Một số phƣơng pháp trích chọn đặc trƣng

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 40)

Ta có một số phƣơng pháp trích chọn đặc trƣng đơn giản nhƣng hiệu quả sau, có thể áp dụng cho các tập chữ viết tay rời rạc.

Trích chọn đặc trƣng chuỗi Fourier

Biên của ảnh là một trong những đặc trƣng quan trọng nhất trong việc mô tả ảnh. Trong đồ án này sẽ sử dụng phƣơng pháp trích chọn đặc trƣng bằng cách dùng biến đổi Fourier của biên ảnh. Giả sử biên hình dạng đƣợc trích chọn trong quá trình tiền xử lý là:

(x(t), y(t)), t = 0,1,…,N-1

Nếu ta xem xét hình dạng trên một mặt phẳng phức, ta có thể thu đƣợc hàm phức một chiều f(t) bằng các lần theo biên của nó ,f(t) là một số phức đƣợc tổng quát hóa từ hệ tọa độ đƣờng bao.

( ) [ ( ) c] [ ( ) c]

f tx txj y ty

Với (xc, yc) là trọng tâm của hình đƣợc bao bởi biên, đƣợc tính theo công thức: 1 0 1 ( ) N t c N xx t    , 1 0 1 ( ) N t c N yy t   

f(t) miêu tả biên và là dấu hiệu bất biến đối với phép dịch chuyển. Biến đổi Fourier

rời rạc DFT của f(t) đƣợc cho bởi:

2 1 0 1 ( ) ut N N u t F f t e N      

Với u từ 0 đến M-1, với M là số mẫu f(t) thu thập đƣợc.

Trọng số vùng: Ảnh ký tự sau khi tiền xử lý kích thƣớc đƣợc chuẩn hoá về mn điểm ảnh. Đây là cách đƣợc áp dụng trong đồ án.

Hình 2.16 Cách chia ô ký tự

Hình 2.17 Ký tự đã được chia ô

Trích chọn chu tuyến (Contour profiles): Phần đƣợc trích chọn là khoảng cách từ biên của khung chứa đến điểm đen đầu tiên của chữ trên cùng một dòng quét.

Phƣơng pháp trích chọn này mô tả tốt các khối bên ngoài của chữ và cho phép phân biệt một số lƣợng lớn các ký tự. Ví dụ nhƣ đối với ảnh có kích thƣớc 14*9, có 14 trên, 14 dƣới, 9 trái, 9 phải, tổng cộng là 46 đặc trƣng.

Hình 2.18 Trích chọn chu tuyến

Trích chọn đặc trƣng wavelet Haar

Từ ảnh nhị phân kích thƣớc 2n x 2n , quá trình trích chọn đặc trƣng đƣợc mô tả theo thuật toán sau:

n

Hình 2.19Trích chọn đặc trưng wavelet Haar

Input : Ma trận vuông (A, n) cấp 2n Khởi tạo: Queue = NULL

Begin

Tính Fi = Tổng các điểm đen trong toàn bộ ma trận (A, n), PUSH ((A,n), Queue),

End, Begin

While Queue != NULL Do {

POP (Queue,(A,n)), If(n>1)

{

Chia ảnh thành 4 phần: A1, A2, A3, A4, For (j=1, i<=4, j++)

PUSH((Aj, n div 2), Queue), } (adsbygoogle = window.adsbygoogle || []).push({});

Gọi S1, S2, S3, S4 là tổng các điểm đen tƣơng ứng với A1, A2, A3, A4 Tính Fi+1 = S1 + S2, Fi+2 = S2 + S3, Fi+3 = S4, i = i+3, }

Hình 2.20Dãy đặc trưng wavelet Haar

Phƣơng pháp trích chọn đặc trƣng này sẽ tạo ra một dãy số các đặc trƣng giảm dần. Với cùng một chữ thì các giá trị lớn ở đầu dãy tƣơng đối ổn định, và có thể đại diện cho hình dạng khái quát của chữ. Còn các giá trị ở cuối dãy nhỏ dần và không ổn định, thể hiện sự đa dạng trong từng chi tiết của chữ.

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nhận diện chữ viết tay bằng mô hình markov ẩn (Trang 40)