Ta có một số phƣơng pháp trích chọn đặc trƣng đơn giản nhƣng hiệu quả sau, có thể áp dụng cho các tập chữ viết tay rời rạc.
Trích chọn đặc trƣng chuỗi Fourier
Biên của ảnh là một trong những đặc trƣng quan trọng nhất trong việc mô tả ảnh. Trong đồ án này sẽ sử dụng phƣơng pháp trích chọn đặc trƣng bằng cách dùng biến đổi Fourier của biên ảnh. Giả sử biên hình dạng đƣợc trích chọn trong quá trình tiền xử lý là:
(x(t), y(t)), t = 0,1,…,N-1
Nếu ta xem xét hình dạng trên một mặt phẳng phức, ta có thể thu đƣợc hàm phức một chiều f(t) bằng các lần theo biên của nó ,f(t) là một số phức đƣợc tổng quát hóa từ hệ tọa độ đƣờng bao.
( ) [ ( ) c] [ ( ) c]
f t x t x j y t y
Với (xc, yc) là trọng tâm của hình đƣợc bao bởi biên, đƣợc tính theo công thức: 1 0 1 ( ) N t c N x x t , 1 0 1 ( ) N t c N y y t
f(t) miêu tả biên và là dấu hiệu bất biến đối với phép dịch chuyển. Biến đổi Fourier
rời rạc DFT của f(t) đƣợc cho bởi:
2 1 0 1 ( ) ut N N u t F f t e N
Với u từ 0 đến M-1, với M là số mẫu f(t) thu thập đƣợc.
Trọng số vùng: Ảnh ký tự sau khi tiền xử lý kích thƣớc đƣợc chuẩn hoá về mn điểm ảnh. Đây là cách đƣợc áp dụng trong đồ án.
Hình 2.16 Cách chia ô ký tự
Hình 2.17 Ký tự đã được chia ô
Trích chọn chu tuyến (Contour profiles): Phần đƣợc trích chọn là khoảng cách từ biên của khung chứa đến điểm đen đầu tiên của chữ trên cùng một dòng quét.
Phƣơng pháp trích chọn này mô tả tốt các khối bên ngoài của chữ và cho phép phân biệt một số lƣợng lớn các ký tự. Ví dụ nhƣ đối với ảnh có kích thƣớc 14*9, có 14 trên, 14 dƣới, 9 trái, 9 phải, tổng cộng là 46 đặc trƣng.
Hình 2.18 Trích chọn chu tuyến
Trích chọn đặc trƣng wavelet Haar
Từ ảnh nhị phân kích thƣớc 2n x 2n , quá trình trích chọn đặc trƣng đƣợc mô tả theo thuật toán sau:
n
Hình 2.19Trích chọn đặc trưng wavelet Haar
Input : Ma trận vuông (A, n) cấp 2n Khởi tạo: Queue = NULL
Begin
Tính Fi = Tổng các điểm đen trong toàn bộ ma trận (A, n), PUSH ((A,n), Queue),
End, Begin
While Queue != NULL Do {
POP (Queue,(A,n)), If(n>1)
{
Chia ảnh thành 4 phần: A1, A2, A3, A4, For (j=1, i<=4, j++)
PUSH((Aj, n div 2), Queue), }
Gọi S1, S2, S3, S4 là tổng các điểm đen tƣơng ứng với A1, A2, A3, A4 Tính Fi+1 = S1 + S2, Fi+2 = S2 + S3, Fi+3 = S4, i = i+3, }
Hình 2.20Dãy đặc trưng wavelet Haar
Phƣơng pháp trích chọn đặc trƣng này sẽ tạo ra một dãy số các đặc trƣng giảm dần. Với cùng một chữ thì các giá trị lớn ở đầu dãy tƣơng đối ổn định, và có thể đại diện cho hình dạng khái quát của chữ. Còn các giá trị ở cuối dãy nhỏ dần và không ổn định, thể hiện sự đa dạng trong từng chi tiết của chữ.