Mục tiêu của việc trích chọ n đặc trưng là lựa chọn được những đặc tính
quan trọng, thường được gọi bằng một thuật ngữ chung đó là các đặc trưng
(feature) của đối tượng cần nhận dạng. Những tiêu chuẩn cơ bản đối với một
thuật toán trích chọn đặc trưng là không nhạy cảm với nhiễu, kiểu font chữ, kích thước, độ nghiêng, độ dịch chuyển và các thay đổi khác của kí tự. Về cơ
bản, có thể chia thành ba hướng tiếp cận chính:
• Trích chọn các đặc trưng thống kê : Những phương pháp trích
chọn đặc trưng thống kê điển hìnhđã và đang được ứng dụng p hổ biến trong
các hệ thống nhận dạng chữ gồm phương pháp chia lưới (zoning), phương
pháp chiếu (projection, profile), phương pháp giao điểm (crossing) và khoảng
cách (distance). Nhìn chung, các phương pháp trong hướng tiếp cận này có khả năng giải quyết các vấn đề nhiễu, kích cỡ và một số thay đổi nhỏ trênảnh
kí tự nhưng lại nhạy cảm với độ dịch chuyển và độ nghiêng của ảnh.
• Trích chọn các đặc trưng cấu trúc: Các đặc trưng cấu trúc thường được trích chọn dựa trên các tính chất tôpô và hình học của kí tự,
chẳng hạn như các điểm chạc, điểm mút,điểm uốn,các điểm cực trị (cực đại,
cực tiểu), các đường baseline, ascenders, descenders, các nét cơ bản, v.v. Hướng tiếp cận này có khả năng giải quyết tốt các vấn đề nghiêng, xoay và
kích cỡ khác nhau trênảnh đầu vào nhưng cần phải có tri thức tốt về các lớp
kí tự mẫu, điều đó đồng nghĩa với việc phải đầu tư công sức rất lớn cho việc
nghiên cứu và xây dựng tập mẫu huấn luyện thuật toán.
Trích chọn đặc trưng dựa vào các phép biến đổi toàn cục: Các
phương pháp biến đổi toàn cục thường sử dụng trong trích chọn đặc trưng bao
gồm biến đổi Cosine rời rạc (DCT), biến đổi Fourier (FT)/Fourier nhanh (FFT), biến đổi Wavelet/Wavelet Harr, khai triển Karhunent-Loeve, các
phương pháp moment. Các phương pháp này có khả năng bất biến với các
phép quay, dịch chuyển nhưng không giải quyết được các trường hợp ảnh kí
tựchất lượng thấp. Hơn nữa, việc đảm bảo tính bất biến có thể gây ra sự nhập
nhằng trong quá trình phân lớp kí tự.
Phương pháp trích chọn đặc trưng ở đây dựa trên tập các đường biên đã
được làm trơn của kí tự. Đây là các đặc trưng ở mức trung gian so với các kiểu đặc trưng trên, các đặc trưng này không bị ảnh hưởng bởi các thay đổi
nhỏ của kí tự như kiểu đặc trưng thứ nhất đồng thời cũng không quá nhạy
cảm nhiễu như kiểu đặc trưng thứ hai. Bên cạnh đó, để tăng khả năng thích nghi được với các lỗi biến dạng của ảnh đầu vào chất lượng thấp, luận văn đã áp kỹ thuật chia nhỏ các đặc trưng đãđược lựa chọn bởi Johnson và cộng sự
[9]. Ý tưởng chính của phương pháp này là cho phép sử dụng 2 tập trưng khác
nhau cho hai quá trình huấn luyện và nhận dạng. Cụ thể, trong quá trình huấn
luyện, mỗi đặc trưng được trích chọn tương ứng với một cạnh trên đa giác xấp
xỉ đường biên của các mẫu họ c, trong khi đó các đặc trưng cần nhận dạng là
các đoạn nhỏ, có kích thước bằng nhau được trích chọn từ đường biên của
Mỗi đường biên (outline) được định nghĩa là một chu trình khép kín chứa các điểm biên kề nhau trong cùng một vùng liên thông. Trong đó, thông
tin về mỗi điểm biên được thể hiện như sau:
Vị trí điểm biên (xpos, ypos).
Hướng của điểm biên (edgeDir): Được xác định theo mã chaincode với
bốn hướng trên, dưới, trái, phải.
Điểm biên liền trước.
Điểm biên liền sau.
Việc làm trơn các đường biên bằng phương pháp xấp xỉ đa giác trong đó
mỗi đường biên sẽ được xấp xỉ bằng một tập các đoạn thẳng là các cạnh của
một đa giác nhằm mục đích tăng tốc độ xử lý và tránh sự nhập nhằng trong
quá trình trích chọn các đặc trưng nhận dạng đối tượng. Phương pháp xấp xỉ đa giác trên đường biên được thực hiện đơn giản bằng cách duyệt lần lượt các đường biên của kí tự để xác định một dãy cácđiểm biên chứa các đặc tính đã
được xác định. Sau đó tiến hành tính độ sâu của mặt lõm của mỗi cặp điểm kề
nhau và loại đi các mặt lõm cóđộ sâu nhỏ hơn một ngưỡng đã cho.