Trích chọn đặc trưng

Mục tiêu của việc trích chọ n đặc trưng là lựa chọn được những đặc tính

quan trọng, thường được gọi bằng một thuật ngữ chung đó là các đặc trưng

(feature) của đối tượng cần nhận dạng. Những tiêu chuẩn cơ bản đối với một

thuật toán trích chọn đặc trưng là không nhạy cảm với nhiễu, kiểu font chữ, kích thước, độ nghiêng, độ dịch chuyển và các thay đổi khác của kí tự. Về cơ

bản, có thể chia thành ba hướng tiếp cận chính:

• Trích chọn các đặc trưng thống kê : Những phương pháp trích

chọn đặc trưng thống kê điển hìnhđã và đang được ứng dụng p hổ biến trong

các hệ thống nhận dạng chữ gồm phương pháp chia lưới (zoning), phương

pháp chiếu (projection, profile), phương pháp giao điểm (crossing) và khoảng

cách (distance). Nhìn chung, các phương pháp trong hướng tiếp cận này có khả năng giải quyết các vấn đề nhiễu, kích cỡ và một số thay đổi nhỏ trênảnh

kí tự nhưng lại nhạy cảm với độ dịch chuyển và độ nghiêng của ảnh.

• Trích chọn các đặc trưng cấu trúc: Các đặc trưng cấu trúc thường được trích chọn dựa trên các tính chất tôpô và hình học của kí tự,

chẳng hạn như các điểm chạc, điểm mút,điểm uốn,các điểm cực trị (cực đại,

cực tiểu), các đường baseline, ascenders, descenders, các nét cơ bản, v.v. Hướng tiếp cận này có khả năng giải quyết tốt các vấn đề nghiêng, xoay và

kích cỡ khác nhau trênảnh đầu vào nhưng cần phải có tri thức tốt về các lớp

kí tự mẫu, điều đó đồng nghĩa với việc phải đầu tư công sức rất lớn cho việc

nghiên cứu và xây dựng tập mẫu huấn luyện thuật toán.

Trích chọn đặc trưng dựa vào các phép biến đổi toàn cục: Các

phương pháp biến đổi toàn cục thường sử dụng trong trích chọn đặc trưng bao

gồm biến đổi Cosine rời rạc (DCT), biến đổi Fourier (FT)/Fourier nhanh (FFT), biến đổi Wavelet/Wavelet Harr, khai triển Karhunent-Loeve, các

phương pháp moment. Các phương pháp này có khả năng bất biến với các

phép quay, dịch chuyển nhưng không giải quyết được các trường hợp ảnh kí

tựchất lượng thấp. Hơn nữa, việc đảm bảo tính bất biến có thể gây ra sự nhập

nhằng trong quá trình phân lớp kí tự.

Phương pháp trích chọn đặc trưng ở đây dựa trên tập các đường biên đã

được làm trơn của kí tự. Đây là các đặc trưng ở mức trung gian so với các kiểu đặc trưng trên, các đặc trưng này không bị ảnh hưởng bởi các thay đổi

nhỏ của kí tự như kiểu đặc trưng thứ nhất đồng thời cũng không quá nhạy

cảm nhiễu như kiểu đặc trưng thứ hai. Bên cạnh đó, để tăng khả năng thích nghi được với các lỗi biến dạng của ảnh đầu vào chất lượng thấp, luận văn đã áp kỹ thuật chia nhỏ các đặc trưng đãđược lựa chọn bởi Johnson và cộng sự

[9]. Ý tưởng chính của phương pháp này là cho phép sử dụng 2 tập trưng khác

nhau cho hai quá trình huấn luyện và nhận dạng. Cụ thể, trong quá trình huấn

luyện, mỗi đặc trưng được trích chọn tương ứng với một cạnh trên đa giác xấp

xỉ đường biên của các mẫu họ c, trong khi đó các đặc trưng cần nhận dạng là

các đoạn nhỏ, có kích thước bằng nhau được trích chọn từ đường biên của

Mỗi đường biên (outline) được định nghĩa là một chu trình khép kín chứa các điểm biên kề nhau trong cùng một vùng liên thông. Trong đó, thông

tin về mỗi điểm biên được thể hiện như sau:

 Vị trí điểm biên (xpos, ypos).

 Hướng của điểm biên (edgeDir): Được xác định theo mã chaincode với

bốn hướng trên, dưới, trái, phải.

 Điểm biên liền trước.

 Điểm biên liền sau.

Việc làm trơn các đường biên bằng phương pháp xấp xỉ đa giác trong đó

mỗi đường biên sẽ được xấp xỉ bằng một tập các đoạn thẳng là các cạnh của

một đa giác nhằm mục đích tăng tốc độ xử lý và tránh sự nhập nhằng trong

quá trình trích chọn các đặc trưng nhận dạng đối tượng. Phương pháp xấp xỉ đa giác trên đường biên được thực hiện đơn giản bằng cách duyệt lần lượt các đường biên của kí tự để xác định một dãy cácđiểm biên chứa các đặc tính đã

được xác định. Sau đó tiến hành tính độ sâu của mặt lõm của mỗi cặp điểm kề

nhau và loại đi các mặt lõm cóđộ sâu nhỏ hơn một ngưỡng đã cho.

Phân cụm tập đặc trưng

Thuật toán phân lớp ký tự