Trích chọn đặc trƣng là một bƣớc quan trọng trong quá trình nhận dạng chữ viết tay. Trong các hệ thống nhận dạng, trích chọn đặc trƣng phải đƣợc rút gọn càng nhỏ càng tốt nhƣng vẫn phải mô tả đƣợc đầy đủ các thông tin của ký tự
để giảm độ phức tạp và tăng độ chính xác của thuật toán nhận dạng chữ viết tay. Các phƣơng pháp trích chọn đặc trƣng đƣợc phân chia thành ba nhóm chính sau [3]:
Biến đổi toàn cục và triển khai chuỗi: Một tín hiệu liên tục thƣờng chứa
nhiều thông tin và chúng có thể sử dụng làm các đặc trƣng cho mục đích phân lớp. Các đặc trƣng đƣợc trích chọn cũng có thể đúng với việc xấp xỉ các tín hiệu liên tục thành các tín hiệu rời rạc. Một cách để biểu diễn tín hiệu là sử dụng một tổ hợp tuyến tính của một dãy các hàm đơn giản hơn. Các hệ số của tổ hợp tuyến tính cung cấp một tri thức giải mã vừa đủ, chẳng hạn nhƣ các phép biển đổi triển khai chuỗi. Cũng có một số phép biển đổi khác nhƣ các phép dịch chuyển và phép quay là bất biết dƣới các phép biến đổi toàn cục và khai triển chuỗi.
Các đặc trƣng mang tính thống kê: Đây là phƣơng pháp xử lý nhằm tạo
ra các đặc trƣng thống kê của văn bản mà phải bảo toàn các kiểu biến đổi đa dạng về hình dáng của chữ. Mặc dù nó không xây dựng lại hình ảnh gốc, nhƣng nó dùng để thu nhỏ số chiều của tập đặc trƣng nhằm tăng tốc độ và giảm độ phức tạp khi tính toán. Một số đặc trƣng thống kê thƣờng dùng nhƣ: Phân vùng, các giao điểm và khoảng cách, các phép chiếu, đặc trƣng hƣớng.
Đặc trƣng hình học và hình thái: Các tính chất của ký tự đầu vào nhƣ tính chất cục bộ và toàn cục khác nhau của ký tự có thể đƣợc biểu diễn bằng các đặc trƣng hình học và hình thái. Nó có thể giải mã các tri thức về cấu trúc của đối tƣợng ảnh hoặc có thể áp dụng một số tri thức nhƣ sắp xếp các thành phần để tạo ra đối tƣợng cần nhận dạng. Một số nhóm của đặc trƣng hình học và hình thái:
o Trích chọn và đếm cấu trúc hình thái.
o Đo xấp xỉ các tính chất hình học.
o Đồ thị và cây.