Các phƣơng pháp hình học và cấu trúc

Một phần của tài liệu Mạng Nơ Ron nhân tạo trong nhận dạng văn bản và ứng dụng vào hệ thống nhận dạng chữ Việt in (Trang 27 - 30)

Có thể tìm đƣợc nhiều đặc trƣng tổng thể và cục bộ có dung sai với nhiễu và biến động về kiểu chữ bằng các phƣơng pháp hình học và cấu trúc. Các phƣơng pháp này cũng thể hiện cấu trúc của đối tƣợng và cho biết các thành phần nào tạo nên đối tƣợng. Có bốn nhóm phƣơng pháp chính:

Trích chọn và đếm các Topological Structures: tìm kiếm trong từ hoặc

ký tự một cấu trúc xác định trƣớc. Số lƣợng hoặc vị trí tƣơng đối của các cấu trúc này trong ký tự chính là các đặc trƣng. Các cấu trúc nguyên thuỷ phổ biến là các nét tạo nên ký tự. Chúng có thể là đoạn thẳng và cung hoặc phức tạp hơn

nhƣ đƣờng cong và spline. Có thể biểu diễn các ký tự và từ bằng cách trích chọn và đếm nhiều đặc trƣng topo nhƣ điểm cực đại, cực tiểu, đỉnh trên và dƣới một ngƣỡng, lỗ hổng bên phải, trái, trên, dƣới, điểm giao (x), điểm nhánh (T), điểm mút (J), điểm vòng, hƣớng của nét, phản chiếu giữa hai điểm, điểm cô đơn, đƣờng cong giữa hai điểm, tính đối xứng, đƣờng cong ngang ở trên và dƣới, ascending, descending, nét ngang và mối quan hệ giữa các nét.

Đo và xấp xỉ các đặc trƣng hình học: các ký tự đƣợc biểu diễn bằng cách đo các đặc trƣng định lƣợng hình học nhƣ tỷ lệ giữa chiều rộng và chiều cao của hộp chứa ký tự, khoảng cách giữa hai điểm, tỷ lệ chiều dài giữa hai nét, chiều rộng của một nét, phần cao và phần thấp của một từ, độ dài từ.

Mã hoá (coding): một trong những lƣợc đồ mã hoá phổ biến nhất là mã

hoá dây chuyền Freeman. Mã này đƣợc tính bằng cách ánh xạ các nét của ký tự vào một không gian hai chiều. Không gian này đƣợc sinh ra từ các mã nhƣ hình 1.9.

Hình 1.9. Biểu diễn ký tự bằng mã dây chuyền Freeman

Đồ thị và cây (Graphs and Trees): các từ hay các ký tự trƣớc tiên đƣợc

tách thành một tập các topological primitives, nhƣ các nét, điểm uốn, điểm cắt… Sau đó các primitives này đƣợc biểu diễn bằng các đồ thị có thuộc tính hay có quan hệ. Có hai loại đồ thị: Loại thứ nhất sử dụng tọa độ của primitives. Loại

thứ hai có các nút ứng với các nét và các cạnh thể hiện mối quan hệ giữa các nét. Cây cũng dùng để biểu diễn ký tự hay từ theo mối quan hệ phân cấp.

Trong [34], tác giả đã sử dụng mạng nơ ron để tự động trích chọn đặc trƣng. Đầu vào là một ảnh kích thƣớc 24x24 sau khi đã tiền xử lý, làm mảnh. Các nơ ron nằm trên một mặt phẳng 6x24 (gọi là mặt phẳng P1). Mỗi nơ ron liên kết với một vùng đặc trƣng trên mặt phẳng đầu vào.

Một phần của tài liệu Mạng Nơ Ron nhân tạo trong nhận dạng văn bản và ứng dụng vào hệ thống nhận dạng chữ Việt in (Trang 27 - 30)