Phƣơng pháp láng giềng gần nhất

Một phần của tài liệu Kỹ thuật nhận dạng chữ số dựa vào mạng nơron trong nhập điểm tự động (Trang 44 - 45)

Tất cả các phƣơng pháp trên đều có hạn chế về góc nghiêng tối đa của trang tài liệu. Một cách tiếp cận khác không bị hạn chế này là: Sử dụng tập hợp các láng giềng gần nhất. Khi đó láng giềng gần nhất mỗi phần đƣợc xác định (đó là bộ phận gần nhất theo khoảng cách Euclid) và giữa các tâm của các phần láng giềng gần nhất đƣợc tính. Do khoảng trống trong các ký tự nhỏ hơn khoảng trống giữa các từ và giữa các ký tự của từ trong cùng một dòng văn bản, những láng giềng gần nhất này sẽ là các láng giềng trội hơn của các ký tự kế tiếp trên cùng một dòng văn bản. Mọi véc tơ định hƣớng cho các đƣờng nối láng giềng gần nhất đƣợc lƣu trong một biểu đồ và đỉnh của biểu đồ chỉ ra hƣớng chiếm ƣu thế - đó là góc nghiêng. Để xác định đƣợc bất kỳ góc nghiêng nào, phƣơng pháp này phải chi phí cho những tính toán trên máy tính nhiều hơn hầu hết các phƣơng pháp khác. Độ chính xác của phƣơng pháp phụ thuộc số thành phần; tuy nhiên, do với mỗi phần chỉ có một đƣờng nối với láng giềng gần nhất đƣợc tạo nên, những phần có nhiễu, ví dụ phần dƣới ký tự, dấu chấm trên chữ “i” và các đƣờng giữa văn bản có thể giảm độ chính xác của những trang tƣơng đối thƣa.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Hình 2.12: Biểu đồ minh hoạ phương pháp người láng giềng gần nhất

Trong hình trên ta có (a) là văn bản gốc, (b) là tâm của các ký tự trong (a), (c) là các đoạn thẳng nối các láng giềng gần nhất, (d) là biểu đồ tần suất xuất hiện các đoạn thẳng có cùng góc nghiêng. Trong đồ thị có đỉnh tại 0, do đó góc lệch của văn bản bằng 0, đỉnh của biểu đồ này chỉ đƣợc dùng để làm ƣớc lƣợng ban tiên nghiệm cho góc nghiêng của trang văn bản. Sự xấp xỉ này đƣợc dùng để loại những đƣờng nối có hƣớng vƣợt ra ngoài dãy các hƣớng gần với hƣớng xấp xỉ, vì chúng có thể là những đƣờng nối giữa các kí tự của các dòng văn bản khác nhau. Sau đó tiến hành hiệu chỉnh tâm các phần lại đƣợc nhóm lại bằng các đƣờng nối láng giềng gần nhất và đƣợc thực hiện bằng phƣơng pháp bình phƣơng tối thiểu. Giả sử phép điều chỉnh bình phƣơng tối thiểu đƣợc dùng cho toàn bộ dòng văn bản và phép đo đã đƣợc cải tiến là xấp xỉ chính xác hơn đối với góc nghiêng.

Một phần của tài liệu Kỹ thuật nhận dạng chữ số dựa vào mạng nơron trong nhập điểm tự động (Trang 44 - 45)

Tải bản đầy đủ (PDF)

(64 trang)