tài liệu viết tay, với độ phân giải khác nhau, phông chữ khác nhau và tỷ lệ chính xác khá cao. Bên cạnh đó, phương pháp này khá đơn giản và độ phức tạp thấp dẫn đến thời gian thực hiện quá trình xử lý nhanh. Nó khơng bị ảnh hưởng bởi nhiễu và đồng thời còn phù hợp để làm việc với văn bản có phơng chữ khác nhau và cả các văn bản có độ phân giải khác nhau.
Hình 1.7 Tìm các điểm xa nhất theo các hướng trên ảnh theo các hướng trên ảnh
Hình 1.8 Trọng tâm được xác định dựa vào các điểm xa nhất định dựa vào các điểm xa nhất
Hình 1.9 Đường cơ sở được nối từ trọng tâm đến gốc tọa độ từ trọng tâm đến gốc tọa độ
Hình 1.10 Xác định góc nghiêng ảnh văn bản ảnh văn bản
1.2.4. Phương pháp phân tích láng giềng (Nearest Neighbour Clustering)
Một hướng tiếp cận khác cho bài tốn phát hiện góc nghiêng văn bản là phương pháp phân tích láng giềng lân
cận hay láng giềng gần nhất. Các thuật toán liên quan đến phương pháp này được đề xuất bởi các tác giả: Hashizume, O' Gorman, Jiang, Loibios, nhóm Yue Lu và Chew Lim Tan [14], nhóm Pal và Chaudhuri, nhóm
Shivakumara, Kumar, X, Jaing, H, Bunke [10], Guru và Nagabhushan.
Theo hướng tiếp cận này, các thuật toán trước hết dùng các kỹ thuật xác định biên cho các đối tượng riêng lẻ. Sau đó, ứng với mỗi một đối tượng, tiến hành xác định một số láng giềng gần nó nhất, dùng một vector định hướng với hai đầu là hai điểm được chọn từ hai trong số các đối tượng này để xác định góc nghiêng. Hai đối tượng là các láng giềng thân cận của nhau nếu kích thước của chúng phải thuộc một khoảng nào đó và khoảng cách giữa chúng cũng thỏa mãn bé hơn một ngưỡng nào đó được định nghĩa trước. Hai điểm đại diện cho hai đối tượng có thể là các tọa độ giữa cạnh đáy của chúng hoặc có thể là các tọa độ dưới trái nhưng cũng có thể là tâm của các hình chữ nhật ngoại tiếp các đối tượng đó tùy theo từng thuật toán cụ thể.
Vector của mỗi một nhóm láng giềng lân cận sẽ cho một góc lệch tương ứng cho nhóm đó. Thơng thường, các thuật tốn theo phương pháp này dùng một mảng tích lũy để lưu histogram cho các góc lệch này. Nghĩa là, giá trị của một phần tử mảng tích lũy sẽ cho biết số nhóm láng giềng mà vector định hướng cho góc bằng với chỉ số của phần tử mảng đó. Góc lệch của văn bản là góc tương ứng với phần tử histogram lớn nhất.