L ỜI CẢM ƠN
1.2.4. Phương pháp phân tích láng giềng (Nearest Neighbour Clustering)
Một hướng tiếp cận khác cho bài toán phát hiện góc nghiêng văn bản là phương pháp phân tích láng giềng lân
cận hay láng giềng gần nhất. Các thuật toán liên quan đến phương pháp này được đề xuất bởi các tác giả: Hashizume, O' Gorman, Jiang, Loibios, nhóm Yue Lu và Chew Lim Tan [14], nhóm Pal và Chaudhuri, nhóm
Shivakumara, Kumar, X, Jaing, H, Bunke [10], Guru và Nagabhushan.
Theo hướng tiếp cận này, các thuật toán trước hết dùng các kỹ thuật xác định biên cho các đối tượng riêng lẻ. Sau đó, ứng với mỗi một đối tượng, tiến hành xác định một số láng giềng gần nó nhất, dùng một vector định hướng với hai đầu là hai điểm được chọn từ hai trong số các đối tượng này để xác định góc nghiêng. Hai đối tượng là các láng giềng thân cận của nhau nếu kích thước của chúng phải thuộc một khoảng nào đó và khoảng cách giữa chúng cũng thỏa mãn bé hơn một ngưỡng nào đó được định nghĩa trước. Hai điểm đại diện cho hai đối tượng có thể là các tọa độ giữa cạnh đáy của chúng hoặc có thể là các tọa độ dưới trái nhưng cũng có thể là tâm của các hình chữ nhật ngoại tiếp các đối tượng đó tùy theo từng thuật toán cụ thể.
Vector của mỗi một nhóm láng giềng lân cận sẽ cho một góc lệch tương ứng cho nhóm đó. Thông thường, các thuật toán theo phương pháp này dùng một mảng tích lũy để lưu histogram cho các góc lệch này. Nghĩa là, giá trị của một phần tử mảng tích lũy sẽ cho biết số nhóm láng giềng mà vector định hướng cho góc bằng với chỉ số của phần tử mảng đó. Góc lệch của văn bản là góc tương ứng với phần tử histogram lớn nhất.
Việc gom các đối tượng thành các cặp láng giềng gần nhất mục đích để gom các cặp ký tự kề nhau trong các dòng văn bản và vector giữa các đối tượng này cho biết góc của đường thẳng đi qua đáy của nhóm ký tự đó. Tuy nhiên, trong trường hợp ảnh có nhiều nhiễu hoặc với ảnh có độ phân giải thấp, các ký tự chữ cái được chia thành nhiều phần riêng biệt thì các vector định hướng sẽ không phản ánh được đúng hướng lệch của văn bản nữa.