L ỜI CẢM ƠN
1.2.6. Phương pháp dùng biến đổi Hough (Hough Transform)
1.2.6.1. Đường thẳng Hough trên tọa độ cực.
Một hướng tiếp cận phổ biến khác cho bài toán phát hiện góc nghiêng văn bản là phương pháp dùng biến đổi Hough [4,12]. Những thuật toán dùng biến đổi Hough thường xác định một số điểm đen và dùng biến đổi Hough tác động lên các điểm đó.
Hình 1.13 Đường thẳng Hough và trục tọa độ
Biến đổi Hough ánh xạ một đường thẳng trong mặt phẳng thành các cặp (r, ) trong không gian Hough với r là khoảng cách từ gốc tọa độ tới đường thẳng đó và là
góc nghiêng của đường thẳng đó so với trục ngang. Sử dụng các tham số này thì phương trình đường thẳng có thể được viết là:
Và có thể được phân phối lại là: r = x cos + ysin. Do đó với mỗi đường thẳng được xác định trong không gian Hough sẽ có duy nhất một cặp (r, ). Như vậy mới mỗi điểm bất kỳ trên mặt phẳng ảnh với trục tọa độ (giả sử là (x0, y0)) thì các đường đi qua nó có dạng: r () = x0*cos + y0*sin với r (là khoảng cách giữa các đường thẳng vào gốc
tạo độ) được xác định bởi .
Góc nghiêng của văn bản tương ứng là góc có tổng số điểm nằm trên những đường thẳng cùng lệch góc là lớn nhất. Số các điểm đen được áp dụng biến đổi Hough tùy thuộc vào từng thuật toán, có thể là tất cả các điểm đen hoặc có thể chỉ những điểm thỏa mãn một số ràng buộc nào đó hoặc chỉ là đáy của các đối tượng ảnh.
Liên quan đến hướng tiếp cận này là những thuật toán của các tác giả: Hinds, Jiang, Dianel Le, Sugwara, Nakano, nhóm Srihari và Govindaraju, nhóm Yu và Jain, nhóm Amin, Fischer, Parkison và Riscky.
Hình 1.14 Biểu diễn đường thẳng Hough đi qua 3 điểm
Trong số đó, phương pháp của Srihari và Govindaraju là áp dụng biến đổi Hough cho tất cả các điểm đen của ảnh. Tất nhiên, việc áp dụng không có loại trừ một điểm nào dẫn đến chi phí tính toán rất
lớn và ảnh hưởng đến độ chính xác của thuật toán. Để giảm thời gian chạy và tăng một phần độ chính xác, Hinds chỉ áp dụng biến đổi Hough cho một số ít điểm hơn bằng phân tích chạy dài theo chiều dọc. Mục đích của nén chạy dài theo chiều dọc trong thuật toán này là để lấy ra các điểm đáy của các dòng văn bản, loại bỏ đi những điểm đen khác kể cả chúng thuộc vào một ký tự và dùng biến đổi Hough lên điểm đen đó. Tuy nhiên, chi phí tính toán của thuật toán này vẫn còn lớn và việc áp dụng biến đổi Hough cho tất cả các điểm đen ở đáy có thể dẫn đến những kết quả sai trong trường hợp ảnh đầu vào có nhiều đối tượng phi ký tự như nhiễu, bảng biểu hay picure.
Về lý thuyết, có thể nói theo hướng tiếp cận này, thuật toán của Dianel Le là một trong những thuật toán có nhiều cải tiến nhất cả về thời gian chạy lẫn độ chính xác. Dianel Le dùng phương pháp phân tích các thành phần liên thông và rút ra những điểm đáy của các đối tượng. Biến đổi Hough chỉ được áp dụng cho những điểm đáy này nếu đối tượng có kích thước trong một khoảng nào đó. Ở đây, Dianel Le dùng hai ngưỡng kích thước được định nghĩa trước là chiều rộng và chiều cao để loại bớt đi những đối tượng quá lớn như picture hoặc quá bé như nhiễu. Vì vậy, thuật toán này cho độ chính xác cao hơn và giảm đáng kể chi phí tính toán.
1.2.6.2. Nhận xét
Thuật toán của Dianel Le sẽ gặp khó khăn nếu các đối tượng trong ảnh chứa nhau. Chẳng hạn, các ký tự nằm hầu hết trong các đối tượng có kích thước lớn mà đáy của chúng không phải là những đường thẳng. Khi đó, có thể những ký tự không được xét đến, thay vào đó lại áp dụng biến đổi Hough cho điểm đáy của các đối tượng phi ký tự dẫn đến kết quả đưa ra góc lệch sai cho văn bản. Hơn nữa do các ngưỡng kích thước được cố định trước nên thuật toán này phụ thuộc nhiều vào kích thước các con chữ và số lượng ký tự trong văn bản.
1.2.7. So sánh một số phương pháp phát hiện góc nghiêng
Trên cơ sở các thuật toán đã nghiên cứu để giải quyết bài toán góc nghiêng, việc lựa chọn áp dụng biến đổi Hough không xuất phát từ tốt độ xử lý mà chủ yếu căn cứ vào góc lệch tìm được tương đối chính xác hơn so với các phương pháp khác khi cùng xử lý trên 1 trang ảnh văn bản.
Phương pháp Góc lệch thực tế Góc lệch tìm được Thời gian (s) Profile Projection 8 8.19 0.889 Center of Gravity 9 8.5 1.146
Nearest Neighbour Clustering 10 10.6 1.173
Morphology 8 7 .5 1
Hough Transform 9 9.12 1.098
CHƯƠNG 2. BIÊN VÀ CÁC PHƯƠNG PHÁP DÒ BIÊN