điểm
Trong số đó, phương pháp của Srihari và Govindaraju là áp dụng biến đổi Hough cho tất cả các điểm đen của ảnh. Tất nhiên, việc áp dụng khơng có loại trừ một điểm nào dẫn đến chi phí tính tốn rất
lớn và ảnh hưởng đến độ chính xác của thuật tốn. Để giảm thời gian chạy và tăng một phần độ chính xác, Hinds chỉ áp dụng biến đổi Hough cho một số ít điểm hơn bằng phân tích chạy dài theo chiều dọc. Mục đích của nén chạy dài theo chiều dọc trong thuật toán này là để lấy ra các điểm đáy của các dòng văn bản, loại bỏ đi những điểm đen khác kể cả chúng thuộc vào một ký tự và dùng biến đổi Hough lên điểm đen đó. Tuy nhiên, chi phí tính tốn của thuật tốn này vẫn cịn lớn và việc áp dụng biến đổi Hough cho tất cả các điểm đen ở đáy có thể dẫn đến những kết quả sai trong trường hợp ảnh đầu vào có nhiều đối tượng phi ký tự như nhiễu, bảng biểu hay picure.
Về lý thuyết, có thể nói theo hướng tiếp cận này, thuật toán của Dianel Le là một trong những thuật tốn có nhiều cải tiến nhất cả về thời gian chạy lẫn độ chính xác. Dianel Le dùng phương pháp phân tích các thành phần liên thơng và rút ra những điểm đáy của các đối tượng. Biến đổi Hough chỉ được áp dụng cho những điểm đáy này nếu đối tượng có kích thước trong một khoảng nào đó. Ở đây, Dianel Le dùng hai ngưỡng kích thước được định nghĩa trước là chiều rộng và chiều cao để loại bớt đi những đối tượng quá lớn như picture hoặc quá bé như nhiễu. Vì vậy, thuật tốn này cho độ chính xác cao hơn và giảm đáng kể chi phí tính tốn.
1.2.6.2. Nhận xét
Thuật tốn của Dianel Le sẽ gặp khó khăn nếu các đối tượng trong ảnh chứa nhau. Chẳng hạn, các ký tự nằm hầu hết trong các đối tượng có kích thước lớn mà đáy của chúng khơng phải là những đường thẳng. Khi đó, có thể những ký tự khơng được xét đến, thay vào đó lại áp dụng biến đổi Hough cho điểm đáy của các đối tượng phi ký tự dẫn đến kết quả đưa ra góc lệch sai cho văn bản. Hơn nữa do các ngưỡng kích thước được cố định trước nên thuật tốn này phụ thuộc nhiều vào kích thước các con chữ và số lượng ký tự trong văn bản.
1.2.7. So sánh một số phương pháp phát hiện góc nghiêng
Trên cơ sở các thuật toán đã nghiên cứu để giải quyết bài tốn góc nghiêng, việc lựa chọn áp dụng biến đổi Hough không xuất phát từ tốt độ xử lý mà chủ yếu căn cứ vào góc lệch tìm được tương đối chính xác hơn so với các phương pháp khác khi cùng xử lý trên 1 trang ảnh văn bản.
Phương pháp Góc lệch thực tế Góc lệch tìm được Thời gian (s) Profile Projection 8 8.19 0.889 Center of Gravity 9 8.5 1.146
Nearest Neighbour Clustering 10 10.6 1.173
Morphology 8 7 .5 1
Hough Transform 9 9.12 1.098
CHƯƠNG 2. BIÊN VÀ CÁC PHƯƠNG PHÁP DÒ BIÊN
2.1. Biên của đối tượng ảnh
2.1.1. Biên và các kiểu biên cơ bản trong ảnh
Các đặc trưng của ảnh thường bao gồm các thành phần như: mật độ xám, phân bố xác suất, phân bố không gian, biên ảnh [2]. Biên là một vấn đề chủ yếu và đặc biệt quan trọng trong phân tích ảnh vì các kĩ thuật phân đoạn ảnh chủ yếu dựa vào biên.
Hiện nay có nhiều định nghĩa về biên ảnh [1] và mỗi định nghĩa được sử dụng trong một số trường hợp nhất định. Song nhìn chung, ta có thể hiểu là: một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám.
Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh.
Tập hợp các điểm biên tạo thành biên, hay còn gọi là đường bao của ảnh (boundary). Chẳng hạn, trong một ảnh nhị phân, một điểm có thể được gọi là biên nếu đây là một điểm đen và có ít nhất một điểm trắng nằm trong lân cận điểm đó.
Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và được tính tốn từ những điểm lân cận nó. Đó là một biến Vector bao gồm hai thành phần:
- Độ lớn của Gadient.
- Hướng φ được xoay đối với hướng Gradient ψ. 2.1.1.1. Biên lý tưởng:
Việc phát hiện biên một cách lý tưởng là việc xác định được tất cả các đường bao trong đối tượng. Biên là sự thay đổi đột ngột về mức xám nên sự thay đổi cấp xám giữa các vùng trong ảnh càng lớn thì càng dễ dàng nhận ra biên.
Hình sau đây minh hoạ điểm ảnh có sự biến đổi mức xám u(x) một
cách đột ngột:
Một biên được coi đó là biên lý tưởng khi mà có sự thay đổi cấp xám lớn giữa các vùng trong ảnh. Biên này thường chỉ xuất hiện khi có sự thay đổi cấp xám qua một điểm ảnh.
2.1.1.2. Biên dốc:
Biên dốc xuất hiện khi sự thay đổi cấp xám trải rộng qua nhiều điểm ảnh. Vị trí của cạnh được xem như vị trí chính giữa của đường dốc nối giữa cấp xám thấp và cấp xám cao. Tuy
nhiên đây chỉ là đường dốc trong toán học, từ khi ảnh được kỹ thuật số hố thì đường dốc khơng cịn là đường thẳng mà thành những đường lởm chởm, không trơn.