Biến đổi Hough là phƣơng pháp phổ biến nhất đƣợc sử dụng trong việc phát hiện góc nghiêng văn bản, nhƣng nó tƣơng đối đắt tiền. Để giảm bớt chi phí tính toán, một số phƣơng pháp sửa đổi đƣợc đề xuất.Ví dụ: Một hình ảnh mức xám có thể đại diện bởi các dòng chạy mã số dài, và các điểm đƣợc chọn dùng biến đổi Hough phải là các mã trong phạm vi nhất định. Sử dụng các điểm ảnh dƣới cùng của các đối tƣợng ứng viên đƣợc chọn để biến đổi Hough.Kỹ thuật biến đổi Hough cũng đƣợc thông qua ý tƣởng chính của phƣơng pháp trên là giảm số lƣợng dữ liệu đầu vào, nhƣng độ phức tạp còn cao.
Các bƣớc cho việc tìm kiếm góc nghiêng sử dụng biến đổi Hough nhƣ sau: - Đối với mỗi điểm ảnh P(‘xi’,’yi’).
- Tính giá trị của tƣơng ứng đối với . Giá trị đƣợc làm tròn số với giá trị gần nhất cho phép dọc theo trục .
- Độ lớn các Hough tƣơng ứng với phần tử H(j,i), bởi một kết quả xử lý phía trên trong ma trận Hough, mà mỗi phần tử (i,j) này mang đến số các điểm này nằm trên đƣờng thẳng với tham số và , ( ). Mỗi cột của ma
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc.tnu.edu.vn/
trận Hough cho tất cả các điểm nằm trên tập hợp các đƣờng thẳng song song, không phân biệt giá trị của .
Vì vậy, việc tìm kiếm các giá trị phƣơng sai dọc theo mỗi cột cho chúng ta phƣơng sai về số lƣợng các điểm ảnh nền nằm trên các đƣờng thẳng song song. Một lần nữa, góc nghiêng là góc mà tại đó phƣơng sai là lớn nhất.
* Xác định góc nghiêng của văn bản
Sau khi tìm đƣợc các góc nghiêng của các vùng bao hình chữ nhật, chia khoảng [-10,10] thành các đoạn nhỏ có độ dài là 10, sắp xếp và tính tổng các góc nằm trong các khoảng [-10,-9], [-9,-8],….[8,9], [9,10]. Tìm ra khoảng có tổng các góc là lớn nhất và số lƣợng các góc thuộc khoảng đó.
Gỉa sử giá trị góc nghiêng văn bản đƣợc ƣớc lƣợng :
- angleMax là tổng các góc lớn nhất thuộc khoảng [a,b] nào đó
-max: số lƣợng góc tƣơng ứng thuộc khoảng [a,b]
- angle: góc của văn bản
* Kết quả thực nghiệm:Qua quá trình thực nghiệm thuật toán, kết quả thu về khá tốt, tính chính xác đƣợc giá trị góc nghiêng của văn bản với góc nghiêng là số nguyên, còn số thập phân thì đƣợc làm tròn.
* Phương pháp xoay ảnh văn bản
Sau khi xác định đƣợc góc nghiêng văn bản, việc cần làm tiếp theo là quay ảnh gốc theo góc mới xác định đó. Quay ảnh văn bản là một bƣớc rất quan trọng, nó là tiền đề cho việc phân tích và xây dựng bố cục cũng nhƣ nhận dạng văn bản sau này. Độ chính xác của việc quay ảnh sẽ ảnh hƣởng rất nhiều đến kết quả của các bƣớc tiếp theo.
Hiện nay đã có rất nhiều phƣơng pháp đề nghị cho việc quay ảnh. Có thể đơn cử nhƣ: phép quay dựa trên biến đổi Affine, phƣơng pháp do Cheng
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc.tnu.edu.vn/
đề nghị, phƣơng pháp 3-pass, phƣơng pháp do Jiang đề nghị hay phƣơng pháp black run…. Tuy nhiên, một hạn chế chung của các phƣơng pháp này là làm mất điểm trong khi quay do phép làm tròn số, gây ra hiện tƣợng “rỗ” ảnh.