.3 Đường thẳng Hough trên trục tọa độ

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin nghiên cứu một số kỹ thuật hiệu chỉnh biểu mẫu và ứng dụng (Trang 53 - 55)

y x.cos+y.sin=r1 Hough[][r1]=3 x 0 x.cos+y.sin=r2 Hough[][r2]=4

- Với mỗi i từ 0 đến 360 tính giá trị ri theo công thức: ri = x * cos i + y * sin i

- Làm tròn giá trị ri thành số nguyên gần nhất là r0

- Tăng giá trị của phần tử mảng Hough[i][r0] lên một đơn vị.

Bước 4: Trong mảng Hough[][r] tính tổng giá trị các phần tử theo

từng dịng và xác định dịng có tổng giá trị là lớn nhất.

Do số giá trị của một phần tử mảng Hough[0][r0] chính là số điểm ảnh thuộc đường thẳng r0 = x * cos 0 + y * sin 0 vì vậy tổng số phần tử của

một hàng chính là tổng số điểm ảnh thuộc các đường thẳng tương ứng được biểu diễn bởi góc  của hàng đó. Do đó, góc nghiêng của trang văn bản chính là góc của hàng trong mảng tích luỹ có giá trị lớn nhất.

Từ cơ sở lý thuyết đã tìm hiểu được, tiến hành xây dựng một thuật toán xác định góc nghiêng ảnh văn bản dựa vào biến đổi Hough.

3.4. Thuật tốn phát hiện góc nghiêng văn bản

* Xử lý đối tượng ảnh ngoại lệ

Sau giai đoạn tiền xử lý ảnh ta thu được ảnh trung gian. Thuật tốn phát hiện góc nghiêng sẽ làm việc với ảnh trung gian này để tìm ra góc nghiêng cho văn bản và sau đó dùng thuật tốn xoay ảnh để xoay ảnh ban đầu với góc nghiêng vừa tìm được.

Tuy nhiên, do ảnh tiến hành xử lý được thu nhận từ nhiều nguồn khác nên chất lượng ảnh cũng như các đối tượng trên ảnh cũng khác nhau. Nên một điểm cần được xét đến trong thuật tốn phát hiện góc nghiêng là xử lý những ảnh văn bản phức tạp hoặc các trường ngoại lệ. Ta sẽ lần lượt đưa ra các phương án xử lý cho các trường hợp này.

+ Ảnh có q ít ký tự.

Trường hợp thứ nhất là trong ảnh có quá ít ký tự chữ cái chưa đủ để xác định được góc nghiêng. Các đối tượng trong ảnh chủ yếu là hình hoặc nhiễu, đặc biệt các ký tự nghiêng các góc khác nhau do đặc thù riêng của ảnh. Hình vẽ dưới đây minh hoạ một ảnh văn bản nghiêng với số ký tự rất ít.

Như vậy, sau khi loại bỏ các đối tượng từ hàm xác định chu tuyến và dùng ngưỡng kích thước thì số đối tượng được lựa chọn để áp dụng biến đổi Hough sẽ cịn lại rất ít. Nếu chúng ta vẫn tiếp tục các bước tiếp theo và đưa ra kết luận về góc nghiêng cho văn bản thì rõ ràng độ chính xác khơng được đảm bảo. Lý do đơn giản vì những đối tượng được lựa chọn chưa chắc đã là những ký tự. Chúng có thể là những đối tượng phi ký tự nhưng được lựa chọn vì kích thước của chúng thoả mãn ngưỡng. Việc xác định những đối tượng chủ đạo ln mang tính tương đối và càng chính xác khi số đối tượng ký tự trong ảnh càng nhiều. Khi trong ảnh có ít ký tự thì càng khơng thể chắc chắn được rằng các đối tượng được chọn là ký tự.

Vì vậy, ta chỉ đưa ra kết luận về góc nghiêng cho văn bản trong trường hợp số lượng các đối tượng này phải lớn hơn một ngưỡng nào đó.

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin nghiên cứu một số kỹ thuật hiệu chỉnh biểu mẫu và ứng dụng (Trang 53 - 55)

Tải bản đầy đủ (PDF)

(81 trang)