.1 Xác định hình chữ nhật ngoại tiếp các đối tượng

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin nghiên cứu một số kỹ thuật hiệu chỉnh biểu mẫu và ứng dụng (Trang 50 - 51)

CHƯƠNG 3. ỨNG DỤNG BIẾN ĐỔI HOUGH PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN.

3.1. Tiền xử lý và phát hiện góc nghiêng văn bản từ biên của đối tượng

Qua nghiên cứu bài tốn góc nghiêng văn bản và một số phương pháp giải quyết, tôi nhận thấy rằng hầu hết các thuật toán chỉ làm việc tốt cho một số trường hợp cụ thể. Có những thuật tốn chỉ làm việc tốt với các ảnh có góc lệch bé hoặc có kích ảnh thước bé, có thuật tốn khơng chính xác với những ảnh có ít ký tự chữ cái hoặc nhiều nhiễu, có thuật tốn phụ thuộc vào font chữ, kích cỡ chữ và nhìn chung rất nhiều thuật tốn có chi phí tính tốn lớn. Có những thuật tốn vượt qua được giới hạn của góc lệch nhưng lại gặp vấn đề độ phức tạp hoặc yêu cầu số lượng ký tự trong văn bản lớn. Và tất cả các thuật toán đều mới chỉ làm việc với các ảnh văn bản hai màu, trong đó một màu là nền và một màu là vùng, chưa đề cập đến phát hiện góc nghiêng văn bản trong ảnh nhiều màu.

Tư tưởng để phát hiện góc nghiêng của thuật tốn khơng khác nhiều so với những thuật toán dùng biến đổi Hough. Trước hết, ta dùng kỹ thuật dò biên để xác định chu tuyến cho các đối tượng ảnh. Các hình chữ nhật chứa các đối tượng này được lưu lại cho các quá trình xử lý tiếp theo. Lựa chọn một số đối tượng có kích thước chủ đạo trong ảnh rồi dùng biến đổi Hough áp dụng cho các điểm đại diện là trung điểm cạnh đáy của hình chữ nhật ngoại tiếp các đối tượng này. Cuối cùng, góc nghiêng văn bản sẽ được ước lượng từ mảng tích luỹ của biến đổi Hough.

3.2. Xác định đường thẳng Hough trên trang văn bản

Mỗi đường thẳng trong toạ độ cực được xác định bởi cặp (r, ) như hình vẽ:

Giả sử (x,y) là một điểm thuộc đường thẳng thì ta tìm cơng thức ràng buộc giữa x, y, r và . Ta có: r = (m + y) . sin Mặt khác ta có: tg = x/m  sin / cos = x/m  m.sin = x.cos

Do đó ta có mối liên hệ giữa ( x, y ) và (r,  ) như sau :

r = x.cos + y.sin

x y

m

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin nghiên cứu một số kỹ thuật hiệu chỉnh biểu mẫu và ứng dụng (Trang 50 - 51)

Tải bản đầy đủ (PDF)

(81 trang)