Tính toán kích thước chủ đạo của các đối tượng ảnh

Một phần của tài liệu Giáo trình xử lý ảnh số ĐH Thái Nguyên (Trang 85 - 87)

Như đã nói từ các phần trên, góc nghiêng được xác định dựa vào biến đổi Hough. Ở đây, chúng ta chỉ áp dụng biến đổi Hough cho những điểm giữa đáy của các hình chữ nhật ngoại tiếp các đối tượng có kích thước chủ đạo trong ảnh. Như vậy, công việc đầu tiên cần thực hiện là xác định được các hình chữ nhật ngoại tiếp các đối tượng hay nói cách khác là xác định biên các đối tượng.

Hình 6.1. Các hình chữ nhật ngoại tiếp đối tượng ảnh

Ở đây, ta dùng thuật toán dò biên đã được cải tiến trong chương 2 để xác định biên cho các đối tượng trong ảnh văn bản. Hình chữ nhật ngoại tiếp đối tượng sẽ được xác định ngay sau khi dò được biên cho đối tượng đó.

Một cách trực tiếp giống như một số thuật toán khác, ta có thể dùng biến đổi Hough áp dụng lên đáy của các hình chữ nhật ngoại tiếp các đối tượng này và ước lượng góc nghiêng cho văn bản. Tuy nhiên, ở đây biến đổi Hough được áp dụng sau khi đã loại bớt đi một số đối tượng bằng các ngưỡng kích thước.

Hình 6.2. Ví dụ về một ảnh văn bản nghiêng với nhiều loại đối tượng

Mục đích của việc dùng ngưỡng là dựa vào thước đo kích thước để phân loại đối tượng. Nói cách khác, dùng ngưỡng phân loại ta có thể phân biệt được một cách tương đối những đối tượng là ký tự và đối tượng phi ký tự. Nhờ biết phân biệt đối tượng, ta sẽ chỉ làm việc với các đối tượng có kích thước chủ đạo trong ảnh do đó độ chính xác của thuật toán được cải thiện đáng kể.

Giả sử ta có một ảnh văn bản nghiêng như hình vẽ trên đây. Rõ ràng đây là một ảnh văn bản phức tạp với nhiều đối tượng phi ký tự và số ký tự

chữ cái trong ảnh trên là rất ít. Mặc dù vậy, chúng ta vẫn cho rằng ảnh bị nghiêng. Vậy ta đã căn cứ vào đâu khi kết luận ảnh bị nghiêng? Trong một ảnh văn bản, thông thường các đối tượng ký tự chiếm nhiều hơn những đối tượng khác. Xuất phát từ quan điểm nhìn nhận sự vật của mắt người và đặc thù trên đây của ảnh văn bản, gợi ý cho chúng ta một hướng giải quyết bài toán góc nghiêng là xác định các đối tượng chủ đạo trong ảnh chính là các ký tự, và căn cứ vào chúng để ước lượng góc nghiêng.

Ý tưởng để xác định các đối tượng có kích thước chủ đạo trong ảnh là dùng kỹ thuật lập biểu đồ tần xuất hay Histogram kích thước để ước lượng một ký tự có tần số xuất hiện nhiều nhất trong văn bản mà ta gọi là đối tượng chuẩn. Với mỗi một ảnh đầu vào, ta sẽ xác định một đối tượng chuẩn riêng và tự động trong chương trình. Sau đó, lấy đối tượng này làm chuẩn và so sánh các đối tượng còn lại với nó. Những đối tượng có kích thước xấp xỉ bằng kích thước của đối tượng này sẽ được chọn để áp dụng biến đổi Hough. Một đối tượng được xem là xấp xỉ bằng kích thước của đối tượng khác nếu chênh lệch kích thước giữa chúng bé hơn một ngưỡng được định nghĩa trước.

Một phần của tài liệu Giáo trình xử lý ảnh số ĐH Thái Nguyên (Trang 85 - 87)

Tải bản đầy đủ (DOC)

(158 trang)
w