Phát sinh vùng văn bản ứng viên

Một phần của tài liệu Xây dựng hệ thống truy vấn ảnh dựa vào văn bản ngoại cảnh (Trang 30 - 31)

Để loại bỏ các thành phần có kích thước quá nhỏ và kết nối các đối tượng gần nhau trong ảnh nhị phân, chúng tôi sử dụng hai toán tử hình thái: phép đóng ảnh (closing) và phép giãn nở (dilation). Trong các ảnh có độ tương phản thấp, một ký tự có thể bị tách ra thành nhiều mảnh. Vì vậy, đầu tiên chúng ta cần kết nối các thành phần này lại để tránh những sai lầm khi phân tích các thành phần kết nối. Chúng tôi sử dụng toán tử đóng ảnh với cấu trúc 13x13 trên ảnh nhị phân thu được từ bước xử lý trước để giải quyết vấn đề này.

Bước tiếp theo, toán tử giãn nở được áp dụng để kết nối các điểm ảnh thành các vùng văn bản ứng viên. Toán tử giãn nở thường được sử dụng để mở rộng và kết nối các vùng gần nhau. Trong phương pháp đề xuất, chúng tôi sử dụng toán tử giãn nở với cấu trúc 33x1 để kết nối các thành phần thành các vùng văn bản ứng viên. Một số quy luật heuristic được áp dụng để lựa chọn các vùng văn bản ứng viên cuối cùng. Các vùng văn bản ứng viên được chọn thỏa mãn các điều kiện sau:

 Tỉ lệ chiều cao/chiều rộng của vùng ứng viên không nhỏ hơn ngưỡng

0.5

hv

T  .

 Chiều cao của vùng ứng viên không nhỏ hơn 8 và diện tích không nhỏ hơn 300. Điều kiện này để loại bỏ các đối tượng có kích thước quá bé, cho kết quả không tốt trong giai đoạn nhận dạng.

 Số lượng điểm ảnh biên cạnh trung bình trên từng dòng không nhỏ hơn 8. Hình 3.4 minh họa các kết quả thực hiện của giai đoạn này, trong đó Hình 3.4c) là các vùng văn bản ứng viên cuối cùng thỏa mãn các điều kiện được lựa chọn (được đánh dấu bằng hình chữ nhật màu đỏ bao quanh).

Hình 3.4 a) Kết quả thực hiện toán tử đóng trên ảnh nhị phân; b) Thực hiện phép giãn nở trên ảnh a); c) Các vùng văn bản ứng viên đƣợc lựa chọn

Một phần của tài liệu Xây dựng hệ thống truy vấn ảnh dựa vào văn bản ngoại cảnh (Trang 30 - 31)