Chương trình thử nghiệm thuật toán phát hiện đối tượng ảnh và văn bản

Một phần của tài liệu Nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu luận văn thạc sĩ (Trang 64 - 65)

Chương trình thử nghiệm phát hiện đối tượng văn bản và hình ảnh tồn tại chung trong một ảnh tài liệu được thực hiện theo trình tự qua các bước sau đây:

Bước 1: Phát hiện các đối tượng là những đường kẻ thuần túy ngang và dọc có độ dài lớn hơn hoặc bằng tham số TS1 rồi chuyển chúng sang lớp đối tượng ảnh.

Bước 2: Dò biên lần thứ nhất để phát hiện các nét bút liên thông tám láng giềng thứ nhất (LT8LG) và tạo vùng bao quanh của đối tượng, lưu thông tin của các nét bút LT8LG vào cấu trúc dữ liệu mảng (array).

Bước 3: Phân tích các nét bút LT8LG, tính các tham số VBQ, TyleDen, TyleChieu để phát hiện được đối tượng ảnh rồi chuyển chúng sang lớp đối tượng ảnh.

Bước 4: Tô đen các ký tự gần nhau theo hai chiều ngang và dọc. Khoảng cách gần nhau của các ký tự được xác định theo tham số cho trước.

Bước 5: Dò biên lần thứ hai để phát hiện các nét bút liên thông tám láng giềng thứ hai (LT8LG2) trên các đối tượng được tạo ra nhờ kỹ thuật tô đen và tạo vùng bao quanh của các đối tượng mới này, lưu thông tin của các nét bút LT8LG2 vào array.

Bước 6: Tiếp tục phát hiện các đối tượng ảnh (nếu có) và chuyển chúng sang lớp đối tượng ảnh. Các đối tượng còn lại được lưu vào lớp đối tượng văn bản.

Kích chọn nút Đặt tham số sẽ có một tham số CBT (cao trung bình) phải thiết lập đó là giá trị độ cao trung bình của ký tự. Kích chọn nút Tính lại tham số

để chương trình tự động tính các tham số khác có phụ thuộc vào nó và có các tham số mặc định như đã trình bày trong mục 2.4.7. Lần lượt thao tác qua các bước của chương trình để có được các kết quả:

- Các đường kẻ ngang và dọc (đoạn thẳng thuần túy) dài hơn giá trị tham số TS1 được chuyển vào lớp đối tượng ảnh.

- Tạo vùng bao quanh hình chữ nhật của các đối tượng và chuyển các đối tượng ảnh đạt yêu cầu vào lớp đối tượng ảnh.

- Tiếp tục chuyển các đối tượng ảnh đạt yêu cầu tiếp theo vào lớp đối tượng ảnh sau khi đã tiến hành phát hiện các nét bút LT8LG2.

Hình 4.4 thể hiện giao diện của chương trình và hình 4.5 thể hiện một kết quả phát hiện văn bản và hình ảnh của thuật toán.

Hình 4.4: Giao diện chương trình thử nghiệm phát hiện đối tượng văn bản và

hình ảnh trong ảnh tài liệu. Nguồn: Xử lý của tác giả (7/2012)

Hình 4.5: Một kết quả thử nghiệm đối với ảnh tài liệu có chứa cả văn bản

Một phần của tài liệu Nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu luận văn thạc sĩ (Trang 64 - 65)

Tải bản đầy đủ (PDF)

(65 trang)