Phát hiện dòng và cột theo cấu trúc

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu (Trang 59 - 61)

Để phát hiện đầy đủ hơn mơi trường bảng có xuất hiện trong ảnh tài liệu, thì ngồi những bước đã thực hiện trên đây, ta cịn phải tìm kiếm những thông tin khác để xác định được nhưng khối có thể tạo thành các thành phần cịn lại của bảng. Khi phát hiện được các khối mới có khả năng tạo thành bảng, ta sẽ tìm cách sắp xếp các khối này vào các hàng và cột tương ứng. Công cụ để thực hiện công việc này được sử dụng tương tự như kỹ thuật tạo đường căn lề được trình bày trong mục 3.3.3 của

(a)

(b)

Hình 3.9: (a) Phân tích khối thuộc lớp thứ nhất thành cấu trúc các ô của bảng

(b) Ô thuộc lớp thứ hai được phân tích nhờ vào ơ thuộc khối thứ nhất

bài luận này. Sau khi xác định được các đoạn thẳng căn lề, ta duyệt qua các điểm căn lề từ trái sang phải hoặc theo chiều ngược lai. Cứ mỗi lần duyệt qua hai đoạn thẳng căn lề thì ta xác định được một cột của bảng từ đó suy ra được tổng số cột của bảng. Nếu một khối mới có chiều dài lớn hơn khoảng cách giữa hai đoạn canh lề thì xem như khối đó chứa nhiều hơn một cột.

3.6 Kết luận chương 3

Sau khi đã tìm hiểu qua một số phương pháp và kỹ thuật phát hiện bảng đã được công bố của một số tác giả khá nổi tiếng, thì việc lựa chọn nghiên cứu giải pháp phát hiện bảng thơng qua thuật tốn T-Recs đã đem lại một hướng phát triển khá khả quan. Thuật tốn lựa chọn có những ưu điểm như tốc độ xử lý nhanh, độ phức tạp nằm trong tầm kiểm soát được do thuật toán lấy ý tưởng từ việc phát hiện các từ và các khối tạo thành các cột của bảng, mà không chú trọng nhiều đến việc phải phát hiện các đối tượng phân cách khác như đường thẳng và các đối tượng ảnh khác.

Thơng qua q trình tìm hiểu và phân tích thuật tốn lựa chọn, bài luận đã có đề xuất một số điểm điều chỉnh, tuy còn chưa thể hiện được sự cải tiến vượt trội nhưng cũng đã phần nào giúp bổ sung giải quyết một số vấn đề và tình huống phát sinh khi thuật toán phải xử lý những ảnh tài liệu đa dạng. Do tính chất phức tạp và quy mơ của lý thuyết về ngành nhận dạng nói chung mà bản thân mỗi một thuật toán ứng dụng vào ngành không thể nào quản lý hết tất cả các công đoạn, qua chương này bài luận cũng đã có trình bày một số cơng đoạn xử lý sau khi thuật toán thực hiện khởi tạo phân khối để nhằm cho được các kết quả đầu ra tốt hơn.

Như đã có trình bày trong phần 3.2.3 về một số ưu điểm và tồn tại của thuật tốn khởi tạo phân khối, thì một số cơng đoạn và thủ tục xử lý sau đó vẫn chưa thể rà sốt hết tất cả các trường hợp. Điển hình như trong q trình phân tích các khối để tạo thành các ơ trong môi trường bảng chỉ mới viện dẫn được một trường hợp là các khối thuộc lớp thứ hai được bố trí kề với các khối thuộc lớp thứ nhất. Còn khối thuộc lớp thứ hai không kề với khối thuộc lớp thứ nhất chưa được đề cập ở đây. Mỗi một phương pháp được đề xuất đều mặt mạnh và điểm yếu vốn có của nó. Vì vậy trong tương lai cần phải đầu tư nhiều hơn nữa mới có thể hồn thiện được các giải pháp phát hiện các đối tượng ảnh nói chung cũng như đối tượng bảng nói riêng.

CHƯƠNG 4

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu (Trang 59 - 61)

Tải bản đầy đủ (PDF)

(65 trang)