Phát hiện dòng và cột theo cấu trúc

Một phần của tài liệu Nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu luận văn thạc sĩ (Trang 59 - 61)

Để phát hiện đầy đủ hơn môi trường bảng có xuất hiện trong ảnh tài liệu, thì ngoài những bước đã thực hiện trên đây, ta còn phải tìm kiếm những thông tin khác để xác định được nhưng khối có thể tạo thành các thành phần còn lại của bảng. Khi phát hiện được các khối mới có khả năng tạo thành bảng, ta sẽ tìm cách sắp xếp các khối này vào các hàng và cột tương ứng. Công cụ để thực hiện công việc này được sử dụng tương tự như kỹ thuật tạo đường căn lề được trình bày trong mục 3.3.3 của

(a)

(b)

Hình 3.9: (a) Phân tích khối thuộc lớp thứ nhất thành cấu trúc các ô của bảng (b) Ô thuộc lớp thứ hai được phân tích nhờ vào ô thuộc khối thứ nhất

bài luận này. Sau khi xác định được các đoạn thẳng căn lề, ta duyệt qua các điểm căn lề từ trái sang phải hoặc theo chiều ngược lai. Cứ mỗi lần duyệt qua hai đoạn thẳng căn lề thì ta xác định được một cột của bảng từ đó suy ra được tổng số cột của bảng. Nếu một khối mới có chiều dài lớn hơn khoảng cách giữa hai đoạn canh lề thì xem như khối đó chứa nhiều hơn một cột.

3.6 Kết luận chương 3

Sau khi đã tìm hiểu qua một số phương pháp và kỹ thuật phát hiện bảng đã được công bố của một số tác giả khá nổi tiếng, thì việc lựa chọn nghiên cứu giải pháp phát hiện bảng thông qua thuật toán T-Recs đã đem lại một hướng phát triển khá khả quan. Thuật toán lựa chọn có những ưu điểm như tốc độ xử lý nhanh, độ phức tạp nằm trong tầm kiểm soát được do thuật toán lấy ý tưởng từ việc phát hiện các từ và các khối tạo thành các cột của bảng, mà không chú trọng nhiều đến việc phải phát hiện các đối tượng phân cách khác như đường thẳng và các đối tượng ảnh khác.

Thông qua quá trình tìm hiểu và phân tích thuật toán lựa chọn, bài luận đã có đề xuất một số điểm điều chỉnh, tuy còn chưa thể hiện được sự cải tiến vượt trội nhưng cũng đã phần nào giúp bổ sung giải quyết một số vấn đề và tình huống phát sinh khi thuật toán phải xử lý những ảnh tài liệu đa dạng. Do tính chất phức tạp và quy mô của lý thuyết về ngành nhận dạng nói chung mà bản thân mỗi một thuật toán ứng dụng vào ngành không thể nào quản lý hết tất cả các công đoạn, qua chương này bài luận cũng đã có trình bày một số công đoạn xử lý sau khi thuật toán thực hiện khởi tạo phân khối để nhằm cho được các kết quả đầu ra tốt hơn.

Như đã có trình bày trong phần 3.2.3 về một số ưu điểm và tồn tại của thuật toán khởi tạo phân khối, thì một số công đoạn và thủ tục xử lý sau đó vẫn chưa thể rà soát hết tất cả các trường hợp. Điển hình như trong quá trình phân tích các khối để tạo thành các ô trong môi trường bảng chỉ mới viện dẫn được một trường hợp là các khối thuộc lớp thứ hai được bố trí kề với các khối thuộc lớp thứ nhất. Còn khối thuộc lớp thứ hai không kề với khối thuộc lớp thứ nhất chưa được đề cập ở đây. Mỗi một phương pháp được đề xuất đều mặt mạnh và điểm yếu vốn có của nó. Vì vậy trong tương lai cần phải đầu tư nhiều hơn nữa mới có thể hoàn thiện được các giải pháp phát hiện các đối tượng ảnh nói chung cũng như đối tượng bảng nói riêng.

CHƯƠNG 4

Một phần của tài liệu Nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu luận văn thạc sĩ (Trang 59 - 61)