TÁCH BẢNG DỰA TRấN TẬP CÁC HèNH CHỮ NHẬT

Một phần của tài liệu Giáo trình môn xử lý ảnh ppt (Trang 110 - 113)

RỜI RẠC

Một trong những vấn đề cơ bản của nhận dạng cỏc trang văn bản núi chung và cỏc trang văn bản ở dạng bảng núi riờng là phải phõn tớch được chỳng. Đối với cỏc trang văn bản thụng thường thỡ phải hiểu phạm vi, cấu trỳc của cỏc khối văn bản. Trong cỏc trang hoặc khối văn bản ở dạng bảng thỡ phải hiểu và phõn tớch được cỏc ụ chứa trong bảng. Vỡ chỉ khi nào phõn tớch được bảng một cỏch chớnh xỏc thỡ khi đú mới cú thể tiến hành nhận dạng cỏc thụng tin trong cỏc ụ trong nú một cỏch chớnh xỏc và cũng chỉ cú phõn tớch được bảng một cỏch chớnh xỏc thỡ sau quỏ trỡnh nhận dạng cỏc ụ mới được trả lại cấu trỳc của nú một cỏch chớnh xỏc.

Nhận dạng đối tượng Bất biến đồng dạng Bất biến Aphin Đường trũn Ellipse Hỡnh chữ nhật

Tam giỏc đều

Ellipse Tam giỏc

Tứ giỏc Đa giỏc

c)

a) b)

d)

Hỡnh 6.19. Khối văn bản ở dạng bảng

Trong mục này chỳng tụi đưa ra cỏch phõn tớch bảng theo tiếp cận từ dưới lờn. Ban đầu cỏc ụ trong bảng sẽ được phỏt hiện nhờ kỹ thuật tỏch đối tượng hỡnh học với dạng đối tượng là hỡnh chữ nhật. Dựa trờn cỏc hỡnh chữ nhật tỡm được, chỳng tụi xõy dựng lưới tựa hỡnh chữ nhật. Sau đú tiến hành hiệu chỉnh lưới dựa trờn khoảng cỏch ngưỡng cho trước. Từ tập lưới đó sửa tiến hành hiệu chỉnh lại tập hỡnh chữ nhật. Dựa vào tập hỡnh chữ nhật và lưới cú thể phỏt hiện ra cỏc ụ thiếu. Cỏc tiếp cận này cú thể phõn tớch và hiệu chỉnh đối với cỏc bảng cú cỏc ụ được ghộp (merge) với nhau và cả những bảng cú đường nột khụng đủ. Bờn cạnh đú, chỳng tụi cũng đưa ra cỏc đỏnh giỏ như thế nào là tập hỡnh chữ nhật cú thể chuyển đổi thành bảng. Với việc đỏnh giỏ như vậy cú thể dẫn tới việc nhận dạng đối

tượng bảng một cỏch

tự động.

6.6.1. Phõn tớch bài toỏn

Để phõn tỏch được bảng chỳng tụi thực hiện phõn tớch từ dưới lờn. Đầu tiờn, tiến hành tỏch ra cỏc chu tuyến sau đú dựa vào chu tuyến trong để nhận ra cỏc hỡnh chữ nhật. Chu tuyến là dóy liờn tiếp cỏc điểm biờn của ảnh. Mỗi chu tuyến đều tồn tại một chu tuyến đối ngẫu. Nếu chu tuyến cú độ dài nhỏ hơn chu tuyến đối ngẫu thỡ ta gọi nú là chu tuyến bờn trong. Trong trường hợp ngược lại thỡ đú là chu tuyến ngoài. Từ cỏc chu tuyến trong tiến hành nhận dạng để tỡm ra tập cỏc hỡnh chữ nhật.

Quỏ trỡnh xõy dựng bảng được tiến hành từ tập cỏc hỡnh chữ nhật tỏch được từ ảnh. Tập cỏc hỡnh chữ nhật là tập liờn thụng hoặc được lựa chọn trong một hỡnh chữ nhật. Dựa vào tập cỏc hỡnh chữ nhật chỳng tụi xõy dựng được cỏc lưới tựa cỏc hỡnh chữ nhật (lưới là tập cỏc toạ độ ngang dọc).

a) Tập hỡnh chữ nhật ban đầu, b) Dựng lưới dựatrờn tập cỏc hỡnh chữ nhật, c) Hiệu chỉnh lưới, d) Hiệu chỉnh bảng dựa trờn lưới, e) Xỏc định ụ khuyết thiếu

f) Sau khi đó bổ sung thờm ụ.

Hỡnh 6.20. Quỏ trỡnh hiệu chỉnh bảng từ tập hỡnh chữ nhật

Bước tiếp theo là tiến hành hiệu chỉnh tập lưới sao cho bất cứ hai toạ độ ngang hoặc dọc khụng quỏ gần nhau. Dựa vào lưới đó hiệu chỉnh cú thể hiệu chỉnh tập hỡnh chữ nhật sao cho tất cả cỏc đỉnh của tập cỏc hỡnh chữ nhật nằm trờn lưới, cỏch hiệu chỉnh được tiến hành cho từng hỡnh chữ nhật. Việc hiệu chỉnh cỏc hỡnh chữ nhật nằm trờn lưới sẽ cho phộp ta phỏt hiện và bổ sung những hỡnh chữ nhật cũn khuyết.

Việc đỏnh giỏ khả năng tỏch bảng được thực hiện như sau: Tớnh tỉ số giữa số ụ lưới được phủ bởi cỏc hỡnh chữ nhật vừa được hiệu chỉnh với tống số ụ lưới được tạo ra. Nếu tỷ số này lớn hơn ngưỡng cho trước thỡ việc chuyển đổi bảng được coi như thành cụng.

Hỡnh 6.21. Quan hệ giữa điểm, hỡnh chữ nhật, lưới, bảng

Để thực hiện việc chuyển đổi từ tập cỏc hỡnh chữ nhật thành bảng chỳng ta cần xỏc định cỏc mối quan hệ nội tại trong cỏc hỡnh như tập cỏc điểm tạo ra một ảnh, tập cỏc hỡnh vuụng, lưới và bảng dựa trờn lưới.

Thuật toỏn xỏc định và hiệu chỉnh đối tượng bảng

Ban đầu, cỏc ụ trong bảng sẽ được phỏt hiện nhờ kỹ thuật tỏch đối tượng hỡnh học. với dạng đối tượng là hỡnh chữ nhật. Dựa trờn cỏc hỡnh chữ nhật tỡm được, xõy dựng lưới tựa hỡnh chữ nhật, sau đú tiến hành hiệu chỉnh lưới dựa trờn khoảng cỏch ngưỡng cho trước. Từ tập lưới đó sửa tiến hành hiệu chỉnh lại tập hỡnh chữ nhật. Dựa vào tập hỡnh chữ nhật và lưới cú thể phỏt hiện ra cỏc ụ thiếu. Trờn cơ sở đú đỏnh giỏ như thế nào là tập hỡnh chữ nhật cú thể chuyển đổi thành bảng. Hiệu chỉnh L à Phủ Tựa lưới Rời nhau, Phủ nhau, Kề Trong, ngoài Điểm Hỡnh chữ nhật Lưới Bảng

Với việc đỏnh giỏ như vậy cú thể dẫn tới việc nhận dạng đối tượng bảng một cỏch tự động. Qua thực nghiệm chỳng tụi thấy cỏch tiếp cận này cú thể phõn tớch và hiệu chỉnh đối với cỏc bảng cú cỏc ụ được nối (merge) với nhau và cả những bảng cú đường nột khụng đủ.

Một phần của tài liệu Giáo trình môn xử lý ảnh ppt (Trang 110 - 113)

Tải bản đầy đủ (DOC)

(158 trang)
w