Những nét vẽ liên thông tám láng giềng thứ ha

Một phần của tài liệu Nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu luận văn thạc sĩ (Trang 39 - 40)

Đến bước này thì các nhóm ký tự tạo thành các từ ngữ bố trí liền kề nhau đã được tô đen các khoảng trắng giữa chúng để tạo thành các nét bút LT8LG2. Bây giờ chúng ta tiến hành phân tích các thành phần liên thông tám này. Việc phân tích và xử lý hoàn toàn tương tự như phần 2.4.2, chỉ khác ở chỗ trong phần 2.4.2 thì phân tích trên đối tượng nét bút LT8LG còn ở phần này thì lại thực hiện xử lý trên đối tượng nét bút LT8LG2. Chúng ta sẽ lấy ra tọa độ các điểm biên của nét bút LT8LG2 bằng việc quét ảnh tài liệu theo từng dòng để duyệt qua toàn bộ các điểm biên. Phương pháp tính ở đây tương tự như đã thực hiện trong phần 2.4.2, chúng ta tiếp tục lập và tính toán các biến số tương tự và các tham số cho trước phù hợp gồm: VBQ2, TyleDen2 và TyleChieu2, TS6, TS7, TS8, TS9 (Zhaoyang-1998). Nét

Hình 2.6: Mô tả kết quả tô đen các điểm ảnh trắng thỏa mãn điều kiện cho trước.

vẽ LT8LG2 được đồng nhất với đối tượng ảnh khi thỏa mãn một trong các bất đẳng thức sau đây:

a) TyleDen2 ≤ TS6;

b) Độ dài của cạnh dài hơn trong VBQ2 ≤ TS7;

c) Độ dài của cạnh nhỏ hơn trong VBQ2 ≤ TS8; hoặc,

d) Độ dài của cạnh nhỏ hơn trong VBQ2 ≤ TS7 và TyleChieu2 ≥ TS9. Ở phần này nếu như giá trị của TyleDen2 không đủ lớn (tỷ lệ của nó chưa đạt được 75%), thì ta thực hiện công đoạn thu nhỏ dần đến cực tiểu vùng bao quanh của nét bút LT8LG2, bằng cách quay các điểm biên trong ảnh của nét bút LT8LG2. Ước lượng tám lần quay cho một nét bút LT8LG2 và cũng ước lượng mỗi lần quay một góc 10o, thực hiện xong các lần quay thì sẽ tạo được hình chữ nhật tạo thành vùng bao quanh nhỏ nhất, và tiếp tục quay hình chữ nhật nhỏ nhất này với góc quay tương ứng nhưng chiều quay ngược lại thì sẽ tạo được một hình chữ nhật nghiêng. Hình chữ nhật nghiêng này là vùng bao quanh nhỏ nhất của nét bút LT8LG2, đồng thời hình chữ nhật nghiêng tạo ra một góc và đó chính là hướng của chuỗi ký tự. Như vậy, chúng ta đã xác định được hướng của chuỗi văn bản (cũng đồng nhất là hướng của chuỗi ký tự) trong ảnh tài liệu. Các đối tượng ảnh đã phát hiện trong bước này sẽ được tiếp tục ghi nhận vào lớp đối tượng ảnh và lặp lại bước xóa chúng khỏi ảnh tài liệu ban đầu.

Một phần của tài liệu Nghiên cứu và ứng dụng thuật toán phát hiện bảng trong ảnh tài liệu luận văn thạc sĩ (Trang 39 - 40)