2.4. Quá trình nhận dạng từ
2.4.3. Quá trình xác định các vị trí cắt khác nhau trên ảnh đầu vào
Đối với chữ in, đường phân cách (hoặc vị trí cắt) giữa các từ và các ký tự trên một từ thường được xác định theo theo hai phương pháp:
Xác định theo miền liên thông.
Xác định các vị trí có mật độ thấp trên biểu đồ tần suất theo chiều thẳng đứng của dòng chữ.
Tuy vậy, hai phương pháp này lại không hiệu quả đối với chữ viết tay bởi lẽ đối với chữ viết tay thì các ký tự thường bị dính nhau ngoài ra độ nghiêng của ký tự cũng rất khác nhau. Từ những nghiên cứu một cách trực quan về chữ viết tay, cho thấy: Ðối với chữ viết tay, các ký tự thường bị dính nhau ở phần giao giữa biên bên trái của ký tự thứ nhất và biên bên phải của ký tự thứ hai, các vị trí dính nhau có thể ở phía đỉnh, phía đáy hoặc phía thân của mỗi ký tự đồng thời đường nối giữ các ký tự thường có dạng các đường cong đặc trưng với độ cong và kích thước khác
nhau [18].
Chúng tôi nhận thấy có đường cong đặc trưng cơ bản sau:
Ðường cong nghiêng phải, đường cong nghiêng trái, đường cong lồi, đường cong lõm, đường dốc phải, đường dốc trái
Trong luận văn này, chúng tôi đã đề xuất một phương pháp xác định các vị trí cắt khác nhau trên ảnh đầu vào bằng việc tìm kiếm các vị trí có mật độ thấp trên biểu đồ tần xuất theo chiều thẳng đứng của ảnh đầu vào kết hợp với việc tìm kiếm
các đường cong đặc trưng. Thuật toán này được thể hiện một cách chi tiết hơn như sau:
INPUT: - Ảnh đầu vào (ảnh của từ)
- Tập các đường cong đặc trưng: F
OUTPUT: Một danh sách các vị trí cắt (có thứ tự ) trên ảnh đầu vào: S PROCESS:
Bƣớc 1:Tính histogram (biểu đồ tần suất) theo chiều thẳng đứng của ảnh đầu vào.
Bƣớc 2: Tìm kiếm tất cả các vị trí có mật độ tần suất thấp (0), trường hợp nhiều vị trí liền nhau cùng có mật độ tần suất = 0, ta sẽ chọn vị trí đầu tiên và bỏ qua các vị trí liền kề nó cho đến khi gặp điểm có mật độ tần suất 0. Để lưu các vị trí cắt đã tìm được, ta sử dụng cấu trúc dữ liệu kiểu danh sách (list).
Bƣớc 3: Xác định tất cả các đường cong đặc trưng trên ảnh (dựa vào tập các đường cong đã được định nghĩa ở trên).
Bƣớc 4: Với mỗi đường cong đặc trưng đã tìm được, tiến hành:
- Tìm kiếm trong khoảng các điểm chạc (thường là điểm chạc 3, chạc 4) trong khoảng [x-, x+], với x là tọa độ điểm mút bên phải của đường cong đặc trưng và là hệ số để điều chỉnh khoảng tìm kiếm. Nếu có nhiều điểm cùng thỏa mãn sẽ ưu tiên chọn các điểm phía bên phải. Nếu không tìm được điểm chạc nào, ta sẽ chọn điểm mút hoặc trung điểm của đường cong này làm điểm cắt.
- Lưu điểm cắt vừa tìm được vào danh sách trên.
Bƣớc 5: Sắp xếp lại danh sách theo chiều tăng dần của toạ độ x, trả về danh sách các vị trí cắt đã tìm được và kết thúc một lần tìm kiếm.
Thuật toán 2-3: Thuật toán xác định các vị trí cắt khác nhau trên ảnh đầu vào
area1. Sau khi thực hiện xong bước 4, ta tìm được bốn vị trí (pos2->pos5) tương ứng với các vùng (area2->area5). Kết quả cuối cùng ta sẽ thu được một danh sách
S gồm 5 vị trí cắt (pos1->pos5) tương ứng với các vùng (area1->area5). Tuy nhiên, sau bước nhận dạng ký tự, ta sẽ xác định được chỉ có vị trí cắt thứ nhất (pos1) là hợp lệ.
Hình 2.5: Kết quả thực hiện của thuật toán xác định các vị trí cắt trên ảnh đầu vào