Thuật toán Yue Lu và Chew Lim Tan

Một phần của tài liệu tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng (Trang 45 - 46)

Trƣớc hết, dùng thuật toán phân tích thành phần liên thông để thu đƣợc các đối tƣợng ảnh riêng biệt. Mỗi một đối tƣợng Ci nội tiếp trong một hình chữ nhật có các cặp tọa độ trên trái và dƣới phải tƣơng ứng là (xli,yti) và (xli,yti), trọng tâm của hình chữ nhật ký hiệu là (xli,yti), ký hiệu hci và wci là các chiều cao và rộng của hình chữ nhật. Ta có các định nghĩa sau:

a. Định nghĩa 1:Khoảng cách từ tâm tới tâm của hai đối tƣợng C1 và C2 đƣợc định nghĩa:

dc(C1,C2)= ∆x + ∆y (Với ∆x = |xc1-xc2| và ∆y = |yc1-yc2|)

b. Định nghĩa 2: Khoảng hụt của hai đối tƣợng C1 và C2 đƣợc định nghĩa: dg(C1,C2) =max (xl2-xr1, xl1-xr2) nếu ∆x > ∆y

dg(C1,C2) =max (yt2-xb1, yt1-yb2) nếu ∆x < ∆y

c. Định nghĩa 3: Định nghĩa láng giềng thân cận

C2 đƣợc gọi là láng giềng thân cận của C1 nếu thỏa mãn các điều kiện sau:  hc1≈hc2 nếu ∆x > ∆y hoặc wc1≈ wc2 nếu ∆x < ∆y

 Cx2 > Cx1 với ∆x > ∆y hoặc Cx1 > Cx2 với ∆x < ∆y  d(C1,C2) = min dc(C1,Cm) với mọi m

dg(C1,C2) < β.max (hc1,hc2)

Với β là một hằng số đƣợc định nghĩa trƣớc trong thuật toán.

38

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

K-NN đƣợc định nghĩa là một dãy chứa K đối tƣợng trong đó hai đối tƣợng kề nhau là các láng giềng của nhau theo định nghĩa 2.

e. Định nghĩa 5: Định nghĩa góc lệch của một dãy K-NN

Giả sử có dãy K-NN: S=[C1, C1, C1,..., Ck,]. Góc nghiêng của dãy các láng giềng này đƣợc định nghĩa nhƣ sau:

 Nếu xck-xc1 < yck-yc1 thì slopeK = (xck-xc1)/(yck-yc1)  Nếu xck-xc1 > yck-yc1 thì slopeK = (yck-yc1)/ (xck-xc1)

Nhƣ vậy, điểm cải tiến lớn nhất của thuật toán này là việc quyết định hai đối tƣợng có là láng giềng của nhau hay không dựa vào các tiêu chí về kích thƣớc của mỗi một đối tƣợng và khoảng cách giữa chúng. Trong định nghĩa 4, K là số các láng giềng trong một cụm láng giềng, K càng lớn thì vector định hƣớng của cụm gáng ghiềng có hƣớng càng gần với góc lệch thực sự của văn bản. Trong thuật toán, K đƣợc giảm dần cho đến khi số các cụm láng giềng đủ để xác định đƣợc góc lệch cho văn bản.

Các thuật toán phân tích láng giềng có chi phí tính toán thấp hơn các thuật toán áp dụng biến đổi Hough vừa trình bày ở trên. Tuy nhiên, tất cả các thuật toán phân tích láng giềng đều bị cản trở bởi giới hạn góc lệch và khoảng cách các dòng văn bản.

Một phần của tài liệu tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng (Trang 45 - 46)