Phương pháp phân tích dựa vào trọng tâm (Center of Gravity)

Một phần của tài liệu Nghiên cứu một số kỹ thuật hiệu chỉnh biểu mẫu và ứng dụng luận văn thạc sĩ (Trang 25 - 29)

L ỜI CẢM ƠN

1.2.3. Phương pháp phân tích dựa vào trọng tâm (Center of Gravity)

Đây là hướng tiếp cận tương đối mới cho bài toán phát hiện góc nghiêng văn bản. Ý tưởng chính của phương pháp này là đi xây dựng một đa giác từ các điểm cực biên của văn bản. Một đường thẳng được xây dựng từ tọa độ trọng tâm của đa giác đến gốc tọa độ. Như vậy, góc lệch của đường thẳng này so với trục hoành chính là góc nghiêng của văn bản.

Theo hướng tiếp cận này, việc xác định đường cơ sở nói chung là bước quan trọng nhất của toàn bộ quá trình. Một phương pháp mới được sử dụng (3)

trong thuật toán này lên tất cả các từ nội tiếp trong đa giác. Trọng tâm của đa giác với góc tọa độ sẽ tạo thành 1

đường thẳng lệch một góc nào đó với trục ngang. Góc được xác định cũng chính là góc nghiêng của từ, đoạn văn và cả ảnh văn bản.

Hình 1.4, một đa giác có 6 đỉnh được tìm thấy và trọng tâm của đa giác được xác định bằng công thức [4]:

cx= (xi + xi+1)(xiyi+1 – xi+1yi)

cy = (yi + yi+1)(xiyi+1 – xi+1yi)

Như vậy tùy theo đa giác tìm được qua bước xác định điểm xa nhất theo các hướng mà ta áp dụng thuật toán cho từng trường hợp cụ thể. Hình chữ nhật được thay thế cho đa giác như trong hình 1.5 cũng được mô tả như là một cách để xây dựng đường cơ sở giúp xác định góc nghiêng văn bản.

Hình 1.4 Đa giác 6 đỉnh và trọng tâm được xác định

Hình 1.5 Hình chữ nhật ngoại tiếp ảnh văn bản thay cho đa giác (4)

* Thuật toán gồm các bước:

+ Đầu vào: ảnh văn bản bị nghiêng giống như hình 1.6 + Đầu ra: ảnh đã được hiệu chỉnh góc nghiêng.

+ Bước 1: Xác định những điểm xa nhất trong tất cả bốn hướng. Hình 1.7 cho thấy hình ảnh quét điểm xa nhất

+ Bước 2: Tìm trọng tâm bằng cách sử dụng bốn điểm vừa xác định được ở bước 1, bốn điểm trước đại diện các góc đa giác và trung tâm đa giác (COG) có thể được tính bằng cách sử dụng các phương trình (4).

+ Bước 3: Để có được đường cơ sở, tiến hành kẻ đường thẳng nối trọng tâm đến gốc tọa độ. Hình 1.9 cho thấy đường cơ bản được tìm thấy.

+ Bước 4: Tìm góc của đường cơ sở so với trục ngang để phát hiện góc nghiêng. Hình 1.10 cho thấy việc phát hiện góc nghiêng trên ảnh văn bản.

+ Bước 5: Xoay ảnh với góc nghiêng tìm được theo chiều ngược chiều kim đồng hồ để được ảnh văn bản ngay ngắn, dễ nhìn.

* Nhận xét:

Phương pháp này tỏ ra hiệu quả khi phát hiện và hiệu chỉnh góc nghiêng của ảnh văn bản được scan vào từ tạp chí, sách giáo khoa, báo chí và tài liệu viết tay, với độ phân giải khác nhau, phông chữ khác nhau và tỷ lệ chính xác khá cao. Bên cạnh đó, phương pháp này khá đơn giản và độ phức tạp thấp dẫn đến thời gian thực hiện quá trình xử lý nhanh. Nó không bị ảnh hưởng bởi nhiễu và đồng thời còn phù hợp để làm việc với văn bản có phông chữ khác nhau và cả các văn bản có độ phân giải khác nhau.

Hình 1.7 Tìm các điểm xa nhất theo các hướng trên ảnh

Hình 1.8 Trọng tâm được xác định dựa vào các điểm xa nhất

Hình 1.9 Đường cơ sở được nối từ trọng tâm đến gốc tọa độ

Hình 1.10 Xác định góc nghiêng ảnh văn bản

Một phần của tài liệu Nghiên cứu một số kỹ thuật hiệu chỉnh biểu mẫu và ứng dụng luận văn thạc sĩ (Trang 25 - 29)

Tải bản đầy đủ (PDF)

(81 trang)