CHU TUYẾN
Gúc nghiờng văn bản là một bài toỏn kinh điển trong xử lý ảnh văn bản. Một hệ thống xử lý ảnh văn bản thường phải giải quyết bài toỏn phỏt hiện gúc nghiờng như một bước đầu tiờn và tất yếu. Chớnh vỡ vậy, cựng với sự phỏt triển của xử lý ảnh núi chung và xử lý ảnh văn bản núi riờng, bài toỏn gúc nghiờng văn bản cũng được quan tõm ngày càng nhiều và dưới nhiều gúc độ khỏc nhau. Cú rất nhiều hướng tiếp cận cho bài toỏn gúc nghiờng văn bản từ trước tới nay. Cỏc thuật toỏn phỏt hiện gúc nghiờng thường được xõy dựng cho cỏc hệ thống phõn tớch ảnh văn bản khỏc nhau nờn chỉ giải quyết cho những loại ảnh văn bản cụ thể. Cú thể chia ra một số hướng tiếp cận cơ bản cho bài toỏn gúc nghiờng văn bản như sau:
• Cỏc thuật toỏn dựa vào phõn tớch hỡnh chiếu (Projection Profile) • Cỏc thuật toỏn dựa vào biến đổi Hough (Hough Transform)
• Cỏc thuật toỏn phõn tớch lỏng giềng (Nearest Neighbour Clustering)
• Phương phỏp dựng cỏc phộp toỏn hỡnh thỏi
Dựa vào tớnh chất mỗi đối tượng ảnh cú duy nhất một chu tuyến ngoài và quan niệm con người nhận ra độ nghiờng của văn bản dựa vào cỡ chữ chiếm chủ đạo trong văn bản. Mục này đề cập đến việc tớnh toỏn kớch thước chủ đạo của cỏc đối tượng ảnh trong văn bản thụng qua kỹ thuật tớnh biểu đồ tần xuất kớch thước hỡnh chữ nhật nhỏ nhất bao quanh đối tượng ảnh. Việc xỏc định gúc nghiờng văn bản sẽ được xỏc định nhờ phộp biến đổi Hough cho những điểm giữa đỏy của hỡnh chữ nhật nhỏ nhất bao quanh đối tượng ảnh cho cỏc đối tượng ảnh cú kớch thước chủ đạo.