Phép chiếu hình dạng trên và dưới (Top – Bottom Shape Projections)

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu trích chọn đặc trưng ứng dụng cho tìm kiếm từ trong ảnh tài liệu (Trang 66 - 69)

2.3 .Trích chọn đặc trưng ứng dụng cho tìm kiếm từ trong ảnh tài liệu

2.3.3.3 .Phân đoạn từ trong ảnh tài liệu

2.4. Đối sánh những đặc trưng trong hệ thống đề xuất

2.4.5. Phép chiếu hình dạng trên và dưới (Top – Bottom Shape Projections)

Phép chiếu hình dạng trên và dưới như được mô tả ở hình 2.34 bên dưới có thể được xem như là dấu hiệu để xác định hình dạng của từ. Dấu hiệu này đưa đến một vector đặc trưng gồm 50 thành phần, trong đó 25 giá trị đầu là 25 hệ số đầu tiên của

trên đã được chuẩn hóa và làm trơn (hình 2.34d) và 25 giá trị còn lại là 25 hệ số của phép biến đổi cosin rời rạc trong phép chiếu hình dạng dưới đã được chuẩn hóa và làm trơn (hình 2.34e).

Để tính toán phép chiếu hình dạng trên, ảnh của từ được quét từ trên xuống dưới. Quan sát ở hình 2.34b, bất cứ khi nào điểm ảnh đen được tìm thấy thì các điểm ảnh sau đó trong cùng một cột, xét theo chiều từ trên xuống dưới được chuyển thành điểm ảnh đen.

Phép chiếu hình dạng dưới cũng được thao tác tương tự. Như quan sát ở hình 2.34c, ảnh của từ được quét từ dưới lên trên. Tất cả điểm ảnh trong cùng một cột sẽ chuyển thành điểm ảnh đến khi một điểm ảnh đen được tìm thấy.

Hình 2.34 Ảnh biểu diễn thao tác với đặc trưng phép chiếu trên và dưới của từ

Cuối cùng hai phép chiếu này được tính toán giống như đặc trưng phép chiếu dọc trước đó.

2.4.6. Những đặc trưng phần bên trên và bên dưới của từ (Upper - Down Grid Features )

Phần bên trên của từ là phần mà các chữ cái bình thường có phần nhô ra hướng lên trên như chữ ‘d’, ‘t’, ‘b’...v.v. Đặc trưng lấy ở đây gồm 10 thành phần

với giá trị nhị phân lấy ra từ phần bên trên của từ. Để tính toán những đặc trưng này, ban đầu chúng ta phải có phép chiếu ngang của ảnh. Sau đó, từ phép chiếu ngang này, phần bên trên của từ được xác định theo thuật toán sau:

Bước 1: Áp dụng phép làm trơn cho phép chiếu ngang với ma trận mặt nạ 5×1.

Bước 2: Bắt đầu từ trên, tìm vị trí i trong biểu đồ phép chiếu ngang V[i] sao cho V[i] ≥ 3

2H như Hình bên dưới. Trong đó, H là chiều cao lớn nhất của phép chiếu ngang (max{V[i]}). Nếu như vị trí i là nằm nửa bên dưới của phép chiếu ngang thì từ đó không có phần bên trên.

Bước 3: Tìm vị trí k (0,i) trong lược đồ phép chiếu ngang V[i] khi V(k) V(k-1) 0. Thì k định nghĩa vị trí phần bên trên của từ, Nếu k có giá trị nhỏ ( 3 hoặc 2 ) thì từ không có phần bên trên.

Hình 2.35 Ảnh biểu diễn thao tác với đặc trưng thông tin về phần bên trên và phần bên dưới của từ

thì giá trị tương đối của vector đặc trưng sẽ đặt là 1; ngược lại đặt là 0. Vector đặc trưng thu được như ở hình 2.35d.

Phần bên dưới của từ là phần mà các chữ cái bình thường có phần nhô hướng xuống dưới ra như chữ ‘y’, ‘p’, ‘g’...v.v. Đặc trưng này được tính toán tương tự như đặc trưng phần trên của từ. Nhưng việc tìm kiếm phần bên dưới bắt đầu từ dưới lên trên.

Cuối cùng tổng hợp từ các đặc trưng lấy ra ta có vector đặc trưng gồm 93 thành phần theo thứ tự cấu trúc như hình 2.36 bên dưới.

Hình 2.36 Mô hình 93 thành phần theo thứ tự cấu trúc

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu trích chọn đặc trưng ứng dụng cho tìm kiếm từ trong ảnh tài liệu (Trang 66 - 69)

Tải bản đầy đủ (PDF)

(82 trang)