Kỹ thuật Background Directional Distribution

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 49 - 53)

Thông thường các kỹ thuật rút trích đặc trưng quan tâm đến sự phân bố điểm ảnh màu đen. Tuy nhiên, Dhir R. và các cộng sự trong nghiên cứu ở [12] đã đề xuất một kỹ thuật rút trích đặc trưng dựa trên các điểm ảnh màu trắng. Đó là kỹ thuật Background Directional Distribution (phân bố điểm ảnh nền theo hướng). Đúng như tên gọi, kỹ thuật này sử dụng tính chất phân bổ tương đối giữa các điểm ảnh màu trắng (điểm ảnh nền – background pixel) xung quanh một điểm ảnh màu đen (điểm ảnh ) theo các hướng trong la bàn ở hình 2.11:

Hình 2.11. La bàn 8 hướng trong Background Directional Distribution d1 d5 d2 d4 d3 d7 d8 d6

Chi tiết thuật toán được trình bày như sau:

 Bước 1: Chia toàn bộ ảnh ký tự ra thành 16 vùng.

 Bước 2: Lần lượt thực hiện các thao tác sau với từng vùng:

Áp lần lượt tất cả các mặt nạ trong hình 2.12 lên từng điểm ảnh màu đen trong vùng:

Hình 2.12. Các mặt nạ tương ứng với 8 hướng [12]

Với mỗi mặt nạ tương ứng với mỗi hướng, ta áp vị trí chữ X vào điểm ảnh màu đen. Khi đó tổng số giá trị trên mặt nạ mà có vị trí trùng với những điểm ảnh màu trắng xung quanh chữ X sẽ được cộng lại.

Với mỗi một hướng trong vùng, tính tổng tất cả các giá trị vừa tìm được bên trên xét theo hướng ấy.

 Bước 3: Kết thúc quá trình trên, từ tập dữ liệu mẫu, ta thu được tập các vector đặc trưng có 8 * 16 = 128 chiều.

2.2.11.Kỹ thuật Shadow

Kỹ thuật Shadow (hình chiếu) được Arora S. và các cộng sự giới thiệu trong nghiên cứu ở [6]. Đây là một kỹ thuật đơn giản về mặt tiếp cận nội dung, sử dụng đặc tính về hình học của ảnh mà cụ thể là đặc tính về độ dài hình chiếu của một

phần ký tự lên một đoạn thẳng nào đó cho trước. Cụ thể các đoạn thẳng được xét sẽ là các đoạn chéo tính từ tâm ảnh đến bốn góc vuông và trung điểm của bốn cạnh.

Hướng tiếp cận của các tác giả trong [6] là sử dụng hình vuông là kích thước chuẩn hóa của ảnh ký tự. Kỹ thuật được trình bày như sau:

 Bước 1: Ảnh ký tự sẽ được chia ra thành 8 phần như hình 2.13, mỗi phần như thế cho ta một hình tam giác vuông có hai cạnh bằng nhau và bằng một nửa cạnh hình vuông ảnh, có cạnh huyền bằng một nửa đường chéo của hình vuông ảnh:

Hình 2.13. Cách tính hình chiếu cho kỹ thuật Shadow [6]

 Bước 2: Lần lượt xét từng tam giác vuông bằng cách tính độ dài hình chiếu D1 và D2 của các điểm ảnh không phải nền trong tam giác đó lên hai cạnh góc vuông của tam giác theo hình 2.14:

 Bước 3: Sau khi tính hết toàn bộ các giá trị cho các tam giác vuông, ta thu được 16 giá trị cho 16 chiều của vector đặc trưng, tương ứng 8 vùng tam giác, mỗi vùng hai giá trị cho hai hình chiếu.

2.2.12.Kỹ thuật Chain code histogram

Cũng trong nghiên cứu ở [6] của Arora S.và các cộng sự, kỹ thuật Chain code histogram (histogram chuỗi mã định hướng) đã được đề cập. Trong kỹ thuật này, hướng đi từ điểm ảnh màu đen này đến điểm ảnh màu đen kia lân cận với nó được lấy ra, và rồi các hướng liên tục này sẽ kết lại thành một chuỗi mã hướng. Histogram – tức là tần số xuất hiện của từng hướng trong chuỗi mã này được ghi nhận lại để tạo thành giá trị đặc trưng. Đó là nội dung chính yếu của thuật toán.

Việc xét liên tục các điểm ảnh màu đen lân cận nhau, trên thực tế, có thể được tính theo chiều kim đồng hồ hoặc theo chiều ngược kim đồng hồ. Sơ đồ xét hướng có thể bao gồm 4 hướng, tương ứng với la bàn 4 điểm (0, 1, 2, 3) hoặc 8 hướng, tương ứng với la bàn 8 điểm (0, 1, 2, 3, 4, 5, 6, 7). Trong hình 2.15 là sơ đồ la bàn 8 điểm – la bàn mà Arora S. và các đồng nghiệp đã chọn sử dụng cài đặt:

Hình 2.15. La bàn 8 hướng trong Chain code histogram [6]

Trong nghiên cứu của mình, Arora S. và đồng nghiệp đã chọn chiều kim đồng hồ để thực hiện. Dưới đây là thuật toán được đề xuất:

 Bước 1: Tìm tất cả các điểm đường viền của ký tự. Một điểm đen bất kỳ được coi là một điểm đường viền nếu trong các lân cận 4 của nó có ít nhất một điểm ảnh màu trắng.

 Bước 2: Tìm vị trí điểm ảnh màu đen đầu tiên, gọi là p0. Lặp lại

Tìm điểm đen là pi là lân cận 8 của pi – 1. Gán hướng cho đường đi từ pi đến pi – 1. i = i + 1

Cho đến khi không tìm thấy điểm đen nào nữa.

 Bước 3: Chia toàn bộ ma trận ảnh ra thành 5 × 5 khối, mỗi khối lấy histogram cho 8 hướng. Như vậy ta sẽ thu được vector đặc trưng có tổng cộng số chiều là 5 * 5 * 8 = 200 (chiều).

Điều đáng lưu ý khi tìm lân cận của một điểm ảnh màu đen đang xét, ta có thể gặp nhiều điểm ảnh cùng là lân cận 8 của nó, mỗi điểm theo một hướng khác nhau. Arora S. và đồng nghiệp của ông đã đưa ra hướng giải quyết là chọn hướng nhỏ nhất trong các hướng đó để đi tiếp. Một vấn đề nữa là vì bản thân thuật toán là đi tìm chuỗi mã định hướng liên tục, do đó trường hợp ký tự có nhiều thành phần không liên thông sẽ dẫn đến hậu quả là không lấy hết được tất cả các điểm ảnh màu đen có trong ký tự.

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 49 - 53)