1.3. Trích chọn đặc trưng ảnh
1.3.3. Phương pháp trích chọn đặc trưng ảnh theo tính lồi lõm (Concavity)
Phương pháp này giúp ta nhận biết được vùng ảnh mà ta đang xét là một vùng lõm (về phía trên, dưới, trái hoặc phải) hay là một lỗ trống (hole). Đối với nhận dạng chữ viết, đặc biệt là chữ viết tay tiếng Việt, phương pháp này giúp cho hệ nhận dạng kí tự làm việc hiệu quả với nhóm kí tự có nhiều điểm uốn, điểm cực đại hay cực tiểu trong một vùng nào đó.
Đặc trưng theo tính lồi lõm của ảnh là những đặc trưng ở mức cao hơn so với đặc trưng về hướng và về cấu trúc. Những đặc trưng này được tính toán và chọn ra dựa trên rất nhiều điểm ảnh (có thể trải ra trên toàn ảnh) với mục tiêu tìm ra những vùng lồi lõm và những lỗ trống (hole) trong ảnh. Ý tưởng thực hiện phương pháp này là ảnh ban đầu được chia thành 4*4 phần bằng nhau, với ứng với mỗi phần ta sẽ tìm ra 8 đặc trưng đặc thù của nó 8 đặc trưng này bao gồm: 1 đặc trưng về mật độ điểm đen, 2 đặc trưng thể hiện ảnh phần ảnh này là một nét lần theo chiều thẳng đứng hay chiều ngang và 5 đặc trưng thể hiện tính lồi lõm hay là lỗ trống có trong phần ảnh này. Cách tìm các đặc trưng này được trình bày ở dưới đây.
• Tìm đặc trưng về mật độ điểm đen: Để tính đặc trưng này trước hết ta tìm tổng số điểm đen có trong mỗi phần ảnh. So sánh tổng số điểm đen này với một ngưỡng
được chọn trước dùng chung cho tất cả các phần của ảnh): nếu lớn hơn thì đặc trưng này có giá trị bằng 1, ngược lại có giá trị bằng 0.
Hình 1.8: Số điểm đen trong một vùng
Ví dụ, trong hình 1.8 tổng số điểm đen có trong phần ảnh thứ 12 là 43. Giả sử ngưỡng đặt ra bằng 20, khi đó đặc trưng về mật độ điểm ảnh cho phần này là 1.
• Để tìm đặc trưng thể hiện phần ảnh là nét lớn theo chiều ngang hay chiều thẳng đứng ta làm như sau:
Gọi C1 là chiều dài của đoạn thẳng dài nhất theo phương ngang chia các điểm đen liên tục (toàn bộ các điểm trong đoạn thẳng đều là điểm đen).
R1 là chiều dài của đoạn thẳng dài nhất theo phương thẳng đứng chia các điểm ảnh liên tục (toàn bộ các điểm trong đoạn thẳng đều là điểm đen).
Nếu C1 < R1 * 0.75 thì vùng này là nét lớn theo chiều thẳng đứng. Từ đó, thiết lập đặc trưng về nét lớn theo chiều thẳng đứng bằng 1, và đặc trưng về nét lớn theo chiều ngang bằng 0.
Nếu C1 > R1 * 1.5 thì vùng này là nét lớn theo chiều ngang. Từ dó, thiết lập đặc trưng về nét lớn theo chiều thẳng đứng bằng 0, và đặc trưng về nét lớn theo chiều ngang bằng 1.
Hình 1.9: Số điểm đen liên tục theo chiều thẳng đứng, ngang
Ví dụ trong hình 1.9 ta có ưng với phần ảnh thứ 12 thì C1 = 5 và R1=9 nên vùng ảnh này có thể coi là nét lớn theo chiều thẳng đứng (C1 < R1*0.75).
• Tìm đặc trưng thể hiện tính lồi lõm hay lỗ trống của ảnh:
Ta quy ước như sau: U là mặt lõm quay về phía trên, D là mặt lõm xuống phía dưới, L là mặt lõm sang bên trái, R là mặt lõm quay sang bên phải, H là lỗ trống.
Ý tưởng để tìm ra các đặc trưng này như sau:
Với mỗi điểm ảnh (ngoại trừ các điểm đen) trong vùng, về 8 tia xuất phát từ điểm ảnh đó lần lượt hợp với trục hoành các góc 0o, 45o, 90o,…, 270o, 315o. Các tia này chỉ có thể tiếp xúc với điểm đen trong ảnh hoặc sẽ chạm vào mép ảnh.
Tới điểm ảnh đó lỗ trống được phát hiện nếu có 8 tia đều chạm vào điểm đen nằm trong ảnh. Vùng lõm hướng xuống phía dưới (D) được phát hiện nếu các tia có hướng 0o, 45o, 90o, 135o, 180ochạm vào điểm đen nằm trong ảnh còn các tia có hướng 225o, 270o, 315ochạm vào mép của ảnh. Việc phát hiện ra các vùng lồi lõm khác được thực hiện tương tự. Về thực chất, việc các tia chạm vào điểm đen nằm trong ảnh hay chạm vào tương đương với việc tổng số các điểm đen nằm trên tia đó lớn hơn hoặc bằng 0. Do việc tính toán là đơn giản nên thuật toán tính tổng số các điểm đen nằm trên mỗi tia không được miêu tả chi tiết ở đây.
Với mỗi 5 đặc trưng nêu trên (U, D, L, R, H), ta tính tổng số điểm ảnh thoả mãn có các đặc trưng đó. Giả sử thu được 5 giá trị ai với i = 1…5 và ai là tổng số điểm ảnh thoả mãn.Với ngưỡng được chọn trước (áp dụng cho tất cả các phần của ảnh)
ta xác định lại giá trị ai như sau: nếu ai > θ thì ai = 1; ngược lại ai = 0. Như vậy, với phương pháp trích chọn đặc trưng ảnh theo tính lồi lõm, mối phần ảnh có 8 đặc trưng nên số đặc trưng của toàn bộ ảnh là 4*4*8 = 128. Thuật toán chi tiết của phương pháp trích chọn đặc trưng theo tính lồi lõm được mô tả như sau:
INPUT : .ảnh đầu vào (là một mảng 2 chiều[x][y]) OUTPUT : Vectơ đặc trưng của ảnh (128 bit) PROCESS :
1. Xác định hình bao của ảnh
2. Với mỗi điểm ảnh xác định tổng số điểm đen có trong mỗi tia, các tia này đi qua điểm đó và hợp với trục hoành các góc: 00,450,…,3150. Ta thu được mảng 3 chiều ray[x][y][k], trong đó k=0…7.
3. Chia ảnh làm 4 * 4 phần bằng nhau 4. Xác định 8 đặc trưng trong mỗi phần:
1 đặc trưng về mật độ điểm đen
2 đặc trưng thể hiện phần ảnh là nét lớn theo chiều thẳng đứng hay chiều ngang
4 đặc trưng về tính lồi lõm, và là đặc trưng về lỗ trống có trong phần ảnh dựa vào mảng ray.
5. Xác định vectơ đặc trưng là tập hợp các giá trị ai (i = 0…7) trong tất cả các phần.
Thuật toán 1-5 Thuật toán trích chọn đặc trƣng theo tính lồi lõm
Ví dụ về các điểm lỗi lõm và lỗ trống có trong ảnh được thể hiện như trên hình 1.10. Trong dó, phần thứ 7 của chữ A chứa một lỗ trống và thành phần thứ 14 chứa một vùng lõm hướng xuống phía dưới.
Hình 1.10: Ví dụ về điểm lồi lõm và lỗ trống có trong ảnh
Nhận xét: Phương pháp trích chọn đặc trưng ảnh theo tính lồi lõm giúp ta tìm ra vùng ảnh là vùng lồi lõm về phía nào hay có là lỗ trống không. Đây là các đặc điểm thường thấy trong các chữ viết (ví dụ như chữ O bao gồm một lỗ trống), hơn nữa trong hệ thống dấu của tiếng Việt: đấu ngã “~” có thể coi bao gồm một vùng lồi và một vùng lõm, dấu mũ “^” bao gồm một vùng lồi ..Do vậy, việc sử dụng phương pháp trích chọn đặc trưng theo tính lồi lõm sẽ rất hiệu quả khi được áp dụng vào việc nhận dạng các ký tự như trên. Trong phần thực nghiệm, chúng ta sẽ thấy phương pháp trích chọn đặc trưng theo tính lồi lõm được sử dụng để phân biệt các ký tự có chung gốc nhưng khác dấu với nhau.