Chương 4: Trớch chọn đặc trưng Bựi Thế Hõn
Đặc trưng theo tớnh lỗi lừm của ảnh là tỡm ra những đặc trưng dựa trờn nhiều điểm ảnh với mục tiờu tỡm ra những vựng lồi lừm và những lỗ trống trong một bức ảnh đầu vào.
Ảnh ban đầu được chia thành 4*4 phần bằng nhau, với ứng với mỗi phần ta sẽ tỡm ra 8 đặc trưng đặc thự của nú. 8 đặc trưng này bao gồm:
1. Đặc trưng về mật độ điểm đen.
2. Đặc trưng thể hiện ảnh phần ảnh này là một nột lớn theo chiều thẳng đứng
3. Đặc trưng thể hiện ảnh phần ảnh này là một nột lớn theo chiều ngang 4. Năm đặc trưng thể hiện tớnh lồi lừm hay là lỗ trống cú trong phần ảnh
này.
4.3.3.1Tỡm đặc trưng về mật độ điểm đen:
Để tớnh đặc trưng này, trước hết ta tỡm tổng số điểm đen cú trong mỗi phần ảnh. So sỏnh tổng số điểm đen này với một ngưỡng θ được chọn trước : nếu lớn hơn thỡ đặc trưng này cú giỏ trị bằng 1, ngược lại cú giỏ trị bằng 0.
4.3.3.2 Đặc trưng thể hiện phần ảnh là nột lớn
Để tỡm đặc trưng thể hiện phần ảnh là nột lớn theo chiều ngang hay chiều thẳng đứng ta làm như sau:
Gọi C1 là chiều dài của đoạn thẳng dài nhất theo phương ngang chứa cỏc điểm đen liờn tục (toàn bộ cỏc điểm trong đoạn thẳng đều là điểm đen).
R1 là chiều dài của đoạn thẳng dài nhất theo phương thẳng đứng chứa cỏc điểm ảnh liờn tục (toàn bộ cỏc điểm trogn đoạn thẳng đều là điểm đen).
Nếu C1 < R1 * 0.75 thỡ vựng này là nột lớn theo chiều thẳng đứng. Từ đú, thiết lập đặc trưng về nột lớn theo chiều thẳng đứng bằng 1, và đặc trưng về nột lớn theo chiều ngang bằng 0.
Nếu C1 > R1 * 1.5 thỡ vựng này là nột lớn theo chiều ngang. Từ đú, thiết lập đặc trưng về nột lớn theo chiều thẳng đứng bằng 0, và đặc trưng về nột lớn theo chiều ngang bằng 1.
4.3.3.3 Tỡm đặc trưng thể hiện tớnh lồi lừm hay lỗ trống của ảnh:
Ta quy ước như sau: U là mặt lừm quay về phớa trờn, D là mặt lừm xuống phớa dưới, L là mặt lừm sang bờn trỏi, R là mặt lừm quay sang bờn phải, H là lỗ trống.
í tưởng để tỡm ra cỏc đặc trưng này như sau:
Với mỗi điểm ảnh (ngoại trừ cỏc điểm đen) trong vựng, vẽ 8 tia xuất phỏt từ điểm ảnh đú lần lượt hợp với trục hoành cỏc gúc 0o, 45o, 90o,…, 270o,315o. Cỏc tia này chỉ cú thể tiếp xỳc với điểm đen trong ảnh hoặc sẽ chạm vào mộp ảnh.
Tại điểm ảnh đú, lỗ trống được phỏt hiện nếu cả 8 tia đều chạm vào điểm đen nằm trong ảnh. Vựng lừm hướng xuống phớa dưới (D) được phỏt hiện nếu cỏc tia cú hướng 0o, 45o, 90o, 135o, 180o chạm vào điểm đen nằm trong ảnh cũn cỏc tia cú hướng 225o, 270o, 315o chạm vào mộp của ảnh. Việc phỏt hiện ra cỏc vựng lồi lừm khỏc được thực hiện tương tự.
Về thực chất, việc cỏc tia chạm vào điểm đen nằm trong ảnh hay chạm vào tương đương với việc tổng số cỏc điểm đen nằm trờn tia đú lớn hơn hoặc bằng 0. Do việc tớnh toỏn là đơn giản nờn thuật toỏn tớnh tổng số cỏc điểm đen nằm trờn mỗi tia khụng được miờu tả chi tiết ở đõy.
Với mỗi 5 đặc trưng nờu trờn (U, D, L, R, H), ta tớnh tổng số điểm ảnh thỏa món cú cỏc đặc trưng đú. Giả sử thu được 5 giỏ trị ai với i = 1…5 và ai là tổng số điểm ảnh thỏa món.
Với ngưỡng θ được chọn trước (ỏp dụng cho tất cả cỏc phần của ảnh) ta xỏc định lại giỏ trị ai như sau: nếu ai > θ thỡ ai = 1; ngược lại ai = 0.
Như vậy, với phương phỏp trớch chọn đặc trưng ảnh theo tớnh lồi lừm, mỗi phần ảnh cú 8 đặc trưng nờn số đặc trưng của toàn bộ ảnh là 4*4*8 = 128.
Chương 5: Phõn lớp và mụ hỡnh học mỏy Bựi Thế Hõn
Chương 5: Phõn lớp và mụ hỡnh học mỏy
Vấn đề quan trọng nhất của nhận dạng tiếng Việt: Với mỗi hỡnh ảnh kớ tự đưa vào mụ hỡnh nhận dạng của chỳng ta phải trả lời được cõu hỏi đõy là kớ tự gỡ. Hay núi cỏch khỏc hỡnh ảnh kớ tự này thuộc lớp nào? Để thực hiện được việc này chỳng ta sử dụng vộc tơ đặc trưng x = (x1, x2, …, xm) được lấy ra từ giai đoạn trớch chọn đặc trưng, làm đầu vào cho mụ hỡnh nhận dạng. Cú rất nhiều mụ hỡnh nhận dạng được dựng hiện nay như mạng neural, Mụ hỡnh học mỏy Entropy, Hidden Markov model (HMM) . Nhưng trong khuụn khổ của luận văn chỳng tụi chỉ đi vào nghiờn cứu và ứng dụng mụ hỡnh mạng neuron cho bài toỏn nhận dạng kớ tự tiếng Việt của mỡnh.