1) Tiền xử lý
3.3 LẤY ĐẶC TRƯNG THEO BIỂU ĐỒ HISTOGRAM CỦA KHUNG
XƯƠNG, GIẢ KHUNG
Biểu đồ histogram gồm có hai trục là trục hoành và trục tung. Trục hoành (nằm ngang) là thang độ xám đánh số 0 đến 255 biểu thị sắc độ đi từ màu tối đen (giá trị bằng 0), nhạt dần và sáng trắng (giá trị bằng 255). Trục tung (trục đứng) biểu thị số lượng điểm ảnh trên dãy sắc độ. Nhìn vào histogram có thể thấy được sự phân bố lượng pixel trên từng vùng của thang độ xám.
Với histogram sử dụng để lấy đặc trưng chữ Nôm thì khác. Chữ Nôm được chuyển hóa thành ảnh đen trắng với giá trị điểm ảnh đen là điểm nền, điểm ảnh trắng là điểm ảnh chữ, biểu đồ ở đây chỉ xác định số lượng điểm ảnh sử dụng, nghĩa là biểu đồ histogram ứng dụng để lấy đặc trưng cho chữ Nôm thể hiện tần xuất xuất hiện điểm ảnh theo một chiều cụ thể. Hình ảnh một khung xương (hay giả khung) của chữ Nôm được tách ra thành hai ảnh thành phần, ảnh khung xương ngang (chỉ lấy các điểm ảnh chiếu theo chiều ngang của khung xương hay giả khung), và ảnh khung xương dọc (chỉ lấy các điểm ảnh chiếu theo chiều dọc khung xương hay giả khung). Hình 3.12 thể hiện các loại khung xương.
a. Ảnh gốc b. Khung xương ảnh (convert điểm ảnh và
điểm nền)
c. Khung xương ngang d. Khung xương đứng
Hình 3.12. Ví dụ khung xương, khung xương ngang,
khung xương dọc chữ Nôm
Sau khi có khung xương ngang và khung xương dọc, ta tiến hành lấy biểu đồ histogram cho chúng. Với khung xương ngang hoặc giả khung ngang ta lấy biểu đồ histogram bằng cách duyệt qua cạnh đứng của ảnh (tương ứng với trục y của histogram), tại mỗi điểm ta lại duyệt qua cạnh ngang (tương ứng với trục x của histogram) để lấy các pixel ảnh có cùng tọa độ cạnh đứng đó. Kết thúc quá trình duyệt này ta sẽ thống kê được số lượng điểm ảnh có cùng tọa độ y của toàn bộ ảnh, mô tả nó theo dạng biểu đồ tần xuất histogram thì ta được histogram của khung xương ngang hoặc của giả khung ngang. Tương tự vậy, với khung xương dọc hoặc giả khung dọc thì ta duyệt trên cạnh ngang, tại mỗi điểm trên cạnh ngang ta duyệt theo cạnh dọc để tìm các điểm ảnh. Kết thúc toàn bộ quá trình duyệt ta có được số lượng điểm ảnh có cùng tọa độ x của toàn bộ ảnh, mô tả theo dạng biểu đồ tần xuất histogram thì ta được histogram của khung xương hoặc của giả khung dọc. Hình 3.13 thể hiện ví dụ lấy histogram cho khung xương ngang. Hình 3.14 thể hiện ví dụ lấy histogram cho khung xương dọc. Hình 3.15 thể hiện ví dụ lấy histogram cho giả khung ngang. Hình 3.16 thể hiện ví dụ lấy histogram cho giả khung dọc.
a. Ảnh gốc b. Khung xương ngang c. Histogram của khung xương ngang
a. Ảnh gốc b. Khung xương dọc c. Histogram của khung xương dọc
Hình 3.14. Ví dụ khung xương dọc và histogram
a. Ảnh gốc b. Giả khung ngang c. Histogram của giả khung ngang
Hình 3.15. Ví dụ giả khung dọc và histogram
a. Ảnh gốc b. Giả Khung ngang c. Histogram của giả khung ngang
Hình 3.16. Ví dụ giả khung ngang và histogram
Trên Histogram ta thấy gồm nhiều cột xếp liền nhau, mỗi cột còn gọi là một ”bin” thể hiện số điểm ảnh tại nét dọc có tọa độ x, hoặc nét ngang có tọa độ y nào đó. Để mã hóa một Histogram ta chia histogram đó ra các đoạn (G1, G2…), ta mô tả như hình 3.17.
Hình 3.17. Mô tả phân đoạn histogram
Trên mỗi đoạn G đó tiến hành thuật toán gán nhãn cho chúng và đánh giá giá trị của các nhãn đã gán để tạo ra chuỗi mã hóa đặc trưng. Ngoài ra có thể bổ sung thêm các thông số khác vào chuổi đặc trưng để tăng độ chính xác nhận dạng, hoặc dùng để phân lớp và giảm khối lượng tính toán, so sánh khi huấn luyện và nhận dạng. Nhóm nghiên cứu Ming GangWen, Kuo Chin Fan và Chin Chuan Han [16], sử dụng các ký tự L, M, S, U để gán nhãn cho các phân đoạn G. Giá trị tương ứng của các ký tự L, M, S, U là 4, 2, 1, 0 được dùng để đánh giá. Ngoài ra nhóm còn đưa thêm một thông số nữa được gọi là điểm ảnh tương đối vào chuỗi mã. Một chữ Nôm sau khi mã hóa đặc trưng bằng phương pháp mã hóa histogram sẽ thu được chuỗi mã gồm 5 thành phần là: điểm ảnh tương đối; chuỗi nhãn của các phân đoạn trong histogram dọc; chuỗi nhãn của các phân đoạn trong histogram ngang; trọng số của chuỗi mã histogram dọc; trọng số của chuỗi mã histogram ngang.
Bảng 3.1 và 3.2 ví dụ về mã hóa chữ Nôm theo phương pháp mã hóa histogram của giả khung, khung xương.
Bảng 3.1. Ví dụ về mã hóa chữ Nôm
theo phương pháp mã hóa histogram của giả khung
Ảnh chữ Giả khung Giả khung ngang Histogra m giả khung ngang Giả khung dọc Histogra m giả khung dọc Mã ngan g Mã dọc Trọn g số ngan g Trọn g số dọc Điểm ảnh tương đối LMS U LLM U 7 10 5.41463 4
Bảng3.2. Ví dụ về mã hóa chữ Nôm
theo phương pháp mã hóa histogram của khung xương
Ảnh chữ Giả khung Giả khung ngang Histogram giả khung ngang Giả khung dọc Histogram giả khung dọc Mã ngang Mã dọc Trọng số ngang Trọng số dọc Điểm ảnh tương đối LMS ML 7 6 4.682926 Tổng kết chương 3
Trong chương 3 chúng tôi trình bày một số kỹ thuật lấy đặc trưng cho nhận dạng chữ tượng hình, những kỹ thuật này bước đầu được nhóm chúng tôi thực nghiệm với chữ Nôm và có kết quả khả quan. Chúng tôi nhận thấy mỗi phương pháp lấy đặc trưng phù hợp với từng phương pháp nhận dạng khác nhau, do đó việc so sánh các phương pháp nhận dạng chỉ mang tính tương đối. Do điều kiện thời gian nên nhóm chưa tiến hành thực nghiệm ghép từng phương pháp nhận dạng khác nhau với từng phương pháp trích chọn đặc trưng khác nhau để so sanh, bước đầu nhóm mới chỉ thực hiện thực nghiệm sử dụng phương pháp trích chọn đặc trưng theo nét với phương pháp nhận dạng cực đại entropy kết quả đạt khoảng 65%, thực nghiệm lấy đặc trưng theo biểu đồ histogram của khung xương và giả khung với phương pháp nhận dạng cực đại entropy đạt khoảng 60%, thực nghiệm lấy đặc trưng theo biểu đồ histogram của khung xương và giả khung với phương pháp nhận string edit-distance kết quả đạt 82%, thực nghiệm lấy đặc trưng theo điểm ảnh với phương pháp nhận dạng bằng mạng nơ-ron truyền ngược kết quả đạt 81%, thực nghiệm lấy đặc trưng theo lưới điểm ảnh với phương pháp nhận dạng bằng máy vector hỗ trợ SVM kết quả đạt 92%
Một số kỹ thuật trong chương này sẽ được chúng tôi đưa vào xây dựng một phương pháp nhận dạng mới trình bày ở chương 4.
Chương 4
NHẬN DẠNG CHỮ NÔM THEO KHOẢNG CÁCH SOẠN THẢO DỰA TRÊN KHUNG XƯƠNG VÀ GIẢ KHUNG