Kỹ thuật wavelet Haar

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 37 - 39)

Bên cạnh các phương pháp trích chọn đặc trưng đã được nêu trong phần trên thì ở đây, xin giới thiệu phương pháp trích chọn đặc trưng wavelet Haar [3]. Kỹ thuật này cũng dựa trên số điểm ảnh đen, nhưng không lấy riêng từng vùng mà có

sự cộng dồn theo quy tắc: trong một vùng được chia thành bốn tiểu vùng, cộng dồn tiểu vùng 1 và tiểu vùng 2 được giá trị thứ nhất, cộng dồn tiểu vùng 2 và tiểu vùng 3 được giá trị thứ hai, riêng tiểu vùng 4 là giá trị thứ 3.

Yêu cầu đầu vào của thuật toán này là ma trận sau giai đoạn tiền xử lý phải có dạng một ma trận vuông A cấp 2n. Sau đây để đơn giản hóa và dễ dàng nắm bắt thì ma trận vuông A thỏa điều kiện nói trên sẽ được ký hiệu là (A, n), tức là đuợc đặc trưng bởi hai yếu tố:

A : tên của ma trận.

Tham số n: chỉ ra rằng kích thước ma trận sẽ là 2n x 2n. Nội dung của thuật toán sẽ được trình bày dưới dạng mã giả:

Bước 1: Khởi tạo

Queue = Ø; i = 1;

Bước 2:

Tính Fi = Tổng số các điểm đen trong toàn bộ ma trận (A, n); PUSH((A, n), Queue);

Bước 3:

Trong khi Queue vẫn còn phần tử thì {

POP(Queue, (A, n)); Nếu (n>1)

{

Lần lượt cho bốn hình vuông A1, A2, A3, A4 có cạnh (n/2) vào hàng đợi Queue;

Gọi S1, S2, S3, S4 là tổng các điểm đen tương ứng với A1, A2, A3, A4; Tính Fi+1 = S1 + S2; Fi+2 = S2 + S3; Fi+3 = S4; i = i + 3; } }

Trong đó, A1, A2, A3, A4 lần lượt là các hình vuông được lấy theo hình 2.4, tương tự như thế cho các hình vuông con:

Hình 2.4. Cách phân bốn tiểu vùng của wavelet Haar

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 37 - 39)