Kỹ thuật Diagonal based

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 39 - 42)

Một trong những kỹ thuật đạt được hiệu quả cao, căn cứ theo thí nghiệm cho thấy, là kỹ thuật Diagonal based (kỹ thuật đặc tính đường chéo) [18]. Ý tưởng chính của kỹ thuật này là dựa trên sự phân bố số điểm đen trên các đường chéo của từng vùng trong một ảnh ký tự. Dưới đây là mô tả kỹ thuật dưới dạng lời viết:

 Bước 1: Ảnh ký tự được chuẩn hóa về kích thước 90 × 60 rồi được chia ra thành 54 vùng, tương ứng mỗi vùng là một ô vuông có kích thước 10 × 10 điểm ảnh.

 Bước 2: Mỗi ô vuông có 19 đường chéo theo hướng Tây Nam – Đông Bắc. Với mỗi đường chéo như thế, tính tổng số điểm ảnh màu đen nằm trên đường chéo đó. Sau đó tính giá trị trung bình ω số điểm ảnh của toàn bộ 19 đường chéo trong ô vuông đang xét. Giá trị này chính là một giá trị cho một chiều trong vector đặc trưng của mẫu hiện hành.

Hình 2.5. Minh họa quá trình phân vùng và lấy đường chéo [18]

 Bước 3: Nếu còn ô vuông thì tiếp tục Bước 2 cho đến hết 54 ô vuông. Nếu hết ô vuông rồi thì chuyển qua bước 4. Tính đến lúc này ta đã có 54 giá trị cho 54 chiều của vector đặc trưng.

 Bước 4: Tính giá trị trung bình của các theo cột (có 6 cột) và theo dòng (có 9 dòng) thì thu được thêm 15 giá trị cho 15 chiều của vector đặc trưng.

Tùy vào ý định của người sử dụng mà có thể sử dụng vector cuối cùng là 54 chiều (chỉ có 54 giá trị ω) hoặc 69 chiều (54 giá trị ω và thêm 15 giá trị trung bình trên). Thực nghiệm nghiên cứu của J. Prdeep, E. Srinivasan, S. Himavathi cho thấy vector đặc trưng có 69 chiều sẽ cho hiệu quả cao hơn so với vector đặc trưng 54 chiều.

Sơ đồ 2.1 mô tả thuật toán:

Sơ đồ 2.1. Thuật toán Diagonal based Bắt đầu

Kết thúc Ma trận I, h = 90, w = 60, zoneID = 1

Tính Si = số điểm ảnh đen trên đường chéo i của vùng thứ zoneID, i1,19

Tính 19 19 1    i i zoneID S zoneID = zoneID + 1 zoneID <= 54 Tính theo cột zone và theo dòng zone được thêm 15 giá trị Tổng cộng có 54 giá trị ω và 15 giá trị Đúng Sai

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 39 - 42)