GVHD: PGS-TS Đỗ Phúc SVTH: Phạm Quang Diệu MSSV: CH1101077 Trong Hội nghị quốc tế lần thứ 14 về nhận dạng mẫu (Pattern Recognition), Connell và Jain đã sử dụng phương pháp gom nhóm (Clustering) để nhận dạng những từ vị (lexemes) trên văn bản viết tay với mục đích nhận dạng chữ viết độc lập với người viết. Hệ thống phụ thuộc người viết Hệ thống phụ thuộc người viết cho độ chính xác nhận dạng cao hơn so với hệ thống độc lập người viết hệ thống độc lập người viết, nhưng nó cũng đòi hỏi một lượng lớn dữ liệu training (training data). Mặt khác, một hệ thống độc lập người viết hệ thống độc lập người viết phải có khả năng nhận dạng nhiều phong cách viết. Do sự thay đổi gia tăng của phong cách viết phải được ghi lại bởi hệ thống, thật sự càng khó hơn để phân biệt giữa những lớp khác nhau bởi số lượng trùng lặp trong không gian đặc trưng. Một giải pháp đối với vấn đề này là chia dữ liệu thành các lớp. Mỗi lớp chứa các phong cách viết khác hẳn nhau. Những lớp này gọi là các từ vị (lexemes). từ vị (lexemes). Trong hệ thống này, chữ viết tay được ghi lại bằng cách lưu trữ vị trí (x, y) của viết và tình trạng của đầu bút (lên hay xuống) với tốc độ lấy mẫu cố định. Sau một số lần lấy mẫu lặp lại và làm trơn, mỗi nét bút được biểu diễn như một chuỗi có chiều dài thay đổi của các điểm. Tính toán khoảng cách giữa hai nét bút, một ma trận độ gần được xây dựng cho mỗi lớp chữ số (0 → 9). Mỗi ma trận đo các khoảng cách bên trong lớp đối với mỗi lớp chữ số cụ thể. Những chữ số trong một lớp riêng biệt được gom nhóm với nỗ lực tìm một lượng nhỏ các khuôn mẫu (prototypes). Việc gom nhóm được thực hiện dùng các thuật toán clustering, trong đó vector đặc trưng cho một chữ số là N độ gần của nó đến các chữ số trong cùng một lớp. Khi biểu diễn một nhóm các chữ số bằng một khuôn mẫu, kết quả nhận dạng tốt nhất đạt được bằng cách dùng chữ số gần với tâm của nhóm đó. Sử dụng mô hình này, tốc độ nhận dạng chính xác đạt được là 99,33%. Chương trình: Chương trình: Nhận dạng các ký tự số. Địa chỉ download: http://www.mathworks.com/matlabcentral/fileexchang e/loadFile.do?objectId=18901&objectType=file Tính năng bổ sung: Dùng Microsoft speech API để đọc các chữ số. Input: Input: Bộ mẫu các chữ số từ 0 → 9 và ảnh có các chữ số cần nhận dạng. Output: Output: Nhận dạng các chữ số xuất hiện trên ảnh và đọc chúng. Ứng dụng: Ứng dụng: Nếu được nâng cấp thì chương trình này có thể dùng để đọc sách điện tử cho người mù. Mẫu các chữ số từ 0 → 9 Ảnh có các chữ số cần nhận dạng Các số xuất hiện trong ảnh sẽ được đánh dấu bằng các khung đỏ bao quanh và sau đó sẽ được đọc lên. . người viết cho độ chính xác nhận dạng cao hơn so với hệ thống độc lập người viết hệ thống độc lập người viết, nhưng nó cũng đòi hỏi một lượng lớn dữ liệu training (training data). Mặt. bởi số lượng trùng lặp trong không gian đặc trưng. Một giải pháp đối với vấn đề này là chia dữ liệu thành các lớp. Mỗi lớp chứa các phong cách viết khác hẳn nhau. Những lớp này gọi là các. thứ 14 về nhận dạng mẫu (Pattern Recognition), Connell và Jain đã sử dụng phương pháp gom nhóm (Clustering) để nhận dạng những từ vị (lexemes) trên văn bản viết tay với mục đích nhận dạng chữ