6. Nội dung của luận văn: gồm có 3 chương 3 xvi
1.5. Đánh giá các phương pháp nhận dạng 22 xvi
Qua quá trình tìm hiểu sơ lược về các phương pháp nhận dạng chữ và số viết tay, tôi rút ra một số đánh giá về ưu điểm và nhược điểm của các phương pháp như sau:
Phương pháp
nhận dạng Ưu điểm Nhược điểm
Đối sánh mẫu
Là kỹ thuật nhận dạng chữ đơn giãn nhất dựa trên cơ sở đối sánh các nguyên mẫu (prototype) với nhau để nhận dạng ký tự hoặc từ. Các kỹ thuật đối sánh mẫu chỉ áp dụng tốt đối với nhận dạng chữ in
Đối với chữ viết tay thì các kỹ thuật này tỏ ra kém hiệu quả, kết quản nhận được của nó cũng rất nhạy cảm với nhiễu.
Phương pháp tiếp cận cấu
Dựa vào việc mô tả đối tượng nhờ một số khái niệm
Cho đến nay có nhiều vấn đề liên quan đến hệ nhận
trúc
biểu diễn đối tượng cơ sở trong ngôn ngữ tự nhiên. Dễ thực hiện căn cứ vào quá trình phân tích cú pháp
dạng cú pháp chưa được giải quyết độc lập và chưa xây dựng được các thuật toán phổ dụng
Mạng nơ ron Mạng nơ ron được ứng dụng nhiều trong các bài toán phân loại mẫu (điển hình là bài toán nhận dạng) bởi ưu điểm nổi bật của nó là dễ cài đặt cùng với khả năng học và tổng quát hóa rất cao. Với thuật toán đơn giản nhưng rất hiệu quả, cùng với thành công của mô hình này trong các ứng dụng thực tiễn, mạng nơ ron hiện đang là một trong các hướng nghiên cứu của lĩnh vực học máy.
Mạng nơ ron tỏ ra phù hợp với các bài toán đối sánh, phân loại mẫu, xấp xỉ hàm, tối ưu hóa, lượng tử hóa vector và phân hoạch không gian dữ liệu, trong khi các phương pháp truyền thống không đủ khả năng để giải quyết các vấn đề nêu trên một cách hiệu quả.
Tính chậm và sắc xuất không cao không có quy tắc tổng quát để xác định cấu trúc mạng và các tham số học tối ưu cho một (lớp) bài toán nhất định. Tiêu chuẩn thu thập cơ sở dữ liệu huấn luyện còn khắt khe. Do đó, để hệ thống có thể ứng dụng trong thực tế cần phải nới lỏng hơn nữa các tiêu chuẩn này.
Đặc biệt trong các hệ thống nhận dạng sử dụng mạng nơ ron đã đạt được tỉ lệ nhận dạng khá chính xác, có thể so sánh với các phương pháp nhận dạng có cấu trúc, thống kê,…, thiết kế và coding đơn giản
Mô hình Markov ẩn
(HMM)
Phương pháp mô tả đường biên ít bị ảnh hưởng bởi kích thước chữ, cũng như độ đậm, nhạt của nét chữ, ít bị tác động bởi nhiễu trên đường biên. Việc sử dụng các HMM để khử nhiễu và trích chọn đặc trưng cho kết quả tốt, với thời gian thực hiện chấp nhận được.
Từ việc đặc tả được cấu trúc, bằng kỹ thuật phân lớp và mã hóa mỗi lớp bằng một mô hình nhận dạng. Cơ sở dữ liệu các mô hình nhận dạng có khả năng tự động loại bỏ sự dư thừa, giảm thiểu thời gian truy xuất, đạt tốc độ tương đối tốt trong các thử nghiệm, xác
Các thuật toán dò biên rất nhạy cảm khi chữ bị dính nét hay đứt nét, để khắc phụ điều này, hệ thống phải có khả năng lường trước các nét có thể bị dính hay bị đứt để đưa ra một mẫu phụ dung trong trường hợp mẫu nhận dạng bị dính nét hay đứt nét. Phương pháp này chỉ cố gắng mô tả tốt nhất cấu trúc chữ mà chưa chú ý đến kích thước, điều này làm cho hệ thống dễ nhầm lẫn chữ hoa và chữ thường, nhất là đối với các ký tự mà viết hoa hay viết thường chỉ khác nhau về mặt kích thước như chữ ‘x’ và ‘X’ hay chữ ‘c’ và
suất cao, coding đơn giản, không dung nhiều bộ nhớ.
‘C’…Nhược điểm là rất khó để phân lớp dữ liệu.
Phương pháp máy vector tựa
(SVM)
SVM được đánh giá là một hướng tiếp cận phân lớp đạt độ chính xác cao. Phương pháp học máy tiên tiến đã đóng góp nhiều thành công trong các lĩnh vực khai phá dữ liệu cũng như trong lĩnh vực nhận dạng. Bài toán huấn luyện SVM thật chất là bài toán QP trên một tập lồi, do đó SVM luôn có nghiệm toàn cục và duy nhất, đây chính là điểm khác biệt rõ nhất giữa SVM so với phương pháp mạng nơ ron, vì mạng nơ ron vốn tồn tại nhiều điểm cực trị địa phương.
Hạn chế lớn nhất của SVM là tốc độ phân lớp rất chậm, tùy thuộ và số lượng vector tựa. Mặc khác, giai đoạn huấn luyện SVM đòi hỏi bộ nhớ rất lớn, do đó các bài toán huấn luyện với số lượng mẫu lớn sẽ gặp trở ngại trong vấn đề lưu trữ. Hiệu quả phân lớp của SVM phụ thuộc vào hai yếu tố: giải bài toán QP và lựa chọn hàm nhân.
1.6. Kết luận chương 1
Chương 1 đã giới thiệu khái quát về bài toán nhận dạng chữ và số viết tay, các giai đoạn hình thành và phát triển, các nghiên cứu trong và ngoài nước về kỹ thuật nhận dạng chữ và số viết tay. Đồng thời cũng đưa ra một số phương pháp sử dụng để thực hiện bài toán nhận dạng. Đồng thời liệt kê các bước nhận dạng chữ và số viết tay.
Chương 2. KỸ THUẬT SVM TRONG NHẬN DẠNG PHIẾU GHI ĐIỂM THI
Qua tìm hiểu và đánh giá, tôi nhận thấy quá trình nhận dạng ký tự chữ và số viết tay trong các phương pháp trên luôn tồn tại những ưu và nhược điểm riêng. Để tiến hành xây dựng một chương trình đảm bảo chất lượng và sử dụng hiệu quả, trong đề tài tôi sẽ tập trung nghiên cứu kỹ thuật SVM để ứng dụng vào bài toán nhận dạng phiếu ghi điểm thi.