Tìm hiểu SVM trong nhận dạng chữ viết tay hạn chế Nguyễn Thị Vân Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Công nghệ phần mềm; Mã số: 60 48 10 Người hướng dẫn: PGS.. Ngô Quốc Tạ
Trang 1Tìm hiểu SVM trong nhận dạng chữ viết tay
hạn chế Nguyễn Thị Vân
Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Công nghệ phần mềm; Mã số: 60 48 10
Người hướng dẫn: PGS TS Ngô Quốc Tạo
Năm bảo vệ: 2011
Abstract: Giới thiệu về nhận dạng chữ viết tay: Trình bày về lịch sử của nhận dạng
chữ viết tay, giới thiệu các hướng tiếp cận trong việc nhận dạng chữ viết tay (nhận dạng chữ in, nhận dạng chữ viết tay) Tổng quan về SVM - Support Vector Machine (Máy véc tơ hỗ trợ): Chiều VC (Vapnik Chervonenkis dimension), hàm phân lớp, siêu phẳng phân cách, Trình bày sự cần thiết của SVM vào việc nhận dạng chữ viết tay Phân tích bộ phân loại SVM Ứng dụng của SVM vào nhận dạng chữ viết tay: Tiền xử
lý, xây dựng các máy phân lớp SVM
Keywords: Nhận dạng ký tự; Phương pháp học SVM; Công nghệ thông tin; Công
nghệ phần mềm; Chữ viết tay
Content
MỞ ĐẦU
Cho đến nay mặc dù khoa học công nghệ không ngừng phát triển để đáp ứng ngày càng cao những nhu cầu của con người nhưng không phải nhu cầu nào cũng có thể dễ dàng giải quyết và đáp ứng được Nhận dạng chữ viết tay hiện nay vẫn đang là vấn đề thách thức lớn đối với các nhà nghiên cứu, bài toán này chưa thể giải quyết trọn vẹn được vì nó phụ thuộc quá nhiều vào người viết với sự biến đổi quá đa dạng trong cách viết và trạng thái tinh thần của từng người viết Nhưng trong nhiều năm qua, bài toán nhận dạng chữ viết tay cũng đã có một số kết quả khả quan, chủ yếu tập trung trên các tập dữ liệu chữ số viết tay như MNIST [6], một số kết quả khác mở rộng đối với các chữ cái hệ La tinh, Hy lạp… Đặc biệt đối với việc nhận dạng chữ viết tay tiếng Việt lại càng khó khăn hơn do bộ ký tự tiếng Việt có nhiều chữ có hình dáng rất giống nhau, chỉ khác chút ít về phần dấu Do đó có rất ít kết quả nghiên cứu về nhận dạng chữ viết tay tiếng Việt và các nghiên cứu chủ yếu cũng chỉ tập trung vào chữ viết tay online
Nhận dạng chữ viết tay là một đề tài rất quan trọng trong nhiều ứng dụng khác nhau, trong lĩnh vực máy tính nó giúp cho máy tính có thể đọc được và hỗ trợ nhập liệu Các nghiên cứu về nhận dạng chữ viết tay đã được phát triển từ hơn nửa thập kỷ qua và đạt được nhiều thành quả thiết thực nhưng độ chính xác phụ thuộc quá nhiều vào ngôn ngữ và sự thay đổi trong cách viết Cho đến nay, bài toán nhận dạng chữ viết tay cũng
đã có một số nghiên cứu khả quan, nhưng chưa có ứng dụng thực tiễn Bài toán chúng tôi đặt ra ở đây là xây dựng một mô hình nhận dạng chữ viết tay hạn chế
Trang 22
Luận văn được bố cục thành 5 chương
Chương 1 giới thiệu về nhận dạng chữ viết tay
Chương 2 giới thiệu về SVM
Chương 3 sự cần thiết của SVM vào việc nhận dạng chữ viết tay
Chương 4 bộ phân loại SVM
Chương 5 ứng dụng của SVM vào nhận dạng chữ viết tay
References
Tiếng Việt
1 Phạm Anh Phương (2008), “Áp dụng một số chiến lược SVM đa lớp cho bài toán
nhận dạng chữ viết tay hạn chế”, Tạp chí khoa học đại học Huế, ISSN 1859-1388, số
45, 109-118
2 Phạm Anh Phương, Ngô Quốc Tạo, Lương Chi Mai (2008), “Trích chọn đặc trưng wavelet Haar kết hợp với SVM cho việc nhận dạng chữ viết tay tiếng Việt”
Tiếng Anh
3 B.verma, M Blumenstein & S Kulkarni, “Recent achievements in off-line handwriting recognition systems” School of Information Technology, Griffith University-Gold Coast Campus
4 Chih-Chung Chang and Chil-Jen Lin (2004), “LIBSVM: a Library for Support
Vector Machines”, National Taiwan University
5 Christopher J.C Burges A Tutorial on Support vector machines for pattern recognition – burges@microsoft.com
6 Gorgevik Dejan, Cakmakov D (2004), “An Efficient Three-Stage Classifier for
Handwritten Digit Recognition” , Proceedings of 17 Int Conference on Pattern Recognition, ICPR2004 th, Vol 4, pp 507-510, IEEE Computer Society, Cambridge,
UK
7 Gabor Lugosi, “Introduction to Statistical Learning Theory”, Department of Economics, Pompeu Fabra University Ramon Trias Fargas 25-27, 08005 Barcelona, Spain, www home page: http://www.econ.upf.edu/~lugosi/mlss_slt.pdf
8 Nello Cristianini and John Shawe-Taylor (2000), “An Introduction to Support Vector Machines and other kernel-based learning methods”, Cambridge University Press
9 Shubhangi D C (2009), “Handwritten English Character And Digit Recognition
Using Multiclass SVM Classifier And Using Structural Micro Features”, International Journal of Recent Trends in Engineering, Vol 2, No 2, November 2009
10 Steven B Poggel (2010), An On-Line Japanese Handwriting Recognition System integrated into an E-Learning Environment for Kanji