__________________________________________________________________________ Học viên : Bùi Hữu Tiến - MHV: CH1102010 31
Cửa sổ huấn luyện:
__________________________________________________________________________ Học viên : Bùi Hữu Tiến - MHV: CH1102010 32
Cửa sổ trợ giúp
Chương 5: Kết Lu n
5.1 Ưu điểm:
1) Sử dụng phương pháp SVM là phương pháp có độ chính xác cao, thời gian huấn luyện và nhận dạng nhanh với kỹ thuật SMO.
2) Độ đo DTW linh động, đạt giá trị so sánh cao hơn so với độ đo Euclid đối với chữ viết tay.
5.2 Nhược điểm:
1) Thuật toán tính khoảng cách DTW có độ phức tập tương đương O(n2) nên làm ảnh hưởng đến tốc độ huấn luyện cũng như tốc đọ nhận dạng của chương trình.
__________________________________________________________________________ Học viên : Bùi Hữu Tiến - MHV: CH1102010 33
2) Trong việc tính toán khoảng cách chưa xem trong yếu tố số lương nét bút của chữ viết, mà đây cũng là yếu tố trong nhận dạng.
3) Tiền sử lý còn đơn giản, chưa ứng dụng thuật toán khử nhiễu, làm trơn nét bút viết.
__________________________________________________________________________ Học viên : Bùi Hữu Tiến - MHV: CH1102010 34
Tài liệu tham khảo :
[1] Đỗ Phúc : Chuyên đề khai phá dữ liệu và nhà kho dữ liệu, Giáo trình đào tạo cao học CNTT qua mạng – Đại học Quốc gia TPHCM , 2005 . [2] Đỗ Phúc , Trịnh Quốc Sơn : Xây dựng hệ thống tạo kiến trúc phân cấp
cụm trang web hỗ trợ tìm kiếm thông tin . 2003 .
[3] Hoàng Kiếm, Đỗ Phúc : "Phân loại văn bản dựa trên cụm từ phổ biến", kỷ yếu hội nghị khoa học lần 2, Trường Đại Học Khoa Học Tự Nhiên , 2000 .
[4] Đỗ Phúc , Nguyễn Thị Kim Phụng : Phát triển công cụ quản trị nội dung trên diễn đàn thảo luận qua mạng , 2005 .
[6] Nguyễn Thanh Phương: "Nhận dạng chữ viết online". Luận văn Thạc sỹ CNTT
[7] Le An Ha : A method for word segmentation Vietnamese , 2003 .
[8] R Shepard , P Arabie : Clustering : Representation of Similarities as Combinations of Discrete Ovelapping Properties . 1997
[9] L Blum , P Langley . Selection of relevant features and examples in machine learning , Artifficial Intelligence , 1997
[10] Alessandro Moschitti, May 8, 2003, Natural Language Processing and Automated Text Categorization, PhD Thesis in Computer Science and Control Engineering , University of Rome.
__________________________________________________________________________ Học viên : Bùi Hữu Tiến - MHV: CH1102010 35
[11] Abney S. (1997), "Part-of-Speech Tagging and Partial Parsing", in Young S. and Bloothooft (Eds), Corpus-Based Methods in Language and Speech processing, Kluwer Academic Publishers, Dodreht (The Netherlands), 1997.
[12] Brill E. (1995), "Transformation-Based Error-Driven Learning and Natural Language Processing: A Case Study in Part of Speech Tagging", Computational Linguistics.