Hình 3.5 Giao diện huấn luyện phân loại
3.4.6 Giao diện danh sách tin tức
3.4.7 Giao diện người dùng
KẾT LUẬN
Dù đã cố gắng tìm hiểu đề tài , nhưng do kiến thức còn có phần hạn chế nên không tránh khỏi sai sót.
Chúng em rất mong nhận được ý kiến đóng góp của thầy , cô cũng như bạn bè trong lớp để có thể hoàn thiện hơn , làm ra sản phẩm tốt hơn nữa.
Bài tập lớn của chúng em về cơ bản đã đạt yêu cầu ,và đạt được những mục tiêu cơ bản:
• Xây dựng được một hệ thống phân loại tin tức đa nền
• Áp dụng kiến thức học được trong môn hệ chuyên gia vào xây dựng bộ tách từ tiếng việt từ đó tạo điều kiên cho việc nâng cao hiệu quả cho việc phân loại • Hệ thống cài đặt xong có tính thực tiễn cao tạo điều kiện xây dựng các ứng
dụng sau này
Bên cạnh đó bài của chúng em vẫn còn một số mặt hạn chế :
• Sản phẩm vẫn còn đơn giản, dù đã được hỗ trợ từ việc tách từ nhưng do CSDL nghèo nàn cũng như thuật toán phân lớp đã lỗi thời độ chính xác không cao. • Do kiến thức cũng như điều kiện có hạn hệ thống mới chỉ dừng kại ở mức độ
TÀI LIỆU THAM KHẢO
[1] Joseph Giarratano, Gart Riley, Expert System. Principles and Programming. PWS Publishing Company, 1993.
[2] Đỗ Trung Tuấn. Hệ chuyên gia. Nhà Xuất bản Giáo dục, 1999.
[3] James L. Crowley. Systèmes Experts. Support de cours, ENSIMAG 1999.
[4] Nguyễn Linh Giang, Nguyễn Mạnh Hiển, Phân loại văn bản tiếng Việt với bộ phân loại vectơ hỗ trợ SVM. Tạp chí CNTT&TT, Tháng 6 năm 2006.
[5] Nguyễn Ngọc Bình, “Dùng lý thuyết tập thô và các kỹ thuật khác để phân loại, phân cụm văn bản tiếng Việt”, Kỷ yếu hội thảo ICT.rda’04. Hà nội 2004.
[6] Nguyễn Linh Giang, Nguyễn Duy Hải, “Mô hình thống kê hình vị tiếng Việt và ứng dụng”, Chuyên san “Các công trình nghiên cứu, triển khai Công nghệ Thông tin và Viễn thông, Tạp chí Bưu chính Viễn thông, số 1, tháng 7-1999, trang 61-67. 1999 [7] Huỳnh Quyết Thắng, Đinh Thị Thu Phương, “Tiếp cận phương pháp học không giám sát trong học có giám sát với bài toán phân lớp văn bản tiếng Việt và đề xuất cải tiến công thức tính độ liên quan giữa hai văn bản trong mô hình vectơ”, Kỷ yếu Hội thảo ICT.rda’04, trang 251-261, Hà Nội 2005.
[8] Đỗ Phúc, Nghiên cứu ứng dụng tập phổ biến và luật kết hợp vào bài toán phân loại văn bản tiếng Việt có xem xét ngữ nghĩa, Tạp chí phát triển KH&CN, tập 9, số 2, pp. 23-32, năm 2006
[9] http://vi.wikipedia.org/wiki/RSS_(định _dạng_tệp tin)
[10] Chih-Hao Tsai, MMSEG: A Word Identification System for Mandarin Chinese Text Based on Two Variants of the Maximum Matching Algorithm.
http://technology.chtsai.org/MMSEG/, 2000.
[11] 8. Quinlan J., C4.5: Programs for Machine Learning, Morgan Kaufman Publishers,1993.
[12] Đỗ Thanh Nghị, Khai mỏ dữ liệu – minh họa bằng ngôn ngữ R (chương 4), NXB Đại học Cần Thơ, 2010.