3.5 .Chuẩn hoá dữ liệu đầu vào cho thuật toán
3.9. Hình ảnh trích ra từ chương trình demo
3.9.1. Giao diện thiết lập cơ sở dữ liệu
3.9.2. Giao diện chương trình tư vấn chọn ngành cho học sinh:
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 1. Kết luận
Trải qua thời gian dài nghiên cứu và thực hiện luận văn, tác giả đã hoàn thành luận văn với các mục tiêu mà bài toán đặt ra ban đầu, luận văn đã kết hợp được công nghệ thông tin vào lĩnh vực giáo dục. Cụ thể luận văn đã đạt được những kết quả sau:
- Kết quả đề tài xây dựng được hệ hỗ trợ tư vấn mang tính chất cộng đồng
- Giới thiệu phương pháp tổng quát xây dựng cây quyết định, và trình bày cụ thể thuật toán xây dựng cây quyết định bằng thuật toán C4.5.
- Xây dựng trang Web hỗ trợ tư vấn chọn ngành phù hợp năng lực người học.
- Xây dựng, lưu trữ được tập luật và cơ sở dữ liệu điểm để tư vấn chọn ngành.
- Tập dữ liệu test và huấn luyện khi kiểm thử có tỉ lệ chênh lệch khơng cao
- Luận văn đã giải quyết được những vấn đề đặt ra trong bài tốn bên cạnh đó có một số vấn đề chưa thỏa mãn được như mong đợi của tác giả:
+ Nguồn dữ liệu thu thập được chưa nhiều vì số lượng tuyển sinh của trường cịn ít.
+ Việc rời rạc dữ liệu đạt tỉ lệ độ chính xác chưa thật sự cao dẫn đến kết quả chưa thật sự tốt do có có một số luật thừa khơng mong muốn tuy nhiên tác giả đã cắt bỏ một số luật thừa khi phát triển ứng dụng.
Ngồi ra đề tài có thể được phát triển để hỗ trợ nhanh và tương đối chính xác cho người cần tham khảo để chọn ngành và một số ngành cần gợi ý thêm.
2. Hướng phát triển
Khai phá dữ liệu là lĩnh vực được nhiều người quan tâm và nghiên cứu, chính vì vậy nó được ứng dụng rộng rãi trong nhiều lĩnh vực tuy nhiên để mở rộng ứng dụng này và đưa vào thực tiễn thì ta cần quan tâm đến một số cộng việc sau:
- Tìm hiểu phương pháp xây dựng cây quyết định trên dữ liệu nhiều phân lớp.
- CSDL phải được thu thập với số lượng nhiều hơn.
- Xử lý dữ liệu tốt hơn để tăng hiệu suất thực thi chương trình.
- Cần sự hợp tác hơn với cán bộ đào tạo và chuyên gia quản lý công nghệ thông tin của trường.
- Cần tiếp tục phát triển hoàn thiện ứng dụng để tích hợp với website quản lý ở hệ thống trường Đại học
- Tìm hiểu nhu cầu thực tế của người học để phát triển cải tiến bài toán theo các thuật toán đã nghiên cứu để phát triển thành ứng dụng phổ biến đáp ứng nhu cầu cho xã hội.
DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt
[1]Nguyễn Đức Cường, “Slide bài giảng môn họcBI&DM:BussinessIntellegent and Data Mining”,2011-2012
[2]Nguyễn Thị Thanh Thủy, Nguyễn Trần Quốc Vinh, Ứng dụng khai phá dữ liệu xây dựng cơng cụ dự đốn kết quả học tập của sinh viên. Hội nghị sinh viên nghiên cứu khoa học lần thứ 8, Đại học Đà Nẵng, 2012.
[3]Nguyễn Chí Ngơn và Nguyễn Thái Nghe. 2010. Hệ chuyên gia hổ trợ sinh viênlậpkế hoạch học tập (dựa trên phương pháp khai phá dữ liệu - data mining). Đề tài NCKH cấp trường. Đại học Cần Thơ.
[4]Nguyễn Thái Nghe. 2013a.Hệ thống dự báo năng lực học tập và hỗ trợ sinhviênlựa chọn môn học. Đề tài NCKH cấp trường. Đại học Cần Thơ.
[5]Nguyễn Thái Nghe, Huỳnh Xuân Hiệp. 2012. Ứng dụng kỹ thuật phân rã ma trận đaquan hệ trong xây dựng hệ trợ giảng thông minh, Kỷ yếu Hội thảo quốc gia lần thứ XV: Một số vấn đề chọn lọc của CNTT&TT (@2012). Nhà xuất bản Khoa học và Kỹ thuật. ISBN: 893-5048-931578
[6]. TS Trương Ngọc Châu, Bài Giảng Khai phá dữ liệu, Đại học Bách Khoa, Đại học Đà Nẵng.
[7]. TS Trương Ngọc Châu, Bài Giảng Cơ sở dữ liệu, Đại học Bách Khoa, Đại học Đà Nẵng.
Tiếng Anh
[8] J. Han and Micheline Kamber. Data Mining:Concepts and Techniques, 3rd Edition. Morgan Kaufmann Publishers, 2011.
[9]. John Wiley & Sons (2003) - Data Mining-Concepts Models Methods And
Algorithms, Copyright © 2003 The Institute of Electrical and Electronics Engineers, Inc.
[10]. Jean – Marc Adamo (2001), Data Mining for Association Rules and Sequential Patterns, Sequential and Parallel Algorithms, Springer – VerlagNew York, Inc.
[11] John Shafer, RakeshAgrawal, ManishMehta. “Sprint –A Scalable Classifier for Data mining” in Predeeings of the 22nd International Conference on very large database, India1996.
[13] J. Ross Quinlan. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, 1993
[14] Ming Li “Data mining. Chepter 10 : Predictive Modeling”, Department of Computer Science and Technology Nanjing University,2011
Tài liệu internet