1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(Luận văn thạc sĩ) nghiên cứu ứng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ học tập cho sinh viên​

81 12 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 81
Dung lượng 2,54 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ XUÂN LÂM NGHIÊN CỨU ỨNG DỤNG CÁC KỸ THUẬT TRONG KHAI PHÁ DỮ LIỆU HỖ TRỢ HỌC TẬP CHO SINH VIÊN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2020 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ XUÂN LÂM NGHIÊN CỨU ỨNG DỤNG CÁC KỸ THUẬT TRONG KHAI PHÁ DỮ LIỆU HỖ TRỢ HỌC TẬP CHO SINH VIÊN Ngành: Công nghệ Thông tin Chuyên ngành: Quản lý Hệ thống Thông tin Mã số: 8480205.01 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HÀ NAM Hà Nội – 2020 LỜI CẢM ƠN Tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS Nguyễn Hà Nam, Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, người thầy dành nhiều thời gian tận tình bảo, hướng dẫn, giúp đỡ tơi suốt trình tìm hiểu, nghiên cứu Thầy người định hướng đưa nhiều góp ý quý báu q trình tơi thực luận văn Tơi xin gửi lời cảm ơn chân thành tới thầy, cô khoa Công nghệ thông tin – Trường Đại học Công nghệ - ĐHQGHN trang bị kiến thức tạo điều kiện thuận lợi cho suốt q trình học tập trường Tơi xin bày tỏ lòng biết ơn sự giúp đỡ lãnh đạo quan, đồng nghiệp cung cấp liệu, tài liệu cho lời khuyên quý báu Tơi xin cảm ơn gia đình, người thân, bạn bè động viên tạo điều kiện tốt cho Tôi xin chân thành cảm ơn! Hà Nội, tháng năm 2020 Học viên Lê Xuân Lâm LỜI CAM ĐOAN Tơi xin cam kết cơng trình nghiên cứu tôi, thực sự hướng dẫn PGS.TS Nguyễn Hà Nam Các số liệu, kết nêu luận văn trung thực chưa công bố công trình khác Hà Nội, tháng năm 2020 Học viên Lê Xuân Lâm ii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT v LỜI MỞ ĐẦU Chương Giới thiệu 1.1.Quy trình quản lý đào tạo trường CĐ.ANND I 1.2.Bài toán ứng dụng KPDL để xây dựng hệ thống tư vấn trường CĐ.ANND I 1.3.Một số nghiên cứu khai phá liệu lĩnh vực giáo dục 1.4.Hướng tiếp cận luận văn 1.5.Kết luận chương 10 Chương Cơ sở lý thuyết 11 2.1.Khai phá liệu 11 2.1.1 Khái niệm 11 2.1.2 Những hướng tiếp cận KPDL 12 2.1.3 Các bước xây dựng giải pháp KPDL 13 2.1.4 Các lĩnh vực ứng dụng KPDL 13 2.2.Một số kỹ thuật KPDL phân lớp, dự đoán 15 2.2.1 Cây định 15 2.2.2 Phân lớp Naïve Bayes 16 2.2.3 Luật kết hợp 17 2.2.4 Hồi quy tuyến tính 19 2.2.5 Mạng nơ-ron nhân tạo 21 2.3.KPDL với MS SQL Server 23 2.3.1 Giới thiệu chung 23 2.3.2 Data Mining eXtensions 25 2.3.3 Bộ công cụ SQL Server Data Tool – Business Intelligence 29 2.3.4 Lập trình KPDL với ADODE.NET 30 iii 2.3.5 Đánh giá tính hiệu mơ hình KPDL SSDT-BI 31 2.4.Kết luận chương 32 Chương Giải toán 33 3.1.Phát biểu toán 33 3.2.Mô tả số giải thuật sử dụng toán toán 33 3.2.1 Thuật toán Apriori 33 3.2.2 Thuật toán C4.5 35 3.2.3 Thuật tốn hồi quy tuyến tính Microsoft 36 3.2.4 Thuật toán Back propagation 38 3.3.Xây dựng CSDL 39 3.4.Xây dựng mơ hình KPDL 43 3.5.Lập trình KPDL với ADOMD.NET 55 3.6.Đánh giá mơ hình 57 3.6.1 Đánh giá mơ hình với Lift Chart 57 3.6.2 Đánh giá mơ hình với Classification Matrix 63 3.7.Xây dựng ứng dụng hỗ trợ tư vấn học tập 64 3.8.Kết luận chương 69 KẾT LUẬN 70 HƯỚNG PHÁT TRIỂN 70 TÀI LIỆU THAM KHẢO 71 iv DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Chữ viết tắt Ý nghĩa CĐ.ANND I Cao đẳng An ninh nhân dân I CSDL Cơ sở liệu DMX Data Mining eXtensions DMM Data Mining Model KPDL Khai phá liệu MS SSDT-BI QLĐT Microsoft SQL Server Data Tool - Bussiness Intelligence Quản lý Đào tạo v DANH MỤC CÁC BẢNG Bảng 2.1: Lựa chọn thuật toán KPDL theo mục đích 24 Bảng 2.2: Bảng danh sách thư viên API Analysis Services 30 Bảng 3.1: Bảng quy đổi thang điểm 40 Bảng 3.2: Thơng tin liệu cho tốn 41 Bảng 3.3: Bảng giá trị Mining Legend 59 DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1: Quá trình khai thác tri thức 11 Hình 2.1: Cấu trúc định 15 Hình 2.2: Cây định dự báo khả khách hàng 16 Hình 2.3: Biểu đồ hồi quy tuyến tính đơn 20 Hình 2.4: Mơ hình nơ-ron đơn lẻ 21 Hình 2.5: Mơ hình mạng nơ-ron đa tầng 21 Hình 2.6: Mạng nơ-ron MS Neural Network 22 Hình 2.7: Kiến trúc tổng quan KPDL với MS SQL Server 23 Hình 2.8: Biểu đồ đánh giá Lift Chart 31 Hình 2.9: Đánh giá mơ hình với Classification Matrix 32 Hình 3.1: Danh sách kết luật 34 Hình 3.2: Kết mơ hình định 36 Hình 3.3: Kết mơ hình hồi quy tuyến tính 37 Hình 3.4: Dạng tổng quát mạng nơ-ron truyền thẳng nhiều lớp 38 Hình 3.5: Lược đồ CSDL quan hệ 41 Hình 3.6: Bộ liệu sử dụng cho toán số 42 Hình 3.7: Sơ đồ liên quan đến liệu điểm 43 Hình 3.8: Danh sách điểm học viên 43 Hình 3.9: Tạo dự án Data mining 44 Hình 3.10: Tạo Data Source 44 Hình 3.11: Tạo Data Source View 45 Hình 3.12: Lựa chọn Mining model structure 45 Hình 3.13: Thiết lập thuộc tính cho dự báo 46 Hình 3.14: Xác định kiểu liệu thuộc tính cho dự báo 46 Hình 3.15: Thiết lập dataset với training testing 47 Hình 3.16: Một Mining Structure Mining Model tạo 47 Hình 3.17: Thêm Mining Model 48 Hình 3.18: Tạo 04 mơ hình cho Mining Structure 49 vi Hình 3.19: Kết viewer mơ hình Cây định 49 Hình 3.20: Kết viewer mơ hình Luật kết hợp 50 Hình 3.21: Kết viewer mơ hình Nạve Bayes 50 Hình 3.22: Kết viewer mơ hình mạng nơ-ron nhân tạo 51 Hình 3.23: Biểu đồ Lift Chart cho 04 mơ hình 51 Hình 3.24: Kết Classification Matrix 04 mơ hình 52 Hình 3.25: Thiết kế truy vấn Singleton Query DMX với mơ hình 53 Hình 3.26: Kết truy vấn Singleton Query với mơ hình 53 Hình 3.27: Tạo mơ hình cho tốn 54 Hình 3.28: Biểu đồ Lift chart cho mơ hình 54 Hình 3.29: Sử dụng ADMOD.NET C# 55 Hình 3.30: Lựa chọn Lift Chart với thuộc tính dự báo xác định 57 Hình 3.31: Kết Lift Chart với ĐTBKY2 = “K” cho 04 mơ hình 58 Hình 3.32: Lift Chart cho tất trường hợp thuộc tính dự đốn 60 Hình 3.33: Biểu đồ Lift Chart tất trường hợp thuộc tính dự đốn 60 Hình 3.34: Mạng phụ thuộc mơ hình CayQĐ 61 Hình 3.35: Mạng phụ thuộc mơ hình CayQĐ 62 Hình 3.36: Biểu đồ phân tán đánh giá mơ hình 62 Hình 3.37: Đánh giá mơ hình với Classifications Matrix 64 Hình 3.38: Sơ đồ hoạt động hệ thống 65 Hình 3.39: Giao diện hệ thống 66 Hình 3.40: Kết Ví dụ 67 Hình 3.41: Kết Ví dụ 67 Hình 3.42: Kết ví dụ 68 vii LỜI MỞ ĐẦU Trong năm gần đây, việc ứng dụng kỹ thuật khai phá liệu phát tri thức lĩnh vực giáo dục, tài chính, ngân hàng, xây dựng…rất quan tâm nghiên cứu Đối với giáo dục, đào tạo sinh viên trường Đại học, Cao đẳng theo hình thức đào tạo tín địi hỏi học viên phải có sự chủ động cao Sinh viên trình học tập phải tự lựa chọn, phân bổ mơn học cho kỳ cho tích lũy đủ số tín theo quy chế đào tạo, Sinh viên hồn tồn trường sớm hạn Qua trình dạy học trường Cao đẳng An ninh nhân dân I, nhận thấy tỉ lệ học viên học tập trường đạt kết chưa cao Nguyên nhân em bước chân từ môi trường giáo dục THPT vào môi trường Đại học, Cao đẳng cịn nhiều bỡ ngỡ, khó khăn việc định hướng học tập, làm ảnh hưởng tới kết học tập thân nhà trường Chúng ta áp dụng lĩnh vực khai phá liệu phát tri thức để giải vấn đề trên, nhằm hỗ trợ cho học viên có định hướng việc lựa chọn, xây dựng thời khóa biểu phù hợp thân mang lại đạt kết cao trình học tập trường Từ sở thực tiễn đó, tơi chọn đề tài: “Nghiên cứu ứng dụng kỹ thuật khai phá liệu hỗ trợ học tập cho sinh viên” Mục đích đề tài sâu tìm hiểu việc phân tích liệu thơng tin cá nhân sinh viên, kết hợp với kết học tập thực tế kỳ nhằm hỗ trợ sinh viên lựa chọn môn học phù hợp, đạt kết cao Nội dung trình bày luận văn “Nghiên cứu ứng dụng kỹ thuật khai phá liệu hỗ trợ học tập cho học viên” bố cục gồm chương: Chương 1: Giới thiệu Chương trình bày trạng cơng tác quản lý đào tạo trường CĐ.ANND I, đối tượng, phạm vi hướng nghiên cứu luận văn Chương 2: Cơ sở lý thuyết Chương trình bày sở khai phá liệu phát tri thức, kỹ thuật khai phá liệu Cây định, Luật kết hợp, Hồi quy tuyến tính, Neural Networks Nạve Bayes, Cơng cụ SSDT-BI SQL Server 2012 Chương 3: Giải tốn Mơ tả, xây dựng toán dự đoán kết học tập cuối kỳ cho học viên, toán dự đoán kết môn học tới Tổng hợp xử lý liệu liên Hình 3.31 Lift Chart dự báo kết học tập với thuộc tính dự báo xác định Khá (K) 04 mô hình đề xuất: Hình 3.31: Kết Lift Chart với ĐTBKY2 = “K” cho 04 mơ hình Trong Lift Chart, trục X biểu diễn phần trăm test dataset sử dụng để so sánh với kết dự đoán, trục Y biểu diễn phần trăm giá trị dự đốn Trong Hình 3.31 ta có: - Đường CayQD: đường biểu diễn khả dự đoán ĐTBKY2 = “K” mơ hình Cây định - Đường KetHop: đường biểu diễn khả dự đoán ĐTBKY2 = “K” mơ hình Luật kết hợp - Đường Neural: đường biểu diễn khả dự đoán ĐTBKY2 = “K” mơ hình Luật kết hợp - Đường Nạve: đường biểu diễn khả dự đoán ĐTBKY2 = “K” 58 mơ hình Nạve Bayes - Đường Random Guess Model: đường biểu diễn kết việc chọn ngẫu nhiên (khơng cần mơ hình) - Đường Ideal Model: đường biểu diễn mơ hình lý tưởng (dự đốn xác trường hợp) - Mining Legend: giúp xem giá trị điểm đồ thị cách di chuyển trượt dọc (Gray line) Trong Hình 3.31 gray line đặt vị trí 60%, Mining Legend có giá trị Bảng 3.3 sau: Bảng 3.3: Bảng giá trị Mining Legend Score Target population Predict probability CayQD 0.85 67.06% 75.55% KetHop 0.80 63.53% 75.28% Neural 0.81 62.35% 67.86% Naive 0.80 61.18% 72.55% Series, Model Random Guess Model 60.00% Ideal Model for: CayQD, KetHop, Neural, Navie 81.18% Từ kết thấy: - Mơ hình Cây định có tính hiệu Score = 0.85, với 60% tổng số học viên database, mơ hình CayQD dự đốn xác 67.06% kết ĐTBKY2 = K, kết dự đốn có giá trị 75.55% đủ tin cậy - Mô hình Luật kết hợp có tính hiệu Score = 0.80, với 60% tổng số học viên database, mơ hình KetHop dự đốn xác 63.53% kết ĐTBKY2 = K, kết dự đốn có giá trị 75.28% đủ tin cậy - Mơ hình Mạng nơ-ron có tính hiệu Score = 0.81, với 60% tổng số học viên database, mơ hình Neural dự đốn xác 62.35% kết ĐTBKY2 = K, kết dự đoán có giá trị 67.86% đủ tin cậy - Mơ hình Nạve Bayes có tính hiệu Score = 0.80, với 60% tổng số học viên database, mơ hình Naive dự đốn xác 61.18% kết 59 ĐTBKY2 = K, kết dự đốn có giá trị 72.55% đủ tin cậy Lift Chart cho tất trường hợp thuộc tính dự đốn: Với Lift Chart cho tất trường hợp thuộc tính dự đốn Để đánh giá mơ hình dự báo kết học viên để trống ô Predict Value Hình 3.32 Hình 3.32: Lift Chart cho tất trường hợp thuộc tính dự đốn Hình 3.33 kết Lift Chart cho tất trường hợp thuộc tính dự đốn với 04 mơ hình đề xuất: Hình 3.33: Biểu đồ Lift Chart tất trường hợp thuộc tính dự đốn Biểu đồ mơ tả khả dự đốn mơ hình tất trường hợp xếp loại điểm trung bình kỳ (ĐTBKY2) học viên Trong trục 60 X biểu thị giá trị thuộc tính dự đoán (là phần trăm Test Data set), trục Y bây biểu thị phần trăm dự đốn xác Tương tự Lift Chart có giá trị thuộc tính dự đốn Trong Hình 3.33 thấy mơ hình Cây định có tính hiệu cao với Score = 0.79, mơ hình Mạng nơ-ron với Score = 0.73, mơ hình Nạve Bayes với Score = 0.67 cuối mơ hình Luật kết hợp với Score = 0.58 Nhận xét: Qua kết trên, toán thấy mơ hình Cây định (CayQD) cho kết tốt với tính hiệu với hai loại Lift Chart có xác định giá trị thuộc tính dự đốn Lift Chart cho tất trường hợp thuộc tính dự đốn Tuy nhiên sử dụng Dependency Network (Mạng phụ thuộc) để xem thuộc tính ảnh hưởng tới kết dự đốn: với mơ hình CayQD kết dự đốn phụ thuộc vào thuộc tính Gioitinh (nhận giá trị True/False) Tennganh (nhận giá trị Trinh sát An ninh/ Trinh sát Ngoại tuyến) không mang giá trị ý nghĩa cao cho dự đốn.(Xem hình 3.34) Hình 3.34: Mạng phụ thuộc mơ hình CayQĐ Trong với mơ hình Luật kết hợp (KetHop) với Dependency Network (Mạng phụ thuộc) thấy mối liên hệ thuộc tính ảnh hưởng lớn tới kết dự đốn, có giá trị thực tế việc dự đốn kết quả.(Xem hình 3.35) 61 Hình 3.35: Mạng phụ thuộc mơ hình CayQĐ Vì mơ hình KetHop lựa chọn để xây dựng ứng dụng Đối với toán 2, dự đốn mơn học kỳ tới học viên Chúng ta sử dụng mơ hình thử nghiệm là: Hồi quy tuyến tính (DiemTest), Cây định (CayQD), Mạng nơ-ron (Noron) Do liệu đầu vào có thuộc tính liên tục nên hỗ trợ đánh giá Lift Chart cho tất trường hợp thuộc tính dự đốn khơng hỗ trợ đánh giá với Classification Matrix Vì tốn sử dụng đánh giá mơ hình với Lift Chart Hình 3.36 biểu đồ phân tán (Scatter Plot) biểu thị giá trị thực tế so với giá trị dự đốn mơ hình đề xuất tốn Trong trục X hiển thị giá trị thực tế trục Y hiển thị giá trị dự đoán Đường dự đoán lý tưởng (Ideal Prediction) đường góc 45o, khoảng cách điểm so với đường lý tưởng cho biết dự đốn thực tốt hay Hình 3.36: Biểu đồ phân tán đánh giá mơ hình 62 Nhận xét: Nhìn vào Hình 3.32 thấy mơ hình Hồi quy tuyến tính (DiemTest) có Score =1.58, mơ hình Cây định có Score = 1.12, mơ hình Mạng nơ-ron có Score = 1.52 Giá trị Score lớn chứng tỏ mơ hình có hiệu tốt Như sử dụng mơ hình Hồi quy tuyến tính (DiemTest) để xây dựng ứng dụng tốn 3.6.2 Đánh giá mơ hình với Classification Matrix Đánh giá mơ hình với Classifications Matrix hoạt động giống ma trận nhầm lẫn (confusion matrix) Dựa vào kết kết dựa toán tính tốn độ xác mơ hình, độ lỗi mơ hình, độ hỗ trợ Cấu tạo ma trận nhầm lẫn Bảng 3.4 Bảng 3.4: Ma trận nhầm lẫn Actual Class Predicted Class Yes No Yes a b No c d Ma trận nhầm lẫn có thơng tin sau: - a (true positive) – mẫu mang nhãn dương phân lớp vào lớp dương - b (false negative) – mẫu mang nhãn dương bị phân lớp sai vào lớp âm - c (false positive) – mẫu mang nhãn âm bị phân lớp sai vào lớp dương - d (true negative) – mẫu mang nhãn âm phân lớp vào lớp âm - Độ xác tính sau: 𝐴𝑐𝑐 = 𝑎+𝑑 𝑎+𝑏+𝑐+𝑑 (8) - Độ lỗi tính sau: 𝐸𝑟𝑟𝑜𝑟_𝑟𝑎𝑡𝑒 = − 𝐴𝑐𝑐 (9) - Độ hỗ trợ tính sau: 𝑆𝑢𝑝𝑝𝑜𝑟𝑡(𝑠𝑢) = 𝑎+𝑏 (% 𝑝𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛) 𝑛 63 (10) Hình 3.37 thể kết đánh giá với Classifications Matrix mơ hình đề xuất với tốn Hình 3.37: Đánh giá mơ hình với Classifications Matrix Nhìn vào Hình 3.37 thấy: - Mơ hình Cây định (CayQD) có: độ xác (0.73), độ lỗi (0.27) - Mơ hình Luật kết hợp (KetHop) có: độ xác (0.63), độ lỗi (0.37) - Mơ hình Mạng nơ-ron (Neural) có: độ xác (0.65), độ lỗi (0.35) - Mơ hình Nạve Bayes (Nạve) có: độ xác (0.67), độ lỗi (0.33) Nhận xét: Dựa vào kết nêu thấy mơ hình Cây định (CayQD) có độ xác cao (0.73) độ lỗi (0.27) thấp Tuy nhiên nhìn vào bảng Classifications Matrix thực tế ta thấy Cây Quyết định dự đoán kết K = Khá, cịn với trường hợp dự đốn kết G = Giỏi, TB = Trung bình khơng xác 3.7 Xây dựng ứng dụng hỗ trợ tư vấn học tập Với đánh giá mơ hình mục 3.6, mơ hình Luật kết hợp cho kết dự đốn 64 tốn mơ hình Hồi quy cho kết dự đoán toán lựa chọn để xây dựng hệ thống tư vấn học tập Hệ thống xây dựng ngôn ngữ Visual C#.NET với hệ quản trị CSDL MS SQL Server 2012 Windows Forms Do yêu cầu bảo mật thông tin ngành nên xây dựng Web có khả lộ lọt thông tin nên hệ thống triển khai Windows Forms Hệ thống triển khai hỗ trợ tốt cho học viên lựa chọn lên kế hoạch phù hợp để đạt kết học tập cao Bên cạnh đó, hệ thống hỗ trợ cán quản lý giáo dục việc định hướng cho học viên lựa chọn học phần thích hợp nhằm nâng cao chất lượng đào tạo Sơ đồ hoạt động hệ thống: Begin Đọc liệu nhập vào - Duyệt tồn thơng tin học viên tương ứng với mã học viên nhập vào - Kết hợp liệu nhập vào với toàn học viên Kết nối đến Analysis Services Kết nối thành công Thông báo lỗi Thực thi lệnh truy vấn DMX dự đốn kết học với thơng tin học viên Hiển thị kết dự đoán Đóng kết nối End Hình 3.38: Sơ đồ hoạt động hệ thống Hình 3.39 giao diện hệ thống: 65 Hình 3.39: Giao diện hệ thống Đối với toán 1: dự đoán kết điểm trung bình kỳ sau cho học viên dựa vào thơng tin nhân học điểm trung bình tích lũy kỳ trước, xem xét ví dụ ví dụ sau đây: Ví dụ 1: Sử dụng hệ thống để đưa kết tư vấn kết học tập kỳ cho học viên với giá trị thuộc tính đầu vào sau: - Giới tính: True (Nam giới) - Mã ngành: (Trinh sát anh ninh) - Điểm thi: 21.5 - Điểm TB kỳ trước: TB - Đối tượng: HSPT - Dân tộc: Kinh Hình 3.40 thể kết quả: 66 Hình 3.40: Kết Ví dụ Ví dụ 2: Sử dụng hệ thống để đưa kết tư vấn kết học tập kỳ sau cho học viên với giá trị thuộc tính đầu vào sau: - Giới tính: False (Nữ giới) - Mã ngành: (Trinh sát anh ninh) - Điểm thi: 22.5 - Điểm TB kỳ trước: TB - Đối tượng: HSPT - Dân tộc: Mông Hình 3.41 thể kết quả: Hình 3.41: Kết Ví dụ 67 Nhận xét kết quả: Với mơ hình dư đốn Luật kết hợp, Ví dụ Ví dụ hai học viên có thuộc tính đầu vào nhau, khác giới tính, dân tộc, điểm thi cho kết tương đối giống nhau, khác xác suất dự đoán Đối với toán dự đoán môn học học kỳ tới, xem xét ví dụ sau: Ví dụ 3: Nhập liệu mã học viên: 403 404 ta danh sách liệt kê kết học tập hiên học viên có mã 403 404 Tiến hành dự đốn mơn học 61 hai học viên mã 403 404 kỳ tới Hình 3.42: Kết ví dụ 68 Nhận xét kết quả: Với đầu vào danh sách điểm môn học học viên 403 404 dự đoán điểm môn 61 học kỳ tới học viên 403 là: 3.01 với xác suất 99.22 học viên 404 là: 3.11 với xác suất 99.22 Từ kết trên, hồn tồn dư đốn thêm nhiều mơn khác mà học viên học kỳ tới Học viên chọn mơn học có số điểm cao với xác suất cao để học kỳ tới 3.8 Kết luận chương Chương trình bày tốn đề xuất việc tổng hợp xử lý liệu học viên trường, xây dựng CSDL cho hệ thống tư vấn học tập Xây dựng mơ hình tư vấn học tập với thuật tốn đề xuất hồi quy tuyến tính, luật kết hợp, định, mạng nơ ron nhân tạo Naive Bayes Đánh giá mức độ xác mơ hình cho thấy mơ hình Luật kết hợp cho kết tốt với tốn 1, mơ hình Hồi quy tuyến tính cho kết tốt với toán Đề xuất ứng dụng hỗ trợ tư vấn kết học tập dựa hai mô hình Luật kết hợp cho tốn mơ hình Hồi quy tuyến tính cho tốn 69 KẾT LUẬN Từ việc nghiên cứu yêu cầu cấp thiết đặt công tác quản lý vào đào tạo trường Cao đẳng An ninh nhân dân I, luận văn đạt số kết sau đây: - Nghiên cứu số kỹ thuật KPDL nhằm xây dựng mơ hình phân tích liệu nhân điểm học viên để dự báo, gợi ý việc lựa chọn môn học theo lịch sử học tập học viên - Xây dựng ứng dụng dự báo kết học tập học viên sử dụng MS SQL Server cho kết bước đầu chứng minh tính khả thi phương pháp tiếp cận HƯỚNG PHÁT TRIỂN Trong thời gian tới em tiếp tục cập nhật mơ hình với liệu khóa trường để kết dự đốn cải thiện Hồn thiện tối đa hệ thống tư vấn, với đầy đủ chức năng, tối ưu hóa người dùng Trong q trình thực luận văn chắn tránh khỏi thiếu sót Em mong nhận góp ý từ thầy, cô bạn đọc để luận văn hoàn thiện Xin chân thành cảm ơn! 70 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Phan Xuân Hiếu (2013), Bài giảng môn học KPDL kho liệu, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội [2] Huỳnh Lý Thanh Nhàn, Nguyễn Thái Nghe (2013), Hệ thống dự đoán kết học tập gợi ý lựa chọn môn học, Hội thảo quốc gia lần thứ XVI: Một số vấn đề chọn lọc Công nghệ thông tin truyền thông- Đà Nẵng [3] Hà Quang Thụy (2010), Bài giảng môn học Kho liệu KPDL, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội [4] Đỗ Thanh Tùng (2010), Xây dựng hệ thống dự báo phụ tải điện sử dụng mạng Nơron nhân tạo, Trường Đại học dân lập Hải Phòng Tiếng Anh [5] Gray, G., C McGuinness, P Owende An Application of Classification Models to Predict Learner Progression in Tertiary Education – In: Advance IEEE International Computing Conference (IACC’14), 2014, pp 549-554 [6] Gregory E Cooper , Edward Herskovit (1992), A Bayesian Method for the Induction of Probabilistic Networks from Data Machine Learning, 9, pp 309347 [7] Jiawei Han and Micheline Kamber (2006), Data Mining Concepts and Techniques, Second Edition Published by Elsevier Inc [8] Brian Knight, Devin Knight, Adam Jorgensen, Patrick LeBlanc, Mike Davis (2010), Knight's Microsoft Business Intelligence 24-Hour Trainer Published by Wiley Publishing, Inc [9] Jamie MacLennan, ZhaoHui Tang, Bogdan Crivat (2008), Data Mining with Microsoft SQL Server 2008 Published by Wiley Publishing, Inc., Indianapolis, Indiana [10] Tran, Thi Oanh and Dang, Hai Trieu and Dinh, Viet Thuong and Truong, Thi Minh Ngoc and Vuong, Thi Phuong Thao and Phan, Xuan Hieu (2017), Performance Prediction for Students: A Multi-Strategy Approach Cybernetics and Information Technologies, 17 (2) pp 164-182 ISSN 1314-4081 71 [11] Microsoft SQL Server (2012), Data Mining Extensions (DMX) Reference, SQL Server 2012 Books Online [12] Rakesh Agrawal, & Ramakrishnan Srikant (1994), Fast algorithms for mining association rules in large databases Proceedings of the 20th International Conference on Very Large Data Bases, VLDB, pp 487-499 [13] Scutari, M (2018), Dirichlet Bayesian network scores and the maximum relative entropy principle Behaviormetrika, 45, pp 337–362 72 ...ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ XUÂN LÂM NGHIÊN CỨU ỨNG DỤNG CÁC KỸ THUẬT TRONG KHAI PHÁ DỮ LIỆU HỖ TRỢ HỌC TẬP CHO SINH VIÊN Ngành: Công nghệ Thông... dụng kỹ thuật khai phá liệu hỗ trợ học tập cho sinh viên” Mục đích đề tài sâu tìm hiểu việc phân tích liệu thơng tin cá nhân sinh viên, kết hợp với kết học tập thực tế kỳ nhằm hỗ trợ sinh viên... kỳ nhằm hỗ trợ sinh viên lựa chọn môn học phù hợp, đạt kết cao Nội dung trình bày luận văn ? ?Nghiên cứu ứng dụng kỹ thuật khai phá liệu hỗ trợ học tập cho học viên” bố cục gồm chương: Chương 1:

Ngày đăng: 19/02/2021, 20:34

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Phan Xuân Hiếu (2013), Bài giảng môn học KPDL và kho dữ liệu, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Sách, tạp chí
Tiêu đề: Bài giảng môn học KPDL và kho dữ liệu
Tác giả: Phan Xuân Hiếu
Năm: 2013
[2] Huỳnh Lý Thanh Nhàn, Nguyễn Thái Nghe (2013), Hệ thống dự đoán kết quả học tập và gợi ý lựa chọn môn học, Hội thảo quốc gia lần thứ XVI: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông- Đà Nẵng Sách, tạp chí
Tiêu đề: Hệ thống dự đoán kết quả học tập và gợi ý lựa chọn môn học
Tác giả: Huỳnh Lý Thanh Nhàn, Nguyễn Thái Nghe
Năm: 2013
[3] Hà Quang Thụy (2010), Bài giảng môn học Kho dữ liệu và KPDL, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Sách, tạp chí
Tiêu đề: Bài giảng môn học Kho dữ liệu và KPDL
Tác giả: Hà Quang Thụy
Năm: 2010
[4] Đỗ Thanh Tùng (2010), Xây dựng hệ thống dự báo phụ tải điện sử dụng mạng Nơron nhân tạo, Trường Đại học dân lập Hải Phòng.Tiếng Anh Sách, tạp chí
Tiêu đề: Xây dựng hệ thống dự báo phụ tải điện sử dụng mạng Nơron nhân tạo
Tác giả: Đỗ Thanh Tùng
Năm: 2010
[5] Gray, G., C. McGuinness, P. Owende. An Application of Classification Models to Predict Learner Progression in Tertiary Education. – In: Advance IEEE International Computing Conference (IACC’14), 2014, pp. 549-554 Sách, tạp chí
Tiêu đề: An Application of Classification Models to Predict Learner Progression in Tertiary Education
[6] Gregory E Cooper , Edward Herskovit (1992), A Bayesian Method for the Induction of Probabilistic Networks from Data. Machine Learning, 9, pp. 309- 347 Sách, tạp chí
Tiêu đề: A Bayesian Method for the Induction of Probabilistic Networks from Data
Tác giả: Gregory E Cooper , Edward Herskovit
Năm: 1992
[7] Jiawei Han and Micheline Kamber (2006), Data Mining Concepts and Techniques, Second Edition. Published by Elsevier Inc Sách, tạp chí
Tiêu đề: Data Mining Concepts and Techniques, Second Edition
Tác giả: Jiawei Han and Micheline Kamber
Năm: 2006
[8] Brian Knight, Devin Knight, Adam Jorgensen, Patrick LeBlanc, Mike Davis (2010), Knight's Microsoft Business Intelligence 24-Hour Trainer.Published by Wiley Publishing, Inc Sách, tạp chí
Tiêu đề: Knight's Microsoft Business Intelligence 24-Hour Trainer
Tác giả: Brian Knight, Devin Knight, Adam Jorgensen, Patrick LeBlanc, Mike Davis
Năm: 2010
[9] Jamie MacLennan, ZhaoHui Tang, Bogdan Crivat (2008), Data Mining with Microsoft SQL Server 2008. Published by Wiley Publishing, Inc., Indianapolis, Indiana Sách, tạp chí
Tiêu đề: Data Mining with Microsoft SQL Server 2008
Tác giả: Jamie MacLennan, ZhaoHui Tang, Bogdan Crivat
Năm: 2008
[10] Tran, Thi Oanh and Dang, Hai Trieu and Dinh, Viet Thuong and Truong, Thi Minh Ngoc and Vuong, Thi Phuong Thao and Phan, Xuan Hieu (2017), Performance Prediction for Students: A Multi-Strategy Approach.Cybernetics and Information Technologies, 17 (2). pp. 164-182. ISSN 1314-4081 Sách, tạp chí
Tiêu đề: Performance Prediction for Students: A Multi-Strategy Approach
Tác giả: Tran, Thi Oanh and Dang, Hai Trieu and Dinh, Viet Thuong and Truong, Thi Minh Ngoc and Vuong, Thi Phuong Thao and Phan, Xuan Hieu
Năm: 2017
[11] Microsoft SQL Server (2012), Data Mining Extensions (DMX) Reference, SQL Server 2012 Books Online Sách, tạp chí
Tiêu đề: Data Mining Extensions (DMX) Reference
Tác giả: Microsoft SQL Server
Năm: 2012
[12] Rakesh Agrawal, & Ramakrishnan Srikant (1994), Fast algorithms for mining association rules in large databases. Proceedings of the 20th International Conference on Very Large Data Bases, VLDB, pp. 487-499 Sách, tạp chí
Tiêu đề: Fast algorithms for mining association rules in large databases
Tác giả: Rakesh Agrawal, & Ramakrishnan Srikant
Năm: 1994
[13] Scutari, M. (2018), Dirichlet Bayesian network scores and the maximum relative entropy principle. Behaviormetrika, 45, pp. 337–362 Sách, tạp chí
Tiêu đề: Dirichlet Bayesian network scores and the maximum relative entropy principle
Tác giả: Scutari, M
Năm: 2018

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w