ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM THỊ NHƢ TRANG KHAI PHÁ DỮ LIỆU ĐIỂM ĐỂ DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN TRƢỜNG CAO ĐẲNG SƢ PHẠM HÀ NỘI LUẬN VĂN THẠC SĨ HÀ NỘI - 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM THỊ NHƢ TRANG KHAI PHÁ DỮ LIỆU ĐIỂM ĐỂ DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN TRƢỜNG CAO ĐẲNG SƢ PHẠM HÀ NỘI Ngành: Công nghệ Thông tin Chuyên ngành: Hệ thống Thông tin Mã số: 60 48 05 LUẬN VĂN THẠC SĨ CÁN BỘ HƢỚNG DẪN: GS.TS VŨ ĐỨC THI HÀ NỘI - 2013 LỜI CẢM ƠN Lời đầu tiên, tơi xin gửi lời cảm ơn lịng biết ơn sâu sắc tới GS.TS Vũ Đức Thi, Viện Công nghệ thông tin, Viện Khoa học Công nghệ Việt Nam Thầy dành nhiều thời gian tận tình hướng dẫn, giúp đỡ đinh hướng và thực ̣ hiê ̣n nô ̣i dung luâ ̣n văn Tôi xin gửi lời c ảm ơn tới thầy/cô khoa Công nghệ thông tin – Trường Đại học Công nghệ giảng dạy chúng tơi suốt q trình học tập Tôi xin chân thành cảm ơn lãnh đạo quan, bạn bè đồng nghiệp cung cấp tài liệu cho lời khuyên quý báu để thực luận văn Tôi gửi lời cảm ơn tới bạn lớp K16HTT2 ủng hộ, khích lệ, giúp đỡ ln sát cánh bên tơi suốt q trình học tập, rèn luyện trường Và cuối cùng, xin gửi lời cảm ơn vơ hạn tới gia đình, người thân bạn bè bên lúc khó khăn nhất, ln động viên tơi, khuyến khích sống học tập, công việc Tôi xin chân thành cảm ơn! Hà nội, tháng 12 năm 2013 Học viên Phạm Thị Nhƣ Trang LỜI CAM ĐOAN Tôi xin cam đoan đề tài nghiên cứu riêng tôi, thực hướng dẫn GS.TS Vũ Đức Thi Các kết thực nghiệm đề tài tiến hành thực nghiệm chưa công bố cơng trình khác Hà nội, tháng 12 năm 2013 Học viên Phạm Thị Nhƣ Trang LỜI MỞ ĐẦU Ngày nay, trường Đại học Cao đẳng dần chuyển sang đào tạo theo học chế tín Việc tư vấn học tập nhằm đạt kết học tập cao cho sinh viên đặc biệt quan tâm Đó khó khăn chung cho cấp quản lý Bằng cảm tính suy luận thủ công từ khối liệu khổng lồ, việc đưa tư vấn tốt cho sinh viên q trình học khơng phải khả thi Tại Việt Nam, việc nghiên cứu khai phá liệu lĩnh vực giáo dục đào tạo chưa quan tâm mức Phần lớn trường sử dụng Excel phần mềm quản lý đào tạo theo khuyến cáo Bộ Edusoft để quản lý Sinh viên, quản lý kết học tập Sinh viên Việc nhà quản lý muốn có nhìn tồn cảnh để thống kê kết học tập nhằm đưa phương hướng, đường lối, sách chương trình đào tạo, phương pháp giảng dạy v.v… gặp nhiều khó khăn Thơng thường việc sinh báo cáo thủ công, thực excel Trường Cao đẳng Sư phạm Hà Nội với bề dầy gần 55 năm, đào tạo số lượng lớn cho thủ đô đội ngũ Giáo viên THCS Tiểu học Hàng năm, Phòng Đào tạo tư vấn thay đổi chương trình đào tạo cho phù hợp với thực tế Nhưng việc thay đổi mang tính chất chủ quan, cảm tính Dữ liệu đào tạo lưu trữ sử dụng với mục đích tra cứu, báo cáo đơn giản Các phần mềm quản lý nhà trường sử dụng chưa trả lời mối quan hệ kết tuyển sinh đầu vào, kết mơn học, giới tính v.v… với kết học tập Sinh viên Các phần mềm chưa sinh báo cáo đa chiều để giúp nhà quản lý đưa chiến lược hàng năm Vì vậy, đề tài luận văn “Khai phá liệu điểm để dự đoán kết học tập Sinh viên trường Cao đẳng Sư phạm Hà Nội” sâu vào việc tiến hành khai thác liệu điểm nhằm đưa báo cáo đa chiều, dự đoán kết học tập Sinh viên dựa điểm môn học học kỳ trước Đề tài tiến hành nghiên cứu xây dựng lại hệ thống liệu điểm dựa theo liệu điểm có sẵn, nghiên cứu kỹ thuật phân lớp khai phá liệu, ứng dụng kỹ thuật để xây dựng mơ hình dự đốn kết học tập Sinh viên cơng cụ SQL Server Business Intelligence Development Studio Từ đó, đánh giá lựa chọn mơ kỹ thuật cho kết dự đoán tốt để ứng dụng dự báo kết học tập cho Sinh viên Nội dung luận văn bao gồm có chương: Chƣơng 1: Giới thiệu Chương giới thiệu trình quản lý đào tạo trường Cao đẳng Sư phạm Hà Nội, đối tượng, phạm vi phương pháp nghiên cứu luận văn Chƣơng 2: Cơ sở lý thuyết Chương trình bày sở lý thuyết Kho liệu, Mơ hình phân tích trực tuyến OLAP, Khai phá liệu, Công cụ Business Intelligence Development Studio SQL Server 2008 Chƣơng 3: Ứng dụng Chương tiến hành xây dựng sở liệu điểm Sinh viên khoa Tự nhiên, trường Cao đẳng Sư phạm Hà Nội Từ sở liệu chuyển thành kho liệu điểm Sau tiến hành phân tích báo cáo đa chiều xây dựng mơ hình dự đốn dựa cơng cụ Business Intelligence Development Studio SQL Server 2008, đánh giá mơ hình Chƣơng 4: Kết luận định hướng phát triển Chương tóm lược kết đạt luận văn Đồng thời đưa định hướng nghiên cứu thời gian tới MỤC LỤC DANH SÁCH CÁC HÌNH VẼ DANH SÁCH CÁC BẢNG BẢNG CÁC KÝ HIỆU VIẾT TẮT Chƣơng 1: GIỚI THIỆU 10 1.1 Quản lý đào tạo trƣờng Cao đẳng Sƣ phạm Hà Nội 10 1.1.1 Thực tiễn quản lý đào tạo trường Cao đẳng Sư phạm Hà Nội 10 1.1.2 Nhu cầu khai thác liệu điểm 11 1.1.3 Một số hướng nghiên cứu khai thác kho liệu điểm để dự đoán kết học tập Sinh viên 11 1.2 Đối tƣợng phạm vi nghiên cứu luận văn 11 1.2.1 Đối tượng 11 1.2.2 Phạm vi nghiên cứu 11 1.3 Phƣơng pháp nghiên cứu dự kiến kết đạt đƣợc 11 1.3.1 Phương pháp nghiên cứu 11 1.3.2 Dự kiến kết đạt 12 1.4 Kết luận chƣơng 12 Chƣơng 2: CƠ SỞ LÝ THUYẾT 13 2.1 Kho liệu 13 2.1.1 Khái niệm kho liệu 13 2.1.2 Các đặc tính kho liệu 13 2.1.3 Cấu trúc hệ thống kho liệu 14 2.1.4 Dòng liệu kho liệu 15 2.1.5 Ứng dụng kho liệu 15 2.1.6 Mơ hình liệu sử dụng kho liệu 16 2.1.7 Các bước xây dựng kho liệu 17 2.2 Phân tích trực tuyến (OLAP) 17 2.2.1 OLAP 17 2.2.2 Mơ hình liệu đa chiều 17 2.2.3 Mô chiều kinh doanh 18 2.2.4 Giới thiệu dịch vụ OLAP (OLAP Services) Microsoft SQL Server: 19 2.3 Khai phá liệu 20 2.3.1 Khái niệm khai phá liệu 20 2.3.2 Ứng dụng khai phá liệu 20 2.3.3 Nhiệm vụ khai phá liệu 21 2.3.4 Các phương pháp khai phá liệu 21 2.4 Giới thiệu công cụ BI hệ quản trị sở liệu SQL 2008 22 2.4.1 Business Intelligent (BI) 22 2.4.2 Các thành phần hệ thống BI 22 2.4.3 Dịch vụ phân tích 25 2.4.4 Giới thiệu số thuật toán sử dụng BIDS 25 2.4.5 Quy trình xây dựng mơ hình khai phá liệu với BIDS sau: 31 2.5 Kết luận chƣơng 31 Chƣơng 3: ỨNG DỤNG 33 3.1 Phân tích phát biểu toán 33 3.2 Xây dựng sở liệu 33 3.2.1 Nguồn liệu: 33 3.2.2 Xây dựng sở liệu SQL Server 2008 35 3.3 Xây dựng kho liệu từ sở liệu có 39 3.4 Khai phá từ kho liệu 42 3.4.1 Phân tích OLAP 42 3.4.2 Xây dựng mơ hình khai phá 43 3.4.3 Phân tích kết đạt được: 51 3.5 Kết luận chƣơng 51 Chƣơng 4: KẾT LUẬN VÀ ĐỊNH HƢỚNG PHÁT TRIỂN 52 TÀI LIỆU THAM KHẢO 53 DANH SÁCH CÁC HÌNH VẼ Hình 2.1: Cấu trúc hệ thống kho liệu 14 Hình 2.2: Dòng liệu kho liệu 15 Hình 2.3: Mơ hình đa chiều 18 Hình 2.4: Kiến trúc dịch vụ OLAP 19 Hình 2.5 Các thành phần hệ thống Business Intelligence 23 Hình 2.6 Hệ thống BI đơn giản 24 Hình 3.1 Danh sách bảng điểm tồn khóa lớp SP Tốn K33 (Khóa 2007-2010)34 Hình 3.2 Danh sách sinh viên lớp 34 Hình 3.3 Sơ đồ sở liệu quan hệ 35 Hình 3.4 Chọn nguồn liệu Microsoft Excel 38 Hình 3.5 Chọn đích kho liệu 39 Hình 3.6 Sử dụng Analysis Services Project 39 Hình 3.7 Kết nối DataSource 40 Hình 3.8 Kho liệu 41 Hình 3.9 Khối liệu chiều 42 Hình 3.10 Ví dụ OLAP 42 Hình 3.11 Ví dụ OLAP 43 Hình 3.12 Tạo mơ hình khai phá 43 Hình 3.13.Lựa chọn thuộc tính 44 Hình 3.14: Kết tính Entropy 45 Hình 3.15: Các mơ hình xây dựng 46 Hình 3.16: Cây phân nhánh dùng thuật toán Decision Tree 46 Hình 3.17: Mạng phụ thuộc dùng thuật toán Decision Tree 47 Hình 3.18:Thuật tốn Neural Network 47 Hình 3.19: Lift Chart 48 Hình 3.20: Ma trận phân lớp dùng thuật toán 49 Hình 3.21: Kết sử dụng mơ hình Decision Tree 50 DANH SÁCH CÁC BẢNG Bảng Ví dụ phân lớp 19 Bảng Ví dụ Entropy thuộc tính Quê quán 20 Bảng Ví dụ Entropy thuộc tính Điểm vào 20 Bảng Ví dụ Entropy thuộc tính Điểm năm 20 Bảng Ví dụ Entropy thuộc tính Giới tính 21 Bƣớc 2: Chọn sở liệu đích nơi đề tài khai thác liệu Hình 3.5 Chọn đích kho liệu 3.3.Xây dựng kho liệu từ sở liệu có Ta dựa công cụ BI cài đặt sẵn hệ quản trị SQL Server 2008 Bƣớc 1: Tạo project (Analysis Services Project) Hình 3.6 Sử dụng Analysis Services Project 39 Bƣớc 2: Tạo Data Source Tạo data source kết nối đến sở liệu quản lý Điểm Hình 3.7 Kết nối DataSource Bƣớc 3: Tạo Data Source View Trong Data Source View, chọn liệu lấy từ kho liệu có tên DW_Diem Bước chọn bảng cần thiết cho phân tích Sau hồn thành, bảng Sự kiện bảng chiều sau: 40 Hình 3.8 Kho liệu Bƣớc 4: Tạo liệu khối (Cubes) Bước giúp ta tạo liệu khối cho phân tích cách nháy chuột phải lên Cube chọn New Cube Bấm Next tiếp tục hệ thống tự động dị tìm bảng kiện bảng chiều Bước yêu cầu xác lập chiều thời gian xác định độ đo (Measure) cho việc phân tích Các độ đo đại lượng phản ánh mục tiêu phân tích, tính tốn Đó phép tốn thuộc tính tính tốn bảng Fact Kết khối liệu chiều sinh ra: 41 Hình 3.9 Khối liệu chiều 3.4.Khai phá từ kho liệu 3.4.1.Phân tích OLAP Panel bên trái chứa Measure (độ đo) chiều định nghĩa xây dựng khối Panel bên phải chia làm cửa sổ Cửa sổ dùng để xác định điều kiện để phân tích Cửa sổ chứa kết Measure ta kéo thả (drag and drop) measure từ panel bên trái qua Tùy theo mục đích phân tích mà xác lập biểu thức phân tích cho phù hợp Ví dụ 1: Với thiết lập có nghĩa cho biết điểm trung bình khóa học điểm đầu vào cao khóa Hình 3.10 Ví dụ OLAP 42 Ví dụ 2: Ta xem nhanh khóa học 2006-2009 (mã khóa học 0609), học kỳ 1, 3, điểm Trung bình học kỳ Sinh viên Hình 3.11 Ví dụ OLAP Việc sử dụng OLAP cho việc phân tích tạo báo cáo hoàn toàn linh hoạt dễ sử dụng Hệ thống cho phép tạo lát cắt (Slice) liệu nhiều chiều khác để sinh tổng hợp cần thiết cho nhu cầu phân tích liệu kho nhanh chóng tiện lợi Ví dụ dựa lát cắt chiều SinhVien, ThoiGian KhoaHoc 3.4.2.Xây dựng mơ hình khai phá Bƣớc 5: Tạo Mining model structure Chọn thuật tốn Cây định: Hình 3.12 Tạo mơ hình khai phá 43 Sau lựa chọn thuộc tính đầu vào: Hình 3.13.Lựa chọn thuộc tính Hình: Xác định Key (MaSV), thuộc tính đầu vào (Input) thuộc tính dự đốn (Predict) Chọn Cột cần dự doán (Predictable) XepLoai cột dùng để dự đoán (input) gồm: GioiTinh, HK1, HK2, QueQuan Sau xác định thuộc tính, nhấn vào nút Suggest để xem cột làm cột Input 44 Hình 3.14: Kết tính Entropy Dựa vào kết tính Entropy trên, ta thấy điểm số Score thuộc tính: HK2, HK1, cao so với thuộc tính cịn lại, tức thuộc tính có tác động mạnh đến thuộc tính dự đốn kết học tập Sinh viên Các thuộc tính cịn lại có mức độ ảnh hưởng đến mơ hình không đáng kể Bƣớc 6: Tạo Mining models 45 Hình 3.15: Các mơ hình xây dựng Bƣớc 6: Khai thác Mining models Thuật tốn định Hình 3.16: Cây phân nhánh dùng thuật toán Decision Tree 46 Hình 3.17: Mạng phụ thuộc dùng thuật tốn Decision Tree Nút trung tâm XepLoai thể thuộc tính dự đốn mơ hình liệu, cịn nút xung quanh thể thuộc tính tác động tới thuộc tính dự đốn Thuật tốn Neural Network Hình 3.18:Thuật tốn Neural Network Bƣớc 7: Kiểm tra độ xác Mining Models Theo Lift Chart tương ứng với mơ hình 47 Hình 3.19: Lift Chart Hình: Biểu đồ dự báo Xếp loại SV dùng thuật toán (Xếp loại =7.5) Trong Lift Chart, trục x biểu diễn % Test data sử dụng để so sánh với kết dự đoán, trục y biểu diễn % giá trị dự đoán -Đường màu xanh da trời thể giá trị ngưỡng giá - Đường màu xanh thể giá trị lý tưởng xếp loại =7.5 Ta thấy đường lý tưởng lập đỉnh x xung quanh 60% , điều có nghĩa ta có mơ hình lý tưởng, tức mơ hình dự đốn xác 100% trường hợp, ta xác định thuộc tính xeploai (7.5) cách test thử 60% liệu database - Đường màu tím hồng thể giá trị thực tế xếp loại =7.5 sử dụng thuật toán Neural Network Decision Tree Trong Lift Chart, Mining Legend giúp ta xem giá trị điểm đồ thị cách di chuyển trượt dọc (Gray line) Giá trị Xác suất dự đoán (Predict Probability): Đây giá trị ngưỡng (Threshold) mơ hình dự đốn Chẳn hạn với mơ hình Decision Tree có giá trị predict probability 75.61% có nghĩa dùng 48 mơ hình để dự đốn dự đốn có giá trị 75.61% đáng tin cậy Việc so sánh hiệu mơ hình cần phải cân nhắc, lựa chọn nhiều yếu tố Giá trị Score cho phép ta so sánh hiệu Mining Models, giá trị cao mơ hình tốt Trong ví dụ Decision Tree tốt Theo Classification Matrix (Ma trận phân lớp)tương ứng với mơ hình Hình 3.20: Ma trận phân lớp dùng thuật toán Ta nhận thấy số lượng dự báo loại xếp loại so với liệu thực tế -Khi sử dụng thuật toán Decision Tree, số lượng thực tế đạt kết 6.5 48 dự đoán 48+42+1=71 Tương tự số lượng thực tế đạt kết 7.5 62 dự đoán 3+62+8=73 Số lượng thực tế đạt kết 8.5 dự đoán Số lượng thực tế đạt kết 5.5 dự đoán Bƣớc 8: Sử dụng Mining Models để dự đốn Dựa vào phân tích bước trên, ta lựa chọn mơ hình Decision Tree Bước tiêp theo sử dụng mơ hình cho việc dự đốn 49 Kết sau: Hình 3.21: Kết sử dụng mơ hình Decision Tree Ba cột MaSV, XepLoai, Expression thể khả dự đoán học lực sinh viên Chẳng hạn với sinh viên có mã 0773007 khả dự đoán học lực 7.5 (khá) 96% So với kết thực tế ta thấy với kết thực tế Ta sử dụng kết để kiểm sốt tình hình học tập sinh viên 50 3.4.3.Phân tích kết đạt được: Đề tài tiến hành thử nghiệm với thuật tốn: Microsoft Decision Tree, Microsoft Neural Network Và chúng tơi có nhận xét sau: Với câu trúc mơ hình khai phá, sử dụng thuật tốn Decision Tree Xếp loại Sinh viên phụ thuộc vào điểm HK1 HK2; Khi sử dụng thuật tốn Neural Network Xếp loại Sinh viên lại phụ thuộc nhiều vào yếu tố Quê quán Về độ xác thuật tốn: Dựa vào phân tích trên, thuật tốn Decision Tree có độ xác thuật tốn cịn lại Với công cụ Microsoft Business Intelligent Development Studio 2008 R2, đề tài thử nghiệm với mơ hình Decision Tree Neural Network Sau dùng biểu đồ Lift Chart để kiểm tra độ xác mơ hình Kết cho thấy mơ hình Cây định lựa chọn để xây dựng với khả đạt mục tiêu 85%, lại đạt 83% Chính mơ hình Cây định lựa chọn để dự đoán kết học tập Sinh viên 3.5 Kết luận chƣơng Chương trình bày nội dung ứng dụng đề tài luận văn: - Phân tích phát biểu tốn khai phá liệu điểm - Xây dựng sở liệu điểm Sinh viên trường Cao đẳng Sư phạm Hà Nội - Xây dựng Kho liệu điểm từ sở liệu có -Khai thác liệu từ hệ thống kho liệu điểm 51 Chƣơng 4: KẾT LUẬN VÀ ĐỊNH HƢỚNG PHÁT TRIỂN Các mục tiêu thực đƣợc luận văn Sau thời gian thực nghiên cứu thực nghiệm, tác giả đáp ứng mục tiêu mà luận văn đặt ra: -Nghiên cứu hiểu vấn đề Kho liệu, mơ hình phân tích OLAP, khai phá liệu, công cụ BI hệ quản trị sở liệu SQL Server 2008 -Xây dựng kho liệu Điểm trường Cao đẳng Sư phạm Hà Nội -Thiết kế báo cáo phân tích nhiều chiều -Xây dựng lựa chọn mơ hình dự đốn để khám phá liệu ẩn Nhìn chung, đề tài hoàn thành mục tiêu đề Để đưa mơ hình dự đốn vào ứng dụng cách hiệu cần tiếp tục đầu tư thu thập liệu sinh viên nhiều Triển khai dự đoán, kiểm chứng thực tế đánh giá kết cách thường xuyên Bản thân nhận thấy hướng tiếp cận đắn có thực tiễn cao Định hƣớng phát triển Dựa kết thực hiên, luận văn có hướng phát triển sau: -Triển khai kho liệu với nguồn liệu lớn -Tích hợp tự động liệu từ nhiều nguồn khác vào kho liệu -Xây dựng hệ thống phần mềm hoàn chỉnh, dễ sử dụng cho sinh viên giáo viên Đặc biệt đội ngũ cố vấn học tập, dựa vào hệ thống tư vấn, lựa chọn lộ trình học phù hợp để kết học tập tốt 52 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hà Quang Thụy (2010), Bài giảng “kho liệu khai phá liệu” [2] Hà Quang Thụy, Phan Xuân Hiếu, Đồn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú Giáo trình khai phá liệu Web Nhà xuất Giáo dục Việt Nam, 2009 [3] Trường Cao đẳng Sư phạm Hà nội, Báo cáo tổng kết năm học [4] Trường Cao đẳng Sư phạm Hà nội, Ba công khai [5] Nguyễn Thái Nghe, Paul Janecek Peter Haddawy, Một phân tích kỹ thuật dự đốn kết học tập [6] Nguyễn Thị Thanh Thủy, Ứng dụng khai phá liệu xây dựng cơng cụ dự đốn kết học tập Sinh viên, Tuyển tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ Đại học Đà Nẵng năm 2012 [7] Trịnh Thị Nhị (2011), Nghiên cứu, khai thác kho liệu điểm trường Đại học Sư phạm kỹ thuật Hưng Yên dựa công cụ BI hệ quản trị CSDL SQL Server 2008, Luận văn Thạc sĩ, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội [8] SQL Server 2008 Books online [9] Website: http://bis.net.vn : Business Intelligence Solution [10] Ví dụ thuật tốn ID3 Naive Bayes, http://dataminingttmk52.googlecode.com/ /Giai_BaiTap_LuatPhanLop Tiếng Anh [11] Brijesh Kumar Baradwaj, Saurabh Pal: Mining Educational Data to Analyze Students Performance, (IJACSA) International Journal of Advanced Computer Science and Applications, Vol 2, No 6, 2011 [12] Sajadin Sembiring, Prediction of student academic performance by an application of datamining techniques, 2011 International Conference on Management and Artificial Intelligence IPEDR vol.6 (2011) © (2011) IACSIT Press, Bali, Indonesia 53 ... xây dựng kho liệu, khai phá liệu kỹ thuật phân lớp khai phá liệu 1.2.2 .Phạm vi nghiên cứu Dữ liệu điểm Sinh viên trường Cao đẳng sư phạm Hà Nội, sử dụng phương pháp phân lớp khai phá liệu điểm. .. tạo quy trường Cao đẳng Sư phạm Hà nội Bài toán khai phá liệu điểm để dự đoán kết học tập Sinh viên thực theo bước: Bước 1: Thu thập liệu, đánh giá xử lý liệu để thiết kế sở liệu điểm Sinh viên. ..ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHẠM THỊ NHƢ TRANG KHAI PHÁ DỮ LIỆU ĐIỂM ĐỂ DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN TRƢỜNG CAO ĐẲNG SƢ PHẠM HÀ NỘI Ngành: Công nghệ