Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 80 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
80
Dung lượng
1,31 MB
Nội dung
i BỘ GIÁO DỤC VÀ ĐÀO TẠO UBND TỈNH THANH HĨA TRƯỜNG ĐẠI HỌC HỒNG ĐỨC LÊ THỊ HỒI THU NGHIÊN CỨU ÁP DỤNG KỸ THUẬT PHÂN LỚP DỮ LIỆU TRONG DỰ ĐOÁN KẾT QUẢ TỐT NGHIỆP CỦA HỌC SINH TẠI TRƯỜNG THPT HOẰNG HOÁ LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN Chun ngành: Khoa học máy tính Mã số: 8.48.01.01 Người hướng dẫn khoa học: TS Nguyễn Thế Cường THANH HÓA, NĂM 2020 i ii LỜI CAM ĐOAN Tôi xin cam đoan luận văn “ Nghiên cứu áp dụng kỹ thuật phân lớp liệu dự đoán kết tốt nghiệp học sinh trường THPT Hoằng Hố 2.” cơng trình nghiên cứu cá nhân hướng dẫn TS Nguyễn Thế Cường, trung thực không chép tác giả khác Trong toàn nghiên cứu luận văn, vấn đề trình bày tìm hiểu nghiên cứu cá nhân tơi trích dẫn từ nguồn tài liệu có ghi tham khảo rõ ràng, hợp pháp Tôi xin chịu trách nhiệm hình thức kỷ luật theo quy định cho lời cam đoan Thanh Hóa, ngày tháng năm 2020 Người cam đoan Lê Thị Hoài Thu ii iii LỜI CẢM ƠN Luận văn “ Nghiên cứu áp dụng kỹ thuật phân lớp liệu dự đoán kết tốt nghiệp học sinh trường THPT Hoằng Hố 2.” hồn thành khơng nhờ nỗ lực cá nhân tác giả mà có trợ giúp, giúp đỡ từ nhiều tập thể cá nhân Trước hết, tác giả xin chân thành cảm ơn tất thầy giáo, cô giáo Khoa Công nghệ thông tin & Truyền thông, Trường Đại học Hồng Đức nhiệt tình giảng dạy, bảo, tạo điều kiện thuận lợi cho tác giả q trình học tập, nghiên cứu, hồn thành chương trình học tập khóa học Đặc biệt, tác giả bày tỏ lòng biết ơn sâu sắc đến thầy TS Nguyễn Thế Cường, thầy hướng dẫn trực tiếp luận văn tác giả dành thời gian bảo tận tình giúp tác giả hoàn thành luận văn Tác giả xin cảm ơn gia đình, bạn bè, đồng nghiệp, động viên tiếp thêm nghị lực để tác giả hoàn thành khóa học luận văn Mặc dù có nhiều cố gắng, song luận văn khó tránh khỏi thiếu sót Tác giả mong bảo, góp ý nhà khoa học, thầy cô giáo đồng nghiệp Xin trân trọng cảm ơn! iii iv MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC TỪ VIẾT TẮT vi DANH MỤC CÁC BẢNG vii DANH MỤC CÁC HÌNH viii MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nhiệm vụ nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Kết đạt Ý nghĩa khoa học thực tiễn Bố cục luận văn Chương 1: KHAI PHÁ DỮ LIỆU TRONG GIÁO DỤC 1.1 Tổng quan khai phá liệu 1.1.1 Khái niệm khai phá liệu 1.1.2 Quá trình khai phá liệu 1.1.3 Các kỹ thuật khai phá liệu 11 1.1.4 Khai phá liệu định 22 1.1.5 Những thách thức khai phá liệu 35 1.2 Khai phá liệu giáo dục 36 1.3 Tổng kết chương 38 Chương 2: BÀI TOÁN DỰ ĐOÁN KẾT QUẢ TỐT NGHIỆP TẠI TRƯỜNG THPT HOẰNG HÓA 39 2.1 Giới thiệu trường THPT Hoằng Hóa 39 2.2 Công tác tuyển sinh vào 10 40 2.3 Phương pháp xét tốt nghiệp năm 2019 41 iv v 2.4 Công tác đánh giá chất lượng giáo dục hàng năm 42 2.4.1 Mục tiêu đánh giá chất lượng giáo dục 42 2.4.2 Các yếu tố ảnh hưởng đến chất lượng đào tạo: 43 2.5 Vấn đề trợ giúp dự đoán tốt nghiệp: 45 2.6 Tổng kết chương 46 Chương 3: XÂY DỰNG MƠ HÌNH HỖ TRỢ DỰ BÁO KẾT QUẢ TỐT NGHIỆP 47 3.1 Ứng dụng định 47 3.1.1 Lượng hóa phân tích liệu để đưa vào thuật toán C4.5 47 3.1.2 Thu thập liệu học tập người học 49 3.2 Xây dựng mơ hình hỗ trợ định dựa phần mềm WEKA 55 3.2.1 Các tính Weka 56 3.2.2 Trích chọn thuộc tính 57 3.2.3 Xây dựng liệu huấn luyện sử dụng WEKA 59 3.3 Tổng kết chương 67 KẾT LUẬN 68 Kết đạt 68 Hạn chế 68 Hướng phát triển 68 TÀI LIỆU THAM KHẢO 70 v vi DANH MỤC CÁC TỪ VIẾT TẮT TIẾNG VIỆT KPDL Khai phá liệu THPT Trung học phổ thông CSDL Cơ sở liệu TIẾNG ANH NN Neural Network NB Naive Bayes ANN Artificial neural network vi vii DANH MỤC CÁC BẢNG Bảng 1: Các dòng liệu kết thi đầu vào học sinh khóa 2016-2019 Trường THPT Hoằng Hóa 50 Bảng 2: Các dòng liệu kết học tập năm lớp 11 học sinh khóa 2016-2019 Trường THPT Hoằng Hóa 51 Bảng 3: Các dòng liệu kết học kỳ lớp 12 học sinh khóa 2016-2019 Trường THPT Hoằng Hóa 52 Bảng 4: Bảng liệu kết học tập học sinh khóa 2016-2019 53 Bảng 5: Bảng liệu thu nhận sau mã hóa 55 vii viii DANH MỤC CÁC HÌNH Hình 1: Các giai đoạn khai phá liệu 10 Hình 2: Cơng cụ ArffViewer cho phép chuyển đổi tệp liệu từ csv thành arff 59 Hình 3: Dữ liệu đọc ArffViewer 60 Hình 4: Phân bố giá trị thuộc tính Tiêu chí kết học tập lớp 11 62 Hình 5: Phân bố giá trị thuộc tính Tiêu chí kết Đầu vào cấp 63 Hình 6: Phân bố giá trị thuộc tính Tiêu chí giới tính học sinh 63 Hình 7: Phân bố giá trị thuộc tính Tiêu chí kết học tập kỳ lớp 1263 Hình 8: Kết đánh giá theo phương pháp K-folds (K=10) 64 Hình 9: Kết đánh giá theo phương pháp Percentage Split 65 Hình 10: Mơ hình định sử dụng để đánh giá chất lượng thi tốt nghiệp học sinh THPT Hoằng Hóa 66 viii MỞ ĐẦU Lý chọn đề tài Trường THPT Hoằng Hóa thành lập từ năm 1967, nhằm đào tạo bồi dưỡng nguồn nhân lực cho 17 xã phía bắc huyện Hoằng Hóa Qua q trình phát triển, hàng năm, nhà trường tuyển sinh 27 lớp công lập với khoảng 1300 học sinh Để đạt thành tựu nhờ quan tâm, đạo sát Ủy ban nhân dân tỉnh Thanh Hóa, phấn đấu khơng ngừng tập thể lãnh đạo, giáo viên, cán bộ, nhân viên Trường THPT Hoằng Hóa suốt năm tháng qua Cùng với tình hình nước, chất lượng giáo dục ln vấn đề nóng tồn xã hội, trường thpt Hoằng Hóa ln quan tâm sát đến chất lượng giáo dục Chất lượng giáo dục đánh giá từ nhiều mặt, đó, đánh giá từ kết học tập học sinh quan trọng Bên cạnh đó, việc kiểm tra đánh giá khơng mục đích đánh giá kết q trình học người học mà cịn nguồn thơng tin phản hồi, giúp người thầy nắm chất lượng, phương pháp giảng dạy, để từ có điều chỉnh thích hợp cho cơng tác giảng dạy Ngày nay, sống kỷ bùng nổ khoa học công nghệ mà đặc biệt phát triển vượt bậc công nghệ thông tin Công nghệ thông tin việc ứng dụng công nghệ thông tin nhiều lĩnh vực đời sống, kinh tế xã hội nhiều năm qua đồng nghĩa với lượng liệu quan thu thập lưu trữ ngày tích lũy nhiều lên Bên cạnh đó, thiết bị thu thập liệu tự động tương đối phát triển tạo kho liệu khổng lồ, liệu ngân hàng, hàng không, giáo dục Cùng với phát triển mạnh mẽ công nghệ, thiết bị lưu trữ thiết bị thu thập thông tin tự động cho phép xây dựng hệ thống thông tin có khả tự động hóa ngày cao Vấn đề đặt làm để xử lý khối lượng thông tin cực lớn để phát tri thức tiềm ẩn khối liệu khổng lồ? Hiện trường Trung học phổ thơng, việc tính tốn lưu trữ điểm học sinh tiến hành đặn vào cuối học kỳ Công việc chủ yếu dùng để đánh giá học lực học sinh theo qui định Bộ Giáo Dục & Đào Tạo, đánh giá tương đối xác học lực học sinh, kết chất lượng đào tạo trường thể qua tỉ lệ phần trăm thống kê từ bảng điểm tổng kết Đánh giá chất lượng giáo dục công việc mà ngành giáo dục quan tâm Các phương pháp đánh giá truyền thống có nhiều ý kiến cho chưa chặt chẽ kết học tập, rèn luyện học sinh Nếu đưa phương pháp cho phép cung cấp thông tin giúp cho việc đánh giá dự đoán kết giáo dục chặt chẽ đạt độ tin cậy cao tính toán khoa học giúp đỡ cho nhà quản lý nhiều việc hoạch định chiến lược giáo dục tương lai Đây nhu cầu thiết thực nhà trường Từ lý xu hướng tất yếu, chọn đề tài “Nghiên cứu áp dụng kỹ thuật phân lớp liệu dự đoán kết tốt nghiệp học sinh trường THPT Hoằng Hoá 2” để làm luận văn thạc sĩ Mục tiêu nhiệm vụ nghiên cứu Xây dựng áp dụng hiệu hệ hỗ trợ định công tác giáo dục, đào tạo thpt Hoằng Hóa Để thực mục đích ý tưởng đề tài, cần nghiên cứu tiến hành triển khai nội dung: Tìm hiểu, phân tích thực trạng học sinh qua điểm đầu vào tuyển sinh 10, điểm tổng kết học kì năm để đề giải pháp hợp lý việc xây dựng triển khai hệ thống Nghiên cứu tài liệu thuật toán liên quan đến định, phân tích, đánh giá lựa chọn để triển khai áp dụng thuật tốn vào hệ thống dự đốn tốt nghiệp Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: + Học sinh khóa 2016 – 2019 58 liệu triển khai mơ hình khai phá liệu Một vấn đề gặp phải dataset dùng để xây dựng Data mining Models thường chứa nhiều thông tin không cần thiết cho việc xây dựng mơ hình Chẳng hạn, dataset gồm hàng trăm thuộc tính dùng để mơ tả khách hàng doanh nghiệp thu thập, nhiên xây dựng Data mining model cần khoảng 50 thuộc tính từ hàng trăm thuộc tính Nếu ta sử dụng tất thuộc tính (hàng trăm) khách hàng để xây dựng mơ hình ta cần nhiều CPU, nhiều nhớ trình Training model, chí thuộc tính khơng cần thiết làm giảm độ xác mơ hình gây khó khăn việc phát tri thức Các phương pháp trích chọn thuộc tính thường tính trọng số (score) thuộc tính sau chọn thuộc tính có trọng số tốt để sử dụng cho mơ hình Các phương pháp cho phép bạn hiệu chỉnh ngưỡng (threshold) để lấy thuộc tính có Score ngưỡng cho phép Q trình trích chọn thuộc tính ln thực trước q trình Training Model Có nhiều phương pháp để lựa chọn thuộc tính tùy thuộc vào cấu trúc liệu dùng cho mơ hìnhvà thuật tốn dùng để xây dựng mơ hình Sau số phương pháp phổ biến dùng trích chọn thuộc tính: - Interestingness score: Được sử dụng để xếp hạng (rank) thuộc tính thuộc tính có kiểu liệu liên tục (continuous) - Shannon's Entropy: Được sử dụng liệu kiểu rời rạc (discretized data) Ngoài cịn có số phương pháp khác thường sử dụng lựa chọn thuộc tính Bayesian with K2 Prior, Bayesian Dirichlet Equivalent with Uniform Prior 58 59 3.2.3 Xây dựng liệu huấn luyện sử dụng WEKA Dữ liệu lưu dạng xlsx chuyển đổi thành định dạng csv để thuận lợi cho việc tạo tệp arff loại định dạng dùng WEKA Sau chuyển đổi thành định dạng ARFF, công cụ ArffViewer cung cấp WAKA Hình 2: Cơng cụ ArffViewer cho phép chuyển đổi tệp liệu từ csv thành arff 59 60 Hình 3: Dữ liệu đọc ArffViewer Sau liệu lưu dạng arff Tên tệp liệu @relation TRAIN_DATA_FINAL Danh sách thuộc tính giá trị thuộc tính rời rạc hóa @attribute GIOI_TINH {NU,NAM} @attribute DAU_VAO {KHA,TB,KEM} @attribute LOP_11 {GIOI,KHA,TB,YEU} @attribute KY_1_LOP_12 {GIOI,KHA,TB} @attribute TOT_NGHIEP {GIOI,KHA,TB,YEU} Dữ liệu sử dụng xây dựng định @data NU,KHA,GIOI,GIOI,GIOI 60 61 NU,KHA,KHA,GIOI,KHA NU,TB,GIOI,GIOI,KHA NU,KHA,GIOI,GIOI,KHA NU,KHA,GIOI,GIOI,KHA NAM,KHA,GIOI,GIOI,GIOI NU,KHA,KHA,KHA,KHA NU,KHA,GIOI,GIOI,KHA NU,KHA,GIOI,GIOI,GIOI NU,KHA,GIOI,KHA,KHA NU,KHA,GIOI,GIOI,GIOI NU,KHA,KHA,GIOI,KHA NU,KHA,KHA,GIOI,KHA NU,TB,GIOI,GIOI,KHA NU,TB,KHA,KHA,KHA NU,TB,GIOI,GIOI,KHA Như thấy trên, tập tin ARFF gồm 02 phần riêng biệt Phần thứ gọi phần mơ tả Nó chứa thơng tin về: tên quan hệ, thuộc tính quan hệ dạng liệu thuộc tính Phần thứ hai phần liệu Nó bắt đầu với từ khóa “@data” dịng riêng biệt Sau thể (instance) thể dịng Giá trị thuộc tính thể phân cách dấu “,” Giá trị thuộc tính xuất theo thứ tự khai báo phần mô tả Các giá trị bị thiếu thể “?” Tên quan hệ khai báo dòng tập tin với cú pháp: @relation Một thuộc tính khai báo với cú pháp: @attribute 61 62 Tên quan hệ tên thuộc tính chuỗi ký tự không bắt đầu ký tự đặc biệt “{”, “}”, “,”, “%” đặt dấu nháy đơn nêu chứa khoảng trắng Tập tin ARFF định nghĩa thuộc tính theo kiểu chính: - Thuộc tính dạng số: @attribute math numeric - Thuộc tính dạng chuỗi: @attribute sentence string - Thuộc tính định danh: @attribute name {,,} - Thuộc tính dạng ngày tháng: @attribute birthday date "", định dạng ngày theo tiêu chuẩn ISO-8601 Ví dụ “yyyy-MM-dd HH:mm:ss” Đối với liệu đầu vào, cần lưu ý với thuộc tính có giá trị “0” thuộc tính chưa có giá trị (missing value) Thuộc tính có giá trị “0” khơng phải thuộc tính chưa có giá trị Những thuộc tính chưa có giá trị cần thể cách rõ ràng dấu “?” Hình 4: Phân bố giá trị thuộc tính Tiêu chí kết học tập lớp 11 62 63 Hình 5: Phân bố giá trị thuộc tính Tiêu chí kết Đầu vào cấp Hình 6: Phân bố giá trị thuộc tính Tiêu chí giới tính học sinh Hình 7: Phân bố giá trị thuộc tính Tiêu chí kết học tập kỳ lớp 12 63 64 Sau tác giả sử dụng phân lớp J48 (là phiên C4.5 cài đặt WEKA) để thực việc kiểm thử tập liệu xây dựng Kết đánh giá mơ hình cho kết độ xác 77,05% lựa chọn chia tập liệu thành phần liệu huấn luyện 66% liệu test 34% Đối với việc đánh giá mơ hình theo phương pháp K-folds (k=10), kết đánh giá 75,98% Hình 8: Kết đánh giá theo phương pháp K-folds (K=10) 64 65 Hình 9: Kết đánh giá theo phương pháp Percentage Split Với mơ hình liệu xây dựng, ta có định sử dụng để chẩn đốn kết thi tốt nghiệp học sinh trường THPT Hoằng Hóa thể Hình 10 Trong mơ hình định xây dựng, ta thấy thuộc tính GIOI_TINH (Giới tính) khơng đưa vào định Giải thích cho vấn đề việc giá trị thuộc tính khơng đóng vai trò việc đưa định kết học tập tốt nghiệp học sinh trường THPT Hoằng Hóa Thuộc tính có ý nghĩa việc định kết tốt nghiệp kết thi đầu vào cấp nhà trường Có thể xem kết đầu vào thể kết thức sở học sinh Sau thuộc tính kết học kỳ lớp 12 Kết đóng góp vào việc định xem kết thi tốt nghiệp học sinh 65 66 Hình 10: Mơ hình định sử dụng để đánh giá chất lượng thi tốt nghiệp học sinh THPT Hoằng Hóa Tác giả thực nhiều tập liệu có kích thước khác nhằm đánh giá độ xác định việc dự đoán kết tốt nghiệp học sinh trường Hoằng Hóa Kết sau: Kích thước K-folds Percentage split (Bản ghi) (%) (%) 100 85 91.17 200 83 82.35 300 73.33 71.57 400 79 75.73 500 79.4 74.11 STT Kết đánh giá cho thấy độ xác giảm số lượng ghi tập huấn luyện tăng lên Tuy nhiên độ xác gần hội tụ khoảng 75-79% Điều cho thấy kích thước liệu huấn luyện không ảnh 66 67 hưởng nhiều đến độ xác định Việc độ xác đạt 91% trường hợp số ghi (100) liệu huấn luyện liệu dùng để kiểm tra tương đối giống nhau, nói cách khác định nhớ liệu Tuy nhiên độ xác đạt 75% cho phép có sở để xây dựng sách, kế hoạch nâng cao chất lượng đào tạo nhằm nâng cao chất lượng tốt nghiệp học sinh 3.3 Tổng kết chương Trong chương này, tác giả trình bày việc ứng dụng phần mềm Weka vào việc xây dựng định từ tạo tập luật thử nghiệm công tác định, dựa sở liệu tuyển sinh phân tích, thiết kế, xây dựng Tiến hành phân tích, nghiên cứu, tìm hiểu bước, quy trình cơng việc dự đốn kết thi tốt nghiệp học sinh thực tế ứng dụng máy tính vào việc tư vấn cho học sinh cách thức học tập Nắm phương pháp mơ hình khai phá liệu, áp dụng để giải yêu cầu toán đặt Cụ thể nghiên cứu vận dụng thuật toán C4.5 xây dựng Cây định để khai phá liệu công việc hỗ trợ dự đoán kết tốt nghiệp học sinh 67 68 KẾT LUẬN Kết đạt * Về mặt khoa học Luận văn tiến hành phân tích, tìm hiểu quy trình đánh giá chất lượng học tập học sinh trường THPT, phát vấn đề hạn chế để đề xuất với ban giám hiệu nhằm có phương án khắc phục để nâng cao hiệu công tác giáo dục Nắm phương pháp mơ hình tốn học, áp dụng để giải u cầu luận văn đặt Nghiên cứu vận dụng giải thuật C4.5 để xây dựng mơ hình dự đoán định * Về mặt thực tiễn Luận văn nêu giải pháp kỹ thuật để xây dựng hệ thống dự đoán tốt nghiệp học sinh THPT Xây dựng ứng dụng có khả phân tích tốt liệu kết học tập học sinh năm qua, từ thầy lãnh đạo nhà trường có hướng giải pháp dạy học phù hợp cho học sinh trước thi tốt nghiệp Hạn chế Tuy nhiên, hạn chế kết : Hệ thống xây dựng mang tính hỗ trợ chính; Mặt khác, nhiều yếu tốt ảnh hưởng đến chất lượng giáo dục mà liệu training thể hết được, dẫn đến kết chưa theo mong muốn Hiện tại, hệ thống chạy thử nghiệm với phạm vi hẹp Hướng phát triển 68 69 Cài đặt phần mềm hồn chỉnh cách sử dụng tính Weka để xây dựng công cụ dự đốn kết tốt nghiệp học sinh Cơng cụ xây dựng cần tiếp tục thử nghiệm Học viên xác định cần hoàn thiện ứng dụng để mở rộng thêm nhu cầu thực tế, từ kết học tập học sinh tiếp tục tư vấn khối thi Đại học , Cao đẳng cho học sinh Đồng thời cần cải thiện phần mềm, giao diện thân thiện gần gũi hơn….; kết tính tốn cần đáp ứng yêu cầu độ xác cao Học viên công tác sở giáo dục, ln nhận thức vai trị ứng dụng công cụ công nghệ thông tin truyền thông để tin học hóa cơng tác quản lí Học viên cố gắng tìm hiểu nghiên cứu vận dụng thuật toán cải tiến để nâng cao hiệu suất tăng cường độ tối ưu, từ hồn thiện hệ thống để hệ thống mang tính ứng dụng độ xác cao 69 70 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Trần Tuấn Anh (2016), Xây dựng mơ hình dự báo kết học tập sinh viên trường đại học Đồng Tháp, Luận văn thạc sĩ, Học viện cơng nghệ bưu viễn thơng, Thành phố Hồ Chí Minh [2] Đồn Văn Ban, Lê Mạnh Thạnh, Lê Văn Tường Lân (2007), Một cách chọn mẫu huấn luyện thuật toán học để xây dựng định khai phá liệu, Tạp chí Tin học Điều khiển học (Số 4) [3] Vũ Ca Giáp (2012), Xây dựng hệ trợ giúp định công tác tuyển sinh đại học hệ từ xa viện đại học mở Hà Nội, Luận văn thạc sĩ kỹ thuật, Đại học Đà Nẵng, Đà Nẵng [4] Giang Thị Thu Huyền (2010), Nghiên cứu luật kết hợp song song khai phá liệu, Luận văn thạc sĩ, Đại học công nghệ, Hà Nội [5] Nguyễn Đăng Hiệp (2017), Nghiên cứu hệ thống trợ giúp định tư vấn nghề nghiệp cho học sinh trung học phổ thông, Luận văn thạc sĩ, Đại học dân lập Hải Phịng, Hải Phịng [6] Hồng Kiếm, Đỗ Phúc (2005), Giáo trình khai phá liệu, Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh [7] Nguyễn Thái Nghe (2020), Ứng dụng kỹ thuật khai phá liệu hỗ trợ sinh viên lập kế hoạch học tập, https://www.researchgate.net/publication/309856233 [8] Huỳnh Lý Thanh Nhàn (2013), Hệ thống dự đoán kết gợi ý lựa chọn môn học dùng giải thuật phân rã ma trận, Luận văn thạc sĩ công nghệ thông tin, Đại học Cần Thơ, Cần Thơ [9] Nguyễn Thị Hữu Phương, Đặng Văn Đức, Nguyễn Trường Xuân (2017), Khai phá liệu Lidar nghiên cứu đối tượng bề mặt địa hình, Kỷ yếu Hội nghị Quốc gia lần thứ X Nghiên cứu 70 71 ứng dụng Công nghệ thông tin (FAIR), Đà Nẵng [10] Nguyễn Nhật Quang (2010), Bài giảng Khai phá liệu, Viện Công nghệ thông tin truyền thông, Đại học bách khoa Hà Nội, Hà Nội [11] Nguyễn Thị Thu Trang (2008), Khai phá liệu phát luật kết hợp ứng dụng kho liệu ngân hàng, Luận văn thạc sĩ, Đại học công nghệ, Hà Nội [12] Phan Quang Thái (2012), Xây dựng hệ trợ giúp định công tác quy hoạch cán bộ, lãnh đạo, quản lí tỉnh Bình Định, Luận văn thạc sĩ, Đại học Đà Nẵng, Đà Nẵng [13] Phạm Thị Như Trang (2013), Khai phá liệu điểm để dự đoán kết học tập sinh viên trường cao đẳng sư phạm Hà Nội, Đại học công nghệ, Hà Nội [14] Đặng Xuân Thọ (2020), Bài giảng Khai phá liệu, Đại học sư phạm Hà Nội, Hà Nội [15] Hà Quang Thụy (2018), Bài giảng Khai phá liệu, Đại học công nghệ, Hà Nội [16] Nguyễn Thị Thanh Thủy (2012), Ứng dụng khai phá liệu xây dựng cơng cụ dự đốn kết học tập sinh viên, Tuyển tập báo cáo hội nghị sinh viên nghiên cứu khoa học lần thứ Đại học Đà Nẵng, Đại học Đà Nẵng, Đà Nẵng [17] Nguyễn Đặng Thế Vinh (2014), Ứng dụng khai phá liệu chọn ngành nghề cho học sinh THPT, Luận văn thạc sĩ, Đại học quốc tế Hồng Bàng, Thành phố Hồ Chí Minh [18] Đàng Quang Vương (2017), Xây dựng hệ thống trợ giúp hướng nghiệp cho học sinh trung học phổ thông, Luận văn thạc sĩ, Đại học Lạc Hồng, Đồng Nai 71 72 Tiếng Anh [19] C Heiner, N Heffernan, T Barnes(2007), Educational Data Mining, In Supplementary Proceedings of the 13th International Conference of Artificial Intelligence in Education (AIED) [20] Jiawei Han and Micheline Kamber(2011), Data Mining: Concepts and Techniques, 3rd Edition, Morgan Kaufmann Publishers [21] Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth (1996), From Data Mining to Knowledge Discovery in Databases, AAAI Press 72