Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 112 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
112
Dung lượng
2,06 MB
Nội dung
- ĐẠI HỌC HUẾ Formatted: Font: Times New Roman Bold, Bold ĐẠI HỌC KINH TẾ HUẾ KHOA HỆ THỐNG THÔNG TIN KINH TẾ ́ uê - - in h tê ́H Formatted: Font: Times New Roman Bold, Bold ̣c K KHÓA LUẬN TỐT NGHIỆP Formatted: Indent: Left: 0", First line: 0" ho Ứng dụng khai phá liệu để dự báo điểm chuyên ngành sinh viên chuyên ngành Tin học Kinh tế ại Trường Đại học Kinh tế Huế XÂY DỰNG MƠ HÌNH PHÂN Đ LỚP DỰ BÁO KẾT QUẢ HỌC TẬP SINH VIÊN CHUYÊN NGÀNH TIN HỌC Formatted: Font: Times New Roman, Font color: Auto Tr ươ ̀n g KINH TẾ ĐẠI HỌC KINH TẾ HUẾ Formatted: Indent: Left: 0", First line: 0" Formatted: Centered TRƯƠNG VĂN QUỐC ANH Formatted: Font: 16 pt - Formatted: Font: pt ́ Tr ươ ̀n g Đ ại ho ̣c K in h tê ́H uê KHĨA HỌC: 2014-2018 - Khóa luận tốt nghiệp Formatted: Font: pt ĐẠI HỌC HUẾ Formatted: Centered ĐẠI HỌC KINH TẾ HUẾ Formatted: Left: 1.18", Right: 0.79", Top: 1.18", Bottom: 1.18", Width: 8.27", Height: 11.69", Header distance from edge: 0.79", Footer distance from edge: 0.79" KHOA HỆ THỐNG THÔNG TIN KINH TẾ - - ́ uê Formatted: Font: Times New Roman Bold, Bold ́H Formatted: Space After: pt, Line spacing: 1.5 lines h tê Formatted: Font: Times New Roman Bold, Bold Formatted: Font: Times New Roman Bold, Bold Formatted: Font: Times New Roman Bold, Bold in Formatted: Space After: pt Formatted: Centered, Space After: pt ̣c K Formatted KHÓA LUẬN TỐT NGHIỆP [1] ho Formatted: Space After: pt XÂY Ứng dụng khai phá liệu để dự báo điểm chuyên Formatted [2] Formatted [3] Formatted: Font: 17 pt, Bold Formatted: Line spacing: 1.5 lines ngành ại Formatted: Font: 17 pt, Bold sinh viên chuyên ngành Tin học Kinh tế Đ Formatted: Font: 17 pt, Bold Trường Đại học Kinh tế Huế DỰNG MƠ HÌNH MẠNG Formatted: Font: Times New Roman PHÂN LỚPNƠ RON DỰ BÁO KẾT QUẢ HỌC TẬP SINH Formatted: Font: Times New Roman g Formatted: Font: 17 pt, Bold ươ ̀n Formatted: Font: 17 pt, Bold VIÊN CHUYÊN NGÀNH TIN HỌC Formatted: Font: Times New Roman KINH TẾ ĐẠI HỌC KINH TẾ HUẾ Formatted: Font: 17 pt, Bold Tr Formatted: Font: Times New Roman Formatted: Font: 17 pt, Bold Formatted: Font: Times New Roman Sinh viên thực hiện: Giảng viên hướng dẫn: Trương Văn Quốc Anh Th.S Mai Thu Giang Lớp: K48B THKT Formatted [4] Formatted [5] Formatted [6] Formatted: Justified Formatted Table - Khóa luận tốt nghiệp Niên khóa: 2010-2014 Formatted: Justified Formatted: Font: Times New Roman Bold Formatted: Centered, Space After: pt, Line spacing: 1.5 lines Giảng viên hướng dẫn: Sinh viên thực hiện: Th.S Mai Thu Giang Trương Văn Quốc Anh ́ uê Lớp: K48B THKT Formatted: Justified, Indent: Left: 0.39", First line: 0", Line spacing: 1.5 lines, Tab stops: Not at 5.29" Formatted: Font: Times New Roman Bold, Bold h tê ́H Niên khóa: 2010-2014 Formatted: Indent: First line: 0", Space After: pt, Line spacing: 1.5 lines in Huế, 2018 Formatted: Font: Times New Roman Bold, 20 pt, Bold Tr ươ ̀n g Đ ại ho ̣c K Formatted: Font: Times New Roman Bold, Bold - Khóa luận tốt nghiệp ́ Tr ươ ̀n g Đ ại ho ̣c K in h tê ́H uê Formatted: Space After: pt, Line spacing: 1.5 lines i - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Times New Roman, 14 pt Lời Cảm Ơn Formatted: Font: Bold Formatted: Font: Bold Formatted: Font: 26 pt, Font color: Red ́ Formatted: Font: UTM Aristote, 26 pt, Font color: Red Formatted: Left: 1.18", Right: 0.79", Top: 1.18", Bottom: 1.18", Width: 8.27", Height: 11.69", Header distance from edge: 0.79", Footer distance from edge: 0.79", Not Different first page header h tê ́H Em xin gửi lời cảm ơn chân thành đến thạc sĩ Mai Thu Giang, tận tình truyền dạy kinh nghiệm kiến thức quý báu hỗ trợ em suốt trình làm thực đề tài Cô giúp đỡ em nhiều từ việc lên ý tưởng đề tài ban đầu hướng dẫn thực đề tài sau góp ý để đề tài hồn thành tốt Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) uê Lời đầu tiên, em xin gửi lời cảm ơn sâu sắc đến quý thầy cô giáo trường Đại học Kinh tế Huế đặc biệt quý thầy cô Khoa Hệ thống Thông tin Kinh tế truyền dạy cho em nhiều kiến thức kinh nghiệm quý báu suốt trình học tập trường tạo điều kiện hỗ trợ cho em hoàn thành đề tài ̣c K in Em xin gửi lời cảm ơn đến phòng Đào tạo Đại học cung cấp sở liệu ban đầu điều kiện thuận lợi khác để em hoàn thành tốt đề tài ho Cuối em xin gửi lời cảm ơn chân thành đến bố mẹ, người thân bạn bè khích lệ động viên em suốt thời gian qua để em hồn thành tốt đề tài Đ ại Mặc dù có nhiều cố gắng, thời gian, kĩ thân cịn nhiều hạn chế nên khơng thể tránh khỏi sai sót, mong q thầy, bạn đóng góp, bảo để đề tài hồn thiện Huế, năm 2018 Sinh viên Tr ươ ̀n g Em xin chân thành cảm ơn! i Formatted: Font color: Custom Color(RGB(0,0,204)) Formatted: Font: Bold, Font color: Custom Color(RGB(0,0,204)) Formatted: Font: Bold, Font color: Custom Color(RGB(0,0,204)) Formatted: Font: Bold, Font color: Custom Color(RGB(0,0,204)) - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold MỤC LỤC Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) LỜI CẢM ƠN i Formatted: Font: Times New Roman, 14 pt MỤC LỤC ii Formatted: Font: Bold DANH MỤC HÌNH VẼ viiiiv Formatted: Font: Times New Roman, 14 pt, Bold ́ MỤC LỤC Formatted: Ml, Justified, Line spacing: 1.5 lines, Tab stops: 6.3", Right,Leader: … ́H DANH MỤC HÌNH VẼ uê DANH MỤC BẢNG BIỂU xxvi Formatted: Ml, Left, Line spacing: 1.5 lines Formatted: Font: 14 pt, Font color: Auto DANH MỤC BẢNG BIỂU tê PHẦN I ĐẶT VẤN ĐỀ .1 Lí chọn đề tài h Mục tiêu nghiên cứu 212 in Đối tượng nghiên cứu 212 ̣c K Phạm vi nghiên cứu Phương pháp nghiên cứu 32 Cấu trúc khóa luận 323 ho PHẦN II NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU 54 CHƯƠNG CƠ SỞ LÝ LUẬN 54 ại 1.1 Tổng quan khai phá liệu 54 Đ 1.1.1 Khái niệm 54 1.1.2 Quá trình khai phá liệu 54 g 1.2 Khai phá liệu giáo dục .65 ươ ̀n 1.3 Các phương pháp khai phá liệu 75 1.3.1 Mạng nơ ron (neural) 75 1.3.2 Cây định (J48) .1310 Tr 1.3.3 K - lân cận .1714 1.3.4 Support Vector Machine .191516 1.3.5 Naïve Bayes 2117 1.4 Đánh giá độ xác mơ hình phân lớp phương pháp K-fold cross validation 2218 1.5 Trích chọn thuộc tính khai phá liệu 2319 ii Formatted: Font: Times New Roman, 13 pt Formatted: Font: (Default) Times New Roman, 13 pt, Font color: Auto Formatted: Justified, Space After: pt, Line spacing: 1.5 lines Formatted: TOC 1, Justified, Line spacing: 1.5 lines, Tab stops: 6.29", Right,Leader: … Formatted: Font: 13 pt, Not Bold, Font color: Auto Formatted: Font: 13 pt, Not Bold, Check spelling and grammar - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Times New Roman, 14 pt 1.6 Phương pháp đánh giá .2420 Formatted: Font: Bold 1.6.1 Độ xác (Accuracy) 2420 Formatted: Font: Bold 1.6.2 Precision Recall 252021 Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) 1.6.3 Gain – Lift chart 262122 ́ 1.6.5 Receiver Operator Characteristic (ROC) 272223 ́H 1.7 Giới thiệu phần mềm Weka 282324 uê 1.6.4 Root Means Square Error 2622 1.7.1 Giới thiệu chung 282324 tê 1.7.2 Môi trường Explorer .292425 CHƯƠNG THỰC TRẠNGỔNG QUAN NGHIÊN CỨU KHAI PHÁ DỮ LIỆU Formatted: Justified, Space After: pt, Line spacing: 1.5 lines h GIÁO DỤC VÀ ĐỀ XUẤT MƠ HÌNH NGHIÊN CỨU ĐỐI VỚI TRƯỜNG ĐẠI in HỌC KINH TẾ HUẾ 322627 ̣c K 2.1 Các nghiên cứu liên quan 322627 2.2 Mơ tả tốn 423537 2.3 Quy trình nghiên cứu 463839 ho Error! Hyperlink reference not valid.2.4 Trích rút tiền xử lý liệu4639 Formatted: Justified, Indent: Left: 0", First line: 0", Space After: pt, Line spacing: 1.5 lines, Tab stops: 0.1", Left + 0.2", Left + 0.3", Left + 0.39", Left + 0.49", Left + 0.59", Left + 0.69", Left + 6.29", Right,Leader: … CHƯƠNG ỨNG DỤNG WEKA TRONG DỰ BÁO ĐIỂM CHUYÊN NGÀNH ại TIN HỌC KINH TẾ 503943 Đ 3.1 Mơ tả thí nghiệm 503943 3.2 Kết thí nghiệm 594647 g 3.3 Lưu sử dụng mơ hình dự báo .675455 ươ ̀n PHẦN III KẾT LUẬN VÀ ĐỀ XUẤT 7558 Kết luận 7558 Đề xuất phát triển 7659 Tr DANH MỤC TÀI LIỆU THAM KHẢO .7860 DANH MỤC HÌNH VẼ DANH MỤC BẢNG BIỂU PHẦN I ĐẶT VẤN ĐỀ Lí chọn đề tài Mục tiêu nghiên cứu iii Formatted: Justified, Space After: pt, Line spacing: 1.5 lines, Tab stops: 0.1", Left + 0.2", Left + 0.3", Left + 0.39", Left + 0.49", Left + 0.59", Left + 0.69", Left + 6.29", Right,Leader: … - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold Đối tượng nghiên cứu Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) Phạm vi nghiên cứu Formatted: Font: Times New Roman, 14 pt Phương pháp nghiên cứu Formatted: Font: Bold Cấu trúc khóa luận ́ CHƯƠNG CƠ SỞ LÝ LUẬN ́H 1.1 Tổng quan khai phá liệu uê PHẦN II NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU 1.1.1 Khái niệm tê 1.1.2 Quá trình khai phá liệu 1.2 Khai phá liệu giáo dục h 1.3 Các phương pháp khai phá liệu in 1.3.1 Mạng nơ ron (neural) ̣c K 1.3.2 Cây định (J48) 14 1.3.3 K - lân cận 18 1.3.4 Support Vector Machine .19 ho 1.3.5 Naïve Bayes 21 1.4 Đánh giá độ xác mơ hình phân lớp phương pháp K-fold cross ại validation .22 Đ 1.5 Trích chọn thuộc tính khai phá liệu 23 1.6 Phương pháp đánh giá 24 g 1.6.1 Độ xác (Accuracy) 24 ươ ̀n 1.6.2 Precision Recall 24 1.6.3 Gain – Lift chart 26 1.6.4 Root Means Square Error .26 Tr 1.6.5 Receiver Operator Characteristic (ROC) 27 1.7 Giới thiệu phần mềm Weka 28 1.7.1 Giới thiệu chung 28 1.7.2 Môi trường Explorer .29 iv - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold CHƯƠNG THỰC TRẠNG NGHIÊN CỨU KHAI PHÁ DỮ LIỆU GIÁO DỤC VÀ Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) ĐỀ XUẤT MƠ HÌNH NGHIÊN CỨU ĐỐI VỚI TRƯỜNG ĐẠI HỌC KINH TẾ Formatted: Font: Times New Roman, 14 pt HUẾ 31 Formatted: Font: Bold 2.1 Các nghiên cứu liên quan 31 ́ 2.3 Quy trình nghiên cứu 43 ́H 2.4 Trích rút tiền xử lý liệu 44 uê 2.2 Mô tả toán 41 CHƯƠNG ỨNG DỤNG WEKA TRONG DỰ BÁO ĐIỂM CHUYÊN NGÀNH tê TIN HỌC KINH TẾ 47 3.1 Mơ tả thí nghiệm 47 h 3.2 Kết thí nghiệm 52 in 3.3 Lưu sử dụng mô hình dự báo .60 ̣c K PHẦN III KẾT LUẬN VÀ ĐỀ XUẤT 63 Kết luận .63 Đề xuất phát triển 64 ho DANH MỤC TÀI LIỆU THAM KHẢO 66 DANH MỤC HÌNH VẼ ại DANH MỤC BẢNG BIỂU Đ PHẦN I ĐẶT VẤN ĐỀ Lí chọn đề tài g Mục tiêu nghiên cứu ươ ̀n Đối tượng nghiên cứu Phạm vi nghiên cứu 5 Đối tượng điều tra kích thước mẫu Tr Phương pháp nghiên cứu Nội dung nghiên cứu PHẦN II NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU CHƯƠNG CƠ SỞ LÝ LUẬN 1.1 Tổng quan khai phá liệu 1.1.1 Khai phá liệu gì? v - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) Formatted: Font: Times New Roman, 14 pt Formatted: Font: Bold Formatted: Font: Bold ́ Đ ại ho ̣c K in h tê ́H uê Formatted: Font: 13 pt g Formatted: Font: 13 pt, Font color: Text ươ ̀n Formatted: Caption, Left, Indent: Left: 0", Line spacing: single Formatted: Font color: Text Formatted: Font: Bold Tr Formatted: Font: 13 pt, Bold, Check spelling and grammar Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold Hình - 11 Dùng mơ hình để dự báo cho liệu SVTH: Trương Văn Quốc Anh1 Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" 72 - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Times New Roman, 14 pt Formatted: Font: Bold Formatted: Font: Bold ́ ho ̣c K in h tê ́H uê Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) Formatted: Font: 13 pt, Font color: Text Hình - Thiết lập thông số ại Formatted: Caption, Left, Indent: Left: 0", Line spacing: single Formatted: Font color: Text ươ ̀n g Đ Formatted: Font: 13 pt Formatted: Font: Bold Tr Formatted: Font: 13 pt, Bold, Check spelling and grammar Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" SVTH: Trương Văn Quốc Anh1 73 B4: kích chuột phải lên - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Times New Roman, 14 pt tên mơ hình chọn Re-evaluate model on current test set để tiến hành dự báo Formatted: Font: Bold liệu Formatted: Font: Bold Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) Formatted: Font: Times New Roman, 13 pt, Font color: Auto ́ uê Formatted: Font color: Auto ươ ̀n g Đ ại ho ̣c K in h tê ́H Formatted: Font: 13 pt Formatted: Font: Bold Tr Formatted: Font: 13 pt, Bold, Check spelling and grammar Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" SVTH: Trương Văn Quốc Anh1 74 - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Times New Roman, 14 pt PHẦN III KẾT QUẢ NGHIÊN CỨU VÀ ĐỀ XUẤT Formatted: Font: Bold Formatted: Font: Bold PHẦN III KẾT LUẬN VÀ ĐỀ XUẤT Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) Kết nghiên cứuluận Formatted: Font color: Auto báo xác Sử dụng sở liệu điểm để tiến hành xử lý khai phá tìm tri Formatted: Centered, Space Before: pt, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left ́H thức cần thiết Formatted: Centered, Space Before: pt, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left ́ kỹ thuật phân lớp đến tiến hành trích chọn thuộc tính quan trọng để cải thiện tỉ lệ dự uê Đề tàiLuận văn sâu tìm hiểu kỹ thuật khai phá liệu từ tê Với kết thu được, nhìn chung với nhóm học phần có độ xác Formatted: Font color: Auto nơ ron với độ xác cao 73.81% trước tiến hành trích chọn thuộc tính Formatted: Justified, Indent: Left: 0", First line: 0.39", Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left h 50% mơ hình định có độ xác cao lên tới 81.11% so với mạng in Sau trích chọn thuộc tính độ xác cao mơ hình mạng nơ ron ̣c K cải thiện với 81.97%, nhiên nhỉnh lượng không đáng kể so với mơ hình định Vì đề tài đến kết luận nên áp dụng mơ hình định để dự báo kết cho học phần có độ xác 50% ho Đề tàiLuận văn vào ứng dụng thực tiễn, đưa cách xử lý áp dụng tri thức khai phá vào thực tế ại Về mặt lý thuyết, khóa luậnluận văn trình bày rõ cách thức ứng dụng khai phá liệu vào thực tế, từ thu thập liệu thơ ban đầu đến xử lý chuẩn hóa liệu cuối g thực tế thu thập Đ áp dụng kĩ thuật phân lớp để huấn luyện mơ hình dự báo dựa sở liệu ươ ̀n Về mặt thực tiễn, khóa luậnn văn đáp ứng mục tiêu đặt ban đầu, áp dụng kĩ thuật khai phá liệu cụ thể mơ hình mạng nơ ron định để đưa dự báo kết học tập cho sinh viên chuyên ngành Tin học Kinh tế, hỗ trợ cố vấn Tr học tập đưa tư vấn kịp thời cho sinh viên, từ sinh viên có hình thức thay đổi phương pháp học tập để đạt kết cao, hỗ trợ cho giảng viên môn nắm sinh viên có khả có kết học tập khơng cao để có phương pháp dạy học đặc biệt sinh viên Tuy nhiên, khóa luận tập trung nghiên cứu chuyên ngành Tin học Kinh tế Khoa Hệ thống Thông tin Kinh tế Bên cạnh đó, sở liệu thu thập SVTH: Trương Văn Quốc Anh1 75 Formatted: Font: Bold Formatted: Font: 13 pt, Bold, Check spelling and grammar Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold hạn chế, chưa bao quát hết dẫn đến tình trạng kết dự báo chưa cao Đặc biệt, Formatted: Font: Bold sở liệu tập trung vào thuộc tính điểm sinh viên Chưa thu thập Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) liệu có ảnh hưởng trực tiếp gián tiếp đến kết học tập sinh viên Formatted: Font: Times New Roman, 14 pt giới tính, thái độ học tập, truyền thống gia đình, nghề nghiệp đam mê,… ́ Khóa lLuận văn sử dụng hai mơ hình phân lớp mạng nơ ron ́H định để khai phá liệu điểm nhiên độ xác số học phần chưa cao uê Đề xuất phát triển Vì để bao qt khóat luậnn văn đề xuất sử dụng nhiều mơ hình phân lớp khác tê để tiện so sánh kết đưa chọn mơ hình phân lớp có tỉ lệ dự báo xác cao h Để đạt kết phân lớp cao hơn, cần có thời gian để sâu khai thác thêm in thuộc tính sinh viên như: thành phần gia đình, điểm thi môn đại học, ̣c K vùng miền sinh sống, sinh viên nguyện vọng hay nguyện vọng 2, giới tính, định hướng nghề nghiệp, đồn viên hay đảng viên chưa, … Hướng nghiên cứu tiếp theo: mở rộng nghiên cứu tất ngành đào ho tạo trường Đại học Kinh tế Huế, sử dụng thêm nhiều mơ hình phân lớp khác để so sánh đối chiếu kết Xây dựng phần mềm tư vấn học tập, đóng vai trị ại cố vấn học tập đưa tư vấn kịp thời đến sinh viên Đ Thu thập lượng mẫu lớn để cải thiện tỉ lệ dự báo xác cho mơ hình Phân tích, xếp hạng trường thuộc tính sở liệu thu thập được, từ g chọn trường thuộc tính đóng vai trị quan trọng tỉ lệ dự báo xác ươ ̀n mơ hình, đồng thời loại bỏ trường thuộc tính gây nhiễu hay làm giảm tỉ lệ dự báo xác mơ hình Ứng dụng thêm thuật tốn khác cắt tỉa chúng cho phù hợp với liểu Formatted: Font: Bold Formatted: Font: 13 pt, Bold, Check spelling and grammar Tr điểm thu thập Qua năm lượng liệu thu tăng theo, thiết nghĩ cần xây dựng Formatted: Font: Bold kho liệu điểm có quy tắc trật tự định, cho việc quản lý liệu Formatted: Font: Bold, Check spelling and grammar điểm trở nên dễ dàng Trong trường hợp cố vấn học tập muốn dự báo cho Formatted: Font: 13 pt, Bold trường hợp cụ thể dễ dàng trích xuất liệu cần thiết không cần phải Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" trải qua trình tiền xử lý trước tiến hành dự báo SVTH: Trương Văn Quốc Anh1 76 - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold Khóa luậnLuận văn nghiên cứu vấn đề dự báo điểm môn chuyên Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) ngành, có điều kiện tiếp tục phát triển dự báo thêm môn tự chọn hay Formatted: Font: Times New Roman, 14 pt dựa điểm môn đại cương để nhằm mục tiêu dự báo hay hỗ trợ việc sinh viên Formatted: Font: Bold thực chọn ngành học ́ ươ ̀n g Đ ại ho ̣c K in h tê ́H uê Formatted: Font: Times New Roman Bold Formatted: Font: Bold Tr Formatted: Font: 13 pt, Bold, Check spelling and grammar Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" SVTH: Trương Văn Quốc Anh1 77 - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold DANH MỤC TÀI LIỆU THAM KHẢO Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) DANH MỤC TÀI LIỆU THAM KHẢO Formatted: Font: Times New Roman, 14 pt Van Bien (2013) Quy trình Khai phá liệu (Process of Data mining) Formatted: Font: Times New Roman Bold, Font color: Auto (2016) Giới thiệu tổng quan Mạng Nơron nhân tạo (Artificial Neural Formatted: Font: Times New Roman Bold Network- ANN) Formatted: Centered, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left ́H Nguyễn Văn Chức (2011) Tổng quan Mạng Neuron (Neural Network) - ́ Formatted: Font: Bold uê (2018) Khai phá liệu Wikipedia tiếng Việt Formatted: Font: Times New Roman Bold, Font color: Auto tê BIS (2017) Cây định Wikipedia tiếng Việt, h TIẾP CẬN KÝ HIỆU: GIẢI THUẬT QUY NẠP CÂY QUYẾT ĐỊNH ID3 - Ông Xuân Hồng (2015) CayQuyetDinh_C45 in VOER Vu Tiep (2017) Support Vector Machine ̣c K Ông Xuân Hồng (2015) Scikit-learn: K-nearest neighbors Formatted: Font: 13 pt Formatted: Bibliography, Justified, Indent: First line: 0.39", Line spacing: 1.5 lines, Widow/Orphan control, Adjust space between Latin and Asian text, Adjust space between Asian text and numbers, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left ho 10 Ông Xuân Hồng (2015) Scikit-learn: Naive Bayes Classifier 11 Nguyễn Ngọc Diệp (2013) Các phương pháp đánh giá độ xác (trung ại bình) mơ hình phân lớp 12 Nguyễn Văn Chức (2011) Vấn đề trích chọn thuộc tính Khai phá Đ liệu - BIS 13 Ông Xuân Hồng (2015) Đánh giá mơ hình (Model evaluation) ươ ̀n g 14 Nguyễn Quang Nhật (2012) Gioi_thieu_WEKA 15 Phạm Thị Như Trang (2013) "Khai phá liệu điểm để dự đoán kết học tập Sinh viên trường Cao đẳng Sư phạm Hà Nội" Tr 16 Nguyễn Đăng Nhượng (2012) "Khai phá liệu kết học tập học sinh trƣờng Cao đẳng nghề Văn Lang Hà Nội" 17 Phạm Cẩm Vân (2012) "Ứng dụng khai phá liệu để tư vấn học tập trường cao đẳng kinh tế- Kỹ thuật Quảng Nam" 18 Phan Văn Dương (2012) "Luận văn Khai phá liệu ứng dụng tư vấn tuyển sinh trường cao đẳng nghề Trung Bộ" SVTH: Trương Văn Quốc Anh1 78 Formatted: Font: Bold Formatted: Font: 13 pt, Bold, Check spelling and grammar Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold 19 Nguyễn Đặng Thế Vinh (2014) " Ứng dụng khai phá liệu chọn ngành Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) nghề cho học sinh THPT" Formatted: Font: Times New Roman, 14 pt 20 Đỗ Thanh Nghị, Phạm Nguyên Khang, Nguyễn Minh Trung (2014) Formatted: Font: Bold "PHÁT HIỆN MÔN HỌC QUAN TRỌNG ẢNH HƯỞNG ĐẾN KẾT QUẢ HỌC ́ 21 Phạm Duy An (2012) "Phương pháp khai phá liệu định" ́H 22 Nguyễn Thị Thanh Thủy (2012) "ỨNG DỤNG KHAI PHÁ DỮ LIỆU uê TẬP SINH VIÊN NGÀNH CÔNG NGHỆ THÔNG TIN" XÂY DỰNG CƠNG CỤ DỰ ĐỐN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN" tê 23 Nguyễn Thái Nghe (2016) "Ứng dụng kỹ thuật khai phá liệu hỗ trợ sinh viên lập kế hoạch học tập" h 24 Getaneh Berie Tarekegn, Dr.Vuda Sreenivasarao (2016) "Application of in Data Mining Techniques to Predict Students Placement in to Departments" ̣c K 25 Sumitha R Vinothkumar E.S (2016) "Prediction of Students Outcome Using Data Mining Techniques" 26 Yehuala M.A (2015) "Application Of Data Mining Techniques For Student ho Success And Failure Prediction (The Case Of Debre_Markos University)" 27 Cheewaprakobkit P (2013) "Study of Factors Analysis Affecting Academic ại Achievement of Undergraduate Students in International Program" Đ 28 Ying Zhang, Samia Oussena (2010) "USE DATA MINING TO IMPROVE STUDENT RETENTION IN HIGHER EDUCATION - A Case Study" g 29 Kumar V Sharma D.V (2012) "Student’s Examination Result Mining: ươ ̀n A Predictive Approach" 30 Abu A (2016) "Educational Data Mining & Students’ Performance Formatted: Font: 13 pt, Bold, Check spelling and grammar Tr (2018) Khai phá liệu Wikipedia tiếng Việt Giới thiệu tổng quan Mạng Nơron nhân tạo (Artificial Neural Network- ANN) Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold (2017) Cây định Wikipedia tiếng Việt SVTH: Trương Văn Quốc Anh1 Formatted: Font: 16 pt Formatted: Font: Bold Prediction" Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" 79 - Khóa luận tốt nghiệp Formatted: Font: 14 pt GVHD: Th.S Mai Thu Giang Formatted: Font: Bold Hồng Ô.X (2015) Scikit-learn: K-nearest neighbors Ông Formatted: Font: Bold Formatted: Border: Bottom: (Single solid line, Auto, 0.5 pt Line width) Xuân Hồng, Formatted: Font: Times New Roman, 14 pt Vu T (2017) Bài 19: Support Vector Machine Tiep Vu’s blog ́ uê Hồng Ô.X (2015) Scikit-learn: Naive Bayes Classifier Ông Xuân Hồng ́H dm_-_chapter_5_-_clustering.pdf tê Các phương pháp đánh giá độ xác (trung bình) mơ hình phân lớp - diepnn80 h Vấn đề trích chọn thuộc tính Khai phá liệu - BIS ̣c K ươ ̀n g Đ ại ho 11.L2-Gioi_thieu_WEKA.pdf in 10.Machine Learning Formatted: Font: Bold Tr Formatted: Font: 13 pt, Bold, Check spelling and grammar Formatted: Font: Bold Formatted: Font: Bold, Check spelling and grammar Formatted: Font: 13 pt, Bold Formatted: Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" SVTH: Trương Văn Quốc Anh1 80 - Page 3: [1] Formatted ADMIN Font: Times New Roman Bold, Bold Page 3: [2] Formatted BaCuong 5/4/2018 9:46:00 AM Font: Times New Roman Bold, 14 pt, Bold Page 3: [3] Formatted BaCuong 5/4/2018 9:46:00 AM ́ Page 3: [4] Formatted uê Font: Times New Roman Bold, 29 pt, Bold BaCuong 5/4/2018 9:47:00 AM BaCuong tê Page 3: [5] Formatted ́H Font: Times New Roman Bold, 17 pt, Bold BaCuong in Page 3: [6] Formatted h Font: Times New Roman Bold, 13 pt 5/4/2018 9:47:00 AM 5/4/2018 9:46:00 AM ̣c K Centered, Space After: pt, Line spacing: 1.5 lines Page 1: [7] Formatted BaCuong 5/4/2018 9:50:00 AM BaCuong 5/4/2018 9:50:00 AM Đ Page 1: [8] Formatted ại ho Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" ̀ng Font: 13 pt, Bold, Check spelling and grammar Page 1: [9] Formatted BaCuong 5/4/2018 9:50:00 AM ươ Font: Bold, Check spelling and grammar Tr Page 5: [10] Formatted Truong Anh 5/20/2018 10:19:00 AM Justified, Level 3, Indent: Left: 0", First line: 0.39", Space After: pt, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 5: [11] Formatted BaCuong 5/4/2018 9:51:00 AM Justified, Indent: First line: 0.39", Space After: pt, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left - Page 5: [12] Formatted BaCuong 5/4/2018 9:51:00 AM Font: (Default) Times New Roman, 13 pt, Font color: Auto Page 5: [13] Formatted Truong Anh 5/20/2018 10:20:00 AM Justified, Level 3, Indent: Left: 0", First line: 0.39", Space After: pt, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left 5/4/2018 9:51:00 AM ́ BaCuong uê Page 5: [14] Formatted BaCuong 5/4/2018 9:50:00 AM h Page 1: [15] Formatted tê ́H Normal, Indent: First line: 0.39", Line spacing: 1.5 lines, No bullets or numbering, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left ̣c K in Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" Page 1: [16] Formatted BaCuong 5/4/2018 9:50:00 AM ho Font: 13 pt, Bold, Check spelling and grammar Page 1: [17] Formatted BaCuong 5/4/2018 9:50:00 AM Page 21: [18] Formatted Đ ại Font: Bold, Check spelling and grammar Truong Anh 5/20/2018 10:24:00 AM ươ ̀ng Normal, Indent: Left: 0.39", Hanging: 0.1", Line spacing: 1.5 lines, No bullets or numbering, Tab stops: 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 21: [19] Formatted BaCuong 5/4/2018 9:51:00 AM Tr Indent: Left: 0", First line: 0.39", Space After: pt, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 21: [20] Formatted BaCuong 5/4/2018 9:56:00 AM Justified, Space After: pt, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left, Position: Horizontal: Left, Relative to: Column, Vertical: In line, Relative to: Margin, Horizontal: 0", Wrap Ar - Page 21: [21] Formatted BaCuong 5/4/2018 9:51:00 AM Indent: Left: 0", First line: 0.39", Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 1: [22] Formatted BaCuong 5/4/2018 9:50:00 AM Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" 5/4/2018 9:50:00 AM ́ BaCuong uê Page 1: [23] Formatted Page 1: [24] Formatted ́H Font: 13 pt, Bold, Check spelling and grammar BaCuong 5/4/2018 9:50:00 AM h BaCuong 5/4/2018 9:51:00 AM in Page 24: [25] Formatted tê Font: Bold, Check spelling and grammar ̣c K Indent: Left: 0", First line: 0.39", Space After: pt, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left BaCuong 5/4/2018 9:51:00 AM ho Page 24: [26] Formatted Page 1: [27] Formatted Đ ại Justified, Indent: Left: 0", First line: 0.39", Space After: pt, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left BaCuong 5/4/2018 9:50:00 AM ươ ̀ng Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" Page 1: [28] Formatted BaCuong 5/4/2018 9:50:00 AM Tr Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" Page 1: [29] Formatted BaCuong 5/4/2018 9:50:00 AM Font: 13 pt, Bold, Check spelling and grammar Page 1: [30] Formatted BaCuong Font: Bold, Check spelling and grammar 5/4/2018 9:50:00 AM - Page 63: [31] Formatted BaCuong 5/4/2018 10:04:00 AM Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 63: [32] Formatted BaCuong 5/4/2018 10:04:00 AM Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left 5/4/2018 10:04:00 AM ́ BaCuong uê Page 63: [33] Formatted BaCuong tê Page 63: [34] Formatted ́H Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left 5/4/2018 10:04:00 AM BaCuong ̣c K Page 63: [35] Formatted in h Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left 5/4/2018 10:04:00 AM ho Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 1: [36] Formatted BaCuong 5/4/2018 9:50:00 AM Đ ại Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" ̀ng Page 1: [37] Formatted BaCuong 5/4/2018 9:50:00 AM ươ Font: 13 pt, Bold, Check spelling and grammar Page 1: [38] Formatted BaCuong 5/4/2018 9:50:00 AM Tr Font: Bold, Check spelling and grammar Page 65: [39] Formatted BaCuong 5/4/2018 10:05:00 AM Space After: pt, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [40] Formatted BaCuong 5/4/2018 10:05:00 AM Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left - Page 65: [41] Formatted BaCuong 5/4/2018 10:05:00 AM Space After: pt, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [42] Formatted BaCuong 5/4/2018 10:05:00 AM Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [43] Formatted BaCuong 5/4/2018 10:05:00 AM ́ Page 65: [44] Formatted ́H uê Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left BaCuong 5/4/2018 10:05:00 AM Page 65: [45] Formatted BaCuong in h tê Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left 5/4/2018 10:05:00 AM ho ̣c K Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [46] Formatted BaCuong 5/4/2018 10:05:00 AM Page 65: [47] Formatted Đ ại Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left BaCuong 5/4/2018 10:05:00 AM ươ ̀ng Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [48] Formatted BaCuong 5/4/2018 10:05:00 AM Tr Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [49] Formatted BaCuong 5/4/2018 10:05:00 AM Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [50] Formatted BaCuong 5/4/2018 10:05:00 AM - Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [51] Formatted BaCuong 5/4/2018 10:05:00 AM Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 65: [52] Formatted BaCuong 5/4/2018 10:05:00 AM ́ Page 1: [53] Formatted ́H uê Justified, Line spacing: 1.5 lines, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left BaCuong 5/4/2018 9:50:00 AM Page 1: [54] Formatted BaCuong in h tê Left, Border: Top: (Single solid line, Auto, 0.5 pt Line width), Tab stops: 6.3", Right + Not at 3.25" + 6.5" 5/4/2018 9:50:00 AM ̣c K Font: 13 pt, Bold, Check spelling and grammar BaCuong 5/4/2018 9:50:00 AM ho Page 1: [55] Formatted Font: Bold, Check spelling and grammar Truong Anh ại Page 67: [56] Formatted 5/20/2018 10:52:00 AM ̀ng Đ Indent: Left: 0", First line: 0.39", Space After: pt, Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 67: [57] Formatted BaCuong 5/4/2018 9:51:00 AM Tr ươ List Paragraph, Indent: Left: 0", First line: 0.39", Tab stops: 0.49", Left + 0.59", Left + 0.69", Left + 0.79", Left + 0.89", Left Page 67: [58] Formatted BaCuong Hh, Left, Indent: Left: 0", Line spacing: single 5/4/2018 11:10:00 AM