(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy

38 1 0
(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy(Luận văn thạc sĩ) Hệ thống tư vấn và phân loại học sinh sử dụng kỹ thuật học máy

UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT HỌ VÀ TÊN: TRÀ NHẤT LAN LUẬN VĂN TỐT NGHIỆP HỆ THỐNG TƯ VẤN VÀ PHÂN LOẠI HỌC SINH SỬ DỤNG KỸ THUẬT HỌC MÁY CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ NGÀNH: 8480104 LUẬN VĂN THẠC SỸ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS QUẢN THÀNH THƠ BÌNH DƯƠNG, năm 2019 LỜI CAM ĐOAN Đề tài “Xây dựng hệ thống tư vấn phân loại học sinh sử dụng kỹ thuật học máy” cơng trình nghiên cứu tơi thực Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Tác giả xin cam đoan lời nêu hoàn toàn thật Bình Dương, ngày 28 tháng năm 2019 Học viên TRÀ NHẤT LAN Trang: i LỜI CẢM ƠN Em xin gửi lời cảm ơn chân thành đến quý Thầy Cô Trường Đại học Thủ Dầu Một trang bị cho em kiến thức, kỹ cần thiết suốt khóa học để em hồn thành nội dung chương trình học trường Em chân thành cảm ơn Thầy PGS.TS Quản Thành Thơ khuyến khích, động viên tận tình hướng dẫn em trình thực luận văn thạc sỹ Chúng tơi mong nhận góp ý quý thầy cô để luận vặn đạt kết tốt Cuối cùng, em xin cảm ơn gia đình, bạn bè, đồng nghiệp động viên, giúp đỡ em suốt q trình học hồn thành luận văn Tôi xin chúc quý thầy cô, bạn thật nhiều sức khỏe, nhiều niềm vui sống, thành công công việc Trang: ii MỤC LỤC DANH MỤC TỪ VIẾT TẮT v DANH MỤC CÁC BẢNG v DANH MỤC BIỂU ĐỒ, ĐỒ THÌ, HÌNH ẢNH, SƠ ĐỒ v TÓM TẮT LUẬN VĂN vi MỞ ĐẦU CHƯƠNG GIỚI THIỆU 1.1 Phân lớp liệu 1.2 Tình hình nghiên cứu 1.3 Mục tiêu đề tài 1.4 Nội dung phương pháp nghiên cứu CHƯƠNG MƠ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 2.1.1 Khái niệm 2.2 MỘT PHƯƠNG PHÁP HỌC MÁY PHỔ BIẾN 2.2.1 Khái niệm học máy 2.2.2 Một số phương pháp học máy 2.2.2.1 Học có giám sát 2.2.2.2 Học khơng có giám sát 2.2.2.3 Học bán giám sát 2.2.3 Một số thuật toán học máy 2.2.3.1 Hồi quy tuyến tính (Linear regression) 2.2.3.2 Thuật toán định (Decision trees) 2.2.3.3 Thuật toán K_means 2.2.3.4 Thuật toán K láng giềng gần (K-nearest neighbors) 2.3 PHƯƠNG PHÁP RANDOM FOREST 2.3.1 Cây định 2.3.2 Rừng ngẫu nhiên (Random Forest) 2.4 Một số cơng trình nghiên cứu liên quan CHƯƠNG XÂY DỰNG MƠ HÌNH DỰ ĐỐN ĐIỂM CỦA HỌC SINH DÙNG RANDOM FOREST 10 3.1 MƠ TẢ DỮ LIỆU BÀI TỐN 10 3.2 MƠ HÌNH HUẤN LUYỆN 13 Trang: iii 3.2.1 MÔ HÌNH DÙNG TRONG RANDOM FOREST 13 3.2.2 Xây dựng Cây định dùng CART 13 3.2.3 Xây dựng Rừng ngẫu nhiên (Random Forest) 14 3.2.4 Áp dụng Rừng ngẫu nhiên 15 3.3 GIAO DIỆN 15 3.4 Chức dự đoán: 15 3.4.1 Chức dự đốn mơn khối tự nhiên 18 3.4.2 Chức dự đốn mơn khối xã hội: 19 3.5 Chức phân loại tư vấn học sinh 19 3.6 Các bước tiền xử lý liệu 20 CHƯƠNG THỰC NGHIỆM 23 4.1 Mô tả liệu huấn luyện 23 4.2 Dữ liệu huấn luyện 23 4.3 Tính độ tương quan 24 4.4 So sánh với thuật toán học máy khác 25 4.5 So sánh độ tương khối xã hội 26 4.6 So sánh độ tương quan khối tự nhiên 27 CHƯƠNG GIAO DIỆN HỆ THỐNG 28 5.1 Ngơn ngữ lập trình: 28 5.1.1 Ngơn ngữ lập trình Python 3.6 28 5.2 Công cụ hỗ trợ 28 5.2.1 Phần mềm Jupyter Notebook 28 5.2.2 Visual Studio Code 28 5.3 Thư viện hỗ trợ 28 5.3.1 Thư viện numpy 28 5.3.2 Thư viện Pandas 29 CHƯƠNG KẾT QUẢ ĐẠT ĐƯỢC VÀ HẠN CHẾ 30 6.1 Kết đạt làm 30 6.2 Hạn chế: 30 6.3 Khuyến nghị 30 TÀI LIỆU THAM KHẢO 31 Trang: iv DANH MỤC TỪ VIẾT TẮT CART: Classification and Regression Tree AI: Artificial Intelligence RF: Random Forest KNN: K – Nearest Neighbors DANH MỤC CÁC BẢNG BẢNG 1: Thông kê độ tương quan thuật tốn BẢNG 2: Só sánh độ tương quan só với thuật toán khác DANH MỤC BIỂU ĐỒ, ĐỒ THÌ, HÌNH ẢNH, SƠ ĐỒ Hình 1: Quy trình khai phá liệu Hình 2: Mơ tả liệu điểm năm học lớp 10 Hình 3: Mơ tả liệu điểm năm học lớp 11 Hình 4: Mô tả liệu điểm năm học lớp 12 Hình 5: Mơ tả liệu điểm thi tốt nghiệp Hình 6: Quy trình huấn luyện RF Hình 7: Quy trình xây dựng RF Hình 8: Minh họa mơ hình hoạt động hệ thống Hình 9: Quy trình hoạt động hệ thống 10 Hình 10: Minh họa module khối mơn tự nhiên 11 Hình 11: Minh họa module khối mơn xã hội 12 Hình 12: Minh họa dự đốn mơn khối tự nhiên 13 Hình 13: Minh họa dự đốn mơn khối xã hội 14 Hình 14: Quy trình chức phân loại tư vấn 15 Hình 15: Minh họa liệu điểm lớp 10 16 Hình 16: Minh họa liệu điểm chuẩn hóa 17 Hình 17: Minh họa liệu huấn luyện 18 Hình 18: Minh họa thuộc tính liệu 19 Hình 19: So sánh độ tương quan khối xã hội 20 Hình 20: So sánh độ tương quan khối tự nhiên Trang: v TÓM TẮT LUẬN VĂN Với tốc độ phát triển mạnh mẽ cơng nghệ thơng tin việc ứng dụng công nghệ thông tin vào lĩnh vực như: ý tế, giáo dục, kinh doanh áp dụng rộng rãi Trong lượng liệu thu lớn, muốn khai thác nguồn liệu việc áp dụng phương pháp khai phá liệu học máy cần thiết Luận văn áp dụng kỹ thuật học máy để dự đoán kết thi tốt nghiệp trước kì thi tốt nghiệp học sinh, luận văn chia làm chương Chương 1: giới thiệu tình hình nghiên cứu lý chọn đề tài luận văn mục tiêu thực luận văn Chương 2: giới thiệu kiến thức tảng khai thác liệu Trí tuệ nhận tạo (AI), số phương pháp học máy như: học có giám sát, học khơng có giám sát, học bán giám sát, học tăng cường Giới thiệu số thuật toán học máy việc ứng dụng thuật toán Random Forest để dự đoán điểm thi trước kì thi tốt nghiệp học sinh Chương 3: mô tả liệu điểm học sinh từ năm học lớp 10, lớp 11, lớp 12 liệu điểm thi tốt nghiệp học sinh từ năm 2015 đến 2018 học sinh trường Phổ Thông Trung Học Thanh Tuyền, từ liệu ta tiến hành bước chuẩn hóa liệu điểm học sinh để áp dụng vào mơ hình hệ thống Luận văn giới thiệu việc xây dựng mơ hình CART việc áp dụng thuật toán Random Forest vào toán dự đoán điểm thi tốt nghiệp học sinh Áp dụng thuật toán để xây dựng giao diện hệ thống dự đoán điểm thi tốt nghiệp học sinh Chương 4: từ việc xây dựng hệ thống ta tiến hành kiểm thử tính độ xác mơ hình hệ thống công thức R Square Chương 5: giới thiệu chức hệ thống việc ứng dụng ngơn ngữ lập trình, cơng cụ hỗ trợ thư việc hỗ trợ việc xây dựng hệ thống dự đốn điểm thi trước kì thi tốt nghiệp học sinh Chương 6: Đánh giá kết đạt hạn chế việc áp dụng mơ hình Random Forest (RF) vào xây dựng hệ thống hướng phát triển tới Trang: vi MỞ ĐẦU Ngày nhu cầu ứng dụng công nghệ thông tin vào ngành giáo dục ứng dụng rộng rãi trường đại học, cao đẳng, trung cấp, trường Phổ Thông Trung Học Nhưng học sinh Phổ Thơng Trung Học nhu cầu cần dự đốn điểm thi trước kì thi tốt nghiệp yêu cầu quan trọng Từ học sinh tìm hiểu trường phù hợp, tham khảo số ngành học trước kì thi để chuẩn bị trước nộp hồ sơ xét tuyển tuyển sinh đại học, cao đẳng, trung cấp Nhằm giúp em dự đốn trước điểm thi đạt thi tốt nghiệp Trung Học Phổ Thông Quốc Gia, hướng dẫn thầy PGS.TS Quản Thành Thơ, chọn đề tài nghiên cứu: “xây dựng hệ thống tư vấn phân loại học sinh sử dụng kỹ thuật học máy” dựa sở liệu điểm môn học năm học liên tiếp điểm thị tốt nghiệp trước lớp 10, 11, 12 điểm thi tốt nghiệp Hệ thống dự đoán điểm thi tốt nghiệp học sinh trước kì thi tốt nghiệp để em biết trước lực cố gắn kì thi tới từ em biết nên chọn trường để xét tuyển, ngành cho phù họp với thân em Hệ thống dự đoán điểm thi học sinh theo hai khối khối môn học tự nhiên khối môn học xã hội cho phù hợp với kết dự thi em Dữ liệu luận văn lấy từ liệu điểm thực tế trường Phổ Thông Thanh Tuyền với liệu từ năm 2015 đến năm 2018 điểm thi tốt nghiệp năm “Hệ thống tư vấn phân loại học sinh sử dụng kỹ thuật học máy” em sử kỹ thuật RF (Random forest Regression) để dự đoán điểm thi tốt nghiệp theo khối môn học tự nhiên khối môn học xã hội dựa liệu điểm năm học gần Trang: CHƯƠNG GIỚI THIỆU 1.1 Phân lớp liệu Ngày phân lớp liệu hướng nghiên cứu khai phá liệu Phân lớp dự đoán hai dạng phân tích liệu nhằm rút mơ hình mơ tả lớp liệu quan trọng hay dự đoán xu hướng liệu tương lai Phân lớp dự đoán nhãn xác định hay giá trị liệu rời rạc có nghĩa phân lớp thao tác với đối tượng liệu mà có giá trị biết trước dự đốn lại xây dựng mơ hình với hàm nhận giá trị liên tục 1.2 Tình hình nghiên cứu Trên thực tế, có nhiều nghiên cứu phân lớp liệu tất lĩnh vực như: y tế, ngân hàng, khách sạn, siêu thị, giáo dục, … Nhưng Việt Nam lĩnh vực giáo dục có nghiên cứu việc chuẩn đốn điểm thi tốt nghiệp trước kì thi tốt nghiệp Trung Học Phổ Thông dựa vào việc phân lớp liệu dựa vào điểm năm học cấp ba điểm thi tốt nghiệp Trung Học Phổ Thông năm học trước (từ lớp 10 đến lớp 12 điểm thi tốt nghiệp Trung Học Phổ Thông) 1.3 Mục tiêu đề tài Khai thác liệu điểm học sinh ba năm học điểm thi tốt nghiệp Trung Học Phổ Thông học sinh Từ liệu điểm tiền xử lý để phù hợp với việc “xây dựng hệ thông phân loại tư vấn sử dụng kĩ thuật học máy” Xây dựng hệ thống dự đoán điểm thi tốt nghiệp học sinh trước kì thi tốt nghiệp theo hai khối: khối mơn học tự nhiên khối môn học xã hội Từ đó, giúp cho học sinh biết khả kiến thức trước kì thi tốt nghiệp để có lựa chọn tốt cho việc chọn trường, chọn ngành để xét tuyển sinh đại học kì tuyển sinh đại học, cao đẳng, trung cấp năm học 1.4 Nội dung phương pháp nghiên cứu Nội dung nghiên cứu khai phá liệu điểm học sinh để xây dựng hệ thống tư vấn phân loại học sinh sử dụng kỹ thuật học máy Trang: Nghiên cứu kết hợp khai phá liệu thuật toán RF (Random Forest) để đưa dự đoán điểm thi trước kì thi tốt nghiệp Trung Học Phổ Thơng Quốc Gia Trang: ... nghiệp năm ? ?Hệ thống tư vấn phân loại học sinh sử dụng kỹ thuật học máy? ?? em sử kỹ thuật RF (Random forest Regression) để dự đoán điểm thi tốt nghiệp theo khối môn học tự nhiên khối môn học xã hội... điểm học sinh ba năm học điểm thi tốt nghiệp Trung Học Phổ Thông học sinh Từ liệu điểm tiền xử lý để phù hợp với việc “xây dựng hệ thông phân loại tư vấn sử dụng kĩ thuật học máy? ?? Xây dựng hệ thống. .. “xây dựng hệ thống tư vấn phân loại học sinh sử dụng kỹ thuật học máy? ?? dựa sở liệu điểm môn học năm học liên tiếp điểm thị tốt nghiệp trước lớp 10, 11, 12 điểm thi tốt nghiệp Hệ thống dự đốn

Ngày đăng: 20/11/2022, 09:11

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan