Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 65 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
65
Dung lượng
3,91 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC LẠC HỒNG *** HỆ THỐNG TRỢ GIÚP HỌC SINH TRUNG HỌC LỰA CHỌN TỔ HỢP MƠN THEO CHƢƠNG TRÌNH GIÁO DỤC PHỔ THÔNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Đồng Nai, năm 2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC LẠC HỒNG *** HỆ THỐNG TRỢ GIÚP HỌC SINH TRUNG HỌC LỰA CHỌN TỔ HỢP MÔN THEO CHƢƠNG TRÌNH GIÁO DỤC PHỔ THƠNG Chun ngành: Cơng nghệ thơng tin Mã số: 8480201 LUẬN VĂN THẠC SĨ CƠNG NGHỆ THÔNG TIN Đồng Nai - năm 2023 LỜI CAM ĐOAN Tôi xin cam đoan đề tài khoa học “Hệ thống trợ giúp học sinh trung học lựa chọn tổ hợp mơn theo chương trình giáo dục phổ thơng” cơng trình nghiên cứu riêng tơi, tài liệu kết nghiên cứu luận văn trung thực Các nội dung tham khảo luận văn từ tài liệu đƣợc trích dẫn đƣợc thích đầy đủ Tơi xin chịu trách nhiệm luận văn Đồng Nai, ngày tháng Học viên năm 2023 LỜI CẢM ƠN Em xin đƣợc chân trọng cảm ơn Trƣờng Đại học , Biên Hòa, Đồng Nai tổ chức khóa học này, tạo điều kiện để em đƣợc học tập tiếp thu kiến thức, kỹ để hoàn thành luận văn Em xin chân thành cảm ơn q Thầy giáo, Cơ giáo Khoa sau đại học q thầy Khoa cơng nghệ thơng tin tận tình truyền đạt cho em kiến thức kỹ cần thiết cho em suốt trình học tập Em xin đƣợc gửi tới thầy PGS.TS lời cảm ơn chân thành Thầy hƣớng dẫn, góp ý tận tình tạo điều kiện để em hoàn thành luận văn Em xin đƣợc gửi lời cảm ơn tới hội đồng sƣ phạm Trƣờng THCS-THPT Bàu Hàm tạo điều kiện thời gian, liệu, xếp công việc em đƣợc học khóa học Đồng Nai, ngày tháng Học viên năm 2023 TÓM TẮT LUẬN VĂN Luận văn nghiên cứu sở lý thuyết ứng dụng máy học với công cụ phần mềm Microsoft azure machine learning studio việc phân tích liệu điểm trung bình mơn học tập năm học 6, 7, 8, từ dự đoán đƣợc kết học tập các môn năm lớp 10, giúp ngƣời học đƣa định hƣớng lựa chọn môn học lớp 10 phù hợp với thân - Thu thập sở liệu sau tiến hành phân tích huấn luyện Kết cấu luận văn (các chƣơng mục) - Chƣơng 1: Phần mở đầu - Chƣơng 2: Nghiên cứu tổng quan toán dự đoán điểm - Chƣơng 3: Cơ sở lý thuyết liên quan - Chƣơng 4: Ứng dụng Azure studio vào dự đoán điểm - Chƣơng 5: Thử nghiệm đánh giá kết Thu thập liệu thực nghiệm (điểm trung bình các mơn học năm học THCS), đƣa liệu vào huấn luyện, xây dựng phần mềm hỗ trợ dự đoán điểm năm học lớp 10 từ đƣa khuyến nghị cho học sinh DANH MỤC CÁC KÍ HIỆU, CÁC TỪ VIẾT TẮT Ký hiệu Thuật ngữ ANH Tiếng anh ANN Artificial Neural Network C4.5 Thuật toán định 4.5 CART and ID3 Thuật toán CART and ID3 CONG_NGHE Công nghệ DIA Địa GD&ĐT Giáo dục đào tạo GDCD Giáo dục cơng dân HOA Hóa KDD Khám phá tri thức các sở liệu (Knowledge discovery in databases) KPDL Khai phá liệu LI Lí ML Machine Learning SINH Sinh SU Sử THCS Trung học sở THPT Trung học phổ thông THPT QG Trung học phổ thơng Quốc gia TIN Tin học TOAN Tốn VAN Văn MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN TÓM TẮT LUẬN VĂN DANH MỤC CÁC KÍ HIỆU, CÁC TỪ VIẾT TẮT Chƣơng 1: PHẦN MỞ ĐẦU 1.1 Lý chọn đề tài 1.2 Mục tiêu luận văn 1.3 Phạm vi đối tƣợng nghiên cứu 1.4 Nội dung thực 1.5 Phƣơng pháp thực 1.6 Dự kiến kết 1.7 Kết cấu luận văn (các chƣơng mục) Chƣơng 2: TỔNG QUAN BÀI TOÁN DỰ ĐOÁN 2.1 Tổng quan đề tài nƣớc 2.2 Tổng quan đề tài nƣớc Chƣơng CƠ SỞ LÝ THUYẾT LIÊN QUAN 3.1 Giới thiệu toán dự đoán 3.2 Bài toán hồi quy [7] 3.2.1Hồi quy tuyến tính (Linear Regression) [8] 3.3 Mạng nơ-ron nhân tạo (Artificial Neural Network – ANN) 12 3.3.1 Mạng Perceptron 13 3.3.2 Mạng Perceptron đa tầng 15 3.3.3 Mơ hình mạng nơ-ron nhân tạo 16 3.3.4 Hoạt động mạng nơ-ron nhận tạo 18 Chƣơng ỨNG DỤNG AZURE STUDIO VÀO DỰ BÁO ĐIỂM 21 Giới thiệu Azure Machine Learning Studio 21 Ứng dụng Machine Learning Studio với tốn dự đoán điểm 24 4.3 Xây dựng mơ hình dự đoán điểm Azure Machine Learning Studio 25 Chƣơng V THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 27 Chuẩn bị liệu 27 Thử nghiệm 30 Xây dựng phần mềm dự đoán 34 Xây dựng phần mềm dựa Webservice 34 5.3.2 Giao diện Demo kết nối Webservice 37 5.3.4 Thực demo tƣ vấn chọn môn học lớp 10 nhƣ định hƣớng xét tuyển vào Đại học 38 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN TÀI LIỆU THAM KHẢO PHỤ LỤC Chƣơng 1: PHẦN MỞ ĐẦU 1.1 Lý chọn đề tài Hội nghị lần thứ Ban Chấp hành Trung ƣơng Đảng Cộng sản Việt Nam (khoá XI) thông qua Nghị số 29/NQ-TW ngày tháng 11 năm 2013 đổi bản, toàn diện giáo dục đào tạo đáp ứng yêu cầu công nghiệp hoá, đại hoá điều kiện kinh tế thị trƣờng định hƣớng xã hội chủ nghĩa hội nhập quốc tế [15]; Quốc hội ban hành Nghị số 88/2014/QH13 ngày 28 tháng 11 năm 2014 đổi chƣơng trình, sách giáo khoa giáo dục phổ thơng [16] Ngày 27 tháng năm 2015, Thủ tƣớng Chính phủ ban hành Quyết định số 404/QĐ-TTg phê duyệt Đề án đổi chƣơng trình, sách giáo khoa giáo dục phổ thông [17] Ngày 26 tháng 12 năm 2018, Bộ trƣởng Bộ Giáo dục Đào tạo ban hành Thơng tƣ số 32/2018/TT-BGDĐT ban hành chƣơng trình giáo dục phổ thơng (chƣơng trình giáo dục phổ thơng 2018) Chƣơng trình giáo dục phổ thơng thực mục tiêu giáo dục hình thành, phát triển phẩm chất lực cho học sinh thông qua nội dung giáo dục Căn mục tiêu giáo dục yêu cầu cần đạt phẩm chất, lực giai đoạn giáo dục cấp học, chƣơng trình môn học hoạt động giáo dục xác định mục tiêu, yêu cầu cần đạt phẩm chất, lực nội dung giáo dục môn học, hoạt động giáo dục [18] Ở cấp trung học phổ thơng (Giai đoạn giáo dục định hƣớng nghề nghiệp): Các môn học hoạt động giáo dục bắt buộc: Ngữ văn; Toán; Ngoại ngữ 1; Giáo dục thể chất; Giáo dục quốc phòng an ninh; Hoạt động trải nghiệm, hƣớng nghiệp; Nội dung giáo dục địa phƣơng; Lịch sử Học sinh lựa chọn 04 môn môn: Địa lí; Giáo dục kinh tế pháp luật; Vật lí; Hoá học; Sinh học; Cơng nghệ; Tin học; Nghệ thuật (Âm nhạc, Mĩ thuật) Các chuyên đề học tập: Mỗi mơn học Ngữ văn, Toán, Lịch sử, Địa lí, Giáo dục kinh tế pháp luật, Vật lí, Hoá học, Sinh học, Cơng nghệ, Tin học, Nghệ thuật có số chuyên đề học tập tạo thành cụm chuyên đề học tập TÀI LIỆU THAM KHẢO [1] N T V Hảo, Ứng dụng lý thuyết tập mờ vào việc dự đoán kết tốt nghiệp phổ thông trung học, Đại học Huế, 2014 luận văn thạc sĩ [2] N T Bình, Ứng dụng Logic mờ xây dựng hệ trợ giúp tƣ vấn hƣớng nghiệp, Đại học Đà Nẵng, 2011 luận văn thạc sĩ [3] L Q Cƣờng, Khai Thác Điểm Học Tập Để Dự Đoán Kết Quả Thi Trung Học Phổ Thông Quốc Gia Cho Học Sinh Trung Học, Đại Học Cơng nghệ thơng tin TP Hồ Chí Minh, 2016 luận văn thạc sĩ [4] L T T Vang, Xây dựng giải pháp dự đoán kết tốt nghiệp trƣờng trung học phổ thông, Đại học Lạc Hồng, 2018 luận văn thạc sĩ [5] P V Thắng, Xây dựng hệ thống tƣ vấn chọn ngành đại học cho học sinh THPT, Đại học Lạc Hồng, 2016 luận văn thạc sĩ [6] T H Tâm, Ứng dụng Random forest phân ban lớp học cho học sinh trung học phổ thông, Đại học Lạc Hồng, 2019 luận văn thạc sĩ [7] V H Tiế p , Machine Learning bản, 2018, giáo trình [8] https://dominhhai.github.io/vi/2017/12/ml-linear-regression, báo điện tử [9] Y E Cakra and B Distiawan Trisedya, “Stock price prediction using linear regression based on sentiment analysis”, Depok: 2015 International Conference on Advanced Computer Science and Information Systems (ICACSIS), pp 147-154, 2015 [10] Superby J F.,a Vandamme J P and Meskens N., Determination of factors influencing the achievement of the first-year university students using data mining methods, Workshop on Education, 2006 [11] B K Bharadwaj and S Pal., “Mining Educational Data to Analyze Student’s Performance”, International Journal of Advance Computer Science and Applications (IJACSA), Vol 2, No 6, pp 63-69, 2011 [12] Gerben W Dekker, M Pechenizkiy and Jan M Vleeshouwers (2009), Predicting students drop out: A case study, In Proceedings of the 2nd International Conference on Educational Data Mining, pp 41-50, 2009 [13] S K Yadav, B K Bharadwaj and S Pal, Data Mining Applications: A Comparative Study for Predicting Student’s Performance, International Journal of Innovative Technology and Creative Engineering (IJITCE), Vol 1, No 12, pp 13-19, 2011 [14] P V Hòa, Ứng dùng máy học dự đoán điểm thi từ tƣ vấn cho học sinh chọn môn thi THPT Quốc gia xét tuyển vào Đại học, Đại học Lạc Hồng, 2019 Luận văn thạc sĩ [15] Đảng Cộng sản Việt Nam (khoá XI), Nghị số 29/NQ-TW đổi bản, toàn diện giáo dục đào tạo đáp ứng yêu cầu công nghiệp hoá, đại hoá điều kiện kinh tế thị trƣờng định hƣớng xã hội chủ nghĩa hội nhập quốc tế, 2013 [16] Quốc hội nƣớc Cộng hòa xã hội chủ nghĩa Việt Nam, Nghị số 88/2014/QH13 đổi chƣơng trình, sách giáo khoa giáo dục phổ thơng, 2014 [17] Thủ tƣớng Chính phủ nƣớc Cộng hòa xã hội chủ nghĩa Việt Nam, Quyết định số 404/QĐ-TTg phê duyệt Đề án đổi chƣơng trình, sách giáo khoa giáo dục phổ thông, 2015 [18] Bộ trƣởng Bộ Giáo dục Đào tạo, Thông tƣ số 32/2018/TT-BGDĐT ban hành chƣơng trình giáo dục phổ thơng, 2018 PHỤ LỤC Các thao tác thực huấn luyện Microsoft Azure Machine Learning Studio 6.1 Chuẩn bị liệu: Điều ta cần học máy liệu Dữ liệu đƣa vào hệ thống thƣờng định dạng file *.csv, nhƣ hình 6.1 Hình 6.1: Dữ liệu huấn luyện mơn tốn Trong đề tài liệu đƣợc thu thập điểm trung bình mơn các năm học lớp 6, 7, 8, 9, 10 11 mơn học: Tốn, Lí, Hóa, Sinh, Tin học, Văn, Anh, Công Nghệ, GDCD, Sử, Địa từ niên khóa 2014-2015 đến 2021-2022 học sinh trƣờng THCS THPT Bàu Hàm, Trảng Bom, Đồng Nai với liệu thu thập đƣợc 824 ghi 6.2 Đƣa liệu lên Azure Machine Learning Studio Khi thực đƣa liệu mẫu vào thành công hệ thống thị tập tin liệu đƣợc đƣa vào huấn luyện nhƣ hình 6.2 Hình 6.2: Dữ liệu nạp vào Sau thực việc đƣa liệu huấn luyện vào hệ thống ta thực tạo mơ hình thử nghiệm nhƣ hình 6.3 Hình 6.3: Tạo thử nghiệm Hình 6.4: Giao diện mơ hình thử nghiệm trống Ta thực thao tác đƣa liệu vào hệ thống cho máy học Hình 6.5: Dữ liệu nạp vào Các liệu mơ-đun có cổng đầu vào đầu đƣợc biểu thị vòng tròn nhỏ - cổng đầu vào cùng, cổng đầu phía dƣới Để tạo luồng liệu thông qua thử nghiệm toán dự đoán, ta kết nối cổng đầu mô-đun với cổng đầu vào mơ-đun khác Bất lúc nào, ta nhấp vào cổng đầu liệu mô-đun để xem liệu trông nhƣ điểm luồng liệu 6.3 Thực kết nối mơ hình huấn luyện Sau hồn tất đƣa liệu vào huấn luyện, ta phải chọn cột liệu thực nghiệm Ở ta quan tâm tới cột liệu mà muốn bao gồm loại trừ mơ hình nhƣ hình 6.6 6.7 Hình 6.6: Chọn cột liệu Hình 6.7: Chọn cột liệu thực nghiệm Trong trƣờng hợp liệu chuẩn bị học ta khơng làm trƣớc ngồi n tâm, Azure Machine Learning Studio cung cấp cơng cụ hỗ trợ thực để làm liệu hệ thống Một liệu thƣờng yêu cầu số tiền xử lý trƣớc đƣợc phân tích Bạn nhận thấy giá trị thiếu diện cột hàng khác Những giá trị thiếu cần đƣợc làm để mơ hình phân tích liệu xác Chúng ta xóa hàng có giá trị thiếu Ngồi ra, cột tổn thất đƣợc chuẩn hóa có tỷ lệ lớn giá trị bị thiếu, loại trừ cột khỏi mơ hình hồn tồn Chúng ta cần phải lƣu ý việc làm giá trị thiếu khỏi liệu đầu vào điều kiện tiên để sử dụng hầu hết mô-đun Đầu tiên, thêm mơ-đun loại bỏ hồn tồn cột tổn thất đƣợc chuẩn hóa Sau đó, thêm mô-đun loại bỏ hàng thiếu liệu Kéo mô-đun làm liệu bị vào khung vẽ thử nghiệm kết nối với mơ-đun chọn cột liệu nhƣ hình 6.8 Trong ngăn thuộc tính, chọn xóa tồn hàng chế độ dọn dẹp nhƣ hình 6.9 -> chọn Remove entire row nhƣ hình 6.9 phía dƣới Các tùy chọn trực tiếp dọn liệu để làm liệu cách xóa hàng có giá trị thiếu Nhấp đúp vào mô-đun nhập nhận xét "Xóa hàng giá trị bị thiếu." Hình 6.8: Chọn làm liệu Hình 6.9: Thiết lập tùy chọn làm liệu Việc chạy thử nghiệm, các định nghĩa cột cho liệu chuyển từ tập liệu, thông qua mô đun chọn cột liệu thông qua mô đun liệu thiếu Điều có nghĩa mô-đun kết nối với Clean Missing Data có thơng tin Bây có liệu Nếu muốn xem tập liệu đƣợc làm sạch, nhấp vào cổng đầu bên trái mô-đun Clean Missing Data chọn Visualize Khi ta thấy cột tổn thất chuẩn hóa khơng cịn đƣợc bao gồm khơng có giá trị thiếu Tiếp theo ta thực việc chia liệu huấn luyện Chúng ta sử dụng liệu cho việc đào tạo mơ hình kiểm tra mơ hình cách chia liệu thành liệu thử nghiệm đào tạo riêng biệt Hình 6.10: Chọn chia liệu thiết lập thơng số Tìm Phân số hàng tập liệu đầu (trong ngăn Thuộc tính bên phải khung vẽ) đặt thành 0.8 Bằng cách này, sử dụng 80% liệu để đào tạo mơ hình giữ lại 20% để thử nghiệm nhƣ hình 6.10 phía Nhƣ vậy, cách thay đổi tham số giá trị ta tạo mẫu ngẫu nhiên khác để đào tạo thử nghiệm Tham số kiểm soát việc dự đoán ngẫu nhiên Tiếp tục chạy thử nghiệm, thử nghiệm đƣợc chạy, các mô đun chọn cột liệu liệu phân chia chuyển các định nghĩa cột cho môđun Bây ta phải thực kết nối mơ hình huấn luyện: Tìm kéo mơ đun Train Model vào khung vẽ thử nghiệm sau chọn cột liệu muốn dự đoán Hình 6.11: Chọn mơ hình huấn luyện Kết nối đầu mô đun Neural Network Regression với đầu vào bên trái mơ hình Train Model kết nối đầu liệu huấn luyện (cổng bên trái) mô đun Split Data với đầu vào bên phải mơ hình Train Model nhƣ ví dụ hình 6.12 Hình 6.12: Chọn thuật tốn huấn luyện Chọn vào mơ đun mơ hình tàu hỏa, khởi chạy chọn cột ngăn Thuộc tính, cột đƣợc chọn giá trị mà mơ hình dự đoán Tiếp tục chạy thử nghiệm, có mơ hình hồi quy đƣợc đào tạo đƣợc sử dụng để chấm điểm ví dụ liệu điểm mơn tốn bốn năm lớp 6, 7, 8, để đƣa dự đoán điểm toán nhƣ hình 6.13 Hình 6.13: Chạy kiểm tra mơ hình Với việc tạo mơ hình chạy thử nghiệm ta có mơ hình dự đoán điểm số Chúng ta đào tạo mơ hình 80% liệu mình, sử dụng để ghi 20% liệu khác để xem mơ hình hoạt động tốt nhƣ Thực Kết nối đầu mô đun mơ hình tàu hỏa với cổng đầu vào bên trái mơ hình điểm Kết nối đầu liệu thử nghiệm (cổng bên phải) mô-đun chia liệu với cổng đầu vào bên phải mơ hình điểm nhƣ hình 6.14 Hình 6.14: Mơ hình dự đốn điểm số Chạy thử nghiệm xem đầu từ mơ đun mơ hình điểm cách nhấp vào cổng đầu mơ hình điểm chọn trực quan hóa Đầu hiển thị giá trị dự đoán cho các giá trị biết từ liệu thử nghiệm Nhƣ hình 6.15 ta thấy TTS điểm trung bình thực tế học sinh, cịn Scored Labels giá trị dự đoán mơ hình Hình 6.15: Kết dự đoán Cuối cùng, kiểm tra chất lƣợng kết Thí nghiệm cuối trơng giống nhƣ hình 6.16 phía dƣới Hình 6.16: Mơ hình đánh giá tổng thể 6.4 Triển khai dƣới dạng Webservice: 6.4.1 Triển khai dịch vụ web cổ điển: Machine Learning Studio hỗ trợ triển khai thử nghiệm dƣới dạng dịch vụ web đƣa đến bảng điều khiển cho dịch vụ web Ta quản lý dịch vụ web, theo dõi hiệu suất dịch vụ web Dịch vụ web dịch vụ web Azure nhận trả lại liệu API REST theo hai cách: Yêu cầu/Phản hồi – Ngƣời dùng gửi nhiều hàng liệu tín dụng đến dịch vụ cách sử dụng giao thức HTTP dịch vụ phản hồi nhiều kết Thực thi hàng loạt – Ngƣời dùng lƣu trữ nhiều hàng liệu tín dụng blob Azure sau gửi vị trí blob đến dịch vụ Dịch vụ chấm điểm tất hàng liệu blob đầu vào, lƣu trữ kết blob khác trả URL vùng chứa Hình 6.17: Kiểm tra web service Kết kiểm tra đƣợc hiển thị phía bên phải trang cột đầu ra, hình 6.17 6.4.2 Thực nghiệm dự đốn ứng dụng Excel kết hợp Web Service Bƣớc 1: Chọn dịch vụ Web muốn triển khai Chọn Dashboard Chọn Test Preview Bƣớc 2: Download Excel tƣơng ứng với phiên máy tính sử dụng Bƣớc 3: Cấu hình file Excel Hình 6.18: File Excel nhập điểm dự đốn Từ File ta nhập các điểm trung bình học sinh năm học 6, 7, 8, môn học mà học sinh dự đoán điểm, hệ thống dự đoán điểm trung bình mơn lớp 10 học sinh