Khai phá dữ liệu kết quả học tập sinh viên trường đại học công nghiệp thực phẩm tp HCM

80 9 0
Khai phá dữ liệu kết quả học tập sinh viên trường đại học công nghiệp thực phẩm tp HCM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM TRẦN THỊ VÂN ANH KHAI PHÁ DỮ LIỆU KẾT QUẢ HỌC TẬP SINH VIÊN TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TP HCM LUẬN VĂN THẠC SĨ Chuyên ngành: Công nghệ thông tin Mã số ngành: 60480201 TP HỒ CHÍ MINH, tháng năm 2016 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM - TRẦN THỊ VÂN ANH KHAI PHÁ DỮ LIỆU KẾT QUẢ HỌC TẬP SINH VIÊN TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TP HCM LUẬN VĂN THẠC SĨ Chuyên ngành : Công nghệ thông tin Mã số ngành: 60480201 CÁN BỘ HƢỚNG DẪN KHOA HỌC: TS LƢ NHẬT VINH TP HỒ CHÍ MINH, tháng năm 2016 i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu Luận văn trung thực chƣa đƣợc công bố cơng trình khác Tơi xin cam đoan giúp đỡ cho việc thực Luận văn đƣợc cảm ơn thơng tin trích dẫn Luận văn đƣợc rõ nguồn gốc Học viên thực Luận văn (Ký ghi rõ họ tên) Trần Thị Vân Anh ii LỜI CÁM ƠN Tôi xin chân thành cảm ơn thầy hƣớng dẫn Tiến sĩ Lƣ Nhật Vinh, khoa Công nghệ thông tin – Trƣờng Đại học Cơng nghiệp Thực phẩm TP.HCM tận tình hƣớng dẫn suốt thời gian thực luận văn Hai ngƣời muốn gửi lời cảm ơn sâu sắc ba mẹ đáng kính tơi chăm sóc nhỏ để tơi n tâm học tập, nghiên cứu làm việc, cảm ơn lời động viên tinh thần từ ngƣời chồng giúp vƣợt qua khó khăn, cảm ơn Ngân Khánh mang lại niềm vui nguồn động lực cho mẹ Tôi xin cảm ơn khoa Công nghệ thông tin – Trƣờng Đại học Công nghệ Tp Hồ Chí Minh, thầy Võ Đình Bảy góp ý, định hƣớng, động viên tinh thần thƣờng xuyên cho tập thể lớp Cao học 14SCT11 Xin cảm ơn bạn bè đồng nghiệp trƣờng Đại học Công nghiệp thực phẩm TP.HCM, anh chị, bạn lớp Cao học giúp đỡ chia sẻ với trình học tập thực luận văn Trần Thị Vân Anh iii TĨM TẮT Trong đào tạo tín chỉ, sinh viên đƣợc tự đăng ký học phần Trong số học phần phải đăng ký có học phần có thuộc tính bắt buộc có học phần có thuộc tính tự chọn Đối với học phần bắt buộc, sinh viên đƣợc yêu cầu phải hoàn thành Đối với học phần tự chọn, sinh viên có quyền chọn học phần theo ý riêng Đối với sinh viên chƣa tìm hiểu rõ mục tiêu, tính áp dụng học phần tự chọn việc chọn lựa học phần điều mẽ gây tâm lý lúng túng Ngay cố vấn học tập lớp khó tƣ vấn xác cho sinh viên khơng tiếp cận đƣợc chi tiết liệu điểm Do đó, luận văn tiến hành nghiên cứu số giải thuật học có giám sát lĩnh vực máy học sở số liệu thu thập đƣợc kết học tập sinh viên Cụ thể, luận văn nghiên cứu lý thuyết giải thuật: Mạng nơron nhân tạo – ANN (Artificial Neural Networks), Máy vector hỗ trợ - SVM (Support Vector Machines) định - DT (Decision Tree).Trên sở phân tích giải thuật này, luận văn đề xuất sử dụng giải thuật ANN cho toán đặt Trƣớc hết, luận văn giới thiệu tổng quan lĩnh vực khai thác liệu giáo dục (EDM) cơng trình nghiên cứu liên quan Đặc biệt, luận văn tập trung vào nghiên cứu áp dụng giải thuật học có giám sát để khai thác liệu học tập sinh viên Nội dung chƣơng 2, luận văn giới thiệu giải thuật học có giám sát vào nghiên cứu chi tiết giải thuật ANN, SVM DT Dựa ngôn ngữ C#, chƣơng luận văn trình bày phần cài đặt thực nghiệm giải thuật ANN Trong chƣơng 4, luận văn tiến hành đánh giá kết thực nghiệm đƣa kết luận đồng thời trình bày hạn chế chƣa thực đƣợc định hƣớng phát triển tƣơng lai iv ABSTRACT In academic credit system, students need to register subjects by themselves Some of these subjects are compulsory and some others are optional For the compulsory subjects, students have to complete all of these subjects For the optional subjects, students can select the subjects that they prefer In case students without understanding the objectives and applicability of the optional subjects, selecting new subjects may cause embarrassed Moreover, their advisors may also hardly provide suitable advices to students as these advisors not clear about the ability of each student Therefore, this thesis studied some supervised learning algorithms in the field of machine learning based on student result Specifically, we applied theoretically three algorithms: ANN (Artificial Neural Networks), SVM (Support Vector Machines) and DT (Decision Tree) The derived results then proposed to use ANN algorithm to solve the given problem Firstly, thesis provided an overview of the field of educational data mining (EDM) and other relevant studies In particular, the thesis focused on the study applied supervised learning algorithms for data mining student result In chapter 2, thesis introduced generally theory of supervised learning algorithms and focused more into ANN, SVM and DT algorithms Based on the C # language, the experimental settings for the ANN algorithm were given in chapter Finally, chapter was to assess empirical and provide conclusions This chapter also identified some limitations of the thesis and provided the orientation for future study v MỤC LỤC LỜI CAM ĐOAN i LỜI CÁM ƠN .ii TÓM TẮT iii ABSTRACT iv MỤC LỤC v DANH MỤC CÁC TỪ VIẾT TẮT vii DANH MỤC CÁC BẢNG viii DANH MỤC BIỂU ĐỒ, ĐỒ THỊ, HÌNH ẢNH ix MỞ ĐẦU 10 CHƢƠNG 1.TỔNG QUAN 12 1.1 Giới thiệu 12 1.2 Giới thiệu khai thác liệu giáo dục (EDM) 14 1.2.1 EDM ứng dụng dự báo đánh giá khả ngƣời học 16 1.2.2 EDM ứng dụng phân tích hành vi ngƣời học 17 1.3 Các vấn đề luận văn cần nghiên cứu 18 1.4 Tổng kết chƣơng 20 CHƢƠNG 2.CƠ SỞ LÝ THUYẾT 21 2.1 Tổng quan học có giám sát (Supervised Learning) 21 2.1.1 Giới thiệu 21 2.1.2 Tổng quan giải thuật học có giám sát 21 2.2 Giải thuật máy vector hỗ trợ - SVM 24 2.2.1 Giới thiệu giải thuật SVM 24 2.2.2 SVM tuyến tính .24 2.2.3 SVM đa lớp 34 2.3 Cây định .35 2.3.1 Cấu trúc định 35 2.3.2 Các kiểu Cây định .36 2.3.3 Các bƣớc để xây dựng 37 vi 2.3.4 Một số ƣu điểm định 38 2.3.5 Một số điểm yếu định 40 2.3.6 Thuật toán ID3 40 2.3.7 Thuật toán C4.5 48 2.4 Mạng ANN .55 2.4.1 Giới thiệu 55 2.4.2 Cấu trúc mạng Nơron 55 2.4.3 Phân loại cấu trúc mạng Nơron 56 2.4.4 Hàm hoạt động 57 2.4.5 Tiến trình học 57 2.4.6 Giải thuật Back – Propagation 59 2.5 Đánh giá giải thuật 61 2.6 Tổng kết chƣơng 63 CHƢƠNG 3.CÀI ĐẶT THỰC NGHIỆM 64 3.1 Mơ tả tốn 64 3.2 Tiền xử lý liệu 66 3.3 Cài đặt thực nghiệm .67 3.3.1 Ví dụ thực nghiệm 70 3.4 Tổng kết chƣơng 75 CHƢƠNG 4.KẾT LUẬN 76 DANH MỤC TÀI LIỆU THAM KHẢO 77 vii DANH MỤC CÁC TỪ VIẾT TẮT Chữ viết tắt Thuật ngữ tiếng Anh Diễn giải ANN Artificial Neural Networks Mạng ANN DM Data Mining Khai thác liệu DT Decision tree Cây định EDM Education Data Mining Khai thác liệu giáo dục LMS Learning managerment systems Hệ thống quản trị học ITS Intelligent tutoriol system Hệ thống hƣớng dẫn thông minh SVM Support Vector Machines Máy vector hỗ trợ KNN K Nearest Neighbours K láng giềng gần NB Naïve Bayer Mạng NB SRM Structural Risk Minimization Cực tiểu hóa rủi ro có cấu trúc viii DANH MỤC CÁC BẢNG Bảng 1.1 Kế hoạch đào tạo học kỳ hệ Đại học ngành Công nghệ sinh học 12 Bảng 2.1 Bảng liệu chơi golf .36 Bảng 3.1 Khung chƣơng trình đào tạo học kỳ ngành Công nghệ sinh học 63 Bảng 3.2 Khung chƣơng trình đào tạo học kỳ ngành Công nghệ sinh học 64 ... TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM - TRẦN THỊ VÂN ANH KHAI PHÁ DỮ LIỆU KẾT QUẢ HỌC TẬP SINH VIÊN TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TP HCM LUẬN VĂN THẠC SĨ Chuyên ngành : Công nghệ... dụng khai thác liệu vào lĩnh vực giáo dục chủ yếu ứng dụng khai thác liệu từ thông tin cá nhân sinh viên, kết hợp khai thác liệu từ thông tin kết tuyển sinh sinh viên để dự đoán kết học tập Trong... cố vấn học tập để hỗ trợ sinh viên vấn đề Nhƣng với số lƣợng sinh viên lớp đông cố vấn học tập tiếp cận chi tiết đến liệu điểm số sinh viên nên cố vấn học tập chƣa sâu sát đƣợc đến sinh viên để

Ngày đăng: 09/07/2021, 18:17

Mục lục

    1.2. Giới thiệu về khai thác dữ liệu giáo dục (EDM)

    1.3. Các vấn đề luận văn cần nghiên cứu

    CHƯƠNG 2. CƠ SỞ LÝ THUYẾT

    2.1. Tổng quan về học có giám sát (Supervised Learning)

    2.1.2. Tổng quan về giải thuật học có giám sát

    2.2. Giải thuật máy vector hỗ trợ - SVM

    2.2.1. Giới thiệu giải thuật SVM

    2.3.1. Cấu trúc của cây quyết định

    2.3.2. Các kiểu Cây quyết định

    2.3.3. Các bước chính để xây dựng cây

Tài liệu cùng người dùng

Tài liệu liên quan