ĐỒ ÁN CHUYÊN NGÀNH HỆ THỐNG THÔNG TIN QUẢN LÝ ĐỀ TÀI KHAI THÁC DỮ LIỆU ĐIỂM, ĐƯA RA CẢNH BÁO VÀ GỢI Ý HỌC TẬP CHO SINH VIÊN.pdf

59 2 0
ĐỒ ÁN CHUYÊN NGÀNH HỆ THỐNG THÔNG TIN QUẢN LÝ ĐỀ TÀI KHAI THÁC DỮ LIỆU ĐIỂM, ĐƯA RA CẢNH BÁO VÀ GỢI Ý HỌC TẬP CHO SINH VIÊN.pdf

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC HOA SEN KHOA CÔNG NGHỆ THÔNG TIN ĐỒ ÁN CHUYÊN NGÀNH HỆ THỐNG THÔNG TIN QUẢN LÝ Tên đề tài: KHAI THÁC DỮ LIỆU ĐIỂM, ĐƯA RA CẢNH BÁO VÀ GỢI Ý HỌC TẬP CHO SINH VIÊN Giảng viên hướng dẫn : ThS Bùi Ngọc Lê : ThS Nguyễn Thị Thanh Thanh Lớp : HQ1911 Thời gian thực : Từ 28/03/2022 đến 02/07/2022 Nhóm sinh viên thực : Nguyễn Việt Nam Số nhóm MSSV: 2190354 : Lê Quỳnh Giang MSSV: 2198644 : Trịnh Chiến Thắng MSSV: 2197858 : Cao Thái Sơn MSSV: 2197602 :2 THÁNG 07 / 2022 TRÍCH YẾU Đề án thực nhằm xây dựng hai mơ hình khai thác liệu để đề xuất học tập đưa cảnh báo học tập cho sinh viên Đại học Hoa Sen Đồng thời với mơ hình này, chúng tơi muốn xây dựng Thơng qua q trình thực đề án, chúng tơi hồn tất việc xây dựng hai mơ hình khai thác thu nạp kết mang tính chất tham khảo Đối với mơ hình khai thác liệu điểm để đưa đề xuất học tập cho sinh viên Hoa Sen, thu 36 luật kết hợp phù hợp với ngữ cảnh thực tế Trong đó, có luật kết hợp liên quan đến mơn chuyên ngành Hệ thống thông tin quản lý mà cho phù hợp để đề xuất Đối với mơ hình khai thác liệu điểm để đưa cảnh báo học tập cho sinh viên Hoa Sen, thu môn học mà sinh viên rớt có nguy trễ so với lộ trình mẫu ngành Trong đó, chúng tơi ghi nhận kết sinh viên ngành Hệ thống thơng tin quản lý khố 18 chưa hồn thành Đề án chun ngành Hệ thống thơng tin quản lý bị trễ so với lộ trình mẫu ngành i LỜI CẢM ƠN Nhóm chúng tơi xin dành lời cảm ơn chân thành đến Thạc sĩ Nguyễn Thị Thanh Thanh, Thạc sĩ Bùi Ngọc Lê tận tình hướng dẫn, hỗ trợ nhóm việc giải đáp thắc mắc trình thực góp ý xây dựng đề án Bên cạnh đó, chúng tơi xin bày tỏ biết ơn đến thầy cô thuộc Khoa Cơng Nghệ Thơng Tin hỗ trợ cung cấp liệu điểm sinh viên ngành MIS K18 để giúp chúng tơi có liệu đầu vào để thực đề án ii NHẬN XÉT CỦA GIẢNG VIÊN Thành Phố Hồ Chí Minh, Ngày … Tháng … Năm 2021 NGƯỜI NHẬN XÉT iii MỤC LỤC TRÍCH YẾU .i LỜI CẢM ƠN ii NHẬN XÉT CỦA GIẢNG VIÊN iii MỤC LỤC iv DANH MỤC HÌNH ẢNH vi NHẬP ĐỀ .viii PHẦN 1: GIỚI THIỆU ĐỀ TÀI 1.1 Bối cảnh thực tế 1.2 Phạm vi nghiên cứu .1 1.3 Mục tiêu đề tài .1 1.4 Tổng quan mơ hình khai thác PHẦN 2: CƠ SỞ LÝ THUYẾT 2.1 Thuật toán Apriori .3 2.1.1 Giới thiệu thuật toán 2.1.2 Nguyên lý hoạt động 2.1.3 Ứng dụng Apriori 2.1.4 Một số mặt hạn chế Apriori .4 2.2 Thuật toán Decision Trees 2.2.1 Giới thiệu thuật toán 2.2.2 Nguyên lý hoạt động 2.2.3 Một số mặt hạn chế Decision Trees PHẦN 3: CÔNG CỤ SỬ DỤNG 2.1 Giới thiệu sơ lược công cụ 2.2 Lý chọn công cụ iv PHẦN 4: QUÁ TRÌNH KHAI THÁC DỮ LIỆU CHO MỤC ĐÍCH ĐỀ XUẤT HỌC TẬP 4.1 Trích xuất 4.2 Chuẩn hoá 4.3 Tải liệu vào SQL Server .10 4.4 Thực khai thác 14 4.5 Xử lý, sàng lọc kết thu .21 PHẦN 5: QUÁ TRÌNH KHAI THÁC DỮ LIỆU CHO MỤC ĐÍCH ĐƯA RA CẢNH BÁO HỌC TẬP CHO SINH VIÊN 25 5.1 Chuẩn hoá 25 5.2 Tải liệu vào SQL Server 27 5.3 Thực khai thác .30 PHẦN 6: ĐÁNH GIÁ KẾT QUẢ THỰC HIỆN & ĐỀ XUẤT MÔ HÌNH 47 KẾT LUẬN 49 TÀI LIỆU THAM KHẢO .50 v DANH MỤC HÌNH ẢNH Hình Tổng quan mơ hình khai thác liệu Hình Bảng liệu thơ ban đầu Hình Bảng liệu thơ sau loại bỏ trường liệu không cần thiết Hình Bảng liệu thu sau loại bỏ hàng liệu trùng lặp giá trị trung bình mơn học Hình Bảng thơng tin điểm trung bình sinh viên Hình Bảng thông tin môn học .8 Hình Bảng lưu trữ thông tin sinh viên Hình Bảng liệu điểm trung bình chuẩn hố 10 Hình Bảng thơng tin mơn học sau chuẩn hoá .10 Hình 10 Tải liệu lên Microsoft SQL Server - Bước .11 Hình 11 Tải liệu lên Microsoft SQL Server - Bước 11 Hình 12 Tải liệu lên Microsoft SQL Server - Bước 12 Hình 13 Tải liệu lên Microsoft SQL Server - Bước .12 Hình 14 Tải liệu lên Microsoft SQL Server – Bước 13 Hình 15 Tải liệu lên Microsoft SQL Server - Bước .13 Hình 16 Điều chỉnh kiểu liệu bảng DiemTB 13 Hình 17 Điều chỉnh kiểu liệu bảng MonHoc 14 Hình 18 Điều chỉnh kiểu liệu bảng Sinhvien 14 Hình 19 Giao diện chức khai thác liệu SQL Server Analysis Service .14 Hình 20 Giao diện chọn phương pháp khai thác liệu 15 Hình 21 Giao diện chọn thuật tốn khai thác liệu 15 Hình 22 Giao diện chọn nguồn liệu để thực khai thác 16 Hình 23 Giao diện chọn bảng liệu để tiến hành khai thác 16 Hình 24 Giao diện định nghĩa giá trị đầu vào thuật tốn 17 Hình 25 Định nghĩa khoá cho bảng liệu 17 Hình 26 Giao diện thiết lập phần trăm liệu dùng để kiểm thử luật kết hợp 18 Hình 27 Giao diện thiết lập tên thuật toán .18 Hình 28 Mơ hình quan hệ hai bảng liệu 19 Hình 29 Thiết lập thước đo cho thuật tốn 19 Hình 30 Thiết lập thước đo thuật toán 19 Hình 31 Tạo dự án để thực khai thác liệu .20 Hình 32 Giao diện thơng báo thuật tốn triển khai thành cơng 20 Hình 33 Những luật kết hợp thu từ thuật toán Apriori 21 Hình 34 Chuẩn hố kết thu - Bước 2(1) .22 Hình 35 Chuẩn hố kết thu - Bước 2(2) .22 Hình 36 Cơng thức tìm tên mơn học cho vế điều kiện 22 Hình 37 Cơng thức tìm tên mơn học cho vế điều kiện 23 Hình 38 Bảng liệu lưu thơng tin điểm trung bình sinh viên .25 Hình 39 Bảng thống kê tổng số tín sinh viên tiến độ so với lộ trình học ngành HQ Khố 18 26 Hình 40 Bảng thơng tin mơn học thuộc lộ trình ngành MIS Khố 18 26 vi Hình 41 Bảng liệu chuẩn hoá (chưa loại bỏ giá trị N/A) 27 Hình 42 Bảng liệu chuẩn hố cho mục đích khai thác (đã xử lý giá trị N/A)27 Hình 43 Chọn nguồn nơi chứa tệp Excel .27 Hình 44 Đặt tên cho Database nơi chứa liệu tải từ tệp Excel .28 Hình 45 Chọn hình thức tải liệu lên SQL Server 28 Hình 46 Chọn trang tính cần tải lên SQL Server 29 Hình 47 Dữ liệu đưa vào SQL Server 29 Hình 48 Bảng liệu tải lên SQL Server thành công 30 Hình 49 Thực khai thác liệu (Bước 1) .30 Hình 50 Thêm nguồn liệu cho công đoạn khai thác liệu (Bước 2) 31 Hình 51 Thơng tin cổng kết nối với SQL Server (Bước 2.1) .31 Hình 52 Định dạng cách thức kết nối liệu với SQL Server (Bước 2.2) 32 Hình 53 Đặt tên cho nguồn liệu (Bước 2.3) 32 Hình 54 Tạo view cho nguồn liệu 33 Hình 55 Chọn nguồn liệu thêm vào Data Source Wizard 33 Hình 56 Chọn logic quan hệ trường liệu 34 Hình 57 Thêm bảng liệu từ nguồn liệu vào View 34 Hình 58 Đặt tên cho View 35 Hình 59 Thiết lập Logical Primary Key cho thuộc tính MASV View .35 Hình 60 View Mining Canh Bao .36 Hình 61 View Mining Canh Bao .36 Hình 62 Bắt đầu thực khai thác liệu (Bước 1) 37 Hình 63 Chọn nguồn liệu có (Bước 2) 37 Hình 64 Chọn thuật tốn khai thác liệu – Decision Trees (Bước 3) .38 Hình 65 Chọn view liệu để tiến hành khai thác (Bước 4) .38 Hình 66 Chọn loại bảng (Bước 5) 39 Hình 67 Thiết lập cài đặt cho trường liệu view chọn (Bước 6) 39 Hình 68 Điều chỉnh kiểu liệu cho trường liệu (Bước 7) 40 Hình 69 Thiết lập số testing cho mơ hình khai thác (Bước 8) 40 Hình 70 Đặt tên cho mơ hình khai thác (Bước 9) 41 Hình 71 Thiết lập thước đo cho thuật tốn (Bước 10) 41 Hình 72 Các số thước đo cho thuật toán 42 Hình 73 Kết mơ hình khai thác .42 Hình 74 Cây định với 0% testing (chưa loại bỏ môn học missing) .43 Hình 75 Cây định với 10% testing (chưa loại bỏ môn học missing) 43 Hình 76 Cây định với 20% testing (chưa loại bỏ mơn học missing) 43 Hình 77 Cây định với 30% testing (chưa loại bỏ giá trị missing) 44 Hình 78 Cây định với 0% testing (đã loại bỏ giá trị missing) 44 Hình 79 Cây định với 10% testing (đã loại bỏ giá trị missing) 45 Hình 80 Cây định với 20% testing (đã loại bỏ giá trị missing) 45 Hình 81 Cây định với 30% testing (đã loại bỏ giá trị missing) 46 Hình 82 36 luật kết hợp thu sau sàng lọc hoàn toàn 47 vii NHẬP ĐỀ Cải thiện chất lượng giáo dục trường đại học vấn đề quan tâm nhà quản lý chương trình đào tạo Trong đó, trường Đại học Hoa Sen, việc nắm bắt tình trạng học tập chung sinh viên để đưa đề xuất học tập cảnh báo phù hợp chưa thực hiệu dẫn đến tỉ lệ tốt nghiệp hạn trường Đại học Hoa Sen năm gần tương đối thấp Một phần nơi chưa có hệ thống đề xuất cảnh báo học tập thông minh để sinh viên ý thức kiểm sốt tình hình học tập thân nhằm phục vụ cho q trình học hiệu có kết học tập tốt Từ đó, giúp cải thiện tình trạng trường trễ hạn sinh viên Hoa Sen viii PHẦN 1: GIỚI THIỆU ĐỀ TÀI 1.1 Bối cảnh thực tế Theo (Thanh, Le, & Tam, 2018), đánh giá lực sinh viên chất lượng chương trình đào tạo vấn đề lớn quan tâm trường Đại học Việt Nam Đối với người quản lý cấp cao phụ trách chất lượng chương trình đào tạo cần thơng tin liệu tình hình học tập chung sinh viên thuộc chương trình họ Đối với sinh viên bạn mong muốn có đề xuất học tập hiệu cho học kì sau dựa kết học tập có bạn từ trước Hiểu vấn đề đó, nhóm chúng tơi định thực đề tài nhằm góp phần đem lại giải pháp cho để giải nhu cầu cấp thiết 1.2 Phạm vi nghiên cứu Trong đề tài này, nhóm chúng tơi chủ yếu tập trung vào liệu đầu vào điểm thành phần sinh viên Hoa Sen môn học Chúng loại trừ yếu tố khách quan khác tình hình tài sinh viên, yếu tố gây ảnh hưởng đến trải nghiệm sinh viên trường đại học Hoa Sen 1.3 Mục tiêu đề tài Thông qua đề tài này, chúng tơi mong muốn xây dựng mơ hình khai thác liệu điểm sinh viên Đại học Hoa Sen nhằm hỗ trợ giám đốc chương trình, quản lý phòng đào tạo trường Đại học Hoa Sen để đưa định điều chỉnh chương trình học, đề cương mơn học nhằm mục đích mang lại kết tốt nhất, hiệu cho sinh viên ngành MIS Đại học Hoa Sen ... ngữ cảnh thực tế Trong đó, có luật kết hợp liên quan đến môn chuyên ngành Hệ thống thông tin quản lý mà cho phù hợp để đề xuất Đối với mơ hình khai thác liệu điểm để đưa cảnh báo học tập cho sinh. .. môn học mà sinh viên rớt có nguy trễ so với lộ trình mẫu ngành Trong đó, ghi nhận kết sinh viên ngành Hệ thống thơng tin quản lý khố 18 chưa hồn thành Đề án chun ngành Hệ thống thơng tin quản lý. .. hình khai thác Do đề tài bao gồm hai vế khai thác liệu để đề xuất học tập cho sinh viên cảnh báo học tập Chúng thực hai mơ hình khác với cách thức chuẩn hoá liệu khác để phù hợp với mục đích khai

Ngày đăng: 23/11/2022, 12:10

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan