Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 108 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
108
Dung lượng
1,35 MB
Nội dung
- ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KINH TẾ ́ ̣c K in h tê ́H uê KHOA HỆ THỐNG THƠNG TIN KINH TẾ ho KHĨA LUẬN TỐT NGHIỆP Tr ươ ̀ng Đ ại ỨNG DỤNG KỸ THUẬT KHAI PHÁ LUẬT KẾT HỢP VÀO VIỆC TƯ VẤN HỌC TẬP CHO SINH VIÊN CHUYÊN NGÀNH TIN HỌC KINH TẾ - TRƯỜNG ĐẠI HỌC KINH TẾ - ĐẠI HỌC HUẾ Người hướng dẫn: ThS Dương Thị Hải Phương Người thực hiện: Sinh Viên Phan Trọng Lưu Huế, 04/2018 - LỜI CẢM ƠN Lời đầu tiên, em xin gửi lời cảm ơn sâu sắc đến quý thầy cô giáo trường Đại học Kinh tế Huế đặc biệt quý thầy cô Khoa Hệ thống Thông tin Kinh tế truyền dạy ́ uê cho em nhiều kiến thức kinh nghiệm quý báu suốt trình học tập trường tạo điều kiện hỗ trợ cho em hoàn thành đề tài ́H Em xin gửi lời cảm ơn chân thành đến Thạc sĩ Dương Thị Hải Phương, tận tình tê truyền dạy kinh nghiệm kiến thức quý báu hỗ trợ em suốt h trình làm thực đề tài Cô giúp đỡ em nhiều từ việc lên ý tưởng đề tài ban đầu in hướng dẫn thực đề tài sau góp ý để đề tài hồn thành tốt ̣c K Em xin gửi lời cảm ơn đến Trường Đại học Kinh tế - Đại học Huế tạo điều kiện cho em thực tập cung cấp sở liệu ban đầu điều kiện ho thuận lợi khác để em hoàn thành tốt đề tài ại Cuối em xin gửi lời cảm ơn chân thành đến bố mẹ, người thân bạn bè Đ khích lệ động viên em suốt thời gian qua để em hồn thành tốt đề tài Mặc dù có nhiều cố gắng, thời gian, kĩ thân nhiều hạn Tr ươ ̀ng chế nên tránh khỏi sai sót, mong q thầy, bạn đóng góp, bảo để đề tài hồn thiện Em xin chân thành cảm ơn! Huế, năm 2018 Sinh viên Phan Trọng Lưu - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương MỤC LỤC MỤC LỤC i DANH MỤC CÁC TỪ VIẾT TẮT iv DANH MỤC BẢNG v DANH MỤC HÌNH vi ́ uê PHẦN MỞ ĐẦU ́H Lý chọn đề tài Mục tiêu nghiên cứu tê Đối tượng phạm vi nghiên cứu h Phương pháp nghiên cứu in Cấu trúc khóa luận ̣c K PHẦN NỘI DUNG 1.1 ho CHƯƠNG TỔNG QUAN VỀ KHUNG ĐÀO TẠO “TIN HỌC KINH TẾ” CỦA TRƯỜNG ĐẠI HỌC KINH TẾ - ĐẠI HỌC HUẾ Giới thiệu chung Trường đại học Kinh tế - Đại học Huế Lịch sử hình thành phát triển 1.1.2 Hoạt động đào tạo 1.1.3 Đề tài nghiên cứu khoa học 1.1.4 Hợp tác quốc tế Đ Tr ươ ̀ng 1.2 ại 1.1.1 Giới thiệu chung Khoa Hệ thống thông tin kinh tế 10 1.2.1 Quá trình hình thành Khoa Hệ thống thông tin kinh tế 10 1.2.2 Chức nhiệm vụ .11 1.2.3 Hoạt động đào tạo nghiên cứu khoa học 11 1.3 Khung chương trình đào tạo Chuyên ngành Tin học kinh tế 13 1.3.1 Mục tiêu đào tạo .13 1.3.2 Thời gian đào tạo 14 1.3.3 Khối lượng kiến thức tồn khóa 14 SVTH: Phan Trọng Lưu i - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương 1.3.4 Đối tượng tuyển sinh 14 1.3.5 Quy trình đào tạo, điều kiện tốt nghiệp 15 1.3.6 Thang điểm 15 1.3.7 Nội dung chương trình kế hoạch dự kiến 15 CHƯƠNG KHAI PHÁ LUẬT KẾT HỢP 19 2.1 Tổng quan Khai phá liệu 19 2.1.2 Quá trình khai phá liệu 19 ́H Tập hợp liệu 20 2.1.2.2 Trích lọc liệu .20 2.1.2.3 Tiền xử lý chuẩn bị liệu 20 2.1.2.4 Chuyển đổi liệu 21 2.1.2.5 Khai phá liệu .21 2.1.2.6 Đánh giá kết mẫu 21 ̣c K in h tê 2.1.2.1 Tổng quan Khai phá luật kết hợp 21 ho 2.2 ́ Khái niệm khai phá liệu 19 uê 2.1.1 Giới thiệu chung khai phá luật kết hợp 21 2.2.2 Một số khái niệm 21 2.2.3 Bài toán khai phá luật kết hợp 23 Đ 2.2.3.1 Phát biểu toán 23 2.2.3.2 Phát tập mục phổ biến 24 2.2.3.3 Sinh luật kết hợp từ tập mục phổ biến 30 Tr ươ ̀ng 2.3 ại 2.2.1 Luật kết hợp phân lớp 31 2.3.1 Giới thiệu luật kết hợp phân lớp 31 2.3.2 Một số khái niệm định nghĩa 32 2.4 Ứng dụng Luật kết hợp 33 2.5 Một số nghiên cứu liên quan 34 CHƯƠNG KHAI PHÁ LUẬT KẾT HỢP TRONG CƠ SỞ DỮ LIỆU ĐIỂM CỦA SINH VIÊN CHUYÊN NGÀNH TIN HỌC KINH TẾ 40 SVTH: Phan Trọng Lưu ii - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương 3.1 Phát biểu toán nghiên cứu 40 3.2 Giới thiệu phần mềm khai phá liệu Weka 41 3.2.1 Giới thiệu chung 42 3.2.2 Môi trường Explorer 43 3.3 Quy trình khai phá liệu điểm sinh viên phần mềm Weka 49 3.3.2 Tiền xử lý liệu toán 50 3.3.3 Tiến hành khai phá liệu điểm thuật toán Apriori Weka 51 ́H ́ Cơ sở liệu toán 49 uê 3.3.1 tê 3.4 Kết đánh giá kết trình khai phá liệu điểm sinh viên dựa thuật toán Apriori Luật kết hợp .54 Về mối quan hệ mật thiết học phần 54 3.4.2 Về mối quan hệ học phần lựa chọn học phần lại 67 3.4.3 Về mối quan hệ nhóm mơn học 78 in ̣c K 3.4.3.1 Nhóm mơn Tin học 78 3.4.3.2 Nhóm mơn Kinh tế 87 ho 3.5 h 3.4.1 Đề xuất tư vấn học tập cho sinh viên Chuyên ngành Tin học kinh tế 89 ại PHẦN KẾT LUẬN 97 Đ Kết đạt 97 Tr ươ ̀ng Hạn chế khóa luận .97 Hướng phát triển đề tài .98 TÀI LIỆU THAM KHẢO .99 SVTH: Phan Trọng Lưu iii - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương DANH MỤC CÁC TỪ VIẾT TẮT CAR-Miner: Classification Association Rules - Miner CAR-Miner-Diff: Classification Association Rules – Miner – Diff CBA: Classification Based Association CMAR: Classification Based on Multiple Association Rules ́ uê CSDL: Cơ sở liệu ECR-CARM: Equivalence Class Rule – Class Association Rule Mining KPDL: Khai phá liệu h MCAR: Multiple Classification Association Rules tê ́H KDD - Knowledge Discovery in Database Tr ươ ̀ng Đ ại ho ̣c K in MMAC: Multi-Class, Multi-Label Associative Classification SVTH: Phan Trọng Lưu iv - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương DANH MỤC BẢNG ́ Tr ươ ̀ng Đ ại ho ̣c K in h tê ́H uê Bảng 1 Khung chương trình đào tạo chuyên ngành Tin học kinh tế 15 Bảng Cơ sở liệu ví dụ gồm giao dịch 28 Bảng 2 Một ví dụ sở liệu huấn luyện mẫu 32 Bảng Ví dụ sở liệu điểm gồm 100 giao dịch 41 Bảng Kết thực thuật toán Apriori dựa tham số min-sup = 0.1; min-conf = 0.6 tìm mối quan hệ mật thiết môn học 54 Bảng 3 Kết thực thuật toán Apriori dựa tham số Apriori (car = true); min-sup = 0.2; min-conf = 0.8 học phần Thực tập cuối khóa 68 Bảng Những tập luật khơng có ý nghĩa thực tế 76 Bảng Kết thực thuật toán Apriori dựa tham số Apriori (car = true); min-sup = 0.2; min-conf = 0.8 học phần Hoạch định nguồn lực doanh nghiệp ERP 78 Bảng Kết thực thuật toán Apriori dựa tham số Apriori (car = true); min-sup = 0.2; min-conf = 0.8 học phần Internet thương mại điện tử so với môn học liên quan 83 Bảng Kết thực thuật toán Apriori dựa tham số Apriori (car = true); min-sup = 0.2; min-conf = 0.8 học phần Phát triển hệ thống thông tin kinh tế so với môn học liên quan 85 Bảng Kết thực thuật toán Apriori dựa tham số Apriori (car = true); min-sup = 0.1; min-conf = 0.6 học phần Ngun lý kế tốn so với mơn học liên quan 87 Bảng Kết thực thuật toán Apriori dựa tham số min-sup = 0.1; min-conf = 0.6 học phần liên quan với nhóm mơn Kinh tế 88 Bảng 10 Số tín tích lũy tối thiểu 90 SVTH: Phan Trọng Lưu v - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương DANH MỤC HÌNH ́ Tr ươ ̀ng Đ ại ho ̣c K in h tê ́H uê Hình 1 Hình ảnh trường Đại học Kinh Tế - Đại học Huế Hình Hợp tác Trường Đại học Kinh tế Huế Đại học quốc gia Chonbuk Hàn Quốc 10 Hình Quá trình khai phá liệu 20 Hình 2 Sơ đồ tổng quan thuật tốn khai phá tập mục phổ biến 25 Hình Ví dụ thuật tốn Apriori 30 Hình Giao diện phần mềm WEKA 42 Hình Giao diện môi trường Explorer 43 Hình 3 Minh họa lớp classify 44 Hình Minh họa lớp cluster 46 Hình Minh họa lớp Associate 47 Hình Minh họa lớp Select attributes 48 Hình Minh họa lớp Visualize 49 Hình Chuyển đổi kiểu liệu 51 Hình Lựa chọn thuật tốn Apriori 52 Hình 10 Thiết lập tham số thuật tốn Apriori 53 Hình 11 Các tập luật sinh thuật tốn Apriori 54 Hình 12 Chuỗi phân bố điểm mơn học cần tích lũy qua năm 96 SVTH: Phan Trọng Lưu vi - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương PHẦN MỞ ĐẦU Lý chọn đề tài Trong mơi trường tin học hóa nay, việc nắm bắt thông tin coi sở hoạt động tin học, xử lý số liệu, thống kê lưu trữ liệu Quá trình thu thập ́ uê hiểu thông tin hành động dựa thông tin chọn lọc từ thơng tin có sẵn tạo nên thành cơng hoạt động Chính lý đó, việc tạo thông ́H tin, tổ chức lưu trữ khai thác ngày trở nên quan trọng phát triển không ngừng tê Cơ sở liệu (CSDL) gia tăng làm lĩnh vực đời h sống như: thương mại, khoa học, quản lý, giáo dục làm nảy sinh thúc đẩy phát in triển kỹ thuật thu thập, lưu trữ, phân tích khai phá liệu khơng phép ̣c K tính tốn đơn giản thơng thường như: phép đếm, thống kê… mà cịn địi hỏi cách xử lý thông minh hơn, hiệu Từ nhà quản lý người sử dụng có ho thơng tin hữu ích cho hoạt động tri thức Các kỹ thuật cho phép ta khai thác tri thức hữu dụng từ Cơ sở liệu (lớn) gọi kỹ thuật khai phá liệu (DM- Data Đ ại Mining) Kỹ thuật khám phá tri thức khai phá liệu nghiên cứu, ứng Tr ươ ̀ng dụng nhiều lĩnh vực khác nước tiên tiến giới Tại Việt Nam, kỹ thuật tương đối mẻ, nhiên nghiên cứu dần đưa vào ứng dụng Khai phá liệu (Data Mining) coi q trình trích xuất thơng tin có giá trị tiềm ẩn bên lượng lớn liệu lưu trữ CSDL, kho liệu… Hiện nay, thuật ngữ khai phá liệu, người ta dùng số thuật ngữ khác có ý nghĩa tương tự như: Khám phá tri thức từ sở liệu (Knowledge Discovery in Database-KDD), trích lọc liệu (knowledge extraction), phân tích liệu/mẫu (data/pattern analysis), khảo cổ liệu (data archacology), nạo vét liệu (data dredging) SVTH: Phan Trọng Lưu - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương Luật kết hợp dạng luật đơn giản lại mang nhiều ý nghĩa Thông tin mà dạng luật đem lại đáng kể hỗ trợ khơng nhỏ q trình định Tìm kiếm luật kết hợp quý mang nhiều thông tin từ CSDL tác nghiệp hướng tiếp cận lĩnh vực khai thác liệu Khai phá luật kết hợp nội dung quan trọng khai phá liệu bật thuật toán Apriori - thuật toán đời sớm Khai phá luật kết hợp ứng dụng nhiều ́ uê lĩnh vực kinh tế, tài chính, y tế, giáo dục,…Trong lĩnh vực giáo dục, khai phá luật kết ́H hợp sử dụng vào nghiên cứu nhằm cải thiện thái độ, hành vi sinh viên, tư vấn lựa chọn môn học, ngành học tê Trường Đại học Kinh tế - Đại Học Huế thành lập gần 50 năm, với 13 ngành h đào tạo thu hút hàng nghìn sinh viên theo học nhiều năm qua Trong đó, Khoa in Hệ thống thông tin kinh tế khoa thành lập cịn non trẻ, Khoa có ̣c K chức quan trọng đào tạo nguồn nhân lực có trình độ, nghiên cứu chuyển giao tiến khoa học kỹ thuật thuộc lĩnh vực Hệ thống Thơng tin Quản lý Bên cạnh đó, ho Khoa đảm trách đào tạo môn học thuộc chương trình sở, cụ thể mơn học Thống kê, Tốn kinh tế Tin học Kinh tế cho tất ngành học ại Trường trường thành viên Đại học Huế có liên quan Khoa trọng Đ đào tạo song song hai chuyên ngành Thống kê kinh doanh Tin học kinh tế So với Tr ươ ̀ng chuyên ngành khác, Tin học kinh tế chuyên ngành đào tạo cịn mẻ có số đặc thù khác Ngoài học phần thuộc khối kiến thức đại cương giáo dục chuyên nghiệp, học phần thuộc khối kiến thức chuyên ngành khác biệt so với chuyên ngành khác trường Do đó, phần lớn sinh viên chuyên ngành Tin học kinh tế thường bỡ ngỡ tiếp cận với khung chương trình đào tạo Một số sinh viên rơi vào tình trạng chán nản, bỏ bê việc học, dẫn đến kết học tập không mong muốn Vậy, học phần khung chương trình đào tạo Tin học kinh tế có quan hệ mật thiết với hay không? Kết học tập học phần ảnh hưởng đến kết học tập học phần khác nào? Làm để thiết kế lộ trình học phù hợp để đạt kết học tập theo mong muốn? SVTH: Phan Trọng Lưu - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương Hoach dinh nguon luc doanh nghiep (ERP) (3)=A Lap trinh ung dung quan ly (3)=A 72 ==> Phat trien he thong thong tin kinh te (3)=A 61 conf:(0.85) Lap trinh ung dung quan ly (3)=A 83 ==> Phat trien he thong thong tin kinh te (3)=A 70 conf:(0.84) Hoach dinh nguon luc doanh nghiep (ERP) (3)=A Internet va thuong mai dien ́ conf:(0.8) ́H tin kinh te (3)=A 72 uê tu (3)=A He thong thong tin quan ly (3)=B 90 ==> Phat trien he thong thong tê Các học phần ảnh hưởng đến học phần “Phát triển hệ thống thông tin kinh tế” bao h gồm học phần, luật kết hợp khai phá: in (1) Internet thương mại điện tử (2/4 luật) = A ̣c K (2) Hoạch định nguồn lực doanh nghiệp (2/4 luật) = A (3) Lập trình ứng dụng quản lý (2/4 luật) = A ho (4) Hệ thống thông tin quản lý (1/4 luật) = B ại Từ 11 học phần học nhóm Tin học có học phần ảnh hưởng trực Đ tiếp đến kết học phần đích lựa chọn “Phát triển hệ thống thông tin kinh tế” Nếu học phần xác định lựa chọn sinh viên mong muốn đạt điểm A Tr ươ ̀ng thiết học phần “Internet thương mại điện tử”, “Hoạch định nguồn lực doanh nghiệp”, “Lập trình ứng dụng quản lý” phải đạt điểm A môn học “Hệ thống thơng tin quản lý” đạt mức điểm B trở lên với độ tin cậy từ 80% đến 87% Cùng sử dụng tham số thuật toán Apriori giá trị độ hỗ trợ (min-sup = 0.2); độ tin cậy (min-conf = 0.8), khảo sát mối quan hệ môn với môn xác định (car = true), số học phần khác nhóm Tin học lại không thu tập luật mong muốn Không thu tập luật, không đồng nghĩa học phần không liên quan đến nhau, mà học phần có mức điểm sinh viên thấp nên Apriori đưa tập luật xác định Bên cạnh đó, mơn học “Internet SVTH: Phan Trọng Lưu 86 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương thương mại điện tử”, “Hoạch định nguồn lực doanh nghiệp”, “Lập trình ứng dụng quản lý”, “Hệ thống thông tin quản lý”, “Mạng truyền thông”, “Phát triển hệ thống thông tin kinh tế” thường xuyên xuất tập luật, cho thấy nhóm học phần có mức độ liên quan với nhau, bổ trợ kiến thức cho q trình học tập sinh viên 3.4.3.2 Nhóm môn Kinh tế ́ uê Không học phần nhóm Tin học liên quan với nhau, học phần ́H thuộc nhóm Kinh tế có tương quan với môn với môn Để xem tê xét mối liên hệ môn đó, cần loại bỏ mơn khơng liên quan đến nhóm kinh tế, mơn liên quan đến Tin học, Lý luận trị hai học phần “Thực tập in h nghề nghiệp”, “Thực tập cuối khóa” cịn lại mơn nhóm học phần liên ̣c K quan đến Kinh tế Sau đó, tiến hành xem xét mức độ ảnh hưởng mơn học nhóm Kinh tế thuật toán Apriori luật kết hợp ho Nếu lựa chọn “Nguyên lý kế toán” làm học phần xác định, cần so sánh tương quan với học phần khác, tham số thiết lập Apriori giá trị độ hỗ ại trợ (min-sup = 0.1); độ tin cậy (min-conf = 0.6), khảo sát mối quan hệ học phần Đ xác định (car = true) thu tập luật Bảng 3.8 Tr ươ ̀ng Bảng Kết thực thuật toán Apriori dựa tham số Apriori (car = true); min-sup = 0.1; min-conf = 0.6 học phần Nguyên lý kế toán so với học phần liên quan STT Apriori (car = true); min-sup = 0.1; min-conf = 0.6 Ly thuyet xac suat va thong ke toan (3)=D Toan cao cap (2)=D 45 ==> Nguyen ly ke toan (3)=C 31 conf:(0.69) Kinh te luong (3)=C Ly thuyet xac suat va thong ke toan (3)=D 46 ==> Nguyen ly ke toan (3)=C 30 conf:(0.65) Kinh te vi mo (3)=D 69 ==> Nguyen ly ke toan (3)=C 44 SVTH: Phan Trọng Lưu conf:(0.64) 87 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương Kinh te luong (3)=D 67 ==> Nguyen ly ke toan (3)=C 42 conf:(0.63) Ly thuyet xac suat va thong ke toan (3)=D 101 ==> Nguyen ly ke toan (3)=C 63 conf:(0.62) Kinh te luong (3)=C Kinh te vi mo (3)=C 50 ==> Nguyen ly ke toan (3)=C 31 conf:(0.62) ́ uê Trong tổng thể học phần nhóm “Ngun lý kế toán” phụ thuộc, ́H chịu ảnh hưởng học phần khác nhóm: (2) Kinh tế vĩ mô (1/6 luật) = C in (5) Kinh tế vi mô (1/6 luật) = D ̣c K (4) Toán cao cấp (1/6 luật) = D h (3) Lý thuyết xác suất thống kê toán (3/6 luật) = D tê (1) Kinh tế lượng (2/6 luật) = C Nếu sinh viên mong muốn đạt mức điểm C với học phần “Ngun lý kế tốn”, ho cần phải đạt mức điểm C học phần “Kinh tế lượng”, “Kinh tế vĩ mô”, ại cần đạt tối thiểu múc điểm D học phần “Lý thuyết xác suất thống kê Đ toán”, “Toán cao cấp 2” “Kinh tế vi mô” với độ tin cậy rơi vào khoảng 62% đến 69% Qua đó, cho thấy học phần có mối liên hệ với học phần đích “Ngun lý kế Tr ươ ̀ng tốn”, sinh viên cần tích lũy điểm cao mơn học tốt học phần xác định “Nguyên lý kế tốn” Cịn khơng sử dụng tham số khảo sát mối quan hệ học phần xác định (car = true) giữ nguyên giá trị độ hỗ trợ (min-sup = 0.1); độ tin cậy (min-conf = 0.6), ngồi luật thu có thêm luật khác xuất Bảng Kết thực thuật toán Apriori dựa tham số min-sup = 0.1; min-conf = 0.6 học phần liên quan với nhóm mơn Kinh tế STT min-sup = 0.1; min-conf = 0.6 Nguyen ly ke toan (3)=B Toan cao cap (2)=C 50 ==> Kinh te vi mo (3)=C 33 SVTH: Phan Trọng Lưu 88 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương lift:(1.44) lev:(0.03) [10] conv:(1.5) Nguyen ly ke toan (3)=C Toan cao cap (2)=D 48 ==> Ly thuyet xac suat va thong ke toan (3)=D 31 Nguyen ly thong ke kinh te (3)=C Toan cao cap (2)=C 55 ==> Toan cao cap (2)=C 34 lift:(1.27) lev:(0.02) [7] conv:(1.28) Kinh te vi mo (3)=C Nguyen ly ke toan (3)=B 54 ==> Toan cao cap (2)=C 33 ́ lift:(1.89) lev:(0.05) [14] conv:(1.76) uê ́H lift:(1.29) lev:(0.03) [7] conv:(1.29) Dựa vào luật thấy được, 66% học phần “Nguyên lý kế toán” tê đạt mức điểm B “Tốn cao cấp 2” đạt mức C “Kinh tế vi mô” đạt tới h mức điểm C Với học phần Lý thuyết xác suất thống kê đạt mức điểm D in nguyên lý kế toán đạt điểm C “Toán cao cấp 2” đạt điểm D Nếu ̣c K học phần Nguyên lý thống kê kinh tế Toán cao cấp đạt điểm C điểm C điểm mơn Tốn cao cấp Nhưng “Toán cao cấp 2”, muốn đạt điểm C ho học phần “Kinh tế vi mô” phải đạt điểm C “Nguyên lý kế toán” phải đạt mức điểm ại B Đ Các học phần thuộc nhóm Kinh tế có mức điểm khơng cao sinh viên chuyên ngành Tin học kinh tế, điểm môn thường mức C D, A B thường Tr ươ ̀ng xuất Vì học phần có liên quan với nhau, để đạt mức điểm cao học phần bắt buộc học phần khác phải đạt điểm cao tương tự 3.5 Đề xuất tư vấn học tập cho sinh viên Chuyên ngành Tin học kinh tế Trên sở phân tích, tổng hợp nội dung từ khung chương trình đào tạo Tin học kinh tế, ý kiến đóng góp số giảng viên sinh viên chuyên ngành Tin học kinh tế, đặc biệt dựa kết thu từ trình khai phá luật kết hợp sở liệu quản lý điểm 296 sinh viên lớp Tin học kinh tế từ K42 đến K47, tác giả đề xuất số tư vấn học tập cho sinh viên Tin học kinh tế sau: SVTH: Phan Trọng Lưu 89 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương Cần tìm hiểu kĩ khung chương trình đào tạo dựa nguồn: Sổ tay sinh viên, website khoa http://eis.hce.edu.vn/, website trường http://www.hce.edu.vn/ Tham khảo ý kiến sinh viên trước, giảng viên khoa hay truy cập fanpage khoa Ngành Hệ Thống Thông Tin Quản Lý - Đại Học Kinh Tế Huế để nắm bắt thơng tin liên quan, có thêm kinh nghiệm quan trọng học tập ́ uê Có kế hoạch học tập từ đầu để đảm bảo tốt nghiệp tiến độ ́H thông thường tốt nghiệp sớm Liên quan đến việc chọn học phần để đăng kí học kì/năm, sinh viên cần ý: Ngồi học phần bắt buộc học kì, sinh viên cần lưu ý số tín h tích lũy tối thiểu khối kiến thức tê Kiến thức Bắt buộc Giáo 28 Kiến thức Giáo 56 Tích lũy tối thiểu 34/38 21 74/104 Đ dục chuyên nghiệp ại dục đại cương Tự chọn ho Khối kiến thức ̣c K in Bảng 10 Số tín tích lũy tối thiểu 4/4 Khóa luận 7/7 Tổng số tín 95 Tr ươ ̀ng Thực tập, kiến tập 27 122/153 Về mặt lý thuyết, sinh viên đăng ký số lượng học phần (Số tín chỉ) học kỳ tùy theo khả (năng lực, điều kiện tài chính) mình; nhiên, kinh nghiệm bạn sinh viên cho thấy số tín kì nên dao động từ 15 đến 18 tín Giữa học phần khung chương trình có mối quan hệ ràng buộc lẫn kết học tập học phần ảnh hưởng đến kết học tập một/một số học phần khác Do đó, để đạt kết học tập theo SVTH: Phan Trọng Lưu 90 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương mong muốn, sinh viên cần nắm mối quan hệ ràng buộc học phần Cụ thể: Có tới 22 học phần có quan hệ mật thiết với nhau: “Thực tập nghề nghiệp”, “Hoạch định nguồn lực doanh nghiệp (ERP)”, “Internet thương mại điện tử”, “Phát triển hệ thống thông tin kinh tế”, “Thực tập cuối khóa”, “Mạng truyền thơng”, “Những ngun lý chủ nghĩa Mac-Lenin ́ uê 1”, “Đường lối cách mạng Đảng cộng sản Việt Nam”, “Hệ thống thông ́H tin quản lý”, “Những nguyên lý chủ nghĩa Mac-Lenin 2”, “Phát tê luật đại cương”, “Tin học đại cương”, “Tư tưởng Hồ Chí Minh”, “Toán rời rạc”, “Toán cao cấp 2”, “Kinh tế vi mơ”, “Tốn cao cấp 1”, “Ngun lý kế Các học phần thuộc vào nhóm học phần liên quan đến Tin học, Kinh ̣c K in toán”, “Nguyên lý thống kê kinh tế” h tốn”, “Kiến trúc máy tính hệ điều hành”, “Kinh tế lượng”, “Nguyên lý kế tế Lý luận trị có ảnh hưởng trực tiếp đến học phần “Hoạch định ho nguồn lực doanh nghiệp (ERP)”, “Thực tập nghề nghiệp”, học phần “Thực Học phần “Hoạch định nguồn lực doanh nghiệp (ERP)” có vai trị Đ ại tập cuối khóa” cầu nối học phần liên quan nhóm Tin học với học phần Tr ươ ̀ng nhóm Kinh tế Lý luận trị Học phần “Thực tập cuối khóa” chịu ảnh hưởng trực tiếp 15 học phần: “Phát triển hệ thống thông tin kinh tế”, “Hoạch định nguồn lực doanh nghiệp”, “Internet thương mại điện tử”, “Thực tập nghề nghiệp”, “Mạng truyền thơng”, “Lập trình ứng dụng quản lý”, “Hệ thống thông tin quản lý”, “Tư tưởng Hồ Chí Minh”, “Đường lối Cách mạng Đảng Cộng sản Việt Nam”, “Toán rời rạc”, “Tin học đại cương”, “Toán cao cấp 2”, “Kinh tế vi mô”, “Lý thuyết xác suất thống kê toán”, “Những nguyên lý Chủ nghĩa Mac-Lenin 1” Tùy vào tập luật, học phần tự động kết nối với để tạo ảnh hưởng, hay nói cách khác mối quan hệ lên học phần SVTH: Phan Trọng Lưu 91 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương đích Có trường hợp học phần nhóm học phần liên quan đến Tin học ảnh hưởng đến học phần xác định, có trường hợp học phần liên quan đến Tin học móc nối với học phần khác nhóm học phần Kinh tế Lý luận trị để tác động đến kết “Thực tập cuối khóa” Sẽ có mức điểm A, B, C ảnh hưởng trực tiếp đến mức điểm A học ́ uê phần “Thực tập cuối khóa” Mức điểm A thường rơi vào học phần có ́H liên quan đến Tin học, mức B, C rơi vào mơn học nhóm học phần Kinh tế Lý luận trị Nhìn chung, học phần có ảnh tê hưởng đến kết có mối quan hệ mật thiết đến học phần “Thực tập cuối h khóa” cuối cùng, ảnh hưởng lớn có mối quan hệ chặt chẽ in nhóm học phần liên quan đến Tin học chiếm đa số tổng số 29 học ̣c K phần, học phần nhóm khác mang tính chất hỗ trợ với nhóm Tin học Đối với nhóm học phần liên quan đến Tin học, học phần “Internet ho thương mại điện tử”, “Hoạch định nguồn lực doanh nghiệp”, “Lập trình ứng ại dụng quản lý”, “Hệ thống thông tin quản lý”, “Mạng truyền thông”, Đ “Phát triển hệ thống thơng tin kinh tế” có mối liên hệ với chặt chẽ Tr ươ ̀ng tất 12 học phần thuộc nhóm này, học phần lại xuất tập luật mức độ liên hệ Với mức điểm A học phần suy học phần lại đạt điểm A, phải đạt điểm B học phần: “Hệ thống thông tin quản lý”, “Cơ sở liệu”, “Lập trình hướng đối tượng”, “Cơ sở lập trình”, điểm C với môn “Tin học đại cương”, “Kiến trúc máy tính hệ điều hành”, “Cấu trúc liệu giải thuật” Đối với nhóm học phần liên quan đến Kinh tế có mối quan hệ mật thiết với nhau, “Ngun lý kế tốn” học phần có quan hệ mật thiết với nhiều học phần tổng số học phần nhóm mơn Kinh tế Ngồi SVTH: Phan Trọng Lưu 92 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương “Ngun lý kế tốn” học phần như: “Kinh tế lượng”, “Kinh tế vĩ mô”, “Lý thuyết xác suất thống kê toán”, “Toán cao cấp 2” “Kinh tế vi mơ” học phần có tác động qua lại lẫn để sinh tập luật Khác với nhóm mơn Tin học, mức điểm đủ để ảnh hưởng đến môn Kinh tế thường rơi vào mức C D Học phần “Thực tập nghề nghiệp” học phần cuối mang tính ́ uê định đến kết học tập sinh viên năm học, học phần ́H chịu tác động có mối liên hệ mật thiết với học phần khác tổng với học phần “Thực tập cuối khóa” cần: tê thể 29 học phần bắt buộc Do đó, sinh viên đặt mục tiêu đạt điểm A đối h Đạt điểm A học phần “Thực tập nghề nghiệp” in Đạt điểm A học phần nhóm Tin học như: “Internet ̣c K thương mại điện tử”, “Hoạch định nguồn lực doanh nghiệp”, “Lập trình ứng dụng quản lý”, “Mạng truyền thông”, “Phát triển ho hệ thống thông tin kinh tế” đạt mức điểm B học phần: “Hệ thống thơng tin quản lý”, “Tin học đại cương”, điểm C học ại phần “Kiến trúc máy tính hệ điều hành” nhóm Đ Ít đạt mức điểm B học phần nhóm Lý luận trị: Tr ươ ̀ng “Tư tưởng hồ Chí Minh”, “Đường lối cách mạng Đảng Cộng sản Việt Nam”, điểm C học phần “Những nguyên lý Chủ nghĩa Mac-Lenin 1”, “Những nguyên lý Chủ nghĩa Mac-Lenin 2” nhóm học phần Lý luận trị Ít đạt mức điểm C học phần nhóm Kinh tế: “Kinh tế lượng”, “Kinh tế vi mô”, “Kinh tế vĩ mô”, “Lý thuyết xác suất thống kê toán”, “Nguyên lý kế toán”, “Nguyên lý thống kê kinh tế”, “Toán cao cấp 1”, “Tốn cao cấp 2” điểm B học phần “Tốn rời rạc” Ngồi ra, dựa vào khung chương trình học dành cho sinh viên chuyên ngành Tin học kinh tế qua năm học cho thấy mức độ liên quan học phần SVTH: Phan Trọng Lưu 93 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương nhóm Tin học, Kinh tế, Lý luận trị, thấy mối quan hệ học phần với Những học phần năm trước đóng vai trò điều kiện tiên cho học phần năm học nhóm học phần Hình 3.12 sơ đồ chuỗi học phần khung chương trình đào tạo Tin học kinh tế với mức điểm tối thiểu cần đạt học phần qua năm học nhằm đạt kết cao q trình học Theo đó, để đạt ́ uê mức điểm A học phần “Thực tập cuối khóa”, sinh viên đặt mục tiêu học ́H tập học phần qua năm sau: Năm 1: Phải đạt điểm B học phần “Tin học đại cương” nhóm tê Tin học Mức điểm B học phần “Tốn rời rạc” phải đạt h mức điểm C học phần “Kinh tế vi mô”, “Lý thuyết xác suất thống in kê toán”, “Toán cao cấp 1”, “Toán cao cấp 2” nhóm học phần liên quan ̣c K đến Kinh tế Đối với học phần “Những nguyên lý Chủ nghĩa Mac-Lenin 1” “Những nguyên lý Chủ nghĩa Mac-Lenin 2” ho phải đạt tối thiểu mức điểm C nhóm học phần Lý luận trị Năm 2: Phải đạt tối thiểu điểm C học phần liên quan đến Tin ại học: “Cấu trúc liệu giải thuật”, “Cơ sở liệu”, “Cơ sở lập trình”, “Kiến Đ trúc máy tính hệ điều hành” Mức điểm C học phần “Kinh tế vĩ mơ”, Tr ươ ̀ng “Ngun lý kế tốn”, “Ngun lý thống kê kinh tế” nhóm học phần liên quan đến Kinh tế Đối với học phần nhóm Lý luận trị “Đường lối cách mạng Đảng Cộng sản Việt Nam” “Tư tưởng Hồ Chí Minh” đạt mức điểm B Năm 3: Phải đạt mức điểm A học phần: “Internet thương mại điện tử”, “Hoạch định nguồn lực doanh nghiệp (ERP)”, “Lập trình ứng dụng quản lý”, “Mạng truyền thông”, “Phát triển hệ thống thông tin kinh tế”, mức điểm B học học phần “Hệ thống thông tin quản lý” nhóm học phần liên quan đến Tin học Cùng với phải đạt điểm C học phần “Kinh tế lượng” nhóm học phần Kinh tế SVTH: Phan Trọng Lưu 94 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương Năm 4: Sau tích lũy đủ mức điểm từ năm đến năm 3, có khả học phần “Thực tập nghề nghiệp” đạt mức điểm A cao ảnh hưởng trực tiếp đến mức điểm A học phần cuối “Thực tập cuối ́ Tr ươ ̀ng Đ ại ho ̣c K in h tê ́H uê khóa” SVTH: Phan Trọng Lưu 95 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương Hình 12 Chuỗi phân bố điểm mơn học cần tích lũy qua năm Năm Lý thuyết xác suất thống kê toán (C) Nguyên lý kế toán (C) Tr ươ ̀ng Những nguyên lý Chủ nghĩa Mac-Lenin (B) Kinh tế vĩ mô (C) Những nguyên lý Chủ nghĩa Mac-Lenin (B) ́ Hoạch định nguồn lực doanh nghiệp (ERP) (A) Phát triển hệ thống thông tin kinh tế (A) Hệ thống thông tin quản lý (B) Thực tập nghề nghiêp Thực tập cuối khóa (A) (A) ại Toán cao cấp (C) Kiến trúc máy tính hệ điều hành (C) Đ Tốn cao cấp (C) Mạng truyền thông (A) uê Cơ sở lập trình (C) ́H Kinh tế vi mơ (C) Lập trình ứng dụng quản lý (A) tê Cơ sở liệu (C) h Toán rời rạc (B) Internet thương mại điện tử (A) in Cấu trúc liệu giải thuật (C) Năm ̣c K Tin học đại cương (B) Năm ho Năm Nguyên lý thống kê kinh tế (C) Đường lối Đảng Cộng sản Việt Nam (B) Tư tưởng Hồ Chí Minh (B) SVTH: Phan Trọng Lưu Kinh tế lượng (C) Nhóm học phần Lý luận trị 96 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương PHẦN KẾT LUẬN Kết đạt Qua trình nghiên cứu, khóa luận đạt kết sau: Hiểu rõ vấn đề Khai phá liệu Luật kết hợp, Nắm vững thuật toán Apriori Khai phá luật kết hợp Sử dụng thành thạo phần mềm khai phá liệu Weka Ứng dụng thuật toán Apriori vào việc khai phá Cơ sở liệu điểm ́H ́ Hệ thống hóa kiến thức liên quan đến Khai phá liệu, uê tê Sinh Viên chuyên ngành THKT – Trường Đại học Kinh Tế Huế từ khóa K42 đến khóa K47 h Tìm số tập luật phổ biến phản ánh mối quan hệ học phần in ̣c K khung chương trình đào tạo Chuyên ngành tin học kinh tế Đưa số tư vấn học tập cho sinh viên chuyên ngành nhằm đạt kết Hạn chế khóa luận ho cao học phần “Thực tập cuối khóa” kết điểm trung bình chung ại Do thời gian thực đề tài tương đối hạn chế, nên tránh khỏi sai Đ sót Với phương pháp phân tích tập liệu phần mềm Weka thuật toán Apriori Luật kết hợp gặp phải nhiều giới hạn Dữ liệu thu thập cịn so với khả Tr ươ ̀ng phân tích liệu số lượng lớn Luật kết hợp, với số trường liệu 29 tương ứng với 29 học phần cần thu thập thêm nhiều liệu điểm sinh viên nữa, nhằm phù hợp với tính chất Luật kết hợp sử dụng cho liệu số lớn Bên cạnh đó, liệu liên quan đến điểm sinh viên không liên quan đến yếu tố khác như: “Năm sinh”, “Giới tính”, … Như vậy, tập luật sinh bị thu hẹp liệu Nominal điểm số, từ chiều liên quan gói gọn chiều “Điểm ảnh hưởng đến điểm” Nếu có nhiều trường với kiểu liệu khác số chiều sinh nhiều so với dừng lại SVTH: Phan Trọng Lưu 97 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương Ngồi ra, khóa luận sử dụng thuật tốn Apriori để khai phá sở liệu điểm sinh viên mà chưa thử nghiệm thuật toán khác khai phá Luật kết hợp FP Growth Filtered Associator Hướng phát triển đề tài Trên sở hạn chế, tác giả đề xuất số hướng phát triển đề tài sau: ́ Ứng dụng khai phá Luật kết hợp cho liệu điểm sinh viên ngành uê ́H đào tạo khác Chuyên ngành Tin học kinh tế như: Quản trị kinh doanh, Tài – Ngân hàng, Kế toán – Kiểm toán, nhằm hiểu rõ khung chương trình đào tạo tê đưa tư vấn học tập phù hợp cho sinh viên ngành Từ đó, h giúp cho sinh viên ngành có chuẩn bị đầy đủ lượng kiến thức Sử dụng thêm thuật toán khác ngồi Apriori có Luật kết hợp để khai ̣c K in học phần bước vào năm phá liệu, từ tập luật thu để mang so sánh độ xác, độ hiệu Tr ươ ̀ng Đ ại ho thuật tốn so với sử dụng thuật toán Apriori SVTH: Phan Trọng Lưu 98 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương TÀI LIỆU THAM KHẢO A.Romagnoli, Michael C.Thomas, WenboZhuJose (2017) "Data mining and clustering in chemical process databases for monitoring and knowledge discovery ScienceDirect" AgatheMerceron, Najmi GhaniHaider, RaheelaAsif, Syed AbbasAli (2017) "Analyzing undergraduate students’ performance using educational data mining - ́ uê ScienceDirect" ́H Angeline D.M.D (2013) "Association Rule Generation for Student Performance tê Analysis using Apriori Algorithm" h Ansari A Parab A (2014) "Apriori- A Big Data Analysis in Education" in Chadha A Kumar D.V (2012) "Mining Association Rules in Student’s ̣c K Assessment Data 6" ho Fadi Thabtah, Peter Cowling, Y onghong Peng (2017) "MCAR-multi-classclassification-based-on-association-rule-2005.pdf" JolitaBernatavičienė, ại GintautasDzemyda, OlgaKurasova, PovilasTreigys, Đ VirginijusMarcinkevičius, ViktorMedvedev (2017) "A new web-based solution for Tr ươ ̀ng modelling data mining processes - ScienceDirect" Han J, Kawano H, Nishio S cộng (1998) "Generalization-based data mining in object-oriented databases using an object cube model Data Knowl Eng, 25(1), 55– 97" Imielinski Tomasz, Rakesh Agrawal, Swami (1993) "Mining Association Rules between Sets of Items in Large Databases" 10 Jain K.K Raut A.B (2015) "Finding Association Rule using Apriori Algorithm on Educational Domain" 11 Jha J Ragha L (2013) "Educational Data Mining using Improved Apriori Algorithm 8" SVTH: Phan Trọng Lưu 99 - Khóa luận tốt nghiệp GVHD: Dương Thị Hải Phương 12 Mehmet R.Toluna, Saleh M.Abu-Soudb (1998) "ILA: an inductive learning algorithm for rule extraction - ScienceDirect" 13 Nguyễn Hà Nam, Nguyễn Chí Thành, Hà Quang Thụy (2009) "Giáo trình Khai phá liệu" 14 Nguyễn Quang, Hồ Văn Lâm, Phạm Vinh Trần Thị Quế Vy, Võ Thanh Minh (2010) "Tiểu luận Tìm hiểu luật kết hợp khai phá liệu - Luận văn, đồ án, đề ́ uê tài tốt nghiệp" ́H 15 Nguyễn Đặng Thế Vinh (2014)." Ứng dụng Khai phá liệu chọn ngành nghề cho tê học sinh THPT" h 16 Phạm Thị Phúc (2010) " Khai phá liệu cho tư vấn lựa chọn môn học" in 17 Phạm Thị Cẩm Vân (2012) "Ứng dụng khai phá liệu để tư vấn học tập trường ̣c K cao đẳng kinh tế- Kỹ thuật Quảng Nam - Luận văn, đồ án, đề tài tốt nghiệp" ho 18 Phan Văn Dương (2012) "Luận văn Khai phá liệu ứng dụng tư vấn Tr ươ ̀ng Đ ại tuyển sinh trường cao đẳng nghề Trung Bộ - Luận văn, đồ án, đề tài tốt nghiệp" SVTH: Phan Trọng Lưu 100