Xây dựng ứng dụng dự toán kết quả học tập cho sinh viên báo cáo tổng kết đề tài khoa học cấp trường

47 24 0
Xây dựng ứng dụng dự toán kết quả học tập cho sinh viên   báo cáo tổng kết đề tài khoa học cấp trường

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ CÔNG THƯƠNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC KẾT QUẢ THỰC HIỆN ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG Tên đề tài: Xây dựng ứng dụng dự đoán kết học tập cho sinh viên Mã số đề tài: 182.CNTT03 Chủ nhiệm đề tài: TS Phạm Thị Thiết Đơn vị thực hiện: Khoa Công Nghệ Thông Tin Tp Hồ Chí Minh, 2018 PHẦN I THƠNG TIN CHUNG I Thông tin tổng quát 1.1 Tên đề tài: Xây dựng ứng dụng dự đoán kết học tập cho sinh viên 1.2 Mã số: 182.CNTT03 1.3 Danh sách chủ trì, thành viên tham gia thực đề tài TT Họ tên (học hàm, học vị) Đơn vị công tác Vai trò thực đề tài TS Phạm Thị Thiết Khoa CNTT ĐHCN Tp.HCM Chủ nhiệm Khoa CNTT ĐHCN Tp.HCM Thư ký Khoa KH&KTMT – ĐHBK Thành viên TS Võ Thị Thanh Vân PGS.TS Quản Thành Thơ TPHCM Nguyễn Hữu Quang Khoa CNTT ĐHCN Tp.HCM Thành viên 1.4 Đơn vị chủ trì: Khoa Cơng Nghệ Thơng Tin 1.5 Thời gian thực hiện: 1.5.1 Theo hợp đồng: từ tháng 01 năm 2018 đến tháng 12 năm 2018 1.5.2 Gia hạn (nếu có): đến tháng… năm… 1.5.3 Thực thực tế: từ tháng 01 năm 2018 đến tháng 12 năm 2018 1.6 Những thay đổi so với thuyết minh ban đầu (nếu có): (Về mục tiêu, nội dung, phương pháp, kết nghiên cứu tổ chức thực hiện; Nguyên nhân; Ý kiến Cơ quan quản lý) 1.7 Tổng kinh phí phê duyệt đề tài: 50 triệu đồng II Kết nghiên cứu Đặt vấn đề Đa số sinh viên học tập trường đại học nói chung trường Đại học Cơng nghiệp Tp.HCM nói riêng học tập theo hình thức tín dựa Quy chế đào tạo tín Bộ Giáo dục Đào tạo [18] Để xét cơng nhận tốt nghiệp, sinh viên phải hồn thành tích lũy điểm tổng kết mơn học qui định chương trình đào tạo, bao gồm môn bắt buộc môn tự chọn [18-19] Do đó, sinh viên phải có định hướng học môn bắt buộc chọn lựa mơn tự chọn phù hợp với sở thích, khả để đạt kết tốt Đối với môn học kể bắt buộc tự chọn, theo chương trình đào tạo ngành, sinh viên phải hoàn thành số mơn học tiên phép đăng ký mơn học theo sau [18] Chính thế, sinh viên cần có định hướng cụ thể việc chọn lựa, xếp môn học cho hợp lý để hồn thành chương trình học thời gian qui định Việc định hướng cần thực từ em sinh viên sinh viên năm thứ để sinh viên có kế hoạch lựa chọn đăng ký học phần học kỳ cách hợp lý Việc phân loại môn học phù hợp, cần thiết hấp dẫn em sinh viên; mơn học khiến cho em có hứng thú học tập tốt môn học sau vấn đề lớn với nhà quản lý giáo dục trường đại học Bên cạnh đó, hệ thống đánh giá chuẩn đào tạo ln ln cần có kênh tư vấn học tập cho sinh viên Nhưng kênh tư vấn học tập cho sinh viên trường Đại học Công nghiệp Tp.HCM thông qua kênh giao tiếp trực tiếp giáo viên chủ nhiệm với sinh viên Với kênh tư vấn dẫn đến số hạn chế thời gian sinh hoạt không thường xuyên, giáo viên chủ nhiệm khơng thể nắm hết tình hình kết học tập môn sinh viên …, sinh viên khó lập kế hoạch chiến lược học tập cụ thể từ kênh tư vấn Dựa thống kế số lượng sinh viên tốt nghiệp hàng năm cho khóa học tập trường Đai học Cơng nghiệp Tp.HCM nói chung khoa Cơng nghệ Thơng tin nói riêng thấp, ví dụ thống kê sinh viên tốt nghiệp năm (2016, 2017), tổng số sinh viên tốt nghiệp toàn trường 5278/10242 đạt 51.53%, sinh viên khoa CNTT tốt nghiệp 124/608 sinh viên đạt 20.39% Một nguyên nhân sinh viên khơng dự đốn lực lựa chọn học phần khơng hợp lý để có kế hoạch học tập phù hợp với khả mình, q trình tích lũy điểm tổng kết học phần sinh viên thấp dẫn đến tỉ lệ tốt nghiệp thấp Mục tiêu Từ vấn đề nêu trên, tác giả nhận thấy cần phải có cơng cụ hỗ trợ cho em sinh viên để em dự đốn kết học tập thân mơn học từ kết dự đốn sinh viên điều chỉnh khả học tập có khoa học việc chọn lựa môn học phần cần đăng ký học kỳ sau để đạt kết học tập tốt đặc biệt học phần tự chọn Chính thế, tác giả định chọn đề tài “Xây dựng ứng dụng dự đoán kết học tập cho sinh viên” Để hồn thành ứng dụng này, nhóm tác giả đề xuất sử dụng kỹ thuật khai thác chuỗi từ sở liệu chuỗi, tập kết học tập sinh viên trường Đại học Công nghiệp Tp.HCM, từ đưa gợi ý phù hợp cho sinh viên lựa chọn học phần Phương pháp nghiên cứu Để đạt mục tiêu đề tài, đề tài tiến hành nghiên cứa thuật toán khai thác chuỗi tuần tự, luật tuần tự/luật không dư thừa Thu tập, nghiên cứu phân tích liệu kết học tập sinh viên theo học chế tín khoa CNTT trường Đại học Công Nghiệp Tp.HCM Phương pháp nghiên cứu tiến hành cụ thể sau: - Thu thập liệu liên quan đến kết học tập sinh viên trường Đại học Công nghiệp Tp.HCM - Nghiên cứu, xây dựng thực nghiệm chọn thuật tốn có hiệu cao để khai thác luật (luật không dư thừa) từ sở liệu thu thập - Xây dựng ứng dụng dự đoán kết học tập sinh viên dựa tập luật (hoặc luật không dư thừa) khai thác từ sở liệu chuỗi kết học tập sinh viên tốt nghiệp khoa Công nghệ thông tin, Trường Đại học Công nghiệp Tp.HCM - Kiểm thử kết dự đoán Tổng kết kết nghiên cứu Đề tài đạt kết sau: - Tập liệu kết học tập sinh viên khoa CNTT – Trường ĐHCN Tp.HCM - báo khoa học: đăng tạp chí khoa học công nghệ - Trường ĐHCN Tp.HCM, đăng tạp chí International Journal of Innovative Computing, Information and Control (IJICIC - Scopus) - Ứng dụng dự đoán kết học tập sinh viên, với giao diện sau: Giao diện hình ứng dụng Giao diện thơng tin đề tài Giao diện dự đốn kết học tập sinh viên Đánh giá kết đạt kết luận Nhóm tác giả xây dựng ứng dụng hỗ trợ dự đốn kết học tập mơn học cho sinh viên Khoa Công Nghệ Thông Tin - Trường Đại học Công Nghiệp Tp HCM Kết nghiên cứu đề tài đạt góp phần quan trọng việc cung cấp công cụ hỗ trợ cho em sinh viên để em dự đốn kết học tập thân từ giúp cho sinh viên có kế hoạch học tập tốt lựa chọn môn học phù hợp với khả mình, tạo điều kiện cho sinh viên phát triển nghiên cứu khoa học chuyên sâu theo tinh thần đào tạo tín giúp cho sinh viên hồn thành trình học tập thời gian sớm Bên cạnh đó, kết đóng góp vào tài ngun cho mơn học liên quan đến Xử lý khai thác liệu, làm tảng cho việc nghiên cứu triển khai ứng dụng q trình học tập làm khóa luận tốt nghiệp Tóm tắt kết (tiếng Việt tiếng Anh) Đề tài xây dựng ứng dụng để dự đốn kết học tập sinh viên Để hồn thành cơng việc này, nhóm tác giả nghiên cứu, xây dựng đánh giá thực nghiệm thuật toán khai thác luật IMSR_PreTree thuật tốn khai thác luật khơng dư thừa MNSR_PreTree Dựa kết so sánh thực nghiệm, đề tài đề xuất sử dụng thuật toán khai thác luật không dư thừa MNSR_PreTree để xây dựng ứng dụng dự đoán kết học tập sinh viên khoa CNTT trường Đại học Công nghiệp Tp.HCM Ứng dụng dự đoán giúp sinh viên có nhìn tổng quan đường học tập thân để có chọn lựa xác nhằm đem lại hiệu cao trình học tập trường This project has proposed a model and developed an application to be able to predict students' learning outcomes To complete this task, the authors have studied, built and evaluated the experimental results between the IMSR_PreTree algorithm for mining sequential rules and the MNSR_PreTree algorithm for mining non-redundant sequential rules Based on the experimental evaluation, the project has proposed to use the MNSR_PreTree algorithm to develop a tool to assist students in predicting their own academic performance in order to improve their academic ability and help them to choose the subjects to get the highest efficiency in the learning process at school III Sản phẩm đề tài, công bố kết đào tạo 3.1 Kết nghiên cứu (sản phẩm dạng 1,2,3) TT Tên sản phẩm Yêu cầu khoa học hoặc/và tiêu kinh tế - kỹ thuật Đăng ký Đạt Chương trình phần mềm máy tính 1 Cơ sở liệu 1 Bài báo khoa học 3.2 Kết đào tạo TT Họ tên Thời gian thực đề tài Tên đề tài Tên chuyên đề NCS Tên luận văn Cao học tháng Ứng dụng luật việc dự đoán kết học tập sinh viên Đã bảo vệ Nghiên cứu sinh Học viên cao học Nguyễn Hữu Quang Đã bảo vệ Sinh viên Đại học IV Tình hình sử dụng kinh phí T T A B Nội dung chi Chi phí trực tiếp Th khốn chun mơn Ngun, nhiên vật liệu, Thiết bị, dụng cụ Cơng tác phí Dịch vụ thuê Hội nghị, hội thảo,thù lao nghiệm thu kỳ In ấn, Văn phịng phẩm Chi phí khác Chi phí gián tiếp Quản lý phí Chi phí điện, nước Tổng số Kinh phí duyệt (triệu đồng) 47,500,000 47,161,500 Kinh phí thực (triệu đồng) 47,500,000 47,161,500 338,500 338,500 2,500,000 2,500,000 2,500,000 2,500,000 50,000,000 50,000,000 Ghi V Kiến nghị (về phát triển kết nghiên cứu đề tài) - Hiện ứng dụng dự đoán kết học tập sinh viên theo học khoa CNTT Ứng dụng nên mở rộng việc dự đoán kết học tập cho tất sinh viên thuộc trường với ngành học khác - Đề tài nên tiếp tục phát triển ứng dụng website để sinh viên chủ động dự đốn kết học tập mà không cần phải nhờ đến tư vấn hỗ trợ giáo viên chủ nhiệm … VI Phụ lục Bài báo khoa học Chương trình phần mềm ứng dụng – sở liệu, cấu hình máy Chủ nhiệm đề tài Tp HCM, ngày tháng năm Phịng QLKH&HTQT Khoa Cơng Nghệ Thơng Tin Trưởng (đơn vị) (Họ tên, chữ ký) PHẦN II BÁO CÁO CHI TIẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CHƯƠNG TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU 1.1 Đặt vấn đề Trong năm gần đây, vai trò máy tính việc lưu trữ xử lý thơng tin ngày trở nên quan trọng thiếu nhiều lĩnh vực khác Dữ liệu thu thập lưu trữ từ thực tế ngày nhiều để người dùng định lại cần có thơng tin bổ ích “tri thức” rút từ nguồn liệu lớn Thực tế, có lượng nhỏ liệu sử dụng để phân tích, số cịn lại người sử dụng khơng biết phải xử lý với chúng họ tiếp tục thu thập, lưu trữ nghĩ đến lúc cần đến Mặt khác, thông tin cần đưa môi trường cạnh tranh cần thiết, việc giúp việc đưa định nhanh xác cần, ngày có nhiều câu hỏi đặt mang tính chất định tính dựa khối lượng liệu khổng lồ có sẵn khứ Với lý trên, việc quản trị khai thác CSDL truyền thống ngày không đáp ứng vấn đề thực tế Dự báo khoa học nghệ thuật tiên đoán việc xảy tương lai, sở phân tích khoa học liệu thu thập Khi tiến hành dự báo cần vào việc thu thập, xử lý số liệu khứ để xác định xu hướng vận động tượng tương lai nhờ vào số mơ hình tốn học Thực tế liên quan đến vấn đề dự báo, có dự báo dựa mối liên hệ thiếu cứ, loại dự báo khơng có sở khoa học Dự báo dựa chuỗi thông tin lịch sử mức độ nhiều có sở khách quan, nhiên có nhược điểm loại dự báo khơng giải thích xu vận động đối tượng nghiên cứu đa số dừng lại bước định tính, loại dự báo dựa kinh nghiệm Các nghiên cứu khoa học dự báo dựa phân tích mối liên hệ qua lại đối tượng nghiên cứu phương pháp xử lý thơng tin khoa học nhằm phát tính quy luật đối tượng Trong khai thác liệu, dự báo sử dụng để dự đoán tương lai dựa vào liệu lịch sử Khai thác liệu chuỗi hướng lĩnh vực khai thác liệu nhiều nhà khoa học tập trung nghiên cứu Khai thác mẫu khai thác mẫu phổ biến liên quan đến thời gian kiện khác, với yêu cầu mẫu phổ biến chuỗi sở liệu chuỗi mà xuất chúng lớn ngưỡng hỗ trợ người dùng Đây phần quan trọng khai thác liệu ứng dụng rộng rãi nhiều lĩnh vực y khoa, giáo dục đào tạo, kinh tế, khoa học, xã hội Khai thác luật nghiên cứu thiết thực lĩnh vực khai thác liệu chuỗi Mục đích tìm luật tìm ẩn sở liệu chuỗi, luật thể mối quan hệ mẫu liệu theo thứ tự thời gian Luật mở rộng khả sử dụng ý nghĩa biểu đạt mẫu tuần tự, thể tri thức tiềm ẩn liệu Với tập luật phổ biến rút trích từ liệu nguồn để xây dựng hệ thống dự báo Nhóm tác giả R Agrawal [1] giới thiệu vấn đề khai thác mẫu từ sở liệu (CSDL) với giao dịch bán hàng khách hàng Nhóm tác giả trình bày ba thuật tốn để giải vấn đề đặt thực nghiệm đánh giá hiệu suất cách sử dụng liệu tổng hợp Các thuật toán triển khai nhiều kho liệu đạt hiệu tốt giao dịch mặt hàng Nhóm tác giả J Ayres giới thiệu thuật toán SPAM [2], thuật toán khai thác mẫu Thuật toán làm việc hiệu với mẫu CSDL dài Nhóm tác giả giới thiệu chiến lược tìm kiếm chi tiết kết hợp việc đào sâu khơng gian tìm kiếm kết hợp với chế cắt tỉa hiệu Tác giả M.J Zaki [17] đề xuất thuật toán SPADE để khai thác nhanh mẫu CSDL lớn Thuật toán SPADE thực ba lần quét CSDL để khai thác trình tự thường xuyên Bằng việc sử dụng Pattern-Growth q trình khai phá mẫu tuần tự, nhóm tác giả J Pei [11] thực nghiên cứu việc khai thác mẫu CSDL lớn phát triển phương pháp tiếp cận mẫu tăng trưởng để khai thác có hiệu mở rộng mẫu Trong cách tiếp cận này, CSDL tham chiếu cách đệ qui vào tập CSDL tham chiếu nhỏ hơn; mẫu phát triển CSDL tham chiếu cách khám phá mẫu thường xuyên cục Phương pháp khai thác mở rộng để khai thác mẫu với ràng buộc người dùng xác định Nhóm tác giả K Gouda [7] đề xuất thuật toán PRISM, cách tiếp cận để khai thác mẫu thường xuyên Thuật toán PRISM [7] sử dụng phương pháp tiếp cận theo chiều dọc cho việc đếm tính tốn độ hỗ trợ dựa mã hóa khối Với cách đánh giá rộng rãi liệu chuẩn, thuật toán PRISM cho kết khai thác chuỗi phổ biến tốt phương pháp nêu Trong lĩnh vực khai thác luật tuần tự, có nghiên cứu cho toán khai thác tập đầy đủ luật luật không dư thừa từ tập mẫu M Spiliopoulou [13], Nhóm tác giả D Lo [9] Tuy nhiên, khai thác luật dựa độ đo khác chẳng hạn độ đo lift [4] độ đo conviction [4] cách tiếp cận giải toán D Lo đồng khơng cịn phù hợp Đối với phương pháp khai thác tập luật đầy đủ M Spiliopoulou đề xuất [13] chủ yếu dựa phương pháp vét cạn, tốn nhiều chi phí tính tốn Cơng trình nghiên cứu nhóm tác giả F.-V Philippe [6] trình bày thuật tốn khai thác luật phổ biến cho chuỗi Đầu tiên, thuật tốn tìm luật có kích thước * sau đệ quy phát triển chúng cách quét chuỗi chứa chúng để tìm phần tử mở rộng phần trái phải chúng để phát sinh tập luật phổ biến Kết thực nghiệm nhóm tác giả dựa liệu thực tế chứng minh thời gian thực hiện, nhớ cách đáng kể Nhóm tác giả Thien-Trang Van giới thiệu thuật tốn IMSR_PreTree [16] dùng để khai thác luật phổ biến dựa tiền tố Để tìm tập mẫu phổ biến, nhóm tác giả thuật toán IMSR_PreTree sử dụng phương pháp tiếp cận theo chiều dọc cho việc đếm tính tốn độ hỗ trợ dựa mã hóa khối nguyên tố thuật toán PRISM [7] 19 2101551 Hệ Thống Cơng nghệ Web 20 2101555 Lập trình hướng kiện với công nghệ NET 1 21 2101556 Lập trình hướng kiện với cơng nghệ Java 22 2101560 Phát triển ứng dụng 23 2101411 Nhập mơn an tồn thơng tin 24 2101420 Công nghệ phần mềm 25 2101419 Trí tuệ nhân tạo 26 2101425 Hệ quản trị CSDL 1 27 2101426 Kiến trúc cài đặt hệ quản trị CSDL 28 2101557 Lập trình phân tán với công nghệ NET 1 29 2101558 Lập trình phân tán với cơng nghệ Java 30 2101452 Kiến trúc Thiết kế Phần mềm 31 2101451 Đảm bảo chất lượng Kiểm thử phần mềm 32 2101460 Kiến trúc hướng dịch vụ Điện toán đám mây 33 2101552 Lập trình WWW 1 34 2113477 Logic học 35 2107446 Quản trị doanh nghiệp 1 36 2110485 Tâm lí học đại cương 37 2101576 Công nghệ phát triển ứng dụng CNTT 38 2101453 Xây dựng phần mềm 39 2101454 Lập trình cho thiết bị di động 40 2101421 Quản lý dự án CNTT 1 41 2101422 Công nghệ thương mại điện tử 1 42 2101428 Tương tác người máy 1 43 2101439 Phân tích thiết kế giải thuật 44 2101456 Quản lý vòng đời ứng dụng 45 2101521 Thực tập doanh nghiệp 46 2101523 Khoá luận tốt nghiệp Bảng 4.8 – Danh sách môn học sau thống ngành Hệ thống thông tin Học kỳ Mã Môn Học 1 2101524 Kỹ học tập lĩnh vực CNTT 2 2113420 Toán A1 2101539 Nhập môn Tin học ST T Tên Môn Học Số tín Mơn tự chọn Mơn sở 32 2101540 Nhập mơn Lập trình 2101567 Hệ Thống Máy tính 2101405 Kỹ thuật lập trình 2113440 Tốn A2 2101402 Cấu trúc rời rạc 2107467 Kỹ phát triển nghề nghiệp 10 2101525 Những vấn đề xà hội nghề nghiệp 11 2101584 Lập trình phân tích liệu 12 2101530 Kinh tế học 13 2101578 Phân tích quản lý yêu cầu 14 2101436 Hệ sở liệu 15 2101551 Hệ Thống Công nghệ Web 16 2101532 Nguyên lý kế toán 17 2101411 Nhập mơn an tồn thơng tin 18 2101401 Thống kê máy tính & ứng dụng 19 2101433 Phân tích thiết kế hệ thống 20 2101425 Hệ quản trị CSDL 21 2101435 Mạng máy tính 22 2101579 Phát triển ứng dụng Web 23 2101533 Quản trị tài 24 2101589 Lập trình phân tích liệu 1 25 2101535 Nguyên lý tiếp thị 26 2101426 Kiến trúc cài đặt hệ quản trị CSDL 27 2101531 Nguyên lý quản trị doanh nghiệp 28 2101582 Nhập môn liêu lớn 1 29 2101542 Thương mại điện tử 30 2101560 Phát triển ứng dụng 31 2101546 Bảo mật Cơ sở liệu 32 2101595 Hệ thống thông tin quản lý 33 2101428 Tương tác người máy 34 2101498 Hệ hỗ trợ định 35 2101516 Quản lý nguồn cung ứng 1 36 2101596 Quản trị bán hàng 37 2101597 Quản trị nhân 38 2101537 Quản lý quy trình nghiệp vụ 1 39 2101538 Kế tốn tài doanh nghiệp 40 2101651 Quản lý dự án Hệ thống thông tin 41 2101576 Công nghệ phát triển ứng dụng 33 CNTT 42 2101543 Hoạch định tài nguyên doanh nghiệp 43 2101585 Hệ quản trị mơ hình hóa liệu lớn 44 2101544 Tiếp thị điện tử 1 45 2101534 Quản trị hành vi tổ chức 1 46 2101545 Các hệ thống thông minh doanh nghiệp 47 2127485 Kế toán quản trị 1 48 2127486 Kiểm toán 49 2101521 Thực tập doanh nghiệp 50 2101523 Khoá luận tốt nghiệp Với danh sách môn học ứng với chuyên ngành thể bảng 4.5, 4.6, 4.7 4.8, đề tài tiến hành thống môn học chuyên ngành Công việc thống gồm bước thực như: lọc danh sách môn chung, giữ danh sách môn riêng chuyên ngành để có danh sách tất mơn học áp dụng cho việc dự đốn Danh sách môn học sau thống gồm 100 môn học xếp theo học kỳ mã môn học tăng dần thể bảng 4.9 Bảng 4.9 – Danh sách môn học dùng để dự đốn kết Học kỳ Mã Mơn Học 1 2101524 Kỹ học tập lĩnh vực CNTT 2101539 Nhập môn Tin học 2101540 Nhập mơn Lập trình 2113420 Tốn A1 2101402 Cấu trúc rời rạc 2101405 Kỹ thuật lập trình 2101567 Hệ Thống Máy tính 2107467 Kỹ phát triển nghề nghiệp 2113440 Toán A2 10 2101404 Lý thuyết đồ thị 11 2101406 Lập trình hướng đối tượng 12 2101409 Cấu trúc liệu giải thuật 13 2101435 Mạng máy tính 14 2101436 Hệ sở liệu 15 2101525 Những vấn đề xã hội nghề nghiệp 16 2101530 Kinh tế học 17 2101578 Phân tích quản lý yêu cầu 18 2101584 Lập trình phân tích liệu STT Tên Mơn Học 34 19 2113480 Vật lí 20 2101401 Thống kê máy tính & ứng dụng 21 2101411 Nhập mơn an tồn thơng tin 22 2101425 Hệ quản trị CSDL 23 2101433 Phân tích thiết kế hệ thống 24 2101532 Nguyên lý kế tốn 25 2101551 Hệ Thống Cơng nghệ Web 26 2101555 Lập trình hướng kiện với cơng nghệ NET 27 2101556 Lập trình hướng kiện với công nghệ Java 28 2101568 Quản trị bảo trì hệ thống 29 2101575 Xác định yêu cầu hệ thống 30 2110485 Tâm lí học đại cương 31 2113477 Logic học 32 2101419 Trí tuệ nhân tạo 33 2101420 Cơng nghệ phần mềm 34 2101426 Kiến trúc cài đặt hệ quản trị CSDL 35 2101428 Tương tác người máy 36 2101531 Nguyên lý quản trị doanh nghiệp 37 2101533 Quản trị tài 38 2101535 Nguyên lý tiếp thị 39 2101557 Lập trình phân tán với cơng nghệ NET 40 2101558 Lập trình phân tán với công nghệ Java 41 2101560 Phát triển ứng dụng 42 2101569 Phát triển hệ thống tích hợp 43 2101570 Kiến trúc tích hợp hệ thống 44 2101579 Phát triển ứng dụng Web 45 2101582 Nhập môn liêu lớn 46 2101589 Lập trình phân tích liệu 47 2101423 Các hệ sở tri thức 48 2101424 Khai phá liệu 49 2101439 Phân tích thiết kế giải thuật 50 2101440 Xử lý ảnh 51 2101441 Automat Ngơn ngữ hình thức 52 2101446 Tính tốn số & Matlab 53 2101451 Đảm bảo chất lượng Kiểm thử phần mềm 54 2101452 Kiến trúc Thiết kế Phần mềm 55 2101460 Kiến trúc hướng dịch vụ Điện toán đám mây 56 2101469 Định tuyến chuyển mạch 35 57 2101498 Hệ hỗ trợ định 58 2101516 Quản lý nguồn cung ứng 59 2101537 Quản lý quy trình nghiệp vụ 60 2101538 Kế tốn tài doanh nghiệp 61 2101542 Thương mại điện tử 62 2101546 Bảo mật Cơ sở liệu 63 2101552 Lập trình WWW 64 2101566 Kiến trúc lưu trữ phân tán 65 2101571 Công nghệ lập trình tích hợp nâng cao 66 2101572 Hệ thống phân tán 67 2101573 Công cụ Web Website hướng liệu 68 2101574 Quản trị mạng hỗ trợ kỹ thuật 69 2101577 Điện tốn đám mây 70 2101595 Hệ thống thơng tin quản lý 71 2101596 Quản trị bán hàng 72 2101597 Quản trị nhân 73 2107446 Quản trị doanh nghiệp 74 2101421 Quản lý dự án CNTT 75 2101422 Công nghệ thương mại điện tử 76 2101442 Ngơn ngữ lập trình 77 2101443 Đồ họa máy tính 78 2101444 Xử lý ngơn ngữ tự nhiên 79 2101445 Nhận dạng mẫu 80 2101453 Xây dựng phần mềm 81 2101454 Lập trình cho thiết bị di động 82 2101456 Quản lý vịng đời ứng dụng 83 2101470 Mạng khơng dây 84 2101473 Phân tích thiết kế mạng 85 2101474 Triển khai an ninh hệ thống 86 2101496 Tối ưu hóa phân tích search engine 87 2101534 Quản trị hành vi tổ chức 88 2101543 Hoạch định tài nguyên doanh nghiệp 89 2101544 Tiếp thị điện tử 90 2101545 Các hệ thống thông minh doanh nghiệp 91 2101565 Phát triển hệ thống đa phương tiện 92 2101576 Công nghệ phát triển ứng dụng CNTT 93 2101585 Hệ quản trị mơ hình hóa liệu lớn 94 2101598 Điện toán cụm 36 ii 95 2101599 Kịch tích hợp nâng cao 96 2101651 Quản lý dự án Hệ thống thông tin 97 2127485 Kế toán quản trị 98 2127486 Kiểm toán 99 2101521 Thực tập doanh nghiệp 100 2101523 Khoá luận tốt nghiệp Dữ liệu điểm đánh giá môn học Dữ liệu đánh giá điểm môn học sử dụng theo Qui chế học vụ trường Đại học Công Nghiệp Tp.HCM dành cho sinh viên hệ tín Dữ liệu đánh giá gồm 09 mức điểm qui đổi thang điểm chữ dựa khung điểm hệ số 10 thể bảng 4.10 Bảng 4.10 – Bảng điểm qui đổi từ điểm số sang điểm chữ Điểm hệ 10 Điểm chữ xxx Điểm hệ 10 Điểm chữ iii 9.0 – 10 A 5.5 - 5.0 C 8.5 – 8.9 A- 5.0 - 5.4 D+ 8.0 - 8.4 B+ 4.0 - 4.9 D 7.0 - 7.9 B < 4.0 F 6.0 - 6.9 C+ Dữ liệu đánh giá kết học tập sinh viên Từ liệu 100 môn học thống bảng 4.9 09 mức đánh giá kết học tập theo qui chế đào tạo trường Đại học Công Nghiệp Tp.HCM thể bảng 4.10, tiến hành rời rạc hóa liệu thành kiểu số nguyên để có liệu phù hợp với yêu cầu thuật tốn khai thác luật Mỗi mơn học có 09 mức đánh giá Do đó, với liệu 100 môn học, sau xếp theo chuyên ngành, học kỳ mã môn học đề tài có liệu rời rạc hóa gồm số nguyên từ đến 900 thể bảng 4.11 Bảng 4.11 – Dữ liệu đánh giá môn học Học kỳ Mã Môn Học F D D+ C C+ B B+ A- A 2101524 2101539 10 11 12 13 14 15 16 17 18 2101540 19 20 21 22 23 24 25 26 27 2113420 28 29 30 31 32 33 34 35 36 2101402 37 38 39 40 41 42 43 44 45 2101405 46 47 48 49 50 51 52 53 54 37 2101567 55 56 57 58 59 60 61 62 63 2107467 64 65 66 67 68 69 70 71 72 2113440 73 74 75 76 77 78 79 80 81 2101404 82 83 84 85 86 87 88 89 90 2101406 91 92 93 94 95 96 97 98 99 2101409 100 101 102 103 104 105 106 107 108 2101435 109 110 111 112 113 114 115 116 117 2101436 118 119 120 121 122 123 124 125 126 2101525 127 128 129 130 131 132 133 134 135 2101530 136 137 138 139 140 141 142 143 144 2101578 145 146 147 148 149 150 151 152 153 2101584 154 155 156 157 158 159 160 161 162 2113480 163 164 165 166 167 168 169 170 171 2101545 802 803 804 805 806 807 808 809 810 2101565 811 812 813 814 815 816 817 818 819 2101576 820 821 822 823 824 825 826 827 828 2101585 829 830 831 832 833 834 835 836 837 2101598 838 839 840 841 842 843 844 845 846 2101599 847 848 849 850 851 852 853 854 855 2101651 856 857 858 859 860 861 862 863 864 2127485 865 866 867 868 869 870 871 872 873 2127486 874 875 876 877 878 879 880 881 882 2101521 883 884 885 886 887 888 889 890 891 2101523 892 893 894 895 896 897 898 899 900 … 4.2.3 Khai thác luật Dựa kết thực nghiệm chương 3, đề tài sử dụng thuật toán MNSR_PreTree [12] để khai thác tập luật không dư thừa cho trình khai thác luật mơ hình mà đề tài đề xuất 4.2.4 Dữ liệu đầu vào/đầu Dữ liệu đầu vào mơ hình đề xuất tập nhiều môn học mà sinh viên học kết tương ứng mơn học Dữ liệu đầu kết dự đốn mơn học mà sinh viên học thời gian tới Dựa liệu đầu này, sinh viên đánh giá điều chỉnh việc học có sở để lựa chọn môn học tự chọn học kỳ sau 38 4.3 Xây dựng ứng dụng Dựa mơ hình đề xuất hình 4.1, đề tài tiến hành xây dựng ứng dụng dự đoán kết học tập sinh viên Ứng dụng dựa liệu đầu vào kết môn học mà sinh viên đạt tập luật không dư thừa khai thác từ CSDL kết học tập sinh viên tốt nghiệp để đưa dự đoán điểm số mơn học chương trình mà sinh viên cịn phải học 4.3.1 Mơi trường thực nghiệm Đề tài tiến hành xây dựng ứng dụng dựa CSDL kết học tập sinh viên theo học chế tín khoa CNTT, trường Đại học Công Nghiệp Tp.HCM với môi trường thực máy tính với cấu hình Intel(R) Core (TM) i7, RAM 8.00 GB, sử dụng hệ điều hành Window 10 Pro 64-bit Các thuật tốn thực ngơn ngữ lập trình C# Dữ liệu kết học tập sinh viên thu thập từ kết học tập 879 sinh viên theo học chế tin khoa Công Nghệ Thông Tin trường Đại học Công Nghiệp Tp.HCM tốt nghiệp 04 chuyên ngành, có 516 sinh viên tốt nghiệp chuyên ngành Khoa học máy tính, 249 sinh viên tốt nghiệp chuyên ngành CNTT, 145 sinh viên tốt nghiệp chuyên ngành Kỹ thuật phần mềm, 49 sinh viên tốt nghiệp chuyên ngành Hệ thống thông tin Dữ liệu thu thập tất điểm số mà sinh viên đạt môn học kể môn học mới, học lại, học cải thiện môn học không đạt Để làm tăng hiệu suất dự đoán kết học tập sinh viên, tập luật không dư thừa lưu trữ Hệ Quản trị CSDL SQL-Server 2012 4.3.2 Ứng dụng Bảng 4.12 bao gồm số lượng luật không dư thừa khai thác từ CSDL kết học tập sinh viên sử dụng thuật toán khai thác luật không dư thừa MNSR_PreTree [12] Bảng 4.12 – Số lượng luật không dư thừa từ liệu học tập sinh viên minSup Số lượng minConf Số lượng (%) (%) mẫu luật 15 71 10 188 1,138 41,064 Thời gian xử lý (giây) 25 0.00402 0.00010 25 77 0.00023 83 0.00025 25 330 0.00075 928 0.00395 25 13,491 0.04668 39 58,308 0.19010 Dữ liệu thu thập kết học tập 879 sinh viên học khoa CNTT trường Đại học Công nghiệp Tp.HCM từa năm 2005 đến tháng 1/2017 tốt nghiệp Với giá trị minSup 10%, có tất 188 mẫu khai thác 77 luật không dư thừa thỏa giá trị minConf 25% thời gian 0.00023 giây Với minSup 5%, minConf 25% khai thác 1,138 mẫu 928 luật không dư thừa với thời gian 0.00395 giây Việc chọn giá trị minSup minConf phụ thuộc vào mục đích cụ thể tốn Trong giới hạn đề tài này, đề tài chọn minSup = minConf = để khai thác hết trường hợp xảy dự đoán Với việc chọn minSup = minConf = 0, thuật toán khai thác 58,308 luật không dư thừa liệu kết học tập sinh viên Hình 4.2 - Ứng dụng dự đoán kết học tập sinh viên Dựa luật không dư thừa khai thác thông qua liệu đầu vào, đề tài phát triển ứng dụng dự đoán kết học tập cho sinh viên hình 4.2 Hình 4.2 mơ tả ứng dụng dự đốn kết học tập sinh viên có mã số 16026741 học kỳ thứ dựa danh sách môn học mà sinh viên hoàn thành học kỳ trước Kết dự đốn danh sách mơn học điểm tương ứng mơn học bao gồm 40 môn bắt buộc môn học: Phân tích thiết kế hệ thống – điểm B, Hệ sở liệu – điểm C+ môn học tự chọn bao gồm: Lập trình hướng kiện với cơng nghệ Net – điểm B, Lập trình hướng kiện với công nghệ Java – điểm C, Logic học – điểm A Xác suất thống kê – điểm B Với kết dự đốn mơn bắt buộc giúp sinh viên biết cách điều chỉnh việc học tập thân để đạt kết cao dự đoán Bằng việc dự đốn mơn học nhóm mơn tự chọn, hệ thống giúp cho sinh viên chọn mơn học có khả đạt kết cao Ví dụ nhóm mơn học với kết dự đốn mơn học Lập trình hướng đối tượng với cơng nghệ Net B, kết dự đốn mơn học Lập trình hướng đối tượng với cơng nghệ Java C sinh viên nên chọn mơn có kết B để đạt điểm tích lũy cao 4.3.3 Kiểm thử a Dữ liệu kiểm thử Dữ liệu dùng để kiểm thử tập hợp điểm sinh viên cịn học trường Bảng 4.13 mơ tả liệu số lượng sinh viên số môn học tương ứng dùng để dự đoán kết thực nghiệm Dữ liệu dùng để dự đoán bao gồm: - 448 sinh viên năm thứ tương ứng với học kỳ thứ chương trình đào tạo - 453 sinh viên năm thứ tương ứng với học kỳ thứ chương trình đào tạo - 660 sinh viên năm thứ tương ứng với học kỳ thứ chương trình đào tạo Bảng 4.13 – Dữ liệu sinh viên học trường sử dụng để dự đoán kết Số lượng sinh viên Số lượng môn học Học kỳ dự đốn điểm STT Khóa học 2015 448 949 2016 453 960 2017 660 1,399 b Kết dự đoán Kết dự đốn sử dụng tiêu chí sau để đánh giá độ xác việc dự đốn kết học tập sinh viên: - Dự đoán đúng: điểm thực tế sinh viên đạt cao kết dự đoán - Dự đoán sai: điểm thực tế sinh viên đạt thấp kết dự đoán Với liệu dùng để dự đoán bảng 4.13, kết thực tế cho thấy có 3,308 mơn học mà sinh viên đăng ký học có kết với kết dự đốn (chiếm tỷ lệ 72%) 916 mơn học có kết sai so với dự đốn (chiếm tỷ lệ 28%) Hình 4.3 thể kết dự đốn mơn học với số liệu dự đốn bảng 4.13 41 Hình 4.3 Tỷ lệ dự đoán kết học tập sinh viên Kết dự đốn có tỷ lệ sai 28% báo dự đốn cần yếu tố mơi trường phụ thuộc luận văn chưa xem xét vấn đề Nguyên nhân số nguyên nhân sau: - Yếu tố chủ quan sinh viên không tập trung học - Yếu tố khách quan: o Vắng lý gia đình, đau ốm o Học kỳ SV học nhiều môn o SV học không thời điểm bảo đảm môn học trước môn học sau o Nội dung môn học thay đổi theo thời gian o … 42 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết luận Mục đích đề tài nghiên cứu thuật tốn khai thác luật luật không dư thừa, xây dựng ứng dụng dự đoán kết học tập sinh viên tập liệu kết học tập sinh viên hoàn thành mơn học chương trình đào tạo tốt nghiệp từ năm 2005 đến tháng 1/2017 Đề tài mô tả chi tiết xây dựng thực nghiệm cho thuật toán khai thác luật IMSR_PreTree thuật tốn khai thác luật khơng dư thừa MNSR_PreTree Dựa kết thực nghiệm, đề tài đề xuất sử dụng thuật toán khai thác luật không dư thừa MNSR_PreTree để xây dựng ứng dụng dự đoán kết học tập sinh viên khoa CNTT trường Đại học Công nghiệp Tp.HCM Đề tài xây dựng ứng dụng dự đốn kết học tập sinh viên Ứng dụng dự đốn giúp sinh viên có nhìn tổng quan đường học tập thân để có chọn lựa xác nhằm đem lại hiệu cao việc học thân Đối với phận tư vấn sinh viên trường, ứng dụng mang lại cho giảng viên nhìn cụ thể khả học tập, trình độ sinh viên để hướng dẫn sinh viên cách rõ ràng, cụ thể hơn; phát huy tối đa khả hỗ trợ sinh viên Đối với lãnh đạo khoa, trường, ứng dụng hỗ trợ việc quản lý sinh viên, quản lý mơn học sinh viên có nhiều khả học tập tốt, mơn học tạo khả học tập cho sinh viên học tập ngày tốt hơn; qua điều chỉnh lại chương trình đào tạo, phương pháp giảng dạy để hỗ trợ tạo điều kiện tốt cho sinh viên em định học khoa CNTT trường Đại học Công nghiệp Tp.HCM Đề tài đề xuất xây dựng ứng dụng nhằm hỗ trợ sinh viên việc học tập để đạt kết cao Nhưng ứng dụng xây dựng hoạt động tình trạng nội Đề tài hướng đến việc phát triển ứng dụng website để sinh viên tự dự đốn kết học tập mà khơng cần phải nhờ đến nhân viên tư vấn hỗ trợ trường Việc làm giảm áp lực công việc giảng viên phụ trách nhiệm vụ tư vấn, hỗ trợ sinh viên, để giảng viên có thời gian hỗ trợ sinh viên phương diện khác đời sống, tâm lý khơng riêng việc học tập Bên cạnh đó, ứng dụng dự đoán kết học tập sinh viên theo học khoa CNTT Hướng phát triển đề tài mở rộng việc dự đoán kết học tập cho sinh viên toàn trường cho dù sinh viên học ngành 43 TÀI LIỆU THAM KHẢO Agrawal, R., Srikant, R (1995), "Mining sequential patterns", Proceedings of the 11th International Conference on Data Engineering, 3–14 Ayres, J., Gehrke, J.E., Yiu, T., Flannick, J (2002), "Sequential pattern mining using a bitmap representation", Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 429–435 Baralis, E., Chiusano, S., Dutto, R (2008), "Applying Sequential Rules to Protein Localization Prediction", Computer and Mathematics with Applications 55, (5), 867–878 Brin, S., Motwani, R., Ullman, J., Tsur, S (1997), "Dynamic Itemset Counting and Implication Rules for Market Basket Data", In Proc of the 1997 ACMSIGMOD Int’l Conf on the Management of Data, 255-264 Dong, G., Pei, J., (2007), "Sequence Data Mining", Springer Science + Business Media, LLC Fournier-viger, P., Wu, C.-W., Tseng, V.S., Nkambou, R (2012), "Mining sequential rules common to several sequences with the window size constraint", Proceedings of the 25th Canadian International Conference on Artificial Intelligence (AI 2012), Lecture Notes in Artificial Intelligence, 7310, Springer, 299–304 Gouda, K., Hassaan, M., Zaki, M.J (2010), "PRISM: a primal-encoding approach for frequent sequence mining", Journal of Computer and System Sciences 76 (1), 88– 102 Han, J., Pei, J., Mortazavi-Asl, B., Chen, Q., Dayal, U., and Hsu, M.C., (2000), "Freespan: Frequent pattern-projected sequential pattern mining", Proc 2000 Int Conf Knowledge Discovery and Data Mining (KDD’00), 355–359 Lo, D., Khoo, S.C., Wong, L (2009), "Non-Redundant Sequential Rules Theory and Algorithm", Information Systems, Volume 34, Issue 4-5, 438-453 10 Masseglia, F., Cathala, F., & Poncelet, P (1998), “The PSP Approach for Mining Sequential Patterns”, Proceedings of the 2nd European Symposium on Principles of Data Mining and Knowledge Discovery, Nantes, France, 176- 184 11 Pei J., Han J., Mortazavi-Asl B., Wang J., Pinto H., Chen Q., Dayal U., Mei-Chun Hsu (2004), "Mining sequential patterns by pattern-growth: the prefixspan approach", IEEE Transactions on Knowledge and Data Engineering 16 (10), 1424–1440 44 12 Pham, T-T., Luo, J., Hong, T-P., Vo B (2014) "An efficent method for mining nonredundant sequential rules using attributed prefix-trees", Engineering Applications of Artificial Intelligence 32, 88-99 13 Spiliopoulou, M (1999), "Managing Interesting Rules in Sequence Mining", Proceedings of European Conference on Principles of Data Mining and Knowledge Discovery, 554–560 14 Srikant, R., Agrawal, R (1996), “Mining Sequential Patterns: Generalizations and Performance Improvements”, in: Proc 5th Int’l Conf Extending Database Technology, 3– 17 15 Van, T.-T., Van, B., Le, B., (2011) "Mining sequential rules based on prefix-tree." Studies in Computational Intelligence (Springer), 147-156 16 Van, T.-T., Vo B., Le B., (2014), "IMSR_PreTree: an improved algorithm for mining sequential rules based on the prefix-tree", Vietnam Journal of Computer Science 1, 97-105 17 Zaki, M.J., (2000), "SPADE: an efficient algorithm for mining frequent sequences", The Journal of Machine Learning Research, 42 (1-2), 31–60 18 Quyết định số 43/2007/QB-BGDBT Bộ Giáo dục Đào tạo: Ban hành Quy chế đào tạo bậc đại học cao đẳng hệ quy theo hệ thống tín chỉ, Bộ giáo dục đào tạo, 2007 19 Qui chế học vụ, Trường Đại học Công nghiệp Tp.HCM 20 http://fimi.ua.ac.be/data/ 45 PHẦN III PHỤ LỤC ĐÍNH KÈM (tất văn sử dụng photo, sử dụng lý hợp đồng) Hợp đồng thực đề tài nghiên cứu khoa học Thuyết minh đề tài phê duyệt Quyết định nghiệm thu Hồ sơ nghiệm thu (biên họp, phiếu đánh giá, bảng tổng hợp điểm, giải trình, phiếu phản biện) Sản phẩm nghiên cứu:bài báo, tốt nghiệp thạc sĩ, bìa luận văn thạc sĩ, hướng dẫn sử dụng sản phẩm ứng dụng 46 ... để xây dựng ứng dụng dự đoán kết học tập sinh viên khoa CNTT trường Đại học Công nghiệp Tp.HCM Đề tài xây dựng ứng dụng dự đoán kết học tập sinh viên Ứng dụng dự đốn giúp sinh viên có nhìn tổng. .. mơn học tự chọn học kỳ sau 38 4.3 Xây dựng ứng dụng Dựa mơ hình đề xuất hình 4.1, đề tài tiến hành xây dựng ứng dụng dự đoán kết học tập sinh viên Ứng dụng dựa liệu đầu vào kết môn học mà sinh viên. .. HÌNH DỰ ĐỐN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN Trong chương này, nhóm tác giả đề xuất xây dựng mơ hình dự đốn kết học tập sinh viên Dựa kết dự đoán, sinh viên có kế hoạch học tập tốt q trình học tập trường

Ngày đăng: 01/02/2021, 08:26

Mục lục

  • Xây dựng ứng dụng dự đoán kết quả học tập cho sinh viên

  • Phần 1: Thông tin chung

  • Phần 2: Báo cáo chi tiết đề tài ngiên cứu khoa học

  • 1.3. Phương pháp nghiên cứu

  • 2.2. Khái niệm luật tuần tự

  • Chương 3: Đánh giá thuật toán

    • 3.1. Môi trường thực nghiệm

    • 3.2. Kết quả thực nghiệm

    • Chương 4: Mô hình dự đoán kết quả học tập của sinh viên

      • 4.1. Mô tả bài toán

      • 4.2. Mô hình dự đoán kết quả học tập của sinh viên

      • 4.3. Xây dựng ứng dụng

      • Tài liệu tham khảo

Tài liệu cùng người dùng

Tài liệu liên quan