Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
2,18 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG - - LÊ THỊ THANH VANG XÂY DỰNG GIẢI PHÁP DỰ ĐOÁN KẾT QUẢ TỐT NGHIỆP TRONG TRƯỜNG TRUNG HỌC PHỔ THÔNG LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN Đồng Nai, Năm 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG - - LÊ THỊ THANH VANG XÂY DỰNG GIẢI PHÁP DỰ ĐOÁN KẾT QUẢ TỐT NGHIỆP TRONG TRƯỜNG TRUNG HỌC PHỔ THÔNG CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Mà SỐ: 8480201 LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS TRẦN VĂN LĂNG Đồng Nai, Năm 2018 i LỜI CẢM ƠN Đầu tiên, em xin chân thành cảm ơn thầy PGS.TS Trần Văn Lăng tận tình hướng dẫn, bảo suốt thời gian thực luận văn Kế đến xin bày tỏ lịng biết ơn đến q thầy khoa sau đại học Đại Học Lạc Hồng tận tâm dạy bảo, cung cấp kiến thức q báu suốt q trình học tập; thầy văn phịng khoa hết lịng giúp đỡ, cung cấp tài liệu tham khảo, tạo điều kiện thuận lợi để tơi hồn thành luận văn Em xin gửi lời cảm ơn đến người thân gia đình; anh chị, bạn lớp quan tâm giúp đỡ suốt thời gian học tập làm luận văn Do thời gian làm luận văn hạn chế, kiến thức có hạn; nên luận văn khơng tránh khỏi thiếu sót Kính mong nhận ý kiến đóng góp q thầy bạn để luận văn hoàn chỉnh Xin chân thành cảm ơn! Đồng Nai, ngày 16 tháng 10 năm 2018 HỌC VIÊN Lê Thị Thanh Vang ii LỜI CAM ĐOAN Tôi cam đoan kết đạt luận văn sản phẩm riêng cá nhân, kết đạt quà trình học tập nghiên cứu khoa học độc lập Trong toàn nội dung luận văn, điều trình bày cá nhân tổng hợp từ nhiều nguồn tài liệu Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Khơng có sản phẩm hay nghiên cứu người khác sử dụng luận văn mà khơng có trích dẫn theo quy định Tơi xin hồn tồn chịu trách nhiệm chịu hình thức kỹ luật theo quy định cho lời cam đoan Đồng Nai, ngày 16 tháng 10 năm 2018 HỌC VIÊN Lê Thị Thanh Vang iii TRƯỜNG ĐẠI HỌC LẠC HỒNG KHOA SAU ĐẠI HỌC ¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯ TÓM TẮT LUẬN VĂN (Dùng cho học viên người hướng dẫn) Đề tài: Xây dựng giải pháp dự đoán kết tốt nghiệp trường trung học phổ thông Ngành: Công nghệ thông tin Mã số: 8480201 Học viên: Lê Thị Thanh Vang Người hướng dẫn: PGS.TS Trần Văn Lăng NỘI DUNG TÓM TẮT Nội dung giao kết mong đợi người hướng dẫn - Thu thập liệu liên quan nằm phạm vi nghiên cứu luận văn như: Tổng điểm trung bình theo mơn học (Tốn, Ngữ Văn, Anh Văn, Vật Lý, Hóa Học, Sinh Học, Lịch Sử, Địa Lí, Giáo Dục Cơng Dân), năm học lớp 10, 11, 12; thông tin cá nhân học sinh; tập liệu huấn luyện ( kết mơn học tốt nghiệp khóa học trước) - Nghiên cứu, phân tích vấn đề liên quan đến cơng việc dự đốn kết đậu tốt nghiệp học sinh, yếu tố ảnh hưởng đến kết tốt nghiệp em - Nghiên cứu thuật toán Kmeans, cách khai phá liệu từ tập liệu có sẵn trường kết học tập, kết tốt nghiệp thông tin cá nhân học sinh Từ tập liệu huấn luyện sử dụng phần mềm Weka để phân lớp - Phân tích thiết kế sở liệu sau có kết thu thập - Phân tích thiết kế hệ thống để có chức chương trình “Xây dựng giải pháp dự đoán kết tốt nghiệp trường trung học phổ thông” - Thực nghiệm đánh giá chương trình Cách thức giải vấn đề Giải pháp đưa để giải vấn đề toán “Xây dựng giải pháp dự đoán kết tốt nghiệp trường trung học phổ thông” thực theo bước sau: Bước 1: Người dùng cung cấp file liệu kết học tập học sinh file excel, file excel đuợc kết xuất từ hệ thống khác Mỗi file excel tuân thủ theo iv định dạng chung, không định dạng chương trình khơng thể cập nhật liệu Buớc 2: Trong bước cần phải chuẩn hóa liệu liệu ban đầu dư thiếu trường (cột) ví dụ: cột kết cuối năm, cột xếp loại, ….Bước cần cập nhật thêm trường thiếu loại bỏ cột dư thừa Bước 3: Thực trình làm liệu liệu không (không phải số), liệu bị nhiễu bị loại bỏ Dữ liệu bị khuyết kiểm tra thông báo yêu cầu bổ sung Bước phải thực hoàn thành trước thực bước Bước 4: Sau liệu làm chuẩn hóa thành cơng Luận văn tiến hành phân cụm liệu với thuật toán K-Means Khi thực liệu huấn luyện với thuật toán K-Means cho ta kết Bước 5: Kết thực thuật toán K-Means với liệu huấn luyện tập cụm Các cụm cho ta biết liệu cần kiểm tra thuộc cụm Từng cụm kết khác hoàn toàn Bước 6: Dựa vào tập cụm kết thống kê tỉ lệ theo cụm, chương trình thực dự đốn kết tốt nghiệp trung học phổ thơng, từ giúp giáo viên có cách nhìn tổng quan tình hình học tập học sinh thực bồi dưỡng kiến thức cho học sinh có học lực trung bình, yếu Kết hợp bước triển khai xây dựng thành phần mềm có giao diện tương tác với người dùng Windows Form Luận văn sử dụng hệ quản trị sở liệu SQL Server 2010 sử dụng công nghệ Visual Studio 2013 để viết chương trình luận văn ngơn ngữ C# Đồng Nai, Ngày 16 tháng 10 năm 2018 NGƯỜI HƯỚNG DẪN PGS.TS Trần Văn Lăng HỌC VIÊN Lê Thị Thanh Vang v MỤC LỤC Trang LỜI CẢM ƠN I LỜI CAM ĐOAN .II MỤC LỤC V DANH MỤC CÁC KÍ HIỆU, CÁC TỪ VIẾT TẮT VIII DANH MỤC CÁC HÌNH ẢNH IX DANH MỤC CÁC BẢNG BIỂU X CHƯƠNG 1: TỔNG QUAN 1.1 MỞ ĐẦU 1.2 GIỚI THIỆU ĐỀ TÀI 1.2.1 Lý chọn đề tài 1.2.2 Mục tiêu đề tài 1.3 ĐỐI TƯỢNG PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI 1.3.1 Kết học tập 1.3.2 Diện miễn thi 1.3.3 Điểm ưu tiên: 1.3.4 Điểm khuyến khích: 1.4 PHƯƠNG PHÁP NGHIÊN CỨU 1.4.1 Phương pháp nghiên cứu lý thuyết: 1.4.2 Phương pháp thực nghiệm 1.5 CÂU HỎI VÀ GIẢ THIẾT NGHIÊN CỨU CỦA ĐỀ TÀI 1.6 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI 1.6.1 Ý nghĩa khoa học 1.6.2 Ý nghĩa thực tiễn 1.7 CẤU TRÚC LUẬN VĂN CHƯƠNG 2: GIẢI PHÁP GIẢI QUYẾT BÀI TOÁN DỰ ĐOÁN 2.1 GIỚI THIỆU VỀ BÀI TOÁN DỰ ĐOÁN 2.2 MỤC TIÊU VÀ NHIỆM VỤ: vi 2.2.1 Mục tiêu: 2.2.2 Nhiệm vụ 2.3 PHÂN CỤM DỮ LIỆU TRONG KHAI PHÁ DỮ LIỆU 2.3.1 Định nghĩa phân cụm liệu 2.3.2 Gom cụm rõ: 2.3.3 Gom cụm mờ: 2.4 ĐỘ ĐO 2.4.1 CÁC TÍNH CHẤT CỦA ĐỘ ĐO 2.4.2 CAC KIỂU DỮ LIỆU CƠ SỞ 2.5 THUẬT TOÁN FUZZY C-MEANS (FCM)[11] 10 2.6 MỘT SỐ NGHIÊN CỨU MỚI VỀ GOM CỤM MỜ 11 2.6.1 Gom cụm mờ với tiêu chuẩn phân tách 11 2.6.2 Gom cụm gia tăng K-Means mờ dựa K-Center véctơ lượng tử 14 2.7 CƠ SỞ DỮ LIỆU THỰC HIỆN GOM CỤM 18 2.7.1 Cở sở thu thập liệu 18 2.7.2 Mục đích khai phá liệu kết học tập học sinh là: 18 2.8 THỰC HIỆN PHÂN CỤM TRONG LUẬN VĂN 19 2.8.1 Dữ liệu thực luận văn 19 2.8.2 Quá trình hình thành gom cụm 21 2.8.3 Kết thực trình gom cụm 26 3.1 XÂY DỰNG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ TỐT NGHIỆP TRUNG HỌC PHỔ THÔNG 29 3.1.1 Tổng quan hệ thống gom cụm luận văn 29 3.1.2 Công cụ thực 32 3.1.3 Kiến trúc hệ thống 32 3.1.4 Ưu điểm nhược điểm kiến trúc 33 3.2 MÔ TẢ MỐI QUAN HỆ GIỮA CÁC LỚP TRONG ỨNG DỤNG 35 3.3 NHỮNG CHỨC NĂNG CHÍNH TRONG CHƯƠNG TRÌNH 36 3.3.1 Phân cụm sử dụng công cụ Weka 36 3.3.2 Thực gom cụm Weka kết 37 3.3.3 Áp dụng kết gom cụm vào ứng dụng 42 4.1 DỮ LIỆU SỬ DỤNG TRONG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ THI TỐT NGHIỆP THPT.45 vii 4.2 PHƯƠNG PHÁP ĐÁNH GIÁ 46 4.3 KẾT QUẢ THỰC NGHIỆM 47 4.3.1 Kết thực nghiệm niên khóa 2013-2016 48 4.3.2 Kết thực nghiệm niên khóa 2014-2017 51 4.3.3 Kết thực nghiệm niên khóa 2015 - 2018 54 5.1 KẾT QUẢ ĐẠT ĐƯỢC CỦA LUẬN VĂN NÀY 57 5.1.1 Về mặt nội dung, luận văn đạt kết sau: 57 5.1.2 Bên cạnh thuận lợi, hạn chế mặt thời gian kiến thức luận văn hạn chế sau: 58 5.2 ĐỊNH HƯỚNG TƯƠNG LAI 58 TÀI LIỆU THAM KHẢO viii DANH MỤC CÁC KÍ HIỆU, CÁC TỪ VIẾT TẮT KÝ HIỆU THUẬT NGỮ BGH Ban giám hiệu CSDL Cơ sở liệu FCM Fuzzy C-Means FCS Fuzzy Compactness and Separation Field Trường liệu GDCD Giáo dục công dân GG Gath-Geva Clustering Algorithm GK Gustafson-Kessel algorithm ICS Inter-Cluster Separation NNC Nghề nghiệp cha NNMe Nghề nghiệp mẹ PCM Possibilistic C-Means SBD Số báo danh SBD Số báo danh THPT Trung học phổ thông Weka Waikato Environment for Knowledge Analysis 47 Nếu tập liệu cần kiểm tra 100 (dữ liệu) Dữ liệu thực là: 95 (dữ liệu) Dữ liệu có kết là: 90 (tài liệu) R= P= 90 100 90 95 𝑥 100%= 90% 𝑥 100% =94.73% 4.3 Kết thực nghiệm Dữ liệu thực nghiệm thu thập từ hệ thống quản lý đào tạo trường THPT Nguyễn Huệ Quận Mỗi liệu tập kết môn học học sinh Trong luận văn Tất phân cụm chọn giá trị K=5 tương ứng là: Rất cao, Cao, Trung Bình, Yếu, Rất Yếu 48 4.3.1 Kết thực nghiệm niên khóa 2013-2016 4.3.1.1 Kết phân cụm niên khóa 2013-2016 với K=5 Hình 4.1: Kết phân cụm niên khóa 2013-2016 49 4.3.1.2 Kết chạy thực nghiệm với mẫu liệu kiểm tra Luận văn thực nghiệm tập liệu kết học tập theo năm học học sinh niên khóa 2013-2016 Luận văn thực liệu kết cuối năm lớp 10, 11, 12 Để đánh giá kết thực nghiệm luận văn sử dụng độ bao phủ (R) độ xác (P), kết thực nghiệm mơ tả bên Trong bảng thực nghiệm có trường: Kết dự đoán kết thi tốt nghiệp THPT: Kết dự đoán thi tốt nghiệp cho niên khóa Số liệu: số lượng liệu học sinh tham gia thi tốt nghiệp THPT niên khóa Số lượng liệu test: số lượng liệu dùng để thực kiểm tra chương trình ứng dụng Số lượng liệu Test hợp lệ: liệu thỏa mãn điều kiện số môn năm học Số luợng liệu test đúng: số lượng liệu với kết thi thực tế học sinh niên khóa Độ bao phủ (R) tính cơng thức nêu phần 4.1 Độ xác (P) tính cơng thức nêu phần 4.2 Bảng 3: Kết thực nghiệm niên khóa 2013-2016 Số lượng Lần Số Số Kết dự lượng Độ lượng liệu đốn kết liệu Số dữ liệu Test thi tốt nghiệp test Độ bao xác liệu test hợp lệ THPT phủ (R) (P) 100% 90% Rất cao: 0% 456 10 10 Cao: 45,45% TB: 54,55% Yếu: 0% 50 Rất yếu: 0% Rất cao: 0% Cao: 15% 456 20 20 TB: 85% 15 100% 75% 24 100% 80% Yếu: 0% Rất yếu: 0% Rất cao: 0% Cao: 36,67% 456 30 30 TB: 63,33% Yếu: 0% Rất yếu: 0% Nhận xét Kết thực nghiệm niên khóa 2013-2016 cho ta thấy độ bao phủ R ln lớn độ xác P liệu Test trích lấy từ kết sở liệu quản lý đào tạo trường THPT Nguyễn Huệ Quận Tuy nhiên độ xác có tỉ lệ đạt từ 75% trở lên Độ xác tồn khóa đạt 81,7% Do liệu mẫu kiểm tra chuẩn bị tốt nên Số lượng liệu Test không hợp lệ Số luợng mẫu liệu test nhỏ số luợng liệu test hợp lệ Trong niên khóa 2013-2016 kết thi tốt nghiệp học sinh chủ yếu phân khúc kết cao trung bình 51 4.3.2 Kết thực nghiệm niên khóa 2014-2017 4.3.2.1 Kết phân cụm niên khóa 2014-2017 với K=5 Hình 4.2: Kết phân lớp niên khóa 2014 -2017 52 4.3.2.2 Kết chạy thực nghiệm với mẫu liệu kiểm tra Luận văn thực nghiệm tập liệu kết học tập theo năm học học sinh niên khóa 2014-2017, liệu kết cuối năm lớp 10, 11, 12 Để đánh giá kết thực nghiệm luận văn sử dụng độ bao phủ (R) độ xác (P), kết thực nghiệm mô tả bên Trong bảng thực nghiêm có trường: Kết dự đoán kết thi tốt nghiệp THPT: Kết dự đốn thi tốt nghiệp cho niên khóa Số liệu: số lượng liệu học sinh tham gia thi tốt nghiệp THPT niên khóa Số lượng liệu test: số lượng liệu dùng để thực kiểm tra chương trình ứng dụng Số lượng liệu Test hợp lệ: liệu thỏa mãn điều kiện số môn năm học Số luợng liệu test đúng: số lượng liệu với kết thi thực tế học sinh niên khóa Độ bao phủ (R) tính cơng thức nêu phần 4.1 Độ xác (P) tính công thức nêu phần 4.2 Bảng 4: Kết thực nghiệm niên khóa 2014-2017 Số Lần Số lượng Số lượng lượng Độ Độ Số liệu Kết dự đốn liệu bao liệu Test kết thi tốt test phủ xác liệu test hợp lệ nghiệp THPT (R) (P) 100% 80% Rất cao: 0% 682 20 20 Cao: 10% TB: 90% Yếu: 0% 53 Rất yếu: 0% Rất cao: 0% Cao: 16,67% 682 30 30 TB: 80% 25 100% 83,3% 34 100% 85% Yếu: 3,33% Rất yếu: 0% Rất cao: 0% Cao: 35% 682 40 40 TB: 57.5% Yếu: 7.5% Rất yếu: 0% Nhận xét Kết thực nghiệm niên khóa 2014-2017 cho ta thấy độ bao phủ R ln lớn độ xác P liệu Test trích lấy từ kết sở liệu quản lý đào tạo trường THPT Nguyễn Huệ, Quận Tuy nhiên độ xác có tỉ lệ đạt cao từ 80% trở lên Độ xác tồn khóa đạt 82,77 % Do liệu mẫu kiểm tra chuẩn bị tốt nên Số lượng liệu Test không hợp lệ Số luợng mẫu liệu test nhỏ số luợng liệu test hợp lệ Trong niên khóa 2014-2017 kết thi tốt nghiệp học sinh chủ yếu phân khúc kết cao trung bình yếu 54 4.3.3 Kết thực nghiệm niên khóa 2015 - 2018 4.3.3.1 Kết phân cụm niên khóa 2015-2018 với K=5 Hình 3: Kết phân lớp niên khóa 2015 -2018 55 4.3.2.2 Kết chạy thực nghiệm với mẫu liệu kiểm tra Luận văn thực nghiệm tập liệu kết học tập theo năm học học sinh niên khóa 2015-2018 Luận văn thực liệu kết cuối năm lớp 10, 11, 12 Để đánh giá kết thực nghiệm luận văn sử dụng độ bao phủ (R) độ xác (P), kết thực nghiệm mô tả bên Trong bảng thực nghiêm có trường: Kết dự đốn kết thi tốt nghiệp THPT: Kết dự đoán thi tốt nghiệp cho niên khóa Số liệu: số lượng liệu học sinh tham gia thi tốt nghiệp THPT niên khóa Số lượng liệu test: số lượng liệu dùng để thực kiểm tra chương trình ứng dụng Số lượng liệu Test hợp lệ: liệu thỏa mãn điều kiện số môn năm học Số luợng liệu test đúng: số lượng liệu với kết thi thực tế học sinh niên khóa Độ bao phủ (R) tính cơng thức nêu phần 4.1 Độ xác (P) tính cơng thức nêu phần 4.2 Bảng 5: Kết thực nghiệm niên khóa 2015-2018 Số Lần Số lượng Số lượng lượng Số liệu Kết dự đoán liệu Độ bao liệu Test kết thi tốt test phủ xác liệu test hợp lệ nghiệp THPT (R) (P) Độ Rất cao: 0% 687 30 29 Cao: 79,31% TB: 17,24% Yếu: 3,45% 24 96,67% 82,76% 56 Rất yếu: 0% Rất cao: 0% Cao: 70% 687 40 40 TB: 22,5% 34 100% 85% 42 96% 87,5% Yếu: 7,5% Rất yếu: 0% Rất cao: 0% Cao: 72,92% 687 50 48 TB: 25% Yếu: 2,08% Rất yếu: 0% Nhận xét Kết thực nghiệm niên khóa 2015-2018 cho ta thấy độ bao phủ R lớn độ xác P liệu Test trích lấy từ kết sở liệu quản lý đào tạo trường THPT Nguyễn Huệ Quận Độ xác có tỉ lệ đạt cao từ 82% trở lên Độ xác tồn khóa đạt 80,1% Do liệu mẫu kiểm tra chuẩn bị tốt nên Số lượng liệu Test không hợp lệ Số luợng mẫu liệu test nhỏ số luợng liệu test hợp lệ Trong niên khóa 2015-2018 kết thi tốt nghiệp học sinh chủ yếu phân khúc kết cao trung bình yếu 57 CHƯƠNG 5: KẾT LUẬN 5.1 Kết đạt luận văn Từ việc dự đoán kết thi tốt nghiệp THPT theo cảm tính theo sở thích, theo phong trào, luận văn cho công cụ hỗ trợ tự động giúp người sử dụng tiện dụng công tác tư vấn hỗ trợ, đưa dự đoán kết thi tốt nghiệp THPT cho học sinh dựa kết học tập học sinh đó, qua kết thống kê nhiều năm học Giúp nhà trường chủ động công tác phụ đạo, bồi dưỡng cho học sinh học lực trung bình, yếu yếu Qua kết thực nghiệm đạt cho thấy tính hữu dụng hệ thống 5.1.1 Về mặt nội dung, luận văn đạt kết sau: Giới thiệu toán khai phá liệu giáo dục: khái niệm, miền liệu hướng tiếp cận tốn Trình bày cách thức phân cụm (phân nhóm) để làm liệu mẫu đầu vào cho hệ thống Trình bày cách thực thuật tốn K-means để phân cụm Weka kết học tập học sinh Ngoài ra, luận văn sử dụng thuật tốn Fuzzy K-means cịn kết hợp với liệu nghề nghiệp cha mẹ học sinh hàm liên thuộc Fuzzy Logic Nghề nghiệp cha mẹ học sinh dựa vào thống kê để làm độ đo nghề nghiệp có ảnh hưởng đến kết học tập học sinh Nghiên cứu toán thuật toán K-means kết hợp với Fuzzy K-means giúp dự đoán kết thi tốt nghiệp: nêu phương pháp thực gom cụm, cách thức thực thuật toán K-means cho lĩnh vực giáo dục, đồng thời phân tích ưu điểm khuyết điểm hệ thống Nhằm xây dựng phương pháp phù hợp để giải toán dự đoán kết thi tốt nghiệp phù hợp với lực học sinh Thông qua sở lý thuyết để giải toán dự đoán kết thi tốt nghiệp cho năm học dựa vào kết học tập, luận văn xây dựng mơ hình hệ thống cho ứng dụng 58 Xây dựng chương trình ứng dụng để ứng dụng toán dự đoán kết thi tốt nghiệp THPT ngôn ngữ C#, mơi trường Windows Form để đánh giá mơ hình hệ thống xây dựng Xuất tập cụm trọng tâm cụm thực thuật tốn K-means sau sử dụng tập cụm để thực trình kiểm tra liệu Lọc liệu trùng, bị nhiễu, liệu trống trước thực thuật toán K-means Hệ thống cho phép Import liệu từ File Excel nên trình nhập liệu đầu vào nhanh, tiết kiệm nhiều thời gian chi phí Hệ thống cho phép kết xuất kết chọn khối thi File Excel, file CSV Thuận tiện cho việc tư vấn với số lượng nhiều học sinh lúc 5.1.2 Bên cạnh thuận lợi, hạn chế mặt thời gian kiến thức luận văn hạn chế sau: Số lượng liệu thu thập không lớn, nghiên cứu diện hẹp (chỉ có liệu học sinh hai niên khóa trường THPT Nguyễn Huệ) Chỉ sử dụng cho thuật toán K-means, chưa sử dụng thuật toán khác để so sánh kết Chưa có chế thu thập liệu trực tiếp từ hệ thống quản lý đào tạo (chỉ thu thập thông qua file Excel) Giao diện sử dụng cịn có số hạn chế chưa tiện dụng thời gian xử lý chậm Chưa có chế cập nhật nguồn liệu theo thời gian, để đảm bảo CSDL theo kịp với nguồn liệu nhà trường sau năm học Phương pháp nghiên cứu sử dụng luận văn phương pháp nghiên cứu thực nghiệm nên có hạn chế định Tốn thời gian muốn thu kết cuối cần phải lặp lại thực nghiệm nhiều lần, thời gian thu nhập thơng tin nghiên cứu dài Chi phí cao phải lặp lặp lại thực nghiệm nhiều lần 5.2 Định hướng tương lai Trong tương lai, luận văn tiếp tục hoàn thiện hạn chế nên 59 Dữ liệu đầu vào lấy trực tiếp từ hệ thống quản lý đào tạo nhà trường Bổ sung thêm chức cho giao diện cho thuận lợi cho người sử dụng Cập nhật liệu theo thời gian, định thời gian để thực cập nhật Mở rộng thu thập liệu thêm cho nhiều niên khóa thực nghiệm với nhiều trường THPT khác Cải tiến kỹ thuật gom cụm, phân nhóm tốt Cải tiến thêm thuật toán K-Mean để q trình xử lý nhanh hơn, xác Cải tiến chương trình để chi phí xử lý thấp thời gian xử lý nhanh TÀI LIỆU THAM KHẢO A Tiếng Việt [1] N T V Hảo, Ứng dụng lý thuyết tập mờ vào việc dự đoán kết tốt nghiệp phổ thông trung học, Đại học Huế, 2014 [2] N T Bình, Ứng dụng Logic mờ xây dựng hệ trợ giúp tư vấn hướng nghiệp, Đại học Đà Nẵng, 2011 [3] Quy chế thi trung học phổ thông quốc gia xét công nhận tốt nghiệp trung học phổ thông (Ban hành kèm theo Thông tư số 04/2017/TT-BGDĐT ngày 25 tháng 01 năm 2017 Bộ trưởng Bộ giáo dục Đào tạo), Quy chế, 2017 [4] Thông tư số 04/2017/TT-BGDĐT, Bộ trưởng Bộ Giáo dục Đào tạo ban hành quy chế thi trung học phổ thông quốc gia xét công nhận tốt nghiệp trung học phổ thông, từ trang 28 đến trang 34 [5] Thông tư số 02/2015/TT-BGDĐT, ngày 26 tháng 02 năm 2015 Bộ trưởng Bộ Giáo dục Đào tạo việc ban hành Quy chế thi trung học phổ thông quốc gia [6] Thông tư số 02/2016/TT-BGDĐT, ngày 10 tháng 03 năm 2016 Bộ trưởng Bộ Giáo dục Đào tạo việc sửa đổi, bổ sung số điều Quy chế thi trung học phổ thông quốc gia [7] Vũ Lan Phương “Nghiên cứu cài đặt số giải thuật phân cụm phân lớp” 2006 (Đại học Bách khoa Hà Nội) [8] Nguyễn Đình Thn, Đồn Huấn (2011), “Sử dụng thuật tốn gom cụm mờ khai phá sở liệu ERP doanh nghiệp dược phẩm”, Báo cáo hội thảo quốc gia lần thứ XIV: Một số vấn đề chọn lọc công nghệ thông tin truyên thông, Trường Đại học Cần Thơ [9] Đỗ Phúc (2009), Giáo trình Khai thác liệu, Nhà xuất Đại học quốc gia thành phố Hồ Chí Minh, Hồ Chí Minh B Tiếng Anh [10] Gustafson D E, Kessel W C (1979), “Fuzzy clustering with a fuzzy covariance matrix”, In: Proceedings of IEEE Conference Decision Control San Diego, CA, 761-766 [11] Hesam I., Ajith A (2011), “Fuzzy C-means and fuzzy swarm for fuzzy clustering problem”, Expert Systems with Applications 38 , 1835–1838 [12] Gath I, Geva A B (1989), “Unsupervised optimal fuzzy clustering”, IEEE Trans Pattern Anal Machine Intell., (7), 773-781 [13] A.K Jain, M.N Murty, P.J Flynn (1999), “Data Clustering: A Review”, ACM Computing Surveys, Vol 31, No [14] Taoying L and Yan C (Nov 2010), “Fuzzy K-Means Incremental Clustering Based on K-Center and Vector Quantization”, Journal of computers, Vol 5, No 11 [15] Nguyen Bich Lien, Do Phuc (2010), “An application of data mining to revenue cycle in ERP and E-commerce environment” Proceedings of the Sixth International Conference on Information Technology for Education and Research [16] Barni M, Cappellini V, Mecocci A (1996), “Comments on A possibilistic approach to clustering” IEEE Trans Fuzzy Sys-terms, 4(3), 393-396 [17] Witold P (2005), Knowledge-Based Clustering: Clustering and Fuzzy Clustering, ISBN 0-471-46966-1, John Wiley & Sons, Inc [18] Krishnapuram R, Keller J M (1993), “A possibilistic approach to clustering”, IEEE Trans Fuzzy Systerms, 1(2): 98-110 [19] Yin Z., Tang Y., Sun F., Sun Z (2006), “Fuzzy Clustering with Novel Separable Criterion”, Tsinghua Science And Technology ISSN 1007-0214 09/21 Volume 11, Number 1, pp50-53 [20] Ozdemir D, Akarun L (2001), “Fuzzy algorithms for combined quantization and dithering”, IEEE Trans Image Processing, 10(6), 923-931 [21] Yang M S, Wu K L, Yu J (2003), “A novel fuzzy clustering algorithm”, Computational Intelligence in Robotics and Auto-mation IEEE International Symposium, (2), 647-652 ... ? ?Xây dựng giải pháp dự đốn kết tốt nghiệp trường trung học phổ thông” - Thực nghiệm đánh giá chương trình Cách thức giải vấn đề Giải pháp đưa để giải vấn đề toán ? ?Xây dựng giải pháp dự đoán kết. .. TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG - - LÊ THỊ THANH VANG XÂY DỰNG GIẢI PHÁP DỰ ĐOÁN KẾT QUẢ TỐT NGHIỆP TRONG TRƯỜNG TRUNG HỌC PHỔ THÔNG CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Mà SỐ: 8480201 LUẬN VĂN THẠC... TRƯỜNG ĐẠI HỌC LẠC HỒNG KHOA SAU ĐẠI HỌC ¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯ TÓM TẮT LUẬN VĂN (Dùng cho học viên người hướng dẫn) Đề tài: Xây dựng giải pháp dự đoán kết tốt nghiệp trường trung học phổ thông