Luận văn xây dựng hệ thống tư vấn chọn ban đầu tiên của trường trung học phổ thông Võ Văn Kiệt – huyện Vũng Liêm – tỉnh Vĩnh Long Hệ thống này đã không chỉ góp phần giải đáp thắc mắc cho đa số học sinh trước khi chọn ban giúp các em chọn đúng ban hạn chế việc chạy ban học nhầm ban… mà còn hỗ trợ cho giáo viên làm công tác quản lý danh sách học sinh chọn ban xếp lớp được thuận tiện và hiệu quả hơn trước thềm năm học mới Nghiên cứu tiến hành bốn bước chính 1 Tìm hiểu cơ sở lý thuyết và công tác quản lý học sinh chọn ban tại trường trung học phổ thông 2 Thu thập và tiền xử lý dữ liệu 3 Tìm hiểu bài toán để phân tích và thiết kế cơ sở dữ liệu lựa chọn phương pháp phù hợp với yêu cầu bài toán đặt ra và dữ liệu thu thập được 4 Cài đặt và thử ghiệm hệ thống Luận văn đã xây dựng được hệ thống hỗ trợ tư vấn chọn ban dựa trên lý thuyết Bayes phù hợp với thực tế chọn ban tại trường trung học phổ thông
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA LÝ THỊ KIỀU OANH XÂY DỰNG HỆ THỐNG TƯ VẤN HỖ TRỢ HỌC SINH CHỌN BAN TẠI TRƯỜNG TRUNG HỌC PHỔ THÔNG VÕ VĂN KIỆT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA LÝ THỊ KIỀU OANH XÂY DỰNG HỆ THỐNG TƯ VẤN HỖ TRỢ HỌC SINH CHỌN BAN TẠI TRƯỜNG TRUNG HỌC PHỔ THÔNG VÕ VĂN KIỆT Chuyên ngành : Khoa học máy tính Mã số : 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT Người hướng dẫn khoa học: TS TRẦN THẾ VŨ Đà Nẵng - Năm 2017 i LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung luận văn thực hướng dẫn trực tiếp PGS TS Nguyễn Thanh Bình; chưa cơng bố cơng trình khác Mọi tham khảo dùng luận văn trích dẫn rõ ràng trung thực tên tác giả, tên cơng trình, thời gian, địa điểm công bố; Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, xin chịu hoàn toàn trách nhiệm Tác giả Lý Thị Kiều Oanh ii TÓM TẮT LUẬN VĂN XÂY DỰNG HỆ THỐNG TƯ VẤN HỖ TRỢ CHỌN BAN CHO HỌC SINH TẠI TRƯỜNG THPT VÕ VĂN KIỆT Lý Thị Kiều Oanh, học viên cao học khoá 31, chuyên ngành Khoa học máy tính Tóm tắt - Luận văn xây dựng hệ thống tư vấn chọn ban trường trung học phổ thông Võ Văn Kiệt – huyện Vũng Liêm – tỉnh Vĩnh Long Hệ thống không góp phần giải đáp thắc mắc cho đa số học sinh trước chọn ban, giúp em chọn ban, hạn chế việc chạy ban, học nhầm ban… mà cịn hỗ trợ cho giáo viên làm cơng tác quản lý danh sách học sinh chọn ban, xếp lớp thuận tiện hiệu trước thềm năm học Nghiên cứu tiến hành bốn bước chính: (1) Tìm hiểu sở lý thuyết công tác quản lý học sinh chọn ban trường trung học phổ thông; (2) Thu thập tiền xử lý liệu; (3) Tìm hiểu tốn để phân tích thiết kế sở liệu, lựa chọn phương pháp phù hợp với yêu cầu toán đặt liệu thu thập được; (4) Cài đặt thử ghiệm hệ thống Luận văn xây dựng hệ thống hỗ trợ tư vấn chọn ban dựa lý thuyết Bayes phù hợp với thực tế chọn ban trường trung học phổ thơng Từ khóa - hệ thống hỗ trợ tư vấn; chọn ban; học sinh; trung học phổ thông; lý thuyết Bayes BUILDING A CONSULTANCY SYSTEM SUPPORTING STUDENTS TO SELECT FIELDS AT VO VAN KIET HIGH SCHOOL Abstract - The thesis presents the first counseling system of high school Vo Van Kiet - Vung Liem district - Vinh Long province This system has contributed to answering questions for the majority of the students before choosing the field, helping them choose the right field, limiting the field, learning the wrong field and support teachers to manage the list of students selecting fields, class placement is more convenient and effective before the new school year Research was conducted in main steps: (1) Understanding the theoretical basis and the management of students for selecting fields at high school; (2) Data collection and pre-processing; (3) Exploring the problem for analysis and design; Selecting the method to solve the problem requirements and the collected data; (4) Installing and testing the system The result of the thesis is to build the counseling system based on the Bayesian theory in order to meet the requirements at high school Key words - counseling support system; choose school board; student; high school; Bayesian theory iii MỤC LỤC LỜI CAM ĐOAN i TÓM TẮT LUẬN VĂN ii MỤC LỤC iii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT vi DANH MỤC CÁC BẢNG vii DANH MỤC CÁC HÌNH viii MỞ ĐẦU 1 Lý chọn đề tài Mục đích ý nghĩa đề tài Mục tiêu nhiệm vụ nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Phương tiện, công cụ triển khai Bố cục luận văn CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 Kho liệu 1.1.1 Tổng quan kho liệu 1.1.2 Mục đích kho liệu 1.1.3 Đặc tính kho liệu 1.1.4 Quy trình xây dựng kho liệu vấn đề liên quan 1.1.4.1 Kho liệu sở liệu 1.1.4.2 Kiến trúc kho liệu 1.2 Khám phá tri thức khai phá liệu 1.2.1 Tổng quan khai phá tri thức khai phá liệu 1.2.2 Quá trình khám phá tri thức 11 1.2.3 Quá trình khai phá liệu 12 1.2.4 Các kỹ thuật khai phá liệu 12 1.2.5 Khai phá liệu định 13 1.2.5.1 Định nghĩa định 13 1.2.5.2 Vấn đề xây dựng định 13 1.2.5.3 Rút luật từ định 13 1.2.5.4 Các thuật toán khai phá liệu định 14 1.3 Giới thiệu công cụ xây dựng mơ hình khai phá liệu Business Intelligence Development Studio (BIDS) Microsoft 16 iv 1.4 Giới thiệu phương pháp phân lớp Naïve Bayes 16 1.4.1 Vận dụng phương pháp toán học để phân lớp liệu 16 1.4.2 Phương pháp phân lớp Naïve Bayes 17 1.4.3 Thuật tốn Nạve Bayes 18 1.4.3.1 Mơ hình phân lớp Naïve Bayes 18 1.4.3.2 Thuật tốn Nạve Bayes 18 1.4.3.3 Các bước thực thuật tốn phân lớp Nạve Bayes 18 1.4.3.4 Mở rộng định lý Naïve Bayes 19 1.5 Kết luận 20 CHƯƠNG GIẢI PHÁP HỆ TƯ VẤN HỖ TRỢ CHỌN BAN 21 2.1 Giới thiệu công tác tư vấn chọn ban trường THPT Võ Văn Kiệt 21 2.2 Phát biểu toán tư vấn chọn ban 22 2.3 Phân tích tốn 22 2.3.1 Yêu cầu chức 22 2.3.2 Yêu cầu phi chức 23 2.3.2.1 Đối với tư vấn chọn ban 23 2.3.2.2 Đối với việc chọn ban học sinh 23 2.4 Giải pháp tổng thể 23 2.4.1 Ý tưởng 23 2.4.2 Hoạt động hệ thống 24 2.4.2.1 Mơ hình giải pháp 24 2.4.2.2 Mô tả chi tiết hoạt động hệ thống 24 2.5 Thiết kế chi tiết 25 2.5.1 Thiết kế sở liệu 25 2.5.2 Thiết kế thuật toán 27 2.5.2.1 Sơ đồ thuật toán chi tiết tư vấn dựa điểm trung bình mơn 27 2.5.2.2 Sơ đồ thuật toán chi tiết tư vấn dựa mơn học u thích 28 2.5.2.3 Sơ đồ thuật toán chi tiết tư vấn dựa ngành nghề 29 2.5.2.4 Học sinh chọn ban học 30 2.6 Kết luận 31 CHƯƠNG CÀI ĐẶT VÀ THỬ NGHIỆM 32 3.1 Môi trường cài đặt 32 3.2 Dữ liệu đầu vào 32 3.3 Cài đặt hệ thống 32 3.3.1 Các chức hệ thống 32 3.3.2 Các thành phần hệ thống 33 v 3.3.2.1 Màn hình hệ thống 33 3.3.2.2 Màn hình đăng nhập hệ thống 33 3.3.2.3 Màn hình tư vấn theo điểm mơn học 34 3.3.2.4 Màn hình tư vấn theo mơn học u thích 35 3.3.2.5 Màn hình tư vấn theo ngành nghề 35 3.3.2.6 Màn hình chọn ban học 36 3.3.2.7 Màn hình thống kê 37 3.4 Kết thử nghiệm 37 3.4.1 Các bước chuẩn bị 37 3.4.2 Dữ liệu thử nghiệm 38 3.4.2.1 Một số bảng liệu thử nghiệm 38 3.4.2.2 Thử nghiệm sử dụng định lý Bayes 39 3.4.3 Một số kết thử nghiệm 40 3.5 Đánh giá kết 43 3.6 Kết luận 43 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 44 TÀI LIỆU THAM KHẢO 46 QUYẾT ĐỊNH GIAO ĐỀ TÀI BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN vi DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT THPT Trung học phổ thông DW Data Warehouse CSDL Cơ sở liệu KPDL Khai phá liệu BIDS Business Intelligence Development Studio vii DANH MỤC CÁC BẢNG Số hiệu bảng Tên bảng Trang 1.1 Số lượng trái theo đặc điểm 19 2.1 Bảng TB_DSHOCSINH chế độ thiết kế 25 2.2 Bảng TB_LUATĐTB chế độ thiết kế 26 2.3 Bảng TB_NHOM chế độ thiết kế 26 2.4 Bảng TB_NGANH chế độ thiết kế 27 3.1 Bảng liệu danh sách học sinh 38 3.2 Bảng liệu danh sách ngành học 38 3.3 Bảng liệu danh sách nhóm ngành 38 3.4 Thống kê kết thử nghiệm 43 viii DANH MỤC CÁC HÌNH Số hiệu hình 1.1 1.2 1.3 1.4 2.1 2.2 2.3 2.4 2.5 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 Tên hình Kiến trúc kho liệu Quá trình khám phá tri thức Quá trình khai phá liệu Cây định phân lớp mức lương Mơ hình hệ thống Sơ đồ thuật toán chi tiết tư vấn dựa điểm trung bình mơn Sơ đồ thuật tốn chi tiết tư vấn dựa mơn học u thích Sơ đồ thuật tốn chi tiết tư vấn dựa ngành nghề Sơ đồ thuật toán chi tiết chọn ban học sinh Màn hình hệ thống tư vấn chọn ban Màn hình đăng nhập hệ thống Màn hình tư vấn theo điểm trung bình Màn hình tư vấn theo mơn học u thích Màn hình tư vấn theo ngành nghề Màn hình chọn ban học sinh Màn hình thống kê kết chọn ban học sinh Màn hình kết tư vấn theo điểm mơn học Màn hình kết tư vấn theo điểm môn học trường hợp chưa xác định Màn hình kết tư vấn theo mơn học u thích Màn hình kết tư vấn theo ngành nghề Màn hình kết chọn ban theo khối Trang 11 12 13 24 27 28 29 30 33 34 34 35 36 36 37 40 41 41 42 42 39 3.4.2.2 Thử nghiệm sử dụng định lý Bayes Với toán đặt mục 2.2, giả sử bạn học sinh chọn tư vấn theo điểm trung bình mơn Học sinh nhập điểm sau: Tốn: 8.5, Lý: 7.8, Hoá: 6.9, Sinh: 8.1, Văn: 7.3, Sử: 6.2, Địa: 8.2, GDCD: 8.0 Dựa vào bảng TB_LUATĐTB (mục 2.5.1), ta có KHTN:93, KHXH: 93, TG:70 Áp dụng định lý Bayes mở rộng, ta có: P1 P(Toan \ KHTN ) P( Ly \ KHTN ) P( Hoa \ KHTN ) P(Sinh\ KHTN ) P2 P(Van \ KHTN ) P(Su \ KHTN ) P( Dia \ KHTN ) P(GDCD \ KHTN ) P( KHTN ) P3 P(Toan) P( Ly) P( Hoa) P(Sinh) P4 P(Van) P(Su) P( Dia) P(GDCD) P( KHTN \ Toan, Ly, Hoa,Sinh) P1 P2 P( KHXH \ Van, Su , Dia, GDCD ) P3 P4 Theo liệu toán, ta có: P(Toan \ KHTN ) 8.5 / 93 0.091 P( Ly \ KHTN ) 7.8 / 93 0.084 P( Hoa \ KHTN ) 6.9 / 93 P(Sinh\ KHTN ) 8.1/ 93 0.087 P(Van \ KHTN ) 7.3 / 93 0.078 P(Su \ KHTN ) 0.074 6.2 / 93 0.067 P( Dia \ KHTN ) 8.2 / 93 0.087 P(GDCD \ KHTN ) 8.0 / 93 0.085 P( KHTN ) 93 / 256 0.363 P( KHXH ) 93 / 256 0.363 P(TG) P(Toan) P( Ly) 70 / 256 0.033 0.03 P( Hoa) 0.027 P(Sinh) 0.032 P(Van) 0.029 P(Su) P( Dia) 0, 024 0.032 0.273 40 P(GDCD) 0.031 P1 0.00001786 P 0.000000855 P3 0.0000140 P 0.00000069 P( KHTN \ Toan, Ly, Hoa,Sinh) P1 P2 20.89 P3 P4 20.29 Tương tự, ta có: P( KHXH \ Van, Su, Dia, GDCD) P(TG \ Toan, Ly, Hoa,Sinh) 15.71 P(TG \ Van, Su, Dia, GDCD) 15.64 Vậy tỷ lệ điểm thuộc nhóm Tốn, lý, hố, sinh cao hơn, kết tư vấn đưa chọn ban KHTN 3.4.3 Một số kết thử nghiệm Hình 3.8 Màn hình kết tư vấn theo điểm mơn học 41 Hình 3.9 Màn hình kết tư vấn theo điểm mơn học trường hợp chưa xác định Hình 3.10 Màn hình kết tư vấn theo mơn học u thích 42 Hình 3.11 Màn hình kết tư vấn theo ngành nghề Hình 3.12 Màn hình kết chọn ban theo khối 43 3.5 Đánh giá kết Hệ thống hỗ trợ tư vấn chọn ban có sở tri thức thu thập từ trường THPT Võ Văn Kiệt - thị trấn Vũng Liêm - tỉnh Vĩnh Long Các tri thức sử dụng hệ thống đầy đủ, luật mơ tả hệ thống xác với tri thức quản lý cung cấp, hệ thống tư vấn xác cho trường hợp chọn ban Kết tư vấn hệ thống dựa liệu chọn ban trường THPT Võ Văn Kiệt với số mẫu sử dụng làm luận văn 1605 học sinh Bảng 3.1 Thống kê kết thử nghiệm Tư vấn Số mẫu thử nghiệm hệ thống: 1519 1425 Tư vấn sai 94 Như kết chạy chương trình thử nghiệm tư vấn xác khoảng 93.81% từ mẫu chọn ban thực tế Kết cho thấy hệ hỗ trợ tư vấn chọn ban có hiệu thực tế cao 3.6 Kết luận Trong chương này, giới thiệu số hình làm việc hệ thống: hình chính, hình đăng nhập, hình tư vấn theo điểm môn học, … Cài đặt thử nghiệm hệ thống tư vấn chọn ban cho trường THPT, địa điểm cụ thể ứng dụng chương trình trường THPT Võ Văn Kiệt – thị trấn Vũng Liêm – tỉnh Vĩnh Long Kết thử nghiệm đạt 94 lần tư vấn sai so với kết chọn ban, nhiều nguyên nhân như: học theo ý cha mẹ, ngành nghề theo gia đình, theo bạn bè gần nhà, … Kết ban đầu đạt kết mong muốn 44 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết đạt Hệ thống góp phần giải đáp thắc mắc cho đa số học sinh trước chọn ban, giúp em chọn ban, hạn chế việc chạy ban học nhầm ban Kết luận văn xây dựng hệ thống hỗ trợ tư vấn chọn ban dựa lý thuyết Bayes phù hợp với thực tế chọn ban trường THPT liệu sử dụng liệu thực tế thu thập trường THPT Võ Văn Kiệt Hệ thống đáp ứng giúp ích cho học sinh chọn ban phù hợp, giúp cho công tác quản lý chọn ban thuận lợi hơn, tiếp cận với công nghệ, đồng thời giúp cho em làm quen với hệ thống tư vấn mà em gặp sử dụng hệ thống tư vấn đào tạo tín trường cao đẳng, đại học sau Hệ thống hoạt động dựa vào máy suy diễn tập luật thu thập từ tri thức chuyên gia để đưa kết tư vấn Tất tri thức thu thập hồn tồn xác, đáng tin cậy sử dụng thực tế trường Ngoài ra, hệ thống thiết kế Windows với giao diện thân thiện, dễ sử dụng Đồng thời có chức cần thiết cập nhật thông tin chọn ban, hỗ trợ xếp lớp cho khối thuận lợi Kết đề tài tìm giải pháp cho việc tin học hóa vấn đề tư vấn cho học sinh phổ thông thực tế, tạo điều kiện thuận lợi cho việc chọn ban, giúp học sinh chọn ban nâng cao chất lượng giảng dạy trường THPT Một số hạn chế - Tư vấn theo điểm môn học: + Vì hệ thống xây dựng theo cách để học sinh tự nhập điểm, học sinh nhập không đúng, dẫn đến kết tư vấn khơng xác + Nếu điểm trung bình mơn học 256 luật có sẵn chưa xác định phải chọn ban nào, mà phải chuyển qua tư vấn theo mơn học u thích - Tư vấn theo mơn học u thích: Mơn học u thích chưa học giỏi, việc lựa chọn ban phải định em - Tư vấn theo ngành nghề: Một ngành nghề tuyển từ nhiều khối, tư vấn lời khuyên, tuỳ ngành nghề khả mà chọn ban học phù hợp 45 Hướng phát triển Hệ thống tư vấn góp phần vào việc chọn ban phù hợp cho đa số học sinh, bên cạnh hệ thống có nhiều hạn chế Để khắc phục hạn chế, hệ thống cần phát triển để khắc phục hạn chế Hướng phát triển theo nghĩ cần: Thêm chức tư vấn trực tuyến, tăng độ xác, xử lý liệu khơng cân bằng, liệu phức tạp có số chiều lớn, tìm kiếm thơng tin, … - Hệ thống cần có thêm chức tư vấn theo khối thi vào trường đại học cao đẳng Giáo dục phổ thông thay đổi thường xuyên năm gần Dự kiến, năm tới học theo chương trình mơn bắt buộc, cịn lại em lựa chọn môn cho số tiết từ 330 trở lên, hệ thống dễ dàng chỉnh sửa cho phù hợp 46 TÀI LIỆU THAM KHẢO Tiếng việt [1] Hoàng Kiếm - Đỗ Phúc, Giáo trình khai phá liệu, Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh (2005) [2] Đồn Văn Ban, Lê Mạnh Thạnh, Lê Văn Tường Lân, Một phương pháp để xây dựng định có hiệu khai phá liệu, Kỷ yếu hội thảo quốc gia Công nghệ phần mềm Công nghệ tri thức (2006) [3] Lê Văn Tường Lân, Phụ thuộc liệu tác động tốn phân lớp khai phá liệu, Tạp chí Khoa học, Đại học Huế (Số 53 2009) Tiếng Anh [4] Nguyen Ha Nam, Nguyen Tri Thanh, and Ha Quang Thuy (2013) Introduction to Data Mining VNU- Publishing House, Vietnam (in Vietnamese) [5] Bing Liu (2011) Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data (2nd edition) Springer [6] Tope Omitola, Sebastián A Ríos, and John G Breslin (2015) Social Semantic Web Mining Morgan & Claypool [7] The Microsoft Data Warehouse Toolkit With SQL Server 2005 and the Microsoft Business Intelligence Toolset Joy Mundy, Warren Thornthwaite, Ralph Kimbal © 2006 Internet [8]http://text.xemtailieu.com/tai-lieu/ap-dung-data-warehouse-trong-phan-tichthong-tin-ve-cac-dich-vu-gia-tri-gia-tang-tren-dien-thoai-695712.html [9]http://doc.edu.vn/tai-lieu/de-tai-phan-mem-quan-ly-hoc-sinh-trung-hoc-phothong-nguyen-du-6361/ [10]http://luanvan.co/luan-van/xay-dung-he-thong-ho-tro-tu-van-tuyen-sinh-va-daotao-tin-chi-tai-truong-dai-hoc-quang-nam-51845/ [11] http://bis.net.vn/forums/p/27/273.aspx [12] http://www.academia.edu/7955467/Chuong_1_Tong_quandata_mining ... ghiệm hệ thống Luận văn xây dựng hệ thống hỗ trợ tư vấn chọn ban dựa lý thuyết Bayes phù hợp với thực tế chọn ban trường trung học phổ thơng Từ khóa - hệ thống hỗ trợ tư vấn; chọn ban; học sinh; trung. .. nhỏ minh họa việc xây dựng hệ thống hỗ trợ tư vấn b Ý nghĩa khoa học Đề tài đưa hệ thống tư vấn hỗ trợ công tác tư vấn chọn ban đăng ký ban học cho học sinh trường trung học phổ thông c Ý nghĩa... động trường, … chưa có hệ thống tư vấn giúp học sinh lựa chọn ban học Đây hệ thống tư vấn chọn ban trường, học sinh tư vấn website trường Hệ thống hỗ trợ phần đến việc lo lắng, đắn đo em học sinh