Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 67 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
67
Dung lượng
2,11 MB
Nội dung
luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KS CAO CHIẾN THẮNG XÂYDỰNGHỆHỖTRỢCHOHỌCSINHDỰTUYỂNVÀOCÁCTRƢỜNGTHPTTRÊNĐỊABÀNNỘITHÀNHHẢI PHÒNG LUẬN VĂN THẠC SĨ KỸ THUẬT HẢI PHÒNG - 2016 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 BỘ GIAO THÔNG VÂN TẢI BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KS CAO CHIẾN THẮNG XÂYDỰNGHỆHỖTRỢCHOHỌCSINHDỰTUYỂNVÀOCÁCTRƢỜNGTHPTTRÊNĐỊABÀNNỘITHÀNHHẢI PHÒNG LUẬN VĂN THẠC SĨ KỸ THUẬT; MÃ SỐ: 60580202 CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Ngƣời hƣớng dẫn khoa học: TS Nguyễn Trọng Đức HẢI PHÒNG - 2016 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 LỜI CAM ĐOAN Tôi xin cam đoan kết đạt đƣợc luận văn sản phẩm riêng cá nhân tôi, không chép lại ngƣời khác Trong toàn nộidung luận văn, điều đƣợc trình bày riêng cá nhân đƣợc tổng hợp từ nhiều nguồn tài liệu Tất nguồn tài liệu tham khảo đƣợc dùng có xuất xứ rõ ràng, đƣợc trích dẫn hợp pháp Tơi xin chịu hồn tồn trách nhiệm chịu hình thức kỉ luật theo quy định cho lời cam đoan Hải Phòng, 03/2016 Cao Chiến Thắng I Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 LỜI CÁM ƠN Trƣớc tiên trân trọng gửi lời cảm ơn tới TS Nguyễn Trọng Đức - ngƣời hƣớng dẫn, bảo tận tình, cung cấp tài liệu phƣơng pháp luận nghiên cứu khoa học để tơi hồn thành luận văn Tơi xin bày tỏ lòng cảm ơn sâu sắc tới thầy cô, bạn bè lớp giúp đỡ suốt năm học qua Xin cảm ơn gia đình, bạn bè, anh em đồng nghiệp quan, ngƣời ln khuyến khích, động viên giúp đỡ tơi hồn cảnh khó khăn Xin cảm ơn Phòng Giáo dục Trung học Sở Giáo dục Đào tạo Hải Phòng, nơi cung cấp cho tơi nguồn liệu quý báu Tôi xin cảm ơn thầy cô trƣờng Đại học Hàng Hải Việt Nam tạo điều kiện cho trình học làm luận văn Luận văn đƣợc hồn thành thời gian hạn hẹp nên khơng thể tránh đƣợc thiếu sót Tơi xin cảm ơn thầy cơ, bạn bè, đồng nghiệp có ý kiến đóng góp chân thànhchonộidung luận văn, để tơi tiếp tục sâu tìm hiểu lĩnh vực tƣơng lai Hải Phòng, 03/2016 Cao Chiến Thắng II Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 MỤC LỤC Trang LỜI CAM ĐOAN i LỜI CÁM ƠN ii DANH MỤC CÁC CHỮ VIẾT TẮT VÀ KÝ HIỆU v DANH MỤC CÁC HÌNH MINH HỌA vi DANH MỤC CÁC BẢNG vii MỞ ĐẦU Chƣơng 1: TỔNG QUAN 1.1 Tổng quan toán tuyểnsinh trung học phổ thông 1.1.1 Đối tƣợng phƣơng thức tuyểnsinh 1.1.2 Hồ sơ tuyểnsinh 1.1.3 Tuyển thẳng, chế độ ƣu tiên, khuyến khích 1.2 Công tác tuyểnsinhvào lớp 10 thành phố Hải Phòng 1.2.1 Đặc điểm 1.2.2 Thi tuyển xét tuyển 1.3 Khai phá liệu 12 1.3.1 Định nghĩa khai phá liệu 12 1.3.2 Nhiệm vụ khai phá liệu 13 1.3.3 Các phƣơng pháp khai phá liệu 15 1.4 Cây định 18 1.4.1 Khái niệm 18 1.4.2 Ƣu điểm nhƣợc điểm định 19 1.4.3 Xâydựng định 20 1.5 Kết luận chƣơng 24 Chƣơng 2: HỆHỖTRỢ RA QUYẾT ĐỊNH CHỌN TRƢỜNG ĐĂNG KÝ DỰ THI VÀO LỚP 10 25 2.1 Hệhỗtrợ định 25 2.1.1 Decision Support Systems (DSS) 25 2.1.2 Quy trình định 25 2.1.3 Phân loại DSS 25 III Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 2.2 Thuật toán C4.5 27 2.2.1 Lịch sử phát triển 27 2.2.2 Mã giả thuật toán C4.5 28 2.2.3 Độ đo để lựa chọn thuộc tính “tốt nhất”:information gain gain ratio 29 2.2.4 Xử lý “quá vừa” liệu 30 2.2.5 Xử lý giá trị thiếu 31 2.2.6 Chuyển đổi sang luật 31 2.2.7 Ứng dụngvào toán phân lớp liệu 32 2.3 Sử dụng phần mềm Weka với việc tạo luật sở liệu 33 2.3.1 Giới thiệu 33 2.3.2 Môi trƣờng 33 2.4 Các bƣớc thực toán 34 2.4.1 Thu gom liệu 34 2.4.2 Trích lọc liệu 34 2.4.3 Làm sạch, tiền xử lý chuẩn bị trƣớc liệu 35 2.4.4 Rời rạc hóa liệu 35 2.4.5 Tạo định 40 2.4.6 Luật đƣợc sinh từ định 42 2.5 Kết luận chƣơng 44 Chƣơng 3: CÀI ĐẶT - THỬ NGHIỆM 45 3.1 Mơ hình tốn 45 3.2 Dữ liệu thử nghiệm 45 3.3 Lựa chọn công nghệ 47 3.4 Chƣơng trình DEMO 49 3.4.1.Giao diện tƣ vấn vào 10 49 3.4.2 Modul Suy diễn 51 3.4.3 Giao diện kiểm thử liệu 51 3.4.4 Một số kết đạt đƣợc 55 KẾT LUẬN VÀ KIẾN NGHỊ 57 TÀI LIỆU THAM KHẢO 58 IV Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 DANH MỤC CÁC CHỮ VIẾT TẮT VÀ KÝ HIỆU Chữ viết tắt Giải thích CSDL Cơ sở liệu HTQĐ Hỗtrợ định KPDL Khai phá liệu HS Họcsinh THPT Trung học phổ thông THCS Trung học sở DSS Decision Support Systems V Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 DANH MỤC CÁC HÌNH MINH HỌA Số hình Tên hình Trang Hình 1.1: Các bƣớc trình khai phá liệu 12 Hình 1.2: Cây định 19 Hình 2.1: Giao diện khởi đầu WEKA 3.6.9 34 Hình 2.2: Kết thi tuyểnsinhvào lớp 10 năm học 34 2013-2014 Hình 2.3: Dữ liệu sau loại bỏ thuộc tính khơng 35 cần thiết Hình 2.4: Một số thuộc tính có liệu kiểu liên tục 36 Hình 2.5: Các thuộc tính sau đƣợc rời rạc 38 Hình 2.6: Hình ảnh định 42 Hình 2.7: Cây định theo tổng điểm thi 43 Hình 2.8 Cây đinh theo tổng điểm thi nhóm 45 điểm Hình 3.1 Thứ tự bƣớc giải toán 47 Hình 3.2 Dữ liệu thơ ban đầu 48 Hình 3.3 Các mẫu luật đƣợc lƣu CSDL 50 Hình 3.4 Các luật đƣợc tạo phần mềm Weka 51 Hình 3.5 Giao diện chƣơng trình 52 Hình 3.6: Đánh giá kết 55 Hình 3.7 Thống kê theo điểm thi 58 Hình 3.8 Thống kê theo trƣờng THCS 59 Hình 3.9 Thống kê theo trƣờng THPT 59 VI Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 DANH MỤC CÁC BẢNG Số bảng Bảng 1.1 Tên bảng Điểm cộng ứng với kết học tập rèn luyện Trang năm lớp 6,7,8,9 Bảng 1.2 Thống kê điểm chuẩn trƣờng THPT quốc lập thuộc quận nộithànhHải Phòng năm 11 2011-2015 Bảng 2.1 Kết phân lớp định 45 Bảng 3.1 Các thuộc tính chƣơng trình tuyểnsinh 48 Bảng 3.2 Mơ tả trƣờng lƣu trữ mẫu luật CSDL 50 VII Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 10 of 95 MỞ ĐẦU "We are drowning in Data but starved for knowledge." (Chúng ta chết chìm liệu lại chết đói tri thức) John Naisbitt Chúng ta biết cơng nghệ thơng tin nói chung tin học hóa lĩnh vực kinh tế, xã hội nói riêng đem lại thành cơng đáng kể, đóng góp vào phát triển toàn nhân loại Đồng thời với việc tin học hóa, việc lƣu trữ thơng tin lĩnh vực kể phát triển cách nhanh chóng Tuy nhiên, việc lƣu trữ cách ạt với nhiều thơng tin, có nhiều thơng tin bị trùng lặp gây khó khăn, từ nguồn liệu mênh mơng bao la làm để khai thác thành tri thức có ích, có giá trị Chính lĩnh vực đời, sử dụng kỹ thuật để liệu mà ta lƣu trữ đƣợc đƣợc chuyển đổi thành tri thức có ích Đó lĩnh vực khai phá liệu Mơ tả q trình phát tri thức CSDL nhiệm vụ khai phá liệu Các tri thức tiềm ẩn từ liệu kết xuất từ trình nàygiúp cho việc dự báo kinh doanh, lĩnh vực sản xuất So với phƣơng pháp truyền thống trƣớc kia,khai phá liệu giúp giảm chi phí thời gian (ví dụ nhƣ phƣơng pháp thống kê) Phát tri thức khai phá liệu liên quan đến nhiều lĩnh vựcnhiều ngành, nhƣ thống kê, sở liệu, trí tuệ nhân tạo nâng cao, thuật tốn, tính tốn song song tốc độ cao, thu thập tri thức chohệ chuyên gia Đặc biệt phát tri thức khai phá liệu gần gũi với lĩnh vực thống kê, dùng phƣơng pháp thống kê để mơ hình liệu phát mẫu, luật Lĩnh vực giáo dục đƣợc chuyên gia khai phá liệu đặc biệt quan tâm Mọi ngƣời biết giáo dục nhân tố định phát triển quốc gia Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 53 of 95 Rule : If tong_d_thi is nhom4 and trg_THCS is Chu Van An then ma_trg1 = THPT MDC (8.0/5.0) Rule : If tong_d_thi is nhom5 and trg_THCS is Chu Van An then ma_trg1 = THPT LQD (33.0/25.0) Rule : If tong_d_thi is nhom6 and trg_THCS is Chu Van An and diemut is ut1 then ma_trg1 = THPT TP (201.0/105.0) Rule : If tong_d_thi is nhom6 and trg_THCS is Chu Van An and diemut is ut2 then ma_trg1 = THPT NQ (3.0) Dựa vào luật này, việc dự đoán lớp cho liệu chƣa biết (unseen data hay Testing data) đơn giản Bảng 2.1: Kết phân lớp định Trƣờng Điểm THCS Diểm HT_RL Uu tiên Điểm Điểm Khuyến mơn Điểm mơn Nhóm Trƣờng THPT khích Chu HT_3 UT_1 KK_2 Mon1_2 Mon2_2 Nhóm THPT LQD HT_2 UT_2 KK_2 Mon1_2 Mon2_2 Nhóm THPT NQ Tơ Hiệu HT_3 UT_1 KK_1 Mon1_2 Mon2_2 Nhóm THPT NQ Văn An Hồng Bàng 2.5 Kết luận chƣơng Trong chƣơng học viên trình bày khái niệm vềhệ HTQĐ, trình bày giải thuật C4.5 việc sử dụng phần mềm Weka để tạo định nhƣ tạo luật từ định cho toán cụ thể 44 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 54 of 95 Chƣơng 3: CÀI ĐẶT - THỬ NGHIỆM 3.1 Mô hình tốn Với mục tiêu cài đặt chƣơng trình thử nghiệm nghiên cứu thuật toán xâydựng định khai phá liệu nhƣ nghiên cứu chƣơng 2, chƣơng học viên giới thiệu quy trình cài đặt chƣơng trình thử nghiệm thuật tốn Hồ sơ HS Giao diện Thu thập, trích lọc liệu Kho Dữ liệu Hệ thống suy diễn Cây đinh, luật kết hợp Tập luật Hình 3.1: Thứ tự bước giải toán 3.2 Dữ liệu thử nghiệm Trong luận văn sử dụng liệu tuyểnsinh Phòng Giáo dục trung học Sở Giáo dục Đào tạo Hải Phòng năm 2011, 2012, 2013, 2014, 2015 bảng liệu với gần 200 trƣờng, năm có khoảng 18000 họcsinhdự thi tƣơng ứng với 18000 dòng liệu: 45 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 55 of 95 Hình 3.2: Dữ liệu thơ ban đầu Bảng 3.1: Các thuộc tính chương trình tuyểnsinh Tên trƣờng Kiểu liệu Mơ tả stt Number Số thứ tự ma_phieu Text Mã phiếu ngay_nhap Date Ngày nhập phongthi Number phòng thi sbd Number Số báo danh trg_thcs Text Họcsinhtrƣờng THCS ma_tr1 Number Mã trƣờng đăng ký nguyện vọng ma_tr2 Number Mã trƣờng đăng ký nguyện vọng hl_6 Text Học lực lớp hk_6 Text Hạnh kiểm lớp hl_7 Text Học lực lớp hk_7 Text Hạnh kiểm lớp hl_8 Text Học lực lớp hk_8 Text Hạnh kiểm lớp 46 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 56 of 95 hl_9 Text Học lực lớp hk_9 Text Hạnh kiểm lớp diem_ht_rl Number Điểm học tập rèn luyện diemut Number Điểm ƣu tiên diemkk Number Điểm khuyến khích diem_mon_1 Number Điểm mơn Tốn diem_mon_2 Number Điểm mơn Văn tong_d_thi Number Tổng điểm thi do_nv Number Đỗ Nguyện vọng … 3.3 Lựa chọn công nghệ Sử dụng sở liệu Microsoft Access 2010 để lƣu trữ liệu luật Hình 3.3: Các mẫu luật lưu CSDL 47 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 57 of 95 Bảng 3.2: Mô tả trường lưu trữ mẫu luật CSDL Tên trƣờng Kiểu Mô tả liệu Muc_luat Text Đánh số luật theo phân cấp Dieukien_luat Text Lƣu trữ điều kiện luật (Kết luật đƣợc tạo từ Weka) Ketqua_luat Text Kết tƣ vấn nhận đƣợc luật Tong_so Number Lƣu trữ số lƣợng có nhóm luật So_luong Number Lƣu trữ số lƣợng có kết luật Sử dụng phần mềm mã nguồn mở Weka 3.6.9 để tạo định tạo luật từ định Hình 3.4: Các luật tạo phần mềm Weka 48 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 58 of 95 Sử dụng ngơn ngữ lập trình C# để thiết kế giao diện nhƣ kết nối sở liệu 3.4 Chƣơng trình DEMO 3.4.1.Giao diện tƣ vấn vào 10 Hình 3.5: Giao diện chương trình Modul Thực tƣ vấn Tên modul: button1_Click Chức : đƣa kết tƣ vấn chohọcsinh * Đầu vào: Điểm họcsinh thơng tin nhập từ bàn phím * Đầu ra: Kết tƣ vấn hiển thi form privatevoid button1_Click(object sender, EventArgs e) { string tong_d_thi1; string trg_thcs1; ; string diem_ht_rl1 ; string diemut1; 49 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 59 of 95 string diemkk1; string kq1; int gt11; int gt22; int gt33; float toan1; float van1; float htrl1; float ut1; float kk1; float tong1; toan1 = float.Parse(toan.Text) ; van1 = float.Parse(van.Text); htrl1 = float.Parse(htrl.Text); ut1 = float.Parse(ut.Text); kk1 = float.Parse(kk.Text); tong1 = (toan1 + van1) * + htrl1 + ut1 + kk1; // Tổng điểm if (tong1 >= 50) { tong_d_thi1 = "nhom6"; } else if ((tong1 >= 46.5) && (tong1 < 50)) { tong_d_thi1 = "nhom5"; } else if ((tong1 >= 41) && (tong1 = 37) && (tong1 < 41)) { tong_d_thi1 = "nhom3"; } else if ((tong1 >= 30) && (tong1 < 37)) { tong_d_thi1 = "nhom2"; } else { tong_d_thi1 = "nhom1"; } // Hộc tập rèn luyện if (htrl1 >= 18) { diem_ht_rl1 = "HT_3"; } else if ((htrl1 >= 16) && (htrl1 1) && (ut1 1) && (kk1 = 46.5) && (tong11 < 50)) { tdt else if ((tong11 >= 41) && (tong11 < 46.5)) { tdt else if ((tong11 >= 37) && (tong11 < 41)) { tdt = else if ((tong11 >= 30) && (tong11 < 37)) { tdt = else { tdt = "nhom1"; } string htrla; if (htrl11 >= 18) { htrla = "HT_3"; } else = "nhom5"; } = "nhom4"; } "nhom3"; } "nhom2"; } 53 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 63 of 95 if ((htrl11 >= 16) && (htrl11 < 18)) { htrla = "HT_2"; } else if (htrl11 < 165.7) { htrla = "HT_1"; } else { htrla = ""; } string uta; if (ut11 > 2) { uta = "ut3"; } else if ((ut11 > 1) && (ut11 1) && (kk11