Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
2,37 MB
Nội dung
luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM BÙI THỊ MỪNG XÂYDỰNGHỆHỖTRỢTƢVẤNHƢỚNGNGHIỆPCHOHỌCSINHTHPTTRÊNĐỊABÀNHẢIPHÒNGDỰATRÊNPHÂNLỚPDỮ LIỆU LUẬN VĂN THẠC SĨ KỸ THUẬT HẢIPHÒNG – 2016 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC ĐÀO TẠO TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM BÙI THỊ MỪNG XÂYDỰNGHỆHỖTRỢTƢVẤNHƢỚNGNGHIỆPCHOHỌCSINHTHPTTRÊNĐỊABÀNHẢIPHÒNGDỰATRÊNPHÂNLỚPDỮ LIỆU LUẬN VĂN THẠC SĨ KỸ THUẬT NGÀNH: CÔNG NGHỆ THÔNG TIN; MÃ SỐ: 60480201 CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Ngƣời hƣớng dẫn: TS Nguyễn Trọng Đức HẢIPHÒNG – 2016 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 LỜI CAM ĐOAN Tôi xin cam đoan luận văn, cơng trình nghiên cứu riêng Các kết nêu luận văn trung thực chƣa đƣợc công bố đề tài, cơng trình khác Tơi xin cam đoan thơng tin trích dẫn luận văn đƣợc rõ nguồn gốc Ngày 15 tháng năm 2016 Bùi Thị Mừng i Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 LỜI CẢM ƠN Luận văn tốt nghiệp cao học chuyên ngành công nghệ thông tin đƣợc hoàn thành Trƣờng Đại học Hàng Hải Việt Nam Có đƣợc luận văn tốt nghiệp này, tơi xin bày tỏ lòng biết ơn chân thành sâu sắc đến Trƣờng Đại học Hàng Hải Việt Nam, Viện Đào tạo sau Đại học, đặc biệt Tiến sỹ Nguyễn Trọng Đức trực tiếp hƣớng dẫn, dìu dắt, giúp đỡ với dẫn khoa học quý giá suốt trình triển khai, nghiên cứu hồn thành đề tài nghiên cứu Tơi xin chân thành cảm ơn thầy, cô giáo trực tiếp giảng dạy, truyền đạt kiến thức khoa học chuyên ngành công nghệ thông tin cho thân tồn thời gian khóa học Cuối cùng, muốn gửi lời cảm ơn sâu sắc đến gia đình, bạn bè ln kịp thời động viên, giúp đỡ tơi vƣợt qua khó khăn sống để hồn thành đƣợc luận văn Mặc dù có nhiều cố gắng để thực đề tài cách hồn chỉnh Song làm quen với cơng tác nghiên cứu khoa học, tiếp cận với công nghệ nhƣ hạn chế kiến thức kinh nghiệm nên khơng thể tránh khỏi thiếu sót định mà thân chƣa nhận thức đƣợc Tôi mong nhận đƣợc góp ý chân thành Quý thầy, cô bạn để đề tài đƣợc hoàn chỉnh Xin chân thành cảm ơn! ii Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC CHỮ VIẾT TẮT VÀ KÝ HIỆU v DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH vii MỞ ĐẦU Chƣơng TỔNG QUAN 1.1 Tổng quan vấn đề nghiên cứu 1.1.1 Một số khái niệm liên quan đến tƣvấnhƣớngnghiệp 1.1.2 Giới thiệu toán hệhỗtrợtƣvấnhƣớngnghiệp 1.2 Tổng quan khai phá liệu 1.2.1 Khái niệm 1.2.3 Các giai đoạn trình khai phá tri thức CSDL 1.2.4 Kiến trúc hệ thống khai phá liệu 10 1.2.5 Một số kỹ thuật khai phá liệu 11 1.3 Kết luận chƣơng 14 Chƣơng HỆHỖ TR RA QUYẾT Đ NH TƢVẤNHƢỚNGNGHIỆP 15 2.1 Tổng quan hệhỗtrợ định 15 2.1.1 Khái niệm 15 2.1.2 Cấu trúc hệhỗtrợ định 16 2.2 Bài toán phânlớp liệu với định 17 2.2.1 Khái niệm phânlớp liệu 17 2.2.2 Quá trình phânlớp liệu 18 2.2.3 Một số phƣơng pháp phânlớp liệu 19 iii Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 2.3 Cây định 22 2.3.1 Khái niệm định 22 2.3.2 Quá trình xâydựng định 23 2.3.3 Thuật toán ID3 xâydựng định 24 2.3.4 Chọn thuộc tính phân hoạch tốt 26 2.4 Ứng dụng phƣơng pháp định để xâydựng DSS cho toán tƣvấnhƣớngnghiệp 33 2.4.1 Giới thiệu phần mềm khai phá liệu Weka Explorer 3.6.3 33 2.4.2 Xác định mục tiêu hệ thống vấn đề cần giải 35 2.4.3 Mô tả hệ thống 35 Hình 2.9 Mơ hình hệhỗtrợtƣvấnhƣớngnghiệp 36 2.4.4 Quy trình giải toán 37 2.5 Kết luận chƣơng 55 Chƣơng CÀI ĐẶT VÀ THỬ NGHIỆM 56 3.1 Mơ hình Hệhỗtrợtƣvấnhƣớngnghiệp 56 3.2 Chức hệhỗtrợtƣvấnhƣớngnghiệp 56 3.3 Chuẩn bị thiết kế CSDL 56 3.4 Công nghệ sử dụng 57 3.5 Giao diện hệhỗtrợtƣvấnhƣớngnghiệp 57 3.6 Đánh giá ƣu, nhƣợc điểm hệ thống 59 3.7 Đánh giá kết thử nghiệm 60 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 61 TÀI LIỆU THAM KHẢO 63 iv Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 DANH MỤC CÁC CHỮ VIẾT TẮT VÀ KÝ HIỆU Chữ viết tắt Giải thích CSDL Cơ sở liệu KDD Knowledge Discovery in Databases THPT Trung học phổ thông DM Data Mining SQL Structured Query Language v Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 DANH MỤC CÁC BẢNG Số bảng Tên bảng Trang 2.1 Dữ liệu thi đại học 28 2.2 Thơng tin thuộc tính “toan” 29 2.3 Thơng tin thuộc tính “ly” 29 2.4 Thơng tin thuộc tính “hoa” 29 2.5 Thơng tin thuộc tính “sinh” 30 2.6 Thơng tin thuộc tính “nguvan” 30 2.7 Thơng tin thuộc tính “su” 30 2.8 Thơng tin thuộc tính “dia” 31 2.9 Thơng tin thuộc tính “ngoaingu” 31 2.10 Độ lợi thơng tin thuộc tính 31 2.11 Bảng điểm tổng kết 35 2.12 Bảng liệu Kết học tập họcsinh 37 2.13 Khối thi-môn thi 38 2.14 Dữ liệu ngành nghề 38 2.15 Dữ liệu trƣờng đại học, cao đẳng nƣớc 40 2.16 Dữ liệu trƣờng cao đẳng nghề HảiPhòng 40 vi Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van of 95 DANH MỤC CÁC HÌNH Số hình Tên hình Quá trình khai phá tri thức CSDL 1.1 Trang 1.2 Kiến trúc tổng quát hệ thống khai phá liệu 10 1.3 Một số kỹ thuật khai phá liệu 11 2.1 Xâydựng mô hình phânlớp liệu 18 2.2 Sử dụng mơ hình phânlớp liệu 19 2.3 Mơ hình định 20 2.4 Một mơ hình SVM 21 2.5 Một mơ hình mạng nơron 22 2.6 Ví dụ định 23 2.7 Kết định với tập liệu học bảng 2.1 33 2.8 Giao diện phần mềm Weka 34 2.9 Mơ hình hệhỗtrợtƣvấnhƣớngnghiệp 36 2.10 Thiết lập thông số cho giá trị weka 43 2.11 Thêm giá trị cho thuộc tính rời rạc 44 2.12 Thuộc tính “toan” sau rời rạc 44 2.13 Mơ hình dự đốn thi đại học 45 2.14 Cây định đầy đủ với thuộc tính Thidh 48 2.15 Nhánh trái định Thidh 49 2.16 Mơ hình dự đoán khối thi, ngành nghề 50 2.17 Cây định đầy đủ 51 3.1 Mơ hình hệhỗtrợtƣvấnhƣớngnghiệp 56 3.2 Giao diện hình trƣớc tƣvấn 58 3.3 Giao diện hình trƣớc tƣvấn 58 3.4 Giao diện hình test liệu 59 vii Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 10 of 95 MỞ ĐẦU Định hƣớng nghề nghiệp tƣơng lai chủ đề thu hút đƣợc nhiều quan tâm tồn thể xã hội, gia đình hệ trẻ, đặc biệt em họcsinhlớp 12 THPT Việc định hƣớng nghề nghiệpchohọcsinhTHPT đƣợc xem bƣớc khởi đầu quan trọng trình đào tạo phát triển nguồn nhân lực Hiện xã hội quan tâm đến số liệu thất nghiệpsinh viên sau tốt nghiệp đại học Với tâm lý phải vào đại học giá, nhiều bậc phụ huynh vô hình chung đè nặng lên vai sỹ tử gánh nặng tƣ tƣởng có đƣờng học đại học Trong bậc phụ huynh thân sỹ tử chƣa thực đánh giá lực sở thích, nguyện vọng thân Do nhiều họcsinhlớp 12 THPT nộp đơn xin thi, đăng ký dự tuyển vào ngành học không với lực, học lực sở thích dẫn đến nhiều trƣờng hợp bỏ học chừng, chuyển nghề khơng thể tiếp tục theo học không đáp ứng đƣợc yêu cầu học tập, nhiều trƣờng hợp phải chuyển nghề thấy khơng phù hợp…, điều gây lãng phí lớn thời gian nguồn lực cho thân, gia đình xã hội Mặc dù khẳng định kỳ thi tốt nghiệpTHPT thi hay tham gia dự tuyển đại học tham gia học tập nghề nghiệp sau THPT quan trọng cần nhiều quan tâm đặc biệt toàn thể xã hội, đòi hỏi quan tâm ngành giáo dục đào tạo Công tác tƣvấnhƣớng nghiệp, định hƣớng nghề nghiệp, ngành học công việc quan trọng để giúp chohọcsinh tự đánh giá đƣợc lực thân, hiểu biết thêm ngành nghề, giúp em có nhiều lựa chọn có định lựa chọn hợp lý cho tƣơng lai Để định tƣơng lai mình, họcsinh THPT, đặc biệt em họcsinhlớp 12 xác định rõ lực thân, học lực mình, tìm hiểu thêm ngành nghề, từ lựa chọn chohƣớng sau tốt nghiệpTHPT là: Nghề nghiệp- Ngành học- Trƣờng Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 59 of 95 - Giai đoạn 2: Dự đoán họcsinh nên thi khối khối A, A1, B, C, D1 học ngành nghề nào, trường Phânlớp liệu với thuộc tính tốn, vật lý, hóa học, sinh học, ngữ văn, lịch sử, địa lý, tiếng anh, ThiDH, khối thi, ngành nghề: Tập liệu test Tập liệu huấn họcHọcphânlớp Bộ phânlớp Hình 2.16 Mơ hình dự đốn khối thi, ngành nghề 50 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 60 of 95 Hình 2.17 Cây định đầy đủ 51 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - tai lieu hot - keyword - seo60 kho tai lieu - khoa lu luan van thac si - luan van thac si kinh te - luan an tien - luan van 61 of 95 Tập luật thu đƣợc nhƣ sau: Suy diễn Tập luật từ Weka Khoi thi = NGH | TBcm = TB: 503203 | TBcm = Kha: 505102 | TBcm = Gioi: 503403 | TBcm = Yeu: 503103 If (Khoi thi is NGH) and (TBcm is TB) then (MaNghe is 503203) If (Khoi thi is NGH) and (TBcm is Kha) then (MaNghe is 505102) If (Khoi thi is NGH) and (TBcm is Gioi) then (MaNghe is 503403) If (Khoi thi is NGH) and (TBcm is Yeu) then (MaNghe is 503103) Khoi thi = A1 | HocLuc = Yeu: null | HocLuc = Tb | | TBcm = TB: D3801 | | TBcm = Kha: D0101 | | TBcm = Gioi: D3404 | | TBcm = Yeu: null | HocLuc = Kha | | TBcm = TB: null | | TBcm = Kha: D0115 | | TBcm = Gioi: D0115 | | TBcm = Yeu: null | HocLuc = Gioi: D5106 If (Khoi thi is A1) and (HocLuc is Tb) and (TBcm is TB) then (MaNghe is D3801) If (Khoi thi is A1) and (HocLuc is Tb) and (TBcm is Kha) then (MaNghe is D0101) If (Khoi thi is A1) and (HocLuc is Tb) and (TBcm is Gioi) then (MaNghe is D3404) If (Khoi thi is A1) and (HocLuc is Kha) and (TBcm is Kha) then (MaNghe is D0115) If (Khoi thi is A1) and (HocLuc is Kha) and (TBcm is Gioi) then (MaNghe is D0115) If (Khoi thi is A1) and (HocLuc is Gioi) then (MaNghe is D0115) 52 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 62 of 95 Khoi thi = C | TBcm = TB: D0120 | TBcm = Kha | | HocLuc = Yeu: null | | HocLuc = Tb: D4202 | | HocLuc = Kha: D0120 | | HocLuc = Gioi: null | TBcm = Gioi | | HocLuc = Yeu: null | | HocLuc = Tb: D3103 | | HocLuc = Kha: D0122 | | HocLuc = Gioi:D0310 | TBcm = Yeu: null If (Khoi thi is C) and (TBcm is TB) then (MaNghe is D0120) If (Khoi thi is C) and (TBcm is Kha) and (HocLuc is Tb) then (MaNghe is D4202) If (Khoi thi is C) and (TBcm is Kha) and (HocLuc is Kha) then (MaNghe is D0120) If (Khoi thi is C) and (TBcm is Gioi) and (HocLuc is Tb) then (MaNghe is D3103) If (Khoi thi is C) and (TBcm is Gioi) and (HocLuc is Kha) then (MaNghe is D0122) If (Khoi thi is C) and (TBcm is Gioi) and (HocLuc is Gioi) then (MaNghe is D0310) Khoi thi = A | TBcm = TB: D4602 | TBcm = Kha | | HocLuc = Yeu: null | | HocLuc = Tb: D6201 | | HocLuc = Kha: D4802 | | HocLuc = Gioi: null | TBcm = Gioi | | HocLuc = Yeu: null | | HocLuc = Tb: D5403 | | HocLuc = Kha: D0122 | | HocLuc = Gioi:D0120 | TBcm = Yeu: null If (Khoi thi is A) and (TBcm is TB) then (MaNghe is D4602) If (Khoi thi is A) and (TBcm is Kha) and (HocLuc is Tb) then (MaNghe is D6201) If (Khoi thi is A) and (TBcm is Kha) and (HocLuc is Kha) then (MaNghe is D4802) If (Khoi thi is A) and (TBcm is Gioi) and (HocLuc is Tb) then (MaNghe is D5403) If (Khoi thi is A) and (TBcm is Gioi) and (HocLuc is Kha) then (MaNghe is D0122) If (Khoi thi is A) and (TBcm is Gioi) and (HocLuc is Gioi) then (MaNghe is D0120) 53 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 63 of 95 Khoi thi = D | HocLuc = Yeu | | TBcm = TB: 5086 | | TBcm = Kha:503404 | | TBcm = Gioi: null | | TBcm = Yeu: 505103 | HocLuc = Tb | | TBcm = TB: D0122 | | TBcm = Kha: D6201 | | TBcm = Gioi: null | | TBcm = Yeu: null | HocLuc = Kha | | TBcm = TB: null | | TBcm = Kha: D0120 | | TBcm = Gioi: D4201 | | TBcm = Yeu: null | HocLuc = Gioi: null If (Khoi thi is D) and (HocLuc isTB) and (TBcm is TB) then (MaNghe is 5086) If (Khoi thi is D) and (HocLuc is Yeu) and (TBcm is Kha) then (MaNghe is 503404) If (Khoi thi is D) and (HocLuc is Yeu) and (TBcm is Yeu) then (MaNghe is 505103) If (Khoi thi is D) and (HocLuc is TB) and (TBcm is TB) then (MaNghe is D0122) If (Khoi thi is D) and (HocLuc is TB) and (TBcm is Kha) then (MaNghe is D6201) If (Khoi thi is D) and (HocLuc is Kha) and (TBcm is Kha) then (MaNghe is D0120) If (Khoi thi is D) and (HocLuc is Kha) and (TBcm is Gioi) then (MaNghe is D4201) Khoi thi = B | TBcm = TB: D0502 | TBcm = Kha | | HocLuc = Yeu: null | | HocLuc = Tb: D7206 | | HocLuc = Kha: D5106 | | HocLuc = Gioi: null | TBcm = Gioi | | HocLuc = Yeu: null | | HocLuc = Tb: D6201 | | HocLuc = Kha:D0115 | | HocLuc = Gioi:D0601 | TBcm = Yeu: null If (Khoi thi is B) and (TBcm is TB) then (MaNghe is D0502) If (Khoi thi is B) and (TBcm is Kha) and (HocLuc is Tb) then (MaNghe is D7206) If (Khoi thi is B) and (TBcm is Kha) and (HocLuc is Kha) then (MaNghe is D5106) If (Khoi thi is B) and (TBcm is Gioi) and (HocLuc is Tb) then (MaNghe is D6201) If (Khoi thi is B) and (TBcm is Gioi ) and (HocLuc is Kha) then (MaNghe is 54 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 64 of 95 D0115) If (Khoi thi is B) and (TBcm is Gioi ) and (HocLuc is Gioi) then (MaNghe is D0601) Khoi thi = D1 | TBcm = TB: D7202 | TBcm = Kha | | HocLuc = Yeu: null | | HocLuc = Tb: D0115 | | HocLuc = Kha: D5106 | | HocLuc = Gioi: null | TBcm = Gioi | | HocLuc = Yeu: null | | HocLuc = Tb: D0401 | | HocLuc = Kha: D0310 | | HocLuc = Gioi: null | TBcm = Yeu: null If (Khoi thi is D1) and (TBcm is TB) then (MaNghe is D7202) If (Khoi thi is D1) and (TBcm is Kha) and (HocLuc is Tb) then (MaNghe is D0115) If (Khoi thi is D1) and (TBcm is Kha) and (HocLuc is Kha) then (MaNghe is D5106) If (Khoi thi is D1) and (TBcm is Gioi) and (HocLuc is Tb) then (MaNghe is D0401) If (Khoi thi is D1) and (TBcm is Gioi ) and (HocLuc is Kha) then (MaNghe is D0310) 2.5 Kết luận chƣơng Chƣơng trình bày tổng quan hệ định DSS ứng dụngxâydựnghệhỗtrợtƣvấnhƣớngnghiệp Do mục tiêu toán rõ chƣơng nghiên cứu mơ hình hệ thống, thiết kế sở liệu để tiến hành khai phá từ xác định, lựa chọn cơng cụ phù hợp với yêu cầu đặt Kết cho thấy kỹ thuật khai phá liệu dựa Cây định mô phần mềm Weka thuật tiện, trực quan, mang lại độ xác hỗtrợ mơ hình dự đốn Việc sử dụng sở liệu lƣu trữ tập tin Excel có nhiều ƣu điểm (quen thuộc, dung lƣợng nhỏ, thời gian xử lý nhanh, thao tác đơn giản ) Từ kết Chƣơng 2, đề tài có hƣớng đắn để xâydựnghệ thống thử nghiệm đƣợc trình bày Chƣơng 55 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 65 of 95 Chƣơng CÀI ĐẶT VÀ THỬ NGHIỆM 3.1 Mơ hình Hệhỗtrợtƣvấnhƣớngnghiệp Giao diện tƣvấnhƣớngnghiệpHồ sơ học sinh, nguồn lƣu trữ khác Thu thập, tổng hợp, trích lọc liệu Kho liệu Hệ thống suy diễn Mô tơ khai phá liệu ( Cây định) Tập luật Hình 3.1 Mơ hình hệhỗtrợtƣvấnhƣớngnghiệp Chức hệhỗtrợtƣvấnhƣớngnghiệp Chức hệ thống ngƣời dùng nhập vào thông tin nhƣ điểm tổng kết mơn họchệ thống dự đốn xem họcsinh có nên tham gia xét tuyển đại học hay khơng dự đốn khối thi, nhóm ngành nghề mà họcsinh nên lựa chọn Từ làm sở tƣvấn ngành nghề, trƣờng để họcsinh lựa chọn 3.3 Chuẩn bị thiết kế CSDL Dữ liệu dùng để thực nghiệm đƣợc thu thập 13 trƣờng THPT khu vực nội thành thành phố HảiPhòngDữ liệu thu thập hồ sơ lƣu trữ kết học tập báo cáo tình hình sau tốt nghiệp các năm 2011, 2012, 2013, 2014 Dữ liệu đƣợc tập hợp file gồm 20.550 ghi 30 thuộc tính Sau trích lọc làm sạch, liệu lại gồm 20.430 ghi 12 thuộc tính 56 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 66 of 95 Chia liệu nguồn thành tập liệu: - Dữ liệu huấn luyện: 15.700 ghi chiếm 70% liệu ban đầu - Dữ liệu kiểm tra: 6.730 ghi chiếm 30% liệu ban đầu Ngoài thu thập thêm liệu liên quan đến tƣvấnhƣớngnghiệp tiến hành lƣu trữ liệu bảng sau: Bảng KetquaHT: Lƣu trữ thông tin kết học tập họcsinh bao gồm Mã học sinh, toán, vật lý, hóa học, sinh học, ngữ văn, lịch sử, địa lý, tiếng anh, Bảng NganhNghe: Lƣu trữ thông tin mã ngành, tên nghành Bảng Khoi: Lƣu trữ thông tin mã khối, tên khối, tên môn thi Bảng Truong: Lƣu trữ thông tin mã trƣờng, tên trƣờng 3.4 C ng nghệ sử dụngHệhỗtrợtƣvấnhƣớngnghiệp đƣợc xâydựng sở công nghệ sau: - Phần mềm mã nguồn mở Weka 3.6.3 để rời rạc liệu tạo luật - Microsoft Access 2010 để lƣu trữ CSDL kho luật - Visual C#2010 làm ngơn ngữ lập trình để xâydựnghệ thống suy diễn từ kho luật thiết kế giao diện tƣơng tác với ngƣời dùng 3.5 Giao diện hệhỗtrợtƣvấnhƣớngnghiệp 3.5.1 Phần giao diện tƣvấnhƣớngnghiệp Tƣơng tác với hệhỗtrợtƣvấnhƣớngnghiệp qua giao diện ngƣời dùng cần nhập điểm tổng kết mơn học sau đƣợc hệ thống đƣa tƣvấn nhƣ nên chọn khối thi nào, ngành nào, liệt kê số trƣờng có đào tạo ngành nghề vừa nêu 57 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 67 of 95 Hình 3.2 Giao diện hình trƣớc tƣvấn Hình 3.3 Giao diện hình trƣớc tƣvấn 58 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 68 of 95 3.5 Phần giao diện test liệu Trong phần ngƣời xâydựnghệ thống test đƣợc liệu kiểm tra độ xác hệ thống Hình 3.4 Giao diện hình test liệu 3.6 Đánh giá ƣu, nhƣợc điểm hệ thống 3.6.1 Ƣu điểm Chƣơng trình xâydựng tảng Microsoft Excel C#, áp dụng giải thuật ID3 xâydựng định, có dung lƣợng nhỏ, không cần cài thêm môi trƣờng hỗtrợ Chƣơng trình xâydựng hồn chỉnh mơ hình khai phá liệu, có đánh giá kết q trình chạy thuật tốn 59 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 69 of 95 Giao diện dễ hiểu, trực quan, ngƣời dùng khơng chun dễ dàng sử dụng Phù hợp với yêu cầu, quy mô tốn đề 3.6 Nhƣợc điểm Để có định tối ƣu tập luật tối ƣu cần phải qua trình tinh chỉnh, cắt tỉa cây, nhiên nội dunghệ thống chƣa đƣợc trọng nghiên cứu Phƣơng pháp lƣu trữ kết hệ thống đơn giản thiếu bảo mật 3.7 Đánh giá kết thử nghiệm Sau xâydựng mơ hình, tiến hành thử nghiệm với tập liệu kiểm thử để kiểm tra xem độ xác mơ hình Kết thu đƣợc nhƣ sau: Số lƣợng mẫu huấn luyện: 22.430 mẫu Số lƣợng mẫu kiểm thử: 6.729 mẫu Số lƣợng mẫu đúng: 5.013 mẫu, chiếm 75% Số lƣợng mẫu sai: 1.716 mẫu, chiếm 25% 60 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 70 of 95 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN Kết luận Đề tài “Xây dựnghệhỗtrợTƣvấnhƣớngnghiệpchohọcsinhTHPTđịabàn nội thành thành phố HảiPhòngdựa việc phânlớp liệu” hoàn thành mục tiêu đề Cụ thể kết đạt đƣợc luận văn nhƣ sau: Về mặt khoa học Luận văn tiến hành phân tích, nghiên cứu, tìm hiểu đƣợc bƣớc, quy trình cơng tác tƣvấnhƣớngnghiệp Nắm đƣợc phƣơng pháp mơ hình khai phá liệu, áp dụng để giải yêu cầu toán đặt Cụ thể nghiên cứu vậndụng thuật toán ID3 xâydựng định để khai phá liệu giáo dục, rút tập luật dự đoán lực họchọcsinh để tƣvấnhƣớngnghiệp Về mặt thực tiễn Luận văn nêu đƣợc giải pháp kỹ thuật để vậndụngxâydựnghệ thống trợ giúp định công tác tƣvấnhƣớngnghiệp trƣờng THPT, trƣờng ĐH, CĐ trung tâm hƣớngnghiệp Có thể thấy việc kết hợp lý thuyết mơ hình khai phá liệu thuật toán xâydựng định cần thiết, giúp giảm thiểu đáng kể thời gian việc tìm kiếm, xác định thơng tin để phục vụ cho cơng tác tƣvấnhƣớngnghiệp Có thể nói cơng cụ có tính thực tiễn, có khả ứng dụng kết việc dự đoán thiên hƣớnghọc tập họcsinh THPT, giúp chocho em họcsinh bậc phụ huynh có đƣợc lựa chọn đắn ngành học, trƣờng học phù hợp với học lực họcsinh Hạn chế 61 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 71 of 95 Đặc thù công tác tƣvấnhƣớngnghiệp mang nặng tính chất định tính, có nhiều yếu tố ảnh hƣởng đến lựa chọn ngành học, trƣờng học em học sinh, hệ thống đƣợc xâydựng mang tính hỗtrợ Hiện tại, hệ thống chạy thử nghiệm sở liệu trích xuất tập tin Excel, chƣa chạy trực tiếp hệ quản trị sở liệu SQL Server Do chƣa có kết nối với chƣơng trình quản lý điểm trƣờng THPT Đây yêu cầu cần thực thời gian sau Hƣớng phát triển Để đƣa hệhỗtrợtƣvấnhƣớngnghiệp vào ứng dụng trình học tập em họcsinh cần kết nối với chƣơng trình quản lý điểm triển khai trƣờng THPT Từ làm sở cho giáo viên chủ nhiêm, cán làm cơng tác hƣớng nghiệp, BGH nhà trƣờng dự đốn tƣvấn thiên hƣớng học, ngành nghề phù hợp với học lực em Để ứng dụng cách sâu rộng hiệu hệhỗtrợtƣvấnhƣớngnghiệp cần tiếp tục đầu tƣ thu thập liệu đầy đủ nhƣ thu thập thêm liệu khác liên quan đến truyền thống điều kiện kinh tế gia đình, nhu cầu lao động, khiếu, sở trƣờng Triển khai dự đoán, kiểm chứng thực tế đánh giá kết cách thƣờng xuyên Bản thân nhận thấy hƣớng tiếp cận đắn có tính thực tiễn cao 62 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 72 of 95 TÀI LIỆU THAM KHẢO Tiếng Việt [1] GS Phạm Tất Dong Nguyễn Nhƣ Ất (2002), Sự lựa chọn tương lai - tư vấn hướng nghiệp, NXB Than niên, Hà Nội [2] Lê Văn Dực (2006), Hệhỗtrợ định, NXB Đại học Quốc gia TP Hồ Chí Minh [3] Hồng Kiếm, Đỗ Phúc (2005), Giáo trình khai phá liệu, Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh [4] Đoàn Văn Ban, Lê Mạnh Thạnh, Lê Văn Tƣờng Lân (2006), Một phương pháp để xâydựng định có hiệu khai phá liệu, Kỷ yếu hội thảo quốc gia Công nghệ phần mềm Cơng nghệ tri thức Tiếng nước ngồi [5] Alan Rea (1995) Data Mining - An Introduction The Parallel Computer Centre, The Queen’s University of Belfast [6] U.Fayyad, G Piatetsky-Shapiro, P.Smyth (1996) From Data Mining to Knowledge Discovery in Databases AI Magazine [7] U M Fayyad, G P Shapiro, P Smyth, and R Uthurusamy (1996) Advances in Knowledge Discovery and Data Mining AAAI Press, Menlo Park, CA [8] D Hand, H Mannila, and P Smyth (2001) Principles of Data Mining The MIT Press, London, England [9] T K Leung, C Victoria, P Chen, W Jiang, and Y A Aslandogan (2001) Data Minning Methods and applications 63 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - luan van thac si - luan van thac si kinh te - luan an tien - luan van 73 of 95 [10] M Kantardzic (2003) Data Mining : Concepts, Models, Method, and Algorithms John Wiley & Sons, New York, NY [11] P Gray, H J Watson (1998), Decision Support in Data Warehouse, Prentice Hall [12] T Mitchell (1999) Machine learning and data mining Communications of the ACM, 42(11) : pp 30-36 [13] J Han and M Kamber (2006) Data Mining: Concepts and Techniques Universityoflllinois, Morgan Kaufmann Publishers [14] Agrawal and J.Shafer Parallel mining of association rules (1995) In IEEE trans, on Knowledge and Data Engg, 8(6), pp 962-969 [15] U M Fayyad, G P Shapiro, and P Smyth (2002) From Data Minning To Discory Knowledge in Database AAAI Press, Menlo Park, CA [16] GS.TSKH Hoàng Kiếm, TS Đỗ Phúc, TS Đỗ Văn Nhơn (2005), Giáo trình hệ sở tri thức, Trƣờng Đại học công nghệ thông tin- Đại học Quốc gia thành phố Hồ Chí Minh [17] Oded Maimon, Lior Rokach (2010) Data Mining and Knowledge Discovery Handbook, Springer Science+Business Media Trang Web [18] http://vi.wikipedia.org/wiki/Cây_quyết_định [19] Huynh Tram Vo, Tiếp cận ký hiệu: Giải thuật quy nạp định ID3, http://voer.edu.vn/content/m14329/1.1/ [20] ID3 Decision Tree Algorithm in C#, www.codeproject.com [21] http://www.decisiontrees.net/ [22] Website: http://www.google.com 64 Footer Page - Footer Page - kho luan van - tai lieu - 123doc- tieu luan - khoa luan-tai chinh ngan hang - thuong mai - ... TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM BÙI THỊ MỪNG XÂY DỰNG HỆ HỖ TRỢ TƢ VẤN HƢỚNG NGHIỆP CHO HỌC SINH THPT TRÊN ĐỊA BÀN HẢI PHÒNG DỰA TRÊN PHÂN LỚP DỮ LIỆU LUẬN VĂN THẠC SĨ KỸ THUẬT NGÀNH: CÔNG NGHỆ THÔNG... ký thi, xét tuyển xây dựng đề tài: "Xây dựng hệ hỗ trợ Tƣ vấn hƣớng nghiệp cho học sinh THPT địa bàn nội thành thành phố Hải Phòng dựa việc phân lớp liệu" cho luận văn tốt nghiệp Luận văn gồm... toán xây dựng hệ hỗ trợ tƣ vấn hƣớng nghiệp tổng quan khai phá liệu Chƣơng 2: Hệ hỗ trợ định tƣ vấn hƣớng nghiệp Trình bày tổng quan hệ hỗ trợ định Sau đó, trình bày ứng dụng phƣơng pháp phân lớp