Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 19 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
19
Dung lượng
904,87 KB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA HỒ ANH TỐ XÂY DỰNG HỆ THỐNG TƯ VẤN CHỌN NGÀNH NGHỀ CHO SINH VIÊN TRƯỜNG CAO ĐẴNG VIỆT NAM – HÀN QUỐC - QUẢNG NGÃI Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng – Năm 2017 Cơng trình hoàn thành TRƯỜNG ĐẠI HỌC BÁCH KHOA Người hướng dẫn khoa học: PGS TS VÕ TRUNG HÙNG Phản biện 1: Phản biện 2: Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật, , họp Trường Đại học Phạm Văn Đồng vào ngày 17 06 tháng năm 2018 Có thể tìm hiểu luận văn tại: Trung tâm Học liệu Truyền thông, Trường Đại học Bách khoa, ĐHĐN Thư viện Khoa CNTT, Trường Đại học Bách khoa – ĐHĐN MỞ ĐẦU Hiện tại, hội học nghề cho sinh viên nhiều, với nhiều sách ưu tiên Luật Giáo dục nghề nghiệp vừa có hiệu lực có đổi phù hợp với xu Điều quan trọng phải phân luồng đối tượng, mục đích làm tốt công tác hướng nghiệp, giúp sinh viên định hướng nghề nghiệp tương lai theo sở thích, đam mê điều kiện thực tế thân, xã hội Khi bước vào trường đào tạo nghề, bạn sinh viên ln mong muốn chọn ngành nghề học phù hợp với lực, trình độ, sở thích, hội việc làm điều kiện thân Tuy nhiên, lúc sinh viên đủ khả lựa chọn cho ngành nghề phù hợp Khi chọn sai ngành nghề sinh viên đối tượng chịu ảnh hưởng trực tiếp, sinh viên thường thiếu động lực chán nản, dễ dẫn đến bỏ học, số sinh viên có điều kiện chuyển ngành, số khác tiếp tục theo đuổi tâm bng trơi, từ dẫn đến chất lượng đào tạo kém, chất lượng nguồn lao động không đáp ứng nhu cầu xã hội; ảnh hưởng tiếp đến sở đào tạo sâu xa ảnh hưởng đến kinh tế quốc gia Trường Cao đẳng Việt Nam - Hàn Quốc - Quảng Ngãi tiền thân Trường Cao đẳng nghề Việt Nam - Hàn Quốc - Quảng Ngãi đào tạo ngành nghề Công nghệ thơng tin, Cơ khí, Kỹ thuật điện - điện tử, Kỹ thuật điều khiển tự động hóa, Kỹ thuật xây dựng, Công nghệ ô tô, Công nghệ thực phẩm Trong tương lai đào tạo thêm nhiều ngành nghề khác như: Giáo dục mầm non, Công nghệ sau thu hoạch, Công nghệ chế biến thủy sản, Chăn nuôi, Phát triển nông thôn, Nuôi trồng thủy sản, Xét nghiệm Y học, Dược, Điều dưỡng, Lúc việc tư vấn chọn ngành nghề phù hợp quan trọng sinh viên Chính tơi định chọn đề tài “Xây dựng hệ thống tư vấn chọn ngành nghề cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi” để làm đề tài luận văn tốt nghiệp cao học Trong đề tài này, đề xuất giải pháp ứng dụng KPDL thuật toán luật kết hợp để xây dựng hệ thống tư vấn chọn ngành nghề học phù hợp cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi 3 CHƯƠNG NGHIÊN CỨU TỔNG QUAN 1.1 Khai phá liệu 1.1.1 Tổng quan khai phá liệu 1.1.1.1 Khái niệm khai phá liệu Khai phá liệu khái niệm đời vào cuối năm 1980 Nó q trình khám phá thơng tin ẩn tìm thấy CSDL xem bước q trình khám phá tri thức Quá trình kết xuất tri thức tiềm ẩn từ liệu giúp cho việc dự báo kinh doanh, hoạt động sản xuất, giáo dục KPDL làm giảm chi phí thời gian so với phương pháp truyền thống trước Một số định nghĩa nhiều tác giả KPDL: - Định nghĩa Ferruzza - Định nghĩa Parsaye - Định nghĩa Fayyad 1.1.1.2 Chức khai phá liệu - Mô tả khái niệm (concept description): thiên mơ tả, tổng hợp tóm tắt khái niệm - Luật kết hợp (association rules): dạng luật biểu diễn tri thức dạng đơn giản - Phân lớp dự đoán (classification & prediction): xếp đối tượng vào lớp biết trước - Phân cụm (clustering): xếp đối tượng theo cụm - Khai phá chuỗi (sequential/ temporal patterns): tương tự khai phá luật kết hợp có thêm tính thứ tự tính thời gian 4 1.1.1.3 Ứng dụng khai phá liệu - Phân tích liệu hỗ trợ định - Điều trị y học (medical treatment) - Text mining & Web mining - Tin-sinh (bio-informatics) - Tài thị trường chứng khoán - Bảo hiểm (insurance) - Nhận dạng (pattern recognition), 1.1.1.4 Quy trình khai phá liệu Hình 1.1 Quy trình KPDL - Tập hợp liệu (Data) - Trích lọc liệu (Extraction) - Tiền xử lý chuẩn bị liệu (Preprocessing) - Chuyển đổi liệu (Transformation) - Khai phá liệu (Data Mining) - Đánh giá kết mẫu (Interpretation/ Evaluation) 1.1.1.5 Kiến trúc hệ thống KPDL 1.1.2 Khai phá liệu sử dụng luật kết hợp 1.1.2.1 Khái niệm luật kết hợp - Luật kết hợp tìm mẫu phổ biến, kết hợp, tương quan hay cấu trúc nhân tập đối tượng sở liệu giao tác, sở liệu quan hệ kho thông tin khác để đưa mối liên kết phần tử liệu - Độ phổ biến (một số tài liệu dịch độ hỗ trợ) tập mục X định nghĩa tỷ lệ giao tác có chứa tập mục sở liệu với tổng số giao tác - Độ tin cậy luật X Y xác suất xuất Y với điều kiện X tất giao tác - Một số định nghĩa tập hợp 1.1.2.2 Quá trình thực 1.1.2.3 Một số hướng tiếp cận - Luật kết hợp nhị phân (Binary association rule) - Luật kết hợp có thuộc tính số thuộc tính hạng mục (Quantitative and categorial association rule) - Luật kết hợp tiếp cận theo hướng tập thô (mining association rule base on rough set) - Luật kết hợp nhiều mức (multi-level association rule) - Luật kết hợp mờ (fuzzy association rule) - Luật kết hợp với thuộc tính đánh trọng số (association rules with weighted items) 1.1.2.4 Một số thuật toán - Thuật toán Apriori - Thuật toán ASI - Thuật toán SETM - Thuật toán Apriori-TID - Thuật toán FP Growth 1.1.3 Khai phá liệu với toán phân lớp 1.1.3.1 Phân lớp liệu Phân lớp liệu (classification) hướng nghiên cứu khác khai phá liệu Thực tế đặt nhu cầu từ sở liệu với nhiều thơng tin ẩn người trích rút định nghiệp vụ thông minh Phân lớp liệu trình gồm hai bước: bước học (trong xây dựng nên mơ hình phân lớp) bước phân lớp (trong mơ hình vừa xây dựng sử dụng để dự đốn nhãn lớp cho liệu đó) 1.1.3.2 Các phương pháp phân lớp liệu - Phân lớp liệu định - Phân lớp liệu giải thuật học ILA - Phân lớp liệu mạng Naïve Bayes - Phân lớp liệu Neural Network 1.1.4 Khai phá liệu sử dụng định 1.1.4.1 Định nghĩa định Hình 1.7 Ví dụ định 1.1.4.2 Các thuật toán KPDL định - Thuật toán CLS - Thuật toán ID3 - Thuật toán C4.5 - Thuật toán SLIQ 1.1.4.3 Ưu điểm định - Cây định tương đối dễ hiểu - Việc chuẩn bị liệu cho định không cần thiết - Cây định xử lý liệu có giá trị số liệu có giá trị tên thể loại - Cây định mơ hình hộp trắng - Có thể thẩm định mơ hình kiểm tra thống kê - Cây định xử lý tốt lượng liệu lớn thời gian ngắn 1.2 Lý thuyết chọn nghề nghiệp 1.2.1 Lý thuyết nghề nghiệp 1.2.1.1 Nội dung lý thuyết nghề nghiệp (LTCNN) Sở thích, khả năng, cá tính giá trị nghề nghiệp người đóng vai trò quan trọng việc chọn hướng học, chọn nghề phù hợp coi phần “Rễ” nghề nghiệp Rễ có khỏe khỏe hoa, kết trái mong muốn người trồng Vì vậy, muốn lựa chọn nghề nghiệp phù hợp, trước hết phải hiểu rõ sở thích, khả năng, cá tính giá trị nghề nghiệp thân phải dựa vào hiểu biết để lựa chọn nghề nghiệp Nói cách khác phải chọn nghề theo “rễ” yếu tố có ảnh hưởng mang tính định tới kết trái nghề nghiệp 8 1.2.1.2 Ý nghĩa lý thuyết nghề nghiệp LTCNN lý thuyết quan trọng hướng nghiệp lý thuyết rằng, công việc cần làm công tác giáo dục hướng nghiệp (GDHN) phải giúp cho sinh viên nhận thức đầy đủ thân để em chọn nghề phù hợp với “rễ”, tránh tình trạng chọn nghề theo “quả”, chọn nghề theo cảm tính, theo ý kiến người khác chọn nghề theo trào lưu chung 1.2.2 Lý thuyết mật mã Holland 1.2.2.1 Nội dung lý thuyết mật mã Holland Hình 1.9 Mơ hình lục giác Holland Từ giả thiết lý thuyết Holland, rút kết luận: - Một là, xếp vào kiểu tính cách có mơi trường hoạt động tương ứng với kiểu tính cách, là: Nhóm kỹ thuật (KT); nhóm nghiên cứu (NC); nhóm nghệ thuật (NT); nhóm xã hội (XH); nhóm quản lý (QL); nhóm nghiệp vụ (NV) 9 - Hai là, người chọn công việc phù hợp với tính cách họ, họ dễ dàng phát triển thành công nghề nghiệp 1.2.2.2 Ý nghĩa lý thuyết mật mã Holland Lý thuyết mật mã Holland có liên quan chặt chẽ với LTCNN sử dụng LTMM Holland cách giúp sinh viên biết sở thích khả nghề nghiệp thân nghề nghiệp phù hợp nhanh nhất, dễ làm Vì lẽ đó, trước tổ chức cho sinh viên học NPT, nhà trường giáo viên dạy NPT nên tổ chức cho sinh viên làm trắc nghiệm tìm hiểu sở thích khả nghề nghiệp thân theo LTMM Holland Kết tìm hiểu thân sở quan trọng để em dựa vào lựa chọn NPT theo học cho phù hợp 10 CHƯƠNG PHÂN TÍCH VÀ XÂY DỰNG HỆ THỐNG 2.1 Mô tả hệ thống hỗ trợ tư vấn chọn ngành nghề Hệ thống hỗ trợ tư vấn chọn ngành nghề xây dựng dựa lý thuyết trình KPDL hệ thống theo hướng hoàn toàn Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi Sau khảo sát yêu cầu, mô tả lại hệ thống gồm chức tư vấn phục vụ đối tượng sinh viên Đối tượng sinh viên người có dự định đăng ký xét tuyển vào trường, học sinh THPT, THCS,… Đối tượng tư vấn chọn ngành theo mật mã Holland Bên cạnh đó, hệ thống hỗ trợ tư vấn bậc đào tạo sách hỗ trợ học phí, nội trú cho sinh viên theo học Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi 2.2 Giới thiệu tốn Dựa vào mơ tả hệ thống hỗ trợ tư vấn chọn ngành nghề mục 2.1, tơi phát biểu tốn tư vấn chọn ngành nghề sau: - Đầu vào: Bài toán tư vấn chọn ngành nghề theo mật mã Holland liệu đầu vào câu trả lời tính cách, sở thích, hoạt động nghề nghiệp khả môn khả sinh viên - Xử lý phương pháp sử dụng: Đối với câu trả lời nhận từ sinh viên, hệ thống sử dụng kỹ thuật suy diễn tiến để thực so khớp với điều kiện luật lưu sở tri thức - Đầu ra: Kết tư vấn ngành nghề học Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi phù hợp với người sử dụng 11 2.3 Mơ hình cấu trúc hệ thống Mơ hình cấu trúc hệ thống tư vấn chọn ngành nghề sau: Hình 2.1 Mơ hình cấu trúc hệ thống tư vấn chọn ngành nghề 2.3.1 Mô tả đầu vào/ đầu Hệ thống tư vấn chọn ngành nghề học xây dựng với đầu (Output) ngành nghề học phù hợp với sinh viên đó; Giá trị đầu phụ thuộc vào yếu tố độc lập đầu vào (Input) lực, trình độ, sở thích, hội việc làm điều kiện thân sinh viên thông qua câu hỏi trắc nghiệm định hướng nghề nghiệp 2.3.2 Phương pháp xây dựng hệ thống Từ phát biểu toán luận văn lựa chọn thiết kế hệ thống sử dụng kiểu mơ hình luật kết hợp với thuật tốn Apriori LTMM Holland 2.4 Phân tích thiết kế hệ thống 2.4.1 Phân tích bậc đào tạo Tùy theo nguyện vọng nhu cầu thời gian học lực thân mà sinh viên tư vấn bậc đào tạo 2.4.2 Phân tích LTMM Holland Con người chia làm loại tính cách Tương ứng với 12 loại tính cách môi trường làm việc phù hợp 2.4.3 Xây dựng tập luật cho hệ thống tư vấn chọn ngành nghề 2.4.3.1 Các luật xếp nhóm ngành nghề Mỗi ngành nghề thuộc nhiều nhóm ngành khác Dựa vào phân tích LTMM Holland, tơi xây dựng luật xếp ngành nghề vào nhóm ngành nghề sau: - Ngành nghề Công nghệ thông tin (Công nghệ thông tin, Quản trị mạng) - Ngành nghề Kỹ thuật Xây dựng (Xây dựng dân dụng công nghiệp, Cầu đường, Máy cơng trình xây dựng) - Ngành Kỹ thuật Cơ khí (Cắt gọt kim loại, Cơng nghệ tơ, Hàn) - Ngành Kỹ thuật Điện, điện tử (Hệ thống điện, Nhiệt điện, Điện công nghiệp, Công nghệ kỹ thuật điện tử, viễn thông) - Ngành Kỹ thuật Điều khiển tự động hóa (Quang điện tử, Tự động hóa) - Ngành Nông nghiệp (Khoa học canh tác trồng, Phát triển nông nghiệp nông thôn) - Ngành Dược học - Ngành Điều dưỡng 2.4.3.2 Các luật xét chọn ngành học theo LTMM Holland Luật 1: Nếu người dùng có: Một tính cách TC1, sở thích ST1, hoạt động nghề nghiệp HD1 Thì nên chọn ngành thuộc nhóm kỹ thuật, mã R Luật 2: Nếu người dùng có: Một tính cách TC2, sở thích ST2, hoạt động nghề nghiệp HD2 Thì nên chọn ngành thuộc nhóm 13 nghiên cứu, mã I Luật 3: Nếu người dùng có: Một tính cách TC3, sở thích ST3, hoạt động nghề nghiệp HD3 Thì nên chọn ngành thuộc nhóm nghệ thuật, mã A Luật 4: Nếu người dùng có: Một tính cách TC4, sở thích ST4, hoạt động nghề nghiệp HD4 Thì nên chọn ngành thuộc nhóm xã hội, mã S Luật 5: Nếu người dùng có: Một tính cách TC5, sở thích ST5, hoạt động nghề nghiệp HD5 Thì nên chọn ngành thuộc nhóm quản lý, mã E Luật 6: Nếu người dùng có: Một tính cách TC6, sở thích ST6, hoạt động nghề nghiệp HD6 Thì nên chọn ngành thuộc nhóm nghiệp vụ, mã C 2.4.3.3 Xây dựng luật cho tư vấn dựa điểm LTCNN Để tư vấn chọn nghề dựa điểm thi LTCNN, ta kết hợp luật chọn ngành theo điểm thi luật chọn ngành theo LTCNN Tức chọn ngành theo điểm chọn ngành theo LTCNN cho chọn ngành theo điểm LTCNN 2.5 Xây dựng hệ thống 2.5.1 Thiết kế CSDL Thiết kế liệu với SQL Server 2008 R2 - Table DiemTrungBinh (Lưu trữ ĐTB học sinh) - Table Groups (6 nhóm sở thích) - Table Groups_Nganh (Mã ngành thuộc vào nhóm sở thích (trong 14 nhóm)) - Table KhaoSat_SinhVien (Dữ liệu kết khảo sát sinh viên) - Table Nganh (Ngành học) - Table Nhom_Nganh (Nhóm ngành) - Table Questions (Bảng câu trắc nghiệm) - Table SinhVien (Chứa thông tin khảo sát chọn ngành học sinh viên) - Table Survey_Answer (Chi tiết thông tin khảo sát chọn ngành học Sinh viên) 2.5.2 Cách xây dựng tập luật Mỗi luật xây dựng thuộc tư vấn dựa LTMM Holland Một luật có nhiều điều kiện kèm Mỗi điều kiện dẫn đến nhiều kết 2.5.3 Cách xây dựng máy suy diễn Đối với tư vấn dựa LTMM Holland - Nhận câu trả lời - Truy vấn vào sở thuật tốn, tìm luật loại tư vấn - Dùng kỹ thuật suy diễn tiến: Với điều kiện kiểm tra kết luận mã nhóm có trùng khơng, trùng loại bỏ mã nhóm trùng, khơng trùng lưu thành nhóm nên chọn Đối với tư vấn dựa LTCNN - Nhận câu trả lời mơn khả sinh viên - Tìm môn khả khối thi mà sinh viên có khả - Truy vấn vào sở thuật tốn, tìm luật loại tư vấn - Dùng kỹ thuật suy diễn tiến: Với khối thi khả tìm được, điều kiện luật kiểm tra kết luận mã ngành có trùng khơng, trùng loại bỏ mã ngành trùng, khơng trùng lưu thành kết luận tìm 15 CHƯƠNG KIỂM THỬ VÀ ĐÁNH GIÁ 3.1 Kết kiểm thử 3.1.1 Giao diện hệ thống Trên giao diện hình chính, người dùng xem thông tin tuyển sinh, sử dụng tư vấn chọn ngành nghề đăng ký hồ sơ trực tuyến Từ cửa sổ hình chính, sinh viên muốn tư vấn chọn chức “tư vấn tuyển sinh” 3.1.2 Giao diện Phiếu thông tin cá nhân 3.1.3 Giao diện khảo sát tư vấn bậc đào tạo 3.1.4 Giao diện khảo sát tư vấn chọn ngành nghề 3.1.5 Giao diện tư vấn mức hỗ trợ học phí, nội trú 3.1.6 Giao diện kết tư vấn chọn ngành nghề 3.2 Đánh giá kết hệ thống Hệ thống xây dựng dựa lý thuyết KPDL hai lý thuyết chọn nghề LTCNN LTMM Holland Hệ thống website xây dựng hoàn chỉnh, với liệu tuyển sinh cập nhật đến năm 2017 Nếu trước đây, sinh viên phải tốn nhiều thời gian để đọc thông tin tờ thông báo tuyển sinh, tuyển sinh Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi, Internet làm nhiều thời gian Bên cạnh đó, lượng thơng tin dồn dập tràn lan lại làm cho sinh viên phân vân, lúng túng việc chọn cho ngành nghề học phù hợp Thì nay, với hệ thống hỗ trợ tư vấn chọn ngành nghề trực tuyến phần giúp ích em sinh viên có thêm cơng cụ việc chọn nghề nghiệp cho tương lai cách nhanh chóng, hài lòng có sở khoa học 16 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 4.1 Kết đạt từ nghiên cứu - Về mặt nghiên cứu trình bày lại cách có hệ thống KPDL ứng dụng - Đề xuất giải pháp ứng dụng kỹ thuật KPDL toán ứng dụng cụ thể tư vấn ngành nghề cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi - Đã xây dựng thử nghiệm hệ thống tư vấn ngành nghề cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi 4.2 Đóng góp luận văn - Về mặt khoa học: Luận văn tập trung nghiên cứu hệ thống KPDL - Về mặt thực tiễn: Luận văn xây dựng hệ thống thử nghiệm tư vấn ngành nghề cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi 4.3 Hạn chế - Luận văn tập trung tư vấn cho sinh viên xác định học Trường; - Luận văn tập trung nghiên cứu ngành học bậc đào tạo cao đẳng trung cấp - Dữ liệu thu thập chưa bao quát hết tất ngành học, chưa có phương pháp tối ưu hóa liệu thực liệu lớn 4.4 Hướng phát triển luận văn - Các hướng nghiên cứu tiếp theo: Xây dựng ứng dụng thành hệ thống chun nghiệp đóng vai trò tư vấn ngành nghề học cho tất sinh viên toàn tỉnh 17 - Xây dựng hệ thống tư vấn cho tất ngành nghề học có - Hiện nay, liệu lưu trữ ngày tăng, để ứng dụng KPDL vào toán cần tiếp tục nghiên cứu phương pháp xử lý cho toán với liệu lớn, nghiên cứu thêm số ứng dụng khác KPDL ... Lúc việc tư vấn chọn ngành nghề phù hợp quan trọng sinh viên Chính tơi định chọn đề tài Xây dựng hệ thống tư vấn chọn ngành nghề cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi ... tế quốc gia Trường Cao đẳng Việt Nam - Hàn Quốc - Quảng Ngãi tiền thân Trường Cao đẳng nghề Việt Nam - Hàn Quốc - Quảng Ngãi đào tạo ngành nghề Cơng nghệ thơng tin, Cơ khí, Kỹ thuật điện - điện... cứu hệ thống KPDL - Về mặt thực tiễn: Luận văn xây dựng hệ thống thử nghiệm tư vấn ngành nghề cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi 4.3 Hạn chế - Luận văn tập trung tư vấn