1. Trang chủ
  2. » Luận Văn - Báo Cáo

GỢI ý NGÀNH học PHÙ hợp dựa vào các yếu tố ẢNH HƯỞNG lựa CHỌN NGÀNH

55 53 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 55
Dung lượng 1,54 MB

Nội dung

GỢI ý NGÀNH học PHÙ hợp dựa vào các yếu tố ẢNH HƯỞNG lựa CHỌN NGÀNH GỢI ý NGÀNH học PHÙ hợp dựa vào các yếu tố ẢNH HƯỞNG lựa CHỌN NGÀNH GỢI ý NGÀNH học PHÙ hợp dựa vào các yếu tố ẢNH HƯỞNG lựa CHỌN NGÀNH GỢI ý NGÀNH học PHÙ hợp dựa vào các yếu tố ẢNH HƯỞNG lựa CHỌN NGÀNH

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG  LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC NGÀNH KHOA HỌC MÁY TÍNH Đề tài GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH Sinh viên thực : Nguyễn Đăng Khoa Mã số : B1611129 Khóa : 42 Cần Thơ, 01/2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG  LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC NGÀNH KHOA HỌC MÁY TÍNH Đề tài GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH Giảng viên hướng dẫn: Sinh viên thực hiện: Ths Phạm Xuân Hiền Nguyễn Đăng Khoa Mã số : B1611129 Khóa: 42 Cần Thơ, 01/2021 NHẬN XÉT CỦA GIẢNG VIÊN - LỜI CẢM ƠN Em xin chân thành cảm ơn Khoa Công Nghệ Thông Tin Truyền Thông tạo điều kiện thuận lợi cho chúng em học tập thực đề tài niên luận Em xin bày tỏ lòng biết ơn sâu sắc đến cô Phạm Xuân Hiền tận tình hướng dẫn bảo em suốt trình thực đề tài Em xin giử lời cảm ơn chân thành đến Thầy Cô Giảng viên Đại học Cần Thơ, đặc biệt Thầy Cô Khoa CNTT & TT, người truyển đạt kiến thức quý báu suốt thời gian qua Bên cạnh đó, cảm ơn bạn khoa CNTT&TT hổ trợ, giúp đỡ trình nghiên cứu đề tài Cuối cùng, gửi lời cảm ơn đến gia đình, nơi động viên tạo động lực để phát triển thân chặng đường học tập Em xin chân thành cảm ơn Cần Thơ, ngày tháng … năm 2021 Người viết Nguyễn Đăng Khoa GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền MỤC LỤC ABSTRACT TÓM TẮT PHẦN GIỚI THIỆU Đặt vấn đề Lịch sử giải vấn đề 2.1 Các nghiên cứu nước 2.2 Các nghiên cứu nước 2.3 Ứng dụng máy học vào định hướng nghề nghiệp 10 Mục tiêu đề tài 10 Đối tượng phạm vi nghiên cứu 10 Phương pháp nghiên cứu 11 Kết đạt 11 Bố cục luận văn 11 PHẦN NỘI DUNG 12 CHƯƠNG MƠ TẢ BÀI TỐN 12 Mô tả chi tiết toán 12 Vấn đề giải pháp liên quan đến toán 12 2.1 Các yếu tố ảnh hưởng đến định chọn ngành học 12 2.2 Giải pháp cho toán 13 2.3 Thu thập liệu 13 Mô tả tập liệu 14 Tiền xử lý liệu 15 4.1 Chuẩn hóa liệu 15 4.2 Tiền xử lý liệu 16 Hệ thống gợi ý 16 5.1 Giới thiệu hệ thống gợi ý ( Recommender System) 16 5.2 Phương pháp xây dựng hệ thống gợi ý 17 5.3 Gợi ý theo lọc cộng tác (Collaborative Filtering) 17 5.4 Lọc nhân học (Demographic Filter) 19 Phương pháp đánh giá 23 Công cụ 24 CHƯƠNG THIẾT KẾ VÀ CÀI ĐẶT 27 Thiết kế giao diện trang web gợi ý lựa chọn ngành 27 Nguyễn Đăng Khoa - B1611129 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền Tổ chức sở liệu 29 2.1 Mơ hình liệu mức quan niệm (CDM) 29 2.2 Mơ hình vật lý (PDM) 30 2.3 Giới thiệu thực thể 30 2.4 Mô tả tập thực thể 31 2.5 Các ràng buộc toàn vẹn 32 Xây dựng hệ thống gợi ý 33 3.1 Quy trình cài đặt giải thuật xây dựng hệ thống gợi ý 33 3.2 Cài đặt trình tiền xử lý liệu 34 3.3 Cân liệu 36 3.4 Cài đặt giải thuật Demographic Filter (K-Means Cluster) 42 3.5 Tính độ tương tự với số Cosine (Similarity) 42 3.6 Cài đặt phương pháp kiểm thử Given – N đánh giá mơ hình số Presision 44 CHƯƠNG 46 THỰC NGHIỆM VÀ ĐÁNH GIÁ 46 Kết thực nghiệm 46 1.1 Kết thu thập liệu 46 1.2 Kết tiền xử lý liệu 46 1.3 Kết huấn luyện mơ hình K-Means 47 1.4 Kết độ xác mơ hình 47 Giao diện hệ thống 48 2.1 Giao diện trang gợi ý 48 Giao diện trang web gợi ý với biểu mẫu câu hỏi, yêu cầu người dùng nhập thông tin trang web 48 2.2 Giao diện cho kết 48 PHẦN KẾT LUẬN 49 Kết đạt 49 Hướng phát triển 49 TÀI LIỆU THAM KHẢO 50 Nguyễn Đăng Khoa - B1611129 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền DANH MỤC HÌNH Hình 1: Trang web edu2review.com 10 Hình 2: Mơ tả phương pháp Oversampling 16 Hình 3: Mơ tả phương pháp lọc cộng tác 17 Hình Sơ đồ mô tả đánh giá số tương quan Pearson 18 Hình Các bước thực giái thuật K-Means 19 Hình 6: Sơ đồ tổng quan hệ thống 28 Hình 7: Mơ hình liệu mức quan niệm 29 Hình 8: Mơ hình vật lý (PDM) 30 Hình 9: Lưu đồ hệ thống 33 Hình 10: Lưu đồ cài đặt giải thuật Demographic Filter (K-Means cluster) 42 Hình 11: Danh sách độ tương tự người dùng nhóm 43 Hình 12: Kết gợi ý 43 Hình 13: Lưu đồ cài đặt phương pháp đánh giá mơ hình 44 Hình 14: Thể liệu trước cân 47 Hình 15: Giao diện trang web 48 Hình 16 Giao diện kết gợi ý 48 Nguyễn Đăng Khoa - B1611129 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền DANH MỤC BẢNG Bảng 1: Bảng diễn giải câu hỏi biểu mẫu 13 Bảng 2: Các thuộc tính tập liệu dataset 14 Bảng 3: Bảng người diệu người dùng 20 Bảng 4: Thống kê giá trị khoảng cách điểm 21 Bảng 5: Giá trị thuộc tính phần tử 22 Bảng 6: Bảng mô tả tập thực thể 31 Bảng 7: Chuẩn hóa thuộc tính Gender (giới tính) 34 Bảng 8: Bảng chuẩn hóa thuộc tính Major(ngànhh học) 34 Bảng 9: Chuẩn hóa liệu Interest (sở thích) 35 Bảng 10 Chuẩn hóa liệu RFCM 35 Bảng 11: Chuẩn hóa điểm môn học 36 Bảng 12 Kết chuẩn hóa liệu Gender 36 Bảng 13: Kết chuẩn hóa liệu RFCM 36 Bảng 14: Kết chuẩn hóa liệu Time 37 Bảng 15: Kết chuẩn hóa liệu Influence 37 Bảng 16: Kết chuẩn hóa liệu Maths_score 37 Bảng 17: Kết chuẩn hóa liệu Physics_score 38 Bảng 18: Kết chuẩn hóa liệu Chemistry_score 39 Bảng 19: Kết chuẩn hóa liệu English_score 39 Bảng 20: Kết chuẩn hóa liệu Literature_score 40 Bảng 21: Kết chuẩn hóa liệu History_score 40 Bảng 22: Kết chuẩn hóa liệu Geography_score 41 Nguyễn Đăng Khoa - B1611129 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền ABSTRACT The problem of graduate employment for students is still a difficult problem, the status of unemployed graduates still accounts for a high proportion in society, due to many influencing factors in the assessment process Career orientation, choosing a career that is not suitable for self is also one of the reasons for the above situation The application of information technology to education is no longer unfamiliar with everyone, the goal brings the best teaching conditions and consultation to choose the right industries In this topic, data were collected from 1062 students of university, and then the pre-processing step is to transform the dataset into structured Applying K-Means clustering algorithm and make suggestions by collaborative filtering method The system results show suggestions for the major with the highest similarity scores Verified with a model accuracy of 0.88 with 20 system tests Nguyễn Đăng Khoa - B1611129 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền TÓM TẮT Vấn đề việc làm sau tốt nghiệp sinh viên tốn khó, tình trạng sinh viên trường khơng có việc làm chiếm tỷ lệ cao xã hội, nhiều yếu tố tác động trình định hướng nghệ nghiệp, việc lựa chọn ngành nghề không phù hợp với thân nguyên nhân tạo nên tình trạng Đề tài nhầm gợi ý ngành nghề phù hợp với học sinh dựa yếu tố ảnh hưởng đến việc lựa chọn ngành Trong đề tài này, liệu thu thập từ 1062 sinh viên , sau thực bước tiền xử lý liệu, đưa liệu dạng cấu trúc Áp dụng giải thuật phân nhóm K-Means đưa gợi ý phương pháp lọc cộng tác Kết hệ thống cho gợi ý với ngành có số tương tự cao Được kiếm chứng với độ xác mơ hình 0.88 với 20 lần kiểm thử hệ thống Nguyễn Đăng Khoa - B1611129 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền Cân liệu Time ( Thời gian tìm hiểu ngành học) Bảng 14: Kết chuẩn hóa liệu Time STT Giá trị chuẩn hóa Số lượng trước cân Số lượng sau cân 1 71 317 2 99 311 3 241 950 4 377 2078 5 206 1019 Cân liện Influence (Mức độ tiếng trường đại học có ảnh htưởng đến định chọn ngành) Bảng 15: Kết chuẩn hóa liệu Influence STT Giá trị chuẩn hóa Số lượng trước cân Số lượng sau cân 1 71 317 2 99 311 3 241 950 4 377 2078 5 206 1019 Cân liệu Maths_score (điểm mơn tốn) Bảng 16: Kết chuẩn hóa liệu Maths_score STT Giá trị thuộc tính tập liệu gốc Giá trị chuẩn hóa Số lượng trước cân Số lượng sau cân Dưới 2.5 16 35 – 6.5 5.75 41 160 6.5 – 7.25 304 1466 8–9 8.5 456 2141 – 10 9.5 165 741 8.0 6.8 14 8.3 9.7 6.9 Điểm số người dùng nhập vào Nguyễn Đăng Khoa - B1611129 37 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền 9.2 7.1 1 8.4 1 10.0 7.6 9.6 17 8.8 8.9 10 9.4 5.0 53 Cân liệu Physics_score (điểm mơn tốn) Bảng 17: Kết chuẩn hóa liệu Physics_score STT Giá trị thuộc tính tập liệu gốc Giá trị chuẩn hóa Số lượng trước cân Số lượng sau cân Dưới 2.5 19 52 - 6.5 5.75 90 291 6.5 - 7.25 374 1826 8-9 8.5 397 1889 - 10 9.5 135 469 5.0 91 8.8 17 6.5 13 8.4 10 8.7 7.9 6.6 9.0 6.3 1 7.4 1 7.1 1 Điểm số người dùng nhập vào Nguyễn Đăng Khoa - B1611129 38 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền Cân liệu Chemistry_score (điểm mơn hóa) Bảng 18: Kết chuẩn hóa liệu Chemistry_score STT Giá trị thuộc tính tập liệu gốc Dưới 5 - 6.5 6.5 - 8-9 - 10 Điểm số người dùng nhập vào Giá trị chuẩn hóa 2.5 5.75 7.25 8.5 9.5 5.0 9.4 5.4 7.0 9.8 7.5 8.8 9.6 9.1 5.7 6.5 9.2 Số lượng trước cân 27 98 371 383 140 1 1 1 1 1 Số lượng sau cân 55 368 1685 1746 700 67 17 13 3 1 Cân liệu English_score (điểm môn ngoại ngữ) Bảng 19: Kết chuẩn hóa liệu English_score STT Giá trị thuộc tính tập liệu gốc Dưới 5 - 6.5 6.5 - 8-9 - 10 Điểm số người dùng nhập vào Nguyễn Đăng Khoa - B1611129 Giá trị chuẩn hóa 2.5 5.75 7.25 8.5 9.5 6.2 7.1 7.6 9.4 8.6 8.8 7.4 Số lượng trước cân 24 149 428 310 102 1 1 1 Số lượng sau cân 90 586 2054 1437 386 13 17 10 39 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền 5.0 9.2 6.7 5.0 1 1 0 67 Số lượng trước cân 21 112 505 280 37 28 1 1 1 Số lượng sau cân 83 478 2467 1358 167 62 18 13 10 3 1 Cân liệu Literature_score (điểm môn ngữ văn) Bảng 20: Kết chuẩn hóa liệu Literature_score STT Giá trị thuộc tính tập liệu gốc Dưới 5 - 6.5 6.5 - 8-9 - 10 Điểm số người dùng nhập vào Giá trị chuẩn hóa 2.5 5.75 7.25 8.5 9.5 5.0 7.8 7.4 7.2 6.5 8.7 8.1 7.6 7.9 5.6 Cân liệu History_score (điểm môn lịch sử) Bảng 21: Kết chuẩn hóa liệu History_score STT Giá trị thuộc tính tập liệu gốc Dưới 5 - 6.5 6.5 - 8-9 - 10 Điểm số người dùng nhập vào Nguyễn Đăng Khoa - B1611129 Giá trị chuẩn hóa 2.5 5.75 7.25 8.5 9.5 5.0 8.9 7.5 9.7 Số lượng trước cân 14 59 377 335 166 33 2 Số lượng sau cân 26 174 1896 1596 795 129 40 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền 8.4 8.7 8.8 7.7 8.6 1 1 13 10 17 Số lượng trước cân 16 40 336 389 177 26 2 1 Số lượng sau cân 29 114 1658 1906 832 80 19 17 14 Cân liệu Geography_score (điểm môn địa lý) Bảng 22: Kết chuẩn hóa liệu Geography_score STT Giá trị thuộc tính tập liệu gốc Dưới 5 - 6.5 6.5 - 8-9 - 10 Điểm số người dùng nhập vào Nguyễn Đăng Khoa - B1611129 Giá trị chuẩn hóa 2.5 5.75 7.25 8.5 9.5 5.0 9.2 8.6 7.6 7.8 9.1 8.5 41 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền 3.4 Cài đặt giải thuật Demographic Filter (K-Means Cluster) Hình 10: Lưu đồ cài đặt giải thuật Demographic Filter (K-Means cluster) Các bước thực hiện: − Bước 1: Chọn tập liệu huấn luyện với cột 3470 dòng thuộc tập liệu dataset bao gồm cột Gender, RFCM, Influence, Time Các cột liệu thuộc nhóm yếu tố ảnh hưởng đến định chọn ngành học − Bước 2: Tiếp theo huấn luyện mơ hình với nhóm liệu người dùng − Bước 3: Kết mơ hình huấn luyện nhóm người dùng phân nhóm 3.5 Tính độ tương tự với số Cosine (Similarity) Sử dụng hàm tính độ tương cosine_similarity() tự thư viện Sklearn để tính số cosine người dùng so với người dùng nhóm (sau phân nhóm).Sử dụng cột điểm số cột thuộc nhóm sở thích để tính tốn số tương tự, cột thuộc nhóm lực thân nhóm yếu tố cá nhân Kết bước tính danh sách số tương tự người dùng so với người dùng nhóm, hình 11 bên ví dụ sau tính độ tương tự người dùng người dùng nhóm: Nguyễn Đăng Khoa - B1611129 42 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền Hình 11: Danh sách độ tương tự người dùng nhóm Từ danh sách độ tương tự có chọn số tương tự có giá trị lớn nhất, truy xuất giá trị nhãn đưa gợi ý ngành học, kết bước đưa ngành có độ tương tự cao nhất, ví dụ kết ngành thể hình 12 Hình 12: Kết gợi ý Nguyễn Đăng Khoa - B1611129 43 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền 3.6 Cài đặt phương pháp kiểm thử Given – N đánh giá mơ hình số Presision Hình 13: Lưu đồ cài đặt phương pháp đánh giá mơ hình Các bước thực hiện: Ý tưởng cua phưuong pháp sau: − Tập liệu kiểm thử chia từ tập dataset với 22 cột 935 dịng (khơng nhãn), tỷ lệ 1:5 so với tập huấn luyện − Tiếp theo mẫu tập kiểm thử qua qua trình phân nhóm giải thuật K-Means sau mẫu tính độ tương tự so với người dùng nhóm, đưa kết gợi ý − Sau có kết gợi ý so sánh với nhãn thực tế mẫu tập liệu kiểm thử − Nếu giá trị kiểm thử có giá trị nhãn giá trị biến tạo sẳn tăng lên đơn vị Nguyễn Đăng Khoa - B1611129 44 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền − Lập lại hết tập liệu kiểm thử − Kết thúc trình này, ta danh sách số lượng giá trị dự đốn Áp dụng phương pháp đánh giá mơ hình số Presision: - Sau có số lượng giá trị dự đoán đúng, so với số lượng (kích thước) tập liệu kiểm thử với số lượng giá trị dự đoán - Kết phương pháp độ xác mơ hình Nguyễn Đăng Khoa - B1611129 45 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền CHƯƠNG THỰC NGHIỆM VÀ ĐÁNH GIÁ Kết thực nghiệm 1.1 Kết thu thập liệu Kết thu thập liệu có tập liệu với kích thước 1062 dịng 17 cột, đó: 16 cột thuộc tính cột nhãn 1.2 Kết tiền xử lý liệu 1.2.1 Kết chuẩn hóa liệu Q trình chuẩn hóa liệu cho tập liệu với 994 dịng 27 cột, đó: 26 cột thuộc tính cột nhãn, sơ lượng nhãn có chênh lệch cao, ảnh hưởng đến độ xác thực tế sử dụng làm tập liệu huấn luyện tính tốn, cần phải xử lý cân liệu để tập liệu xây dựng mơ hình mang độ tin cậy cao 1.2.2 Đánh giá tiền xử lý liệu Ở bước tiền xử lý liệu sử dụng phương pháp Oversampling với hướng áp dụng: Oversampling – SMOTE: tập liệu từ phương pháp cho kết với độ xác mơ hình 0.89 sau kiểm thử 20 lần kết xác định cách tính trung bình lần kiểm thử, mơ hình huấn luyện K-Means với k = Oversampling – Random Forest: phương pháp cho kết với độ xác mơ hình 0.92 sau kiểm thử 20, mơ hình huấn luyện K-Means với k = Nhưng phương pháp liệu tăng cách ngẫu nhiên, có nghĩa dựa vào mẫu cũ tập liệu mà nhân số lượng lên giá trị nhãn nhau, thực tế cách làm không mang ý nghĩa tăng độ xác thực tế cho mơ hình, phương pháp không sử dụng cho toán Kết xử lý cân liệu cho tập liệu với số lượng nhãn cân bằng, tất mẫu mang số lượng nhãn 85 Hình thể cột nhãn trước sau cân Nguyễn Đăng Khoa - B1611129 46 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền Trước cân Hình 14: Thể liệu trước cân 1.3 Kết huấn luyện mơ hình K-Means Mơ hình huấn luyện K-Means số nhóm kiểm thử là: 2, 5, 7, ,12 ,15 nhóm, với độ xác kiểm thử qua nhóm sau thực 20 lần, tính trung bình tổng thể giá trị nhóm: Với k = cho độ xác 0.87 Với k = cho độ xác 0.88 Với k = cho độ xác 0.88 Với k = cho độ xác 0.89 Với k = 12 cho độ xác 0.87 Với k = 15 cho độ xác 0.87 Kết cho thấy với số lượng nhóm kết mơ hình cho với độ xác mơ hình cho cao 1.4 Kết độ xác mơ hình Độ xác mơ hình xác định với tập liệu dataset, xử lý cân bằng phương pháp Oversampling – SMOTE, với mơ hình huấn luyện K-Means với số lượng nhóm nhóm, mơ hình đánh giá phương pháp Given – N kiểm thử só Presision với 20 lần kiểm thử, lấy trung bình giá trị kiểm thử, cho kết mơ hình 0.88 Nguyễn Đăng Khoa - B1611129 47 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền Giao diện hệ thống 2.1 Giao diện trang gợi ý Giao diện trang web gợi ý với biểu mẫu câu hỏi, yêu cầu người dùng nhập thơng tin trang web Hình 15: Giao diện trang web 2.2 Giao diện cho kết Trang đưa kết gợi ý ngành học Hình 16 Giao diện kết gợi ý Nguyễn Đăng Khoa - B1611129 48 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền PHẦN KẾT LUẬN Kết đạt Đề tài “Gợi ý ngành học phù hợp dựa vào yếu tố ảnh hưởng lựa chọn ngành” kết sau: − Xây dựng thành công hệ thống gợi ý, đưa kết gợi ý ngành học − Trang web gợi ý ngành cài đặt thành công với phương pháp lọc cộng tác (Collaborative Filtering) − Bên cạnh biết phương pháp thu thập liệu xử lý liệu phù hợp với toán − Dữ liệu xử lý phù hợp với hệ thống − Độ xác mơ hình cao đạt 88% − Giao diện hiển thị thông tin chi tiết, theo yêu cầu đề tài Hướng phát triển − Thu thập thêm nhiều liệu với nhiều cách khác − Xây dựng hệ thống trang web hoàn chỉnh với chức quản lý − Cải tiến giải thuật với nhiều phương pháp, cho độ xác thực tế cao − Mở rộng đề tài, phát triển ứng dụng vào thực tế Nguyễn Đăng Khoa - B1611129 49 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền TÀI LIỆU THAM KHẢO Bộ Lao động – Thương binh Xã hội , Bản tin cập nhật thị trường lao động Việt Nam số 21 quý năm 2019 Nguyễn Thị Kim Nhung – Lương Thị Thành Vinh (2018), Đánh giá yếu tố ảnh hưởng đến định hướng nghề nghiệp học sinh trung học phổ thông nghệ an Trường Đại học Cần Thơ, Khoa Kinh tế - Luận văn tốt nghiệp (2017), Phân tích nhân tố ảnh hưởng đến định chọn ngành, Trường Đại học học sinh THPT vùng ĐBSCL F.O.Isinkaye ,Y.O.Folajimi, B.A.Ojokoh, Recommendation systems: Principles, methods and eluavation.(2015) Department of Guidance and Counselling, Delta State University, Rev Fr Jude J.Obiunu , Oghenebrohie Ruth Ebunu – Factors affecting career development of senior secondary school student in Ethiope east local government area, Delta state, Nigeria (2010) Nguyễn Nhựt Quỳnh, Xây dựng trang web gợi ý phim dựa vào thể loại diễn viên (2018) Trường Đại học PHENIKAA – Lê Thị Mỹ Linh, Khúc Văn Qúy– Các yếu tố ảnh hưởnh tới định chọn trường đại học học sinh THPT Tại Việt Nam: Bằng chứng khảo sát năm 2020 Phạm Đình Khánh , Mất cân liệu (Imbalanced dataset).(2020) Iateilang, L Chameikho, Don Bosco College Of Engineering & Technology Assam Don Bosco University, Recommender Systems: Types of Filtering Techniques (IJERT).(2014) 10 Trần Nguyễn Minh Thư, Phạm Xuân Hiền – Các phương pháp đánh giá hệ thống gợi ý (2016) 11 Mortensen M.,2007 Design and evaluation of a recommender system 12 Bela Gripp, J𝑜̈ 𝑟𝑎𝑛 Bell1 , Christian Hentschel2 – Scienstein: A Research Paper Recommender System (2009) Danh sách website kham khảo 13 https://moet.gov.vn/thong-ke/Pages/thong-ko-giao-duc-daihoc.aspx?ItemID=6636 14 http://sqladvice.com/postgresql-la-gi-so-sanh-mysql-va-postgresql/ 15 https://vimentor.com/vi/lesson/tien-xu-ly-du-lieu-trong-linh-vuc-hoc-may-phan-1 16 https://phantichspss.com/he-so-tuong-quan-pearson-cach-thao-tac-phan-tichtuong-quan-trong-spss.html\ 17 https://sites.google.com/site/dataclusteringalgorithms/k-means-clusteringalgorithm 18 https://vi.wikipedia.org/wiki/Visual_Studio_Code 19 https://www.hostinger.vn/huong-dan/angular-la-gi/ Nguyễn Đăng Khoa - B1611129 50 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền 20 https://bizflycloud.vn/tin-tuc/sdk-la-gi-su-khac-nhau-giua-api-va-sdk20181128092524829.htm ❖ Các địa web điều truy cập ngày 10/01/2021 Nguyễn Đăng Khoa - B1611129 51 ... đề tài: ? ?gợi ý ngành học phù hợp dựa vào yếu tố ảnh hưởng lựa chọn ngành? ?? với mục tiêu tìm hiểu yếu tố ảnh hưởng đến lựa chọn nghề nghiệp học sinh – sinh viên nay, qua đưa gợi ý ngành học góp... Đại học Cần Thơ (thuộc tính khơng bắt buộc) 13 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH 10 11 12 13 ThS Phạm Xuân Hiền Ngành chọn học Chọn nhập tên Khoa học máy tính ngành. .. cấp giải pháp phù hợp Nguyễn Đăng Khoa - B1611129 16 GỢI Ý NGÀNH HỌC PHÙ HỢP DỰA VÀO CÁC YẾU TỐ ẢNH HƯỞNG LỰA CHỌN NGÀNH ThS Phạm Xuân Hiền đối tượng, nhằm gợi ý mục thông tin phù hợp với người

Ngày đăng: 25/03/2021, 20:49

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
4. F.O.Isinkaye ,Y.O.Folajimi, B.A.Ojokoh, Recommendation systems: Principles, methods and eluavation.(2015) Sách, tạp chí
Tiêu đề: Recommendation systems: Principles, methods and eluavation
6. Nguyễn Nhựt Quỳnh, Xây dựng trang web gợi ý phim dựa vào thể loại hoặc diễn viên. (2018) Sách, tạp chí
Tiêu đề: Xây dựng trang web gợi ý phim dựa vào thể loại hoặc diễn viên
8. Phạm Đình Khánh , Mất cân bằng dữ liệu (Imbalanced dataset).(2020) Sách, tạp chí
Tiêu đề: Mất cân bằng dữ liệu (Imbalanced dataset)
9. Iateilang, L. Chameikho, Don Bosco College Of Engineering & Technology Assam Don Bosco University, Recommender Systems: Types of Filtering Techniques (IJERT).(2014) Sách, tạp chí
Tiêu đề: Recommender Systems: Types of Filtering Techniques (IJERT)
10. Trần Nguyễn Minh Thư, Phạm Xuân Hiền – Các phương pháp đánh giá hệ thống gợi ý. (2016) Sách, tạp chí
Tiêu đề: Các phương pháp đánh giá hệ thống gợi ý
12. Bela Gripp, J𝑜̈𝑟𝑎𝑛 Bell 1 , Christian Hentschel 2 – Scienstein: A Research Paper Recommender System (2009)Danh sách các website kham khảo Sách, tạp chí
Tiêu đề: Scienstein: A Research Paper Recommender System
1. Bộ Lao động – Thương binh và Xã hội , Bản tin cập nhật thị trường lao động Việt Nam số 21 quý 1 năm 2019 Khác
2. Nguyễn Thị Kim Nhung – Lương Thị Thành Vinh (2018), Đánh giá các yếu tố ảnh hưởng đến định hướng nghề nghiệp của học sinh trung học phổ thông tại nghệ an Khác
3. Trường Đại học Cần Thơ, Khoa Kinh tế - Luận văn tốt nghiệp (2017), Phân tích các nhân tố ảnh hưởng đến quyết định chọn ngành, Trường Đại học của học sinh THPT vùng ĐBSCL Khác
7. Trường Đại học PHENIKAA – Lê Thị Mỹ Linh, Khúc Văn Qúy– Các yếu tố ảnh hưởnh tới quyết định chọn trường đại học của học sinh THPT Tại Việt Nam: Bằng chứng khảo sát năm 2020 Khác
11. Mortensen M.,2007. Design and evaluation of a recommender system Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w