Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 110 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
110
Dung lượng
3,82 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM BÁO CÁO ĐỒ ÁN Môn học: Đồ án Đề tài: Hệ thống sàn lọc sơ yếu lý lịch tự động Giảng viên hướng dẫn: ThS Huỳnh Tuấn Anh Sinh viên thực hiện: Phạm Quang Vinh - 16521446 TP HỒ CHÍ MINH, tháng năm 2021 LỜI CẢM ƠN Lời đầu tiên, chúng em xin chân thành cảm ơn ban giám hiệu nhà trường, thầy cô Trường Đại học Cơng nghệ Thơng tin nói chung thầy trực thuộc khoa Cơng nghệ phần mềm nói riêng, người ln tận tình dạy dỗ, truyền đạt cho chúng em nhiều kiến thức mẻ bổ ích suốt thời gian mà chúng em theo học trường Đặc biệt, chúng em xin gửi đến thầy Nguyễn Đình Hiển thầy Huỳnh Tuấn Anh lời cảm ơn chân thành sâu sắc Cảm ơn thầy tận tình giúp đỡ, hướng dẫn đưa lời khun bổ ích q trình hồn thành đồ án Nếu không thầy quan tâm, lời góp ý, hướng dẫn thầy chúng em khơng thể hồn thành đồ án tốt nghiệp cách trọn vẹn Đồng thời, chúng em muốn thể lòng biết ơn đến gia đình bạn bè giúp đỡ chúng em mặt vật chất lẫn tinh thần để chúng em hồn thành chặng đường học hành, bên cạnh để động viên chúng em gặp khó khăn Trong suốt q trình làm đồ án, chúng em cố gắng để làm thứ thật tốt Tuy nhiên, khơng tránh khỏi sai sót Vì vậy, chúng em mong nhận thật nhiều lời góp ý quý giá từ phía thầy cơ, bạn bè tất người quan tâm đến đồ án chúng em Sau cùng, em xin kính chúc tồn thể q thầy cô thật nhiều sức khoẻ, nhiệt huyết thành cơng nghiệp giảng dạy Tp Hồ Chí Minh, tháng năm 2021 Nhóm sinh viên thực Phan Thanh Tùng – Phạm Quang Vinh MỤC LỤC Chương MỞ ĐẦU .2 1.1 Lý chọn đề tài 1.2 Mục tiêu đề tài .3 1.3 Nội dung thực 1.4 Phạm vi đề tài 1.5 Bố cục báo cáo .4 Chương TỔNG QUAN .6 2.1 Một số khái niệm 2.1.1 Cấu trúc CV 2.1.2 Quan điểm nhà tuyển dụng .7 2.2 Phát biểu toán 2.3 Các nghiên cứu liên quan Chương PHƯƠNG PHÁP THỰC HIỆN 13 3.1 Cơ sở lý thuyết 13 3.1.1 Word Embedding 13 3.1.1.1 Định nghĩa 13 3.1.1.2 Phương pháp biểu diễn Word Embedding 13 3.1.2 Ontology 15 3.1.2.1 Định nghĩa 15 3.1.2.2 Thành phần ontology 16 3.1.3 Một số thuật tốn tính khoảng cách 17 3.1.3.1 Khoảng cách Levenshtein 17 3.1.3.1 Khoảng cách chỉnh sửa đồ thị (Graph edit distance – GED) 18 3.2 Công nghệ sử dụng 18 3.2.1 3.3 CSO (Computer Science Ontology) Classifier 18 Phương pháp thực 19 3.3.1 Thu thập liệu 19 3.3.2 Tạo ontology 21 3.3.3 Tạo Word2vec model 22 3.3.3.1 Tiền xử lý liệu 22 3.3.3.2 Tiến hành train model 23 3.3.4 Áp dụng CSO Ontology để trích xuất kỹ 24 3.3.4.1 Tạo cached model cho CSO Classifier 24 3.3.4.2 Áp dụng CSO Classifier cho nhiều domain lúc 26 3.3.4.3 Trích xuất kỹ từ CV 27 3.3.4.4 Trích xuất kỹ từ JD 28 3.3.5 Tạo đồ thị kỹ từ ontology danh sách kỹ 30 3.3.6 So khớp thông tin trích xuất xếp hạng CV 32 Chương CÀI ĐẶT HỆ THỐNG 34 4.1 Thiết kế hệ thống 34 4.1.1 Sơ đồ use case 34 4.1.1.1 Các sơ đồ use case 34 4.1.1.2 Danh sách actors: 40 4.1.1.3 Danh sách use case 41 4.1.2 Mơ hình ERD 43 4.1.3 Phân tích thiết kế sở liệu 44 4.1.3.1 Bảng NTD theo dõi CV 46 4.1.3.2 Bảng ứng viên lưu tin tuyển dụng 47 4.1.3.3 Bảng học vấn 47 4.1.3.4 Bảng ứng viên 48 4.1.3.5 Bảng công ty 49 4.1.3.6 Bảng lọc ứng viên 50 4.1.3.7 Bảng tin tuyển dụng 51 4.1.3.8 Bảng đăng ký ứng tuyển 52 4.1.3.9 Bảng nhà tuyển dụng 53 4.1.3.10 Bảng sơ yếu lý lịch 54 4.1.3.11 Bảng chuyên ngành 55 4.2 Kiến trúc hệ thống 56 4.3 Cài đặt hệ thống 57 4.3.1 Tổng quan công nghệ 57 4.3.1.1 Nền tảng Flask 57 4.3.1.2 Hệ quản trị sở liệu MySQL 58 4.3.1.3 Firebase Storage 59 4.3.2 Thiết kế API 59 4.3.3 Một số UI hệ thống 75 4.3.3.1 Giao diện cho ứng viên 75 4.3.3.1 Giao diện cho nhà tuyển dụng: 82 4.4 Đánh giá 88 4.4.1 Độ đo kết 88 4.4.2 Kết đánh giá 89 4.4.3 Đánh giá kết xếp hạng danh sách CV 90 4.4.4 Đánh giá thực nghiệm 93 Chương KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 95 5.1 Tổng kết 95 5.2 Ưu điểm 95 5.3 Nhược điểm 95 5.4 Hướng phát triển 96 TÀI LIỆU THAM KHẢO 97 DANH MỤC HÌNH Hình 2.1: Mơ hình so khớp Hình 2.2: Sơ đồ mô tả module xác định kỹ 11 Hình 3.1: Ví dụ count-based method 14 Hình 3.2: Tổng quan CBOW Skip-gram 14 Hình 3.3: Kiến trúc CSO Classifier 19 Hình 3.6: Top 10 từ/ cụm từ liên quan gần với từ khố reactjs 24 Hình 3.7: Top 10 từ/ cụm từ liên quan gần với từ khố oop 24 Hình 3.8: Ví dụ từ vựng “react” có Word2Vec thể từ điển cached model 25 Hình 3.9: Sơ đồ thành phần cấu tạo Domain Classifier 26 Hình 3.10: Sơ đồ hoạt động hệ thống sử dụng Domain Classifier 27 Hình 3.11: Top 10 từ/ cụm từ gần với từ “docker” tính word2vec model 30 Hình 3.12: Thuật toán tạo đồ thị từ domain ontology danh sách kỹ 31 Hình 3.13: Đồ thị biểu diễn kỹ trích xuất từ CV ứng tuyển Frontend Developer 32 Hình 4.1: Biểu đồ use case mức tổng quát 34 Hình 4.2: Biểu đồ use case Chưa đăng nhập 35 Hình 4.3: Biểu đồ use case Đăng nhập 35 Hình 4.4: Biểu đồ use case Đăng ký tài khoản 36 Hình 4.5: Biểu đồ use case ứng viên đăng ký tài khoản 36 Hình 4.6: Biểu đồ use case Xem danh sách việc làm 37 Hình 4.7: Biểu đồ use case Upload sơ yếu lý lịch 37 Hình 4.8: Biểu đồ use case Quản lý thông tin cá nhân 38 Hình 4.9: Biểu đồ use case Tìm kiếm việc làm 38 Hình 4.10: Biểu đồ use case Quản lý thông tin tuyển dụng 39 Hình 4.11: Biểu đồ use case Xem danh sách ứng tuyển 39 Hình 4.12: Biểu đồ use case Tìm kiếm ứng viên 40 Hình 4.13: Biểu đồ use case Thêm ứng viên tiềm 40 Hình 4.14: Mơ hình ERD 43 Hình 4.15: Kiến trúc hệ thống 56 Hình 4.17: Giao diện trang chủ cho ứng viên 75 Hình 4.18: Giao diện đăng nhập cho ứng viên 76 Hình 4.19: Giao diện đăng ký tài khoản cho ứng viên 76 Hình 4.20: Giao diện đăng ký tài khoản thành công 77 Hình 4.21: Giao diện tìm việc cho ứng viên 77 Hình 4.22: Giao diện chi tiết tin tuyển dụng 78 Hình 4.23: Giao diện ứng tuyển 79 Hình 4.24: Giao diện Xem việc làm lưu 79 Hình 4.25: Giao diện Xem việc ứng tuyển 79 Hình 4.26: Giao diện Quản lý CV 80 Hình 4.27: Giao diện Quản lý CV 80 Hình 4.28: Giao diện Cập nhật thông tin CV tải lên 81 Hình 4.29: Giao diện Cập nhật thông tin CV tải lên 81 Hình 4.30: Giao diện Cập nhật thông tin CV tải lên 82 Hình 4.31: Giao diện trang chủ cho nhà tuyển dụng 82 Hình 4.32: Giao diện Danh sách lọc ứng viên 83 Hình 4.33: Giao diện Danh sách ứng viên thoả lọc 83 Hình 4.34: Giao diện Xem CV ứng viên 85 Hình 4.35: Giao diện Tạo/ Cập nhật lọc ứng viên 85 Hình 4.36: Giao diện Danh sách ứng viên theo dõi 85 Hình 4.37: Giao diện Danh sách tin tuyển dụng 86 Hình 4.38: Giao diện Danh sách tin tuyển dụng 86 Hình 4.39: Giao diện Xác nhận xoá 87 Hình 4.40: Giao diện Đăng/ Cập nhật tin tuyển dụng 87 Hình 4.41: Giao diện Chi tiết tin tuyển dụng 88 Hình 4.42: Giao diện Danh sách ứng viên ứng tuyển 88 Hình 4.43: Đồ thị biểu diễn kỹ cho JD 91 Hình 4.44: Đồ thị biểu diễn kỹ cho CV_2 92 Hình 4.45: Đồ thị biểu diễn kỹ cho CV_1 92 DANH MỤC BẢNG Bảng 3.1: Các tham số cho Gensim Phrase để nhận diện bigram trigram 23 Bảng 3.2: Các tham số cho Gensim để nhận train Word2vec model 23 Bảng 3.3: Kết trích xuất từ CV ứng tuyển vị trí Frontend Developer 28 Bảng 3.4: Kết trích xuất từ JD cho vị trí Backend Developer 29 Bảng 4.1: Danh sách actors 41 Bảng 4.2: Danh sách use case 42 Bảng 4.3: Các lớp sơ đổ lớp 44 Bảng 4.4: Các đối tượng thuộc tính đối tượng 46 Bảng 4.5: Bảng NTD theo dõi CV 47 Bảng 4.6: Bảng ứng viên lưu tin tuyển dụng 47 Bảng 4.7: Bảng học vấn 48 Bảng 4.8: Bảng ứng viên 49 Bảng 4.9: Bảng công ty 49 Bảng 4.10: Bảng lọc ứng viên 51 Bảng 4.11: Bảng tin tuyển dụng 52 Bảng 4.12: Bảng đăng ký ứng tuyển 53 Bảng 4.13: Bảng nhà tuyển dụng 54 Bảng 4.14: Bảng sơ yếu lý lịch 55 Bảng 4.15: Bảng chuyên ngành 56 Bảng 4.16: Thông số truyền vào API POST: /company 60 Bảng 4.17: Thông số truyền vào API GET: /company 60 Bảng 4.18: Thông số truyền vào API GET: /company 60 Bảng 4.19: Thông số truyền vào API POST: /user/candidate/register 61 Bảng 4.20: Thông số truyền vào API POST: /user/candidate/login 61 Bảng 4.21: Kết trả API POST: /user/candidate/login 62 Bảng 4.22: Thông số truyền vào API POST: /user/candidate/profile/update 62 Bảng 4.23: Thông số truyền vào API GET: /user/candidate/profile 63 Bảng 4.24: Thông số truyền vào API POST: /user/recruiter/register 63 Bảng 4.25: Thông số truyền vào API POST: /user/recruiter/login 64 Bảng 4.26: Kết trả API POST: /user/recruiter/login 64 Bảng 4.27: Kết trả API GET: /job-domains 64 84 Hình 4.33: Giao diện Xem CV ứng viên • Giao diện Tạo/ Cập nhật lọc ứng viên: Hình 4.34: Giao diện Tạo/ Cập nhật lọc ứng viên • Giao diện Danh sách ứng viên theo dõi: Hình 4.35: Giao diện Danh sách ứng viên theo dõi • Giao diện Danh sách tin tuyển dụng: o Tin hiển thị 85 Hình 4.36: Giao diện Danh sách tin tuyển dụng o Tin hết hạn/ đóng: Hình 4.37: Giao diện Danh sách tin tuyển dụng • Giao diện Xác nhận xố: 86 Hình 4.38: Giao diện Xác nhận xố • Giao diện Đăng/Cập nhật tin tuyển dụng mới: Hình 4.39: Giao diện Đăng/ Cập nhật tin tuyển dụng • Giao diện Chi tiết tin tuyển dụng 87 Hình 4.40: Giao diện Chi tiết tin tuyển dụng • Giao diện Danh sách ứng viên ứng tuyển: Hình 4.41: Giao diện Danh sách ứng viên ứng tuyển 4.4 Đánh giá 4.4.1 Độ đo kết Nhóm tiến hành đánh giá kết trích xuất từ mơ hình tập liệu tạo trước Để đánh giá kết quả, nhóm thực sử dụng độ kiểm tra xác 88 dựa kỹ trích xuất tự động gắn nhãn thủ công bao gồm độ đo [24] độ đo xác (precision), độ phủ (recall) số F1-score để đánh giá hiệu phương pháp liệu thực tế Các độ đo mô tả sau: • Độ xác: 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃 𝑇𝑃 + 𝐹𝑃 • Độ phủ: 𝑟𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃 𝑇𝑃 + ã Ch s F1-score: = ì × 𝑟𝑒𝑐𝑎𝑙𝑙 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 + 𝑟𝑒𝑐𝑎𝑙𝑙 Trong đó: • TP: tổng số lượng kỹ trích xuất xác định • FP: tổng số lượng kỹ trích xuất xác định sai • FN: tổng số lượng kỹ xác định không liên quan 4.4.2 Kết đánh giá Để tiến hành đánh giá, nhóm sử dụng liệu thực tế thu thập từ trang web tuyển dụng sau tiến hành gán nhãn bổ sung cho kỹ bị liệt kê thiếu từ JD Sau đó, nhóm tiến hành trích xuất kỹ tập liệu mơ hình xây dựng so sánh với kỹ gán nhãn thủ công sử dụng độ đo Precision, Recall F1-score để đánh giá độ hiệu phương pháp Kết thu độ xác (Precision) 24.29% độ phủ (Recall) 78.17% cuối F1-score 36.71% Kết thực nghiệm cho thấy, có khác biệt lớn kỹ rút trích từ mơ hình so với kỹ gán nhãn thủ công Giá trị Precision tương đối thấp hiểu chấp nhập số lý sau: 89 Việc mơ hình mà nhóm sử dụng có module semantic, tức phân tích ngữ nghĩa, giúp cho mơ hình nhóm thơng minh trích xuất kỹ liên quan đến kỹ có JD khơng trực tiếp xuất Tuy nhiên, việc nguyên nhân trực tiếp ảnh hưởng lớn đến giá trị độ đo Do đó, dù Precision có thấp mong đợi chấp nhận Việc xác định kỹ cách gán nhãn thủ công số lượng lớn JD khiến cho việc sai sót xảy điều không tránh khỏi 4.4.3 Đánh giá kết xếp hạng danh sách CV Đối với việc đánh giá xếp hạng danh sách CV, nhóm chọn ngẫu nhiên 10 CVs tìm việc vị trí Frontend Developer JD ngẫu nhiên từ ITviec Sau cho chạy hệ thống cho kết sau CV ID Domain Score General Score Soft Skill Score Overall Score CV_2 0.7692 0.6193 0.9091 5.0746 CV_8 0.8033 0.5899 0.75 4.9296 CV_1 0.7049 0.5899 0.9091 4.7935 CV_6 0.6897 0.5829 0.9 4.778 CV_9 0.7344 0.5924 0.5455 4.5259 CV_5 0.6607 0.5795 0.7 4.4206 CV_0 0.619 0.509 0.6364 4.0204 CV_3 0.6316 0.506 0.5455 3.9583 CV_4 0.5714 0.521 0.5455 3.8227 CV_7 0.5091 0.506 0.5455 3.5908 90 Bảng 4.49: Bảng xếp hạng danh sách 10 CV với JD cho vị trí Frontend Developer Qua bảng trên, ta thấy CV hàng đầu dễ dàng chọn so với CV hàng sau Nhóm chọn đại diện CV_2 CV_1 cho việc so sánh điểm số Domain Score để lý giải CV_2 lại có điểm cao Bên hình ảnh đồ thị biểu diễn danh sách kỹ trích xuất từ JD, CV_2 CV_1 Hình 4.42: Đồ thị biểu diễn kỹ cho JD 91 Hình 4.43: Đồ thị biểu diễn kỹ cho CV_2 Hình 4.44: Đồ thị biểu diễn kỹ cho CV_1 Các bước chuyển đổi 92 Từ đồ thị CV_2 sang JD Từ đồ thị CV_1 sang JD • Update: reac hook -> jquery, algorithms -> api, https -> code review, oop -> responsive, three > ajax • Insert: wireframes, sass, bitbucket, sourcetree, svn, testing, modernizr • Remove: reactjs, redux • Update: reactjs -> bootstrap, redux -> jquery, https -> code review, oop -> responsive, restful > wireframes, three -> ajax • Insert: sass, scss, css preprocessors, bitbucket, git, github, sourcetree, svn, source control, testing, modernizr, tools • Remove: rest Bảng 4.50: Các bước chuyển đổi từ đồ thị CV_1, CV_2 sang đồ thị JD Sau quan sát đồ thị bước chuyển đổi, ta dễ dàng nhận thấy số bước chuyển đổi CV_1 nhiều so với số bước chuyển đổi CV_2 Do đó, CV_2 có mức độ phù hợp với JD cao so với CV_1 Nên domain score CV_2 cao hợp lí 4.4.4 Đánh giá thực nghiệm Để đánh giá hệ thống cách trực quan, nhóm tiến hành so sánh tương quan ưu nhược điểm hệ thống so với vài website lớn lĩnh vực tuyển dụng có thị trường Itviec – website hàng đầu lĩnh vực tuyển dụng chuyên cho ngành IT Ưu điểm ITviec Hệ thống nhóm - Có xét duyệt CV ứng viên - Có hệ thống sàn lọc trước tới tay nhà tuyển dụng xếp hạng CV tự động dựa dựa vào tiểu chuẩn Itviec, tiêu chí nhà giúp nhà tuyển dụng tiếp cận tuyển dụng quan tâm, ứng viên triển vọng Qua tiết kiệm thời gian xem CV số lượng CV lớn 93 Nhược điểm - Cung cấp đánh giá công ty - Việc đăng ký tài khoản môi trường làm việc cho ứng viên tuyển dụng hồn tồn tìm nơi phù hợp miễn phí - Thời gian duyệt CV vịng - Chưa có chức đánh 12 tiếng vào ngày tuần giá công ty - Chưa hỗ trợ xếp danh sách - Số lượng lĩnh vực CV theo mức độ phù hợp với JD ngành IT hỗ trợ việc nhà tuyển dụng tìm kiếm sàn lọc, - Việc đăng ký tài khoản nhà xếp hạn chế tuyển dụng cần liên hệ với ITviec để xét duyệt Bảng 4.51: Ưu nhược điểm hệ thống so với Itviec 94 Chương KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Tổng kết Qua q trình thực đồ án, nhóm thực tìm hiểu số phương pháp tiếp cận để giải toán sàng lọc CV tự động, kiến thức xử lý ngôn ngữ tự nhiên, công việc thu thập xử lý liệu Theo mục tiêu đề ra, nhóm hồn thiện hệ thống sàng lọc CV tự động xếp hạng CV xây dựng website tuyển dụng cho phép người dùng tương tác dễ dàng với hệ thống Nhóm thực hy vọng website giúp ích cho ứng viên nhà tuyển dụng trình tối ưu hố quy trình tuyển dụng tìm việc 5.2 Ưu điểm Hồn thành u cầu đặt ban đầu, có đầy đủ tính cần thiết cho website tuyển dụng, sàng lọc CV tự động xếp hạng CV Giao diện website đơn giản, bố cục hợp lý, thân thiện với người dùng Sinh viên nắm số kiến thức xử lý ngôn ngữ tự nhiên, hiểu biết cách xây dựng website Flask Reactjs 5.3 Nhược điểm Đồ án cịn có vài hạn chế: • Chưa tối ưu code nên tốc độ phản hồi cịn chưa nhanh • Website cịn đơn giản, chưa tích hợp bước khác quy trình tuyển dụng • Khả tương tác thành viên nhóm cịn chưa tốt nên hiệu suất làm việc chưa cao 95 5.4 Hướng phát triển Vì thời gian thực đồ án khơng cho phép, tính hệ thống mức đáp ứng mục tiêu đề ban đầu Qua đó, nhóm thực đề xuất hướng phát triển cho thời gian tới sau: • Mở rộng khả crawl data thu thập nhiều liệu để làm giàu cho ontology • Thực việc làm giàu ontology cách tự động thay thủ cơng • Cải thiện hiệu suất trích xuất thơng tin từ CV • Tích hợp tồn quy trình tuyển dụng vào hệ thống: tích hợp video call để nhà tuyển dụng ứng viên vấn trực tiếp hệ thống • Tối ưu hố module trích xuất kỹ 96 TÀI LIỆU THAM KHẢO [1] Mishra, Rudresh & Rodriguez, Ricardo & Portillo, Valentin (2020) An AI based talent acquisition and benchmarking for job [2] Andreas Bogstad (2015) Topic Segmentation of Curriculum Vitae [3] Gugnani, Akshay & Misra, Hemant (2020) Implicit Skills Extraction Using Document Embedding and Its Use in Job Recommendation [4] “Word Embedding” https://towardsdatascience.com/nlp-101-word2vec-skip-gramand-cbow-93512ee24314 [5] Natalya F Noy and Deborah L McGuinness, Ontology Development 101: A Guide to Creating Your First Ontology, Stanford University, Stanford, CA, 9430, 2001 [6] Grigoris Antoniou and Frank van Harmelen, A Semantic web Primer, The MIT Press Cambridge, Massachusett, London, England, p.31-33, 2004 [7] “Khoảng cách Levenshtein” https://vi.wikipedia.org/wiki/Kho%E1%BA%A3ng_c%C3%A1ch_Levenshtein [8] “Thuật toán quy hoạch động” https://vi.wikipedia.org/wiki/Quy_ho%E1%BA%A1ch_%C4%91%E1%BB%99ng [9] P Foggia, G Percannella, and M Vento, “Graph matching and learning in pattern recognition in the last 10 years”, Int J Pattern Recognit Artif Intell., vol 28, no 1, 1450001:1–1450001:40, 2014 doi: 10.1142/ S0218001414500013 [10] “Graph edit distance” https://en.wikipedia.org/wiki/Graph_edit_distance [11] “OpenCV” https://opencv.org/about/ [12] “Tesseract” https://github.com/tesseract-ocr/tesseract [13] “CSO Classifier” https://github.com/angelosalatino/cso-classifier 97 [14] Gugnani, Akshay & Kasireddy, Vinay & Ponnalagu, Karthikeyan (2018) Generating Unified Candidate Skill Graph for Career Path Recommendation 328333 doi: 10.1109/ICDMW.2018.00054 [15] “How to use CSO Classifier in other domains” https://www.salatino.org/wp/how-touse-the-cso-classifier-in-other-domains/ [16] “ESCO” https://ec.europa.eu/esco/portal/skill [17] Le, Van-Duyet & Vo, Minh-Quan & Quang-An, Dang (2017) Skill2vec: Machine Learning Approaches for Determining the Relevant Skill from Job Description [18] “Beautiful Soup” https://www.crummy.com/software/BeautifulSoup/ [19] “Gensim” https://radimrehurek.com/gensim [20] “NetworkX” https://networkx.org/ [21] Zhang, Kaizhong & Shasha, Dennis (1989) Simple Fast Algorithms for the Editing Distance Between Trees and Related Problems SIAM J Comput 18 1245-1262 doi: 10.1137/0218082 [22] “Tree edit distance in Python” https://github.com/timtadh/zhang-shasha [23] “Restful API” https://topdev.vn/blog/restful-api-la-gi/ [24] “Đánh giá độ xác” https://machinelearningcoban.com/2017/08/31/evaluation/#-dinh-nghia [25] “n-gram” https://vi.wikipedia.org/wiki/N-gram 98 ... điểm xếp hạng CV linh động việc đánh giá ứng viên thay sử dụng cách đánh giá cố định 33 Chương CÀI ĐẶT HỆ THỐNG 4.1 Thiết kế hệ thống 4.1.1 Sơ đồ use case 4.1.1.1 Các sơ đồ use case Use case mức... xem chi tiết việc làm 36 Hình 4.6: Biểu đồ use case Xem danh sách việc làm Use case Upload sơ yếu lý lịch: • Mục đích: Ứng viên tải lên hồ sơ sơ yếu lý lịch để lưu lại • Tác nhân: Ứng viên • Mô... giải pháp để tự động trích xuất kỹ từ CV JD để từ sàng lọc xếp hạng danh sách CV ứng tuyển cho JD cụ thể Tóm lại, đồ án thực nội dung sau: • Tìm hiểu tốn so khớp, sàng lọc CV số toán liên quan