1. Trang chủ
  2. » Luận Văn - Báo Cáo

Áp dụng các kỹ thuật học máy trong việc phân loại cv ứng tuyển trong lĩnh vực cntt

65 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 65
Dung lượng 2,84 MB

Nội dung

Khóa luận tốt nghiệp NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ - - KHÓA LUẬN TỐT NGHIỆP Tên đề tài: ÁP DỤNG CÁC KỸ THUẬT HỌC MÁY TRONG VIỆC PHÂN LOẠI CV ỨNG TUYỂN TRONG LĨNH VỰC CÔNG NGHỆ THÔNG TIN Giáo viên hướng dẫn Sinh viên thực Mã sinh viên Lớp Khóa : : : : : TS Vũ Trọng Sinh Trần Thị Kiều Trang 21A4040124 K21HTTTB 2018 – 2022 Hà Nội, năm 2022 i 21A4040124 – Trần Thị Kiều Trang Tai ngay!!! Ban co the xoa dong chu nay!!! 17014129423211000000 Khóa luận tốt nghiệp NGÂN HÀNG NHÀ NƯỚC VIỆT NAM HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ - - KHĨA LUẬN TỐT NGHIỆP Tên đề tài: ÁP DỤNG CÁC KỸ THUẬT HỌC MÁY TRONG VIỆC PHÂN LOẠI CV ỨNG TUYỂN TRONG LĨNH VỰC CÔNG NGHỆ THÔNG TIN Giáo viên hướng dẫn Sinh viên thực Mã sinh viên Lớp Khóa : : : : : TS Vũ Trọng Sinh Trần Thị Kiều Trang 21A4040124 K21HTTTB 2018 – 2022 Hà Nội, năm 2022 ii 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp LỜI CẢM ƠN Chặng đường năm rèn luyện, học tập trải nghiệm môi trường Học viện Ngân hàng không dài không ngắn mốc thời gian lưu trữ nhiều kỉ niệm đẹp đáng nhớ thời sinh viên Theo dịng thời gian, em học hỏi tích lũy kiến thức quan trọng từ thầy cô bạn bè Trong suốt thời gian thực đề tài khóa luận tốt nghiệp, em nhận nhiều quan tâm, giúp đỡ nhiệt tình cán bộ, giảng viên trường Học viện Ngân hàng Với lòng biết ơn sâu sắc, em xin chân thành gửi lời cảm ơn tới cán bộ, giảng viên trường Học viện Ngân hàng đặc biệt quý Thầy cô Khoa Hệ thống thông tin quản lý – Học viện Ngân hàng tạo điều kiện, tận tình giảng dạy truyền đạt cho em kiến thức tuyệt vời làm tảng, hành trang quý báu để em bước tiếp chặng đường thử thách, khó khăn phía trước Em xin bày tỏ tri ân sâu sắc tới Tiến sĩ Vũ Trọng Sinh – Giảng viên Khoa Hệ thống thông tin quản lý quan tâm, tạo điều kiện, tận tâm hướng dẫn giúp đỡ em suốt trình thực đề tài khóa luận tốt nghiệp Bên cạnh em xin đặc biệt gửi lời cảm ơn tới quý Công ty Cổ phần Phần mềm BRAVO cho em có hội thực tập, học hỏi trải nghiệm thực tế công ty Đặc biệt, em xin gửi lời tri ân chân thành tới anh Ninh Ngọc Hiếu – Trưởng phòng số chị Nguyễn Thị Kỳ Duyên – Bộ phận Nhân – Phòng Quản lý tổng hợp anh chị công ty hỗ trợ em nhiều trình thực tập cơng ty để có kiến thức thực tế để thực đề tài Trong trình hồn thiện khóa luận tốt nghiệp với cố gắng vận dụng kiến thức tích lũy thân, giúp đỡ nhiệt tình thầy cơ, anh chị nhiều hạn chế kiến thức, lý luận kinh nghiệm thực tiễn em nên đề tài khóa luận khơng tránh khỏi nhiều thiếu sót Em mong nhận quan tâm góp ý q báu thầy cơ, anh chị để khóa luận hồn thiện Từ góp ý người, em tích lũy, học hỏi thêm nhiều kinh nghiệm để hoàn thiện kiến thức tốt vận dụng tương lai Em xin chân thành cảm ơn! iii 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp LỜI CAM KẾT Em xin cam đoan khóa luận tốt nghiệp với đề tài “Áp dụng kỹ thuật học máy việc phân loại CV ứng tuyển lĩnh vực CNTT” sản phẩm nghiên cứu, tìm hiểu riêng cá nhân em Trong tồn nội dung khóa luận, vấn đề trình bày cá nhân em tìm hiểu tự tổng hợp từ nhiều nguồn tài liệu khác có nguồn gốc trích dẫn cách rõ ràng Em xin hồn tồn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan SINH VIÊN THỰC HIỆN iv 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp MỤC LỤC LỜI CẢM ƠN iii LỜI CAM KẾT iv MỤC LỤC v DANH MỤC CHỮ VIẾT TẮT viii DANH MỤC BẢNG ix DANH MỤC HÌNH ẢNH x LỜI MỞ ĐẦU 1 Tính cấp thiết đề tài Mục đích đề tài Đối tượng phạm vi nghiên cứu Ý nghĩa đề tài Bố cục đề tài CHƯƠNG 1: GIỚI THIỆU BÀI TOÁN VÀ ĐƠN VỊ ĐANG CÔNG TÁC THỰC TẬP 1.1 Quy trình tuyển dụng vị trí cơng việc phổ biến lĩnh vực CNTT 1.1.1 Nhu cầu thực tiễn nhân lĩnh vực CNTT 1.1.2 Quy trình tuyển dụng lĩnh vực CNTT 1.1.3 Các vị trí cơng việc phổ biến lĩnh vực CNTT 1.2 Những khó khăn cho nhà tuyển dụng việc phân loại CV ứng tuyển 1.3 Nhu cầu ứng tuyển thuật toán Học máy để tự động hóa việc phân loại CV ứng tuyển 10 1.4 Tổng quan nghiên cứu 11 1.5 Công ty Cổ phần Phần mềm BRAVO thực trạng tuyển dụng vị trí CNTT 13 1.5.1 Sơ lược công ty 13 1.5.2 Thực trạng công tác tuyển dụng vị trí CNTT cơng ty 14 1.6 Kết luận 17 CáCHƯƠNG 2: CƠ SỞ LÝ THUYẾT CÁC THUẬT TOÁN HỌC MÁY CHO PHÂN LOẠI CV TỰ ĐỘNG 19 2.1 Học máy toán phân loại 19 2.1.1 Khái niệm học máy 19 2.1.2 Bài toán phân loại học máy 19 v 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp 2.1.3 Đánh giá kết phân loại 22 2.2 Các thuật tốn học máy có giám sát cho toán phân loại [14] 23 2.2.1 Phân loại liệu với định 23 2.2.2 Phân loại liệu với mạng Bayesian 23 2.2.3 Phân loại liệu với mạng neural 23 2.2.4 Phân loại liệu với k phần tử gần (k – nearest neighbor) 23 1.3 Mã hóa liệu văn 24 2.3.1 Mã hóa liệu dựa tần suất xuất từ 24 2.3.2 Mã hóa liệu dựa phương pháp học sâu 26 2.4 Kết luận 28 CHƯƠNG 3: XÂY DỰNG HỆ THỐNG THỬ NGHIỆM PHÂN LOẠI CV TRONG LĨNH VỰC CNTT BẰNG CÁC THUẬT TOÁN HỌC MÁY 29 3.1 Chuẩn bị liệu CV lĩnh vực CNTT 29 3.2 Tiền xử lý liệu 32 3.2.1 Chuyển đổi liệu từ định dạng PDF sang văn 32 3.2.2 Tổ chức liệu văn sau chuyển đổi 33 3.2.3 Xử lý liệu khuyết thiếu, liệu trùng lặp làm liệu văn 34 3.2.4 Chuẩn hóa liệu nhiễu 36 3.2.5 Chọn lọc thuộc tính quan trọng 38 3.3 Mã hóa liệu văn 38 3.3.1 Mã hóa liệu cột Jobs 38 3.3.2 Mã hóa liệu văn với thuật tốn TFIDF 39 3.4 Tách liệu 39 3.5 Xây dựng mơ hình phân loại CV 39 3.6 Đánh giá kết phân loại 41 3.7 Thực nghiệm mơ hình 46 3.7.1 Đưa file CV 46 3.7.2 Ý tưởng phát triển tích hợp mơ hình với hệ thống quản lý nhân BRAVO 46 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49 Kết đạt 49 Hạn chế 49 Hướng phát triển tương lai 49 vi 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp TÀI LIỆU THAM KHẢO 51 NHẬN XÉT CỦA ĐƠN VỊ THỰC TẬP 54 vii 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp DANH MỤC CHỮ VIẾT TẮT STT Chữ viết tắt Chú thích CNTT Cơng nghệ thông tin CV Curriculum Vitae ISO Tổ chức tiêu chuẩn quốc tế (International Organization for Standardization) TNHH Trách nhiệm hữu hạn ERP Enterprise Resource Planning CNTT Công nghệ thông tin BA Business Analyst QLKH Quản lý khách hàng CBNS Cán nhân HCNS Hành nhân 10 BRAVO Cơng ty Cổ phần Phần mềm BRAVO 11 ML Machine learning 12 AI Artificial Intelligence 13 TFIDF Term frequency inverse document frequency 14 KNN K-nearest neighbor 15 SVM Support Vector Machine viii 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp DANH MỤC BẢNG Bảng 1 Danh sách vị trí ứng tuyển BRAVO 16 Bảng Bảng mã hóa liệu văn dựa CountVectorizer 24 Bảng Xử lý giá trị nhiễu 37 Bảng Độ xác tập thử nghiệm thuật toán sử dụng 41 Bảng 3 Ý nghĩa cột 41 ix 21A4040124 – Trần Thị Kiều Trang Khóa luận tốt nghiệp DANH MỤC HÌNH ẢNH Hình 1 Lập kế hoạch tuyển dụng nhân Hình Sơ đồ cấu tổ chức công ty BRAVO 14 Hình Thống kê số lượng cần tuyển dụng quý năm 2022 BRAVO [11] 15 Hình Thống kê số lượng CV ứng tuyển thu nhận quý năm 2022 [11] 15 Hình Quy trình quản lý CV BRAVO 17 Hình Phân loại thuật tốn dựa chức [15] 21 Hình 2 Ma trận sai số - confusion matrix 22 Hình Các độ đo đánh giá hiệu kết 22 Hình Ví dụ mã hóa liệu dựa CountVectorizer 25 Hình Phương pháp Word2vec 26 Hình Phương pháp FastText 27 Hình Phương pháp Glove 27 Hình Các bước tiến hành 29 Hình CV ứng tuyển dạng pdf lưu trữ quản Excel 30 Hình 3 CV ứng tuyển qua sàng lọc lưu trữ quản lý Excel 30 Hình Các vị trí ứng tuyển tổng hợp từ liệu 31 Hình Số lượng CV tương ứng với vị trí ứng tuyển liệu 31 Hình Thực chuyển đổi PDF sang văn Module PyPDF2 32 Hình Chuyển đổi PDF sang văn sử dụng công cụ PDFelement 33 Hình Tổ chức liệu sau thực chuyển đổi PDF sang txt 34 Hình Kiểm tra xử lý liệu trùng lặp liệu 34 Hình 10 Kiểm tra xử lý liệu khuyết thiếu 35 Hình 11 Ví dụ làm liệu 35 Hình 12 Làm liệu văn 36 Hình 13 Bộ liệu chưa xử lý 36 Hình 14 Xử lý liệu nhiễu 37 Hình 15 Chọn lọc thuộc tính quan trọng liệu 38 Hình 16 Mã hóa liệu cột Jobs 38 Hình 17 Mã hóa liệu văn với thuật toán TFIDF 39 Hình 18 Chia liệu thành Train set Test set 39 Hình 19 Dùng thuật tốn kNN xây dựng mơ hình 40 Hình 20 Dùng thuật tốn SVM xây dựng mơ hình 40 Hình 21 Dùng thuật tốn Nạve Bayes xây dựng mơ hình 40 Hình 22 Dùng thuật toán Decision Tree để xây dựng mơ hình 41 Hình 23 So sánh giá trị mục tiêu đầu vào giá trị trả 42 Hình 24 Ma trận mơ hình kNN 42 Hình 25 Ma trận mơ hình SVM 43 x 21A4040124 – Trần Thị Kiều Trang

Ngày đăng: 05/12/2023, 17:07

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w