(Luận văn thạc sĩ) ứng dụng kỹ thuật logic mờ và trí tuệ nhân tạo trong đánh giá mức độ phù hợp của hồ sơ xin việc với yêu cầu công việc trên website tuyển dụng

88 4 0
(Luận văn thạc sĩ) ứng dụng kỹ thuật logic mờ và trí tuệ nhân tạo trong đánh giá mức độ phù hợp của hồ sơ xin việc với yêu cầu công việc trên website tuyển dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH CƠNG TRÌNH NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN h ỨNG DỤNG KỸ THUẬT LOGIC MỜ VÀ TRÍ TUỆ NHÂN TẠO TRONG ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA HỒ SƠ XIN VIỆC VỚI YÊU CẦU CÔNG VIỆC TRÊN WEBSITE TUYỂN DỤNG MÃ SỐ: SV2022-39 CHỦ NHIỆM ĐỀ TÀI: NGUYỄN THANH HIỀN SKC 0 8 Tp Hồ Chí Minh, tháng 11/2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN Đề Tài : Ứng dụng kỹ thuật logic mờ trí tuệ nhân tạo đánh giá mức độ phù hợp hồ sơ xin việc với yêu cầu công việc website tuyển dụng h [SV2022-39] Thuộc nhóm ngành khoa học: Kỹ thuật SV thực hiện: Nguyễn Thanh Hiền Dân tộc: Kinh Lớp, khoa: 19110CLST2, ĐT Chất Lượng Cao Ngành học: Công Nghệ Thông Tin Nam, Nữ: Năm thứ: Người hướng dẫn: TS Lê Vĩnh Thịnh TP Hồ Chí Minh, Tháng 11 Năm 2022 Nam 4/Số năm đào tạo:4 MỤC LỤC DANH MỤC BẢNG BIỂU DANH MỤC CÁC TỪ VIẾT TẮT THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI PHẦN : MỞ ĐẦU Tổng Quan Tình Hình Nghiên Cứu Lý Do Chọn Đề Tài Mục Tiêu Đề Tài Phương Pháp Nghiên Cứu Đối Tượng Và Phạm Vi Nghiên Cứu PHẦN : CƠ SỞ LÝ THUYẾT Chương : TẬP MỜ VÀ LOGIC MỜ Tập Mờ (Fuzzy Set) 1.1 Khái niệm 1.2 Các phép toán phổ biến tập mờ [2] 10 h 1.3 Độ cao, miền xác định miền tin cậy tập mờ [2] 11 1.4 Biến ngôn ngữ (Linguistic Hedges) 11 1.5 Quan hệ mờ 12 Logic mờ (Fuzzy logic) 12 2.1 Số mờ 13 2.2 Lượng từ mờ 13 2.3 Mệnh đề mờ 14 Phép toán mệnh đề mờ 14 2.4 Phép toán kéo theo mờ 14 2.5 Luật hợp thành mờ (Rule Base) 15 2.6 Mờ hóa (Fuzzifier) 16 2.7 Giải mờ (Defuzzifier) 16 Logic mờ AI 16 Ứng dụng logic mờ 16 Một số thư viện logic mờ giúp phát triển phần mềm 17 Chương : TÌM HIỂU CÁC THƯ VIỆN NHẬN DẠNG VĂN BẢN 19 NLTK 19 1.1 Khái niệm 19 1.2 Một vài cách xử lý liệu văn với NLTK 19 SPACY 20 2.1 Khái niệm 20 2.2 Một vài cách xử lý liệu văn với spaCy 21 GENSIM 22 3.1 Khái niệm 22 3.2 Biến đổi văn với Gensim 22 CORENLP 22 4.1 Khái niệm 22 4.2 Một vài cách xử lý liệu văn với CoreNLP 23 Chương : TÌM HIỂU VỀ CÁC TẬP DỮ LIỆU VỀ VĂN PHONG NGƯỜI DÙNG 25 Văn Phong Người Dùng Khi Viết CV Xin Việc 25 1.1 CV gì? 25 h 1.2 Cách viết CV hoàn chỉnh người dùng 25 Tập Dữ Liệu (Dataset) 26 2.1 Tập liệu gì? 26 2.2 Quyền sở hữu liệu 26 2.3 Cách thu thập dataset 27 Các Tập Dữ Liệu Mẫu 27 3.1 Tập Dữ Liệu Số 27 3.2 Tập Dữ Liệu Số 28 3.3 Tập Dữ Liệu Số 28 Tập Dữ Liệu Mẫu Cho Ứng Dụng 29 Chương : MẠNG NƠ RON NHÂN TẠO 30 Học sâu 30 Mạng nơ ron (neural network) 30 2.1 Mạng nơ ron gì? 30 2.2 Cách hoạt động 31 2.3 Các loại mạng nơ ron 31 Chương : CHƯƠNG TRÌNH MINH HỌA 33 Phân Tích Thiết Kế 33 1.1 ERD Diagram 33 1.2 Use Case Diagram 34 1.3 Use Case Description & Sequence Diagram 34 Cài Đặt Và Triển Khai 66 2.1 Cài Đặt Môi Trường 66 2.2 Các Bước Triển Khai Chương Trình 66 Huấn luyện liệu dự đoán tỷ lệ phù hợp với công việc 67 Tính tỷ lệ phù hợp 69 KẾT QUẢ NGHIÊN CỨU VÀ ĐÁNH GIÁ 78 PHẦN : KẾT LUẬN VÀ KIẾN NGHỊ 79 Kết Luận 79 1.1 Ưu điểm: 79 1.2 Nhược điểm: 79 h 1.3 Hướng phát triển: 79 Kiến Nghị Lĩnh Vực Nên Ứng Dụng 79 TÀI LIỆU THAM KHẢO 80 PHỤ LỤC 82 DANH MỤC BẢNG BIỂU Bảng 1: Danh mục từ viết tắt Bảng 1: Đặc tả use case đăng nhập 35 Bảng 2: Đặc tả use case đăng xuất 37 Bảng 3: Đặc tả use case đăng ký 39 Bảng 4: Đặc tả use case sữa thông tin 41 Bảng 5:Đặc tả use case đổi mật 42 Bảng 6: Đặc tả use case đăng tin tuyển dụng 44 Bảng 7: Đặc tả use case cập nhật tin tuyển dụng 46 Bảng 8: Đặc tả use case xóa tin tuyển dụng 48 Bảng 9: Đặc tả use case tìm kiếm tuyển dụng 50 Bảng 10: Đặc tả use case thêm hồ sơ 52 Bảng 11: Đặc tả use case xóa hồ sơ 54 Bảng 12: Đặc tả use case dự đốn cơng việc 55 Bảng 13: Đặc tả use case nộp hồ sơ ứng viên 57 Bảng 14: Đặc tả use case quản lý viết 59 Bảng 15: Đặc tả use case thêm ngành nghề 62 Bảng 16: Đặc tả use case cập nhật ngành nghề 64 Bảng 17: Đặc tả use case xem hồ sơ ứng viên 65 h Bảng 1: Cài đặt môi trường 66 Bảng 2: Kết nghiên cứu đánh giá 78 DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết tắt Nguyên nghĩa Tiếng Anh Nguyên nghĩa Tiếng Việt CV Curriculum Vitae Hồ sơ ứng tuyển/xin việc AI Artificial intelligence Trí tuệ nhân tạo ML Machine learning Học máy NLP Neuro Linguistic Programming Lập trình ngơn ngữ tư NLTK Natural Language Toolkit Công cụ xử lý ngôn ngữ tự nhiên IDE Integrated Development Environment Mơi trường tích hợp dùng để viết code phát triển ứng dụng ANN Artificial Neural Network Mạng thần kinh nhân tạo SNN Spiking neural network Mạng nơ-ron xoắn ốc Bảng 1: Danh mục từ viết tắt h BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI Thông tin chung: - Tên đề tài: Ứng dụng kỹ thuật logic mờ trí tuệ nhân tạo đánh giá mức độ phù hợp hồ sơ xin việc với yêu cầu công việc website tuyển dụng - Chủ nhiệm đề tài: Nguyễn Thanh Hiền - Lớp: 19110CLST2 - Thành viên đề tài: Mã số SV: 19110200 Khoa: ĐT Chất Lượng Cao Stt Họ tên MSSV Lớp Khoa Trần Văn Quang 19110271 19110CLST1 ĐT Chất Lượng Cao h - Người hướng dẫn: TS.Lê Vĩnh Thịnh Mục tiêu đề tài: Áp dụng lý thuyết logic mờ, thư viện nhận dạng văn trí tuệ nhân tạo để xây dựng ứng dụng website đánh giá mức độ phù hợp hồ sơ xin việc với cơng việc Tính sáng tạo: Ngày nay, việc sử dụng website để hỗ trợ sống khơng cịn xa lạ với người Đặc biệt, website có thơng minh có tích hợp trí tuệ nhân tạo ngày ưa chuộng Bên cạnh kỹ thuật logic mờ áp dụng vào nhiều lĩnh vực khác sống Vậy việc tạo website việc làm tích hợp logic mờ trí tuệ nhân tạo giúp ích nhiều việc xác định, tìm kiếm cơng việc, tạo cơng ăn việc làm cho nhiều người Và Việt Nam chưa có đề tài nghiên cứu thực vấn đề Từ phân tích trên, kết hợp với khảo sát website tuyển dụng khác, nhóm tiến hành nghiên cứu tạo website ứng dụng kỹ thuật logic mờ trí tuệ nhân tạo thơng qua hồ sơ xin việc đánh giá phù hợp với cơng việc Kết nghiên cứu: Hồn thành website ứng dụng kỹ thuật logic mờ trí tuệ nhân tạo có chức đánh giá mức độ phù hợp cv với công việc Hỗ trợ phía người xin việc nhà tuyển dụng Trang web có đầy đủ chức cần có website tuyển dụng h Kết trình huấn luyện học máy, tỷ lệ dự đốn xác công việc phù hợp với người xin việc đạt khoảng 71% h Sau huấn luyện tạo model, tích hợp chức trí tuệ nhân tạo vào website Từ dựa vào hồ sơ xin việc (đầu vào) đưa công việc phù hợp (đầu ra) Số phần trăm mức độ phù hợp với cơng việc Sử dụng thư viện fuzzywuzzy để hỗ trợ xây dựng chức đánh giá hồ sơ xin việc dựa kỹ thuật logic mờ Tích hợp vào website tuyển dụng phía nhà tuyển dụng để lọc hồ sơ xin việc Đưa tỷ lệ đánh giá, xếp hạng hồ sơ Tính tỷ lệ phù hợp Để so sánh hai văn tính tỷ lệ phù hợp nó: dựa vào khoảng cách Levenshtein thể khoảng cách khác biệt chuỗi ký tự [16] Khoảng cách Levenshtein hai chuỗi a,b Có biểu thức lev(a,b) tính: Khoảng cách Levenshtein chuỗi a chuỗi b số bước biến chuỗi a thành chuỗi b thơng qua phép biến đổi là: ● ● ● Xóa ký tự Thêm ký tự Thay ký tự ký tự khác h Chuỗi mờ khớp gọi khớp chuỗi gần đúng, trình tìm chuỗi gần khớp với mẫu, vấn đề tiếng xây dựng khoảng cách Levenshtein Fuzzywuzzy thư viện sử dụng khoảng cách Levenshtein, chuỗi mờ khớp để tính tốn khác biệt chuỗi mẫu phát triển SeatGeek Áp dụng vào tính tỷ lệ phù hợp hồ sơ xin việc với công việc: Thư viện Fuzzywuzzy cung cấp class FuzzySearch với phương thức tokenSetRatio() giúp tách chuỗi đầu vào cv (text) chuỗi mô tả công việc (des) thành từ (token) tính tốn giao điểm với phần lại từ hai chuỗi Đưa tỷ lệ khớp chuỗi 69 2.2.2 Giao diện Trang Đăng Nhập Cho Employee h 70 Trang Đăng Ký Cho Employee h Trang Đăng Nhập Cho Employer 71 Trang Đăng Ký Cho Employer h Trang Đăng Nhập Cho Administrator 72 Trang chủ cho Employee Trang thông tin Employee h 73 Trang cập nhật thông tin Employee h Giao diện Upload Cv cho Employee 74 Giao diện hiển thị chi tiết viết - employee Giao diện hiển thị kết dự đoán CV - employee h 75 Trang chủ cho Employer Trang quản lý viết cho employer h 76 Các CV apply vào đăng h 77 KẾT QUẢ NGHIÊN CỨU VÀ ĐÁNH GIÁ STT Nội dung thực Kết nghiên cứu Đánh giá Tìm hiểu logic mờ Lý thuyết logic mờ Hồn Thành Tìm hiểu thư viện nhận Lý thuyết thư viện nhận Hoàn Thành diện văn dạng văn phổ biến Tìm hiểu tập liệu Tập liệu mẫu cho ứng dụng văn phong người dùng Viết chương trình ứng dụng Website tuyển dụng tích hợp Hồn Thành minh họa lọc CV h Bảng 2: Kết nghiên cứu đánh giá 78 Hoàn Thành PHẦN : KẾT LUẬN VÀ KIẾN NGHỊ Kết Luận - Kết nghiên cứu có ý nghĩa quan trọng làm sáng tỏ quan điểm logic mờ, công dụng thư viện nhận dạng văn trí tuệ nhân tạo máy học từ vận dụng vào thực tiễn đời sống, đem công nghệ vào hỗ trợ tìm việc, tìm nhân giải cho vấn đề nhức nhối việc làm tuyển dụng nước ta nói chung, trường đại học cơng ty nói riêng 1.1 Ưu điểm: - Đáp ứng mục tiêu đề tài nghiên cứu - Xây dựng thành cơng chương trình minh họa - Đã tích hợp trí tuệ nhân tạo logic mờ đánh giá mức độ phù hợp công việc - Sử dụng công nghệ thư viện phổ biến 1.2 Nhược điểm: Không tìm hiểu hết tất thư viện nhận dạng văn tìm hiểu khơng hết tất ưu điểm h - - Tập liệu chưa thật tốt phong phú cho việc huấn luyện học máy - Giao diện ứng dụng minh họa chưa đẹp mắt 1.3 Hướng phát triển: - Cải tiến giao diện, xây dựng thêm chức cho ứng dụng minh họa - Nâng cấp ứng dụng trí tuệ nhân tạo, phân tích tính cách người tìm việc thông qua CV Kiến Nghị Lĩnh Vực Nên Ứng Dụng Kiến nghị ứng dụng vào lĩnh vực “tuyển dụng” hay “trí tuệ nhân tạo” 79 TÀI LIỆU THAM KHẢO [1] Nguyễn Cát Hồ Nguyễn Cơng Hào, Giáo trình “Logic mờ ứng dụng”, ĐH Huế, năm 2009 Available online: https://www.academia.edu/5562699/Giao_trinh_logic_mo_va_ung_dung [2] Nguyễn Đức Hiễn-Hồng Đình Cơ, Tài liệu học tập “Điều khiển mờ mạng nơron”, ĐH Kinh Tế-Kỹ Thuật Công Nghiệp, năm 2019 Available online: https://khoadien.uneti.edu.vn/wp-content/uploads/2019/12/TLHT_-Dieu-khien-mo-vamang-noron.pdf [3] Nguyễn Việt Hùng, Nguyễn Tấn Đời, Trương Ngọc Anh Tạ Văn Phương, Bài giảng “Điều Khiển Thông Minh”, ĐH Sư Phạm Kỹ Thuật, năm 2008 Available online: http://cyu.hcmute.edu.vn/Resources/Docs/SubDomain/cyu/%C4%90I%E1%BB%80U%2 0KHI%E1%BB%82N%20TH%C3%94NG%20MINH.pdf [4] Rodney Carlos Bassanezi, A First Course in Fuzzy Logic, Fuzzy Dynamical Systems, and Biomathematics: Theory and Applications, 2017 Available online: h https://www.pdfdrive.com/a-first-course-in-fuzzy-logic-fuzzy-dynamical-systems-andbiomathematics-theory-and-applications-e158076248.html [5] Đỗ Đăng Hùng, Tiền xử lý liệu văn với NLTK, 14/09/2021 Retrieved from https://viblo.asia/p/tien-xu-li-du-lieu-van-ban-voi-nltk-Az45b0LgZxY [6] Spacy documentation Available online: https://spacy.io/ [7] Giới thiệu Gensim Available online: https://tek4.vn/khoa-hoc/tong-quan-ve-xu-ly-ngon-ngu-tu-nhien/gioi-thieu-ve-gensim [8] CoreNLP documentation Available online: https://stanfordnlp.github.io/CoreNLP/annotators.html [9] Cách viết cv tiếng anh chuyên nghiệp Available online: https://www.vietnamworks.com/hrinsider/cach-viet-cv-bang-tieng-anh-chuyen-nghiep [10] Đinh Hoàng,Dataset sức mạnh Data Science, 27/05/2022 Available online: 80 https://viblo.asia/p/dataset-suc-manh-cua-data-science-data-science-seriesgAm5yEYO5db [11] Xuân Hiệp,Tổng hợp nguồn datasets dành cho machine learning, 05/10/2021 Available online: https://itguru.vn/blog/tong-hop-nhung-nguon-datasets-danh-chomachine-learning [12] Sneha Bhawan, Resume Dataset, 2021 Available online: https://www.kaggle.com/datasets/snehaanbhawal/resume-dataset [13] Gaurav Dutta, Resume Dataset, 2020 Available online: https://www.kaggle.com/datasets/gauravduttakiit/resume-dataset [14] Wahib Mzali, Resume Dataset, 2022 Available online: https://www.kaggle.com/datasets/wahib04/multilabel-resume-dataset [15] Hướng dẫn best string matching algorithm python - thuật toán khớp chuỗi tốt python Available online: https://biquyetxaynha.com/huong-dan-best-string-matching-algorithm-python-thuat-toan- h khop-chuoi-tot-nhat-python [16] Keras documentation Available online: https://keras.io/ [17] IBM documentation Available online: www.ibm.com/cloud/learn 81 PHỤ LỤC Source code : https://drive.google.com/file/d/1UMlpB340Zv8KykgxVL5wSmflpcVolzNm/view?usp=s haring h 82 h

Ngày đăng: 06/11/2023, 05:11

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan