1. Trang chủ
  2. » Công Nghệ Thông Tin

Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng

57 294 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 57
Dung lượng 3,39 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - PHẠM VĂN HIẾU TÌM KIẾM CV TƯƠNG ỨNG VỚI YÊU CẦU TUYỂN DỤNG Chuyên ngành : KĨ THUẬT MÁY TÍNH VÀ TRUYỀN THÔNG LUẬN VĂN THẠC SĨ KỸ THUẬT CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC : TS.TRỊNH ANH PHÚC Hà Nội – Năm 2015 LỜI CẢM ƠN Đầu tiên, muốn gửi lời biết ơn chân thành tới TS Trịnh Anh Phúc, người trực tiếp hướng dẫn giúp đỡ tận tình cho kiến thức, định hướng tài liệu tham khảo quý báu Tiếp theo, xin cảm ơn thầy cô Viện Công nghệ thông tin Truyền thông – Đại học Bách khoa Hà Nội giảng dạy, truyền đạt kiến thức cho suốt thời gian qua Tôi xin cảm ơn gia đình, bạn bè chia sẻ, giúp đỡ học tập thời gian thực nghiên cứu đề tài Trong luận văn chắn không tránh khỏi chỗ thiếu sót, mong nhận lời góp ý, bảo từ thầy cô để hoàn thiện đề tài tốt Hà Nội, ngày 20 tháng 10 năm 2015 Người thực Phạm Văn Hiếu LỜI CAM ĐOAN Luận văn Thạc sĩ “Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng” công trình cá nhân Các nội dung nghiên cứu kết trình bày luận văn trung thực rõ ràng Các tài liệu tham khảo nội dung trích dẫn ghi rõ nguồn gốc Hà Nội, ngày 20 tháng 10 năm 2015 Người thực Phạm Văn Hiếu DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT Chữ viết tắt Tiếng Anh Tiếng Việt CV Cirriculum vitae Đơn xin việc SVM Support Vector Machine Máy véc tơ hỗ trợ TF Term Frequency Tần số xuất OAR One Against Rest Một với tất OAO One Against One Một với DANH MỤC CÁC HÌNH VẼ Hình 1.1 Đơn xin việc mẫu .13 Hình 1.2 Sơ đồ thành phần toán phân loại đơn xin việc .15 Hình 2.1 Minh hoạ cách đọc liệu từ tập tin pdf dùng Apache Tika .17 Hình 2.2 Kiến trúc thư viện Apache Tika 18 Hình 3.1 Minh hoạ toán phân lớp tổng quát .24 Hình 3.2 Phân lớp tuyến tính không gian hai chiều 26 Hình 3.3 Lề lớn tính toán SVMs tuyến tính 27 Hình 3.4 Minh hoạ lựa chọn C phân lớp tuyến tính 31 Hình 3.5 Mức độ tác động nhân đa thức 33 Hình 3.6 Ảnh hưởng số chiều nhân Gaussian 34 Hình 3.7 Ví dụ phân lớp sử dụng chiến lược OAR 35 Hình 3.8 Ví dụ phân lớp sử dụng chiến lược OAO 36 Hình 4.1 Danh sách CV mẫu 40 Hình 4.2 Mẫu đơn xin việc trước tiền xử lý 41 Hình 4.3 Thông tin đơn xin việc trích rút 42 Hình 4.4 Một đoạn liệu từ điển 43 Hình 4.5 Minh hoạ véc tơ đặc trưng theo tần số xuất từ 44 Hình 4.6 Minh hoạ véc tơ đặc trưng theo công thức TFIDF 45 Hình 4.7 Minh hoạ véc tơ đặc trưng theo Okapi BM25 46 Hình 4.8 Ví dụ đơn xin việc bị phân lớp sai .50 Hình 4.9 Dữ liệu sau tiền xử lý đơn xin việc bị phân loại sai 51 DANH MỤC CÁC BẢNG Bảng 2.1 Một số từ dừng văn tiếng Việt 20 Bảng 4.2 Ví dụ việc gán nhãn cho CV .48 Bảng 4.3 Kết phân loại .49 MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC BẢNG MỞ ĐẦU Lý chọn đề tài Mục đích nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Bố cục luận văn 10 CHƯƠNG : Tổng quan toán phân loại đơn xin việc 11 1.1 Quy trình tiếp nhận đơn xin việc thông thường 11 1.2 Định nghĩa toán phân loại tự động đơn xin việc 14 1.3 Mô hình toán phân loại tự động đơn xin việc 15 1.3.1 Thu thập liệu đơn xin việc 15 1.3.2 Bước tiền xử lý 16 1.3.3 Bước phân loại 16 CHƯƠNG : Các phương pháp tiền xử lý đơn xin việc 17 2.1 Trích rút thông tin 17 2.1.1 Đọc thông tin 17 2.1.2 Giới thiệu thư viện Apache Tika 17 2.1.3 Mô hình kiến trúc mức ứng dụng thư viện Apache Tika 18 2.2 Tách từ xây dựng từ điển 19 2.2.1 Tách từ 19 2.2.2 Loại bỏ từ dừng 19 2.2.3 Xây dựng từ điển 20 2.3 Mô hình hoá không gian véc tơ 21 2.3.1 Phương pháp dựa xuất từ khóa 21 2.3.2 Phương pháp dựa tần số xuất 21 2.3.3 Phương pháp TFIDF 22 2.3.4 Okapi BM25 23 CHƯƠNG : Phương pháp phân lớp SVM 24 3.1 Bài toán phân lớp tổng quát 24 3.2 Khái niệm SVM 25 3.3 SVM cho toán phân lớp tuyến tính 26 3.4 SVM cho toán phi tuyến 31 3.5 Phân loại đa lớp 34 3.5.1 Chiến lược One-against-Rest (OAR) 34 3.5.2 Chiến lược One-against-One (OAO) 35 3.6 Giới thiệu thư viện LibSVM 37 3.7 Quá trình sử dụng LibSVM 38 CHƯƠNG : Chương trình thực nghiệm 40 4.1 Dữ liệu thử nghiệm 40 4.2 Giai đoạn tiền xử lý 41 4.2.1 Xây dựng từ điển 41 4.2.2 Mô hình hoá véc tơ 43 4.3 Giai đoạn phân loại 46 4.4 Kết phân loại 48 4.4.1 Kết thực nghiệm 48 4.4.2 Đánh giá trường hợp phân lớp sai 50 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 53 TÀI LIỆU THAM KHẢO 55 MỞ ĐẦU Lý chọn đề tài Tháng 12/2014, theo công bố Tổng cục Thống kê (GSO) Quỹ Dân số Liên hợp quốc (UNFPA) Việt Nam, dân số Việt Nam đạt gần 90,5 triệu người Theo tính toán Quỹ Dân số Liên hiệp quốc, đến kỷ XXI, dân số Việt Nam đạt ngưỡng 100 triệu người Dân số Việt Nam trải qua thời kỳ “dân số vàng” với khoảng nửa dân số độ tuổi lao động 34 tuổi Với lợi từ cấu dân số mang lại, Việt Nam đánh giá nước có thị trường nhân lực dồi với chất lượng ngày nâng cao Bên cạnh đó, Việt Nam nước bật trình đổi tăng trưởng kinh tế khu vực Đông Nam Á Sau 20 năm mở cửa, Việt Nam thu hút nhiều tập đoàn lớn tham gia đầu tư kinh doanh Cùng với đó, nhiều kĩ thuật công nghệ tiên tiến giới chuyển giao cho Việt Nam Trong đó, công nghệ thông tin lĩnh vực bật với tốc độ phát triển nhanh chóng Tại khu vực thành thị, số lượng người truy cập Internet chiếm khoảng 50% dân số Tại hai thành phố lớn Hà Nội TP.HCM, tỷ lệ cao nhiều lần với hai phần ba dân số sử dụng Internet ngày thời gian sử dụng internet tháng gần 50 Việt Nam xu hướng phát triển bước áp dụng công nghệ thông tin vào nhiều ngành nghề, lĩnh vực Trong đó, lĩnh vực tuyển dụng điển hình Hiện nay, hình thức tuyển dụng việc làm truyền thống dần thay hình thức tuyển dụng trực tuyến Hiện nay, người lao động việc viết đơn xin việc giấy, họ thực số hóa đơn xin việc để lưu trữ máy tính truyền tải mạng Về phía nhà tuyển dụng, việc đăng tải thông tin tuyển dụng trang web trực tuyến giúp quảng bá thông tin việc làm đến nhiều người tìm việc nhanh hiệu Ở thành phố lớn nước ta, hình thức tuyển dụng trực tuyến dần phổ biến giúp trình tuyển dụng đơn giản Tuy nhiên, với thời gian số lượng người sử dụng hình thức tuyển dụng trực tuyến tăng, số lượng đơn xin việc nhà tuyển dụng nhận ngày nhiều đến thời điểm số lượng đơn xin việc vượt khả xử lý Do đó, để tìm kiếm đơn xin việc phù hợp với yêu cầu vị trí công việc đó, việc tìm kiếm, chọn lọc phân loại đơn xin việc tốn nhiều thời gian mang lại hiệu thấp Từ thực tế đó, nhà tuyển dụng có nhu cầu xây dựng hệ thống phân loại tự động đơn xin việc tương ứng với yêu cầu tiêu chí công việc Từ nhu cầu trên, luận văn nghiên cứu, tìm hiểu xây dựng giải pháp thực nghiệm để giải toán tìm kiếm phân loại đơn xin việc theo yêu cầu tuyển dụng Mục đích nghiên cứu Trong lĩnh vực tuyển dụng, việc áp dụng phân loại tự động đơn xin việc người tìm việc giúp giảm thời, tiết kiệm chi phí nhân lực nhà tuyển dụng Vì vậy, luận văn tìm hiểu phương pháp tiền xử lý văn lý thuyết mô hình học máy thống kê, đồng thời áp dụng mô hình học máy thống kê vào việc phân loại tự động đơn xin việc Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu luận văn đơn xin việc số hoá với nhiều định dạng biểu mẫu liệu khác Phạm vi nghiên cứu luận văn : - Nghiên cứu phương pháp trích rút thông tin tiền xử lý liệu từ tệp liệu có định dạng khác - Nghiên cứu số phương pháp mô hình hoá liệu sang không gian véc tơ - Nghiên cứu đưa vào ứng dụng việc phân loại đơn xin việc phương pháp máy véc tơ hỗ trợ - Đánh giá kết hiệu việc giải toán phân loại tự động đơn xin việc phương pháp học máy thống kê Phương pháp nghiên cứu Sau sử dụng thư viện Apache Tika để đưa liệu đơn xin việc chuẩn liệu chung, với đơn xin việc, nội dung chia tách thành nhiều từ đơn dựa khoảng trắng từ Với mẫu đơn xin việc hình 4.3, sau thực việc đọc liệu loại bỏ kí tự không mang ý nghĩa (dấu chấm, dấu hỏi), liệu thu gồm 522 từ đơn sau: Hình 4.3 Thông tin đơn xin việc trích rút Sau đó, từ tập hợp xây dựng thành từ điển chung cho toàn đơn xin việc thu thập Với số lượng 100 đơn xin việc, từ điển thu gồm 4848 từ Sau hình ảnh đoạn liệu từ điển 42 Hình 4.4 Một đoạn liệu từ điển 4.2.2 Mô hình hoá véc tơ Trong bước này, cách áp dụng phương pháp mô hình hoá véc tơ trình bày chương để thu véc tơ đặc trưng cho đơn xin việc Với phương pháp trích chọn đặc trưng, kết thu 100 véc tơ đặc trừng cho 100 đơn xin việc đầu vào Ø Mô hình hoá theo xuất từ Trọng số từ véc tơ chi có hai giá trị Giá trị thể từ có xuất đơn xin việc kiểm tra ngược lại nhận giá trị tương ứng từ không xuất 43 Với đơn xin việc hình 4.2 phía trên, véc tơ đặc trưng thu gồm 522 chiều có giá trị tổng số 4848 chiều Ø Mô hình hoá theo tần suất xuất từ (TF): Hình 4.5 Minh hoạ véc tơ đặc trưng theo tần số xuất từ Trong hình 4.5, trục hoành biểu diễn chiều véc tơ trục tung biểu diễn giá trị trọng số khác không chiều véc tơ Bằng việc mô hình hoá véc tơ theo tuần suất xuất hiện, véc tơ biểu diên hình 4.5 có phần lớn chiều có giá trị trọng số nằm khoảng từ đến Ngoài có số chiều có giá trị trọng số nằm khoảng từ 12 đến 27 Số lượng chiều có giá trị trọng số 30 chiếm tỷ lệ nhỏ Đơn xin việc có véc tơ đặc trưng biểu diễn hình 4.5 gồm phần lớn từ có số lần xuất ( từ đến lần) Tuy nhiên, có số lượng từ xuất với tần số lớn ( 30 lần) tỉ lệ từ đơn xin việc chiếm phần nhỏ 44 Ø Mô hình hoá theo TFIDF Hình 4.6 Minh hoạ véc tơ đặc trưng theo công thức TFIDF Trong hình 4.6, véc tơ đặc trưng có 460 chiều với giá trị trọng số biểu diễn từ 0.5 đến 13.8 Các từ có trọng số TFIDF[9] cao từ xuất nhiều đơn xin việc xuất đơn xin việc khác Ø Mô hình hoá theo Okapi BM25 45 Hình 4.7 Minh hoạ véc tơ đặc trưng theo Okapi BM25 Trong hình 4.7, véc tơ đặc trưng biểu diễn gồm 460 chiều có giá trị trọng số Okapi BM25[11] từ -113 đến 12.5 Một số chiều véc tơ có trọng số mang giá trị âm biểu thị từ tương ứng với chiều xuất nhiều tập đơn xin việc 4.3 Giai đoạn phân loại Bài toàn phân loại đơn xin việc luận văn dựa hai thuộc tính: - Kinh nghiệm : có không - Trình độ học vấn: đại học, cao đẳng trình độ khác Từ đó, phân chia thành lớp tương ứng với nhãn khác có giá trị từ đến theo bảng sau : 46 Kinh nghiệm Trình độ học vấn Nhãn Không Khác Không Cao đẳng Không Đại học Có Khác Có Cao đẳng Có Đại học Bảng 4.1 Đặt tên nhãn theo thuộc tính Quá trình gán nhãn cho đơn xin việc thực thủ công dựa cảm quan người tuyển dụng công ty để xác định đơn xin việc có tương ứng với nhãn Sau bảng gán nhãn cho 100 đơn xin việc thử nghiệm : 47 Bảng 4.2 Ví dụ việc gán nhãn cho CV 4.4 Kết phân loại 4.4.1 Kết thực nghiệm Chương trình thực phân loại theo tỉ lệ số lượng đơn xin việc dùng cho huấn luyện kiểm thử : - Tỉ lệ thứ nhất: 75 đơn xin việc cho huấn luyện 25 đơn xin việc cho kiểm thử 48 - Tỉ lệ thứ hai: 80 đơn xin việc cho huấn luyện 20 đơn xin việc cho kiểm thử Trong trình sử dụng thư viện LibSVM, tác giả chạy thử nghiệm chương trình với loại nhân phân loại: - Tuyến tính - Đa thức - RBF - Sigmoid Kết hợp với liệu tiền xử lý mô hình hoá theo loại phần trước, tác giả thu bảng kết chạy thử nghiệm sau đây: Bảng 4.3 Kết phân loại Theo bảng kết phân loại phía trên, việc phân loại sử dụng tỉ lệ đơn xin việc thứ hai (80 đơn xin việc cho trình huấn luyện 20 đơn xin việc để kiểm thử) cho kết phân loại tốt phân loại sử dụng tỉ lệ đơn xin việc thứ Trong phương pháp biểu diễn véc tơ không gian, phương pháp biểu diễn công thức TFIDF cho kết tốt phương pháp lại Trong hình 4.2, ta thấy kết phân loại sử dụng thư viện LibSVM với nhân (tuyến tính, đa thức, RBF, Sigmoid) đạt 50% Đặc biệt sử dụng nhân Sigmoid với phương pháp biểu diễn véc tơ TFIDF, kết thu 70% Đây kết phân loại cao tốt cho toán phân loại tự động đơn xin việc thực tế 49 4.4.2 Đánh giá trường hợp phân lớp sai Tuy nhiên, kết phân loại cho thấy số trường hợp, máy học cho kết phân lớp bị sai so với thực tế kiểm tra Sau đây, xét đến trường hợp đơn xin việc bị phân lớp sai Hình 4.8 Ví dụ đơn xin việc bị phân lớp sai 50 Sau trình tiền xử lý, đơn xin việc hình 4.8 phân tách thành từ đơn hình sau Hình 4.9 Dữ liệu sau tiền xử lý đơn xin việc bị phân loại sai Trong đơn xin việc bị phân loại sai hình 4.8, ta thấy thông tin người tìm việc sau: - Trình độ học vấn : đại học - Kinh nghiệm làm việc: chưa có kinh nghiệm, sinh viên trường Theo bảng 4.1 quy định đánh nhãn với thông tin trên, đơn xin việc hình 4.8 đánh nhãn Tuy nhiên trình phân lớp, đơn xin việc xếp vào lớp mang nhãn ( trình độ học vấn đại học có kinh nghiệm làm việc) Theo hình 4.9, thấy thông tin trường mà người tìm việc học Cụ thể đại học Thuỷ lợi Từ phán định người tìm việc có trình độ học vấn bậc đại học Với kĩ chuyên môn, người tìm việc có thông tin ngôn ngữ lập trình, công nghệ sử dụng Các thông tin gần giống với thông tin người tìm việc có kinh nghiệm làm việc thực tế Vì thế, trình học máy, máy học có nhầm lẫn xếp người tìm việc vào lớp có trình độ kinh nghiệm làm việc Ngoài ra, phân lớp bị sai trường hợp việc tạo siêu phẳng phân lớp không xác Do số 100 đơn xin việc đầu vào chương trình, số lượng đơn xin việc đánh nhãn chiếm số lượng lớn, khoảng 60% tổng số lượng đơn xin việc Vì vậy, xây dựng siêu phẳng để phân lớp, máy học dựa véc tơ đặc trưng đơn xin việc chiếm số lượng lớn 51 Do đó, phân lớp, đơn xin việc thường xếp vào lớp có số lượng đơn xin việc chiếm đa số Đây tượng cân tập mẫu trình học máy sử dụng SVM để phân lớp 52 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN A Kết luận Luận văn tốt nghiệp tác giả với đề tài: “Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng” hoàn thành Đề tài giải vấn đề sau: Tìm hiểu định nghĩa toán phân lớp tự động đơn xin việc xây dựng mô hình toán phân lớp áp dụng lý thuyết học máy Tìm hiểu phương pháp tiền xử lý đơn xin việc mô hình hoá đơn xin việc sang dạng không gian véc tơ số có chiều tương ứng với từ Giải toán phân lớp đa lớp đơn xin việc việc áp dụng phương pháp phân lớp SVM thư viện LibSVM Các kết đạt luận văn: Tác giả sưu tầm khoảng 100 đơn xin việc đơn xin việc ứng cử viên lĩnh vực phần mềm thuộc nhiều định dạng, có nội dung biểu mẫu đa dạng Tác giả sử dụng thư viện Apache Tika để lập trình tự động tách từ tạo từ điển dựa tập từ thuộc đơn xin việc Sau đó, tác giả mô hình hoá đơn xin việc thành véc tơ số có trọng số theo công thức TF, TFIDF Okapi Luận văn tiếp tục với phương pháp học máy thông kê SVM để phân lớp tự động đơn xin việc không gian véc tơ số Trong phần thực nghiệm, luận văn đưa bảng tỉ lệ phân lớp theo phương pháp tiền xử lý nhân SVM khác Ngoài ra, tác giả giải thích phần lý trường hợp bị dự đoán sai 53 Những khó khăn hướng giải Những khó khăn gặp phải trình thực đề tài: - Các đơn xin có nhiều định dạng biểu mẫu khác nên gặp khó khăn việc trích rút thông tin xác, loại bỏ thông tin không cần thiết cho trình phân lớp - Tỉ lệ số lượng đơn xin việc lớp khác không đồng Vì kết phân lớp chưa đạt độ xác cao Hướng giải quyết: - Bổ sung thêm thuật toán để trích rút thông tin hiệu xác - Tăng số lượng đơn xin việc thực nghiệm tỉ lệ số lượng đơn xin việc theo lớp khác có tương đồng Từ giúp việc xây dựng siêu phẳng để phân lớp có độ xác cao Các kết nghiên cứu lí luận thực tiễn cho thấy việc áp dụng phương pháp học máy để giải toán phân lớp tự động đơn xin việc bước đầu đạt tín hiệu tích cực Kết phân lớp đạt độ xác cao khoảng 70% với số lượng 100 đơn xin việc B Hướng phát triển đề tài Do điều kiện cá nhân hạn chế, nên vấn đề nghiên cứu toán phân lớp tự động đơn xin việc theo nhu cầu tuyển dụng khuôn khổ luận văn dừng lại nghiên cứu ban đầu Vì vậy, nghiên cứu vấn đề tập trung triển khai theo hướng sau: - Nghiên cứu giải toán phân lớp tự động đơn xin việc có nội dung bao gồm hình ảnh - Nghiên cứu phương pháp để mô hình hoá liệu sang không gian véc tơ số - Nghiên cứu vấn đề cân phân lớp sử dụng phương pháp phân lớp SVM 54 TÀI LIỆU THAM KHẢO Phan Thị Thu Hồng, Đoàn Thị Thu Hà, Nguyễn Thị Thuỷ(2013), “Ứng dụng phân lớp ảnh chụp phương pháp máy véc tơ hỗ trợ”, Tạp chí khoa học Phát triển, 11(7), 1045-1052 Trần Cao Đệ, Phạm Nguyên Khang(2012), “Phân loại văn với máy học véc tơ hỗ trợ định”, Tạp chí Khoa học, (21a), 52-63 Alberto Tellaechea, Xavier P Burgos-Artizzub, Gonzalo Pajaresa, Angela Ribeirob(2008), “Avision-basedmethod forweeds identification through the Bayesian decision theory”, Pattern Recognition, 41, 521-530 Chang C, C-J.Lin(2011), “LIBSVM: A library for support vector machines”, ACM Transactions on Intelligent Systems and Technology, 2(27), 1-27 Chris Mattmann, Jukka L Zitting(2011), Tika in Action, Manning Publications, USA Christopher M.Bishop(2006), Pattern Recognition and Machine Learning, Springer-Verlag, New York, USA Cristianini Nello, Shawe-Taylor John(2000), An Introduction to Support Vector Machines and other nhân-based learning method, Cambridge University Press John Shafer, Rakesh Agrawal, Manish Mehta(1996), SPRINT- A Scalable Paralllel Classifier for Data mining, In Predeeings of the 22nd International Conference on Very Large Database, India Gerard Salton, Michael J.McGill(1986), Introduction to Modern Information Retrieval, Mc Graw-Hill, Inc New York, NY, USA 10 Liao K., Paulsen M R., Reid J F., et al(1994), “Corn nhân breakage classification by machine vision using a neutral network classifier”, Transactions of the ASAE, 36(6), 1949-1953 11 Stephen E Robertson, Steve Walker, Susan Jones, Micheline HancockBeaulieu, and Mike Gatford(1994), Okapi at TREC-3, Proceedings of the Third Text REtrieval Conference, Gaithersburg, USA 55 12 Vladimir N.Vapnik (1995) The nature of statistical learning theory, SpringerVerlag, New York, USA 56 ... xin việc tương ứng với yêu cầu tiêu chí công việc Từ nhu cầu trên, luận văn nghiên cứu, tìm hiểu xây dựng giải pháp thực nghiệm để giải toán tìm kiếm phân loại đơn xin việc theo yêu cầu tuyển dụng.. . để tìm kiếm đơn xin việc phù hợp với yêu cầu vị trí công việc đó, việc tìm kiếm, chọn lọc phân loại đơn xin việc tốn nhiều thời gian mang lại hiệu thấp Từ thực tế đó, nhà tuyển dụng có nhu cầu. .. ngày 20 tháng 10 năm 2015 Người thực Phạm Văn Hiếu LỜI CAM ĐOAN Luận văn Thạc sĩ Tìm kiếm CVs tương ứng với yêu cầu tuyển dụng” công trình cá nhân Các nội dung nghiên cứu kết trình bày luận văn

Ngày đăng: 26/07/2017, 21:05

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Phan Thị Thu Hồng, Đoàn Thị Thu Hà, Nguyễn Thị Thuỷ(2013), “Ứng dụng phân lớp ảnh chụp lá cây bằng phương pháp máy véc tơ hỗ trợ”, Tạp chí khoa học và Phát triển, 11(7), 1045-1052 Sách, tạp chí
Tiêu đề: Ứng dụng phân lớp ảnh chụp lá cây bằng phương pháp máy véc tơ hỗ trợ
Tác giả: Phan Thị Thu Hồng, Đoàn Thị Thu Hà, Nguyễn Thị Thuỷ
Năm: 2013
2. Trần Cao Đệ, Phạm Nguyên Khang(2012), “Phân loại văn bản với máy học véc tơ hỗ trợ và cây quyết định”, Tạp chí Khoa học, (21a), 52-63 Sách, tạp chí
Tiêu đề: Phân loại văn bản với máy học véc tơ hỗ trợ và cây quyết định
Tác giả: Trần Cao Đệ, Phạm Nguyên Khang
Năm: 2012
3. Alberto Tellaechea, Xavier P . Burgos-Artizzub, Gonzalo Pajaresa, Angela Ribeirob(2008), “Avision-basedmethod forweeds identification through the Bayesian decision theory”, Pattern Recognition, 41, 521-530 Sách, tạp chí
Tiêu đề: Avision-basedmethod forweeds identification through the Bayesian decision theory
Tác giả: Alberto Tellaechea, Xavier P . Burgos-Artizzub, Gonzalo Pajaresa, Angela Ribeirob
Năm: 2008
4. Chang C, C-J.Lin(2011), “LIBSVM: A library for support vector machines”, ACM Transactions on Intelligent Systems and Technology, 2(27), 1-27 Sách, tạp chí
Tiêu đề: LIBSVM: A library for support vector machines
Tác giả: Chang C, C-J.Lin
Năm: 2011
10. Liao K., Paulsen M. R., Reid J. F., et al(1994), “Corn nhân breakage classification by machine vision using a neutral network classifier”, Transactions of the ASAE, 36(6), 1949-1953 Sách, tạp chí
Tiêu đề: Corn nhân breakage classification by machine vision using a neutral network classifier
Tác giả: Liao K., Paulsen M. R., Reid J. F., et al
Năm: 1994
5. Chris Mattmann, Jukka L. Zitting(2011), Tika in Action, Manning Publications, USA Khác
6. Christopher M.Bishop(2006), Pattern Recognition and Machine Learning, Springer-Verlag, New York, USA Khác
7. Cristianini Nello, Shawe-Taylor John(2000), An Introduction to Support Vector Machines and other nhân-based learning method,. Cambridge University Press Khác
8. John Shafer, Rakesh Agrawal, Manish Mehta(1996), SPRINT- A Scalable Paralllel Classifier for Data mining, In Predeeings of the 22nd International Conference on Very Large Database, India Khác
9. Gerard Salton, Michael J.McGill(1986), Introduction to Modern Information Retrieval, Mc Graw-Hill, Inc. New York, NY, USA Khác
11. Stephen E. Robertson, Steve Walker, Susan Jones, Micheline Hancock- Beaulieu, and Mike Gatford(1994), Okapi at TREC-3, Proceedings of the Third Text REtrieval Conference, Gaithersburg, USA Khác

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w