Dé tài dap ứng các chức năng cơ bản cân có của một website vê việc làm hiện nay, ngoài ra còn bô sung hệ khuyên nghị đê đưa ra gợi ý việc lam , giúp cho người tìm việc có thê tìm được cô
Màn hình đăng nhập dành cho nhà tuyển dụng
Dành cho nhà tuyển dụng @ Ung viên đăng nhập
CỔNG THÔNG TIN VIỆC LÀM
TRANG CHỦ TÌM VIỆC LAM + CÔNG TY TÌM ỨNG VIÊN ĐANG TUYỂN DỤNG LIÊN HỆ Đăng nhập
‘a0 mới một tài khoản đăng nhập
Hình 3-16: Màn hình đăng nhập dành cho nhà tuyên dụng
Xây dung website tìm kiếm và tuyến dụng việc làm
Bảng 3-19: Mô tả màn hình đăng nhập dành cho nhà tuyển dụng
Màn hình đăng nhập dành cho quản tri viên
Hình 3-17: Màn hình đăng nhập dành cho quản trị viên Bảng 3-20: Mô tả màn hình đăng nhập dành cho quản tri viên
1 Form điển tên đăng nhập va mật khâu
Xây dựng website tìm kiếm và tuyển dụng việc làm
3.6.3 Màn hình chỉ tiết công việc đang tuyển dụng
Mã công việc - 1 + Số lượng nhân viên cần tuyển : 6 (người) Loại ngành nghệ : DétMay-Daciay + Thời hạn tuyển dụng - 29/01/2021 ( côn 12 ngây ty Hình thức làm việc - Việc làm theo ca, đổi ca + Giới tính yêu cầu : Nam
Mức lượng : § - 7 triệu (VNĐAháng) Địa điểm làm việc
Yeu câu công việc : Đô tuổi từ 30-40 =
Trinh đội Kinh nghiệm làm việc = 1
Kinh nghiệm:1 - 2 năm kinh nghiệm Yeu cầu bằng cép:Trung cáp trở lên.
Mô tả công Việc: phần phát triển, thiết kế mẫu mã sản phẩm:
‘Thu nhập cạnh tranh, hắp dẫn trên thị trường Thưởng theo năng lực 2
Co hôi trải nghiêm vài học hỏi, tham gia dao tao kỹ thuật, công nghé mới, thang tiến
Hỗ sơ yêu cầu: Đơn xin việc
“Thông tin khác về công việc.
Nhà tuyến dụng : Apple inc Coporstlon. Địa chỉ trụ 26: California, Mỹ
Thêm CV của bạn ở đây dé ứng tuyền.
File đính kèm: (enon tap ] không có tep nào được chọn 2
=o ĐÁNH GIA VA PHAN HOI VE VIỆC LAM
4.Ban phải đã ứng tuyến việc làm này để đánh giá và bình luận !
'€ó 6 phản hỏi eno việc làm này !
Nguyễn Thiện © Bình buên của tôi Dương.
Nguyễn Thị © Binh luận của tôi Minh Châu.
312/1272020 , 00:00 g Eọx~l*~lx + si Âu Chủ đề của tôi
Vũ Quang Minh © Binh luận của tôi
Chu đề của tôi Ngô Thừa An © Bình luận của tôi
La Quán Trung © Binh buên của tôi £9 1271272020 , 00:00
Hình 3-18: Màn hình chi tiết công việc
Xây dựng website tìm kiếm và tuyển dụng việc làm
Bảng 3-21: Mô tả màn hình chỉ tiết công việc
1 Mô tả chi tiết công việc dang tuyển nhân viên
2 Thêm CV và ứng tuyên việc làm
3 Đánh giá và phản hồi về việc làm
3.6.4 Màn hình xem thông tin hồ sơ ứng viên
Q(B) Apple inc Coporation | wĐăng xuất
Xem Hồ Sơ Ứng Viên
ANgười tìm việc mới nhất - Xem Hồ sơ CV ứng viên miễn phí Ứng viên : Nguyên Thiện Dương
Bien tập viên © Bà Rịa -v © 0-1 năm kinh nghiệ
Hình 3-19: Màn hình xem hồ sơ ứng viên Bang 3-22: Mô tả màn hình xem hồ sơ ứng viên
1 Nhập thông tin cần tìm kiếm
2 Nút tìm kiêm ứng viên theo điều kiện
3 Hiên thị thông tin ứng viên ứng tuyển mới nhất
Xây dựng website tìm kiếm và tuyển dụng việc làm
3.6.5 Màn hình phản hồi thông tin việc làm cho ứng viên
Q ff | ME VINAMILK | Đăng xuất
TRANG CHỦ CÔNG TY TÌM ỨNG VIÊN ĐANG TUYỂN DỤNG LIÊN HỆ
VINAMILK Ứng viên : Nguyễn Thị Minh Châu
Mã ứng viên : 2 Địa chỉ hiện nay : 6 đường 15 khu phố 5, bình chiểu thủ đức
Số điện thoại : 965879220 Địa chỉ email: chau08603@gmail.com Giới tính: Nữ
& Thông tin tài khoản Mục tiêu nghề nghiệp
Mô tả bản thân ứng viên
Thông tin về trình độ học vấn của ứng viên
@ Cai đặt tài khoảr Thông tin về trình độ ngoại ngữ của ứng viên
Tải CV ứng viên ở đây| 2
Phản hối từ công ty hiihi
Trạng thái (Kiểm tra lại trạng thái trước khi cập nhật) Đủ điều kiện v
Cài đặt lịch phỏng vấn 4
Phản hồi thông tin lần cuối lúc : 16/01/2021 , 22:38
Hình 3-20: Màn hình phản hồi thông tin
Xây dung website tìm kiếm và tuyến dụng việc làm
Bảng 3-23: Mô tả màn hình phản hồi thông tin
1 Hién thị thông tin của ứng viên
2 Tải CV của ứng viên
3 Phản hồi cho ứng viên về công việc
4 Nếu Trang thái là đủ điều kiện thì có thé cài đặt lịch phỏng van
Xây dựng website tìm kiếm và tuyển dụng việc làm
3.6.6 Màn hình trang quản tri
TRANG QUẢN TRỊ = ail Thốngkê
Số lượng ứng viên hiện có Số lượng nhà tuyển dụng hiện có Số lượng việc làm hiện có Số lượng giao dịch việc làm
More info More info More info® More info®
Copyright © 2018 Job Portal All rights reserved Version 2.3.4
Hinh 3-21: Man hinh trang quan tri Bang 3-24: M6 ta man hinh trang quan tri
1 Phan quản lý của hệ thông
2 Hiền thị số liệu thông kê về sô lượng ứng viên, số nhà tuyên dụng, sô lượng việc làm hiện có
Xây dung website tìm kiếm và tuyến dụng việc làm
CHƯƠNG4 CÀI ĐẶT VÀ KIEM THU
Trong chương này nhóm tác giả cài đặt kiểm nghiệm và quy trình chọn điểm lân cận trong thuật toán lọc cộng tác dựa trên đánh giá việc làm của người dùng Cùng với cài đặt, triển khai và kiểm thử các chức năng của website.
4.1 Cài đặt thuật toán trên hệ thống website
Việc lập trình lọc cộng tác được tiến hành bên phía backend của hệ thống website
Chỉ tiết các bước cài đặt sẽ được trình bày ở phụ lục A.
4.1.2 Áp dụng lên dữ liệu
Dữ liệu được sử dụng gồm 9010 dòng dữ liệu đánh giá Được 903 user_1d đánh giá trên 849 công việc Các cột được định nghĩa theo các cột userld, itemId và rating tương ứng với mả ứng viên đánh giá, mã việc làm được đánh giá và sô điêm rating. userld |itemld |ratingNumber
COR) CO) OO a) SR) ee er) | oo) ay
Hình 4-1: Mô ta dữ liệu
Xây dung website tìm kiếm và tuyến dụng việc làm
Một số kết quả đánh giá của nhóm tác giả khi thực nghiệm:
Ví dụ gợi ý việc làm cho ứng viên “Nguyễn Thiện Dương” với userld là 1.
- Bước 1: Ta có bang đánh gia trong CSDL lưu dữ liệu người dùng sau khi đánh giá việc làm, bắt đầu cài đặt sẽ lưu dữ liệu thành ma trận Ta có ma trận ban đầu (utility matrix).
- Bước 2: Chuan hoa dit liệu bằng cách tính trung bình của điểm đánh giá từng người dùng, rồi lấy điểm đánh giá của người dùng cho mỗi sản phẩm lần lượt trừ cho điểm đánh giá trung bình Việc trừ đi như vậy sẽ khiến các điểm đánh giá có giá trị dương va âm Gia tri dương tương đương với việc người dùng quan tâm đến việc làm đó, còn âm thì tương đương với việc người dùng có khả năng không thích việc làm đó Sau khi tính ta có được ma trận được chuẩn hóa
Hình 4-2: Kết quả thực nghiệm - Ma trận chuẩn hóa
Xây dung website tìm kiếm và tuyến dụng việc làm
- Bước 3: Thực hiện tính độ tương quan giữa các người dùng dựa trên công thức cosine similarity Sau đó, ta được ma trận tương tự giữa các việc làm.
Hinh 4-3: Két qua thuc nghiém - Ma tran tuong tu
- Bước 4: Dự đoán kết quả: Thuật toán sẽ lần lượt dự đoán số điểm của các việc làm mà user_1 chưa đánh giá Trong nội dung này nhóm tác giả sẽ chỉ lay ra kết quả dự doan của việc làm có Itemld là 40 (itemId@). e - Bước 4.1: Trong danh sách việc làm, xác định những việc làm mà user_1 mã đánh giá. ratingNumber
Hình 4-4: Xác định việc làm mà người dùng user_1 đã đánh giá
Xây dung website tìm kiếm và tuyến dụng việc làm e Bước 4.2: Sau khi đã xác định được những việc làm mà user_id | đánh giá, nhóm tác giả sẽ xét tiếp tục tìm những người dùng đã đánh giá các việc làm trên, bao gồm ké cả việc làm có itemid_ 308. e Bước 4.3: Tiến hành xét từng việc làm để tính độ tương tự giữa việc làm itemld_40 với các việc làm trên Áp dụng công thức cosine similarity ta được: sim (itemld 7; itemId 40) = -0,11171 sim (itemId 37; itemId 40) = 0 sim (itemId 40; itemId 40) = 1 sim (itemId 169; itemId 40) = 0 sim (itemld 188; itemld 40) = 0,01026 sim (itemId 217; itemId 40) = -0,05119 sim (itemId 242; itemId 40) = 0 sim (itemId 267; itemId 40) = 0,01393 sim (itemId 268; itemId 40) = 0 sim (itemId 305; itemId 40) = -0,00937
Từ đây ta có thé thay được k số điểm lân cận là 3 dé đánh giá kết quả, ta sẽ lay
3 giá trị độ tương quan lớn nhất đó là sim(itemId 49; itemld 40), sim(itemId 188; itemId 40) và sim(itemld 267; itemld 40) dé dự đoán kết quả điểm đánh giá chuẩn hóa. e Bước 4.4: Dự đoán điểm đánh giá chuẩn hóa còn thiếu theo công thức: pred(u,p) = die rw Sữnẹ,p)
Từ công thức trên ta dự đoán được điểm đánh giá chuẩn hóa cho người dùng userld_1 về công việc có itemld là 40 sẽ là:
Xây dung website tìm kiếm và tuyến dụng việc làm d(userld 1, ttemtd 40) - 372189 * 07 + 0,01026 + 0/2105 + 0,01393 x —1/5) _ 4 6 preetusersd © tem ~ 0,372189 + 0,01026 + 0,01393 ”
Ta có thé thấy điểm đánh giá chuẩn hóa gần bằng 0,169278 là một số dương, suy ra người dùng này có thể thích việc làm này Từ đó ta đưa việc làm này vào danh sách gợi ý việc làm.
Ta sẽ lặp lại các bước trên cho các việc làm ma user! chưa đánh gia tương tự với việc làm có itemld là 40.
- Bước 5: Kết quả sau khi chạy thuật toán ở CSDL
-T—~ id JOBID APPLICANTID + 1 predict nor
1) „#Sửa ọ‡ Chộp @Xúabỏ 33 4 1 0.37 L] gf Sta Fé Chép @Xóabỏ 43 5 1 0.39
O Sita ọ3¿Chộp @Xúabỏử 73 8 1 0.92 L] „# Sửa #2 Chép @Xóabỏ 93 10 1 065 ) g Sta Fe Chép @ Xóa bỏ 113 12 1 021 L] „#Sửa 3¿ Chép © Xóa bỏ 153 16 1 0.5
1] g Stra ọ3¿Chộp â Xúa bỏ 163 17 1 0.32 L] „#Sửa Ze Chép @ Xóa bỏ 173 19 1 021 L) g Sita Ä¿ Chép © Xóa bỏ 193 21 1 0.46 L] gf Sta ọ3¿Chộp â Xúa bỏ 203 22 1 0.11 C) g Sta FE Chép @ Xóa bỏ 233 25 1 084 L] gf Sita 3¿Chép © Xóa bỏ 243 26 1 0.97 ] g Sita FE Chép © Xóa bỏ 253 27 1 0.19 L] „#Sửa 3¿ Chép © Xóa bỏ 273 29 1 082 L] g Sita FE Chép @ Xóa bỏ 293 31 1 0.42 L] „#Sửa FE Chép © Xóa bỏ 333 36 1 0.22 ] „#Sửa Fe Chép © Xóa bỏ 343 38 1 075 L] „#Sửa 3¿ Chép @ Xóa bỏ 363 40 1 061
(1) „# Sửa 3¿ Chép © Xóa bỏ 413 45 1 1.06 L] „#Sửa JE Chép © Xóa bỏ 443 48 1 01 L] g Sita Fé Chép © Xóa bỏ 473 51 1 1.04 L] „# Sửa 3¿ Chép © Xóa bỏ 483 52 1 0.32
Hình 4-5: Kết quả chạy thuật toán ở CSDL
Xây dung website tìm kiếm và tuyến dụng việc làm
Mã Thời hạn Điểm côn#* tuyển thuật việc Chức danh, vị trí tuyển dụng Công ty Địa điểm làm việc dụng toán
1 Giám Đốc Công+C2:C840 Nghệ Apple Inc Coporation Tầng 7, Tòa nhà MIPEC, 229 14/02/2021 0.35
(CTO) Tây Sơn, Đống Da, Hà Nội
Chuyên Viên IT - Quản Lý CÔNG TY TNHH 400A-402 Điện Biên Phủ, p25, 14/02/2021
Tên ứng viên : Nguyễn Thiện Website THƯƠNG MẠI - DỊCH VỤ Phường Bình Thạnh, Thành
Dương - KỸ THUẬT TOÀN ẤN Phố Hồ Chí Minh.
Thiết kế đồ họa Facebook Inc 24 đường 11, P AN Lạc A, Q 14/02/2021 â Hồ sơ của bạn
ES] CV của ban 139 TRỢ LÝ VẬN HÀNH Trường Đại học CNTT 400A-402 Điện Biên Phủ, p25, 14/02/2021
I8 Việc làm đã lưu Phố Hồ Chí Minh.
Hình 4-6: Kết quả chạy thuật toán trên trang web 4.2 Quy trình chọn số điểm lân cận (k) để đoán kết qua
Sau bước chuẩn hóa và dữ liệu và tính độ tương tự giữa các việc làm thì ta đến bước dự đoán các điểm đánh giả chuẩn hóa còn thiếu (normalized ratings) của các ứng viên cho từng việc làm Sau đó từ bước này dé đến bước tiến hành gợi ý việc làm cho ứng viên Và cách chọn số điểm lân cận (k) sẽ được nhóm tác giả trình bày ở phan này.
4.2.1 Độ đo RMSE - Root mean squared error
MSE là viết tắt của — Mean squared error nghĩa là sai số bình phương trung bình.
RMSE - Root Mean squared error là căn bậc hai của sai số bình phương trung bình.
RMSE cho biết mức độ phân tán các giá trị dự đoán từ các giá tri thực tế Là khoảng cách Euclid của các giá trị dự đoán đến giá trị đúng.
Xây dung website tìm kiếm và tuyến dụng việc làm
Hàm tìm điêm lân cận k: def trainningmodels(kk): v_train_data, v_test_data = train_test_split(rating_data,test_size=0.2, random_stateB) rsv_train_data,k=kk, uuCF=0) rs.fit() n_tests = v test data.shape[9]
SE = @ #square_error v_test_data=v_test_data for n in range(n tests): pred=rs.pred(int(v_test_data[n,@]),int(v_test_data[n,1]), normal ized=0) 1
RMSE = np.sqrt(SE/n tests) 3 h
Hình 4-7: Hàm tìm sai số toàn phương trung bình list_rmse=[] for k in range(1,101): tm = trainningmodels(k) list_rmse append(tm)
Hinh 4-8: Cai dat tim k Ở đây dau tiên nhóm tác gia lấy ra 2 phan train_data va test_data Với train_data là 80% dt liệu sốc và test_data là 20% dữ liệu còn lại và nhóm tác giả sẽ kiểm tra
Xây dung website tìm kiếm và tuyến dụng việc làm trên phan test_ data này Theo như phan mô tả dữ liệu, cột 1 là userId, cột 2 là itemld, cột 3 là ratingNumber.
Màn hình xem thông tin hồ sơ ứng viên 2-5 +s+cece+szxze+ 64
Q(B) Apple inc Coporation | wĐăng xuất
Xem Hồ Sơ Ứng Viên
ANgười tìm việc mới nhất - Xem Hồ sơ CV ứng viên miễn phí Ứng viên : Nguyên Thiện Dương
Bien tập viên © Bà Rịa -v © 0-1 năm kinh nghiệ
Hình 3-19: Màn hình xem hồ sơ ứng viên Bang 3-22: Mô tả màn hình xem hồ sơ ứng viên
1 Nhập thông tin cần tìm kiếm
2 Nút tìm kiêm ứng viên theo điều kiện
3 Hiên thị thông tin ứng viên ứng tuyển mới nhất
Xây dựng website tìm kiếm và tuyển dụng việc làm
Màn hình phản hồi thông tin việc làm cho ứng viên
Q ff | ME VINAMILK | Đăng xuất
TRANG CHỦ CÔNG TY TÌM ỨNG VIÊN ĐANG TUYỂN DỤNG LIÊN HỆ
VINAMILK Ứng viên : Nguyễn Thị Minh Châu
Mã ứng viên : 2 Địa chỉ hiện nay : 6 đường 15 khu phố 5, bình chiểu thủ đức
Số điện thoại : 965879220 Địa chỉ email: chau08603@gmail.com Giới tính: Nữ
& Thông tin tài khoản Mục tiêu nghề nghiệp
Mô tả bản thân ứng viên
Thông tin về trình độ học vấn của ứng viên
@ Cai đặt tài khoảr Thông tin về trình độ ngoại ngữ của ứng viên
Tải CV ứng viên ở đây| 2
Phản hối từ công ty hiihi
Trạng thái (Kiểm tra lại trạng thái trước khi cập nhật) Đủ điều kiện v
Cài đặt lịch phỏng vấn 4
Phản hồi thông tin lần cuối lúc : 16/01/2021 , 22:38
Hình 3-20: Màn hình phản hồi thông tin
Xây dung website tìm kiếm và tuyến dụng việc làm
Bảng 3-23: Mô tả màn hình phản hồi thông tin
1 Hién thị thông tin của ứng viên
2 Tải CV của ứng viên
3 Phản hồi cho ứng viên về công việc
4 Nếu Trang thái là đủ điều kiện thì có thé cài đặt lịch phỏng van
Xây dựng website tìm kiếm và tuyển dụng việc làm
3.6.6 Màn hình trang quản tri
TRANG QUẢN TRỊ = ail Thốngkê
Số lượng ứng viên hiện có Số lượng nhà tuyển dụng hiện có Số lượng việc làm hiện có Số lượng giao dịch việc làm
More info More info More info® More info®
Copyright © 2018 Job Portal All rights reserved Version 2.3.4
Hinh 3-21: Man hinh trang quan tri Bang 3-24: M6 ta man hinh trang quan tri
1 Phan quản lý của hệ thông
2 Hiền thị số liệu thông kê về sô lượng ứng viên, số nhà tuyên dụng, sô lượng việc làm hiện có
Xây dung website tìm kiếm và tuyến dụng việc làm
CHƯƠNG4 CÀI ĐẶT VÀ KIEM THU
Trong chương này nhóm tác giả cài đặt kiểm nghiệm và quy trình chọn điểm lân cận trong thuật toán lọc cộng tác dựa trên đánh giá việc làm của người dùng Cùng với cài đặt, triển khai và kiểm thử các chức năng của website.
4.1 Cài đặt thuật toán trên hệ thống website
Việc lập trình lọc cộng tác được tiến hành bên phía backend của hệ thống website
Chỉ tiết các bước cài đặt sẽ được trình bày ở phụ lục A.
4.1.2 Áp dụng lên dữ liệu
Dữ liệu được sử dụng gồm 9010 dòng dữ liệu đánh giá Được 903 user_1d đánh giá trên 849 công việc Các cột được định nghĩa theo các cột userld, itemId và rating tương ứng với mả ứng viên đánh giá, mã việc làm được đánh giá và sô điêm rating. userld |itemld |ratingNumber
COR) CO) OO a) SR) ee er) | oo) ay
Hình 4-1: Mô ta dữ liệu
Xây dung website tìm kiếm và tuyến dụng việc làm
Một số kết quả đánh giá của nhóm tác giả khi thực nghiệm:
Ví dụ gợi ý việc làm cho ứng viên “Nguyễn Thiện Dương” với userld là 1.
- Bước 1: Ta có bang đánh gia trong CSDL lưu dữ liệu người dùng sau khi đánh giá việc làm, bắt đầu cài đặt sẽ lưu dữ liệu thành ma trận Ta có ma trận ban đầu (utility matrix).
- Bước 2: Chuan hoa dit liệu bằng cách tính trung bình của điểm đánh giá từng người dùng, rồi lấy điểm đánh giá của người dùng cho mỗi sản phẩm lần lượt trừ cho điểm đánh giá trung bình Việc trừ đi như vậy sẽ khiến các điểm đánh giá có giá trị dương va âm Gia tri dương tương đương với việc người dùng quan tâm đến việc làm đó, còn âm thì tương đương với việc người dùng có khả năng không thích việc làm đó Sau khi tính ta có được ma trận được chuẩn hóa
Hình 4-2: Kết quả thực nghiệm - Ma trận chuẩn hóa
Xây dung website tìm kiếm và tuyến dụng việc làm
- Bước 3: Thực hiện tính độ tương quan giữa các người dùng dựa trên công thức cosine similarity Sau đó, ta được ma trận tương tự giữa các việc làm.
Hinh 4-3: Két qua thuc nghiém - Ma tran tuong tu
- Bước 4: Dự đoán kết quả: Thuật toán sẽ lần lượt dự đoán số điểm của các việc làm mà user_1 chưa đánh giá Trong nội dung này nhóm tác giả sẽ chỉ lay ra kết quả dự doan của việc làm có Itemld là 40 (itemId@). e - Bước 4.1: Trong danh sách việc làm, xác định những việc làm mà user_1 mã đánh giá. ratingNumber
Hình 4-4: Xác định việc làm mà người dùng user_1 đã đánh giá
Xây dung website tìm kiếm và tuyến dụng việc làm e Bước 4.2: Sau khi đã xác định được những việc làm mà user_id | đánh giá, nhóm tác giả sẽ xét tiếp tục tìm những người dùng đã đánh giá các việc làm trên, bao gồm ké cả việc làm có itemid_ 308. e Bước 4.3: Tiến hành xét từng việc làm để tính độ tương tự giữa việc làm itemld_40 với các việc làm trên Áp dụng công thức cosine similarity ta được: sim (itemld 7; itemId 40) = -0,11171 sim (itemId 37; itemId 40) = 0 sim (itemId 40; itemId 40) = 1 sim (itemId 169; itemId 40) = 0 sim (itemld 188; itemld 40) = 0,01026 sim (itemId 217; itemId 40) = -0,05119 sim (itemId 242; itemId 40) = 0 sim (itemId 267; itemId 40) = 0,01393 sim (itemId 268; itemId 40) = 0 sim (itemId 305; itemId 40) = -0,00937
Từ đây ta có thé thay được k số điểm lân cận là 3 dé đánh giá kết quả, ta sẽ lay
3 giá trị độ tương quan lớn nhất đó là sim(itemId 49; itemld 40), sim(itemId 188; itemId 40) và sim(itemld 267; itemld 40) dé dự đoán kết quả điểm đánh giá chuẩn hóa. e Bước 4.4: Dự đoán điểm đánh giá chuẩn hóa còn thiếu theo công thức: pred(u,p) = die rw Sữnẹ,p)
Từ công thức trên ta dự đoán được điểm đánh giá chuẩn hóa cho người dùng userld_1 về công việc có itemld là 40 sẽ là:
Xây dung website tìm kiếm và tuyến dụng việc làm d(userld 1, ttemtd 40) - 372189 * 07 + 0,01026 + 0/2105 + 0,01393 x —1/5) _ 4 6 preetusersd © tem ~ 0,372189 + 0,01026 + 0,01393 ”
Ta có thé thấy điểm đánh giá chuẩn hóa gần bằng 0,169278 là một số dương, suy ra người dùng này có thể thích việc làm này Từ đó ta đưa việc làm này vào danh sách gợi ý việc làm.
Ta sẽ lặp lại các bước trên cho các việc làm ma user! chưa đánh gia tương tự với việc làm có itemld là 40.
- Bước 5: Kết quả sau khi chạy thuật toán ở CSDL
-T—~ id JOBID APPLICANTID + 1 predict nor
1) „#Sửa ọ‡ Chộp @Xúabỏ 33 4 1 0.37 L] gf Sta Fé Chép @Xóabỏ 43 5 1 0.39
O Sita ọ3¿Chộp @Xúabỏử 73 8 1 0.92 L] „# Sửa #2 Chép @Xóabỏ 93 10 1 065 ) g Sta Fe Chép @ Xóa bỏ 113 12 1 021 L] „#Sửa 3¿ Chép © Xóa bỏ 153 16 1 0.5
1] g Stra ọ3¿Chộp â Xúa bỏ 163 17 1 0.32 L] „#Sửa Ze Chép @ Xóa bỏ 173 19 1 021 L) g Sita Ä¿ Chép © Xóa bỏ 193 21 1 0.46 L] gf Sta ọ3¿Chộp â Xúa bỏ 203 22 1 0.11 C) g Sta FE Chép @ Xóa bỏ 233 25 1 084 L] gf Sita 3¿Chép © Xóa bỏ 243 26 1 0.97 ] g Sita FE Chép © Xóa bỏ 253 27 1 0.19 L] „#Sửa 3¿ Chép © Xóa bỏ 273 29 1 082 L] g Sita FE Chép @ Xóa bỏ 293 31 1 0.42 L] „#Sửa FE Chép © Xóa bỏ 333 36 1 0.22 ] „#Sửa Fe Chép © Xóa bỏ 343 38 1 075 L] „#Sửa 3¿ Chép @ Xóa bỏ 363 40 1 061
(1) „# Sửa 3¿ Chép © Xóa bỏ 413 45 1 1.06 L] „#Sửa JE Chép © Xóa bỏ 443 48 1 01 L] g Sita Fé Chép © Xóa bỏ 473 51 1 1.04 L] „# Sửa 3¿ Chép © Xóa bỏ 483 52 1 0.32
Hình 4-5: Kết quả chạy thuật toán ở CSDL
Xây dung website tìm kiếm và tuyến dụng việc làm
Mã Thời hạn Điểm côn#* tuyển thuật việc Chức danh, vị trí tuyển dụng Công ty Địa điểm làm việc dụng toán
1 Giám Đốc Công+C2:C840 Nghệ Apple Inc Coporation Tầng 7, Tòa nhà MIPEC, 229 14/02/2021 0.35
(CTO) Tây Sơn, Đống Da, Hà Nội
Chuyên Viên IT - Quản Lý CÔNG TY TNHH 400A-402 Điện Biên Phủ, p25, 14/02/2021
Tên ứng viên : Nguyễn Thiện Website THƯƠNG MẠI - DỊCH VỤ Phường Bình Thạnh, Thành
Dương - KỸ THUẬT TOÀN ẤN Phố Hồ Chí Minh.
Thiết kế đồ họa Facebook Inc 24 đường 11, P AN Lạc A, Q 14/02/2021 â Hồ sơ của bạn
ES] CV của ban 139 TRỢ LÝ VẬN HÀNH Trường Đại học CNTT 400A-402 Điện Biên Phủ, p25, 14/02/2021
I8 Việc làm đã lưu Phố Hồ Chí Minh.
Hình 4-6: Kết quả chạy thuật toán trên trang web 4.2 Quy trình chọn số điểm lân cận (k) để đoán kết qua
Sau bước chuẩn hóa và dữ liệu và tính độ tương tự giữa các việc làm thì ta đến bước dự đoán các điểm đánh giả chuẩn hóa còn thiếu (normalized ratings) của các ứng viên cho từng việc làm Sau đó từ bước này dé đến bước tiến hành gợi ý việc làm cho ứng viên Và cách chọn số điểm lân cận (k) sẽ được nhóm tác giả trình bày ở phan này.
4.2.1 Độ đo RMSE - Root mean squared error
MSE là viết tắt của — Mean squared error nghĩa là sai số bình phương trung bình.
RMSE - Root Mean squared error là căn bậc hai của sai số bình phương trung bình.
RMSE cho biết mức độ phân tán các giá trị dự đoán từ các giá tri thực tế Là khoảng cách Euclid của các giá trị dự đoán đến giá trị đúng.
Xây dung website tìm kiếm và tuyến dụng việc làm
Hàm tìm điêm lân cận k: def trainningmodels(kk): v_train_data, v_test_data = train_test_split(rating_data,test_size=0.2, random_stateB) rsv_train_data,k=kk, uuCF=0) rs.fit() n_tests = v test data.shape[9]
SE = @ #square_error v_test_data=v_test_data for n in range(n tests): pred=rs.pred(int(v_test_data[n,@]),int(v_test_data[n,1]), normal ized=0) 1
RMSE = np.sqrt(SE/n tests) 3 h
Hình 4-7: Hàm tìm sai số toàn phương trung bình list_rmse=[] for k in range(1,101): tm = trainningmodels(k) list_rmse append(tm)
Hinh 4-8: Cai dat tim k Ở đây dau tiên nhóm tác gia lấy ra 2 phan train_data va test_data Với train_data là 80% dt liệu sốc và test_data là 20% dữ liệu còn lại và nhóm tác giả sẽ kiểm tra
Xây dung website tìm kiếm và tuyến dụng việc làm trên phan test_ data này Theo như phan mô tả dữ liệu, cột 1 là userId, cột 2 là itemld, cột 3 là ratingNumber.
- — Bước 1: Ở đây phan test_data sẽ tự ân đi một phần của của dữ liệu rating, do đó hệ thống sẽ tính lại những phần rating nay dựa trên thuật toán dã được cài đặt