HO CHi MINH Bộ môn Kinh tế BÀI TẬP NHOM MÔN HỌC: KHOA HỌC DỮ LIỆU CHO KINH DOANH ĐÈ TÀI: Ứng dụng mô hình học máy đề xây trong việc dự đoán khá năng ra quyết định tuyển dụng của cá
Trang 1
TRUONG DAI HOC NGAN HANG TP HO CHi MINH
Bộ môn Kinh tế
BÀI TẬP NHOM MÔN HỌC: KHOA HỌC DỮ LIỆU CHO KINH DOANH
ĐÈ TÀI: Ứng dụng mô hình học máy đề xây trong việc dự đoán khá năng ra quyết định
tuyển dụng của các doanh nghiệp
Giáo viên hướng dẫn: ThS Trần Doãn Hiểu
Lớp học phần: DAT722_231_ 10 L26
Sinh viên thực hiện: Nguyễn Ngọc Dan Thanh — 050610221306,
Nguyễn Ngọc Thư — 050610221377,
Nguyễn Thu Phương — 050610220469
TP.H6 Chi Minh, ngay 26 tháng 10 năm 2023
Trang 2
MỤC LỤC
THÀNH VIÊN THỰỰC HIỆN 2-5-5 5£ se s+seESseEseEvserseorserserrsersgreersre 4 Chương I: GIỚI TIHIỆ,U 5-2 << s£ se sEES£E£ 82EE£8EES xe SeEesevs se serscvee 5
I — Lý do chọn đề tài: s-c< 5c coehe th hExgEEEEErkrkerseesreersre 5
III Đối tượng nghiên cứu: wT
L Tổng quan về khoa học dữ liệu, học máy: - so co co s2 Hs se, 9
2 Học máy: Gói TH TY TH TT TT Tà Tá 0 00000 08 8 8 9
II Lĩnh vực liên quan đến bộ dữ liệu được thu thập: .- s55 c5: 11
1 HR (Human €es0UFC€S) - 5< 5= nọ Họ 11
2 Các công việc trong ngành HI o5 << se HH như, 12
3 Mô hình phòng ban nhân sỰ -. <5 «ng ngư 12
4 Thuận lợi 5< Hs HH HO HT HH HT HT 4 13 5Š, Khó khăn oo s00 0 0 0 9.9 9.900 99690900006 9999998 95.995959.50 0000089888889 95.9 088888 88 14
6 Con đường thắng TÄẾn 5 G1 HE gen ve 14
HH Công cụ học máy được sử dụng trong báo CÁO: uc Sen sex 15
1 A VY) 0a o7 15
2 Cac cong cu lap trinh Python hé tro format €0de . s 55555 seses2 16
3 Các công cụ ve Linting ccscccssssssssssssessssssssesssssssscsssssssesssssesssssssssescscsscessseenes 16
5 Các công cụ hỗ trợ kiểm tra dữ liệu s s-sccs©csccssessecssesersersesse 17
Trang 3Chương HII: MÔ TẢ DỮ LLIỆU - 5£ 5£ 5£ S2 SE Ex8 8 £2eeseeerscxersersee
L Nguồn gốc của dữ liệu: set sex Ee+keExetkeersererkeersrrrsrerrerree
II Đặc điểm của dữ liệu: s- sec cseecsceeerseveeerserseerserserseesersee THD Nội dung của đữ lIỆU: - - (<< HH KH HH vn
TV Mô tả dữ liệu bằng các công cụ trực quan hóa: 5c 55s se ss=sesee Chương IV: PHÂN TÍCH DỮ LIIỆU 2-2 s52 5s£sess£ssexssssesseesseserse
I Cu tric dir ligu:
II Tiền xử lý dữ liệu:
II Ứng dụng tiềm năng:
Chương V: THẢO LUẬN VÀ KẾT LUẬN 5 sec cccsccsccseseeersrssrseeersree
Trang 4DANH SÁCH THÀNH VIÊN VÀ BẢNG PHẦN CÔNG LÀM VIỆC NHÓM
2_ | Nguyễn Thu Phương | 050610220469 Cơ sở lý thuyét 100%
3 Nguyên Ngọc Đan | 050610221306 | Mô tả dữ liệu và phân tích 100%
4 | Nguyên Mmh Quyên | 050610221272 Giới thiệu đê tài 100%
Trang 5Chương I: GIỚI THIỆU
I Lý do chọn đề tài:
Công nghệ thông tin đóng một vai trò hết sức quan trọng trong việc phát triển kinh
tế - xã hội, cũng như về cả mặt văn hóa và chính trị cùng với đó đóng góp phần hình thành những nhân tố mới, con người mới Công nghệ thông tin tại Việt Nam ngày nay cũng đần phát triển và bùng nỗ khiến cho việc thu thập một lượng lớn đữ liệu tăng lên
nhanh chóng Mặc dù, đã có nhiều công cụ hỗ trợ việc thu thập, lưu trữ và khai thác dữ liệu, nhưng với sự bùng nô lớn mạnh của thông tmm được thu thập đã vượt ngoài tầm kiêm
soát của con người đề có thể nắm bắt chúng và xử lý kịp thời Cần phải có kỹ thuật đề
khai phá một bộ đữ liệu lớn, vì thế, khai phá dữ liệu đang là mối quan tâm hàng đầu của
các nhà nghiên cứu trong những năm gân dây Khai phá đữ liệu có thể được ứng dụng trong nhiều lĩnh vực như tài chính, ngân hàng, công nghệ thông tin, y tế, giáo dục, Đặc biệt, với sự phát triên không ngừng nghỉ của ngành tài chính hiện nay, việc mà chúng ta
xử lý dữ liệu quá lớn cần phải được thực hiện nhanh chóng, triệt để và chính xác, tránh
mắt mát nhiều thời gian Công nghệ càng ngày càng phát triển đồng nghĩa với việc chúng
ta cần phải phát triển hơn các phần mềm, các ứng dụng đề nâng cao năng suất làm việc, thay thê cho những kỹ thuật xử lý thô sơ như trước Chính vì thế, khai phá đữ liệu là công
cụ giúp cho việc xử lý và phân tích dữ liệu được diễn ra nhanh chóng và thông minh hơn Khai phá đữ liệu cho phép người sử dụng phân tích đữ liệu với nhiều góc độ khác nhau, phân loại đữ liệu theo quan điểm riêng biệt từ đó, tông kết các mỗi quan hệ được bóc tách
Đề hỗ trợ các tổ chức và nhà tuyển dụng đánh giá sự phù hợp của ứng viên với các
cơ hội việc làm khác nhau trong quy trình tuyển dụng là một nhiệm vụ đầy thách thức khi
phải đánh giá dựa trên nhiều yếu tố: tuổi, giới tính, trình độ, số năm đã làm việc, Hiện
nay, nhiều doanh nghiệp vẫn áp dụng quy trình tuyển dụng truyền thống với những thủ tục thủ công và dựa trên giấy tờ Đây là nguyên nhân dẫn đến việc họ chậm trễ trong việc phản hồi và ra quyết định của bộ phận chuyên trách, không đáp ứng được nhiều yêu cầu
xử lý cấp bách của công ty Đồng thời, việc quản lý đữ liệu nội bộ trong doanh nghiệp tạo
ra những khối lượng công việc lớn cho các cấp quản trị
Trang 6Là một sinh viên học ngành Quản Trị Kinh Doanh nói riêng và thuộc ngành Kinh
Tế nói chung, việc áp dụng kiến thức về kinh tế vào việc quan sát, năm bắt và hiểu rõ việc kinh doanh là một trong những mục tiêu chính của sinh viên ngành Thông qua môn Khoa học đữ liệu, việc áp dụng công nghệ số cũng như hiểu rõ đữ liệu trong mảng Quan Tri da trở nên dễ hiểu cũng như dễ áp dụng trong quá trình nghiên cứu thị trường và doanh nghiệp Hiểu được điều này, công nghệ số đang ngày càng được ứng dụng mạnh mẽ nhằm
tự động hóa quá trình thâm định tuyên dụng của các doanh nghiệp Bằng cách hợp lý hóa
và tự động hóa quy trình tuyển đụng, các doanh nghiệp cần tìm kiếm một giải pháp có thé giúp họ vượt qua thách thức, nâng cao hiệu quả của quá trình tuyên dụng và mang lại sự hài lòng cho nhân viên và doanh nghiệp Việc tối ưu bằng công nghệ trong các khâu, đặc biệt là khâu tuyên dụng đã giúp giảm đáng kê chỉ phí đồng thời nâng cao kết quả làm việc trong công ty đo thời gian xử lý nhanh chóng, hiệu quả hơn của các hệ thống
Vì vậy, để kết hợp giữa những phương pháp khai phá đữ liệu trong lĩnh vực công
nghệ thông tin cùng với phân tích dự báo các khâu thâm định hồ sơ tuyển dụng, nhóm chúng em đã quyết định chọn đề tài “Ứng dụng mô hình học máy để xây trong việc dự đoán khả năng ra quyết định tuyển dụng của các doanh nghiệp” làm đề tài nghiên
cứu trong bai tiểu luận
Il Mục tiêu nghiên cứu:
Bài nghiên cứu “Ứng dụng mô hình hoc may để xây trong việc dự đoán khả năng ra quyết định tuyển dụng của các doanh nghiệp” sẽ tập trung những mục tiêu đã
được đề cập dưới đây:
Bài nghiên cứu tiến hành phân tích các lý thuyết của khai phá đữ liệu nhằm tập
trung làm rõ những vấn đề của bài nghiên cứu
Nghiên cứu về những phương pháp cụ thể, phương pháp phân lớp dữ liệu ( phương pháp phân lớp đưa ra các dự báo, phân loại và cũng như phân lớp các đối tượng) Nghiên cứu sẽ đưa các phương pháp phân lớp dữ liệu, và từ đó sẽ chọn ra một phương pháp tối
ưu và đảm bảo chất lượng quá trình dự báo dữ liệu
Trang 7luyện, từ đó sẽ đưa ra những mô hình hoạt động kinh doanh tốt nhất cho thâm định tuyển dụng của công ty
Qua những kết quả của đữ liệu cùng với đó là dự báo mô hình hoạt động kinh doanh, nhóm chúng em sẽ đưa ra các kết luận, cùng với đó là những hạn chế của bài nghiên cứu, sau đó đưa ra giải pháp tốt nhất cho bài nghiên cứu
II - Đối tượng nghiên cứu:
Phân loại khả năng tuyên dụng của hơn 70.000 người xin việc Bộ đữ liệu được thu
thập và tạo ra bởi Ayushtankha được đăng tải trên trang web_
https://www.kagele.com/datasets/ayushtankha/70k-job-applicants-data-human-resource/
data? fbclid=IwAR3MIW8q A4gE6Rd7IFgcegpe nGwuxtWdhsjelm-
yKjd0gW979zirCyHwPI
IV Phương pháp nghiên cứu:
Phương pháp nghiên cứu của đề tài là kết hợp giữa phân tích định tính cùng với phân tích định lượng (dự báo) Chúng em đã sử dụng các phương pháp thống kê, phân
tích đữ liệu, ứng dụng mô hình hồi quy kinh tế định lượng đề dự báo mô hình ra quyết
định hồ sơ tuyên dụng của công ty với sự hỗ trợ của các chương trình Orange và Excel
V, Cấu trúc nghiên cứu:
Ngoài phần mục lục, danh mục bảng biểu và hình vẽ, tài liệu tham khảo, đề tài được kết cầu thành 5 chương như sau:
- Chương I: Giới Thiệu
- _ Chương II: Cơ Sở Lý Thuyết
- Chương III: Mô tả đữ liệu
- Chương IV: Phân tích dữ liệu
Trang 8- _ Chương V: Thảo Luận và Kết Luận
Trang 9Chương II: CƠ SỞ LÝ THUYÉT
Tổng quan về khoa học dữ liệu, học máy:
1 Khoa học dữ liệu:
- Khoa học đữ liệu:
+ Là lĩnh vực nghiên cứu dữ liệu nhằm khai thác những thông tin chuyên sâu
có ý nghĩa đối với hoạt động kinh doanh
+_ Một phương thức tiếp cận đa ngành cùng kết hợp những nguyên tắc và phương pháp thực hành của các lĩnh vực toán học, thống kê, trí tuệ nhân
tạo và kỹ thuật máy tính đề phân tích khối lượng lớn đữ liệu
+_ Nội dung phân tích này giúp các nhà khoa học dữ liệu đặt ra và trả lời những câu hỏi như sự kiện gi đã xảy ra, tại sao nó xảy ra, sự kiện gì sẽ xảy
ra và có thể sử dụng kết quả thu được cho mục đích gì
- _ Gồm có ba phân chính:
+ Tao ra va quan tri chinh dữ liệu đó
+ Phan tich dir liéu
+ Phát triển kết quả và phân tích thành giá trị hành động
- Việc phân tích và sử dụng dữ liệu cũng dựa vào ba nguồn tr1 thức:
+ Toán học (thống kê toán học — Mathematical)
+ Công nghệ thông tm (máy học — Machine Learning)
+ Tri thức của lĩnh vực cụ thê
2 Học máy:
Trang 10+ Là một những lĩnh vực nghiên cứu của trí tuệ nhân tạo
Biểu diễn một bài toán học máy:
Đôi với các tiêu chí sẽ đánh giá hiệu năng
Thông qua (sử dụng) kinh nghiệm
Một sô ví dụ về học máy:
+ Loc thu rac
Phan loai trang web
Tu van dau tu chimg khoan
Dự đoán rủi ro khi cho vay tài chính
Trang 11hệ thống
đã học
I Lĩnh vực liên quan đến bộ dữ liệu được thu thập:
1 HR (Human Resources):
- Là ngành quản trị nhân sw Cac céng viéc cha HR sé lién quan đến các hoạt
động tuyển dụng, lên kế hoạch triển khai các chính sách phù hợp để duy trì nguồn nhân lực cho công ty và tiếp đến sẽ có kế hoạch bồi dưỡng phát triển năng lực các cá nhân, phòng ban đề có thê hoàn thành công việc một cách hiệu quả nhất
- _ Được chia thành 2 mảng chính:
+ Quản trị nhân sự là công tác quản lý hành chính va thực hiện các chính
sách lao động
+ Quản trị nguồn nhân lực:
® Nó mang tính chiến lược lâu dài hơn như chiêu mộ và phát triển nhân
tài, xây dựng các cơ chế đánh giá nhân viên
11
Trang 12®_ Một số công việc như tìm kiếm và tuyên chọn ứng viên đang tìm việc làm, tư vẫn quảng cáo tuyển dụng, tư vẫn chiến lược nhân sự Các công việc trong ngành HR:
Tuyển nhân sự mới cho công ty bao gồm các hoạt động như tìm kiếm ứng viên, tiền hành phỏng vẫn, chuẩn bị các thủ tục để ứng viên thử việc
Chuan bi lam hợp đồng, bảo hiểm xã hội và thực hiện các chế độ đãi ngộ cho
nhân viên mới
Thực hiện đánh giá năng lực nhân viên trong công ty thông qua KPI hoặc đánh giá theo hiệu suất công việc để đề xuất thăng tiến tăng lương hay luân chuyên
nhân sự
Lên kế hoạch đào tạo, phát triển và đề xuất các chế độ đãi ngộ giúp giữ chân người tài, tô chức các hoạt động gắn kết các nhân viên trong công ty, xây đựng văn hóa doanh nghiệp, quy tắc ứng xử giữa các thành viên trong công ty Đây cũng là mục tiêu lớn mà phòng ban nhân sự trong các công ty đều hướng đến
đề giúp công ty, doanh nghiệp phát triển bền vững
Mô hình phòng ban nhân sự:
Trang 13V7} Ví dụ về một mô hình phòng ban nhên sự phổ biến
H IIIRLLTUR
tộp trung xôy dựng chương trình đòo tQo nhôn lực khéc v6i CoE va HR BP mang tinh chiến lược lôu dời,
va CGc chính sóch liên quan dén nhan sự Hf Shœed $ervice quỏn lí cóc công việc hỏng ngòy liên quon
Plonning: Định hướng phót triển tổ chức vờ lên kế hoọch vẻ đến hònh chính, lương thưởng
nhôn lực để đợt mục tiêu © Administration/ execution of payroll: Chém công tính
© Compensation & Benefits (C&B): Xdy CóC chính sóch, lương cho người loo động
hAxp-esppopet>deirenop>.kbeertsjeilob AeresAnlr-dEerte ® Resourcing/ ©utsourcing - Tuyển dựng/ Són đổu người
đöi ngộ cho người lao động: Tư vốn, kiểm tra vò thực hiện cóc Tìm kiếm những ứng viên phù hợp với vị trí công việc dựo nghiệp vụ vẻ Bỏo hiểm xở hội, hợp đồng loo động, chế độ phúc trên yêu cổu củo doonh nghiệp
lợi, lương thưởng theo dung quy định phóp luột vò chính sóch ® Talent acquisition/ management: Tim kiém va thu hut
® Leorning & Development (L&D) - Đòo to vò phót triển nhôn trọng
lực: Đòo tạo để nông cơo kỹ nöng, kiến thức cho đội ngũ nhôn '®' HR Admin - Hònh Chính: Thực hiện cóc công việc liên quon viên, thường chỉ có ở những tớp đoòn/ doonh nghiệp lớn vò đến thủ tục nhộn việc/ nghỉ việc, chuyển công tóc
những tổ chức đèo tọo chuyên biệt bên ngoòi
'® Analytics: Phôn tích nguôn lực con người đồ sử dụng hiệu quỏ
lao động sử dụng cóc dữ liệu nghiên cứu và mô hình để đưa ra
HR Business Partner (HR BP):
liên hệ chốt chẽ với từng bộ phộn chuyên biệt, cùng với lönh đọo lộp nên
Chiến lược phớt triển bển vững cho bộ phộn đó Ngoời yêu cổu chuyên môn
về nhôn sự, người kờm Hft Business Portner cổn có sy am hiểu vé tém nhin phat
triển cũng như chuyên môn trong lĩnh vực mờ bộ phộn tộp trung, nhồm giứo
đưa ro những chiến lược phót triển hiệu quỏ vò chuyên sôu
|
4 Thuận lợi:
- C6 cơ hội tiếp xúc với rất nhiều người với những tính cách khác nhau và có
định hướng nghề nghiệp cũng khác nhau
- (C6 vai tré quan trọng trong quá trình tuyển dụng và đảo tạo, giúp nhân viên và
tô chức phát triển bền vững
Trang 14Nhân được nhiều tình cảm yêu quý của mọi người trong công ty khi những đề xuất và chính sách mình đưa ra có tác động tích cực giúp nhân viên và công ty
hoạt động hiệu quả
Có cơ hội đám nhận những vai trò hết sức quan trọng như quản lý nguồn nhân lực - công việc quản lý và tuyên chọn những người tài năng
Liên tục gặp các vấn đề như nhân viên nghỉ việc, đình công hoặc năng suất lao động kém phải liên tục tổ chức sàng lọc, tuyên dụng các ứng viên phù hợp Ngoài ra, người sử dụng lao động thường có khuynh hướng mong muốn nguồn nhân lực chất lượng cao được đào tạo trong thời gian ngắn đề cắt giảm kinh phí
và tăng lợi nhuận, nhưng đào tạo con người rất cần thời gian và chiến lược cụ
thé, không thê cho kết quả ngay trong một sớm một chiều
Con đường thăng tiến: