Không chỉ vậy, khi một nhân viên nghỉ việc và chưa tìm đượcnhân lực mới thay thế vào vị trí đó, thì những nhân viên cùng bộ phận sẽ phảicáng đáng công việc nhiều hơn, dẫn đến nguy cơ sụt
Trang 1TRƯỜNG ĐẠI HỌC KINH TE QUOC DAN
KHOA TOÁN KINH TE
Trang 2EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
LOI CAM DOAN
Tôi — Pham Nguyễn Khanh Chi xin cam đoan dé tai “Dy báo và phân tích cácyếu tố ảnh hưởng đến khả năng hao mòn lao động” là thành quả học tập và
nghiên cứu của riêng bản thân tôi Dựa vào vốn kiến thức tích lũy tại trường
trong những năm qua cùng với sự hướng dẫn vô cùng tận tình, sự chỉ bảo chu
đáo, tâm huyết và khoa học của Thạc sĩ Vũ Thị Bích Ngọc cũng như quá trình
nghiên cứu, tìm hiểu tài liệu trong và nước nước liên quan đến vấn đề hao mònlao động tôi đã hoàn thành luận văn tốt nghiệp Tất cả những thông tin và kết quảnghiên cứu được trình bày trong bai luận văn đều hoàn toàn trung thực Nhữngtrường hợp sử dụng thông tin trích dẫn, tham khảo ở những nguồn khác đã được
chú thích, đề cập đầy đủ tại phần Tài liệu tham khảo
Sinh viên thực hiện chuyên đề
Chi
Pham Nguyén Khanh Chi
11180795 - PHAM NGUYEN KHANH CHI
Trang 3EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
LOI CAM ON
Qua suốt cả một quá trình tim hiểu và nghiên cứu thực hiện bài chuyên dé tốtnghiệp, tôi — Phạm Nguyễn Khánh Chi thực sự cảm thấy vô cùng biết ơn các
Thay/ Cô, bạn bè, người thân, đã luôn tận tình hỗ trợ, giúp đỡ va chi bao, tao
mọi điều kiện cũng như đưa ra những lời khuyên, gửi tới những lời khích lệ để
tôi luôn giữ vững được tỉnh thần cũng như trang bị đủ kiến thức để có thể hoàn
thành bài luận văn tốt nghiệp trong thời gian ba tháng của kì thực tập.Trước tiên, tôi muốn bày tỏ lòng biết ơn đến tat cả các Thay/ Cô thuộc chuyênngành Toán kinh tế, Trường Đại học Kinh tế Quốc dân Thầy cô đã truyền lửacho tôi tiếp tục với con đường đam mê những con số, mô hình; cung cấp rấtnhiều những kiến thức bổ ích không chi là về mặt chuyên môn mà còn là nhữngbài học cuộc sống, giúp cho tôi có được những hành trang bồ ích trên con đường
sắp tới của mình và trong quá trình thực hiện bài chuyên đề tốt nghiệp này.Đặc biệt, tôi xin được gửi lời tri ân sâu sắc nhất đến Thạc sĩ Vũ Thị Bích Ngọc
Nhờ có sự dẫn dắt của cô, những gợi ý, phân tích mang tính chuyên môn cũngnhư thực tế có giá trị cùng với những lời động viên vô cùng quý giá đã giúp tôi
hoàn thành được luận văn lần này.Tôi cũng xin được chân thành cảm ơn người thân trong gia đình, bạn bè đã lắngnghe, chia sẻ và tạo điều kiện, nhiệt tình hỗ trợ cả về mặt tinh thần, không gianvà thời gian giúp tôi yên tâm bước những bước chân vững chắc trên chặng đường
cuối cùng của quá trình học Đại học.Tuy nhiên, do trình độ của bản thân còn nhiều mặt hạn chế về cả kiến thức lẫnthời gian nghiên cứu nên bài luận văn còn nhiều điểm chưa được hoàn chỉnh
Chính vì vậy, tôi rất mong nhận được những lời góp ý từ thầy cô và bạn học dé
bài chuyên đề của tôi trở nên hoàn thiện hơn Bên cạnh đó, bản thân tôi mong
muốn rằng dé tài của mình có thé dem lại phan nào đó giá trị thực tế đối vớidoanh nghiệp nói chung và các phòng ban về quản trị nhân sự nói riêng nhằmgiúp các nhà quản lý có thể thấu hiểu nguồn lực lao động của mình từ đó xâydựng được các chiến lược lâu dài với mục tiêu phát triển bền vững
Sinh viên thực hiện chuyên đề
Trang 4EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
MUC LUC
LOI CAM ĐOAN c2 2 tt 21 tt 21 ro |LOI CẢM ƠN óc c2 2t re 2DANH MỤC BANG BIEU, HÌNH VẼ -222¿-22222c222vxvttrtrrrrrrrrrrrree 6
DANH MỤC HINH VẼ 2222:222222222211122221112271111.21111 re 6
IM.928Ẻ10/08:7 9165:7000 7
DANH MỤC CÁC TỪ VIET TẮTT 2¿22©+++222EE+tt22EEEEttrEkrrrrrrrrrree 898/9520 9
CHƯƠNG 1: CƠ SỞ LÝ LUẬN VA TONG QUAN NGHIÊN CỨU 12
1.1 KHÁI NIEM HAO MON LAO ĐỘNG (ATTRITTION) 12
1.2 CÁC YEU TO TÁC DONG DEN HAO MON LAO ĐỘNG 13
1.2.1 Sự thỏa mãn trong công việc (Job Satisfactlon§) - - 13
1.2.2 Quyền chọn cô phiếu (Stock Options) -2-©s2cs+z+zxzzseez 141.2.3 Sự cân bằng giữa công việc và cuộc sống (Work life balance) 15
1.2.4 Tiền công theo giờ (Hourly Raf) - ¿- 25s xecxerxerErErrxsrsered 151.3 HẬU QUA CUA HAO MON LAO ĐỘNG - - se ccrcrerxerxet 151.4 MỘT SO CÁC KET QUÁ NGHIÊN CỨU - 2 2+ccxeEerzreres 171.4.1 Sự thỏa mãn tác động đến kha năng hao mòn lao động 17
1.4.2 Tần suất đi công tác tác động đến khả năng hao mòn lao động 18
1.4.3 Giáo dục tác động đến khả năng hao mòn lao động - 18
1.4.4 Tình trạng hôn nhân tác động đến khả năng hao mòn lao động 19
1.4.5 Giới tính tac động đến khả năng hao mòn lao động - 19
1.4.6 Thu nhập tác động đến khả năng hao mòn lao động 20
1.4.7 Lĩnh vực làm việc tác động đến khả năng hao mòn lao động 20
1.4.8 Độ tuôi tác động đến khả năng hao mòn lao động 21
1.5 THUC TRANG woe cccccccccesessssssssesesesesesesesesesescscsescseseseseseseseseseseensnenenenenees 22 1.5.1 Thực trang tại thi trường Việt Nam oo ccecccceseeseeeseeeseeeseeeneeenes 22 1.5.2 Thực trạng tại thi trường MĨ cceeseeseeseeeeeeseeeeseesseeeeseeees 23 F1"
11180795 - PHAM NGUYEN KHANH CHI 3
Trang 5EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
1.6 KET QUA NGHIÊN CỨU -2-©2¿©2+22+2EE£2EEEEEEEtEEEtzrkrerkrerked 24
Chương 2: PHƯƠNG PHÁP NGHIÊN CỨU 2-22 22z2+£xzzz+zxzz+ 27
2.1 PHƯƠNG PHAP PHAN CUM K - MEANS CLUSTERING 27
2.1.1 Giới HhiGu oc eecceecccccccesseesssesssesssecssesssessssesssesssessseessesssesssvsssuessseessessseeese 27
2.1.2 Một số phương pháp xác định số cụm 2-2 ++s++cx+zzsez 282.1.3 Các bước tiến hảnh - 2: 525 222£EEt2EEE2E22E12112212112712221 2 xe 31
2.1.4 Ưu điểm và nhược điểm của thuật toán - - s s+c+zxezxzEszrezes 322.2 CÁC PHƯƠNG PHÁP DU BÁO ¿-©22 22222222 EEEerrrerree 33
2.2.1 Một số thuật toán Machine L€aTnInB - -cccccscsssssseseeeeeses 332.2.2 Thuật toán Logistic Regression (Sử dung cho việc dự báo va phân 15 (0) 01M E-(06(0) 012) 17707077 47
2.2.3 Cac thước do dùng dé đánh giá kết quả dự báo -s 492.2.4 Van đề cần lưu ý khi tiến hành bài toán phân loại nhị phân 52
CHƯƠNG 3: KET QUA NGHIÊN CỨU VÀ THẢO LUẬN 54
3.1 SO LIEU VÀ TRUC QUAN DU LIỆU - 2-5 522522 +E+Eerxerxee 54
3.1.2 Thống kê mô tả dit liệu 2-22 2 ©£2EE+£EE+EE2EESEEE2EEeEEesrxerrree 55
3.2 BÀI TOÁN PHAN CUM NHÂN VIÊN VA KET QUA PHAN TÍCH 60
3.2.1 Bài toán phân cụm nhân Vién ¿62322333 *+£+s+evxeereeeeeeres 60 3.2.2 Phương pháp K Means C ÏuSf€r 2c St St sEetksrrrrrrrrreres 60
3.3 BÀI TOÁN DU BAO Ý ĐỊNH NGHĨ VIỆC CUA NHÂN VIÊN 65
3.3.1 Bai toán dự bao ý định nghỉ việc của nhân viên ‹ s5 653.3.2 Xử lý mat cân bằng dữ liệu bằng phương pháp SMOTE 663.3.3 Phuong pháp K Nearest Neighbors 0 cccceccesccesceeseeeseeeeeeeseesseees 66 3.3.4 Phương pháp Decision Tree ceceeeeseeseeseeeeeeceeseeeeeseeseeneeneeneeaees 67 3.3.5 Phương pháp Random FOT€SẲ - 6 12+ xé svseeeeerkrek 68 3.3.6 Phương pháp Gradient Boosting ClasSIÍIer - ¿5c s+sx+++ 69 3.3.7 Phương pháp Logistic Regress1on - - cc + ssvserxsrrssrsree 69
F1"
11180795 - PHAM NGUYEN KHANH CHI 4
Trang 6SE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
3.3.8 Kết hợp và Tổng két eccceccccccsssesssessesssessesssesseessessessesssessesssesseesseessen 71
CHƯƠNG 4: KET LUẬN - 2-5222 2EEEEE2E1E2112712112711211 21121121 re 73
4.1 KET LUẬN VÀ KHUYEN NGHỊ, 2¿52+2+z+22zt2zxczrxsrxcee 734.2 ĐỊNH HƯỚNG NGHIÊN CỨU TRONG TƯƠNG LAI 73TÀI LIEU THAM KHẢO - 22: ©2+22+2EE22EE222112211221271127122712 21 21.ccre 75
TÀI LIEU THAM KHẢO 22 ©2222222EE22EE2E12221122112211221 2212 1e crxe 75
TÀI LIEU INTERINETT -2-©22+22EE2EEE2EEEC2EE1271127112711227122212 22 cee 76
11180795 - PHAM NGUYEN KHÁNH CHI 5
Trang 7EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
DANH MUC BANG BIEU, HINH VE
DANH MỤC HÌNH VEHình 1.1 Ty lệ nghỉ việc tự nguyện từ 2014 đến HI - 2021 -: 23Hình 1.2 Tỷ lệ nghỉ việc theo nhóm ngành tại Mĩ năm 2020 - 23Hình 1.3 Khả năng nhận hoặc tìm kiếm một cồn việc khác vì làm việc quá sứctheo mMhOm 61 011217 21 Hình 2.1 Mô tả thuật toán K — means CusterIng - «sex 27Hình 2.2 Ví dụ về bài toán với 3 cụm dữ liệu -©-¿©2++2cxcezxzscscee 28Hình 2.3 Minh họa đồ thị đường cong biểu diễn WSS theo K (number of
J3) 017 ,Ô 29
Hình 2.4 Minh họa đồ thị đường cong biểu diễn agv.Sil theo K (number of
Hình 2.5 Minh họa đồ thị đường cong biểu diễn Gap(k) -.-: -: 5: 31
theo K (number of CÏUSf€TS) -. G2232 1121 1211211511511 1111 1.1111 tem rreg 3l Hình 2.6 Minh họa thuật toán K - nearest Neighbors (KNN) - 34
Hình 2.7 Cấu trúc của một cây quyết định ¿- ¿+52 ++£2EzEerxerxerxeee 36
Hình 2.8 Minh họa thuật toán Random Foresf - 55 5555 +22 *££+s<£<+zss2 42 Hình 2.9 Minh hoa quá trình BootstrappIng - -:- 5 5c 5s s+c*+sssexseeserssss 43 Hình 2.10 Mô tả thuật toán Gradient Boosting CÏassIfler 5-55: 45Hình 2.11 Minh họa đồ thị biểu diễn ham Sigmoid 2-2 s2 s£s>sz 48Hình 2.12 Minh họa đường cong ROC . - +2 * + se r hp 52 Hình 2.13 Minh hoa thuật toán SMO TIE óc net 54 Hình 3.1 Nhân viên theo ý định rời bỏ công việc hiện tại - - 56 Hình 3.2 Chuyên ngành theo trình độ giáo dục - -csscssxsscxseesserevrs 57Hình 3.3 Tần suất đi công tác theo trình độ chuyên môn . 59Hình 3.4 Mức cân bằng giữa cuộc sống và công viỆc 2-2 cse+czze: 59Hình 3.5 Đồ thị xác định giá trị tối ưu K theo Phương pháp khuỷu tay 61Hình 3.6 Đồ thị xác định giá trị tối ưu KK - 2-22 ++E++Ex++Exzrxrzrxerrxees 61
LE
11180795 - PHAM NGUYEN KHANH CHI 6
Trang 8EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
theo Phuong pháp hình bóng trung bình óc vs ng ri, 61Hình 3.7 Đồ thị xác định giá trị tối ưu K -¿©+¿2c++2cx++zxeerxxerrxere 62theo Phương pháp thống kê khoảng cách 2- 2: ¿22+2+£+£x++2z+tzzxezzxd 62
Hình 3.8 D6 thị cây quyết định - 2¿+22z+2EE+2EEC2EECEEE221.2711 2211211 xe 67
Hình 3.9 Top10 kết qua mức độ quan trong của các biến dự báo 68DANH MỤC BANG BIEU
Bang 2.1 Mô trả Ma trận nhầm lẫn 2-22 2+ 2EE2EE£EE+2EEEEEEEEErrEkerxerrxer 49Bang 3.1 Bang thống kê mô tả dit liệu - 2: 225E2E2+EE+2EEtEEE2EEerrserresred 54Bang 3.2 Đặc điểm cá nhân của nhân viên - 2: 5c 52+ 2+E2£E+Ee£xerxerxeez 56Bang 3.3 VỊ trí chuyên môn theo phòng ban 5 255355 ++scsseesseess 57Bang 3.4 Các thông tin về nhân viên cần được loại bỏ - 5z 525522 60Bang 3.5 Điểm trung tâm của các cụm nhân viên - 2-5 52+ +2 +2£++£xez 62
Bang 3.6 Đánh giá mô hình K — Nearest NeIgbors -¿- c5 5+ s+<xss+2 66 Bang 3.7 Đánh giá mô hình Decision Tree - - «5s ni 67 Bang 3.8 Đánh giá mô hình Random FOF€SE - - 55+ +2 *+s*++++exsexeereez 68 Bang 3.9 Đánh giá mô hình Gradient Boosting - các sssecsererrs 69
Bang 3.10 Kết quả hồi quy LogisfiC 2- 2c ©522522SE£EE2EEt£EE2EEzExrrxerrxeee 69
Bảng 3.11 Đánh giá mô hình Logistic RÑegression - 5 sex 71Bang 3.12 Đánh giá kết quả các phương pháp dự báo 2 sz©sz=s2 71Bảng 3.13 Đánh giá kết quả Random Forest cho từng cụm . 72
F1"
11180795 - PHAM NGUYEN KHÁNH CHI 7
Trang 9SE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
DANH MUC CAC TU VIET TAT
11180795 — PHAM NGUYEN KHANH CHI 8
Trang 10EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
LOI MO DAU
1 Ly do lựa chọn đề tai
Hao mòn lao động là một thuật ngữ được dùng để mô tả sự suy giảm về số
lượng nhân viên nhưng có chủ ý xảy ra trong các trường hợp khi một nhân viên
nghỉ hưu hoặc xin từ chức tuy nhiên lại không được thay thé, lap đầy chỗ trốngbởi một nhân viên khác.
Sự hao mòn lao động này có thé gây ra các tác động khác nhau đến doanhnghiệp, tình hình hoạt động của doanh nghiệp nói chung và đến các nhân sự vẫnđang hoạt động tại doanh nghiệp đó nói riêng.
Dé hình thành nên một doanh nghiệp, phát triển nên một doanh nghiệpbền vững, hoạt động có hiệu quả thì một trong những yếu tố căn bản nhất quyếtđịnh sự thành bại chính là yéu tố con người, hay nói cách khác chính là yếu tốnhân sự, nguồn nhân lực Nguồn nhân lực chính là yếu tố bên trong quan trọnghang đầu quyết định đến kết qua sản xuất, kinh doanh Chi phí phải bỏ ra dé
tuyển dụng và đảo tạo nhân viên mới, nhất là trong thời điểm nhạy cảm của nền
kinh tế khi mọi hoạt động kinh doanh sản xuất đều đang bị ảnh hưởng nặng nề
bởi đại dich Covid19 cũng là một van dé khá nan giải của rất nhiều các công ty,
doanh nghiệp Không chỉ vậy, khi một nhân viên nghỉ việc và chưa tìm đượcnhân lực mới thay thế vào vị trí đó, thì những nhân viên cùng bộ phận sẽ phảicáng đáng công việc nhiều hơn, dẫn đến nguy cơ sụt giảm chất lượng công việccũng như sự thỏa mãn trong công việc của nhân viên Vì vậy, các nhà quản lýluôn muốn tìm ra một chiến lược cụ thể để giảm thiểu tối đa hết sức có thể nguy
cơ hao mòn nhân sự nhằm tiết kiệm chi phi cho doanh nghiệp cũng như không
làm ảnh hưởng đến quá trình sản xuất kinh doanh
Ngoài ra, trong trường hợp không thể tránh khỏi sự hao mòn lao động củadoanh nghiệp, thì dự tính được nguy cơ nghỉ việc của nhân viên cũng là mongmuốn của các nhà quản lý nhân sự, giúp cho họ có thé lên kế hoạch tuyển dụngnhân lực mới sớm hơn dé không ảnh hưởng đến quá trình kinh doanh, sản xuấtcủa doanh nghiệp Vậy nên, bài toán dự báo sự hao mòn lao động là rất cần thiếtđối với các nhà quản trị nhân sự Trước hết, dự báo được khả năng nghỉ việc vàtìm hiểu được lí do tại sao một nhân viên có ý định nghỉ việc có thể giúp nhà
quản lý nhân sự đưa ra một số những đãi ngộ tốt hơn trong khả năng của mình để
giữ chân nhân viên ở lại với doanh nghiệp, hoặc rút ra được kinh nghiệm đối với
trường hợp của các nhân viên mới hoặc nhân viên khác vẫn còn đang làm việc.
Bên cạnh đó, các nhà quản trị nhân lực cũng rât quan tâm đên việc phân nhóm
7⁄”,,mẳẳ -11180795 - PHAM NGUYEN KHANH CHI 9
Trang 11EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
nhân sự Sau khi doanh nghiệp tiến hành phân nhóm nhân sự dé dự báo nhóm
nhân sự nào có khả năng hao mòn cao sẽ dễ dàng hơn trong việc xây dựng, hình
thành các chiến lược về tuyên dụng và đãi ngộ nhân sự phù hợp đối với từngnhóm đối tượng
Bài toán được đưa ra cho các nhà quản lý nhân sự “Làm thé nào dé giảm
tỷ lệ hao mòn lao động?” Hầu hết các nhà tuyên dụng đều gặp khó khăn trongviệc có găng giảm tỷ lệ nhân viên nghỉ việc mà không có nhân sự thay thế Đâylà một chủ đề được quan tâm và nghiên cứu ở rất nhiều các quốc gia trên thế giớituy nhiên tính đến thời điểm hiện tại ở Việt Nam lại chưa thực sự được đầu tưnghiên cứu.
Nhận thức được tầm quan trọng của việc dự báo được khả năng và giảipháp làm giảm thiểu hao mòn nhân sự, người thực hiện đã quyết định tiến hànhnghiên cứu và thực hiện chuyên đề “Dự báo và phân tích các yếu tố ảnh hưởng
đến khả năng hao mòn lao động”.
Mục tiêu của chủ đề này chính là qua việc nghiên cứu một bộ số liệu củaMỹ sẽ tạo được một nền tảng nhất định để các nghiên cứu sau có thé thực hiện
được tại thị trường Việt Nam 2 Mục đích nghiên cứu
Mục đích
Dự báo khả năng hao mòn lao động của doanh nghiệp, phân tích các yếu tô ảnhhưởng đến quyết định nghỉ việc của nhân viên Bên cạnh đó sẽ đề xuất các giảipháp giảm thiểu khả năng hao mòn lao động
Mục tiêu- Xác định các yêu tố quan trọng ảnh hưởng đến khả năng hao mòn lao động.- Phân cụm các nhóm nhân viên và tìm hiểu đặc điểm tính chất riêng của nhómlao động có khả năng hao mòn cao nhất
- Dé xuất giải pháp, gợi ý nhăm giảm thiểu kha năng hao mòn lao động dé doanhnghiệp xây dựng kế hoạch cải thiện chế độ đãi ngộ giữ chân nhân sự cũng nhưtuyển dụng lao động sao cho phù hợp và hiệu quả
3 Phạm vi và đối tượngĐối tượng nghiên cứu: Các yếu tố ảnh hưởng đến khả năng hao mòn nhân sự.Phạm vi nghiên cứu: Giới hạn trong trường hợp của 1470 nhân viên với dữ liệu
do IBM cung cấp.4 Phương pháp nghiên cứu
F1"
11180795 - PHAM NGUYEN KHANH CHI 10
Trang 12EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
e Phân tích định tính: Nghiên cứu tai ban các lý thuyết, quan điểm phân tích
của các nhà nghiên cứu đi trước, thống kê mô tả dit liệu.e Phan tích định lượng: Sử dụng phương pháp K — means Cluster dé phân
nhóm nhân sự kết hợp với các phương pháp truyền thống (Hồi quyLogistics) và một số phương pháp Machine Learning (K — nearestNeigbors, Decision Tree, Random Forest, Support Vector Machine) để dựbáo khả năng hao mòn nhân sự.
5 Kết cauBài chuyên đề có kết câu bao gồm 4 chương như sau:
Chương 1: Cơ sở lý luận và tông quan nghiên cứuChương 2: Phương pháp nghiên cứu
Chương 3: Kết quả nghiên cứu và thảo luận
Chương 4: Kết luận
F1"
11180795 - PHAM NGUYEN KHÁNH CHI 11
Trang 13EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
CHUONG 1: CO SO LY LUAN VA TONG QUAN NGHIEN
CUU
Ở chương đầu tiên của bài chuyên đề, người thực hiện sẽ đưa ra một số các kháiniệm liên quan đến hao mòn nhân sự, đồng thời tóm tắt tình hình nghiên cứutrong và ngoài nước có chủ đề liên quan và chỉ ra khoảng trống nghiên cứu Từđó, đưa ra cơ sở lý luận các nhân tố ảnh hưởng đến sự hao mòn nhân sự, các
phương pháp dự báo sự hao mòn nhân sự chính xác nhất
1.1 KHÁI NIEM HAO MON LAO DONG (ATTRITTION)Attrition được định nghĩa là sự hao mòn, suy yếu đi Sự hao mòn này được sử
dụng trong cả ba lĩnh vực quan trọng của cuộc sông là quân sự, giáo dục và kinh
doanh.
Hao mòn lao động trong kinh doanh mô tả sự giảm dần về số lượng nhân viênnhưng có chủ ý xảy ra khi nhân viên nghỉ hưu, từ chức, mất sức lao động hay độtngột qua đời và không được thay thế bởi nhân viên khác Các công ty, doanh
nghiệp sẽ phải tự đánh gia attrition rate (tỷ lệ tiêu hao lực lượng lao động hay
lãng phí lao động) của mình là cao hay thấp Những doanh nghiệp có tỷ lệ lão
phí lao động cao thường gặp phải tình trạng lạm dụng nguồn lực nội bộ.
Phân biệt giữa Attrition va Turnover
Turnover đề cập đến việc nhà tuyển dụng có thể chủ động thay thế một nhân viên
vừa rời công ty hoặc một phòng ban của công ty bang nguồn lực lao động khác.Trong khi đó, attrition sẽ nói về viễn cảnh mà không có bắt kì hành động thay thénào được thực hiện Nó có thể dẫn tới việc xóa bỏ hoàn toàn vị trí đó Việc xóabỏ hoàn toàn vị trí này có thé là do công ty không có nhu cầu tuyển người mới(cắt giảm hăn vị trí này do hoạt động kinh doanh kém phát triển) hoặc không thểtuyển dụng được người mới (do chế độ đãi ngộ, mức lương, chưa thỏa mãnnhu cầu của người lao động)
Nguyên nhân dẫn đến việc hao mòn nhân sự này có thê đến từ rất nhiều các yếu
tố khác nhau như mức lương, điều kiện làm việc, chính sách đãi ngộ của doanh
nghiệp, sự thỏa mãn trong công việc là kém, không có tương lai phát triển sựnghiệp.
Các loại hao mon lao độngHao mòn lao động có thể được phân ra thành hai loại chính là hao mòn tự
nguyện và hao mòn không tự nguyện Tuy nghiên thì cũng có những cách phân
F1"
11180795 - PHAM NGUYEN KHANH CHI 12
Trang 14EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
loại khác nữa, ví dụ như là hao mon tích cực và hao mòn tiêu cực, hao mon bên trong và hao mòn bên ngoài Dưới đây là các định nghĩa cho các phân loại trên.
Hao mon tự nguyện là khi mà nhân viên dang làm việc xin nghỉ ở doanh nghiệpđể có một cơ hội tốt hơn, mức đãi ngộ, phát triển nghề nghiệp tốt hơn, hoặc
những ly do cá nhân và chuyên nghiệp khác Trong trường hop hao mon tự
nguyện, thì nhân viên là người quyết định rời khỏi doanh nghiệp.Hao mòn không tự nguyện là khi nhân viên vị đuôi việc, hay nói cách khác là
người thuê lao động quyết định cham dứt hợp đồng lao động với nhân viên củamình Ở trường hợp này thì người quyết định là ông chủ, người thuê lao động
Hao mon tích cực là khi sự hao mòn lao động sẽ mang lại những điều tích cựchơn đối với doanh nghiệp Khi mà nhân viên mới có tài và có nhiều kinh nghiệmhơn nhân viên cũ thì đó có thé được coi là hao mòn tích cực
Hao mòn tiêu cực chính là sự mat mát của công ty Khi mà công ty mất đi một
nhân viên có nhiều năng lực và kinh nghiệm trong công việc của mình trong một
thời gian ngắn và công ty muốn giữ nhân viên đó lại nhưng không thê thì đó
chính là hao mòn tiêu cực.
Hao mòn bên trong là khi mà phòng ban trong công ty có sự thay đổi Dé là khi
nhân viên của công ty được chuyền qua một phòng ban khác trong công ty dé có
thể có môi trường làm việc phù hợp với khả năng nhất
Hao mòn bên ngoài là khi nhân viên rời khỏi công ty vì bat kỳ một lý do gì Tổchức và bộ phận nhân sự cần phải để mắt rất kỹ đến trường hợp hao mòn này vìnó làm ảnh hưởng tiêu cực đến hình ảnh chung của công ty trên thị trường lao
động Tỷ lệ hao mon lao động (Attrition Rate)Đây là một chỉ số cho thấy % số nhân viên rời khỏi doanh nghiệp Nó giúp
doanh nghiệp định tính số lượng nhân viên rời đi trong một thời kỳ nhất định,dựa theo công thức sau:
Số lượng nhân viên rời đi
Tỷ lệ tiêu hao lao động = 100 %
Tổng số nhân viên
1.2 CAC YEU TO TÁC DONG DEN HAO MON LAO DONG
1.2.1 Sự thỏa mãn trong công việc (Job Satisfactions) “Sự thỏa mãn trong công việc là sự hài lòng của một cá nhân đôi với công viêc” (Oxford Advance Learner’s Dictionary).
LE
11180795 - PHAM NGUYEN KHANH CHI 13
Trang 15EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
"Sự thỏa mãn công việc là việc nhân viên được đáp ứng nhu cầu hay mong muốn
của họ khi làm việc" hay "Sự thỏa mãn công việc đơn giản là việc người ra cảm
thấy thích công việc của họ và các khía cạnh công việc của họ" (Spector, 1997);"Sự thỏa mãn công việc chủ yếu phản ánh mức độ một cá nhân yêu thích côngviệc của mình" (Kreitner và Kinicki, 2007) Đó chính là tình cảm hay cảm xúccủa người nhân viên đó đối với công việc của mình Một người được xem là cósự thỏa mãn công việc thì người đó sẽ có cảm giác thoải mái, dễ chịu đối với
công việc của mình.
Có rất nhiều định nghĩa, khái nệm khác nhau nói về sự thỏa mãn trong công việc
nhưng nhìn chung, các tác giá đều cho rằng, khi nhu cầu của một nhân sự được
đáp ứng và thỏa mãn thông qua việc thực hiện công việc của mình thì đó chính là sự thỏa mãn với công việc.
1.2.2 Quyền chọn cỗ phiếu (Stock Options)Quyền chọn cô phiếu là những hợp đồng quyền chọn được thiết kế với tài sản cơ
sở là một cổ phiếu đơn lẻ Về mặt khái niệm, quyền chọn cô phiếu đơn lẻ đem lạicho người nắm giữ quyền, chứ không phải nghĩa vụ, mua hoặc bán một cô phiếucụ thể với số lượng nhất định ở mức giả xác định vào hoặc trước một thời điểmđã biết trong tương lai
Quyền chọn cô phiếu cho phép nhà đầu tư đạt được những mục đích khác nhau
dựa trên kì vọng cụ thé về biến động giá của cổ phiếu CƠ SỞ
Chang hạn, nhà dau tư có thé bảo vệ (danh mục) cô phiếu mình đang nắm giữtrước nguy cơ giá cô phiếu giảm trên thị trường, ôn định giá mua cô phiếu trong
tương lại ở mức cố định (thấp hơn so với giá hiện hành khi thực hiện giao dịch),kiếm lợi nhuận từ sự tăng hoặc giảm giá cổ phiếu mà không cần phải trực tiếpmua hoặc bán cổ phiếu đó
Quyền chọn cô phiếu là một quyền chon mua mà một công ty dành cho thànhviên công ty đối với cổ phiếu của chính công ty đó như là một hình thức trả thùlao phi tiền mặt Một số hạn chế đối với quyền chọn này đều nham mục đích gắnchặt quyền lợi của những người nắm quyền chon này với các cổ đông khác củacông ty, kích thích họ làm việc tốt hơn, cống hiến nhiều hơn cho công ty
Quyền chọn cổ phiếu thường dành cho các nhà quản trị như là một phan trongchế độ lương bong cua họ Cac doanh nghiệp mới thành lập, làm ăn chưa có lãi,có thể sử dụng quyền mua cô phiếu để trả lương cho nhân viên thay vì sử
dụng tiền mặt Ngoài ra trong một số trường hợp ngoại lệ, quyền mua cô phiếu
';7"
11180795 - PHAM NGUYEN KHÁNH CHI 14
Trang 16EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
cũng có thé được dành cho các đối tác ngoài doanh nghiệp như nhà cung cấp,
nhà tư vân, các luật sư, 1.2.3 Sự can băng giữa công việc và cuộc sông (Work life balance)
Thuật ngữ work life balance thé hiện nguyện vọng, mong muốn của một cá nhân
và mức độ mong muốn của họ phụ thuộc vào tính chất công việc của mỗi cá
nhân Đây hiện tại là một trong những yếu tố các nhà tuyên dụng nhân sự sửdụng khá nhiều dé thu hút nhân tài về cho các tô chức, doanh nghiệp Thuật ngữnày có thé được hiểu là sự cân băng giữa công việc chuyên môn và cuộc sốngkhác nhân, khi một nhân viên đi làm có thể được hưởng phúc lợi đầy đủ phù hợpvới mong muốn và cống hiến của bản thân cùng lúc với cuộc sống cá nhân không
bị ảnh hưởng tiêu cực, quỹ thời gian cho công việc và cuộc sống riêng không bị
chông chéo lên nhau.1.2.4 Tiền công theo giờ (Hourly Rate)
Tiên công theo giờ là sô lượng tiên mà bạn nhận được cho mỗi giờ làm việc Với
một nhân viên làm theo giờ, người đó sẽ được trả cho tât cả sô giờ mà người đó làm việc Nêu người thuê lao động muôn một người làm thêm giờ, họ sẽ phải trả
thêm bằng đúng số giờ đó.1.3 HẬU QUÁ CỦA HAO MÒN LAO ĐỘNGSự hao mòn lao động ảnh hưởng tiêu cực đến vấn đề về thể chất cũng như tỉnh
thân của người lao động
Dù một người lao động nghỉ việc do bất kì một nguyên nhân nào thì hao mòn laođộng cũng gây nên những ảnh hưởng tiêu cực đến doanh nghiệp Ảnh hưởng tiêucực đầu tiên có thể được nói đến chính là hao mòn lao động tác động tiêu cựcđến các nhân viên khác cùng một bộ phận Những nhân viên ở lại của doanhnghiệp sẽ phải tăng năng suất lao động hoặc tăng thời gian lao động của mình décó thể bù lấp vào khối lượng và mảng công việc mà nhân viên đã nghỉ trước đódé lại Người lao động sẽ phải làm thêm những việc của người đã nghỉ, tuy nhiên
lại không được trả thêm bất cứ một phần tiền lương nào cho các công việc bị làm
thêm đó Điều này sẽ gây nên những ức chế nhất định về mặt suy nghĩ của cácnhân viên, kéo theo đó là những ảnh hưởng tiêu cực đến sức khỏe của nhân viên
trong doanh nghiệp.
F1"
11180795 - PHAM NGUYEN KHANH CHI 15
Trang 17EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Khi cac nhan vién con lai nhin thay những nhân viên khác lần lượt xin nghỉ, họsẽ dần đặt câu hỏi và có thái độ hoài nghi về các chính sách và chế độ phúc lợihiện tại của công ty.
Việc phải cáng đáng thêm khối lượng công việc nhiều hơn dé bù đắp lại cho cácnhân viên đã nghỉ nếu xảy ra trong một thời gian dài sẽ gây nên căng thắng mệtmỏi Tình trạng phải làm thêm giờ (Overtime) cũng có thé xuất hiện và khiếnviệc mat cân bằng giữa công việc và cuộc sông cá nhân xảy ra Hệ quả chính lànhững nhân viên khác cùng sé dần trở nên mat hứng thú với công việc va xinnghỉ.
Sự hao mòn lao động còn gây ảnh hưởng tiêu cực đến uy tín của một doanhnghiệp
Không chỉ ảnh hưởng tiêu cực đến người lao động, sự hao mòn lao động còn gâynên tác động không tốt lên uy tín của một tổ chức Khi một nhân viên rời bỏ
doanh nghiệp dé tìm kiếm cơ hội việc làm ở một doanh nghiệp khác, đồng nghĩa
với việc nhân viên đó chưa thực sự hài lòng với các chính sách đãi ngộ, hay nói
cách khác là không thỏa mãn với mức lương và quyền lợi mà tổ chức cũ đưa ra
Chính vì vậy, sự nghỉ việc của nhân viên cũng phần nào gây ảnh hưởng đến uytín cũng như sự thu hút của công ty/ doanh nghiệp đó trên thị trường lao động.
Sự hao mòn lao động ảnh hưởng đến sức mạnh nội bộ - hiện tượng cháy mauchất xám
Khi một tổ chức/ doanh nghiệp thiếu hụt đi nguồn nhân lực sẽ dẫn đến làm suygiảm sức mạnh nội bộ của công ty Đây chính là một biểu hiện của hiện tượng
chảy máu chất xám Khi công ty ban đầu tuyển dụng được những nhân tài về làm
việc cho mình nhưng lại không thể đưa ra được những chính sách đãi ngộ vàphúc lợi đủ tốt để giữ chân nhân sự trong thị trường lao động thì những nhân sựnay sẽ khó có thé gan bó ở lại lâu đài với công ty, có xu hướng nghỉ việc dé tìmđược một môi trường va bến đỗ tốt hơn
Sự hao mòn lao động khiến cho doanh nghiệp mat thêm nhiễu thời gian và chỉphí đào tạo để tạo ra nguồn lao động mới
Khi nhân viên nghỉ việc cũng đồng nghĩa với việc bộ phận nhân sự sẽ phải thực
hiện lại quá trình tuyển dụng người mới vào vị trí đó Trong quá trình này, nhà
tuyển dung sẽ phải mat thêm một khoảng thời gian và chi phí cho việc đàm phánhợp đồng lao động đối với nhân viên mới cũng như mắt thêm quãng thời gian vàchi phí bỏ ra cho việc đào tạo Không chỉ vậy, việc phải tuyên thêm nhân viên
mới cũng sẽ khiến cho hoạt động sản xuất kinh doanh của doanh nghiệp có sự
';7"
11180795 - PHAM NGUYEN KHÁNH CHI 16
Trang 18EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
chậm ché nhất định khi nhân viên mới chưa thé bắt kip ngay với tiến độ và quá
trình, công đoạn làm việc đặc thù của công ty.
Một nghiên cứu được thực hiện bởi Employee Benefits News VỀ sự nghỉ việc củanhân viên vào năm 2020 đã chỉ ra rằng chi phí trung bình cho việc hao mòn mộtnhân viên lao động là 33% mức lương hàng năm của nhân viên đó Theo báo cáo
được đưa ra bởi Work Institute cùng năm, việc nhân viên nghỉ việc đã tiêu tốn
của các ngành công nghiệp của Mi hơn 630 triệu đô la Mi.Khảo sát được thực hiện tại Canada đã thong ké rang chi phi dé thay thé mộtnhân viên nghỉ việc có thé nam ở mức từ 75% đến 200% lương hang năm cuanhân viên 27% nhà tuyển dụng ở Canada cho biết rằng nhân viên nghỉ việc
chính là một trong những “điểm đau đớn” nhất của họ.Nói cách khác, khi một nhân viên nghỉ việc, doanh nghiệp không chỉ mất đi mộtngười làm việc và thời gian, mà doanh nghiệp sẽ mat đi một khoản chi phí dangkê.
1.4 MỘT SO CAC KET QUÁ NGHIÊN CỨU
1.4.1 Sự thỏa mãn tác động đến khả năng hao mòn lao độngTheo thuyết Hai nhân tố (Two-factor Theory) của Herzberg (1959), bằng cáchthỏa mãn những yếu tố bên ngoài, nhân viên có thé cảm thấy trung lập, nhưngkhông có thêm được sự hài lòng Nếu các yếu tô bên ngoài được thỏa mãn, khiđó, nhân viên có thé có thêm động lực và từ đó thỏa mãn được các yếu tố nội tại.McGregor (1960) va Bass (1965) đưa ra quan điểm rằng sự thỏa mãn trong côngviệc phụ thuộc vào sự thỏa mãn tiềm năng của môi trường làm việc (thỏa mãn vềmôi trường) Nhân viên có cho thấy sự liên kết giữa môi trường làm việc của họ
với sự thoải mái của cá nhân và kết quả làm việc Nếu môi trường lam việc tốt,cá nhân sẽ cảm thấy dễ dàng thực hiện công việc của mình hơn, mang lại sự thỏamãn cao hơn Từ đó, sẽ giảm thiểu mong muốn muốn đổi công việc của minh
Một vài nghiên cứu ở Nam Phi (Mwamwenda 1995; Steyn & Van Wyk 1999) đã
chỉ ra rằng điều kiện làm việc nghèo nan, ví dụ như là ap lực công việc nhiều,
trang thiết bị môi trường làm việc kém, nguồn cung cấp phục vụ cho công việckhông day đủ, thiếu sự an toàn trông việc là những yếu tố ảnh hưởng đến sự thỏa
mãn trong công việc Điều này sẽ dẫn đến khả năng hao mòn lao động cao hơn
so với bình thường.
Những nhân viên đạt đến một ngưỡng thỏa mãn nhất định sẽ thường ít có xu
hướng dời công ty hơn (Coomber and Barribal, 2007; Rusbult và Farrel, 1983).
===========B —_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _.
11180795 - PHAM NGUYEN KHANH CHI 17
Trang 19EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Theo như Herberg (2003), sự thỏa mãn là kết qua của một loạt những yếu tốmang tính động lực như là sự ghi nhận, cơ hội thăng tiến và cảm giác tốt về tôchức Những nhân tô góp phần giúp giảm thiểu sự thỏa mãn bao gồm những nhàquản lý cấp trên thấu hiểu và làm việc hiệu quả, sự thỏa mãn đối với lương
thưởng và các chế độ đãi ngộ, quan hệ tốt đối với đồng nghiệp.Những thước đo liên quan đến sự thỏa mãn cũng có liên kết với kết quả làm việc
Những nhân viên được thỏa mãn nhiều hơn cho ra được những thước đo đánh giá
về hiệu quả công việc cao hơn (Whetten va Cameron, 2011)
Các ly do dẫn đến sự hao mòn lao động hầu hết đều liên quan đến động lực làmviệc và các chỉ số đánh giá sự thỏa mãn (Pratt and Cakula, 2021)
1.4.2 Tần suất đi công tác tác động đến khả năng hao mòn lao độngVào năm 2017 Global Business Travel Association (GBTA) đã công bố mộtnghiên cứu mới, với sự hợp tác cùng Sabre Corporation, tiến hành dựa trênnhững người đi công tác do công việc trên toàn thế giới và cho thấy ảnh hưởng
đáng ké của việc đi công tác lên quyết định ở lại và quyết định bắt đầu một côngviệc mới ở doanh nghiêp khác của một nhân viên Ở Bắc Mỹ, hơn 3⁄4 (79%) sốnhân viên đi công tác nói rằng là việc được đi công tác có ảnh hưởng nhất địnhđến sự thỏa mãn công việc nói chung ở một mức độ nào đó Điều này đặc biệtđúng cho tang lớp Millennials (88%) Ở Châu Âu, con số này là 83% cho cácnhân viên nói chung và 88% cho Millennials Ở các nước thuộc khu vực Châu Á— Thái Bình Dương, da số các nhân viên đã từng có cơ hội đi công tác khi làmviệc nói rằng việc nảy ảnh hưởng đến sự thỏa mãn công việc it nhất là từ 81 đến
96% Không chỉ ảnh hưởng đến việc nhân viên có quyết định ở lại một doanh
nghiệp hay không, việc đi công tác còn có tác động đến quyết định liệu họ có nênchấp nhận một công việc mới 59% những nhân viên tại Bắc Mỹ được hỏi và66% đối với nhân viên Mỹ La tinh chỉ ra rằng chính sách, tần suất của việc đicông tác là một yếu tố quan trọng khi họ cân nhắc một công việc mới tiềm năng
1.4.3 Giáo dục tác động đến khả năng hao mòn lao động
Theo một nghiên cứu diễn ra trong 4 năm giải thích sự liên kết giữa giáo dục,phù hợp công việc và sự thỏa mãn cuộc sống (Ilies, R., Yao, J., Curseu, P L.,Liang, A X., 2018), người thực hiện chi ra rằng giáo duc đóng một vai trò quantrọng trong sự thỏa mãn trong cuộc sống Những người có bậc học cao hơnthường có xu hướng ít thỏa mãn hơn với công việc của họ hơn là những người có
F1"
11180795 - PHAM NGUYEN KHANH CHI 18
Trang 20EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
cùng công việc nhưng trình độ giáo dục thấp hơn Nói cách khác, những ngườicó bậc học cao hơn sẽ có xu hướng tìm kiếm được những vị trí, công việc mớivới mức lương và chế độ đãi ngộ cao hơn dễ dàng hơn so với những người có
trình độ giáo dục thấp, nên họ sẽ có xu hướng rời bỏ công việc hiện tại dễ dàng
hơn so với những người có trình độ giáo dục thấp hơn.1.4.4 Tình trạng hôn nhân tác động đến khả năng hao mòn lao độngỞ mối quan hệ này, không có quá nhiều bài nghiên cứu chỉ ra mối liên kết giữa
tình trạng hôn nhân và sự thỏa mãn công việc cũng như ý định nghỉ việc của một
nhân viên Nhưng ở một số bài nghiên cứu có chỉ ra rằng những nhân viên đãkết hôn sẽ thỏa mãn với công việc của họ hơn là những nhân viên khác (Austrom
et al 1988; Federico et al 1976; Garrison and Muchinsky 1977; Watson 1981).
Ly do được đưa ra có thé là hôn nhân và gia đình khiến cho việc có một côngviệc ôn định và lâu dai sẽ quan trọng hơn Sự thỏa mãn trong công việc lúc nàysẽ là có một công việc ổn định Vì vậy, nếu với điều kiện công việc phù hợp thi
người có gia đình sẽ ít có xu hướng nghỉ việc hơn là người độc thân.
1.4.5 Giới tính tác động đến khả năng hao mòn lao độngMột số nghiên cứu chỉ ra rằng phụ nữ thì thường dễ thỏa mãn trong công việc
hơn là đàn ông (Bartol and Worman 1975; Clark 1996) Dẫu vậy, một vải nghiên
cứu khác lại cho thấy kết quả ngược lại rằng phái nam thì thỏa mãn với công việchon là phái nữ ((Hulin and Smith 1964; Weaver 1974; Forgionne and Peeters
1982) Ly do dang sau cho việc có nhiều mức độ thỏa mãn về công việc khácnhau giữa nam và nữ có thé là do những kỳ vọng khác nhau từ công việc của họở mỗi giới tính (Campbell et al 1976) Ví dụ, đối với nhân viên nam, thì sựnghiệp chính là mục tiêu quan trọng nhất nhưng đối với nữ giới thì không phảinhư vậy (Kuhlen 1963).
Việc giới tính có ảnh hưởng đến thỏa mãn trong công việc hay không là một chủ
đều nóng hồi ở nhiều những buổi diễn thuyết về doanh nghiệp (Goh et al 1991;
Mason 1995) Tuy nhiên thì kết quả của nhiều nghiên cứu cân nhắc về mối quan
hệ giữa giới tính và thỏa mãn công việc thì vẫn còn gây tranh cãi.
Nghiên cứu chỉ ra răng nam và nữ sử dụng những tiêu chí khác nhau khi đánhgiá về công việc của họ (Oshagbemi 2000) Những nhân viên nữ thường chú
trọng đên những yêu tô xã hội về công việc hơn là nhân viên nam Trong khi đó,
F1"
11180795 - PHAM NGUYEN KHANH CHI 19
Trang 21EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
nhân viên nam thường quan trọng van dé cơ hội dé chứng tỏ, bày tỏ ban thân
trong công việc hơn là nhân viên nữ (Centres and Bugental 1966).
Chính vì thế, cho thé cho thấy rằng, đối với mỗi giới tính, việc đánh giá mộtcông việc là tốt hay không tốt phụ thuộc vào những yếu tố khác nhau dẫn đếnviệc định nghĩa sự thỏa mãn trong công việc, môi trường làm việc, tình trạng cácmỗi quan hệ cũng trở nên khác nhau Điều này, dẫn đến việc xu hướng quyếtđịnh nghỉ việc hay không đối với mỗi giới tính có thé coi là khác nhau
1.4.6 Thu nhập tác động đến khả năng hao mòn lao độngTheo Faisal Mahmood (2015) trong bài nghiên cứu về mối quan hệ giữa thunhập, thái độ của người thuê lao động, mật độ công việc và quyết định nghỉ việc
của nhân viên được thực hiện tại Paksitan, người thực hiện đã đi đến một vài kết
luận Nếu thu nhập tăng, khối lượng công việc được phân chia 6n định và phùhợp thì mức độ thỏa mãn công việc của nhân viên sẽ được nâng lên Và mức độthỏa mãn công việc có liên quan trực tiếp đến quyết định có tiếp tục gắn bó vớidoanh nghiệp hay không của nhân viên, vì vậy có thé nói rằng những yếu tố
được nêu trên đều có tác động tích cực đến quyết định nghỉ việc của nhân viên.
Và trong các yếu tô được nhac đến, yếu tố thu nhập cho thấy rang có tác độnglớn hơn hắn đối với sự thỏa mãn trong công việc Từ những kết luận trên, có thể
cho thấy được rằng, được thỏa mãn về mặt thu nhập sẽ có tác động không nhỏ
đến việc nhân viên có quyết định nghỉ việc hay không Một nhân viên có được sự
thỏa mãn trong công việc sẽ có khả năng gắn bó với doanh nghiệp lâu dài hơn và
có động lực, năng suất, hiệu quả làm việc cao hơn Doanh nghiệp cần phải cân
băng các yếu tố và trong đó thu nhập là yếu tô quan trọng nhất Thu nhập nênđược điều chỉnh phù hợp với từng thời điểm và năng lực cá nhân, kinh nghiệm
cũng như điều kiện thị trường đề có thê giữ chân các nhân sự có năng lực.1.4.7 Lĩnh vực làm việc tác động đến khả năng hao mòn lao động
Theo thống kê được thực hiện bởi U.S Bureau of Labor Statistics thực hiện dựa
theo số liệu được thu thập vào năm 2019, những công việc liên quan đến Chính
phủ, Tài chính và Bảo hiểm hay Giáo dục có lượng lao động nghỉ việc ít hơn sovới các ngành liên quan đến Nghệ thuật, Giải trí, Kinh doanh, Bất động sản hay
dịch vụ ăn uông,
F1"
11180795 - PHAM NGUYEN KHANH CHI 20
Trang 22SE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
1.4.8 Độ tuổi tác động đến khả năng hao mòn lao động
Việc không thỏa mãn với công việc và quyết định nghỉ việc thì sẽ khác nhau đốivới mỗi một thế hệ Trong những thống kê về nghỉ việc tác giả đã sưu tầm và
tong hợp, các chuyên gia thường có nhận xét rằng người trẻ thì thường có xuhướng nghỉ việc nhiều hơn so với các đồng nghiệp tiền bối Một trong những yếu
tố dẫn đến việc này chính là “sự thịnh hành” của việc kiệt sức Các báo cáo chi rarằng, thế hệ trẻ hơn thường phải làm quá nhiều việc và không được trả lươngxứng đáng Hệ quả là họ sẽ đễ dàng đi đến quyết định nghỉ việc hơn Điều đángbáo động hơn là, có nhiều trường hợp những nhân viên làm việc quá sức nàykhông chỉ nghỉ việc một minh mà họ còn có thé thuyết phục thêm một vài đồng
nghiệp nghỉ cùng với họ.
Khả năng nhận hoặc tìm kiếm một công việc
khác vì làm việc quá sức 94%
100% 88%
70% 58% 55%
60% 47% 50% 37%
oer
% & st
& w =
lữ Sẽ nhận một công việc khác vi làm việc qua sức
l# Sẽ tìm kiếm một công việc khác vì làm việc quá sức
Hình 1.3 Kha năng nhận hoặc tìm kiếm một công việc khác vì làm việc qua
sức theo nhom tuoi
Nguồn: Limeade, 2020
Những người trẻ, cụ thé là thé hé Gen Z va Millennials hau nhu déu tim kiém
một công việc khác do phải làm việc qua sức (94% đối với Gen Z và 88% đốivới Millennials) Tỷ lệ này thì thấp hơn một chút ở thé hệ Gen X (82%) va BabyBoomers (75%) Gen Z có 58% làm một công việc khác vì công việc cũ quá mệt
eee
11180795 — PHAM NGUYEN KHANH CHI 21
Trang 23EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
mỏi Con số này sẽ giảm dan theo từng thé hệ và thấp nhất là Baby Boomers với37%.
1.5 THUC TRANG
1.5.1 Thực trang tại thị trường Việt Nam
Một báo cáo được công bố bởi Anphabe vào năm 2019 cho thấy tỷ lệ nghỉ việctại Việt Nam đã đạt tới mức 24%, cao hơn đáng ké so với tỷ lệ nghỉ việc tối ưu là10% Theo Anphabe, 4 yếu tô chính anh hưởng đến việc liệu nhân viên sẽ tiếptục làm hay nghỉ việc là thu nhập, con đường sự nghiệp, danh tiếng của người
chủ và sự cân bằng giữa cuộc sống và công việc Báo cáo này cũng chỉ ra rằng,
“tiền lương càng cao thì nguy cơ nghỉ việc càng cao’, điều này đặc biệt đúngtrong các lĩnh vực Marketing, Bán hàng (Sales), Công nghệ (TT) và Tài chính
Ở hội thảo trên web “Reward Summit 2021’ được tổ chức vào tháng 10 năm2021 với chủ đề “Sự chuyên đổi phần thưởng trong thời đại mới” (“Rewards
Transformation in the New Now”), Talentnet đã trình bày kết quả của khảo sát“Thủ lao tổng thé” (“Total Remuneration Survey (TRS)”) được thực hiện với597 doanh nghiệp ở 16 lĩnh vực ngành nghé khác nhau trong năm 2021
Trang 24SE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Hình 1.1 Tỷ lệ nghỉ việc tự nguyện từ 2014 đến HI - 2021
Nguồn: TRS 2021Báo cáo này đã thống kê số liệu tỷ lệ nghỉ việc tự nguyện của các doanh nghiệpkề từ năm 2014, cho thấy các doanh nghiệp Việt Nam liên tục có tỷ lệ nghỉ việc
cao hơn các doanh nghiệp nước ngoài với khoảng cách trung bình là 3% Ngoài ra, Ngành bán lẻ (Retail), Các công ty tài chính phi ngân hàng (Non — banking financial companies), Ngành hàng tiêu dung (Consumer goods) là ba ngành có tỷlệ nghỉ việc cao nhất với số liệu lần lượt là 29.7%, 22.9%, 17.7% Top 3 ngànhcó tỷ lệ nghỉ việc thấp nhất trong cả năm 2020 và năm 2021 đều là Dầu khí
(Petroleum), Hóa học (Chemistry), Cung ứng (Supply).
Tính đến thời điểm hiện tại, chưa có bài nghiên cứu nào được thực hiện về khả
năng hao mòn lao động về thị trường tại Việt Nam cũng như chưa hình thành bộ
số liệu cho việc nghiên cứu chủ đề này.Chính vì vậy, dé thực hiện đề tai, tác giả sẽ tiến hành nghiên cứu dựa trên bộ số
liệu được cung cấp tại thị trường MI
1.5.2 Thực trạng tại thị trường MĩTheo Work Institute tổng hợp dữ liệu và công bố báo cáo thông kê vào năm 2020,
tỷ lệ nghỉ việc tại Mĩ năm 2020 là 20% Trong đó, cứ mỗi 4 nhân viên nghỉ việc
Trang 25EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Tương tự như ở thị trường Việt Nam, tai Mi, ngành Bán lẻ và Thuong mai điệntử cũng đứng đầu về tỷ lệ nghỉ việc trong số các nhóm ngành với 30.7% Tiếptheo đó là nhân sự thuộc nhóm Gaming, Giải trí và Truyền thông với tỷ lệ là22.6% Nhóm ngành có tỷ lệ nghỉ việc thấp nhất là Nhóm ngành Năng lượng với
15.2%.
Zippia — một công ty chuyên về tuyên dụng tại Mĩ đưa ra thống kê rằng: gần mộtnửa nhân viên nói rằng họ sẽ không nghỉ việc cho tới khi họ tìm được một côngviệc thay thế Trong khi đó, khoảng 22% thi tự tin rằng bản thân có thé nhanhchóng tìm được một công việc mới sau khi kết thúc công việc hiện tại 36% nóirằng họ sẵn sàng nghỉ việc chỉ đơn giản là vì họ cảm thấy không hạnh phúc với
công việc của họ Ngoài ra, báo cáo của Prudential Financial cùng năm cũng cho
thấy hơn một nửa số người lao động sẵn sàng rời bỏ công việc hiện tại của mìnhnếu có bên khác đưa ra được các đãi ngộ và lợi ích phù hợp
1.6 KET QUÁ NGHIÊN CỨU
Bài nghiên cứu của Sarah S Alduayj thực hiện vào năm 2018 với mục tiêu sử
dụng các mô hình Machine Learning dé dự đoán hao mòn nhân lực dựa trên các
yếu tố được cung cấp Đầu tiên, với dữ liệu không cân bằng ban đầu được huấn
luyện qua một số các mô hình dự đoán, SVM bậc hai đưa ra được kết quả caonhất với F1 scores là 0.50 Tiếp đến, sử dụng ADASYN để tiếp cận, đã giúp cânbằng giữa hai nhóm Lúc này thì hiệu quả của các mô hình được cải thiện đángkể: cubic, Gausian, Random Forest và K- nearest Neigbors (K = 3) có được F1
scores cao, năm trong khoảng từ 0.91 đến 0.93 Bên cạnh đó, kết quả cũng khatương tự khi sử dụng chọn yếu tố, Random Forest đạt 0.92 F1 scores chỉ với 2
yếu tố, và đạt 0.90 với việc sử dụng top 12 yếu tố để dự đoán
Bài nghiên cứu được thực hiện bởi Madara PRATT, Mohcine BOUDHANE, Sarma
CAKULA (2021) sử dụng cùng bộ đữ liệu bài nghiên cứu sử dụng với mục đích
đưa ra sự so sánh khi sử dụng các phương pháp Machine Learning khác nhau déđưa ra dự đoán về một nhân viên có khả năng dời công ty hay không Bài nghiêncứu này sử dụng 6 thuật toán Machine Learning khác nhau Kết quả cho thấyrằng thuật toán Random Forest phù hợp rất trong việc dự đoán ý định nghỉ việccủa nhân viên Dự đoán chính xác nhất đạt mức 85.12%, được coi là độ chínhxác khá tốt
Sau khi nhận thấy rằng Random Forest là thuật toán hiệu quả nhất cho bộ dữ liệu,
tác giả tiếp tục sử dụng thuật toán này dé nhận dạng những yếu tố quan trong';7"
11180795 - PHAM NGUYEN KHÁNH CHI 24
Trang 26EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
nhất tac động đến chi tỷ lệ hao mòn lao động Theo đó, những yếu tố quan trongnhất là thu nhập hàng tháng, tuổi, bậc lương, số năm làm việc, bậc lương hàngtháng Chỉ có 5 yếu tố trong số top10 yếu tô cao nhất được nhận diện là có độquan trọng cao theo kết quả tương quan Pearson Đó là độ tuổi, thu nhập hàng
tháng, tông số năm làm việc, số năm làm ở công ty và số năm làm việc với quan
lý hiện tại Nó cho thấy tầm quan trọng và tính hiệu quả của thuật toán MachineLearning trong việc dự đoán quyết định nghỉ việc của nhân viên và đưa ra kết
quả chính xác hơn Ý nghĩa thống kê cao nhất là thu nhập hàng tháng (0.07), tuổi(0.056), bậc lương hàng ngày (0.053) và tổng số năm lao động (0.05) Khi sosánh với những nghiên cứu trước đó của các tác giả, thì kết quả này khác ở chỗnhắn mạnh tam quan trọng của lương (thu nhập hàng tháng, bậc lương theo ngày/tháng) và độ tuôi (Pratt et al., 2020) Day không phải là những nhân tổ có độtương quan cao, những nhân tố quan trọng đều có liên quan đến động lực và tháiđộ của nhà quản lý Nhiều dé liệu đã làm tăng độ chính xác của thuật toán, cũng
như nhiều yếu tố được bổ sung đã cho thấy được những khám phá khác trongvan đề nghỉ việc của nhân viên
Ở bài nghiên cứu được thực hiện bởi Shenghuan Yang (2021) với bộ dữ liệu
tương tự với mục đích muốn chỉ ra những lý do chính khiến nhân viên muốn
nghỉ việc Bài nghiên cứu này thực hiện phân loại nhóm nhân viên bằng cách sử
dụng phương pháp K — means Clustering và phân loại dữ liệu đã có thành 2
nhóm Tiếp đến, tác giả thực hiện hồi quy nhị phân và phân tích định lượng, đưara được một số các kết quả nhất định
Bài nghiên cứu nay sử dụng Random Forest và K — means Clustering dé lựa
chọn được những yếu tố quan trọng nhất có ảnh hưởng rõ rệt đến sự hao mòn lao
động Theo như kết quả của thuật toán Random Forest, thu nhập hàng tháng, độtuổi, số lượng công ty đã làm việc là những lý do chính khiến nhân viên lựa chọnnghỉ việc Sau đó, tác giả cũng tìm ra rằng những người lớn tuổi hơn, nhữngngười có bậc công việc cao, sự thỏa mãn trong công việc cao, mức lương hangtháng cao, số lượng công ty đã từng làm việc nhiều là những nhóm người sẽthường không nghỉ việc dựa theo kết quả của K — means Clustering
Tuy nhiên thì đối với mỗi người khác nhau sẽ có những ý định khác nhau Chính
vì vậy, tác giả đã sử dụng hồi quy Logistics nhị phân dé so sánh giữa các nhân
viên Kết quả chỉ ra rằng tỷ lệ hao mòn nhân viên nữ thì nhiều hơn 0.659 lần sovới nhân viên năm, những người đã kết hôn hoặc đã li dị thì nhiều hơn lần lượt là
0.427 và 0.304 lần so với những người độc thân Ngoài ra, tỷ lệ hao mòn đối với';7"
11180795 - PHAM NGUYEN KHÁNH CHI 25
Trang 27EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
nhóm người di công tác thường xuyên thì cao hơn 2.4 lần so với nhóm người gần
như không đi công tác Bên cạnh đó, những nhân viên thuộc bộ phận nhân sự thì
thường có xu hướng nghỉ việc nhiều hơn Không chỉ vậy, nghiên cứu này còn chỉra được rang, xét về số lượng công ty đã làm việc, thì những người đã làm ở 2
đến 4 công ty sẽ ít có khả năng rời đi hơn Tỷ lệ hao mòn của nhân viên nữ cũng
ít hơn so với nhân viên nam sau khi làm cho 6 công ty Những người có bằngTiến sĩ thì gần như là luôn luôn có tỷ lệ nghỉ việc thấp nhất
Về mặt hiệu năng của mô hình, Random Forest và H6i quy Logistics có độ chínhxác lần lượt là 84.56% và 88.43%, có nghĩa là mô hình Hồi quy Logistics phủhợp và hiệu quả hơn đôi với việc dự đoán.
F1"
11180795 - PHAM NGUYEN KHÁNH CHI 26
Trang 28EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Chuong 2: PHUONG PHAP NGHIEN CUU
Chương 2 sẽ trình bay về các phương pháp nghiên cứu sé được thực hiện ở bàichuyên đề này Dựa vào các kết quả nghiên cứu đã có từ trước và tổng hợp lại,
bài chuyên đề thực hiện bài toán phân cụm dựa trên phương pháp K — Means
Clustering va bai toán dự báo thông qua 5 phương pháp là K — Nearest Neigbors, Decision Tree, Random Forest, Gradient Boosting va Logistic Regression.
2.1 PHƯƠNG PHAP PHAN CUM K - MEANS CLUSTERING
2.1.1 Giới thiệu Thuật toán K — means Clustering (phân cụm K — means) là một trong nhữngthuật toán cơ bản nhất trong Unsupervised learning (Học tập không giám sát) Ởtrong thuật toán này, label (nhãn) của từng điểm dữ liệu sẽ không được gắn Mụcđích của thuật toán sẽ là làm thế nào để phân đữ liệu thành các cluster (cụm)
khác nhau sao cho dit liệu trong cùng một cụm này có tinh chất, đặc điểm tươngđồng
Original unclustered data Clustered data
Hình 2.1 Mô tả thuật toán K — means ClusteringCluster (cụm) được hiéu theo cách đơn giản nhất chính là tập hợp các điểm ở gầnnhau trong một không gian nhất định, không gian này có thé có rất nhiều chiềutùy thuộc vào lượng thông tin về một điểm dữ liệu Giả sử mỗi cụm có mộtcenfer (điểm đại diện), những điểm xung quanh mỗi điểm đại diện sẽ thuộc vào
cùng nhóm với điêm đại diện đó.
F1"
11180795 - PHAM NGUYEN KHANH CHI 27
Trang 29EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Cluster 2
® Points
+ Cluster Center
Hình 2.2 Vi dụ về bài toán với 3 cụm dữ liệu
Mục tiêu cuối cùng của thuật toán này là từ tap dit liệu ban đầu gồm N điểm dữliệu X = [X1, X2, , Xy]€ Re cung voi sé lượng nhóm mong muốn tìm được K(với K nhỏ hơn N), có thé chỉ ra điểm đại diện của mỗi cụm Œ¡, C;„ ,C„ € IR#“+1và phân chia các điểm đữ liệu vào các cụm tương ứng Giả sử thêm rằng mỗiđiểm dữ liệu chỉ nằm trong một cụm duy nhất
chẽ của phân cụm và được tính như sau:
W (Cy) = dec, (Xi — Cx)?
WSS = Y_, W (Cy)
Trong do:
x; là một điểm di liệu của cụm C;,
Cx là điểm đại điện của cụm CụSỐ lượng cụm (K) tối ưu được xác định theo các bước:
1 Xây dựng thuật toán phân cụm cho các giá trị K khác nhau Giá trị nay sẽ
thường chạy trong khoảng [1, 20].2 Đối với mỗi giá trị K, thực hiện tính tổng bình phương trong cụm (WSS)
3 Biểu diễn WSS theo K dưới dang đồ thị đường cong
11180795 - PHAM NGUYEN KHANH CHI 28
Trang 30EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
4 Số K tối ưu chính là điểm mà ở đó WSS bắt đầu giảm đều Vi tri knee (vị
trí khúc cua) năm trên đô thị chính là sô K cân tìm.
Elbow for KMeans clustering
Average within-cluster sum of squares © ye fFœ ° N >
cụm được chọn dé tiễn hành phân cụm
Phương pháp hình bóng trung bình (Average Silhouette method)
Phương pháp này tính hình bóng trung bình của các quan sát với các giá trị Kkhác nhau Số lượng K tối ưu là cụm tối đa hóa hình bóng trung bình trên một
loạt các giá tri có thé có của K (Kaufman và Rousseeuw, 1990)
Số lượng cụm (K) toi ưu được xác định theo các bước:
1 Xây dựng thuật toán phân cụm cho các gia trị K khác nhau Giá tri này sé
thường chạy trong khoảng [1, 20].2 Đối với mỗi giá trị K, thực hiện tính tính hình hóng trung bình của các
điểm di liệu (Average Silhouette — avg.Sil).3 Biểu diễn avg.Sil theo K dưới dang đồ thị đường cong.4 So K tôi ưu chính là diém năm ở vi trí cực đại trên do thi.
F1"
11180795 - PHAM NGUYEN KHÁNH CHI 29
Trang 31EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Optimal number of clusters
h ;
c 041 i Š 2 Là _—
Như ở trên đô thi minh hoa, vị trí avg.Sil đạt cực đại K = 2 chính la số lượng
cum được chọn dé tiễn hành phân cụm
Phương pháp thống kê khoảng cách (Gap statistic method)Phương pháp nay là phương pháp của R Tibshirani, G Walther, T Hastie của
Đại học
Standford được ông xây dựng vào năm 2001 Thống kê khoảng cách so sánh
tổng biến thể trong cụm với một loạt các giá tri K khác nhau va các giá tri dự
kiến của chúng trong phân phối tham chiếu rỗng của tập dữ liệu Ước tính giá trị
cụm tối ưu là giá trị tối đa hóa về thống kê khoảng cách
Số lượng cụm (K) toi ưu được xác định theo các bước:
1 Nhóm dé liệu quan sát, thay đổi số lượng cụm K € [1, K„„„„]và tính tổng
biến thé trong từng cụm W,2 Tạo tập dữ liệu tham chiếu B với phân phối thống nhất ngẫu nhiên Nhóm
từng bộ dit liệu tham chiếu này với số lượng cụm k khác nhau và tinh tổng
biến thé trong từng cụm Wp3 Tinh thống kê hoảng cách là độ lệch giá trị W„ quan sát so với giá trị kì
vọng W,, trong giả thuyết rỗng
Gap(k) = 5 >p—¡ (Wie) — log (Wy)
LE
11180795 - PHAM NGUYEN KHANH CHI 30
Trang 32EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
4 Chon giá tri K tối ưu là giá trị nhỏ nhất sao cho thống kê khoảng cách
namtrong độ lệch chuẩn khoảng trống tại k+1: Gap(k) > Gap (k + 1) — Sit.Việc sử dung B = 500 cho kết quả chính xác dé biểu đô khoảng cách về cơban không thay đổi sau mỗi lan chạy khác
Optimal number of clusters
Hinh 2.5 Minh hoa dé thi dwong cong biéu dién Gap(k)
theo K (number of clusters)
2.1.3 Các bước tiến hành
Bước 1: Xử lý trước dữ liệu
Khai báo thư viện và tập dữ liệu cần sử dụng lên Google Colaboratory Sau đó,
trích xuất các biến độc lập sử dụng dé xay dung thuat toan phan cum đối tượng.
Bước 2: Tìm số lượng cụm (K) tối ưu
Xác định số lượng cụm (K) tối ưu qua một số các phương pháp xác định cụm đãđược trình bày ở phần trên
Bước 3: Tiến hành xây dựng mô hình với số lượng cụm (K) tối ưu vừa tim
được
1 Chọn ngẫu nhiên K đối tượng từ cụm dữ liệu làm điểm đại điện cụm ban
đầu.2 Gan các điểm dữ liệu theo cụm sao cho khoảng cách Euclide giữa mỗi
điểm dữ liệu đến điểm đại diện của cum là nhỏ nhất.3 Xác định lại giá trị của điểm đại diện mỗi cụm bằng cách tính trung bình
mới cua tat cả các điêm dữ liệu trong 1 cụm.
F1"
11180795 - PHAM NGUYEN KHANH CHI 3]
Trang 33EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
4 Lap lại bước 2 dé gắn nhãn cho tat cả các diém có trong tập dữ liệu theo
giá tri điểm đại diện mới của mỗi cụm.5 Lặp lại bước 3 sau khi không còn sự phân tích lại dữ liệu, đến khi điểm
đại diện của mỗi cụm không còn thay đôi hoặc đạt đến số lần lặp tối da
Bước 4: Mô tả đặc điểm của các cụmỞ bước này, việc cần làm là đưa ra kết quả biểu diễn của các cụm cũng như các
đặc điểm, tính chất, số lượng điểm dữ liệu của từng cụm.2.1.4 Ưu điểm và nhược điểm của thuật toán
2 Có thé sử dụng ngay cả với tập dữ liệu có kích thước rat lớn Với dit liệu
lớn thì thuật toán hoạt động nhanh hơn phân cụm phân cấp (khi K nhỏ).Phương pháp giúp gắn các điểm dữ liệu vào mỗi cụm dựa trên phép tính
khoảng cách đến các điểm đại diện Vì vậy, nó không giới hạn về số lượngđiểm đữ liệu cần phải xứ lý
3 Dữ liệu ban đầu không bắt buộc phải được gan nhãn nên thường được sử
dụng trong các bài toán thực tế
Trên thực tế, không phải dữ liệu đầu vào đều được thu thập theo hệ thốngnhất định dé được gắn nhãn sẵn Chính vi thế, K — means giúp giải quyếtđược vấn đề gắn nhãn cho tập dữ liệu
2.1.4.2 Nhược điểm
1 Cần phải xác định được số lượng cụm (K) ban đầu
Thuật toán được xây dựng dựa trên sé lượng cụm (K) được đưa vao nên kết
quả cuối cùng phụ thuộc rất lớn vào quyết định lựa chọn giá trị K sao cho tối
ưu được khả năng phân cụm.
2 Nhạy cảm với dữ liệu liễu.
Việc phân cụm dựa trên dữ liệu liên quan đến đối tượng cần phân nhóm Tuy
nhiên, đôi khi việc này sẽ bị ảnh hưởng bởi một số các yếu té bất ngờ hay nói
cách khác là các đặc điêm đặc biệt của một đôi tượng.
F1"
11180795 - PHAM NGUYEN KHANH CHI 32
Trang 34EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
3 Với những cụm dữ liệu gần hoặc chồng lên nhau sẽ dẫn đến khả năng
phân loại sai.
Dữ liệu được gắn nhãn dựa trên phép tính khoảng cách từ điểm đữ liệu đếnđiểm đại điện của cụm Với những cụm điểm đữ liệu nằm gần nhau hoặcchồng lên nhau, thì khoảng cách đến 2 điểm đại diện của 2 cụm có thé gầnnhư nhau vì vậy dẫn đến trường hợp điểm dữ liệu bị gắn nhãn sai sang các
cụm lân cận.
2.2 CÁC PHƯƠNG PHÁP DỰ BÁOTiếp cận bài toán dự báo khả năng sụt giảm nhân lực lao động theo hướng học
máy (Machine Learning), bài chuyên đề đưa ra các phương pháp phân loại baogồm: K — nearest Neighbors, Decision Tree, Random Forest, Support VectorMachine và thuật toán Logistic Regression Từ đó, xác định các yêu tô tác độngđến sự thâm hụt nhân sự và kết hợp dự báo giữa các phương pháp Kết quả được
đánh giá dựa trên các thước đo, ma trận nhằm lẫn.2.2.1 Một số thuật toán Machine Learning
2.2.1.1 Thuật toán K — nearest Neighbors (KNN) 1 Giới thiệu
K — Nearest Neighbors (KNN) là một trong những thuật toán SupervisedLearning (Học giám sát) đơn giản nhất của Machine Learning
Với KNN, trong bài toán Classification (phân loại), label (nhãn) của một điểmdữ liệu sẽ được suy ra từ K điểm dit liệu lân cận theo ý tưởng cơ bản là nhữngđiểm di liệu tương tự nhau sẽ tồn tại gần nhau trong một khoảng không gian
Trong bài toán Regression (hồi quy), đầu ra của một điểm dữ liệu sẽ băng chính
đầu ra của điểm dit liệu đã biết gần nhất (trong trường hợp K = 1), hoặc là trungbình có trọng số của đầu ra của những điểm dit liệu gần nhất, hoặc bằng một mối
quan hệ dựa trên khoảng cách đến các điểm gần nhất đó.Thuật toán KNN sẽ hoạt động tốt hơn khi được áp dụng trong việc phân loại
F1"
11180795 - PHAM NGUYEN KHANH CHI 33
Trang 35SE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Hình 2.6 Minh họa thuật toán K - nearest Neighbors (KNN)
2 Thuật toán và các bước tiến hành
Thuật toán giả định có sự tương đồng giữa các điểm dữ liệu mới chưa được gắnnhãn với các điểm dữ liệu có sẵn và gan nhãn theo danh mục dit liệu giống nhấttrong số các danh mục đã có sẵn
Các bước tiến hành
Bước 1: Xử lý trước số liệuChia tập đữ liệu đầu vào thành 2 tập là tập train (huấn luyện) và tập test (thử
nghiệm) Bước 2: Xây dựng thuật toán với tập train
Thuật toán KNN được tiến hành với tập train dựa theo các bước như sau:
- _ Xác định giá trị của tham số K (số láng giéng lân cận gần nhất)
Ở bước đầu xây dựng thuật toán sẽ không có cách cụ thé nào dé lựa chọn
được giá tri tốt nhất của K Vì vậy, giả tri ưu tiên nhất sẽ được lựa chọn theo
- Tinh khoảng cách giữa các query point (điểm dữ liệu cần phân lớp) với tat
cả các đối tượng trong tập huấn luyện
Khoảng cách giữa 2 điểm dữ liệu x, y co thé được tính theo một số cách sau:
"HH
11180795 - PHAM NGUYEN KHÁNH CHI 34
Trang 36EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
Khoảng cách Euclidean (Được sử dung nhiễu nhất
- Sap xếp các khoảng cách đã được tính theo thứ tự tăng dan và xác định số
láng giềng gần nhất với điểm dữ liệu cần phân lớp.- Trong số K láng giéng thân cận, xác định số lượng điểm dữ liệu trong
từng nhóm loại có thể có.- Găn nhãn cho điểm dữ liệu cần phân lớp theo loại dit liệu mà số lượng
láng giéng thé hiện là nhiều nhất
Bước 3: Dự đoán kết quả thử nghiệmBước 4: Kiểm tra độ chính xác
Bước 5: Hình dung kết quả bộ thử nghiệm3 Ưu điểm và nhược điểm của thuật toánƯu điểm
- _ Thuật toán đơn giản, dễ thực hiện.
- _ Không có yêu cầu về sự phân phối của các lớp nhóm.- _ Hoạt động tốt với bộ dit liệu có tập train lớn
Nhược điểm
- KNN nhạy cam đối với dữ liệu nhiễu khi giá trị K nhỏ.- Két quả của bài toán phụ thuộc khá nhiều và việc chọn số lượng lang
giềng thân cận K.
- _ Tốn nhiều thời gian và chi phí tính toán do phải tính khoảng cách từ điểm
dữ liệu cân phân loại đên tat cả các diém dữ liệu khác có trong tập.
F1"
11180795 - PHAM NGUYEN KHANH CHI 35
Trang 37EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
2.2.1.2 Thuật toán Decision Tree 1 Giới thiệu
Decision Tree (Cây quyết định) là một mô hình Supervised Learning (Học giám
sát) có thể được áp dụng cho cả hai bài toán phân loại và hồi quy, nhưng chủ yếu
được ứng dụng vào việc xử lý các bài toán phân loại.
Decision Tree (Cây quyết định) còn có hai tên gọi khác là Regression Tree (Câyhồi quy) va Classification Tree (Cây phân loại) Cây hồi quy được sử dụng déước lượng các ham có giá tri là số thực, ví dụ như ước tính giá nhà hay ước tính
giá cô phiếu Cây phân loại được thực hiện khi biến phụ thuộc là biến phân loại
như phân loại rượu hay dự báo sự thâm hụt nhân viên (có nghỉ việc hay không).
Cây quyết định thường được lựa chọn dé phân loại do có khả năng bắt chước tưduy con người trong việc quyết định và có thể dễ dàng hiểu được ý nghĩa khi
nhìn vào kết quả của thuật toán.2 Thuật toán và các bước tiến hành
Phân tích toán họcDữ liệu đầu vào cho trước ở dạng
(x, y) = (X1, Xa› ; Xn Y)
Trong đó:y là biến phụ thuộc, biến cần tìm hiểu (phân loại hoặc dự đoán)X41, ạ, , Xy là các biến độc lập giúp xây dựng thuật toán
Cấu trúc của một cây quyết định
Root Node
Internal Node Leaf Node
Nut quyét dinh Nut la
Leaf Node Leaf Node Nut la Nut la
Hình 2.7 Cấu trúc của một cây quyết định
F1"
11180795 - PHAM NGUYEN KHÁNH CHI 36
Trang 38EE CHUYEN DE THUC TẬP CHUYEN NGÀNH TOÁN KINH TE
- _ Trên cùng của cây được gọi là Root Node (nút gốc cây quyết định).- Mỗi Internal Node/Decision Node (nút quyết định) biểu diễn một thuộc
thuộc tinh và có thé phân chia thành nhiều nhánh nhỏ.- Branch (Nhánh) biểu diễn các giá trị có thé có của mỗi thuộc tính
- Leaf Node (nút lá) biểu diễn đầu ra của các cây quyết định không chứa
các nhánh con Phương pháp xây dựng thuật toánTạo ra một cây quyết định sẽ đi qua 2 giai đoạn là tỉa cây và tạo cây
- Tao cây là quá trình phân tích, chia tập dữ liệu thành những tập dữ liệu
nhỏ dựa trên các thuộc tính được lựa chọn.- Sau khi tạo ra được cây quyết định cần tỉa cây bang cách xác định và xóa
các nhánh có phan tử nhiễu hoặc những phan tử không thé phân lớp.Các bước tiến hành
Bước 1: Xử lý trước số liệuChia tập đữ liệu đầu vào thành 2 tập là tập train (huấn luyện) và tập test (thử
nghiệm) Bước 2: Xây dựng thuật toán với tập train
Thuật toán Decision Tree được tiễn hành với tập train dựa theo các bước như sau:
- Bat đầu cây quyết định tai Root node chứa toàn bộ tập train
- _ Lựa chọn thuộc tích phân tách lớp.
Cây quyết định được xây dựng dựa vào phép phân tách dữ liệu tại mỗinode dựa trên thuộc tính của biến đầu vào để đưa ra sự phân tách tốt nhất
Dựa trên các loại biến đầu vào của tập dữ liệu có thể chia ra những phép
phân tách cơ bản sau:Phép phân tách dựa trên các biến dau vào dang số
Phép phân tách có dang X > NThường chỉ kiểm tra trên một mẫu giá trị của biến do không thé kiểm trađược hét toàn bộ giá tri của biên dau vảo.
Phép phân tách dựa trên biến dau vào dạng định tinhThuật toán cơ bản nhất là đối với mỗi một gia tri của biến sẽ tách nhỏthành một nhánh, tương đương với một lớp phân loại.
Phương pháp phố biến hon là nhóm các lớp dự đoán có cùng kết quả, cóthể gộp 2 lớp nếu chỉ khác 1 giới hạn
F1"
11180795 - PHAM NGUYEN KHANH CHI 37