Theo số liệu thông kê từ Hiệp hội Quản lý Nguồn nhân lực tại Hoa Kỳ SHRM, tình trạng nghỉ việc của nhân viên đang là một thách thức đối với các công ty ở Hoa Kỳ... 1.3 Mục tiêu nghiên cứ
Trang 1
TỎNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA QUẢN TRỊ KINH DOANH
BAI HOC TON BUC THANG TON DUC THANG UNIVERSITY
BAI BAO CAO CUOI KY MON UNG DUNG PHAN TICH DU LIEU LON
Khoa: 21 Nhom: K1721 Sinh viên thực hiện:
I Nguyễn Thị Trâm Anh 71706244
2 Nguyễn Thị Thu Thảo 71706161 3 Nguyễn Thị Câm Tú 71706209
THANH PHO HO CHi MINH, THANG 9 NAM 2021
Trang 2
NHẬN XÉT CỦA GIẢNG VIÊN
Trang 4DANH MỤC HÌNH ẢNH 52 2212121221222112221222211222222122212 re 1 DANH MỤC BÁNG 2 2212222212222 eeu 2 DANH MỤC BIÊU ĐỒÔ 2 2222222222211 ea 2 CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU 22 2212222 re rgrvo 3
11 Lý do chọn để tđài tr t1 ngu ryn 3
12 Giới thiệu tông quan về công ty IBM nen rruyn 6
1.3 Mục tiêu nghiên CỨU 2 2222211211211 21 1211221212111 221 12111211011 01 1x 81 tr cay 7
2.1 Lý thuyết về quyết định nghỉ việc và các yếu tố ảnh hưởng sào 9
2.1.1 Lý thuyết về quyết định nghỉ việc - 52 nnnH HH ng ườu 9 2.1.2 Ảnh hưởng của sự nghỉ việc s s2 2g rung 9 2.1.3 Các yếu tô ảnh hưởng đến quyết định nghỉ việc Sen 10
2.2 Các nghiên cỨU tTƯỚC 120 121221221121 221 121111211 211122111 2111121111111 kErrey 12
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU 2 S2 22122 22tr ryyn 14 3.1 Thu thập và mô tả đữ liệu 225 2221 222 221222222122 14 3⁄2 Xử lý dữ liệu 2 H222 re 18 3.3 Phân tích khám phá dữ liệu -2-©22s2222221211222 21.222 re 20 3.4 Mô hình nghiên cứu 525 222 22t 222212122 22.22rerrre 27
MỤC LỤC
Trang 5CHUONG 4: KET QUA NGHIÊN CỨU - :: 2222222222tt1trrrrre 33
4.1 Thiét lap mé hinh Two-Class Bayes Point Machine, Two-Class Logistics Regression, Two-Class Decision Forest, Two-Class Support Vector Machine: 34
4.2 Thiét lap m6 hinh Random Forest 0 0.ccccccccscesesssesessrevsessressessresevsenessversentees 36
PHỤ LỤC THAM KHẢÁO 5s s21 2122 2 ng Hee 51
Trang 6DANH MỤC HÌNH ẢNH
Hình 1.1: Ty lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế ĐIỚI 4
Hình 1.2: Ty lệ nghỉ việc tại Mỹ theo ngành 2n nhe Hà Hà e 5
Hình 3.1: Những thuộc tính ảnh hưởng nhiều nhất đến biến “Attrition” bang Filter
Based Feafure ŠeleCHOT cu nhà HH TH HH HH HH tiết 19
Hình 3.2: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bằng Filter
Based Feature Selecftion - 2 1 22122111221 1212121112112212211171 20112212025 E12 1x Ha 19
5 .ằ`¬ằ 34 Hình 4.2: Mô hình Random Forest trên Azure Machine Learning - 36 Hình 4.3: Kết quả mô hình Random Forest thông qua Metries - sen 38 Hình 4.4: Kết quả Random Forest thông qua ma trận Confision Matrix 39 Hinh 4.5: Setup Web Service cua m6 hinh Two-Class Logistics Regression 40 Hình 4.6: Kết quả dự đoán khả năng nghỉ việc của nhân viên bằng mô hình Two-Class I3 85c 8 ồÖỒÖ.Ầˆắ5 42
Trang 7DANH MỤC BẢNG Bảng 3.1: Mô tả biến 0 n2 2221221221 21 2g ưa 18 Bảng 3.2: Chỉ số ảnh hưởng các thuộc tính có ảnh hưởng nhiều nhất đến biến
“ ATHEOT TQ 0 0 tt vn TH 1111121211 HH0 111111111111 11111111 111111111111 111111112 111111 1E cH 20
Bảng 4.1: Chỉ số so sánh kết quá các mô hình 22 2 2n t212222 2z erryn 35
DANH MỤC BIÊU Ð
Biéu dé 3.1: Théng kê số lượng nhân viên nghỉ việc tại IBM àìà se 20
Biéu dé 3.2: Thống kê số lượng nhân viên nghỉ việc theo áp lực tăng ca 21 Biéu dé 3.3: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong các mỗi quan hệ ở công ty ses esse eesesesves sees ves eeseseseeeereuieeseenevetseteteiseneeneieeneeenees 22
Biéu dé 3.4: Thống kê số lượng nhân viên nghỉ việc theo mức đệ hài lòng về môi
Trang 8CHƯƠNG I: GIỚI THIỆU ĐÈ TÀI NGHIÊN CỨU 1.1 Lý do chọn đề tài
Trong nền kinh tế cạnh tranh ngày nay và sự chuyên môn hóa, mua lại công nghệ ngày càng cao, việc nghiên cứu và phân tích dữ liệu đang tạo ra kiến thức mới,
được gọi là “nền kinh tế trí thức” Công nghệ thông tin không chỉ là nguồn dữ liệu mà trên hết, là yếu tố tạo điều kiện cho phân tích đữ liệu, làm cho có thê xử lý các bộ sưu
tap đữ liệu lớn và cho phép thông tin được rút ra chuẩn xác
Trong các tô chức, có một số lĩnh vực mà việc ap dụng AI - trí tuệ nhân tạo sẽ
tác động đến quá trình ra quyết định Những năm gần đây, nguồn nhân lực ngày càng được chú trọng Chất lượng và kỹ năng của nhân viên tạo thành yếu tố tăng trưởng và
một lợi thể cạnh tranh thực sự cho các cong ty
Tuy nhiên trong những năm gần đây, nhiều công ty đang gặp phải tình trạng nhân viên “nhảy việc”, nhân viên không gắn kết lâu đài với công ty Khi một nhân viên
nghỉ việc, công ty không những mất đi một nhân viên có giá trị, mà còn gây ra nhiều
ton thất cụ thê là thời gian, chỉ phí tuyên dụng, đào tạo nhân viên mới, gia tăng các sai sớt do nhân viên mới chưa quen với công việc, thậm chí gây mất niềm tin, sự đoàn kết của các thành viên trong nội bộ, Theo Mohd & Lim, 2007 các công ty khong giảm ty
lệ nghỉ việc của nhân viên thì có khả năng sẽ giảm khả năng cạnh tranh trong thời gian
đài Một nhân viên sẽ chọn ở lại hoặc rời khỏi một tổ chức phụ thuộc vào nhiều nguyên
nhân như cơ hội phát triển nghề nghiệp, môi trường làm việc, hành vi quản lý, đặc điểm công việc, lương thưởng và phúc lợi, cân bằng giữa công việc và cuộc sống Nhận thấy tầm quan trọng của đội ngũ nhân viên, các nhà quản lý đã và đang tim moi cach dé duy trì, phát triển và nâng cao nguồn nhân lực Họ phân tích đến các
Trang 9hưởng như thế nào đến quyết định gắn bó hoặc rời đi của nhân viên nhằm đưa ra những giải pháp giúp nhân viên gắn bó lâu dài hơn với tô chức
© _ Tình hình về nghỉ việc của nhân viên tại Mỹ
Theo Tông cục Thống kê lao động ở Mỹ, có khoảng 3 triệu người Mỹ nghỉ việc
mỗi tháng với tỷ lệ cao hơn so với Châu Âu và Châu Phi
13.9% 13.9% 13.9%
3 13.3% 13.4% 134% 134X
11.4M1.4X
@ Americas @ Europe, Middle East and Africa Asia Pacific
Hình 1.1: Ty lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế gidi
Tại Mỹ, tỷ lệ nhân viên nghỉ việc có sự khác nhau giữa các ngành nghề, cụ thé năm 2015 ty lệ nghí việc trung bình là 13.7% trong đó ngành khách sạn có tý lệ nhân viên nghỉ việc cao nhất 17,8%, ngành chăm sóc sức khóe là 14,2% trong khi đó, ty lệ thấp hơn rất nhiều trong các ngành công nghiệp khác, như bảo hiểm 8,8%, tiện ích 6,1%, xây đựng và sản xuất Đến năm 2020, tỷ lệ này có xu hướng giảm nhưng vẫn còn cao hơn so với toàn cầu 10.9%,
Trang 10Nghỉ việc
Tỷ lệ nghỉ việc tại
Hình 1.2: Ty lệ nghỉ việc tại Mỹ theo ngành
Với hiện trạng thiếu hụt nguồn nhân lực ở các ngành nghề tăng cao, thì nhân viên khi có kinh nghiệm trong lĩnh vực nghề, sẽ có những ý định nghỉ việc dé tim
những nơi đem cho họ cơ hội mới Phân lớn (81%) nhân viên đã tự nguyện rời đi để có
cơ hội việc làm tốt hơn Một nửa số nhân viên được khảo sát cho biết họ sẽ nghỉ việc nếu họ tìm thay một công việc linh hoạt hơn Một nửa số nhân viên Hoa Kỳ đã nghĩ đến việc rời bỏ công ty hiện tại của họ
e® Hơn 20% nhân viên nhận thấy có cơ hội thăng tiến trong nghề nghiệp sẽ có
khả năng ở lại làm việc cao hơn
® Các nhân viên trẻ mong muốn có sự linh hoạt trong công việc, 84% thế hệ
millennials muốn cân bằng giữa công việc và cuộc sống, 36% chọn phương án làm việc tại nhà thay vì tăng lương
® 31% nhân viên nghỉ việc vì văn hoá, môi trường làm việc của công ty không như họ mong nghĩ, trong đó nhân viên da đen có ý định nghỉ việc chiếm 35% cao hơn so với nhân viên da trắng 27%
Theo số liệu thông kê từ Hiệp hội Quản lý Nguồn nhân lực tại Hoa Kỳ (SHRM),
tình trạng nghỉ việc của nhân viên đang là một thách thức đối với các công ty ở Hoa Kỳ
Trang 11tìm người thay thé
Một nghiên cứu của Center for American Progress (Tô chức nghiên cứu và vận động chính sách công tại Mỹ) chỉ ra rằng các công ty thường phải chỉ trả khoảng 1/5 số
tiền lương của một nhân viên đề thay thế họ và chỉ phí có thê tăng lên đáng kế nếu
những chức vụ cao hoặc những nhân viên được trả lương cao cần tìm người thay thé
Việc năm bắt được tại sao và khi nào nhân viên có khả năng nghỉ việc cao có thể
giúp nhà quản lý đưa ra các phương án hành động đề giữ chân nhân viên lâu hơn cũng
như có kế hoạch tuyển dụng phù hợp Nhóm chúng tôi đã tiến hành nghiên cứu thực hiện để tài “Dự báo khả năng nghỉ việc của nhân viên tại công ty IBM ở Mỹ bằng mô
hình Azure Machine Learning” Thông qua bài nghiên cứu này sẽ cung cấp một mô
hình mang tính chất tham khảo giúp dự báo khả năng nghỉ việc hay tiếp tục ở lại dựa trên những yếu tố co ban từ đó có thể giúp nhà quản lý đưa ra những phương án hành
động đề giữ chân nhân viên lâu hơn cũng như lập kế hoạch tuyển đụng phù hợp 1.2 Giới thiệu tông quan về công ty IBM
IBM - Tập đoàn công nghệ đến từ USA (viết tat cua International Business Machines) là một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New York, Mỹ Được thành lập năm 1911, công ty IBM là một trong số ít các công ty công nghệ của thế kỷ thứ 19 vẫn còn tồn tại cho đến ngày nay Các sản phẩm được IBM sản
xuất và bán ra chủ yếu là phân cứng và phần mềm máy tính, bên cạnh đó là các dịch vụ
cơ sở hạ tầng, hosting và tư vấn trong nhiều lĩnh vực từ máy tính lớn đến công nghệ
Tiano
IBM được biết đến gần đây như là một công ty sản xuất máy tính hàng đầu thé
Trang 12lớn nhất trên toàn thế giới Năm 201 1, ITBM đã xếp thứ 2 trong top 10 thương hiệu lớn nhất thế giới với giá trị thương hiệu lên đến 70 tỷ USD
IBM đã liên tục cải tiến AI sử dụng trong việc quản lý nguồn nhân sự tại công
ty, bà Rometty - CEO của IBM đã chia sẻ trong nhiệm kỳ CEO 7 năm của mình “Thời
điểm tốt nhất để có được nhân viên là trước khi họ bỏ việc” Rometty nhận định rằng,
mô hình nhân sự truyền thống cần một cuộc đại tu, và đó là một trong số những chuyên
môn mà con người cần sự hễ trợ của AI để cải thiện hiệu quả
Bằng việc hiểu rõ hơn những mẫu đữ liệu và các kỹ năng liên quan, AI của IBM
có thé tap trung vào thế mạnh của mỗi cá nhân Điều này sẽ giúp quản lý có thê chỉ dẫn
nhân viên tới những cơ hội trong tương lai mà khó có thể xác định khi sử dụng phương
pháp truyền thống “Chúng tôi nhận ra rằng bảng khảo sát bởi quản lý không hề chính
xác, đánh giá của quản lý mang tính chủ quan, chúng tôi có thê đưa ra nhận định một cách chính xác hơn từ đữ liệu” bà Rometty nói về quy trình đánh giá kỹ năng
Vi vậy, nhóm chúng tôi mong muốn thực hiện việc để xuất một mô hình dự
đoán khả năng nghỉ việc của nhân viên đề có thể giúp ban lãnh đạo quản lý sử dụng nguồn nhân sự của công ty một cách chính xác và hiệu quả hơn
1.3 Mục tiêu nghiên cứu
Đề tài nghiên cứu của chúng tôi tập trung vào các giải quyết các vấn đề như sau:
* Tìm hiểu các yếu tế cơ bản ảnh hưởng đến quyết định nghỉ việc hoặc tiếp tục làm việc của nhân viên tại công ty IBM
s Để xuất ra mô hình giúp công ty IBM cũng như các doanh nghiệp có thé ap dụng để dự đoán khả năng nghí việc của nhân viên nhằm nâng cao công tác
Trang 13Đề hỗ trợ việc nghiên cứu, cần đặt ra các câu hỏi nhằm mục đích giải quyết các thắc mắc đang gặp phải cũng như để hiểu rõ hơn về vấn đề:
Các yếu tổ ảnh hưởng đến vấn đề nghỉ việc của nhân viên? Yếu tô nào là quan
trọng nhất?
Mô hình nào phủ hợp nhất đê dự đoán quyết định nghỉ việc của nhân viên? Giải pháp để nhà lãnh đạo có thể hạn chế được quyết định nghỉ việc của nhân
viên trong công ty, nâng cao hiệu quả quản lý nguồn nhân lực hơn?
1.5 Ý nghĩa của nghiên cứu
Bài nghiên cứu này, tiết kiệm tài nguyên, giảm bớt sự lo lắng của các nhà quản
lý Và chí ra cho các nhà quản lý cơ sở đề sửa đôi, cải thiện các yêu câu làm việc của
nhân viên nhằm giữ chân họ lại
1.6 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: quyết định nghỉ việc của nhân viên tại công ty IBM ở
Mỹ
Phạm vi nghiên cứu: mô hình được lay dữ liệu tại Hoa Kỳ được cung cấp bởi
IBM Analytics
1.7 Bồ cục bài nghiên cứu
Chương I: Giới thiệu đề tài nghiên cứu
Chương 2: Cơ sở lý thuyết
Trang 14s _ Chương 5: Kết luận và đề xuất giải pháp
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2,1 Lý thuyết về quyết định nghỉ việc và các yếu tổ ảnh hưởng
2.1.1 Lý thuyết về quyết định nghỉ việc
Theo Tommy Thomas, 2009 quyết định nghỉ việc là tình trạng xảy ra khi nhân viên của một tổ chức lựa chọn đưa ra quyết định chấm dứt hợp đồng lao động với tổ chức
Theo Tett & Meyer, 1993 quyét định nghí việc là hành động có ý thức, có sự cân
nhắc trước khi rời khỏi tô chức hiện tại
Theo Mobley, 1997 quá trình đưa ra quyết định nghỉ việc là một chuỗi các giai
đoạn nhận thức, bắt đầu từ việc đánh giá công việc hiện tại, tiếp theo là cảm giác thỏa
mãn hoặc không thoả mãn về công việc hiện tại, nếu không thoả mãn họ sẽ nghĩ đến
việc nghỉ việc Kế tiếp họ sẽ đánh giá tìm kiếm việc làm khác và chi phí bỏ ra Nếu họ
nhận thấy sự thay thế là có sẵn và chi phí bỏ ra không cao, họ sẽ thực hiện việc tìm
kiếm và đánh giá các lựa chọn Từ đó ý định nghỉ việc sẽ được kích thích và cuối cùng
là đưa ra quyết định nghỉ việc
2.1.2 Ảnh hưởng của sự nghỉ việc
Theo Chan và cộng sự, 2001 đã khăng định nhân viên nghỉ việc là một vấn đề
nghiêm trọng đối với tô chức, đặc biệt trong lĩnh vực quản trị nhân sự Ông cho rằng tỷ
lệ nghí việc cao sẽ gây bất lợi cho tô chức thông qua việc gia tăng các loại chỉ phí, ảnh
hưởng trực tiếp và gián tiếp tới tô chức
Trang 15® Ảnh hưởng trực tiếp: Khi một nhân viên nghỉ việc, công ty phải mắt 78.000 USD dé thay thế nhân viên nghỉ việc (Ramsey Smith, 2004), bao gồm:
- Chi phi cho tuyén dung, chi phí đào tạo cho nhân viên (Alexander và cộng su,
® Ảnh hưởng gián tiếp:
- Gay thiếu hụt nhân sự có chuyên môn và kinh nghiệm, làm giảm hiệu suất công việc và giản đoạn hoạt động của dự án
- Ảnh hưởng tinh thần làm việc của nhân viên khác
-_ Thông tin, tình hình kinh doanh cũng như chính sách, khách hàng thân thiết của tô chức cũng có nguy cơ bị chia sẻ ra bên ngoài đặc biệt nguy hiểm khi nhân viên chuyên sang làm việc cho đối thủ cạnh tranh
2.1.3 Các yếu tổ ảnh hướng đến quyết định nghỉ việc
Hiện nay, công tác nghiên cứu về các yếu tô ảnh hưởng tới quyết định nghỉ việc
của nhân viên đã được nhiều nhà nghiên cứu tìm hiệu, nhóm tác giả nhận thấy có 2 yếu
tố chính ảnh hưởng đến quyết định này là: yếu tố cá nhân và yếu tổ tô chức
®© Yếu tô cá nhân:
Trang 16Age: tuôi tác có thê ảnh hưởng đến quyết định nghỉ việc của nhân viên Theo
Pitts và cộng sự, 2011 cho thấy ý định nghỉ việc sẽ xuất hiện và tăng trong giai
đoạn tuôi đầu tiên tham gia vào lao động sau đó thì giảm lại
Gender: theo kết quả từ các nghiên cứu cia Knapp, 1982; Schwartz, 1989;
Powell và York, 1992 đã có kết luận rằng có mối quan hệ giữa giới tính và quyết định nghỉ việc, và họ phân tích rằng khả năng nữ giới rời bỏ nơi làm việc
nhiều hơn nam giới
Edueation: trình độ học vấn cá nhân cũng là một nhân tố tác động đến quyết định nghỉ việc, các nghiên cứu đã đưa ra kết luận là người lao động có trình độ học vấn càng cao thì càng có nhiều cơ hội tìm kiếm công việc thay thế theo Cordes va Dougherty, 1993; Todd va Deery Schimit, 1996; Blankertz va Robinson, 1997
Overtime: theo phân tích của Zangaro và Socken, 2007 về sự hài lòng công việc đã nhận thấy rằng làm thêm giờ gây ra căng thẳng trong công việc, nó mang tính tương quan mạnh mẽ đến sự hài lòng trong công việc
Marital Status: theo Krau, 1981 tinh trạng hôn nhân cũng có thể ảnh hưởng đến sự hao mòn nhân lực Số con, trách nhiệm khi có gia đỉnh sẽ tạo ra các nhu cầu ổn định
Monthly Income: trong phan tích của Griffth và cộng sự, 2000 thảo luận về tác dụng và trả công sự thoả mãn Họ nhận thấy điều quan trọng nhất là nhân viên phải có cảm giác công bằng trong tiền lương Theo MeConnell, 2007 cho rằng mức lương là nguyên nhân hàng đầu gây ra ý định nghỉ việc của nhân viên Theo Willis, 2000 tiền lương, thưởng là vấn để quan trọng nhất khi nói
Trang 17nghỉ việc của người lao động Người lao động làm việc cho tô chức với thời
gian càng dai, họ sẽ càng gắn bó với tô chức và tiếp tục làm việc cho tổ chức
lâu dài hơn theo Miller và Wheeler, 1992; Krecker, 1994; Lane, 1998
®© Yếu tổ tổ chúc:
Job Level: theo Delfgaauw Josse, 2007 sự không hài lòng với một lĩnh vực công việc chẳng hạn như nhiệm vụ họ đang làm có thê đây người lao động ra khỏi công việc đó, họ sẽ tìm tới công việc khác phù hợp hơn
Environment Satisfaction: theo Knipht, Crutsinger, Kim, 2006 sự hải lòng
trong môi trường làm việc có thê ảnh hưởng đến quyết định của một nhân viên
ở lại với tổ chức dù vẫn có cơ hội việc làm khác
Relationship Satisfaction: sự hài lòng trong mối quan hệ là sự đánh giá chủ quan về mối quan hệ của một người với nhiều người trong tổ chức Khi sự hài lòng ở mức cao mối quan hệ sẽ kéo đài, và ngược lại
Job Satisfaction: theo két qua nghién ciru cua Bashir va cộng sự, 2012, sự hài lòng với công việc có tác động ngược chiều đến quyết định nghỉ việc Bashir
cũng cho biết kết quả này trùng khớp với nghiên cứu của Hulin, 1966
2.2 Các nghiên cứu trước
K Coussement va D Vanden poel, 2008 với bài nghiên cứu “Integrating the voice of customers through call center email into a decision support system for attrition prediction” Trong nghiên cứu này, họ thiết lập rằng việc
thêm dữ liệu văn bản, phi cầu trúc thành một nhận dạng rời đi thông thường
Các kết qua là nâng cao hiệu suất trong phân tích nhan dang rời đi Nghiên cứu
này hỗ trợ cho những người ra quyết định tiếp thị để cải thiện khả năng nhận biết khách hàng có xác suất rời đi
Trang 18call details to attrition prediction: a data mining approach” Trong nghiên cứu này, thực nghiệm đánh gia phương pháp nhận dạng sự rời đi từ dữ liệu hợp
đồng thuê bao và mô hình cuộc gọi sửa đôi được khai thác từ chỉ tiết cuộc gọi
Điều này được mô tả là phương pháp có khả năng mô tả tiềm năng những
khách hàng tiêu chuẩn với mức hợp đồng cụ thê cho khoảng thời gian dự đoán
được
VV Saradhi va GK Palshikar, 2011 voi bai nghién cứu “Employee churn prediction” đã nghiên cứu và so sánh một số các phương pháp trong Machine Learning để ngăn chặn quyết định nghỉ việc của nhân viên Trong này họ đã thực hiện một số phương pháp để tạo và so sánh các mô hình để có được mô
hình dự đoán tốt nhất
R.Khare, D Kaloya, CK Choudhary và G.Gupta, 2011 đã nghiên cứu về
“Employee attrition risk assessment using logistic regression analysis” Nghiên cứu này sử dụng phương pháp Logistics Regression để ngăn chặn sự rời đi của nhân viên Trong điều này các nhà nghiên cứu thu thập đữ liệu nhân khâu học của nhân viên hiện tại ở công ty Các thông tin này hữu ích để tạo ra những mô hình phân loại nhóm các nhân viên có rủi ro cao Mục tiêu cuối cùng của nghiên cứu là xác định nhóm nhân viên có rủi ro cao đề tô chức chú ý
và ngăn chặn khỏi sự nghỉ việc này
ML Kane- Sellers, 2007 da nghién ciru vé “Predictive models of employee voluntary turnover in a North American professional salesforce using data-mining analysis” Bài nghiên cứu chủ yếu tập trung vào các đặc điểm cá nhân, đặc tính công việc và phát triển nguồn nhân lực (human resources
Trang 19hơn là tiền lương và sự thăng tiễn trong công việc.
Trang 20CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
Chúng tôi đề xuất sử dụng mô hình Azure Machine Learning để dự báo khả
năng nghỉ việc của nhân viên tại công ty IBM theo quy trình như sau:
@ Đầu tiên, chúng tôi thu thập đữ liệu về nhân viên bao gồm cá nhân viên ở quá
khứ và hiện tại
e Thứ hai, chúng tôi áp dụng các kỹ thuật làm sạch dữ liệu khác nhau tạo ra tập dữ
liệu mới đồng thời tiến hành phân tích, mô tả dữ liệu để xác định các thuộc tính
chính ảnh hưởng lớn đến quyết định nghỉ việc của nhân viên
e© Thứ ba, chúng tôi áp dụng mô hình số học Azure Machine Leaming với nhiều
thuật toán khác nhau trên tập đữ liệu đã được xử lý cùng với các biến số đã được
chọn ra để dự báo khả năng nghỉ việc của nhân viên
e Cuối cùng dựa trên kết quả thu thập được, so sánh các chỉ số hiệu suất của mô
hình máy học và chọn ra mô hình có hiệu quả nhất đề giải quyết vấn đề đặt ra và
phát hành phần mềm hỗ trợ nhân sự trong công tác HRM
3.1 Thu thập và mô tả dữ liệu
Đề thực hiện bài nghiên cứu, chúng tôi đã sử dụng bộ đữ liệu “IBM Employee Dataset” duoc cung cấp bởi IBM Watson Analytics tại trang web https:/Avww.kagegle.com/rohitsahoo/employee
Bộ đữ liệu bao gồm 1470 mẫu quan sát với 35 đặc tính khác nhau liên quan đến đời sống làm việc và đặc điểm cá nhân của nhân viên tại Hoa Kỳ bao gồm:
Định nghĩa thuộc
2 Attrition Phan loai Quyét định nghỉ việc
Trang 21Mức độ tham gia vào công việc
Human
Resources/Research & Development/Sales
eS Below College College Bachelor Master
Doctor
Human Resources/Life Sciences/Medical/ Marketing/Technical Degree/Other
Low
Medium High
4 Very High Male/Female
= Low
Medium High Very High
Trang 22Tinh trang hon nhân
Thu thap hang thang
Mức lương theo tháng
Số lượng công ty đã làm trước đây
No/Yes
Low Medium High Very High Low Medium High Very High Fw
Trang 23So nam lam viée 6 vi
tri hién tai
So nam lam viéc ké
từ khi thăng chức
Số năm làm việc với
quản lý hiện tại
Bảng 3.1: Mô tả biến
nghỉ việc va “Yes” đại diện cho một nhân viên đã nghỉ việc tại công ty
chuyên đổi biến phụ thuộc “Attrition” từ định tính (đữ liệu đạng văn bản) thành định
3.2 Xử lý dữ liệu
Để cho mô hình máy học được thực hiện một cách dé dang, chúng tôi tiến hành
lượng (đữ liệu số), cụ thê:
“Yes” duoc ma hoa vé “1”
Trang 24của các biến độc lập đối với biến phụ thuộc Mục đích của việc này là xác định các
biến sẽ tham gia thực hiện mô hình, loại bỏ những biến ít quan trọng hoặc dư thừa vì chúng có thê ảnh hưởng đến việc đưa ra những dự đoán không chính xác
Chúng tôi sử dụng thuật toán Filter Based Feature Selection trên phần mềm
Azure Machine Learning dé kiểm tra mức độ ảnh hưởng của các biến lên biển
“Attrition” thông qua chỉ số Pearson Correlation
Hình 3.3: Những thuộc tính ảnh hưởng nhiều nhất đến biến “Attrition” bang Filter
Based Feature Selection
Hình 3.4: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bằng Filter
Based Feature Selection
Sau quá trình kiểm tra chúng tôi nhận thấy thuộc tính “OverTime” có sự ảnh
hưởng lớn nhất đến sự nghỉ việc của nhân viên, kết quả cụ thể như sau như sau:
Trang 25Những thuộc tính không ảnh hưởng đến biến “Attrition” la “Over18”,
“EmployeeCount” va “StandardHours” véi chỉ số ảnh hưởng bằng 0 sẽ được chúng tôi xoá bỏ Ngoài ra, theo bài tham khảo chính, các biến “HourlyRate”, “MonthlyRate” và
“EmployeeNumber” cũng được tác giả loại bỏ trong quả trình chạy mô hình 3.3 Phân tích khám phá dữ liệu
3.3.1 Thống kê mô tả dữ liệu
Biểu đề 3.1: Thống kê số lượng nhân viên nghỉ việc tai IBM
Có 237 nhân viên nghỉ việc trong tông số 1470 nhân viên, chiếm 16,12% tại
công ty Tuy là con số nhỏ nhưng phòng Nhân sự vẫn muốn biết được lý do dẫn đến sự nghỉ việc của nhan vién IBM
Trang 26Theo như phân tích trên, biến số “Overtime” ảnh hưởng nhiều nhất đến quyết
định nghỉ việc của nhân viên Chúng ta có thé thay duoc chi co 10,44% nhan vién
không làm việc ngoài giờ đã rời bỏ công ty Mặt khác, 30,53% nhân viên lam thêm giờ
đã bỏ việc Vì vậy, chúng ta có thê kết luận rằng làm việc ngoài giờ có thể là một yêu
tố quan trọng quyết định đến sự nghỉ việc của nhân viên trong một tô chức Các chỉ số đánh giá mức độ hài lòng của nhân viên trong công việc, về môi trường làm việc, các mối quan hệ cũng là một trong các nhân tổ ảnh hưởng đến quyết định nghỉ việc của nhân viên
© Mite dé hài lòng trong các mối quan hệ
Trang 27mỗi quan hệ ở công ty
Có thể nói số lượng nhân viên nghỉ việc đối với trường hợp bất đồng với các thành viên trong công ty khá là thấp (16,12% trên tông số nhân viên) Mức độ hài lòng thấp nhất chiếm 20,56% (57/276) lượng nhân viên nghỉ việc Mức độ hài lòng cao
chiếm 14,81% (64/432) Có thé thấy mức độ hài lòng về các mối quan hệ trong công ty càng thấp sẽ có xu hướng nghỉ việc cao hơn
©_ A/ức độ hài lòng về môi trường làm việc
Trang 28Biểu đề 3.4: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng về môi
trường làm việc ở công ty
Môi trường làm việc là một vấn để quan trọng trong việc giữ chân các nhân sự
của công ty Thông qua biểu dé ta có thể thấy mức độ hài lòng càng thấp thì tỷ lệ nhân
viên nghỉ việc càng cao Môi trường làm việc tốt giúp nhân viên cảm thấy thoải mai, dé
chịu, nâng cao tỉnh thần làm việc của nhân viên tạo điều kiện để nhân viên gắn bó lâu dài với tô chức
@ Muc dé hai long trong céng viéc
Biéu đồ 3.5: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong công
việc ở công †y
Trang 29Như chúng ta có thê thấy từ đữ liệu trên, có tỷ lệ thôi việc lần lượt là 22,84%,
16,43%, 16,52% và 11,33% ở các mức độ hài lòng trong công việc l, 2, 3 và 4 Vì vậy,
chúng ta có thê kết luận rằng mức độ hài lòng trong công việc thấp hơn có thê là một
yếu tô liên quan đến sự thôi việc của nhân viên Sự hài lòng trong công việc là một trong những yếu tố quan trọng nhất đối với sự nỗ lực của nhân viên Nếu nhân viên không hoàn toàn hài lòng với công việc của mình, cuối cùng, nhân viên đó sẽ ra đi Các
tổ chức nên thường xuyên đánh giá mức độ hài lòng của nhân viên Trọng tâm chính
của bat kỳ tổ chức nào là làm cho nhân viên của họ hài lòng vì nó gắn liền với năng
suất của nhân viên
Ngoài ra mức thu nhập hằng tháng “Monthly Ineome” cũng được đánh giá là một yếu tố quan trọng ảnh hưởng đến quyết định nghí việc của nhân viên
Biéu đồ 3.6: Thống kê số lượng nhân viên nghỉ việc theo mức thu nhập hằng tháng ở
cong ty
Nhóm có thu nhập từ $1009-$3008 chiếm tỷ lệ 47,68% trong tông số 237 nhân
viên nghỉ việc Họ cân tiền để trang trải cuộc sống nên có nhu cầu nhảy việc đề tìm
công việc mới với mức lương tốt hơn Nhóm có thu nhập thấp nhất từ $15,009-$17,008
Trang 30ra, số lương càng cao đồng nghĩa với trách nhiệm càng lớn, nên phần lớn họ chịu được
áp lực ở mức thu nhập này
3.3.2 Kiếm tra mức độ tương quan
Biéu đồ 3.7: Kiểm tra mức độ tương quan giữa các biến
Chúng tôi str dung ban dé Correlation matrix dé thể hiện sự tương quan giữa các
biến: màu đỏ thê hiện mối tương quan nghịch (mối tương cao có gia tri tir -1 đến -0.7),
màu xanh thê hiện mối tương quan thuận (mối tương quan cao có giá trị từ 0.7 đến 1),
cụ thể như sau:
- Bién “MonthlyIncome” va “JobLevel” với chí số tương quan 0.95: nhân viên có cấp bậc càng cao có xu hướng kiếm được mức thu nhập hằng tháng cao hơn
Trang 31quan lần lượt là 0.78 và 0.77 có nghĩa nhân viên làm lâu năm thường có cấp bậc cao đồng thời mức thu nhập hằng tháng cũng cao hơn
-_ Biến “PercentSalaryHike” và “PerformanceRating” với chỉ số tương quan 0.77:
khi nhân viên nhận được sự tăng lương họ sẽ làm việc tết hơn
- Một số biến khác cũng có sự tương quan thuận cao như “YearsAtCompany”,
“VearsWithCurrentManager” và “YearsInCurrentRole” với chỉ số tương quan là 0.71, 0.76 và 0.77
3.4 Mô hình nghiên cứu
Quả trình mô hình hóa bao gồm việc lựa chọn các mô hình dựa trên các máy
học khác nhau các kỹ thuật được sử dụng trong thử nghiệm Trong trường hợp này, các
mô hình đự đoán khác nhau đã được sử dụng như dựa trên cây quyết định, phương pháp Bayes, hồi quy logistic và SVM Mục tiêu là xác định phân loại tốt nhất cho vẫn
đề phân tích Các thuật toán phân loại được xem xét là:
3.4.1 Gaussian Naive Bayes
NaIve Bayes là một thuật toán dựa trén dinh ly Bayes về lý thuyết xác suất để đưa ra các phản đoán cũng như phân loại dữ liệu dựa trên các dữ liệu được quan sát và
thông kê
Gaussian Naive Bayes là một biến thể của Naive Bayes tuân theo phân phối
chuẩn Gaussian và hỗ trợ dữ liệu liên tục Khi làm việc với dữ liệu liên tục, một giả định thường được đưa ra là các giả trị liên tục được liên kết với mỗi lớp được phân
phối theo phân phối chuân (hoặc Gaussian) Gaussian Naive Bayes hỗ trợ các tính năng
và mô hình có giá trị liên tục phù hợp với phân phối Gaussian (chuẩn)
Trang 32Mô hình này chỉ cân ước tính giá trị trung bình và độ lệch chuẩn của các điểm trong mỗi nhãn, đó là tất cả những gì cần thiết để xác định phân phối như vậy Với mỗi
chiều dữ liệu ¡ và một class c, x¡ tuân theo một phân phối chuẩn có kỳ vọng H ¿ và phương sai ø.¡
3.4.2 Naive Bayes classifier for multivariate Bernoulli models
Trong mô hình Bernoulli đa biến, các đặc trưng là các Boolean độc lập (biến nhị
phân) mô tả đầu vào Giống như MultinomialNB, bộ phân loại này phù hợp với dữ liệu rời rạc Sự khác biệt là trong khi MultinomialNB hoạt động với tần suất xuất hiện, BernoulliNB được thiết kế cho các tinh năng nhị phân / boolean (biến nhị phân)
Loại trình phân loại Naive Bayes này có thê hữu ích khi một từ không mong
muốn muốn được phát hiện hoặc một loại từ cụ thể muốn được gắn thẻ trong một tài
liệu nhất định Ngoài ra, nó phân biệt với phương pháp đa thức bằng cách tạo ra đầu ra nhi phan la 1-0, Dung-Sai hoặc Có-Không