1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề tài dự báo về khả năng nghỉ việc của nhân viên công ty ibm tại mỹ bằng cách sử dụng mô hình azure machine learning

64 1 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Dự Báo Về Khả Năng Nghỉ Việc Của Nhân Viên Công Ty IBM Tại Mỹ Bằng Cách Sử Dụng Mô Hình Azure Machine Learning
Tác giả Nguyễn Thị Trõm Anh, Nguyễn Thị Thu Thảo, Nguyễn Thị Cõm Tỳ
Người hướng dẫn Thể. Phạm Ngọc Bao Duy
Trường học Tôn Đức Thắng University
Chuyên ngành Kinh doanh quốc tế
Thể loại báo cáo
Năm xuất bản 2021
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 64
Dung lượng 3,44 MB

Nội dung

Theo số liệu thông kê từ Hiệp hội Quản lý Nguồn nhân lực tại Hoa Kỳ SHRM, tình trạng nghỉ việc của nhân viên đang là một thách thức đối với các công ty ở Hoa Kỳ... 1.3 Mục tiêu nghiên cứ

Trang 1

TỎNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG

KHOA QUẢN TRỊ KINH DOANH

BAI HOC TON BUC THANG TON DUC THANG UNIVERSITY

BAI BAO CAO CUOI KY MON UNG DUNG PHAN TICH DU LIEU LON

Khoa: 21 Nhom: K1721 Sinh viên thực hiện:

I Nguyễn Thị Trâm Anh 71706244

2 Nguyễn Thị Thu Thảo 71706161 3 Nguyễn Thị Câm Tú 71706209

THANH PHO HO CHi MINH, THANG 9 NAM 2021

Trang 2

NHẬN XÉT CỦA GIẢNG VIÊN

Trang 4

DANH MỤC HÌNH ẢNH 52 2212121221222112221222211222222122212 re 1 DANH MỤC BÁNG 2 2212222212222 eeu 2 DANH MỤC BIÊU ĐỒÔ 2 2222222222211 ea 2 CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU 22 2212222 re rgrvo 3

11 Lý do chọn để tđài tr t1 ngu ryn 3

12 Giới thiệu tông quan về công ty IBM nen rruyn 6

1.3 Mục tiêu nghiên CỨU 2 2222211211211 21 1211221212111 221 12111211011 01 1x 81 tr cay 7

2.1 Lý thuyết về quyết định nghỉ việc và các yếu tố ảnh hưởng sào 9

2.1.1 Lý thuyết về quyết định nghỉ việc - 52 nnnH HH ng ườu 9 2.1.2 Ảnh hưởng của sự nghỉ việc s s2 2g rung 9 2.1.3 Các yếu tô ảnh hưởng đến quyết định nghỉ việc Sen 10

2.2 Các nghiên cỨU tTƯỚC 120 121221221121 221 121111211 211122111 2111121111111 kErrey 12

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU 2 S2 22122 22tr ryyn 14 3.1 Thu thập và mô tả đữ liệu 225 2221 222 221222222122 14 3⁄2 Xử lý dữ liệu 2 H222 re 18 3.3 Phân tích khám phá dữ liệu -2-©22s2222221211222 21.222 re 20 3.4 Mô hình nghiên cứu 525 222 22t 222212122 22.22rerrre 27

MỤC LỤC

Trang 5

CHUONG 4: KET QUA NGHIÊN CỨU - :: 2222222222tt1trrrrre 33

4.1 Thiét lap mé hinh Two-Class Bayes Point Machine, Two-Class Logistics Regression, Two-Class Decision Forest, Two-Class Support Vector Machine: 34

4.2 Thiét lap m6 hinh Random Forest 0 0.ccccccccscesesssesessrevsessressessresevsenessversentees 36

PHỤ LỤC THAM KHẢÁO 5s s21 2122 2 ng Hee 51

Trang 6

DANH MỤC HÌNH ẢNH

Hình 1.1: Ty lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế ĐIỚI 4

Hình 1.2: Ty lệ nghỉ việc tại Mỹ theo ngành 2n nhe Hà Hà e 5

Hình 3.1: Những thuộc tính ảnh hưởng nhiều nhất đến biến “Attrition” bang Filter

Based Feafure ŠeleCHOT cu nhà HH TH HH HH HH tiết 19

Hình 3.2: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bằng Filter

Based Feature Selecftion - 2 1 22122111221 1212121112112212211171 20112212025 E12 1x Ha 19

5 .ằ`¬ằ 34 Hình 4.2: Mô hình Random Forest trên Azure Machine Learning - 36 Hình 4.3: Kết quả mô hình Random Forest thông qua Metries - sen 38 Hình 4.4: Kết quả Random Forest thông qua ma trận Confision Matrix 39 Hinh 4.5: Setup Web Service cua m6 hinh Two-Class Logistics Regression 40 Hình 4.6: Kết quả dự đoán khả năng nghỉ việc của nhân viên bằng mô hình Two-Class I3 85c 8 ồÖỒÖ.Ầˆắ5 42

Trang 7

DANH MỤC BẢNG Bảng 3.1: Mô tả biến 0 n2 2221221221 21 2g ưa 18 Bảng 3.2: Chỉ số ảnh hưởng các thuộc tính có ảnh hưởng nhiều nhất đến biến

“ ATHEOT TQ 0 0 tt vn TH 1111121211 HH0 111111111111 11111111 111111111111 111111112 111111 1E cH 20

Bảng 4.1: Chỉ số so sánh kết quá các mô hình 22 2 2n t212222 2z erryn 35

DANH MỤC BIÊU Ð

Biéu dé 3.1: Théng kê số lượng nhân viên nghỉ việc tại IBM àìà se 20

Biéu dé 3.2: Thống kê số lượng nhân viên nghỉ việc theo áp lực tăng ca 21 Biéu dé 3.3: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong các mỗi quan hệ ở công ty ses esse eesesesves sees ves eeseseseeeereuieeseenevetseteteiseneeneieeneeenees 22

Biéu dé 3.4: Thống kê số lượng nhân viên nghỉ việc theo mức đệ hài lòng về môi

Trang 8

CHƯƠNG I: GIỚI THIỆU ĐÈ TÀI NGHIÊN CỨU 1.1 Lý do chọn đề tài

Trong nền kinh tế cạnh tranh ngày nay và sự chuyên môn hóa, mua lại công nghệ ngày càng cao, việc nghiên cứu và phân tích dữ liệu đang tạo ra kiến thức mới,

được gọi là “nền kinh tế trí thức” Công nghệ thông tin không chỉ là nguồn dữ liệu mà trên hết, là yếu tố tạo điều kiện cho phân tích đữ liệu, làm cho có thê xử lý các bộ sưu

tap đữ liệu lớn và cho phép thông tin được rút ra chuẩn xác

Trong các tô chức, có một số lĩnh vực mà việc ap dụng AI - trí tuệ nhân tạo sẽ

tác động đến quá trình ra quyết định Những năm gần đây, nguồn nhân lực ngày càng được chú trọng Chất lượng và kỹ năng của nhân viên tạo thành yếu tố tăng trưởng và

một lợi thể cạnh tranh thực sự cho các cong ty

Tuy nhiên trong những năm gần đây, nhiều công ty đang gặp phải tình trạng nhân viên “nhảy việc”, nhân viên không gắn kết lâu đài với công ty Khi một nhân viên

nghỉ việc, công ty không những mất đi một nhân viên có giá trị, mà còn gây ra nhiều

ton thất cụ thê là thời gian, chỉ phí tuyên dụng, đào tạo nhân viên mới, gia tăng các sai sớt do nhân viên mới chưa quen với công việc, thậm chí gây mất niềm tin, sự đoàn kết của các thành viên trong nội bộ, Theo Mohd & Lim, 2007 các công ty khong giảm ty

lệ nghỉ việc của nhân viên thì có khả năng sẽ giảm khả năng cạnh tranh trong thời gian

đài Một nhân viên sẽ chọn ở lại hoặc rời khỏi một tổ chức phụ thuộc vào nhiều nguyên

nhân như cơ hội phát triển nghề nghiệp, môi trường làm việc, hành vi quản lý, đặc điểm công việc, lương thưởng và phúc lợi, cân bằng giữa công việc và cuộc sống Nhận thấy tầm quan trọng của đội ngũ nhân viên, các nhà quản lý đã và đang tim moi cach dé duy trì, phát triển và nâng cao nguồn nhân lực Họ phân tích đến các

Trang 9

hưởng như thế nào đến quyết định gắn bó hoặc rời đi của nhân viên nhằm đưa ra những giải pháp giúp nhân viên gắn bó lâu dài hơn với tô chức

© _ Tình hình về nghỉ việc của nhân viên tại Mỹ

Theo Tông cục Thống kê lao động ở Mỹ, có khoảng 3 triệu người Mỹ nghỉ việc

mỗi tháng với tỷ lệ cao hơn so với Châu Âu và Châu Phi

13.9% 13.9% 13.9%

3 13.3% 13.4% 134% 134X

11.4M1.4X

@ Americas @ Europe, Middle East and Africa Asia Pacific

Hình 1.1: Ty lệ nghỉ việc của nhân viên tại Mỹ và các khu vực trên thế gidi

Tại Mỹ, tỷ lệ nhân viên nghỉ việc có sự khác nhau giữa các ngành nghề, cụ thé năm 2015 ty lệ nghí việc trung bình là 13.7% trong đó ngành khách sạn có tý lệ nhân viên nghỉ việc cao nhất 17,8%, ngành chăm sóc sức khóe là 14,2% trong khi đó, ty lệ thấp hơn rất nhiều trong các ngành công nghiệp khác, như bảo hiểm 8,8%, tiện ích 6,1%, xây đựng và sản xuất Đến năm 2020, tỷ lệ này có xu hướng giảm nhưng vẫn còn cao hơn so với toàn cầu 10.9%,

Trang 10

Nghỉ việc

Tỷ lệ nghỉ việc tại

Hình 1.2: Ty lệ nghỉ việc tại Mỹ theo ngành

Với hiện trạng thiếu hụt nguồn nhân lực ở các ngành nghề tăng cao, thì nhân viên khi có kinh nghiệm trong lĩnh vực nghề, sẽ có những ý định nghỉ việc dé tim

những nơi đem cho họ cơ hội mới Phân lớn (81%) nhân viên đã tự nguyện rời đi để có

cơ hội việc làm tốt hơn Một nửa số nhân viên được khảo sát cho biết họ sẽ nghỉ việc nếu họ tìm thay một công việc linh hoạt hơn Một nửa số nhân viên Hoa Kỳ đã nghĩ đến việc rời bỏ công ty hiện tại của họ

e® Hơn 20% nhân viên nhận thấy có cơ hội thăng tiến trong nghề nghiệp sẽ có

khả năng ở lại làm việc cao hơn

® Các nhân viên trẻ mong muốn có sự linh hoạt trong công việc, 84% thế hệ

millennials muốn cân bằng giữa công việc và cuộc sống, 36% chọn phương án làm việc tại nhà thay vì tăng lương

® 31% nhân viên nghỉ việc vì văn hoá, môi trường làm việc của công ty không như họ mong nghĩ, trong đó nhân viên da đen có ý định nghỉ việc chiếm 35% cao hơn so với nhân viên da trắng 27%

Theo số liệu thông kê từ Hiệp hội Quản lý Nguồn nhân lực tại Hoa Kỳ (SHRM),

tình trạng nghỉ việc của nhân viên đang là một thách thức đối với các công ty ở Hoa Kỳ

Trang 11

tìm người thay thé

Một nghiên cứu của Center for American Progress (Tô chức nghiên cứu và vận động chính sách công tại Mỹ) chỉ ra rằng các công ty thường phải chỉ trả khoảng 1/5 số

tiền lương của một nhân viên đề thay thế họ và chỉ phí có thê tăng lên đáng kế nếu

những chức vụ cao hoặc những nhân viên được trả lương cao cần tìm người thay thé

Việc năm bắt được tại sao và khi nào nhân viên có khả năng nghỉ việc cao có thể

giúp nhà quản lý đưa ra các phương án hành động đề giữ chân nhân viên lâu hơn cũng

như có kế hoạch tuyển dụng phù hợp Nhóm chúng tôi đã tiến hành nghiên cứu thực hiện để tài “Dự báo khả năng nghỉ việc của nhân viên tại công ty IBM ở Mỹ bằng mô

hình Azure Machine Learning” Thông qua bài nghiên cứu này sẽ cung cấp một mô

hình mang tính chất tham khảo giúp dự báo khả năng nghỉ việc hay tiếp tục ở lại dựa trên những yếu tố co ban từ đó có thể giúp nhà quản lý đưa ra những phương án hành

động đề giữ chân nhân viên lâu hơn cũng như lập kế hoạch tuyển đụng phù hợp 1.2 Giới thiệu tông quan về công ty IBM

IBM - Tập đoàn công nghệ đến từ USA (viết tat cua International Business Machines) là một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New York, Mỹ Được thành lập năm 1911, công ty IBM là một trong số ít các công ty công nghệ của thế kỷ thứ 19 vẫn còn tồn tại cho đến ngày nay Các sản phẩm được IBM sản

xuất và bán ra chủ yếu là phân cứng và phần mềm máy tính, bên cạnh đó là các dịch vụ

cơ sở hạ tầng, hosting và tư vấn trong nhiều lĩnh vực từ máy tính lớn đến công nghệ

Tiano

IBM được biết đến gần đây như là một công ty sản xuất máy tính hàng đầu thé

Trang 12

lớn nhất trên toàn thế giới Năm 201 1, ITBM đã xếp thứ 2 trong top 10 thương hiệu lớn nhất thế giới với giá trị thương hiệu lên đến 70 tỷ USD

IBM đã liên tục cải tiến AI sử dụng trong việc quản lý nguồn nhân sự tại công

ty, bà Rometty - CEO của IBM đã chia sẻ trong nhiệm kỳ CEO 7 năm của mình “Thời

điểm tốt nhất để có được nhân viên là trước khi họ bỏ việc” Rometty nhận định rằng,

mô hình nhân sự truyền thống cần một cuộc đại tu, và đó là một trong số những chuyên

môn mà con người cần sự hễ trợ của AI để cải thiện hiệu quả

Bằng việc hiểu rõ hơn những mẫu đữ liệu và các kỹ năng liên quan, AI của IBM

có thé tap trung vào thế mạnh của mỗi cá nhân Điều này sẽ giúp quản lý có thê chỉ dẫn

nhân viên tới những cơ hội trong tương lai mà khó có thể xác định khi sử dụng phương

pháp truyền thống “Chúng tôi nhận ra rằng bảng khảo sát bởi quản lý không hề chính

xác, đánh giá của quản lý mang tính chủ quan, chúng tôi có thê đưa ra nhận định một cách chính xác hơn từ đữ liệu” bà Rometty nói về quy trình đánh giá kỹ năng

Vi vậy, nhóm chúng tôi mong muốn thực hiện việc để xuất một mô hình dự

đoán khả năng nghỉ việc của nhân viên đề có thể giúp ban lãnh đạo quản lý sử dụng nguồn nhân sự của công ty một cách chính xác và hiệu quả hơn

1.3 Mục tiêu nghiên cứu

Đề tài nghiên cứu của chúng tôi tập trung vào các giải quyết các vấn đề như sau:

* Tìm hiểu các yếu tế cơ bản ảnh hưởng đến quyết định nghỉ việc hoặc tiếp tục làm việc của nhân viên tại công ty IBM

s Để xuất ra mô hình giúp công ty IBM cũng như các doanh nghiệp có thé ap dụng để dự đoán khả năng nghí việc của nhân viên nhằm nâng cao công tác

Trang 13

Đề hỗ trợ việc nghiên cứu, cần đặt ra các câu hỏi nhằm mục đích giải quyết các thắc mắc đang gặp phải cũng như để hiểu rõ hơn về vấn đề:

Các yếu tổ ảnh hưởng đến vấn đề nghỉ việc của nhân viên? Yếu tô nào là quan

trọng nhất?

Mô hình nào phủ hợp nhất đê dự đoán quyết định nghỉ việc của nhân viên? Giải pháp để nhà lãnh đạo có thể hạn chế được quyết định nghỉ việc của nhân

viên trong công ty, nâng cao hiệu quả quản lý nguồn nhân lực hơn?

1.5 Ý nghĩa của nghiên cứu

Bài nghiên cứu này, tiết kiệm tài nguyên, giảm bớt sự lo lắng của các nhà quản

lý Và chí ra cho các nhà quản lý cơ sở đề sửa đôi, cải thiện các yêu câu làm việc của

nhân viên nhằm giữ chân họ lại

1.6 Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu: quyết định nghỉ việc của nhân viên tại công ty IBM ở

Mỹ

Phạm vi nghiên cứu: mô hình được lay dữ liệu tại Hoa Kỳ được cung cấp bởi

IBM Analytics

1.7 Bồ cục bài nghiên cứu

Chương I: Giới thiệu đề tài nghiên cứu

Chương 2: Cơ sở lý thuyết

Trang 14

s _ Chương 5: Kết luận và đề xuất giải pháp

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2,1 Lý thuyết về quyết định nghỉ việc và các yếu tổ ảnh hưởng

2.1.1 Lý thuyết về quyết định nghỉ việc

Theo Tommy Thomas, 2009 quyết định nghỉ việc là tình trạng xảy ra khi nhân viên của một tổ chức lựa chọn đưa ra quyết định chấm dứt hợp đồng lao động với tổ chức

Theo Tett & Meyer, 1993 quyét định nghí việc là hành động có ý thức, có sự cân

nhắc trước khi rời khỏi tô chức hiện tại

Theo Mobley, 1997 quá trình đưa ra quyết định nghỉ việc là một chuỗi các giai

đoạn nhận thức, bắt đầu từ việc đánh giá công việc hiện tại, tiếp theo là cảm giác thỏa

mãn hoặc không thoả mãn về công việc hiện tại, nếu không thoả mãn họ sẽ nghĩ đến

việc nghỉ việc Kế tiếp họ sẽ đánh giá tìm kiếm việc làm khác và chi phí bỏ ra Nếu họ

nhận thấy sự thay thế là có sẵn và chi phí bỏ ra không cao, họ sẽ thực hiện việc tìm

kiếm và đánh giá các lựa chọn Từ đó ý định nghỉ việc sẽ được kích thích và cuối cùng

là đưa ra quyết định nghỉ việc

2.1.2 Ảnh hưởng của sự nghỉ việc

Theo Chan và cộng sự, 2001 đã khăng định nhân viên nghỉ việc là một vấn đề

nghiêm trọng đối với tô chức, đặc biệt trong lĩnh vực quản trị nhân sự Ông cho rằng tỷ

lệ nghí việc cao sẽ gây bất lợi cho tô chức thông qua việc gia tăng các loại chỉ phí, ảnh

hưởng trực tiếp và gián tiếp tới tô chức

Trang 15

® Ảnh hưởng trực tiếp: Khi một nhân viên nghỉ việc, công ty phải mắt 78.000 USD dé thay thế nhân viên nghỉ việc (Ramsey Smith, 2004), bao gồm:

- Chi phi cho tuyén dung, chi phí đào tạo cho nhân viên (Alexander và cộng su,

® Ảnh hưởng gián tiếp:

- Gay thiếu hụt nhân sự có chuyên môn và kinh nghiệm, làm giảm hiệu suất công việc và giản đoạn hoạt động của dự án

- Ảnh hưởng tinh thần làm việc của nhân viên khác

-_ Thông tin, tình hình kinh doanh cũng như chính sách, khách hàng thân thiết của tô chức cũng có nguy cơ bị chia sẻ ra bên ngoài đặc biệt nguy hiểm khi nhân viên chuyên sang làm việc cho đối thủ cạnh tranh

2.1.3 Các yếu tổ ảnh hướng đến quyết định nghỉ việc

Hiện nay, công tác nghiên cứu về các yếu tô ảnh hưởng tới quyết định nghỉ việc

của nhân viên đã được nhiều nhà nghiên cứu tìm hiệu, nhóm tác giả nhận thấy có 2 yếu

tố chính ảnh hưởng đến quyết định này là: yếu tố cá nhân và yếu tổ tô chức

®© Yếu tô cá nhân:

Trang 16

Age: tuôi tác có thê ảnh hưởng đến quyết định nghỉ việc của nhân viên Theo

Pitts và cộng sự, 2011 cho thấy ý định nghỉ việc sẽ xuất hiện và tăng trong giai

đoạn tuôi đầu tiên tham gia vào lao động sau đó thì giảm lại

Gender: theo kết quả từ các nghiên cứu cia Knapp, 1982; Schwartz, 1989;

Powell và York, 1992 đã có kết luận rằng có mối quan hệ giữa giới tính và quyết định nghỉ việc, và họ phân tích rằng khả năng nữ giới rời bỏ nơi làm việc

nhiều hơn nam giới

Edueation: trình độ học vấn cá nhân cũng là một nhân tố tác động đến quyết định nghỉ việc, các nghiên cứu đã đưa ra kết luận là người lao động có trình độ học vấn càng cao thì càng có nhiều cơ hội tìm kiếm công việc thay thế theo Cordes va Dougherty, 1993; Todd va Deery Schimit, 1996; Blankertz va Robinson, 1997

Overtime: theo phân tích của Zangaro và Socken, 2007 về sự hài lòng công việc đã nhận thấy rằng làm thêm giờ gây ra căng thẳng trong công việc, nó mang tính tương quan mạnh mẽ đến sự hài lòng trong công việc

Marital Status: theo Krau, 1981 tinh trạng hôn nhân cũng có thể ảnh hưởng đến sự hao mòn nhân lực Số con, trách nhiệm khi có gia đỉnh sẽ tạo ra các nhu cầu ổn định

Monthly Income: trong phan tích của Griffth và cộng sự, 2000 thảo luận về tác dụng và trả công sự thoả mãn Họ nhận thấy điều quan trọng nhất là nhân viên phải có cảm giác công bằng trong tiền lương Theo MeConnell, 2007 cho rằng mức lương là nguyên nhân hàng đầu gây ra ý định nghỉ việc của nhân viên Theo Willis, 2000 tiền lương, thưởng là vấn để quan trọng nhất khi nói

Trang 17

nghỉ việc của người lao động Người lao động làm việc cho tô chức với thời

gian càng dai, họ sẽ càng gắn bó với tô chức và tiếp tục làm việc cho tổ chức

lâu dài hơn theo Miller và Wheeler, 1992; Krecker, 1994; Lane, 1998

®© Yếu tổ tổ chúc:

Job Level: theo Delfgaauw Josse, 2007 sự không hài lòng với một lĩnh vực công việc chẳng hạn như nhiệm vụ họ đang làm có thê đây người lao động ra khỏi công việc đó, họ sẽ tìm tới công việc khác phù hợp hơn

Environment Satisfaction: theo Knipht, Crutsinger, Kim, 2006 sự hải lòng

trong môi trường làm việc có thê ảnh hưởng đến quyết định của một nhân viên

ở lại với tổ chức dù vẫn có cơ hội việc làm khác

Relationship Satisfaction: sự hài lòng trong mối quan hệ là sự đánh giá chủ quan về mối quan hệ của một người với nhiều người trong tổ chức Khi sự hài lòng ở mức cao mối quan hệ sẽ kéo đài, và ngược lại

Job Satisfaction: theo két qua nghién ciru cua Bashir va cộng sự, 2012, sự hài lòng với công việc có tác động ngược chiều đến quyết định nghỉ việc Bashir

cũng cho biết kết quả này trùng khớp với nghiên cứu của Hulin, 1966

2.2 Các nghiên cứu trước

K Coussement va D Vanden poel, 2008 với bài nghiên cứu “Integrating the voice of customers through call center email into a decision support system for attrition prediction” Trong nghiên cứu này, họ thiết lập rằng việc

thêm dữ liệu văn bản, phi cầu trúc thành một nhận dạng rời đi thông thường

Các kết qua là nâng cao hiệu suất trong phân tích nhan dang rời đi Nghiên cứu

này hỗ trợ cho những người ra quyết định tiếp thị để cải thiện khả năng nhận biết khách hàng có xác suất rời đi

Trang 18

call details to attrition prediction: a data mining approach” Trong nghiên cứu này, thực nghiệm đánh gia phương pháp nhận dạng sự rời đi từ dữ liệu hợp

đồng thuê bao và mô hình cuộc gọi sửa đôi được khai thác từ chỉ tiết cuộc gọi

Điều này được mô tả là phương pháp có khả năng mô tả tiềm năng những

khách hàng tiêu chuẩn với mức hợp đồng cụ thê cho khoảng thời gian dự đoán

được

VV Saradhi va GK Palshikar, 2011 voi bai nghién cứu “Employee churn prediction” đã nghiên cứu và so sánh một số các phương pháp trong Machine Learning để ngăn chặn quyết định nghỉ việc của nhân viên Trong này họ đã thực hiện một số phương pháp để tạo và so sánh các mô hình để có được mô

hình dự đoán tốt nhất

R.Khare, D Kaloya, CK Choudhary và G.Gupta, 2011 đã nghiên cứu về

“Employee attrition risk assessment using logistic regression analysis” Nghiên cứu này sử dụng phương pháp Logistics Regression để ngăn chặn sự rời đi của nhân viên Trong điều này các nhà nghiên cứu thu thập đữ liệu nhân khâu học của nhân viên hiện tại ở công ty Các thông tin này hữu ích để tạo ra những mô hình phân loại nhóm các nhân viên có rủi ro cao Mục tiêu cuối cùng của nghiên cứu là xác định nhóm nhân viên có rủi ro cao đề tô chức chú ý

và ngăn chặn khỏi sự nghỉ việc này

ML Kane- Sellers, 2007 da nghién ciru vé “Predictive models of employee voluntary turnover in a North American professional salesforce using data-mining analysis” Bài nghiên cứu chủ yếu tập trung vào các đặc điểm cá nhân, đặc tính công việc và phát triển nguồn nhân lực (human resources

Trang 19

hơn là tiền lương và sự thăng tiễn trong công việc.

Trang 20

CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU

Chúng tôi đề xuất sử dụng mô hình Azure Machine Learning để dự báo khả

năng nghỉ việc của nhân viên tại công ty IBM theo quy trình như sau:

@ Đầu tiên, chúng tôi thu thập đữ liệu về nhân viên bao gồm cá nhân viên ở quá

khứ và hiện tại

e Thứ hai, chúng tôi áp dụng các kỹ thuật làm sạch dữ liệu khác nhau tạo ra tập dữ

liệu mới đồng thời tiến hành phân tích, mô tả dữ liệu để xác định các thuộc tính

chính ảnh hưởng lớn đến quyết định nghỉ việc của nhân viên

e© Thứ ba, chúng tôi áp dụng mô hình số học Azure Machine Leaming với nhiều

thuật toán khác nhau trên tập đữ liệu đã được xử lý cùng với các biến số đã được

chọn ra để dự báo khả năng nghỉ việc của nhân viên

e Cuối cùng dựa trên kết quả thu thập được, so sánh các chỉ số hiệu suất của mô

hình máy học và chọn ra mô hình có hiệu quả nhất đề giải quyết vấn đề đặt ra và

phát hành phần mềm hỗ trợ nhân sự trong công tác HRM

3.1 Thu thập và mô tả dữ liệu

Đề thực hiện bài nghiên cứu, chúng tôi đã sử dụng bộ đữ liệu “IBM Employee Dataset” duoc cung cấp bởi IBM Watson Analytics tại trang web https:/Avww.kagegle.com/rohitsahoo/employee

Bộ đữ liệu bao gồm 1470 mẫu quan sát với 35 đặc tính khác nhau liên quan đến đời sống làm việc và đặc điểm cá nhân của nhân viên tại Hoa Kỳ bao gồm:

Định nghĩa thuộc

2 Attrition Phan loai Quyét định nghỉ việc

Trang 21

Mức độ tham gia vào công việc

Human

Resources/Research & Development/Sales

eS Below College College Bachelor Master

Doctor

Human Resources/Life Sciences/Medical/ Marketing/Technical Degree/Other

Low

Medium High

4 Very High Male/Female

= Low

Medium High Very High

Trang 22

Tinh trang hon nhân

Thu thap hang thang

Mức lương theo tháng

Số lượng công ty đã làm trước đây

No/Yes

Low Medium High Very High Low Medium High Very High Fw

Trang 23

So nam lam viée 6 vi

tri hién tai

So nam lam viéc ké

từ khi thăng chức

Số năm làm việc với

quản lý hiện tại

Bảng 3.1: Mô tả biến

nghỉ việc va “Yes” đại diện cho một nhân viên đã nghỉ việc tại công ty

chuyên đổi biến phụ thuộc “Attrition” từ định tính (đữ liệu đạng văn bản) thành định

3.2 Xử lý dữ liệu

Để cho mô hình máy học được thực hiện một cách dé dang, chúng tôi tiến hành

lượng (đữ liệu số), cụ thê:

“Yes” duoc ma hoa vé “1”

Trang 24

của các biến độc lập đối với biến phụ thuộc Mục đích của việc này là xác định các

biến sẽ tham gia thực hiện mô hình, loại bỏ những biến ít quan trọng hoặc dư thừa vì chúng có thê ảnh hưởng đến việc đưa ra những dự đoán không chính xác

Chúng tôi sử dụng thuật toán Filter Based Feature Selection trên phần mềm

Azure Machine Learning dé kiểm tra mức độ ảnh hưởng của các biến lên biển

“Attrition” thông qua chỉ số Pearson Correlation

Hình 3.3: Những thuộc tính ảnh hưởng nhiều nhất đến biến “Attrition” bang Filter

Based Feature Selection

Hình 3.4: Những thuộc tính ít hoặc không ảnh hưởng đến biến “Attrition” bằng Filter

Based Feature Selection

Sau quá trình kiểm tra chúng tôi nhận thấy thuộc tính “OverTime” có sự ảnh

hưởng lớn nhất đến sự nghỉ việc của nhân viên, kết quả cụ thể như sau như sau:

Trang 25

Những thuộc tính không ảnh hưởng đến biến “Attrition” la “Over18”,

“EmployeeCount” va “StandardHours” véi chỉ số ảnh hưởng bằng 0 sẽ được chúng tôi xoá bỏ Ngoài ra, theo bài tham khảo chính, các biến “HourlyRate”, “MonthlyRate” và

“EmployeeNumber” cũng được tác giả loại bỏ trong quả trình chạy mô hình 3.3 Phân tích khám phá dữ liệu

3.3.1 Thống kê mô tả dữ liệu

Biểu đề 3.1: Thống kê số lượng nhân viên nghỉ việc tai IBM

Có 237 nhân viên nghỉ việc trong tông số 1470 nhân viên, chiếm 16,12% tại

công ty Tuy là con số nhỏ nhưng phòng Nhân sự vẫn muốn biết được lý do dẫn đến sự nghỉ việc của nhan vién IBM

Trang 26

Theo như phân tích trên, biến số “Overtime” ảnh hưởng nhiều nhất đến quyết

định nghỉ việc của nhân viên Chúng ta có thé thay duoc chi co 10,44% nhan vién

không làm việc ngoài giờ đã rời bỏ công ty Mặt khác, 30,53% nhân viên lam thêm giờ

đã bỏ việc Vì vậy, chúng ta có thê kết luận rằng làm việc ngoài giờ có thể là một yêu

tố quan trọng quyết định đến sự nghỉ việc của nhân viên trong một tô chức Các chỉ số đánh giá mức độ hài lòng của nhân viên trong công việc, về môi trường làm việc, các mối quan hệ cũng là một trong các nhân tổ ảnh hưởng đến quyết định nghỉ việc của nhân viên

© Mite dé hài lòng trong các mối quan hệ

Trang 27

mỗi quan hệ ở công ty

Có thể nói số lượng nhân viên nghỉ việc đối với trường hợp bất đồng với các thành viên trong công ty khá là thấp (16,12% trên tông số nhân viên) Mức độ hài lòng thấp nhất chiếm 20,56% (57/276) lượng nhân viên nghỉ việc Mức độ hài lòng cao

chiếm 14,81% (64/432) Có thé thấy mức độ hài lòng về các mối quan hệ trong công ty càng thấp sẽ có xu hướng nghỉ việc cao hơn

©_ A/ức độ hài lòng về môi trường làm việc

Trang 28

Biểu đề 3.4: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng về môi

trường làm việc ở công ty

Môi trường làm việc là một vấn để quan trọng trong việc giữ chân các nhân sự

của công ty Thông qua biểu dé ta có thể thấy mức độ hài lòng càng thấp thì tỷ lệ nhân

viên nghỉ việc càng cao Môi trường làm việc tốt giúp nhân viên cảm thấy thoải mai, dé

chịu, nâng cao tỉnh thần làm việc của nhân viên tạo điều kiện để nhân viên gắn bó lâu dài với tô chức

@ Muc dé hai long trong céng viéc

Biéu đồ 3.5: Thống kê số lượng nhân viên nghỉ việc theo mức độ hài lòng trong công

việc ở công †y

Trang 29

Như chúng ta có thê thấy từ đữ liệu trên, có tỷ lệ thôi việc lần lượt là 22,84%,

16,43%, 16,52% và 11,33% ở các mức độ hài lòng trong công việc l, 2, 3 và 4 Vì vậy,

chúng ta có thê kết luận rằng mức độ hài lòng trong công việc thấp hơn có thê là một

yếu tô liên quan đến sự thôi việc của nhân viên Sự hài lòng trong công việc là một trong những yếu tố quan trọng nhất đối với sự nỗ lực của nhân viên Nếu nhân viên không hoàn toàn hài lòng với công việc của mình, cuối cùng, nhân viên đó sẽ ra đi Các

tổ chức nên thường xuyên đánh giá mức độ hài lòng của nhân viên Trọng tâm chính

của bat kỳ tổ chức nào là làm cho nhân viên của họ hài lòng vì nó gắn liền với năng

suất của nhân viên

Ngoài ra mức thu nhập hằng tháng “Monthly Ineome” cũng được đánh giá là một yếu tố quan trọng ảnh hưởng đến quyết định nghí việc của nhân viên

Biéu đồ 3.6: Thống kê số lượng nhân viên nghỉ việc theo mức thu nhập hằng tháng ở

cong ty

Nhóm có thu nhập từ $1009-$3008 chiếm tỷ lệ 47,68% trong tông số 237 nhân

viên nghỉ việc Họ cân tiền để trang trải cuộc sống nên có nhu cầu nhảy việc đề tìm

công việc mới với mức lương tốt hơn Nhóm có thu nhập thấp nhất từ $15,009-$17,008

Trang 30

ra, số lương càng cao đồng nghĩa với trách nhiệm càng lớn, nên phần lớn họ chịu được

áp lực ở mức thu nhập này

3.3.2 Kiếm tra mức độ tương quan

Biéu đồ 3.7: Kiểm tra mức độ tương quan giữa các biến

Chúng tôi str dung ban dé Correlation matrix dé thể hiện sự tương quan giữa các

biến: màu đỏ thê hiện mối tương quan nghịch (mối tương cao có gia tri tir -1 đến -0.7),

màu xanh thê hiện mối tương quan thuận (mối tương quan cao có giá trị từ 0.7 đến 1),

cụ thể như sau:

- Bién “MonthlyIncome” va “JobLevel” với chí số tương quan 0.95: nhân viên có cấp bậc càng cao có xu hướng kiếm được mức thu nhập hằng tháng cao hơn

Trang 31

quan lần lượt là 0.78 và 0.77 có nghĩa nhân viên làm lâu năm thường có cấp bậc cao đồng thời mức thu nhập hằng tháng cũng cao hơn

-_ Biến “PercentSalaryHike” và “PerformanceRating” với chỉ số tương quan 0.77:

khi nhân viên nhận được sự tăng lương họ sẽ làm việc tết hơn

- Một số biến khác cũng có sự tương quan thuận cao như “YearsAtCompany”,

“VearsWithCurrentManager” và “YearsInCurrentRole” với chỉ số tương quan là 0.71, 0.76 và 0.77

3.4 Mô hình nghiên cứu

Quả trình mô hình hóa bao gồm việc lựa chọn các mô hình dựa trên các máy

học khác nhau các kỹ thuật được sử dụng trong thử nghiệm Trong trường hợp này, các

mô hình đự đoán khác nhau đã được sử dụng như dựa trên cây quyết định, phương pháp Bayes, hồi quy logistic và SVM Mục tiêu là xác định phân loại tốt nhất cho vẫn

đề phân tích Các thuật toán phân loại được xem xét là:

3.4.1 Gaussian Naive Bayes

NaIve Bayes là một thuật toán dựa trén dinh ly Bayes về lý thuyết xác suất để đưa ra các phản đoán cũng như phân loại dữ liệu dựa trên các dữ liệu được quan sát và

thông kê

Gaussian Naive Bayes là một biến thể của Naive Bayes tuân theo phân phối

chuẩn Gaussian và hỗ trợ dữ liệu liên tục Khi làm việc với dữ liệu liên tục, một giả định thường được đưa ra là các giả trị liên tục được liên kết với mỗi lớp được phân

phối theo phân phối chuân (hoặc Gaussian) Gaussian Naive Bayes hỗ trợ các tính năng

và mô hình có giá trị liên tục phù hợp với phân phối Gaussian (chuẩn)

Trang 32

Mô hình này chỉ cân ước tính giá trị trung bình và độ lệch chuẩn của các điểm trong mỗi nhãn, đó là tất cả những gì cần thiết để xác định phân phối như vậy Với mỗi

chiều dữ liệu ¡ và một class c, x¡ tuân theo một phân phối chuẩn có kỳ vọng H ¿ và phương sai ø.¡

3.4.2 Naive Bayes classifier for multivariate Bernoulli models

Trong mô hình Bernoulli đa biến, các đặc trưng là các Boolean độc lập (biến nhị

phân) mô tả đầu vào Giống như MultinomialNB, bộ phân loại này phù hợp với dữ liệu rời rạc Sự khác biệt là trong khi MultinomialNB hoạt động với tần suất xuất hiện, BernoulliNB được thiết kế cho các tinh năng nhị phân / boolean (biến nhị phân)

Loại trình phân loại Naive Bayes này có thê hữu ích khi một từ không mong

muốn muốn được phát hiện hoặc một loại từ cụ thể muốn được gắn thẻ trong một tài

liệu nhất định Ngoài ra, nó phân biệt với phương pháp đa thức bằng cách tạo ra đầu ra nhi phan la 1-0, Dung-Sai hoặc Có-Không

Ngày đăng: 13/12/2024, 16:22

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN