Mục tiêu nghiên cứu
Mụctiêu nghiên cứu tổng quát: tìm hiểu các phương pháp phân tích dữ liệu để đưa ra được quyếtđịnh tối ưu, từ đó đưa rabáo cáo giúp cho Phòng TCNS có được cái nhìn tổng quan về khảnăng nghỉ việc của người lao động.
Mục tiêunghiên cứu cụ thể: tìm hiểu và đánh giá các thuật toán máy học và phân tích dữ liệu hành vi người lao động để cóthể đưarakết quả dự báo tối ưu nhất cho Công ty, cụ thể là đưa ra được dự đoán khả năng nghỉ việc của người lao động qua một hoặc nhiều các tác nhân có trongtập dữ liệu, tổng hợp được các nguyên nhân có ảnh hưởngnhiều đến khảnăng nghỉ việc của người lao động, từ đó đưa ra được báo chi tiết để Phòng TCNS có thể tổng hợp, đề xuất và đưa ra giải pháp cụ thể cho các kế hoạch tuyển dụng nhân sự thay thế, hoặc điều chỉnh lại cách phân công nhân sự sao cho giảm thiểu được tỷ lệ nghỉ việc ở mứcthấp nhất Ngoài ra, báo cáocòn cung cấp cho Phòng TCNS có cái nhìn tổng quan về mức độ hài lòng vàthâm niên cống hiến của người lao động tại công ty từ đó đưa ra được các hình thức khen thưởng và ghi nhận để thúc đẩy năng suấtcông việc vàgiảm thiểu được sự bất mãn của người lao động tạiCông ty.
Cách tiếp cận và phương pháp nghiên cứu
Thời gian nghiên cứu: thời gian nghiên cứu trong khoản 6 tháng từ 12/2020 đến 05/2021. Địa điểm nghiên cứu: nghiên cứu được thực hiện tại Phòng TCNS.
Vật liệu nghiên cứu: máy tính, các nguồn thông tin thu thập từ mạngInternet, tài liệu tham khảo
• Phương pháp nghiên tài liệu: Thu thập, phân tích, xử lý thông tin từ tập dữ liệu được bộ phận nhân sự cung cấp
• Phương pháp nghiên cứu dựa trên thực nghiệm: Thông qua việc hiện thực giải phápvà vận hành thử nghiệm trên các tập dữ liệu đầu vào có độ tin cậy cao.
5 Ý nghĩa thực tiễn của đề tài
Sử dụng các phương pháp kỹ thuậtmachine learning thực hiện thống kê và phân tích dữ liệu do Phòng TCNS cung cấp để giúp Công ty dự đoán đượcnhững nhân sự có khảnăng nghỉ việc để mau chóng đưa ra giải pháp tuyển dụng thay thế để mọi hoạt độngcủa công ty được ổn định.
CHƯƠNG 1 GIỚI THIỆU VỀ ĐỀ TÀI
1.1 Tổng quan về quản trịnhânsự Địnhnghĩa: Quản lý nhân sự là sự khai thác và sử dụng nguồn nhân lực của một tổ chức hoặc một công ty một cách hợp lý và hiệu quả.
Quản lý nhân sự mang một ý rất lớn cho sự thành công của một tổ chức hoặc một công ty vì nguồn lực conngười đóng vai trò quan trọng tronghoạt động của các doanh nghiệp hay tổ chức Việcquản lý nguồn lực đòi hỏi sự hiểu biết về con người ở nhiều khíacạnh, vàquan niệm rằng con người làyếu tố trung tâm của sự phát triển Các kỹ thuật quản lý nhân lực thườngcó mục đích tạo điều kiện để con người phát huy hết khảnăng tiềm ẩn, giảmlãng phí nguồn lực, tăng hiệu quả của tổ chức Tổngquan các nghiệp vụ nhân sự tại Công tyVissan.
Một số quy trình nghiệp vụ đượcPhòngTCNS cung cấp đểgiải quyếtđề tàiluận văn:
- Thu nhận và chọn lọc hồ sơ
- Tiếp nhận tập sự - thử việc
• Quy trình giải quyết nghỉ việc:
- Xác định từng trường hợp nghỉ việc
- Thời gian nộp đơn nghỉ việc
- Tiếp nhận và xử lý đơn nghỉ việc
- Xử lí hồ sơ nghỉ việc
- Thanh lý hợp đồng và quyết định cho nghỉ việc
- Lưu giữ hồ sơ người nghỉ việc
• Quy trình chấm công - tính lương:
- Đối chiếu và điều chỉnhcông
- Lập bảng chấm công hoàn chỉnh
- Kiểm trabảng lương và thanh toán
1.2 Tổng quan các bài toán về nhânsự
Có rấtnhiều bài toán về nhân sự được đưa ra, cụ thể:
1.2.1 Bài toán xây dựng KPI
Công ty vẫn đangdùng đánh giá hiệu quả công việc dựa trên thang điểm ABC, thang đo này chỉ thể hiện được sự tổng quát về chất lượng nhân viên, không thể đánh giá chi tiết vàđầy đủ nhất chất lượng của công việccủa nhân viên.
Từ đóyêu cầu đưara được giải pháp đểcóthể giúpCông ty đánh giáchấtlượngcông việc chi tiết hơn là xây dựng KPI Thông thường mỗi chức danh sẽ có bảng mô tả công việc riêng Thông thường hệ thống KPI cóthể thuộc ba loại nhưsau:
• Hệ thống KPI tậptrung vào đầu ra (output)
Cho phépthực hiện công tác đánh giánhanh và hiệu quả Tuy nhiên hệthốngnày có các yếu điểm là không cân nhắc tốt tình hình thay đổi trên thị trường kinh doanh, không khuyến khích phát triển, tạo điều kiện cho nhân viên tập trung vào các giải pháp ngắn hạn tình thế.
• Hệ thống KPI hành vi (behavior)
Thích hợpvới các vị trí mà đầu rarất khó lượnghóa Ví dụ tại vị trí chuyên viên dịch vụ khách hàng, các hành vi như tích cực làm việc, chăm chỉ, cẩn thận là những yếu tố tiên quyết đảmbảo đầu ra tại vị trí làm việc.
• Hệ thống KPI năng lực (competencies)
Chú trọng vào khả năng của người nhân viên Hệ thống KPI năng lực tập trung vào nguyên nhân thay vì kếtquả như trong hệthống KPI tập trung vào đầu ra.
Bài toán áp dụng hệthống KPI là điều chỉnh ỷ lệ các nhóm KPI cho từngvị trí công việc, chức danh, theo từng hoàn cảnh môi trường sẽ quyết định được tính hiệu quả của công tácnhân sự.
1.2.2 Bài toán xây dựng cơ che tiền lương cho từng vị trí phù họp
Cơ chế trả lương luôn là mối quan tâm hàng đầu của người lao động trong doanh nghiệp bêncạnh các yếu tố quan trọngkhác như ngành nghề, uy tín của doanh nghiệp, môi trường làm việc này cơ hội thăng tiến Một cơ chế trả lương phù hợp có tác dụng nâng cao năng suấtvà chất lượng lao động, giúp doanh nghiệp thu hút và duy trì được nhữngcán bộ, nhằn viên giỏi.
Mặt bằng lương chung củaxã hội của ngành và khu vực Doanh nghiệp không chỉ chịu sức ép cạnh tranh về đầu ra của sản phẩm, dịch vụ mà còn chịu sự cạnh tranh gay gắt của các yếu tố đầu vào mà nhân lực luôn luôn làyếu tố quan trọng nhất, cần phải xác định được mặtbằng mứclương bình quân của các vịtrí lao động trong cùng ngành và trong cùng khu vực địa lý Điều này giúp đưa ra được các mức tiền lương cạnh tranh, cókhảnăng thu hút và lưu giữ nhân viên.
Hiện nay, Công ty đã xâydựng được thang bảng lương cơbản đảm bảo lớn hơn mức lương tối thiểu vùng, tuy nhiên vẫn chưa đáp ứng được đúng với nguyện vọng của các ứng viên trẻ khi tuyển dụng vào Công ty và thangbảng lương cũng chỉ xâydựng trên những yếu tố khách quan và sự tịnh tiến theo khung cố định và thời gian 3 năm tăng lương một lần Không thựcsự thúc đẩy được khảnăng của những lao động, đặc biệt lànhững là lao độngtrẻ.
Từ đó, Công tyđang triển khai kế hoạch về sử dụng trí tuệ nhân tạo để phân tích dựa trên các dữ liệu có sẵn, hoặc tham khảo từ nhiều công ty để có thể đưa ra đượcmức lương phù hợpcho từngngười, từng vị trí đảm nhận, đảm bảo được cuộc sống hằng ngày của người lao động và thúc đẩy được khảnăng của người lao động, giúp công ty pháttriển hơn.
7 2.3 Bài toán về các báo cáo thông minh
Thống kê số liệu, hoạch định kế hoạch tuyển dụng, định biên lao động, báo cáo số liệu về lao động liên tục và nhiều thời điểm khác nhau đòi hỏi người chuyên viên của PhòngTCNS phải có nhữngkiến thức cụthể về lĩnh vực thống kêsố liệu.
GIỚI THIỆU VẾ ĐỀ TÀI
Tổng quan về quản trị nhân sự
Địnhnghĩa: Quản lý nhân sự là sự khai thác và sử dụng nguồn nhân lực của một tổ chức hoặc một công ty một cách hợp lý và hiệu quả.
Quản lý nhân sự mang một ý rất lớn cho sự thành công của một tổ chức hoặc một công ty vì nguồn lực conngười đóng vai trò quan trọng tronghoạt động của các doanh nghiệp hay tổ chức Việcquản lý nguồn lực đòi hỏi sự hiểu biết về con người ở nhiều khíacạnh, vàquan niệm rằng con người làyếu tố trung tâm của sự phát triển Các kỹ thuật quản lý nhân lực thườngcó mục đích tạo điều kiện để con người phát huy hết khảnăng tiềm ẩn, giảmlãng phí nguồn lực, tăng hiệu quả của tổ chức Tổngquan các nghiệp vụ nhân sự tại Công tyVissan.
Một số quy trình nghiệp vụ đượcPhòngTCNS cung cấp đểgiải quyếtđề tàiluận văn:
- Thu nhận và chọn lọc hồ sơ
- Tiếp nhận tập sự - thử việc
• Quy trình giải quyết nghỉ việc:
- Xác định từng trường hợp nghỉ việc
- Thời gian nộp đơn nghỉ việc
- Tiếp nhận và xử lý đơn nghỉ việc
- Xử lí hồ sơ nghỉ việc
- Thanh lý hợp đồng và quyết định cho nghỉ việc
- Lưu giữ hồ sơ người nghỉ việc
• Quy trình chấm công - tính lương:
- Đối chiếu và điều chỉnhcông
- Lập bảng chấm công hoàn chỉnh
- Kiểm trabảng lương và thanh toán
Tổng quan các bài toán về nhân sự
Có rấtnhiều bài toán về nhân sự được đưa ra, cụ thể:
1.2.1 Bài toán xây dựng KPI
Công ty vẫn đangdùng đánh giá hiệu quả công việc dựa trên thang điểm ABC, thang đo này chỉ thể hiện được sự tổng quát về chất lượng nhân viên, không thể đánh giá chi tiết vàđầy đủ nhất chất lượng của công việccủa nhân viên.
Từ đóyêu cầu đưara được giải pháp đểcóthể giúpCông ty đánh giáchấtlượngcông việc chi tiết hơn là xây dựng KPI Thông thường mỗi chức danh sẽ có bảng mô tả công việc riêng Thông thường hệ thống KPI cóthể thuộc ba loại nhưsau:
• Hệ thống KPI tậptrung vào đầu ra (output)
Cho phépthực hiện công tác đánh giánhanh và hiệu quả Tuy nhiên hệthốngnày có các yếu điểm là không cân nhắc tốt tình hình thay đổi trên thị trường kinh doanh, không khuyến khích phát triển, tạo điều kiện cho nhân viên tập trung vào các giải pháp ngắn hạn tình thế.
• Hệ thống KPI hành vi (behavior)
Thích hợpvới các vị trí mà đầu rarất khó lượnghóa Ví dụ tại vị trí chuyên viên dịch vụ khách hàng, các hành vi như tích cực làm việc, chăm chỉ, cẩn thận là những yếu tố tiên quyết đảmbảo đầu ra tại vị trí làm việc.
• Hệ thống KPI năng lực (competencies)
Chú trọng vào khả năng của người nhân viên Hệ thống KPI năng lực tập trung vào nguyên nhân thay vì kếtquả như trong hệthống KPI tập trung vào đầu ra.
Bài toán áp dụng hệthống KPI là điều chỉnh ỷ lệ các nhóm KPI cho từngvị trí công việc, chức danh, theo từng hoàn cảnh môi trường sẽ quyết định được tính hiệu quả của công tácnhân sự.
1.2.2 Bài toán xây dựng cơ che tiền lương cho từng vị trí phù họp
Cơ chế trả lương luôn là mối quan tâm hàng đầu của người lao động trong doanh nghiệp bêncạnh các yếu tố quan trọngkhác như ngành nghề, uy tín của doanh nghiệp, môi trường làm việc này cơ hội thăng tiến Một cơ chế trả lương phù hợp có tác dụng nâng cao năng suấtvà chất lượng lao động, giúp doanh nghiệp thu hút và duy trì được nhữngcán bộ, nhằn viên giỏi.
Mặt bằng lương chung củaxã hội của ngành và khu vực Doanh nghiệp không chỉ chịu sức ép cạnh tranh về đầu ra của sản phẩm, dịch vụ mà còn chịu sự cạnh tranh gay gắt của các yếu tố đầu vào mà nhân lực luôn luôn làyếu tố quan trọng nhất, cần phải xác định được mặtbằng mứclương bình quân của các vịtrí lao động trong cùng ngành và trong cùng khu vực địa lý Điều này giúp đưa ra được các mức tiền lương cạnh tranh, cókhảnăng thu hút và lưu giữ nhân viên.
Hiện nay, Công ty đã xâydựng được thang bảng lương cơbản đảm bảo lớn hơn mức lương tối thiểu vùng, tuy nhiên vẫn chưa đáp ứng được đúng với nguyện vọng của các ứng viên trẻ khi tuyển dụng vào Công ty và thangbảng lương cũng chỉ xâydựng trên những yếu tố khách quan và sự tịnh tiến theo khung cố định và thời gian 3 năm tăng lương một lần Không thựcsự thúc đẩy được khảnăng của những lao động, đặc biệt lànhững là lao độngtrẻ.
Từ đó, Công tyđang triển khai kế hoạch về sử dụng trí tuệ nhân tạo để phân tích dựa trên các dữ liệu có sẵn, hoặc tham khảo từ nhiều công ty để có thể đưa ra đượcmức lương phù hợpcho từngngười, từng vị trí đảm nhận, đảm bảo được cuộc sống hằng ngày của người lao động và thúc đẩy được khảnăng của người lao động, giúp công ty pháttriển hơn.
7 2.3 Bài toán về các báo cáo thông minh
Thống kê số liệu, hoạch định kế hoạch tuyển dụng, định biên lao động, báo cáo số liệu về lao động liên tục và nhiều thời điểm khác nhau đòi hỏi người chuyên viên của PhòngTCNS phải có nhữngkiến thức cụthể về lĩnh vực thống kêsố liệu.
Giải pháp BI phân mảng về nhân sự góp phần rấtnhiều trong việc đưa ranhiều báo cáosố liệu với nhiều hình thức khác nhau, giúp người xem có cái nhìn trực quang và đầy đủthông tin nhất để phục vụ trong công việc.
Giải pháp BI có thể ápdụng rất nhiều lĩnh vực trong Công ty như hoạt động sản xuất kinh doanh vì có những dữ liệu về nhà cung cấp và khách hàng là rấtnhiều nên đòi hỏi việc quản lý rất nhiều; mặt khác về sản xuất có rất nhiều các dữ liệu về nhiều dòng sản phẩm có quy trình sản xuất phức tạp Khi cần truy xuất mất rấtnhiều thời gian từ đó BI là công cụ không thể thiếu trongmọi lĩnh vực hoạt động củaCôngty
BIgiúp phântích để hiểu dữ liệu đượcthu thập đượcqua các quá trình hoạt độngsản xuất, kiểm soátđượckhối dữ liệu khổnglồ. Đồngthời đó là cơ sở báo cáo định kỳ hằng ngày, hằng tháng, hằng quý, hay hằng năm cho các cơ sở ban ngành khi hiện nay rấtnhiều biểu mẫu được đưa ra phục vụ cho số liệu của Nhànước.
Lợi ích mà các báo cáoBI manglại gồm:
• Hỗ trợ công ty nhận biết các điểm khác biệt trước các đối thủ cạnhtranh: xác định xu hướng thị trường; phát hiện sớm các mối đe dọa từ đối thủ cạnh tranh; thựchiện các nhiệm vụ hành động được xâydựng từ các dữ liệu kinh doanh.
Khó khăn và thách thức khi tiếp cận
Do Phòng TCNS chỉ vừa áp dụng quản lí dữ liệu nhân sự đồng bộ với nhau từ năm
2014 nên vẫn còn thiếu rất nhiều dữ liệu từ quákhứ, không kịp thời lưu trữ dữ liệu của các năm trước nên khó xâydựng chi tiếtđượccác tiêuchí để có thể đưara quyết định, chỉ có thể dùng những dữ liệu nhằn sự có sẵn từ năm 2014 cho đến hết năm 2020.
Phần mềm quản lý nhân sự đã cũ và chưa đượccập nhật thay thế các tính năng mới, thiết kếcũ và không đáp ứng được các hoạt động hiện tại của Phòng TCNS, khó mà đưa ra đượccácmẫu báo cáo dữ liệu cần thiết phục vụ cho việc phân tích dữ liệu để đánh giá hành vi người lao độngtại Công ty.
File CSV do Phòng TCNS quản lý không đồng bộ về format cũng như là tính nhất quáncủa dữ liệu vì trải qua nhiều người phụ trách với mỗitư duy và định nghĩakhác nhau, tạo sự khó khăn khi đồngbộ lại dữ liệu một cách có hệ thống để đảm bảotính nhất quán trong dữ liệu sử dụng phục vụ đề tài Bên cạnh đó, dữ liệu còn rất nhiều trường bỏ trống do không cập nhật kịp thời hoặc không có thông tin chính xác để nhập vào dẫn đến hệthống sẽ gặp khó khăn khi phân tích và ra quyết định.
Các sự thay đổi về quy trình làm việc cũngảnh hưởng tới dữ liệu và quy trình đánh giánhân sự trong quá khứ cũng như hiện tại, rất khó để có thể đánh giá và so sánh các lao động vói những đánh giá và các định nghĩaphân loại luôn thay đổi theo từng năm.
Các đơn vị,chi nhánh trực thuộccó những đặc thù và vài điểm không thốngnhấtvớiCông ty, tạonên sự khó khăn khi tiếp cận dữ liệu từ những đơn vị chi nhánh này Do sự truyền đạt và hướng dẫn chưa kỹ vớinhững nghiệp vụ khi thay đổilà nguyên nhân dẫn đến sự sai lệch thông tin người lao động tại các chi nhánh và đơn vị trực thuộc của Công ty.
Cáctiêu chí để dự đoán nhân sự nghỉ việc gặp khó khăn vàthách thức vì Công ty chưa có tiêu chuẩn đánhgiá KPI cholao động, dẫn tới việc cần tìm hiểu vàthảoluận với phòng nhân sự để đưara tiêu chí hợp lý, KPI là phươngpháp đưararấtnhiều tiêu chí sẽ dễ dàng hơntrong việc đưara quyết định.
Đe xuất hướng giải quyết
Qua quá trìnhphân tíchva tổnghợpnhiềudữ liệu lại với nhau, Phòng TCNS đãthống nhất và lựa chọn các tiêu chí hợp lý để có cơsở nền tảng cho việc phân tích dữ liệu của nhân sự nghỉ việc.
Trong thời gian thực hiện đề tài, Phòng TCNS vẫn tiếptục cập nhất những thông tin bị khuyết để đảmbảo cơsở dữ liệu đầy đủ nhất khi hệthống vận hành.
Dựavào các thông tin về khen thưởng - kỷ luậtđể đánh giá tạm thời chấtlượngcông việc của từng ngườilao động trongCông ty, đồng thời triển khai thang đánhgiá KPI để sử dụng lâu dài và chính xác với hệ thống.
Dành một khoảnthời gian đểrà soát và đồng bộ lại file CSV dữ liệu vềmộtđịnhdạng thốngnhấtvàcó quy định sử dụng và cập nhật file rõ ràng để những ngườiđi sau tiếp cận vẫn có thểcó sẵn quy trìnhthực hiện để đảm bảo được tính nhất quán của dữ liệu từ hiện tại đến tương lai sau này.
Các sự thay đổi về quy trình làm việc cần phải được xem xét và thông qua, đồng thời cung cấptài liệu và thông báo rộng rãi trên toàn hệ thống của Công ty để tất cả các đơn vị và chi nhánh dễ dàng tiếp cận và thực hiện theo chỉ đạo.
Xây dựng các chương trình đào tạo và huấn luyện cho người sử dụng dễ dàng tiếp cận với phương pháp phân tích dữ liệu và hệthống ra quyết định.
Cơ SỞ LÝ THUYẾT
Một số khái niệm cơ bản
Nhân lực được hiểu là toàn bộ khả năng thể lực và trí lực củacon người dùngtham gia vào quá trình lao động, làtổng thể các yếu tố về thể chất vàtinh thần được huy động vào quá trình lao động.
Các yếu tố về giới tính, sức khỏe, trình độ chuyên môn, ý thức, tác phong, thái độ làm việc của người lao động thường đượcdùng để đánh giá chấtlượng nhân lực.
Có thể định nghĩa Nguồn nhân lực [1] là nguồn lực con người, yếu tố quan trọng, năng động nhất của tăng trưởng và pháttriển kinh tế - xã hội Nguồnnhân lực [2] của một tổchức đượchình thànhtrên cơ sở của các cá nhằn có vai tròkhácnhau vàđược liên kết với nhau theo những mục tiêu nhất định Hoặc có thể hiểu nguồn nhân lực [3] lànguồn lực con ngườicủa những tổ chức (với quy mô, loại hình,chức năng khác nhau) có khảnăng và tiềm năng tham gia vào quá trình pháttriển của tổ chức cùng với sự pháttriển kinh tế - xã hội của quốc gia, khu vực, thế giới.
Với các tiếp cận dựa vào khả năng lao động của con người: nguồn nhân lực là khả năng lao động củaxã hội, của toàn bộ những con người có khảnăng lao động bình thường Ở Việt Nam,theo tính toán và dựbáonguồn nhân lực của quốc gia được chia làm02 nhóm là: những người trong độ tuổi lao động có khảnăng lao động vànhững người ngoài độ tuổi lao động cótham gia lao động.
Vớicách tiếp cận dựa vào hoạtđộng kinh tế của con người: nguồnnhân lực lànhững người đang hoạt động trongcác ngành kinh tế, văn hóa, xã hội.
Với cách tiếp cận dựa vào khả năng lao động của con người và giới hạn độ tuổi lao động: nguồn nhân lực gồm toàn bộ những người trong độ tuổi lao động và có khả năng lao động.
Qua nghiên cứu và xem xét theo chất lượng và số lượng nguồn nhân lực đãthể hiện quymô và tốc độ tăng theo hàng năm Chất lượngnguồn nhân lực thể hiện mối quan hệ giữa các yếu tốcấu thành nên bản chấtbên trong của nguồn nhân lực, được biểu diễn qua các tiêu thức: sức khỏe, trình độ học van, trình độ chuyên môn, Chất lượng nguồn nhân lực do trình độ pháttriển kinh tế xã hội và chính sách đầu tư phát triển nguồn nhân lựccủa chính phủ quốc gia quyết định.
Quản lý nguồn nhân lực
2.2.1 Khái niệm quản lý nguồn nhân lực
Quản lý nguồn nhân lực được hiểu lànhững tác động hợp quy luật của chủ thểquản lý nguồn nhân lực đến các khách thể quản lý nguồn nhân lực nhằm đạt được cácmục tiêu quản lý nguồn nhân lực đã đề ra.
Quản trị nguồn nhân lựccung cấp cách tiếpcận có kế hoạch đối với việc quản lýcon người hiệu quả, tập trung xây dựng phong cách quản lý linh hoạt, quan tâm tới con người, từ đónhân viên có độnglực làm việc hơn, được pháttriển hợp lí và đónggóp vào việc thực hiện mục tiêu và sứ mệnh của doanh nghiệp tốt hơn Có thể nói quản lý nguồn nhân lực [5] là nghệthuật và khoahọc của việcthu hút, phát triển, sửdụng và quản lý nhân sự một cách hiệu quả để đạt được mục tiêu của tổ chức.
Quản trị nguồn nhân lựcmang một ý rất lớn cho sự thành công của một tổchức hoặc mộtcông ty vì nguồn lựccon người đóng vai trò quan trọng trong hoạt độngcủa các doanhnghiệp hay tổ chức Việc quản lý nguồn lực đòi hỏi sự hiểu biết về con người ở nhiều khíacạnh, và quan niệm rằng con người làyếu tố trung tâm của sự phát triển Cáckỹ thuật quản lý nhân lực thường có mục đích tạo điều kiện để con người phát huy hếtkhảnăngtiềm ẩn, giảm lãng phí nguồn lực, tăng hiệu quả của tổchức.
2.2.2 Các công việc của quản lý nguồn nhân lực tại Công ty Vissan
Cơ cấu, tổ chức bộ máy: định hìnhvà tham mưu cho Ban TGĐ vềcơcấu cánbộ hoặc tổ chứcbộ máy hoạt động côngty quacác quyết định về nhân sự và tổ chức để phù hợp với tình hình thực tế và kinh tế xã hội hiện nay Việc bổ nhiệm cán bộ giúp các đơn vị có những mục tiêu và tầm nhìn mới,thườngnhững lao động được bổ nhiệm các chức vụ quan trọng đều có thâm niên trong lĩnh vực hoạt động, có khảnăng gắn kết cáccá nhân lại với nhau tạo nên tinhthần đoàn kết của đơn vị giúpcho mọi hoạt động sản xuất kinh doanh của Công ty luôn được ổn định và pháttriển.
Quản lý hồsơ nhân sự của công ty: bao gồm cáchồ sơ của người lao động đanglàm việc, hồ sơ của nhữngứng viên tham gia phỏng vấn để vào làm tại Công ty và bao gồm cảhồ sơ của những người lao động đã nghỉ việc.
Chấm công và tính lương chonhân viên: theo dõi ngày công của người lao động tại khối văn phòng và khối xưởng sản xuất của Công ty Quản lý được ngày công của những đơn vị chi nhánh trựcthuộc công ty Có cácchế độ lương thưởng theo doanh thu hoặccác dịp lễ tết, góp phần thúc đẩytinhthần làm việccủa người lao động Trả lương đúng ngày theothỏaước lao động tập thể tại công ty. Đánh giá năng lực, ý thức trách nhiệm: trưởng đơn vị của từng phòng ban có trách nhiệm đánh giá năng lực và mức độ hoàn thành công việc của từng người lao động thuộcđơn vị mình quản lý, phối hợp với Phòng TCNS để có những đánh giátốt nhất cho người lao động.
Khen thưởng, kỷ luật: định kỳ hàng năm, Công ty đều tổng hợp các sángkiến thức đẩy quá trình làm việc hoặc tăng năng suấttrong quy trình sản xuất, tăng lợi nhuận từ việc bán hàng, tất cảcác ýkiến và đóng góp của người lao động đề đượccông ty lưu lại và thể hiện quacác phần khen thưởng cấp công ty, cấp thành phố, cấpbộ và cả cấp quốc gia Đồng thời những hành vi gây tổn thất về mặt tinh thần con người hay ảnhhưởng đến hoạt động sản xuất kinh doanh đều đượcđưa ra hội đồng kỷ luật của công ty để răn đe và mang tính kỷ luậttrong môi trường làm việc.
Tuyển dụng nhân sư: tiếpnhận ý kiếncủa các đơn vị để cókếhoạchtuyển dụng hiệu quả, đúng người đúng việc Trình bày báo các công tác tuyển dụng định kỳ cho BanTGĐ để có cái nhìn tổng quan và có chiến lược cụ thể trong việc sử dụng lao động tại Công ty. Đào tạo nhân sự: tổ chức các lớp học liên quan đến các yêu cầu thiết yếu của Công việc như công nhân và nhân viên bán hàng cần được đào tạo về an toàn lao động, vệ sinh an toàn thực phẩm, vì các chứng chỉ này được cấp có thời hạn, mỗi năm sẽ đều có thay đổi để cập nhật thay đổi bổ sungnhữngcái mới màngành Công nghiệp thực phẩm cần có.
Duytrì nguồn nhân lực: thị trường lao động càng cạnh tranh thì người lao động càng có nhiều cơ hội lựa chọn chỗ làm Điều này khiến công ty gặp rất nhiều khó khăn trong việcduytrìnguồn nhân lực, nhất là nguồnnhân lực có tay nghề và kinh nghiệm cao Côngty cần xây dựng được một chính sách về tiền lương vàcác đãi ngộ tốt để có thể giữ chân được người laođộng làm việc tại công ty Thiết lập được môi trường làm việc thân thiện cũng làmộtyếu tố để Công ty giữ chân được người lao động.
2.2.3 Tầm quan trọng của bộ phận quản trị nguồn nhân lực trong doanh nghiệp
Vai trò của quản trị nhân sự [6] vừalà khoa học vừa là nghệthuật Quản trị nhân sự đượcxem làkhoahọc vì đã đượcnghiên cứu từ rấtlâu, được đúc kếtthành các triết lýđược áp dụng, rút kinhnghiệm qua thựctếtriển khai các hoạt động, luôn phản ánh được thựctế, được thực tế kiểm nghiệm và chấp nhận.
Tầm quan trọng của bộ phận quản trị nguồn nhân lực [7] được thể hiện rõ rệtthông qua những nhiệm vụ và chức năng liên quan đếnchính sách, chế độ đối với nhân viên trong toàn doanhnghiệp, cụ thể là:
• Bộ phận quản trị nguồn nhân lực lànơi đề rachính sách chế độ về nhân viên Các chính sách này được thi hành thống nhấttrong toàn tổchức
• Bộ phận quản trị nguồn nhân lực thực hiện chức năng cố vấn cho cáccấp quản trị gia, cũng như các bộ phận trong doanh nghiệp về vấn đề nhân viên.
• Bộ phận quản trị nguồn nhân lực là đơn vị duynhấtcó quyền kiểm traviệc tổ chức thi hành các chính sách, đánh giá, khen thưởngbổ nhiệm ở các đơn vị cơ sở của doanh nghiệp
Phân tích dữ liệu (Data Analytics)
2.3.1 Khái niệm về Ph ân tích dữ liệu
Phân tích dữ liệu [8] là quá trình kiểm tradữ liệu thô để rút ra những hiểu biết sâu sắc và đưara quyết định sáng suốt Baogồm nhiềukỹ thuật và công cụ khác nhau để phân tích các tập hợp dữ liệu lớn, xác định các mẫu và đưa ra kết luận có thể giúp doanh nghiệp đưara quyết định dựa trên dữ liệu Phân tích dữ liệu có thể giúp doanh nghiệphiểu rõ hon về khách hàng, cải thiện hoạt động và cuối cùng làthúc đẩy tăng trưởng.
Phân tích dữ liệu được sử dụng trong hoạt động nội chính về quản lý nhân sự, phân tích dữ liệu giúp hỗ trợ rất nhiều trong việc phân tích hành vi người lao động hoặc đánhgiá đượcnăng lực của nhân sựtrong Công ty.
5 bước cơbản để thực hiện phân tích dữliệu [9] gồm:
• Xác định các mục tiêu yêu cầu
• Thu thập và lưu trữ dữ liệu
• Làm sạch và chuẩn bị dữ liệu
• Trực quan hóa và truyền đạt dữ liệu
2.3.2 Các loại phân tích dữ liệu
Phân tích văn bản: tìm kiếm và trích xuấtthông tin nằmtrong văn bản, được sử dụng để chuyển đổi dữ liệu thô thành thông tin kinh doanh Là một cách để trích xuất và kiểm tradữ liệu Ngày nay với sựtăng trưởng nhanhchóng của dữ liệu văn bản, phân tích văn bản càng cónhiều ứng dụng trong thực tế Mục đích của phân tích văn bản [10] là cung cấp các công cụ chuyên môn nhưphê bình văn học, ngữ văn hoặc phân tích nội dung để giải mã các văn bản mà người đọc bình thường không thể tiếp cận
Phân tích sống còn (Survival Analysis)
Phân tích thống kê: phân tích dữ liệu từ quá khứ, gồm thu nhập, phân tích, giải thích, trình bày và môhình hóadữ liệu Phân tích một mẫu hoặc tâp hợp dữ liệu Thống kê toán học [11] củaviệctổ chức và giải thích các thông tindạng số Kết quả của những phân tích thốngkê làcác mô tả, các so sánh, các dự báo, các mối quan hệ, v.v Phân tích thống kê gồm hai loại phân tích làPhân tích mô tả và Phân tích suy luận.
Phân tích dự đoán: thể hiện dự đoán những thứ sáp xảy ravới các dữ liệu của hiệntại hoặc quá khứ Dựbáo chỉ cóthể là ướctính, độ chính xác dựa trên số lượngthông tin chi tiết của dữ liệu và những thông tin khám phá được từ nhữngdữ liệu đó Phântích dự đoán [12] là mộtthuật ngữ chủ yếu được sử dụng trong các kỹ thuậtthống kê và phân tích Thuật ngữnày được rútratừ sốliệu thống kê, học máy, kỹ thuậtcơ sở dữ liệu và kỹ thuật tối ưu hóa, có nguồn gốc từ thống kê cổ điển và dự đoán tương lai bằng cách phân tích dữliệu hiệntại và lịchsử Các sựkiện và hành vitrong tương lai của các biến cóthể được dự đoán bằng cách sử dụng cácmô hình phân tích dự đoán.
2.4 Phân tích sống cỏn (Survival Analysis)
2.4.1 Định nghĩa Sự kiện (Event)
Phân tích sống còn [14] đề cập tới các sự kiện liên quan đến thất bại Và thất bại có thể xảy ra một hoặc nhiều lần với bất kỳ đối tượng nào Đối tượng có thể là người, máy móc hoặc thậm chí là toàn bộ vùng địa lý.
Có rấtnhiều trường hợp sử dụng Phân tích sống còn, được áp dụng trong việctìm ra cơ hội xảy ra sự kiện, một trong số đó có thể là:
• Sự không thànhcông của các công cụ hay máy móc
• Sự quan tâm từ nhân sự trong một tổchứchoặccông ty
• Thảm họathiên tai xảy ra(lũ lụt, động đất,núi lửaphun trào, v.v )
Theo thời gian (cóthể được địnhnghĩa là năm, tháng,ngày hoặc tuần) kể từ khi phân tíchdữ liệu cho đến khixảy ra một sự kiện (như cái chết, nhân viên nghỉ việc, động đất) Thời gian chođến khixảy rasự kiện hay còngọi là thời gian đến khi xảy rathất bại hoặc thời gian tồn tại Thời gian không nhất thiết phải luôn là một đon vị vật lý, đôi khi được sử dụng như là đon vị logical, cần lưu ý những điểm dưới đây trước khi xác định thời gian:
• Nguồn gốc thời gian phải được xácđịnh rõ ràng
• Xác định được thang đo để đo được sự chênh lệchthời gian
• Định nghĩavề thất bại (sự kiện - event) phải rõ ràng
2.4.2 Định nghĩa sồng còn (Survival)
Khinói về sống còn lànói đến xác suất [14] Xác suất khôngxảy ramột sự kiện nào đó chođến một thời điểm nào đó cóthể đượccoi là xác suất sống còn.Nói các khác thời gian xảy ra sự kiện sau mộtthời gian nhất định làxác suấtsống còn.
Một trong những mục đích của phân tích tỉ lệ sống còn là tìm ra phân bố xác suất Nhiều suy luận thống kê theo miền cụ thể khác cũng có thể được rút ratừ điều này
Có thể quan sát xác suất sống sót giảm dần theo thời gian Đó là một tính năng rất quan trọngcủa phân phối.
2.4.3 Định nghĩa Phân tích sống còn
Phân tích sống còn giúp ước lượng thời gian cho tói khi sự kiện xảy ra với một đối tượng haynhóm đốitượng nghiêncứu, xác định khoảng thời gian cần để mộtsự kiện nào đó xảy ra Phân tích sống còn [15] là phân tích dữ liệu liên quan đến thời gian xảy ramột số sự kiện quan tâm Các đặc điểm khác biệt của dữ liệu về tỷ lệ sống còn hoặc thời gian xảy ra sự kiện và mục tiêu của phân tíchtỷ lệ sống còn được mô tả.Biến mục tiêu trong phân tích sống còn chủ yếu là biến thời gian (đon vị có thể là ngày, tháng hoặc năm, kết hợp với biến nhị phân (có hoặc không xảy ra) cho sự kiện đó Tập trung xây dựng môhình “Dữ liệu thời gian và sự kiện (Time to event)”, định lượng các biến dự báo lên thời gian đến khi sự kiện xảy ra. ÁpdụngPhân tíchsống còn trongbài luận văn để cóthể xây dựng đượcbảng Sự kiện các nhân sự đã nghỉ việctrong quá khứ từ đó có các dữ liệu cụ thể cho việc phân tích hành vi người lao động Sẽ có 2 giá trị “còn” hoặc “đã nghỉ” để dự đoán nghỉ việc chocác đơn vị hiện hữu của Công ty.
2.4.4 Hàm sinh ton (Survival Function) và Hàm rủi ro (Hazard Function)
Gọi “T” là thời gian người lao độnggắng bó làm việc với công ty cho đến khi quyết định nghỉ việc.
Gọi “t” là thời gian muốn xem xét liệu người lao động có nghỉ hay không.
Gọi “d” là thể hiện của trạngthái của sự kiện quan tâm diễn ra hay chưa, “d” cũng được coi là biến ngẫu nhiên khi nó được xem xét trạng thái sự kiện xảy ra hoặc chưa xảy ra đối với người lao động tại Công ty.
Neu “d= 0”làsự kiện chưa xảy ra trong thời gian nghiên cứu, không biết liệu sự kiện có xảy rahay khôngkhi đã hoàn thànhnghiên cứu, ngược lại, nếu “d =1” thì sự kiện đã xảy ra trong thời gian nghiên cứu vàđược ghi nhận lại cụ thể.
Công thứctổng quát của Hàm sinh tồn: t s(t) = exp = P(T > t) = 1 - P(T < t) = 1 - Fụ)
0 Để sự kiện nghỉ việc không xảy ratrong thời gian mong muốn (0;t) ký hiệu là S(F),
Thời gian đến khi nghỉ việc xảy ra luôn được quan tâm trong bài toán này, mong muốncủa Công ty làkhông có sựkiện nghỉ việcxảy ra tại thời điểm này.
Hàm sinh tồn tích lũy xác suất không xảy ra sự kiện nghỉ việc(sống còn) của người lao động ở các “t” khác nhau, qua đó manglại nhiều thông tin quan trọng cho Phân tích sống còn.
Là hàm rủi ro tính khảnăng người lao độngquyết định nghỉ việc(sự kiện) được quan tâm trong một khoản thời gian theo dõi với điều kiện là người lao động chưa quyết định nghỉ việc cho đến thời điểm bắt đầu theo dõi Là mộtxác xuất người lao động quyết định nghỉ việc trong một khoản khắcmà trước đó họ chưa quyết định nghỉ Công thứctổng quát của Hàm rủi ro: p(t t) Lànguy cơ mà nghỉ việc xảy ratrong khoản thời gian từt đến t + At (vàAt rất là nhỏ)
Tỷ lệrủi ro tính từ hàm rủi ro là tỷ lệ giới hạn có điều kiện vì giữa điểmt bắtđầu theo dõi cho đến thời điểm kết thúc theodõi có khoản thời gian là At Được tính liên tục theo thời gian từ t (thời điểm bắt đầu) đến t + At (thời điểm kết thúc), khoản thời gian At càng lớn (cho đến thời điểm kết thúc), t + At càng lớn, tỷ lệ rủi ro càngtăng.
Hàm rủi ro h(t) cung cấp tỷ lệ rủi ro tức tại thời điểm t để chỉ ra ngay nguy cơ xảy ra nghỉ việc tại Công ty. Đặc tính của hàm rủi ro:
• Khi xảy ra sự kiện nghỉ việc là 0, tỷ lệ rủi ro sẽ thấp nhất
• Neu nguy cơ nghỉ việcxảy ratăng lên theo thời gian, tỷ lệ rủi ro sẽ tăng theo, tín hiệu không tốt chotương lai.
• Neu nguy cơ nghỉ việc xảy ra giảm dần theo thời gian, tỷ lệ hazard sẽ giảm dần,tươnglai sẽ tốt hơn.
Mô hình ước tính Kaplan-Meier và Mô hình CoxPH
Lifetable [16] thường được coi là thước đo tóm tắt về tỷ lệ tử vong theo độtuổi cụ thể trong từng thời kỳ Life table cũng có đặc điểm là mô tả trải nghiệm sinh tồn giả định củamộtnhóm thuần tậptổnghợp hoặc hư cấu, phụthuộc vào tỷ lệ tử vong hiện tại trong một quá trình giả tượng.
Kaplan - Meier ước tính từng tỷ lệ sống sót mỗi lần xảy ra sự kiện, không bắt buộc chia thời gian bằng các khoản bằng nhau Cụ thể khi áp dụng vào Cơ sở dữ liệu của Phòng TCNS, chúng ta có thể tính toán dựa trên các sự kiện “Nghỉ việc” và bắt đầu tínhtoán từ tháng 01/2015 đến thời điểm 31/12/2020.
Công thức tính xác suất tích lũy của Kaplan - Meier:
Trong đó, ĩĩị làsố lượng người lao động còn làm việc tại thời điểm 31/12/2020, dị là số lượng người đã nghỉ tính tới thời điểm 31/12/2020 Áp dụng Kaplan Meier vàoLife Table như trên
Bảng 2.1 Life Tabletheo ước tính Kaplan Meier t_i nJ d_i q_i d_i / n_i L(d_i / n_i) s_i
Mụctiêu của phân tích Kaplan Meier là phân tích được và diễn giải được Hàm sinh tồn và Hàm rủi ro So sánh 2 hàm từ 2 nhóm khác nhau Đánhgiá được sự ảnh hưởng của các yếu tố ảnh hưởng tớithời gian còn làm việctrước khinghỉ việc của người lao động Tính được tỷ lệ nghỉ việc quacácnăm để có biện pháp cải thiện nhiều yếu tố để giảm thiểu tỷ lệ nghỉ việcnhiều nhất có thể
Là mô hình phân tích hồi quy và không được xem là mô hình phi tham số (non- parametric) hay môhình tham so (parametric), nói đúng hon mô hình CoxPH là mô hình Semiparametric đều có tính chất của mô hình tham sốvà môhình phi tham số.
Sử dụng CoxPH không cần đưa ra bất kỳ giả định gì về quy luật phân phối, không phải xác định bất kỳ tham số cũng như là mô hình nào cho nó, hay không cần ước lượng /i0(t).
• h0(t) được gọi làBaseline Hazards function hoặc hàm Rủi ro theo thời gian. h(t) = ^0© * exp(& + £l*i + ftx2 + ■■• + Pp x p) = ^o(t) * exp (^ íh*i)
^^i=ỵ Pi^i là hàm mũ e, các biến X độc lập với thời gian đại diện chocác yếu tố tác động đến tỉ lệ rủi ro h(t) được định lượng bởi các hệ số hồi quy p Trong đó /?1?
/? 2 , Pp làhệ số cần được ướctính từ dữ liệu thực tế.
• Hazard Ratio (HR): dùng để so sánh tỷ lệ rủi ro xảy ra sựkiện giữa 2 nhóm, công thức tổng quát của HR:
• O A và O B là đối tượngthuộc nhóm A và Btrải qua sự kiện được quan tâm EA và E b là số đối tượngcó nguy cơ đối mặt vớisự kiện được quan tâm
• Nếu giá trị HR = 1, không có sự khác biệt giữa tỷ lệ rủi ro giữa 2 nhóm so sánh, biến đầu vào so sánh không có tác động nguy cơ xảy ra sự kiện.
• Nếu HR > 1, có sự khác biệt giữa tỷlệ rủi ro giữa 2 nhóm so sánh, giá trị của biến đầuvào đang xét tănglên, sẽ khiến nguycơ xảy ra sự kiện tăng theo.
• Nếu HR < 1, có sự khác biệt giữa tỷ lệ rủi ro giữa 2 nhóm so sánh, giá trị của biến đầuvào đang xét tănglên, sẽ khiến nguy cơ xảy ra sự kiện giảm xuống.
Mô hình hồi quyCoxPH cóthể phát biểu ở2 dạngcông thứctổng quát
/MOA YM log / = ^íXí + ^^ + ^^ ■ ■ ■+ ^pXp = À^lX‘
Các giá trị/?1? Pz ’ Pz cóthểước tính được biến số “predict” khi sử dụng phương pháp MLE.
Mô hình CoxPH [17] có dạng chức năng của mốinguy cơbản không được đưara mà được xác định từ dữ liệu nên mô hình Cox được gọi là bán tham số Tuy nhiên, một dạng tham số cho tác động của các đồng biến đối với mối nguy tổng hợp được giả định như tồn tại mối quan hệnhân giữa hàm rủi ro cơbản và hàm log-tuyến tính của các hiệp phương sai Giả định này được gọi là giả định tỷ lệ Trong thực tế, người ta giả định rằng hai vậtthể bất kỳ có hàm nguy hiểm có tỷ số làmộthằng số Tỷ lệ phụ thuộc vào hiệp phương sai và không đúng thời gian; có mối quan hệ log-tuyến tính giữa các hiệp phương sai độc lập và hàm rủi ro cơbản; tác động của hiệpphương sai luôn giốngnhau.
Mô hình áp dụng vào phân tíchnhân sự để dự đoán khoảnthời gian trung bình từ lúc nhân sự được tuyển dụng cho đến lúc nhân sự nghỉ việc Đánh giá được mức độcó thể nghỉ việc trong tương lai của nhằn sự.
Trong thực tế khi tiến hành phân tích, cần xem xét đến nhiều nhóm đối tượng khác nhau Ví dụ như những nhân sự thuộc nhóm văn phòng thường có xu hướng ítnghỉ việc hơn những nhóm người làm ở bộ phận sản xuất hoặckinh doanh.
Các yếu tố xung quanh như: thu nhập, độ tuổi, cực kỳ hữu ích khi được đưa vào mô hình Cox để định lượngtác động và hỗ trợ phân tích sâu hơn vềđộ ở lại làm việc hoặc rủi ro nghỉ việc của từng nhân sự trong công ty.
Hồi quy Logistic (Logistic Regression)
2.6.1 Định nghĩa và ứng dụng của Hổi quy Logistic
Hồi quy Logistic [19] đôi khi được gọi là mô hình logistic hoặc mô hình logit, phân tích mối quan hệ giữa nhiều biến độc lậpvà biến phụ thuộc phân loại vàước tính xác suất xảy ra sự kiện bằng cách khớp dữ liệu với đường cong logistic.
Hồi quy Logistic được ứngdụng trong phân tích dựbáo, đã được ứng dụng rộng hơn trongmachine learning, xuất hiện trong cácphần mềm thống kê và khai phá dữ liệu (data mining), giúp người dùng tìm hiểu mối quan hệ giữa biến mục tiêu là biến định tính vàmộthay nhiều biến độc lập thông qua thiết lập phươngtrình hồi quy logistic. ứng dụngtrongviệc xây dựng mô hình dự báo với cácdoanhnghiệpvì giúp họ khai phá các mối quan hệ, những yếu tố tác động lên doanh thu, lợi nhuận và quản lý hành chính nội bộdoanhnghiệp.
Làphương pháphồi quy thông dụng nhất, áp dụng cho các biến mục tiêu không phải là biến định lượng liên tục, đặc biệt là Hồi quy Logisticnhị phân vì đây làdạng phổ biến nhấttrong các hồi quy logistic.
Sự khác biệt của biến mục tiêu chính là cơ sở phân biệt hồi quy logistic với các phương pháp hồi quykhác Điều quan trọng phảihiểu rằngmục tiêu sư dụng mô hình này cũng giống bất kỳ mô hình hồi quy nào khác trong thống kê là tìm ra được mô hình phù hợp nhất và tối ưu nhất để mô tả mối quan hệ giữa biến mục tiêu y và một tập hợp các biến độc lập X (biến dự đoán hoặc giải thích) qua đó đưa ra các kết quả dự báo hayphân loại trong tương lai.
Hồi quy Logistic dùng để dự báo khảnăng xảy rasự kiện, tìnhhuống trong tương lai. Điển hình ở đây là việc áp dụng vào việc dự đoán xem người lao độngcó quyết định nghỉ việchay không, qua các dựbáo công tysẽ biết và lập kếhoạch sử dụng lao động để không gián đoạn việcsản xuất kinhdoanh tại công ty.
Kết quả của biến mục tiêuy trong Hồi quy logistic mang giátrị xác suất (probability) để phân loại đối tượng nghiên cứu hay quyết định giátrị cuối cùngcủa biến y trong danh mục các giátrị địnhtính Nhiệm vụ phân tích sau cùng của hồi quy logistic đưa ra kết quả dự báo chính xác (value prediction) và có cả kết quả phân loại chính xác (category classification).
2.6.2 Phương trình tống quát Hoi quy Logistic
Phương trình cơbản của Hồi quy Logistic:
Dựa vào xác suất để quyết định giá trị cuối cùng của Y (y chỉ có 2 giá trị: có hoặc không), thông thường theothông lệ, các chuyên giatrong lĩnh vực phằn tích sẽ gán y = 0 cho kết quả “không; thất bại; nghỉ việc; ”, còn gán y —1 chocácgiá trị còn lại vàcó kết quả tích cực, kết quả mong đợi của người phân tích.
Biến đổi phương trình tổng quát của Hồi quy Logistic sẽ có dạng tổng quát với p là xác suất cần tìm p = fỉ ữ + P-ỊX+ £
Xác suất chỉ có giá trịtừ 0 tới 1, khixác suất có giá trịlớn tiến đến 1 thì tương úng khả năng y = 1 càng cao và khi xác suất có giá trị tiến đến 0 thì tương ứng khả nẵngy = 0 càng cao Lưuỷ giá trị 0 và 1 củaykhông phải giá trị số thực, mà là kết quả mã hóa (coding) của những giá trị định tính của biến y, ví dụy = 0 nghĩa là đối tượng nghiên cứu trong bài ở tươnglai có thể “nghỉ việc”, y = 1 thì suyngược lại. với p là biến phụ thuộc, xác suất khả năng y xảy ra 0 hoặc 1 (chịu ảnh hưởng của biên %), là biên chúng ta sẽ dự báo giá trị X là biên độc lập (biên tác động lên biên phụ thuộc), p ồ là giá trịước lượng của p khi X đạt giá trị 0, p ± dùng để xác định giá trịtrung bình của p tăng hay giảm khi X tăng, 8 là sai số, thề hiện giá trị của cácyếu tố khác không thể nghiên cứu hết và cácyếu tố này vẫn tácđộng lên giá trị p
Tuy nhiên phương trình tổng quát trên lại khôngthích hợptrong việc ước lượng xác suất trung bình của biến mục tiêu y cho một đốitượng bất kỳ trong tổng thểnghiên cứu mặc dủchúngvẫn thể hiện mối quanhệ giữa biến yvà biến X bằng hệ số hồi quy
Như đã nói nếu sử dụng phương trình trên thì giá trị xác suất p có thể không nằm trong giới hạn 0 và 1, tức có thể p lớn hơn 1 hoặc p bé hơn 0 mang giá trị âm Với phương trình trên có thể suy ra dạngđồthị tồng quát của hồi quy logistic:
Phương trình tông quát của Hôi quy Logistic: g^o + ^i^i+^2^2+ •••+ Ppxp
Phương trình tông quát đêước lượngxác suằt: gồQ + b^Xỵ-ị-b 2x 2 -ị- + bpXp ỹ = ước lương P(y = llxi.Xo, = - , , , —-r—
2.6.3 Hàm Logit, hàm Sigmoid (Logit function & Sigmoid function) Để giới hạn kết quả tính toán nằm từ 0 đến 1, là xác suất của phương trình hồi quy logistic, người ta sử dụng mộtloại hàm trong toán học gọi là Hàm Sigmoid (Sigmoid Function)hay Hàm Logistic (Logistic Function) hay Phép biến đổi Logistic (Logistic Transformation) CÓ 3 tên khác nhau nhưng cùng chung một dạng gọi là hàm Logit đảo ngược (Inverse logit function).
Công thức của hàm logit logit(p) = log
Hàmlogit đượcdùng chủ yếutronglĩnh vực thống kê mục đích đểchuyển đổigiá trị xác suất trong khoảng (0; 1] thành những giá trị số thực (real numbers) nằm trong khoảng (-00, +00), nghĩa là giátrị của hàm logitsẽ tiến đến+00 khi xác suất p tiến đến
1, và giá trị hàm logitsẽ tiến đến -co khi xác suất p tiến đến 0.
Công thức của hàm Sigmoid
HàmSigmoid là mộtdạng ngược lại của hàm logit, tức nếu có xác suất pthì sigmoid (logit(p)) = p, nghĩa là sẽchuyểnđược các giá trị thực của một biến bất kỳ nằm trong khoảng (-00; +®) sang giátrị nằm trong khoảng (0, 1], Dođốhàm Sigmoid rất hữu ích trong các bài toán phân loại (Classification) lchi tính năng chính của nó phù hợp để xem xét, tínhtoánkết quà phân tích ỏ' giai đoạnsau cùng của quy trình phân loại thành những kết quâ cụ thể.
Hình 2.2ĐỒ thị hàm Sigmoid
Hàm Sigmoid được nhận biết vớiđặc điểm nổibật làđộthịcủa nócóhình cong như chữS Hàm Sigmoid thựcchất bắt nguồntừ hàm Logistic, còn hàm LogitvàSigmoid giống như biếnthể của hàm logistic Và cũng chính vì thế mặc dù hàm Sigmoid được dùng trong mô hìnhhổiquy áp dụng cho biến mục tiễu là biến thay phiên, biến nhị phân (binary) nhưngkhông được gọi là Hồi quy Sigmoid (Sigmoid Regression)mà Hồi quy Logistic.
Hàm Sigmoid là giá trị tại đó chiếu thẳng lên điểm chính giữa đường cong có thễ được dùng đề làm mốc kết luận giá trị cùa biến y, nghĩa là có thễ lấy p = 0.5 làm chuẩn Giảsử trong bài luận văn ước lượng xác suất nghỉviệccủa nhân viên A là 0.7 thìnhânviên này cókhà năng không nghỉ việcvì0.7 >0.5 nên biến y sẽ mang giátrị là 1 - không nghỉ việc, ước lượng xác suất của nhân viên B là 0.3 vì 0.3 < 0.5 nên biến ỵ sẽmanggiá trị 0 -có khảnăng nghỉ việc.
2.7 Mô hình Rùng ngẫu nhiên (Random Forest):
2 7.1 Định nghĩa Rừng ngâu nhiên
Mô hình Láng giềng gần nhất KNN (K-Nearest Neighbors)
Mô hình K NearestNeighbor (KNN) [18] đã được sử dụng rộng rãi trong các ứng dụng khai thác dữ liệu và học máy docách triển khai đon giản và hiệu suất vượt trội Tuy nhiên, việc thiết lập tất cả dữ liệu thử nghiệm có cùng giátrị k trong các mô hình KNN (đã được chứng minh) đãkhiến phương pháp này khôngthựctế trong các ứng dụng thực tế Bên cạnh các nhiệm vụ phân loại, mô hình KNN còn được sử dụng để hồi quy và dữ liệu bị khuyết.
2.8.2 Àp dụng mô hình KNN trong bài toán dự đoán
Trong bài toán dự đoán người nghỉ việc, không có một công thức cụ thể như trong các mô hình tuyến tính Thay vào đó, mô hình KNN sử dụng một cách tiếp cận dựa trên láng giềng gần nhất để dự đoán Quy trình dự đoán trong mô hình KNN có thể được mô tả như sau:
• Tính khoảng cách: tính khoảng cách giữa điểm dữ liệu mới và tất cả các điểm dữ liệu trongtập huấn luyện, thường sử dụng khoảngcách Euclidean.
• Lựa chọn láng giềng: chọn ra K lánggiềnggầnnhất với điểm dữ liệu mới, dựa trên khoảngcáchtính được.
• Dự đoán nhãn: dựa trên nhãn của K láng giềng gần nhất, mô hình KNN thực hiện dự đoán bằng cách sử dụng đa so (majority voting) hoặc trung bình (mean) của nhãn của các láng giềng.
Vídụ, sửdụngKNN để dự đoán liệu mộtnhân viên có nghỉviệc hay không, quy trình sẽ là:
• Tính khoảng cách giữa thông tin của nhân viên mới và các nhân viên trong tập huấn luyện.
• Chọn ra K nhân viên gần nhất.
• Dự đoán rằngnhân viên mới sẽ nghỉ việc nếu hon nửa số K láng giềngdự đoán là nghỉ việc, và ngược lại. Điều quan trọng là bạn cần chú ý đến việc chọn giá trị K phù hợp để đảm bảo mô hình có hiệu suất dự đoán tốt trên tập dữ liệu kiểm tra.
Mô hình Máy hỗ trợ vector SVM (Support Vector Machine)
Máy hỗ trợ vector (SVM) [19] là một trong những thuật toán học có giám sát phổ biến nhất, bao gồm phân loại và phân tích hồi quy Mục tiêu của SVM là tìm một ranh giới phân chia tối ưu giữa các lớp(trong trường hợp phân loại) hoặc một ranh giới tối ưu (trong trường hợp hồi quy) dựa trên dữ liệu huấn luyện Đặc điểm chính của SVM là sự sử dụng các vector hỗ trợ (support vectors), đó là các điểm dữ liệu trong tập huấn luyện gần nhấtvói ranh giới quyết định Ranh giới được xâydựng sao cho khoảng cách từ các vector hỗ trợ tới ranh giới là lớn nhất, giúp tối ưu hóa tính
2.9.2 Áp dụng mô hình SVM trong bài toán dự đoán
Mô hình SVM dùng để dự đoán nhân sự có nghỉ việc cần tiến hành cácbước sau:
• Chuẩn bị dữ liệu: thu thập các dữ liệu về nhân sự bao gồm các đặc trưngnhư tuổi, giới tính, trình độ học vấn, kinhnghiệm làm việc, mức lưong, v.v Đặc biệt, cần có biến phụ thuộc (targetvariable) là trạngthái nghỉ việc (có hoặc không).
• Tiền xử lý dữ liệu: tiền xử lý dữ liệu bao gồm việcxử lý dữ liệu còn thiếu, chuẩn hóa các biến số, mã hóa biến phân loại, và chia tậpdữ liệu thành tập huấn luyện và tập kiểm tra.
• Huấn luyện mô hình SVM: sử dụng tập huấn luyện để huấn luyện môhình SVM Chọn loại kernel phù hợp cho bài toán (ví dụ: kernel tuyến tính, kernel đa thức, hoặc kernel Gauss (RBF)) Điều chỉnh các siêu tham số (như c và gamma) thông qua việc thửnghiệm và đánh giá trên tập kiểm tra hoặccross-validation.
• Dự đoán và đánhgiá: sử dụng mô hình đãhuấn luyện để dự đoán trên tập kiểm tra. Đánh giá hiệu suất của mô hình bằng các độ đo như accuracy, precision, recall, Fl-score.
• Sử dụng mô hình để dự đoán: Sửdụng mô hình đãhuấn luyện để dự đoán liệu một nhân viên mới có nghỉ việc hay khôngdựa trên thông tin về họ.
• Theo dõi và cải thiện: theo dõi hiệu suất của mô hình trênthời gian và cập nhậtmô hình nếu cần thiết khi có sự thay đổi trong dữliệu hoặc yêu cầucủa bàitoán.
Công thức co bảncủa mô hình SVM trong bài toán dự đoánnhằn sự nghỉ việc có thể được biểu diễn như sau: f^x) = ớ) ■ X + b
• f(x) là giá trị dự đoán cho mộtnhân viên X
• ờ) là vector trọng số của siêu phẳng
• X là vector đặc trưng của mỗi nhân viên (ví dụ: tuổi, giớitính, mức lưong, )
• ò làhệ số điều chỉnh(bias) Đe điều chỉnh mô hình, chúngta cần tối ưu hóa các tham số 60 và ờ dựa trên dữ liệu huấn luyện.
ÁP dụng kết quả nghiên cứu
Đánh giá bộ tập dữ liệu
Bảng 3.1 Bảng môtảtông quan vêtập dữ liệu Đặc điểm Mô tả
Số ô không có dữ liệu 4.240 ô
Dữ liệu do Phòng TCNS tổng hợp vàđượccung cấp dưới dạng bảng trong file CSV, chứa các thông tin cơbản về nhân sự từ năm 2014 đến thời điểm 31/08/2020.
Bộ dữ liệu file CSV của phòng TCNS có một số ưu điểm như sau:
• Dữ liệu trongtập dữ liệu là loại dữliệu thực.
• Dữ liệu được tổng hợp vào từng tháng, dễdàngcho việc phân tích
• Tập dữ liệu này được đánh nhãn.
• Phần dữ liệu đã được phân tách thành tệp CSV dễ dàng phân tích hơn so với tập dữ liệu thô.
Tuy nhiên, file CSV của phòngTCNS có một số nhược điểm như sau:
• Tập dữ liệu này còn khá mới và chứamột số lỗi nhỏ cần phải được tiền xử lý trước khi thực hiện các tác vụ khác.
• Rất nhiều giátrị NULLdo file quản lí đi qua nhiều người tiếp nhận nhưng không có một tiêu chuẩn chocùng một file.
Cài đặt và thử nghiệm mô hình
Cài đặtvà thử nghiệm mô hình trong 2 tuần với tập dữ liệu Phòng TCNS cung cấp, cụ thể:
• Sử dụng file cơ sở dữ liệu đến tháng 08/2020
• Chuyển đổi từtập dữ liệu file CSV thô và kếthợp nhữngđiều chỉnhtrong dữ liệu.
• Ảp dụngcác thuật toán về phân tíchdữliệu cho tập dữ liệu.
• Dựa vào báo cáo để đưa ra những nhận xét về nhân sự đã nghỉ việc để tìm ra các tác nhân dẫn đến nhân sự nghỉ việc.
Đánh giá kết quả
Sử dụng ngôn ngữ Python, tiến hành import các thư việncần thiết để làm việc với dữ liệudạng bảng, tải, đọc dữ liệu từfile CSV của Phòng TCNS Tiến hành xử lý số hóa vàtrực quan hóadữ liệu.
Bảng 3.2 Ví dụ số hóa ở các cộtdữ liệu trong tập dữ liệu của Công ty
Cột dữ liệu Giá trị Giá trị số hóa Đơn vị
Cao đẳng/ Cao đẳng nghề 15 Đại học 16
Lựa chọn các cột chuyển số hóa thành dữ liệu cụ thể đểtạo thành một DataFrame (Bảng dữ liệu) có các thông tin cần thiết cho việc nghiên cứu Sau khi chuyển đổi, DataFrame hiện có sẽ thànhdạng như sau:
Bảng 3.3 5 dòng đầu tiên của DataFrame sau khi chuyển đổi
TênTP Chức danh Thành tích
Tổ Trưởng/ Cửa Hàng Trưởng 2
Tổ Phó/ Đội Trưởng/ Đội Phó/ Cửa
NGUYỄN ĐỨC SƠN Đại học Hà Nội Trưởng Phòng/ Giám Đốc/ Trưởng
Ban/ Quản Đốc/ Quyền Trưởng Phòng 3
Thuận Tổ Trưởng/ Cửa Hàng Trưởng 3
Thêm một cột trạngthái nghỉ việc“RESIGNED” dựa vào cột “DATE_END” (ngày nghỉ việc), nếu cột “RESIGNED” có dữ liệu thì tưong đưong người lao động nghỉ việc có giátrị value=l, ngược lại value=o tưong đưong người lao độngcòn làm việc. Kiểu dữ liệu của từng cột trong DataFrame:
Bảng 3.4 Bảng kiểu dữ liệu của các cột trong DataFrame
Kiểu dữ liệu Cột float64
Mã NV, Tuổi bắt đầu làm việc, Hệ số trách nhiệm, Hệ số thâm niên, Phụ cấp chức vụ, Phụ cấp trách nhiệm, Tổng thu nhập không thuế object Họ tên, Ngày nghỉ việc, Đơn vị, Ngày sính, Tên TP, Trình độ, Khu vực, Chức danh,
Mã lương, Bậc lương Ĩnt64
Tình trạng làm việc, Tuổi, Giới tính, Thời gian làm việc tới khi đủ hưu, Phụ cấp thu hút, Thời gian làm việc, Lương cơ bản, Thành tích, Nghỉ việc datetimeố4[ns] Ngày bắt đầu làm việc
Tạo DataFrame 1 ọc ra những nhẵn sự đãnghỉ việc, cột “EMPL STA”(tìnhtrạnglàm việc) có giátrị là 0.
Bảng3.5 5 dòngđầutiên củaDataFrame saukhi lọcnhữngngười đãnghỉ việc
60 LÝ MỸ LAN 0 TP.HỒ Chí
PHƯỚC 0 Quảng Nam Tổ Trưởng/ Cửa Hàng
TRANG 0 Bình Định Tổ Trường/ Cửa Hàng
3.3.2 Phân tích và trực quan hóa đữ ỉiệu
Thống kê đếm số lưọng ngưòi lao động đang làm việc hoặc nghỉ việc dựa vào cột
“Tình trạng làm việó”(EMPL_STA).
Tình trạng nghỉ việc so với chưa nghỉ việc
Theo biểu đồtrên từ dữ liệu của Phòng TCNS có thể đưa ravài nhận xétcụ thể:
• Tổng sốngười làm việc tạicông ty từ thờiđiểm 2014 đến 2020 là: 11.947 người
• Số người hiện tại còn làm việc có mặt tại thời điểm 31/12/2020 là: 4.240 người
• Số người đã nghỉ việc tói thờiđiểm 31/12/2020 là: 7.707 người
• Số người đã nghỉ việc chiếm 65% trong tổng số laođộng của dữ liệu
3.3.2 ỉ Người lao động nghỉ nhiều vào thời điểm nào? Đó thị sỗ lương nhân viên nghỉ việc từ 2006 - 2021
Hình 3.2 Đồthị số lượng nhân viên nghỉtheo năm (2006-2020)
Theodữ liệu đượctổng hợp và cập nhậttừnăm 2014 nên quabiểuđồ trêncó thể thấy nhân sự bắt đầu nghỉ việc từ năm 2014 Để rõ hơn về diễn biến nghỉ việc qua các tháng trong năm, cần quan sát thêm biểu đồ số lượng nhân viên nghỉ việctheo từng tháng của từng năm cụ thể từnăm 2014 đến năm 2020.
Hình3.3 Đồthị số lượng nhânviên nghỉ việc theo tháng (2014-2020)
Nhưcó thể thấyqua đồ thị chi tiết như sau:
• Giai đoạn 2014 - cuối 2016 số lượng nhân viên nghỉ việc rấtít (dao động từ 10 -
50 nhân viên cho 1 tháng) Cóthể suy ra rằng giai đoạn này chế độ lương bổng và mức hàilồng công việc ổn định, nên nhân viênít nghỉ việc.
• Giai đoạn 2017 trở đi nhân viên nghỉ việc khá nhiều, đặc biệt có xu thế nghỉ ở giai đoạn Tết mỗi năm: từ tháng 1 đếntháng 3 hàng năm => Có thể từ năm 2017 trỗ đi, có nhiềucông ty khác cóchế độ đãi ngộ tốthơn, nên nhân viên có xu thế làm việc đến Tếtđể hưởng thưởng Tết, sau đósễ nghỉ việc qua công tykhác có chếđộ đãi ngộ và lương tốt hơn.
♦ Giaiđoạn tháng 06 năm 2020 và tháng 07 năm2020 có số lượng nhânviên nghỉ rất cao (trên200 người/tháng) và cao hơnhẳn so với giai đoạn Tếtnăm 2020 Có thểgiải thíchrằng thời giannày công ty cơ cấutổ chức lạibộ phận bán hàng kênh truyềnthống.
3.3.2.2 Phân tích trỉnh độ chuyên môn
Tạo mộtDataFrame đểthốngkêtỷ lệ nghỉ việc dựa trên trình độ của người lao động. Cột “Tỷ lệ nghỉ (%)” được tính bằng công thức:
Tỷ lệ nghỉ (%) = số lượng dòng value = 1 ở cột RESIGNED (đã nghỉ việc)
SO lượng dòng ở cột EMP_CODE {dang lầm việc) Lọc radữ liệu của 5 nhóm trình độ có tỷ lệ nghỉ việc cao nhất
Bảng 3.6 Top 5 nhóm trình độ có tỷ lệ nghỉ việc cao nhất
STT Trình độ Tống nhân viên Số Nhân Viên nghỉ Tỷ lệ nghỉ (%)
Tỷ lệ nghỉ việc trung bình là 56.184524
Công ty về sản xuất và kinh doanh thực phẩm nên lực lượngnồng cốt chủ yếu là công nhân vànhân viên bán hàng Những vị trí đó không yêu cầu cao về trình độ chuyên môn nên các bảng thông số trên có thể thấy phần lón tập trung ở các bậc trình độ từ1/12 đến 12/12 Trình độ 12/12 chiếm tỉ lệ cao nhất của công ty.
Biểu đó phân bồ sử dụng nhân viên s ó n h â n v iê n in Ọ
Hình 3.4 Biếu đồ thế hiệnTống số lượng nhânviên và số lượng nhân viên nghỉ việcphân bố theo trình độ chuyên môn
Từ biểu đồ trên, tacó những nhận xétsau đây:
♦ Tỷ lệnghỉ việc trung bình khá cao: 5ố 18%(trên 50%)
• Lao động chiếm số lượngcao nhất là lao động trinh độ 12/12, với tỷ lệ nghỉ việc chiếm 63,53% Đây là lực lượng lao động chính và luôn có sự thay đối nhân sự liên tục do nhiều yếu tố như lương, môi trường làm việc và các yếu tố khác liên quan đến phúc lợi, khen thưởng.
• Tiếp theo làlao động trình độ 9/12, với tỷ lệ gần 59.85 % Cũng giống như trình độ 12/12, đây cũng là lực lượngchínhtronvai tròcôngnhân sảnxuất(vịtrí không yêu cầu quácaovề học thức cũng như bằng cấp, có thể tuyển dụng được với điều kiện tối thiểu là tốtnghiệp cấp 2 trởlên).
• Tỷ lệ nhân viên nghỉ nhiều nhất theo trình tự là trình độ 3/12, 4/12, 5/12, 12/12, 6/12, v.v Đây là nhữnglao động phổthông và làm việcchân tay làchủ yếu, tỷ lệ nghỉ nhiều có thể là do ảnh hưởng từ mức lưong thấp, hoặc làm việc trong môi trường không phù hợp với những lao động đấy.
• Nhân viên có trình độ đại học/thạc sĩ có tỷ lệ nghỉ cũng cao (48.45%), như vậy có thể thấy rằng, môi trường sản xuất kinh doanh ít bị ảnh hưởng bỏi các bằng cấp đại học/cao học Chỉ có những vị trí lãnh đạo và một bộ phận nhỏ ỏ các phòng chuyên môn là cần có những yêu cầu này.
3.3.2.3 Phân tích theo khu vực, tỉnh thành
Có 63 tỉnh thành và được chia thành 8 khu vực khác nhau, cụ thể gồm có:
Bảng 3.7 Danh mục Khu vực của 63 tỉnhthành cả nước
5 Duyên hải Nam Trung Bộ
8 Đồng bang sông Cửu Long
Tạo DataFrame đểnhóm lại theo từng giátrị ở cột “Khu vực” và cột“Tên TP” Đem số lượngtổng dựa vào cột “Tìnhtrạng làm việc” (EMPL_STA) và số lượng giátrị 1 ởcột“RESIGNED”.
Tỷ lệ nghỉ với nhóm theo cột “Khu vực” vànhóm theo “Tên TP”
_ _ số lượng dòng value = 1 ở cột RESIGNED (đã nghỉ việc)
Tỷ lệ nghỉ (%) = -————-—^—G00 số lượng dong ờ cột EMP CODE (gang lầm việc) Tạo DataFrame 5 khu vực cótỷ lệ nghi cao nhất
Bảng 3.8 Top 5 khu vực có tỷ lệ nghỉ cao nhất
STT Khu vực Tổng nhân viên Số Nhân Viên nghỉ Tỷ lệ nghỉ (%)
1 Duyên hải Nam Trung Bộ 1222 747 61.129296
Khu vực Tây Bắc Bộ có tỉ lệ nghỉ cao nhấttuy nhiên số lượng nhân viên thuộc khu vực này không nhiều, đây có thể là những nhân viên thực hiện việc giới thiệu sản phẳm hoặc bán hàng kênh GT.
Tạo DataFrame 5 khu vực có tỳ lệ nghỉ thấp nhất
Bảng 3.9 Top 5 khu vực có tỷ lệ nghỉ thấp nhất
Số Nhân Viên nghỉ Tỷ lệ nghỉ (%)
6 Đồng bằng sông Cửu Long 2499 1390 5 5.622249
1 Duyên hải Nam Trung Bộ 1222 747 61.129296