Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 20 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
20
Dung lượng
2,32 MB
File đính kèm
code.rar
(10 MB)
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC —— o0o —— HỆ HỖ TRỢ QUYẾT ĐỊNH HỆ HỖ TRỢ DỰ BÁO KHẢ NĂNG NGHỈ VIỆC CỦA NHÂN VIÊN Giảng viên hướng dẫn: TS Lê Chí Ngọc Sinh viên thực hiện: Hồng Thanh Lưu Lớp: Toán Tin K61 Hà Nội - 5/2020 Mục lục Điều tra khảo sát 1.1 Khảo sát trạng 1.2 Bài tốn nghiệp vụ thiết kế mơ hình 1.2.1 Bài tốn nghiệp vụ 1.2.2 Thiết kế mơ hình 1.3 Dữ liệu thực nghiệm 1.4 Đặc tả yêu cầu hệ thống Phân tích thiết kế hệ thống 2.1 Biểu đồ phân cấp chức 2.2 Biểu đồ luồng liệu 2.2.1 Biểu đồ luồng liệu mức 2.2.2 Biểu đồ luồng liệu mức 2.2.3 Biểu đồ luồng liệu mức ngữ cảnh đỉnh đỉnh Thiết kế hệ thống 3.1 Mơ hình hệ thống 3.2 Thiết kế hệ thống mặt liệu 3.3 Thiết kế hệ thống mặt giao diện 3.3.1 Công nghệ sử dụng 3.3.2 Giao diện hệ thống 4 4 10 10 11 11 11 12 13 13 13 14 14 16 Mở đầu Trong trình hình thành phát triển, cơng ty ln phải đối mặt với vấn đề nghỉ việc nhân viên Có nhiều nguyên nhân dẫn đến rời nhân viên cân công việc, sống, vấn đề kinh tế, khoảng cách địa lý, Hệ lụy từ việc nhân viên nghỉ việc ảnh hưởng đến công ty không tránh khỏi Hiểu biết nhân viên nghỉ việc giúp nhà quản lý đưa chiến lược giữ chân nhân viên lên kế hoạch tuyển dụng nhân phù hợp để đáp ứng với yêu cầu cấp thiết công ty Trong báo cáo em xây dựng hệ thống hỗ trợ định dự báo khả nghỉ việc nhân viên thể dạng báo cáo thống kê biểu đồ, bảng biểu trực quan, sinh động hỗ trợ cho nhà quản lý Em xin chân thành cảm ơn thầy Lê Chí Ngọc - Viện Toán ứng dụng Tin học, Đại học Bách Khoa Hà Nội tận tình dạy, hướng dẫn, truyền đạt kiến thức cho em suốt q trình thực đề tài Do có nhiều hạn chế mặt kiến thức nên báo cáo tránh khỏi số sai sót mặt chủ quan khách quan Vì em mong nhận góp ý, đánh giá thầy bạn để hoàn thiện báo cáo hoàn thiện hệ thống thời gian tới Em xin chân thành cảm ơn! Chương Điều tra khảo sát 1.1 Khảo sát trạng • Nhân viên nghỉ việc vấn đề gây nhiều hao tổn cho công ty Chi phí thực tế cho việc thay nhân viên thường cao • Một nghiên cứu Center for American Progress (Tổ chức nghiên cứu vận động sách cơng Mỹ) cơng ty thường trả khoảng phần năm số tiền lương nhân viên để thay họ, chi phí tăng đáng kể vị trí có chức vụ cao nhân viên trả lương cao cần tìm người thay (Chi tiết xem thêm tại: [2] - Tài liệu tham khảo) • Một cách nói khác, chi phí thay nhân viên đáng kể với hầu hết nhà tuyển dụng Điều lượng thời gian dành cho vấn, tiền thưởng hiệu suất, chất lượng công việc bị giảm sút vài tháng nhân viên làm quen với cơng việc, vai trị • Nắm bắt nhân viên có khả nghỉ việc cao giúp nhà quản lý đưa phương án hành động để giữ chân nhân viên lâu lập kế hoạch tuyển dụng phù hợp 1.2 Bài toán nghiệp vụ thiết kế mơ hình 1.2.1 Bài tốn nghiệp vụ Yêu cầu đặt toán nghiệp vụ: • Khả mà nhân viên tích cực rời khỏi cơng ty nào? Hệ hỗ trợ định GVHD: TS Lê Chí Ngọc • Những yếu tố (đặc trưng) góp phần tác động tới định nhân viên? • Những chiến lược hợp lý thơng qua dựa kết phân tích liệu để giữ chân nhân viên? Hình 1.1: Mơ hình hóa nghiệp vụ Bài tốn sử dụng đề tài tốn phân lớp nhị phân có giám sát với (nhân viên hoạt động) (nhân viên nghỉ việc) Mục tiêu toán tìm xác suất mà nhân viên rời bỏ cơng ty 1.2.2 Thiết kế mơ hình Mơ hình áp dụng thuật tốn Hồi quy Logistic • Phân tích hồi quy Logistic kỹ thuật thống kê mà dạng sử dụng hàm Logistic để xem xét mối liên hệ biến độc lập (biến số biến phân loại) với biến phụ thuộc biến nhị phân • Các biến độc lập x1 , x2 , , xk VD: JobSatisfaction, PerformanceRating, TotalWorkingYears, • Dự báo xác suất để nhân viên nghỉ việc Gọi biến phụ thuộc "nghỉ việc" y (y = 1: nghỉ việc, y = 0: không nghỉ việc), ta tính tốn xác suất để nhân viên nghỉ việc P (y = 1|x); P (y = 0|x) = − P (y = 1|x) • Sử dụng hàm Logistic: P (y = 1|x) = 1 + e−(β0 +β1 x1 + +βk xk ) = 1 + e−s Hàm có số tính chất sau: SVTH: Hồng Thanh Lưu Tốn Tin K61 Hệ hỗ trợ định GVHD: TS Lê Chí Ngọc Hình 1.2: Nhân viên nghỉ việc vấn đề nan giải với công ty – Là hàm số liên tục nhận giá trị thực, bị chặn khoảng (0, 1) = 0; s→−∞ + e−s lim =1 s→+∞ + e−s lim – Hàm có đạo hàm nơi, lợi cho việc tối ưu Nếu coi điểm có tung độ 1/2 ngưỡng, điểm xa ngưỡng phía bên trái có giá trị gần 0, điểm xa ngưỡng phía bên phải có giá trị gần SVTH: Hồng Thanh Lưu Toán Tin K61 Hệ hỗ trợ định GVHD: TS Lê Chí Ngọc • Các giá trị β0 , β1 , · · · , βk giải thích cho xác suất P (y = 1|x) với mối quan hệ phụ thuộc tuyến tính P (y = 1|x) − P (y = 1|x) log = β0 + β1 x1 + · · · + βk xk • Giá trị ngưỡng: Mơ hình Logistic dự báo xác suất P (y = 1|x), nhiên thực tế ta cần dự báo giá trị y = 1/0 (nghỉ việc/khơng nghỉ việc), ta cần xác định giá trị ngưỡng t (0 < t < 1) cho: – Nếu P (y = 1|x) ≥ t: Dự báo y = – Nếu P (y = 1|x) < t: Dự báo y = Thông thường chọn t = 0.5, nhiên thực tế, tùy vào u cầu mục đích cụ thể ta chọn giá trị t khác Ước lượng tham số - phương pháp hợp lý cực đại Phương trình Hồi quy Logistic: P (y = 1|x) = 1 + e−(β0 +β1 x1 + +βk xk ) = hβ (x) ⇒ P (y = 0) = − hβ (x) Do ta viết gọn lại sau: P (y|x, β) = hβ (x) y − hβ (x) 1−y Hàm hợp lý: n L(β) = P (y1 , y2 , · · · , yn |x, β) = n P (yi |xi , β) = i=1 hβ (xi ) yi − hβ (xi ) 1−yi i=1 Log hàm hợp lý: n yi log hβ (xi ) + (1 − yi ) log − hβ (xi ) log L(β) = i=1 Tối ưu hóa hàm hợp lý Xác định vector β cho làm log L(β) đạt cực đại • Khơng có cơng thức tường minh cho ước lượng β phương pháp hồi quy tuyến tính • Bài toán tối ưu hàm hợp lý hồi quy Logistic giải stochastic gradient descent (SGD) (xem thêm [1] - trang 168-169) SVTH: Hoàng Thanh Lưu Toán Tin K61 Hệ hỗ trợ định GVHD: TS Lê Chí Ngọc • Ưu điểm – Đơn giản, dễ thực hiện, hiệu – Khơng địi hỏi q nhiều tài ngun tính tốn – Ứng dụng nhiều lĩnh vực: lao động, sản xuất (khả hư hỏng thiết bị, ), kinh doanh (khả rời dịch vụ, phân khúc khách hàng, ), y tế (khả mắc bệnh, ), ngân hàng (rủi ro tín dụng, ), • Nhược điểm – Khơng giải vấn đề phi tuyến tính – Phụ thuộc cao vào tính đắn liệu – Chỉ dự đoán kết phân loại 1.3 Dữ liệu thực nghiệm Dữ liệu sử dụng đề tài liệu nhân lấy từ IBM HR Analytics Emplyoee Attrition & Peformance Bộ liệu có thơng tin 1470 nhân viên với 35 thuộc tính Mơ hình xây dựng đề tài dự đốn liệu nhân viên có nghỉ việc hay khơng Theo lời phát biểu từ trang web IBM: “Đây liệu hư cấu tạo nhà khoa học liệu IBM Mục đích để chứng minh cơng cụ IBM Watson Analytics cho phân tích nhân viên nghỉ việc" Một vài ý liệu: • Bộ liệu cung cấp khơng có giá trị bị thiếu, bị sai • Dữ liệu cần tiền xử lý vài thuộc tính có giá trị khơng đổi cần loại bỏ q trình luyện mơ hình: EmployeeCount, StandardHours chuyển đưa liệu từ dạng chữ dạng số • Một vài thuộc tính số bị lệch phải: MonthlyIncome, DistanceFromHome, YearsAtCompany Dữ liệu lưu trữ bảng tính Excel SVTH: Hồng Thanh Lưu Tốn Tin K61 Hệ hỗ trợ định GVHD: TS Lê Chí Ngọc Hình 1.3: Bộ liệu IBM HR Analytics Emplyoee Attrition & Peformance 1.4 Đặc tả yêu cầu hệ thống Ứng dụng xây dựng với mục đích hỗ trợ nhà quản lý đưa định nên cần phải trình bày kết dự đoán cách trực quan, sinh động để nhà quản lý có nhìn tổng quan tình hình nhân viên nghỉ việc Khi xây dựng hệ thống cần thực được: • Tổng số nhân viên tại, tổng quan số đặc trưng liệu Thông tin giúp cho nhà quản lý có nhìn tổng quan hệ thống • Một số biểu đồ dự báo, thông tin chi tiết xác suất khách hàng rời đi, phân nhóm khả năng, • Đưa gợi ý cho nhà quản lý với kết thu từ hệ thống SVTH: Hồng Thanh Lưu Tốn Tin K61 Chương Phân tích thiết kế hệ thống 2.1 Biểu đồ phân cấp chức 10 Hệ hỗ trợ định 2.2 GVHD: TS Lê Chí Ngọc Biểu đồ luồng liệu 2.2.1 Biểu đồ luồng liệu mức ngữ cảnh 2.2.2 Biểu đồ luồng liệu mức đỉnh SVTH: Hoàng Thanh Lưu 11 Toán Tin K61 Hệ hỗ trợ định 2.2.3 GVHD: TS Lê Chí Ngọc Biểu đồ luồng liệu mức đỉnh Biểu đồ luồng liệu mức đỉnh chức Quản lý nhân viên: Biểu đồ luồng liệu mức đỉnh chức Báo cáo thống kê: Biểu đồ luồng liệu mức đỉnh chức Dự báo: SVTH: Hoàng Thanh Lưu 12 Toán Tin K61 Chương Thiết kế hệ thống 3.1 Mơ hình hệ thống Hình 3.1: Mơ hình hệ thống 3.2 Thiết kế hệ thống mặt liệu Dữ liệu lưu dạng file json hình 13 Hệ hỗ trợ định 3.3 GVHD: TS Lê Chí Ngọc Thiết kế hệ thống mặt giao diện 3.3.1 Cơng nghệ sử dụng HTML, CSS, Javascript • HTML từ viết tắt HyperText Markup Language (ngôn ngữ đánh dấu siêu văn bản) dùng mô tả cấu trúc trang Web tạo loại tài liệu xem trình duyệt • CSS (viết tắt Cascading Style Sheets) ngôn ngữ định dạng sử dụng để mơ tả trình bày trang Web, bao gồm màu sắc, cách SVTH: Hoàng Thanh Lưu 14 Toán Tin K61 Hệ hỗ trợ định GVHD: TS Lê Chí Ngọc bố trí phơng chữ CSS cho phép chúng hiển thị nội dung tương thích loại thiết bị có kích thước hình khác nhau, chẳng hạn hình lớn, hình nhỏ điện thoại hay máy tính bảng • Javascript ngôn ngữ nhanh nhẹ chạy mơi trường máy chủ lưu trữ (ví dụ: trình duyệt web), JavaScript kết nối với đối tượng mơi trường để cung cấp kiểm sốt chương trình chúng JavaScript cho phép bạn thực điều phức tạp trang web đồ tương tác Javascript hỗ trợ tất trình duyệt Firefox, Chrome, chí trình duyệt thiết bị di động có hỗ trợ NodeJs/Express • NodeJs tảng trực quan xây dựng V8 JavaScript Engine - trình thơng dịch thực thi mã JavaScript, giúp xây dựng ứng dụng web cách đơn giản dễ dàng mở rộng • Express framework xây dựng tảng NodeJs Nó cung cấp tính mạnh mẽ để phát triển web mobile Express hỗ trợ method HTTP midleware tạo API vô mạnh mẽ dễ sử dụng Python Python ngôn ngữ lập trình bậc cao cho mục đích lập trình đa năng, thiết kế với ưu điểm mạnh dễ đọc, dễ học dễ nhớ Python có nhiều thư viện framework lớn thuận lợi cho việc viết code phát triển khoa học máy tính SVTH: Hồng Thanh Lưu 15 Toán Tin K61 Hệ hỗ trợ định 3.3.2 GVHD: TS Lê Chí Ngọc Giao diện hệ thống Trang chủ Trang quản lý liệu nhân viên Nhà quản lý xem danh sách nhân viên với chi tiết thông tin bao gồm đầy đủ 35 thuộc tính nhân viên Nhà quản lý thao tác với liệu cách xem, thêm, xoá, sửa nhân viên Trang thống kê Hiện thị thông tin liệu nhân viên dạng trực quan hóa biểu đồ, cho phép nhà quản lý nhìn tổng quan SVTH: Hồng Thanh Lưu 16 Toán Tin K61 Hệ hỗ trợ định GVHD: TS Lê Chí Ngọc Trang dự báo Hiển thị dự báo biểu đồ thống kê bảng biểu số lượng tỉ lệ nghỉ việc nhân viên theo phòng ban, chức vụ Trang dự báo chi tiết nhân viên Hiển thị dự báo chi tiết nhân viên với số AttritionRate (tỷ lệ xác suất) Attrition (cao, trung bình, thấp) số thuộc tính quan trọng khác Nhà quản lý xem danh sách nhân viên theo nhóm rủi ro tiêu hao, thể bảng dự báo SVTH: Hoàng Thanh Lưu 17 Toán Tin K61 Hệ hỗ trợ định SVTH: Hồng Thanh Lưu GVHD: TS Lê Chí Ngọc 18 Toán Tin K61 Kết luận Trong báo cáo này, em trình bày quy trình phân tích thiết kế hệ thống hỗ trợ định dự báo khả nghỉ việc nhân viên, bao gồm quy trình điều tra khảo sát, mơ hình hóa nghiệp vụ, xây dựng mơ hình thiết kế giao diện Một số chiến lược giữ chân nhân viên kế hoạch tuyển dụng nhân phù hợp áp dụng dựa vào kết dự báo mơ hình, áp dụng cho nhóm nhân viên (theo xác suất nghỉ việc họ) Hệ hỗ trợ định dự báo khả nghỉ việc nhân viên giúp nhà quản lý nhìn thơng số chủ chốt đưa định phù hợp với tình hình 19 Tài liệu tham khảo [1] Vũ Hữu Tiệp, Machine Learning bản, Diễn đàn machinelearningcoban.com, January 2, 2018 [2] Center for Americant Progress, There Are Significant Business Costs to Replacing Employees , November 16, 2012 [3] https://towardsdatascience.com/building-an-employee-churn-model-inpython-to-develop-a-strategic-retention-plan-57d5bd882c2d [4] https://www.w3schools.com [5] https://vi.wikipedia.org/wiki/JavaScript [6] https://vi.wikipedia.org/wiki/NodeJs [7] https://vi.wikipedia.org/wiki/Express.js [8] https://vi.wikipedia.org/wiki/Python 20 ... viên kế hoạch tuyển dụng nhân phù hợp áp dụng dựa vào kết dự báo mơ hình, áp dụng cho nhóm nhân viên (theo xác suất nghỉ việc họ) Hệ hỗ trợ định dự báo khả nghỉ việc nhân viên giúp nhà quản lý nhìn... Ngọc Trang dự báo Hiển thị dự báo biểu đồ thống kê bảng biểu số lượng tỉ lệ nghỉ việc nhân viên theo phòng ban, chức vụ Trang dự báo chi tiết nhân viên Hiển thị dự báo chi tiết nhân viên với số... thiết kế hệ thống hỗ trợ định dự báo khả nghỉ việc nhân viên, bao gồm quy trình điều tra khảo sát, mơ hình hóa nghiệp vụ, xây dựng mơ hình thiết kế giao diện Một số chiến lược giữ chân nhân viên