1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC CỦA NHÂN VIÊN TRONG CÔNG TY

45 18 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Dự Đoán Khả Năng Nghỉ Việc Của Nhân Viên Trong Công Ty
Tác giả Nguyễn Hoàng Thuận, Nguyễn Đức Thắng, Phạm Văn Nam, Chu Thành Đô
Người hướng dẫn TS. Nguyễn Bình Minh
Trường học Trường Đại Học
Thể loại báo cáo
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 45
Dung lượng 2,46 MB

Nội dung

BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THƠNG MINH ĐỀ TÀI: DỰ ĐỐN KHẢ NĂNG NGHỈ VIỆC CỦA NHÂN VIÊN TRONG CÔNG TY Giáo viên hướng dẫn: TS Nguyễn Bình Minh Sinh viên thực hiện: Nguyễn Hồng Thuận 2017339 Nguyễn Đức Thắng 2019417 Phạm Văn Nam 2018359 Chu Thành Đô 2019401 NỘI DUNG Giới thiệu đề tài Mơ hình đề xuất Cơ sở lý thuyết Kết thực nghiệm Tổng kết Giới thiệu đề tài Nhân viên nghỉ việc vấn đề gây nhiều hao tổn cho công ty Theo thống kê, công ty thường phải trả khoảng 1/5 tiền lương để thay nhân viên Nắm bắt nhân viên có khả nghỉ việc cao giúp nhà quản lý đưa phương án hành động phù hợp Mơ hình đề xuất Mơ hình sử dụng: • Mơ hình hồi quy tuyến tính • Mơ hình SVM • Mơ hình Gradient Bootsting • Mơ hình rừng ngẫu nhiên Cơ sở lý thuyết 3.1 Mơ hình hồi quy tuyến tính 3.2 Support Vector Machine - SVM 3.3 Mơ hình Gradient Boosting 3.4 Rừng ngẫu nhiên 3.1 Mơ hình hồi quy tuyến tính • Mục tiêu: Tìm ánh xạ từ không gian liệu đầu vào sang không gian liệu nhãn đầu ra: hay Với hồi quy tuyến tính hàm tuyến tính 3.1 Mơ hình hồi quy tuyến tính • Giả sử : vector hàng input data vector cột trọng số cần tìm nhãn liệu đầu Khi hàm có dạng: 3.1 Mơ hình hồi quy tuyến tính • Hàm mát: • L1 – Least absolute deviations: • L2 – Least absolute deviations: 10 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo cân công việc sống: 31 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ khơng nghỉ việc theo hài lịng mơi trường làm việc: 32 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo hài lịng cơng việc: 33 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo thứ bậc công việc: 34 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo tần suất cơng tác: 35 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo ban chuyên môn: 36 4.3 Tiền xử lý liệu Loại bỏ trường ‘StandardHours’ ‘EmployeeCount’, ‘EmployeeNumber’, ‘MonthlyRate’, ‘Over18’ có q nhiều q giá trị khác Thêm cột TotalSatisfaction có ý nghĩa tổng cộng mức độ hài lòng nhân viên TotalSatisfation tổng cột: ‘EnvironmentSatisfaction’, ‘JobInvolvement’, ‘JobSatisfaction’, ‘RelationshipSatisfaction’, ‘WorkLifeBalance’ 37 4.3 Tiền xử lý liệu Thêm cột EducationYear với mức giá trị thành số năm chương trình giáo dục với cài đặt sau: • 1: 10, Trung học sở • 2: 12, Trung học phổ thơng • 3: 16, Đại học • 4: 18, Thạc sĩ • 5: 22, Tiến sĩ 38 4.3 Tiền xử lý liệu Mã hóa one-hot cho cột chứa liệu dạng category: • BusinessTravel • Gender • Department • MaritalStatus • EducationField • OverTime • JobRole 39 4.3 Tiền xử lý liệu Visualize ma trận tương quan cột sau mã hóa: 40 4.3 Tiền xử lý liệu Từ biểu đồ ta thấy bỏ số cột tương quan cao với hay nhiều cột khác: • Bỏ ‘Education’ tương quan cao với ‘EducationYear’ • Bỏ ‘YearsInCurrentRole’ tương quan cao với ‘YearsAtCompany’ • Bỏ ‘Department_1’ tương quan cao với ‘Department_2’ • Bỏ ‘JobLevel’ tương quan cao với ‘MonthlyIncome’ 41 4.3 Tiền xử lý liệu Sau mã hóa bỏ cột khơng cần thiết, tiến hành chia liệu thành tập train test với tỷ lệ 80-20 Sử dụng kỹ thuật SMOTE để làm tăng liệu tập huấn luyện: 42 4.4 Kết Phương pháp Logistic Regression SVM Gradient Boosting Decision Tree Random Forest Accuracy (%) 67.0 37.0 89.0 87.0 85.0 F1-marco 58.0 37.0 76.0 62.0 70.0 Phương pháp Gradient Boosting cho kết cao với 89%, phương pháp SVM cho kết tệ với 37% 43 Tổng kết Trong nghiên cứu này, nhóm thử nghiệm cách tiếp cận mơ hình hồi quy logistic, mơ hình Gradient Boosting, mơ hình SVM mơ hình rừng ngẫu nhiên cho toán “Dự đoán khả nghỉ việc nhân viên” Kết cho thấy mô hình Gradient Boosting với việc lọc bỏ liệu dư thừa cho kết tốt Trong tương lai, nhóm tiếp tục cải thiện mơ hình cách thử nghiệm mơ hình hồi quy dựa XGBoost 44 THANK YOU ! 45 ...BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THƠNG MINH ĐỀ TÀI: DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC CỦA NHÂN VIÊN TRONG CÔNG TY Giáo viên hướng dẫn: TS Nguyễn Bình Minh Sinh viên thực hiện:... 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo hài lịng cơng việc: 33 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo thứ bậc công việc: 34 4.2 Phân tích. .. nhân: 30 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo cân cơng việc sống: 31 4.2 Phân tích liệu Biểu đồ số nhân viên nghỉ không nghỉ việc theo hài lịng mơi trường làm việc:

Ngày đăng: 09/07/2022, 21:25

HÌNH ẢNH LIÊN QUAN

2. Mơ hình đề xuất - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
2. Mơ hình đề xuất (Trang 6)
3.1. Mơ hình hồi quy tuyến tính - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
3.1. Mơ hình hồi quy tuyến tính (Trang 8)
3.1. Mơ hình hồi quy tuyến tính - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
3.1. Mơ hình hồi quy tuyến tính (Trang 10)
3.3. Mơ hình Gradient Boosting - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
3.3. Mơ hình Gradient Boosting (Trang 15)
Là một mơ hình tạo ra một loạt các mơ hình phân loại yếu - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
m ột mơ hình tạo ra một loạt các mơ hình phân loại yếu (Trang 15)
3.3. Mơ hình Gradient Boosting - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
3.3. Mơ hình Gradient Boosting (Trang 17)
3.3. Mơ hình Gradient Boosting - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
3.3. Mơ hình Gradient Boosting (Trang 19)
3.3. Mơ hình Gradient Boosting - BÁO CÁO BÀI TẬP LỚN PHÂN TÍCH NGHIỆP VỤ THÔNG MINH ĐỀ TÀI DỰ ĐOÁN KHẢ NĂNG NGHỈ VIỆC   CỦA NHÂN VIÊN TRONG CÔNG TY
3.3. Mơ hình Gradient Boosting (Trang 19)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w