1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka cho bộ dữ liệu nhân sự Labor

34 364 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 1,76 MB

Nội dung

I.Đặt vấn đề: Ngày nay vấn đề việc làm là hết sức quan trọng và đặc biệt là các bản hợp đồng lao động. để tìm hiểu được và tìm ra một bản hợp đồng có thể được coi là được là một trong những vấn đề rất phức tạp Có rất nhiều vấn đề dẫn đến người lao động bị thiệt thòi khi không tìm ra bản hợp đồng tốt, có thể nảy sinh ra từ các nguyên nhân như là : tăng lương, ngày nghỉ , trợ cấp lao động , ốm đau…… Nhằm khắc phục được những nhược điểm đó thì vấn đề đặt ra là cần xây dựng một công cụ tiện ích cho phép cung cấp, gợi ý, tham khảo cho người lao động để lựa chọn cái hợp đồng lao động tốt nhất. Công cụ này dựa trên các dữ liệu đã được thu thập, cân bằng tương đối. II.Xây dựng cơ sở dữ liệu: Dựa trên những dữ liệu thực tế ta xây dựng được bộ dữ liệu: Trường dữ liệu Giải thích Duration Thời gian Wage-increase-first-year Lương tăng trong năm đầu Wage-increase-second-year Lương tăng trong năm thứ 2 Wage-increase-third-year Lương tăng trong năm thứ 3 Cost-of-living-adjustment Điều chỉnh giá hiện tại đang sống Working-hours Giờ làm việc Pension Trợ cấp Standby-pay Dự trữ trả Shift-differential Các thay đổi khác Education-allowance Trợ cấp giáo dục Statutory-holidays Ngày nghỉ quy định Vacation Ngày lễ Longterm-disability-assitance Trợ cấp ko may mắn Contribution-to-dental-plan Beravement-assistance Trợ giúp mất người thân Contribution-to-health-plan Đóng góp dự định về sức khỏe Class Quyết định III. Phân tích yêu cầu của bài toán: Nhiệm vụ là phải phân loại và cung cấp các mô tả hợp đồng lao động chấp nhận được và không thể chấp nhận được .Dựa trên cây quyết định. IV.Thực nghiệm trên weka: 1.Tiền xử lý dữ liệu: Khởi động WEKA Explorer. Chọn cơ sở dữ liệu CSDL.csv bằng cách chọn Open File… chọn kiểu dữ liệu CSV data file (*.csv) rồi chọn

SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang I.Đặt vấn đề: Ngày nay vấn đề việc làm là hết sức quan trọng và đặc biệt là các bản hợp đồng lao động. để tìm hiểu được và tìm ra một bản hợp đồng có thể được coi là được là một trong những vấn đề rất phức tạp Có rất nhiều vấn đề dẫn đến người lao động bị thiệt thòi khi không tìm ra bản hợp đồng tốt, có thể nảy sinh ra từ các nguyên nhân như là : tăng lương, ngày nghỉ , trợ cấp lao động , ốm đau…… Nhằm khắc phục được những nhược điểm đó thì vấn đề đặt ra là cần xây dựng một công cụ tiện ích cho phép cung cấp, gợi ý, tham khảo cho người lao động để lựa chọn cái hợp đồng lao động tốt nhất. Công cụ này dựa trên các dữ liệu đã được thu thập, cân bằng tương đối. II.Xây dựng cơ sở dữ liệu: Dựa trên những dữ liệu thực tế ta xây dựng được bộ dữ liệu: Trường dữ liệu Giải thích Duration Thời gian Wage-increase-first-year Lương tăng trong năm đầu Wage-increase-second-year Lương tăng trong năm thứ 2 Wage-increase-third-year Lương tăng trong năm thứ 3 Cost-of-living-adjustment Điều chỉnh giá hiện tại đang sống Working-hours Giờ làm việc Pension Trợ cấp Standby-pay Dự trữ trả Shift-differential Các thay đổi khác Education-allowance Trợ cấp giáo dục Statutory-holidays Ngày nghỉ quy định Vacation Ngày lễ Longterm-disability-assitance Trợ cấp ko may mắn Contribution-to-dental-plan Beravement-assistance Trợ giúp mất người thân Contribution-to-health-plan Đóng góp dự định về sức khỏe Class Quyết định III. Phân tích yêu cầu của bài toán: Nhiệm vụ là phải phân loại và cung cấp các mô tả hợp đồng lao động chấp nhận được và không thể chấp nhận được .Dựa trên cây quyết định. Tiểu Luận Khai Phá Dữ Liệu Page 1 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang IV.Thực nghiệm trên weka: 1.Tiền xử lý dữ liệu: Khởi động WEKA Explorer. Chọn cơ sở dữ liệu CSDL.csv bằng cách chọn Open File… chọn kiểu dữ liệu CSV data file (*.csv) rồi chọn đường dẫn tới CSDL.csv. Ta thấy xuất hiện dữ liệu trên cửa số Preprocess của WEKA như sau: Tiểu Luận Khai Phá Dữ Liệu Page 2 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang - Chuyển kiểu dữ liệu wage-increase-first thành kiểu Nominal với các giá trị tương ứng cao , thấp Tiểu Luận Khai Phá Dữ Liệu Page 3 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang + Nhập biểu thức lọc vào nhấn OK để chấp nhận.Chọn Apply để áp dụng lên trường dữ liệu DiemTB. + Chọn tiếp mục NumericToNominal trong cây thư mục. Chọn Apply ta thu được kết quả như sau: Tiểu Luận Khai Phá Dữ Liệu Page 4 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang Thêm các gí trị cao,thấp Gioi vào thuộc tính học lực. Trong cây thư mục chọn AddValue. Tiến hành nhập vào các giá trị tương ứng như sau: Tiểu Luận Khai Phá Dữ Liệu Page 5 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang Tiểu Luận Khai Phá Dữ Liệu Page 6 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang Xây dựng cây quyết định bằng thuật toán: J48 - Bước đầu tiên ta sử dụng tất cả dữ liệu để trainning cho cây: + Nhấn vào tab Classify chọn thuật toán sử dụng bằng cách nhấn vào nút Choose; khi cây thư mục hiện thư mục Trees/J48: Tiểu Luận Khai Phá Dữ Liệu Page 7 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang Sau đó ta sẽ nhận được giao diện có dạng: Để tiến hành trainning trên toàn bộ dữ liệu ta chọn vào tùy chọn Use tranning set rồi nhấn Start. Ta thu được kết quả hiển thị ở khung Classifier Output như sau: Tiểu Luận Khai Phá Dữ Liệu Page 8 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang Nội dung kết quả: Tiểu Luận Khai Phá Dữ Liệu Page 9 SVTH:Trần Thị Hương GVHD:Hồ Nhật Quang Tiểu Luận Khai Phá Dữ Liệu Page 10 . trong những vấn đề rất phức tạp Có rất nhiều vấn đề dẫn đến người lao động bị thi t thòi khi không tìm ra bản hợp đồng tốt, có thể nảy sinh ra từ các nguyên. năm đầu Wage-increase-second-year Lương tăng trong năm thứ 2 Wage-increase-third-year Lương tăng trong năm thứ 3 Cost-of-living-adjustment Điều chỉnh giá

Ngày đăng: 16/12/2013, 15:12

HÌNH ẢNH LIÊN QUAN

Để xem kết quả cây dưới dạng hình ảnh tiến hành như sau: - Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka cho bộ dữ liệu nhân sự Labor
xem kết quả cây dưới dạng hình ảnh tiến hành như sau: (Trang 13)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w