Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

94 97 0
Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐỂ PHÂN CỤM NHÂN VIÊN NÂNG CAO HIỆU QUẢ BÀI TỐN PHÂN BƠ VÀ ĐÁNH GIÁ NHÂN Sự TẠI CÔNG TY GMO Z-COM RUNSYSTEM Giáo viên hướng dẫn Sinh viên thực Mã sinh viên Lớp Khóa Hệ : ThS Nguyễn Thị Thùy Anh : Nguyễn Thị Lựu : 19A4040093 : K19HTTTC : 19 : Đại học quy Hà Nội, tháng 6/2020 Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân cơng ty GMO LỜI CẢM ƠN Để hồn thành khóa luận tốt nghiệp này, em xin gửi lời cảm ơn chân thành đến ThS Nguyễn Thị Thùy Anh - Giảng viên Khoa Hệ thống thông tin quản lý - Học viện Ngân Hàng tạo điều kiện nhiệt tình hướng dẫn, giải đáp thắc mắc cho em suốt trình thực đề tài Em xin cảm ơn đến anh/chị công ty GMO Z-com RUNSYSTEM tạo hội thuận lợi cho em tiếp xúc công việc thực tiễn, đưa lời khuyên định hướng nghề nghiệp, bảo tận tình q trình em thực tập cơng ty Hơn thế, cảm ơn ln tin tưởng cung cấp liệu nội công ty để em hồn thành tốt khóa luận tốt nghiệp Cuối cùng, em xin cảm ơn toàn thể thầy/cơ khoa Hệ thống thơng tin Quản lý nói riêng thầy/cơ trường Học viện Ngân Hàng nói chung giảng dạy truyền đạt kiến thức bổ ích cho em trình học tập trường Em xin trân trọng cảm ơn! Nguyễn Thị Lựu - K19HTTTC i Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO LỜI CAM KẾT Em xin cam kết nội dung đề tài khóa luận sản phẩm nghiên cứu, tìm hiểu riêng cá nhân em Trong tồn nội dung đề tài này, điều trình bày cá nhân em tổng hợp từ nhiều nguồn tài liệu Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Em xin hồn tồn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan SINH VIÊN THỰC HIỆN NGUYỄN THỊ LỰU Nguyễn Thị Lựu - K19HTTTC ii Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO 1.4.1 Tổng quan ngôn ngữ Python 36 MỤC LỤC MỤC LỤC iii DANH MỤC CÁC CHỮ VIẾT TẮT v DANH MỤC BẢNG BIỂU vi DANH MUC HÌNH VẼ vii PHẦN MỞ ĐẦU CHƯƠNG 1: THỰC TRẠNG PHÂN BỔ, ĐÁNH GIÁ NGUỒN LỰC TẠI CÔNG TY GMO-Z.COM RUNSYSTEM 1.1 Tổng quan công ty GMO-Z.com RUNSYSTEM 1.2.Sơ lược tình hình nhân GMO .6 1.2.1 Cơ cấu tổ chức tình hình nhân GMO 1.2.2 Cách thức quản lý nhân GMO Z-com RUNSYSTEM 13 1.2.3 Các vấn đề phân bổ đánh giá nhân doanh nghiệp nói chung GMO nói riêng 17 1.3 Phát biểu toán 18 1.4 Kết thúc chương 19 CHƯƠNG 2: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU, CÁC KỸ THUẬT PHÂN CỤM DỮ LIỆU VÀ THUẬT TOÁN PHÂN CỤM K-MEANS 20 2.1 Khai phá liệu .20 2.1.1 Khái niệm khai phá liệu .20 2.1.2 Những nhóm toán khai phá liệu .21 2.1.3 Khai phá liệu kinh doanh 23 2.2 Phân cụm liệu số kỹ thuật phân cụm khai phá liệu 24 2.2.1 Tổng quan phân cụm liệu: 24 2.2.2 Các kiểu liệu phép đo độ tương tự 25 2.2.3 Các hướng tiếp cận toán phân cụm 30 2.2.4 Một số kỹ thuật phân cụm khai phá liệu 34 2.3 Thuật toán K-Means 34 2.3.1 Các bước thực thuật toán K-Means: 35 2.3.2 Đánh giá thuật toán K-means 36 2.4 Python Machine Learning 36 1.4.2 Ứng dụng Python Data Science Machine Learning 43 Nguyễn Thị Lựu - K19HTTTC 1.4.3 Thư viện SCIKIT-LEARN 44 iii 1.4.4 Giới thiệu Anaconda 46 2.5 Kết thúc chương 47 CHƯƠNG 3: ỨNG DỤNG THUẬT TOÁN PHÂN CỤM K-MEANS ĐỂ PHÂN NHÓM NHÂN VIÊN NÂNG CAO HIỆU QUẢ BÀI TOÁN PHÂN BỔ VÀ ĐÁNH GIÁ NHÂN VIÊN 48 3.1 Mô tả liệu thực nghiệm 48 3.2 Quy trình thực phân nhóm nhân viên .50 3.2.1 Thu thập liệu 50 3.2.2 Tiền xử lý liệu 50 3.2.3 Tìm k tối ưu phương pháp Eblow 51 3.2.4 Khai phá liệu thuật toán K-means sử dụng ngôn ngữ Python.54 3.2.5 Đọc diễn giải kết 60 3.3 Một số giải pháp nhân sau áp dụng kết KPDL 62 3.4 Kết luận chương 65 KẾT LUẬN 66 PHỤ LỤC 68 Phụ lục 1: Các cấp độ vị trí cơng việc 68 Phụ lục 2: Các phận 69 TÀI LIỆU THAM KHẢO 70 NHẬT KÝ THỰC TẬP 71 KPDL Nguyên nghĩaphân cụm nhân viên nâng cao hiệu Ứng dụng KPDL toán phân bổ đánh giá nhân công ty GMO Khai phá liệu CNTT DANH Công nghệ thông MỤC tin CÁC CHỮ VIẾT TẮT IT Information Technology WSS Within-cluster Sum of Square PCA Principal Component Analysis CSDL Cơ sở liệu Khóa luận tốt nghiệp Nguyễn Thị Lựu - K19HTTTC iv Nguyễn Thị Lựu - K19HTTTC v Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO DANH MỤC BẢNG BIỂU Bảng Phân bổ nhân theo chi nhánh công ty GMO Bảng 2.Các phận chức phận công ty GMO Z-com RUNSYSTEM 13 Bảng 3.Bảng tham số 27 Bảng Dữ liệu thực nghiệm 48 Bảng Mô tả thuộc tính tập liệu thực nghiệm .49 Bảng Dữ liệu ban đầu thu thập .51 Bảng Các thư viện để phân cụm nhân viên .55 Nguyễn Thị Lựu - K19HTTTC vi Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO DANH MUC HÌNH VẼ Hình Sản phẩm, dịch vụ GMO cung cấp Hình Cơ cấu tổ chức cơng ty GMO Hình Quy trình phân bổ nhân dự án 17 Hình Mô vấn đề phân cụm liệu 24 Hình Minh họa phân cụm liệu theo mật độ 32 Hình Một số kĩ thuật phân cụm .34 Hình Các bước thưc thuật toán K-means .35 Hình Hình dạng cụm liệu khai phá thuật toán K-means 36 Hình Top 10 ngơn ngữ lập trình phổ biến năm 2018 .37 Hình 10 Một ví dụ minh họa so sánh việc đơn giản hóa cú pháp Python40 Hình 11 Ví dụ ngơn ngữ Python 41 Hình 12 Lưu đồ tra cứu tài liệu liên quan thư viện scikit-learn 45 Hình 13 Cách khai báo thư viện Python 45 Hình 14 Truy cập vào Jupyter Notebook 46 Hình 15 Giao diện Jupyter Notebook 46 Hình 16 Kết k tối ưu phương pháp Eblow 54 Hình 17 Mơ hình hóa liệu thực nghiệm 59 Nguyễn Thị Lựu - K19HTTTC vii Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân cơng ty GMO ban đầu Tuy ta cần tìmkhi khơng cho pháp thànhPCA phầnxoay có tương quannhiên tuyếnchúng tính với nhau, trục sửgian dụngsao phương biểu hầukhơng hết thơng ban5đầu chiềumà không gian cũdiễn thành chiều gian tin mớitừmà biến cịn biến khơng có tương quan tuyến màliệu vẫnthực nhiều lượng thông tin từ nhóm biến ban ❖ Thực hành trêntính nghiệm đầu Hiện số chiều liệu 8, sử dụng PCA để giảm số chiều xuốngMột cịn số đặc tính PCA kể đến như: Bước Khaigiảm báo thêm thư viện và-sử dụng • 1.Giúp số chiều liệu Giúp mơhàm hìnhPCA hóavới khin_components=2 liệu có q nhiều chiều thơng tin • Do liệu ban đầu có số chiều lớn (nhiều biến) PCA giúp xoay from sklearn.decomposition PCA trục tọa độ đảm bảo độ biến thiên liệu giữ trục tọa độ xâyimport pca=PCA(n_components=2) In [19]: principalComponents-pca.fit_transform(data_transtormed) principalDf=pd.DataFrame(data=principalComponents, columns=['principal component ,'principal component 2']) lại nhiều thông tin mà không ảnh hưởng tới chất lượng mơ , hình dự báo (Maximize the variability) Out[36]: principal component principal component • Do PCA giúp tạo hệ trục tọa độ nên mặt ý nghĩa toán học, PCA giúp xây dựng biến factor tổ hợp tuyến tính biến ban đầu • Trong khơng gian mới, có thẻ giúp khám phá thêm thông tin quý giá mà chiều thông tin cũ thông tin quý giá bị che (Điển hình cho ví dụ lạc đà phía trên) Mơ hình PCA: Xét tập khơng gian (dữ liệu) k biến, k biến biểu qua j thành phần cho (j < k) Xét thành phần có dạng: PC1=a1X1+a2X3+a4X5+ akXkPC1=a1X1+a2X3+a4X5+ akXk Thành phần chứa đựng hầu hết thơng tin từ k biến ban đầu (được hình thành tổ hợp tuyến tính biến ban đầu) lúc tiếp tục xét thành phần thứ biểu diễn tuyến tính từ k biến ban đầu nhiên thành phần thứ phải khơng trực giao với thành phần ban đầu hay (thành phần thứ khơng có mối tương quan tuyến tính với thành phần đầu tiên) lý thuyết xây dựng nhiều thành phần từ nhiều biến O 0.508908 -0.525839 -0.580047 456416 -0.469794 0.367185 0.010876 0.481 133 0.109 316 0.496076 Nguyễn Thị Lựu - K19HTTTC 57 552 0.504977 553 0.607890 0.355866 0.407955 554 0.406142 0.609676 555 -0.531361 0.000102 556 -0.485538 0.434869 557 rows X columns Bước Mơ hình hóa liệu chuyển hóa In [21]: PrincipalDf.plot(figsize=[7,5],kind=’scatter,,y=,principal component 2,,x='principal component 1,) pit.show() Nguyễn Thị Lựu - K19HTTTC 58 Khóa Khóaluận luậntốt tốtnghiệp nghiệp [ĩ Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO G 0 4 G 4 3 G 4 G 4 ữ 4 3 4 1 G 1 G G 3 4 0 4 3 G 3 3 G 1 G 1 2 Hình 17 Mơ hình hóa liệu thực nghiệm 3 2 G 2 2 3 3 2 5 G 5 2Bước G 03.3 Tìm 2 2k 2tối ưu 2(Phương 3 0pháp Eblow) 2 2 G G 3 G 0 e 2 G 0 G θ 0 1 2 G G G G Lấy tâm cụm: ữ 2 2 0 G e 2 2 θ 2 G 2 4 G 2Đã 2trình 2 bày 3 1ở 0phần 2 3.2.3 3 3 0 2 4 2 G 3 0 0 [16]: G centroids=km6.cluster_centers_ 0 0 3 2 2 0 G 3 G G 0 1 1 2 1 1 θ1 J2Centroids 1 J'Centroids 1 33','Centroids 1 14','Centroids 15' 'Centroids β'1'C(1 1 2 centroids=pd.DataFrame(centroids,columns=['Centroids 1 ữ 1 centroids 1 e 3 0 G θ G 1 G 2 3 Bước Phân cụm liệu 2 θ 1 2 1 G G 4 AVG 3Capdocongviec 3 0AVG0thoigianlamviec 0AVG1Socongthucte AVG 2diem_atbmtt G 1AVG0 SOduan AVG G dohailong 2AVG thamgiahoatdong G AVG tiengnhat 1 1 1 2 G 2 G 3 2kπ6=KMeans e 3( ni_clusters=6) 2 3 θ G G G 3 2 1] , , , j km6.fit(df) Out[lΞ> ]: cluster , 157 KMeans(algorithm=' auto j CDpy x=TrLiej init =' k-means++', maxiter=39βj 90 n_clusters=6j niπit=lθj njobs=Nonej precOiIipute_distanceS= ,auto" J 141 in doιι st ate =Nonej tol=0.0001j Verbose=B) 100 56 13 dtype: int64 print(km6 labels) result=km6.labels_ result=pd.DataFname(reSultjCDlunns=['cluster']) result.groupby('cluster').size() Thu kết quả: O 3.452229 2.888217 20.353503 3.155556 2.517667 20011111 3.156028 2.231064 20 262411 3.100000 2.176300 19.870000 3.553571 4.012321 20.562500 0.846154 4.103077 0.384615 87.51592 0.166667 72.58865 80.00000 96.25000 0.000000 2.394904 2.159236 2.222222 2.044444 2.517730 2.120567 2.200000 2.120000 2.571429 2.125000 3.384615 2.230769 46 0.4904 0.095541 0511111 0.333333 0.5106 38 0.5200 00 0.3750 00 0.4615 0.099291 0.110000 0.285714 0.076923 38 Đọc diễn giải kết cụm Thị Lựu157 - K19HTTTC Kết Nguyễn cho biết: Có mẫu 0, 90 mẫu cụm 1, 141 mẫu 59 cụm Khóa luận tốt nghiệp - - - - - - Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO Cụm (157 nhân viên): thường có trình độ mức xấp xỉ ~ 3.5, thời gian vào làm việc công ty trung bình gần năm, làm đặn với số công thực tế 20.353503, tuân thủ xuất sắc an tồn bảo mật thơng tin với 87.5 điểm, năm tham gia trung bình 2.394904 dự án, tương đối hài lịng cơng việc, gần nửa số nhân viên cụm (0.490446) có tham gia hoạt động công ty tiếng Nhật Cụm (141 nhân viên): có đặc điểm tương đối giống cụm nhiên nhân viên cụm có cấp độ cơng việc thấp cụm với mức ~3, có thời gian vào làm việc so với cụm 2.231064 năm không tuân thủ bảo mật tốt nhân viên cụm Cụm (100 nhân viên): có đặc điểm tương đối giống cụm 2, điểm khác biệt nhân viên cụm tham gia dự án với 2.2 dự án năm, điểm an tồn bảo mật thơng tin cao (80 điểm), tỉ lệ nhân viên biết tiếng Nhật cụm cao (~0.11) Cụm (90 nhân viên): Cụm nhân viên có cấp độ cơng việc trung bình 3.155556, thời gian vào làm việc năm rưỡi, làm đầy đủ số công thực tế 20.011111, không tham gia kiểm tra an tồn bảo mật thơng tin, làm dự án năm 2019, mức độ hài lòng hài lòng, tham gia hoạt động chiếm 50% nhiều nhân viên trogn nhóm biết tiếng Nhật (0.333333) Cụm (56 nhân viên): Ở cụm nhân viên có cấp độ việc làm mức ~3.55, thời gian vào làm việc năm, số công thực tế 20.5625 ngày/ tháng, điểm bảo mật an tồn thơng tin gần tuyệt đối (96.25 điểm), tham gia trung bình 2.57 dự án năm 2019, việc tham gia hoạt động công ty thấp hẳn nhân viên cụm trên, tiếng Nhật cụm có số nhân viên (0.285714) Cụm (13 nhân viên): Nhân viên cụm thường nhân viên nghỉ thai sản nghỉ không lương nên cấp độ công việc thấp mức 0.846154, số ngày làm việc thập 0.384615 ngày/năm, khơng tham gia kiểm tra an tồn bảo mật thông tin, thời gian vào làm việc năm Tuy nhiên số dự án tham dự lại cao với 3.384615 dự án năm Điều có chiếm, 100 mẫu cụm cụm 3, 56 mẫu cụm 4, 13 mẫu cụm Giá trị tâm cụm cho biết giá trị trung bình (đối với thuộc tính có kiểu định lượng) Dựa vào kết ta thấy, cụm chiếm tỉ lệ cao nhất, cụm chiếm tỉ lệ thấp Tức nhân viên cụm chiếm tỉ trọng cao cơng ty, cịn nhân viên cụm chiếm tỉ trọng thấp Cụ thể đặc điểm cụm sau: Nguyễn Thị Lựu - K19HTTTC 60 Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO thể giải thích liệu ghi nhận nhân viên tham gia dự án có nhiều kinh nghiệm nhân viên theo dự án từ bắt đầu đến kết thúc dự án Nhìn chung, ta thấy thực trạng nhân công ty GMO Z-com RUNSYSTEM sau: - Công ty chủ yếu nhân viên thức thể cấp độ công việc hầu hết cụm mức >3, nhân viên vị trí thực tập sinh, học việc - Nhân viên làm việc công ty bền lâu, độ hài lịng cơng việc mức trung bình, thể thời gian vào làm việc tất cụm >2 năm, mức độ hài lòng >2 - Ý thức nhân viên tốt thể việc làm tương đối đặn, tích cực tham gia hoạt động công ty, trừ trường hợp nghỉ thai sản nghỉ không lương - Một phận nhân viên không thực tn thủ an tồn bảo mật thơng tin (cụm 1) An toàn bảo mật nguyên tắc quan trọng doanh nghiệp nói chung GMO nói riêng Bộ phận nhân viên cần nhắc nhở để thực - Nhân viên tham gia dự án đặn - Tỉ lệ nhân viên biết tiếng Nhật thấp Như vậy, kết phân cụm không cho biết đặc điểm cụm nhân viên mà phần ta thấy thực trạng phân bổ nhân cơng ty năm 2019 Việc có ý nghĩa lớn việc cải tiến nhân sự, đưa chiến lược quản lý, tuyển dụng nhân cách hợp lý 3.3 Một số giải pháp nhân sau áp dụng kết KPDL Kết phân cụm, phân nhóm nhân viên sử dụng cho cấp lãnh đạo, quản lý dự án phận nhân sự, tuyển dụng với mục đích đưa định nhân hợp lý xây dựng chiến lược nhân Cụ thể sau: - Đối với cấp lãnh đạo: Kết phân nhóm nhân viên giúp nhà lãnh đạo có nhìn tổng quan nhân cơng ty Vì thực tế, người lãnh đạo Nguyễn Thị Lựu - K19HTTTC 61 Khóa luận tốt nghiệp - - Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO biết chi tiết, cặn kẽ điểm mạnh, điểm yếu cơng ty khơng thường xun làm việc Nhà lãnh đạo dựa vào kết phân nhóm nhân viên để thấy tình trạng nhân thừa điều gì, thiếu điều kết hợp với mục tiêu tương lai công ty để đưa chiến lược điều chỉnh nhân hợp lý Hơn thế, kết phân nhóm nhân viên giúp đưa định bổ nhiệm, khen thưởng phù hợp với nhân viên công ty thật cơng tâm, chí sách cải thiện nhân Đối với quản lý dự án: Việc giao người việc dự án bước quan trọng, chí ảnh hưởng đến thành cơng dự án Việc phân nhóm nhân viên với đặc đặc điểm khác nhóm nhân viên tương đồng nhân viên nhóm, giúp quản lý dự án phân tích điểm mạnh, điểm yếu nhân viên từ sử dụng nhân cách hiệu Đối với phận nhân sự: Từ kết phân nhóm, phân cụm nhân viên, phận nhân biết nhân phân bổ nào, đưa cách quản lý nhân phù hợp với tình hình Khơng thế, phận nhân có ciếc lược tuyển dụng tương lai, điều chỉnh chế độ phù hợp với nhóm nhân viên Nếu bạn nhà quản lý, phân lọai nhân viên việc bạn cần ưu tiên thực hàng đầu mang đến nhiều lợi ích như: - Phác thảo kế hoạch phát triển phù hợp - Có mong đợi cơng việc phù hợp - Giúp nhân viên quản lý nghề nghiệp - Xây dựng chương trình phát triển phù hợp với nhu cầu cụ thể cá nhân nhân viên giúp nhân viên tối đa hóa hội thành công nơi làm việc tương lai - Xây dựng sở tảng tốt cho thành công công ty Phân cụm nhân viên đề tài dựa vào liệu thu thập số phận Tuy nhiên thực tế, doanh nghiệp có liệu khủng lồ lưu trữ với mục đích khác nhau, hồn tồn sử dụng phương Nguyễn Thị Lựu - K19HTTTC 62 Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân cơng ty GMO pháp phân nhóm cụm để phân nhóm nhân viên để ứng dụng vào định mà doanh nghiệp mong muốn Một số cách phân nhóm nhân viên sử dụng rộng rãi: - Phân loại theo lực làm việc Phân loại nhân viên theo lực làm việc (ASK) giúp nhà quản lý chọn người, vị trí đồng thời nắm bắt chất lượng công việc, đánh giá hiệu đưa kế hoạch phát triển, đào tạo phù hợp - Phân loại theo thời gian làm việc Việc phân loại theo thời gian làm việc giúp nhà quản lý nắm bắt nhên viên có thâm niên làm việc lâu năm, nhân viên làm việc ngắn hạn để từ có kế hoạch phát triển, sách, chế độ đãi ngộ phù hợp Nhân viên thâm viên lâu năm thường người có kinh nghiệm dày dặn, lịng trung thành cao Việc có kế hoạch phát triển riêng, sách, chế độ đãi ngộ riêng thể ghi nhận cóng hiến họ giúp họ nỗ lực cống hiến nhiều cho doanh nghiệp bạn - Phân loại theo mức độ quan trọng Theo mức độ quan trọng, nhân viên phân loại sau: • Bình thường • Tài trẻ • Quản lý/chun gia • Cán nguồn • Chủ chốt để đãi ngộ Việc phân loại theo mức độ quan trọng nhiệm vụ, có bổ nhiệm, đãi ngộ người việc giúp lãnh đạo doanh nghiệp giao Ngoài ra, phân cụm liệu giúp đánh giá nhân viên dễ dàng Có hai hình thức đánh giá nhân viên đánh giá cách tương đối đánh giá tuyệt đối Và phân cụm nhân viên hình thức đánh giá tương đối Trong hình thức đánh giá tương đối, cơng việc nhân viên có liên quan đến Phương pháp liên quan đến hệ thống chức vụ phân bố quyền hạn Có thể phân loại số nhân viên thành nhóm khác Ví nhóm làm việc xuất sắc, nhóm làm việc Nguyễn Thị Lựu - K19HTTTC 63 Nguyễn Thị Lựu - K19HTTTC 64 Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO khá, nhóm làm việc trung bình, nhóm làm việc yếu Tuy nhiên, kiểu đánh giá không cung cấp cho nhân viên nhiều thông tin công việc họ Họ biết vị trí so với đồng nghiệp cấp Nhưng để thực điều chỉnh cơng việc họ cần phải biết cần chỉnh sửa 3.3 Kết luận chương Chương ứng dụng tất lý thuyết trình bày chương với liệu thực nghiệm thu thập công ty GMO Z-com RUNSYSTEM Cụ thể áp dụng phân cụm liệu với thuật toán K-means để phân cụm nhân viên ngôn ngữ Python (thư viện scikit-learn) Từ kết phân cụm này, nêu lên giải pháp cụ thể việc phân bổ đánh giá nhân GMO nói riêng doanh nghiệp nói chung Nguyễn Thị Lựu - K19HTTTC 65 Khóa luận tốt nghiệp Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu toán phân bổ đánh giá nhân công ty GMO KẾT LUẬN Ket đạt đề tài Phân cụm liệu nhiệm vụ quan trọng KPDL, thu hút quan tâm nhiều nhà nghiên cứu Các kỹ thuật phân cụm ứng dụng thành công nhiều lĩnh vực khoa học, đời sống xã hội Hiện nay, phát triển không ngừng công nghệ thông tin truyền thông, hệ thống CSDL ngày đa dạng, tăng trưởng nhanh chất lẫn lượng Hơn nữa, nhu cầu khai thác tri thức từ CSDL ngày lớn Vì vậy, việc nghiên cứu mơ hình liệu mới, áp dụng phương pháp khai phá liệu, có kỹ thuật phân cụm liệu việc làm cần thiết có nhiều ý nghĩa Trong nội dung khóa luận này, trước tiên em trình bày hiểu biết khai phá liệu sau phần nội dung khóa luận: Về lý thuyết, nêu tổng quan KPDL, cụ thể toán phân cụm liệu thuật tốn K-means Bên cạnh đó, em khái qt ngơn ngữ lập trình Python nói chung thư viện scikit learn - ngôn ngữ thư viện phổ biến ứng dụng Data Sciences Machine Learning Về thực hành, dựa vào liệu thu thập công ty GMO để phân cụm nhân viên (sử dụng thuật toán K-means thư viện scikit learn python), từ kết phân cụm ứng dụng vào công việc công ty Những vấn đề tồn Bên cạnh kết đạt được, phải thực đề tài thời gian ngắn nên không tránh khỏi thiếu sót Cụ thể sau: - Chưa nêu lên thuật toán phân cụm khác để so sánh với thuật toán k-means để thấy ưu nhược điểm thuật tốn sử dụng - Dữ liệu thu thập khơng có nhãn nên khơng thực việc đánh giá độ xác thuật tốn Hướng phát triển đề tài Nguyễn Thị Lựu - K19HTTTC 66 Khóa Khóaluận luậntốt tốtnghiệp nghiệp Ứng Ứngdụng dụngKPDL KPDLphân phâncụm cụmnhân nhânviên viênnâng nângcao caohiệu hiệuquả bàitoán toánphân phânbổ bổvà vàđánh đánhgiá giánhân nhânsự sựtại tạicơng cơngtytyGMO GMO Trong tương lai, có điềuPHỤ kiện,LỤC em mong muốn tìm hiểu sâu đề tài Đặc biệt phát triển kĩ lập trình Python để mở thực Phụứng lụcdụng 1: Các cấptếđộ trí cơngLearning việc thực vềvịMachine Vị trí cơng việc Cấp độ quy đổi Vị trí cơng việc Cấp độ quy đổi Member of BOM Accountant Department Manager HR Excutive Sub Department PR Executive Manager 6 Data Process Executive 3 Team Leader Sale Support Sub Team Leader Sales Executive Project Manager Pre-Sales Tester Sales Comtor Network Administrator BrSE R&D Engineer Developer Infra Engineer Designer CS Excutive QA Executive Tech Support Content Executive Thử việc Marketing Executive Học việc Receptionist CTV Administration Excutive Internship Security Guard Nghỉ không lương Tạp vụ Nghỉ thai sản ^BA Branch Director Nguyễn Thị Lựu - K19HTTTC 67 STT Khóa luận tốt nghiệp Bộ phận Ứng dụng KPDL phân cụm nhân viên nâng cao hiệu Testing Solution Department (TSD)bài toán phân bổ đánh giá nhân công ty GMO Comm Department Phụ lục 2: Các phận BrSE Department Business Solution Department (BSD) Quality Assurance (QA Team) Internet Media Department Admin Department Ho Chi Minh Branch Da Nang Branch 10 ũ Tokyo Branch Assistant 12 13 Accounting Department Human Resources Department 14 Public Relations Department 15 16 Business Process Outsourcing Department CAD Team 17 BizConnex Division 18 Digital Transformation Department 19 20 R&D Department Internet Infra Division 21 Enterprise Solutions Division Nguyễn Thị Lựu - K19HTTTC 68 Nguyễn Thị Lựu - K19HTTTC 69 Khóa Khóaluận luậntốt tốtnghiệp nghiệp Ứng Ứngdụng dụngKPDL KPDLphân phâncụm cụmnhân nhânviên viênnâng nângcao caohiệu hiệuquả bàitoán toánphân phânbổ bổvà vàđánh đánhgiá giánhân nhânsự sựtại tạicông côngtytyGMO GMO NHẬT THỰC TẬP TÀI LIỆUKÝ THAM KHẢO Tiếng Họ vàViệt tên: Nguyễn Thị Lựu [1] Nguyễn Hồng Tú Anh, Giáo trình “Khai thác liệu ứng dụng” 2009 (Đại học KHTN Tp Hồ Chí Minh) Lớp/Khóa: K19HTTTC [2] An Hồng Sơn, Luận văn thạc sĩ “Nghiên cứu số phương pháp phân cụm ứng 2008 (Đại học Thái Nguyên) Mã dụng” SV: 19A4040093 [3] Vũ Lan Phương, “Nghiên cứu cài đặt số giải thuật phân cụm phân lớp” 2006 (Đại học Bách khoa Hà Nội) Email: luunguyen98.ba@gmail.com Tiếng Anh [4] M.Kamber, Data Mining, “Concepts and Techniques”, Morgan Điện J.Han thoại: and 0353985500 rd Kaufmann, Edition, 2011 (Chapter & Chapter 10) Đề tài thực tập: Ứng dụng khai phá liệu phân cụm nhân viên nâng caao hiệu [5] Charu C.Aggarwal and Chandan K.Reddy, Data Clustering: Algorithms and toán phân bổ đánh giá nhân Applications, 2014 (Chapter - A Survey of Partitional and Hierarchical Clustering Giảng viên hướng dẫn: ThS Nguyễn Thị Thùy Anh Algorithms) Cơ quan thực tập: Công ty cổ phần GMO-Z.com RUNSYSTEM Địa quan: Tòa nhà Ocean Park Building, số Đào Duy Anh, Đống Đa, Hà Nội STT Ngày tháng GVHD trao đổi công việc cần thực Kết thực sinh viên 25/02/2020 Liên hệ với GVHD để trao đổi đề tài nghiên cứu Liên hệ với GVHD để trao đổi đề tài nghiên cứu “2 06/03/2020 Nộp đề cương lần Nộp đề cương lần Nộp đề cương lần 12703/2020 Phê duyệt đề cương, bắt đầu 15/03/2020 thực nghiên cứu đề tài Nộp đề cương lần Bắt đầu thực nghiên cứu đề tài 19/04/2020 Báo cáo tiến độ thực đề tài lần Báo cáo tiến độ thực đề tài lần 07/05/2020 Báo cáo tiến độ thực đề tài lần Báo cáo tiến độ thực đề tài lần 19/05/2020 Báo cáo tiến độ thực đề tài lần Báo cáo tiến độ thực đề tài lần 29/05/2020 Gặp GVHD trao đổi trực tiếp sai sót báo cáo Gặp GVHD trao đổi trực tiếp sai sót báo cáo 07/06/2020 Nộp báo cáo chỉnh sửa Nộp báo cáo chỉnh sửa cuối cuối Nguyễn Nguyễn Thị Thị Lựu Lựu K19HTTTC K19HTTTC 70 71 ... luậntốttốtnghiệp nghiệp Khóa dụng KPDL phân viên cụm nâng nhân cao viênhiệu nângquả cao hiệu Ứng dụng Ứng KPDL phân cụm nhân toán phân bổ toán v? ?phân đánhbổ giáv? ?nhân đánhs? ?giá tạinhân côngsự ty. .. luận luận tốt tốt nghiệp nghiệp Ứng Ứng dụng dụng KPDL KPDLphân phân cụm cụm nhân nhân viên viên nâng nâng cao cao hiệu hiệu quả bài toán toán phân phân bổ bổ và đánh đánh giá giá nhân nhân sự. .. THÔNG TIN QUẢN LÝ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐỂ PHÂN CỤM NHÂN VIÊN NÂNG CAO HIỆU QUẢ BÀI TỐN PHÂN BƠ VÀ ĐÁNH GIÁ NHÂN Sự TẠI CÔNG TY GMO Z- COM RUNSYSTEM Giáo viên hướng

Ngày đăng: 07/04/2022, 11:20

Hình ảnh liên quan

Hình 1. Sản phẩm, dịch vụ GMO cung cấp - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 1..

Sản phẩm, dịch vụ GMO cung cấp Xem tại trang 15 của tài liệu.
Hình 2. Cơ cấu tổ chức côngty GMO - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 2..

Cơ cấu tổ chức côngty GMO Xem tại trang 19 của tài liệu.
Hình 3. Quy trình phânbổ nhânsự trong dự án - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 3..

Quy trình phânbổ nhânsự trong dự án Xem tại trang 31 của tài liệu.
Hình 4. Mô phỏng vấn đề phâncụm dữ liệu - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 4..

Mô phỏng vấn đề phâncụm dữ liệu Xem tại trang 40 của tài liệu.
hình cây, cây phân cấp này được xây dựng theo kỹ thuật đệ quy bằng phương pháp trên xuống (Top down) hoặc phương pháp dưới lên (Bottum up). - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

hình c.

ây, cây phân cấp này được xây dựng theo kỹ thuật đệ quy bằng phương pháp trên xuống (Top down) hoặc phương pháp dưới lên (Bottum up) Xem tại trang 48 của tài liệu.
Hình 5. Minh họa phâncụm dữ liệu theo mật độ - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 5..

Minh họa phâncụm dữ liệu theo mật độ Xem tại trang 50 của tài liệu.
Hình 6. Một số kĩ thuật phâncụm - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 6..

Một số kĩ thuật phâncụm Xem tại trang 53 của tài liệu.
Hình 7. Các bước thưc hiện thuật toán K-means - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 7..

Các bước thưc hiện thuật toán K-means Xem tại trang 54 của tài liệu.
Hình 8. Hình dạng cụm dữ liệu được khai phá bởi thuật toán K-means 2.3.2. Đánh giá thuật toán K-means - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 8..

Hình dạng cụm dữ liệu được khai phá bởi thuật toán K-means 2.3.2. Đánh giá thuật toán K-means Xem tại trang 55 của tài liệu.
Hình 9. Top 10 ngôn ngữ lập trình phổ biến nhất năm 2018 - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 9..

Top 10 ngôn ngữ lập trình phổ biến nhất năm 2018 Xem tại trang 56 của tài liệu.
Hình 10. Một ví dụ minh họa so sánh giữa việc đơn giản hóa cú pháp của Python - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 10..

Một ví dụ minh họa so sánh giữa việc đơn giản hóa cú pháp của Python Xem tại trang 59 của tài liệu.
Hình 11. Ví dụ ngôn ngữ Python - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 11..

Ví dụ ngôn ngữ Python Xem tại trang 60 của tài liệu.
Hình 12. Lưu đồ tra cứu tài liệu liên quan trong thư viện scikit-learn - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 12..

Lưu đồ tra cứu tài liệu liên quan trong thư viện scikit-learn Xem tại trang 65 của tài liệu.
Hình 14. Truy cập vào Jupyter Notebook - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 14..

Truy cập vào Jupyter Notebook Xem tại trang 67 của tài liệu.
Hình 16. Kết quả k tối ưu bằng phương pháp Eblow - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 16..

Kết quả k tối ưu bằng phương pháp Eblow Xem tại trang 76 của tài liệu.
Hình 17. Mô hình hóa dữ liệu thực nghiệm - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

Hình 17..

Mô hình hóa dữ liệu thực nghiệm Xem tại trang 83 của tài liệu.
44 00 2G 42 43 04 04 22 434 32 25 404 14 30 G 21 24 2411 G1 04 13 G0 133 32 GG 23 30 34 34 5G 3 44 - Ứng dụng khai phá dữ liệu để phân cụm nhân viên nâng cao hiệu quả bài toán phân bổ và đánh giá nhân sự tại công ty gmo z com runsystem,khoá luận tốt nghiệp

44.

00 2G 42 43 04 04 22 434 32 25 404 14 30 G 21 24 2411 G1 04 13 G0 133 32 GG 23 30 34 34 5G 3 44 Xem tại trang 83 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan