Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 67 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
67
Dung lượng
1,76 MB
Nội dung
i UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN KIM SƠN SỬ DỤNG DATA MINING DỰ BÁO NHU CẦU LAO ĐỘNG CHO MỘT SỐ NGÀNH NGHỀ TRÊN ĐỊA BÀN TỈNH BÌNH DƯƠNG LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH: HỆ THỐNG THƠNG TIN MÃ SỐ: 8480104 BÌNH DƯƠNG, NĂM 2019 ii UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN KIM SƠN SỬ DỤNG DATA MINING DỰ BÁO NHU CẦU LAO ĐỘNG CHO MỘT SỐ NGÀNH NGHỀ TRÊN ĐỊA BÀN TỈNH BÌNH DƯƠNG LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8480104 NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS LÊ TUẤN ANH BÌNH DƯƠNG, NĂM 2019 iii LỜI CAM ĐOAN Tơi cam đoan luận văn : “Sử dụng Data Mining dự báo nhu cầu lao động cho số ngành nghề địa bàn tỉnh Bình Dương” cơng trình nghiên cứu riêng Các số liệu thực tế, kết thực nêu luận văn trung thực chưa công bố cơng trình khác Các tài liệu tham khảo, sản phẩm/ nghiên cứu sử dụng cho luận văn trính dẫn theo quy định Bình Dương, ngày 07 tháng năm 2019 Học viên thực luận văn Nguyễn Kim Sơn iv LỜI CẢM ƠN Lời tơi xin bày tỏ lịng biết ơn chân thành PGS.TS Lê Tuấn Anh, Thầy tận tình dẫn, định hướng truyền đạt kiến thức cho suốt thời gian thực luận văn Tôi xin bày tỏ long biết ơn ơn đến với quí Thầy Cơ giáo khoa Kỹ thuật - Cơng nghệ, Phịng Đào tạo sau đại học – Trường đại học Thủ Dầu Một trang bị cho kiến thức tảng quan trọng hỗ trợ tận tình suốt q trình tơi theo học Tơi xin chân thành cảm ơn Lãnh đạo Sở Lao động – Thương binh Xã hội, Lãnh đạo Trung tâm Dịch vụ Việc làm tỉnh Bình Dương tạo điều kiện cung cấp số liệu cho tơi hồn thiện luận văn Mặc dù cố gắng song luận văn không tránh khỏi thiếu sót Tơi mong nhận ý kiến đóng góp Thầy Cơ để tơi hồn thiện đề tài Xin trân trọng cảm ơn Bình Dương, ngày 07 tháng năm 2019 Học viên thực luận văn Nguyễn Kim Sơn v MỤC LỤC LỜI CẢM ƠN IV DANH MỤC CÁC CHỮ VIẾT TẮT VII DANH SÁCH BẢNG VIII DANH SÁCH HÌNH VẼ X CHƯƠNG TỔNG QUAN CHƯƠNG CÁC NGHIÊN CỨU LIÊN QUAN 2.1 THỊ TRƯỜNG LAO ĐỘNG .4 2.1.1 Khái niệm đặc điểm chung thị trường lao động 2.1.2 Các yếu tố thị trường lao động 2.1.3 Thông tin thị trường lao động .5 2.1.4 Hệ thống thông tin thị trường lao động 2.2 MỘT SỐ PHƯƠNG PHÁP DỰ BÁO .5 2.3 KHAI PHÁ DỮ LIỆU .7 2.3.1 Giới thiệu khai phá liệu .7 2.3.2 Các kỹ thuật khai phá liệu phổ biến 2.4 CÁC NGHIÊN CỨU LIÊN QUAN 11 CHƯƠNG MƠ HÌNH DỰ BÁO, TIÊU CHÍ ĐÁNH GIÁ VÀ YẾU TỐ TÁC ĐỘNG ĐẾN DỰ BÁO CẦU LAO ĐỘNG 16 3.1 XÁC ĐỊNH BÀI TỐN CHO MƠ HÌNH DỰ BÁO 16 3.2 MỘT SỐ THUẬT TỐN XÂY DỰNG MƠ HÌNH DỰ BÁO .17 3.2.1 Linear Regression .17 3.2.2 K - Nearest Neighbors 18 3.2.3 Decision trees Random forests .20 3.3 ĐỘ ĐO ĐÁNH GIÁ MƠ HÌNH DỰ BÁO 24 3.4 CÁC YẾU TỐ TÁC ĐỘNG ĐẾN CẦU LAO ĐỘNG 25 3.4.1 Các yếu tố sách .25 vi 3.4.2 Các yếu tố kinh tế - xã hội .25 3.4.3 Các yếu tố khoa học công nghệ 26 3.4.4 Lựa chọn yếu tố tác động thêm vào liệu dự báo .26 CHƯƠNG THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ .28 4.1 MƠ HÌNH THỰC NGHIỆM 28 4.2 CHUẨN BỊ TẬP DỮ LIỆU .31 4.2.1 Thông tin sở liệu 31 4.2.2 Mô tả sở liệu thực nghiệm 31 4.3 CÀI ĐẶT CHƯƠNG TRÌNH THỰC NGHIỆM .36 4.4 THỰC NGHIỆM MƠ HÌNH DỰ BÁO 36 4.4.1 Thực nghiệm, đánh giá mơ hình dự báo .36 4.4.1.1.Đánh giá kết thực nghiệm mơ hình dựa độ đo 36 4.4.1.2.Kiểm chứng số liệu dự báo với số liệu thực tế 42 4.4.2 Kết dự báo dựa Random forest .45 KẾT LUẬN 50 TÀI LIỆU THAM KHẢO 52 vii DANH MỤC CÁC CHỮ VIẾT TẮT Viết tắt ILO Tiếng Anh International Labour Tiếng Việt Tổ chức lao động Quốc tế Organization LR Linear Regression Hồi quy tuyến tính KNN K-nearest neighbors K láng giềng gần DTs Decision trees Cây định RF Random forests Rừng ngẫu nhiên CSDL Cơ sở liệu TTLĐ Thị trường lao động viii DANH SÁCH BẢNG Bảng 3.1 Độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính thơng tin chung số Lao động doanh nghiệp mơ hình 16 Bảng 3.2 Hệ số tương quan tổng số lao động đại học trở lên GDP, dân số nước, dân số Bình Dương 26 Bảng 4.1 Bảng mô tả liệu thực nghiệm dự báo 34 Bảng 4.2: kết độ đo thuộc tính thơng tin chung số lao động 37 Bảng 4.3: kết độ đo thuộc tính số lao động theo chun mơn kỹ thuật 38 Bảng 4.4: kết độ đo thuộc tính số lao động theo lĩnh vực giáo dục đào tạo 39 Bảng 4.5: kết độ đo thuộc tính số lao động theo lĩnh vực nhà nghiên cứu 40 Bảng 4.6: Kết độ đo trung bình thuộc tính mơ hình 41 Bảng 4.7: Số liệu thực tế, số liệu dự báo độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính thơng tin chung số lao động doanh nghiệp mơ hình 42 Bảng 4.8: Số liệu thực tế, số liệu dự báo độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo chun mơn kỹ thuật mơ hình 43 Bảng 4.9: Số liệu thực tế, số liệu dự báo độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực giáo dục đào tạo mơ hình 43 ix Bảng 4.10: Số liệu thực tế, số liệu dự báo độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực nhà nghiên cứu mơ hình 44 Bảng 4.11 Tỷ lệ phần trăm tập kiểm tra kết độ lệch số liệu dự báo so với số liệu thực tế năm 2015 thuộc tính tổng số lao động 46 Bảng 4.12 Số rừng kết độ lệch số liệu dự báo so với số liệu thực tế năm 2015 thuộc tính tổng số lao động 47 Bảng 4.13: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính thơng tin chung số Lao động doanh nghiệp theo số năm dự báo 47 Bảng 4.14: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo chun môn kỹ thuật theo số năm dự báo 48 Bảng 4.15: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực giáo dục đào tạo theo số năm dự báo 48 Bảng 4.16: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực nhà nghiên cứu theo số năm dự báo 48 Bảng 4.17: Độ xác trung bình kết dự báo thuộc tính với số năm dự báo 01 năm 02 năm 49 x DANH SÁCH HÌNH VẼ Hình 2.1 Q trình khai phá liệu Hình 3.1: Mơ hình hồi quy tuyến tính 18 Hình 3.2: Mơ hình Random forest cho vấn đề hồi quy 22 Hình 4.1: Mơ hình thực nghiệm dự báo 29 Hình 4.2: Biểu đồ so sánh kết trung bình độ đo thuộc tính mơ hình 41 Hình 4.3: Biểu đồ độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 giá trị trung bình độ xác thuộc tính mơ hình 45 43 Bảng 4.8: Số liệu thực tế, số liệu dự báo độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo chuyên môn kỹ thuật mô hình Nhóm thuộc tính số lao động theo chun mơn kỹ thuật Số liệu/ Độ lệch Mơ hình Tốt nghiệp THPT Không CMKT Công nhân KT Số liệu thực tế 333,327 307,355 327,464 25,229 21,613 48,202 25,568 44,817 Dự báo 355,159 350,921 322,160 25,634 23,358 54,750 27,564 47,308 Độ lệch 6.5% 14.2% 1.6% 1.6% 8.1% 13.6% 7.8% 5.6% Dự báo 357,466 351,440 332,760 23,915 23,182 55,926 27,983 47,588 Độ lệch 7.2% 14.3% 1.6% 5.2% 7.3% 16.0% 9.4% 6.2% Dự báo 355,011 366,138 333,080 24,335 23,399 54,643 27,625 41,932 Độ lệch 6.5% 19.1% 1.7% 3.5% 8.3% 13.4% 8.0% 6.4% Dự báo 293,328 267,399 271,795 12,362 13,184 37,116 17,386 30,924 Độ lệch 12.0% 13.0% 17.0% 51.0% 39.0% 23.0% 32.0% 31.0% RF DT LR KNN Đào tao thường xuyên Sơ cấp nghề Trung cấp Đại học trở lên Cao đẳng Với số liệu từ Bảng 4.8 nhận thấy độ lệch nhóm thuộc tính thơng tin chung số lao động doanh nghiệp thuộc mơ hình RF tốt Bảng 4.9: Số liệu thực tế, số liệu dự báo độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực giáo dục đào tạo mơ hình Mơ hình Số liệu/ Độ lệch Số liệu thực tế RF DT LR KNN Nhóm thuộc tính số lao động theo lĩnh vực giáo dục đào tạo Y tế Kỹ thuật Nơng Kinh tế - Khoa học Mơi Chưa có ta Lâm Xã hội tự nhiên trường qua ĐT nghề' Thủy DV khác 50,851 13,353 345,715 29,052 36,092 325,185 Dự báo 56,160 13,455 344,894 20,764 36,969 391,120 Độ lệch 10.4% 0.8% 0.2% 28.5% 2.4% 20.3% Dự báo 55,638 13,440 351,993 23,030 36,505 392,638 Độ lệch 9.4% 0.7% 1.8% 20.7% 1.1% 20.7% Dự báo 56,857 12,498 357,362 20,726 35,232 390,637 Độ lệch 11.8% 6.4% 3.4% 28.7% 2.4% 20.1% Dự báo 40,681 7,745 300,772 4,939 18,046 344,696 Độ lệch 20.0% 42.0% 13.0% 83.0% 50.0% 6.0% 44 Kết độ lệch từ bảng 4.9, thấy kết độ lệch mơ hình DT có độ lệch ổn định tốt so với mơ hình cịn lại nhóm thuộc tính Bảng 4.10: Số liệu thực tế, số liệu dự báo độ lệch kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực nhà nghiên cứu mơ hình Mơ hình Số liệu/ Độ lệch Số liệu thực tế RF DT LR KNN Nhóm thuộc tính số lao động theo lĩnh vực nhà nghiên cứu chuyên Trợ lý, Lãnh đạo môn bậc Nông Phi Nông LĐ giản VP, đơn vị trung, nghiệp nghiệp đơn DVKH Cao 15,910 31,966 64,686 24,129 439,929 223,628 Dự báo 16,683 35,039 68,428 22,875 441,807 279,877 Độ lệch 4.9% 9.6% 5.8% 5.2% 0.4% 25.2% Dự báo 17,574 35,085 68,774 25,488 450,441 281,356 Độ lệch 10.5% 9.8% 6.3% 5.6% 2.4% 25.8% Dự báo 14,045 33,683 65,813 25,573 444,601 283,228 Độ lệch 11.7% 5.4% 1.7% 6.0% 1.1% 26.7% Dự báo 12,410 22,376 51,749 5,791 378,339 225,864 Độ lệch 22.0% 30.0% 20.0% 76.0% 14.0% 1.0% Tương tự 02 nhóm thuộc tính thơng tin chung số lao động nhóm thuộc tính số lao động theo chun mơn kỹ thuật, kết độ lệch từ số liệu bảng 4.10 cho ta thấy mơ hình RF có độ lệch ổn định tốt so với mô hình cịn lại Vậy độ đo thuộc mơ hình RF phù hợp nhóm thuộc tính Từ số liệu nhóm thuộc tính trên, chúng tơi tính giá trị trung bình độ đo thuộc tính tốn, cho ta biếu đồ Hình 4.3 45 Hình 4.3: Biểu đồ độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 giá trị trung bình độ xác thuộc tính mơ hình Qua kết số liệu từ bảng 4.7, 4.8, 4.9, 4.10 biểu đồ hình 4.3, cho ta thấy mơ hình dự báo sử dụng thuật tốn Random Forests có kết xác 90,5 %, độ xác cao mơ hình cịn lại Với kết độ xác cao nhất, độ sai lệch tương đối thuộc tính ổn định mơ hình cịn lại ưu điểm thuật tốn Random Forests như: thuật tốn có nhiều đào tạo tập hợp liệu nên tránh việc Overfitting với tập liệu, hoạt động tốt liệu bị thiếu, độ ổn định cao tránh ảnh hưởng nhiễu tốt… vậy, chúng thấy mơ hình Random Forests mơ hình phù hợp tốn chúng tơi chọn để xây dựng mơ hình thực nghiệm dự báo nhu cầu lao động cho số ngành nghề địa bàn tỉnh Bình Dương 4.4.2 Kết dự báo dựa Random forest Sau có kết lựa chọn mơ hình phù hợp trên, chúng tơi thực mơ hình Random forest sau 46 Thực nghiêm với tập liệu gồm 35 thuộc tính với 28 thuộc tính dự báo mơ hình Random Forest, chúng tơi chọn số lượng năm dự báo 01 (một) năm (hai) năm cụ thể sau: - Số năm dự báo 01 năm: chọn năm 2015 làm năm dự báo, với tập liệu từ năm 2011 đến năm 2014 thực dự báo cho năm 2015, sau có kết dự báo đem so sánh với số liệu thực tế độ lệch thuộc tính - Số năm dự báo năm: chọn 2014 2015 để dự báo, đồng thời tách liệu năm khỏi tập liệu thực nghiệm q trình thực nghiệm, sau lấy kết số liệu dự báo so với liệu thực tế Tiến hành chạy thực nghiệm với tập liệu trên, q trình thực nghiệm, chúng tơi tiến hành thay đổi tỷ lệ tập huấn luyện tập kiểm tra, tinh chỉnh tham số có liên quan mơ hình Random forests kết tốt sau: - Trong trình thực nghiệm, lần lược thay đổi tỷ lệ phân chia tập tập huấn luyện tập kiểm tra, cuối có tỷ lệ phân chia kết dự báo tốt tập tập huấn luyện 80% tập kiểm tra 20% bảng 4.11 Bảng 4.11 Tỷ lệ phần trăm tập kiểm tra kết độ lệch số liệu dự báo so với số liệu thực tế năm 2015 thuộc tính tổng số lao động Số phần trăm tập test Kết độ lệch 10% 12.58% 20% 11.19% 30% 12.50% - Tiếp đến, lần lược thay đổi tham số mơ hình Random forest, qua q trình chạy thử nghiệm, chúng tơi nhận thấy rằng: tốn có tham số n_estimators thay đổi có ảnh hưởng đến kết thực nghiệm, từ lần lược thay đổi đổi tham số n_estimators tương ứng với kết độ lệch số liệu dự báo so với số liệu thực tế năm 2015 theo bảng 4.12 47 Bảng 4.12 Số rừng kết độ lệch số liệu dự báo so với số liệu thực tế năm 2015 thuộc tính tổng số lao động Số rừng 10 50 200 500 700 1.000 Kết độ lệch 12.85% 12.52% 12.43% 11.70% 11.19% 11.19% Vậy từ kết số liệu bảng 4.12, ta thấy tham số n_estimators (số lượng rừng) đạt kết dự báo tốt từ 500 đến 1.000 cây, nhiên chọn tham số tiến gần đến 1.000 chương trình chạy tốn nhiều thời gian mà kết không thay đổi nhiều, chúng tơi chọn tham số n_estimators =700 Tiến hành chạy thực nghiệm với tập liệu chọn ngẫu nhiên chia 80% làm tập huấn luyện, 20% lại làm tập kiểm tra mơ hình Random Forests với tham số n_estimators =700 để thực dự báo cho 01 năm (năm 2015) 02 năm (năm 2014 2015), trải qua 59 cho kết sau: Bảng 4.13: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính thơng tin chung số Lao động doanh nghiệp theo số năm dự báo Thông tin chung số Lao động doanh nghiệp Số Năm dự báo Tổng số LĐ tỉnh LĐ trực tiếp 01 88.8% 97.4% 02 93.4% 73.7% LĐ nữ LĐ có hợp đồng LĐ có HĐ nữ LĐ tuyển thêm LĐ thay 88.7% 87.6% 90.1% 91.7% 87.7% 74.6% 91.6% 95.4% 94.2% 94.7% 76.0% 60.2% 48 Bảng 4.14: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo chuyên môn kỹ thuật theo số năm dự báo Số Năm dự báo Nhóm thuộc tính số lao động theo chuyên môn kỹ thuật Tốt Không nghiệp CMKT THPT Công nhân KT 01 93.5% 85.8% 98.4% Đào tao Sơ cấp Trung Cao thường nghề cấp đẳng xuyên 98.4% 91.9% 86.4% 92.2% 02 93.8% 78.6% 86.6% 95.5% 92.2% 92.3% 97.3% Đại học trở lên 94.4% 93.8% Bảng 4.15: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực giáo dục đào tạo theo số năm dự báo Nhóm thuộc tính số lao động theo lĩnh vực giáo dục đào tạo 01 89.6% 99.2% Kỹ Nơng thuật Lâm có ta Thủy nghề' 99.8% 71.5% 02 90.0% 99.6% 88.2% Số Năm dự báo Kinh tế - Xã hội Khoa học tự nhiên 50.4% Y tế Môi Chưa trường - qua ĐT DV khác 97.6% 79.7% 89.9% 78.6% Bảng 4.16: Độ xác kết số liệu dự báo so với số liệu thực tế năm 2015 nhóm thuộc tính số lao động theo lĩnh vực nhà nghiên cứu theo số năm dự báo Nhóm thuộc tính số lao động theo lĩnh vực nhà nghiên cứu 01 95.1% chuyên Trợ lý, môn bậc VP, trung, DVKH Cao 90.4% 94.2% 02 96.2% 90.0% Số Năm dự báo Lãnh đạo đơn vị 99.7% Nông nghiệp Phi Nông nghiệp LĐ giản đơn 94.8% 99.6% 74.8% 53.0% 80.5% 63.5% 49 Bảng 4.17: Độ xác trung bình kết dự báo thuộc tính với số năm dự báo 01 năm 02 năm Số năm dự báo Độ lệch trung bình Độ xác trung bình Một năm 10% 90% Hai năm 16% 84% Từ kết bảng số liệu dự báo theo nhóm thuộc tính Bảng 4.17 độ xác trung bình kết dự báo thuộc tính với số năm dự báo 01 năm 02 năm trên, ta thấy kết độ xác dự báo dao động khoảng từ 60% đến 90%, từ kết quả cho ta thấy độ xác dự báo cao để áp dụng cho thực tế 50 KẾT LUẬN Trong đề tài này, chúng tơi trình bày phương pháp dự báo, khai phá liệu, kỹ thuật khai phá liệu ứng dụng khai phá liệu thực tế Trong luận văn tập trung vào nghiên cứu kỹ thuật, phương pháp hồi quy thuật tốn áp dụng vào tồn dự báo thực tế tốn dự báo nhu cầu lao động cho số ngành nghề địa bàn tỉnh Bình Dương Chúng tơi trình bày viết ứng dụng khai phá liệu để khai thác sở liệu Cầu lao động với 38.739 dòng 33 cột liệu, việc tìm hiểu yếu tố tác động đến cầu lao động để thu thập số liệu đưa vào làm thuộc tính cho liệu dự báo, từ đó, chúng tơi xây dựng mơ hình để dự báo nhu cầu lao động theo lình vực ngành nghề, trình độ đào tạo địa bàn tỉnh Bình Dương Dựa vào tốn thực tế, liệu có tiến hành thực nghiệm để xác đinh toán, qua trình thực nghiệm chúng tơi minh chứng chọn mơ hình hồi quy cho tốn phù hợp, đồng thời tiến hành xây dựng 04 mơ hình theo tốn hồi quy: KneighborsRegressor, LinearRegression, DecisionTreeRegressor RandomForestRegressor Q trình thực nghiệm nhiều thời gian điều chỉnh tham số, xem xét thêm vào liệu số liệu có liên quan để tạo mơ hình dự báo có kết tốt Thực nghiệm cho thấy mơ hình dự báo sử dụng thuật tốn Random Forest kết xác nhất, dự báo độ xác năm 2014 90%, đảm bảo độ tin cậy đáp ứng yêu cầu thực tiễn chúng tơi chọn thuật toán để thực nghiên cứu Việc xây dựng mơ hình dự báo nhu cầu lao động cho số ngành nghề địa bàn tỉnh Bình Dương cần thiết việc góp phần xây dựng hệ thống thơng tin thị trường lao động tỉnh, nhằm tạo tranh tổng thể thị trường lao động, từ hỗ trợ cho cán chuyên môn công tác hỗ trợ người dân giải việc làm hay tuyển dụng, tạo điều kiện phục vụ người dân nhanh chóng tốt hơn, thông qua hoạt động Hệ thống thông tin thị trường lao động nhà lãnh đạo, ngành, cac cấp có định hướng, hoạch định chiến lược phát triển cho tương 51 lai có kế hoạch cụ thể việc đào tạo – dạy nghề giải pháp thiết thực việc giới thiệu giải việc làm tỉnh… Tuy nhiên bên cạnh kết đạt đươc, luận văn số hạn chế chưa xét hết yếu tố ảnh hướng đến chuỗi thời gian thu thập được, liệu điều tra theo năm (cuối năm) nên chưa xác định yếu tố mùa vụ nhu cầu lao động chưa xác định đầy đủ thuộc tính có yếu tố ảnh hưởng đến mơ hình dự báo, mẫu biểu thu thập thơng tin cầu lao động chung chung, chưa phân tách ngành nghề cụ thể… việc xác định áp dụng mơ hình vào tốn cịn hạn chế, có 04 mơ hình để thực nghiệm…trước hạn chế này, khuyến nghị, thời gian tới tiếp tục thu thập thêm liệu, thử nghiệm thêm nhiều mơ hình kết hợp với hiệu chỉnh mơ hình, chỉnh sửa lại phiếu điều tra nhu cầu lao động với tiêu chí cụ thể ngành nghề, việc thu thập liệu cầu lao động thời gian dài bổ sung thêm các yếu tố ảnh hưởng để kết dự báo cải thiện để mô hình áp dụng rộng rãi thực tế nước 52 TÀI LIỆU THAM KHẢO [1] Niên giám thống kê tỉnh Bình Dương (2011-2017) [2] Luật việc làm số 38/2013/QH13, ngày 16 tháng 11 năm 2013 [3] Đỗ Văn Chấn (1984) Dự đoán nhu cầu triển vọng cán chuyên môn nước ta Viện Nghiên cứu Đại học THCN, Hà Nội [4] Phạm Đức Chính (2006) Thị trường lao động, sở lý luận thực tiễn Việt Nam Nhà xuất Chính trị quốc gia, Hà Nội [5] Nguyễn Thị Lan Hương, Nguyễn Bá Ngọc, Nguyễn Bích Ngọc (2009) Lao động - việc làm thời kỳ hội nhập Nhà xuất Lao động Xã hội, Hà Nội [6] Nguyễn Trọng Hoài, Phùng Thanh Bình, Nguyễn Khánh Duy (2009) Dự báo phân tích liệu kinh tế tài Nhà xuất thống kê, Hà Nội [7] Phan Văn Kha (2009) Cơ sở khoa học việc xác định cấu ngành đào tạo đại học tiến trình hội nhập quốc tế Đề tài B2007-CTGD04 thuộc chương trình nghiên cứu khoa học giáo dục cấp Bộ 2006-2008 [8] Trần Hữu Nam (2000), Đề tài “Nghiên cứu ứng dụng phương pháp dự báo giáo dục - đào tạo”, Viện Nghiên cứu phát triển giáo dục [9] Trần Thị Phương Nam (2014) Cơ sở khoa học dự báo nhu cầu nhân lực trình độ cao đẳng, đại học Việt Nam Luận án Tiến sĩ Khoa học giáo dục, Viện Khoa học Giáo dục Việt Nam [10] Nguyễn Hà Nam, Nguyễn Trí Thành, Hà Quang Thụy (2013) Giáo Trình Khai Phá Dữ Liệu Nhà xuất đại học quốc gia, Hà Nội [11] Đỗ Thanh Nghị, Trần Nguyễn Minh Thư, Bùi Võ Quốc Bảo, Phạm Nguyên Khang (1984) Xây dựng cân chỉnh mơ hình dự báo mật số rầy nâu apache spark Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX - Nghiên cứu ứng dụng Công nghệ thông tin (FAIR'9), Trường Đại học Cần Thơ, Cần Thơ [12] Trần Minh Nguyệt (2011) Giáo trình Kinh tế lao động Nhà xuất Đại học Tài nguyên Môi trường, Hà Nội [13] Nguyễn Tiệp (2008) Giáo trình thị trường lao động Nhà xuất Lao động – Xã hội, Hà Nội 53 [14] Nguyễn Văn Tuấn (2018) Phân tích liệu với R – Hỏi đáp Nhà xuất Tổng hợp TP HCM, TP HCM [15] Techtalk via Viblo (2018) 10 thuật tốn machine learning mà lập trình viên cần biết [online], viewed 08/10/2018, from: [16] Machine Learning (2016) Bài 3: Linear Regression [online], viewed 08/10/2018, from: [17] Machine Learning (2017) Bài 6: K-nearest neighbors [online], viewed 08/10/2018, from: [18] Machine Learning (2018) Bài 34: Decision Trees (1) [online], viewed 08/10/2018, from:< https://machinelearningcoban.com/2018/01/14/id3/> [19] Leo Breiman, Jerome Friedman, Charles J Stone & R.A Olshen (1984) Classification and Regression Trees Taylor & Francis [20] Leo Breiman (1996) Bagging predictors In: Leo Breiman, Machine Learning vol.24(2), pp 123–140 [21] Leo Breiman (1998) Arcing classifiers In: Leo Breiman, The Annals of Statistics vol.26(3), pp 801-849 [22] Leo Breiman (2001) Random forests In: Machine Learning vol.45(1) , pp 5-32 [23] Jiawei Han, Micheline Kamber (2006) Data Mining: Concepts and Techniques Second Edition, Morgan Kaufmann Publishers [24] David Hand, Heikki Mannila, Padhraic Smyth (2001) Principles of Data Mining, MIT Press [25] J Han, M Kamber, and Jian Pei (2011) Data Mining: Concepts and Techniques 3rd edition, Morgan Kaufmann [26] John E.Hanke & Dean W.Wichern (2005) Business Forecasting, 8th Edition [27] Gregory Piatetsky – Shapiro (2006) Data Mining Course (Power Point Version) 54 [28] J.Holton Wilson & Barry Keating (2007) Business Forecasting With Accompanying Excel – Based ForecastX TM Software, 5th Edition [29] Ross Ihaka (2005) Time Series Analysis, Lecture Notes for 475.726, Statistics Department, University of Auckland [30] Francis X Diebold (2000) Elements of Forecasting, 2nd Edition University of Pennsylvania [31] Michael R.Carrell, Norbert F.Elbert, Robert D Hatfield (1995) Human resource management: Global strategies for managing a diverse workforce Prentice Hall, 5th Revised edition edition 55 Phụ lục Phiếu cập nhật thông tin lao động Doanh nghiệp 56 57 ...ii UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN KIM SƠN SỬ DỤNG DATA MINING DỰ BÁO NHU CẦU LAO ĐỘNG CHO MỘT SỐ NGÀNH NGHỀ TRÊN ĐỊA BÀN TỈNH BÌNH DƯƠNG LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH:... TIÊU CHÍ ĐÁNH GIÁ VÀ YẾU TỐ TÁC ĐỘNG ĐẾN DỰ BÁO CẦU LAO ĐỘNG 3.1 Xác định tốn cho mơ hình dự báo Căn váo liệu cầu lao động có, tốn dự báo cho số lương nhu cầu lao động theo nhóm thuộc tính trình... 45 ngàn lao động, lao động có tay nghề có trình độ chun mơn cao 80% Việc nghiên cứu đưa mơ hình dự báo nhu cầu lao động cho số ngành nghề tỉnh Bình Dương cần thiết việc góp phần xây dựng hệ thống