TIỂU LUẬN NGHIÊN CỨU THỰC TRẠNG VỀ DÂN SỐ VÀ LAO ĐỘNG CỦA VIỆT NAM NĂM 2021 MỤC LỤC DANH MỤC HÌNH ẢNH 1 DANH MỤC TỪ VIẾT TẮT 2 CHƯƠNG 1 GIỚI THIỆU 1 1 1 Tính cấp thiết của đề tài 1 1 2 Mục tiêu nghiên.
TIỂU LUẬN: NGHIÊN CỨU THỰC TRẠNG VỀ DÂN SỐ VÀ LAO ĐỘNG CỦA VIỆT NAM NĂM 2021 MỤC LỤC DANH MỤC HÌNH ẢNH Dương Thị Ngọc Diem_01/03/2001 DANH MỤC TỪ VIẾT TẮT DT diện tích DS dân số MDDS mật độ dân số LLLD15 lực lượng lao động từ 15 tuổi trở lên DGDT đánh giá diện tích DGDS đánh giá dân số DGMDDS đánh giá mật độ dân số DGLLLD15 đánh giá lực lượng lao động 15 tuổi TSNC tỷ suất nhập cư TSXC tỷ suất xuất cư TSST tỷ suất sinh thô TSNCR tỷ suất nhập cư ròng DGTSNC đánh giá tỷ suất nhập cư DGTSXC đánh giá tỷ suất xuất cư DGTSST đánh giá tỷ suất sinh thô GRDPUSD gross regional domestic product USD tổng sản phẩm địa bàn tính theo đơn vị USD CSGSH số giá sinh hoạt theo không gian ML machine learning học máy Dương Thị Ngọc Diem_01/03/2001 CHƯƠNG 1: GIỚI THIỆU 1.1 Tính cấp thiết đề tài Con người nguồn lực trọng yếu quốc gia, yếu tố quan trọng góp phần thúc đẩy phát triển kinh tế - trị - xã hội Chính tầm quan trọng đó, quốc gia giới tập trung vào khảo sát liên quan đến cấu dân số, nhằm mục đích theo dõi đưa sách phù hợp với đất nước Dân số thay đổi nhanh chóng cho thấy tầm quan trọng việc sử dụng liệu dự báo dân số việc xây dựng sách, chiến lược kế hoạch kinh tế - xã hội cấp quốc gia, cấp địa phương cấp ngành, đồng thời tính đến nhu cầu nhóm dân số khác cách xác, đảm bảo khơng để bị bỏ lại phía sau, hướng tới đạt mục tiêu phát triển bền vững Trong bốn thập kỷ qua, dân số Việt Nam có bước thay đổi đáng kể Việt Nam tiếp tục tiến vào thời kỳ dân số vàng từ năm 2007 dự kiến kéo dài đến năm 2039 Tuy nhiên, việc kiểm soát tốc độ tăng trưởng, trình độ phát triển, cấu dân số có ảnh hưởng đến thu nhập bình quân kinh tế chưa tốn dễ trả lời Chính thế, nhóm chúng em định thực báo cáo " Thực trạng dân số lao động nước ta năm 2021" bao gồm số liệu cụ thể: Tên tỉnh thành, khu vực, dân số, mật độ dân số, tỷ suất nhập (xuất) cư, LLLĐ từ 15 tuổi, tỷ suất sinh thơ với mục đích nghiên cứu thay đổi dân số khu vực, nguồn lực lao động tác động đến vấn đề việc làm Đồng thời phần giải câu hỏi tỷ lệ nhập (xuất) dân cư đơn vị hành Việt Nam 1.2 Mục tiêu nghiên cứu Dựa liệu khảo sát trực quan hóa rõ ràng, đề tài nghiên cứu hướng đến mục tiêu điều ta dân số khu vực có ảnh hưởng đến số phát triển khu vực nói riêng nước nói chung Từ mối quan hệ Dương Thị Ngọc Diem_01/03/2001 vấn đề dân số vấn đề kinh tế - xã hội như: dân số nhiều mang lợi ích gì, tỉ suất sinh tỷ suất xuất (nhập) cư khiến cấu dân số thay đổi sao, nguồn lao động từ 15 tuổi chiếm phần trăm tổng dân số địa bàn tỉnh Bài nghiên cứu tập trung vào số tiêu đánh giá cụ thể xoay quanh biến động dân số địa phương Thơng qua đưa số nhận xét, giải pháp cho để giải toán dân số nêu 1.3 Câu hỏi nghiên cứu Để đạt mục tiêu nghiên cứu trên, báo cáo tập trung trả lời câu hỏi sau: Dân số ảnh hưởng tới lao động việc làm nào? 1.4 Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: Dân số lao động Việt Nam Phạm vi nghiên cứu: - Phạm vi không gian: Dân số lao động tỉnh thành Việt Nam - Phạm vi thời gian: Báo cáo thu thập liệu năm 2021 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 Một số khái niệm 2.1.1 Tổng quan khoa học liệu • Khoa học liệu lĩnh vực nghiên cứu liệu nhằm khai thác thông tin chuyên sâu có ý nghĩa hoạt động kinh doanh Đây phương thức tiếp cận đa ngành, kết hợp nguyên tắc phương pháp thực hành lĩnh vực tốn học, thống kê, trí tuệ nhân tạo kỹ thuật máy tính để phân tích khối lượng lớn liệu Nội dung phân tích giúp nhà khoa học liệu đặt Dương Thị Ngọc Diem_01/03/2001 trả lời câu hỏi kiện xảy ra, xảy ra, kiện xảy sử dụng kết thu cho mục đích Tại khoa học liệu lại quan trọng? • Khoa học liệu quan trọng lĩnh vực kết hợp công cụ, phương pháp công nghệ để rút ý nghĩa từ liệu Các tổ chức đại chìm ngập liệu có vơ vàn thiết bị tự động thu thập lưu trữ liệu Các hệ thống cổng toán trực tuyến dần thu thập nhiều liệu lĩnh vực thương mại điện tử, y tế, tài khía cạnh khác đời sống người Chúng ta có sẵn khối lượng đồ sộ liệu dạng văn bản, âm thanh, video hình ảnh • Đáng tiếc thay, liệu thơ chẳng có giá trị trừ chúng sử dụng để giải vấn đề Các nhà khoa học liệu chuyển đổi liệu thô thành đề xuất có ý nghĩa Họ phát giải vấn đề mà doanh nghiệp cịn khơng biết chúng tồn Các tổ chức sử dụng đề xuất để khiến khách hàng hài lịng hơn, tối ưu hóa chuỗi cung ứng cho mắt sản phẩm Các kỹ thuật khoa học liệu • Phân loại kỹ thuật xếp liệu thành nhóm danh mục cụ thể Máy tính đào tạo để xác định xếp liệu Các tập liệu xác định sử dụng để xây dựng thuật tốn định máy tính có khả xử lý phân loại liệu cách nhanh chóng Ví dụ: • Phân loại sản phẩm theo phổ biến khơng phổ biến • Phân loại đơn bảo hiểm theo rủi ro cao rủi ro thấp • Phân loại bình luận mạng xã hội thành tích cực, tiêu cực trung lập Dương Thị Ngọc Diem_01/03/2001 • Hồi quy phương pháp tìm mối quan hệ điểm liệu dường không liên quan Mối liên kết thường lập mô hình xoay quanh cơng thức tốn học biểu thị dạng đồ thị đường cong Khi giá trị điểm liệu xác định, hồi quy sử dụng để dự đoán điểm liệu cịn lại Ví dụ: • Tốc độ lây nhiễm bệnh lây qua đường không khí • Mối quan hệ mức độ hài lịng khách hàng số lượng nhân viên • Phân nhóm phương pháp gộp liệu có liên quan chặt chẽ lại với để tìm kiếm mẫu điểm dị thường Phân nhóm khác với phân loại liệu khơng thể xếp xác vào hạng mục cố định Do đó, liệu nhóm thành mối quan hệ có khả xảy Thơng qua phân nhóm, mẫu mối quan hệ phát Ví dụ: · • Nhóm khách hàng có hành vi mua hàng giống để cải thiện dịch vụ khách hàng • Nhóm lưu lượng mạng để xác định mẫu sử dụng hàng ngày nhanh chóng phát cơng mạng • Nhóm viết thành nhiều hạng mục tin tức khác sử dụng thơng tin để tìm kiếm tin giả 2.1.2 Khái quát học máy Học máy hay máy học tiếng Anh Machine learning, viết tắt: ML Học máy công nghệ phát triển từ lĩnh vực trí tuệ nhân tạo Các thuật tốn học máy chương trình máy tính có khả học hỏi cách hoàn thành nhiệm vụ cách cải thiện hiệu suất theo thời gian Dương Thị Ngọc Diem_01/03/2001 Học máy đòi hỏi đánh giá người việc tìm hiểu liệu sở lựa chọn kĩ thuật phù hợp để phân tích liệu Đồng thời, trước sử dụng, liệu phải sạch, khơng có sai lệch khơng có liệu giả Các mơ hình học máy u cầu lượng liệu đủ lớn để "huấn luyện" đánh giá mơ hình Trước đây, thuật tốn học máy thiếu quyền truy cập vào lượng lớn liệu cần thiết để mơ hình hóa mối quan hệ liệu Sự tăng trưởng liệu lớn (big data) cung cấp thuật toán học máy với đủ liệu để cải thiện độ xác mơ hình dự đốn Bộ liệu điều tra dân số từ 2011 - 2021 bao gồm trường liệu sau: Dân số (DS): tập hợp người sinh sống quốc gia, khu vực, vùng địa lý kinh tế đơn vị hành Mật độ dân số (MDDS): số dân tính bình qn kilơmét vng diện tích lãnh thổ, tính cách chia dân số (thời điểm bình quân) vùng dân cư định cho diện tích lãnh thổ vùng Mật độ dân số tính cho tồn quốc riêng vùng (nông thôn, thành thị, vùng kinh tế); tỉnh, huyện, xã, v.v… nhằm phản ánh tình hình phân bố dân số theo địa lý vào thời gian định MDDSngườikm2 =Số lượng dân số (người)Diện tích lãnh thổ (km2) Tỷ suất nhập cư (TSNC): phản ánh số người từ đơn vị lãnh thổ khác (nơi xuất cư) nhập cư đến đơn vị lãnh thổ thời kỳ nghiên cứu tính bình qn 1.000 dân đơn vị lãnh thổ (nơi nhập cư) IMR %=IPtb×1000 Trong đó: • IMR: Tỷ suất nhập cư • I: Số người nhập cư năm Dương Thị Ngọc Diem_01/03/2001 • Ptb: Dân số trung bình (hay dân số có đến năm) Tỷ suất xuất cư (TSXC): phản ánh số người xuất cư đơn vị lãnh thổ thời kỳ nghiên cứu tính bình qn 1.000 dân đơn vị lãnh thổ OMR %OOPtb×1000 Trong đó: • OMR: Tỷ suất xuất cư • O: Số người xuất cư năm • Ptb: Dân số trung bình (hay dân số có đến năm) Tỷ suất nhập cư ròng (TSNCR): TSNC – TSXC Thể độ hấp dẫn tỉnh thành (ta phân tích yếu tố khác tác động đến TSNCR nào) Tỷ suất sinh thô (TSST): tiêu đo lường mức sinh dân số, hai thành phần tăng tự nhiên dân số Tỷ suất sinh thô lớn hay nhỏ có ảnh hưởng đến quy mơ, cấu tốc độ tăng dân số Tỷ suất sinh thô cho biết 1.000 dân, có trẻ em sinh sống thời kỳ nghiên cứu CBR = (Số trẻ em sinh năm/Tổng số dân trung bỡnh ca nm) ì 1000 ã Tng sn phm trờn địa bàn (GRDP): kết cuối hoạt động sản xuất thực đơn vị sản xuất thường trú địa bàn Tỉnh, Thành phố trực thuộc trung ương GDP thường tính cho nước, GRDP thường tính cho địa phương Cơng thức tính GRDP: Theo phương pháp sản xuất: GRDP = VA + T – S Dương Thị Ngọc Diem_01/03/2001 Trong đó: • VA: Là tổng giá trị tăng thêm ngành nghề, dịch vụ • T: Là thuế nhập vào địa phương • S: Trợ cấp sản phẩm địa phương Tính theo phương pháp thu nhập: GRDP = I+T+A+S Trong đó: • I = Thuế sản xuất (khơng bao gồm phần trợ cấp sản xuất) • T = Thu nhập người lao động đến từ hoạt động sản xuất ( tính vật quy tiền) • A= Khấu hao tài sản • S= Thu nhập hỗn hợp thặng dư sản xuất Tính theo phương pháp sử dụng: GRDP = C + G + I + (X-M) Trong đó: • C = Chi tiêu hộ gia đình • G = Tổng chi tiêu hệ thống phủ nhà nước • I = Tích lũy tài sản đầu tư nhà kinh doanh • X-M: Xuất rịng – tổng giá trị hàng hóa nhập Dương Thị Ngọc Diem_01/03/2001 - Lực lượng lao động 15 tuổi tỷ lệ thuận mức độ tăng theo dân số - Lực lượng lao động 15 tuổi dân số có xu hướng tăng dần - Lực lượng lao động 15 tuổi thường tập trung nhiều nơi có dân số đông - Lực lượng lao động tăng theo dân số - Dân số tập trung nhiều lực lượng lao động 15 tuổi dồi Hình 3.3: Diện tích số tỉnh thành nước - Tỉnh thành có diện tích lớn nước Nghệ An: 16486.5(km2) - Tỉnh thành có diện nhỏ nước Bắc Ninh: 822.71(km2) Dương Thị Ngọc Diem_01/03/2001 Hình 3.4: Diện tích ba khu vực - Diện tích miền trung lớn nhất, chênh lệch lớn so với miền bắc miền nam - Diện tích miền trung lớn nhất, chênh lệch lớn so với miền bắc miền nam Diện tích miền trung lớn kinh tế khu vực thấp khu vực Bắc, Trung, Nam - Tỷ lệ diện tích khơng tỷ lệ thuận với phát triển kinh tế - Miền Trung: lãnh thổ trải rộng địa hình phức tạp cản trở tổ chức khơng gian phát triển kinh tế - xã hội vùng, đặc biệt kết nối giao thơng đường bộ; cịn thiếu hệ thống giao thông liên vùng đại, tuyến đường cao tốc, đường trục ngang nối với miền núi Tây Nguyên Hạ tầng kinh tế - kỹ thuật nhìn chung cịn chưa đồng - Thực tế vùng KTTĐ Bắc Bộ có Thủ Hà Nội hạt nhân tạo phát triển lan tỏa chung cho vùng; vùng KTTĐ phía Nam có Thành phố Hồ Chí Minh đóng vai trị hạt nhân phát triển; vùng KTTĐ miền Trung chưa có địa bàn phát triển thật mạnh nhằm tạo sức lan tỏa chung, “tính vùng” khơng lấn át “tính địa phương” dẫn đến chưa khai thác lợi ven biển vùng Dương Thị Ngọc Diem_01/03/2001 Hình 3.5: Tỷ suất nhập cư ròng theo khu vực TSNCR = TSNC – TSXC (%) - Miền nam TSNC TSXC người dân miền nam di chuyển đến địa phương khác làm nhiều người dân địa phương khác di chuyển đến - Miền trung TSNCR < 0, kinh tế không phát triển ảnh hưởng thiên tai nên người dân đa phần xuất cư đến nơi khác học tập làm việc, đặc biệt vào miền nam Sự di chuyển lao động trẻ, lao động có đào tạo từ miền Trung đến miền Đông Nam Bộ năm qua tiếp diễn thách thức phát triển vùng - Miền bắc TSNC TSXC cao miền nam, cho thấy kinh tế động Dương Thị Ngọc Diem_01/03/2001 Hình 3.6: DS, LLLD15, MDDS tỉnh thành - DS, MDDS LLLD15 tỷ lệ thuận với - Đặc biệt DS LLLD15 trùng khớp với nhau, DS tăng LLLD15 tăng ngược lại - Điều cho thấy dân số nước ta trẻ, đa phần độ tuổi lao động đến độ tuổi lao động - Dân số nước ta không chênh lệch, có vài địa phương cao thành phố Hồ Chí Minh Hình 3.7: TSNC VÀ TSXC tỉnh thành - Thực tế địa có TSNC tăng chứng tỏ địa phương có sức hút người lao động, người lao động nơi có lý để rời khỏi địa phương Dương Thị Ngọc Diem_01/03/2001 - Bình Dương địa phương có tỷ suất nhập cư cao với 217‰, tức 1.000 người có 217 người dân nhập cư Xếp thứ Bắc Ninh với tỷ suất 106,82‰ Sau TP Hồ Chí Minh, Đà Nẵng, Đồng Nai, Long An, Cần Thơ, Hà Nội, Bà Rịa - Vũng Tàu Thái Ngun Hình 3.8: Diện tích dân số tỉnh thành - TP Hồ Chí Minh có DT nhỏ 2095.39 (km 2) có DS cao nước 9166.84 (nghìn người) - DS thấp nước Bắc Kạn có DS nhỏ 323.71(nghìn người) với DT 4859.96 (km2) Dân số khơng phụ thuộc vào diện tích mà phụ thuộc vào kinh tế vận hành địa phương Hình 3.9: Dân số theo khu vực Dương Thị Ngọc Diem_01/03/2001 - Dân số miền bắc không cao phân bố không chênh lệch nhiều - Mỗi miền thường có vài địa phương có dân số cao vượt bậc - Miền Nam có DS tập trung cao nước - Miền Trung có DS tập trung so với khu vực miền Bắc miền Nam Hình 3.10: GRDPUSD theo tỉnh thành GRPUSD bình quân đầu người năm 2021 cao tỉnh Bà Rịa Vũng Tàu(12.122USD/người/năm), đứng thứu hai Quảng Ninh(7.586-USD/người/năm), thứ ba Bắc Ninh(6.706-USD/người/năm) GRPUSD bình quân đầu người năm 2021 thấp Điện Biên(1.49-USD/người/năm) Nhìn chung tỉnh thành miền trung có GRPUSD thấp so với miền Bắc miền Nam (USD/người/năm) Dương Thị Ngọc Diem_01/03/2001 Hình 3.11: Lực lượng lao động 15 tuổi tỉnh thành - Lực lượng lao động 15 tuổi tỉnh thành nước 100 nghìn người đó: Thành phố Hồ Chí Minh có lực lượng lao động 15 tuổi lớn 4622.5(nghìn người) Bắc Kạn có lực lượng lao động 15 tuổi 144.6(nghìn người) Các tỉnh có LLLDD15 cao hầu hết tập trung vùng trung tỉnh thành có nhiều khu cơng nghiệp, kinh tế phát triển vùng đất rộng có tỷ trọng lao động thấp (vùng trung du miền núi phía Bắc chiếm 13,8% lực lượng lao động, Tây Nguyên chiếm 6,5% lực lượng lao động), phân bổ lao động chưa tạo điều kiện phát huy lợi đất đai, tạo việc làm cho người lao động tác động tích cực đến di chuyển lao động từ vùng nông thôn thành thị, tỉnh kinh tế thấp di chuyển đến vùng có kinh tế cao Bình Dương, Đồng Nai, TpHCM, Hải Phòng, Dương Thị Ngọc Diem_01/03/2001 CHƯƠNG 4: PHÂN TÍCH DỮ LIỆU 4.1 Kiểm tra R^2 RMSE Để kiểm tra độ xác mơ hình hồi quy OLS với liệu nhóm nhóm định phân tích R^2 rmse trước phân tích hồi quy tuyến tính OLS Quy trình Bước 1: Khai báo dùng thư viện • Thư viện Pandas, Numpy • Thư viện Scikit-learn Bước 2: Nạp liệu Để thực nghiên cứu liệu sau sử dụng: DT, DS, MDDS, LLLD15, TSST, CSGSH, GRDPUSD, TSNCR Bước 3: Xác định biến độc lập biến phụ thuộc Xác định biến độc lập biến phụ thuộc sau: • Biến độc lập: DT, DS, MDDS, LLLD15, TSST, CSGSH, GRDPUSD • Biến phụ thuộc: TSNCR Bước 4: Tách thành liệu huấn luyện đánh giá Tách liệu thành liệu huấn luyện liệu đánh giá để có kết xác Kết sau: Hình 4.1: Kết kiểm tra R^2 RMSE - R^2: hay gọi R-squared hệ số xác định phản ánh mức độ giải thích biến độc lập biến phụ thuộc TSNCR mơ hình hồi quy → R^2 cao độ tin cậy mơ hình cao → Mơ hình phù hợp với liệu Dương Thị Ngọc Diem_01/03/2001 - rmse: dần có đủ độ đáng tin cậy chứng minh mơ hình bị sai số → rmse nằm mức chấp nhận 4.2 Mơ hình hồi quy OLS Quy trình phân tích liệu Bước 1: Khai báo • Thư viện Pandas, Numpy • Thư viện Scikit-learn, StatsModels Bước 2: Nạp liệu Nghiên cứu thực nạp liệu từ tập tin chuẩn bị sẵn có 20 cột liệu, có cột liệu dùng để chạy mơ hình hồi quy OLS Để thực nghiên cứu liệu sau sử dụng: DT, DS, MDDS, LLLD15, TSST, CSGSH, GRDPUSD, TSNCR Bước 3: Xác định biến độc lập biến phụ thuộc Sau trình tìm hiểu TSNCR có nhiều mối liên hệ với biến khác, nhóm chọn TSNCR biến phụ thuộc để mơ hình có ý nghĩa thống kê cao: • Biến độc lập: DT, DS, MDDS, LLLD15, TSST, CSGSH, GRDPUSD • Biến phụ thuộc: TSNCR Bước 4: Tách thành liệu huấn luyện đánh giá Q trình phân tích đòi hỏi phải qua bước bước huấn luyện bước đánh giá để làm điều nghiên cứu lựa chọn tỷ lệ ngẫu nhiên 30% đánh giá, 70% huấn luyện Kết thực việc học sử dụng cơng cụ hồi quy tuyến tính cho kết sau tập huấn luyện Mô hình hồi quy OLS ban đầu Dương Thị Ngọc Diem_01/03/2001 Kết thực việc học sử dụng công cụ hồi quy tuyến tính cho kết sau tập huấn luyện Hình 4.2.1: Kết hồi quy OLS ban đầu Kết phân tích hồi quy tuyến tính theo phương pháp OLS cho thấy: - F-statistic = 17.23: kiểm định độ tin cậy mặt thống kê tồn phương trình hồi quy - Prob (F-statistic) = 0.00000000000775 < 0.05 → Mơ hình hồi quy tồn - R-squared = 0.687 > 0.5: • Là hệ số xác định phản ánh mức độ giải thích biến độc lập biến • • • • phụ thuộc TSNCR mơ hình hồi quy 68.7% R-squared có ý nghĩa Prob(F-statistic) < 0.05 Mức giải thích mơ hình mức trung bình cao Đánh giá mơ hình phù hợp Trên sở phương trình hồi quy tuyến tính tồn với số cụ thể - xác định bảng hệ số hồi quy riêng phần Adj R-squared = 0.647: bổ sung độ xác độ tin cậy cách xem xét tác động biến độc lập bổ sung có xu hướng làm sai lệch kết phép đo R-squared Dương Thị Ngọc Diem_01/03/2001 Do đó: Adj R-squared < R-squared - Sai số chuẩn (stt err) biến không lớn → Mẫu có độ xác cao - khơng q lệch so với giá trị thực Dựa kết phân tích số P-value (P > t) bảng hệ số hồi quy riêng phần cho thấy: • P-value biến độc lập DT = 0.482 CSGSH = 0.447 lớn 0.05 nên khơng có - ý nghĩa thống kê → Cần phải loại bỏ Như vậy, có biến DS, MDDS, LLLD15, TSST, GRDPUSD có ý nghĩa phương trình hồi quy tuyến tính để đảm bảo xác hệ số hồi quy riêng phần, nghiên cứu thực chạy hồi quy lần Dương Thị Ngọc Diem_01/03/2001 Mơ hình hồi quy OLS điều chỉnh Kết thực việc học sử dụng cơng cụ hồi quy tuyến tính cho kết sau tập đánh giá Hình 4.3.2: Kết hồi quy OLS ban đầu Kết phân tích hồi quy tuyến tính theo phương pháp OLS cho thấy: - F-statistic = 24.31: kiểm định độ tin cậy mặt thống kê toàn phương trình hồi quy - Prob (F-statistic) = 0.000000000000516 < 0.05 → Mơ hình hồi quy tồn - R-squared = 0.681 > 0.5 • Hệ số xác định phản ánh mức độ giải thích biến độc lập biến • • • • phụ thuộc TSNCR mơ hình hồi quy 68.1% R-squared có ý nghĩa Prob(F-statistic) < 0.05 Mức giải thích mơ hình mức trung bình cao Đánh giá mơ hình phù hợp Trên sở phương trình hồi quy tuyến tính tồn với số cụ thể xác định bảng hệ số hồi quy riêng phần Dương Thị Ngọc Diem_01/03/2001 - Adj R-squared = 0.653: bổ sung độ xác độ tin cậy cách xem xét tác động biến độc lập bổ sung có xu hướng làm sai lệch kết phép đo R-squared Do đó: Adj R-squared < R-squared → Khi bỏ biến DT CSGSH khơng có ý nghĩa thống kê (P-value < 0.05) Adj R-squared tăng lên (0.653>0.647) biến có xu hướng làm sai lệch kết - F-statistic = 24.31: kiểm định độ tin cậy mặt thống kê tồn phương trình hồi quy - Prob (F-statistic) = 0.000000000000516 < 0.05 → Mơ hình hồi quy tồn - coef: • = -0.0178: tỉ lệ nghịch với TSNCR → Nếu DS tăng 1000(người) TSNCR • giảm 0,0178%, điều kiện yếu tố khác không đổi = 0.0083: tỉ lệ thuận với TSNCR → Nếu MDDS tăng người/km2 TSNCR tăng 0.0083%, điều kiện yếu tố khác khơng đổi • = 0.0336: tỉ lệ thuận với TSNCR → Nếu LLLD15 tăng 1000(người) TSNCR • tăng 0.0336%, điều kiện yếu tố khác không đổi = 1.8838: tỉ lệ thuận với TSNCR → Nếu TSST tăng 1% TSNCR tăng • 1.8838%, điều kiện yếu tố khác không đổi = 1.5864: tỉ lệ thuận với TSNCR → Nếu GRDPUSD tăng 1(USD) TSNCR tăng 1.5864%, điều kiện yếu tố khác không đổi → TSST GRDPUSD tác động mạnh đến TSNCR - Sai số chuẩn (stt err) biến khơng lớn → Mẫu có độ xác cao - khơng q lệch so với giá trị thực P-value (P > t) biến độc lập có cải thiện đáng kể sau bỏ biến độc lập CSGSH DT, tất biến có P-value = P-value ≈ Dương Thị Ngọc Diem_01/03/2001 Phương trình hồi quy tuyến tính ≈ TSNCR ≈ f(x) = +.+ ++ + = Dương Thị Ngọc Diem_01/03/2001 CHƯƠNG 5: THẢO LUẬN VÀ KẾT LUẬN Nghiên cứu tổng quát phần sở lý thuyết bao gồm kiến thức học máy trình bày tóm tắt cơng cụ học máy liên quan đến việc xây dựng mơ hình hồi quy tuyến tính thể tác động biến độc lập đến biến phụ thuộc để thể thực trạng dự báo dân số lao động Việt Nam Nghiên cứu trực quan hóa tồn liệu liên quan đến nghiên cứu cách áp dụng cơng cụ khác Nhóm thành cơng việc sử dụng công cụ học máy theo phương pháp hồi quy tuyến tính sử dụng OLS để giải thích mối liên hệ biến độc lập gồm DS, MDDS, LLLD15, TSST, GRDPUSD có tác động đến biến phụ thuộc TSNCR, cụ thể biến tác động chiều ngược chiều tác động có ý nghĩa thống kê Nghiên cứu có ý nghĩa mặt thống kê Dương Thị Ngọc Diem_01/03/2001 ... cứu: Dân số lao động Việt Nam Phạm vi nghiên cứu: - Phạm vi không gian: Dân số lao động tỉnh thành Việt Nam - Phạm vi thời gian: Báo cáo thu thập liệu năm 2021 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 2.1 Một số. .. lời Chính thế, nhóm chúng em định thực báo cáo " Thực trạng dân số lao động nước ta năm 2021" bao gồm số liệu cụ thể: Tên tỉnh thành, khu vực, dân số, mật độ dân số, tỷ suất nhập (xuất) cư, LLLĐ... phương (GRDPUSD), số giá sinh hoạt theo không gian + Số liệu đáng tin cậy + Thể tình hình dân số lao động nước ta - Nội dung: thể thực trạng dân số lực lượng lao động nước ta năm 2021 Dương Thị