Cách lọc số liệu

Một phần của tài liệu Các yếu tố tác động thu nhập của lao động khu vực kinh tế phi chính thức tại TPHCM năm 2014 (Trang 32)

Dựa vào phiếu điều tra lao động việc làm 2014, tác giả lọc số liệu như sau:

 Giới tính của người lao động: câu 3 trang 2

 Tuổi của người lao động: câu 5 trang 2

 Trình độ (số năm đi học) của người lao động: câu 15 trang 4

 Kinh nghiệm làm việc của người lao động: câu 34 trang 9

 Tình trạng hôn nhân của người lao động: câu 8 trang 3

 Dân tộc của người lao động: câu 6 trang 2

 Tình trạng di cư của người lao động: câu 9 trang 3

 Thành thị - nông thôn: định danh trang 1

 Giờ làm việc của người lao động: câu 41 trang 10

 Ngành kinh doanh: câu 25 kết hợp câu 22 trang 6

 Việc làm trước đây: câu 35 trang 9

 Quy mô hộ: định danh trang 1

 Địa điểm kinh doanh: câu 26 trang 7

 Có làm thêm việc: câu 45 trang 11

3.3.3. Phƣơng pháp xử lý d liệu nghiên cứu

Sau khi tiến hành khảo sát thu thập thông tin, các phiếu thu thập sẽ được kiểm tra về mức độ hoàn chỉnh thông tin. Những phiếu không đầy đủ thông tin sẽ bị loại bỏ. Bước tiếp theo là mã hoá dữ liệu, nhập và hiệu chỉnh dữ liệu trước khi tiến hành phân tích. Sau khi nhập hoàn tất dữ liệu, tiến hành kiểm tra ngẫu nhiên một số mẫu để đảm bảo việc nhập số liệu chính xác. Luận văn sử dụng phần mềm SPSS 22.0 để phân tích dữ liệu.

Luận văn áp dụng các kỹ thuật thống kê mô tả như: tần suất, tỉ lệ, trung bình cộng, giá trị lớn nhất, giá trị nhỏ nhất, các biểu đồ thống kê. Phân tích thống kê mô tả sẽ cung cấp các thông tin tổng quan về các mẫu nghiên cứu.

Phương pháp hồi quy tuyến tính bội sẽ được sử dụng trong việc nhận diện những yếu tố độc lập thực sự có ảnh hưởng, xác định mức độ ảnh hưởng và khẳng định tầm quan trọng của các yếu tố độc lập đến yếu tố phụ thuộc. Luận văn sử dụng phương pháp hồi quy Enter. Đây là phương pháp được lựa chọn phổ biến trong phân tích hồi quy tuyến tính.

3.4. Cách đánh giá độ phù hợp của mô hình

Đánh giá sự phù hợp của mô hình đối với dữ liệu thu thập nghiên cứu: Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), để đánh giá sự phù hợp của mô hình hồi quy đa biến với dữ liệu mẫu, sử dụng hệ số R Square hiệu chỉnh, hệ số này càng tiến đến giá trị gần 1.00 càng chứng tỏ sự phù hợp của mô hình.

 Hệ số R2 cho biết mức độ phù hợp của phương trình hồi quy, R2 có giá trị từ 0 đến 1, R2

càng lớn thì mô hình có khả năng giải thích càng mạnh.

 Ý nghĩa của R2 thể hiện đặc trưng cho % biến thiên của biến phụ thuộc được giải thích do sự biến thiên của biến độc lập. Khi hệ số biến độc lập đưa vào mô hình tăng lên thì hệ số R2 cũngtăng lên. Hệ số R2 điều chỉnh là hệ số đã hiệu chỉnh có kể đến số lượng các biến độc lập đưa vào mô hình. Như vậy R2 điều chỉnh phản ánh sát hơn mức độ phù hợp của mô hình hồi quy. R2 điều chỉnh không nhất thiết tăng lên khi đưa thêm biến độc lập vào mô hình, sử dụng nó để đánh giá độ phù hợp của mô hình sẽ an toàn hơn vì nó không làm gia tăng mức độ phù hợp của mô hình. Mức ý nghĩa của R2 hiệu chỉnh được kiểm định bằng phương pháp F-test.

Thực hiện các kiểm định xem mức độ phù hợp của mô hình:

 Kiểm định F – test: là phép kiểm định giả thuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể. Mục đích của kiểm định này là về mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập. Đặt giả thuyết H0: R2=0 có nghĩa là β1 =β2 =...=βk =...=βp=0 và khi giả thuyết H0 bị bác bỏ, điều này cũng có nghĩa là mô hình ta xây dựng phù hợp với dữ liệu.

 Kiểm định T- test: để kiểm định mức ý nghĩa của hệ số β đây là thông số Sig trong bảng Coefficients, thông thường các nghiên cứu sẽ mặc định chọn mức ý nghĩa 95% tức là các hệ số β có Sig <0,05 thì mới có ý nghĩa về mặt thống kê.

 Kiểm định quan hệ tuyến tính bằng đồ thị Scatterplot: Nếu các điểm phần dư phân tán ngẫu nhiên trong vùng xung quanh đường tung độ bằng 0 và thay đổi không theo trật tự nào (không theo hình dáng nào) giả định tuyến tính được thỏa mãn.

 Kiểm định phần dư có phân phối chuẩn: xây dựng biểu đồ phân tán của phần dư. xem xét biểu đồ Norman Probability Plot của phần dư.

 Kiểm định phương sai đồng nhất: đo lường mức độ phân tán của phần dư (e) xung quanh giá trị trung bình 0, phương sai của độ sai số không đổi có nghĩa mức độ

phân tán như nhau cho tất cả quan sát. Nếu phương sai của độ sai số thay đổi ảnh hưởng đến tính hiệu quả của ước lượng. (adsbygoogle = window.adsbygoogle || []).push({});

Tóm tắt chƣơng 3

Chương 3 đã trình bày mô hình nghiên cứu, kỳ vọng dấu và giải thích ý nghĩa của từng biến. Bên cạnh đó, tác giả trình bày cách lấy mẫu, xử lý và quy trình nghiên cứu. Chương 4 tiếp theo sẽ trình bày kết quả nghiên cứu phân tích từng thông tin thống kê của các số liệu thu thập được.

CHƢƠNG 4

KẾT QUẢ NGHIÊN CỨU

Nội dung chính của chương 4 tr nh bày về kết quả nghiên cứu. Trình tự trình bày từ thống kê mô tả đến kết quả hồi quy tuyến t nh. Đồng th i, chương 4 cũng tr nh bày các kiể đ nh về độ phù hợp của mô hình, hiện tượng đa cộng tuyến, ph n dư của mô hình.

4.1. Kết quả thống kê mô tả 4.1.1. Mô tả mẫu 4.1.1. Mô tả mẫu

Nghiên cứu sử dụng bộ số liệu điều tra lao động việc làm năm 2014 tại Tp. Hồ Chí Minh. Bộ số liệu được thu thập từ cuộc điều tra gồm 11.340 hộ gia đình trên cả nước với tổng cộng 41.424 nhân khẩu. Các hộ có từ 1 đến 15 thành viên, chỉ lọc các thành viên có làm việc trong khu vực kinh tế phi chính thức. Sử dụng mô hình các yếu tố ảnh hưởng đến thu nhập của người lao động thì điều kiện lọc ít hơn, chỉ sử dụng một điều kiện lọc: Các cá nhân có mức thu nhập lớn hơn 0 (câu 38 + câu 40 + câu 59 + câu 60 > 0). Số quan sát là 1.575.

4.1.2. Các biến liên quan đến lao động

Hình 4.1: Nhóm tuổi của lao động

Tuổi của người lao động trong mẫu điều tra tập trung trong độ tuổi từ 30 – 45 tuổi có 747 người chiếm 47,4%. Đây là nhóm tuổi trung niên, những người còn khả năng lao động và rất cần công việc để ổn định gia đình, họ có xu hướng tự kinh doanh,

làm nghề tự do nhiều hơn. Nhóm tuổi phổ biến thứ 2 là dưới 30 tuổi, có 426 người chiếm 27%, nhóm tuổi này rất trẻ có tính linh hoạt cao nên việc nhảy việc và tìm thêm việc là rất lớn (xem hình 4.1 hoặc bảng 1, phụ lục đính kèm). Nhóm tuổi còn lại từ 45 – 60 tuổi cũng chiếm phần lớn trong mẫu điều tra, với 373 người chiếm 23,7% hay đã qua độ tuổi lao động trên 60 tuổi chiếm tỷ lệ 1,8 %. Điều này cho thấy, mọi độ tuổi đều có nhu cầu tìm việc trong khu vực kinh tế phi chính thức.

Hình 4.2: Giới tính của lao động

Giới tính người lao động rất được quan tâm vì có ảnh hưởng đến thu nhập của người lao động. Trong nghiên cứu này, mẫu nghiên cứu có 1.575 người thì đã có đến 1.056 người lao động là nam giới, chiếm 67% mẫu nghiên cứu. Lao động là nữ giới có 519 người, chiếm 33% mẫu nghiên cứu. Kết quả này cho thấy, người lao động nam trong khu vực kinh tế phi chính thức chiếm tỷ lệ gấp đôi lao động nữ.

Trình độ học vấn của người người lao động cho biết khả năng nhận thức vấn đề của người lao động. Trong mẫu nghiên cứu, người lao động có trình độ học vấn không cao, trong đó không đi học chiếm 2,5%, tỷ lệ không nhiều nhưng vẫn có người không biết đọc không biết viết, trình độ phổ biến nhất trong mẫu nghiên cứu là học hết tiểu học là 573 người chiếm 36,4%, trình độ cao nhất chỉ là cao đẳng là 11 người chiếm 0,7% mẫu nghiên cứu. Như vậy, trình độ học vấn của lao động khu vực kinh tế phi chính thức có hạn chế, phần nào ảnh hưởng đến khả năng thu nhập của người lao động.

Hình 4.3: Số năm đi học của lao động

Năm đi học Số lượng

(người) % Không đi học 39 2,5 3 năm 276 17,5 5 năm 573 36,4 9 năm 421 26,7 12 năm 155 9,8 13 năm 72 4,6 14 năm 18 1,1 15 năm 7 0,4 17 năm 11 0,7 Tổng 1.575 99,8 Nhỡ 3 0,2 Tổng cộng 1.575 100,0

Hình 4.4: Tình trạng hôn nhân của lao động

Hôn nhân có ít nhiều ảnh hưởng đến kinh tế của người lao động. Thông thường, những người có gia đình sẽ chịu áp lực về kinh tế nhiều hơn những người độc thân. Những người tự kinh doanh, làm nghề tự do,… thường là những người trung niên, chú trọng phát triển kinh tế gia đình. Trong mẫu nghiên cứu, 1046 người cho biết mình đã có gia đình, chiếm 66%; còn lại 34% là các trường hợp khác như: độc thân, ly dị….

Kết quả này là phù hợp cho thấy, gia đình chính là động lực để người lao động tìm thêm thu nhập.

Hình 4.5: Dân tộc của lao động

Hầu hết người lao động trong khu vực kinh tế phi chính thức đa phần là người dân tộc Kinh có 1.508 người chiếm 96%, dân tộc khác chiếm 4%. Kết quả này cho thấy người lao động dân tộc Kinh hoạt động mạnh trong khu vực kinh tế phi chính thức vì dân tộc Kinh là dân tộc chiếm đa số trong xã hội.

Hình 4.6: Tình trạng di cư của lao động

Khác ; 1560 Dưới 6 tháng; 15 0 500 1000 1500 2000 Khác Dưới 6 tháng

Theo kết quả nghiên cứu có 15 người có di cư vào TPHCM dưới 6 tháng chiếm 1%, trong khi đó có 1.560 người thuộc các nhóm di cư khác chiếm 99%, chứng tỏ làm việc khu vực kinh tế phi chính thức không phải là mục đích cuối cùng của những người dân nhập cư vào thành phố. Thành phố Hồ Chí Minh là trung tâm kinh tế văn

hóa và giáo dục của cả nước, với nhiều tập đoàn kinh tế, công ty lớn và nhiều trường đại học uy tín, vì vậy sẽ thu hút nhiều học sinh, sinh viên, lao động đến làm việc và đi học.

Hình 4.7: Kinh nghiệm của lao động

Trong 1.575 người ở mẫu nghiên cứu thì đa phần người lao động có kinh nghiệm (đi làm trên 1 năm) là 1.426 người chiếm 91%, người lao động không có kinh nghiệm chiếm 9% trong mẫu nghiên cứu. Điều này chứng tỏ thâm niên của người lao động hoạt động trong khu vực kinh tế phi chính thức rất cao vì phần đông độ tuổi của người lao động trong khu vực này từ trung niên trở lên.

4.1.3. Các biến hộ gia đình của ngƣời lao động

Hình 4.8: Quy mô hộ gia đình (adsbygoogle = window.adsbygoogle || []).push({});

Theo kết quả mẫu nghiên cứu, quy mô hộ gia đình của người lao động tập trung khoảng 4 người (thông thường là gia đình 2 thế hệ), có 489 người cho biết hộ gia đình

họ có 4 thành viên, kế tiếp là gia đình có 3 thành viên. Mức độ phổ biến trong mẫu nghiên cứu là gia đình có từ 3 đến 6 thành viên. Đây là dạng gia đình phổ biến trong xã hội hiện nay. Số người trong hộ có ảnh hưởng đến thu nhập của hộ gia đình vì có ảnh hưởng đến số lượng lao động trong hộ.

Hình 4.9: Thành thị - nông thôn của hộ gia đình

Vị trí địa lý có thể ảnh hưởng đến điều kiện sống, sinh hoạt, đi lại, tiếp cận thông tin của người lao động… Theo kết quả khảo sát, người lao động khu vực nông thôn chiếm 66% mẫu nghiên cứu và người lao động khu vực thành thị chỉ chiếm 34% mẫu nghiên cứu. Kết quả này cho thấy, người lao đông khu vực kinh tế phi chính thức tập trung phần đông ở nông thôn.

Đa phần trong mẫu nghiên cứu này người lao động tập trung vào ngành nghề khác là 1.016 người, chiếm 65% mẫu nghiên cứu, vì đa phần người lao động tập trung ở vùng nông thôn nên không thể tham gia làm việc tại các khu công nghiệp nên phần đông chỉ làm ngành nghề khác, ngành công nghiệp chỉ chiếm 35% trong mẫu nghiên cứu.

4.1.4. Các biến liên quan đến thu nhập của ngƣời lao động

Hình 4.11: Việc làm trước đây ảnh hưởng đến thu nhập của người lao động

Việc làm trước đây 1509 96% Không làm việc trước đây 66 4%

Theo kết quả nghiên cứu người lao động có việc làm trước đây là 1.509 người chiếm 96% trong mẫu nghiên cứu, trước đây chưa từng đi làm chỉ chiếm 4%, 66 người. Đều này phù hợp với biến kinh nghiệm của người lao động là đa số người lao động trong khu vực kinh tế phi chính thức ở độ tuổi từ trung niên trở lên nên phần đông là người lao động đều có kinh nghiệm và những việc làm trước đây.

Người lao động ở khu vực kinh tế phi chính thức bắt buộc phải tìm thêm việc làm thì thu nhập của người lao động mới có khả năng tăng, vì theo kết quả nghiên cứu ở 1.575 mẫu nghiên cứu cho thấy đã có 1.557 người lao động có làm thêm việc chiếm 99% trong mẫu nghiên cứu. Điều này càng chứng tỏ thêm việc làm thứ nhất của người lao động trong khu vực không đủ thu nhập để nuôi gia đình.

4.2. Kết quả phân tích tƣơng quan

Bảng 4.2: Kết quả hệ số tương quan

Biến

Tương quan Thống kê đa cộng tuyến Riêng Chung Hệ số

Tolerance Hệ số VIF

Giới tính 0,368 0,321 0,799 1,252

Tuổi 0,006 0,005 0,818 1,223

Trình độ (số năm đi học) 0,168 0,139 0,913 1,095

Kinh nghiệm làm việc 0,169 0,139 0,550 1,817

Tình trạng hôn nhân 0,084 0,068 0,872 1,147 Dân tộc 0,020 0,016 0,941 1,063 Di cư 0,062 0,050 0,967 1,034 Thành thị - nông thôn 0,087 0,071 0,842 1,188 Giờ làm việc 0,230 0,192 0,974 1,027 Ngành kinh doanh 0,169 0,139 0,785 1,273

Việc làm trước đây 0,052 0,042 0,571 1,753

Quy mô hộ -0,042 -0,035 0,950 1,053

Địa điểm kinh doanh -0,081 -0,066 0,920 1,087

Làm thêm việc -0,112 -0,100 0,975 1,025

Trước khi tiến hành phân tích hồi quy tuyến tính cần thực hiện phân tích mối tương quan giữa các biến. Dùng ma trận hệ số tương quan xem xét mối tương quan giữa các biến độc lập với nhau thông qua hệ số Pearson Correlation của bảng Correlation. Điều cần chú ý trong bước này là hệ số tương quan giữa các biến độc lập với nhau nếu có tương quan chặt chẽ (hệ số Pearson Correlation đạt giá trị lớn hơn 1) là dấu hiệu cho thấy có thể xảy ra hiện tượng đa cộng tuyến. Bên cạnh đó, các nhà nghiên cứu sử dụng VIF < 10 để kiểm tra hiện tượng đa cộng tuyến. Đồng thời, các

biến trong mô hình có hệ số VIF nhỏ hơn 5 (1≤ VIF≤ 5) nên có thể kết luận, các biến trong mô hình không có hiện tượng đa cộng tuyến giữa các biến trong mô hình.

Mô hình nghiên cứu gồm 14 biến độc lập, 1 biến phụ thuộc – thu nhập của lao động, trong đó có 12 biến có ý nghĩa thông kê, nghĩa là có 12 biến độc lập có tác động đến biến phụ thuộc. Trong 12 biến đó, 9 biến có hệ số hồi quy mang dấu dương và 3 biến mang dấu âm.

Có 9 biến độc lập có mức ý nghĩa 1% là: - Giới tính người lao động (β = 0,303)

- Trình độ học vấn (số năm đi học) người lao động (β = 0,016) - Thời gian làm việc (β = 0,253)

- Tình trạng hôn nhân (β = 0,061) - Thành thị - nông thôn (β = 0,064) (adsbygoogle = window.adsbygoogle || []).push({});

- Số giờ làm việc trong 1 tuần (β = 0,008) - Ngành kinh doanh (β = 0,130)

- Địa điểm kinh doanh (β = -0,091) - Có làm thêm việc (β = -0,375) Có 2 biến độc lập có mức ý nghĩa 5% là:

- Di cư (β = 0,207)

- Việc làm trước (β = 0,110)

Có 1 biến độc lập có mức ý nghĩa 10% là:

- Quy mô hộ gia đình của người lao động (β = -0,008)

Một phần của tài liệu Các yếu tố tác động thu nhập của lao động khu vực kinh tế phi chính thức tại TPHCM năm 2014 (Trang 32)