Bảng kết quả kiểm tra tính đầy đủ các biến độc lập của mơ hình

Một phần của tài liệu (LUẬN văn THẠC sĩ) yếu tố ảnh hưởng đến quyết định thành lập doanh nghiệp của các hộ kinh doanh ngành dừa tỉnh bến tre (Trang 56)

Bảng 4.2 cho thấy biến _hat có ý nghĩa thống kê (p<0.01) và biến _hatsq khơng có ý nghĩa thống kê (p=0.348) hay kiểm định linktest khơng có ý nghĩa thống kê. Từ đó cho thấy các biến số đưa vào hồi quy trong mơ hình trình bày trong bảng 4.1 đã đầy đủ và phù hợp.

Kiểm định mức độ phù hợp của mơ hình (goodness of fit), tác giả tiến hành với lệnh lfit trong stata 11. Kết quả p = 0.986, như vậy kiểm định Hosmer Lemeshow cho biết giá trị tiên đốn từ mơ hình phù hợp với giá trị quan sát.

Bước tiếp theo, tác giả tiến hành xem xét ma trận hệ số tương quan để có thể xác định vấn đề đa cộng tuyến. Theo kinh nghiệm của các chuyên gia, hệ số tương quan nhỏ hơn 0,3 là tương quan yếu, từ 0,3 đến 0,7 là tương quan khá và lớn hơn 0,7 là tương quan mạnh. Trong luận văn này, tác giả xem xét hệ số tương quan giữa các biến độc lập ở mức từ 0,3 trở lên để xác định vấn đề đa cộng tuyến.

| laodong tuoi knghiem dthu taisan vondautu qhdn thaido1 chmuc1 -------------+--------------------------------------------------------------------------------- laodong | 1.0000 tuoi | 0.2698 1.0000 knghiem | 0.2419 0.2968 1.0000 dthu | 0.5951 0.1885 0.1410 1.0000 taisan | 0.6213 0.1364 0.2866 0.7106 1.0000 vondautu | 0.2829 0.1086 0.2479 0.1627 0.5269 1.0000 qhdn | 0.2682 0.1267 0.1448 0.3568 0.2929 0.0909 1.0000 thaido1 | 0.1902 -0.0060 -0.0004 0.1188 0.1332 0.1681 0.0655 1.0000 chmuc1 | 0.0794 0.0256 -0.0378 0.0072 -0.0240 0.0467 0.1228 0.1081 1.0000 chmuc2 | -0.0288 0.0633 0.1211 -0.0402 0.0202 0.0844 -0.0430 0.0078 0.0231 tuchu2 | 0.2177 -0.0061 -0.1091 0.1245 0.1120 0.2271 0.1138 0.2344 0.1465 theche1 | 0.1504 0.2008 0.1268 0.1367 0.1315 0.1630 0.0922 0.0622 0.0410 hocvan2 | -0.0826 -0.1084 0.0260 0.0490 0.0680 -0.0449 -0.0078 0.0184 0.0366 sp3 | -0.0447 -0.0049 -0.0346 -0.0489 -0.0716 -0.0741 -0.0699 0.0126 -0.0006 sp4 | -0.0857 0.1131 0.0480 -0.1483 -0.1562 0.0752 0.0625 0.0659 0.1723 sp1 | 0.0988 -0.0715 -0.0408 0.0051 0.0675 -0.1144 -0.0479 -0.1482 -0.1611

| chmuc2 tuchu2 theche1 hocvan2 sp3 sp4 sp1 -------------+--------------------------------------------------------------- chmuc2 | 1.0000 tuchu2 | -0.0573 1.0000 theche1 | 0.0613 0.0260 1.0000 hocvan2 | -0.0079 -0.1668 -0.0418 1.0000 sp3 | -0.1649 0.0886 -0.0868 -0.0041 1.0000 sp4 | -0.1019 0.0508 0.2700 -0.0721 -0.2642 1.0000 sp1 | 0.0121 -0.1233 -0.1854 0.0232 -0.3320 -0.4160 1.0000 Bảng 4.3. Ma trận hệ số tương quan

Từ bảng 4.3 ta thấy có các mối tương quan cụ thể là: giữa biến dthu với laodong, taisan và qhdn; giữa biến taisan với laodong, dthu và vondautu; và giữa sp1 với sp3 và sp4. Có 8 biến tương quan lẫn nhau bao gồm: laodong, dthu, taisan, vondautu, qhdn, sp1, sp3 và và sp4.

Để xử lý vấn đề này, tác giả dùng phương pháp thử và sai để loại bỏ các biến ra khỏi mơ hình. Trước tiên, tiến hành (1) loại bỏ biến laodong thì cả 2 biến dthu và taisan đều khơng có ý nghĩa thống kê, tổng cộng phải loại bỏ 3 biến; (2) loại bỏ biến dthu thì biến taisan khơng có ý nghĩa thống kê, tổng cộng phải loại bỏ 2 biến; (3) loại bỏ biến taisan thì biến dthu khơng có ý nghĩa thống kê, tổng cộng phải loại bỏ 2 biến; (4) loại bỏ biến vondautu tất cả đều có ý nghĩa thống kê, tổng cộng phải loại bỏ 1 biến; (5) loại bỏ biến qhdn thì biến dthu khơng có ý nghĩa thống kê, tổng cộng phải loại bỏ 2 biến; (6) loại bỏ biến sp1 thì biến dthu, taisan, chmuc2, hocvan2, sp3 và sp4 khơng có ý nghĩa thống kê, tổng cộng phải loại bỏ 7 biến; (7) loại bỏ biến sp3 thì biến dthu và sp4 khơng có ý nghĩa thống kê, tổng cộng phải loại bỏ 3 biến; (8) loại bỏ biến sp4 thì biến dthu và taisan và chmuc2 khơng có ý nghĩa thống kê, tổng cộng phải loại bỏ 4 biến.

PA Biến loại bỏ Biến khơng có ý nghĩa thống kê trong mơ hình mới Tổng số biến phải loại bỏ

1 laodong dthu và taisan 3

2 dthu taisan 2

3 taisan dthu 2

4 vondautu - 1

5 qhdn dthu 2

6 sp1 dthu, taisan, chmuc2, hocvan2, sp3

và sp4

7

7 sp3 dthu, taisan và sp4 4

8 sp4 dthu, taisan và chmuc2 4

Từ kết quả thống kê các phương án loại bỏ biến số trình bày trong bảng 4.4 cho thấy giải pháp tối ưu là loại bỏ cả 2 biến dthu và taisan, kết quả có 14 biến có ý nghĩa thống kê ở mức 10%. Tiếp tục kiểm tra ma trận hệ số tương quan, cho thấy vẫn còn mối tương quan giữa biến sp1 với sp3 và sp4. Tác giả tiếp tục dùng phương pháp thử và sai để loại bỏ các biến số như trên. Kết quả được tóm tắt trong bảng 4.5.

PA Biến loại bỏ Biến khơng có ý nghĩa thống kê trong mơ hình mới Tổng số biến phải loại bỏ

1 sp1 chmuc2, hocvan2 và sp4 4 2 sp3 chmuc2, hocvan2 và sp4 4 3 sp4 chmuc2 2 4 sp1 và sp3 chmuc2, hocvan2 và sp4 4 5 sp1 và sp4 chmuc2, hocvan2 và sp3 5 6 sp3 và sp4 chmuc2, hocvan2 và sp1 5 7 sp1, sp3 và sp4 chmuc2, hocvan2 5

Bảng 4.5. Bảng kết quả thống kê các phương án loại bỏ biến số lần 2

Từ kết quả thống kê các phương án loại bỏ biến số trong bảng 4.5, tác giả chọn phương án 3 để loại bỏ sp4 và chmuc2. Ma trận hệ số tương quan sau khi thực hiện phương án này cho thấy vẫn còn tương quan giữa sp1 và sp3. Sau khi tiếp tục loại bỏ sp3, kết quả hồi quy lần lượt xuất hiện biến hocvan2 và tuoi khơng có ý nghĩa thống kê. Sau khi loại biến hocvan2 và tuoi ra khỏi mơ hình, tất cả các hệ số hồi quy đều có ý nghĩa thống kê ở mức 5% và ma trận hệ số tương quan cho thấy khơng có sự tương quan khá hay mạnh giữa các biến độc lập, kết quả được trình bày trong bảng 4.6 và bảng 4.7.

------------------------------------------------------------------------------ Biến số | Hệ số Sai số Thống Mức ý Khoảng tin cậy 95% độc lập | chuẩn kê nghĩa

-------------+---------------------------------------------------------------- laodong | .0412255 .013816 2.98 0.003 .0141467 .0683044 knghiem | -.3019928 .0819362 -3.69 0.000 -.4625848 -.1414009 vondautu | .4634878 .1526101 3.04 0.002 .1643775 .7625981 qhdn | .028055 .0078749 3.56 0.000 .0126205 .0434895 thaido1 | .8754729 .3206253 2.73 0.006 .247059 1.503887 chmuc1 | 1.101476 .3272208 3.37 0.001 .4601352 1.742817 tuchu2 | 1.673116 .4451314 3.76 0.000 .8006742 2.545557 theche1 | .5322765 .2182238 2.44 0.015 .1045658 .9599872 sp1 | -1.038508 .5274625 -1.97 0.049 -2.072316 -.0047008 _cons | -17.09752 3.293064 -5.19 0.000 -23.5518 -10.64323 ------------------------------------------------------------------------------

| laodong knghiem vondautu qhdn thaido1 chmuc1 tuchu2 theche1 sp1 -------------+--------------------------------------------------------------------------------- laodong | 1.0000 knghiem | 0.2477 1.0000 vondautu | 0.2756 0.2417 1.0000 qhdn | 0.2729 0.1566 0.0801 1.0000 thaido1 | 0.1998 0.0030 0.1618 0.0683 1.0000 chmuc1 | 0.0756 -0.0760 0.0464 0.0996 0.1165 1.0000 tuchu2 | 0.2164 -0.1051 0.2262 0.1122 0.2326 0.1430 1.0000 theche1 | 0.1502 0.1063 0.1577 0.0948 0.0663 0.0521 0.0259 1.0000 sp1 | 0.0919 -0.0444 -0.1064 -0.0574 -0.1496 -0.1472 -0.1228 -0.1844 1.0000

Bảng 4.7. Bảng ma trận hệ số tương quan (được chấp nhận)

Công việc được lập lại với việc kiểm tra tính đầy đủ các biến độc lập của mơ hình và kiểm định mức độ phù hợp của mơ hình (goodness of fit). Kết quả được trình bày trong bảng 4.8.

------------------------------------------------------------------------------ Biến số | Hệ số Sai số Thống Mức ý Khoảng tin cậy 95% | chuẩn kê nghĩa

-------------+---------------------------------------------------------------- _hat | 1.031137 .1551699 6.65 0.000 .7270099 1.335265 _hatsq | -.0264555 .0241154 -1.10 0.273 -.0737209 .0208099 _cons | .0672565 .2509962 0.27 0.789 -.4246871 .5592001 ------------------------------------------------------------------------------

Bảng 4.8. Kiểm tra tính đầy đủ các biến độc lập (lần 2)

Bảng 4.8 cho thấy biến _hat có ý nghĩa thống kê (p<0,01) và biến _hatsq khơng có ý nghĩa thống kê (p=0,273) hay kiểm định linktest khơng có ý nghĩa thống kê. Từ đó cho thấy các biến số đưa vào hồi quy trong mơ hình trình bày trong bảng 4.7 đã đầy đủ và phù hợp.

Tiếp tục tiến hành kiểm định mức độ phù hợp của mơ hình (goodness of fit), kết quả p = 0,815, như vậy kiểm định Hosmer Lemeshow cho biết giá trị tiên đoán từ mơ hình phù hợp với giá trị quan sát.

Mơ hình cụ thể được trình bày trong phương trình 4.2 như sau:

Ln[p/(1-p)] = ln(odds) = -17,097 + 0,041*laodong – 0,302*knghiem + 0,463*vondautu + 0,028*qhdn + 0,875*thaido1 + 1,101*chmuc1 + 1,673*tuchu2 +

0,532*theche1 – 1,038*sp1 (4.2)

Phương trình trên cho thấy khả năng điều hành thực hiện các thủ tục thuế của DN đúng theo quy định của pháp luật (biến tuchu2) có ảnh hưởng lớn nhất đối với quyết định thành lập DN. Có 8/9 hệ số hồi quy có dấu đúng theo kỳ vọng ban đầu, trong

đó chỉ có biến knghiem là ngược dấu kỳ vọng, mang dấu (-). Tác giả kỳ vọng biến knghiem mang dấu dương (+) mang ý nghĩa hi vọng người chủ HKD có kinh nghiệm càng nhiều thì xác suất ra quyết định thành lập DN càng cao, với lập luận rằng người có nhiều kinh nghiệm sẽ điều hành DN tốt hơn, từ đó đem lại lợi nhuận nhiều hơn. Tuy nhiên, kết quả hồi quy cho thấy điều ngược lại là người chủ HKD có kinh nghiệm càng nhiều thì xác suất ra quyết định thành lập DN càng thấp. Như đã phân tích ở phần thống kê mô tả (1) ở mục 4.1 cho thấy, sau khoản thời gian thành lập trung bình từ 5 đến 6 năm thì HKD có xu hướng chuyển thành DN, nếu vượt qua thời gian này thì HKD có xu hướng khơng thành lập DN và (2) ở mục 4.19, lý do mà các HKD không thành lập DN xuất hiện với tần suất khá cao là “ngại thay đổi hay quen cách làm từ trước đến nay” với 26 lựa chọn. Qua đó, có thể thấy rằng HKD càng tích lũy được nhiều kinh nghiệm thì đồng thời với q trình này họ cũng tích lũy thói quen làm việc ở loại hình HKD. Kết hợp với tâm lý ngại thay đổi vốn có, kết quả là càng nhiều năm làm việc thì họ càng khó thay đổi. Điều này lý giải cho hệ số hồi quy của biến knghiem có dấu âm (-) trong mơ hình trên.

Với lệnh estat class trong stata cho thấy xác suất dự đốn đúng của mơ hình này là 89,76% (xem phụ lục 5).

4.2.2. Xem xét ảnh hưởng của đối tượng nghiên cứu

Sau đây tác giả tiến hành một số biện pháp để phát hiện các đối tượng trong mẫu nghiên cứu có ảnh hưởng đáng kể đến mơ hình. Lý do để làm việc này là xem q trình nhập liệu có sai hay khơng, hoặc qua đó có thể đem lại thêm những thơng tin từ các đối tượng này.

Trước tiên là thông số phần dư Pearson và phần dư Pearson chuẩn hóa, là sự khác biệt được chuẩn hóa giữa giá trị quan sát (giá trị được thu thập trong thực tế) và giá trị dự đốn (giá trị được tính từ cơng thức với các hệ số của mơ hình). Thơng số này đo lường độ lệch tương đối giữa giá trị quan sát và giá trị dự đốn từ mơ hình. Thứ hai là độ lệch phần dư, đo lường sự khác nhau giữa tối đa các giá trị quan sát và hàm logarit xác suất của giá trị dự đoán. Do hàm logarit dựa trên nguyên tắc tối đa

hóa xác suất nên mong muốn trong hồi quy logistic là giảm tối thiểu tổng độ lệch phần dư. Thứ ba là thông số đường chéo mũ (hat diagonal) còn được gọi là ảnh hưởng địn bẩy Pregibon (Pregibon leverage), vì nó là đường chéo của ma trận mũ (hat matrix) đo lường ảnh hưởng của các đối tượng nghiên cứu. Ma trận này vẽ vectơ các giá trị quan sát với các giá trị dự đoán cho biết ảnh hưởng của mỗi giá trị quan sát lên mỗi giá trị dự đoán. Những đường chéo trong ma trận này là các đòn bẩy cho biết ảnh hưởng của mỗi giá trị quan sát lên giá trị tiên đoán của cùng một đối tượng.

Từ các hình 4.5, 4.6, 4.7 và 4.8 cho thấy có khá nhiều đối tượng có phần dư chuẩn hóa Pearson và độ lệch phần dư nằm tách rời so với các đối tượng khác. Ví dụ như các đối tượng có số thứ tự là 164, 39, 133, 103, các đối tượng này có giá trị tiên đốn rất thấp; hay các đối tượng có số thứ tự 86, 122, 30 có giá trị tiên đoán rất cao. Tuy vậy, các đối tượng này khơng có ảnh hưởng địn bẩy Pregibon (xem hình 4.9 và 4.10). 1 2 3 5 6 7 8 9 10 11

Một phần của tài liệu (LUẬN văn THẠC sĩ) yếu tố ảnh hưởng đến quyết định thành lập doanh nghiệp của các hộ kinh doanh ngành dừa tỉnh bến tre (Trang 56)

Tải bản đầy đủ (PDF)

(110 trang)