Mối quan hệ giữa các biến

Một phần của tài liệu Luận văn thạc sĩ Mức độ tuân thủ quy định môi trường của các doanh nghiệp vừa và nhỏ tại TP. Hồ Chí Minh (Trang 72)

4.3.1.Tƣơng quan đơn

Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008), để lƣợng hóa mối quan hệ chặt chẽ của mối quan hệ tuyến tính giữa hai biến định lƣợng ta sử dụng hệ số tƣơng quan Pearson (r). Trị tuyệt đối của r cho biết mức độ chặt chẽ của mối quan hệ tuyến tính, càng tiến gần về 1 thì quan hệ này càng mạnh và càng tiến gần về 0 thì quan hệ này càng yếu. <0,3: tƣơng quan ở mức thấp; 0,3≤ <0,5: tƣơng quan ở mức trung bình; 0,5≤ <0,7: tƣơng quan khá chặt chẽ; 0,7≤ <0,9: tƣơng quan chặt chẽ; ≥0,9: tƣơng quan rất chặt chẽ. Tuy nhiên, hệ số tƣơng quan này chỉ cho ta một số nhận định ban đầu, không đi đến kết luận nào. Vì trong một số trƣờng hợp mặc dù hai biến có quan hệ chặt chẽ với nhau nhƣng hệ số tƣơng quan vẫn gần 0 nếu nhƣ dạng của mối quan hệ này là phi tuyến. Và hệ số tƣơng quan này không phải lúc nào cũng nói lên mối quan hệ nhân quả. Để biết hai biến thực sự có mối quan hệ nhân quả hay không chúng ta cần phải chạy mô hình hồi quy phức tạp hơn.

Bảng 4.14. Hệ số tƣơng quan đơn giữa các biến 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 1 C 1 2 Scale ,277** 1 3 L_Limited 0,094 ,439** 1 4 L_Joint ,134** ,231** -,112* 1 5 S_Paper 0,005 0,06 0,006 -0,036 1 6 S_TextApp -,139** ,217** ,194** -0,076 -,125* 1 7 S_Elec -0,027 -0,039 0,076 -0,041 -0,068 -,146** 1 8 S_PubPrint -0,031 -0,026 0,035 -0,045 -0,075 -,160** -0,087 1 9 S_Rubber ,130* 0,044 0,026 -0,008 -0,1 -,213** -,116* -,127* 1 10 S_FabMetal -,186** -,153** -,111* -0,068 -,112* -,240** -,131* -,143** -,191** 1 11 S_FoodBev ,153** -,193** -,155** ,154** -,122* -,261** -,143** -,156** -,208** -,234** 1 12 Age ,160** 0,036 -,175** 0,056 0,052 -,181** -0,021 -0,079 0,098 0,05 0,033 1 13 NewEquip 0,094 0,086 ,117* 0,035 -,105* ,166** -0,085 -0,026 -,147** -0,06 ,136** -,264** 1 14 Edu_Own 0,048 ,392** ,396** 0,082 0,002 ,170** 0,05 0,1 -0,072 -0,06 -,133** -,238** ,165** 1 15 Know_EnvLaw ,267** ,251** ,208** 0,095 ,122* -0,09 0,087 0,016 0,021 -,109* 0,002 -0,012 ,101* ,228** 1 16 Profit -0,013 0,064 -0,003 0,088 0,039 -0,095 -0,024 -0,088 -0,052 ,101* 0,064 -0,049 -0,006 0,007 -0,034 1 17 Invest 0,028 ,113* ,113* -0,023 -0,032 0,073 -0,03 ,105* 0,039 -0,034 -0,086 0 -0,033 0,093 0,079 -0,083 1 18 Export ,150** ,373** ,170** ,304** -0,055 ,140** -0,043 -0,068 -0,047 -,115* 0,051 0,044 0,052 ,128* ,119* 0,093 -0,04 1 19 Ex_OECD ,241** ,374** ,163** ,312** 0 0,067 -0,063 0,019 0,014 -0,071 -0,02 0,033 0,039 ,129* 0,041 0,044 -0,012 ,624** 1 20 Sal_Cons 0,017 -,188** -0,082 -0,052 -,107* -0,088 0,03 0,042 -,150** -0,073 ,330** -0,085 0,098 -0,05 -0,018 0,07 -0,061 -0,066 -0,051 1 21 Inspect_Past ,245** ,114* ,101* ,125* -0,008 -0,012 -0,024 -0,075 0,064 -0,022 0,078 0,002 0,065 ,136** ,191** -0,031 -0,017 ,101* ,163** -0,014 1 22 Inspect_Pre ,220** ,284** ,128* ,193** 0,027 -0,089 0,011 -0,053 0,063 0,002 0,069 -0,012 ,143** ,137** ,234** 0,002 -0,037 ,114* ,183** 0,013 ,302** 1 23 Bride_Freq ,177** ,142** 0 ,157** -0,017 -0,024 -,128* 0,033 ,124* 0,005 -0,066 0,095 -0,024 0,047 0,014 ,122* -0,05 ,198** ,196** -0,06 -0,033 -0,062 1 24 Net_Gov -0,058 0,09 0,012 0,025 -,110* ,106* -0,07 -0,028 0,087 -0,062 0 -0,063 -0,014 0,074 0,077 -0,092 0,087 0,013 0,06 0,037 -0,047 0,022 ,110* 1 Nguồn dữ liệu: Kết quả tính toán hệ số tƣơng quan Pearson.

Ghi chú: **: tƣơng quan có ý nghĩa ở mức 1% (2-tailed); *: tƣơng quan có ý nghĩa ở mức 5% (2-tailed).

Ma trận tƣơng quan Pearson trên cho thấy với 24 biến (bao gồm cả biến độc lập và phụ thuộc), sẽ tạo ra (24+1)x24/2=300 cặp quan hệ, trong đó có 106 cặp quan hệ có ý nghĩa thống kê ở mức 5%. Hầu hết giá trị tuyệt đối của r có giá trị nhỏ hơn 0,3, tức là tƣơng quan thấp. Cặp quan hệ có cho giá trị cao nhất (giữa xuất khẩu và xuất khẩu trực tiếp) cũng chỉ có giá trị 0,624. Do đó, chúng tôi kỳ vọng không có hiện tƣợng đa cộng tuyến diễn ra trong mô hình với bộ dữ liệu này. Biến phụ thuộc C (doanh nghiệp có giấy phép môi trƣờng hay không?) quan hệ có ý nghĩa về mặt thống kê với 13/23 biến còn lại. Một số biến độc lập cũng có quan hệ với nhiều biến độc lập còn lại, nhƣ biến Scale (quy mô doanh nghiệp) quan hệ có ý nghĩa về mặt thống kê với 14/22 biến độc lập còn lại và điều này có thể chứng tỏ biến Scale là một biến nội sinh.

4.3.2.Kiểm định mối quan hệ giữa biến phụ thuộc và các biến độc lập

Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008), để kiểm tra mối quan hệ giữa hai biến định danh hoặc định danh với thứ bậc thì có thể sử dụng kiểm định Pearson Chi- square.

Bảng 4.15. Kiểm định Pearson Chi- square giữa biến phụ thuộc và từng biến độc lập

C (EC?)

p

Scale (quy mô doanh nghiệp) 205,306 0,005

L_Limited (công ty TNHH) 7,728 0,021

L_Joint (công ty cổ phần) 8,780 0,012

S_Paper (ngành giấy) 0,538 0,764

S_TextApp (ngành dệt và may mặc) 9,095 0,011

S_Elec (ngành máy móc điện tử, máy tính, đài phát thanh,

truyền hình) 15,820 0,000

S_PubPrint (ngành in ấn và xuất bản) 0,995 0,608

S_Rubber (ngành cao su) 6,379 0,041

S_FabMetal (ngành kim loại đúc sẵn) 13,161 0,001

S_FoodBev (ngành thực phẩm và đồ uống) 16,693 0,000

Age (số năm đã hoạt động của doanh nghiệp) 66,797 0,255 NewEquip (tỷ lệ máy móc/ thiết bị có thời gian đã sử dụng

dƣới 5 năm) 78,912 0,001

Edu_Own (Số năm đi học chủ doanh nghiệp/ nhà quản lý) 21,252 0,505 Know_EnvLaw (hiểu biết về pháp luật môi trƣờng) 40,752 0,000

Profit (lợi nhuận/ tổng tài sản 2007) 754,889 0,484

Invest (tỷ lệ lợi tức dành cho đầu tƣ mới) 396,836 0,002 Export (tỷ lệ doanh số bán ra từ xuất khẩu trực tiếp) 28,808 0,150 Ex_OECD (xuất khẩu trực tiếp qua các nƣớc phát triển?) 24,124 0,000 Sal_Cons (tỷ lệ sản xuất cho ngƣời tiêu dùng) 38,283 0,093 Inspect_Past (nƣớc thải có đƣợc đo lƣờng trong quá khứ?) 23,475 0,000 Inspect_Pre (nƣớc thải có đƣợc đo lƣờng khối lƣợng/ nồng

độ bởi cơ quan quản lý/ doanh nghiệp?) 18,995 0,000

Bride (Số lần đƣa hối lộ) 22,685 0,004

Net_Gov (Mạng lƣới chính trị gia, công chức) 13,620 0,034

Số liệu bảng trên cho thấy có 17/23 biến độc có quan hệ với biến phụ thuộc với mức ý nghĩa 10%, trong đó nhóm biến đại diện cho đặc điểm doanh nghiệp có 9/12 biến, nhóm biến đại diện cho nhận thức có ½ biến, nhóm biến đại diện cho tình hình hoạt động tài chính có ½ biến, nhóm biến đại diện cho áp lực có 4/5 biến và nhóm biến đại diện cho quan hệ với chính quyền có 2/2 biến. Các biến độc lập không có quan hệ với biến phụ thuộc bao gồm: 2 biến đại diện cho ngành nghề sản xuất, Age (số năm đã hoạt động), Edu_Own (số năm đi học chủ doanh nghiệp/ nhà quản lý), Profit (lợi nhuận/ tổng tài sản 2007), Export (tỷ lệ doanh số bán ra từ xuất khẩu trực tiếp). Mặc dù các biến này không có quan hệ có ý nghĩa thống kê với biến phụ thuộc, nhƣng các biến này vẫn đƣợc sử dụng trong phân tích hồi quy vì lý thuyết và quan sát thực tế chứng minh rằng các biến này có ảnh hƣởng đến mức độ tuân thủ quy định BVMT của doanh nghiệp.

4.4. Hồi quy binary logistic

4.4.1.Hồi quy binary logistic với bộ dữ liệu ban đầu

Kiểm tra cỡ mẫu có phù hợp để chạy thống kê hay không? Theo Schwab (2007) điều kiện tiên quyết để có thể chạy thống kê là tỷ lệ tối thiếu của cỡ mẫu so với số biến độc lập là 10:1 (tức là cỡ mẫu tối thiểu phải gấp 10 lần tổng số biến độc lập có trong mô hình) và tỷ lệ cho kết quả tốt hơn là 20:1.

Mô hình ban đầu có cỡ mẫu: 379 quan sát; tổng số biến độc lập: 23 biến. Tỷ lệ (cỡ mẫu: tổng số biến độc lập) là (16,5:1), thỏa mãn yêu cầu tỷ lệ tối thiểu (10:1). Nhƣ vậy, chúng tôi có thể tiến hành chạy hồi quy logistic.

Chạy hồi quy, trong lần chạy ban đầu này, chúng tôi cần tính toán thêm 2 giá trị: (1) phần dƣ đƣợc chuẩn hóa (standardized residual) của từng quan sát để tìm ra các quan sát ngoại lai21 (outliers); (2) cook’s distance của từng quan sát để tìm ra các trƣờng hợp ảnh hƣởng22 (influential cases). Mục tiêu của việc tìm ra các quan sát có tính chất trên là để loại bớt các quan sát này ra khỏi mẫu để có kết quả chạy hồi qui tốt hơn. Theo Schwab (2007) thì các quan sát có giá trị

21 Quan sát ngoại lai: là quan sát có giá trị cách xa trung tâm quan sát một cách bất thƣờng giá trị.

lớn hơn 3 đƣợc xem là quan sát ngoại lai và quan sát có cook’s distance lớn hơn 1 đƣợc cho là quan sát có ảnh hƣởng.

Kết quả chạy bộ dữ liệu ban đầu cho kết quả về tỷ lệ chính xác phân loại23 (classification accuracy rate) là 85,8%

Bảng 4.16. Tỷ lệ chính xác phân loại (dữ liệu ban đầu)

Quan sát

Dự đoán

Doanh nghiệp có EC? Tỷ lệ chính xác

0 1

Doanh nghiệp có EC? 0 289 11 96,3

1 43 36 45,6

Tỷ lệ chính xác tổng thể 85,8

Nguồn dữ liệu: Kết quả chạy hồi quy binary logistic từ bộ dữ liệu ban đầu.

4.4.2.Hồi quy binary logistic với bộ dữ liệu đã loại trừ các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng các trƣờng hợp ảnh hƣởng

Loại trừ các giá trị ngoại lai và các trường hợp ảnh hưởng: Những quan sát có giá trị lớn 3 và cook’s distance lớn hơn 1 sẽ bị loại ra khỏi mẫu để chạy hồi quy lần này. Kết quả loại cho ra bộ dữ liệu gồm: 370 quan sát.

Kiểm tra cỡ mẫu có phù hợp để chạy thống kê hay không? Mô hình sau khi loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng có cỡ mẫu: 370 quan sát; tổng số biến độc lập: 23 biến. Tỷ lệ (cỡ mẫu: tổng số biến độc lập) là (16,1:1), thỏa mãn yêu cầu tỷ lệ tối thiểu (10:1). Nhƣ vậy, có thể tiến hành chạy hồi quy logistic. Kết quả cho tỷ lệ chính xác phân loại: 87,6%.

Bảng 4.17. Tỷ lệ chính xác phân loại (dữ liệu đã loại quan sát ngoại lai và các trƣờng hợp ảnh hƣởng)

Quan sát

Dự đoán

Doanh nghiệp có EC? Tỷ lệ chính xác

0 1

Doanh nghiệp có EC? 0 287 11 96,3

1 35 37 51,4

Tỷ lệ chính xác tổng thể 87,6

Nguồn dữ liệu: Kết quả chạy hồi quy binary logistic từ bộ dữ liệu đã loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng.

4.4.3.Lựa chọn mô hình để thuyết minh kết quả

Theo Schwab (2007), tỷ lệ chính xác phân loại có đƣợc từ chạy bộ dữ liệu đã loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng nếu lớn hơn tỷ lệ chính xác phân loại có đƣợc từ chạy từ bộ dữ liệu ban đầu từ 2% trở lên thì chọn kết quả hồi quy từ bộ dữ liệu đã loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng làm cơ sở thuyết minh kết quả; ngƣợc lại, ta chọn kết quả hồi quy từ bộ dữ liệu ban đầu.

Kết quả chạy ban đầu cho tỷ lệ chính xác phân loại: 85,8%. Kết quả chạy từ bộ dữ liệu đã loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng cho tỷ lệ chính xác phân loại: 87,6%. Nhƣ vậy, tỷ lệ chính xác phân loại có đƣợc từ chạy bộ dữ liệu đã loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng lớn hơn tỷ lệ chính xác phân loại có đƣợc từ chạy bộ dữ liệu ban đầu gần 2% (số liệu chính xác là 1,8%); do đó chúng tôi chọn kết quả hồi qui sau khi loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng làm cơ sở để thuyết minh cho các phần sau có liên quan.

4.4.4.Kiểm tra kết quả về mặt thống kê

4.4.4.1. Kiểm tra sự tồn tại mối quan hệ giữa biến phụ thuộc và biến độc lập

Mô hình đƣợc xem là có sự hiện diện mối quan hệ giữa biến phụ thuộc và các biến độc lập khi có ít nhất một hệ số hồi qui khác không. Giả thuyết kiểm định:

H0: Tất cả các hệ số hồi qui bằng không;

H1: Có ít nhất một hệ số hồi qui khác không. Với mức ý nghĩa kỳ vọng Theo Swchab (2007), sử dụng phép kiểm tra Omnibus để kiểm định. Nếu giá trị Chi- square của mô hình cho mức ý nghĩa thống kê (sig.) nhỏ hơn mức ý nghĩa kỳ vọng (1%, 5% hoặc 10%) thì chấp nhận giả thuyết H1, tức là có mối quan hệ giữa biến phụ thuộc và các biến độc lập, mô hình đƣợc xem là phù hợp.

Kết quả chạy mô hình nghiên cứu cho kết quả nhƣ sau:

Bảng 4.18. Kiểm định Omnibus về hệ số của mô hình

Chi-square Df Sig.

Step 163,503 23 ,000

Block 163,503 23 ,000

Model 163,503 23 ,000

Nguồn dữ liệu: Kết quả chạy hồi quy binary logistic từ bộ dữ liệu đã loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng.

Giá trị Chi- square của mô hình là 163,503, tƣơng ứng với mức ý nghĩa p= 0,000, nhỏ hơn hoặc bằng mức ý nghĩa 1%. Do đó, giả thuyết H0 bị bác bỏ, chấp nhận giả thuyết H1: tồn tại mối quan hệ giữa biến phụ thuộc và các biến độc lập ở mức ý nghĩa 1%, mô hình đƣợc xem là phù hợp.

4.4.4.2. Kiểm tra hiện tƣợng đa cộng tuyến:

Theo Swchab (2007) để phát hiện hiện tƣợng đa cộng tuyến trong mô hình hồi quy binary logistic ta kiểm tra sai số chuẩn của các hệ số (standard errors of coefficents). Nếu tồn tại một hệ số có sai số chuẩn của các hệ số (trừ hằng số- constant) lớn hơn 2 thì mô hình có vấn đề về số liệu, hiện tƣợng đa cộng tuyến xuất hiện trong kết quả mô hình.

Bảng 4.19. Hồi quy binary logistic (N= 370)

B S.E. Wald df Sig. Exp(B)

Scale 2,166 ,619 12,234 1 ,000 8,727 L_Limited -,375 ,514 ,534 1 ,465 ,687 L_Joint -2,246 1,975 1,293 1 ,256 ,106 S_Paper -2,491 1,010 6,080 1 ,014 ,083 S_TextApp -2,786 ,895 9,698 1 ,002 ,062 S_Elec -3,864 1,468 6,925 1 ,009 ,021 S_PubPrint -2,397 ,984 5,928 1 ,015 ,091 S_Rubber -1,137 ,797 2,033 1 ,154 ,321 S_FabMetal -3,792 1,089 12,132 1 ,000 ,023 S_FoodBev ,176 ,763 ,053 1 ,818 1,192 Age ,075 ,025 9,253 1 ,002 1,078 NewEquip ,552 ,498 1,229 1 ,268 1,736 Edu_Own -,033 ,056 ,346 1 ,557 ,968 Know_EnvLaw ,817 ,255 10,261 1 ,001 2,263 Profit -,014 ,482 ,001 1 ,977 ,986 Invest -,441 ,790 ,312 1 ,577 ,643 Export -3,111 1,246 6,234 1 ,013 ,045 Ex_OECD 4,041 1,124 12,935 1 ,000 56,895 Sal_Cons ,871 ,861 1,023 1 ,312 2,389 Inspect_Past 1,864 ,772 5,829 1 ,016 6,452 Inspect_Pre 2,009 1,186 2,868 1 ,090 7,455

B S.E. Wald df Sig. Exp(B)

Bride ,231 ,078 8,759 1 ,003 1,260

Net_Gov -,662 ,184 13,029 1 ,000 ,516

Constant -3,964 1,197 10,965 1 ,001 ,019

Nguồn dữ liệu: Kết quả chạy hồi quy binary logistic từ bộ dữ liệu đã loại các giá trị ngoại lai và các trƣờng hợp ảnh hƣởng.

Cột S.E. cho biết sai số chuẩn của các hệ số. Không có biến độc lập nào trong kết quả chạy hồi quy này có sai số chuẩn lớn hơn 2, do đó nghiên cứu có thể khẳng định không có hiện tƣợng đa cộng tuyến xảy ra, không tồn tại ít nhất một cặp biến độc lập trong mô hình có quan hệ phụ thuộc lẫn nhau và bộ dữ liệu có ý nghĩa về mặt thống kê, ƣớc lƣợng các hệ số hồi quy trong mô hình là các ƣớc lƣợng không chệch (chính xác) và có thể tin tƣởng đƣợc.

4.4.4.3. Kiểm tra mối quan hệ giữa biến phụ thuộc và từng biến độc lập

Mục tiêu của kiểm tra này là kiểm định hệ số hồi quy của mô hình. Phép kiểm định đƣợc sử dụng là kiểm định Wald, sử dụng giá trị p- value của thống kê Wald cho từng biến để kiểm định.

H0: Hệ số hồi quy của biến thứ i bằng 0;

H1: Hệ số hồi quy của biến thứ i khác 0. Với mức ý nghĩa kỳ vọng Nếu hệ số hồi quy của biến thứ i khác 0 và p- value có đƣợc từ thống kê Wald của mô hình nhỏ hơn mức ý nghĩa kỳ vọng thì ta bác bỏ giả thuyết H0, chấp nhận giả thuyết H1, tức là tồn mối quan hệ giữa biến phụ thuộc và biến độc lập thứ i.

Sử dụng Bảng 4.19 để kiểm định hệ số hồi quy của mô hình:

(i) Các biến: (1) Scale; (2) S_Paper; (3) S_TextApp; (4) S_Elec; (5) S_PubPrint; (6) S_FabMetal; (7) Age; (8) Know_EnvLaw; (9) Export; (10) Ex_OECD; (11) Inspect_Past; (12) Inspect_Pre; (13) Bride; (14) Net_Gov có hệ số hồi quy khác không và có giá trị p- value nhỏ hơn 10%.

Một phần của tài liệu Luận văn thạc sĩ Mức độ tuân thủ quy định môi trường của các doanh nghiệp vừa và nhỏ tại TP. Hồ Chí Minh (Trang 72)

Tải bản đầy đủ (PDF)

(107 trang)