8. Tổng quan tài liệu nghiên cứu trước ñ ây
3.1.3. Kiểm ñị nh các giả thuyết và ước lượng mô hình
a. Kiểm tra phân phối chuẩn
ðể ước lượng hồi quy tuyến tính, một trong những kiểm định quan trọng là xem xét xem các biến cĩ phân phối chuẩn hay khơng. Trong phân phối này, trị số trung bình (Mean) và trung vị (Median) gần bằng nhau. Skewness (độ xiên) và Kurtosis (độ nhọn) là hai chỉ số chính cần được xem xét để quyết định biến định lượng cĩ phân phối chuẩn hay khơng. Kline [87] cho rằng nếu hệ số Skewness nhỏ hơn 3 và hệ số Kurtosis nhỏ hơn 10 thì xem như dữ liệu khơng vi phạm giảđịnh về phân phối chuẩn (theo TS. ðồn Ngọc Phi Anh [1]). Std. Error of Skewness và Std. Error of Kurtosis cũng được sử dụng để kiểm nghiệm tính phân phối chuẩn của biến. Nếu Std. Error of Skewness và Std. Error of Kurtosis nằm trong khoảng [-2; 2] thì phân phối được coi là chuẩn hĩa. Ngồi ra khi kiểm tra phân phối chuẩn của một biến, người ta cịn sử dụng chỉ số Excess Kurtosis (Excess Kurtosis = Kurtosis – 3). Excess Kurtosis dương cĩ nghĩa là Kurtosis của phân phối lớn hơn 3, Excess Kurtosis âm nghĩa là Kurtosis của phân phối nhỏ hơn 3. Cụ thể hơn, phân phối cĩ Excess Kurtosis dương được gọi là Leptokurtic, Excess Kurtosis bằng khơng được gọi là Mesokurtic, Excess Kurtosis âm được gọi là Platykurtic.
Kết quả thống kê tần số của dữ liệu nghiên cứu với các chỉ tiêu số trung bình (Mean), trung vị (Median), độ xiên (Skewness), độ nhọn (Kurtosis) được thể hiện qua bảng 3.3:
75
Bảng 3.3. Thống kê mơ tả tần số các biến nghiên cứu
EP AGE BGDI AUDIT SIZE GrTA DER LIQ GrSALE ACCR BTD
Valid 100 100 100 100 100 100 100 100 100 100 100 N Missing 0 0 0 0 0 0 0 0 0 0 0 Mean 0.4545 10.0300 0.3621 1.5100 23.7761 14.0570 1.2425 1.6586 11.5019 0.2928 20.4984 Median 0.4600 10.0000 0.3100 1.0000 23.8220 13.7775 0.8395 1.3190 11.1800 0.3025 20.0793 Std. Deviation 0.3780 3.1090 0.1768 1.2590 4.5855 9.2524 1.3225 1.4316 6.6107 0.1977 2.4459 Skewness -1.4230 1.2120 0.4240 1.1230 -.3930 0.5540 1.7700 0.7730 0.7890 -0.2390 1.0750 Std. Error of Skewness 0.2410 0.2410 0.2410 0.2410 0.2410 0.2410 0.2410 0.2410 0.2410 0.2410 0.2410 Kurtosis 3.1480 2.3340 -0.3360 0.2510 -0.0720 0.0220 2.0620 -0.6550 0.4040 -0.9820 2.0270 Std. Error of Kurtosis 0.4780 0.4780 0.4780 0.4780 0.4780 0.4780 0.4780 0.4780 0.4780 0.4780 0.4780 Excess Kurtosis 0.1480 -0.6660 -3.3360 -2.7490 -3.0720 -2.9780 -0.9380 -3.6550 -2.5960 -3.9820 -0.9730 (Nguồn: Kết quả xử lý số liệu bằng phần mềm SPSS V.20) 3.3: Thống kê mơ tả tần số các biến nghiên cứu download by : skknchat@gmail.com
76 Dựa vào kết quảở bảng 3.3 ta thấy:
(1) Tất cả các biến độc lập đều cĩ trị số trung bình và trung vị gần bằng nhau. Trong số các biến độc lập, mức chênh lệch lớn nhất giữa hai hệ số này là 0.51 (đối với biến AUDIT) và nhỏ nhất là -0.0097 (đối với biến ACCR).
(2) Hệ số Skewness của biến phụ thuộc EP và các biến độc lập đều nhỏ hơn 3. Hệ số Skewness của các biến độc lập AGE, BGDI, AUDIT, GrTA, DER, LIQ, GrSALE, BTD lớn hơn 0, nghĩa là phân phối lệch phải. Hệ số Skewness của biến phụ thuộc EP và các biến độc lập SIZE, ACCR, nhỏ hơn 0, nghĩa là phân phối lệch phải.
(3) Hệ số Kurtosis của biến phụ thuộc EP và các biến độc lập đều nhỏ hơn 10. Hệ số Kurtosis của biến phụ thuộc EP và các biến độc lập AGE, AUDIT, GrTA, DER, GrSALE, BTD lớn hơn 0, nghĩa là phân phối cĩ dạng nhọn. Hệ số Skewness của các biến BGDI, SIZE, LIQ, ACCR nhỏ hơn 0, nghĩa là phân phối cĩ dạng bẹt.
(4) ðộ lệch chuẩn của hệ số Skewness Std. Error of Skewness bằng 0.2410 nằm trong khoảng [-2; 2]. Std. Error of Skewness xấp xỉ 0, nghĩa là các quan sát được phân phối một cách đối xứng quanh giá trị trung bình.
ðộ lệch chuẩn của hệ số Kurtosis Std. Error of Kurtosis bằng 0.4780 nằm trong khoảng [-2; 2]. Std. Error of Kurtosis >0, nghĩa là các quan sát cĩ xu hướng tập trung mạnh quanh giá trị trung bình.
(5) Hệ số Excess Kurtosis của tất cả các biến độc lập đều nhỏ hơn 0, nghĩa là Kurtosis của phân phối nhỏ hơn 3, phân phối cĩ dạng Platykurtic.
Như vậy, đa số các biến đưa vào mơ hình thỏa mãn các điều kiện phân phối chuẩn. Thật vậy xem biểu đồ phân phối của biến phụ thuộc EP ta thấy đường cong cĩ dạng hình chuơng, cĩ trị trung bình là 0.4545 và số liệu phân phối khá đều, với tần số cao nhất nằm ngay giữa và các tần số thấp dần nằm ở hai bên.
77
Hình 3.1. Biểu đồ phân phối biến EP với đường cong chuẩn
(Nguồn: Kết quả xử lý số liệu bằng phần mềm SPSS V.20)
b. Kiểm định đa cộng tuyến
Ở phần phân tích hệ số tương quan Pearson ở trên, ta đã thấy rằng giữa biến phụ thuộc cĩ quan hệ tương quan khá rõ với các biến độc lập nhưng ta cũng thấy đuợc giữa các biến độc lập cũng cĩ tương quan với nhau. Ðiều này cĩ thể sẽ tạo ra khả năng đa cộng tuyến của mơ hình (multicollinearity). ðây là điều thường thấy trong hồi quy đa biến. ða cộng tuyến cĩ thể dẫn tới một số hậu quả như các ước lượng của hệ số hồi quy OLS cĩ thể khơng chính xác do cĩ sai số chuẩn quá lớn và dấu của hệ số hồi quy cĩ thể sai so với kỳ vọng (từ cơ sở lý thuyết). ðể phát hiện vấn đề đa cộng tuyến, trong kinh tế lượng quy định là khi hệ số tương quan giữa các biến độc lập > 0.9 hoặc hệ số nhân
78
tử phĩng đại phương sai (VIF, variance – inflating factor) > 10 thì mức độ đa cộng tuyến được xem là cao (Studenmund [155]). Hai phương pháp giúp phát hiện đa cộng tuyến trong luận văn này được tác giả sử dụng là:
Hệ số tương quan Pearson
Hầu hết các nhà nghiên cứu kinh tế lượng cho rằng khi hệ số tương quan giữa hai biến giải thích nào đĩ bằng hoặc cao hơn 0.9 thì đĩ là một dấu hiệu quan trọng xảy ra hiện tượng đa cộng tuyến. Quan sát phụ lục 6 Ma trận tương quan Pearson giữa các biến trong mơ hình nghiên cứu ta thấy, giá trị tuyệt đối của hệ số tương quan Pearson giữa các biến độc lập đều nhỏ hơn 0.9 nên ta vẫn chấp nhận sự tồn tại của chúng trong mơ hình. Như vậy, mơ hình hồi quy tác giảđưa ra tránh được hiện tượng đa cộng tuyến.
ðộ chấp nhận của biến (Tolerance) hoặc Hệ số phĩng đại phương sai (Variance inflation factor – VIF)
Trong phân tích hồi quy tương quan, ngồi phương pháp kiểm tra hiện tượng đa cộng tuyến bằng hệ số tương quan Pearson, ta cịn cĩ thể áp dụng kiểm định Collineariry Statistics thơng qua độ chấp nhận của biến (Tolerance = 1 – R2) và hệ số phĩng đại phương sai (Variance inflation factor – VIF = 1/Tolerance).
ðộ chấp nhận Tolerance thường được sử dụng để đo lường hiện tượng cộng tuyến. Theo các nhà kinh tế lượng, các biến độc lập sẽ cĩ hiện tượng đa cộng tuyến khi hệ số Tolerance nhỏ hơn 0.1. Hệ số phĩng đại phương sai VIF cĩ liên hệ gần với độ chấp nhận, thực tế nĩ là nghịch đảo của độ chấp nhận. Quy tắc là khi VIF vượt quá 10, đĩ là dấu hiệu của đa cộng tuyến. Khi kiểm định, chỉ cần hệ số VIF nhỏ hơn 10 là ta cĩ thể bác bỏ giả thuyết mơ hình bị đa cộng tuyến (Hồng Trọng, Chu Nguyễn Mộng Ngọc [4]).
79 Bảng 3.4. Kết quả kiểm định hiện tượng đa cộng tuyến Biến Tolerance VIF AGE 0.1220 8.2210 BGDI 0.1370 7.2880 AUDIT 0.3220 3.1080 SIZE 0.1050 9.5320 GrTA 0.2750 3.6330 DER 0.1290 7.7320 LIQ 0.1090 9.1410 GrSALE 0.1410 7.1050 ACCR 0.2170 4.6180 BTD 0.3300 3.0280 (Nguồn: Kết quả xử lý số liệu bằng phần mềm SPSS V.20)
Quan sát bảng 3.4 ta thấy, hệ số Tolerance biến thiên từ 0.1050 đến 0.3300, nghĩa là lớn hơn 0.1, và hệ số VIF của tất cả các biến đều nhỏ hơn 10, biến thiên từ 3.0280 đến 9.5320 nên ta cĩ thể kết luận mơ hình khơng cĩ hiện tượng đa cộng tuyến.
c. Kiểm định hiện tượng tự tương quan giữa các phần dư
Hiện tượng tự tương quan là hiện tượng các phần dư cĩ quan hệ với nhau. ðiều này sẽ dẫn tới sai số chuẩn của các hệ số hồi quy OLS sẽ bị chệch và khơng nhất quán và vì thế việc kiểm định thống kê sẽ khơng cịn đáng tin cậy nữa. Xác định được tầm quan trọng của việc kiểm định mối tương quan giữa các phần dư, tác giả tiến hành kiểm định theo hai phương pháp: sử dụng đại lượng thống kê Durbin –Watson và phương pháp đồ thị.
Sử dụng đại lượng thống kê Durbin –Watson
ðể kiểm tra hiện tượng tự tương quan, trong thực tế các nhà nghiên cứu thường sử dụng kiểm định Durbin –Watson. Nếu hệ số Durbin –Watson
80
nằm thỏa mãn điều kiện d > dU và d < 4 - dU thì khơng cĩ hiện tượng tự tương quan trong phần dư của mơ hình hồi quy tuyến tính (Hồng Trọng, Chu Nguyễn Mộng Ngọc [4]). Kết quả kiểm định Durbin –Watson mơ hình nghiên cứu được thể hiện qua bảng 3.5:
Bảng 3.5. Kết quả kiểm định Durbin –Watson
Model R R Square Adjusted R Square Std. Error of the Estimate Durbin- Watson 1 .843a .711 .679 .2142916 2.029
a. Predictors: (Constant), BTD, SIZE, AUDIT, ACCR, GrTA, AGE, GrSALE, BGDI, DER, LIQ
b. Dependent Variable: EP
Qua dữ liệu kiểm định Durbin –Watson trên phần mềm SPSS V.20 cĩ hệ số d = 2.029. Tra bảng Durbin –Watson 1 biến độc lập, 100 quan sát và mức ý nghĩa 5%, ta cĩ dL = 1.654 và dU = 1.694. Ta thấy, d = 2.029 > dU = 1.694, và d = 2.029 < 4 - dU (4 – 1.694 = 2.306) nên trong mơ hình khơng cĩ hiện tượng tự tương quan, nĩi cách khác ta chấp nhận giả thuyết khơng cĩ tương quan chuỗi bậc nhất giữa các phần dư.
Phương pháp đồ thị
Bên cạnh việc sử dụng đại lượng thống kê Durbin – Watson để kiểm định, tác giả sử dụng thêm phương pháp đồ thị để vẽ đồ thị phân tán phần dư chuẩn hĩa theo thứ tự quan sát để kiểm chứng điều này.
81
Hình 3.2. Biểu đồ phân tán phần dư chuẩn hĩa theo thứ tự quan sát
Nguồn: Kết quả xử lý số liệu bằng phần mềm SPSS V.20
Dựa vào hình 3.2 ta thấy các phần dư phân tán khơng theo một quy luật nào nên giữa các phần dư khơng cĩ tương quan với nhau, nghĩa là khơng cĩ tương quan chuỗi bậc nhất giữa các phần dư.
d. Kiểm định phương sai khơng đổi
Hiện tượng phương sai của sai số thay đổi là hiện tượng độ lớn của phần dư tăng hoặc giảm cùng với các giá trị dự đốn hay giá trị của biến độc lập mà ta nghi ngờ gây ra hiện tượng phương sai của sai số thay đổi. Hiện tượng phương sai thay đổi gây ra hậu quả lớn nhất là các hệ số hồi quy khơng cĩ ý nghĩa thống kê. Tiêu chuẩn uớc luợng của phương pháp OLS là dựa trên tổng bình phương các phần dư đạt giá trị cực tiểu. Tác giả sẽ kiểm định phương sai của sai số thay đổi bằng cách kết hợp 2 phương pháp: vẽ biểu đồ và kiểm định tương quan hạng Spearman.
82 Vẽ biểu đồ bình phương phần dư theo EP (BP_rest1: biến bình phương phần dư) Hình 3.3. Biểu đồ bình phương phần dư theo EP (Nguồn: Kết quả xử lý số liệu bằng phần mềm SPSS V.20) Rõ ràng từ đồ thị cho thấy bình phương của phần dư giảm cùng với sự gia tăng của biến EP hay phương sai thay đổi, vì vậy rất cĩ khả năng mơ hình đã vi phạm giả thuyết phương sai khơng thay đổi. Tác giả sẽ sử dụng kiểm định tương quan hạng Spearman giữa các biến độc lập với trị tuyệt đối của phần dư.
Kiểm định tương quan hạng Spearman giữa các biến độc lập với trị tuyệt đối của phần dư
Ðặt giả thuyết H0: Hệ số tương quan hạng của tổng thể bằng 0 (phương sai của sai số khơng đổi).
Bảng 3.6. Kết quả kiểm định tương quan hạng Spearman giữa các biến nghiên cứu
EP AGE BGDI AUDIT SIZE GrTA DER LIQ GrSALE ACCR BTD ABSEP
Correlation Coefficient 1.000 -.642 ** .675** -.357** -.603** -.609** -.510** -.641** -.589** -.512** -.252* .052 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .011 .607 EP N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient -.642** 1.000 -.946** .731** .904** .774** .768** .921** .866** .779** .447** -.152 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .130 AGE N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient .675 ** -.946** 1.000 -.700** -.919** -.809** -.829** -.955** -.903** -.830** -.436** .172 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .088 BGDI N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient -.357** .731** -.700** 1.000 .786** .632** .618** .711** .740** .608** .426** -.063 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .531 AUDIT N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient -.603** .904** .919** .786** 1.000 .805** .787** .903** .931** .810** .353** -.199* Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .047 Spearman's rho SIZE N 100 100 100 100 100 100 100 100 100 100 100 100
EP AGE BGDI AUDIT SIZE GrTA DER LIQ GrSALE ACCR BTD ABSEP
83
EP AGE BGDI AUDIT SIZE GrTA DER LIQ GrSALE ACCR BTD ABSEP Coefficient Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .003 .007 N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient -.510 ** .768** -.829** .618** .787** .695** 1.000 .828** .772** .941** .439** -.057 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .571 DER N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient -.641 ** .921** -.955** .711** .903** .834** .828** 1.000 .876** .838** .420** -.167 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .097 LIQ N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient -.589** .866** -.903** .740** .931** .749** .772** .876** 1.000 .753** .365** -.181 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .071 GrSALE N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient -.512** .779** -.830** .608** .810** .708** .941** .838** .753** 1.000 .354** -.076 Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .452 ACCR N 100 100 100 100 100 100 100 100 100 100 100 100
EP AGE BGDI AUDIT SIZE GrTA DER LIQ GrSALE ACCR BTD ABSEP
84
EP AGE BGDI AUDIT SIZE GrTA DER LIQ GrSALE ACCR BTD ABSEP Sig. (2-tailed) .011 .000 .000 .000 .000 .003 .000 .000 .000 .000 .136 N 100 100 100 100 100 100 100 100 100 100 100 100 Correlation Coefficient .052 -.152 .172 -.063 -.199 * -.268** -.057 -.167 -.181 -.076 .150 1.000 Sig. (2-tailed) .607 .130 .088 .531 .047 .007 .571 .097 .071 .452 .136 ABSEP N 100 100 100 100 100 100 100 100 100 100 100 100
**. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed).
(Nguồn: Kết quả xử lý số liệu bằng phần mềm SPSS V.20)
3.6: Kết quả kiểm định tương quan hạng Spearman giữa các biến nghiên cứu 85
86
Kết quả kiểm định cho thấy các giá trị Sig. của kiểm định tương quan giữa biến độc lập và trị tuyệt đối phần dư đều lớn hơn 1% nên ta khơng thể bác bỏ giả thuyết H0, như vậy giả thuyết phương sai của sai số thay đổi bị bác bỏ trong mơ hình này.
e. Kiểm định phân phối chuẩn của phần dư
Cĩ nhiều nguyên nhân dẫn đến phần dư cĩ thể khơng tuân theo phân phối chuẩn như sai dạng mơ hình, số lượng các phần dư khơng đủ nhiều để phân tích… Vì vậy chúng ta phải thực hiện khảo sát phân phối của phần dư. ðể dị tìm sự vi phạm giả định phân phối chuẩn của phần dư ta sẽ dùng hai