Để biết được biến phụ thuộc có tương quan tuyến tính với các biến độc lập, cũng như giữa các biến độc lập với nhau, người ta sử dụng một số thống kê có tên là
hệ số tương quan Pearson, ký hiệu: r (Hoàng Trọng - Chu Nguyễn Mộng Ngọc, 2008).
Giá trị r nằm trong đoạn [-1 ÷ 1], giá trị tuyệt đối của r càng gần 1 thì tương quan tuyến tính là chặt chẽ và khi r = 0 thì không có mối liên hệ tương quan tuyến tính giữa biến phụ thuộc và các biến độc lập. Mặc khác, nếu giữa các biến độc lập cũng có tương quan lớn với nhau thì đó cũng là dấu hiệu cho biết giữa chúng có thể xảy ra hiện tượng đa cộng tuyến trong mô hình hồi quy tuyến tính đang xét.
Bảng 3.28: Ma trận tương quan giữa các biến luongvon
vay laisuat taphuan hocvan dientich
_SX kinhnghiem chiphi gioitinh tuoidoi loinhuan Hệ số tương quan Pearson 1 Sig. (2-tailed) luongvo nvay N 200 Hệ số tương quan Pearson -.759 ** 1 Sig. (2-tailed) .000 laisuat N 200 200 Hệ số tương quan Pearson .229 ** -.134 1 Sig. (2-tailed) .001 .059 taphuan N 200 200 200 Hệ số tương quan Pearson -.358 ** .326** -.044 1 Sig. (2-tailed) .000 .000 .536 hocvan N 200 200 200 200 Hệ số tương quan Pearson .628 ** -.453** .166* -.144* 1 Sig. (2-tailed) .000 .000 .019 .041 dientich _SX N 200 200 200 200 200 Hệ số tương quan Pearson .116 .047 .128 -.192 ** .141* 1 Sig. (2-tailed) .102 .504 .071 .007 .046 kinhngh iem N 200 200 200 200 200 200 Hệ số tương quan Pearson .794 ** -.528** .177* -.286** .447** .148* 1 Sig. (2-tailed) .000 .000 .012 .000 .000 .037 chiphi N 200 200 200 200 200 200 200 Hệ số tương quan Pearson .060 -.168 * .007 .066 .066 -.072 .040 1 Sig. (2-tailed) .399 .017 .923 .356 .350 .313 .579 gioitinh N 200 200 200 200 200 200 200 200 Hệ số tương quan Pearson .047 .088 .100 -.201 ** .056 .724** .068 -.032 1 Sig. (2-tailed) .506 .214 .160 .004 .431 .000 .336 .652 tuoidoi N 200 200 200 200 200 200 200 200 200 Hệ số tương quan Pearson .777 ** -.659** .262** -.252** .573** .102 .530** .092 .034 1 Sig. (2-tailed) .000 .000 .000 .000 .000 .151 .000 .193 .633 loinhuan N 200 200 200 200 200 200 200 200 200 200
**. Tương quan có ý nghĩa ở mức 0,01 (2-tailed). *. Tương quan có ý nghĩa ở mức 0,05 (2-tailed).
Nhận xét: Giữa từng biến độc lập có sự tương quan với biến phụ thuộc (loinhuan), trong đó tương quan cao nhất là giữa biến X1 (luongvonvay), có r = 0,777.
Kiểm định mức ý nghĩa Sig. về mối quan hệ giữa biến phụ thuộc với từng biến độc lập cho thấy, cả 9 nhóm biến độc lập trong mô hình hồi quy đều có quan hệ tuyến tính với biến phụ thuộc. Tuy nhiên, giữa các biến độc lập cũng có tương quan với nhau.
Tiếp tục ở phần kiểm định đa cộng tuyến bên dưới, đề tài sẽ xác định xem giữa các biến được giữ lại trong mô hình hồi quy tuyến tính có xảy ra hiện tượng đa cộng tuyến hay không.
3.6.2. Phân tích hồi quy Mô hình hồi quy có dạng:
Y = β0 + β1X1 + β2 X2 + β3X3 + β4 X4 + β5X5 + β6X6 + β7X7 + β8X8 + β9X9 Tương ứng:
Y = β0 + β1*LUONGVONVAY + β2*LAISUAT + β3*TAPHUAN + β4*HOCVAN + β5*DIENTICHDAT + β6*KINHNGHIEM + β7*CHIPHI + β8*GIOITINH + β9*TUOIDOI
Để tiến hành phân tích hồi quy tuyến tính bội, các biến được đưa vào mô hình theo phương pháp Enter. Tiêu chuẩn kiểm định là tiêu chuẩn được xây dựng vào phương pháp kiểm định giá trị thống kê F và xác định xác suất tương ứng của giá trị thống kê F, kiểm định mức độ phù hợp giữa mẫu và tổng thể thông qua hệ số xác định R2 hiệu chỉnh.
3.6.2.1. Kết quả hồi quy tuyến tính lần đầu (Phục lục 4, Mục 1)
Bảng 3.29: Bảng mô hình tóm tắt, phân tích phương sai và hồi quy (lần đầu) Mô hình tóm tắt
Thống kê thay đổi Mô hình R R2 R2 hiệu chỉnh Sai số chuẩn của ước lượng R 2 thay
đổi F thay đổi df1 df2
Mức ý nghĩa. F thay đổi Durbin- Watson 1 .806a .650 .634 16.65712 .650 39.230 9 190 .000 1.913
a. Biến độc lập: (hằng số), tuoidoi, gioitinh, luongvonvay, taphuan, hocvan, dientich_SX, kinhnghiem, laisuat, chiphi
Phân tích phương sai (ANOVA)
Mô hình
Tổng độ lệch
bình phương df
Độ lệch bình
phương bình quân F Mức ý nghĩa
Hồi quy 97963.318 9 10884.813 39.230 .000a Phần dư 52717.343 190 277.460
1
Tổng 150680.661 199
a. Biến độc lập: (hằng số), tuoidoi, gioitinh, luongvonvay, taphuan, hocvan, dientich_SX, kinhnghiem, laisuat, chiphi b. Biến phụ thuộc: loinhuan
Phân tích hồi quy
Hệ số chưa chuẩn hóa
Hệ số chuẩn
hóa Thống kê cộng tuyến Mô hình Hệ số B chuẩn Sai số Beta
t Mức ý nghĩa Tolerance VIF (hằng số) 32.035 16.236 1.973 .050 luongvonvay .575 .085 .722 6.764 .000 .162 6.181 laisuat -2.375 1.110 -.151 -2.139 .034 .368 2.715 taphuan 1.697 .858 .088 1.977 .049 .932 1.073 hocvan .701 1.277 .026 .549 .583 .798 1.253 dientich_SX .467 .221 .119 2.111 .036 .581 1.722 kinhnghiem .129 .194 .042 .663 .508 .454 2.204 chiphi -.186 .071 -.190 -2.610 .010 .349 2.865 gioitinh 1.926 3.607 .024 .534 .594 .943 1.061 1 tuoidoi -.041 .189 -.014 -.219 .827 .462 2.163 a. Biến phụ thuộc: loinhuan
Kết quả phân tích hồi quy tuyến tính lần đầu như sau:
So sánh 2 giá trị R2 và R2 hiệu chỉnh có thể thấy, R2 hiệu chỉnh nhỏ hơn, dùng nó để đánh giá độ phù hợp của mô hình sẽ an toàn hơn (vì nó không thổi phồng mức độ phù hợp của mô hình). Vậy, hệ số R2 hiệu chỉnh xác định được là 0,634, mô hình hồi quy tuyến tính đã xây dựng phù hợp với tập dữ liệu ở mức 63,40%. Kết luận là mô hình có mức độ giải thích trên khá chặt.
Kiểm định F sử dụng trong bảng phân tích phương sai là một phép kiểm định giả thuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể. Theo kết quả Bảng 3.29 - phân tích phương sai (ANOVA) của mô hình ta thấy: mức ý nghĩa (Sig.) = ,000 < 0,05
chứng tỏ mô hình hồi quy tuyến tính bội là phù hợp với tập dữ liệu và có thể sử dụng được. Từ phương trình hồi quy có thể thấy, các giá trị Beta đều khác 0. Tuy nhiên, các biến: X4, X6, X8 và X9 (tương ứng các biến: “hocvan”, “kinhnghiem”, “gioitinh” và “tuoidoi”) có giá trị Beta khác 0 nhưng không có ý nghĩa thống kê (vì kiểm định 2 phía, p> 0,05). Và các nhân tố này không được lựa chọn là nhân tố quyết định đến hiệu quả sử dụng vốn vay về mặt lý luận thống kê. Trong thực tế, có thể hiệu quả sử dụng vốn vay có chịu ảnh hưởng của các nhân tố này, tuy nhiên ở mức độ chưa đủ mạnh.
Như vậy, các nhân tố được giữ lại trong mô hình gồm: X1, X2, X3, X5 và X7
(tương ứng các biến: “luongvonvay”, “laisuat”, “taphuan”, “dientich_SX” và “chiphi”). Sau đó, thiết lập mô hình hồi quy mới có hệ số hồi quy riêng phần chuẩn hoá β’ như sau:
Y = β’0 + β’1X1 + β’2X2 + β’3X3 + β’5X5 + β’7X7
Tương ứng:
Y = β’0 + β’1*LUONGVONVAY + β’2*LAISUAT + β’3*TAPHUAN + β’5*DIENTICHDAT + β’7*CHIPHI
3.6.2.2. Kết quả hồi quy tuyến tính sau khi loại biến (Phục lục 4, Mục 2) Bảng 3.30: Bảng mô hình tóm tắt, phân tích phương sai và hồi quy (sau loại biến)
Mô hình tóm tắt
Thống kê thay đổi Mô hình R R2 R2 hiệu chỉnh Sai số chuẩn của ước lượng R 2 thay
đổi F thay đổi df1 df2
Mức ý nghĩa. F thay đổi Durbin- Watson 1 .805a .648 .639 16.53079 .648 71.481 5 194 .000 1.914
a. Biến độc lập: (hằng số), chiphi, taphuan, dientich_SX, laisuat, luongvonvay b. Biến phụ thuộc: loinhuan
Phân tích phương sai (ANOVA)
Mô hình
Tổng độ lệch
bình phương df
Độ lệch bình
phương bình quân F Mức ý nghĩa
Hồi quy 97666.873 5 19533.375 71.481 .000a
Phần dư 53013.788 194 273.267 1
Tổng 150680.661 199
a. Biến độc lập: (hằng số), chiphi, taphuan, dientich_SX, laisuat, luongvonvay b. Biến phụ thuộc: loinhuan
Phân tích hồi quy
Hệ số chưa chuẩn hóa
Hệ số chuẩn
hóa Thống kê cộng tuyến Mô hình Hệ số B chuẩn Sai số Beta
t Mức ý nghĩa Tolerance VIF (hằng số) 35.075 14.272 2.458 .015 luongvonvay .567 .083 .711 6.824 .000 .167 5.981 laisuat -2.307 1.051 -.147 -2.196 .029 .405 2.468 taphuan 1.769 .847 .092 2.090 .038 .943 1.060 dientich_SX .502 .217 .128 2.316 .022 .596 1.678 1 chiphi -.181 .071 -.185 -2.570 .011 .352 2.845
a. Biến phụ thuộc: loinhuan
3.6.2.3. Kiểm định các giả định cần thiết trong hồi quy tuyến tính
Kiểm định khả năng đa cộng tuyến giữa các biến độc lập
Cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau, vấn đề của hiện tượng cộng tuyến là chúng cung cấp cho mô hình những thông tin giống nhau, rất khó tách rời ảnh hưởng của các biến độc lập đến biến phụ thuộc. Hiệu ứng khác của sự tương quan khá chặt giữa các biến độc lập là nó làm các hệ số hồi quy có khuynh hướng kém ý nghĩa hơn (Hoàng Trọng - Chu Nguyễn Mộng Ngọc, 2008). Hệ số phóng đại phương sai VIF và Tolerance là hai đại lượng để chuẩn đoán hiện tượng đa cộng tuyến.
Nhìn vào Bảng 3.30, phân tích hồi quy của mô hình ta thấy tất cả hệ số VIF đều < 8 và Tolerance đều nằm trong khoảng (0;1) nên chấp nhận giả thuyết là không có mối tương quan độc lập. Kết luận là không xảy ra hiện tượng đa cộng tuyến.
Kiểm định hiện tượng tự tương quan giữa các phần dư
Một số lý do dẫn đến sự tồn tại của phần dư đó là các biến có ảnh hưởng không được đưa vào mô hình, chọn dạng tuyến tính cho mối quan hệ lẽ ra là phi tuyến tính, sai số trong đo lường các biến… Các vấn đề này có thể dẫn đến tương quan chuỗi trong sai số và tương quan này gây ra tác động sai lệch nghiêm trọng đến mô hình hồi quy tuyến tính (Hoàng Trọng - Chu Nguyễn Mộng Ngọc, 2008). Vì thế, phải kiểm định xem có sự tự tương quan giữa các phần dư này không. Đại lượng Durbin - Watson được dùng để kiểm định giả thuyết này.
Durbin - Watson người ta thường áp dụng quy tắc kiểm định đơn giản như sau: nếu 1 < d < 3 thì kết luận mô hình không có tương quan; nếu 0 < d < 1 thì kết luận mô hình có tương quan dương; nếu 3 < d < 4 thì kết luận mô hình có sự tương quan âm. Từ kết quả Bảng 3.30, mô hình tóm tắt, ta có 1 < d = 1,914< 3. Vậy ta có thể kết luận, các phần dư là độc lập với nhau và tính độc lập của phần dư đã được đảm bảo.
Kiểm định phương sai thay đổi
Kiểm định phương sai thay đổi, dùng công cụ vẽ của phần mềm SPSS là đồ thị Scatterplot. Nếu giả định này được thỏa mãn thì sẽ không nhận thấy có sự liên hệ nào giữa các giá trị dự đoán và phần dư; phần dư phải phân tán ngẫu nhiên.
Hình 3.3: Đồ thị Scatterplot
Nhìn vào đồ thị phân tán giữa các phần dư và giá trị dự đoán (Hình 3.3), ta thấy phần dư thay đổi không theo một trật tự nào. Vì vậy, chấp nhận giả thuyết có liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc.
Kiểm định phần dư phân phối chuẩn
Phần dư có thể không tuân theo phân phối chuẩn vì những lý do: sử dụng mô hình không đúng, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích. Vì vậy, ta sử dụng nhiều cách khảo sát khác nhau để đảm bảo tính xác đáng của kiểm định. Trong nghiên cứu này sẽ sử dụng biểu đồ tần số Histogram và đồ thị P - P plot để khảo sát phân phối của phần dư.
Hình 3.4: Biểu đồ Histogram
Nhìn vào biểu đồ tần số Histogram (Hình 3.4) cho thấy một đường cong phân phối chuẩn được đặt chồng lên biểu đồ tần số. Như vậy, phân phối phần dư xấp xỉ chuẩn Mean gần bằng 0 và độ lệch chuẩn Std. Dev. = 0,987 (gần bằng 1), nên có thể kết luận rằng giả thuyết phân phối chuẩn không bị vi phạm.
Nhìn vào đồ thị P - P plot (Hình 3.5) biểu diễn các điểm quan sát thực tế tập trung khá sát đường chéo những giá trị kỳ vọng, có nghĩa là dữ liệu phần dư có phân phối chuẩn.
3.6.2.4. Đánh giá độ phù hợp của mô hình và kiểm định các giả thuyết Để đánh giá độ phù hợp của mô hình, ta sẽ dùng các công cụ như tính hệ số xác định điều chỉnh (R2 hiệu chỉnh), kiểm định F. Trước tiên, hệ số xác định điều chỉnh của mô hình trên là 0,639, thể hiện 05 biến độc lập trong mô hình giải thích được 63,90% biến thiên của biến phụ thuộc (Bảng 3.30). Với giá trị này thì độ phù hợp của mô hình là chấp nhận được.
Ở trên, sau khi đánh giá giá trị R2 hiệu chỉnh, ta biết được mô hình hồi quy tuyến tính đã xây dựng là phù hợp với mẫu. Tuy nhiên, để có thể suy diễn mô hình này thành mô hình của tổng thể ta cần phải tiến hành kiểm định F thông qua phân tích phương sai. Ta có mức ý nghĩa (Sig.) của F xấp xỉ bằng 0 < 0,05 nên ta có thể bác bỏ giả thuyết H0: β1 = β2 = β3 = β5 = β7 = 0. Điều này có nghĩa là có ít nhất một biến độc lập nào đó ảnh hưởng đến biến phụ thuộc.
Kiểm định các giả thuyết của mô hình: Sau khi phân tích hồi quy, các nhân tố: X4, X6, X8 và X9 (tương ứng các biến: “hocvan”, “kinhnghiem”, “gioitinh” và “tuoidoi”) bị loại ra khỏi mô hình do không đáp ứng được tiêu chuẩn (vì có mức ý nghĩa (Sig.) > 0,05) nên các giả thuyết H4, H6, H8 và H9 bị bác bỏ với mức ý nghĩa thống kê 5%. Những thành phần còn lại (có mức ý nghĩa (Sig.) < 0,05) với mức ý nghĩa thống kê 5% gồm các giả thuyết: H1, H2, H3, H5 và H7 được chấp nhận.
Mô hình hồi quy có được là:
Y = 35,075 + 0,567X1 - 2,307X2 + 1,769X3 + 0,502X5 - 0,181X7
Tương ứng:
Y = 35,075 + 0,567*LUONGVONVAY - 2,307*LAISUAT + 1,769*TAPHUAN + 0,502*DIENTICHDAT - 0,181*CHIPHI
So sánh giá trị (độ lớn) của hệ số β cho thấy: “laisuat” và “taphuan” là yếu tố tác động lớn nhất đến hiệu quả sử dụng vốn vay vượt trội hơn so với các yếu tố khác.
Kết luận: Qua kết quả phân tích hồi quy, các nhân tố được xem xét có khả năng ảnh hưởng đến hiệu quả sử dụng vốn vay được sử dụng cho mô hình hồi quy được giải thích như sau :
● LUONGVONVAY (X1): Biến số lượng vốn vay mang dấu (+) cho thấy, tổng lượng vốn vay và thu nhập từ lượng vốn vay (Y) có mối quan hệ tỷ lệ thuận với nhau, có nghĩa là khi các yếu tố khác không đổi, nếu tổng lượng vốn vay tăng lên 1 triệu đồng thì thu nhập từ lượng vốn vay tăng lên 0,567 triệu đồng.
● LAISUAT (X2): Biến số lãi suất tiền vay mang dấu (-) cho thấy, lãi suất vay vốn là nhân tố tác động tỷ lệ nghịch với thu nhập từ lượng vốn vay (Y) trong thời gian sử dụng vốn. Lãi suất càng cao sẽ làm cho thu nhập càng ít lại, cụ thể khi các yếu tố khác không đổi, nếu lãi suất (năm) tăng 1% thì thu nhập từ lượng vốn vay giảm xuống 0,43 triệu đồng (1 / 2,307 = 0,433).
● TAPHUAN (X3): Biến số tham gia tập huấn mang dấu (+) cho thấy, số lần tham gia tập huấn của chủ hộ có tương quan tỷ lệ thuận với thu nhập từ lượng vốn vay (Y). Những hộ có tham gia tập huấn thường có những hoạt động sản xuất tốt hơn. Hộ tham gia tập huấn thường họ nắm bắt được nhiều thông tin về kỹ thuật, học hỏi được nhiều kinh nghiệm, tiếp cận được nhiều kiến thức mới, tiến bộ, quy trình kỹ thuật trồng trọt... và còn nắm bắt được nhiều cơ hội đầu tư và định hướng được kế hoạch sản xuất, chi tiêu một cách hợp lý nhất khi sử dụng đồng vốn vay được. Vì thế, những hộ tham gia tập huấn càng nhiều thì sử dụng đồng vốn vào sản xuất càng hiệu quả. Cụ thể, khi các yếu tố khác không đổi, nếu hộ tham gia tập huấn thêm 1 lần thì thu nhập từ lượng vốn vay tăng lên 0,57 triệu đồng. (1 / 1,769 = 0,565).
● DIENTICHDAT (X5): Biến số diện tích đất sản xuất mang dấu (+) cho thấy, số m2 đất sản xuất (lúa) của chủ hộ có tương quan tỷ lệ thuận với thu nhập từ lượng vốn vay (Y). Những hộ có diện tích đất càng nhiều là những hộ có hoạt động sản