Chƣơng 4 : KẾT QUẢ NGHIÊN CỨU
4.3. Phân tích hồi quy
4.3.1. Tiếp cận tín dụng chính thức
Trong phần này chúng tôi nghiên cứu m i quan hệ giữa VXH và tiếp cận tín dụng chính thức. Vì biến phụ thuộc là một biến có hai biểu hiện (dichotomous) nên chúng tôi sử dụng các mơ hình hồi quy binary logistic để ƣớc lƣợng. Mặc dù có nhiều thuận lợi về s giả định so với mơ hình hồi quy đa biến dựa tr n phƣơng pháp OLS, mơ hình hồi quy binary logistic cũng có hai vấn đề cần đƣợc xử lý: đa cộng tuyến (multicollinearity) và giá trị dị biệt (outliers). Ngoài ra, cỡ mẫu phù hợp để áp dụng
mơ hình này t i thiểu là 10 quan sát cho 1 biến giải thích, và tỉ lệ t t hơn n n là 20:1(Schwab, 2007).
Bảng 4.8. trình bày kết quả hai mơ hình hồi quy binary logistic: mơ hình 1-A chỉ bao gồm biến phụ thuộc ca_fl và các biến độc lập fl_net, inf_net và trust; mơ hình 1-B bao gồm các biến kiểm soát, bên cạnh các biến gi ng nhƣ trong mơ hình 1-A. Việc hình thành 2 mơ hình khác nhau nhằm khám phá những tác động riêng biệt đến tiếp cận tín dụng chính thức của các thành phần VXH và các đặc điểm nhân khẩu học cũng nhƣ đặc điểm của khoản vay.
Kết quả phân tích tƣơng quan (Bảng 4.8.) giữa các biến độc lập và các biến kiểm sốt với nhau cho thấy khơng có vấn đề về đa cộng tuyến khi các hệ s tƣơng quan tƣơng đ i thấp, cao nhất chỉ là 0,542 (vấn đề đa cộng tuyến xảy ra khi có sự tƣơng quan cao, cụ thể là r > 0,7). Bên cạnh việc xem xét ma trận tƣơng quan, sai s chuẩn (standard error) của các biến giải thích cũng đƣợc kiểm tra để dị tìm hiện tƣợng đa cộng tuyến. Kết quả kiểm tra sai s chuẩn cho thấy rằng cả hai mơ hình khơng có vấn đề về đa cộng tuyến vì khơng có sai s chuẩn của biến dự báo nào lớn hơn 2. Sau khi kiểm tra không phát hiện đa cộng tuyến đ i với các biến giải thích, bƣớc tiếp theo là dị tìm các giá trị dị biệt bằng cách quan sát các phần dƣ chuẩn hóa (standardized residuals) và khoảng cách Cook’s (Cook’s distance) sau khi chạy mơ hình hồi quy binary logistic. Kết quả dị tìm trong hai mơ hình khơng phát hiện giá trị tuyệt đ i của phần dƣ chuẩn hóa nào lớn hơn hoặc bằng 3, hoặc khoảng cách Cook’s lớn hơn hoặc bằng 1-những giá trị cho biết một quan sát trong bộ dữ liệu chứa giá trị dị biệt.
Về tính phù hợp của quy mơ mẫu, mỗi mơ hình có 859 quan sát và s biến giải thích t i đa đƣa vào một mơ hình là 16, tính ra s quan sát trên một biến giải thích t i thiểu là khoảng 53 cho 1 biến. Tỉ lệ này t t hơn rất nhiều so với yêu cầu về cỡ mẫu khi áp dụng mơ hình hồi quy binary logistic.
Mơ hình 1-A: hồi quy biến phụ thuộc ca_fl theo các biến độc lập fl_net, inf_net và trust
Bảng 4.10. Hồi quy binary logistic (N = 859)
(A) (B) Biến độc lập β (SE) Wald Exp(β) β (SE) Wald Exp(β) Mạng lưới chính thức -0.177*** (0,067) 7,047 0,838 -0.200** (0,097) 4,217 0,819 Mạng lưới phi chính thức 0,013 (0,011) 1,374 1,013 -0.005 (0,017) 0,089 0,995 Niềm tin -0,148 (0,113) 1,709 0,863 -0,019 (0,153) 0,015 0,981 Chủ hộ 0,081 (0,271) 0,088 1,084 Giới tính 0,375 (0,253) 2,194 1,455 Tuổi 0,071 (0,045) 2,462 1,074 (Tuổi)2 0,000 (0,000) 2,327 0,999 Trình độ học vấn 0,038 (0,030) 1,577 1,039 Dân tộc -0,854*** (0,239) 12,767 0,426 Tài sản thế chấp 4,508*** (0,385) 137,400 90,708 Thu nhập hộ gia đình 0,000 (0,000) 0,004 1,000 Khoảng cách 0,001 (0,003) 0,165 0,999 2 9,774 422,517 Bậc tự do 3 12 Giá trị p 0,021 0,000 Cox-Snell Pseudo-R2 0,011 0,389 Nagelkerke Pseudo-R2 0,015 0,521 -2Log Likelihood 1167,690 754,947
Chú thích: Ƣớc lƣợng hồi quy binary logistic-Biến phụ thuộc: khả năng tiếp cận các khoản vay từ các tổ chức tài chính chính thức (ca_fl); trong mơ hình B, biến vùng đƣợc kiểm soát. Trong ngoặc là sai s chuẩn.***,** và * tƣơng ứng chỉ ý nghĩa ở các mức 1%, 5% và 10%.
Kết quả phân tích hồi quy của mơ hình 1- đƣợc trình bày trong các cột 2, 3, và 4 của Bảng 4.10. Giá trị Chi-square của mơ hình là 9,774 có ý nghĩa với p = 0,021 (nhỏ hơn 0,05), điều này kết luận rằng có m i quan hệ giữa biến phụ thuộc và tập biến độc lập. Mặc dù vậy, độ mạnh của m i quan hệ này không cao khi giá trị Nagelkerke Pseudo-R2 rất gần 0, chỉ là 0,015. Cụ thể hơn, kết quả phân tích của mơ hình này chứng minh rằng có m i quan hệ có ý nghĩa th ng kê ở mức p ≤ 0,01 đ i với mạng lƣới quan hệ xã hội chính thức. Tuy nhiên, hai biến độc lập cịn lại khơng có ý nghĩa th ng kê ở mức p ≤ 0,1. Nói cách khác, kết quả phân tích hồi quy binary logistic đ i với các thành phần của VXH cho thấy rằng chỉ có thành phần mạng lƣới quan hệ xã hội chính thức là có ý nghĩa th ng kê trong việc giải thích khả năng tiếp cận tín dụng chính thức của hộ gia đình. Hệ s β nhỏ hơn 0 và Exp(β) nhỏ hơn 1 cho thấy mạng lƣới chính thức có quan hệ ngƣợc chiều với khả năng tiếp cận tín dụng chính thức.
Mơ hình 1-B: hồi quy biến phụ thuộc ca_fl theo các biến độc lập fl_net, inf_net và trust và các biến kiểm sốt
Trong mơ hình 1-B, bên cạnh các biến độc lập là các thành phần của VXH, chúng tơi cịn thêm vào các biến đóng vai trị là biến kiểm sốt trong mơ hình 1-A, cụ thể là các biến age, sex, edu, inc, h_head, ethnic, collat, và distance. Kết quả phân tích hồi quy binary logistic của mơ hình này đƣợc trình bày trong các cột 5, 6, và 7 của Bảng 4.10. Các giá trị kiểm định cho thấy có m i quan hệ khá mạnh giữa biến phụ thuộc và tập biến giải thích với Chi-square bằng 422,517 (p = 0,000 nhỏ hơn 0,01) và Nagelkerke Pseudo-R2 bằng 0,521. Sự xuất hiện của các yếu t thuộc đặc điểm nhân khẩu học và đặc điểm khoản vay không làm thay đổi đáng kể tác động của các thành phần VXH đến khả năng tiếp cận tín dụng chính thức so với mơ hình 1-A. Cụ thể trong ba biến độc lập, cũng chỉ có biến mạng lƣới các quan hệ xã hội chính thức có quan hệ có ý nghĩa th ng kê với biến phụ thuộc ở mức ý nghĩa p ≤ 0,05. Kết quả này khẳng định rằng thành phần mạng lƣới quan hệ chính thức của VXH thực sự có tác động đến tiếp cận tín dụng chính thức. Ngồi ra, mơ hình 1-B cũng chỉ ra một s yếu t khác có ảnh hƣởng đến khả năng tiếp cận tín dụng chính thức của các hộ gia
đình, đó là thành phần dân tộc và tài sản thế chấp có ý nghĩa th ng kê ở mức 1%. Tác động của các yếu t này đến khả năng tiếp cận tín dụng chính thức đƣợc giải thích nhƣ sau.
Mạng lưới quan hệ xã hội chính thức: hệ s β nhỏ hơn 0 và Exp(β) nhỏ hơn 1
chứng tỏ mạng lƣới quan hệ xã hội chính thức có quan hệ ngƣợc chiều với khả năng tiếp cận tín dụng chính thức. Exp(β) = 0,819 đồng nghĩa với sự gia tăng một đơn vị mạng lƣới quan hệ xã hội chính thức làm giảm tỉ lệ so sánh (odds) giữa xác suất tiếp cận đƣợc tín dụng chính thức và xác suất khơng tiếp cận đƣợc tín dụng chính thức 18,1% (-0,181 = 0,819 - 1).
Tài sản thế chấp: hệ s β dƣơng và Exp(β) lớn hơn 1 cho thấy những ngƣời đi vay
khơng thế chấp tài sản có nhiều khả năng tiếp cận các nguồn tín dụng ít chính thức hơn. Giá trị Exp(β) bằng 90,708 chỉ ra rằng khi chuyển từ vay mƣợn khơng thế chấp thành vay mƣợn có thế chấp thì tỉ lệ hộ gia đình tiếp cận tín dụng chính thức so với hộ gia đình tiếp cận các loại tín dụng khác tăng 90,708 lần.
Dân tộc: hệ s β nhỏ hơn 0 và Exp(β) nhỏ hơn 1 kết luận rằng những hộ gia đình
dân tộc thiểu s có nhiều khả năng thuộc nhóm tiếp cận tín dụng chính thức so với các hộ gia đình dân tộc Kinh. Giá trị Exp(β) bằng 0,426 cho biết một sự thay đổi về thành phần dân tộc (chuyển từ dân tộc thiểu s sang dân tộc Kinh) làm giảm tỉ lệ hộ gia đình tiếp cận tín dụng chính thức so với hộ gia đình tiếp cận các loại tín dụng khác 57,4% (-0,574 = 0,426 - 1).
4.3.2. Tiếp cận tín dụng từ các lo i hình khác nhau
Trong phần này, mơ hình ƣớc lƣợng multinomial logistic đƣợc sử dụng để tìm hiểu m i quan hệ giữa VXH và tiếp cận tín dụng từ những nguồn khác nhau-tín dụng chính thức, tín dụng bán chính thức và tín dụng phi chính thức. Hồi quy multinomial logistic so sánh đa nhóm thơng qua sự kết hợp của các mơ hình hồi quy binary logistic, và do đó mơ hình ƣớc lƣợng này khơng yêu cầu các giả định về phân ph i chuẩn, tuyến tính, và phƣơng sai đồng nhất đ i với các biến độc lập (Schwab, 2007). Tuy nhi n, tƣơng tự nhƣ hồi quy binary logistic, việc kiểm tra đa
cộng tuyến và các giá trị dị biệt là cần thiết nhằm đảm bảo kết quả ƣớc lƣợng phù hợp với thực tế. Bên cạnh đó, cỡ mẫu cũng là một u cầu khi áp dụng mơ hình này. Vì dữ liệu sử dụng trong phân tích này cũng là mẫu nghiên cứu gồm có 859 quan sát và các biến giải thích nhƣ trong các mơ hình hồi quy binary logistic nên tỉ lệ quan sát trên một biến độc lập thỏa mãn yêu cầu khi áp dụng mơ hình hồi quy multinomial logistic là 20:1 (Schwab, 2007).
Việc kiểm tra các giá trị dị biệt và đa cộng tuyến đƣợc thực hiện trong quá trình chạy mơ hình hồi quy multinomial logistic bằng SPSS 16. Cũng gi ng nhƣ nghi n cứu về m i quan hệ giữa tiếp cận tín dụng chính thức và VXH, chúng tơi hồi quy biến phụ thuộc theo các thành phần của VXH-mạng lƣới quan hệ xã hội chính thức, mạng lƣới quan hệ phi chính thức và niềm tin (mơ hình 2-A) và hồi quy biến phụ thuộc theo các biến độc lập và biến kiểm sốt (mơ hình 2-B).
Hồi quy multinomial logistic trong SPSS 16 không hỗ trợ việc kiểm tra các giá trị dị biệt. Do đó, để xác định các giá trị này, chúng tôi chạy hai mơ hình hồi quy binary logistic: mơ hình a gồm các quan sát chứa biến phụ thuộc có giá trị 1 và 2, và mơ hình b gồm các quan sát chứa biến phụ thuộc có giá trị 1 và 3. Với mỗi mơ hình chúng tơi xác định giá trị dị biệt nhƣ trình bày trong phần hồi quy binary logistic, tức là dựa vào các giá trị phần dƣ chuẩn hóa và khoảng cách Cook’s. Kết quả hồi quy li n quan đến mơ hình 2-A khơng phát hiện các giá trị dị biệt, trong khi đ i với mơ hình 2-B, chúng tơi phát hiện 10 giá trị dị biệt. Để xác định ảnh hƣởng của các giá trị dị biệt này, chúng tôi so sánh tỉ lệ chính xác của hai lần chạy hồi quy multinomial logistic đ i với mơ hình 2-B: lần thứ nhất với toàn bộ mẫu gồm 859 quan sát và lần thứ hai với mẫu đ loại bỏ các giá trị dị biệt. Với tồn bộ mẫu, tỉ lệ chính xác phân nhóm (classification accuracy rate) là 67,5% (Phụ lục 4c). Sau khi loại bỏ các giá trị dị biệt, tỉ lệ này đƣợc cải thiện thành 68,0% (Phụ lục 4b). Tuy nhi n, lƣợng tăng th m không quá 2% nên mơ hình với toàn bộ mẫu sẽ đƣợc sử dụng để giải thích kết quả (Schwab, 2007).
Việc phát hiện đa cộng tuyến đƣợc thực hiện dựa vào sai s chuẩn (standard error) của các hệ s hồi quy. Theo Schwab (2007), sai s chuẩn của một hệ s hồi quy lớn hơn 2 báo hiệu có những vấn đề li n quan đến s liệu (numerical problems), chẳng hạn nhƣ hiện tƣợng đa cộng tuyến giữa các biến độc lập. Bảng 4.9. trình bày các kết quả hồi quy multinomial logistic của các mô hình 2-A và 2-B, trong đó khơng có biến độc lập nào có sai s chuẩn lớn hơn 2.
Mơ hình 2-A: hồi quy biến phụ thuộc ca_type theo các biến độc lập fl_net, inf_net và trust
Kết quả phân tích hồi quy của mơ hình 2- đƣợc trình bày trong các cột từ 2 đến 7 của Bảng 4.11. Trong phần phân tích này, xác suất giá trị Chi-square của mơ hình (17,4) là 0,008, nhỏ hơn mức ý nghĩa 0,05. Điều này kết luận rằng có m i quan hệ giữa biến phụ thuộc và tập biến độc lập. Tuy nhi n, độ mạnh của m i quan hệ này khá thấp vì giá trị Nagelkerke Pseudo-R2 chỉ bằng 0,024.
Về m i quan hệ của từng biến độc lập với biến phụ thuộc, kết quả kiểm định likelihood ratio (Phụ lục 4a) cho thấy chỉ duy nhất m i quan hệ giữa mạng lƣới quan hệ xã hội chính thức và khả năng tiếp cận tín dụng từ các loại hình khác nhau có ý nghĩa th ng kê (p = 0,001). Ngoài ra, đ i với việc phân biệt giữa nhóm tiếp cận tín dụng bán chính thức và nhóm tiếp cận tín dụng chính thức, biến độc lập này cũng có ý nghĩa th ng kê ở mức 1%, bên cạnh biến niềm tin có ý nghĩa th ng kê ở mức 10% .
Mạng lưới quan hệ xã hội chính thức: hệ s β lớn hơn 0 và Exp(β) lớn hơn 1 cho
biết các hộ gia đình đƣợc khảo sát có mạng lƣới quan hệ chính thức rộng hơn có nhiều khả năng thuộc nhóm trả lời tiếp cận tín dụng bán chính thức hơn là thuộc nhóm trả lời tiếp cận tín dụng chính thức. Với mỗi đơn vị tăng th m của mạng lƣới quan hệ chính thức, log(odds) tăng th m 0,378 hay tỉ lệ so sánh giữa xác suất tiếp cận tín dụng bán chính thức và xác suất tiếp cận tín dụng chính thức tăng th m 46%.
Niềm tin: hệ s β = 0,355 và Exp(β) = 1,426 chỉ ra rằng những ngƣời trong mẫu
điều tra có niềm tin cao hơn đ i với cộng đồng có nhiều khả năng thuộc nhóm trả lời tiếp cận đƣợc tín dụng bán chính thức hơn là thuộc nhóm trả lời tiếp cận đƣợc tín dụng chính thức. Với mỗi đơn vị tăng th m của niềm tin, log(odds) tăng th m 0,355 hay tỉ lệ so sánh giữa xác suất tiếp cận tín dụng bán chính thức và xác suất tiếp cận tín dụng chính thức tăng th m 42,6%.
Trong khi đó, đ i với m i quan hệ giữa nhóm tiếp cận tín dụng phi chính thức và nhóm tiếp cận tín dụng chính thức, cả ba biến độc lập trong mơ hình 2-A khơng thể hiện ý nghĩa th ng kê.
Mơ hình 2-B: hồi quy biến phụ thuộc ca_type theo các biến độc lập fl_net, inf_net và trust và các biến kiểm sốt
Trong mơ hình 2-B, chúng tơi tìm hiểu tác động đến tiếp cận tín dụng thuộc các loại hình khác nhau của những yếu t truyền th ng bên cạnh các biến độc lập là các thành phần của VXH. Cụ thể, chúng tơi thêm vào các biến đóng vai trị là biến kiểm sốt trong mơ hình 2- , đó là các biến age, sex, edu, inc, h_head, ethnic, collat, và
distance. Kết quả phân tích hồi quy multinomial logistic của mơ hình này đƣợc
trình bày trong các cột từ 8 đến 13 của Bảng 4.11.
Giá trị Chi-square bằng 464,384 (p = 0,000) và Nagelkerke Pseudo-R2 bằng 0,493 chứng minh rằng có m i quan hệ khá mạnh giữa biến phụ thuộc và tập biến giải thích. Tuy nhiên, khi có sự hiện diện của các yếu t thuộc đặc điểm nhân khẩu học và đặc điểm khoản vay trong mơ hình, kết quả ƣớc lƣợng cho thấy, trong ba thành phần của VXH mà nghiên cứu này quan tâm, chỉ còn thành phần mạng lƣới quan hệ xã hội chính thức có ý nghĩa th ng k đ i với biến phụ thuộc. Ngồi ra, tƣơng tự nhƣ mơ hình 1-B, việc tiếp cận tín dụng từ các loại hình khác nhau cũng chịu tác động của các yếu t khác. Cụ thể, đ i với việc phân biệt giữa nhóm tiếp cận tín dụng bán chính thức và nhóm tiếp cận tín dụng chính thức, biến tài sản thế chấp có tác động ở mức ý nghĩa th ng kê 1% và biến giới tính có ý nghĩa th ng kê ở mức 5%; đ i với việc phân biệt giữa nhóm tiếp cận tín dụng phi chính thức và nhóm tiếp
cận tín dụng chính thức, các yếu t ảnh hƣởng gồm có dân tộc, tài sản thế chấp (ở