Phƣơng pháp phân tích hồi quy

3.6.1 .Phƣơng pháp phân tích, xử lý số liệu

3.6.3. Phƣơng pháp phân tích hồi quy

Trên cơ sở thiết lập phƣơng trình, tiến hành hồi quy, kiểm định ý nghĩa các biến độc lập, từ đó nghiên cứu, phân tích các nhân tố ảnh hƣởng đến khả năng trả nợ của hộ vay vốn chƣơng trình học sinh sinh viên trên địa bàn TP.HCM

3.6.3.1. Mô hình kinh tế lượng tổng quátĐể tiến hành đo lƣờng những nhân

tố tác động lên khả năng trả nợ của hộ vay vốn chƣơng trình học sinh sinh viên trên địa bàn TP.HCM, đề tài tiến hành dựa trên mô hình hồi quy Binary Logistic để phân tích mối liên hệ giữa biến phụ thuộc với các biến độc lập.

Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), với mô hình hồi quy Binary Logistic, thông tin cần thu thập về biến phụ thuộc Y và biến độc lập X. Đây là mô hình định lƣợng với biến phụ thuộc Y là biến giả, chỉ nhận hai giá trị là 0 và 1, với giá trị bằng 0 là không xảy ra sự kiện và bằng 1 là có xảy ra.

3.6.3.2. Mô hình hồi quy Binary Logistic (Logit)

Mô hình hồi quy Binary Logistic (hoặc mô hình Logit) là một mô hình toán học hồi quy để xem xét mối liên hệ giữa biến phụ thuộc Y và tất cả các biến độc lập (Xi), có dạng nhƣ sau:

Trong công thức này Pi là kỳ vọng xác suất Y=1 với điều kiện Xi xảy ra. Xi là biến độc lập. Khi đó, xác suất không xảy ra sự kiện là:

P(Y=0) = 1 – P(Y=1)

Ý nghĩa của mô hình: Trong điều kiện các yếu tố khác không đổi, khi biến độc lập Xi thay đổi 1 đơn vị thì biến phụ thuộc Y sẽ thay đổi 1 lƣợng βi so với ban đầu. Nếu hệ số hồi quy βi dƣơng thì nhân tố Xi sẽ có tác động cùng chiều và ngƣợc lại nếu hệ số hồi quy βi âm thì nhân tố Xi sẽ có tác động ngƣợc chiều.

Trên cơ sở các nghiên cứu liên quan, một số biến đƣợc đề xuất, đề tài đƣa ra mô hình nhƣ sau:

= β0 + β1GTINH+ β2TRDO + β3NGHENGHIEP + β4TVHOI + β5QMO + β6LSTD + β7YTHUC + β8NCAU + ε

Trong đó, khả năng trả nợ (KNTRNO) là biến phụ thuộc. Quan sát này sẽ nhận đƣợc giá trị là 1 thì đƣợc xem là hộ có khả năng trả nợ, không phát sinh nợ quá hạn và ngƣợc lại nhận giá trị bằng 0 nếu hộ có phát sinh nợ quá hạn. Ngoài ra, để đảm bảo mô hình không bị mắc các khuyết tật về dữ liệu và sai lệch, đề tài sẽ tiến hành kiểm định tự tƣơng quan, đa cộng tuyến và phƣơng sai thay đổi (nếu có), từ đó sẽ tiến hành điều chỉnh nhằm mang lại kết quả chính xác hơn cho đề tài.

3.6.3.3. Các kiểm định

Trƣớc khi chính thức thực hiện hồi quy Binary Logistic, nghiên cứu tiến hành một số kiểm định ban đầu nhƣ: Phân tích tƣơng quan để xem xét mối tƣơng quan giữa các biến với nhau, đặc biệt là kiểm định xem có mối tƣơng quan giữa biến phụ thuộc và các biến độc lập trong mẫu quan sát, hiện tƣợng đa cộng tuyến để kiểm tra vi phạm các biến độc lập trong mô hình có phụ thuộc lẫn nhau hay không. Khi các kiểm định này thỏa mãn, các kiểm định về mức độ phù hợp của mô hình và kiểm định thêm về tính nội sinh của mô hình với các giả thiết về hệ số hồi quy sẽ đƣợc tiến hành và phân tích.

Mục đích chạy tƣơng quan Pearson nhằm kiểm tra mối tƣơng quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập, vì điều kiện để hồi quy là trƣớc nhất phải tƣơng quan (sig.< 0,05). Phân tích này dựa trên kết quả hệ số tƣơng quan trong ma trận hệ số tƣơng quan giữa các biến trong mô hình nghiên cứu.

* Kiểm định đa cộng tuyến

Để dò tìm và phát hiện hiện tƣợng đa cộng tuyến, nghiên cứu sử dụng công cụ phóng đại phƣơng sai (VIF – Variance Inflation Factor), quy tắc là khi VIF vƣợt quá 10 thì mô hình xảy ra hiện tƣợng đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).

Một biện pháp dò tìm khác cũng khá hiệu quả đó là xem xét các hệ số tƣơng quan tuyến tính giữa các biến giải thích trong ma trận hệ số tƣơng quan. Nếu tồn tại mỗi quan hệ tƣơng quan mạnh giữa các biến độc lập với nhau thì mô hình có khả năng xảy ra hiện tƣợng đa cộng tuyến.

Trƣờng hợp nếu mô hình nghiên cứu có xảy ra hiện tƣợng đa cộng tuyến, đề tài sử dụng phƣơng pháp loại bỏ bớt biến giải thích ra khỏi mô hình, cụ thể nhƣ sau:

Bƣớc 1: Xem cặp biến nào có quan hệ chặt chẽ. Giả sử X2, X3,... X klà các biến độc lập, Y là biến phụ thuộc và X2, X3 có tƣơng quan chặt chẽ với nhau.

Bƣớc 2: Tính R2 đối với các hàm hồi quy: Có mặt cả hai biến; không có mặt một trong hai biến.

Bƣớc 3: Loại biến mà giá trị R2 tính đƣợc khi không có mặt biến đó là lớn hơn.

* Kiểm định mức độ phù hợp của mô hình

Kiểm định độ phù hợp tổng quát: Đối với kiểm định này, hồi quy Logistic sử dụng kiểm định Chi-square để xem các biến số đƣa vào mô hình thực sự có ý nghĩa trong việc giải thích cho biến phụ thuộc hay không. Kết luận đƣợc đánh giá dựa vào mức ý nghĩa quan sát mà SPSS đƣa ra trong bảng Omnibus Tests of Model

Coefficients. Nếu sig. Nhỏ hơn mức ý nghĩa đƣa ra thì có thể khẳng định tồn tại mối tƣơng quan giữa các biến độc lập và biến phụ thuộc trong mô hình nghiên cứu. Đo lƣờng sự phù hợp của mô hình hồi quy Logistic còn đƣợc dựa trên chỉ tiêu -2LL (viết tắt của -2 log likelihood), thƣớc đo này càng nhỏ càng tốt vì -2LL càng nhỏ thì càng thể hiện độ phù hợp của mô hình cao. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số), khi đó mô hình có độ phù hợp hoàn hảo.

Ngoài ra, ta cũng có thể xác định đƣợc mô hình dự đoán tốt đến đâu qua bảng phân loại Clasification Table do SPSS đƣa ra, bảng này sẽ so sánh số thực và số dự đoán cho từng biểu hiện và tính tỷ lệ đoán đúng.

* Kiểm định ý nghĩa của các hệ số (kiểm định Wald)

Trong hồi quy Logistic, kiểm định Wald sẽ đƣợc sử dụng để kiểm định ý nghĩa thống kê của các hệ số hồi quy tổng thể.

Cách thức sử dụng mức ý nghĩa sig. Cho kiểm định Wald cũng theo nguyên tắc thông thƣờng, nếu sig. nhỏ hơn mức ý nghĩa đƣa ra thì kết luận có ý nghĩa về mặt thống kê và ngƣợc lại.

* Kiểm định Hosmer và Lemeshow

Kiểm định Hosmer-Lemeshow (1980) là kiểm định sự phù hợp của hàm hồi quy với biến độc lập là biến nhị phân. Kiểm định này đƣợc sử dụng rất phổ biến nhƣng bên cạnh đó vẫn còn nhiều điểm chƣa đƣợc phù hợp.

Thông thƣờng, để đánh giá mức độ giải thích (predict power) của biến độc lập cho biến phụ thuộc ngƣời ta dùng R2. Chỉ số này cho biết những biến độc lập giải thích đƣợc bao nhiêu % sự thay đổi của biến phụ thuộc.

Ngƣợc lại, goodness-of-fit (GOF) tests cho biết liệu mô hình đã chọn có chính xác hay không. Nếu p-value thấp (<0.05) loại bỏ mô hình, p-value cao thì chấp nhận mô hình.

Mô hình với biến phụ thuộc là nhị phân, thông thƣờng phải dùng link function (logit, probit, log-log hay hàm gì đó) tức là mô hình không trực tiếp dự

báo xác suất. Vì vậy, kể cả trƣờng hợp tuyến tính hay phi tuyến, vẫn có thể có trƣờng hợp R2 cao, nhƣng mô hình phân loại không chính xác và ngƣợc lại R2 thấp nhƣng mô hình lại phân loại chính xác.

* Kiểm định phƣơng sai, sai số thay đổi

Phƣơng sai của phần dƣ thay đổi là hiện tƣợng các giá trị phần dƣ có phân phối không giống nhau và giá trị phƣơng sai không nhƣ nhau. Bỏ qua phƣơng sai của phần dƣ thay đổi sẽ làm cho ƣớc lƣợng của các hệ số hồi quy không hiệu quả. Để kiểm tra hiện tƣợng này, nghiên cứu sử dụng kiểm định Spearman, nếu sig.> 0,05 thì phƣơng sai phần dƣ không đổi và ngƣợc lại.

TÓM TẮT CHƢƠNG 3

Dựa vào cơ sở lý luận đƣợc tác giả phân tích ở chƣơng 2. Để giải quyết mục tiêu nghiên cứu của đề tài liên quan đến các nhân tổ ảnh hƣởng đến khả năng trả nợ của hộ vay Chƣơng trình học sinh sinh viên tại NHCSXH trên địa bàn TP. Hồ Chí Minh, đề tài sử dụng phƣơng pháp nghiên cứu định lƣợng trong quá trình nghiên cứu. Nội dung chƣơng 3 chủ yếu tập trung trình bày chi tiết phƣơng pháp nghiên cứu sử dụng trong luận văn. Trƣớc hết tác giả trình bày về phƣơng pháp và thiết kế nghiên cứu, quy trình nghiên cứu, mẫu nghiên cứu, kích cỡ mẫu và công cụ nghiên cứu. Ngoài ra, trong chƣơng này cũng đã nêu các phƣơng pháp thu thập dữ liệu nghiên cứu và những phƣơng pháp phân tích sử dụng trong đề tài bao gồm: Phƣơng pháp phân tích hồi quy Binary Logistic, phƣơng pháp kiểm định mô hình nghiên cứu. Đây là nền tảng quan trọng cho bƣớc phân tích và thảo luận kết quả trong chƣơng tiếp theo.

Thủ tục và quy trình cho vay

xuất mô hình nghiên cứu và giả thuyết