Xây dựng mô hình nghiên cứu

Một phần của tài liệu (LUẬN văn THẠC sĩ) các nhân tố ảnh hưởng đến khả năng trả nợ của học sinh, sinh viên tại chi nhánh ngân hàng chính sách xã hội tỉnh bến tre (Trang 34)

3.1.1 Mô hình hồi qui Binary Logistic

Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), với hồi qui Binary Logistic, thông tin cần thu thập về biến phụ thuộc là một sự kiện nào đó có xảy ra hay không, biến phụ thuộc Y là biến giả, chỉ nhận hai giá trị là 0 và 1, với 0 là không xảy ra sự kiện quan tâm và 1 là có xảy ra, và tất nhiên là cả thông tin về các biến độc lập X. Từ biến phụ thuộc nhị phân này, một thủ tục sẽ được dùng để dự đoán xác suất sự kiện xảy ra theo quy tắc nếu xác suất được dự đoán lớn hơn 0,5 thì kết quả dự đoán sẽ cho là “có” xảy ra sự kiện, ngược lại kết quả dự đoán sẽ là “không”. Chúng ta sẽ nghiên cứu mô hình hồi qui Binary Logistic trong trường hợp đơn giản nhất là khi chỉ có một biến độc lập X.

Mô hình hồi qui Binary Logistic có dạng như sau:

) ( ) ( i 0 1 1 0 1 = X) | 1 = E(Y = P B BX X B B e e   

Trong công thức này Pi = E(Y=1/X) = P(Y=1) gọi là xác suất để sự kiện xảy ra (Y=1) khi biến độc lập X có giá trị cụ thể Xi. Ký hiệu biểu thức (B0+B1X) là z, ta viết lại mô hình hàm hồi qui Binary Logistic như sau:

z z e e  1 = 1) = P(Y Vậy xác suất không xảy ra sự kiện là:

z e   1) 1- P(Y - 1 = 0) = P(Y

25

Thực hiện phép so sánh giữa xác suất một sự kiện xảy ra với xác suất sự kiện đó không xảy ra, tỷ lệ chênh lệch này có thể được thể hiện trong công thức:

z z z z e e e e Y P Y P       1 1 1 ) 0 ( ) 1 (

Lấy log cơ số e hai vế của phương trình trên rồi thực hiện biến đổi vế phải ta được kết quả là: z e e e log 0) P(Y 1) P(Y log        

Vì Logeez= z nên kết quả cuối cùng là:

X B1 0 e B 0) P(Y 1) P(Y log         

Hay viết cách khác: 0 B1X

i i e B P - 1 P log        (*)

(*) Đây là dạng hàm hồi qui Binary Logistic, và có thể mở rộng mô hình Binary Logistic cho hai hay nhiều biến độc lập Xk.

Mô hình Binary Logistic có thể là cơ sở để ngân hàng phân loại và nhận diện rủi ro. Thông qua kết quả từ mô hình, có thể ước lượng được xác suất không trả được nợ của khách hàng. Từ đó, ngân hàng có thể xác định khách hàng nào đang nằm trong vùng cảnh báo, khách hàng nào đang trong vùng an toàn và giúp ngân hàng chủ động trong việc đưa ra những biện pháp phù hợp để hạn chế rủi ro.

26

Hình 3.1: Mô hình nghiên cứu

Dựa vào một số nghiên cứu thực nghiệm liên quan đã được giới thiệu, trên nguyên tắc kế thừa và điều chỉnh sao cho phù hợp với thực tế tại vùng nghiên cứu, các số biến được đề xuất và đưa vào mô hình như sau:

LogePP((YY10)) = B0 + B1*GTINHSV + B2*HEDTAO + B3*QUYMO + B4*LSUAT + B5*VLAMSV + B6*TNHAPSV + B7*NPTHUOC + B8*DTGD + ε

Trong đó: B1, B2,…B8: Hệ số của các biến độc lập; B0: Hệ số chặn; ε : Sai số. Biến phụ thuộc Y đại diện cho KNTN vay của HSSV. Trong nghiên cứu này, biến phụ thuộc nhận những giá trị sau:

- Y = 0 nếu khách hàng không có KNTN; - Y = 1 nếu khách hàng có KNTN.

Có KNTN vay của HSSV được hiểu là khả năng HSSV trả nợ vay đúng hạn quy định trong hợp đồng vay vốn với NHCSXH và không có nợ quá hạn. Những trường hợp khoản vay nợ quá hạn xem như không có KNTN. Do đó, trong nghiên

Khả năng trả nợ vay Nhóm nhân tố liên quan đến HSSV  Giới tính  Việc làm  Thu nhập  Hệ đào tạo Nhóm nhân tố liên quan đến hộ gia đình HSSV

 Số người phụ thuộc

 Đối tượng gia đình

Nhóm nhân tố liên quan đến khoản vay

 Quy mô khoản vay

27

cứu này tác giả cho rằng những khoản vay bị phân loại thuộc nợ nhóm 3, 4, 5 theo Thông tư 09/2014/TT-NHNN được xem là không có KNTN. Các khái niệm và cách đo lường các biến được mô tả trong bảng 3.1.

Bảng 3.1: Mô tả các biến đo lường sử dụng trong nghiên cứu

Tên biến Định nghĩa Giá trị nhận biến Dấu kỳ vọng Biến phụ thuộc

KNTRANO Xác suất trả nợ

Y = 1 nếu HSSV có KNTN đúng hạn

Y = 0 nếu HSSV không có KNTN đúng hạn

Biến độc lập

GTINHSV Giới tính của HSSV =1 nếu là nam

=0 nếu là nữ -

HEDTAO Hệ đào tạo =1 nếu học đại học

=0 nếu học cao đẳng, trung cấp + QUYMO Quy mô khoản vay Tổng số tiền được giải ngân

(triệu đồng) -

LSUAT Lãi suất vay Lãi suất cho vay chương trình tín dụng đối với HSSV (%/năm)

+ VLAMSV Tình trạng việc làm

của HSSV sau khi ra trường

=1 nếu có việc làm

=0 nếu chưa có việc làm + TNHAPSV Thu nhập bình quân

của HSSV sau khi ra trường

Thu nhập bình quân của HSSV sau khi ra trường trên tháng (triệu đồng)

+ NPTHUOC Số người phụ thuộc

trong gia đình HSSV

Số thành viên không tạo ra thu nhập trong gia đình HSSV (người)

- DTGD Đối tượng gia đình

vay vốn HSSV

=1 hộ khó khăn về tài chính =0 hộ thuộc các đối tượng còn lại theo Quyết định 157

+ Nguồn: Tổng hợp của tác giả

28

3.1.3 Giả thuyết nghiên cứu

Trên cơ sở kết quả đạt được từ các nghiên cứu thực nghiệm đã được tìm hiểu và chứng minh, kế thừa và vận dụng vào bối cảnh thực tế tại vùng nghiên cứu, các giả thuyết nghiên cứu sử dụng trong đề tài:

Giả thuyết H1: Giới tính của HSSV có tác động đến KNTN vay. Kỳ vọng HSSV nữ có xác suất hoàn trả nợ vay cao hơn so với HSSV nam (Flint, 1997; Podgursky, 2002; Woo, 2002a, 2002b).

Giả thuyết H2: Chương trình đào tạo, hệ đào tạo (đại học, cao đẳng, trung cấp,…) có tác động đến KNTN của HSSV. Kỳ vọng HSSV học đại học sẽ làm tăng KNTN vay hơn so với các hệ đào tạo khác (Podgursky, Ehlert, Monroe, Watson và Wittstruck, 2002; Woo , 2002a, 2002b; Hillman, 2014).

Giả thuyết H3: Quy mô khoản vay có tác động đến KNTN của HSSV. Kỳ vọng quy mô khoản vay càng lớn càng làm giảm KNTN vay (Dynarski, 1994; Lochner và Monge Naranjo, 2004; Choy và Li, 2006).

Giả thuyết H4: Lãi suất khoản vay có tác động đến KNTN của HSSV. Lãi suất khoản vay càng cao sẽ càng làm giảm KNTN vay của khách hàng nói chung (Kohansal và Mansoori, 2009; Trương Đông Lộc và Nguyễn Thanh Bình, 2011). Tuy nhiên, chương trình tín dụng HSSV theo Quyết định 157 có mức lãi suất ưu đãi rất thấp hơn so với lãi suất thị trường. Kỳ vọng lãi suất càng thấp sẽ làm tăng KNTN vay của HSSV.

Giả thuyết H5: Tình trạng việc làm của HSSV có ảnh hưởng đến KNTN của HSSV. Kỳ vọng HSSV tìm được việc làm sau khi ra trường sẽ giúp tăng KNTN vay (California Postecondary, 2006; Dynarski, 1994; Monteverde, 2000).

Giả thuyết H6: Thu nhập của HSSV sau khi ra trường có tác động đến KNTN của HSSV. Kỳ vọng thu nhập sau khi ra trường càng cao sẽ càng làm tăng KNTN vay đúng hạn của HSSV (Boyd, 1997; Lochner và Monge Naranjo, 2004; Choy và Li, 2006).

29

Giả thuyết H7: Số người phụ thuộc trong mỗi hộ gia đình của HSSV có tác động đến KNTN vay của HSSV. Kỳ vọng sự gia tăng số người phụ thuộc trong gia đình sẽ làm giảm KNTN vay của HSSV (Dynarski, 1994; Volkwein, 1995, 1998; Woo, 2002).

Giả thuyết H8: Đối tượng hộ gia đình vay vốn HSSV (hộ nghèo, hộ cận nghèo và hộ khó khăn về tài chính) có tác động đến KNTN vay của HSSV. Kỳ vọng đối tượng gia đình vay vốn HSSV là hộ khó khăn về tài chính làm tăng KNTN vay đúng hạn hơn những đối tượng gia đình vay vốn HSSV còn lại theo Quyết định 157.

3.2 Dữ liệu nghiên cứu

Về kích cỡ mẫu trong phân tích hồi qui, kích thước mẫu phụ thuộc rất nhiều vào các yếu tố như: Mức ý nghĩa, độ mạnh của phép kiểm định và số lượng biến độc lập. Có nhiều kỹ thuật để chọn kích thước mẫu đại diện cho tổng thể. Một trong số đó là kỹ thuật xác định cỡ mẫu dựa trên kinh nghiệm của Green (1991) trích bởi Lưu Tiến Dũng (2013). Tác giả khuyến nghị công thức xác định cỡ mẫu nghiên cứu như sau: n > 50 + 8m. Trong đó, n là kích thước mẫu tối thiểu cần thiết và m là số lượng biến độc lập trong mô hình. Giả sử vẫn áp dụng kinh nghiệm chọn mẫu của Green (1991), với số biến độc lập là 8, vậy kích thước mẫu nghiên cứu tối thiểu bằng 115 quan sát.

Ngoài ra, Tabachnick và Fidell (2007) trích bởi Lưu Tiến Dũng (2013), còn cho rằng kích thước mẫu nghiên cứu cần đủ lớn để kết quả hồi qui được thuyết phục hơn. Các tác giả cũng đề xuất một công thức khác để xác định cỡ mẫu dựa trên kinh nghiệm như sau: n > 104 + m. Trong đó, n là kích thước mẫu tối thiểu cần thiết và m là số lượng biến độc lập trong mô hình. Áp dụng theo công thức của Tabachnick và Fidell (2007), với số biến độc lập là 8, vậy kích thước mẫu nghiên cứu tối thiểu trong nghiên cứu này phải bằng 113 quan sát để đảm bảo kích thước mẫu tương đối lớn và đại diện tốt cho tổng thể.

Phương pháp chọn mẫu xác suất ngẫu nhiên đơn giản được sử dụng để giảm bớt thời gian thu thập số liệu trong nghiên cứu. Theo Trần Tiến Khai (2014), đây là

30

phương pháp chọn mẫu không hạn chế, phương pháp chọn mẫu xác suất ngẫu nhiên đơn giản là hình thức đơn giản nhất, thuần nhất của cách chọn mẫu xác suất.

Đối với nghiên cứu, chọn 400 mẫu dữ liệu (thứ cấp) khách hàng vay vốn của HSSV thỏa mãn phạm vi nghiên cứu. Trong đó: 306 hồ sơ không phát sinh nợ quá hạn và 94 hồ sơ phát sinh nợ quá hạn được phân loại thuộc nợ nhóm 3, 4, 5 theo Thông tư 09/2014/TT-NHNN. Như vậy với những yêu cầu đặt ra đối với cỡ mẫu thì số quan sát là 400 đã đủ lớn và thỏa yêu cầu để tiến hành nghiên cứu.

Mẫu số liệu nghiên cứu được chia làm 2 nhóm: Nhóm 1 là nhóm có KNTN, nhóm 0 là nhóm không có KNTN theo bảng 3.2.

Bảng 3.2: Thống kê số liệu nghiên cứu

Nhóm Số lượng hồ sơ Tỷ lệ (%)

0 94 23,5

1 306 76,5

Tổng cộng 400 100

Nguồn: Tổng hợp của tác giả, 2019 Các thông tin thu thập từ dữ liệu khách hàng vay vốn HSSV, bao gồm: Giới tính của HSSV, hệ đào tạo, quy mô khoản vay, lãi suất vay, tình trạng việc làm, thu nhập bình quân của HSSV, số người phụ thuộc trong gia đình HSSV, đối tượng gia đình vay vốn HSSV.

3.3 Phương pháp nghiên cứu 3.3.1 Phương pháp thống kê mô tả 3.3.1 Phương pháp thống kê mô tả

Phương pháp thống kê mô tả sẽ được sử dụng để đưa ra một cái nhìn khái quát về những điều kiện đặc trưng của vùng nghiên cứu; sử dụng các dữ liệu thống kê trên cơ sở những dữ liệu có sẵn để tiến hành phân tích, đánh giá và giải thích sơ lược về hoạt động cho vay HSSV theo Quyết định 157 trên địa bàn tỉnh Bến Tre.

3.3.2 Các kiểm định

Mục đích của việc xây dựng và phân tích mô hình kinh tế lượng sử dụng hàm hồi quy Logistic là nhằm nhận diện và đánh giá mức độ tác động của từng nhân tố

31

ảnh hưởng. Các thông tin thu thập được thực tế sẽ được phân tích bằng phần mềm SPSS và STATA.

Trước khi chính thức thực hiện hồi quy Binary Logistic, đề tài tiến hành một số kiểm định ban đầu như: Phân tích tương quan để xem xét mối tương quan giữa các biến với nhau, đặc biệt là kiểm định xem có mối tương quan giữa biến phụ thuộc và các biến độc lập trong mẫu quan sát, hiện tượng đa cộng tuyến để kiểm tra vi phạm các biến độc lập trong mô hình có phụ thuộc lẫn nhau hay không. Khi các kiểm định này thoả, các kiểm định về mức độ phù hợp của mô hình và kiểm định thêm về tính nội sinh của mô hình với các giả thiết về hệ số hồi quy sẽ được tiếp tục tiến hành và phân tích.

Phân tích tương quan

Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập, vì điều kiện để hồi quy là trước nhất phải tương quan (sig. < 0,05). Phân tích này dựa trên kết quả hệ số tương quan trong ma trận hệ số tương quan giữa các biến trong mô hình nghiên cứu.

Kiểm định hiện tượng đa cộng tuyến

Để dò tìm và phát hiện hiện tượng đa cộng tuyến, nghiên cứu sử dụng công cụ hệ số phóng đại phương sai (VIF - Variance Inflation Factor), quy tắc là khi VIF vượt quá 10 thì mô hình có xảy ra hiện tượng đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).

Một biện pháp dò tìm khác cũng khá hiệu quả đó là xem xét các hệ số tương quan tuyến tính giữa các biến giải thích trong ma trận hệ số tương quan. Nếu tồn tại mối quan hệ tương quan mạnh giữa các biến độc lập với nhau thì mô hình có khả năng xảy ra hiện tượng đa cộng tuyến.

Nếu mô hình nghiên cứu có tồn tại hiện tượng đa cộng tuyến, đề tài sử dụng phương pháp loại bỏ bớt biến giải thích ra khỏi mô hình, cụ thể như sau:

Bước 1: Xem cặp biến giải thích nào có quan hệ chặt chẽ. Giả sử X2, X3,… Xk là các biến độc lập, Y là biến phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau.

32

Bước 2: Tính R2 đối với các hàm hồi quy: Có mặt cả hai biến; không có mặt một trong hai biến.

Bước 3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn.

Kiểm định mức độ phù hợp của mô hình

Kiểm định độ phù hợp tổng quát: Đối với kiểm định này, hồi quy Logistic sử dụng kiểm định Chi-square để xem các biến số đưa vào mô hình thực sự có ý nghĩa trong việc giải thích cho biến phụ thuộc không. Kết luận được đánh giá dựa vào mức ý nghĩa quan sát mà SPSS đưa ra trong bảng Omnibus Tests of Model Coefficients. Nếu sig. nhỏ hơn mức ý nghĩa đưa ra thì có thể khẳng định tồn tại mối tương quan giữa các biến độc lập và biến phụ thuộc trong mô hình nghiên cứu.

Đo lường độ phù hợp của mô hình hồi quy Logistic còn được dựa trên chỉ tiêu -2LL (viết tắt của -2 log likelihood), thước đo này càng nhỏ càng tốt vì -2LL càng nhỏ càng thể hiện độ phù hợp của mô hình cao. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số), khi đó mô hình có độ phù hợp hoàn hảo.

Ngoài ra, chúng ta cùng có thể xác định được mô hình dự đoán tốt đến đâu qua bảng phân loại Clasification Table do SPSS đưa ra, bảng này sẽ so sánh số thực và số dự đoán cho từng biểu hiện và tính tỷ lệ đoán đúng sự kiện.

Kiểm định ý nghĩa của các hệ số

Trong hồi quy Logistic, kiểm định Wald sẽ được sử dụng để kiểm định ý nghĩa thống kê của các hệ số hồi quy tổng thể.

Cách thức sử dụng mức ý nghĩa sig. cho kiểm định Wald cũng theo nguyên tắc thông thường, nếu sig. nhỏ hơn mức ý nghĩa đưa ra thì kết luận có ý nghĩa về mặt thống kê và ngược lại.

Kiểm định phương sai sai số thay đổi

Phương sai của phần dư thay đổi là hiện tượng các giá trị phần dư có phân phối không giống nhau, và giá trị phương sai không như nhau. Bỏ qua phương sai của phần dư thay đổi sẽ làm cho ước lượng của các hệ số hồi quy không hiệu quả.

33

Để kiểm tra hiện tượng này, nghiên cứu sử dụng kiểm định Spearman, nếu sig. > 0,05 thì phương sai phần dư không đổi và ngược lại.

3.4 Quy trình phân tích và xử lý dữ liệu trên SPSS

Một phần của tài liệu (LUẬN văn THẠC sĩ) các nhân tố ảnh hưởng đến khả năng trả nợ của học sinh, sinh viên tại chi nhánh ngân hàng chính sách xã hội tỉnh bến tre (Trang 34)

Tải bản đầy đủ (PDF)

(84 trang)