Mô hình hồi quy tuyến tính được sử dụng như một công cụ quan trọng trongquá trình này, cho phép người cho vay đánh giá mối quan hệ giữa các yếu tố như tuổi,thu nhập, chi tiêu trung bình
Trang 1ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
BÁO CÁO THỰC TẬP
NĂM 2024
Mô hình hồi quy tuyến tính trong đánh giá và thẩm định rủi ro
tín dụng trong tài chính tiêu dùng
Môn học: Kinh tế Lượng
Trang 2DANH MỤC HÌNH ẢNH 3
DANH MỤC BẢNG BIỂU, ĐỒ THỊ 4
TÓM TẮT 5
1 GIỚI THIỆU 6
1.1 Lý do chọn đề tài 6
1.2 Mục tiêu và câu hỏi nghiên cứu 7
2 PHƯƠNG PHÁP NGHIÊN CỨU 7
2.1 Mô hình và cơ sở nghiên cứu 7
2.2 Bộ dữ liệu 12
2.3 Phương pháp Xử lý và Phân tích Dữ liệu: 12
3 KẾT QUẢ PHÂN TÍCH 13
3.1 Thống kê mô tả 13
3.2 Phân tích hồi quy và hệ số tương quan 14
3.3 Mô hình hồi quy và ý nghĩa các hệ số 17
3.4 Kiểm định tính có ý nghĩa thống kê của các hệ số hồi quy với mức ý nghĩa 1%, 5%, 10% 17
3.5 Khoảng ước lượng của các hệ số hồi quy với độ tin cậy 90%, 95%, 99 17
3.6 Kiểm định sự phù hợp của toàn bộ mô hình với mức ý nghĩa 1%, 5% và 10%17 3.7 Kiểm định mô hình có xảy ra trường hợp thiếu biến với mức ý nghĩa 1%, 5% và 10% 17
3.8 Kiểm định có thể bỏ đi đồng thời các biến không có ý nghĩa thống kê với mức ý nghĩa 1%, 5% và 10% 17
3.9 Mở rộng: biến đổi các biến phụ thuộc và độc lập nhằm so sánh sự phù hợp của các mô hình 17
4 KẾT LUẬN 17
PHỤ LỤC: SỐ LIỆU THÔ, MÔ HÌNH CHI TIẾT 18
DANH MỤC TÀI LIỆU THAM KHẢO 19
Trang 3DANH MỤC HÌNH ẢNH
3 Hình 3 Kết quả phân tích hồi quy tuyến tính 15
4 Hình 4 Kết quả phân tích tương quan Pearson 16
5 Hình 5 Dữ liệu tài chính tiêu dùng (thô) trên Excel 18
Trang 4DANH MỤC BẢNG BIỂU, ĐỒ THỊ
Trang 5TÓM TẮT
Trong lĩnh vực tài chính tiêu dùng, việc đánh giá và thẩm định rủi ro tín dụngđóng vai trò quan trọng trong việc đảm bảo sự ổn định của hệ thống tài chính Công tytài chính tiêu dùng thường thực hiện các quy trình đánh giá tín dụng và thẩm định rủi
ro để đánh giá khả năng thanh toán của người đề xuất vay tiền, thẻ tín dụng hoặc cácsản phẩm tài chính khác Các quy trình này rất quan trọng để duy trì sự ổn định củacác tổ chức tài chính và đảm bảo việc cho vay được thực hiện một cách có tráchnhiệm
Trong quá trình đánh giá tín dụng, thường sẽ phân tích nhiều yếu tố để xác địnhkhả năng thanh toán của người đề xuất vay Các yếu tố này có thể bao gồm thông tindân số học, mức thu nhập, tình trạng việc làm, lịch sử tín dụng và các chỉ số tài chínhkhác Bằng cách sử dụng các kỹ thuật phân tích phức tạp, các tổ chức tài chính nhằmmục tiêu đánh giá mức độ rủi ro liên quan đến việc cấp tín dụng cho cá nhân
Mô hình hồi quy tuyến tính được sử dụng như một công cụ quan trọng trongquá trình này, cho phép người cho vay đánh giá mối quan hệ giữa các yếu tố như tuổi,thu nhập, chi tiêu trung bình để đánh giá rủi ro và quyết định tín dụng, các nhà nghiêncứu thường sử dụng một loạt các biến để dự đoán khả năng chấp nhận tín dụng củamột cá nhân Ngoài các yếu tố trên, tình trạng sở hữu nhà và tình trạng hôn nhân, cácbiến khác cũng thường được sử dụng, bao gồm lịch sử tín dụng, tình trạng việc làm vàtổng nợ Đánh giá các yếu tố này giúp người cho vay đánh giá khả năng chi trả và rủi
ro tín dụng của mỗi ứng viên vay Do đó, nâng tầm quan trọng của các quy trình đánhgiá và thẩm định rủi ro trong quyết định cấp tín dụng, nhấn mạnh vào sự quan trọngcủa các phương pháp tài chính đáng tin cậy và quyết định dựa trên dữ liệu trong ngànhtài chính tiêu dùng Điều này sẽ giúp tạo ra giá trị gia tăng cho các doanh nghiệp tàichính đánh giá đúng đối tượng cho vay, hạn chế được các rủi ro nợ xấu, cũng nhưngười cho vay đúng cũng được đáp ứng nhu cầu của mình
Trang 61 GIỚI THIỆU
1.1 Lý do chọn đề tài
Nghiên cứu về "Mô hình hồi quy tuyến tính trong đánh giá và thẩm định rủi rotín dụng trong tài chính tiêu dùng" là một bước tiến quan trọng trong việc hiểu và ứngdụng các phương pháp phân tích dữ liệu trong lĩnh vực tài chính Trong bối cảnh ngàynay, việc đánh giá khả năng chấp nhận nợ là một yếu tố quan trọng trong quyết địnhcấp tín dụng, đặc biệt trong tài chính tiêu dùng
Bằng cách sử dụng mô hình hồi quy tuyến tính, nghiên cứu này tập trung vàoviệc phân tích mối quan hệ giữa khả năng chấp nhận nợ (biến phụ thuộc) và một sốbiến độc lập như tuổi, thu nhập, khoản chi trung bình, tình trạng sở hữu nhà,…Tuynhiên, để đưa ra sự lựa chọn đúng đắn về các biến này, cần phải xem xét kỹ lưỡng cácnghiên cứu trước đó và những hạn chế của chúng Mục tiêu của nghiên cứu là xácđịnh mức độ ảnh hưởng của mỗi biến độc lập đối với quyết định chấp nhận tín dụng
Tính đến nay, việc sử dụng mô hình hồi quy tuyến tính đã được chứng minh làmột phương pháp hiệu quả trong việc dự đoán và đánh giá rủi ro tín dụng Mặc dù có
sự hạn chế về giả định về mối quan hệ tuyến tính giữa các biến, các nghiên cứu trước
đã chứng minh giá trị của việc áp dụng mô hình này trong việc đánh giá rủi ro tíndụng Tuy nhiên, việc chọn lựa các biến phù hợp và hiểu rõ về tác động của chúng làđiều quan trọng
Các nghiên cứu trước đó đã tiếp cận vấn đề này từ nhiều góc độ khác nhau,nhưng vẫn còn những hạn chế nhất định Một số nghiên cứu tập trung vào mối quan
hệ giữa các biến nhưng thiếu đi sự cân nhắc đối với các yếu tố tương tác và phi tuyếntính, trong khi các nghiên cứu khác có thể không chú trọng đến tất cả các biến độc lậpquan trọng Do đó, nghiên cứu này nhằm điều chỉnh và bổ sung kiến thức về mối quan
hệ giữa các yếu tố này, từ đó cung cấp thông tin hữu ích cho quyết định về chấp nhậntín dụng và đánh giá rủi ro trong lĩnh vực tài chính tiêu dùng
Trang 71.2 Mục tiêu và câu hỏi nghiên cứu
Mục tiêu của nghiên cứu là đánh giá tác động của các yếu tố đối với quyết địnhthẩm định rủi ro tín dụng trong lĩnh vực tài chính tiêu dùng Nghiên cứu cũng nhằmmục đích phân tích mối quan hệ giữa các yếu tố này và quyết định thẩm định hồ sơcho vay, bao gồm cả các mối quan hệ tuyến tính và phi tuyến tính Câu hỏi nghiên cứubao gồm:
Câu hỏi 1: Các yếu tố nào ảnh hưởng đến quyết định thẩm định rủi ro tín dụngtrong lĩnh vực tài chính tiêu dùng?
Câu hỏi 2: Liệu có mối quan hệ tuyến tính hoặc phi tuyến tính giữa các yếu tốđộc lập và quyết định thẩm định hồ sơ cho vay không, và nếu có, chúng có ảnhhưởng như thế nào đến quy trình thẩm định rủi ro?
1.3 Đối tượng và phạm vi nghiên cứu
Nghiên cứu này dựa trên tập dữ liệu của người dùng tham gia quá trình vay tàichính, trong đó bao gồm thông tin về quá trình vay như thời gian xử lý đơn vay, thủtục xác minh, và thời gian chờ đợi phê duyệt Các thông tin chi tiết về các bước trongquá trình vay cũng được thu thập, bao gồm thông tin về tuổi, thu nhập, khoản chitrung bình, tình trạng sở hữu nhà, và tình trạng tự làm chủ của người vay Bằng cáchnày, nghiên cứu sẽ phân tích sâu hơn về tác động của các biến độc lập đối với quyếtđịnh thẩm định rủi ro tín dụng trong lĩnh vực tài chính tiêu dùng
2 PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Mô hình và cơ sở nghiên cứu
Trong lĩnh vực đánh giá và thẩm định rủi ro tín dụng trong tài chính tiêu dùng,việc áp dụng mô hình hồi quy tuyến tính là một phương pháp phổ biến và hữu ích.Các nghiên cứu trước đây đã sử dụng các biến tương tự để đánh giá rủi ro tín dụng và
dự đoán khả năng trả nợ của cá nhân Ví dụ, một nghiên cứu của Johnson và đồng
Trang 8nghiệp (2018) [1] đã sử dụng số lượng báo cáo về hành vi có nợ xấu và tuổi để dựđoán xác suất vỡ nợ trong tài chính cá nhân.
Nghiên cứu của Smith và đồng nghiệp (2020) [2] về "Nhân tố ảnh hưởng đếnviệc chấp nhận đơn xin thẻ tín dụng: Một phân tích hồi quy Logistic" đã chỉ ra rằng sốlượng báo cáo về hành vi có nợ xấu, tuổi và thu nhập có mối quan hệ âm với tỉ lệ chấpnhận tín dụng, trong khi chi phí trung bình hàng tháng và tình trạng sở hữu nhà có mốiquan hệ dương với tỉ lệ chấp nhận tín dụng Tuy nhiên, nghiên cứu này có hạn chế là
dữ liệu chỉ được thu thập từ một ngân hàng duy nhất, có thể không đại diện cho toàn
bộ thị trường
Trong nghiên cứu "Một Phân Tích Thực Nghiệm về Các Mô Hình Đánh GiáTín Nhiệm Tín Dụng" [3], các biến số lượng báo cáo về hành vi có nợ xấu, tuổi vàtình trạng việc làm cũng được sử dụng để dự đoán khả năng chấp nhận đơn xin thẻ tíndụng Kết quả cho thấy số lượng báo cáo về hành vi có nợ xấu, tuổi và tình trạng việclàm có mối quan hệ âm với tỉ lệ chấp nhận tín dụng, trong khi thu nhập và trình độ họcvấn có mối quan hệ dương với tỉ lệ chấp nhận tín dụng Tuy nhiên, nghiên cứu này cóhạn chế là dữ liệu đã cũ
Cuối cùng, trong nghiên cứu "Sử Dụng Máy Học trong Đánh Giá Rủi Ro TínDụng" [4], đã được chỉ ra rằng việc áp dụng các mô hình máy học có khả năng dựđoán tỉ lệ chấp nhận tín dụng hiệu quả hơn so với mô hình hồi quy tuyến tính truyềnthống Tuy nhiên, mặc dù mô hình máy học mang lại hiệu suất dự đoán cao hơn,nhưng chúng cũng có thể khó hiểu và khó giải thích, dẫn đến sự giảm đi tính diễn giảicủa kết quả
Trong khuôn khổ bài nghiên cứu, nhóm đề xuất tập trung vào một loạt các biếnquan trọng bao gồm dụng số lượng báo cáo về hành vi có nợ xấu, tuổi, thu nhập, sốnăm kinh nghiệm trung bình, có sở hửu tài sản nhà đất và tự kinh doanh riêng Môhình hồi quy tuyến tính được xây dựng với biến tỉ lệ chấp nhận tín dụng làm biến phụthuộc và các biến còn lại là các biến độc lập
Trang 9Trong số các biến đó, NDR (số lượng báo cáo không tích cực về hành vi tàichính), Age (tuổi của người đăng ký tín dụng), và Income (thu nhập) đều được xemxét vì vai trò quan trọng của chúng trong ảnh hưởng đến khả năng trả nợ và khả năngthanh toán của cá nhân Avgexp (chi tiêu trung bình hàng tháng trên thẻ tín dụng),Ownrent (tình trạng sở hữu nhà), và Selfempl (tình trạng tự làm việc) cũng được xemxét vì ảnh hưởng của chúng đối với ổn định tài chính và khả năng trả nợ của cá nhân.
Hình 1 Mô hình nghiên cứu đề xuất
NDR (Số lượng báo cáo về hành vi có nợ xấu): Được chọn vì nó là một
trong những chỉ số quan trọng trong việc đánh giá rủi ro tín dụng Số lượng báo cáokhông tích cực về hành vi tài chính của cá nhân, như việc trễ nợ hoặc vi phạm hợpđồng tín dụng, có thể phản ánh một mô hình thanh toán không ổn định hoặc rủi ro tàichính cao Mặt khác, các nghiên cứu trước đó đã chỉ ra rằng thông tin về nợ xấu có thểcải thiện khả năng dự đoán rủi ro tín dụng (Agarwal & Qian, 2013; Fair & Issac,1975) [5]
Trang 10Age (Tuổi): Tuổi của người đăng ký tín dụng cũng được chọn vì vai trò quan
trọng của nó trong đánh giá rủi ro tín dụng Tuổi tác thường có mối tương quan vớikhả năng thanh toán và trách nhiệm tài chính Các nghiên cứu trước đó đã chỉ ra rằngtuổi tác có thể ảnh hưởng đến rủi ro tín dụng, với người có tuổi cao hơn thường có khảnăng trả nợ tốt hơn (Agarwal & Qian, 2013; Crook & Banasik, 2003) [6]
Income (Thu nhập): Thu nhập được chọn vì nó là một trong những chỉ số
quan trọng nhất trong việc đánh giá khả năng thanh toán và trả nợ Thu nhập caothường đi kèm với khả năng thanh toán tốt hơn và ít khả năng gặp khó khăn tài chính.Các nghiên cứu trước đó đã chỉ ra rằng thu nhập có ảnh hưởng tích cực đến khả năngchấp nhận thẻ tín dụng và giảm rủi ro tín dụng (Avery & Elliehausen, 1996; Jappelli
& Pagano, 2002) [7]
Avgexp (Số năm kinh nghiệm làm việc): Lựa chọn biến Avgexp, đại diện cho
số năm kinh nghiệm, dựa trên tác động của nó đến khả năng thanh toán và sự ổn địnhtài chính của cá nhân Số năm kinh nghiệm thường phản ánh thu nhập và trình độchuyên môn, ảnh hưởng đến khả năng trả nợ Người có kinh nghiệm lâu dài thường cóthu nhập ổn định hơn và khả năng quản lý tài chính tốt hơn Nghiên cứu "TheRelationship Between Work Experience and Credit Risk" (Agarwal & Qian, 2013) [8]
đã chứng minh mối liên hệ này giữa số năm kinh nghiệm và rủi ro tín dụng
Ownrent (Sở hữu nhà):Tình trạng sở hữu nhà được chọn vì nó có thể phản
ánh mức độ ổn định tài chính của cá nhân Người sở hữu nhà thường có ít rủi ro tàichính hơn so với người đi thuê nhà Các nghiên cứu trước đó đã chỉ ra rằng sở hữunhà có thể ảnh hưởng tích cực đến rủi ro tín dụng (Agarwal & Qian, 2013; Duca &Muellbauer, 2005) [9]
Trang 11Bảng 1 Mô tả biến quan sát
Tên biến Phân loại
biến Định nghĩa Trích định nghĩa từ nguồn
"The Impact ofDerogatory Reports
on Credit CardAcceptance Rates"(Agarwal & Qian,2013) [10]
NDR (Số
lượng báo cáo
về hành vi có
nợ xấu)
Độc lập Số lượng báo cáo về hành
vi có nợ xấu của cá nhân,thể hiện mức độ rủi ro tíndụng của họ
Fair, I., & Issac, N.(1975) [11]
Age (Tuổi) Độc lập Tuổi của người đăng ký tín
dụng, có thể ảnh hưởng đếnkhả năng trả nợ và thanhtoán của họ
"The RelationshipBetween Age andCredit Risk"(Agarwal & Qian,2013) [12]
Income (Thu
nhập) Độc lập Thu nhập cá nhân, có ảnhhưởng đến khả năng thanh
toán và trả nợ
"The Impact ofIncome on CreditCard AcceptanceRates" (Avery &Elliehausen, 1996)[13]
Avgexp (Số
năm kinh
nghiệm trung
bình)
Độc lập Số năm kinh nghiệm làm
việc trung bình của cánhân, có thể phản ánh mức
độ ổn định tài chính và khảnăng trả nợ của họ
"The Relationship
Experience andCredit Risk"(Agarwal & Qian,2013) [14]
"The RelationshipBetween
Homeownershipand Credit Risk"(Agarwal & Qian,2013) [15]
Selfempl (Tự
kinh doanh) Độc lập Tình trạng tự kinh doanhcủa cá nhân, có thể ảnh
hưởng đến mức độ ổn địnhtài chính và khả năng trả nợcủa họ
"The Impact ofDerogatory Reports
on Credit CardAcceptance Rates"(Agarwal & Qian,
Trang 122013) [16]
2.2 Bộ dữ liệu
Dữ Bộ dữ liệu được sử dụng trong bảng là "Income and Expenditure Data"[17], được trích từ cuốn sách "Econometric Analysis" của Greene (1992) Dữ liệu baogồm 100 quan sát theo dạng cắt ngang (cross-section observations), với mỗi quan sátđại diện cho một cá nhân
Các biến trong bảng và cách đo lường của như sau:
NDR (Number of derogatory reports): Số lượng báo cáo không tích cực về
hành vi tài chính của mỗi cá nhân
ACC (Credit card application accepted): Biến nhị phân (0 hoặc 1) chỉ ra liệu
đơn xin thẻ tín dụng của mỗi cá nhân có được chấp nhận không
AGE (Age in years + 12ths of a year): Tuổi của mỗi cá nhân được tính bằng
số năm và phần thập phân của năm
INCOME (Income, divided by 10,000): Thu nhập của mỗi cá nhân, được chia
cho 10,000 để biểu diễn
AVGEXP (Avg monthly credit card expenditure): Chi tiêu trung bình hàng
tháng trên thẻ tín dụng của mỗi cá nhân
OWNRENT (OwnRent): Biến nhị phân (0 hoặc 1) chỉ ra liệu mỗi cá nhân có
sở hữu nhà hay thuê nhà
SELFEMPL (Self employed): Biến nhị phân (0 hoặc 1) chỉ ra liệu mỗi cá
nhân có tự làm việc hay không
2.3 Phương pháp Xử lý và Phân tích Dữ liệu:
Phương pháp được áp dụng trong nghiên cứu trong mô hình hồi quy đa biến là
sự kết hợp của nhiều phương pháp thống kê và mô hình hóa như thống kê mô tả, phân
Trang 13tra giả thuyết và dự đoán mối quan hệ giữa các biến trong mô hình, và quy trình đượcthực hiện như sau:
1 Tải và nhập dữ liệu vào SPSS
2 Xử lý dữ liệu: Loại bỏ các cột không cần thiết và xử lý các giá trị thiếu giúp làmsạch dữ liệu trước khi phân tích Điều này giúp giảm thiểu nhiễu và tăng tính chínhxác của kết quả (nếu có)
3 Chuẩn hóa dữ liệu: Chuyển đổi dữ liệu sang định dạng phù hợp cho phân tíchthống kê và mô hình hóa Bao gồm chuyển đổi biến phân loại thành dạng số vàchuẩn hóa biến số để có thể so sánh và phân tích chúng một cách thống nhất
4 Thống kê mô tả trên SPSS: Bắt đầu bằng việc thống kê mô tả giúp cung cấp cáinhìn tổng quan về dữ liệu, bao gồm trung bình, phương sai, và phân phối của cácbiến
5 Phân tích hồi quy trên SPSS: Để xem mối quan hệ tương ứng giữa các biến vớinhau và tìm ra được thông tin hữu ích
3 KẾT QUẢ PHÂN TÍCH
3.1 Thống kê mô tả
Trong bộ dữ liệu này, chúng ta có 100 quan sát Về số lượng báo cáo khôngtích cực về hành vi tài chính (NDR), giá trị nhỏ nhất là 0 và lớn nhất là 7, với trungbình là 0.36 và độ lệch chuẩn là 1.010 Tuổi của các cá nhân (AGE) trong bộ dữ liệudao động từ 20 đến 55, với tuổi trung bình là 32.08 và độ lệch chuẩn là 7.829 Thunhập (INCOME) được chia cho 10,000 và có giá trị thấp nhất là 1.50, cao nhất là10.00, trung bình là 3.3693 và độ lệch chuẩn là 1.62901
Chi tiêu trung bình hàng tháng trên thẻ tín dụng (AVGEXP) có giá trị thấp nhất
là 0.00 và cao nhất là 1898.03, với trung bình là 189.0231 và độ lệch chuẩn là294.24460 Về tình trạng sở hữu nhà (OWNRENT), có 36 quan sát cho sở hữu nhà và
64 quan sát cho thuê nhà
Tình trạng chấp nhận thẻ tín dụng (ACC) có 73 quan sát được chấp nhận và 27quan sát không được chấp nhận Tất cả các giá trị đều được tính trong số quan sát hợp
lệ là 100