Dữ liệu nghiên cứu

Một phần của tài liệu Phân tích các yếu tố ảnh hưởng đến khả năng trả nợ của khách hàng đối với Công ty tài chính TNHH Ngân hàng Việt Nam Thịnh Vượng. (Trang 42 - 45)

4 1.1.1 Khái niệm và đặc điểm của công ty tài chính

2.3. Dữ liệu nghiên cứu

Nghiên cứu sử dụng thông tin thứ cấp từ hồ sơ của những khách hàng vay vốn tại Công ty Tài chính FE Credit trong năm 2019. Tổng cộng có 51.915 hồ sơ.

Tuy nhiên, để đảm bảo cho tính đầy đủ của tất cả thông tin được đề xuất đánh giá, tác giả đã loại bỏ các quan sát bị thiếu một trong các dữ liệu dùng để đánh giá tính chính xác của các giả thuyết. Cuối cùng đưa vào nghiên cứu 13.066 khách hàng, trong đó có 12.143 hồ sơ vay được đánh giá là có khả năng trả nợ, chiếm tỷ lệ 93% trong tổng số lượng hồ sơ thỏa mãn điều kiện và có 923 hồ sơ khách hàng được đánh giá là không có khả năng trả nợ, chiếm tỷ lệ 7%

Phân bổ khả năng trả nợ của mẫu nghiên cứu

7%

Có khả năng trả nợ Không có khả năng trả nợ

93%

Hồi quy Binary Logistic

Hình 2.1: Phân bổ khả năng trả nợ của mẫu nghiên cứu

Nguồn: Tác giả tự tổng hợp bằng Python

2.4. Phương pháp nghiên cứu

Tác giả chủ yếu sử dụng phương pháp nghiên cứu định lượng để nghiên cứu nhằm thực hiện được mục tiêu nghiên cứu của đề tài. Các bước thực hiện nghiên cứu theo thứ sơ đồ dưới đây:

Phân tích thống kê mô tả

Kiểm định liên quan: Tương quan; Đa cộng tuyến

Phân tích kết quả và thảo luận

Hình 2.2: Sơ đồ quy trình các bước thực hiện phân tích trong nghiên cứu

Thống kê mô tả

Phương pháp thống kê mô tả được sử dụng trong nghiên cứu để mô tả khái quát Thu thập dữ liệu

lại những đặc tính cơ bản của dữ liệu thu thập được qua các phương pháp khác nhau. Trên cơ sở dữ liệu có sẵn, tác giả thực hiện thống kê để đánh giá sơ lược về các đặc trưng của khách hàng cá nhân vay vốn tín chấp tại Công ty Tài chính FE Credit.

Phân tích tương quan

Hệ số tương quan Pearson (Pearson correlation coefficient, kí hiệu r) đo lường mức độ tương quan tuyến tính giữa hai biến. Về nguyên tắc, việc phân tích tương quan Pearson sẽ tìm ra một đường thẳng phù hợp nhất với mối quan hệ tuyến tính của 2 biến. Trong phân tích áp dụng cho luận văn, việc kiểm định hệ số tương quan Pearson là để kiểm tra mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc. Hệ số tương quan Pearson (r) sẽ nhận giá trị từ +1 đến -1. Điều kiện để tương quan có ý nghĩa là giá trị sig. <0.05. Tương quan tuyến tính càng mạnh, càng chặt chẽ nếu r càng tiến về 1, -1; tương quan tuyến tính càng yếu nếu r càng tiến về 0.

Ý nghĩa của các hệ số trong ma trận tương quan:

Hệ số Pearson Correlation: thể hiện mức độ tương quan tuyến tính giữa các biến với nhau trong mô hình.

Hệ số Sig: đánh giá tính phù hợp của hệ số tương quan giữa các biến theo kiểm định F với một độ tin cậy cho trước. Mức ý nghĩa của hệ số này thường được chọn là 1% hoặc 5%, nếu Sig > 0.05 thì phải thực hiện loại bỏ bớt biến nghiên cứu ra khỏi mô hình nhằm đảm bảo tính phù hợp của mô hình.

Kiểm định đa cộng tuyến

Đa cộng tuyến là hiện tượng các biến độc lập trong mô hình hồi qui phụ thuộc tuyến tính lẫn nhau, thể hiện dưới dạng hàm số. Xét về hậu quả, mặc dù sự hiện diện của đa cộng tuyến không ảnh hưởng đến tính nhất quán của các ước tính OLS của các hệ số hồi qui. Tuy nhiên, các ước tính sẽ trở nên không chính xác và không đáng tin cậy. Hơn nữa, thực tế không thể phân biệt các tác động riêng lẻ của các biến độc lập lên biến phụ thuộc. Hậu quả là sai số chuẩn của tham số hồi quy tăng, từ đó dẫn đến t-tests trên các hệ số có ít khả năng bác bỏ giả thuyết không.

Có hai cách chủ yếu để phát hiện ra hiện tượng đa cộng tuyến: dựa vào hệ số phóng đại phương sai VIF, hoặc dựa vào ma trận hệ số tương quan. Tuy nhiên cách dùng ma trận hệ số tương quan ít được sử dụng, chủ yếu sử dụng cách nhận xét chỉ

số. Trong nghiên cứu này, tác giả sử dụng hệ số VIF để kiểm định đa cộng tuyến. Nếu hệ số phóng đại phương sai VIF (variance inflation factor) > 2 thì có dấu hiệu đa cộng tuyến, đây là điều không mong muốn. Nếu VIF > 10 thì chắc chắn có đa cộng tuyến. Nếu VIF <2: không bị đa cộng tuyến.

Hồi quy Binary Logistic

Độ phù hợp của mô hình: Kiểm định Hosmer and Lemeshow là một trong các kiểm định nhằm dự báo độ phù hợp của mô hình, với 2 giả thiết H0: Không có sự khác biệt giữa giá trị thực tế và giá trị dự báo; H1: Có sự khác biệt giữa giá trị thực tế và giá trị dự báo. Hệ số Sig trong kiểm định này được phải lớn hơn mức ý nghĩa thì có thể kết luận đây là mô hình tốt.

Kiếm định ý nghĩa của các hệ số: Đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể. Nếu giá trị p (Sig.) nhỏ hơn mức ý nghĩa được chọn thì bác bỏ H0. Như vậy các hệ số hồi quy tìm được có ý nghĩa và mô hình được sử dụng tốt.

Một phần của tài liệu Phân tích các yếu tố ảnh hưởng đến khả năng trả nợ của khách hàng đối với Công ty tài chính TNHH Ngân hàng Việt Nam Thịnh Vượng. (Trang 42 - 45)

Tải bản đầy đủ (DOCX)

(93 trang)
w