CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU
3.3. Phân tích dữ liệu
3.3.1.Thống kê mơ tả dữ liệu
Để đánh giá mơ hình chấm điểm tín dụng cá nhân hiện tại của FE Credit, nghiên cứu này sử dụng phương pháp thống kê mô tả dữ liệu để có cái nhìn tổng quan về những thông tin đặc trưng của dữ liệu thông qua các thước đo đánh giá khuynh hướng tập trung (giá trị trung bình) và khuynh hướng phân tán dữ liệu (phương sai, độ lệch chuẩn, khoảng biến thiên) (Theo PGS.TS Đinh Phi Hổ, 2021,
tr.146, 151-155).
“Theo Mason (1999), ba đại lượng dùng để đo lường mức độ tập trung: Trung
bình, trung vị trong đó:
- Giá trị trung bình được tính theo cơng thức: � =
1 � � = � 1 �� �: Giá trị trung bình của biến X
Xi: Giá trị thứ i của biến X N: Số quan sát trong mẫu
Theo Fisher (1918), đại lượng dùng để đo lường mức độ phân tán của dữ liệu bao gồm phương sai của mẫu, độ lệch chuẩn, khoảng biến thiên
- Phương sai của mẫu: Đo lường sự phân tán của tán phần tử trong mẫu của
một biến số. Phương sai của mẫu cho biến giá trị của biến đó thường ở cách giá trị trung bình bao xa. Phương sai của biến X thường được ký hiệu là �2. Phương sai càng nhỏ thì tổng thể nghiên cứu càng đồng đều, tính đại diện số bình quân càng cao và ngược lại.
��2 = 1 ∑� ( �� � − )2 −1
�
=1 �
�: Giá trị trung bình của X
Xi: Giá trị quan sát thứ i
- Độ lệnh chuẩn: Là phương sai với dạng căn bậc hai SD=√√√√√√√√√√√√√√√ 2
- Giá trị lớn nhất, giá trị nhỏ nhất: Là giá trị lớn nhất, nhỏ nhất tương ứng với
mỗi biến độc lập”
3.3.2.Phân tích hồi quy
Trên cơ sở phân tích, đánh giá và tham khảo nghiên cứu của các tác giả nêu trên thì nghiên cứu sẽ đưa ra đề xuất các biến có thể ảnh hưởng đến hoạt động chấm điểm tín dụng cá nhân từ đó thực hiện phân tích hồi quy theo mơ hình Binary Logistic bằng phần mềm SPSS. Trên cơ sở kết quả phân tích hồi quy, nghiên cứu thực hiện phân tích, đánh giá độ phù hợp, mức ý nghĩa và đánh giá vể mức độ dự báo trung bình về khả năng trả nợ của khách hàng qua các mơ hình như thế nào từ đó đưa ra những kết luận cho nghiên cứu. Việc phân tích, đánh giá, kiểm định mơ hình được thực hiện như sau:
3.3.2.1. Đánh giá hiện tượng đa cộng tuyến
Theo Nguyễn Quang Dong, Nguyễn Thị Minh (2013, tr 238), đa cộng tuyến là hiện tượng các biến độc lập có mối tương quan rất mạnh với nhau. Mơ hình hồi quy xảy ra hiện tượng đa cộng tuyến sẽ khiến nhiều chỉ số bị sai lệch, dẫn đến kết quả của việc phân tích định lượng khơng cịn mang lại nhiều ý nghĩa. Để xác định xem
� �
� �
nghiên cứu có hiện tượng đa cộng tuyến cao hay khơng, nghiên cứu này dựa vào giá trị của hệ số phóng đại phương sai VIF (Variance inflation factor) để đánh giá hiện tượng đa cộng tuyến giữa các biến.
Hệ số phóng đại phương sai VIF (Variance inflation factor) để xác định mối tương quan giữa các biến độc lập và mức độ của mối tương quan đó. Giá trị VIF bắt đầu từ 1 và khơng có giới hạn trên. Trong đó, nếu VIF lớn hơn 10 thì sẽ có hiện tượng đa cộng tuyến cao.
3.3.2.2. Kiểm định sự phù hợp của mơ hình
Nghiên cứu dùng kiểm định Chi bình phương của các mơ hình để xác định sự phù hợp của mơ hình
+ Nếu sig < 0.05 thì hàm hồi quy phù hợp
+ Nếu sig > 0.05 thì hàm hồi quy không phù hợp
3.3.2.3. Đánh giá mức độ phù hợp của mơ hình
Việc này được thực hiện qua so sánh sự khác biệt giá trị -2 Log-likelihood (- 2LL) giữa các mơ hình hồi quy, nếu mơ hình đề xuất có -2LL thấp hơn mơ hình ban đầu thì mơ hình hồi quy đó càng phù hợp (Hair và cộng sự, 2014). Trị số -2LL có giá trị nhỏ nhất là 0 và khơng có giá trị lớn nhất. Đồng thời so sánh hai trị số hệ số Cox & Snell R Square và hệ số Nagelkerke R Square này nếu càng lớn thì độ phù hợp mơ hình hồi quy nhị phân Binary Logistic càng cao.
3.3.2.4. Ý nghĩa thống kê của các biến độc lập
Căn cứ vào chỉ số sig tương ứng với mỗi biến để kiểm định các giả thuyết sau: Với giả thuyết:
+ H0: Hệ số hồi quy của biến đó bằng 0 + H1: Hệ số hồi quy của biến đó khác 0
Nếu sig < 0.05 thì bác bỏ giả thuyết H0, khi đó biến có ý nghĩa thống kê
Nếu sig > 0.05 thì chấp nhận giả thuyết H0, kho đó các biến khơng có ý nghĩa thống kê và sẽ loại khỏi mơ hình.
3.3.2.5. Mức độ dự báo của mơ hình
Trên cơ sở phân tích hồi quy các mơ hình, kết quả mức độ dự báo trung bình của các mơ hình sẽ phản ánh khả năng dự báo chính xác khả năng trả nợ của khách hàng là bao nhiêu phần trăm. Mơ hình có mức độ dự báo trung bình cao hơn thì sẽ có nhiều khả năng dự đốn đúng số khách hàng có khả năng trả nợ hơn, kết quả này sẽ là cơ sở để tác giả đề xuất các yếu tố của mơ hình chấm điểm tín dụng tại FE Credit.
Tóm tắt chương 3
Trên cơ sở các nội dung về cơ sở lý luận và tham khảo một số nghiên cứu có liên quan, tại Chương 3, tác giả đã trình bày các cơ sở để lựa chọn phương pháp nghiên cứu đồng thời đưa ra các giải thiết, quy mô mẫu cũng như cách thức, quy trình thực hiện nghiên cứu. Kết quả nghiên cứu sẽ được thể hiện ở Chương 4.