1.1.2.2 .Các yêu cầu về mô hình đo lường PD theo phương pháp IRB
1.3. Mô hình Logistic
1.3.5. Sự phù hợp của mô hình hồi quy logistic trong đo lường PD tại Việt Nam
Hiện nay, bên cạnh phương pháp chuyên gia, các phương pháp dự báo rủi ro tín dụng doanh nghiệp dựa trên dữ liệu thống kê đang phát triển ngày càng mạnh mẽ cả về chiều rộng và chiều sâu. Từ mô hình xác suất tuyến tính LPM và phương pháp MDA đã được sử dụng từ những năm 1930, đến phương pháp hồi quy Logistic, Probit đang được ứng dụng rộng rãi từ những năm 1980 và gần đây thì xuất hiện các cách thức tiếp cận mới sử dụng phương pháp thống kê phi thông số (non- parametric) phức tạp như lân cận gần nhất K, mạng nơ ron thần kinh.
Mô hình xác suất tuyến tính
Mô hình xác suất tuyến tính (Linear probability model - LPM) là mô hình ước lượng đa biến dùng phương pháp bình phương tối thiếu OLS. Mô hình này gặp phải nhiều hạn chế:
- Sai số hồi quy không phân phối chuẩn - Phương sai thay đổi
- Không thỏa mãn điều kiện cơ bản của xác suất trong khoảng 0-1
- Tác động biến không đổi, trong khi bản chất của mô hình xác suất là tác động biến thay đổi theo từng giá trị của biến độc lập.
Chính vì vậy, mô hình này hầu như không còn được sử dụng trong dự báo rủi ro tín dụng.
Phân tích biệt số đa nhân tố MDA, Logit và Probit
Phân tích biệt số đa nhân tố (MDA) là dạng tổng quát của hàm phân biệt tuyến tính. MDA có các giả định cơ bản:
- Số lượng các nhóm rời rạc và được định nghĩa trước.
- Biến độc lập có phân phối chuẩn; tương quan giữa các biến độc lập thấp hoặc không tương quan.
- Ma trận hiệp phương sai của các nhóm là như nhau. - Hàm phân biệt là tuyến tính.
Năm 1968, MDA đã được Altman sử dụng để dự báo khả năng phá sản rất hiệu quả. Tuy nhiên, từ những năm 1980 trở lại đây thì hồi quy Logistic lại được sử dụng phổ biến. Lý do là Logit không có bất cử giả thiết nào về phân phối của các biến độc lập, kiểm định thống kê không phức tạp, có thể điều chỉnh hàm phi tuyến dễ dàng, các biến độc lập định tính thông qua việc thiết lập biến giả có thể chuyển thành định lượng.
Lân cận gần nhất K và mạng nơ ron thần kinh
Machine learning (nhiều tác giả dịch là “học máy”) là một lĩnh vực của trí tuệ nhân tạo mà nó liên quan đến thiết kế và phát triển các thuật toán cho phép cải thiện khả năng thực thi các chức năng dựa trên cơ sở dữ liệu. Mục tiêu chính trong nghiên cứu machine learning là đưa ra những mô hình có kết quả được tạo ra một cách tự động từ những quy luật hay kiểu mẫu từ dữ liệu. Do đó, các mô hình này đòi hỏi phải có dữ liệu đầu vào lớn. Các thuật toán của machine learing đang được sử dụng để xếp hạng tín nhiệm trên thế thới như là những kỹ thuật riêng lẻ tốt nhất: lân cận gần nhất K và mạng nơ ron thần kinh.
- Lân cận gần nhất K: Là một trong số những thuật toán machine learning đơn giản nhất. Thuật toán này phân loại dựa trên phương pháp chọn những quan sát gần nhau trong không gian vectơ đa chiều của các biến độc lập thành một nhóm, mức độ gần nhau của các quan sát phụ thuộc vào K. K là một số nguyên dương và có đặc trưng là nhỏ. Tương tự đối với hồi quy, bằng cách phân giá trị của quan sát gần với trung bình giá trị của nhóm các quan sát nằm trong khoảng lân cận gần nhất K. Giá trị của bên nào càng gần mức trung bình thì tỷ trọng của nó càng lớn.
- Mạng nơ ron thần kinh: Là một kỹ thuật phân tích khác để xây dựng mô hình dự báo. Mạng nơ ron thần kinh có thể bắt chước và nhận thức được các trạng thái thực đối với dữ liệu đầu vào không đầy đủ hoặc dữ liệu với một số lượng biến rất lớn. Kỹ thuật này đặc biệt phù hợp với mô hình dự báo mà không có công thức toán học nào được biết để miêu tả mối quan hệ giữa các biến đầu vào và đầu ra. Hơn nữa
nó hữu dụng khi mục tiêu dự báo là quan trọng hơn giải thích. Một trong những thuận lợi của mô hình mạng là nó có thể giải quyết mối quan hệ phi tuyến.
Stone và Rasp (1991), Maddala (1991) trong các nghiên cứu của mình đã so sánh Logit với ước lượng OLS và cùng cho kết quả Logit thích hợp hơn OLS. Martin (1977), Press và Wilson (1978), Wiginton (1980) chỉ ra rằng Logit thì vượt trội hơn MDA; Yesilvaprak (2004) khi so sánh mạng nơ ron thần kinh với MDA và Logit cũng cho kết quả mạng nơ ron dự báo tốt nhất, thứ hai là Logit và sau cùng là MDA.
Các nghiên cứu đã cho ta một kết luận: Mô hình ước lượng và dự báo dựa trên phương pháp lân cận gần nhất K và mạng nơ ron thần kinh tốt hơn mô hình Logit và Probit, sau đó mới là MDA và LPM. Nhưng do lân cận gần nhất K và mạng nơ ron thần kinh đòi hỏi dữ liệu đầu vào lớn, các phương pháp này cũng rất phức tạp và chưa phổ biến ở nước ra. Nên việc lựa chọn mô hình Logit là hợp lý vì yêu cầu mẫu không quá cao, ít ràng buộc về mặt giả thiết, hiện đang được sử dụng rộng rãi trên thế giới.
Như vậy ta thấy ở những bước nhận định ban đầu, phương pháp xây dựng mô hình đo lường PD dựa trên mô hình Logistic là phương pháp phù hợp đối với các ngân hàng ở Việt Nam hiện nay.