1.1.2.2 .Các yêu cầu về mô hình đo lường PD theo phương pháp IRB
1.2. Các bước cơ bản xây dựng mô hình đo lường PD
1.2.3. Phân tích đơn biến
Phân tích đơn biến là quá trình chọn ra các biến thích hợp có khả năng dự đoán tình trạng Tốt/Xấu của khách hàng trong một khoảng thời gian xác định. Quá trình phân tích cho biến tài chính và phi tài chính được miêu tả ở mục 1.2.3.1 và 1.2.3.2.
1.2.3.1 Biến tài chính
Từ khía cạnh thống kê, việc nhập giá trị thô của biến giải thích vào mô hình hồi quy là không hiệu quả và có thể dẫn đến việc ước lượng sai lệch các hệ số. Vì vậy, để so sánh và hồi quy các biến khác nhau trong bước phân tích đa biến, các biến nên được biến đổi về một thang đo đồng nhất.
Sau quá trình biến đổi biến, kết quả của phương trình hồi quy sẽ được phản ánh qua giá trị được chuyển đổi của các biến giải thích.
Các biến tài chính sau đó được chuẩn hóa làm dữ liệu đầu vào cho mô hình. Các biến sẽ được biến đổi sang giá trị chuẩn với giá trị trung bình 0 và độ lệch chuẩn tương ứng là 1. Công thức chuẩn hóa là:
𝑍 =𝑋 − 𝐸(𝑋) 𝛿 (𝑋) Trong đó
E(X): Giá tri kỳ vọng 𝛿 (𝑋): Độ lệch chuẩn
Mục đích của việc chuẩn hóa là để dễ dàng so sánh ảnh hưởng của các biến khác nhau trong mô hình. Theo đó, hệ số càng lớn thể hiện ảnh hưởng càng lớn của biến tương ứng lên P(x)
Kiểm tra khả năng phân biệt của biến tài chính
Có rất nhiều phương pháp để đánh giá khả năng phân biệt của biến tài chính. Cách phổ biến để đo lường khả năng phân biệt của bộ chỉ tiêu chấm điểm là Đường cong đặc trưng (ROC), ROC cũng là chỉ tiêu đánh giá khả năng phân biệt của các biến tài chính. ROC được lập bằng cách vẽ tần số lũy kế các trường hợp khách hàng không trả được nợ xảy ra được thể hiện trên trục y và tần số lũy kế tương ứng số lượng khách hàng được thể hiện trên trục x. Mỗi điểm của Đường cong đặc trưng tương ứng với một hạng, với hạng xấu nhất ở bên trái của biểu đồ.
Một biến lý tưởng sẽ xếp hạng các trường hợp không trả được nợ vào hạng xấu nhất. Từ đó Đường cong đặc trưng của biến lý tưởng sẽ chạy từ điểm dưới cùng bên trái (0%, 0%) đến điểm trên cùng (0%, 100%) và từ đó đến điểm trên cùng bên phải (100%,100%). Giá trị x và y của Đường cong ROC luôn bằng nhau nếu tần số xảy ra của các trường hợp tốt và xấu bằng nhau có nghĩa là biến không có khả năng phân biệt giữa khách hàng Tốt và khách hàng Xấu. Trong trường hợp này đường ROC chạy theo đường chéo, xem hình 1.2.
Hình 1.2 - Minh họa về một đường cong ROC
(Nguồn: Advanced Techniques: Regression Student Guide, IBM, 2010)
Diện tích dưới Đường cong đặc trưng (AUROC) được sử dụng như một phép đo lường khả năng phân biệt. AUROC là phép đo lường đồ họa về khả năng phân
biệt, được xác định bởi đường cong ROC và tính đến diện tích phía dưới đường cong ROC. Giá trị AUROC càng cao thể hiện khả năng phân biệt càng tốt của biến.
Khả năng phân biệt của các biến có xu hướng biến đổi cùng chiều với P(x) có thể được giải thích theo Bảng 1.1 – Quy luật thể hiện khả năng phân biệt AUROC (tuy nhiên AUROC quá cao thể hiện mô hình phù hợp trội - overfit)
Bảng 1.1 - Quy luật thể hiện khả năng phân biệt AUROC
AUROC Khả năng phân biệt
AUROC = 0.5 Không có khả năng phân biệt 0.5< AUROC < 0.7 Khả năng phân biệt kém
0.7<= AUROC <= 0.8 Khả năng phân biệt chấp nhận được 0.8< AUROC < 0.9 Khả năng phân biệt tốt
AUROC >= 0.9 Khả năng phân biệt vượt trội
(Nguồn: Advanced Techniques: Regression Student Guide, IBM, 2010)
Để thực hiện tính toán AUROC, các ngân hàng có thể sử dụng các công thức tính của Excel hoặc mua các phần mềm phục vụ cho thống kê như SPSS, Oracle…
1.2.3.2 Biến phi tài chính
Biến đổi biến phi tài chính
Phần lớn các biến phi tài chính là biến lựa chọn. Các lựa chọn của từng biến được xếp thành các thang điểm. Các thành phần này có thể sắp xếp theo thứ tự (đối với các biến thứ tự) hoặc không theo thứ tự (đối với các biến danh nghĩa). Điều này phụ thuộc vào bản chất của từng biến. Các thang điểm của biến phi tài chính được gộp thành các nhóm mới. Mỗi biến được biến đổi hiệu quả khi nhóm mới của biến đó thể hiện được tính chất rủi ro khác biệt so với các thành phần khác.
Có rất nhiều phương pháp để biến đổi giá trị của các biến phi tài chính, tuy nhiên phương pháp Weight of Evidence (WOE) được sử dụng nhiều nhất. Giá trị WOE âm tại một thang điểm thể hiện rằng thang điểm đó có tỷ lệ khách hàng tốt thấp hơn tỷ lệ khách hàng xấu. Ngược lại giá trị WOE dương thể hiện rằng thang điểm tương ứng có tỷ lệ khách hàng tốt nhiều hơn tỷ lệ khách hàng xấu. Giá trị tuyệt đối của WOE càng cao thể hiện khả năng phân biệt tốt của thang điểm.
Giá trị WOE bằng log của odds (tức tỷ lệ khách hàng tốt trên khách hàng xấu của từng thang điểm). Công thức tính WOE của từng thang điểm là:
Đánh giá khả năng phân biệt của các biến phi tài chính
Một trong các phương pháp để đánh giá mức độ phân biệt của biến phi tài chính đi kèm với giá trị WOE là Information Values (IV) được sử dụng để đánh giá mức độ trọng yếu của phân tích đơn biến trong việc phân biệt khách hàng tốt và khách hàng xấu. Theo kinh nghiệm, các biến với tổng IV của các thành phần >=0.1 được coi là có khả năng phân biệt và được đưa vào danh sách được lựa chọn. Ngưỡng IV=0.1 có thể được điều chỉnh cao hơn hoặc thấp hơn phụ thuộc vào phân phối của dữ liệu. IV được đo lường bằng công thức:
Trong đó: LogOdds = WOE
IV không liên quan đến thứ tự thang điểm của các biến. Chỉ số này, khác với AUROC, đóng vai trò quan trọng trong việc phân tích dữ liệu khi không xác định được phân phối rủi ro (tỷ lệ xấu) theo giá trị. Vì vậy, chỉ số này phù hợp với các biến định tính hơn do các biến định tính bao gồm các biến danh nghĩa.
Quy luật về khả năng phân biệt của các biến theo IV được đo lường theo Bảng 1.2: Bảng 1.2 – Quy luật khả năng phân biệt của biến theo IV
Khoảng giá trị IV Khả năng phân biệt
<= 0.02 Không có khả năng phân biệt 0.02<= IV <= 0.1 Khả năng phân biệt kém 0.1<= IV <= 0.3 Khả năng phân biệt trung bình IV>= 0.3 Khả năng phân biệt tốt
(Nguồn: Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring, Naeem Siddiqui, 2006, trang 83-86)
Các biến được lựa chọn nếu có ý nghĩa kinh tế và IV cao. Các biến với IV lớn hơn 0.5 phải được kiểm tra lại do khả năng dự báo trội – over predict. Các biến này
Bads Goods LogOdds WOE % % ln
Good Bad LogOdds IV % %
có thể được loại bỏ khỏi quá trình xây dựng mô hình, hoặc cần xem xét kĩ càng nếu đưa vào sử dụng.