4. Phương pháp nghiên cứu
4.1. Những trạng thái liên thông của điểm số hành vi và các mô hình chuỗ
mô hình chuỗi Markov
Những tổ chức cho vay sử dụng những điểm số hành vi được cập nhật hàng tháng để đánh giá rủi ro tín dụng của người tiêu dùng. Điểm số được xem xét như là một chỉ số xác suất khả thi mà một người vay sẽ “xấu (B)”, và vì thế vỡ nợ trong thời gian nhất định (thường được đo lường trong 12 tháng tiếp theo). Những người vay không xấu được phân loại vào “tốt (G)”. Vì vậy, tại thời điểm
𝑡, một người vay tiêu biểu có những đặc tính 𝑥(𝑡) (có thể mô tả các khoản hoàn trả gần nhất và biểu hiện quen thuộc, thông tin sẵn có gần nhất về người vay tại một trung tâm thông tin tín dụng, và những chi tiết nhân khẩu xã hội) có một điểm số 𝑠(𝑥(𝑡),𝑡), vì vậy
𝑝(𝐵|𝑥(𝑡),𝑡) = 𝑝(𝐵|𝑠(𝑥(𝑡),𝑡)) (4.1) Vài tổ chức cho vay thu được một xác suất vỡ nợ (𝑃𝐷), do Thỏa ước Basel yêu cầu, bằng cách kết hợp cả điểm số hành vi và điểm số hồ sơ. Những người vay mới được chấm điểm chỉ dựa trên điểm số hồ sơ vay để ước tính 𝑃𝐷, sau đó một khi đã có một lịch sử đủ để tính toán điểm số hành vi, việc kết hợp tỷ trọng 2 điểm số được sử dụng để tính toán 𝑃𝐷; sau cùng, khoản vay được xem là đủ dài (thường là hơn một năm) thì khi đó chỉ điểm số hành vi được sử dụng để tính toán 𝑃𝐷. Các mô hình được mô tả sau đây cũng có thể được áp dụng đối với hệ thống chấm điểm kết hợp như thế.
Hầu hết điểm số đều là điểm số logarit tỷ lệ xác suất (log odds scores) (Thomas, 2009a), và vì vậy mối quan hệ trực tiếp giữa điểm số và xác suất một khoản vay bị xem là xấu được cho bởi biểu thức
𝑠(𝑥(𝑡),𝑡) = log�𝑃�𝐺�𝑠𝑃�𝐵�𝑠((𝑥𝑥((𝑡𝑡),),𝑡𝑡))��� ⇔ 𝑃�𝐵�𝑠(𝑥(𝑡),𝑡)� =1+𝑒𝑠1(𝑥(𝑡),𝑡) (4.2)
dù cho trong thực tế điều này có thể không giữ một cách chính xác như vậy. Áp dụng định lý Bayes vào biểu thức (4.2) sinh ra phần mở rộng trong đó nếu 𝑝𝐺(𝑡) là tỷ lệ người vay tốt trong mẫu tại thời điểm 𝑡 (𝑝𝐵(𝑡) là tỷ lệ người vay xấu), chúng ta có
𝑠(𝑥(𝑡),𝑡) = log�𝑃�𝐺�𝑠𝑃�𝐵�𝑠((𝑥𝑥((𝑡𝑡),),𝑡𝑡))��� = log�pG(t)
pB(t)�+ log�PP((ss((xx((tt),),tt)|)|BG,,tt))�
= 𝑠𝑝𝑜𝑝(𝑡) + 𝑤𝑜𝑒𝑡(𝑠(𝑥(𝑡),𝑡)) (4.3)
Khoản mục thứ nhất là logarit tỷ lệ xác suất tổng thể tại thời điểm 𝑡 và khoản mục thứ hai là tỷ trọng của dấu hiệu dành cho điểm số đó (Thomas, 2009a). Việc phân tích này có thể không giữ vững chính xác trong thực tiễn, và có khả năng thay đổi theo thời hạn hiệu lực của bảng điểm. Tuy nhiên, nó chỉ ra rằng điều khoản 𝑠𝑝𝑜𝑝(𝑡), là như nhau với điểm số của tất cả mọi người vay, có thể được cho rằng đóng vai trò là nhân tố hệ thống có ảnh hưởng đến rủi ro vỡ nợ của tất cả người vay trong danh mục. Thông thường, tổ chức cho vay không để ý đến tính phụ thuộc vào thời gian của điểm số hành vi. Tổ chức cho vay thường chỉ quan tâm đến việc xếp loại người đi vay về phương diện rủi ro, và họ tin rằng khoản mục thứ hai (tỷ trọng của dấu hiệu) trong biểu thức (4.3), là điều duy nhất ảnh hưởng đến việc xếp loại, và ổn định theo thời gian hơn là 𝑠𝑝𝑜𝑝(𝑡), đặc biệt trong khoảng thời gian 2-3 năm. Trong thực tế, tính phụ thuộc vào thời gian rất quan trọng vì nó mô tả những trạng thái liên thông của rủi ro tín dụng của người đi vay. Những phương pháp mạnh mẽ tương tự được cho trước giữa những điểm số hành vi trong tín dụng tiêu dùng và xếp hạng tín dụng được sử dụng để đánh giá rủi ro tín dụng doanh nghiệp, một phương thức trước đây mô tả những trạng thái liên thông của điểm số hành vi là sử dụng phương pháp chuỗi Markov tương tự với hình thức hạch toán theo giá thị trường đang có dấu hiệu giảm sút của
những mô hình rủi ro tín dụng doanh nghiệp (Jarrow cùng cộng sự, 1997). Để sử dụng phương pháp chuỗi Markov có những điểm số hành vi, tôi chia khoảng điểm thành một số khoảng cách, mỗi khoảng trình bày một trạng thái của chuỗi Markov; tiếp theo, khi đề cập đến điểm số hành vi nghĩa là đề cập đến chuỗi Markov của điểm số, trong đó các điểm số là những khoảng cách của khoảng điểm ban đầu.
Các chuỗi Markov đã chứng tỏ những mô hình thường gặp về quá trình ngẫu nhiên bởi vì tính đơn giản của chúng đi ngược lại với khả năng của chúng để mô hình hóa hàng loạt các tình huống. Tôi chính thức định rõ một khoảng thời gian hữu hạn {𝑡0,𝑡1, … ,𝑡𝑛, … :𝑛 ∈ 𝑁} và một không gian trạng thái có giới hạn
𝑆 = {1, 2, … ,𝑠} chuỗi Markov bậc nhất là một quy trình ngẫu nhiên {𝑋(𝑡𝑛)}𝑛∈𝑁, có thuộc tính bất kỳ 𝑠0,𝑠1, … ,𝑠𝑛−1,𝑖,𝑗 ∈ 𝑆:
𝑃 [𝑋 (𝑡𝑛+1) = 𝑗 |𝑋(𝑡0) = 𝑠0, 𝑋(𝑡1) = 𝑠1, . . . ,𝑋(𝑡𝑛−1) = 𝑠𝑛−1,𝑋(𝑡𝑛) = 𝑖] = 𝑃 [𝑋 (𝑡𝑛+1) = 𝑗 | 𝑋 (𝑡𝑛) = 𝑖] = 𝑝𝑖𝑗(𝑡𝑛,𝑡𝑛+1) (4.4) Trong đó 𝑝𝑖𝑗(𝑡𝑛,𝑡𝑛+1) biểu thị xác suất chuyển đổi từ trạng thái 𝑖 tại thời điểm
𝑡𝑛 đến trạng thái 𝑗 tại thời điểm 𝑡𝑛+1. Ma trận 𝑆×𝑆 các nhân tố 𝑝𝑖𝑗 (. , . ) biểu thị
𝑃(𝑡𝑛,𝑡𝑛+1) được gọi là ma trận xác suất chuyển đổi bậc nhất cùng với quy trình ngẫu nhiên {𝑋(𝑡𝑛)}𝑛∈𝑁. Nếu 𝜋(𝑡𝑛) = (𝜋1(𝑡𝑛), . . . ,𝜋𝑠(𝑡𝑛)) mô tả phân phối xác suất các trạng thái của quy trình tại thời điểm 𝑡𝑛, thuộc tính Markov ngụ ý rằng phân phối tại thời điểm 𝑡𝑛+1 có thể được thu từ thời điểm 𝑡𝑛 bằng cách
𝜋(𝑡𝑛+1) =𝜋(𝑡𝑛)𝑃(𝑡𝑛,𝑡𝑛+1). Điều này mở rộng đến ma trận chuyển đổi 𝑚 giai đoạn, để phân phối tại thời điểm 𝑡𝑛+𝑚 với 𝑚 ≥ 2được cho bởi biểu thức sau:
𝜋(𝑡𝑛+𝑚) =𝜋(𝑡𝑛)𝑃(𝑡𝑛,𝑡𝑛+1) …𝑃(𝑡𝑛+𝑚−1,𝑡𝑛+𝑚).
Chuỗi Markov được gọi là tĩnh hay đồng nhất về thời gian, cho rằng
Giả định rằng quy trình {𝑋(𝑡𝑛)}𝑛∈𝑁 là một chuỗi Markov động, là tình huống có dữ liệu mà tôi sẽ kiểm tra sau đây. Nếu ta có một mẫu những khách hàng trước đây, đặt 𝑛𝑖(𝑡𝑛),𝑖 ∈ 𝑆 là số người ở trạng thái 𝑖 tại thời điểm 𝑡𝑛, ngược lại đặt
𝑛𝑖𝑗(𝑡𝑛,𝑡𝑛+1) là số người chuyển từ trạng thái 𝑖 tại thời điểm 𝑡𝑛 sang trạng thái 𝑗
tại thời điểm 𝑡𝑛+1. Ước tính khả năng tối đa của 𝑝𝑖𝑗(𝑡𝑛,𝑡𝑛+1) khi đó là
𝑝̂𝑖𝑗(𝑡𝑛,𝑡𝑛+1) = 𝑛𝑖𝑗(𝑡𝑛,𝑡𝑛+1)
𝑛𝑖(𝑡𝑛) (4.6)
Nếu ta giả định rằng chuỗi Markov là tĩnh thì khi đó dữ liệu trong khoảng thời gian 𝑇+ 1 cho sẵn 𝑛 = 0, 1, 2, . . . ,𝑇, ước tính xác suất chuyển đổi trở thành
𝑝̂𝑖𝑗 = ∑𝑇−1𝑛=0𝑛𝑖𝑗(𝑡𝑛,𝑡𝑛+1)
∑𝑇−1𝑛=0𝑛𝑖(𝑡𝑛) (4.7)
Lưu ý rằng các đặc tính của chuỗi Markov cho thấy những sự chuyển đổi trước đây không ảnh hưởng đến những xác suất chuyển đổi hiện tại, và vì vậy trong những tính toán này tôi không cần quan tâm xem những sự chuyển đổi đến từ cùng một khách hàng là phụ thuộc hay không. Tất cả những sự chuyển đổi này về cơ bản thì độc lập, thậm chí họ là cùng một khách hàng. Ta có thể làm yếu những đặc tính của chuỗi Markov để thông tin cần thiết cho ước tính giá trị tương lai của chuỗi là trạng thái hiện tại và trạng thái trước đó của quy trình. Điều này gọi là chuỗi Markov bậc hai, tương ứng với quy trình trong chuỗi Markov bậc nhất nhưng có không gian trạng thái 𝑆×𝑆. Từ đây ta có thể khái quát những chuỗi Markov bậc thứ 𝑘 với 𝑘 bất kỳ, dĩ nhiên mặc cho không gian trạng thái và kích cỡ của các ma trận xác suất chuyển đổi gia tăng theo hàm mũ khi 𝑘 gia tăng.