Hồi quy Logistic đơn

Một phần của tài liệu đánh giá khả năng trả nợ vay ngân hàng bằng mô hình bài toán phân loại (Trang 36)

IV. ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU

2.4.2Hồi quy Logistic đơn

a) Mô hình

Khi phân tích dữ liệu nhị phân, chúng ta quan tâm đến việc phân tích mối quan hệ giữa xác suất của kết quả thành công với các biến độc lập ảnh hƣởng đến kết quả này, hơn là phân tích mối quan hệ giữa giá trị của biến phụ thuộc với các biến độc lập.

Khi tìm mối quan hệ giữa biến phụ thuộc nhị phân với các biến độc lập khác ta gặp vấn đề khó khăn so với các mô hình hồi quy khác. Bởi xác suất của sự thành công chỉ có thể đƣa giá trị giữa và trong khi các biến độc lập khác có thể nhận giá trị bất kỳ. Để giải quyết khó khăn này, ngƣời ta sử dụng mô hình hồi quy Logistic. Hàm hồi quy Logistic sẽ tìm mối quan hệ giữa odds của một sự thành công với các biến độc lập khác bất kỳ. Mối quan hệ này có thể tuyến tính và phi tuyến tính. Tuy nhiên, trong các bài toán thực tế mối quan hệ này thông thƣờng là tuyến tính.

Xét hai biến XY, trong đó Y chỉ nhận giá trị là 0 và 1 còn giá trị của X

ảnh hƣởng đến giá trị của Y. Gọi ( ) ( | ) là xác suất có điều kiện của khi X xảy ra. Giả sử ( ) có mối quan hệ với biến X, nhƣng ta không thể tìm trực tiếp mối quan hệ này vì ( ) thuộc , - trong khi tùy ý. Bởi vì [ ( ( ))] 0 ( )

( )1 có mối quan hệ với ( ) và có giá trị bất kỳ nên ta có thể thay thế mối quan hệ giữa ( ) và bằng mối quan hệ giữa 0 ( ) ( ) 1 và X. Giả sử mối quan hệ này là tuyến tính

[ ( )

( )] ( )

Hay

( )

( ) ( ) ( )

(2.9) và (2.10) là hai hình thức của mô hình hồi quy Logistic đơn. Trong đó

[ ( ( ))] hay 0 ( ) ( ) 1 còn đƣợc gọi là ( ( )).

Hai tham số và đƣợc gọi là hai hệ số của đƣờng hồi quy, cụ thể hơn đƣợc gọi là điểm chắn, đƣợc gọi là độ dốc.

30

Chú ý:

i) Ta có

* ( )+ * ( )+ ( ) ( )

Như vậy khi tăng lên 1 đơn vị thì ( ( )) sẽ tăng lên ii) Khi thì giá trị của odds tương ứng là

( ( )| ) ( )

Khi (tức tăng lên 1 đơn vị từ thì

( ( )| ) ( ( ))

Khi đó tỷ số là tỷ số của hai odds và được tính bằng công thức sau:

( ( )| )

( ( )| )

( ( ))

( ) ( )

b) Xây dựng đƣờng hồi quy mẫu

Trong hồi quy Logistic, các hệ số trong các đƣờng hồi quy đƣợc ƣớc lƣợng bằng phƣơng pháp hợp lý cực đại.

Giả sử ta có n mẫu quan sát độc lập ( ) . Trong đó

( ) . Giả sử phân phối có điều kiện cho khi xảy ra là phân phối nhị thức ( ) với (adsbygoogle = window.adsbygoogle || []).push({});

[

]

Gọi ̂ , ̂ lần lƣợt là các ƣớc lƣợng của và . Chúng ta xây dựng đƣờng hồi quy

( ( )

( )) ̂ ̂ ( )

Từ (2.11) ta có xác suất của sự thành công và không thành công đƣợc xác định bởi ( ̂ ̂ ) ( ̂ ̂ ) ( ̂ ̂ ) Thực hiên n lần quan sát ta có hàm hợp lý ( ̂ ̂ ) ∏ ( ) ∏ [( ( ̂ ̂ ) ( ̂ ̂ )) ( ( ̂ ̂ )) ]

31

( ̂ ∑ ̂ ∑ ) ∏ [ ( ̂ ̂ )]

Trong đó, nhận giá trị bằng 1 nếu kết quả thành công và nhận giá trị bằng 0 nếu kết quả thất bại.

Ta có ( ) * ( ̂ ̂ ) ( ̂ ̂ )+ ∑ ( ) ( ( ̂ ̂ ) ( ̂ ̂ )) (∑∑ ( ) ( ) )

Cho ( ) ta có hệ phƣơng trình cụ thể nhƣ sau:

{ ∑ ∑( [ ( ̂ ̂ )]) ∑ ∑ ( [ ( ̂ ̂ )])

Việc giải hệ phƣơng trình để tìm một biểu thức giải tích cụ thể rất phức tạp trong trƣờng hợp tổng quát, nên ngƣời ta chỉ giải trong trƣờng hợp cụ thể. Tuy nhiên việc tính toán trong trƣờng hợp cụ thể cũng không đơn giản, nên trong thực tế ngƣời ta thƣờng sử dụng đến sự hỗ trợ của các phần mềm toán học nhƣ SPSS hay R.

Một phần của tài liệu đánh giá khả năng trả nợ vay ngân hàng bằng mô hình bài toán phân loại (Trang 36)