Mô hình hồi quy Binary Logistic là mô hình phân tích hồi quy tuyến tính trong đó biến phụ thuộc là biến định tính và nhị phân (chỉ mang 2 tính chất Có/Không) và biến độc lập (nguyên nhân) có thể là biến định tính hoặc định lượng do đó hồi quy Binary Logistic là một trong những mô hình được sử dụng phổ biến trong phân loại và dự báo. Bên cạnh việc cung cấp thông tin về mối quan hệ giữa các biến, phương pháp hồi quy này còn tính toán xác suất xảy ra biến cố cần dự báo. Để sử dụng mô hình hồi quy Logistic đòi hỏi một số điều kiện sau:
- Biến phân loại phải là biến nhị phân (biến phân loại chỉ có 2 nhóm) - Biến độc lập không được là thang đo khoảng
- Biến phân loại cần phải triệt tiêu lẫn nhau. Nói cách khác là quan sát nào thuộc nhóm này thì không thuộc nhóm còn lại
- Cần có bộ mẫu đủ để tối ưu giá trị hiệp phương sai do đó cần có ít nhất 50 quan sát.
Mô hình hồi quy Binary Logistic có dạng tổng quát như sau:
1 1 2 2 3 3 1 1 2 2 3 3 ... ... exp 1 exp x x x x x x p Trong đó: p = Xác suất phá sản
exp = Hàm nghịch đảo của ln (2, 72)
= Hằng số có phương trình
= Hiệp phương sai của các biến dự báo
Mô hình hồi quy này phân loại bằng cách ước lượng xác suất xảy ra đối với biến phụ thuộc dựa vào biến độc lập đã cho sẵn, thay vì ước lượng số như hồi
48
quy tuyến tính thông thường. Trong đó khi các x nhận các giá trị từ - đến thì p nhận giá trị từ 0 đến 1. Do đó mặc dù hồi quy logistic có dạng tương tự với hồi quy tuyến tính nhưng thay vì sử dụng phương pháp OLS để ước lượng mô hình, ở đây ta dùng phương pháp Maximum Likelihood để ước lượng .
Chỉ số thống kê quan trọng trong hồi quy Logistic là tỷ số nguy cơ (Odds Ratio– OR) được tính như sau. Hệ số Odds: Là tỉ lệ xác suất xảy ra sự kiện với xác suất không xảy ra sự kiện. Hay nói cách khác là khả năng xảy ra sự kiện gấp bao nhiêu lần so với không xảy ra.
1 p odd p
So với mô hình phân loại MDA việc vận dụng còn nhiều hạn chế thì mô hình Binary Logistic là một trong những công cụ mạnh trong dự báo ngắn hạn và được sử dụng phổ biến hơn nhờ vào những ưu điểm nổi bật so với công cụ phân loại khác nhờ vào tính việc nó cho phép sử dụng hỗn hợp biến độc lập là định lượng và biến định tính. Đồng thời hỗ trợ sử dụng các biến giả. Biến độc lập có thể là biến liên tục hay rời rạc đều có thể sử dụng phương pháp này. Bên cạnh đó phương pháp Binary Logistic cũng đòi hỏi ít giả định hơn so với phương pháp MDA đồng thời cung cấp một xác suất cho biến cố cần dự báo tạo ra thuận lợi cho việc ứng dụng trong thực tiễn.