– Giả thuyết của hồi quy logistic • Quan hệ tuyến tính (linearity) • Quan hệ cộng gộp (additivity) • Các quan sát phải độc lập
Xây dựng mơ hình đa biến
• Bước 8: Kiểm tra độ phù hợp của Mơ hình F
– Kiểm định Chi2 xem dữ liệu cĩ phù hợp với mơ hình
(observed vs expected)
• Pearson Chi2 test for goodness of fit
• Hosmer-Lemeshow Chi2 test for goodness of fit #
phương pháp decile • Kỳ vọng p > 0,05
– R2 dựa vào phương pháp của Pearson
– R2 dựa vào log likelihood ~ Pseudo R2 = 1 - LModel / L0
Xây dựng mơ hình đa biến
• Bước 8: Kiểm tra độ phù hợp của Mơ hình F
– AIC (Akaike's Information Criterion)
• “Trừng phạt” mơ hình nhiều biến số ít ý nghĩa • AIC = 2 x (Số biến - log-likelihood)
• Khi đưa bất kỳ biến mới vào thì log-likelihood sẽ gia tăng
• Giá trị càng thấp càng tốt (ngưỡng <3, 3 – 7, >7) – BIC (Bayesian Information Criterion)
Xây dựng mơ hình đa biến
• Bước 8: Kiểm tra độ phù hợp của Mơ hình F
– VIF (Variance Inflation Factor) → Collinearity
• Sai số chuẩn gia tăng khi cĩ collinearity → giảm power • VIF = 1 → Khơng cĩ collinearity
• 1 < VIF < 5 → cĩ collinearity vừa • > 5 → cĩ collinearity mạnh
– Khả năng xác định phân biệt (diện tích dưới đường cong ROC)
Xây dựng mơ hình đa biến
• Bước 8: Kiểm tra độ phù hợp của Mơ hình F
– Phân phối của giá trị tiên đốn
– Phân phối bình thường của phần dư (residual)
– Xây dựng lại Mơ hình F trên dữ liệu đánh giá
• Ví dụ: ban đầu chỉ chọn ngẫu nhiên khoảng 60% dữ liệu để xây dựng mơ hình
• Sau khi cĩ mơ hình thì chạy lại mơ hình trên tồn bộ dữ liệu
Nội dung đã học
• Cơng thức mơ hình hồi quy logistic – Tính xác suất từ mơ hình
– Tính tỉ số số chênh từ mơ hình • Nguyên tắc xây dựng mơ hình
• Phương pháp xây dựng mơ hình đa biến • Đánh giá mơ hình