2. T NG QUAN CÁC NGHIÊ NC UăTR Că ỂY
3.1.2.2. phù hp ca mô hình Logit
M c tiêu c aăph ngăphápăMLă(maximumălikelihood)ălàăt iăđaăhóaăgiáătr c a LLF (Log likelihood function) ch không ph i là t i thi u hóa RSS (residual sum of squares). Do v y, tiêu chu nănh ăRSS, R2khôngăcònăđúngăv iămôăhìnhăLogit.ăThayăvàoăđó,ăcó 2 cách đoăl ng m căđ phù h p c a mô hình h i quy v i bi n ph thu c b gi i h n:
oăl ng s c m nh d báo (Measures of predictive power): cho th y kh n ngăgi i
thích/ d báo c a các bi năđ c l p t i bi n ph thu c.
- S d ng R-square
V i L0 là likelihood c a mô hình ch có h s ch n (only an intercept model) hay mô hình không d báo (no predictors) và LM là likelihood c a mô hình logit.
Cox-Snell’s R2 = 1 ậ (L0/LM)2/n
Nagelkerke’săR2 = [(1 ậ (L0/LM)2/n)]/ [1-(L0)2/n]
Các giá tr R2 đ uăđoăl ng m căđ c i thi n kh n ngăd báo c a mô hình khi có các bi năđ c l p so v i mô hình khi ch cóătungăđ g căvàăcóăýăngh aăt ngăt R2 trong mô
hình h i quy tuy n tính.
- Phơnătíchăđ ng bi u di n R.O.C (ROC curve)
S d ng AUC (Area Under the ROC Curve)
AUC (Area Under the ROC Curve) là vùng di n tích vùng t d iăđ ngăROCăchoăđ n đi m có t aăđ (1,0) góc ph i c aăđ th . Altman và các c ng s (2010)ăđãăchoăr ng ắvùngăd iăđ ng cong ROC (AUC) là m t công c đoăl ng m căđ chính xác trong d báo c a mô hình, v i giá tr b ngă1ăđ i di n cho m t mô hình hoàn h o”. Hay nói cách khác, n uăđ ng ROC càng g năđi m (0,1) góc trái c aăđ th th kh n ngăd báo c a mô hình càng t t. Sauăđó,ăs d ng ki măđ nh phi tham s Mann ậ Whitney nh m ki măđ nh xem s khác nhau gi a các giá tr AUC có th c s khác nhau v m t th ng kê gi a các mô hình hay không.
S d ng Gini rank coefficient
Theo Anderson (2007), h s Giniăđ căcácănhàăphânătíchăđ aăvàoăs d ngănh ăm t công c đ đoăl ngă m t b ng phân lo i có th phân bi t gi a các quan sát t t và các quan sát x u hi u qu đ n m căđ nào. H s Giniăđ c tính theo công th c (2*AUC ậ 1). M tămôăhìnhălýăt ng, t c là m t mô hình phân lo i hoàn h o các quan sát t t và các
quan sát x u, có h s Gini b ng 1.
Goodness of fit tests: s d ng công c Hosmer-Lemeshow
Ragavană(2008)ăđãăth c hi n,ăcácăđ iăt ngăđ c chia thành x p x 10 nhóm theo phân v . S khác bi t gi a các quan sát và các quan sát k v ng trong các nhóm s t ng h p trong th ng kê Pearson chi-square,ăsauăđóăsoăsánhăgiáătr này v i phân ph i chi-square
v i b t t do là k (k là s nhóm tr điăn).ăM t giá tr nh c a chi-square (<15) và m t giá tr l n c a p-value (>0.05) g i ý r ng mô hình phù h p t t v i d li u.
C 2ăph ngăphápăđ u có nh ngă uănh căđi m khác nhau. Có nh ng mô hình R2 cao, trong khi ki măđ nh goodness of fit tests r t t .ăNg c l i, m t s mô hình ki măđnh Goodness of fit cho k t qu r t t t trong khi R2 r t th p.