ÁNH GIÁ, N HN XÉT KT QU MƠ HÌNH

Một phần của tài liệu XÂY DỰNG ỨNG DỰNG DỰ BÁO CHỈ SỐ CPI VÀ TÌNH HÌNH LẠM PHÁT KINH TẾ VIỆT NAM ĐẾN NĂM 2020 (Trang 60 - 63)

K t l un ch n g2

3.3. ÁNH GIÁ, N HN XÉT KT QU MƠ HÌNH

Vi c ánh giá các mơ hình là c n thi t m b o r ng các mơ hình

chúng ta xây d ng s cĩ hi u qu d báo t t. ây, chúng ta s t p trung vào

kh n ng d ốn c a các mơ hình qua vi c quan sát k t qu c a ma tr n nh m l n (confusion matrix), T l chính xác, MAE, RMSE, Precision, Recall,

F1-score, Error_rate ánh giá, nh n xét các mơ hình. Trong ĩ:

Confusion matrix Predicted Class

Actual Class

tang giam

tang a b

giam c d

a: TP (true positive) m u mang nhãn d ng c phân l p úng vào

l p d ng.

b:FN (false negative) m u mang nhãn d ng b phân l p sai vào

c:FP (false positive) m u mang nhãn âm b phân l p sai vào l p d ng.

d:TN (true negative) m u mang nhãn âm c phân l p úng vào

l p âm.

MAE (Mean Absolute Error) Sai s tuy t i trung bình

MAE là m t ph ng pháp o l ng s khác bi t gi a hai bi n liên t c.

Gi s r ng X và Y là hai bi n liên t c th hi n k t qu d ốn c a mơ hình

và k t qu th c t , o MAE c tính theo cơng th c sau:

MAE = =

RMSE (Root mean squared error) c n b c hai sai s bình ph ng trung bình

RMSE th ng xuyên c s d ng ánh giá kh p c a mơ hình so

v i d li u hu n luy n. c tính b ng c n b c hai c a giá tr tuy t i c a h

s t ng quan gi a giá tr th c và giá tr d ốn.

RMSE=

Precision (bao nhiêu cái úng c l y ra)

Xem xét trên t p d li u ki m tra xem cĩ bao nhiêu d li u c mơ

hình d ốn úng. ây chính là ch s accuracy ( chính xác c a mơ

hình), Precision c tính nh sau:

Precision =

Tuy nhiên cho khách quan h n ng i ta c n ph i xem xét thêm m t

y u t n a chính làRecall, Recall (bao nhiêu cái c l y ra là úng) c

tính theo cơng th c sau:

Ch s này cịn c g i là nh y c a mơ hình là xem xét cĩ kh n ng t ng quát hĩa nh th nào.

F1-score là harmonic mean c a precision và recall (gi s r ng hai i l ng này khác khơng)

F1-score = 2

F1-score càng cao, b phân l p càng t t. T ng h p k t qu t các mơ hình nh sau:

B ng 3.3. score cĩ giá tr n m trong n a kho ng B ng t ng h p k t qu phân tích các mơ hình

Classifier MAE RMSE Precision Recall F1-score Error_rate

Train Test Train Test Train Test Train Test Train Test Train Test

Logistic 0.1148 0.1152 0.2381 0.2186 0.933 0.961 0.935 0.935 0.934 0.948 0.067 0.039 NaiveBayes 0.1285 0.1144 0.3069 0.2687 0.883 0.907 0.887 0.871 0.885 0.889 0.117 0.093 BayesNet 0.1235 0.1436 0.2698 0.2808 0.916 0.945 0.909 0.871 0.912 0.906 0.084 0.055 Tree J48 0.1028 0.0889 0.2267 0.1705 0.940 0.976 0.942 0.986 0.941 0.981 0.060 0.058 kNN K=1 0.0551 0.061 0.1621 0.1534 0.963 0.969 0.961 0.968 0.962 0.968 0.037 0.031 K=2 0.1006 0.1131 0.2133 0.2058 0.929 0.969 0.922 0.968 0.925 0.968 0.071 0.078 K=3 0.116 0.1128 0.2375 0.2153 0.919 0.967 0.922 0.968 0.92 0.967 0.081 0.033 SMO 0.0909 0.129 0.3015 0.3529 0.920 0.945 0.909 0.871 0.914 0.906 0.080 0.055 Multilayer Perceptron 0.0633 0.0678 0.1668 0.1529 0.961 0.976 0.961 0.968 0.961 0.972 0.039 0.033

Hình 3.19. Bi u so sánh k t qu d báo các mơ hình

D a vào b ng k t qu phân tích và bi u so sánh trên chúng ta cĩ th k t lu n r ng i v i t p d li u ã cĩ trong lu n v n này thì mơ hình

MultilayerPerceptroncho k t qu d báo chính xác cao nh t (> 96%), t l d báo l i th p nh t (< 4%) t p d li u hu n luy n và cho k t qu d báo chính xác cao nh t (> 96.5%), t l d báo l i th p nh t (x p x 3.5%) t p d li u ki m th và t l F1-score i v i t p d li u hu n luy n là > 96%, t p ki m th là > 97%, t l F1 càng cao cho th y b phân l p càng t t. V y, ta cĩ th

u tiên l a ch n mơ hình Multilayer Perceptron cho bài tốn.

Một phần của tài liệu XÂY DỰNG ỨNG DỰNG DỰ BÁO CHỈ SỐ CPI VÀ TÌNH HÌNH LẠM PHÁT KINH TẾ VIỆT NAM ĐẾN NĂM 2020 (Trang 60 - 63)

Tải bản đầy đủ (PDF)

(76 trang)