K t lunch ng 1:
2.2.2.1 Sd ng mô hình Bayesian Network:
ây là d li u thu đ c sau khi th c hi n thành công, g m thông tin v t p d
B ng 2.1: K t qu c a mô hình h c máy Bayesian Network (2 trang)
Scheme: weka.classifiers.bayes.BayesNet - D - Q
weka.classifiers.bayes.net.search.local.K2 - - - P 1 - S BAYES - E
weka.classifiers.bayes.net.estimate.SimpleEstimator - - - A 0.5 Relation: 1.nonfraud&fraud- non dscr
Instances: 202 Attributes: 29
=== Classifier model (full training set) === Bayes Network Classifier
not using ADTree
#attributes=29 #classindex=28
Network structure (nodes followed by parents) Time taken to build model: 0.02 seconds === Evaluation on training set ===
Time taken to test model on training data: 0.02 seconds === Summary ===
Correctly Classified Instances 131 64.8515 % Incorrectly Classified Instances 71 35.1485 % Kappa statistic 0.3064
Mean absolute error 0.3618 Root mean squared error 0.4787 Relative absolute error 72.4133 % Root relative squared error 95.7915 % Coverage of cases (0.95 level) 97.5248 % Mean rel. region size (0.95 level) 90.8416 % Total Number of Instances 202 === Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F- Measure MCC ROC Area PRC Area Class 0.888 0.577 0.592 0.888 0.71 0.349 0.748 0.718 NonFraud 0.423 0.112 0.8 0.423 0.553 0.349 0.748 0.739 Fraud Weighted Avg. 0.649 0.338 0.699 0.649 0.63 0.349 0.748 0.729 === Confusion Matrix ===
B ng 2.1: K t qu c a mô hình h c máy Bayesian Network (2 trang)
a b <- - classified as 87 11 | a = NonFraud 60 44 | b = Fraud
Theo k t qu trên đây thì m u d li u g m có 202 công ty, phân lo i ban đ u có
104 BCTC có đi u ch nh sau khi công b (có sai sót tr ng y u), nh ng mô hình ch
phát hi n đ c 87 tr ng h p; phân lo i ban đ u có 98 BCTC không có đi u ch nh sau khi công b , nh ng mô hình ch phát hi n đ c 44 tr ng h p; t ng s phát
hi n đúng là 131 tr ng h p (64,9%), phát hi n sai 71 tr ng h p (35,1%).
Mô hình phân l p này không đ t hi u qu l m.