7. Bố cục luận văn
3.3.2. Mô hình RandomForest
a. ết qu mô hình phân lớp với andom rorest
******* MÔ HÌNH *******
Random forest của 25 Cây, ở mỗi lần tạo cây xem xét 5 thuộc tính. Tỉ lệ lỗi Out of bag: 0.2065
RandomTree ========== phamvihoatdong = NgoaiTinh | sotienboithuong < 30 | | thoigiansudung < 8.5 | | | kinhnghiemlaixe < 8 | | | | baoduongdinhky = Co : TrungBinh (1/0) | | | | baoduongdinhky = Khong
| | | | | mucdichsudung = ChuyenDung : Thap (2/0) .
.
| | | | | | phamvihoatdong = NgoaiTinh : Thap (1/0) | | | | | | phamvihoatdong = TrongTinh : Thap (8/2) | | | | thoigiansudung >= 12 : Thap (9/0)
sotienboithuong >= 35 : Cao (156/0)
************** TỔNG KẾT ******************
Số trường hợp chính xác của Cây Quyết Định(C4.5) với 1724 trường hợp = 1452.0 Tỉ lệ chính xác của của Cây Quyết Định(C4.5) = 84.22273781902551%
Hình 3.19. Mô hình Cây quyết định bằng Random Forest
Với kết quả trên là mô hình của tập hợp 25 cây với 5 thuộc tính ng u nhiên đƣợc chọn khi xem xét chia cây.
Cách biểu diễn nhƣ trên giúp ta có thể biểu diễn đƣợc những cây có kích thƣớc lớn để dễ cho việc sử dụng.
b. ánh giá độ chính xác của mô hình
Đánh giá độ chính xác của mô hình b ng cách sử dụng k-fold croos validation với k=10 Kết quả với mỗi lần chạy là:
Hình 3.20. Độ chính xác của mô hình Random Forest- fold1
Vậy Fold 1: Đúng 144/173 => 83,23% Tƣơng tự với các lần chạy còn lại:
-Fold 2 : Đúng 141/173 => 81,50% -Fold 3 : Đúng 140/173 => 80,92% -Fold 4 : Đúng 152/173 => 87,86% -Fold 5 : Đúng 141/172 => 81,97% -Fold 6 : Đúng 146/172 => 84,88% -Fold 7 : Đúng 152/172 => 88,37% -Fold 8 : Đúng 143/172 => 83,13% -Fold 9 : Đúng 146/172 => 84,88% -Fold 10 : Đúng 156/172 => 84,74% Kết quả độ chính xác: 1461/1724 => 84,74% ************** TỔNG KẾT ******************
Số trường hợp chính xác của Random Forests với 1724 trường hợp = 1461.0 Tỉ lệ chính xác của Random Forests = 84.74477958236659%
***************************************
Hình 3.21. Kết quả Độ chính xác của mô hình Random Forest