Độ c
hính xác
Hiệu năng của một số bộ phân lớp khác nhau[55] đƣợc so sánh và thể hiện trong Bảng 2.2. Cơ sở dùng để so sánh là kết quả phân lớp mà khơng lựa chọn đặc trƣng. Một số bộ phân lớp đƣợc sử dụng trong thực nghiệm của chúng tơi bao gồm: SVM, CART, k-NN, Naive Bayes, MLP. Các phƣơng pháp lựa chọn đặc trƣng khác nhau cũng đƣợc sử dụng để so sánh bao gồm cả phƣơng pháp Lọc và phƣơng pháp Đĩng gĩi. Phƣơng pháp lọc bao gồm: t-test, phân tích biệt thức tuyến tính (LDA), hồi quy Logistic (LR). Phƣơng pháp Đĩng gĩi sử dụng các kỹ thuật tối ƣu bao gồm: thuật tốn di truyền (GA) và tối ƣu hĩa bầy đàn (PSO).
Bảng 2.2So sánh hiệu năng của các bộ phân lớp[55] trên bộ dữ liệu tín dụng của Đức Bộ phân lớp Phƣơng pháp Lọc Phƣơng pháp Đĩng gĩi Phƣơng pháp Bộ phân lớp Phƣơng pháp Lọc Phƣơng pháp Đĩng gĩi Phƣơng pháp
cơ sở
t-test LDA LR GA PSO
SVM 76,74 75,72 75,10 76,54 73,76 77,18 CART 74,28 73,52 73,66 75,72 74,16 74,30 k-NN 71,82 71,86 72,62 72,24 71,60 70,86 Nạve Bayes 72,40 70,88 71,44 71,56 74,16 70,52 MLP 73,28 73,44 73,42 74,03 72,54 71,76 RandomForest 75,3 Lựa chọn tiến 76,20
Qua kết quả so sánh hiệu năng của các phƣơng pháp khác nhau nhƣ thể hiện trong Bảng 2.2, chúng tơi thấy rằngđộ chính xác của RF trên tập hợp con các đặc trƣng mới đƣợc chọn đã đƣợc tăng lên từ 73.4% ban đầu thành 76,20%. Và số lƣợng các đặc trƣng đƣợc lựa chọn chỉ cịn lại 65% so với số lƣợng đặc trƣng ban đầu.
Hơn nữa, phƣơng pháp của chúng tơi dựa trên kỹ thuật xử lý song song của kiến trúc H20 cho phép thời gian để chạy nhanh hơn 9,5 lầnso với bộ phân lớp rừng ngẫu nhiên gốc.
Kết quả thực nghiệm theo hướng lùi sử dụng FRFE
Áp dụng phƣơng pháplựa chọn đặc trƣng FRFEtheo hƣớng lùi, chúng tơi cĩ kết quả nhƣ Hình 2.14