Cây quyết định cĩ thể hỗ trợ phân lớp và các vấn đề hồi quy. Cây quyết định gần đây được gọi là Cây phân loại và hồi quy (CART). Họ làm việc bằng cách tạo một cây để đánh giá một thể hiện của dữ liệu, bắt đầu từ gốc của cây và chuyển thị trấn đến lá (Roots) cho đến khi cĩ thể dự đốn. Quá trình tạo cây quyết định hoạt động bằng cách tham lam chọn điểm phân chia tốt nhất để đưa ra dự đốn và lặp lại quy trình cho đến khi cây cĩ độ sâu cố định.
Sau khi cây được xây dựng, nĩ được cắt tỉa để cải thiện khả năng mơ hình hĩa để tổng quát hĩa dữ liệu mới.
Chọn thuật tốn cây quyết định:
1. Nhấp vào nút “Choose” và chọn “REPTree” trong nhĩm “Trees”. 2. Nhấp vào tên của thuật tốn để xem lại cấu hình thuật tốn.
Hình 3. 10. Cấu hình Weka cho thuật tốn Cây quyết định (Decision Tree)
Độ sâu của cây được xác định tự động, nhưng độ sâu cĩ thể được chỉ định trong thuộc tính maxDepth. Cũng cĩ thể chọn chuyển chế độ cắt tỉa bằng cách đặt tham số noPruning thành True, mặc dù điều này cĩ thể dẫn đến hiệu suất kém hơn. Tham số minNum xác định số lượng phiên bản tối thiểu được cây hỗ trợ trong một nút lá khi xây dựng cây từ dữ liệu huấn luyện.
1. Nhấn vào “Ok” đây để đĩng cấu hình thuật tốn.
2. Nhấp vào nút “Start” trực tiếp để chạy thuật tốn trên bộ dữ liệu Ionosphere.
Cĩ thể thấy rằng với cấu hình mặc định, thuật tốn cây quyết định đạt được độ chính xác 89%.
Hình 3. 11. Kết quả phân lớp Weka cho thuật tốn Cây quyết định (Decision Tree)
Một thuật tốn cây quyết định nâng cao khác mà bạn cĩ thể sử dụng là thuật tốn C4.5, được gọi là J48 trong Weka.
Cĩ thể xem lại một hình ảnh trực quan của cây quyết định được chuẩn bị trên tồn bộ dữ liệu huấn luyện bằng cách nhấp chuột phải vào “Result list” của trị chơi và nhấp vào “Visualize Tree”.