Naive Bayes là một thuật tốn phân lớp. Theo truyền thống, nĩ giả định rằng các giá trị đầu vào là danh nghĩa, mặc dù các đầu vào số được hỗ trợ bằng cách giả sử phân phối.
Naive Bayes sử dụng một triển khai đơn giản của Bayes Theorem (hence naive)
trong đĩ xác suất trước cho mỗi lớp được tính từ dữ liệu huấn luyện và được coi là độc lập với nhau (được gọi là độc lập cĩ điều kiện).
Đây là một giả định khơng thực tế bởi vì chúng ta hy vọng các biến sẽ tương tác và phụ thuộc, mặc dù giả định này làm cho xác suất nhanh và dễ tính tốn. Ngay cả theo giả định phi thực tế này, Naive Bayes đã được chứng minh là một thuật tốn phân lớp rất hiệu quả.
Naive Bayes tính tốn xác suất sau cho mỗi lớp và đưa ra dự đốn cho lớp cĩ xác suất cao nhất. Như vậy, nĩ hỗ trợ cả các vấn đề phân lớp nhị phân và phân lớp nhiều lớp.
Chọn thuật tốn Naive Bayes:
1. Nhấp vào nút “Choose” Lựa chọn và chọn Tập tin “NaiveBayes” trực tuyến trong nhĩm “Bay Bayes”.
2. Nhấp vào tên của thuật tốn để xem lại cấu hình thuật tốn.
Hình 3. 8. Cấu hình Weka cho thuật tốn Naive Bayes
Theo mặc định, một phân phối Gaussian được giả sử cho từng thuộc tính số. Các phân phối này cĩ thể thay đổi thuật tốn để sử dụng cơng cụ ước tính Kernel với đối số sử dụng Kernel Estimator cĩ thể phù hợp hơn với phân phối thực tế của các thuộc tính trong tập dữ liệu của bạn. Tuy nhiên, các thơng số này cĩ thể tự động chuyển đổi các thuộc tính số thành thuộc tính danh nghĩa với tham số sử dụng Supervised Discretization.
1. Nhấn vào “Ok” đây để đĩng cấu hình thuật tốn.
2. Nhấp vào nút “Start” trực tiếp để chạy thuật tốn trên bộ dữ liệu Ionosphere.
Cĩ thể thấy rằng với cấu hình mặc định mà Naive Bayes đạt được độ chính xác là 82%.
Hình 3. 9. Kết quả phân lớp Weka cho thuật tốn Naive Bayes