Dựa vào Lift Chart hay Classification Matrix, ta thấy rằng Decision Tree Model có khả năng dự đoán chính xác cao nhất (70%), sau đó là Naïve Bayes Model (69%) và cuối cùng là Clustering Model (60%).
4. 8. Sử dụng mô hình để dự đoán
Sau khi chọn được mô hình phù hợp (tốt nhất), bước tiếp theo là sử dụng mô hình đó cho việc dự đoán. Bạn có thể sử dụng ngôn ngữ DMX để thiết lập các quyery cho dự đoán.
Các bước sử dụng model để dự đoán như sau:
Giả sử ta sử dụng mô hình Decision Tree (Mô hình có dự đoán chính xác cao nhất trong 3 Mining models đã xây dựng) để dự đoán khả năng khách hàng mua xe đạp như sau:
Để xem kết quả của dự đoán, chọn mục Result ở góc trên bên trái của của sổ thiết kế Prediction Query. Kết quả như sau
Các cột CustomerKey, BikeBuyer, và Expression được dùng để xác định khách hàng nào tiềm năng (có khả năng mua sản phẩm - ở đây là xe đạp). Và xác suất của các dự đoán chính xác. Bộ phận Marketing có thể sử dụng kết quả này để xây dựng chiến dịch quảng cáo, tiếp cận khách hàng của mình (chẳng hạn quyết định gởi email quảng cáo cho nhóm khách hàng nào), cũng như đề xuất các chiến dịch khuyến mãi, quảng cáo phù hợp với từng nhóm khách hàng để đạt được lợi nhuận cao nhất.
Tài liệu tham khảo
1. Bài giảng môn khai phá dữ liệu tác giả PGS.TS. Đỗ Phúc
2. Giáo trình Khai Phá Dữ liệu tác giả PGS.TS. Đỗ Phúc đại học Quốc Gia, đại học công nghệ thông tin TPHCM.
3. Hướng dẫn sử dụng công cụ khai phá dữ liệu trong SQL tại trang web
http://bis.net.vn/forums/t/458.aspx
http://bis.net.vn/forums/p/450/826.aspx#826
4. Tài liệu kỹ thuật phân lớp trong khai phá dữ liệu của Bùi Trung Hiếu 5. Tìm dữ liệu để thử nghiệm trên SQL Server 2008R2 tại trang web
http://stackoverflow.com/questions/10870537/where-to-download- adventureworks2008-msi