Theo nhận đinh của IBM, hiện nay những kỹ thuật Data Mining đƣợc sử dụng rông rãi chia làm hai phạm trù:
- Khai phá dữ liệu khám phá - Khai phá dữ liệu đoán trƣớc
1- Khai phá dữ liệu khám phá (Discovery data mining)
Khai phá dữ liệu khám phá là một phạm trù của kỹ thuật tìm những mẫu dữ liệu bên trong kho dữ liệu mà chúng ta không có một kiến thức truớc nào của mẫu dữ liệu đó.
Sau đây là những ví dụ cho loại Khai phá dữ liệu khám phá:
Phân cụm ( Clustering ) : Chẳng hạn phân cụm khách hàng theo một mục tiêu nào đó, chẳng hạn theo mức thu nhập.
Phân tích mối liên kết ( Link analysis) : Ví dụ điển hình nhất của phân tích
mối liên kết là bài toán Cái giỏ thị trường đây là bài toán phân tích mối liên hệ
giữa các loại sản phẩm mà một khách hàng hay là một gia đình thƣờng mua kèm với nhau
Phân tích tần số ( Frequency analysis ): Đây là kỹ thuật phân tích thời gian của những bản ghi trong Cơ sở dữ liệu, nhằm tìm kiếm quy luật xuất hiện của một loại thông tin
2- Khai phá dữ liệu đoán trƣớc
Khai phá dữ liệu đoán trƣớc là tìm kiếm một mối quan hệ đặc biệt giữa một biến và các biến khác trong dữ liệu
- Phân loại ( Classification ) : Đây là kỹ thuật nhằm vào việc gán những mẫu tin vào một phạm trù định nghĩa trƣớc, chẳng hạn gán
mỗi khách hàng vào một phân khúc thị trường. Kỹ thuật này khám
phá mối quan hệ giữa những biến và một phạm trù, khi một bản ghi mới đƣợc xác lập, kỹ thuật này xác định phạm trù mà biến này thuộc vào và xác suất mà bản ghi này thuộc vào phạm trù ấy.
- Dự đoán giá trị ( Value prediction ) : Đây là nhóm kỹ thuật nhằm dự
đoán giá trị của một biến liên tục từ những biến khác trong một mẩu tin dữ liệu, chẳng hạn dự đoán chi phí của một khách hàng dựa vào tuổi, tầng lớp và thu nhập của họ. Một trong những kỹ thuật khá quen thuộc là tìm phụ thuộc ham nhƣ hồi quy tuyến tính …