- Ba loại ứng dụng kho dữ liệu
o Xử lý thông tin: hỗ trợ việc truy vấn thông tin, phân tích thống kê cơ bản và làm báo cáo sử dụng các bảng tham chiếu chéo, các bảng, các biểu đồvà đồ
thị
o Xử lý phân tích: dùng cho phân tích đa chiều của kho dữ liệu, hỗ trợ các thao
tác OLAP cơ bản, cắt ngang, cắt dọc, khoan sâu, xoay
o Khai phá dữ liệu bao gồm:
101
Hỗ trợ luật kết hợp, xây dựng các mô hình phân tích,thực hiện phân loại
và dự đoán,trình bày các kết quả khai phá sử dụng các công cụ trực quan
Ba nhiệm vụ này khác nhau về bản chất và ý nghĩa ứng dụng, một cho truy vấn báo cáo đơn
giản, một cho phân tích đểđƣa ra các kết quả tổng hợp, cái cuối cùng để dành cho việc phát hiện
tri thức tiềm ẩn trong dữ liệu
Từ xử lý phân tích trực tuyến (OLAP) tới khai phá phân tích trực tuyến (OLAM)
- Tại sao cần khai phá phân tích trực tuyến
o Vì dữ liệu trong kho dữ liệu đƣợc lƣu trữ với chất lƣợng cao do chứa những dữ liệu đã đƣợc làm sạch, đồng nhất và tích hợp
o Vì cấu trúc xử lý thông tin sẵn có xung quanh các kho dữ liệu nhƣ ODBC (kết nối
dữ liệu), OLEDB (nhúng cơ sở dữ liệu), truy nhập Web, các dịch vụ tiện tích, các
công cụ OLAP và báo cáo.
o Vì cần phân tích dữ liệu thăm dò dựa trên OLAP:có thể khai phá với các phép toán khoan sâu, cắt lát, xoay, v.v…
o Lựa chọn trực tuyến các chức năng khai phá dữ liệu: tích hợp và hoán đổi nhiều
chức năng khai thác khác nhau, các thuật toán và nhiệm vụ khác nhau.
102