- Ba loại ứng dụng kho dữ liệu
o Xử lý thông tin: hỗ trợ việc truy vấn thông tin, phân tích thống kê cơ bản và làm báo cáo sử dụng các bảng tham chiếu chéo, các bảng, các biểu đồvà đồ
thị
o Xử lý phân tích: dùng cho phân tích đa chiều của kho dữ liệu, hỗ trợ các thao
tác OLAP cơ bản, cắt ngang, cắt dọc, khoan sâu, xoay
o Khai phá dữ liệu bao gồm:
101
Hỗ trợ luật kết hợp, xây dựng các mô hình phân tích,thực hiện phân loại và dự đoán,trình bày các kết quả khai phá sử dụng các công cụ trực quan Ba nhiệm vụ này khác nhau về bản chất và ý nghĩa ứng dụng, một cho truy vấn báo cáo đơn
giản, một cho phân tích đểđƣa ra các kết quả tổng hợp, cái cuối cùng để dành cho việc phát hiện tri thức tiềm ẩn trong dữ liệu
Từ xử lý phân tích trực tuyến (OLAP) tới khai phá phân tích trực tuyến (OLAM)
- Tại sao cần khai phá phân tích trực tuyến
o Vì dữ liệu trong kho dữ liệu đƣợc lƣu trữ với chất lƣợng cao do chứa những dữ liệu đã đƣợc làm sạch, đồng nhất và tích hợp
o Vì cấu trúc xử lý thông tin sẵn có xung quanh các kho dữ liệu nhƣ ODBC (kết nối dữ liệu), OLEDB (nhúng cơ sở dữ liệu), truy nhập Web, các dịch vụ tiện tích, các công cụ OLAP và báo cáo.
o Vì cần phân tích dữ liệu thăm dò dựa trên OLAP:có thể khai phá với các phép toán khoan sâu, cắt lát, xoay, v.v…
o Lựa chọn trực tuyến các chức năng khai phá dữ liệu: tích hợp và hoán đổi nhiều chức năng khai thác khác nhau, các thuật toán và nhiệm vụ khác nhau.
102