1. Thế nào về kho dữ liệu ? Quản lý kho dữ liệu ?– để cho học viên phát biểu trước khi đưa ra các khái niệm chính thức
3.1.2. Các kỹ thuật khai thác DW
Kỹ thuật khai thác DW thường dựa trên kỹ thuật truy vấn đa chiều (Multidimension Query Techniques) bao gồm các kỹ thuật phân tích cơ bản như sau:
Slicing (cắt lát): chính là việc giới hạn khung nhìn dữ liệu theo một nhiều từ các chiều trong số các chiều sẵn có. Ví dụ dữ liệu bán hàng trong bảng fact phụ thuộc vào 03 chiều là sản phẩm, vng và thi gian thì việc lấy dữ liệu theo chiều vùng cho tất cả sản phẩm và thời gian là một “lát cắt”..
Dicing (thái nhỏ): chính là việc cắt lát theo nhiều chiều khác nhau, và cũng có
thể trong mỗi chiều lại bị giới hạn bởi các điều kiện.
Drilling (phân tích): thực hiện phân tích dữ liệu theo nhiều hướng khác nhau
kết quả có thể là tập dữ liệu tổng hợp tập dữ liệu chi tiết hơn tập dữ liệu đang xem xét. Việc phân tích cũng chia làm 03 loại.
o Drilling Down (Phân tích chi tiết): cho phép xem xét dữ liệu ở mức chi tiết hơn so với mức hiện hành. Ví dụ: đang xem dữ liệu bán hàng theo từng tháng mà chọn Drill Down hì dữ liệu chi tiết đến từng ngày bán hàng cho tháng vừa chọn sẽ hiện ra. Chú ý: thứ tự phân cấp về thời gian <Năm -> Tháng -> ngày> phải được định nghĩa trước.
o Drilling Up (Phân tích tổng hợp): cho phép xem xét dữ liệu ở mức tổng hợp hơn so với mức hiện hành. Ví dụ: đang xem dữ liệu bán hàng theo từng tháng mà chọn Drill Up thì dữ liệu sẽ tổng hợp đến từng năm bán hàng.
o Drilling Across (Phân tích chéo): tức là đang phân tích dữ liệu theo một cây phân cấp (Hierarchy) lại chuyển sang kết hợp theo một thuộc tính thuộc cây phân cấp khác. Ví dụ: đang xem dữ liệu bán hàng theo mức tháng (theo cây phân cấp theo yếu tố thời gian) thì ta có thể chọn thêm chiều tỉnh thành (Theo cây phân cấp địa lý Vùng -> Tỉnh -> Huyện) để xem dữ liệu liệt kế
Pivoting (Xoay chiều): là kỹ thuật thay đổi trục theo dữ liệu, cho phép ta thay đổi các hàng và cột cho nhau trong một báo cáo dạng bảng (Tabular), nó cho phép người sử dụng có thể nhìn theo nhiều chiều khác nhau mà không cần phải chạy lại truy vấn dữ liệu (requering) cho nó.