Các kỹ thuật khai thác DW

Một phần của tài liệu Giáo trình Quản lý kho dữ liệu (Nghề Lập trình máy tính) - Tổng cục dạy nghề (Trang 39 - 40)

TÊN BÀI: KHAI THÁC KHO DỮ LIỆU

3.1.2. Các kỹ thuật khai thác DW

Kỹ thuật khai thác DW thường dựa trên kỹ thuật truy vấn đa chiều (Multidimension Query Techniques) bao gồm các kỹ thuật phân tích cơ bản như sau:

Slicing (cắt lát): chính là việc giới hạn khung nhìn dữ liệu theo một nhiều từ

các chiều trong số các chiều sẵn có. Ví dụ dữ liệu bán hàng trong bảng fact phụ thuộc vào 03 chiều là sản phẩm, vng và thi gian thì việc lấy dữ liệu theo chiều vùng cho tất cả sản phẩm và thời gian là một “lát cắt”..

Dicing (thái nhỏ): chính là việc cắt lát theo nhiều chiều khác nhau, và cũng có

thể trong mỗi chiều lại bị giới hạn bởi các điều kiện.

Drilling (phân tích): thực hiện phân tích dữ liệu theo nhiều hướng khác nhau

kết quả có thể là tập dữ liệu tổng hợp tập dữ liệu chi tiết hơn tập dữ liệu đang xem xét. Việc phân tích cũng chia làm 03 loại.

o Drilling Down (Phân tích chi tiết): cho phép xem xét dữ liệu ở mức

chi tiết hơn so với mức hiện hành. Ví dụ: đang xem dữ liệu bán hàng theo từng tháng mà chọn Drill Down hì dữ liệu chi tiết đến từng ngày bán hàng cho tháng vừa chọn sẽ hiện ra. Chú ý: thứ tự phân cấp về thời gian <Năm -> Tháng -> ngày> phải được định nghĩa trước.

o Drilling Up (Phân tích tổng hợp): cho phép xem xét dữ liệu ở mức tổng hợp hơn so với mức hiện hành. Ví dụ: đang xem dữ liệu bán hàng theo từng tháng mà chọn Drill Up thì dữ liệu sẽ tổng hợp đến từng năm bán hàng.

o Drilling Across (Phân tích chéo): tức là đang phân tích dữ liệu theo

một cây phân cấp (Hierarchy) lại chuyển sang kết hợp theo một thuộc tính thuộc cây phân cấp khác. Ví dụ: đang xem dữ liệu bán hàng theo mức tháng (theo cây phân cấp theo yếu tố thời gian) thì ta có thể chọn thêm chiều tỉnh thành (Theo cây phân cấp địa lý Vùng -> Tỉnh -> Huyện) để xem dữ liệu liệt kế

Pivoting (Xoay chiều): là kỹ thuật thay đổi trục theo dữ liệu, cho phép ta thay

đổi các hàng và cột cho nhau trong một báo cáo dạng bảng (Tabular), nó cho phép người sử dụng có thể nhìn theo nhiều chiều khác nhau mà không cần phải chạy lại truy vấn dữ liệu (requering) cho nó.

Một phần của tài liệu Giáo trình Quản lý kho dữ liệu (Nghề Lập trình máy tính) - Tổng cục dạy nghề (Trang 39 - 40)

Tải bản đầy đủ (PDF)

(49 trang)