Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 50 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
50
Dung lượng
731,43 KB
Nội dung
Chương Chương 4: 4: Mô h Mô h ì ì nh d nh d ữ ữ li li ệ ệ u đa chi u đa chi ề ề u u N N ộ ộ i i dung dung chương chương • Các khái niệm chính của mô hình dữ liệu đa chiều – Dữ kiện (Fact) – Chiều (Dimension) – Độ thô – Tổng hợp • Các mô hình lưu trữ Mô h Mô h ì ì nh d nh d ữ ữ li li ệ ệ u đa chi u đa chi ề ề u u • Được đề xuất và thiết kế cho một mục đích phân tích dữ liệu • Mô hình dữ liệu này không phù hợp cho hệ thống OLTP • Mô hình dữ liệu này được thao tác bởi các công cụ OLAP – Các công cụ này cung cấp các phương tiện truy vấn mạnh dựa trên thiết kế mô hình dữ liệu đa chiều – Ví dụ như: TARGIT Analysis, SQL OLAP Server Mô h Mô h ì ì nh d nh d ữ ữ li li ệ ệ u đa chi u đa chi ề ề u u Location Time Month Year Day Week All Quarter Store District Region All Product Product Brand Manufacturer All C C á á c th c th à à nh ph nh ph ầ ầ n ch n ch í í nh nh • Các dữ kiện (Facts) – Miêu tả các vùng kinh doanh – Không thay đổi khi nó đã được sinh ra – Được lưu tại một cấp thô nào đó • Các chiều (Dimensions) – Thông tin tham chiếu qua đó các dữ kiện có thể được cấu trúc cho việc phân tích – Định nghĩa các phân cấp • Và các khối đa chiều (Cubes) Kh Kh ố ố i i • Một khối có thể có nhiều chiều – Nếu có nhiều hơn 3 chiều sẽ được gọi là ‘siêu khối’ (”hypercube”) – Về mặt lý thuyết thì số chiều là không hạn chế – Thường thì số chiều là từ 4 đến 12 • Một khối bao gồm nhiều ô dữ liệu – Là một liên kết giữa các giá trị của chiều – Một ô có thể là rỗng (không có dữ liệu cho liên kết này) – Khối thưa (sparsecube): có nhiều ô rỗng – Khối dày đặc (densecube): có ít ô rỗng V V í í d d ụ ụ v v ề ề ô r ô r ỗ ỗ ng ng V V í í d d ụ ụ v v ề ề d d ữ ữ ki ki ệ ệ n n v v à à chi chi ề ề u u • Kho Grocery • Dữ kiện: – POS:point of sales sự kiện bán hàng • Chiều: – Thời gian (Time) – Vị trí Kho (Location - Store) – Sản phẩm (Product) – Quảng cáo (Promotion) Kh Kh ố ố i i Grocery Grocery C C á á c k c k h h á á i ni i ni ệ ệ m v m v ề ề chi chi ề ề u u • Miền phân cấp • Các cấp (Levels), cấp tương ứng với các độ thô • Lược đồ chiều Dimension schema • Các toán tử chiều Dimension operators [...]... Unit_Sales Dữ kiện (Fact Data) • Các bảng chứa dữ liệu lớn • Dữ liệu được dán nhãn thời gian 1997 1992 Time Ví dụ về dữ kiện (Dollars_Cost,Max) (Dollars_Sold,Min) (Unit_Sold,Sum) Khối đa chiều (Cube) Location Product Time All All Region All Manufacturer Year District Store Quarter Week Month Brand Day Product (Dollars_Cost,Max) (Dollars_Sold,Min) (Unit_Sold,Sum) Ví dụ về khối 3 chiều Ví dụ về tổng hợp (Aggregation)... Month Item Day Ví dụ về Slice và Pivot ROLAP Mô hình dữ liệu đa chiều trong csdl quan hệ Lược đồ hình sao tổng quát Lược đồ hình sao Phân đoạn dữ liệu Dữ liệu không chuẩn hóa Một bản dữ kiện và các chiều bao quanh Các câu hỏi nhằm vào bản dữ kiện và được cấu trúc bởi các bản chiều • Mô hình nổi bật của KDL • • • • Ví dụ lược đồ hình sao có 4 chiều Ví dụ lược đồ hình sao với dữ liệu Các lược đồ của ROLAP... toán tử chiều all 1999 Q1.1999 Jan.1999 Feb.1999 Mar.1999 W1.1999 1.Jan.1999 6.Jan.1999 1.Feb.1999 3.Feb.1999 W5.1999 3.Mar.1999 W9.1999 Dữ kiện (Fact Data) • Các dữ kiện số (Numerical measures) • Được truy cập bởi các chiều Fact Summary Fact Dữ kiện (Fact Data) • Chứa dữ kiện suy dẫn Unit_Sales Unit_Sales / Unit_Price Unit_Price Average_Selling_Price Average_Selling_Price + January_Unit_Sales January_Unit_Sales... hình nổi bật của KDL • • • • Ví dụ lược đồ hình sao có 4 chiều Ví dụ lược đồ hình sao với dữ liệu Các lược đồ của ROLAP Lược đồ hình bông tuyết • Căn cứ vào lược đồ hình sao • Bản dữ kiện giống như luợc đồ hình sao • Các chiều được chuẩn hoá (chuẩn 3) • Các chiều được cấu trúc rõ ràng ... brand manufacturer • Các thuộc tính xác định cấp nào mà một phần tử chiều thuộc vào • Các phần tử time có cùng năm, tháng thuộc về cấp ‘month’ • Tất cả phần tử product có cùng brand thuộc về cấp ‘brand’ Ví dụ về vùng phân cấp all 1999 Q1.1999 Jan.1999 Feb.1999 Mar.1999 W1.1999 1.Jan.1999 6.Jan.1999 1.Feb.1999 3.Feb.1999 W5.1999 3.Mar.1999 W9.1999 Lược đồ chiều và phân cấp Product All Time Geography... (Dollars_Sold,Min) (Unit_Sold,Sum) Ví dụ về khối 3 chiều Ví dụ về tổng hợp (Aggregation) Geography Product All Time Country All All State Year Category City Quarter Type Week Month Item Day Ví dụ của chuyển dịch Geography Product All Time Country All All State Year Category City Quarter Type Week Month Item Day Ví dụ: rolling up và drilling down Ví dụ của rolling up Ví dụ của rolling up Geography Product All . gian Time Time 1992 1992 1997 1997 V V í í d d ụ ụ v v ề ề d d ữ ữ ki ki ệ ệ n n (Dollars_Sold,Min) (Unit_Sold,Sum) (Dollars_Cost,Max) Kh Kh ố ố i đa chi i đa chi ề ề u (Cube) u (Cube) Time Month Year Day Week All Quarter (Dollars_Sold,Min) (Unit_Sold,Sum) (Dollars_Cost,Max) Store District Region All Product Product Brand Manufacturer All Location . 3.Mar.1999 D D ữ ữ ki ki ệ ệ n n (Fact (Fact Data) Data) • Các dữ kiện số (Numerical measures) • Được truy cập bởi các chiều Fact Fact Summary Fact Summary Fact D D ữ ữ ki ki ệ ệ n n (Fact (Fact Data) Data) • Chứa dữ kiện. dẫn Unit_Sales Unit_Sales Unit_Price Unit_Price / / Average_Selling_Price Average_Selling_Price January_Unit_Sales January_Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales Unit_Sales + + January January D D ữ ữ ki ki ệ ệ n n (Fact (Fact Data) Data) • Các bảng chứa dữ liệu lớn • Dữ liệu được dán nhãn thời gian Time Time 1992 1992 1997 1997 V V í í d d ụ ụ v v ề ề d d ữ ữ ki ki ệ ệ n n (Dollars_Sold,Min) (Unit_Sold,Sum) (Dollars_Cost,Max) Kh Kh ố ố i