Mơ hình đầy đủ về datawarehouse

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Thiết kế Data Warehouse và ứng dụng trong hệ thống thông tin ngành điện (Trang 33 - 36)

Thực tế, mơ hình này phân nhỏ data warehouse thành các data warehouse nhỏ hơn gọi là kho dữ liệu hướng chủ đề để phục vụ cho những chủ đề khác nhau.

2.3. Mơ hình dữ liệu đa chiều

Data warehouse và các công cụ OLAP đều dựa trên dựa trên mơ hình dữ liệu đa chiều. Mơ hình này xem xét dữ liệu dưới hình dạng dữ liệu n chiều (data lược đồ). Như vậy, dữ liệu đa chiều là gì? "Dạng dữ liệu đa chiều là kiểu mà dữ liệu được mơ hình hố và

được xem xét dưới góc độ đa chiều. Dạng dữ liệu này được được tạo ra bởi các chiều (dimention) và các sự kiện ( fact)."

Chiều được xem như là một thực thể mà lưu giữ các bản ghi để mô tả, làm rõ các giá trị cần phần tích. Ví dụ như một cơng ty điện tử có tên viết tắt là AllElectronics xây dựng một data warehouse hướng về chủ đề bán hàng nhằm lưu trữ các bản ghi mô tả việc kinh doanh sản phẩm theo các chiều như thời gian, sản phẩm, kho hàng, và thành

phố. Mỗi chiều đều có một bảng quan hệ liên kết với nó và được gọi là bảng chiều.

Như vậy, dữ liệu trong bảng chiều thường có mục đích miêu tả giá trị sự kiện trong bảng sự kiện và thường ở dạng text.

 Các câu truy vấn sẽ sử dụng điều kiện where với các tiêu chí là các cột thuộc bảng

dimension để xác định giá trị fact của bảng sự kiện.

 Trong bảng dimension có ràng buộc duy nhất tương ứng với foreign key ở bảng sự

kiện.

Mơ hình dữ liệu đa chiều tổ chức dữ liệu xung quanh một thực thể trung tâm như bảng

Bán hàng ở trên. Thực thể trung tâm này được gọi là bảng sự kiện (fact). Bảng này có

kích thước lớn và có chứa các giá trị độ đo (measure) cùng với các giá trị tương ứng với giá trị khóa trong các bảng chiều mà nó có quan hệ đến. Như vậy, bảng sự kiện thường chứa 2 loại cột và có đặc điểm sau:

 Các cột sự kiện (còn gọi là cột fact). Chúng là những tiêu chí đánh giá hoạt động

của doanh nghiệp.

 Các cột khố ngồi tương ứng với khố chính của bảng chiều. Chúng chỉ ra

mối quan hệ giữa bảng sự kiện với bảng chiều.

 Những cột khố ngồi trong bảng sự kiện tập hợp thành một cột khố chính cho bảng sự kiện.

 Các cột sự kiện có thể ở mức chi tiết hoặc ở mức tổng hợp. Bảng sự kiện có cột sự

kiện ở mức tổng hợp. Do vậy, bảng đó thường được gọi là bảng tổng hợp.

Khi thiết lập được được liên kết giữa bảng sự kiện với các bảng chiều chúng ta có mơt mơ hình rõ ràng hơn và được gọi là lược đồ đa chiều (lược đồ).

Mặc dù, chúng ta vẫn xem xét mơ hình dữ liệu đa chiều như là một cấu trúc lập phương trong hình học 3D nhưng trong mơi trường data warehouse nó là một mơ hình

dữ liệu n-chiều. Để cho dễ tưởng tưởng, hãy xem xét mơ hình dưới dạng 2D khi mà dữ liệu bán hàng của công ty điện tử AllElectronics với thông tin về các sản phẩm theo từng quý tại thành phố Vancouver. Dữ liệu này được chỉ ra như hình vẽ bên dưới

Bảng 3: Khung nhìn dữ liệu đa chiều đơn giản

Trong hình vẽ 2D mơ tả trên, dữ liệu bán hàng cho thành phố Vancouver được xem dưới khía cạnh là chiều thời gian (được tổ chức theo từng quý) và chiều sản phẩm (được tổ chức theo từng loại sản phẩm được bán). Độ đo hiển thị là doanh số bán hàng là giá trị dollars_sold của bảng sự kiện mô tả số tiền bán được theo đơn vị dollar tính trên đơn vị nghìn.

Bây giờ, hãy xem xét dữ liệu bán hàng này cũng với các chiều Thời gian, Sản phẩm như ở trên nhưng ở nhiều vị trí như các thành phố Chicago, New York, Toronto,

Vancouver trong chiều Thành phố. Lúc này ta có khung nhìn với mơ hình 3D thể hiện

như hình vẽ bên dưới

Bảng 4: Khung nhìn dữ liệu đa chiều chi tiết

Khung nhìn này là tập hợp của các khung nhìn 2D ở trên theo vị trí là các thành phố bán hàng trong bảng Thành phố. Để mô tả giống với khái niệm mơ hình dữ liệu đa

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Thiết kế Data Warehouse và ứng dụng trong hệ thống thông tin ngành điện (Trang 33 - 36)

Tải bản đầy đủ (PDF)

(96 trang)