KIẾN TRÚC DỮ LIỆU CỦA DATA WAREHOUSE : 1 MÔ HÌNH DỮ LIỆU ĐA CHIỀU (MULTIDIMENSIONAL DATA) :

Một phần của tài liệu những khái niệm về data warehouse (Trang 31 - 33)

g) Líp ứng dông :

3.2. KIẾN TRÚC DỮ LIỆU CỦA DATA WAREHOUSE : 1 MÔ HÌNH DỮ LIỆU ĐA CHIỀU (MULTIDIMENSIONAL DATA) :

3.2.1. MÔ HÌNH DỮ LIỆU ĐA CHIỀU (MULTIDIMENSIONAL DATA) :

Trong cơ sở dữ liệu quan hệ, các thực thể được mô tả bằng các bảng (còn gọi là các quan hệ). Một bảng gồm nhiều cột và nhiều dòng, mỗi cột thể hiện một thuộc tính còn mỗi dòng đại diện cho một thực thể trong líp thực thể được định nghĩa bởi chính bảng ghi đó.

Vớ dô :

Mã công ty con Tên công ty con Tỉnh

LD01 Vĩnh Tiến Lâm Đồng

KH03 Nam Khang Khánh Hòa

BT01 Vĩnh Lâm Bình Thuận

Mặc dù bảng này có ba cột chứa thông tin nhưng mỗi ô chứa thông tin chỉ thuộc về một công ty con. Chóng ta có thể thấy rằng mỗi công ty con chỉ nằm trên một tỉnh mà thôi.

Sản phẩm Cửa hàng Số lượng

Vở học sinh Tân Tiến 1000

Vở học sinh Vĩnh Giang 1500

Vở học sinh Đại Nam 1200

Thước kẻ Tân Tiến 500

Thước kẻ Vĩnh Giang 600

Thước kẻ Đại Nam 800

Bót bi Tân Tiến 2000

Bót bi Vĩnh Giang 2600

Bót bi Đại Nam 1800

Máy tính Tân Tiến 150

Máy tính Vĩnh Giang 120

Máy tính Đại Nam 200

Ta thấy rằng bảng này khác hẳn bảng trước và với loại bảng như thế này nếu dùng kiểu hiển thị dữ liệu ma trận hai chiều hàng, cột thì người xem có thể dễ hiểu hơn.

Tân Tiến Vĩnh Giang Đại Nam

Vở học sinh 1000 1500 1200

Thước kẻ 500 600 800

Bót bi 2000 2600 1800

Máy tính 150 120 200

Với việc tổ chức dữ liệu thành ma trận hai chiều như thế này, công việc tổng hợp dữ liệu được thực hiện một cách rõ ràng và nhanh chóng. Ví dô ta muốn tính tổng số hàng đã bán ra theo chủng loại hay theo cửa hàng hoặc là tổng tất cả mặt hàng đã bán được thì ta chỉ việc cộng các số liệu theo hàng và cột để được số liệu tổng.

Vở học sinh 1000 1500 1200 3700

Thước kẻ 500 600 800 1900

Bót bi 2000 2600 1800 6400

Máy tính 150 120 200 470

Tổng sè 3650 4820 4000 12470

Việc hiển thị và lưu trữ dữ liệu kiểu này sẽ làm giảm đáng kể thời gian tổng hợp số liệu và vì vậy có ý nghĩa to lớn trong việc sử dụng. Hơn nữa cách thức hiển thị như vậy rất gần gũi với người dùng, đặc biệt với những mẫu dữ liệu dạng số có thể hiển thị chúng bằng biểu đồ khiến người dùng dễ dàng hình dung hơn.

Nếu như người sử dụng cần thêm thông tin về thời gian nữa thì một chiều thời gian nữa sẽ được thêm vào và lúc đó ta sẽ có mô hình dữ liệu đa chiều. Trong dữ liệu đa chiều, mét "phần tử" hay một ô dữ liệu thường được đặc trưng bởi một giá trị đi kèm với nó là một tổ hợp các giá trị chiều. Trong ví dụ này, "phần tử số lượng" được thể hiện bởi một con số và đi kèm với nó là một tổ hợp 3 chiều (mặt hàng, công ty, thời gian). Có thể xem chiều trong dữ liệu đa chiều tương tự như khái niệm trường trong dữ liệu quan hệ. Với mỗi tổ hợp các chiều ta có một giá trị của phần tử tương ứng. Giá trị này thường là biến đổi, trong khi đó các chiều chỉ nhận một số giá trị xác định và có thể đoán trước.

Việc biểu diễn dữ liệu theo kiến trúc dữ liệu đa chiều cho phép ta dễ dàng phân tích dữ liệu theo dạng ma trận hàng, cột. Động tác này được gọi là thái mỏng dữ liệu. Sở dĩ người ta sử dụng cái tên này là vì động tác ngày cũng giống như ta cắt ra một lát từ hình hộp dữ liệu đa chiều. Vì vậy mà dữ liệu trong data warehouse theo logic cũng sẽ được lưu trữ dưới dạng đa chiều.

Một phần của tài liệu những khái niệm về data warehouse (Trang 31 - 33)

Tải bản đầy đủ (DOC)

(68 trang)
w