Thiết kế CSDL tích hợp (Enterprise Mode l EM)

Một phần của tài liệu Xây dựng hệ thống data warehouse và business intelligence ứng dụng trong ngành bưu chính của tổng công ty bưu điện việt nam (Trang 25 - 27)

4. Thiết kế logic hệ thống Data Warehouse và Business Intelligence

4.1.4.Thiết kế CSDL tích hợp (Enterprise Mode l EM)

Enterprise Model là CSDL được thiết kế theo mô hình bông tuyết (như đã nêu ở mục 4.1.1), chứa dữ liệu tích hợp của tất cả các chủ đề thông tin mà hệ thống cần đáp ứng, cung cấp dữ liệu cho tất cả các DM. Trong một DW, chỉ có một EM, nhưng bên trong EM này có thể có một hoặc nhiều bảng sự kiện.

Dựa trên bản thiết kế logic các DM đã có, các bước để thiết kế EM bao gồm: - Phân tích bản thiết kế logic các DM đã có

- Chuẩn hóa và tích hợp các bảng danh mục:

o Mỗi DM có một tập hợp các bảng danh mục, mỗi bảng này cần được chuẩn hóa (tách bảng) thành các bảng quan hệ theo dạng chuẩn 3 để không bị dư thừa dữ liệu.

o Sau khi chuẩn hóa, những bảng danh mục nào tương đương nhau (cùng ý nghĩa nghiệp vụ, cùng primary key,…) thì tích hợp thành một bảng (primary key là chung, các trường thuộc tính là hợp từ hai bảng); những bảng danh mục còn lại được giữ nguyên cấu trúc và nếu có quan hệ thì tạo Foreign Key với các bảng danh mục khác.

- Tích hợp các bảng sự kiện

o Mỗi DM có một bảng sự kiện, mỗi bảng sự kiện bao gồm một số hoặc tất cả các trường thông tin của một loại dữ liệu nghiệp vụ cụ thể (ví dụ: dữ liệu

dữ liệu (và cùng primary key) thì tích hợp thành một bảng (primary key là chung, các foreign key và các trường measure là hợp từ hai bảng); những bảng sự kiện còn lại được giữ nguyên cấu trúc.

o Tích hợp các bảng slave (nếu có): tương tự và đi kèm với bảng sự kiện. - Vẽ sơ đồ thực thể quan hệ (ERD, mô hình bông tuyết, có thể có nhiều bảng sự

kiện)

- Thiết kế các bảng danh mục theo dạng chuẩn 3, một số đặc điểm:

o Riêng với bảng danh mục quan hệ trực tiếp với bảng sự kiện: Primary Key phải là kiểu số (có thể dùng Surrogate Key nếu cần).

o Không cần các trường thông tin tổng hợp, thông tin dẫn xuất. - Thiết kế các bảng sự kiện: tương tự trong DM

o Primary Key: kiểu số, dùng Surrogate Key nếu Primary Key hiện thời chưa phải là kiểu số.

o Foreign Key: sang các bảng danh mục o Các trường measure

- Thiết kế Slave Table (nếu cần lưu thông tin bổ sung, không phải kiểu số,.. như đã mô tả ở trên): tương tự trong DM

- Thiết kế các partition: tương tự trong DM

o Với bảng sự kiện: thường chia partition theo chiều thời gian (tức là chia theo trường Foreign Key sang bảng danh mục thời gian).

o Với các bảng danh mục lớn, có sự tăng trưởng dữ liệu: chia partition theo trường có nhu cầu tìm kiếm chủ yếu (nếu xác định được).

o Thiết kế các index

 Với bảng sự kiện: index trên các trường Foreign Key (trừ Foreign Key đã được chọn để chia partition)

 Với các bảng danh mục: index trên các trường có nhu cầu tìm kiếm (trừ trường đã được chọn để chia partition)

o Thiết kế giải pháp phi chuẩn:

 Làm dư thừa dữ liệu để tăng tốc độ thực hiện các câu lệnh truy vấn, ví dụ: mview trong Oracle.

Dưới đây là một ví dụ về ERD của một Enterprise Model, trong đó có 2 bảng fact là

Hình 7: ERD của một Enterprise Model

Một phần của tài liệu Xây dựng hệ thống data warehouse và business intelligence ứng dụng trong ngành bưu chính của tổng công ty bưu điện việt nam (Trang 25 - 27)