4. Thiết kế logic hệ thống Data Warehouse và Business Intelligence
4.3.1. Thiết kế CSDL đa chiều với OLAP
Nhìn chung, mục đích hướng đến của việc thiết kế DW là ra được các DM. Về mặt logic, các DM được thiết kế theo ý tưởng đa chiều với các bảng danh mục (các chiều) xoay quanh bảng dữ liệu chi tiết về các giao dịch phát sinh; kiểu thiết kế này giúp đáp ứng nhanh và linh hoạt các nhu cầu thông tin đa dạng, đa chiều của người dùng. Nhưng về bản chất lưu trữ dữ liệu, DM vẫn là một tập các bảng dữ liệu quan hệ (các bảng với 2 chiều dòng và cột), để đưa ra được các báo cáo đa chiều, cần thực hiện các câu lệnh truy vấn (SQL) để join các bảng với nhau.
Để tạo sự thuận tiện và chủ động cho người dùng cuối, đồng thời tăng tốc độ đáp ứng các nhu cầu thông tin, cần tạo thêm một lớp dữ liệu nữa ở dạng tính toán sẵn và gần gũi hơn với nhu cầu thông tin của người dùng, lớp dữ liệu đó chính là OLAP.
OLAP là tầng dữ liệu phía trên các DM, có cấu trúc lưu trữ đặc biệt (không sử dụng các bảng quan hệ thông thường) để lưu trữ các dữ liệu đa chiều ở dạng tính toán sẵn, các dữ liệu này rất gần với nhu cầu thông tin của người dùng.
Với OLAP, người dùng chỉ cần chọn và lấy ra các thông tin mình cần (các dimension, các measure) để thực hiện việc báo cáo và phân tích vì các thông tin này đã được tính toán sẵn trong OLAP.
OLAP được tổ chức thành các OLAP cube (Khối dữ liệu đa chiều), mỗi OLAP cube phục vụ một nhóm nhu cầu thông tin của người dùng. Tương ứng với một chủ đề thông tin (DM), có thể tạo ra nhiều OLAP cube. Ngoài ra, tùy thuộc nhu cầu phân tích thông tin, cũng có thể tạo ra một OLAP cube từ các DM khác nhau.
Căn cứ vào việc phân tích các nhu cầu thông tin của người dùng, căn cứ bản thiết kế các DM, thiết kế tầng dữ liệu OLAP theo các bước sau:
- Xác định danh sách các OLAP cube dựa trên các nhóm nhu cầu thông tin đã biết. - Thiết kế từng OLAP cube:
o Cấu trúc của cube: các Measure, các Dimension o Thủ tục chuyển dữ liệu từ DM vào cube
4.3.2. Thiết kế tầng khai thác và phân tích thông tin
Tầng khai thác và phân tích thông tin là môi trường thuận tiện và an toàn để người dùng tương tác với hệ thống, môi trường này bao gồm các thành phần sau:
- Lớp dữ liệu tham chiếu:
o Là một cấu trúc lưu trữ xác định mối quan hệ tham chiếu giữa các thuật ngữ nghiệp vụ (của người dùng cuối) với các đối tượng dữ liệu tin học (các bảng, các trường).
o Đóng vai trò cầu nối để người dùng cuối có thể khai thác được dữ liệu của các CSDL trong DW bằng cách lựa chọn và kéo thả các thông tin nghiệp vụ mình cần thay vì việc viết các câu lệnh truy vấn SQL.
- Lớp thông tin kết quả
o Là tập hợp các file kết quả báo cáo, phân tích,… của người dùng và được lưu tại các thư mục xác định.
- Các công cụ khai thác và phân tích thông tin
o Là các chương trình ứng dụng để người dùng phân tích, lập báo cáo và chia sẻ các thông tin.
- Cổng thông tin:
o Là giao diện để người dùng truy cập hệ thống và lấy các thông tin kết quả. o Ví dụ: web portal, ms office,…
CHƢƠNG 2: BÀI TOÁN XÂY DỰNG HỆ THỐNG DW VÀ BI TẠI VNPOST