Nhƣ trên đã phân tích, dữ liệu nghiệp vụ bao gồm ba loại: dữ liệu thời gian thực, dữ liệu tƣơng hợp và dữ liệu dẫn xuất. Mỗi loại dữ liệu này có thể ở các tầng khác nhau và mỗi tầng có cấu trúc vật lý riêng. Kiến trúc dữ liệu logic cho DW có thể xây dựng nhƣ sau [1]:
Hình 1.16 Kiến trúc ba tầng của DW
Hệ thống tác nghiệp (Operational System)
Là chƣơng trình phần mềm ứng dụng để thực hiện các nghiệp vụ và các dữ liệu đƣợc lƣu trữ ở hệ thống tệp hay CSDL.
Hệ thống tác nghiệp bao gồm các nguồn dữ liệu của DW. Dữ liệu đƣợc tạo ra trong các hệ thống xử lý giao tác hàng ngày của xí nghiệp.
Kho dữ liệu nghiệp vụ (Business Data Warehouse - BDW)
Kho dữ liệu nghiệp vụ BDW là dạng cài đặt vật lý những dữ liệu tổng hợp đƣợc thiết kế để điều khiển và cung cấp dữ liệu đơn giản, nhất quán cho NSD đầu cuối. BDW có những đặc tính sau:
Chi tiết, Lịch sử, Nhất quán,
Chuẩn hoá.
BDW rất ít khi đƣợc ngƣời sử dụng khai thác trực tiếp. Nó là nguồn cung cấp dữ liệu cho kho dữ liệu thông tin tác nghiệp.
Kho thông tin tác nghiệp (Business Information Warehouse BIW)
Đây là hệ thống thông tin đƣợc sử dụng để làm báo cáo, phân tích, hay dự đoán về nghiệp vụ. Nó bao gồm những thông tin quản lý, trợ giúp quyết định và các hệ thống thông tin thực thi nhƣ các hệ thống phân tích thị trƣờng, các chƣơng trình ứng dụng khai thác thông tin.
BIW đƣợc xây dựng hoặc trực tiếp từ BDW hoặc gián tiếp từ những BDW khác.
Từ những kiến trúc tổng thể chúng ta có thể đƣa ra cách nhìn tổng quan về kiến trúc kho dữ liệu, trong đó thể hiện đƣợc cách nạp dữ liệu về kho, cách truy nhập, xử lý thông tin, v.v.
1.4. Mô hình kho dữ liệu
Mô hình DW đƣợc phát sinh từ một mô hình dữ liệu tổng thể (mô hình dữ liệu mức xí nghiệp) (Enterprise Data Model - EDM). Một EDM là một bức tranh tổng thể mà các mô hình khác cụ thể hoạt động trên đó. Nó đƣợc tổ chức thành các vùng theo chủ điểm, vùng dữ liệu tác nghiệp (Subject Area - SA) là phần chính của sự chia nhỏ các công việc cần đƣợc quan tâm đáp ứng nhu cầu ngƣời sử dụng. Nếu một tổ chức không có sẵn EDM thích hợp, EDM cũ đƣợc phép dùng tiếp và bổ sung các SA mới.
Mô hình dữ liệu DW có thể đƣợc thiết lập theo:
Sơ đồ hình sao (Star Schema)
Sơ đồ tuyết rơi (Snowflake)
Sơ đồ hỗn hợp