Kiến trúc kho dữ liệu bao gồm các thành phần như sau:
SieuThi_SRC: là nguồn dữ liệu của kho dữ liệu, chính là CSDL tác nghiệp của phần mềm quản lý siêu thị.
SieuThi_STG: là CSDL tạm dùng cho việc tích hợp dữ liệu cho kho dữ liệu. Chứa các bảng tạm tương ứng với các bảng cần lấy trong CSDL nguồn, các bảng siêu dữ liệu và một số thủ tục dùng trong việc tích hợp.
SieuThi_DW: là kho dữ liệu hay có thể hiểu là kho dữ liệu doanh nghiệp, nó chứa tất cả các bảng tham chiếu và bảng giao dịch lấy từ CSDL tác
nghiệp. SieuThi_DW vẫn là CSDL quan hệ được và tổ chức theo chuẩn
3NF, nhưng có điều hơi khác với CSDL nguồn là các bảng tham chiếu sử dụng khóa thay thế, là số nguyên tự tăng, làm khóa chính, nhằm đảm bảo tính lịch sử của dữ liệu trong các bảng tham chiếu.
SieuThi_DM: là kho dữ liệu chuyên biệt bán hàng, nó được tổ chức theo mô hình hình sao gồm cả các bảng chiều và bảng sự kiện nhằm phục vụ cho việc phân tích số liệu.
PKG_STG_Controller: là gói SSIS để chuyển dữ liệu từ SieuThi_SRC vào
SieuThi_STG, đây là gói mức điều khiển nên không thực hiện trực tiếp các thao tác tích hợp dữ liệu mà chỉ gọi đến các gói ở mức chi tiết hơn.
PKG_DW_Controller: là gói SSIS để chuyển dữ liệu từ SieuThi_STG vào
SieuThi_DW.
PKG_DM_Controller: là gói SSIS để chuyển dữ liệu từ SieuThi_DW vào
SieuThi_DM.
Cube_POSRetail: là khối dữ liệu được tạo bởi BIDS, dữ liệu đầu vào cho
nó là kho dữ liệu chuyên biệt bán hang SieuThi_DM.
AS_POSRetail.xlsx: là tập tin Excel chứa một số mẫu phân tích cho bán lẻ của siêu thị, việc phân tích trong Excel sẽ thực hiện thông qua công cụ
PivotTable, công cụ này cho phép kết nối trực tiếp đến khối dữ liệu
Cube_POSRetail.
Các báo cáo: đây là danh sách các báo cáo được tạo bởi công cụ Report
Designer trong bộ công cụ BIDS hoặc bộ công cụ Report Builder, chạy
trên nền web, được tích hợp trong Report Manager. Các báo cáo này có
thể lấy dữ liệu từ khối dữ liệu Cube_POSRetail hoặc từ kho dữ liệu
chuyên biệt SieuThi_DM.
Cổng quản lý báo cáo: chính là Report Manager của SQL Server 2008,
tích trên Excel, các tài liệu liên quan. Người sử dụng có thể truy cập qua giao diện web để xem, phân tích số liệu, chia sẻ và quản lý các báo cáo.
3.5.2. Thiết kế cấu trúc dữ liệu
3.5.2.1. Qui ước chung
Việc thiết kế cấu trúc chi tiết cho các bảng của kho dữ liệu doanh nghiệp
SieuThi_DW và kho dữ liệu chuyên biệt SieuThi_DM nên tuân theo các qui ước chung sau đây:
Tất cả các bảng tham chiếu và chiều đều có áp dụng cách thức ghi lại sự thay đổi theo kiểu 2 (SCD – Type 2) để đảm bảo tính lịch sử của dữ liệu. Với kiểu 2 này thì khi một đối tượng thay đổi một thông tin nào đấy thì phải phát sinh một bản ghi mới để lưu thông tin mới nhất mà không ghi đè lên bản ghi cũ. Khi đấy bản ghi mới sẽ được đánh dấu là bản ghi hiện hành.
*_DW_ID: chỉ ra đây là cột khóa thay thế, chính là một số tự nhiên tự tăng.
*_SRC_CODE: chỉ ra đây là cột mã tự nhiên, thường lấy từ cột mã hoặc khóa chính của dữ liệu tác nghiệp.
CURR_IND: là cột để xác định bản ghi có còn là hiện hành không, vì sử dụng kiểu 2 như ở trên.
EFF_FROM_DATE: ngày bản ghi bắt đầu có hiệu lực, thường là ngày được thêm vào bảng.
EFF_TO_DATE: ngày bản ghi hết hiệu lực, bình thường giá trị sẽ là NULL, nghĩa là vẫn còn hiệu lực. Khi có một bản ghi mới cùng một số thuộc tính khóa nghiệp vụ được thêm vào thì bản ghi cũ sẽ gán giá trị
ngày giờ hệ thống cho EFT_TO_DATE.
LAST_UPDATE_DATE: ngày mà bản ghi được cập nhật.
3.5.2.2. Cấu trúc kho dữ liệu (SieuThi_DW)
Cấu trúc dữ liệu của kho dữ liệu doanh nghiệp SieuThi_DW được tổ chức dựa
trên chuẩn 3NF. Các bảng được tổ chức gần gống với CSDL dữ liệu tác nghiệp, chỉ khác là đã thêm các cột khóa thay thế vào các bảng danh mục (hay còn gọi là các bảng tham chiếu), để đảm bảo tính lịch sử của dữ liệu. Sơ đồ quan hệ các bảng trong