Thiết kế bảng chiều đóng vai trò quan trọng trong thiết kế Data warehouse. Sau đây là một số nguyên tắc thiết kế và cập nhật bảng chiều.
Tính độc lập về ngữ nghĩa của các bảng chiều
Bảng chiều không nhất thiết ở dạng chuẩn 3, nhưng nên chuẩn hóa về mặt ngữ nghĩa. Những dữ liệu không liên quan không nên đưa vào cùng một bảng chiều, và
những dữ liệu liên quan không nên rải ra trên nhiều bảng chiều.
Hạn chế số bảng chiều của DM
Mỗi ô (cell) của cube trong OLAP là ảnh của ánh xạ tập tích Đề-Các các bảng chiều. Do đó việc tăng số bảng chiều sẽ làm tăng số phần tử của cube. Trong thực tế, có rất nhiều phần tử của cube không mang giá trị. Cube có nhiều phần tử rỗng như vậy được gọi là cube thưa. Cube thưa làm lãng phí bộ nhớ cũng như thời gian thực hiện các phép toán trên chúng. Mặt khác, bởi vì phép JOIN các bảng chiều để xây dựng cube là phép toán đòi hỏi chi phí lớn, nên DM càng có nhiều bảng chiều thì chi phí xây dựng cube càng cao. Thông thường, một DM chỉ nên có từ 15 đến 20 bảng chiều là hợp lý.
Vấn đề cập nhật các bảng chiều
Ở đây chúng ta xét việc cập nhật thuộc tính các bảng chiều. Trong thực tế, các bảng chiều rất ít thay đổi, việc thay đổi thuộc tính bảng chiều gây ảnh hưởng đến kết quả phân tích, do đó chúng ta cần có kỹ thuật xử lý thích hợp. Có 2 kỹ thuật thay đổi
bảng chiều được áp dụng:
Kiểu 1: Ghi đè giá trị
Với kỹ thuật này, chúng ta đơn giản là ghi đè lên giá trị thuộc tính cũ trong bảng chiều bởi giá trị mới. Kiểu này rất dễ cài đặt, nhưng không giữ được lịch sử của giá trị thuộc tính trước. Kiểu 1 phù hợp với yêu cầu sửa đổi thuộc tính, và không cần nhớ lịch sử cũ.
Kiểu 2: Thêm bản ghi mới cho bảng chiều
Trong bảng chiều có phân cấp, mỗi bản ghi tương ứng với một con đường (path) từ gốc tới lá. Phép toán mở rộng (drill-down) thực chất là phép tổng hợp theo các mức. Nếu chúng ta áp dụng kỹ thuật kiểu 1 ghi đè lên thuộc tính của mức trên mức lá, thì bản ghi đó sẽ chuyển sang một con đường khác, khi đó kết quả tổng hợp trước đó sẽ không nhận lại được nữa.
Kỹ thuật kiểu 2 là thêm bản ghi mới. Với bản ghi mới giống hệt bản ghi cũ, trừ thuộc tính có giá trị phải thay đổi, sẽ nhận giá trị mới (bản ghi mới của bảng chiều có khóa khác với khóa của bản ghi cũ). Trong bảng Fact, các bản ghi tham chiếu đến bản ghi cũ của bảng chiều vẫn không thay đổi, nhưng các bản ghi Fact mới sẽ tham chiếu đến bản ghi chiều mới. Kỹ thuật này sẽ giữ lại được các giá trị liên quan đến bản ghi chiều cũ.
Hạn chế các giá trị Null trong các thuộc tính của các bản ghi bảng chiều
Tên bảng Ý nghĩa
Bảng chiều
D_DOI_TUONG_AP_DUNG Đối tượng là các công ty, chi nhánh,
kho hàng nơi áp dụng giá.
D_DON_VI_TINH Đối với các nhóm hàng hóa, dịch vụ
khác nhau, tùy từng loại có đơn vị tính khác nhau. VD: liều, lít, đồng/kg.
D_DOANH_NGHIEP_DKKK Thông tin về các doanh nghiệp đăng ký
giá, kê khai giá, địa chỉ.
thức điều kiện để lấy dữ liệu, mà còn là tiêu đề cho các cột/hàng của báo cáo sinh ra từ cube, cho nên cần đặt các giá trị có nghĩa cho các thuộc tính của các bản ghi bảng chiều. Ngay cả Null cũng có những ý nghĩa nhất định tùy từng tình huống, bởi vậy chúng ta nên thay thế các Null bởi những nội dung phù hợp.