Một trong những đặc trưng của hệ thống DWBI đó là dung lượng dữ liệu rất lớn, thường là không xác định vòng đời. Do đó, để đảm bảo cho sự vận hành lâu dài của hệ thống, cần thực hiện việc dự báo tăng trưởng dung lượng dữ liệu cũng như tăng trưởng về không gian đĩa cho lưu trữ, từ đó có phương án về lưu trữ cho hệ thống.
Các bước thực hiện bao gồm:
- Dự báo tăng trưởng dữ liệu cho từng CSDL trong DW: (DSA, EM, DM)
o DSA là lưu trữ dữ liệu tạm thời nên có chỉ cần dung lượng đủ cho các phiên ETL, có thể bỏ qua việc dự báo tăng trưởng dữ liệu.
Căn cứ trên dữ liệu nguồn, phân loại các bảng của EM theo số bản ghi: các bảng cực lớn là những bảng fact, các bảng trung bình và nhỏ là các bảng dimension.
Dự báo tăng trưởng dung lượng dữ liệu cho từng bảng fact, từng nhóm bảng dimension (dự báo theo từng năm)
Dự báo tăng trưởng về không gian đĩa (tùy thuộc công nghệ CSDL cụ thể được lựa chọn: Greenplum, Oracle, …): không gian đĩa cho lưu trữ nội dung dữ liệu, không gian đĩa cho các thành phần vật lý khác của một Database Production (system, temp, log,…)
- Dự báo tăng trưởng dữ liệu của tầng BI.
o Ước tính số lượng các kết quả đầu ra, dung lượng của từng file o Dự báo tăng trưởng không gian lưu trữ các file kết quả (theo từng năm), không gian lưu trữ cho các thành phần vật lý khác của hệ thống BI (system, log…)
- Dự báo tăng trưởng dữ liệu của toàn bộ hệ thống DWBI. o Tổng hợp từ các thành phần đã tính ở trên.