liệu vào data warehouse và vấn đề mà người quản trị quan tâm nhất đối với tiến trình này là khoảng thời gian cần thiết để làm việc đó.
Khi tiến hành tải dữ liệu vào data warehouse thì data warehouse sẽ bị tê liệt, toàn bộ các chương trình khai thác data warehouse sẽ gần như không chạy được hoặc chạy rất chậm, nguyên nhân là vì quá trình này sẽ cần tới rất nhiều tài nguyên. Vì vậy, vấn đề làm sao rút ngắn được khoảng thời gian tải dữ liệu vào data warehouse được đặt lên hàng đầu.
Như phần trên đã nhắc tới, dữ liệu trong stage 1.1 có cấu trúc và mối quan hệ gần giống với dữ liệu được trích trong data source, điều đó có nghĩa là nó rất khác so với cấu trúc và quan hệ dữ liệu trong data warehouse.Vỡ vậy nếu sau khi làm sạch mà ta tiến hành tải ngay dữ liệu vào trong data warehouse thì sẽ mất một khoảng thời gian rất dài. Để giải quyết vấn đề này, ta cần tiến hành tạo thêm stage 2 để dữ liệu trong staging area gần giống với dữ liệu của data warehouse hơn. Để tạo stage 2 ta cần làm một số công việc như tạo thêm trường có trong data warehouse mà không có trong stage 1.1 hay tạo dư thừa dữ liệu để quá trình tải diễn ra nhanh hơn.
Ta cần chú ý rằng các dữ liệu được sinh thêm hoàn toàn là các dữ liệu dẫn xuất và chúng chỉ có tác dụng làm cho quá trình tải dữ liệu vào data warehouse được nhanh hơn mà thôi, còn dữ liệu trong stage 1.1 đã đủ thông tin để có thể hình thành dữ liệu trong data warehouse rồi.