Trong nhiều ngữ cảnh, ví dụ bên trong một tổ chức, doanh nghiệp, kiến trúc vật lý tốt nhất là một server tập trung. Trƣớc hết chúng ta xem xét đến một kho dữ liệu trung tâm cổ điển để thấy rõ về hệ thống tích hợp dữ liệu. Khi các nguồn dữ liệu đa dạng, độc lập, và phân tán cần đƣợc tích hợp, chúng ta phải phân biệt giữa các tải (loading) của kho dữ liệu trung tâm với dữ liệu và xử lý truy vấn trên dữ liệu đƣợc tích hợp.
Hình vẽ sau mô tả hai giai đoạn của cách tiếp cận này. Kho dữ liệu định nghĩa định dạng dữ liệu và lƣợc đồ cho tất cả các dữ liệu đƣợc lƣu trữ tập trung. Kho dữ liệu đƣợc tích hợp bởi sử dụng công cụ ETL (Extract, Transform, Load).
Hình 6: Tích hợp dữ liệu với một kho dữ liệu trung tâm
Với việc phải cấu hình cho mỗi nguồn dữ liệu riêng rẻ. Dữ liệu đƣợc chiết xuất (extracted), chuyển đổi (transformed) và cuối cùng là nạp (loaded) vào trong kho dữ liệu (data warehouse). Toàn bộ xử lý truy vấn xảy ra tại kho dữ liệu trung tâm: Việc truy vấn chỉ xử lý truy cập tập trung đến các bản sao của dữ liệu ban đầu. Điều này dẫn đến truy cập đồng nhất tới các nguồn dữ liệu tại kho dữ liệu trung tâm nên việc xử lý truy vấn là đơn giản hơn. Vì vậy chỉ có các phép toán của kho dữ liệu trung tâm là đƣợc thực hiện nhƣ scan, join hay select các bảng.
Nhƣ vậy cách tiếp cận kho dữ liệu tập trung là phù hợp và tốt nhất cho các ứng dụng xử lý phân tích trực tuyến (OLAP). Các truy vấn đó thực hiện trên khối lƣợng lớn dữ liệu và bao gồm rất nhiều kết nối, nhƣng không thực hiện việc cập nhật trên dữ liệu. Trong các ứng dụng OLAP dữ liệu không phải đầy đủ theo thời gian (up-to-date), một số dữ liệu cũ hơn có thể đƣợc sử dụng mà không làm sai lệch kết quả quá nhiều. Do đó dữ liệu mới hoặc dữ liệu thay đổi chỉ có thể đƣợc tích hợp một cách định kỳ từ các nguồn dữ liệu, nhƣ theo ngày hoặc theo tuần.