Vận chuyển là thao tác chuyển dữ liệu từ một hệ thống sang hệ thống khác. Có thể là thao tác chuyển dữ liệu từ hệ thống nguồn tới cơ sở dữ liệu trung gian hoặc cơ
sở dữ liệu DWH, từ cơ sở dữ liệu trung gian tới cơ sở dữ liệu DWH, từ cơ sở dữ liệu DWH tới vùng lưu trữ siêu dữ liệu.
Các cơ chế vận chuyển dữ liệu trong DWH:
1. Vận chuyển sử dụng các tập tin dữ liệu: Dữ liệu nguồn có thể được kết xuất ra dạng tệp tin dữ liệu, được truyền tới máy đích thông qua giao thức FTP, sau đó các tập tin dữ liệu này có thể được đưa vào DWH. Đây là cơ chế đơn giản và hiệu quả để thực hiện việc vận chuyển dữ liệu ngoại tuyên ngay cả khi nguồn và DWH không cùng hệđiều hành hoặc không cùng database.
2. Vận chuyển thông qua các thao tác phân tán: Thông qua các truy vấn phân tán, cơ chế này thực hiện chuyển dữ liệu trực tiếp tới hệ thống đích, do vậy nó hỗ
trợ đồng thời cả trích xuất và vận chuyển dữ liệu. Kết quả vận chuyển dữ liệu
được biết ngay sau khi thực hiện các truy vấn hoặc giao dịch phân tán.
3. Vận chuyển sử dụng các không gian lưu trữ dự liệu có thể trao đổi: Cơ chế này phù hợp khi vận chuyển lượng lớn dữ liệu. Các không gian lưu trữ dự liệu này có thể trao đổi hỗ trợ vận chuyển đồng thời cả dữ liệu và siêu dữ liệu. Các tệp tin dữ liệu bao gồm hầu hết các đối tượng trong CSDL đều được vận chuyển từ
CSDL này tới CSDL khác. Hạn chế của cơ chế này là chỉ chạy trên cùng hệ điều hành, chỉ có từ phiên bản Oracle 8i trở lên, phải cùng bộđịnh dạng kí tự.
Ứng dụng các không gian lưu trữ dữ liệu có thể trao đổi trong DWH là khi vận chuyển dữ liệu từ nguồn dữ liệu trung gian sang DWH hoặc từ DWH sang vùng lưu trữ siêu dữ liệu. Các không gian lưu trữ dữ liệu có thể trao đổi phải được thiết lập dạng READ ONLY để có thể vận chuyển được.