II. Khái quát chung về hệ thống Ngân hàng dữ liệu (DWH)
2.1 Nguồn dữ liệu
Tất cả các hoạt động giao dịch hàng ngày tại tất cả các chi nhánh trong toàn hệ thống Ngõn hàng Công thương Việt Nam đều phải thông qua trụ sở chớnh. Dữ liệu của các giao dịch đó được kiểm soát bởi hệ thống máy chủ AS400 đặt tại trụ sở chớnh. Và cứ như vậy thì dữ liệu được tự động cập nhật vào cơ sở dữ liệu DB2. Như vậy, có thể thấy rằng đõy chớnh là nguồn cung cấp dữ liệu của hệ thống Data Warehouse. Về cơ bản thì nguồn dữ liệu trong hệ thống Data Warehouse có một số đặc điểm sau:
- Cần phải xác định nguồn dữ liệu này là có sẵn ( Ví dụ: Cho vay, tiền gửi,… ) và được sử dụng trong Data Warehouse.
- Mỗi nguồn dữ liệu phải là cơ sở dữ liệu chớnh xác, hoặc ít nhất là một vài cấu trúc có thể chuyển sang cơ sở dữ liệu, gồm cả cơ sở dữ liệu cho Microsoft Access và SQL Server, các file văn bản,…
- Data Warehouse không làm thay đổi các nguồn dữ liệu nhưng phải đọc được các nguồn dữ liệu.
- Các nguồn dữ liệu khác có thể bổ sung và cho là nguồn cho phép sử dụng.
2.2 Đường dẫn
Như đã trình bày ở trên thì tất cả dữ liệu đều được lưư trữ và quản lý trong cở sở dữ liệu DB2 trên máy chủ AS400. Để có thể khai thác được nguồn dữ liệu này thì cần phải có đường dẫn tới một hệ thống có thể xử lý được dữ liệu này. Và trong hệ thống Data Warehouse đường dẫn mang những đặc trưng sau:
- Các đường dẫn được lập trình để tạo ra các bản copy dữ liệu từ hệ thống nguồn tới khu vực định trước.
- Dữ liệu thường được trích dẫn sau khi dữ liệu nguồn được cập nhật (ví dụ như qua chạy lô hàng ngày) để đảm bảo rằng dữ liệu được tớnh toán và phõn bổ chớnh xác.
- Các đường dẫn kết hợp tất cả các bước cần phải thực hiện.