Mơ hình đề xuất này gồm 4 thành phần chính là: 1) Kho dữ liệu tham chiếu (metadata);
2) Hệ thống chiết xuất dữ liệu;
3) Hệ thống tích hợp và tổng hợp dữ liệu vào Kho dữ liệu; 4) Hệ thống sử dụng và phân tích dữ liệu trong Kho dữ liệu.
Tổng quan mơ hình đề xuất này sẽ được xây dựng và vận hành như sau: - Việc đầu tiên và cơ bản là xây dựng Từ điển dữ liệu đặc tả (Kho dữ liệu tham chiếu), xuất phát từ các dữ liệu đang được sử dụng trong các CSDL thành phần. Việc xây dựng Kho dữ liệu đặc tả này sẽ cịn tiếp tục song song với cơng việc xây dựng hệ thống tích hợp dữ liệu và chiết xuất dữ liệu cho đến khi hoàn tất.
- Xây dựng hệ thống chiết xuất dữ liệu gồm:
+ Các API sử dụng để chiết xuất dữ liệu CSDL thành phần; bảo đảm dữ liệu nhập vào tuân thủ đúng theo quy định của Kho dữ liệu đặc tả.
+ Dữ liệu từ các ứng dụng CSDL sẽ được trích xuất và tải vào kho dữ liệu. Lưu ý, mơ hình dữ liệu của kho dữ liệu sẽ giống hệt như mơ hình dữ liệu của các CSDL thành phần.
+ Lựa chọn công cụ ETL (Extract/Transform/Load) tương xứng để chuyển nhập dữ liệu vào Kho dữ liệu; quy định quy trình và lịch vận hành cơng đoạn thực
hiện ETL để nhập dữ liệu vào Kho dữ liệu, bảo đảm dữ liệu nhập vào tuân thủ đúng theo quy định của Kho dữ liệu đặc tả.
- Qua quy trình ETL, dữ liệu được nhập vào khu vực tích hợp dữ liệu của Kho dữ liệu. Tại đây, chỉ có người quản lý CSDL mới có quyền (authorization) xem xét và chỉnh sửa lại dữ liệu, bảo đảm lần cuối chất lượng của dữ liệu trước khi đưa vào khu vực tổng hợp dữ liệu.
- Công đoạn chuyển tải dữ liệu vào khu vực tổng hợp dữ liệu là công đoạn cuối cùng trong việc nhập dữ liệu vào Kho. Trong khu vực tổng hợp, dữ liệu chỉ được truy cập chứ khơng thể thay đổi chỉnh sửa, bảo đảm tính tồn vẹn và trung thực.
- Từ thiết kế CSDL trong Kho dữ liệu, các CSDL chuyên đề (Data marts) và các OLAP cần có để đáp ứng các yêu cầu nghiệp vụ về làm báo cáo, dashboard, phân tích thơng tin, .... sẽ được xây dựng cho người sử dụng. Người sử dụng sẽ truy cập và xem được các báo cáo, dashboard, hay kết quả phân tích thơng tin qua đường truyền mạng WAN hay đường truyền mạng công cộng, tùy theo mức độ cho phép (authentication/authorization) của người sử dụng với hệ thống kho dữ liệu.
6.4.7. Mơ hình kiến trúc kho dữ liệu
Hình dưới đây mơ tả mơ hình kiến trúc kho dữ liệu theo mơ hình dữ liệu được tập trung tại trung ương (Dựa trên phân tích các mơ hình tham khảo và định
hướng thiết kế mơ hình kiến trúc ở trên):