Các hệ thống nguồn đóng vai trò quan trọng trong bất kỳ giải pháp ETL nào. Thay thế cho việc tạo siêu dữ liệu bằng tay, Warehouse Builder cung các thành phần tích hợp để đưa các thông tin được thích hợp vào kho lưu trữ của nó.
Một trong những điểm mạnh của kiến trúc Warehouse Builder là nó trợ giúp việc quản lý vòng đời phát triển hệ thống. Nó cho phép siêu dữ liệu được cập nhật dựa trên những thay đổi trong hệ thống nguồn. Sau đó tinh giản những thay đổi này đưa đến tiến trình ETL và hệ thống đích.
Để đảm bảo chất lượng và tính đầy đủ cho siêu dữ liệu trong kho lưu trữ, Warehouse Builder cung cấp sự kiểm tra bao quát từng vùng lưu trữ. Sự kiểm tra giữ cho một hệ thống phức tạp được nhiều người sử dụng tạo ra luôn có được trạng thái chính xác và kết dính với nhau.
Ngoài ra, trong quá trình phát triển và đánh giá siêu dữ liệu, luôn có một trang web báo cáo về môi trường siêu dữ liệu. Những báo cáo về môi trường cho phép người phát triển và người sử dụng hiển thị và kiểm tra các thành phần của hệ thống mà không cần sử dụng công cụ thiết kế. Một thành phần rất quan trọng của môi trường báo cáo này là thành phần Các khả năng phân tích tương tác
(Impact Analysis capabilities). Nó cho phép nhận dạng được những tương tác lẫn nhau của các thay đổi trong hệ thống trước khi chúng được thực thi. Báo cáo
Sơ đồ thiết kế của Warehouse Builder Lập báo cáo siêu dữ liệu Lập báo cáo thời gian thực Kho lƣu trữ siêu dữ liệu
của Warehouse Builder
Môi trƣờng thời gian thực của Warehouse Builder Dữ liệu nguồn Kho dữ liệu đích Siêu DL nguồn Thiết kế Siêu DL nguồn Môi trƣờng vận hành Môi trƣờng thiết kế
này cho phép việc điều khiển những thay đổi tốt hơn và việc lập kế hoạch thực thi những thay đổi cũng tốt hơn.
2.1.2 Môi trường vận hành
Người sử dụng sau khi đã thiết kế hệ thống ETL ở mức logic thì cần phải chuyển nó vào môi trường dữ liệu vật lý. Trước khi làm công việc này, thông tin về môi trường vật lý cần được đưa thêm vào thiết kế logic và môi trường đích được cấu hình cho việc triển khai. Sau khi hoàn tất việc cấu hình, mã sẽ được sinh ra. Warehouse Builder sinh ra mã để trích lọc dữ liệu cho quá trình ETL và các câu lệnh định nghĩa đối tượng (DDL) cho CSDL được đặt trong các tệp hệ thống hoặc trong CSDL. Việc thực hiện tiến trình ETL có thể dùng Warehouse Builder Deployment Manager của Warehouse Builder hoặc một công cụ khác như Oracle Enterprise Manager.
Phần này có những đoạn chương trình kiểm tra để báo cáo về quá trình lấy dữ liệu, sinh mã. Có thể nắm bắt được các thông tin này ngay khi hệ thống đang chạy bằng việc sử dụng bộ Runtime Audit Browser.
2.2 Các chức năng chính của Warehouse Builder
Warehouse Builder có các chức năng chính sau: − Định nghĩa các dữ liệu nguồn
− Thiết kế và tạo lược đồ kho dữ liệu đích
− Định nghĩa việc chuyển dịch dữ liệu giữa dữ liệu nguồn và kho dữ liệu đích
− Định nghĩa những sự phụ thuộc giữa tiến trình ETL − Định nghĩa việc quản lý và cập nhật dữ liệu
− Triển khai, nâng cấp và quản lý lược đồ đích − Thiết kế và tạo ra một môi trường OLAP − Thiết kế và tạo ra môi trường công cụ truy vấn
2.3 Các thành phần của Warehouse Builder
2.3.1 Ứng dụng phía khách của Warehouse Builder Client Application
Ứng dụng phía khách của Warehouse Builder (Warehouse Builder Client Application) cung cấp một giao diện dễ sử dụng cho phép định nghĩa, thiết kế và triển khai hệ thống. Hai thành phần Bộ sinh mã (Code Generator) và Bộ quản lý
phát triển (Deployment Manager) giúp cho quá trình kiểm soát việc tạo và quản lý hệ thống được tốt hơn.
Bộ sinh mã: thành phần này sinh ra các script như DDL, PL/SQL dựa trên siêu dữ liệu trong kho. Các script sinh ra cung cấp sự thực hiện tối ưu cho các hệ thống CSDL Oracle.
Bộ quản lý phát triển: thành phần này quản lý mọi mặt của quá trình triển khai và các đối tượng triển khai.
2.3.2 Dịch vụ nền vận hành Warehouse Builder
Dịch vụ nền vận hành của Warehouse Builder (Warehouse Builder Runtime Platform Service) là thành phần của máy dịch vụ. Nó cung cấp các dịch vụ quản lý việc thực thi các ánh xạ và luồng các tiến trình. Nó đảm bảo rằng việc thực thi và triển khai dữ liệu luôn được lưu trong kho lưu trữ vận hành (Runtime Repository). Với những thực hiện từ xa, nó nối với Oracle Enterprise Manager's Management Server. Dịch vụ nền vận hành được gọi thông qua một công việc của CSDL. Nó tự động làm việc khi CSDL khởi tạo và tự động kết thúc khi CSDL tắt.
2.3.3 Kho lưu trữ thiết kế của Warehouse Builder
Kho lưu trữ thiết kế của Warehouse Builder (Warehouse BuilderDesign Repository) lưu trữ siêu dữ liệu cho tất cả các đối tượng sử dụng Warehouse Builder. Đây là nơi mà tất cả thông tin thiết kế cho hệ thống đích được lưu trữ. Có thể truy cập vào siêu dữ liệu thông qua giao diện người sử dụng, qua script tiện dụng của Warehouse Builder.
2.3.4 Kho lưu trữ vận hành của Warehouse Builder
Kho lưu trữ vận hành của Warehouse Builder (Warehouse Builder Runtime Repository) lưu trữ tất cả dữ liệu khi triển khai dữ liệu cũng như việc ánh xạ dữ liệu vào các luồng tiến trình. Đây là nơi lưu trữ thông tin của môi trường đích dùng cho hệ thống nghiệp vụ thông minh. Nó bao gồm thông tin kết nối của tất cả các trạm triển khai.
2.3.5 Trình duyệt báo cáo kiểm toán
Trình duyệt báo cáo kiểm toán (Audit Reporting Browser) cho phép xem xét việc triển khai và thực hiện các thông tin từ một ứng dụng web. Nguồn dữ liệu của báo cáo được lấy từ Runtime Repository.
2.3.6 Trình duyệt báo cáo siêu dữ liệu
Trình duyệt báo cáo siêu dữ liệu (Metadata Reporting Browser) cho phép xem xét siêu dữ liệu lưu trữ trong kho thiết kế từ một ứng dụng web và cung cấp thông tin cho người quan tâm.
2.4 Các đối tượng của Warehouse Builder
Bảng sự kiện (fact table) và bảng chiều (dimension table) là hai kiểu đối tượng thường được sử dụng trong lược đồ của WH (hình 2.2).
1. Bảng sự kiện là bảng lớn trong DWH chứa các thước đo nghiệp vụ của doanh nghiệp. Nó cũng chứa các khóa ngoài đến các bảng chiều.
2. Bảng chiều là các bảng nhìn vào (lookup) hoặc tham chiếu chứa dữ liệu tĩnh để qui chiếu trong DWH. Nó chứa các thông tin thường được sử dụng trong các câu lệnh truy vấn. Bảng chiều là một cấu trúc, chứa một hoặc nhiều cấp để phân hạng dữ liệu.