Mô hình kiến trúc đặc trưng nhất của hệ thống BI với dữ liệu có cấu trúc đặt tại một kho dữ liệu được mô tả như trong hình 2.4 [11]:
Hình 2.4: Kiến trúc BI thông thường đối với dữ liệu có cấu trúc
Dữ liệu được trích rút từ các cơ sở dữ liệu nghiệp vụ và được đưa vào kho dữ liệu. Dữ liệu cụ thể phục vụ cho BI được tải về các kho dữ liệu theo chủđề (data mart) để sau đó được sử dụng bởi người lập kế hoạch hoặc người điều hành. Các dữ liệu đầu ra có được từ theo thông lệđược đẩy dữ liệu từ các kho dữ liệu theo chủ đề và từ sự đáp ứng các yêu cầu của người duyệt Web hoặc thành phần phân tích OLAP. Các dữ liệu đầu ra có thể có nhiều dạng khác nhau như báo cáo đột xuất, báo cáo thông thường và các đáp ứng với các yêu cầu cụ thể. Các dữ liệu đầu ra được gửi đi mỗi khi các thông số nằm ngoài giới hạn định trước.
Với hệ thống thông tin chất lượng môi trường, dữ liệu đầu vào của hệ thống là các số liệu quan trắc đã được gửi về từ các trạm, các đơn vị thực hiện quan trắc. Số liệu này được tập hợp ở vùng dữ liệu tạm trước khi chuyển vào kho lưu trữ phục vụ cho việc khai thác. Hình 2.5 sẽ mô tả quy trình xử lý thông tin trong hệ thống ứng dụng BI vào bài toán thông tin chất lượng môi trường.
Bước 1: Số liệu quan trắc từ các trạm khác nhau sẽ được gửi về trung tâm dữ liệu lưu tại CSDL tạm;
Bước 2: Dữ liệu qua quá trình trích xuất, chuyển đổi và nạp dữ liệu được thực hiện bởi kỹ thuật ETL;
Bước 3: Dữ liệu từ bước trên được nạp vào kho dữ liệu. Trong phạm vi bài toán này, dự kiến kho dữ liệu sẽ được thiết kế theo lược đồ hình sao bởi ưu điểm trực quan và dễ dàng thực hiện truy vấn, tăng tốc độ xử lý do không phải kết nối nhiều bảng dữ liệu;
Bước 4: Dữ liệu tại kho sẽ là đầu vào cho quá trình xử lý, triết xuất thông tin tại OLAP.
Bước 5: Tại OLAP, dữ liệu được phân ra thành các khối dữ liệu (cube dữ liệu) hoặc các kho dữ liệu theo chủđề (data mart) như mô tả trong hình 2.4. Với các công cụ khác nhau, OLAP sẽ thực hiện các truy vấn, phân tích dữ liệu theo yêu cầu cho trước, cung cấp đầu ra cho bài toán nghiệp vụ đặt ra. Trong phạm vi bài toán môi trường, thông tin đầu ra của OLAP là chỉ số chất lượng không khí (Air Quality Index - AQI), chỉ số chất lượng môi trường nước (Water Quality Index – WQI); 2 chỉ số này phục vụ đánh giá tương ứng chất lượng môi trường không khí và nước ngoài ra là một số yêu cầu khác;
Bước 6: Dữ liệu đầu ra của quá trình phân tích & lập báo cáo tại OLAP sẽđược hiển thị trên trang web, phục vụ các đối tượng người dùng với bố cục trình bầy khoa học, giao diện và màu sắc hài hòa, có tỉnh thẩm mỹ.
Như vậy, trong chương này, luận văn đã đưa ra được những đánh giá sơ bộ về hiện trạng thông tin, dữ liệu liên quan tới bài toán, bước đầu đề xuất được quy trình xử lý thông tin và các thành phần trong hệ thống thông tin chất lượng môi trường có ứng dụng BI làm cơ sở cho các thiết kế chi tiết được đề cập cụ thể trong chương sau. Về cơ bản, có một số nhận xét như sau:
Về nguồn dữ liệu: là các số liệu quan trắc thu thập từ nhiều trạm khác nhau, được tập hợp lại trong CSDL quan trắc đặt tại một đơn vị đầu mối duy nhất. Như vậy, dữ liệu đa dạng song tập trung ở một địa điểm;
Về phạm vi triển khai: hệ thống dự kiến triển khai tại một đơn vị và được khai thác tại nhiều nơi do đó việc triển khai sẽ có nhiều thuận lợi;
Về giải pháp công nghệ: sử dụng kho dữ liệu kết hợp với kỹ thuật OLAP là phù hợp, khả thi để lưu trữ dữ liệu đa chiều, từ nhiều nguồn gốc khác nhau. Giải pháp này cho phép tổ chức lưu trữ một cách khoa học các dữ liệu từ nhiều nguồn khác nhau, mang tính lịch sử, khối lượng dữ liệu lớn; trên cơ sở đó với kỹ thuật phân tích thông tin của OLAP, việc thực hiện các truy vấn, đáp ứng các nhu cầu bài toán đặt ra là hoàn toàn khả thi;
Đây là một giải pháp mới, lần đầu tiên áp dụng trong lĩnh vực thông tin chất lượng môi trường song hoàn toàn có thể áp dụng với các bài toán có tính mở, phù hợp với các yêu cầu nghiệp vụ đa dạng, phong phú trong thực tiễn của ngành môi trường.
Chương 3 – ĐỀ XUẤT MÔ HÌNH LƯU TRỮ VÀ PHÂN TÍCH DỮ LIỆU VỀ CHẤT LƯỢNG MÔI TRƯỜNG
Chương này sẽ giới thiệu cụ thể các thiết kế kỹ thuật của giải pháp ứng dụng BI trong quản trị hệ thống thông tin chất lượng môi trường đã đề cập ở chương 2. Các nội dung chính được đề cập gồm có mô hình dữ liệu, kiến trúc lưu trữ, kiến trúc phân tích dữ liệu và kiến trúc hỗ trợ ra quyết định.