Trong bài toán thông tin chất lượng môi trường, đối tượng cần lưu trữ và khai thác là các số liệu quan trắc được thu thập từ nhiều nguồn khác nhau, khối lượng số liệu lớn, có tính lịch sử do Mạng lưới quan trắc được hình thành và duy trì từ khá lâu. Một đặc điểm chung dễ nhận thấy, đó là các dữ liệu này đều thuộc loại có cấu trúc, đều được tập hợp tại CSDL tập trung song chưa được khai thác triệt để. Nhiệm vụ đặt ra là tổ chức lại cách thức lưu trữ các dữ liệu này một cách khoa học, hỗ trợ việc truy vấn thông tin một cách nhanh chóng, đưa ra được những cách thức khai thác thông tin mới, hỗ trợ hiệu quả công tác giám sát và đánh giá chất lượng môi trường thông qua các chỉ số.
Hình 2.3 mô tả các thành phần của hệ thống BI được đề xuất để ứng dụng trong bài toán quản trị Hệ thống thông tin chất lượng môi trường.
Hình 2.3: Các thành phần của một hệ thống BI trong bài toán quản trị Hệ
Dữ liệu quan trắc từ các nguồn khác nhau sẽđược triết xuất, chuyển đổi và đưa vào kho dữ liệu bằng công cụ ETL;
Tại kho dữ liệu, dữ liệu qua quá trình chuyển đổi sẽ được tổ chức lại dưới dạng các khối dữ liệu theo chủđề, lưu trữ theo mô hình logic hình sao để tăng tốc độ truy vấn, hỗ trợ phân tích dữ liệu thực hiện ở bước sau. Tại kho dữ liệu chỉ bao gồm 2 thao tác chính là thêm mới và đọc dữ liệu và đặc biệt hơn cả là đặc tính gắn với thời gian.
Với OLAP, hệ thống sẽ thiết lập các công thức tính toán chỉ số chất lượng không khí (AQI) và chỉ số chất lượng nước (WQI) (được trình bầy trong các phần sau), thực hiện tính toán và phân tích trên cơ sở công thức đã thiết lập. Cuối cùng hiển thị các kết quả, các truy vấn dưới dạng các bảng kết quả, các đồ thị trực quan sinh động. Bên cạnh kết quả tính toán 2 chỉ số AQI và WQI, hệ thống hỗ trợ chức năng giám sát số liệu trong khâu truyền nhận số liệu từ trạm. 2 tiêu chí của quá trình giám sát này là lượng kết quả thu được từ các trạm quan trắc tự động trong ngày (được kết xuất dưới dạng file excel 1 lần trong ngày, sẵn sàng download mỗi khi cần) và diễn biến ô nhiễm tương ứng với các kết quả của từng nhóm thông số (biểu diễn dưới dạng biểu đồ theo thời gian). Chức năng này sẽ phục vụ tốt việc theo dõi diễn biến chất lượng môi trường xung quanh trạm, hỗ trợ giám sát, phát hiện những bất thường trong quá trình vận hành trạm.
Luận văn sẽ làm rõ hơn tính phù hợp của giải pháp trong những phân tích dưới đây thông qua việc xây dựng mô hình ứng dụng và các thiết kế chi tiết trong những phần tiếp theo.