Kỹ Thuật - Công Nghệ - Báo cáo khoa học, luận văn tiến sĩ, luận văn thạc sĩ, nghiên cứu - Công nghệ thông tin ❖ KHOA HỌC CÔNG NGHỆ ❖ ỨNG DỤNG MÔ HÌNH HỌC SÂU TRONG Dự BÁO CHÁT LƯỢNG NƯỚC MẬT HỆ THỐNG THỦY LỢI BẢC HƯNG HẢI NGUYỄN ĐỨC PHONG, HÀ HẢI DƯƠNG Viện Nước, tưới tiêu và Môi trường Tóm tắt: Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thố sông Hồng và là hệ thống lớn nhất miền Bắc. Nguồn nước của hệ thống rất quan trọng đối với phát triến kinh tế - xã hội của các địa phương trong vùng nghiên cứu. Tuy nhiên, ô nhiễm nguồn nước có xu hướng gia tăng cả về phạm vi và mức độ, các chỉ tiêu COD, NHf, PO43'''' và Coliform có mức tăng cao hơn so với các chỉ tiêu khác. Hàm lượng COD tăng 8,6 lần, NH4 tăng 2,48 lần; PO43'''' tăng 4,15 lần và Coliform tăng 91,6 lần. Hằng năm, chất lượng nước mặt được giám sát (chủ yếu vào vụ Đông — Xuân) để phục vụ đổ ải. Phương pháp giám sát chất lượng nước chủ yếu là phương pháp truyền thong tổn nhiều thời gian, công sức và thường cung cấp thông tin hạn chế về chất lượng nước. Trong nghiên cứu này sẽ đảnh giả tiềm năng của các thuật toán học sâu trong dự bảo các thông sổ chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục). Kết quả nghiên cứu cho thấy các thuật toán học sâu có thê đưa ra các dự báo chính xác và nhanh chóng đối với các thông số BOD5, NH4+, PO43'''' và COD. Các mô hình có độ chính xác cao (từ 75 đến 85), đồng thời cung cấp các kết quả có ý nghĩa. Nghiên cứu cũng đã chứng minh được tiềm năng của các thuật toán học sâu để cải thiện việc dự báo chất lượng nước và nhấn mạnh tầm quan trọng của việc lựa chọn các thuật toán học sâu phù hợp cho các thông số chất lượng nước khác nhau. Từ khóa: Hệ thống thuỷ lợi Bắc Hưng Hải, mô hình học sâu, mạng nơ-ron hồi quy (RNN), chất lượng nước mặt. Abstract: Bac Hung Hai Irrigation System is located in the center of the Northern Delta in the Red River Delta and is the largest system in the North. The water source of the system is very important for the socio-economic development of the localities in the study area. However, water pollution tends to increase in both scope and extent, indicators of COD, NH4+, PO43'''' and Coliform have a higher increase than other indicators. COD content increased 8.6 times, NH4 increased 2.48 times; PO43- increased 4.15 times and Coliform increased 91.6 times. Every year, surface water quality is monitored (mainly in the Winter-Spring crop) to serve the drainage. Water quality monitoring methods are mainly traditional methods that are time consuming and labor intensive and often provide limited information on water quality. In this study, we will evaluate the potential of deep learning algorithms in predicting water quality parameters of Bac Hung Hai irrigation system based on field measurements (temperature, pH, DO and turbidity). Research results show that deep learning algorithms can make accurate andfast predictions for parameters BOD5, NH4+, PO4 and COD. The models are highly accurate (from 75 to 85), and provide meaningful results. The study also demonstrated the potential of deep learning algorithms to improve water quality forecasting and highlighted the importance of selecting suitable deep learning algorithms for different water quality parameters. Keywords: Bac Hung Hai irrigation system, Deep learning model, Recurrent neural network (RNN), Surface water quality. TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 61 ❖ KHOA HỌC CÔNG NGHỆ ❖ 1. ĐẶT VẤN ĐỀ Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thổ sông Hồng và là hệ thống lớn nhất miền Bắc. Ranh giới hệ thống được bao bọc bởi 4 sông lớn: phía Bắc là sông Đuống dài 67 km từ Xuân Canh đến Phả Lại; phía Nam là sông Luộc dài 72 km từ Hà Lão đến Quý Cao; phía Tây là sông Hồng dài 57 km từ Xuân Quan đến Hà Lão; phía Đông là sông Thái Bình dài 73 km từ Phả Lại đến Quý Cao 3. Bắc Hưng Hải có hệ thống sông nội địa khá dày đặc, chúng nối thông với nhau tạo thành mạng lưới dẫn và tiêu nước khá thuận lợi. Có 2 sông chính là Sông Kim Son (phía Bắc) chạy từ Xuân Quan đến thành phố Hải Dưong (60 km), đây là tuyến tải nước chính của hệ thống Bắc Hưng Hải lấy từ sông Hồng qua cống Xuân Quan để cấp nước cho cả vùng. Sông Cửu An là trục chính phía Nam chạy từ Nghi Xuyên đến Cự Lộc dài 50 km. Hệ thống sông nội địa có thế dốc lòng sông và hướng chuyển nước đều theo hướng Tây Bắc xuống Đông Nam. Vì vậy nước ngọt lấy từ sông Hồng qua cổng Xuân Quan vào sông Kim Son đã có điều kiện thuận lợi dẫn nước cho toàn khu vực. Hướng tiêu thoát nước chính tập trung vào 2 cửa cầu Xe và An Thổ. Do địa hình thấp nên thuỷ triều từ sông Thái Bình, sông Luộc đều có ảnh hưởng mạnh và khá sâu đến các sông trong nội địa. Nhờ xây dựng 2 công trình ở 2 cửa sông này (Cầu Xe - An Thổ) đã phát huy cao tác dụng chuyển - giữ nước phục vụ cho tưới và ngăn triều, tăng khả năng tiêu thoát nước trong mùa mưa của hệ thống sông nội địa cho toàn khu vực Bắc Hưng Hải 3, 6.'''' Hình 1.1: Vị trí địa lý hệ thống thủy lợi Bắc Hưng Hải Chất lượng nước trong HTTL Bắc Hưng Hải được quan trắc từ năm 2005 đến nay với tần suất quan trắc từ 2-6 lần trong năm, bổ trí vào các thời gian cung cấp nước tưới cho vụ xuân (tháng 2-5) và thời gian cấp nước tưới trong vụ mùa (tháng 7-9). Trong những năm trở lại đây, có ứng dụng mô hình toán chất lượng nước để mô phỏng 3 thông số DO, BODs và NH nhưng độ chính xác còn hạn chế do số liệu đầu vào chưa đầy đủ, nhất là số liệu về lưu lượng nguồn thải (khó điều tra). 62 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Kết quả đã đánh giá được mức độ gia tăng ô nhiễm, các chỉ tiêu ô nhiễm và nguyên nhân gây ô nhiễm làm cơ sở đề xuất các giải pháp giảm thiểu ô nhiễm và giảm thiểu tác hại của ô nhiễm nước đến SXNN và NTTS 3, Có thể thấy phương pháp giám sát chất lượng nước trong HTTL Bắc Hưng Hải là phương pháp truyền thống (thu thập các mẫu nước, sau đó được phân tích trong phòng thí nghiệm bằng các xét nghiệm hóa học và sinh học khác nhau) với các thông số lý, hóa, vi sinh... Các phương pháp này thường tốn nhiều thời gian, công sức và có thể tổn kém, đặc biệt khi một số lượng lớn mẫu nước được thu thập từ các địa điểm khác nhau. Ngoài ra, phương pháp này chỉ có thể cung cấp số liệu chất lượng nước tại các thời điểm nhất thời, gây khó khăn cho việc đánh giá những thay đổi theo thời gian và không gian. Trong những năm gần đây, trên Thế giới, trí tuệ nhân tạo (AI) ngày càng được ứng dụng nhiều trong dự báo chất lượng nước nhờ khả năng xử lý lượng lớn dữ liệu và đưa ra dự đoán chính xác. Các thuật toán AI, chẳng hạn như học máy và học sâu, đã được áp dụng để dự báo các thông số chất lượng nước, bao gồm pH, DO, BOD5, COD... cũng như để phát hiện các bất thường về chất lượng nước và dự đoán xu hướng chất lượng nước. Các thuật toán học sâu có thể xử lý các mối quan hệ phi tuyến tính giữa các thông số chất lượng nước, cũng như xử lý dữ liệu bị thiếu và xử lý dữ liệu nhiều chiều một cách hiệu quả. Ngoài ra, các thuật toán AI có thể học hỏi từ dữ liệu trong thời gian thực và liên tục cải thiện các dự đoán của chúng khi có dữ liệu mới. Điều này cho phép các hệ thống giám sát chất lượng nước dựa trên AI thích ứng với những thay đổi về điều kiện chất lượng nước theo thời gian và đưa ra các dự đoán chính xác và đáng tin cậy hơn. Có một số loại thuật toán học sâu có thể được sử dụng để giám sát chất lượng nước, bao gồm mạng nơ-ron nhân tạo (ANN), mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy (RNN). Mỗi loại thuật toán học sâu đều có điểm mạnh và điểm yếu riêng và việc lựa chọn thuật toán sẽ phụ thuộc vào ứng dụng giám sát chất lượng nước cụ thể. Trong những năm gần đây, việc ứng dụng các thuật toán mạng lưới nơ-ron nhân tạo (ANN) để dự báo chất lượng nước đã có những kết quả nổi bật. Các mô hình ANN có khả năng giải quyết các vấn đề mô hình hóa khác nhau ở sông, hồ, hồ chứa, nhà máy xử lý nước thải (WWTP)... 2, Đã có một số nghiên cứu sử dụng mô hình học sâu để dự báo chất lượng nước, chủ yếu tập trung vào dự báo các thông số chất lượng nước (pH, nhiệt độ, DO, COD...) và tính toán chỉ số chất lượng nước (WQI). về dự báo các thông số chất lượng nước như DO, nhiệt độ, pH và độ mặn, Hu và các cộng sự 5 đã dự báo chất lượng nước mới dựa trên mạng học sâu bộ nhớ ngắn - dài hạn (LSTM) được đề xuất để dự báo pH và nhiệt độ. Kết quả cho thấy, độ chính xác đạt của mô hình rất cao lần lượt là 95,76 và 96,88. Haq 9 sử dụng các mô hình (lai) học sâu như mạng thuật toán mạng nơ-ron tích chập (CNN), LSTM và đơn vị tái phát có kiểm soát (GRU) để dự báo. Kết quả cho thấy mô hình (lai) CNN-LSTM vượt trội so với tất cả các mô hình khác về độ chính xác dự đoán và thời gian tính toán. Một kiến trúc với mô hình dự báo cho các hệ thống loT để giám sát chất lượng nước trong nuôi trồng thủy sản được thực hiện bằng cách sử dụng thuật toán học sâu (LSTM) để dự báo các chỉ sổ trên cho thấy hoạt động tốt và có thể áp dụng cho các hệ thống thực tế. Đối với dự báo tổng nitơ (TN), tổng phốt pho (TP) và chỉ số kali permanganat (COD-Mn), nghiên cứu của Yan 10 đã sử dụng mô hình mạng lưới nơ-ron kết họp 1-DRCNN và BiGRU để dự báo. Kết quả TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 63 ❖ KHOA HỌC CÔNG NGHỆ ❖ thực nghiệm cho thấy mô hình đề xuất có độ chính xác dự đoán và tính tổng quát cao hơn so với các mô hình LSTM, GRU và BiGRU (hệ số xác định (R2) có thể đạt tới 0,9431). Các thuật toán trí tuệ nhân tạo (AI) cũng được phát triển để dự báo chỉ số chất lượng nước (WQI) và phân loại chất lượng nước (WQC). Để dự báo WQI, các mô hình mạng nơ- ron nhân tạo như mạng nơ-ron tự hồi quy phi tuyến tính (NARNET) và thuật toán học sâu bộ nhớ ngắn - dài hạn (LSTM) đã được ứng dụng dựa trên 7 thông số đầu vào. Ket quả dự báo cho thấy mô hình NARNET hoạt động tốt hơn so với LSTM để dự báo các giá trị WQI 1. Trong quá trình xây dựng và vận hành các hệ thống quan trắc chất lượng nước thông minh trên nền tảng Internet vạn vật (loT), ngày càng nhiều dữ liệu lớn được tạo ra. Nhằm tận dụng hiệu suất tốt của mạng lưới nơ-ron sâu bộ nhớ ngắn - dài hạn (LSTM) trong dự đoán chuỗi thời gian, mô hình chất lượng nước uống đã được thiết kế và thiết lập để dự đoán dừ liệu lớn về chất lượng nước với sự trợ giúp của công nghệ học sâu nâng cao. Kết quả nghiên cứu cho thấy giá trị dự báo của mô hình và giá trị thực tế rất phù hợp và cho thấy chính xác xu hướng phát triển chất lượng nước trong tương lai, cho thấy tính khả thi và hiệu quả của việc sử dụng mạng lưới nơ-ron sâu LSTM để dự báo chất lượng của nước uống 8. Đối với khu vực số liệu đo đạc còn hạn chế, thiếu số liệu, thuật toán học sâu đã được ứng dụng để dự báo các thông số chất lượng nước (thời gian thực). Một mạng lưới nơ-ron nhân tạo học sâu (ANN) cộng với một kỹ thuật xử lý hậu kỳ được gọi là Bộ xử lý Bayesian đa biến bất định (MBUP) được ứng dụng để dự báo. Kết quả cho thấy đã cải thiện đáng kể độ chính xác của các dự báo chất lượng nước 12. Việc dự báo chất lượng nước dựa trên thuật toán Phân tích quan hệ xám cải tiến (IGRA) và mạng lưới nơ-ron Bộ nhớ ngắn - dài hạn (LSTM) 11. Trong đó, xem xét mối tương quan đa biến của thông số chất lượng nước, IGRA, xét về mức độ tương đồng và gần gũi, được đề xuất đế lựa chọn thông số đặc trưng. Bên cạnh đó cũng xem xét trình tự thời gian của thông tin chất lượng nước, mô hình dự báo chất lượng nước dựa trên LSTM, có đầu vào là các tính năng thu được từ IGRA, được thiết lập. Kết quả cho thấy phương pháp được đề xuất có thể tận dụng tối đa các mối tương quan đa biến và chuồi thời gian của thông tin chất lượng nước để đạt được hiệu quả dự đoán chất lượng nước tốt hơn so với các phương pháp dự đoán tính năng đơn lẻ hoặc không theo trình tự. Để cảnh báo cho người dùng trước khi nguồn nước bị ô nhiễm (Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ thông số nào vượt tiêu chuẩn cho phép), một giải pháp dựa trên loT để dự báo chất lượng nước 4, Hệ thống được đề xuất sử dụng loT và mạng lưới nơ-ron được tối ưu hóa để dự đoán. Thuật toán mạng nơ-ron dựa trên tối ưu hóa bầy đàn Cat (CSO) được sử dụng để dự báo. Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ tham số đo được nào nhỏ hơn ngường cố định. Kỹ thuật này cũng có thể được thực hiện trong các nhà máy nước, sông và các ngành công nghiệp. Các thuật toán học sâu đã cải thiện đáng kể độ chính xác và hiệu quả của dự báo chất lượng nước. Im và các cộng sự 7 đã sử dụng các thuật toán học sâu (LSTM, GRU, SCINet) để dự báo chất lượng nước máy theo chuồi thời gian ở Hàn Quốc. Mô hình học sâu được tối ưu hóa đạt được độ chính xác dự đoán trung bình và tối đa lần lượt là 98,78 và 99,98. Mô hình đề xuất có thể cung cấp thông tin chất lượng nước nhanh chóng và chính xác cho các cơ sở cấp nước quy mỏ lớn trên toàn quốc và cải thiện sức khỏe cộng đồng thông qua chẩn đoán sớm các bất thường về chất lượng nước. 64 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Tóm lại, các nghiên cứu trước đây về sử dụng phương pháp học sâu trong dự báo chất lượng nước chủ yếu tập trung vào vào dự báo các thông số chất lượng nước (thông số vật lý là chủ yếu) và tính toán chỉ số chất lượng nước (WQI). Một số nghiên cứu cũng đã kết hợp thuật toán học sâu với mạng lưới quan trắc thời gian thực và cho kết quả rất khả quan. Tuy nhiên, những nghiên cứu trên chủ yếu là trên Thế giới, ở Việt Nam có rất ít nghiên cứu đánh giá tiềm năng của các thuật toán học sâu trong dự báo các thông số chất lượng nước, nhất là về hóa học và vi sinh (BOD5, NH4+, PO43'''' và Coliform) dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục). Do vậy, việc nghiên cứu ứng dụng trí tuệ nhân tạo (mô hình học sâu) để dự báo chỉ số chất lượng nước mặt dựa vào số liệu đo hiện trường của hệ thống Bắc Hưng Hải là quan trọng và cần thiết. Nghiên cứu sẽ góp phần cung cấp thêm phương pháp dự báo các thông số chất lượng nước mặt khoa học, hiệu quả, tốn ít chi phí nhằm thích hợp với điều kiện thực tế của các địa phương trong vùng nghiên cứu. 2. PHƯƠNG PHÁP THỰC HIỆN 2.1. Mục tiêu - Xây dựng được cơ sở khoa học tính toán các thông số chất lượng nước mặt bằng phương pháp học sâu; - Đe xuất được phương pháp tính toán các thông chất lượng nước mặt bằng phương pháp học sâu dựa vào số liệu đo hiện trường. 2.2. Phưong pháp thực hiện Để đạt được các mục tiêu đề ra, các phương pháp nghiên cứu được sử dụng như sau: 2.2.1. Phươngpháp thu thập tài liệu, số liệu Việc thu thập dữ liệu cho nghiên cứu này sẽ chủ yếu tập trung vào việc thu thập dữ liệu chất lượng nước (quan trắc hiện trường) và các thông số chất lượng nước về hóa học và vi sinh (BOD5, NH4+, PO43" và Coliform) của công trình thủy lợi Bắc Hưng Hải từ các báo cáo quan trắc chất lượng nước và dữ liệu từ các nghiên cứu trước đây. Các dữ liệu sẽ được thu thập và phân tích để phục vụ xây dựng mô hình học sâu. Tham vấn các bên liên quan: Các cuộc tham vấn các bên liên quan sẽ được tiến hành để thu thập thêm thông tin về các nguồn gây ô nhiễm và các yếu tố khác có thể ảnh hưởng đến chất lượng nước ở công trình thủy lợi Bắc Hưng Hải. 2.2.2. Phương pháp xử lý số liệu Chuẩn bị và xử lý trước dữ liệu là một bước quan trọng trong nghiên cứu này để đảm bảo dữ liệu, số liệu phù hợp nhằm loại bỏ mọi yếu tố nhiễu hoặc giá trị ngoại lai có thể ảnh hưởng đến độ chính xác của các mô hình. Bao gồm các bước sau đây: - Làm sạch dữ liệu: Dừ liệu được thu thập sẽ được làm sạch để xử lý mọi giá trị bị thiếu hoặc không đồng nhất. - Chuẩn hóa dữ liệu: số liệu sẽ được chuẩn hóa để đảm bảo rằng tất cả các biến (thông số) đều ở cùng một tỷ lệ (không thứ nguyên), điều này rất quan trọng đối với độ chính xác của các thuật toán học sâu. - Chia dữ liệu: Dừ liệu sẽ được chia thành các bộ dữ liệu huấn luyện và bộ dữ liệu thử nghiệm. Tập dữ liệu huấn luyện sẽ được sử dụng đế huấn luyện các thuật toán, trong khi tập dữ liệu thử nghiệm sẽ được sử dụng để đánh giá độ chính xác của kết quả dự báo. 2.2.3. Phương pháp xây dựng mô hình học sâu 2.2.3.1. Lựa chọn thuật toán học sâu Việc lựa chọn các thuật toán học sâu để dự báo các thông số chất lượng nước cho hệ thống thủy lợi Bắc Hưng Hải sẽ dựa trên khả năng nắm bắt các mối quan hệ phi tuyến tính phức tạp trong dữ liệu và xử lý lượng dữ liệu lớn. Một số thuật toán thường được ứng dụng để dự báo như sa...
Trang 1ỨNG DỤNG MÔ HÌNH HỌC SÂU TRONG Dự BÁO
CHÁT LƯỢNG NƯỚC MẬT HỆ THỐNG THỦY LỢI BẢC HƯNG HẢI
NGUYỄN ĐỨC PHONG, HÀ HẢI DƯƠNG
Viện Nước, tưới tiêu và Môi trường
Tóm tắt: Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thố sông Hồng và là hệ thống lớn nhất miền Bắc Nguồn nước của hệ thống rất quan trọng đối với phát triến kinh tế - xã hội của các địa phương trong vùng nghiên cứu Tuy nhiên, ô nhiễm nguồn nước có xu hướng gia tăng cả về phạm vi và mức độ, các chỉ tiêu COD, NHf, PO43' và Coliform có mức tăng cao hơn so với các chỉ tiêu khác Hàm lượng COD tăng 8,6 lần, NH4 tăng 2,48 lần; PO43' tăng 4,15 lần và Coliform tăng 91,6 lần Hằng năm, chất lượng nước mặt được giám sát (chủ yếu vào vụ Đông — Xuân) để phục vụ đổ ải Phương pháp giám sát chất lượng nước chủ yếu là phương pháp truyền thong tổn nhiều thời gian, công sức và thường cung cấp thông tin hạn chế về chất lượng nước Trong nghiên cứu này sẽ đảnh giả tiềm năng của các thuật toán học sâu trong dự bảo các thông sổ chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục) Kết quả nghiên cứu cho thấy các thuật toán học sâu có thê đưa ra các dự báo chính xác và nhanh chóng đối với các thông số BOD5, NH4+, PO43' và COD Các mô hình có độ chính xác cao (từ 75% đến 85%), đồng thời cung cấp các kết quả có ý nghĩa Nghiên cứu cũng đã chứng minh được tiềm năng của các thuật toán học sâu để cải thiện việc dự báo chất lượng nước và nhấn mạnh tầm quan trọng của việc lựa chọn các thuật toán học sâu phù hợp cho các thông số chất lượng nước khác nhau.
Từ khóa: Hệ thống thuỷ lợi Bắc Hưng Hải, mô hình học sâu, mạng nơ-ron hồi quy (RNN), chất lượng nước mặt
Abstract: Bac Hung Hai Irrigation System is located in the center of the Northern Delta in the Red River Delta and is the largest system in the North The water source of the system is very important for the socio-economic development of the localities in the study area However, water pollution tends to increase in both scope and extent, indicators of COD, NH4+, PO43' and Coliform have a higher increase than other indicators COD content increased 8.6 times, NH4 increased 2.48 times; PO43- increased 4.15 times and Coliform increased 91.6 times Every year, surface water quality is monitored (mainly in the Winter-Spring crop) to serve the drainage Water quality monitoring methods are mainly traditional methods that are time consuming and labor intensive and often provide limited information on water quality In this study, we will evaluate the potential
of deep learning algorithms in predicting water quality parameters of Bac Hung Hai irrigation system based on field measurements (temperature, pH, DO and turbidity) Research results show
PO4 and COD The models are highly accurate (from 75% to 85%), and provide meaningful results The study also demonstrated the potential of deep learning algorithms to improve water quality forecasting and highlighted the importance of selecting suitable deep learning algorithms for different water quality parameters.
Keywords: Bac Hung Hai irrigation system, Deep learning model, Recurrent neural network (RNN), Surface water quality
Trang 21 ĐẶT VẤN ĐỀ
Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở
Trung tâm đồng bằng Bắc Bộ thuộc vùng châu
thổ sông Hồng và là hệ thống lớn nhất miền
Bắc Ranh giới hệ thống được bao bọc bởi 4
sông lớn: phía Bắc là sông Đuống dài 67 km từ
Xuân Canh đến Phả Lại; phía Nam là sông Luộc
dài 72 km từ Hà Lão đến Quý Cao; phía Tây là
sông Hồng dài 57 km từ Xuân Quan đến Hà
Lão; phía Đông là sông Thái Bình dài 73 km từ
Phả Lại đến Quý Cao [3]
Bắc Hưng Hải có hệ thống sông nội địa khá
dày đặc, chúng nối thông với nhau tạo thành
mạng lưới dẫn và tiêu nước khá thuận lợi Có 2
sông chính là Sông Kim Son (phía Bắc) chạy từ
Xuân Quan đến thành phố Hải Dưong (60 km),
đây là tuyến tải nước chính của hệ thống Bắc
Hưng Hải lấy từ sông Hồng qua cống Xuân
Quan để cấp nước cho cả vùng Sông Cửu An là trục chính phía Nam chạy từ Nghi Xuyên đến
Cự Lộc dài 50 km Hệ thống sông nội địa có thế dốc lòng sông và hướng chuyển nước đều theo hướng Tây Bắc xuống Đông Nam Vì vậy nước ngọt lấy từ sông Hồng qua cổng Xuân Quan vào sông Kim Son đã có điều kiện thuận lợi dẫn nước cho toàn khu vực Hướng tiêu thoát nước chính tập trung vào 2 cửa cầu Xe và An Thổ
Do địa hình thấp nên thuỷ triều từ sông Thái Bình, sông Luộc đều có ảnh hưởng mạnh và khá sâu đến các sông trong nội địa Nhờ xây dựng 2 công trình ở 2 cửa sông này (Cầu Xe - An Thổ)
đã phát huy cao tác dụng chuyển - giữ nước phục vụ cho tưới và ngăn triều, tăng khả năng tiêu thoát nước trong mùa mưa của hệ thống sông nội địa cho toàn khu vực Bắc Hưng Hải [3], [6].'
Hình 1.1: Vị trí địa lý hệ thống thủy lợi Bắc Hưng Hải
Chất lượng nước trong HTTL Bắc Hưng Hải
được quan trắc từ năm 2005 đến nay với tần suất
quan trắc từ 2-6 lần trong năm, bổ trí vào các thời
gian cung cấp nước tưới cho vụ xuân (tháng 2-5)
và thời gian cấp nước tưới trong vụ mùa (tháng
7-9) Trong những năm trở lại đây, có ứng dụng
mô hình toán chất lượng nước để mô phỏng 3 thông số DO, BODs và NH/ nhưng độ chính xác còn hạn chế do số liệu đầu vào chưa đầy đủ, nhất
là số liệu về lưu lượng nguồn thải (khó điều tra)
Trang 3Kết quả đã đánh giá được mức độ gia tăng ô
nhiễm, các chỉ tiêu ô nhiễm và nguyên nhân gây
ô nhiễm làm cơ sở đề xuất các giải pháp giảm
thiểu ô nhiễm và giảm thiểu tác hại của ô nhiễm
nước đến SXNN và NTTS [3],
Có thể thấy phương pháp giám sát chất lượng
nước trong HTTL Bắc Hưng Hải là phương
pháp truyền thống (thu thập các mẫu nước, sau
đó được phân tích trong phòng thí nghiệm bằng
các xét nghiệm hóa học và sinh học khác nhau)
với các thông số lý, hóa, vi sinh Các phương
pháp này thường tốn nhiều thời gian, công sức
và có thể tổn kém, đặc biệt khi một số lượng lớn
mẫu nước được thu thập từ các địa điểm khác
nhau Ngoài ra, phương pháp này chỉ có thể
cung cấp số liệu chất lượng nước tại các thời
điểm nhất thời, gây khó khăn cho việc đánh giá
những thay đổi theo thời gian và không gian
Trong những năm gần đây, trên Thế giới, trí
tuệ nhân tạo (AI) ngày càng được ứng dụng
nhiều trong dự báo chất lượng nước nhờ khả
năng xử lý lượng lớn dữ liệu và đưa ra dự đoán
chính xác Các thuật toán AI, chẳng hạn như
học máy và học sâu, đã được áp dụng để dự báo
các thông số chất lượng nước, bao gồm pH, DO,
BOD5, COD cũng như để phát hiện các bất
thường về chất lượng nước và dự đoán xu
hướng chất lượng nước Các thuật toán học sâu
có thể xử lý các mối quan hệ phi tuyến tính giữa
các thông số chất lượng nước, cũng như xử lý
dữ liệu bị thiếu và xử lý dữ liệu nhiều chiều một
cách hiệu quả Ngoài ra, các thuật toán AI có thể
học hỏi từ dữ liệu trong thời gian thực và liên
tục cải thiện các dự đoán của chúng khi có dữ
liệu mới Điều này cho phép các hệ thống giám
sát chất lượng nước dựa trên AI thích ứng với
những thay đổi về điều kiện chất lượng nước
theo thời gian và đưa ra các dự đoán chính xác
và đáng tin cậy hơn
Có một số loại thuật toán học sâu có thể được
sử dụng để giám sát chất lượng nước, bao gồm
mạng nơ-ron nhân tạo (ANN), mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy (RNN) Mỗi loại thuật toán học sâu đều có điểm mạnh
và điểm yếu riêng và việc lựa chọn thuật toán sẽ phụ thuộc vào ứng dụng giám sát chất lượng nước cụ thể
Trong những năm gần đây, việc ứng dụng các thuật toán mạng lưới nơ-ron nhân tạo (ANN) để dự báo chất lượng nước đã có những kết quả nổi bật Các mô hình ANN có khả năng giải quyết các vấn đề mô hình hóa khác nhau ở sông, hồ, hồ chứa, nhà máy xử lý nước thải (WWTP) [2], Đã có một số nghiên cứu sử dụng mô hình học sâu để dự báo chất lượng nước, chủ yếu tập trung vào dự báo các thông số chất lượng nước (pH, nhiệt độ, DO, COD ) và tính toán chỉ số chất lượng nước (WQI)
về dự báo các thông số chất lượng nước như DO, nhiệt độ, pH và độ mặn, Hu và các cộng sự [5] đã dự báo chất lượng nước mới dựa trên mạng học sâu bộ nhớ ngắn - dài hạn (LSTM) được đề xuất để dự báo pH và nhiệt
độ Kết quả cho thấy, độ chính xác đạt của mô hình rất cao lần lượt là 95,76% và 96,88% Haq [9] sử dụng các mô hình (lai) học sâu như mạng thuật toán mạng nơ-ron tích chập (CNN), LSTM và đơn vị tái phát có kiểm soát (GRU) để dự báo Kết quả cho thấy mô hình (lai) CNN-LSTM vượt trội so với tất cả các
mô hình khác về độ chính xác dự đoán và thời gian tính toán Một kiến trúc với mô hình dự báo cho các hệ thống loT để giám sát chất lượng nước trong nuôi trồng thủy sản được thực hiện bằng cách sử dụng thuật toán học sâu (LSTM) để dự báo các chỉ sổ trên cho thấy hoạt động tốt và có thể áp dụng cho các
hệ thống thực tế Đối với dự báo tổng nitơ (TN), tổng phốt pho (TP) và chỉ số kali permanganat (COD-Mn), nghiên cứu của Yan [10] đã sử dụng mô hình mạng lưới nơ-ron kết họp 1-DRCNN và BiGRU để dự báo Kết quả
Trang 4thực nghiệm cho thấy mô hình đề xuất có độ
chính xác dự đoán và tính tổng quát cao hơn
so với các mô hình LSTM, GRU và BiGRU
(hệ số xác định (R2) có thể đạt tới 0,9431)
Các thuật toán trí tuệ nhân tạo (AI) cũng
được phát triển để dự báo chỉ số chất lượng
nước (WQI) và phân loại chất lượng nước
(WQC) Để dự báo WQI, các mô hình mạng nơ-
ron nhân tạo như mạng nơ-ron tự hồi quy phi
tuyến tính (NARNET) và thuật toán học sâu bộ
nhớ ngắn - dài hạn (LSTM) đã được ứng dụng
dựa trên 7 thông số đầu vào Ket quả dự báo cho
thấy mô hình NARNET hoạt động tốt hơn so
với LSTM để dự báo các giá trị WQI [1]
Trong quá trình xây dựng và vận hành các hệ
thống quan trắc chất lượng nước thông minh
trên nền tảng Internet vạn vật (loT), ngày càng
nhiều dữ liệu lớn được tạo ra Nhằm tận dụng
hiệu suất tốt của mạng lưới nơ-ron sâu bộ nhớ
ngắn - dài hạn (LSTM) trong dự đoán chuỗi thời
gian, mô hình chất lượng nước uống đã được
thiết kế và thiết lập để dự đoán dừ liệu lớn về
chất lượng nước với sự trợ giúp của công nghệ
học sâu nâng cao Kết quả nghiên cứu cho thấy
giá trị dự báo của mô hình và giá trị thực tế rất
phù hợp và cho thấy chính xác xu hướng phát
triển chất lượng nước trong tương lai, cho thấy
tính khả thi và hiệu quả của việc sử dụng mạng
lưới nơ-ron sâu LSTM để dự báo chất lượng của
nước uống [8]
Đối với khu vực số liệu đo đạc còn hạn chế,
thiếu số liệu, thuật toán học sâu đã được ứng
dụng để dự báo các thông số chất lượng nước
(thời gian thực) Một mạng lưới nơ-ron nhân tạo
học sâu (ANN) cộng với một kỹ thuật xử lý hậu
kỳ được gọi là Bộ xử lý Bayesian đa biến bất
định (MBUP) được ứng dụng để dự báo Kết
quả cho thấy đã cải thiện đáng kể độ chính xác
của các dự báo chất lượng nước [12] Việc dự
báo chất lượng nước dựa trên thuật toán Phân
tích quan hệ xám cải tiến (IGRA) và mạng lưới
nơ-ron Bộ nhớ ngắn - dài hạn (LSTM) [11] Trong đó, xem xét mối tương quan đa biến của thông số chất lượng nước, IGRA, xét về mức độ tương đồng và gần gũi, được đề xuất đế lựa chọn thông số đặc trưng Bên cạnh đó cũng xem xét trình tự thời gian của thông tin chất lượng nước, mô hình dự báo chất lượng nước dựa trên LSTM, có đầu vào là các tính năng thu được từ IGRA, được thiết lập Kết quả cho thấy phương pháp được đề xuất có thể tận dụng tối đa các mối tương quan đa biến và chuồi thời gian của thông tin chất lượng nước để đạt được hiệu quả
dự đoán chất lượng nước tốt hơn so với các phương pháp dự đoán tính năng đơn lẻ hoặc không theo trình tự Để cảnh báo cho người dùng trước khi nguồn nước bị ô nhiễm (Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ thông số nào vượt tiêu chuẩn cho phép), một giải pháp dựa trên loT để dự báo chất lượng nước [4], Hệ thống được đề xuất sử dụng loT và mạng lưới nơ-ron được tối ưu hóa để dự đoán Thuật toán mạng nơ-ron dựa trên tối ưu hóa bầy đàn Cat (CSO) được sử dụng để dự báo Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ tham số đo được nào nhỏ hơn ngường cố định Kỹ thuật này cũng có thể được thực hiện trong các nhà máy nước, sông và các ngành công nghiệp
Các thuật toán học sâu đã cải thiện đáng kể
độ chính xác và hiệu quả của dự báo chất lượng nước Im và các cộng sự [7] đã sử dụng các thuật toán học sâu (LSTM, GRU, SCINet) để dự báo chất lượng nước máy theo chuồi thời gian ở Hàn Quốc Mô hình học sâu được tối ưu hóa đạt được độ chính xác dự đoán trung bình và tối đa lần lượt là 98,78 và 99,98% Mô hình đề xuất có thể cung cấp thông tin chất lượng nước nhanh chóng và chính xác cho các cơ sở cấp nước quy
mỏ lớn trên toàn quốc và cải thiện sức khỏe cộng đồng thông qua chẩn đoán sớm các bất thường về chất lượng nước
Trang 5Tóm lại, các nghiên cứu trước đây về sử
dụng phương pháp học sâu trong dự báo chất
lượng nước chủ yếu tập trung vào vào dự báo
các thông số chất lượng nước (thông số vật lý là
chủ yếu) và tính toán chỉ số chất lượng nước
(WQI) Một số nghiên cứu cũng đã kết hợp
thuật toán học sâu với mạng lưới quan trắc thời
gian thực và cho kết quả rất khả quan Tuy
nhiên, những nghiên cứu trên chủ yếu là trên
Thế giới, ở Việt Nam có rất ít nghiên cứu đánh
giá tiềm năng của các thuật toán học sâu trong
dự báo các thông số chất lượng nước, nhất là về
hóa học và vi sinh (BOD5, NH4+, PO43' và
Coliform) dựa vào các thông số đo hiện trường
(nhiệt độ, pH, DO và độ đục)
Do vậy, việc nghiên cứu ứng dụng trí tuệ
nhân tạo (mô hình học sâu) để dự báo chỉ số
chất lượng nước mặt dựa vào số liệu đo hiện
trường của hệ thống Bắc Hưng Hải là quan
trọng và cần thiết Nghiên cứu sẽ góp phần cung
cấp thêm phương pháp dự báo các thông số chất
lượng nước mặt khoa học, hiệu quả, tốn ít chi
phí nhằm thích hợp với điều kiện thực tế của các
địa phương trong vùng nghiên cứu
2 PHƯƠNG PHÁP THỰC HIỆN
2.1 Mục tiêu
- Xây dựng được cơ sở khoa học tính toán
các thông số chất lượng nước mặt bằng phương
pháp học sâu;
- Đe xuất được phương pháp tính toán các
thông chất lượng nước mặt bằng phương pháp
học sâu dựa vào số liệu đo hiện trường
2.2 Phưong pháp thực hiện
Để đạt được các mục tiêu đề ra, các phương
pháp nghiên cứu được sử dụng như sau:
2.2.1 Phươngpháp thu thập tài liệu, số liệu
Việc thu thập dữ liệu cho nghiên cứu này sẽ
chủ yếu tập trung vào việc thu thập dữ liệu chất
lượng nước (quan trắc hiện trường) và các thông
số chất lượng nước về hóa học và vi sinh
(BOD5, NH4+, PO43" và Coliform) của công
trình thủy lợi Bắc Hưng Hải từ các báo cáo quan trắc chất lượng nước và dữ liệu từ các nghiên cứu trước đây Các dữ liệu sẽ được thu thập và phân tích để phục vụ xây dựng mô hình học sâu
Tham vấn các bên liên quan: Các cuộc tham vấn các bên liên quan sẽ được tiến hành để thu thập thêm thông tin về các nguồn gây ô nhiễm
và các yếu tố khác có thể ảnh hưởng đến chất lượng nước ở công trình thủy lợi Bắc Hưng Hải
2.2.2. Phương pháp xử lý số liệu
Chuẩn bị và xử lý trước dữ liệu là một bước quan trọng trong nghiên cứu này để đảm bảo dữ liệu, số liệu phù hợp nhằm loại bỏ mọi yếu tố nhiễu hoặc giá trị ngoại lai có thể ảnh hưởng đến độ chính xác của các mô hình Bao gồm các bước sau đây:
- Làm sạch dữ liệu: Dừ liệu được thu thập sẽ được làm sạch để xử lý mọi giá trị bị thiếu hoặc không đồng nhất
- Chuẩn hóa dữ liệu: số liệu sẽ được chuẩn hóa để đảm bảo rằng tất cả các biến (thông số) đều ở cùng một tỷ lệ (không thứ nguyên), điều này rất quan trọng đối với độ chính xác của các thuật toán học sâu
- Chia dữ liệu: Dừ liệu sẽ được chia thành các bộ dữ liệu huấn luyện và bộ dữ liệu thử nghiệm Tập dữ liệu huấn luyện sẽ được sử dụng đế huấn luyện các thuật toán, trong khi tập
dữ liệu thử nghiệm sẽ được sử dụng để đánh giá
độ chính xác của kết quả dự báo
2.2.3 Phương pháp xây dựng mô hình học sâu
2.2.3.1 Lựa chọn thuật toán học sâu
Việc lựa chọn các thuật toán học sâu để dự báo các thông số chất lượng nước cho hệ thống thủy lợi Bắc Hưng Hải sẽ dựa trên khả năng nắm bắt các mối quan hệ phi tuyến tính phức tạp trong dữ liệu và xử lý lượng dữ liệu lớn Một số thuật toán thường được ứng dụng
để dự báo như sau:
Trang 6- Mạng nơ-ron nhân tạo (ANN): là một loại
thuật toán học sâu thường được sử dụng cho các
nhiệm vụ dự báo ANN bao gồm nhiều lớp nút
được kết nối với nhau và được đào tạo bằng
cách sử dụng lan truyền ngược
- Mạng nơ-ron tích chập (CNN): là một loại
thuật toán học sâu thường được sử dụng để
nhận dạng và xử lý hình ảnh CNN rất phù
hợp với dữ liệu chuỗi thời gian và đã được
chứng minh là hoạt động tốt để theo dõi chất
lượng nước
- Mạng nơ-ron hồi quy (RNNs): RNNs là
một loại thuật toán học sâu rất phù hợp với dữ
liệu liên tục và đa biến RNN được thiết kế để
xử lý dữ liệu tuần tự và đã được chứng minh là
hoạt động tốt để dự báo chất lượng nước
- Mạng bộ nhớ ngắn - dài hạn (LSTM):
Mạng LSTM là một loại RNN được thiết kế để
xử lý các chuỗi dữ liệu theo thời gian LSTM đã
được chứng minh là rất hiệu quả trong việc dự
báo chất lượng nước thời gian thực
Qua phân tích ở trên, thấy rằng Mạng nơ-ron
hồi quy (RNNs) phù hợp với nghiên cứu này
Do vậy nghiên cứu sẽ sử dụng thuật toán này để
xây dựng mô hình dự báo các thông số chất
lượng nước về hữu cơ (BOD5, NH/, PO43’ và
COD) của công trình thủy lợi Bắc Hưng Hải
2.2.3.2 Cơ sở lý thuyết mạng nơ-ron hồi quy
(RNN)
Mạng RNN như là một mạng nơ-ron (Neural
Network) xử lý thông tin ở dạng chuỗi
(sequence/time-series) với việc tiền xử lý các
data theo thứ tự RNN được gọi là hồi quy
(Recurrent) bởi lẽ chúng thực hiện cùng một tác
vụ cho tất cả các phần tử của một chuồi với đầu
ra phụ thuộc vào cả các phép tính trước đó Nói
cách khác, RNN có khả năng nhớ các thông tin
được tính toán trước đó RNN hoạt động theo
nguyên tắc lưu đầu ra của một lớp cụ thể và đưa
dữ liệu này trở lại đầu vào để dự đoán đầu ra
của lớp
Recurrent Neural Network
Hình 2.1: Sơ đồ chuyển đổi mạng nơ-ron lan truyền thang thành mạng nơ-ron hồi quy
Theo Hình 2.1, các nút trong các lóp khác nhau của mạng nơ-ron được nén để tạo thành một lớp mạng nơ-ron hồi quy A, B, c là các tham số của mạng Trogn đó, “x” là lớp đầu vào, “h” là lóp ẩn và “y” là lớp đầu ra A, B và
c là các tham số mạng được sử dụng để cải thiện đầu ra của mô hình Tại bất kỳ thời điểm t nào, đầu vào hiện tại là sự kết họp của đầu vào tại x(t) và x(t-l) Đầu ra tại bất kỳ thời điểm nào được tìm nạp trở lại mạng để cải thiện đầu ra
Hình 2.2: Sơ đồ mạng nơ-ron hồi quy (RNN)
được kết nổi đầy đủ
Trong các mạng nơ-ron hồi quy, thông tin tuần hoàn qua một vòng lặp đến lóp ẩn ở giữa Lóp đầu vào 'x' nhận đầu vào của mạng nơ-ron
và xử lý nó rồi chuyển nó lên lóp giữa Lóp giữa 'h' có thể bao gồm nhiều lóp ẩn, mồi lóp có các chức năng kích hoạt và trọng số cũng như độ lệch riêng Neu có một mạng nơ-ron trong đó các tham số khác nhau của các lớp ẩn khác nhau không bị ảnh hưởng bởi lớp trước đó, tức là:
66 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1-2023
Trang 7mạng nơ-ron không có bộ nhớ, thì có thể sử
dụng mạng nơ-ron hồi quy Mạng nơ-ron hồi
quy sẽ chuẩn hóa các chức năng kích hoạt khác
nhau, trọng số và độ lệch để mồi lớp ẩn có cùng
tham số Sau đó, thay vì tạo nhiều lớp ẩn, nó sẽ
tạo một lớp và lặp lại nhiều lần theo yêu cầu
Hình 2.3: Sơ đồ hoạt động của mạng nơ-ron hồi quy
Có 4 loại mạng nơ-ron hồi quy: 1 đầu vào
cho kết quả 1 đầu ra; 1 đầu vào - nhiều đầu ra;
nhiều đầu vào - 1 đầu ra; và nhiều đầu vào -
nhiều đầu ra Trong nghiên cứu này ứng dụng
loại mạng RNN với nhiều đầu vào - 1 đầu ra
2.2.3.3 Đào tạo và kiếm định mô hình
Quá trình đào tạo là sử dụng tập dữ liệu đào
tạo sẽ được sử dụng để đào tạo các thuật toán
nhận dạng các thông số và mối quan hệ của
chúng trong tập dữ liệu Quá trình kiểm định
bao gồm sử dụng bộ dữ liệu kiểm tra để đánh
giá độ chính xác của thuật toán
Các bước sau đây sẽ được thực hiện để đào
tạo và kiểm định mô hình:
- Đào tạo mô hình: thuật toán học sâu (RNN)
sẽ được đào tạo bằng tập dữ liệu đào tạo, đồng
thời để giảm thiểu sai số dự đoán giữa thông số
chất lượng nước thực tế và thông số chất lượng
nước dự đoán
- Điều chỉnh siêu tham số: các tham số của
thuật toán học sâu sẽ được điều chỉnh để cải
thiện hơn nữa độ chính xác
- Kiểm định mô hình: được xác thực bằng bộ
dữ liệu kiểm tra
- Lựa chọn mô hình: Thuật toán hoạt động tốt
nhất (theo các tham số đã hiệu chỉnh) sẽ được
chọn dựa trên kết quả hiệu chỉnh Thuật toán này sẽ được sử dụng cho mô hình dự báo các thông số chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải Ngôn ngữ sử dụng để viết mã là
R với các gói Keras, đây là API mạng nơ-ron cấp cao, chạy trên TensorFlow Nó được phát triển với trọng tâm là cho phép thiết kế dễ dàng
và nhanh chóng các mô hình học sâu phức tạp, cũng như giúp đào tạo chúng dễ dàng hơn Keras cung cấp các phương pháp thuận tiện để tải và chuẩn bị dừ liệu, cũng như các công cụ để trực quan hóa và giải thích kết quả đào tạo
2.2.3.4 Đánh giá độ chỉnh xác của mô hình
Các chỉ số đánh giá độ chính xác của mô hình sau đây sẽ được sử dụng để đánh giá mô hình học sâu trong việc dự báo các thông số chất lượng nước ở thủy lợi Bắc Hưng Hải Các tiêu chí đánh giá (hiệu chỉnh) các mô hình học sâu được trình bày trong các công thức (1) đến (4):
- Sai số tuyệt đối trung bình (MAE): chênh lệch trung bình giữa giá trị thực và giá trị dự đoán MAE là 1 chỉ số phổ biến để tính sai số nhằm đánh giá (kiểm định) mô hình đối với các biến liên tục, được xác định theo công thức (1) Trong đó, Pi là giá trị dự báo và Mi là giá trị thực đo Giá trị MAE càng thấp thì kết quả tính toán càng chính xác
1 ",
MAE = - Y |Pi - Àfi| (!)
- Sai số toàn phương trung bình (MSE) của một phép ước lượng là trung bình của bình phương các sai số, tức là sự khác biệt giữa các giá trị dự đoán và giá trị thực đo và được tính toán theo theo công thức (2) Giá trị MSE càng thấp thì kết quả tính toán càng chính xác
MSE = è Ẻ< Y' - *)! (2)
71 Í=1
- RMSE là căn bậc hai của trung bình của các sai số bình phương RMSE là thước đo mức độ dàn trải của những phần dư này, nói cách khác,
Trang 8nó cho bạn biết mức độ tập trung của dữ liệu
xung quanh đường phù hợp nhất RMSE là độ
lệch chuẩn của các phần dư (sai số dự đoán) và
được tính toán theo theo công thức (3) Giá trị
RMSE càng thấp thì kết quả tính toán càng
chính xác
- Hệ số xác định (R2): phản ánh phần trăm
phương sai của y có thể giải thích bởi mô hình
được xác định theo theo công thức (4) Trong
đó, ESS là tổng các độ lệch bình phương của
phần dư; TSS là tổng các độ lệch bình phương
Giá trị R2 dao động từ 0 đến 1, giá trị R2 càng
gần 1 thì kết quả tính toán càng chính xác
R2 = 1 - (ESS/TSS) (4)
3 KẾT QUẢ VÀ THẢO LUẬN 3.1 Kết quả thu thập số liệu quan trắc chất lượng nước mặt
Số liệu quan trắc chất lượng nước mặt năm 2021-2022 tại các vị trí lấy mẫu vùng nghiên cứu được tổng họp trong Bảng 3.1 và các biểu
đồ một số thông số chất lượng nước chính từ Hình 3.1 - Hình 3.6
Có thể thấy nước mặt vùng nghiên cứu chủ yếu bị ô nhiễm hữu cơ, chất dinh dưỡng, vi sinh vật nhất là tại các vị trí Xuân Thụy, Ngọc Đà, Binh Lâu Các thông số vượt nhiều lần TCCP là
DO, BOD5, COD, NH4 và tổng Coliform (đây cũng là những thông số ô nhiễm điển hình của vùng nghiên cứu)
Bảng 3.1: Tổng hợp các giá trị đặc trưng các chất lượng nước mặt hệ thống Bắc Hưng Hải
(N=108) (N=75) (N=183) Nhiệt độ Trung bình (SD) 26.0 (3.63) 20.1 (4.25) 23.6 (4.85)
Trung vị [Min, Max] 25.6 [19.6,33.4] 21.1 [12.6,26.5] 24.5 [12.6, 33.4]
pH Trung bình (SD) 7.41 (0.397) 7.34 (0.264) 7.38 (0.350)
Trung vị [Min, Max] 7.33 [6.78, 8.68] 7.37 [6.77, 7.94] 7.34 [6.77, 8.68]
DO Trung bình (SD) 2.64(1.24) 3.21 (1.32) 2.87 (1.30)
Trung vị [Min, Max] 2.45 [0.800, 6.10] 3.40 [0.820, 6.40] 2.90 [0.800, 6.40] bod5 Trung bình (SD) 22.4 (12.6) 30.5 (24.1) 25.7(18.6)
Trung vị [Min, Max] 20.8 [4.10, 69.7] 23.8 [4.60, 183] 22.5 [4.10, 183]
COD Trung bình (SD) 58.1 (32.6) 69.4 (57.5) 62.7 (44.7)
Trung vị [Min, Max] 55.3 [9.50, 176] 55.5 [10.3,451] 55.4 [9.50, 451]
NH4 Trung bình (SD) 7.65 (7.83) 7.72 (6.92) 7.68 (7.45)
Trung vị [Min, Max] 5.32 [0.450,41.7] 6.16 [0.110, 35.3] 5.82 [0.110,41.7] NO2 Trung bình (SD) 0.0529 (0.0974) 0.0237(0.0167) 0.0409 (0.0768)
Trung vị [Min, Max]
0.0200 [0.0100, 0.800]
0.0200 [0.0100, 0.0800] 0.0200 [0.0100, 0.800]
PO4 Trung bình (SD) 0.911 (1.04) 0.783 (1.04) 0.859(1.04)
Trung vị [Min, Max] 0.420 [0.0100, 3.90] 0.300 [0.0100, 4.40] 0.360 [0.0100, 4.40] Coliform Trung bình (SD) 1050000 (3660000) 1080000 (3600000) 1060000 (3630000)
Trung vị [Min, Max]
43000 [610, 16000000]
29000 [1400, 16000000]
39000 [610, 16000000]
68 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023
Trang 9Hình 3.1: Biếu đồ biểu diễn nhiệt độ theo các
• An Tho • Binh Lau • Cong Neo ạ Ngoc Da • Phan Ha
• Bang Ngang * Cau Xe • Luc Dien Nhu Quynh • Xuan Thuy
Hình 3.2: Biếu đồ biểu diễn pH theo các vị trí
• An Tho • Binh Lau ỊỊ Cong Neo • Ngoc Da * Phan Ha
• Bang Ngang • Cau Xe ® Luc Dien • Nhu Quynh * Xuan Thuy
1
J I ,
Hình 3.4: Biêu đô hàm lượng BODỊ theo các Hình 3.3: Biểu đồ hàm lượng DO theo các
Hình 3.5: Biếu đồ hàm lượng NHf theo các
vị trí quan trắc của hệ thong BHH
3.2 Phân tích tương quan các thông số
phục vụ xây dựng mô hình học sâu
Theo kết quả phân tích tương quan giữa các
thông số chất lượng nước mặt cho thấy COD và
Hình 3.6: Biếu đồ Coliform theo các vị trí quan trắc của hệ thống BHH
BOD5 có tương quan với nhau cao nhất (0,98); tiếp đến tương quan giữa NH/ với PO43‘ là 0,64; tương quan giữa NHT với DO là 0,62; tương quan giữa DO với PO43 là 0,52 (Hình 3.7) Như vậy
Trang 10mối tương quan giữa các thông số đầu vào (nhiệt
độ, pH, DO) với các thông số dự báo là phi tuyến,
đây cũng là cơ sở để chọn thuật toán học sâu (RNN) để dự báo các thông số chất lượng nước
15 25 1 3 5 0 200 400 0.0 0.4 0.8 0.0e+00 1.5e+07
Hình 3.7: Biểu đồ tương quan của các thông sổ chất lượng nước
3.3 Nghiên cứu tính toán các thông số
chất lượng nước mặt bằng phưong pháp học
sâu cho hệ thống thủy lợi Bắc Hưng Hải
3.3.1. Ket quả đánh gùi các mô hình học sâu
Căn cứ vào kết quả lựa chọn các thông số
phục vụ xây dựng mô hình học sâu (Nhiệt độ,
pH và DO) Nghiên cứu đã xây dựng mô hình học sâu từ các thông số trên để dự báo các thông
số BODs, NH/, PO43' và COD Kết quả dự báo
và các biểu đồ so sánh giữa giá trị dự báo và thực đo đối với tập số liệu thử nghiệm được trình bày trong Hình 3.8
Hình 3.8: Biểu đồ so sánh giữa giá trị dự báo
và thực đo của thông số BODs
- j
Hình 3.9: Biểu đồ so sảnh giữa giá trị dự báo
và thực đo của thông số COD