Kỹ Thuật - Công Nghệ - Báo cáo khoa học, luận văn tiến sĩ, luận văn thạc sĩ, nghiên cứu - Công nghệ thông tin ❖ KHOA HỌC CÔNG NGHỆ ❖ ỨNG DỤNG MÔ HÌNH HỌC SÂU TRONG Dự BÁO CHÁT LƯỢNG NƯỚC MẬT HỆ THỐNG THỦY LỢI BẢC HƯNG HẢI NGUYỄN ĐỨC PHONG, HÀ HẢI DƯƠNG Viện Nước, tưới tiêu và Môi trường Tóm tắt: Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thố sông Hồng và là hệ thống lớn nhất miền Bắc. Nguồn nước của hệ thống rất quan trọng đối với phát triến kinh tế - xã hội của các địa phương trong vùng nghiên cứu. Tuy nhiên, ô nhiễm nguồn nước có xu hướng gia tăng cả về phạm vi và mức độ, các chỉ tiêu COD, NHf, PO43'''' và Coliform có mức tăng cao hơn so với các chỉ tiêu khác. Hàm lượng COD tăng 8,6 lần, NH4 tăng 2,48 lần; PO43'''' tăng 4,15 lần và Coliform tăng 91,6 lần. Hằng năm, chất lượng nước mặt được giám sát (chủ yếu vào vụ Đông — Xuân) để phục vụ đổ ải. Phương pháp giám sát chất lượng nước chủ yếu là phương pháp truyền thong tổn nhiều thời gian, công sức và thường cung cấp thông tin hạn chế về chất lượng nước. Trong nghiên cứu này sẽ đảnh giả tiềm năng của các thuật toán học sâu trong dự bảo các thông sổ chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục). Kết quả nghiên cứu cho thấy các thuật toán học sâu có thê đưa ra các dự báo chính xác và nhanh chóng đối với các thông số BOD5, NH4+, PO43'''' và COD. Các mô hình có độ chính xác cao (từ 75 đến 85), đồng thời cung cấp các kết quả có ý nghĩa. Nghiên cứu cũng đã chứng minh được tiềm năng của các thuật toán học sâu để cải thiện việc dự báo chất lượng nước và nhấn mạnh tầm quan trọng của việc lựa chọn các thuật toán học sâu phù hợp cho các thông số chất lượng nước khác nhau. Từ khóa: Hệ thống thuỷ lợi Bắc Hưng Hải, mô hình học sâu, mạng nơ-ron hồi quy (RNN), chất lượng nước mặt. Abstract: Bac Hung Hai Irrigation System is located in the center of the Northern Delta in the Red River Delta and is the largest system in the North. The water source of the system is very important for the socio-economic development of the localities in the study area. However, water pollution tends to increase in both scope and extent, indicators of COD, NH4+, PO43'''' and Coliform have a higher increase than other indicators. COD content increased 8.6 times, NH4 increased 2.48 times; PO43- increased 4.15 times and Coliform increased 91.6 times. Every year, surface water quality is monitored (mainly in the Winter-Spring crop) to serve the drainage. Water quality monitoring methods are mainly traditional methods that are time consuming and labor intensive and often provide limited information on water quality. In this study, we will evaluate the potential of deep learning algorithms in predicting water quality parameters of Bac Hung Hai irrigation system based on field measurements (temperature, pH, DO and turbidity). Research results show that deep learning algorithms can make accurate andfast predictions for parameters BOD5, NH4+, PO4 and COD. The models are highly accurate (from 75 to 85), and provide meaningful results. The study also demonstrated the potential of deep learning algorithms to improve water quality forecasting and highlighted the importance of selecting suitable deep learning algorithms for different water quality parameters. Keywords: Bac Hung Hai irrigation system, Deep learning model, Recurrent neural network (RNN), Surface water quality. TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 61 ❖ KHOA HỌC CÔNG NGHỆ ❖ 1. ĐẶT VẤN ĐỀ Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thổ sông Hồng và là hệ thống lớn nhất miền Bắc. Ranh giới hệ thống được bao bọc bởi 4 sông lớn: phía Bắc là sông Đuống dài 67 km từ Xuân Canh đến Phả Lại; phía Nam là sông Luộc dài 72 km từ Hà Lão đến Quý Cao; phía Tây là sông Hồng dài 57 km từ Xuân Quan đến Hà Lão; phía Đông là sông Thái Bình dài 73 km từ Phả Lại đến Quý Cao 3. Bắc Hưng Hải có hệ thống sông nội địa khá dày đặc, chúng nối thông với nhau tạo thành mạng lưới dẫn và tiêu nước khá thuận lợi. Có 2 sông chính là Sông Kim Son (phía Bắc) chạy từ Xuân Quan đến thành phố Hải Dưong (60 km), đây là tuyến tải nước chính của hệ thống Bắc Hưng Hải lấy từ sông Hồng qua cống Xuân Quan để cấp nước cho cả vùng. Sông Cửu An là trục chính phía Nam chạy từ Nghi Xuyên đến Cự Lộc dài 50 km. Hệ thống sông nội địa có thế dốc lòng sông và hướng chuyển nước đều theo hướng Tây Bắc xuống Đông Nam. Vì vậy nước ngọt lấy từ sông Hồng qua cổng Xuân Quan vào sông Kim Son đã có điều kiện thuận lợi dẫn nước cho toàn khu vực. Hướng tiêu thoát nước chính tập trung vào 2 cửa cầu Xe và An Thổ. Do địa hình thấp nên thuỷ triều từ sông Thái Bình, sông Luộc đều có ảnh hưởng mạnh và khá sâu đến các sông trong nội địa. Nhờ xây dựng 2 công trình ở 2 cửa sông này (Cầu Xe - An Thổ) đã phát huy cao tác dụng chuyển - giữ nước phục vụ cho tưới và ngăn triều, tăng khả năng tiêu thoát nước trong mùa mưa của hệ thống sông nội địa cho toàn khu vực Bắc Hưng Hải 3, 6.'''' Hình 1.1: Vị trí địa lý hệ thống thủy lợi Bắc Hưng Hải Chất lượng nước trong HTTL Bắc Hưng Hải được quan trắc từ năm 2005 đến nay với tần suất quan trắc từ 2-6 lần trong năm, bổ trí vào các thời gian cung cấp nước tưới cho vụ xuân (tháng 2-5) và thời gian cấp nước tưới trong vụ mùa (tháng 7-9). Trong những năm trở lại đây, có ứng dụng mô hình toán chất lượng nước để mô phỏng 3 thông số DO, BODs và NH nhưng độ chính xác còn hạn chế do số liệu đầu vào chưa đầy đủ, nhất là số liệu về lưu lượng nguồn thải (khó điều tra). 62 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Kết quả đã đánh giá được mức độ gia tăng ô nhiễm, các chỉ tiêu ô nhiễm và nguyên nhân gây ô nhiễm làm cơ sở đề xuất các giải pháp giảm thiểu ô nhiễm và giảm thiểu tác hại của ô nhiễm nước đến SXNN và NTTS 3, Có thể thấy phương pháp giám sát chất lượng nước trong HTTL Bắc Hưng Hải là phương pháp truyền thống (thu thập các mẫu nước, sau đó được phân tích trong phòng thí nghiệm bằng các xét nghiệm hóa học và sinh học khác nhau) với các thông số lý, hóa, vi sinh... Các phương pháp này thường tốn nhiều thời gian, công sức và có thể tổn kém, đặc biệt khi một số lượng lớn mẫu nước được thu thập từ các địa điểm khác nhau. Ngoài ra, phương pháp này chỉ có thể cung cấp số liệu chất lượng nước tại các thời điểm nhất thời, gây khó khăn cho việc đánh giá những thay đổi theo thời gian và không gian. Trong những năm gần đây, trên Thế giới, trí tuệ nhân tạo (AI) ngày càng được ứng dụng nhiều trong dự báo chất lượng nước nhờ khả năng xử lý lượng lớn dữ liệu và đưa ra dự đoán chính xác. Các thuật toán AI, chẳng hạn như học máy và học sâu, đã được áp dụng để dự báo các thông số chất lượng nước, bao gồm pH, DO, BOD5, COD... cũng như để phát hiện các bất thường về chất lượng nước và dự đoán xu hướng chất lượng nước. Các thuật toán học sâu có thể xử lý các mối quan hệ phi tuyến tính giữa các thông số chất lượng nước, cũng như xử lý dữ liệu bị thiếu và xử lý dữ liệu nhiều chiều một cách hiệu quả. Ngoài ra, các thuật toán AI có thể học hỏi từ dữ liệu trong thời gian thực và liên tục cải thiện các dự đoán của chúng khi có dữ liệu mới. Điều này cho phép các hệ thống giám sát chất lượng nước dựa trên AI thích ứng với những thay đổi về điều kiện chất lượng nước theo thời gian và đưa ra các dự đoán chính xác và đáng tin cậy hơn. Có một số loại thuật toán học sâu có thể được sử dụng để giám sát chất lượng nước, bao gồm mạng nơ-ron nhân tạo (ANN), mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy (RNN). Mỗi loại thuật toán học sâu đều có điểm mạnh và điểm yếu riêng và việc lựa chọn thuật toán sẽ phụ thuộc vào ứng dụng giám sát chất lượng nước cụ thể. Trong những năm gần đây, việc ứng dụng các thuật toán mạng lưới nơ-ron nhân tạo (ANN) để dự báo chất lượng nước đã có những kết quả nổi bật. Các mô hình ANN có khả năng giải quyết các vấn đề mô hình hóa khác nhau ở sông, hồ, hồ chứa, nhà máy xử lý nước thải (WWTP)... 2, Đã có một số nghiên cứu sử dụng mô hình học sâu để dự báo chất lượng nước, chủ yếu tập trung vào dự báo các thông số chất lượng nước (pH, nhiệt độ, DO, COD...) và tính toán chỉ số chất lượng nước (WQI). về dự báo các thông số chất lượng nước như DO, nhiệt độ, pH và độ mặn, Hu và các cộng sự 5 đã dự báo chất lượng nước mới dựa trên mạng học sâu bộ nhớ ngắn - dài hạn (LSTM) được đề xuất để dự báo pH và nhiệt độ. Kết quả cho thấy, độ chính xác đạt của mô hình rất cao lần lượt là 95,76 và 96,88. Haq 9 sử dụng các mô hình (lai) học sâu như mạng thuật toán mạng nơ-ron tích chập (CNN), LSTM và đơn vị tái phát có kiểm soát (GRU) để dự báo. Kết quả cho thấy mô hình (lai) CNN-LSTM vượt trội so với tất cả các mô hình khác về độ chính xác dự đoán và thời gian tính toán. Một kiến trúc với mô hình dự báo cho các hệ thống loT để giám sát chất lượng nước trong nuôi trồng thủy sản được thực hiện bằng cách sử dụng thuật toán học sâu (LSTM) để dự báo các chỉ sổ trên cho thấy hoạt động tốt và có thể áp dụng cho các hệ thống thực tế. Đối với dự báo tổng nitơ (TN), tổng phốt pho (TP) và chỉ số kali permanganat (COD-Mn), nghiên cứu của Yan 10 đã sử dụng mô hình mạng lưới nơ-ron kết họp 1-DRCNN và BiGRU để dự báo. Kết quả TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 63 ❖ KHOA HỌC CÔNG NGHỆ ❖ thực nghiệm cho thấy mô hình đề xuất có độ chính xác dự đoán và tính tổng quát cao hơn so với các mô hình LSTM, GRU và BiGRU (hệ số xác định (R2) có thể đạt tới 0,9431). Các thuật toán trí tuệ nhân tạo (AI) cũng được phát triển để dự báo chỉ số chất lượng nước (WQI) và phân loại chất lượng nước (WQC). Để dự báo WQI, các mô hình mạng nơ- ron nhân tạo như mạng nơ-ron tự hồi quy phi tuyến tính (NARNET) và thuật toán học sâu bộ nhớ ngắn - dài hạn (LSTM) đã được ứng dụng dựa trên 7 thông số đầu vào. Ket quả dự báo cho thấy mô hình NARNET hoạt động tốt hơn so với LSTM để dự báo các giá trị WQI 1. Trong quá trình xây dựng và vận hành các hệ thống quan trắc chất lượng nước thông minh trên nền tảng Internet vạn vật (loT), ngày càng nhiều dữ liệu lớn được tạo ra. Nhằm tận dụng hiệu suất tốt của mạng lưới nơ-ron sâu bộ nhớ ngắn - dài hạn (LSTM) trong dự đoán chuỗi thời gian, mô hình chất lượng nước uống đã được thiết kế và thiết lập để dự đoán dừ liệu lớn về chất lượng nước với sự trợ giúp của công nghệ học sâu nâng cao. Kết quả nghiên cứu cho thấy giá trị dự báo của mô hình và giá trị thực tế rất phù hợp và cho thấy chính xác xu hướng phát triển chất lượng nước trong tương lai, cho thấy tính khả thi và hiệu quả của việc sử dụng mạng lưới nơ-ron sâu LSTM để dự báo chất lượng của nước uống 8. Đối với khu vực số liệu đo đạc còn hạn chế, thiếu số liệu, thuật toán học sâu đã được ứng dụng để dự báo các thông số chất lượng nước (thời gian thực). Một mạng lưới nơ-ron nhân tạo học sâu (ANN) cộng với một kỹ thuật xử lý hậu kỳ được gọi là Bộ xử lý Bayesian đa biến bất định (MBUP) được ứng dụng để dự báo. Kết quả cho thấy đã cải thiện đáng kể độ chính xác của các dự báo chất lượng nước 12. Việc dự báo chất lượng nước dựa trên thuật toán Phân tích quan hệ xám cải tiến (IGRA) và mạng lưới nơ-ron Bộ nhớ ngắn - dài hạn (LSTM) 11. Trong đó, xem xét mối tương quan đa biến của thông số chất lượng nước, IGRA, xét về mức độ tương đồng và gần gũi, được đề xuất đế lựa chọn thông số đặc trưng. Bên cạnh đó cũng xem xét trình tự thời gian của thông tin chất lượng nước, mô hình dự báo chất lượng nước dựa trên LSTM, có đầu vào là các tính năng thu được từ IGRA, được thiết lập. Kết quả cho thấy phương pháp được đề xuất có thể tận dụng tối đa các mối tương quan đa biến và chuồi thời gian của thông tin chất lượng nước để đạt được hiệu quả dự đoán chất lượng nước tốt hơn so với các phương pháp dự đoán tính năng đơn lẻ hoặc không theo trình tự. Để cảnh báo cho người dùng trước khi nguồn nước bị ô nhiễm (Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ thông số nào vượt tiêu chuẩn cho phép), một giải pháp dựa trên loT để dự báo chất lượng nước 4, Hệ thống được đề xuất sử dụng loT và mạng lưới nơ-ron được tối ưu hóa để dự đoán. Thuật toán mạng nơ-ron dựa trên tối ưu hóa bầy đàn Cat (CSO) được sử dụng để dự báo. Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ tham số đo được nào nhỏ hơn ngường cố định. Kỹ thuật này cũng có thể được thực hiện trong các nhà máy nước, sông và các ngành công nghiệp. Các thuật toán học sâu đã cải thiện đáng kể độ chính xác và hiệu quả của dự báo chất lượng nước. Im và các cộng sự 7 đã sử dụng các thuật toán học sâu (LSTM, GRU, SCINet) để dự báo chất lượng nước máy theo chuồi thời gian ở Hàn Quốc. Mô hình học sâu được tối ưu hóa đạt được độ chính xác dự đoán trung bình và tối đa lần lượt là 98,78 và 99,98. Mô hình đề xuất có thể cung cấp thông tin chất lượng nước nhanh chóng và chính xác cho các cơ sở cấp nước quy mỏ lớn trên toàn quốc và cải thiện sức khỏe cộng đồng thông qua chẩn đoán sớm các bất thường về chất lượng nước. 64 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Tóm lại, các nghiên cứu trước đây về sử dụng phương pháp học sâu trong dự báo chất lượng nước chủ yếu tập trung vào vào dự báo các thông số chất lượng nước (thông số vật lý là chủ yếu) và tính toán chỉ số chất lượng nước (WQI). Một số nghiên cứu cũng đã kết hợp thuật toán học sâu với mạng lưới quan trắc thời gian thực và cho kết quả rất khả quan. Tuy nhiên, những nghiên cứu trên chủ yếu là trên Thế giới, ở Việt Nam có rất ít nghiên cứu đánh giá tiềm năng của các thuật toán học sâu trong dự báo các thông số chất lượng nước, nhất là về hóa học và vi sinh (BOD5, NH4+, PO43'''' và Coliform) dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục). Do vậy, việc nghiên cứu ứng dụng trí tuệ nhân tạo (mô hình học sâu) để dự báo chỉ số chất lượng nước mặt dựa vào số liệu đo hiện trường của hệ thống Bắc Hưng Hải là quan trọng và cần thiết. Nghiên cứu sẽ góp phần cung cấp thêm phương pháp dự báo các thông số chất lượng nước mặt khoa học, hiệu quả, tốn ít chi phí nhằm thích hợp với điều kiện thực tế của các địa phương trong vùng nghiên cứu. 2. PHƯƠNG PHÁP THỰC HIỆN 2.1. Mục tiêu - Xây dựng được cơ sở khoa học tính toán các thông số chất lượng nước mặt bằng phương pháp học sâu; - Đe xuất được phương pháp tính toán các thông chất lượng nước mặt bằng phương pháp học sâu dựa vào số liệu đo hiện trường. 2.2. Phưong pháp thực hiện Để đạt được các mục tiêu đề ra, các phương pháp nghiên cứu được sử dụng như sau: 2.2.1. Phươngpháp thu thập tài liệu, số liệu Việc thu thập dữ liệu cho nghiên cứu này sẽ chủ yếu tập trung vào việc thu thập dữ liệu chất lượng nước (quan trắc hiện trường) và các thông số chất lượng nước về hóa học và vi sinh (BOD5, NH4+, PO43" và Coliform) của công trình thủy lợi Bắc Hưng Hải từ các báo cáo quan trắc chất lượng nước và dữ liệu từ các nghiên cứu trước đây. Các dữ liệu sẽ được thu thập và phân tích để phục vụ xây dựng mô hình học sâu. Tham vấn các bên liên quan: Các cuộc tham vấn các bên liên quan sẽ được tiến hành để thu thập thêm thông tin về các nguồn gây ô nhiễm và các yếu tố khác có thể ảnh hưởng đến chất lượng nước ở công trình thủy lợi Bắc Hưng Hải. 2.2.2. Phương pháp xử lý số liệu Chuẩn bị và xử lý trước dữ liệu là một bước quan trọng trong nghiên cứu này để đảm bảo dữ liệu, số liệu phù hợp nhằm loại bỏ mọi yếu tố nhiễu hoặc giá trị ngoại lai có thể ảnh hưởng đến độ chính xác của các mô hình. Bao gồm các bước sau đây: - Làm sạch dữ liệu: Dừ liệu được thu thập sẽ được làm sạch để xử lý mọi giá trị bị thiếu hoặc không đồng nhất. - Chuẩn hóa dữ liệu: số liệu sẽ được chuẩn hóa để đảm bảo rằng tất cả các biến (thông số) đều ở cùng một tỷ lệ (không thứ nguyên), điều này rất quan trọng đối với độ chính xác của các thuật toán học sâu. - Chia dữ liệu: Dừ liệu sẽ được chia thành các bộ dữ liệu huấn luyện và bộ dữ liệu thử nghiệm. Tập dữ liệu huấn luyện sẽ được sử dụng đế huấn luyện các thuật toán, trong khi tập dữ liệu thử nghiệm sẽ được sử dụng để đánh giá độ chính xác của kết quả dự báo. 2.2.3. Phương pháp xây dựng mô hình học sâu 2.2.3.1. Lựa chọn thuật toán học sâu Việc lựa chọn các thuật toán học sâu để dự báo các thông số chất lượng nước cho hệ thống thủy lợi Bắc Hưng Hải sẽ dựa trên khả năng nắm bắt các mối quan hệ phi tuyến tính phức tạp trong dữ liệu và xử lý lượng dữ liệu lớn. Một số thuật toán thường được ứng dụng để dự báo như sa...
❖ KHOA HỌC CÔNG NGHỆ ❖ ỨNG DỤNG MÔ HÌNH HỌC SÂU TRONG Dự BÁO CHÁT LƯỢNG NƯỚC MẬT HỆ THỐNG THỦY LỢI BẢC HƯNG HẢI NGUYỄN ĐỨC PHONG, HÀ HẢI DƯƠNG Viện Nước, tưới tiêu và Môi trường Tóm tắt: Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thố sông Hồng và là hệ thống lớn nhất miền Bắc Nguồn nước của hệ thống rất quan trọng đối với phát triến kinh tế - xã hội của các địa phương trong vùng nghiên cứu Tuy nhiên, ô nhiễm nguồn nước có xu hướng gia tăng cả về phạm vi và mức độ, các chỉ tiêu COD, NHf, PO43' và Coliform có mức tăng cao hơn so với các chỉ tiêu khác Hàm lượng COD tăng 8,6 lần, NH4 tăng 2,48 lần; PO43' tăng 4,15 lần và Coliform tăng 91,6 lần Hằng năm, chất lượng nước mặt được giám sát (chủ yếu vào vụ Đông — Xuân) để phục vụ đổ ải Phương pháp giám sát chất lượng nước chủ yếu là phương pháp truyền thong tổn nhiều thời gian, công sức và thường cung cấp thông tin hạn chế về chất lượng nước Trong nghiên cứu này sẽ đảnh giả tiềm năng của các thuật toán học sâu trong dự bảo các thông sổ chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục) Kết quả nghiên cứu cho thấy các thuật toán học sâu có thê đưa ra các dự báo chính xác và nhanh chóng đối với các thông số BOD5, NH4+, PO43' và COD Các mô hình có độ chính xác cao (từ 75% đến 85%), đồng thời cung cấp các kết quả có ý nghĩa Nghiên cứu cũng đã chứng minh được tiềm năng của các thuật toán học sâu để cải thiện việc dự báo chất lượng nước và nhấn mạnh tầm quan trọng của việc lựa chọn các thuật toán học sâu phù hợp cho các thông số chất lượng nước khác nhau Từ khóa: Hệ thống thuỷ lợi Bắc Hưng Hải, mô hình học sâu, mạng nơ-ron hồi quy (RNN), chất lượng nước mặt Abstract: Bac Hung Hai Irrigation System is located in the center of the Northern Delta in the Red River Delta and is the largest system in the North The water source of the system is very important for the socio-economic development of the localities in the study area However, water pollution tends to increase in both scope and extent, indicators of COD, NH4+, PO43' and Coliform have a higher increase than other indicators COD content increased 8.6 times, NH4 increased 2.48 times; PO43- increased 4.15 times and Coliform increased 91.6 times Every year, surface water quality is monitored (mainly in the Winter-Spring crop) to serve the drainage Water quality monitoring methods are mainly traditional methods that are time consuming and labor intensive and often provide limited information on water quality In this study, we will evaluate the potential of deep learning algorithms in predicting water quality parameters of Bac Hung Hai irrigation system based on field measurements (temperature, pH, DO and turbidity) Research results show that deep learning algorithms can make accurate andfast predictions for parameters BOD5, NH4+, PO4 and COD The models are highly accurate (from 75% to 85%), and provide meaningful results The study also demonstrated the potential of deep learning algorithms to improve water quality forecasting and highlighted the importance of selecting suitable deep learning algorithms for different water quality parameters Keywords: Bac Hung Hai irrigation system, Deep learning model, Recurrent neural network (RNN), Surface water quality TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 61 ❖ KHOA HỌC CÔNG NGHỆ ❖ 1 ĐẶT VẤN ĐỀ Quan để cấp nước cho cả vùng Sông Cửu An là Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở trục chính phía Nam chạy từ Nghi Xuyên đến Trung tâm đồng bằng Bắc Bộ thuộc vùng châu Cự Lộc dài 50 km Hệ thống sông nội địa có thế thổ sông Hồng và là hệ thống lớn nhất miền dốc lòng sông và hướng chuyển nước đều theo Bắc Ranh giới hệ thống được bao bọc bởi 4 hướng Tây Bắc xuống Đông Nam Vì vậy nước sông lớn: phía Bắc là sông Đuống dài 67 km từ ngọt lấy từ sông Hồng qua cổng Xuân Quan vào Xuân Canh đến Phả Lại; phía Nam là sông Luộc sông Kim Son đã có điều kiện thuận lợi dẫn dài 72 km từ Hà Lão đến Quý Cao; phía Tây là nước cho toàn khu vực Hướng tiêu thoát nước sông Hồng dài 57 km từ Xuân Quan đến Hà chính tập trung vào 2 cửa cầu Xe và An Thổ Lão; phía Đông là sông Thái Bình dài 73 km từ Do địa hình thấp nên thuỷ triều từ sông Thái Phả Lại đến Quý Cao [3] Bình, sông Luộc đều có ảnh hưởng mạnh và khá Bắc Hưng Hải có hệ thống sông nội địa khá sâu đến các sông trong nội địa Nhờ xây dựng 2 dày đặc, chúng nối thông với nhau tạo thành công trình ở 2 cửa sông này (Cầu Xe - An Thổ) mạng lưới dẫn và tiêu nước khá thuận lợi Có 2 đã phát huy cao tác dụng chuyển - giữ nước sông chính là Sông Kim Son (phía Bắc) chạy từ phục vụ cho tưới và ngăn triều, tăng khả năng Xuân Quan đến thành phố Hải Dưong (60 km), tiêu thoát nước trong mùa mưa của hệ thống đây là tuyến tải nước chính của hệ thống Bắc sông nội địa cho toàn khu vực Bắc Hưng Hải Hưng Hải lấy từ sông Hồng qua cống Xuân [3], [6].' Hình 1.1: Vị trí địa lý hệ thống thủy lợi Bắc Hưng Hải Chất lượng nước trong HTTL Bắc Hưng Hải 7-9) Trong những năm trở lại đây, có ứng dụng được quan trắc từ năm 2005 đến nay với tần suất mô hình toán chất lượng nước để mô phỏng 3 quan trắc từ 2-6 lần trong năm, bổ trí vào các thời thông số DO, BODs và NH/ nhưng độ chính xác gian cung cấp nước tưới cho vụ xuân (tháng 2-5) còn hạn chế do số liệu đầu vào chưa đầy đủ, nhất và thời gian cấp nước tưới trong vụ mùa (tháng là số liệu về lưu lượng nguồn thải (khó điều tra) 62 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Kết quả đã đánh giá được mức độ gia tăng ô mạng nơ-ron nhân tạo (ANN), mạng nơ-ron tích nhiễm, các chỉ tiêu ô nhiễm và nguyên nhân gây chập (CNN) và mạng nơ-ron hồi quy (RNN) ô nhiễm làm cơ sở đề xuất các giải pháp giảm Mỗi loại thuật toán học sâu đều có điểm mạnh thiểu ô nhiễm và giảm thiểu tác hại của ô nhiễm và điểm yếu riêng và việc lựa chọn thuật toán sẽ nước đến SXNN và NTTS [3], phụ thuộc vào ứng dụng giám sát chất lượng nước cụ thể Có thể thấy phương pháp giám sát chất lượng nước trong HTTL Bắc Hưng Hải là phương Trong những năm gần đây, việc ứng dụng pháp truyền thống (thu thập các mẫu nước, sau các thuật toán mạng lưới nơ-ron nhân tạo đó được phân tích trong phòng thí nghiệm bằng (ANN) để dự báo chất lượng nước đã có những các xét nghiệm hóa học và sinh học khác nhau) kết quả nổi bật Các mô hình ANN có khả năng với các thông số lý, hóa, vi sinh Các phương giải quyết các vấn đề mô hình hóa khác nhau ở pháp này thường tốn nhiều thời gian, công sức sông, hồ, hồ chứa, nhà máy xử lý nước thải và có thể tổn kém, đặc biệt khi một số lượng lớn (WWTP) [2], Đã có một số nghiên cứu sử mẫu nước được thu thập từ các địa điểm khác dụng mô hình học sâu để dự báo chất lượng nhau Ngoài ra, phương pháp này chỉ có thể nước, chủ yếu tập trung vào dự báo các thông số cung cấp số liệu chất lượng nước tại các thời chất lượng nước (pH, nhiệt độ, DO, COD ) và điểm nhất thời, gây khó khăn cho việc đánh giá tính toán chỉ số chất lượng nước (WQI) những thay đổi theo thời gian và không gian về dự báo các thông số chất lượng nước Trong những năm gần đây, trên Thế giới, trí như DO, nhiệt độ, pH và độ mặn, Hu và các tuệ nhân tạo (AI) ngày càng được ứng dụng cộng sự [5] đã dự báo chất lượng nước mới nhiều trong dự báo chất lượng nước nhờ khả dựa trên mạng học sâu bộ nhớ ngắn - dài hạn năng xử lý lượng lớn dữ liệu và đưa ra dự đoán (LSTM) được đề xuất để dự báo pH và nhiệt chính xác Các thuật toán AI, chẳng hạn như độ Kết quả cho thấy, độ chính xác đạt của mô học máy và học sâu, đã được áp dụng để dự báo hình rất cao lần lượt là 95,76% và 96,88% các thông số chất lượng nước, bao gồm pH, DO, Haq [9] sử dụng các mô hình (lai) học sâu như BOD5, COD cũng như để phát hiện các bất mạng thuật toán mạng nơ-ron tích chập thường về chất lượng nước và dự đoán xu (CNN), LSTM và đơn vị tái phát có kiểm soát hướng chất lượng nước Các thuật toán học sâu (GRU) để dự báo Kết quả cho thấy mô hình có thể xử lý các mối quan hệ phi tuyến tính giữa (lai) CNN-LSTM vượt trội so với tất cả các các thông số chất lượng nước, cũng như xử lý mô hình khác về độ chính xác dự đoán và thời dữ liệu bị thiếu và xử lý dữ liệu nhiều chiều một gian tính toán Một kiến trúc với mô hình dự cách hiệu quả Ngoài ra, các thuật toán AI có thể báo cho các hệ thống loT để giám sát chất học hỏi từ dữ liệu trong thời gian thực và liên lượng nước trong nuôi trồng thủy sản được tục cải thiện các dự đoán của chúng khi có dữ thực hiện bằng cách sử dụng thuật toán học liệu mới Điều này cho phép các hệ thống giám sâu (LSTM) để dự báo các chỉ sổ trên cho sát chất lượng nước dựa trên AI thích ứng với thấy hoạt động tốt và có thể áp dụng cho các những thay đổi về điều kiện chất lượng nước hệ thống thực tế Đối với dự báo tổng nitơ theo thời gian và đưa ra các dự đoán chính xác (TN), tổng phốt pho (TP) và chỉ số kali và đáng tin cậy hơn permanganat (COD-Mn), nghiên cứu của Yan [10] đã sử dụng mô hình mạng lưới nơ-ron kết Có một số loại thuật toán học sâu có thể được họp 1-DRCNN và BiGRU để dự báo Kết quả sử dụng để giám sát chất lượng nước, bao gồm TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 63 ❖ KHOA HỌC CÔNG NGHỆ ❖ thực nghiệm cho thấy mô hình đề xuất có độ nơ-ron Bộ nhớ ngắn - dài hạn (LSTM) [11] chính xác dự đoán và tính tổng quát cao hơn Trong đó, xem xét mối tương quan đa biến của so với các mô hình LSTM, GRU và BiGRU thông số chất lượng nước, IGRA, xét về mức độ (hệ số xác định (R2) có thể đạt tới 0,9431) tương đồng và gần gũi, được đề xuất đế lựa chọn thông số đặc trưng Bên cạnh đó cũng xem Các thuật toán trí tuệ nhân tạo (AI) cũng xét trình tự thời gian của thông tin chất lượng được phát triển để dự báo chỉ số chất lượng nước, mô hình dự báo chất lượng nước dựa trên nước (WQI) và phân loại chất lượng nước LSTM, có đầu vào là các tính năng thu được từ (WQC) Để dự báo WQI, các mô hình mạng nơ- IGRA, được thiết lập Kết quả cho thấy phương ron nhân tạo như mạng nơ-ron tự hồi quy phi pháp được đề xuất có thể tận dụng tối đa các tuyến tính (NARNET) và thuật toán học sâu bộ mối tương quan đa biến và chuồi thời gian của nhớ ngắn - dài hạn (LSTM) đã được ứng dụng thông tin chất lượng nước để đạt được hiệu quả dựa trên 7 thông số đầu vào Ket quả dự báo cho dự đoán chất lượng nước tốt hơn so với các thấy mô hình NARNET hoạt động tốt hơn so phương pháp dự đoán tính năng đơn lẻ hoặc với LSTM để dự báo các giá trị WQI [1] không theo trình tự Để cảnh báo cho người dùng trước khi nguồn nước bị ô nhiễm (Hệ Trong quá trình xây dựng và vận hành các hệ thống được đề xuất sẽ cảnh báo người dùng khi thống quan trắc chất lượng nước thông minh bất kỳ thông số nào vượt tiêu chuẩn cho phép), trên nền tảng Internet vạn vật (loT), ngày càng một giải pháp dựa trên loT để dự báo chất lượng nhiều dữ liệu lớn được tạo ra Nhằm tận dụng nước [4], Hệ thống được đề xuất sử dụng loT và hiệu suất tốt của mạng lưới nơ-ron sâu bộ nhớ mạng lưới nơ-ron được tối ưu hóa để dự đoán ngắn - dài hạn (LSTM) trong dự đoán chuỗi thời Thuật toán mạng nơ-ron dựa trên tối ưu hóa bầy gian, mô hình chất lượng nước uống đã được đàn Cat (CSO) được sử dụng để dự báo Hệ thiết kế và thiết lập để dự đoán dừ liệu lớn về thống được đề xuất sẽ cảnh báo người dùng khi chất lượng nước với sự trợ giúp của công nghệ bất kỳ tham số đo được nào nhỏ hơn ngường cố học sâu nâng cao Kết quả nghiên cứu cho thấy định Kỹ thuật này cũng có thể được thực hiện giá trị dự báo của mô hình và giá trị thực tế rất trong các nhà máy nước, sông và các ngành phù hợp và cho thấy chính xác xu hướng phát công nghiệp triển chất lượng nước trong tương lai, cho thấy tính khả thi và hiệu quả của việc sử dụng mạng Các thuật toán học sâu đã cải thiện đáng kể lưới nơ-ron sâu LSTM để dự báo chất lượng của độ chính xác và hiệu quả của dự báo chất lượng nước uống [8] nước Im và các cộng sự [7] đã sử dụng các thuật toán học sâu (LSTM, GRU, SCINet) để dự Đối với khu vực số liệu đo đạc còn hạn chế, báo chất lượng nước máy theo chuồi thời gian ở thiếu số liệu, thuật toán học sâu đã được ứng Hàn Quốc Mô hình học sâu được tối ưu hóa đạt dụng để dự báo các thông số chất lượng nước được độ chính xác dự đoán trung bình và tối đa (thời gian thực) Một mạng lưới nơ-ron nhân tạo lần lượt là 98,78 và 99,98% Mô hình đề xuất có học sâu (ANN) cộng với một kỹ thuật xử lý hậu thể cung cấp thông tin chất lượng nước nhanh kỳ được gọi là Bộ xử lý Bayesian đa biến bất chóng và chính xác cho các cơ sở cấp nước quy định (MBUP) được ứng dụng để dự báo Kết mỏ lớn trên toàn quốc và cải thiện sức khỏe quả cho thấy đã cải thiện đáng kể độ chính xác cộng đồng thông qua chẩn đoán sớm các bất của các dự báo chất lượng nước [12] Việc dự thường về chất lượng nước báo chất lượng nước dựa trên thuật toán Phân tích quan hệ xám cải tiến (IGRA) và mạng lưới 64 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Tóm lại, các nghiên cứu trước đây về sử trình thủy lợi Bắc Hưng Hải từ các báo cáo dụng phương pháp học sâu trong dự báo chất quan trắc chất lượng nước và dữ liệu từ các lượng nước chủ yếu tập trung vào vào dự báo nghiên cứu trước đây Các dữ liệu sẽ được thu các thông số chất lượng nước (thông số vật lý là thập và phân tích để phục vụ xây dựng mô chủ yếu) và tính toán chỉ số chất lượng nước hình học sâu (WQI) Một số nghiên cứu cũng đã kết hợp thuật toán học sâu với mạng lưới quan trắc thời Tham vấn các bên liên quan: Các cuộc tham gian thực và cho kết quả rất khả quan Tuy vấn các bên liên quan sẽ được tiến hành để thu nhiên, những nghiên cứu trên chủ yếu là trên thập thêm thông tin về các nguồn gây ô nhiễm Thế giới, ở Việt Nam có rất ít nghiên cứu đánh và các yếu tố khác có thể ảnh hưởng đến chất giá tiềm năng của các thuật toán học sâu trong lượng nước ở công trình thủy lợi Bắc Hưng Hải dự báo các thông số chất lượng nước, nhất là về hóa học và vi sinh (BOD5, NH4+, PO43' và 2.2.2 Phương pháp xử lý số liệu Coliform) dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục) Chuẩn bị và xử lý trước dữ liệu là một bước quan trọng trong nghiên cứu này để đảm bảo dữ Do vậy, việc nghiên cứu ứng dụng trí tuệ liệu, số liệu phù hợp nhằm loại bỏ mọi yếu tố nhân tạo (mô hình học sâu) để dự báo chỉ số nhiễu hoặc giá trị ngoại lai có thể ảnh hưởng chất lượng nước mặt dựa vào số liệu đo hiện đến độ chính xác của các mô hình Bao gồm các trường của hệ thống Bắc Hưng Hải là quan bước sau đây: trọng và cần thiết Nghiên cứu sẽ góp phần cung cấp thêm phương pháp dự báo các thông số chất - Làm sạch dữ liệu: Dừ liệu được thu thập sẽ lượng nước mặt khoa học, hiệu quả, tốn ít chi được làm sạch để xử lý mọi giá trị bị thiếu hoặc phí nhằm thích hợp với điều kiện thực tế của các không đồng nhất địa phương trong vùng nghiên cứu - Chuẩn hóa dữ liệu: số liệu sẽ được chuẩn 2 PHƯƠNG PHÁP THỰC HIỆN hóa để đảm bảo rằng tất cả các biến (thông số) 2.1 Mục tiêu đều ở cùng một tỷ lệ (không thứ nguyên), điều - Xây dựng được cơ sở khoa học tính toán này rất quan trọng đối với độ chính xác của các các thông số chất lượng nước mặt bằng phương thuật toán học sâu pháp học sâu; - Đe xuất được phương pháp tính toán các - Chia dữ liệu: Dừ liệu sẽ được chia thành thông chất lượng nước mặt bằng phương pháp các bộ dữ liệu huấn luyện và bộ dữ liệu thử học sâu dựa vào số liệu đo hiện trường nghiệm Tập dữ liệu huấn luyện sẽ được sử 2.2 Phưong pháp thực hiện dụng đế huấn luyện các thuật toán, trong khi tập Để đạt được các mục tiêu đề ra, các phương dữ liệu thử nghiệm sẽ được sử dụng để đánh giá pháp nghiên cứu được sử dụng như sau: độ chính xác của kết quả dự báo 2.2.1 Phươngpháp thu thập tài liệu, số liệu Việc thu thập dữ liệu cho nghiên cứu này sẽ 2.2.3 Phương pháp xây dựng mô hình chủ yếu tập trung vào việc thu thập dữ liệu chất học sâu lượng nước (quan trắc hiện trường) và các thông số chất lượng nước về hóa học và vi sinh 2.2.3.1 Lựa chọn thuật toán học sâu (BOD5, NH4+, PO43" và Coliform) của công Việc lựa chọn các thuật toán học sâu để dự báo các thông số chất lượng nước cho hệ thống thủy lợi Bắc Hưng Hải sẽ dựa trên khả năng nắm bắt các mối quan hệ phi tuyến tính phức tạp trong dữ liệu và xử lý lượng dữ liệu lớn Một số thuật toán thường được ứng dụng để dự báo như sau: TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 65 ❖ KHOA HỌC CÔNG NGHỆ ❖ - Mạng nơ-ron nhân tạo (ANN): là một loại Recurrent Neural Network thuật toán học sâu thường được sử dụng cho các nhiệm vụ dự báo ANN bao gồm nhiều lớp nút Hình 2.1: Sơ đồ chuyển đổi mạng nơ-ron lan được kết nối với nhau và được đào tạo bằng truyền thang thành mạng nơ-ron hồi quy cách sử dụng lan truyền ngược Theo Hình 2.1, các nút trong các lóp khác - Mạng nơ-ron tích chập (CNN): là một loại nhau của mạng nơ-ron được nén để tạo thành thuật toán học sâu thường được sử dụng để một lớp mạng nơ-ron hồi quy A, B, c là các nhận dạng và xử lý hình ảnh CNN rất phù tham số của mạng Trogn đó, “x” là lớp đầu hợp với dữ liệu chuỗi thời gian và đã được vào, “h” là lóp ẩn và “y” là lớp đầu ra A, B và chứng minh là hoạt động tốt để theo dõi chất c là các tham số mạng được sử dụng để cải lượng nước thiện đầu ra của mô hình Tại bất kỳ thời điểm t nào, đầu vào hiện tại là sự kết họp của đầu vào - Mạng nơ-ron hồi quy (RNNs): RNNs là tại x(t) và x(t-l) Đầu ra tại bất kỳ thời điểm nào một loại thuật toán học sâu rất phù hợp với dữ được tìm nạp trở lại mạng để cải thiện đầu ra liệu liên tục và đa biến RNN được thiết kế để xử lý dữ liệu tuần tự và đã được chứng minh là Hình 2.2: Sơ đồ mạng nơ-ron hồi quy (RNN) hoạt động tốt để dự báo chất lượng nước được kết nổi đầy đủ - Mạng bộ nhớ ngắn - dài hạn (LSTM): Trong các mạng nơ-ron hồi quy, thông tin Mạng LSTM là một loại RNN được thiết kế để tuần hoàn qua một vòng lặp đến lóp ẩn ở giữa xử lý các chuỗi dữ liệu theo thời gian LSTM đã Lóp đầu vào 'x' nhận đầu vào của mạng nơ-ron được chứng minh là rất hiệu quả trong việc dự và xử lý nó rồi chuyển nó lên lóp giữa Lóp giữa báo chất lượng nước thời gian thực 'h' có thể bao gồm nhiều lóp ẩn, mồi lóp có các chức năng kích hoạt và trọng số cũng như độ Qua phân tích ở trên, thấy rằng Mạng nơ-ron lệch riêng Neu có một mạng nơ-ron trong đó hồi quy (RNNs) phù hợp với nghiên cứu này các tham số khác nhau của các lớp ẩn khác nhau Do vậy nghiên cứu sẽ sử dụng thuật toán này để không bị ảnh hưởng bởi lớp trước đó, tức là: xây dựng mô hình dự báo các thông số chất lượng nước về hữu cơ (BOD5, NH/, PO43’ và COD) của công trình thủy lợi Bắc Hưng Hải 2.2.3.2 Cơ sở lý thuyết mạng nơ-ron hồi quy (RNN) Mạng RNN như là một mạng nơ-ron (Neural Network) xử lý thông tin ở dạng chuỗi (sequence/time-series) với việc tiền xử lý các data theo thứ tự RNN được gọi là hồi quy (Recurrent) bởi lẽ chúng thực hiện cùng một tác vụ cho tất cả các phần tử của một chuồi với đầu ra phụ thuộc vào cả các phép tính trước đó Nói cách khác, RNN có khả năng nhớ các thông tin được tính toán trước đó RNN hoạt động theo nguyên tắc lưu đầu ra của một lớp cụ thể và đưa dữ liệu này trở lại đầu vào để dự đoán đầu ra của lớp 66 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1-2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ mạng nơ-ron không có bộ nhớ, thì có thể sử chọn dựa trên kết quả hiệu chỉnh Thuật toán dụng mạng nơ-ron hồi quy Mạng nơ-ron hồi quy sẽ chuẩn hóa các chức năng kích hoạt khác này sẽ được sử dụng cho mô hình dự báo các nhau, trọng số và độ lệch để mồi lớp ẩn có cùng thông số chất lượng nước của hệ thống thủy lợi tham số Sau đó, thay vì tạo nhiều lớp ẩn, nó sẽ tạo một lớp và lặp lại nhiều lần theo yêu cầu Bắc Hưng Hải Ngôn ngữ sử dụng để viết mã là Hình 2.3: Sơ đồ hoạt động của mạng nơ-ron hồi quy R với các gói Keras, đây là API mạng nơ-ron cấp cao, chạy trên TensorFlow Nó được phát Có 4 loại mạng nơ-ron hồi quy: 1 đầu vào cho kết quả 1 đầu ra; 1 đầu vào - nhiều đầu ra; triển với trọng tâm là cho phép thiết kế dễ dàng nhiều đầu vào - 1 đầu ra; và nhiều đầu vào - nhiều đầu ra Trong nghiên cứu này ứng dụng và nhanh chóng các mô hình học sâu phức tạp, loại mạng RNN với nhiều đầu vào - 1 đầu ra cũng như giúp đào tạo chúng dễ dàng hơn 2.2.3.3 Đào tạo và kiếm định mô hình Keras cung cấp các phương pháp thuận tiện để Quá trình đào tạo là sử dụng tập dữ liệu đào tạo sẽ được sử dụng để đào tạo các thuật toán tải và chuẩn bị dừ liệu, cũng như các công cụ để nhận dạng các thông số và mối quan hệ của chúng trong tập dữ liệu Quá trình kiểm định trực quan hóa và giải thích kết quả đào tạo bao gồm sử dụng bộ dữ liệu kiểm tra để đánh giá độ chính xác của thuật toán 2.2.3.4 Đánh giá độ chỉnh xác của mô hình Các bước sau đây sẽ được thực hiện để đào Các chỉ số đánh giá độ chính xác của mô tạo và kiểm định mô hình: - Đào tạo mô hình: thuật toán học sâu (RNN) hình sau đây sẽ được sử dụng để đánh giá mô sẽ được đào tạo bằng tập dữ liệu đào tạo, đồng thời để giảm thiểu sai số dự đoán giữa thông số hình học sâu trong việc dự báo các thông số chất chất lượng nước thực tế và thông số chất lượng nước dự đoán lượng nước ở thủy lợi Bắc Hưng Hải Các tiêu - Điều chỉnh siêu tham số: các tham số của thuật toán học sâu sẽ được điều chỉnh để cải chí đánh giá (hiệu chỉnh) các mô hình học sâu thiện hơn nữa độ chính xác - Kiểm định mô hình: được xác thực bằng bộ được trình bày trong các công thức (1) đến (4): dữ liệu kiểm tra - Lựa chọn mô hình: Thuật toán hoạt động tốt - Sai số tuyệt đối trung bình (MAE): chênh nhất (theo các tham số đã hiệu chỉnh) sẽ được lệch trung bình giữa giá trị thực và giá trị dự đoán MAE là 1 chỉ số phổ biến để tính sai số nhằm đánh giá (kiểm định) mô hình đối với các biến liên tục, được xác định theo công thức (1) Trong đó, Pi là giá trị dự báo và Mi là giá trị thực đo Giá trị MAE càng thấp thì kết quả tính toán càng chính xác 1 ", (!) MAE = - Y |Pi - Àfi| - Sai số toàn phương trung bình (MSE) của một phép ước lượng là trung bình của bình phương các sai số, tức là sự khác biệt giữa các giá trị dự đoán và giá trị thực đo và được tính toán theo theo công thức (2) Giá trị MSE càng thấp thì kết quả tính toán càng chính xác MSE = è Ẻ< Y' - *)! (2) 71 Í=1 - RMSE là căn bậc hai của trung bình của các sai số bình phương RMSE là thước đo mức độ dàn trải của những phần dư này, nói cách khác, TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 67 ❖ KHOA HỌC CÔNG NGHỆ ❖ nó cho bạn biết mức độ tập trung của dữ liệu R2 = 1 - (ESS/TSS) (4) xung quanh đường phù hợp nhất RMSE là độ lệch chuẩn của các phần dư (sai số dự đoán) và 3 KẾT QUẢ VÀ THẢO LUẬN được tính toán theo theo công thức (3) Giá trị RMSE càng thấp thì kết quả tính toán càng 3.1 Kết quả thu thập số liệu quan trắc chính xác chất lượng nước mặt - Hệ số xác định (R2): phản ánh phần trăm phương sai của y có thể giải thích bởi mô hình Số liệu quan trắc chất lượng nước mặt năm được xác định theo theo công thức (4) Trong đó, ESS là tổng các độ lệch bình phương của 2021-2022 tại các vị trí lấy mẫu vùng nghiên phần dư; TSS là tổng các độ lệch bình phương Giá trị R2 dao động từ 0 đến 1, giá trị R2 càng cứu được tổng họp trong Bảng 3.1 và các biểu gần 1 thì kết quả tính toán càng chính xác đồ một số thông số chất lượng nước chính từ Hình 3.1 - Hình 3.6 Có thể thấy nước mặt vùng nghiên cứu chủ yếu bị ô nhiễm hữu cơ, chất dinh dưỡng, vi sinh vật nhất là tại các vị trí Xuân Thụy, Ngọc Đà, Binh Lâu Các thông số vượt nhiều lần TCCP là DO, BOD5, COD, NH4 và tổng Coliform (đây cũng là những thông số ô nhiễm điển hình của vùng nghiên cứu) Bảng 3.1: Tổng hợp các giá trị đặc trưng các chất lượng nước mặt hệ thống Bắc Hưng Hải Thông số Đặc trưng Năm 2021 Năm 2022 Tổng (N=108) (N=75) (N=183) Nhiệt độ Trung bình (SD) 26.0 (3.63) 20.1 (4.25) 23.6 (4.85) Trung vị [Min, Max] pH Trung bình (SD) 25.6 [19.6,33.4] 21.1 [12.6,26.5] 24.5 [12.6, 33.4] DO Trung vị [Min, Max] Trung bình (SD) 7.41 (0.397) 7.34 (0.264) 7.38 (0.350) bod5 Trung vị [Min, Max] Trung bình (SD) 7.33 [6.78, 8.68] 7.37 [6.77, 7.94] 7.34 [6.77, 8.68] COD Trung vị [Min, Max] NH4 Trung bình (SD) 2.64(1.24) 3.21 (1.32) 2.87 (1.30) NO2 Trung vị [Min, Max] Trung bình (SD) 2.45 [0.800, 6.10] 3.40 [0.820, 6.40] 2.90 [0.800, 6.40] Trung vị [Min, Max] Trung bình (SD) 22.4 (12.6) 30.5 (24.1) 25.7(18.6) 20.8 [4.10, 69.7] 23.8 [4.60, 183] 22.5 [4.10, 183] 58.1 (32.6) 69.4 (57.5) 62.7 (44.7) 55.3 [9.50, 176] 55.5 [10.3,451] 55.4 [9.50, 451] 7.65 (7.83) 7.72 (6.92) 7.68 (7.45) 5.32 [0.450,41.7] 6.16 [0.110, 35.3] 5.82 [0.110,41.7] 0.0529 (0.0974) 0.0237(0.0167) 0.0409 (0.0768) 0.0200 [0.0100, 0.0200 [0.0100, Trung vị [Min, Max] 0.800] 0.0800] 0.0200 [0.0100, 0.800] Trung bình (SD) PO4 Trung vị [Min, Max] 0.911 (1.04) 0.783 (1.04) 0.859(1.04) Trung bình (SD) Coliform 0.420 [0.0100, 3.90] 0.300 [0.0100, 4.40] 0.360 [0.0100, 4.40] 1050000 (3660000) 1080000 (3600000) 1060000 (3630000) 43000 [610, 29000 [1400, 39000 [610, Trung vị [Min, Max] 16000000] 16000000] 16000000] 68 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ • An Tho • Binh Lau • Cong Neo ạ Ngoc Da • Phan Ha • Ba Thụy ạ Cau Cat * Kenh Cau * Ngoc Lam • Xuan Quan • Bang Ngang * Cau Xe • Luc Dien * Nhu Quynh • Xuan Thuy Hình 3.1: Biếu đồ biểu diễn nhiệt độ theo các Hình 3.2: Biếu đồ biểu diễn pH theo các vị trí vị trí quan trắc của hệ thống BHH quan trắc của hệ thống BHH • An Tho • Binh Lau ỊỊ Cong Neo • Ngoc Da * Phan Ha •An Tho • Bánh Lau • Cong Neo • Ngoe Da • Phan Ha 5 Ba Thuy • Cau Cat 5» Kenh ệãu * NgocLam 5 Xuan Quan • Ba Thuy • Cau Gat • Kenh Cau • Npoc Lam • Xuan Quan • Bang Ngang • Cau Xe ® Luc Dien • Nhu Quynh * Xuan Thuy • Bang Ngang • Cau Xe * Luc Dion * Nhu Quynh • Xuan Thuy 1 JI , Hình 3.3: Biểu đồ hàm lượng DO theo các Hình 3.4: Biêu đô hàm lượng BODỊ theo các Hình 3.5: Biếu đồ hàm lượng NHf theo các Hình 3.6: Biếu đồ Coliform theo các vị trí vị trí quan trắc của hệ thong BHH quan trắc của hệ thống BHH 3.2 Phân tích tương quan các thông số BOD5 có tương quan với nhau cao nhất (0,98); phục vụ xây dựng mô hình học sâu tiếp đến tương quan giữa NH/ với PO43‘ là 0,64; Theo kết quả phân tích tương quan giữa các tương quan giữa NHT với DO là 0,62; tương quan thông số chất lượng nước mặt cho thấy COD và giữa DO với PO43 là 0,52 (Hình 3.7) Như vậy TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 69 ❖ KHOA HỌC CÔNG NGHỆ ❖ mối tương quan giữa các thông số đầu vào (nhiệt đây cũng là cơ sở để chọn thuật toán học sâu độ, pH, DO) với các thông số dự báo là phi tuyến, (RNN) để dự báo các thông số chất lượng nước 15 25 1 35 0 200 400 0.0 0.4 0.8 0.0e+00 1.5e+07 Hình 3.7: Biểu đồ tương quan của các thông sổ chất lượng nước 3.3 Nghiên cứu tính toán các thông số pH và DO) Nghiên cứu đã xây dựng mô hình chất lượng nước mặt bằng phưong pháp học học sâu từ các thông số trên để dự báo các thông sâu cho hệ thống thủy lợi Bắc Hưng Hải số BODs, NH/, PO43' và COD Kết quả dự báo và các biểu đồ so sánh giữa giá trị dự báo và 3.3.1 Ket quả đánh gùi các mô hình học sâu thực đo đối với tập số liệu thử nghiệm được Căn cứ vào kết quả lựa chọn các thông số trình bày trong Hình 3.8 phục vụ xây dựng mô hình học sâu (Nhiệt độ, - j Hình 3.8: Biểu đồ so sánh giữa giá trị dự báo Hình 3.9: Biểu đồ so sảnh giữa giá trị dự báo và thực đo của thông số BODs và thực đo của thông số COD 70 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ o*» ♦ Ma ♦ Hình 3.11: Biểu đồ so sánh giữa giá trị dự bảo và thực đo của thông số PO43' Hình 3.10: Biếu đồ so sảnh giữa giả trị dự bảo và thực đo của thông số NH4+ Kêt quả đánh giá (dựa vào 4 tiêu chí) của là 0,77; giá trị các sai số MAE, MSE và RMSE mô hình học sâu dự báo các thông số chất lần lượt là 28,28; 1637,5 và 40,46 lượng nước mặt được trình bày trong - Mô hình dự báo NH4+ có hệ số xác định R2 Bảng 3.2 là 0,75; giá trị các sai số MAE, MSE và RMSE - Mô hình dự báo BOD5 có hệ số xác định R2 lần lượt là 4,30; 46,2 và 6,79 là 0,79; giá trị các sai số MAE, MSE và RMSE - Mô hình dự báo PO43" có hệ số xác định R2 lần lượt là 11,54; 297,8 và 17,2 là 0,85; giá trị các sai số MAE, MSE và RMSE - Mô hình dự báo COD có hệ số xác định R2 lần lượt là 0,51; 0,68 và 0,82 Bảng 3.2: Bảng thống kê kết quả đánh giá kết quả dự báo chỉ số chất lượng nước mặt bằng mô hình học sâu cho HTTL Bắc Hưng Hải Các thông số đầu vào Thông số số lớp Số lần Tiêu chí đánh giá đầu ra ẩn lặp MAE MSE RMSE R2 Nhiệt độ, pH, DO và Độ đục BOD5 10 200 11,54 297,80 17,20 0,79 Nhiệt độ, pH, DO và Độ đục COD 10 200 28,28 1637,50 40,46 0,77 Nhiệt độ, pH, DO và Độ đục nh4+ 10 200 4,30 46,2 6,79 0,75 Nhiệt độ, pH, DO và Độ đục PO43’ 10 200 0,51 0,68 0,82 0,85 Có thể thấy, mô hình học sâu được áp dụng 4 KẾT LUẬN trong nghiên cứu này đều có thể dự đoán tốt các Ket quả nghiên cứu đã xây dựng được cơ sở thông số chất lượng nước cho khu vực nghiên khoa học dự báo các thông số chất lượng nước cứu với hệ số xác định khá cao, lớn hơn 0,75 mặt bằng phương pháp học sâu (mạng nơ ron Đây là cơ sở khoa học vững chắc và cũng là kết hồi quy - RNN) và đề xuất được phương pháp quả quan trọng để có thể ứng dụng mô hình học dự báo các thông số chất lượng nước mặt bằng sâu để dự đoán các thông số chất lượng nước cho phương pháp học sâu thích họp với điều kiện các vùng khác có điều kiện tương tự, nhất là thực tế của các địa phương trong vùng hệ thống trong điều kiện khó khăn trong công tác quan Bắc Hưng Hải trắc đầy đủ các thông số chất lượng nước theo Theo kết quả tính toán (dự báo) các thông số phương pháp truyền thống để phục vụ công tác BOD5, NH4+, PO43’ và COD cho thấy rằng kết đánh giá và quản lý nước trong hệ thống thủy lợi quả dự báo PO43’ có độ chính xác cao nhất TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1-2023 71 ❖ KHOA HỌC CÔNG NGHỆ ❖ (85%), tiếp đến là BOD5 (79%), COD (77%) và Deep LSTM Network Considering Correlation NH4+ (75%) in Smart Mariculture", Sensors 19(6), tr 1420 Như vậy, việc ứng dụng mô hình học sâu có 6 Vũ Thị Thanh Hương (2018), Nghiên cứu thể tính toán (dự báo) các thông số chất lượng đề xuất các giải pháp giảm thiểu ô nhiễm nước nước cho khu vực nghiên cứu với độ chính xác trong hệ thống công trình thủy lợi Bắc Hưng cao, và có thể áp dụng cho các hệ thống thủy lợi Hải, Viện Nước, Tưới tiêu và Môi trường khác với điều kiện tương tự Điều này sẽ giúp các công ty khai thác công trình thủy lợi và các 7 Yunjeong Im và các cộng sự (2022), địa phương cải thiện hơn trong công tác đánh "Deep Learning Methods for Predicting Tap- giá và quản lý chất lượng nước mặt Water Quality Time Series in South Korea", Water 14(22), tr 3766 Lời cảm on: Tác giả xin chân thành cảm ơn Ban chủ nhiệm Đe tài “Nghiên cứu tác động của 8 Ping Liu và các cộng sự (2019), nguồn cấp nước đến ô nhiễm nước trong các hệ "Analysis and Prediction of Water Quality thong thủy lợi vùng Đồng bằng sông Hồng và Using LSTM Deep Neural Networks in loT đề xuất các giải pháp khắc phục”Mẵ số: Envữonment", Sustainability 11(7), tr 2058 ĐTĐL.CN-02/21 đã cung cấp số liệu về chất lượng nước của Hệ thống thủy lợi Bắc Hưng 9 K p Rasheed Abdul Haq và V p Hải cho nghiên cứu này Harigovindan (2022), "Water Quality Prediction for Smart Aquaculture Using Hybrid Deep TÀI LIỆU THAM KHẢO Learning Models", IEEE Access 10, tr 60078-60098 1 Theyazn H H Aldhyani và các cộng sự (2020), "Water Quality Prediction Using 10 Jianzhuo Yan và các cộng sự (2021), Artificial Intelligence Algorithms", Applied "Water Quality Prediction in the Luan River Bionics and Biomechanics 2020, tr 1-12 Based on 1-DRCNN and BiGRU Hybrid Neural Network Model", Water 13(9), tr 1273 2 Yingyi Chen và các cộng sự (2020), "A Review of the Artificial Neural Network 11 Jian Zhou và các cộng sự (2018), Models for Water Quality Prediction", Applied "Water Quality Prediction Method Based on Sciences 10(17), tr 5776 IGRA and LSTM ", Water 10(9), tr 1148 3 Vũ Quốc Chính (2022), Giám sát, dự báo 12 Yanlai Zhou (2020), "Real-time chất lượng nước trong hệ thống công trình thuỷ probabilistic forecasting of river water quality lợi Bắc Hưng Hải phục vụ lấy nước sản xuất under data missing situation: Deep learning plus nông nghiệp năm 2022, Viện Nước, Tưới tiêu post-processing techniques", Journal of và Môi trường, Hà Nội Hydrology 589, tr 125164 4 Mrs G Mariammal Et al (2021), Người phản biện: PGS.TS Hoàng Thái Đại "Efficient IOT based Water Quality Prediction Phản biện xong: 02/2023 Using Cat Swarm Optimized Neural Network classification", Psychology and Education Journal 58(1), tr 4279-4282 5 Zhuhua Hu và các cộng sự (2019), "A Water Quality Prediction Method Based on the 72 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023