1. Trang chủ
  2. » Luận Văn - Báo Cáo

ỨNG DỤNG MÔ HÌNH HỌC SÂU TRONG DỰ BÁO CHẤT LƯỢNG NƯỚC MẶT HỆ THỐNG THUỶ LỢI BẮC HƯNG HẢI

12 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Mô Hình Học Sâu Trong Dự Báo Chất Lượng Nước Mặt Hệ Thống Thủy Lợi Bắc Hưng Hải
Tác giả Nguyễn Đức Phong, Hà Hải Dương
Trường học Viện Nước, Tưới Tiêu và Môi Trường
Thể loại Tạp Chí Tài Nguyên Nước
Năm xuất bản 2023
Định dạng
Số trang 12
Dung lượng 1,36 MB

Nội dung

Kỹ Thuật - Công Nghệ - Báo cáo khoa học, luận văn tiến sĩ, luận văn thạc sĩ, nghiên cứu - Công nghệ thông tin ❖ KHOA HỌC CÔNG NGHỆ ❖ ỨNG DỤNG MÔ HÌNH HỌC SÂU TRONG Dự BÁO CHÁT LƯỢNG NƯỚC MẬT HỆ THỐNG THỦY LỢI BẢC HƯNG HẢI NGUYỄN ĐỨC PHONG, HÀ HẢI DƯƠNG Viện Nước, tưới tiêu và Môi trường Tóm tắt: Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thố sông Hồng và là hệ thống lớn nhất miền Bắc. Nguồn nước của hệ thống rất quan trọng đối với phát triến kinh tế - xã hội của các địa phương trong vùng nghiên cứu. Tuy nhiên, ô nhiễm nguồn nước có xu hướng gia tăng cả về phạm vi và mức độ, các chỉ tiêu COD, NHf, PO43'''' và Coliform có mức tăng cao hơn so với các chỉ tiêu khác. Hàm lượng COD tăng 8,6 lần, NH4 tăng 2,48 lần; PO43'''' tăng 4,15 lần và Coliform tăng 91,6 lần. Hằng năm, chất lượng nước mặt được giám sát (chủ yếu vào vụ Đông — Xuân) để phục vụ đổ ải. Phương pháp giám sát chất lượng nước chủ yếu là phương pháp truyền thong tổn nhiều thời gian, công sức và thường cung cấp thông tin hạn chế về chất lượng nước. Trong nghiên cứu này sẽ đảnh giả tiềm năng của các thuật toán học sâu trong dự bảo các thông sổ chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục). Kết quả nghiên cứu cho thấy các thuật toán học sâu có thê đưa ra các dự báo chính xác và nhanh chóng đối với các thông số BOD5, NH4+, PO43'''' và COD. Các mô hình có độ chính xác cao (từ 75 đến 85), đồng thời cung cấp các kết quả có ý nghĩa. Nghiên cứu cũng đã chứng minh được tiềm năng của các thuật toán học sâu để cải thiện việc dự báo chất lượng nước và nhấn mạnh tầm quan trọng của việc lựa chọn các thuật toán học sâu phù hợp cho các thông số chất lượng nước khác nhau. Từ khóa: Hệ thống thuỷ lợi Bắc Hưng Hải, mô hình học sâu, mạng nơ-ron hồi quy (RNN), chất lượng nước mặt. Abstract: Bac Hung Hai Irrigation System is located in the center of the Northern Delta in the Red River Delta and is the largest system in the North. The water source of the system is very important for the socio-economic development of the localities in the study area. However, water pollution tends to increase in both scope and extent, indicators of COD, NH4+, PO43'''' and Coliform have a higher increase than other indicators. COD content increased 8.6 times, NH4 increased 2.48 times; PO43- increased 4.15 times and Coliform increased 91.6 times. Every year, surface water quality is monitored (mainly in the Winter-Spring crop) to serve the drainage. Water quality monitoring methods are mainly traditional methods that are time consuming and labor intensive and often provide limited information on water quality. In this study, we will evaluate the potential of deep learning algorithms in predicting water quality parameters of Bac Hung Hai irrigation system based on field measurements (temperature, pH, DO and turbidity). Research results show that deep learning algorithms can make accurate andfast predictions for parameters BOD5, NH4+, PO4 and COD. The models are highly accurate (from 75 to 85), and provide meaningful results. The study also demonstrated the potential of deep learning algorithms to improve water quality forecasting and highlighted the importance of selecting suitable deep learning algorithms for different water quality parameters. Keywords: Bac Hung Hai irrigation system, Deep learning model, Recurrent neural network (RNN), Surface water quality. TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 61 ❖ KHOA HỌC CÔNG NGHỆ ❖ 1. ĐẶT VẤN ĐỀ Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thổ sông Hồng và là hệ thống lớn nhất miền Bắc. Ranh giới hệ thống được bao bọc bởi 4 sông lớn: phía Bắc là sông Đuống dài 67 km từ Xuân Canh đến Phả Lại; phía Nam là sông Luộc dài 72 km từ Hà Lão đến Quý Cao; phía Tây là sông Hồng dài 57 km từ Xuân Quan đến Hà Lão; phía Đông là sông Thái Bình dài 73 km từ Phả Lại đến Quý Cao 3. Bắc Hưng Hải có hệ thống sông nội địa khá dày đặc, chúng nối thông với nhau tạo thành mạng lưới dẫn và tiêu nước khá thuận lợi. Có 2 sông chính là Sông Kim Son (phía Bắc) chạy từ Xuân Quan đến thành phố Hải Dưong (60 km), đây là tuyến tải nước chính của hệ thống Bắc Hưng Hải lấy từ sông Hồng qua cống Xuân Quan để cấp nước cho cả vùng. Sông Cửu An là trục chính phía Nam chạy từ Nghi Xuyên đến Cự Lộc dài 50 km. Hệ thống sông nội địa có thế dốc lòng sông và hướng chuyển nước đều theo hướng Tây Bắc xuống Đông Nam. Vì vậy nước ngọt lấy từ sông Hồng qua cổng Xuân Quan vào sông Kim Son đã có điều kiện thuận lợi dẫn nước cho toàn khu vực. Hướng tiêu thoát nước chính tập trung vào 2 cửa cầu Xe và An Thổ. Do địa hình thấp nên thuỷ triều từ sông Thái Bình, sông Luộc đều có ảnh hưởng mạnh và khá sâu đến các sông trong nội địa. Nhờ xây dựng 2 công trình ở 2 cửa sông này (Cầu Xe - An Thổ) đã phát huy cao tác dụng chuyển - giữ nước phục vụ cho tưới và ngăn triều, tăng khả năng tiêu thoát nước trong mùa mưa của hệ thống sông nội địa cho toàn khu vực Bắc Hưng Hải 3, 6.'''' Hình 1.1: Vị trí địa lý hệ thống thủy lợi Bắc Hưng Hải Chất lượng nước trong HTTL Bắc Hưng Hải được quan trắc từ năm 2005 đến nay với tần suất quan trắc từ 2-6 lần trong năm, bổ trí vào các thời gian cung cấp nước tưới cho vụ xuân (tháng 2-5) và thời gian cấp nước tưới trong vụ mùa (tháng 7-9). Trong những năm trở lại đây, có ứng dụng mô hình toán chất lượng nước để mô phỏng 3 thông số DO, BODs và NH nhưng độ chính xác còn hạn chế do số liệu đầu vào chưa đầy đủ, nhất là số liệu về lưu lượng nguồn thải (khó điều tra). 62 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Kết quả đã đánh giá được mức độ gia tăng ô nhiễm, các chỉ tiêu ô nhiễm và nguyên nhân gây ô nhiễm làm cơ sở đề xuất các giải pháp giảm thiểu ô nhiễm và giảm thiểu tác hại của ô nhiễm nước đến SXNN và NTTS 3, Có thể thấy phương pháp giám sát chất lượng nước trong HTTL Bắc Hưng Hải là phương pháp truyền thống (thu thập các mẫu nước, sau đó được phân tích trong phòng thí nghiệm bằng các xét nghiệm hóa học và sinh học khác nhau) với các thông số lý, hóa, vi sinh... Các phương pháp này thường tốn nhiều thời gian, công sức và có thể tổn kém, đặc biệt khi một số lượng lớn mẫu nước được thu thập từ các địa điểm khác nhau. Ngoài ra, phương pháp này chỉ có thể cung cấp số liệu chất lượng nước tại các thời điểm nhất thời, gây khó khăn cho việc đánh giá những thay đổi theo thời gian và không gian. Trong những năm gần đây, trên Thế giới, trí tuệ nhân tạo (AI) ngày càng được ứng dụng nhiều trong dự báo chất lượng nước nhờ khả năng xử lý lượng lớn dữ liệu và đưa ra dự đoán chính xác. Các thuật toán AI, chẳng hạn như học máy và học sâu, đã được áp dụng để dự báo các thông số chất lượng nước, bao gồm pH, DO, BOD5, COD... cũng như để phát hiện các bất thường về chất lượng nước và dự đoán xu hướng chất lượng nước. Các thuật toán học sâu có thể xử lý các mối quan hệ phi tuyến tính giữa các thông số chất lượng nước, cũng như xử lý dữ liệu bị thiếu và xử lý dữ liệu nhiều chiều một cách hiệu quả. Ngoài ra, các thuật toán AI có thể học hỏi từ dữ liệu trong thời gian thực và liên tục cải thiện các dự đoán của chúng khi có dữ liệu mới. Điều này cho phép các hệ thống giám sát chất lượng nước dựa trên AI thích ứng với những thay đổi về điều kiện chất lượng nước theo thời gian và đưa ra các dự đoán chính xác và đáng tin cậy hơn. Có một số loại thuật toán học sâu có thể được sử dụng để giám sát chất lượng nước, bao gồm mạng nơ-ron nhân tạo (ANN), mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy (RNN). Mỗi loại thuật toán học sâu đều có điểm mạnh và điểm yếu riêng và việc lựa chọn thuật toán sẽ phụ thuộc vào ứng dụng giám sát chất lượng nước cụ thể. Trong những năm gần đây, việc ứng dụng các thuật toán mạng lưới nơ-ron nhân tạo (ANN) để dự báo chất lượng nước đã có những kết quả nổi bật. Các mô hình ANN có khả năng giải quyết các vấn đề mô hình hóa khác nhau ở sông, hồ, hồ chứa, nhà máy xử lý nước thải (WWTP)... 2, Đã có một số nghiên cứu sử dụng mô hình học sâu để dự báo chất lượng nước, chủ yếu tập trung vào dự báo các thông số chất lượng nước (pH, nhiệt độ, DO, COD...) và tính toán chỉ số chất lượng nước (WQI). về dự báo các thông số chất lượng nước như DO, nhiệt độ, pH và độ mặn, Hu và các cộng sự 5 đã dự báo chất lượng nước mới dựa trên mạng học sâu bộ nhớ ngắn - dài hạn (LSTM) được đề xuất để dự báo pH và nhiệt độ. Kết quả cho thấy, độ chính xác đạt của mô hình rất cao lần lượt là 95,76 và 96,88. Haq 9 sử dụng các mô hình (lai) học sâu như mạng thuật toán mạng nơ-ron tích chập (CNN), LSTM và đơn vị tái phát có kiểm soát (GRU) để dự báo. Kết quả cho thấy mô hình (lai) CNN-LSTM vượt trội so với tất cả các mô hình khác về độ chính xác dự đoán và thời gian tính toán. Một kiến trúc với mô hình dự báo cho các hệ thống loT để giám sát chất lượng nước trong nuôi trồng thủy sản được thực hiện bằng cách sử dụng thuật toán học sâu (LSTM) để dự báo các chỉ sổ trên cho thấy hoạt động tốt và có thể áp dụng cho các hệ thống thực tế. Đối với dự báo tổng nitơ (TN), tổng phốt pho (TP) và chỉ số kali permanganat (COD-Mn), nghiên cứu của Yan 10 đã sử dụng mô hình mạng lưới nơ-ron kết họp 1-DRCNN và BiGRU để dự báo. Kết quả TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1 -2023 63 ❖ KHOA HỌC CÔNG NGHỆ ❖ thực nghiệm cho thấy mô hình đề xuất có độ chính xác dự đoán và tính tổng quát cao hơn so với các mô hình LSTM, GRU và BiGRU (hệ số xác định (R2) có thể đạt tới 0,9431). Các thuật toán trí tuệ nhân tạo (AI) cũng được phát triển để dự báo chỉ số chất lượng nước (WQI) và phân loại chất lượng nước (WQC). Để dự báo WQI, các mô hình mạng nơ- ron nhân tạo như mạng nơ-ron tự hồi quy phi tuyến tính (NARNET) và thuật toán học sâu bộ nhớ ngắn - dài hạn (LSTM) đã được ứng dụng dựa trên 7 thông số đầu vào. Ket quả dự báo cho thấy mô hình NARNET hoạt động tốt hơn so với LSTM để dự báo các giá trị WQI 1. Trong quá trình xây dựng và vận hành các hệ thống quan trắc chất lượng nước thông minh trên nền tảng Internet vạn vật (loT), ngày càng nhiều dữ liệu lớn được tạo ra. Nhằm tận dụng hiệu suất tốt của mạng lưới nơ-ron sâu bộ nhớ ngắn - dài hạn (LSTM) trong dự đoán chuỗi thời gian, mô hình chất lượng nước uống đã được thiết kế và thiết lập để dự đoán dừ liệu lớn về chất lượng nước với sự trợ giúp của công nghệ học sâu nâng cao. Kết quả nghiên cứu cho thấy giá trị dự báo của mô hình và giá trị thực tế rất phù hợp và cho thấy chính xác xu hướng phát triển chất lượng nước trong tương lai, cho thấy tính khả thi và hiệu quả của việc sử dụng mạng lưới nơ-ron sâu LSTM để dự báo chất lượng của nước uống 8. Đối với khu vực số liệu đo đạc còn hạn chế, thiếu số liệu, thuật toán học sâu đã được ứng dụng để dự báo các thông số chất lượng nước (thời gian thực). Một mạng lưới nơ-ron nhân tạo học sâu (ANN) cộng với một kỹ thuật xử lý hậu kỳ được gọi là Bộ xử lý Bayesian đa biến bất định (MBUP) được ứng dụng để dự báo. Kết quả cho thấy đã cải thiện đáng kể độ chính xác của các dự báo chất lượng nước 12. Việc dự báo chất lượng nước dựa trên thuật toán Phân tích quan hệ xám cải tiến (IGRA) và mạng lưới nơ-ron Bộ nhớ ngắn - dài hạn (LSTM) 11. Trong đó, xem xét mối tương quan đa biến của thông số chất lượng nước, IGRA, xét về mức độ tương đồng và gần gũi, được đề xuất đế lựa chọn thông số đặc trưng. Bên cạnh đó cũng xem xét trình tự thời gian của thông tin chất lượng nước, mô hình dự báo chất lượng nước dựa trên LSTM, có đầu vào là các tính năng thu được từ IGRA, được thiết lập. Kết quả cho thấy phương pháp được đề xuất có thể tận dụng tối đa các mối tương quan đa biến và chuồi thời gian của thông tin chất lượng nước để đạt được hiệu quả dự đoán chất lượng nước tốt hơn so với các phương pháp dự đoán tính năng đơn lẻ hoặc không theo trình tự. Để cảnh báo cho người dùng trước khi nguồn nước bị ô nhiễm (Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ thông số nào vượt tiêu chuẩn cho phép), một giải pháp dựa trên loT để dự báo chất lượng nước 4, Hệ thống được đề xuất sử dụng loT và mạng lưới nơ-ron được tối ưu hóa để dự đoán. Thuật toán mạng nơ-ron dựa trên tối ưu hóa bầy đàn Cat (CSO) được sử dụng để dự báo. Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ tham số đo được nào nhỏ hơn ngường cố định. Kỹ thuật này cũng có thể được thực hiện trong các nhà máy nước, sông và các ngành công nghiệp. Các thuật toán học sâu đã cải thiện đáng kể độ chính xác và hiệu quả của dự báo chất lượng nước. Im và các cộng sự 7 đã sử dụng các thuật toán học sâu (LSTM, GRU, SCINet) để dự báo chất lượng nước máy theo chuồi thời gian ở Hàn Quốc. Mô hình học sâu được tối ưu hóa đạt được độ chính xác dự đoán trung bình và tối đa lần lượt là 98,78 và 99,98. Mô hình đề xuất có thể cung cấp thông tin chất lượng nước nhanh chóng và chính xác cho các cơ sở cấp nước quy mỏ lớn trên toàn quốc và cải thiện sức khỏe cộng đồng thông qua chẩn đoán sớm các bất thường về chất lượng nước. 64 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023 ❖ KHOA HỌC CÔNG NGHỆ ❖ Tóm lại, các nghiên cứu trước đây về sử dụng phương pháp học sâu trong dự báo chất lượng nước chủ yếu tập trung vào vào dự báo các thông số chất lượng nước (thông số vật lý là chủ yếu) và tính toán chỉ số chất lượng nước (WQI). Một số nghiên cứu cũng đã kết hợp thuật toán học sâu với mạng lưới quan trắc thời gian thực và cho kết quả rất khả quan. Tuy nhiên, những nghiên cứu trên chủ yếu là trên Thế giới, ở Việt Nam có rất ít nghiên cứu đánh giá tiềm năng của các thuật toán học sâu trong dự báo các thông số chất lượng nước, nhất là về hóa học và vi sinh (BOD5, NH4+, PO43'''' và Coliform) dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục). Do vậy, việc nghiên cứu ứng dụng trí tuệ nhân tạo (mô hình học sâu) để dự báo chỉ số chất lượng nước mặt dựa vào số liệu đo hiện trường của hệ thống Bắc Hưng Hải là quan trọng và cần thiết. Nghiên cứu sẽ góp phần cung cấp thêm phương pháp dự báo các thông số chất lượng nước mặt khoa học, hiệu quả, tốn ít chi phí nhằm thích hợp với điều kiện thực tế của các địa phương trong vùng nghiên cứu. 2. PHƯƠNG PHÁP THỰC HIỆN 2.1. Mục tiêu - Xây dựng được cơ sở khoa học tính toán các thông số chất lượng nước mặt bằng phương pháp học sâu; - Đe xuất được phương pháp tính toán các thông chất lượng nước mặt bằng phương pháp học sâu dựa vào số liệu đo hiện trường. 2.2. Phưong pháp thực hiện Để đạt được các mục tiêu đề ra, các phương pháp nghiên cứu được sử dụng như sau: 2.2.1. Phươngpháp thu thập tài liệu, số liệu Việc thu thập dữ liệu cho nghiên cứu này sẽ chủ yếu tập trung vào việc thu thập dữ liệu chất lượng nước (quan trắc hiện trường) và các thông số chất lượng nước về hóa học và vi sinh (BOD5, NH4+, PO43" và Coliform) của công trình thủy lợi Bắc Hưng Hải từ các báo cáo quan trắc chất lượng nước và dữ liệu từ các nghiên cứu trước đây. Các dữ liệu sẽ được thu thập và phân tích để phục vụ xây dựng mô hình học sâu. Tham vấn các bên liên quan: Các cuộc tham vấn các bên liên quan sẽ được tiến hành để thu thập thêm thông tin về các nguồn gây ô nhiễm và các yếu tố khác có thể ảnh hưởng đến chất lượng nước ở công trình thủy lợi Bắc Hưng Hải. 2.2.2. Phương pháp xử lý số liệu Chuẩn bị và xử lý trước dữ liệu là một bước quan trọng trong nghiên cứu này để đảm bảo dữ liệu, số liệu phù hợp nhằm loại bỏ mọi yếu tố nhiễu hoặc giá trị ngoại lai có thể ảnh hưởng đến độ chính xác của các mô hình. Bao gồm các bước sau đây: - Làm sạch dữ liệu: Dừ liệu được thu thập sẽ được làm sạch để xử lý mọi giá trị bị thiếu hoặc không đồng nhất. - Chuẩn hóa dữ liệu: số liệu sẽ được chuẩn hóa để đảm bảo rằng tất cả các biến (thông số) đều ở cùng một tỷ lệ (không thứ nguyên), điều này rất quan trọng đối với độ chính xác của các thuật toán học sâu. - Chia dữ liệu: Dừ liệu sẽ được chia thành các bộ dữ liệu huấn luyện và bộ dữ liệu thử nghiệm. Tập dữ liệu huấn luyện sẽ được sử dụng đế huấn luyện các thuật toán, trong khi tập dữ liệu thử nghiệm sẽ được sử dụng để đánh giá độ chính xác của kết quả dự báo. 2.2.3. Phương pháp xây dựng mô hình học sâu 2.2.3.1. Lựa chọn thuật toán học sâu Việc lựa chọn các thuật toán học sâu để dự báo các thông số chất lượng nước cho hệ thống thủy lợi Bắc Hưng Hải sẽ dựa trên khả năng nắm bắt các mối quan hệ phi tuyến tính phức tạp trong dữ liệu và xử lý lượng dữ liệu lớn. Một số thuật toán thường được ứng dụng để dự báo như sa...

Trang 1

ỨNG DỤNG MÔ HÌNH HỌC SÂU TRONG Dự BÁO

CHÁT LƯỢNG NƯỚC MẬT HỆ THỐNG THỦY LỢI BẢC HƯNG HẢI

NGUYỄN ĐỨC PHONG, HÀ HẢI DƯƠNG

Viện Nước, tưới tiêu và Môi trường

Tóm tắt: Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở Trung tâm đồng bằng Bắc Bộ thuộc vùng châu thố sông Hồng và là hệ thống lớn nhất miền Bắc Nguồn nước của hệ thống rất quan trọng đối với phát triến kinh tế - xã hội của các địa phương trong vùng nghiên cứu Tuy nhiên, ô nhiễm nguồn nước có xu hướng gia tăng cả về phạm vi và mức độ, các chỉ tiêu COD, NHf, PO43' và Coliform có mức tăng cao hơn so với các chỉ tiêu khác Hàm lượng COD tăng 8,6 lần, NH4 tăng 2,48 lần; PO43' tăng 4,15 lần và Coliform tăng 91,6 lần Hằng năm, chất lượng nước mặt được giám sát (chủ yếu vào vụ Đông — Xuân) để phục vụ đổ ải Phương pháp giám sát chất lượng nước chủ yếu là phương pháp truyền thong tổn nhiều thời gian, công sức và thường cung cấp thông tin hạn chế về chất lượng nước Trong nghiên cứu này sẽ đảnh giả tiềm năng của các thuật toán học sâu trong dự bảo các thông sổ chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải dựa vào các thông số đo hiện trường (nhiệt độ, pH, DO và độ đục) Kết quả nghiên cứu cho thấy các thuật toán học sâu có thê đưa ra các dự báo chính xác và nhanh chóng đối với các thông số BOD5, NH4+, PO43' và COD Các mô hình có độ chính xác cao (từ 75% đến 85%), đồng thời cung cấp các kết quả có ý nghĩa Nghiên cứu cũng đã chứng minh được tiềm năng của các thuật toán học sâu để cải thiện việc dự báo chất lượng nước và nhấn mạnh tầm quan trọng của việc lựa chọn các thuật toán học sâu phù hợp cho các thông số chất lượng nước khác nhau.

Từ khóa: Hệ thống thuỷ lợi Bắc Hưng Hải, mô hình học sâu, mạng nơ-ron hồi quy (RNN), chất lượng nước mặt

Abstract: Bac Hung Hai Irrigation System is located in the center of the Northern Delta in the Red River Delta and is the largest system in the North The water source of the system is very important for the socio-economic development of the localities in the study area However, water pollution tends to increase in both scope and extent, indicators of COD, NH4+, PO43' and Coliform have a higher increase than other indicators COD content increased 8.6 times, NH4 increased 2.48 times; PO43- increased 4.15 times and Coliform increased 91.6 times Every year, surface water quality is monitored (mainly in the Winter-Spring crop) to serve the drainage Water quality monitoring methods are mainly traditional methods that are time consuming and labor intensive and often provide limited information on water quality In this study, we will evaluate the potential

of deep learning algorithms in predicting water quality parameters of Bac Hung Hai irrigation system based on field measurements (temperature, pH, DO and turbidity) Research results show

PO4 and COD The models are highly accurate (from 75% to 85%), and provide meaningful results The study also demonstrated the potential of deep learning algorithms to improve water quality forecasting and highlighted the importance of selecting suitable deep learning algorithms for different water quality parameters.

Keywords: Bac Hung Hai irrigation system, Deep learning model, Recurrent neural network (RNN), Surface water quality

Trang 2

1 ĐẶT VẤN ĐỀ

Hệ thống thuỷ lợi Bắc Hưng Hải nằm ở

Trung tâm đồng bằng Bắc Bộ thuộc vùng châu

thổ sông Hồng và là hệ thống lớn nhất miền

Bắc Ranh giới hệ thống được bao bọc bởi 4

sông lớn: phía Bắc là sông Đuống dài 67 km từ

Xuân Canh đến Phả Lại; phía Nam là sông Luộc

dài 72 km từ Hà Lão đến Quý Cao; phía Tây là

sông Hồng dài 57 km từ Xuân Quan đến Hà

Lão; phía Đông là sông Thái Bình dài 73 km từ

Phả Lại đến Quý Cao [3]

Bắc Hưng Hải có hệ thống sông nội địa khá

dày đặc, chúng nối thông với nhau tạo thành

mạng lưới dẫn và tiêu nước khá thuận lợi Có 2

sông chính là Sông Kim Son (phía Bắc) chạy từ

Xuân Quan đến thành phố Hải Dưong (60 km),

đây là tuyến tải nước chính của hệ thống Bắc

Hưng Hải lấy từ sông Hồng qua cống Xuân

Quan để cấp nước cho cả vùng Sông Cửu An là trục chính phía Nam chạy từ Nghi Xuyên đến

Cự Lộc dài 50 km Hệ thống sông nội địa có thế dốc lòng sông và hướng chuyển nước đều theo hướng Tây Bắc xuống Đông Nam Vì vậy nước ngọt lấy từ sông Hồng qua cổng Xuân Quan vào sông Kim Son đã có điều kiện thuận lợi dẫn nước cho toàn khu vực Hướng tiêu thoát nước chính tập trung vào 2 cửa cầu Xe và An Thổ

Do địa hình thấp nên thuỷ triều từ sông Thái Bình, sông Luộc đều có ảnh hưởng mạnh và khá sâu đến các sông trong nội địa Nhờ xây dựng 2 công trình ở 2 cửa sông này (Cầu Xe - An Thổ)

đã phát huy cao tác dụng chuyển - giữ nước phục vụ cho tưới và ngăn triều, tăng khả năng tiêu thoát nước trong mùa mưa của hệ thống sông nội địa cho toàn khu vực Bắc Hưng Hải [3], [6].'

Hình 1.1: Vị trí địa lý hệ thống thủy lợi Bắc Hưng Hải

Chất lượng nước trong HTTL Bắc Hưng Hải

được quan trắc từ năm 2005 đến nay với tần suất

quan trắc từ 2-6 lần trong năm, bổ trí vào các thời

gian cung cấp nước tưới cho vụ xuân (tháng 2-5)

và thời gian cấp nước tưới trong vụ mùa (tháng

7-9) Trong những năm trở lại đây, có ứng dụng

mô hình toán chất lượng nước để mô phỏng 3 thông số DO, BODs và NH/ nhưng độ chính xác còn hạn chế do số liệu đầu vào chưa đầy đủ, nhất

là số liệu về lưu lượng nguồn thải (khó điều tra)

Trang 3

Kết quả đã đánh giá được mức độ gia tăng ô

nhiễm, các chỉ tiêu ô nhiễm và nguyên nhân gây

ô nhiễm làm cơ sở đề xuất các giải pháp giảm

thiểu ô nhiễm và giảm thiểu tác hại của ô nhiễm

nước đến SXNN và NTTS [3],

Có thể thấy phương pháp giám sát chất lượng

nước trong HTTL Bắc Hưng Hải là phương

pháp truyền thống (thu thập các mẫu nước, sau

đó được phân tích trong phòng thí nghiệm bằng

các xét nghiệm hóa học và sinh học khác nhau)

với các thông số lý, hóa, vi sinh Các phương

pháp này thường tốn nhiều thời gian, công sức

và có thể tổn kém, đặc biệt khi một số lượng lớn

mẫu nước được thu thập từ các địa điểm khác

nhau Ngoài ra, phương pháp này chỉ có thể

cung cấp số liệu chất lượng nước tại các thời

điểm nhất thời, gây khó khăn cho việc đánh giá

những thay đổi theo thời gian và không gian

Trong những năm gần đây, trên Thế giới, trí

tuệ nhân tạo (AI) ngày càng được ứng dụng

nhiều trong dự báo chất lượng nước nhờ khả

năng xử lý lượng lớn dữ liệu và đưa ra dự đoán

chính xác Các thuật toán AI, chẳng hạn như

học máy và học sâu, đã được áp dụng để dự báo

các thông số chất lượng nước, bao gồm pH, DO,

BOD5, COD cũng như để phát hiện các bất

thường về chất lượng nước và dự đoán xu

hướng chất lượng nước Các thuật toán học sâu

có thể xử lý các mối quan hệ phi tuyến tính giữa

các thông số chất lượng nước, cũng như xử lý

dữ liệu bị thiếu và xử lý dữ liệu nhiều chiều một

cách hiệu quả Ngoài ra, các thuật toán AI có thể

học hỏi từ dữ liệu trong thời gian thực và liên

tục cải thiện các dự đoán của chúng khi có dữ

liệu mới Điều này cho phép các hệ thống giám

sát chất lượng nước dựa trên AI thích ứng với

những thay đổi về điều kiện chất lượng nước

theo thời gian và đưa ra các dự đoán chính xác

và đáng tin cậy hơn

Có một số loại thuật toán học sâu có thể được

sử dụng để giám sát chất lượng nước, bao gồm

mạng nơ-ron nhân tạo (ANN), mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy (RNN) Mỗi loại thuật toán học sâu đều có điểm mạnh

và điểm yếu riêng và việc lựa chọn thuật toán sẽ phụ thuộc vào ứng dụng giám sát chất lượng nước cụ thể

Trong những năm gần đây, việc ứng dụng các thuật toán mạng lưới nơ-ron nhân tạo (ANN) để dự báo chất lượng nước đã có những kết quả nổi bật Các mô hình ANN có khả năng giải quyết các vấn đề mô hình hóa khác nhau ở sông, hồ, hồ chứa, nhà máy xử lý nước thải (WWTP) [2], Đã có một số nghiên cứu sử dụng mô hình học sâu để dự báo chất lượng nước, chủ yếu tập trung vào dự báo các thông số chất lượng nước (pH, nhiệt độ, DO, COD ) và tính toán chỉ số chất lượng nước (WQI)

về dự báo các thông số chất lượng nước như DO, nhiệt độ, pH và độ mặn, Hu và các cộng sự [5] đã dự báo chất lượng nước mới dựa trên mạng học sâu bộ nhớ ngắn - dài hạn (LSTM) được đề xuất để dự báo pH và nhiệt

độ Kết quả cho thấy, độ chính xác đạt của mô hình rất cao lần lượt là 95,76% và 96,88% Haq [9] sử dụng các mô hình (lai) học sâu như mạng thuật toán mạng nơ-ron tích chập (CNN), LSTM và đơn vị tái phát có kiểm soát (GRU) để dự báo Kết quả cho thấy mô hình (lai) CNN-LSTM vượt trội so với tất cả các

mô hình khác về độ chính xác dự đoán và thời gian tính toán Một kiến trúc với mô hình dự báo cho các hệ thống loT để giám sát chất lượng nước trong nuôi trồng thủy sản được thực hiện bằng cách sử dụng thuật toán học sâu (LSTM) để dự báo các chỉ sổ trên cho thấy hoạt động tốt và có thể áp dụng cho các

hệ thống thực tế Đối với dự báo tổng nitơ (TN), tổng phốt pho (TP) và chỉ số kali permanganat (COD-Mn), nghiên cứu của Yan [10] đã sử dụng mô hình mạng lưới nơ-ron kết họp 1-DRCNN và BiGRU để dự báo Kết quả

Trang 4

thực nghiệm cho thấy mô hình đề xuất có độ

chính xác dự đoán và tính tổng quát cao hơn

so với các mô hình LSTM, GRU và BiGRU

(hệ số xác định (R2) có thể đạt tới 0,9431)

Các thuật toán trí tuệ nhân tạo (AI) cũng

được phát triển để dự báo chỉ số chất lượng

nước (WQI) và phân loại chất lượng nước

(WQC) Để dự báo WQI, các mô hình mạng nơ-

ron nhân tạo như mạng nơ-ron tự hồi quy phi

tuyến tính (NARNET) và thuật toán học sâu bộ

nhớ ngắn - dài hạn (LSTM) đã được ứng dụng

dựa trên 7 thông số đầu vào Ket quả dự báo cho

thấy mô hình NARNET hoạt động tốt hơn so

với LSTM để dự báo các giá trị WQI [1]

Trong quá trình xây dựng và vận hành các hệ

thống quan trắc chất lượng nước thông minh

trên nền tảng Internet vạn vật (loT), ngày càng

nhiều dữ liệu lớn được tạo ra Nhằm tận dụng

hiệu suất tốt của mạng lưới nơ-ron sâu bộ nhớ

ngắn - dài hạn (LSTM) trong dự đoán chuỗi thời

gian, mô hình chất lượng nước uống đã được

thiết kế và thiết lập để dự đoán dừ liệu lớn về

chất lượng nước với sự trợ giúp của công nghệ

học sâu nâng cao Kết quả nghiên cứu cho thấy

giá trị dự báo của mô hình và giá trị thực tế rất

phù hợp và cho thấy chính xác xu hướng phát

triển chất lượng nước trong tương lai, cho thấy

tính khả thi và hiệu quả của việc sử dụng mạng

lưới nơ-ron sâu LSTM để dự báo chất lượng của

nước uống [8]

Đối với khu vực số liệu đo đạc còn hạn chế,

thiếu số liệu, thuật toán học sâu đã được ứng

dụng để dự báo các thông số chất lượng nước

(thời gian thực) Một mạng lưới nơ-ron nhân tạo

học sâu (ANN) cộng với một kỹ thuật xử lý hậu

kỳ được gọi là Bộ xử lý Bayesian đa biến bất

định (MBUP) được ứng dụng để dự báo Kết

quả cho thấy đã cải thiện đáng kể độ chính xác

của các dự báo chất lượng nước [12] Việc dự

báo chất lượng nước dựa trên thuật toán Phân

tích quan hệ xám cải tiến (IGRA) và mạng lưới

nơ-ron Bộ nhớ ngắn - dài hạn (LSTM) [11] Trong đó, xem xét mối tương quan đa biến của thông số chất lượng nước, IGRA, xét về mức độ tương đồng và gần gũi, được đề xuất đế lựa chọn thông số đặc trưng Bên cạnh đó cũng xem xét trình tự thời gian của thông tin chất lượng nước, mô hình dự báo chất lượng nước dựa trên LSTM, có đầu vào là các tính năng thu được từ IGRA, được thiết lập Kết quả cho thấy phương pháp được đề xuất có thể tận dụng tối đa các mối tương quan đa biến và chuồi thời gian của thông tin chất lượng nước để đạt được hiệu quả

dự đoán chất lượng nước tốt hơn so với các phương pháp dự đoán tính năng đơn lẻ hoặc không theo trình tự Để cảnh báo cho người dùng trước khi nguồn nước bị ô nhiễm (Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ thông số nào vượt tiêu chuẩn cho phép), một giải pháp dựa trên loT để dự báo chất lượng nước [4], Hệ thống được đề xuất sử dụng loT và mạng lưới nơ-ron được tối ưu hóa để dự đoán Thuật toán mạng nơ-ron dựa trên tối ưu hóa bầy đàn Cat (CSO) được sử dụng để dự báo Hệ thống được đề xuất sẽ cảnh báo người dùng khi bất kỳ tham số đo được nào nhỏ hơn ngường cố định Kỹ thuật này cũng có thể được thực hiện trong các nhà máy nước, sông và các ngành công nghiệp

Các thuật toán học sâu đã cải thiện đáng kể

độ chính xác và hiệu quả của dự báo chất lượng nước Im và các cộng sự [7] đã sử dụng các thuật toán học sâu (LSTM, GRU, SCINet) để dự báo chất lượng nước máy theo chuồi thời gian ở Hàn Quốc Mô hình học sâu được tối ưu hóa đạt được độ chính xác dự đoán trung bình và tối đa lần lượt là 98,78 và 99,98% Mô hình đề xuất có thể cung cấp thông tin chất lượng nước nhanh chóng và chính xác cho các cơ sở cấp nước quy

mỏ lớn trên toàn quốc và cải thiện sức khỏe cộng đồng thông qua chẩn đoán sớm các bất thường về chất lượng nước

Trang 5

Tóm lại, các nghiên cứu trước đây về sử

dụng phương pháp học sâu trong dự báo chất

lượng nước chủ yếu tập trung vào vào dự báo

các thông số chất lượng nước (thông số vật lý là

chủ yếu) và tính toán chỉ số chất lượng nước

(WQI) Một số nghiên cứu cũng đã kết hợp

thuật toán học sâu với mạng lưới quan trắc thời

gian thực và cho kết quả rất khả quan Tuy

nhiên, những nghiên cứu trên chủ yếu là trên

Thế giới, ở Việt Nam có rất ít nghiên cứu đánh

giá tiềm năng của các thuật toán học sâu trong

dự báo các thông số chất lượng nước, nhất là về

hóa học và vi sinh (BOD5, NH4+, PO43' và

Coliform) dựa vào các thông số đo hiện trường

(nhiệt độ, pH, DO và độ đục)

Do vậy, việc nghiên cứu ứng dụng trí tuệ

nhân tạo (mô hình học sâu) để dự báo chỉ số

chất lượng nước mặt dựa vào số liệu đo hiện

trường của hệ thống Bắc Hưng Hải là quan

trọng và cần thiết Nghiên cứu sẽ góp phần cung

cấp thêm phương pháp dự báo các thông số chất

lượng nước mặt khoa học, hiệu quả, tốn ít chi

phí nhằm thích hợp với điều kiện thực tế của các

địa phương trong vùng nghiên cứu

2 PHƯƠNG PHÁP THỰC HIỆN

2.1 Mục tiêu

- Xây dựng được cơ sở khoa học tính toán

các thông số chất lượng nước mặt bằng phương

pháp học sâu;

- Đe xuất được phương pháp tính toán các

thông chất lượng nước mặt bằng phương pháp

học sâu dựa vào số liệu đo hiện trường

2.2 Phưong pháp thực hiện

Để đạt được các mục tiêu đề ra, các phương

pháp nghiên cứu được sử dụng như sau:

2.2.1 Phươngpháp thu thập tài liệu, số liệu

Việc thu thập dữ liệu cho nghiên cứu này sẽ

chủ yếu tập trung vào việc thu thập dữ liệu chất

lượng nước (quan trắc hiện trường) và các thông

số chất lượng nước về hóa học và vi sinh

(BOD5, NH4+, PO43" và Coliform) của công

trình thủy lợi Bắc Hưng Hải từ các báo cáo quan trắc chất lượng nước và dữ liệu từ các nghiên cứu trước đây Các dữ liệu sẽ được thu thập và phân tích để phục vụ xây dựng mô hình học sâu

Tham vấn các bên liên quan: Các cuộc tham vấn các bên liên quan sẽ được tiến hành để thu thập thêm thông tin về các nguồn gây ô nhiễm

và các yếu tố khác có thể ảnh hưởng đến chất lượng nước ở công trình thủy lợi Bắc Hưng Hải

2.2.2. Phương pháp xử lý số liệu

Chuẩn bị và xử lý trước dữ liệu là một bước quan trọng trong nghiên cứu này để đảm bảo dữ liệu, số liệu phù hợp nhằm loại bỏ mọi yếu tố nhiễu hoặc giá trị ngoại lai có thể ảnh hưởng đến độ chính xác của các mô hình Bao gồm các bước sau đây:

- Làm sạch dữ liệu: Dừ liệu được thu thập sẽ được làm sạch để xử lý mọi giá trị bị thiếu hoặc không đồng nhất

- Chuẩn hóa dữ liệu: số liệu sẽ được chuẩn hóa để đảm bảo rằng tất cả các biến (thông số) đều ở cùng một tỷ lệ (không thứ nguyên), điều này rất quan trọng đối với độ chính xác của các thuật toán học sâu

- Chia dữ liệu: Dừ liệu sẽ được chia thành các bộ dữ liệu huấn luyện và bộ dữ liệu thử nghiệm Tập dữ liệu huấn luyện sẽ được sử dụng đế huấn luyện các thuật toán, trong khi tập

dữ liệu thử nghiệm sẽ được sử dụng để đánh giá

độ chính xác của kết quả dự báo

2.2.3 Phương pháp xây dựnghình học sâu

2.2.3.1 Lựa chọn thuật toán học sâu

Việc lựa chọn các thuật toán học sâu để dự báo các thông số chất lượng nước cho hệ thống thủy lợi Bắc Hưng Hải sẽ dựa trên khả năng nắm bắt các mối quan hệ phi tuyến tính phức tạp trong dữ liệu và xử lý lượng dữ liệu lớn Một số thuật toán thường được ứng dụng

để dự báo như sau:

Trang 6

- Mạng nơ-ron nhân tạo (ANN): là một loại

thuật toán học sâu thường được sử dụng cho các

nhiệm vụ dự báo ANN bao gồm nhiều lớp nút

được kết nối với nhau và được đào tạo bằng

cách sử dụng lan truyền ngược

- Mạng nơ-ron tích chập (CNN): là một loại

thuật toán học sâu thường được sử dụng để

nhận dạng và xử lý hình ảnh CNN rất phù

hợp với dữ liệu chuỗi thời gian và đã được

chứng minh là hoạt động tốt để theo dõi chất

lượng nước

- Mạng nơ-ron hồi quy (RNNs): RNNs là

một loại thuật toán học sâu rất phù hợp với dữ

liệu liên tục và đa biến RNN được thiết kế để

xử lý dữ liệu tuần tự và đã được chứng minh là

hoạt động tốt để dự báo chất lượng nước

- Mạng bộ nhớ ngắn - dài hạn (LSTM):

Mạng LSTM là một loại RNN được thiết kế để

xử lý các chuỗi dữ liệu theo thời gian LSTM đã

được chứng minh là rất hiệu quả trong việc dự

báo chất lượng nước thời gian thực

Qua phân tích ở trên, thấy rằng Mạng nơ-ron

hồi quy (RNNs) phù hợp với nghiên cứu này

Do vậy nghiên cứu sẽ sử dụng thuật toán này để

xây dựng mô hình dự báo các thông số chất

lượng nước về hữu cơ (BOD5, NH/, PO43’ và

COD) của công trình thủy lợi Bắc Hưng Hải

2.2.3.2 Cơ sở lý thuyết mạng nơ-ron hồi quy

(RNN)

Mạng RNN như là một mạng nơ-ron (Neural

Network) xử lý thông tin ở dạng chuỗi

(sequence/time-series) với việc tiền xử lý các

data theo thứ tự RNN được gọi là hồi quy

(Recurrent) bởi lẽ chúng thực hiện cùng một tác

vụ cho tất cả các phần tử của một chuồi với đầu

ra phụ thuộc vào cả các phép tính trước đó Nói

cách khác, RNN có khả năng nhớ các thông tin

được tính toán trước đó RNN hoạt động theo

nguyên tắc lưu đầu ra của một lớp cụ thể và đưa

dữ liệu này trở lại đầu vào để dự đoán đầu ra

của lớp

Recurrent Neural Network

Hình 2.1: Sơ đồ chuyển đổi mạng nơ-ron lan truyền thang thành mạng nơ-ron hồi quy

Theo Hình 2.1, các nút trong các lóp khác nhau của mạng nơ-ron được nén để tạo thành một lớp mạng nơ-ron hồi quy A, B, c là các tham số của mạng Trogn đó, “x” là lớp đầu vào, “h” là lóp ẩn và “y” là lớp đầu ra A, B và

c là các tham số mạng được sử dụng để cải thiện đầu ra của mô hình Tại bất kỳ thời điểm t nào, đầu vào hiện tại là sự kết họp của đầu vào tại x(t) và x(t-l) Đầu ra tại bất kỳ thời điểm nào được tìm nạp trở lại mạng để cải thiện đầu ra

Hình 2.2: Sơ đồ mạng nơ-ron hồi quy (RNN)

được kết nổi đầy đủ

Trong các mạng nơ-ron hồi quy, thông tin tuần hoàn qua một vòng lặp đến lóp ẩn ở giữa Lóp đầu vào 'x' nhận đầu vào của mạng nơ-ron

và xử lý nó rồi chuyển nó lên lóp giữa Lóp giữa 'h' có thể bao gồm nhiều lóp ẩn, mồi lóp có các chức năng kích hoạt và trọng số cũng như độ lệch riêng Neu có một mạng nơ-ron trong đó các tham số khác nhau của các lớp ẩn khác nhau không bị ảnh hưởng bởi lớp trước đó, tức là:

66 TẠP CHÍ TÀI NGUYÊN NƯỚC SỐ 1-2023

Trang 7

mạng nơ-ron không có bộ nhớ, thì có thể sử

dụng mạng nơ-ron hồi quy Mạng nơ-ron hồi

quy sẽ chuẩn hóa các chức năng kích hoạt khác

nhau, trọng số và độ lệch để mồi lớp ẩn có cùng

tham số Sau đó, thay vì tạo nhiều lớp ẩn, nó sẽ

tạo một lớp và lặp lại nhiều lần theo yêu cầu

Hình 2.3: Sơ đồ hoạt động của mạng nơ-ron hồi quy

Có 4 loại mạng nơ-ron hồi quy: 1 đầu vào

cho kết quả 1 đầu ra; 1 đầu vào - nhiều đầu ra;

nhiều đầu vào - 1 đầu ra; và nhiều đầu vào -

nhiều đầu ra Trong nghiên cứu này ứng dụng

loại mạng RNN với nhiều đầu vào - 1 đầu ra

2.2.3.3 Đào tạo và kiếm định mô hình

Quá trình đào tạo là sử dụng tập dữ liệu đào

tạo sẽ được sử dụng để đào tạo các thuật toán

nhận dạng các thông số và mối quan hệ của

chúng trong tập dữ liệu Quá trình kiểm định

bao gồm sử dụng bộ dữ liệu kiểm tra để đánh

giá độ chính xác của thuật toán

Các bước sau đây sẽ được thực hiện để đào

tạo và kiểm định mô hình:

- Đào tạo mô hình: thuật toán học sâu (RNN)

sẽ được đào tạo bằng tập dữ liệu đào tạo, đồng

thời để giảm thiểu sai số dự đoán giữa thông số

chất lượng nước thực tế và thông số chất lượng

nước dự đoán

- Điều chỉnh siêu tham số: các tham số của

thuật toán học sâu sẽ được điều chỉnh để cải

thiện hơn nữa độ chính xác

- Kiểm định mô hình: được xác thực bằng bộ

dữ liệu kiểm tra

- Lựa chọn mô hình: Thuật toán hoạt động tốt

nhất (theo các tham số đã hiệu chỉnh) sẽ được

chọn dựa trên kết quả hiệu chỉnh Thuật toán này sẽ được sử dụng cho mô hình dự báo các thông số chất lượng nước của hệ thống thủy lợi Bắc Hưng Hải Ngôn ngữ sử dụng để viết mã là

R với các gói Keras, đây là API mạng nơ-ron cấp cao, chạy trên TensorFlow Nó được phát triển với trọng tâm là cho phép thiết kế dễ dàng

và nhanh chóng các mô hình học sâu phức tạp, cũng như giúp đào tạo chúng dễ dàng hơn Keras cung cấp các phương pháp thuận tiện để tải và chuẩn bị dừ liệu, cũng như các công cụ để trực quan hóa và giải thích kết quả đào tạo

2.2.3.4 Đánh giá độ chỉnh xác của mô hình

Các chỉ số đánh giá độ chính xác của mô hình sau đây sẽ được sử dụng để đánh giá mô hình học sâu trong việc dự báo các thông số chất lượng nước ở thủy lợi Bắc Hưng Hải Các tiêu chí đánh giá (hiệu chỉnh) các mô hình học sâu được trình bày trong các công thức (1) đến (4):

- Sai số tuyệt đối trung bình (MAE): chênh lệch trung bình giữa giá trị thực và giá trị dự đoán MAE là 1 chỉ số phổ biến để tính sai số nhằm đánh giá (kiểm định) mô hình đối với các biến liên tục, được xác định theo công thức (1) Trong đó, Pi là giá trị dự báo và Mi là giá trị thực đo Giá trị MAE càng thấp thì kết quả tính toán càng chính xác

1 ",

MAE = - Y |Pi - Àfi| (!)

- Sai số toàn phương trung bình (MSE) của một phép ước lượng là trung bình của bình phương các sai số, tức là sự khác biệt giữa các giá trị dự đoán và giá trị thực đo và được tính toán theo theo công thức (2) Giá trị MSE càng thấp thì kết quả tính toán càng chính xác

MSE = è Ẻ< Y' - *)! (2)

71 Í=1

- RMSE là căn bậc hai của trung bình của các sai số bình phương RMSE là thước đo mức độ dàn trải của những phần dư này, nói cách khác,

Trang 8

nó cho bạn biết mức độ tập trung của dữ liệu

xung quanh đường phù hợp nhất RMSE là độ

lệch chuẩn của các phần dư (sai số dự đoán) và

được tính toán theo theo công thức (3) Giá trị

RMSE càng thấp thì kết quả tính toán càng

chính xác

- Hệ số xác định (R2): phản ánh phần trăm

phương sai của y có thể giải thích bởi mô hình

được xác định theo theo công thức (4) Trong

đó, ESS là tổng các độ lệch bình phương của

phần dư; TSS là tổng các độ lệch bình phương

Giá trị R2 dao động từ 0 đến 1, giá trị R2 càng

gần 1 thì kết quả tính toán càng chính xác

R2 = 1 - (ESS/TSS) (4)

3 KẾT QUẢ VÀ THẢO LUẬN 3.1 Kết quả thu thập số liệu quan trắc chất lượng nước mặt

Số liệu quan trắc chất lượng nước mặt năm 2021-2022 tại các vị trí lấy mẫu vùng nghiên cứu được tổng họp trong Bảng 3.1 và các biểu

đồ một số thông số chất lượng nước chính từ Hình 3.1 - Hình 3.6

Có thể thấy nước mặt vùng nghiên cứu chủ yếu bị ô nhiễm hữu cơ, chất dinh dưỡng, vi sinh vật nhất là tại các vị trí Xuân Thụy, Ngọc Đà, Binh Lâu Các thông số vượt nhiều lần TCCP là

DO, BOD5, COD, NH4 và tổng Coliform (đây cũng là những thông số ô nhiễm điển hình của vùng nghiên cứu)

Bảng 3.1: Tổng hợp các giá trị đặc trưng các chất lượng nước mặt hệ thống Bắc Hưng Hải

(N=108) (N=75) (N=183) Nhiệt độ Trung bình (SD) 26.0 (3.63) 20.1 (4.25) 23.6 (4.85)

Trung vị [Min, Max] 25.6 [19.6,33.4] 21.1 [12.6,26.5] 24.5 [12.6, 33.4]

pH Trung bình (SD) 7.41 (0.397) 7.34 (0.264) 7.38 (0.350)

Trung vị [Min, Max] 7.33 [6.78, 8.68] 7.37 [6.77, 7.94] 7.34 [6.77, 8.68]

DO Trung bình (SD) 2.64(1.24) 3.21 (1.32) 2.87 (1.30)

Trung vị [Min, Max] 2.45 [0.800, 6.10] 3.40 [0.820, 6.40] 2.90 [0.800, 6.40] bod5 Trung bình (SD) 22.4 (12.6) 30.5 (24.1) 25.7(18.6)

Trung vị [Min, Max] 20.8 [4.10, 69.7] 23.8 [4.60, 183] 22.5 [4.10, 183]

COD Trung bình (SD) 58.1 (32.6) 69.4 (57.5) 62.7 (44.7)

Trung vị [Min, Max] 55.3 [9.50, 176] 55.5 [10.3,451] 55.4 [9.50, 451]

NH4 Trung bình (SD) 7.65 (7.83) 7.72 (6.92) 7.68 (7.45)

Trung vị [Min, Max] 5.32 [0.450,41.7] 6.16 [0.110, 35.3] 5.82 [0.110,41.7] NO2 Trung bình (SD) 0.0529 (0.0974) 0.0237(0.0167) 0.0409 (0.0768)

Trung vị [Min, Max]

0.0200 [0.0100, 0.800]

0.0200 [0.0100, 0.0800] 0.0200 [0.0100, 0.800]

PO4 Trung bình (SD) 0.911 (1.04) 0.783 (1.04) 0.859(1.04)

Trung vị [Min, Max] 0.420 [0.0100, 3.90] 0.300 [0.0100, 4.40] 0.360 [0.0100, 4.40] Coliform Trung bình (SD) 1050000 (3660000) 1080000 (3600000) 1060000 (3630000)

Trung vị [Min, Max]

43000 [610, 16000000]

29000 [1400, 16000000]

39000 [610, 16000000]

68 TẠP CHÍ TÀI NGUYÊN NƯỚC số 1 -2023

Trang 9

Hình 3.1: Biếu đồ biểu diễn nhiệt độ theo các

• An Tho • Binh Lau • Cong Neo ạ Ngoc Da • Phan Ha

• Bang Ngang * Cau Xe • Luc Dien Nhu Quynh • Xuan Thuy

Hình 3.2: Biếu đồ biểu diễn pH theo các vị trí

• An Tho • Binh Lau ỊỊ Cong Neo • Ngoc Da * Phan Ha

• Bang Ngang • Cau Xe ® Luc Dien • Nhu Quynh * Xuan Thuy

1

J I ,

Hình 3.4: Biêu đô hàm lượng BODỊ theo các Hình 3.3: Biểu đồ hàm lượng DO theo các

Hình 3.5: Biếu đồ hàm lượng NHf theo các

vị trí quan trắc của hệ thong BHH

3.2 Phân tích tương quan các thông số

phục vụ xây dựng mô hình học sâu

Theo kết quả phân tích tương quan giữa các

thông số chất lượng nước mặt cho thấy COD và

Hình 3.6: Biếu đồ Coliform theo các vị trí quan trắc của hệ thống BHH

BOD5 có tương quan với nhau cao nhất (0,98); tiếp đến tương quan giữa NH/ với PO43‘ là 0,64; tương quan giữa NHT với DO là 0,62; tương quan giữa DO với PO43 là 0,52 (Hình 3.7) Như vậy

Trang 10

mối tương quan giữa các thông số đầu vào (nhiệt

độ, pH, DO) với các thông số dự báo là phi tuyến,

đây cũng là cơ sở để chọn thuật toán học sâu (RNN) để dự báo các thông số chất lượng nước

15 25 1 3 5 0 200 400 0.0 0.4 0.8 0.0e+00 1.5e+07

Hình 3.7: Biểu đồ tương quan của các thông sổ chất lượng nước

3.3 Nghiên cứu tính toán các thông số

chất lượng nước mặt bằng phưong pháp học

sâu cho hệ thống thủy lợi Bắc Hưng Hải

3.3.1. Ket quả đánh gùi các mô hình học sâu

Căn cứ vào kết quả lựa chọn các thông số

phục vụ xây dựng mô hình học sâu (Nhiệt độ,

pH và DO) Nghiên cứu đã xây dựng mô hình học sâu từ các thông số trên để dự báo các thông

số BODs, NH/, PO43' và COD Kết quả dự báo

và các biểu đồ so sánh giữa giá trị dự báo và thực đo đối với tập số liệu thử nghiệm được trình bày trong Hình 3.8

Hình 3.8: Biểu đồ so sánh giữa giá trị dự báo

và thực đo của thông số BODs

- j

Hình 3.9: Biểu đồ so sảnh giữa giá trị dự báo

và thực đo của thông số COD

Ngày đăng: 16/03/2024, 22:24

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN