Mục tiêu của bài viết này là giới thiệu một cách tiếp cận hiệu quả dựa trên mô hình mạng nơ-ron hồi quy để xây dựng lại dữ liệu dòng chảy hàng ngày bị thiếu. Trạm thủy văn Lai Châu được chọn làm trạm mục tiêu cho nghiên cứu điển hình bởi đây là trạm thủy văn nằm ở thượng lưu của lưu vực sông Đà. Kết quả nghiên cứu thể hiện hiệu suất cao của mô hình mạng nơ-ron hồi quy.
BÀI BÁO KHOA HỌC ỨNG DỤNG MẠNG NƠ-RON HỒI QUY ĐỂ XÂY DỰNG LẠI DỮ LIỆU DÒNG CHẢY NGÀY BỊ THIẾU Lê Xn Hiền1 Tóm tắt: Lưu lượng sơng liệu quan trọng thủy văn liệu sử dụng cho phân tích liên quan tới quản lý tài nguyên nước dự báo dòng chảy lũ Việc thiếu liệu dòng chảy dẫn tới phân tích khoa học khơng đầy đủ Để có thơng tin đáng tin cậy xác liệu bị thiếu phải lấp đầy Mục tiêu báo giới thiệu cách tiệp cận hiệu dựa mô hình mạng nơ-ron hồi quy để xây dựng lại liệu dòng chảy hàng ngày bị thiếu Trạm thủy văn Lai Châu chọn làm trạm mục tiêu cho nghiên cứu điển hình trạm thủy văn nằm thượng lưu lưu vực sông Đà Kết nghiên cứu thể hiệu suất cao mơ hình mạng nơ-ron hồi quy Với kết này, mơ hình hồn tồn áp dụng cho trạm thủy văn thượng nguồn nơi mà thiếu liệu dòng chảy Từ khóa: GRU, RNN, liệu dòng chảy bị thiếu, khơi phục liệu MỞ ĐẦU* Trong thủy văn, bên cạnh liệu lượng mưa độ ẩm đất, liệu dòng chảy lưu vực sơng đóng vai trò quan trọng Các liệu sử dụng cho công tác quản lý vận hành tài nguyên nước, dự báo dòng chảy phân tích liên quan tới biến đổi khí hậu Một đặc điểm chung với toán yêu cầu chuỗi liệu đáng tin cậy theo thời gian Các chuỗi liệu dài liên tục cho phép nhà khoa học đưa phân tích xác tiến trình thủy văn đầu nguồn Tuy nhiên, việc thu thập liệu thủy văn liên tục thời gian dài vấn đề khó khăn đơi liệu bị thiếu trình lưu trữ, bảo trì thiết bị thiết bị đo bị hỏng kiện lũ Đối với trạm thủy văn khu vực miền núi cao nước phát triển, việc thu thập đầy đủ chuỗi liệu dòng chảy trở nên khó khăn Việc thiếu liệu dòng chảy khoảng thời gian dẫn tới phân tích khoa học khơng đầy đủ Do đó, để có thơng tin đáng tin cậy xác từ liệu, khoảng trống liệu nên lấp đầy Bài tốn ước tính liệu dòng chảy bị thiếu theo thời gian toán nghiên cứu từ nhiều thập kỷ trước nay, toán thách thức đáng kể với nhà khoa học Một số giải pháp thực để xây dựng lại liệu bị thiếu Có thể kể đến như, cách tiếp cận dựa phân tích hồi quy (Tencaliec et al 2015; Woodhouse et al 2006) hay cách tiếp cận dựa mạng nơ-ron nhân tạo (Ben Aissia et al 2017; Gao and Wang 2017; Sivapragasam et al 2015) Cùng với đó, Harvey et al (2012) rằng, việc sử dụng mơ hình với nhiều biến đầu vào đưa kết có độ xác cao so với việc sử dụng mơ hình hồi quy đơn giản Tuy nhiên, hầu hết nghiên cứu xây dựng lại liệu dòng chảy bị thiếu đề cập tới trên, liệu ước tính liệu dòng chảy hạ lưu Điều có nghĩa nghiên cứu trước sử dụng liệu thượng nguồn liệu đầu vào để ước tính cho liệu dòng chảy bị thiếu hạ lưu Trong báo này, mơ hình mạng nơ-ron hồi quy (RNN - recurrent neural network) dựa mạng nơ-ron nhân tạo (ANN- artificial neural network) xây dựng với mục đích ước tính Khoa Kỹ thuật Tài nguyên nước, Trường Đại học Thủy lợi KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) 63 liệu dòng chảy bị thiếu Mơ hình RNN áp dụng nghiên cứu để ước tính liệu dòng chảy bị thiếu trạm thủy văn thượng nguồn lưu vực sông Đây yếu tố quan trọng khiến cho nghiên cứu khác biệt so với nghiên cứu trước Với mục đích đánh giá khả mơ hình RNN tốn xây dựng lại liệu dòng chảy bị thiếu, trạm thủy văn Lai Châu nằm thượng nguồn lưu vực sông Đà chọn làm nghiên cứu điển hình Kết nghiên cứu áp dụng để xây dựng lại liệu dòng chảy bị thiếu trạm thủy văn đầu nguồn khác trạm Lào Cai hay trạm Bảo Yên, tỉnh Lào Cai, Việt Nam PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Mơ hình Gated Recurrent Unit (GRU) Trong báo này, mô hình mạng nơ-ron GRU áp dụng để xây dựng mơ hình khơi phục liệu dòng chảy trạm Lai Châu Mạng GRU dạng đặc biệt mạng nơ-ron hồi quy, đề xuất Cho et al (2014) để giải vấn đề biến đạo hàm toán chuỗi thời gian GRU với LSTM (Long Short-Term Memory) kiến trúc mạng sử dụng rộng rãi nghiên cứu toán liệu chuỗi thời gian Về bản, ý tưởng cốt lõi RNN sử dụng ô nhớ để lưu trữ thông tin cần thiết từ bước xử lý trước để đưa dự báo xác cho bước Cấu trúc ô nhớ RNN với kiến trúc GRU thể Hình Hình Cấu trúc ô nhớ GRU (GRU cell) mơ hình Theo Chung et al (2014), kiến trúc GRU khơng có nhớ tách biệt LSTM Thay có ba lớp cổng kiến trúc LSTM, GRU có hai lớp cổng, cổng đặt lại (reset gate - rt) cổng cập nhật (update gate – zt) Trong cổng đặt lại (rt) xác định lượng thông tin cần bỏ qua từ nhớ trước cổng cập nhật (zt) định thông tin từ nhớ trước truyền qua Chính vậy, kiến trúc mạng đào tạo để giữ lượng thơng tin từ bước trước mà không cần loại bỏ thông tin không liên quan tới việc dự báo Ở bước cuối kiến trúc mạng, đầu ô nhớ GRU hay trạng thái ẩn (hidden state – ht) thời điểm t xác định phương trình sau: zt Wz xt U z ht 1 64 (1) rt Wr xt U r ht 1 (2) ht ' Wh xt rt U h ht 1 (3) ht ( zt ) ht ' zt ht 1 (4) Trong phương trình trên, Wi Ui ma trận trọng số; bi hệ số; hàm kích hoạt sigmoid; rt zt cổng đặt lại cổng cập nhật bước thời gian thứ t; ht' ứng viên cho giá trị lớp ẩn; biểu thị phép nhân phần tử ma trận (element-wise multiplication) 2.2 Khu vực nghiên cứu Sông Đà nằm khu vực phía Tây Bắc, phụ lưu lớn sông Hồng, lưu vực sông lớn Việt Nam Bắt nguồn từ Trung Quốc, lưu vực sông Đà trải dài theo hướng tây bắc – đông nam Ở Việt Nam, sông Đà chảy qua tỉnh Lai Châu, Điện Biên, Sơn La Hòa Bình trước nhập vào sông Hồng Phú Thọ Hiện nay, lưu vực sơng Đà có ba đập thủy điện lớn đập Hòa Bình KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) (1994), đập Sơn La (2012) đập Lai Châu (2016) với tổng công suất lắp máy khoảng 5520 MW Nghiên cứu tập trung xây dựng mơ hình mạng GRU để xây dựng lại liệu dòng chảy bị thiếu bị lưu vực sông Thông thường, liệu dòng chảy thượng lưu sử dụng làm liệu đầu vào cho mơ hình để đưa tính tốn dự báo dòng chảy hạ lưu Khác với mơ hình thủy văn thơng thường mơ hình dựa phương pháp hướng liệu (data-driven method), mơ hình đề xuất sử dụng liệu đầu vào liệu dòng chảy ngày quan sát trạm thủy văn hạ lưu để tính tốn ước tính cho trạm mục tiêu thượng lưu Lưu vực sông Đà lựa chọn làm nghiên cứu điển hình trạm thủy văn Lai Châu nằm thượng lưu chọn làm trạm mục tiêu cho nghiên cứu Khu vực nghiên cứu bao gồm năm trạm thủy văn, có bốn trạm hạ lưu là: Nậm Mức, Tả Gia, Tạ Bú, Hòa Bình; trạm mục tiêu – Lai Châu Sơ đồ vị trí trạm thủy văn khu vực nghiên cứu thể Hình Hình Sơ đồ khu vực nghiên cứu vị trí trạm thủy văn Dữ liệu dòng chảy trạm thủy văn thu thập từ trung tâm dự báo khí tượng thủy văn Đây liệu lưu lượng ngày thực đo 24 năm, từ 1961 đến 1984, trước đập thủy điện Hòa Bình xây dựng Các liệu lưu lượng đo đạc với đơn vị m3/s 2.3 Các tiêu chí đánh giá mơ hình Hiệu suất mơ hình đánh giá thơng qua ba trị số bình quân sai số tuyệt đối (MAE - mean absolute error), sai số quân phương (RMSE - root mean squared error), hệ số hiệu Nash (NSE - Nash-Sutcliffe Efficiency) Đây trị số thường sử dụng so sánh giá trị thực đo với giá trị tính tốn mơ hình thủy văn Các trị số tính tốn sau: n MAE Pi Oi n i 1 RMSE n Oi Pi n i 1 n O P i NSE (6) i i 1 n O O i (5) (7) i i 1 Trong đó: Oi, Oi , Pi giá trị thực đo, giá trị thực đo trung bình giá trị tính tốn mẫu thứ i tương ứng Mơ hình cho kết tốt giá trị MAE, RMSE nhỏ NSE lớn KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) 65 THIẾT LẬP THƠNG SỐ MƠ HÌNH Mơ hình mạng GRU đề xuất cho nghiên cứu dựa thư viện phần mềm mã nguồn mở Trong đó, Python ngơn ngữ lập trình lựa chọn cho nghiên cứu thư viện NumPy, Pandas, Matplotlib, TensorFlow sử dụng để xử lý, quản lý liệu xây dựng mơ hình Các liệu thu thập chia thành tập liệu độc lập với mục đích huấn luyện, hiệu chỉnh kiểm định mơ hình Cụ thể, tập liệu chuỗi lưu lượng thực đo hàng ngày 23 năm (1961-1983) sử dụng với mục đich huấn luyện hiệu chỉnh mơ hình Trong đó, 80% liệu sử dụng cho huấn luyện 20% liệu sử dụng cho mục đích hiệu chỉnh Tập liệu lại năm (1984) sử dụng với mục đích so sánh giá trị ước tính giá trị thực đo để kiểm định hiệu suất mơ hình đề xuất Các thông số cấu trúc mô hình đề xuất thể Bảng Bảng Các thơng số mơ hình GRU Đặc trưng Mục tiêu Dữ liệu đầu vào Thông số mơ hình Chi tiết Bổ sung lại liệu dòng chảy trạm thủy văn Lai Châu Lưu lượng thực đo trạm thủy văn Chiều dài chuỗi: 20 Hệ số học: 0,001 Số lượng unit: 20; 30; 50; Số lượng epoch tối đa: 100.000 Để mơ hình GRU đạt hiệu suất tốt học phụ thuộc từ liệu hiệu hơn, có vài thay đổi việc xếp liệu đầu vào cho mơ hình Thay sử dụng vectơ liệu đầu vào liệu bước thời gian cụ thể, vectơ định dạng thành dạng chuỗi liệu đầu vào (ma trận) với chiều dài chuỗi 20 Mỗi bước thời gian tương ứng với lần quan sát Trong báo này, liệu dòng chảy quan sát theo ngày Điều có nghĩa mơ hình sử dụng liệu đầu vào liệu 20 bước thời gian (tương ứng 20 ngày) quan sát gần để đưa tính tốn cho bước thời gian (hoặc ngày) Thêm vào đó, nghiên cứu tốn khơi phục lưu lượng dòng chảy sơng sử dụng liệu từ hạ lưu để tính tốn cho thượng lưu Chính vậy, việc lựa chọn giá trị chiều dài chuỗi 20 ngày để đảm bảo mơ hình học đầy đủ q trình xuất trận lũ từ lúc hình thành tới lúc kết thúc Dữ liệu dòng chảy cần ước tính trạm Lai Châu bước thời gian t ( X t5 ) 66 tính tốn dựa công thức sau: X t1 , X t11 , , X t119 ; 2 X t , X t 1 , , X t 19 ; X t5 f X t3 , X t31 , , X t319 ; (8) X , X , , X ; t 19 t t 1 X , X , , X t 20 t 1 t 2 Trong đó: X t , X t , X t3 , X t4 , X t5 lần luợt liệu dòng chảy trạm Nậm Mức, Tả Gia, Tạ Bú, Hòa Bình, Lai Châu thời điểm t Trong mơ hình mạng nơ-ron, q trình tối ưu hóa phụ thuộc vào hàm tối ưu hóa, thuật tốn tối ưu hóa hệ số học (learning rate) Hệ số học có liên quan chặt chẽ với thuật tốn tối ưu hóa lựa chọn Trong báo này, thuật tốn tối ưu hóa Adam (Kingma and Ba 2014) lựa chọn hệ số học mặc định 0,001 Đây thuật toán sử dụng rộng rãi tốn học sâu (deep learning) hiệu Một thơng số khác lựa chọn việc xây dựng mơ hình số lượng unit Số lượng unit hiểu số lượng nơ-ron tế bào GRU (GRU cell) Việc lựa chọn giá trị khác với mục đích nhằm đánh giá ảnh hưởng KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) số lượng unit đến hiệu suất mơ hình Số lượng unit tế bào GRU lớn độ phức tạp mơ hình tăng lên thời gian để tính tốn cập nhập vòng lặp (epoch) tăng lên đáng kể Ngồi ra, mơ hình thiết lập để huấn luyện với số lần lặp tối đa 100.000 lần Trong trường hợp kiểm định mơ hình với tập liệu độc lặp năm 1984, để đưa chuỗi giá trị dòng chảy ước tính năm, mơ hình thiết lập để xây dựng chuỗi vòng lặp tính tốn liên tục Ý tưởng cốt lõi việc xây dựng vòng lặp tính tốn sử dụng giá trị ước tính một vòng lặp làm liệu đầu vào vòng lặp để tính tốn đưa chuỗi giá trị theo yêu cầu KẾT QUẢ NGHIÊN CỨU 4.1 Kết hiệu chỉnh mơ hình Mơ hình đề xuất huấn luyện hiệu chỉnh với tập liệu 23 năm từ 1961 đến 1983 tương ứng với tỉ lệ liệu 80% 20% Kết hiệu chỉnh mơ hình thể Bảng So sánh trực quan giá trị thực đo giá trị ước tính trình hiệu chỉnh thể Hình Hình Bảng Kết hiệu chỉnh mơ hình GRU Trường hợp TH1 TH2 TH3 Chiều dài chuỗi 20 20 20 Số lượng unit 20 30 50 Hệ số học 0,001 0,001 0,001 Hình So sánh lưu lượng thực đo với tính tốn q trình hiệu chỉnh (TH1) Hình Tương quan giá trị thực đo tính tốn q trình hiệu chỉnh (TH1) Số lượng epoch 9455 8147 5226 MAE (m3/s) 76,3 75,9 75,9 RMSE (m3/s) 159,5 158,7 158,9 NSE 0,981 0,981 0,981 Kết hiệu chỉnh mơ hình cho thấy khơng có khác biệt ba trường hợp lựa chọn mặc số lượng unit tế bào GRU thay đổi Giá trị NSE ba trường hợp đạt 98,1% so sánh lưu lượng ước tính lưu lượng thực đo Các giá trị MAE RMSE cho thấy xu hướng tương tự vậy, giá trị sai số lưu lượng ước tính thực đo ba trường hợp tương tự nhau, 76 m3/s 160 m3/s Bảng cho thấy xu hướng quan trọng khác, số lượng unit tăng lên số lượng epoch giảm xuống Điều có nghĩa độ phức tạp mơ hình tăng lên hay thời gian tính tốn cho vòng lặp tăng lên số lần tính tốn (vòng lặp) để mơ hình đạt giá trị tối ưu giảm Thời gian tính tốn mơ hình mạng nơ-ron phụ thuộc vào cấu hình thiết bị sử dụng Hình Hình cho thấy có tương quan chặt chẽ giá trị lưu lượng mô giá trị quan sát Đối với trường hợp 1, hệ số tương quan NSE lên tới 98,1% trung bình sai số tuyệt đối 73,3 m3/s Hình cho thấy khả mơ mơ hình trường hợp khơi phục liệu dòng chảy vào KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) 67 mùa lũ mà đỉnh lũ tính tốn xuất thời điểm với đỉnh lũ thực tế Thêm vào đó, Hình cho thấy giá trị mô phù hợp với giá trị thực đo sai số tuyệt đối trường hợp xuất đỉnh lũ 103,5 m3/s (so với giá trị đỉnh lũ thực đo 8800 m3/s), mức sai số tương ứng khoảng 1,2% 4.2 Kết kiểm định mô hình Sau q trình hiệu chỉnh, mơ hình kiểm định với tập liệu độc lập năm 1984 Đây tập liệu chưa sử dụng trước mục đích kiểm định để đánh giá khả tính tốn mơ hình đề xuất Kết kiểm định mơ hình GRU thể Bảng Bảng Kết kiểm định mơ hình GRU Trường hợp TH1 TH2 TH3 Chiều dài chuỗi 20 20 20 Số lượng unit 20 30 50 Hệ số học 0,001 0,001 0,001 Kết kiểm định cho thấy mơ hình GRU đạt kết ấn tượng Mặc dù có vài khác biệt nhỏ so sánh kết ba trường hợp tính tốn, nói khác biệt khơng đáng kể mà độ xác (giá trị NSE) mơ hình đạt 95-96% Trường hợp (TH1) cho hiệu suất mơ hình ổn định so với trường hợp lại Giá trị sai số tương ứng MAE RMSE trình kiểm định khoảng 105 m3/s 190 m3/s Kết so sánh trực quan giá trị thực đo giá trị mô thể Hình Hình Số lượng epoch 9455 8147 5226 MAE (m3/s) 104,6 154,5 126,6 RMSE (m3/s) 188,2 228,8 212,7 NSE 0964 0,947 0,954 lũ 230,7 m3/s tương ứng với mức sai số tương đối khoảng 3,3% Hình biểu diễn cặp liệu ghép đôi giá trị thực đo giá trị tính tốn Các cặp liệu nằm gần đường chéo 450 mơ hình đạt hiệu suất Có thể thấy rằng, kết tính tốn q trình kiểm định có phù hợp cao với giá trị thực đo Các kết khẳng định mơ hình đề xuất cho kết tính tốn có độ xác cao ổn định Hình So sánh lưu lượng thực đo với tính tốn q trình kiểm định (TH1) Hình so sánh tương quan giá trị thực đo tính tốn trường hợp TH1 Có thể thấy đỉnh đỉnh lũ dự báo vào đỉnh lũ thực đo xuất thời điểm vào khoảng tháng Sai số tuyệt đối trường hợp tính tốn giá trị đỉnh 68 Hình Tương quan giá trị thực đo tính tốn q trình kiểm định (TH1) KẾT LUẬN Trong báo này, tác giả xây dựng mô KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) hình mạng GRU dựa mạng nơ-ron hồi quy với mục đích xây dựng lại liệu dòng chảy ngày trạm Lai Châu sông Đà Mặc dù sử dụng lượng khiêm tốn liệu, kết tính tốn mơ hình đề xuất thể phù hợp với liệu thực đo Các kết đánh giá cách cẩn thận thơng qua q trình huấn luyện, hiệu chỉnh kiểm định Cả ba trường hợp nghiên cứu đạt hiệu suất xuất sắc gần mà thơng số mơ hình thay đổi Điều cho thấy mơ hình đề xuất thể ổn định cho hiệu suất cao Kết nghiên cứu phụ thuộc vào liệu thu thập Trong nghiên cứu này, liệu đầu vào giá trị lưu lượng thực đo trạm thủy văn hạ lưu Các liệu lượng mưa khu vực nghiên cứu quan tâm, nhiên, việc đưa thêm liệu lượng mưa khơng làm hiệu suất mơ hình tăng lên Điều giải thích tương quan liệu lượng mưa lưu lượng trạm mục tiêu nhỏ nhiều so với tự tương quan lưu lượng lưu lượng Hơn nữa, mơ hình mạng nơron hồi quy, tương quan liệu cao hiệu suất mơ hình tốt (Le et al 2019) Mơ hình mạng GRU hay mơ hình mạng nơ-ron hồi quy mơ hình dựa phương pháp định hướng liệu Phương pháp có ưu điểm đơn giản so với phương pháp dựa mô hình vật lý khơng u cầu nhiều liệu đầu vào tình hình sử dụng đất hay diện tích bề mặt Nghiên cứu bước việc xây dựng mơ hình để tính tốn khơi phục lại liệu dòng chảy trạm Lào Cai sơng Hồng, nơi mà liệu dòng chảy bị 15 năm từ 1979 đến 1994 Với kết nghiên cứu này, mơ hình mạng nơ-ron hồi quy hồn tồn áp dụng để ước tính xây dựng lại liệu dòng chảy bị bị thiếu trạm thủy văn hạ lưu chí thượng lưu lưu vực sông TÀI LIỆU THAM KHẢO Ben Aissia, M.-A., Chebana, F., and Ouarda, T B M J (2017) "Multivariate missing data in hydrology – Review and applications." Adv Water Resour., 110, 299-309 Cho, K., van Merrienboer, B., Gỹlỗehre, Ç., Bougares, F., Schwenk, H., and Bengio, Y (2014) "Learning phrase representations using RNN encoder-decoder for statistical machine translation." CoRR, abs/1406.1078 Chung, J., Gỹlỗehre, ầ., Cho, K., and Bengio, Y (2014) "Empirical evaluation of gated recurrent neural networks on sequence modeling." CoRR, abs/1412.3555 Gao, T., and Wang, H (2017) "Testing Backpropagation Neural Network Approach in Interpolating Missing Daily Precipitation." Water, Air, & Soil Pollut., 228(10), 404 Harvey, C L., Dixon, H., and Hannaford, J (2012) "An appraisal of the performance of data-infilling methods for application to daily mean river flow records in the UK." Hydrol Res., 43(5), 618-636 Kingma, D P., and Ba, J (2014) "Adam: A method for stochastic optimization." CoRR, abs/1412.6980 Le, X H., Ho, H V., Lee, G., and Jung, S (2019) "Application of long short-term memory (LSTM) neural network for flood forecasting." Water, 11(7), 1387 Sivapragasam, C., Muttil, N., Jeselia, M C., and Visweshwaran, S (2015) "Infilling of Rainfall Information Using Genetic Programming." Aquatic Procedia, 4, 1016-1022 Tencaliec, P., Favre, A.-C., Prieur, C., and Mathevet, T (2015) "Reconstruction of missing daily streamflow data using dynamic regression models." Water Resour Res., 51(12), 9447-9463 Woodhouse, C A., Gray, S T., and Meko, D M (2006) "Updated streamflow reconstructions for the Upper Colorado River Basin." Water Resour Res., 42(5) KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) 69 Abstract: RECONSTRUCTION OF MISSING DAILY STREAMFLOW DATA USING RECURRENT NEURAL NETWORK Streamflow data is one of the most important quantities in hydrology because of these data closely related to water resource management problems as well as flood forecasting problems The lack of these data can lead to inadequate scientific analysis Therefore, reconstruction of missing data is an important step to get more reliable and accurate information The objective of this paper is to introduce an effective approach based on the recurrent neural network model to reconstructing missing daily discharge data Lai Chau hydrological station, located upstream of the Da River basin, was selected as a case study The findings of this study demonstrated that the recurrent neural network model yields reliable estimates for the problem of missing data As a result, the RNN model can be applied to other hydrological stations upstream where the flow data is missing Keywords: GRU, RNN, missing data, data reconstruction, Da River Ngày nhận bài: 26/7/2019 Ngày chấp nhận đăng: 27/8/2019 70 KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 66 (9/2019) ... trung xây dựng mơ hình mạng GRU để xây dựng lại liệu dòng chảy bị thiếu bị lưu vực sơng Thơng thường, liệu dòng chảy thượng lưu sử dụng làm liệu đầu vào cho mơ hình để đưa tính tốn dự báo dòng chảy. .. Unit (GRU) Trong báo này, mơ hình mạng nơ- ron GRU áp dụng để xây dựng mơ hình khơi phục liệu dòng chảy trạm Lai Châu Mạng GRU dạng đặc biệt mạng nơ- ron hồi quy, đề xuất Cho et al (2014) để giải vấn... RNN tốn xây dựng lại liệu dòng chảy bị thiếu, trạm thủy văn Lai Châu nằm thượng nguồn lưu vực sông Đà chọn làm nghiên cứu điển hình Kết nghiên cứu áp dụng để xây dựng lại liệu dòng chảy bị thiếu