CHƯƠNG 4. ỨNG DỤNG MÔ HÌNH GR4J TẠI LƯU VỰC SÔNG CÁI TỈNH NINH THUẬN
4.2 Các tiêu chí đánh giá mô hình
4.2.1 Các hàm mục tiêu được sử dụng hiệu chỉnh mô hình
Phầm mềm Source cung cấp các hàm mục tiêu nhằm đánh giá khả năng mô phỏng dòng chảy của mô hình thông qua giá trị thống kê của các hàm mục tiêu thể hiện sự khác nhau giữa chuỗi dữ liệu dòng chảy thực đo và tính toán từ mô hình.
Trong Source, hệ số hiệu quả Nash-Sutcliffe (NSE) là hàm mục tiêu được sử dụng rộng rãi cho các mô hình mưa-dòng chảy. Giá trị hệ số này nằm trong khoảng từ -∞ đến +1. NSE càng tiến đến 1 thì kết quả dòng chảy mô phỏng càng tương
đồng với giá trị thực đo. Trong trường hợp NSE bằng 0, dữ liệu dòng chảy mô phỏng gần với giá trị trung bình của dữ liệu dòng chảy thực đo nhưng không thể hiện được xu hướng dòng chảy. Nếu NSE<0, dòng chảy mô phỏng không hợp lý [36].
Thông thường, hệ số hiệu quả NSE thường nhạy với các chuỗi dữ liệu dòng chảy trung bình và dòng chảy lũ, nhưng kém phù hợp với dữ liệu dòng chảy kiệt.
Để khắc phục nhược điểm này, hệ số NSE được kết hợp với các tiêu chí khác trong phần mềm Source để tạo ra các hàm mục tiêu phù hợp với mục đích nghiên cứu như: NSE Daily & Bias Penalty, NSE Log Daily & Bias Penalty, NSE Monthly &
Bias Penalty, NSE Daily & Flow Duration, và NSE Daily & Log Flow Duration.
Trong nghiên cứu này, hàm mục tiêu NSE Daily & Flow Duration, hệ số tương quan Pearson (Pearson's Correlation Coefficient), và hệ số sai số (Volume Bias) được lựa chọn để đánh giá khả năng mô phỏng và hiệu suất của mô hình GR4J cho khu vực khô hạn và bán khô hạn ở Ninh Thuận. Các hệ số này được tính theo các công thức sau:
- NSE Daily & Flow Duration
NSE Daily & Flow Duration là sự kết hợp phép tính NSE Daily và NSE Flow Duration nhằm mục đích cân bằng sự phù hợp của mô hình với thời gian (và cường độ) của các sự kiện dòng chảy và phân phối tổng thể của lưu lượng dòng chảy.
NSE Daily & Flow Duration = a * NSE Daily + (1 - a) * Flow Duration Trong đó:
a là trọng số do người dùng xác định (0 ≤ a ≤1)
NSE Daily tương ứng với hệ số hiệu quả NSE truyền thống.
Flow Duration được tính bằng cách sắp xếp các dữ liệu đo đạc và dữ liệu mô phỏng theo thứ tự tăng dần và sau đó tính toán NSE của dữ liệu được sắp xếp.
= ∑ ( , , )
∑ ( , )
, RQobs, k là giá trịtrung bình dòng chảy và giá trị thực đo thứ k, k=1,...,N RQsim, k là giá trị dòng chảy mô phỏng thứ k, k = 1, …, N
- Hệ số tương quan Pearson (r)
Hệ số tương quan Pearson thể hiện mối tương quan tuyến tính giữa hai biến và nằm trong khoảng từ -1 đến 1. Giá trị r tiến tới |1| thể hiện sự tương quan hoàn hảo giữ hai biến và bằng 0 nếu không có sự tương quan giữa hai biến x và y.
= ∑ ( )( )
∑ ( ) ∑ ( )
Trong đó: x giá trị trung bình dòng chảy được mô phỏng từ mô hình GR4J y giá trị trung bình dòng chảy thực đo
xi là giá trị dòng chảy mô phỏng tại bước thời gian i yi là giá trị dòng chảy thực đo tại bước thời gian i - Hệ số sai số thể tích (Volume Bias)
Hệ số sai số thể tích (VB) thể hiện sự chênh lệch giữa dữ liệu mô phỏng với dòng chảy thực đo, có giới hạn nằm trong khoảng từ -∞ đến +∞. Giá trị độ lệch VB<0 hoặc VB>0 khi dữ liệu dòng chảy mô phỏng lần lượt thấp hơn hoặc cao hơn dữ liệu dòng chảy thực đo. Giá trị VB=0 ứng với dữ liệu dòng chảy mô phỏng không có sự sai lệch với dữ liệu dòng chảy thực đo [47]. Mô hình được đánh giá là tốt khi giá trị B lớn hơn 0 và tiến gần về 1 [10]. Công thức tính hệ số B như sau:
= ∑ ( , , )
∑ ,
Trong đó: Qobs, i là dữ liệu dòng chảythực đo cho bước thời gian i Qmod, i là dữ liệu dòng chảy mô phỏng cho bước thời gian i N là số bước thời gian
4.2.2 Xác định hàm tối ưu cho tham số trong Source
Các hàm tối ưu có sẵn trong Source được thể hiện ở Hình 4-2 bao gồm:
Shuffled Complex Evolution (SCE): Đây là dạng tối ưu hóa toàn cục (a global optimiser) dựa trên sự tiến hóa có chọn lọc. Dạng này cho phép bộ tham số được hiệu chỉnh từ các lần chạy trước một cách dễ dàng và nhanh chóng.
Uniform Random Sampling (URS): Đây cũng là một dạng tối ưu hóa toàn cục nhưng bộ tham số tốt nhất được chọn ngẫu nhiên từ các bộ tham số có sẵn được tập hợp từ các ứng dụng trước đây của Source cho các lưu vực khác. Nhược điểm của URS so với SCE là nó không xem xét kết quả của các lần chạy trước. Điều này dẫn đến sự mất ổn định (có thể rất nhanh hoặc chậm) của quá trình hiệu chỉnh.
Rosenbrock: Đây là dạng tối ưu cục bộ với ưu điểm là nhanh chóng tìm ra bộ tham số tốt nhất. Tuy nhiên, dạng này có thể tìm thấy các giá trị cục bộ, nên có thể bỏ qua các bộ tham số tối ưu toàn cục.
Hình 4-2. Các hàm tối ưu hóa trong phần mềm Source
Manual optimisation: Hàm này có thể dựa vào kiến thức và kinh nghiệm về tác động của từng tham số để chỉnh sửa giá trị bộ tham số theo cách thủ công. Tuy nhiên, nó có nhược điểm tương tự như URS.
SCE then Rosenbrock: Đây là sự kết hợp giữa các hàm SCE và Rosenbrock.
Hàm này thực hiện tối ưu hóa toàn cục trước khi áp dụng tối ưu hóa cục bộ. Hiệu quả của SCE then Rosenbrock đã được chứng minh khi đã được áp dụng cho hơn 200 lưu vực tại Úc [36].
Dựa trên các ưu và nhược điểm của từng hàm tối ưu, hàm SCE then Rosenbrock được lựa chọn trong nghiên cứu này để hỗ trợ quá trình hiệu chỉnh, tìm ra bộ tham số tối ưu cho mô hình. Để ứng dụng hàm này thì số vòng lặp và số lần đổi ngẫu nhiên vị trí ban đầu của bộ tham số cần được giả định, như được trình bày trong Bảng 3-4 cho nghiên cứu này.
Kết quả cho thấy hầu hết các giả định về số vòng lặp và số lần đổi ngẫu nhiên vị trí ban đầu đều có giá trị hiệu quả mô hình NSE tốt, đặc biệt là với số vòng lặp 100 và số lần đổi ngẫu nhiên vị trí ban đầu là 4. Tuy nhiên dễ dàng nhận thấy rằng khi giả định số lần đổi ngẫu nhiên vị trí ban đầu càng lớn thì thời gian chạy mô hình càng lâu trong khi hệ số NSE không đạt được giá trị tốt hơn. Vì thế, để tiết kiệm thời gian chạy mô hình cho các trường hợp nghiên cứu dòng chảy tại Ninh Thuận, số vòng lặp và số lần đổi ngẫu nhiên vị trí ban đầu cho hàm tối ưu SCE than Rosenbrock được đề xuất lần lượt là 100 và 4.
Bảng 4-4. Xác định số vòng lặp thích hợp cho mô hình GR4J tại tỉnh Ninh Thuận
Số lần đổi Số lần lặp Tổng số lần chạy
Thời gian chạy
mô hình (phút) NSE
2 100 295 3 0.9501
3 100 360 6 0.9501
4 100 425 7 0.9512
5 100 490 8 0.9481
6 100 565 8 0.9479
7 100 640 12 0.9481
8 100 789 20 0.9485
9 100 849 21 0.9481