Chương 7. Ước lượng thông số và độ bất định dự báo
7.6. Hiệu chỉnh mô hình sử dụng phương pháp lý thuyết tập hợp
điểm cho rằng có một bộ thông số tối ưu. Như đã thảo luận trong mục 1.8, các kiểm tra chi tiết của bề mặt phản ứng cho thấy có nhiều sự kết hợp khác nhau của giá trị thông số đưa đến sự phù hợp tốt với chuỗi số liệu đo đạc ngay cả đối với các mô hình tương
đối đơn giản. Khái niệm về bộ thông số tối ưu có thể là thiếu cơ sở trong mô hình hoá
thủy văn, mang đến từ các khái niệm trong suy diễn thống kê. Nền tảng của lý thuyết suy diễn thống kê là có một mô hình chính xác: vấn đề là ước lượng các thông số của mô hình đưa đến một độ bất định nào đó trong số liệu sẵn có. Trong thuỷ văn, thực hiện những giả thiết như thế còn khó khăn hơn. Không có mô hình chính xác và số liệu có sẵn để đánh giá các mô hình khác nhau, có thể có độ bất định lớn liên quan đến chúng, đặc biệt là các sự kiện cực trị, thường được quan tâm lớn nhất.
Một phương pháp thay thế để hiệu chỉnh mô hình là cố gắng xác định một tập hợp của mô hình chấp nhận được. Phương pháp lý thuyết tập hợp nhìn chung dựa vào mô
phỏng Monte-Carlo. Một lượng lớn các lần chạy của mô hình được thực hiện với các bộ thông số chọn ngẫu nhiên khác nhau. Các bộ thông số phù hợp thoả mãn một tiêu chuẩn hoạt động hoặc được duy trì sẽ không bị loại bỏ. Kết quả là một tập hợp các mô
hình có thể chấp nhận được hơn là một mô hình tối ưu đơn. Sử dụng tất cả các mô
hình có thể chấp nhận được cho dự báo đưa đến một khoảng dự báo cho mỗi biến quan
t©m, cho phÐp mét íc
lượng của khoảng dự
báo. Loại phương pháp
này không được
sử dụng rộng rãi
trong mô hình mưa-
dòng chảy (ngoại
trừ phương án
GLUE của mục tiếp
theo), nhưng đã có
một số nghiên cứu
trong mô hình hóa
chất lượng nước
(chẳng hạn Klepper
và nnk 1991; Rose
và nnk 1991; Van
Straten và Keesman
1991).
Hình 7.5. Xác định lặp lại của bộ tối ưu Pareto sử dụng tập hợp bộ thông số chọn ngẫu nhiên ban đầu.
(a), Bộ thông số ban đầu trong không gian thông số hai chiều(các thông số x1,x2). (b), Bộ thông số ban đầu trong không gian hàm mục tiêu 2 chiều (các hàm F1 F2 ). (c, d), Nhóm các bộ thông số sau một
phép lặp. (e, f), Nhóm các bộ thông số sau phép lặp thứ 4. Sau phép lặp cuối cùng không có mô hình với các giá rị thông số nằm ngoài bộ tối ưu Pareto có giá trị của hàm mục tiêu cao hơn các mô hình trong bộ tối ưu Pareto. Yapo và nnk. In lại từ tạp trí Thuỷ văn 204: 83 – 97, xuất bản 1998 với sự cho
phép của Elsevier Science.
Một phát triển gần đây trong việc tiếp cận lý thuyết tập hợp là phương pháp hiệu chỉnh thông số đa tiêu chuẩn của Yapo và nnk (1998). Phương pháp của họ dựa trên khái niệm tập hợp tối ưu của Pareto, một tập hợp các mô hình với các bộ thông số khác nhau. Tất cả đều có các giá trị tiêu chuẩn hoạt động khác nhau không kém bất kỳ một mô hình nào nằm ngoài bộ thông số tối ưu trên bất kỳ đa tiêu chuẩn nào. Trong thuật ngữ của phương pháp, các mô hình trong bộ tối ưu chiếm ưu thế hơn so với các bộ các mô hình bên ngoài tập hợp này. Yapo và nnk (1998) đã tạo ra một phương pháp khá
hay để xác định bộ tối ưu Pareto, liên quan tới thuật toán tối ưu hoá SCE trong mục 7.3. Đơn giản hơn phương pháp thực nghiệm Monte-Carlo thuần tuý, họ bắt đầu với N
điểm được chọn ngẫu nhiên trong không gian các thông số và sau đó sử dụng kỹ thuật dò tìm để thay đổi giá trị các thông số và tìm ra N bộ bên trong bộ tối ưu (Hình 7.5).
Họ cho rằng điều này sẽ hiệu quả hơn nhiều so với tìm bộ tối ưu Pareto.
Họ chứng minh việc sử dụng mô hình và rút ra giới hạn dự báo trong mô hình mưa dòng chảy Sacrameto ESMA, sử dụng trong hệ thống dự báo sông ngòi của Cục khí tượng quốc gia Mỹ, áp dụng cho lưu vực sông Leaf River, Mississippi. Mô hình có 13 thông số cần hiệu chỉnh. Hai hàm mục tiêu được sử dụng trong hiệu chỉnh: tổng bình phương sai số và tiêu chuẩn hữu hiệu cực đại hỗn hợp. Để tìm ra tập hợp bộ tối
ưu Pareto, 500 bộ thông số được đưa vào, cần 68980 lần chạy mô hình. Kết quả được chỉ trên hình 7.6, trong dạng nhóm 500 bộ thông số cuối cùng trên bề mặt hai hàm mục tiêu ( từ Yapo và nnk 1998) và phạm vi kết hợp của lưu lượng được dự báo bởi bộ thông số chọn ngẫu nhiên ban đầu và bộ thông số tối ưu Pareto cuối cùng (Gupta và nnk 1998). ưu điểm chính của phương pháp bộ tối ưu Pareto là nó không yêu cầu đưa ra các độ đo hoạt động khác nhau để được kết hợp vào trong một độ đo tổng thể. Gupta và nnk (1999) cho rằng phương pháp này ngày nay cạnh tranh hơn với các phương pháp tương tác được thực hiện bởi một chuyên gia mô hình hoá để đạt được sự hiệu chỉnh, làm thoả mãn yêu cầu phù hợp với số liệu.
Hình 7.6. Hiệu chỉnh bộ tối ưu Pareto của mô hình mưa–dòng chảy Scramento ESMA cho lưu vực sông Leaf River, Mississippi (Yapo và nnk 1998). (a), Nhóm 500 bộ thông số mô hình của bộ tối ưu Pareto trong mặt của 2 thông số mô hình. (b), Giới hạn dự báo cho 500 bộ thông số tối ưu Pareto. In lại từ Tạp
chí thuỷ văn 204: 83 – 97. Xuất bản 1998, với sự cho phép từ Elsevier Science.
Như chỉ ra ở hình 7.6(a) bộ mô hình được tìm thấy để tối ưu Pareto phản ánh các yêu cầu mâu thuẫn của việc thoả mãn nhiều độ đo hoạt động. Tuy nhiên, hình 7.6(b) chỉ ra rằng điều đó không đảm bảo rằng các giá trị dự báo từ mẫu của mô hình tối ưu Pareto sẽ phù hợp với các quan trắc vì nó không thể bù đắp hoàn toàn cho sai số của cấu trúc mô hình hoặc lưu lượng quan trắc không có sai số tự do. Bộ chọn ngẫu nhiên ban đầu sẽ phù hợp với quan trắc nhưng với giới hạn rộng hơn đáng kể (lưu ý thang loga lưu lượng trên hình 7.6b). Cần phải nhớ rằng phương pháp không hướng tới ước lượng các giới hạn dự báo trong bất kỳ ý nghĩa thống kê nào, nhưng một đặc điểm của phương pháp đó là nó dường như đưa đến một bộ vượt giới hạn của dự báo so với quan trắc. Người sử dụng sau đó sẽ gặp khó khăn trong việc liên hệ khoảng dự báo với bất kỳ độ tin cậy nào mà họ muốn đáp ứng bất kỳ quan trắc cụ thể nào.