Chương 7. Ước lượng thông số và độ bất định dự báo
7.7. Thừa nhận sự tương đương: Phương pháp GLUE
Nếu chúng ta chấp nhận rằng không có mô hình đơn chính xác hoặc tối ưu, thì
một phương pháp khác để ước lượng giới hạn dự báo là ước lượng độ tin tưởng. Chúng ta có thể liên kết với các mô hình và các bộ thông số khác nhau. Đây là tư tưởng nền tảng tiếp theo thừ nhận sự tương đương của mô hình và bộ thông số. Tất nhiên chúng ta có thể đưa ra các độ tin tưởng khác nhau cho các mô hình và các bộ thông số khác nhau, và nhiều khi chúng ta có thể loại bỏ chúng do chúng rõ ràng không đưa ra phân loại hợp lý của phản ứng cho một ứng dụng. “Tối ưu” đưa ra dữ liệu nào đó để hiệu chỉnh, sẽ có độ tin cậy cao nhất liên quan đến nó, nhưng như thấy dưới đây, sẽ có nhiều mô hình khác cũng cho kết quả tốt. Điều này có thể được thấy trong đồ thị dạng
điểm của hình 7.7(a), nó biểu diễn một ứng dụng điển hình của TOPMODEL đối với lưu vực Maimai, ở New Zealand.
Hình 7.7. áp dụng TOPMODEL cho lưu vực Maimai M8 (3.8 ha), New Zealand sử dụng phương pháp GLUE. (a) Đồ thị điểm của độ hiệu quả mô hình Nash- Sutclife. Mỗi một điểm diễn tả một lần chạy mô
hình với các giá trị thông số chọn ngẫu nhiên bằng chọn mẫu đồng nhất trong khoảng của mỗi thông số.
(b) Giới hạn dự báo lưu lượng cho thời kỳ 1987, sau khi quy định sử dụng các quan trắc từ 1985 và 1986.
Các đồ thị điểm là biểu đồ tản mạn của giá trị các thông số tương phản với giá trị hàm mục tiêu. Mỗi điểm đại diện cho một lần chạy của mô hình từ thực nghiệm Monte-Carlo, sử dụng nhiều mô phỏng với các giá trị chọn ngẫu nhiên khác nhau.
Chúng chủ yếu đại diện cho phép chiếu các mẫu điểm trên bề mặt phản ứng phù hợp vào trong từng chiều của thông số riêng biệt. Trên hình 7.7(a) các mô hình tốt là các mô hình mà các điểm đồ thị gần đỉnh. Sẽ thấy rằng với mỗi thông số có một mô phỏng tốt qua một khoảng rộng của các thông số. Chúng ta thường thấy với loại này của phương pháp Monte-Carlo, các mô phỏng tốt đưa tất cả về phía biên của khoảng các thông số mẫu. Tuy nhiên cũng tồn tại các mô phỏng xấu qua toàn bộ khoảng rộng của mỗi mẫu thông số. Duan và nnk (1992) chỉ ra dạng tương tự với các mô hình khác nhau hoàn toàn. Dáng điệu như vậy là một biểu hiện khá rõ về một mô hình cho kết quả tốt hay xấu không phụ thuộc vào từng thông số mà hầu hết bộ thông số và sự tương tác giữa chúng. Như một phép chiếu của bề mặt phản ứng, đồ thị điểm không thể chỉ ra toàn bộ cấu trúc phức tạp của các tương tác thông số, định hình dạng cho bề mặt đó. Tuy nhiên, trong một khái niệm, điều này lại không quá quan trọng vì chúng
ta từ đầu đã thực sự quan tâm là ở đó các bộ thông số tốt coi như là một tập hợp.
Tuy nhiên, tất cả các bộ thông số tốt này lại đưa đến các kết quả dự báo khác nhau, nhưng nếu chúng ta kết hợp một độ tin cậy với mỗi tập hợp dự báo (cao nhất đối với mô hình tối ưu, và bằng 0 đối với các mô hình bị loại bỏ), thì chúng ta có thể ước lượng độ bất định rút ra trong các dự báo theo một quan niệm rất đơn giản là lấy trọng số các dự báo của các mô hình có thể chấp nhận được bằng độ tin cậy liên kết của chúng. Phương pháp như vậy cho phép sự không tuyến tính của phản ứng của các mô hình có thể chấp nhận bằng việc sử dụng các bộ thông số khác nhau để đưa vào trong tính toán dự báo và ước lượng độ bất định.
Tiếp cận hoàn toàn tự nhiên này dẫn tới dạng phân tích Bayes (xem Lee 1989;
Box và Tiao 1992). Thống kê Bayes cho phép dạng thông tin chủ quan này được sử
dụng để ước lượng xác suất của các kết quả khác nhau (xem hộp 7.2). ở đây phân bố có trước của các mô hình và dự báo được đánh giá trong dạng độ hữu hiệu nào đó (độ tin cậy hoặc chấp nhận được) liên quan đến các quan trắc có sẵn và phân bố sau tính toán có thể được sử dụng trong dự báo. Đây là bản chất của phương pháp ước lượng độ bất định hữu hiệu tổng quát (GLUE) được đưa ra bởi Beven và Binley (1992), ngày nay được sử dụng rộng rãi trong thuỷ văn với các chỉ tiêu hữu hiệu khác nhau. Cập nhật các phân bố hữu hiệu khi số liệu hiệu chỉnh mới có sẵn được điều khiển dễ dàng trong khuôn khổ phương pháp Bayes này.
Trong phương pháp GLUE, phân bố trước của các giá trị thông số được sử dụng để tạo các bộ thông số ngẫu nhiên để sử dụng trong mỗi mô hình bằng mô phỏng Monte Carlo. Một chuỗi đầu vào được sử dụng để tìm kiếm mỗi mô hình và các kết quả được so sánh với số liệu hiệu chỉnh có sẵn. Một độ đo hoạt động định lượng được dùng để
đánh giá khả năng chấp nhận được của mỗi mô hình dựa trên các phần dư của mô
hình. Bất kỳ độ đo hữu hiệu nào đưa ra ở hộp 7.1 hoặc 7.2 đều có thể phục vụ mục
đích này. Chỉ có một yêu cầu, đó là độ đo phải tăng đơn điệu với độ tăng mức độ phù hợp và các mô hình không hành vi phải có độ đo hữu hiệu bằng 0. Các độ đo hữu hiệu khác nhau hoặc kết hợp của các độ đo hữu hiệu khác nhau sẽ dẫn đến các ước lượng khác nhau của độ bất định dự báo.
Trong việc sử dụng mô hình cho dự báo tất cả các mô phỏng với độ đo hữu hiệu lớn hơn 0 sau đó được phép đóng góp vào phân bố của dự báo. Các dự báo của mỗi mô
phỏng được lấy trọng số bằng độ đo hữu hiệu kết hợp với mô phỏng đó. Phân bố trọng số hữu hiệu luỹ tích dự báo có thể được sử dụng để ước lượng các phân vị cho các dự báo ở bất kỳ bước thời gian nào.
Thực hiện phương pháp GLUE yêu cầu một số quyết định phải tiến hành :
Quyết định sử dụng một hay nhiều mô hình trong một phân tích.
Quyết định khoảng giá trị khả thi cho mỗi thông số.
Quyết định chiến lược tạo mẫu cho các bộ thông số
Quyết định tiếp cận độ đo hữu hiệu
Những quyết định này, trong một phạm vi nào đó, là hoàn toàn chủ quan, nhưng
điểm quan trọng là chúng phải rõ ràng trong bất kỳ ứng dụng nào. Vì vậy việc phân tích có thể phải thực hiện lại nếu cần thiết và các quyết định có thể cần được thảo luận và đánh giá của những người khác.
Cho trước một mẫu đủ lớn của mô phỏng Monte Carlo, phạm vi các dự báo trọng số hữu hiệu có thể được đánh giá để thu được phân vị dự báo ở bất kỳ bước thời gian nào. Đây là công việc rất đơn giản nếu các giá trị hữu hiệu được chuẩn hoá như
L M i =1, trong đó M i là chỉ số mẫu Monte Carlo thứ i, để ở bất cứ bước thời gian t nào ta có:
P(Q^t q)LM i Q^i,t q (7.6)
trong đó Qi,t
^
là biến quan tâm đã dự báo bởi mẫu Monte Carlo thứ i và N là số lượng mẫu. Phân vị dự báo
Q q
P ^i,t p đạt được theo cách này (như chỉ ra trong ví dụ ở hình 7.7(b)) được quy định trên đầu vào của mô hình, các phản ứng của mô hình đối với từng mẫu thông số cụ thể được sử dụng, sự lựa chọn chủ quan độ hữu hiệu và các quan trắc được sử dụng trong hiệu chỉnh độ hữu hiệu. Do đó, chúng là phương pháp kinh nghiệm, nhưng chú ý là trong thủ tục như vậy các mô phỏng đóng góp cho khoảng phân vị cụ thể có thể thay đổi từ bước thời gian này tới bước thời gian khác, phản ánh sự không tuyến tính và thay đổi theo thời gian trễ trong các phản ứng mô
hình. Thực tế nó cũng cho phép rằng các đặc điểm phân bố của các dự báo mô hình trọng số hữu hiệu có thể thay đổi từ bước thời gian này đến bước thời gian khác (xem Freer và nnk (1996) và trường hợp nghiên cứu trong mục 7.8 dưới đây).
Bất kỳ sự tượng tác nào của các thông số trong mô hình và bất kỳ ảnh hưởng của sai số trong số liệu đầu vào và số liệu quan trắc cũng sẽ được phản ánh không rõ ràng trong độ đo hữu hiệu kết hợp với mỗi mô phỏng và do đó không phải xem xét riêng rẽ.
Điều này tạo ra một giả thiết rằng những ảnh hưởng này sẽ tương tự nhau trong quá
trình dự báo, nhưng đã tránh được vấn đề là những ảnh hưởng này quả thực rất khó có thể xem xét một cách riêng rẽ.
7.7.1.Quyết định khoảng thông số khả thi
Quyết định khoảng giá trị khả thi của thông số là công việc không dễ dàng, ngay cả khi cho trước một số thực nghiệm trong các ứng dụng trước đó của mô hình. Mục
đích là để có khoảng đủ rộng không gian thông số, mà sự phù hợp tốt của mô hình là không bị loại trừ, nhưng cũng không rộng đến mức giá trị các thông số vô nghĩa hoặc có ý nghĩa hoặc các lần chạy mô hình không hành vi không cần thiết tiến hành. Tuy nhiên, người ta thường thấy rằng ngay cả nếu khoảng giá trị được đưa ra là khá rộng, thì các giá trị phù hợp tốt tìm thấy đúng ở biên của một số thông số (như hình 7.7).
Điều này có lẽ do các dự báo của mô hình không quá nhạy với những thông số đó hoặc có thể là khoảng được vẽ ra không đủ rộng, vì nó công nhận rằng vẫn còn có giá trị khác phù hợp hơn ở ngoài khoảng đang xét. Đề nghị tốt nhất là bắt đầu với các khoảng tương đối rộng và xem xét liệu chúng có thể được thu hẹp lại sau một mẫu đầu tiên của không gian thông số.
7.7.2. Quyết định chiến lược tạo mẫu
Lựa chọn một chiến lược tạo mẫu cũng rất quan trọng vì nếu một lượng lớn các thông số được bao gồm trong việc phân tích một số lượng lớn các bước chạy mô hình để xác định dạng của bề mặt phản ứng chấp nhận được trong không gian nhiều chiều của thông số. ý tưởng sử dụng các bộ thông số được chọn ngẫu nhiên là để ít nhất cũng nhận được một mẫu lớn từ không gian này, nhưng rõ ràng thời gian tính toán có thể sẽ lãng phí nếu quá nhiều lần chạy mô hình khu vực không gian các thông số đưa đến sự kém phù hợp với số liệu. Một vài chiến lược đã được đưa ra trong ước lượng thống kê thông số với mục đích tránh được vấn đề này. Trong hầu hết các ứng dụng của GLUE
ngày nay, một mẫu độc lập đồng nhất các thông số trong không gian thông số đã được sử dụng. Điều này đảm bảo sự độc lập trước đây của các bộ thông số trước khi đánh giá chúng với sự sử dụng độ hữu hiệu đã chọn và rất dễ thực hiện, nhưng nó cũng có thể là một phương pháp tương đối không hiệu quả nếu các khu vực lớn không gian thông số đưa đến các mô phỏng không hành vi.
Chi phí tính toán trong việc thực hiện hàng nghìn các mô phỏng để xác định một bề mặt phản ứng thu được hợp lý là nguyên nhân chính tại sao phương pháp Monte Carlo không được sử dụng rộng rãi trong mô hình hoá thuỷ văn. Số lượng lớn hơn các thông số và độ phức tạp lớn hơn của bề mặt phản ứng, sẽ dẫn tới số lượng các mô
phỏng lớn hơn được yêu cầu. Giới hạn này sẽ trở nên nhỏ đi, ít nhất là đối với các mô
hình tương đối đơn giản, vì khả năng tính toán của máy tính điện tử ngày càng được tăng cường và giá cả của chúng tiếp tục giảm xuống. Phát triển hiện thời các hệ thống máy tính giá rẻ liên kết Ethernet, hệ thống PC song song sử dụng các hộp không ngăn sẽ đồng nghĩa với việc mô phỏng Monte Carlo sẽ càng tăng tính khả thi trong cả các dự án nghiên cứu và ứng dụng. Những hệ thống song song như vậy là dạng lý tưởng của tính toán loại này. Nếu một bước chạy đơn của mô hình sẽ phù hợp trong bộ nhớ của bộ điều khiển đơn thì sẽ mất rất ít hiệu quả trong cấu trúc song song: mỗi bộ điều khiển cần thiết sẽ hoạt động với khả năng tính toán tối đa trong suốt quá trình chạy, ngoại trừ khoảng thời gian rất ngắn trong đó các kết quả từ một bước chạy được chuyển đến cho bộ điều khiển chủ hoặc ghi lên đĩa và một bước chạy mới lại được bắt
®Çu.
Tuy nhiên, với các mô hình lớn sẽ vẫn có một vài lợi ích trong nỗ lực làm cho mô
phỏng Monte Carlo trở nên hiệu quả hơn. Chẳng hạn, trong phương pháp GLUE, có rất ít lợi ích trong các khu vực mẫu của không gian thông số với độ hữu hiệu thấp ngay khi những khu vực này được thiết lập. Sẽ tốt hơn khi chỉ tập trung các mẫu vào khu vực có độ hữu hiệu cao. Đây là chủ đề đã được nghiên cứu trong nhiều lĩnh vực khác nhau đưa đến một đề tài mở rộng mà thường được gọi là tạo mẫu đại biểu. Một số phương pháp đã được pháp triển để lợi dụng các kiến thức thu được của phản ứng bề mặt trong việc tinh chỉnh chiến lược chọn mẫu hợp lý. Những phương pháp này bao gồm các kỹ thuật chẳng hạn như một số phương pháp Latin Hypercube và xích Markov Monte Carlo (MC2 ), nó cố gắng tạo mẫu bề mặt phản ứng theo giá trị mật độ hữu hiệu, để các khu vực có độ hữu hiệu cao được tạo mẫu thường xuyên hơn. Hi vọng rằng việc tiết kiệm đáng kể thời gian tính toán trên máy tính điện tử sẽ được thực hiện từ việc xác định đúng đắn bề mặt hữu hiệu. Những phương pháp như vậy có thể hoạt động tốt khi bề mặt được xác định tốt, nhưng đối với các bề mặt với rất nhiều cực
đại cục bộ hoặc bằng phẳng, các ưu điểm có thể sẽ không lớn. ảnh hưởng của kỹ thuật chọn mẫu đồng nhất cũng có thể được cải thiện bằng việc chạy mô hình chỉ ở những khu vực của không gian thông số nơi mà các mô hình hành vi được mong đợi dựa trên cơ sở của mẫu trước đó. Tìm kiếm ba cấu trúc của Spear và nnk (1994) và phương pháp Monte Carlo hướng dẫn của Shorter và Rabitz (1997) đều có thể được sử dụng theo cách này.
Tất nhiên có thể cũng có một vài thông tin biết trước về thông số. Thông tin này có
thể đưa ra một số dạng. Đầu tiên là ý nghĩa nào đấy của phân phối mong đợi và phương sai của các giá trị thông số. Một vài bộ thông số ở trong một khoảng xác định có thể được biết trước là không khả thi trên cơ sở hoạt động trước đó hoặc suy diễn cơ
học. Sau đó mỗi bộ thông số có thể vẫn được hình thành bởi tạo mẫu đồng nhất không gian thông số nhưng có thể đưa ra một độ hữu hiệu có trước (có lẽ bằng 0). Nếu độ hữu hiệu biết trước bằng 0, sẽ không cần thiết chạy mô hình, một mô hình như vậy được xem là không khả thi.
Một câu hỏi thú vị xuất hiện khi sẵn có các giá trị đo đạc của một, một vài hoặc tất cả các giá trị thông số trong mô hình. Trong một số trường hợp (hiếm) thậm chí có thể xác định các phân bố và hiệp phương sai cho các giá trị thông số trên cơ sở các đo
đạc. Những kết quả này sau đó có thể sử dụng để xác định trọng số hữu hiệu có trước trong không gian thông số mẫu đồng nhất. Mặc dù thường có các trường hợp mà các đo
đạc như vậy là thông tin tốt nhất chúng ta có được về giá trị thông số, không có đảm bảo rằng giá trị đo đạc được ở một quy mô sẽ phản ánh các giá trị hiệu quả yêu cầu trong mô hình để đạt được hàm dự báo phù hợp với các giá trị quan trắc. Sau đó người ta có thể thêm thông tin sai lệch vào trong phân bố thông số có trước, nhưng nếu không gian thông số là một mẫu đủ rộng để bao gồm các giá trị thông số ảnh hưởng bền vững thì ứng dụng được lặp lại của phương trình Bayes hoặc theo cách khác kết hợp các độ hữu hiệu (xem hộp 7.2) sẽ làm cho sự hoàn thiện của mô hình tăng lên khi chi phối hình dạng của bề mặt phản ứng so với các ước lượng trước ban đầu của các phân bố thông số .
7.7.3. Quyết định độ hữu hiệu
Có rất nhiều độ đo có thể được sử dụng để đánh giá các kết quả của mô phỏng mô
hình. Những độ đo này sẽ một phần phụ thuộc vào số liệu quan trắc có sẵn để đánh giá mô hình, ngay cả khi chỉ có duy nhất một loại số liệu có sẵn (chẳng hạn số liệu lưu lượng trong đánh giá mô hình mưa-dòng chảy) vẫn có những cách khác nhau tính toán sai số của mô hình và sử dụng những sai số này cho tính toán độ hữu hiệu. Điều chắc chắn là nếu chúng ta muốn phân cấp mẫu của các mô hình bằng sự hoạt động, thì các
độ hữu hiệu khác nhau sẽ cho các phân cấp khác nhau và cùng một độ đo tính toán cho các thời kỳ quan trắc khác nhau cũng sẽ cho các cấp khác nhau .
Lựa chọn độ hữu hiệu nên được xác định rõ ràng bởi bản chất của vấn đề dự báo.
Nếu vấn đề ta quan tâm là dòng chảy nhỏ thì độ hữu hiệu đưa đến trọng số lớn hơn cho dự báo dòng chảy thấp được dùng. Nếu vấn đề quan tâm là lượng nước trong thiết kế hồ chứa thì độ hữu hiệu dựa trên sai số dự báo tổng lượng có lẽ là gần đúng hơn.
Nếu chúng ra quan tâm đến dự báo đỉnh lũ thì độ đo nhấn mạnh độ chính xác đỉnh lũ
được chọn. Trong dự báo lũ, độ hữu hiệu giải thích độ chính xác dự báo thời gian đỉnh lũ có thể được chọn. Nếu đánh giá mô hình phân bố được thực hiện thì độ hữu hiệu kết hợp thực hiện dự báo lưu lượng và thực hiện dự báo của biến trạng thái nội tại như
mực nước ngầm có thể là gần đúng. Một tổng kết các độ đo hữu hiệu khác nhau được
đưa ra ở hộp 7.1.
7.7.4. Cập nhật các độ hữu hiệu