Phân tích độ nhạy và bề mặt phản ứng thông số- 123docz.net

Chương 7. Ước lượng thông số và độ bất định dự báo

7.2. Phân tích độ nhạy và bề mặt phản ứng thông số

Để đơn giản, ta xem xét mô hình chỉ có 2 thông số. Một số giá trị ban đầu của các thông số được chọn và mô hình được vận hành với bộ thông số đã được hiệu chỉnh. Kết quả dự báo được so sánh với một số biến quan trắc và một độ đo tương thích được tính toán và làm tròn để sao cho nếu mô hình có độ phù hợp tốt thì có giá trị bằng 1, còn kém thì bằng 0 (độ đo hoạt động chi tiết được bàn tới trong mục sau). Giả sử trong lần chạy đầu tiên mô hình cho kết quả độ phù hợp bằng 0.72, nghĩa là chúng ta kỳ vọng rằng mô hình có thể làm tốt hơn thế (tiến gần hơn tới 1). Đó là một lý do tương đối đơn giản khiến chúng ta phải thiết lập một mô hình để thay đổi các giá trị thông số, chạy lần khác và tính toán lại độ phù hợp. Tuỳ chọn này được cung cấp trong phần mềm TOPMODEL (xem phụ lục A). Tuy nhiên, chúng ta chọn thế nào để được giá trị thông số làm thay đổi độ phù hợp.

Một cách làm là thử sai đơn giản, biểu diễn kết quả trên màn hình, suy nghĩ về vai trò của mỗi thông số trong mô hình, và thay đổi các giá trị để làm cho đỉnh các thuỷ đồ nâng cao hơn hoặc đường nước xuống dài hơn, hoặc bất cứ cái gì cần thiết.

Việc này có vẻ rất cảm tính, nhưng khi lượng thông số lớn hơn thì sẽ rất khó phân loại

được tất cả những tương tác qua lại giữa các thông số trong mô hình và quyết định cái gì sẽ cần được thay đổi tiếp theo (hãy thử cách này với phần mềm TOPMODEL mà ở

đó có tới 5 thông số có thể được thay đổi)

Một cách khác là chạy mô hình đủ để đánh giá hoạt động của mô hình trong toàn bộ không gian thông số. Trong ví dụ 2-thông số đơn giản, chúng ta có thể quyết định dựa trên phạm vi giá trị đối với mỗi thông số, sử dụng 10 số gia gián đoạn cho mỗi phạm vi thông số và chạy mô hình cho mỗi tổ hợp giá trị thông số. Phạm vi của thông số xác định không gian thông số. Biểu diễn giá trị kết quả của độ phù hợp xác định một bề mặt phản ứng thông số như các đường đẳng trị trên hình 7.1 (xem biểu diễn ba chiều trên hình 1.7). Trong ví dụ này, 10 gia số gián đoạn sẽ cần 102=100 lần chạy mô

hình. Đối với những mô hình đơn giản việc chạy không mất quá nhiều thời gian.

Chẳng hạn, với 100 lần chạy của TOPMODEL với 1000 bước thời gian trên máy PC Pentium sẽ mất khoảng 2 phút, mặc dù vậy những mô hình phân bố phức tạp sẽ mất nhiều thời gian hơn. Cách làm tương tự cho 3 thông số sẽ yêu cầu cao hơn một chút:

103 lần chạy. Đối với 6 thông số sẽ yêu cầu 106 hay là 1 triệu lần chạy (mất khoảng 2 tuần tính toán đối với TOPMODEL trên một máy PC, và lâu hơn đối với những mô

hình phức tạp hơn) và 10 gia số cho mỗi biến không phải là sự rời rạc hoá rất mịn của không gian thông số. Tất nhiên, không phải tất cả các lần chạy mô hình sẽ đưa đến tương thích tốt với số liệu. Thời gian tính toán lâu có thể ghi cả những lần chạy mô

hình chạy có độ tương thích kém. Đây là lý do chủ yếu giải thích tại sao có nhiều nghiên cứu về kỹ thuật tối ưu hoá tự động nhằm giảm thiểu số lần chạy cần thiết để tìm được một bộ thông số tối ưu.

Dạng của mặt phản ứng có thể trở nên phức tạp hơn nhiều khi lượng thông số tăng lên, và cũng khó khăn hơn để có thể hình dung ra mặt phản ứng thông số trong không gian ba chiều hoặc nhiều chiều hơn. Một vài vấn đề chúng ta đã gặp phải, tuy

nhiên, có thể minh hoạ được bằng ví dụ 2-thông số của chúng ta. Dạng của mặt phản ứng không phải luôn luôn là kiểu gò đồi đơn giản như chỉ ra trong hình 1.7. Nếu vậy thì việc tìm bộ thông số tối ưu đã không có gì khó khăn. Bất kỳ kỹ thuật tự động tối ưu hoá nào gọi là “leo dốc” trong mục 7.4, sẽ thực hiện tốt việc dò tìm con đường từ một

điểm xuất phát bất kỳ tới điểm tối ưu.

Hình 7.1. Bề mặt phản ứng cho 2 chiều thông số với độ phù hợp biểu thi như những đường đẳng trị

Một trong những vấn đề thường gặp phải là độ trơ thông số. Điều này sẽ xảy ra nếu một thông số ảnh hưởng quá ít đến kết quả mô hình trong giới hạn của nó. Điều

đó có thể là kết quả của thành phần mô hình liên kết với thông số không được kích hoạt trong quá trình chạy (có lẽ thông số là khả năng lớn nhất trong dung lượng mô

hình và dung lượng này không bao giờ đầy). Trong trường hợp này, một phần mặt phản ứng thông số sẽ là phẳng với sự thay đổi một hoặc nhiều thông số (ví dụ thông số 1 trong hình 7.2a). Thay đổi thông số trong khu vực này có ảnh hưởng rất ít đến kết quả. Các kỹ thuật leo dốc có thể tìm thấy nó khó khăn để tìm một con đường bằng phẳng và hướng tới một hàm tương thích tốt hơn nếu chúng đưa đến một cao nguyên bằng phẳng trong mặt phản ứng. Những điểm khởi đầu khác nhau có thể đưa tới những bộ giá trị thông số cuối cùng khác nhau.

Vấn đề khác nữa là sự tương tác giữa các thông số. Điều này có thể dẫn tới nhiều

đỉnh (hình 7.2b) hoặc các sống trong mặt phản ứng (hình 7.2c), với các cặp giá trị thông số khác nhau cho độ tương thích rất giống nhau. Trong những trường hợp sau kỹ thuật leo dốc có thể tìm thấy sống rất dễ dàng nhưng có thể khó tìm thấy sự hội tụ trên một bộ đơn các giá trị cho độ tương thích tốt nhất. Một lần nữa giá trị khởi đầu khác nhau có thể cho những bộ thông số cuối cùng khác nhau.

Vấn để nhiều đỉnh địa phương có thể làm cho việc tối ưu hoá leo dốc thực sự khó khăn. Một trong những đỉnh địa phương này sẽ là điều kiện tối ưu toàn cục, nhưng có thể có một số lượng đỉnh địa phương cho độ tương thích tương tự. Mặt phản ứng cũng có thể rất bất thường hoặc lởm chởm (xem Blackie và Eales 1985 cho ví dụ 2-thông số tốt và cũng được bàn đến trong Sorooshian và Gupta 1995). Lại một lần nữa điểm khởi

đầu khác nhau đối với thuật toán leo dốc có thể đưa tới những giá trị cuối cùng rất khác nhau. Hầu hết các thuật toán như vậy sẽ tìm được điều kiện tối ưu cục bộ gần nhau, nó không thể là tối ưu toàn cục.

Đây không phải là một ví dụ phức tạp về mặt toán học; có thể có nguyên nhân về

mặt vật lý giải thích tốt tại sao sự việc có thể như vậy. Nếu một mô hình có những thành phần sinh dòng chảy vượt thấm, vượt bão hoà hoặc dòng chảy sát mặt (chúng ta hy vọng nhiều hơn 2 thông số trong trường hợp này) thì sẽ có những bộ thông số cho một độ tương thích tốt đối với thuỷ đồ khi sử dụng cơ chế vượt thấm; những bộ cho độ tương thích tốt sử dụng cơ chế vượt bão hoà, bộ thông số phù hợp tôt bởi dòng chảy sát mặt; và thậm chí nhiều bộ hơn cho độ tương thích tốt bởi sự pha trộn của cả 3 quá

trình (xem Beven và Kirkby 1979 cho một ví dụ sử dụng TOPMODEL nguyên thuỷ).

Đỉnh địa phương khác nhau thì có thể nằm ở những phần rất khác nhau trong không gian thông số.

Hình 7.2. Bề mặt phản ứng phức tạp hơn trong 2 chiều không gian thông số. (a). Vùng phẳng của bề mặt phản ứng không nhạy với sự phù hợp trong khi thay đổi thông số. (b). Nhiều đỉnh trên bề mặt

phản ứng chỉ ra nhiều đỉnh cục bộ. (c). Sống trên bề mặt phản ứng phản ảnh tương tác thông số.

Các kiểu thể hiện trên hình 7.2 có thể làm cho việc tìm tối ưu toàn cục trở nên khó khăn để đưa ra được kết luận cuối cùng. Hầu hết các bài toán tối ưu hoá thông số liên quan tới nhiều hơn 2 thông số. Để có được ấn tượng về khó khăn phải đối mặt, hãy cố gắng tưởng tượng một số lượng đỉnh địa phương sẽ trông giống một cái gì đó trên bề mặt phản ứng 3 thông số; rồi một mặt 4 thông số, vân vân. Một vài cải tiến đã được thực hiện trong việc hình dung mặt phản ứng nhiều chiều hơn trong máy tính nhưng việc cố gắng hình dung một mặt như vậy chẳng mấy chốc làm mệt mỏi cho bộ não nhỏ bé (thậm chí cả với những chuyên gia làm mô hình thuỷ văn). Thuật toán leo dốc hiện

đại được trình bày trong mục 7.4 được thiết kế rất mạnh để giải quyết sự phức tạp như thế của bề mặt phản ứng.

Tuy nhiên, có cách khác để tiếp cận vấn đề, nghĩa là bằng thiết kế những mô hình thuỷ văn để tránh những bài toán hiệu chỉnh như thế. Chẳng hạn một mô hình có thể

được cấu trúc để tránh kiểu thông số dung lượng lưu trữ ngưỡng cực đại đưa đến chỉ kích hoạt với bước thời gian nhỏ. Công trình đầu tiên theo kiểu tiếp cận này trong mô

hình mưa-dòng chảy được thực hiện bởi Rechard Ibbitt (xem Ibbitt và O’Donnell 1971,1974) khi sử dụng mô hình kiểu ESMA nhận thức. Trong khi đó, như đã lưu ý trong mục 6.2, mô hình PDM được hình thành ban đầu bởi Moore và Clark (1981) cũng từ ý tưởng này. Tất nhiên, thường thì các mô hình không được thiết kế như vậy.

Những khái niệm thuỷ văn được đưa ra gồm những bài toán hiệu chỉnh thông số, đặc biệt là trong các mô hình dựa trên vật lý. Tuy nhiên, đối với bất kỳ mô hình nào mà buộc phải hiệu chỉnh theo cách này, những quan tâm này sẽ là thích đáng.

Có những bài toán cụ thể trong việc đánh giá bề mặt phản ứng và độ nhạy của thông số trong những mô hình phân bố, ít nhất là vì có một lượng rất lớn các giá trị thông số liên quan và khả năng tương tác giữa các thông số trong việc xác định trường phân bố của chúng. Điều này sẽ để lại một khó khăn cho tương lai thấy trước và chỉ những cách làm khôn ngoan trong việc hiệu chỉnh các mô hình phân bố xuất hiện để khẳng định rằng hầu hết, nếu không phải tất cả, các thông số được cố định (có lẽ trong vòng một phạm vi nào đó khả thi, như trong Parkin và nnk 1996) hoặc được hiệu chỉnh với một vài quan trắc phân bố và lưu lượng lưu vực không đơn độc (như Franks và nnk 1988 và Lamb và nnk 1998). Những vấn đề đặc biệt của việc hiệu chỉnh các mô

hình phân bố đã được thảo luận ngay từ mục 5.1.1 và 5.7 7.2.1 Đánh giá độ nhạy thông số

ảnh hưởng của việc hiệu chỉnh thông số sẽ được tăng cường rõ rệt nếu có thể tập trung nỗ lực lên các thông số này để kết quả mô phỏng mô hình là nhạy nhất. Điều này đòi hỏi một cách tiếp cận để đánh giá độ nhạy thông số với một cấu trúc mô hình phức tạp. Độ nhạy có thể được đánh giá với sự lưu tâm đến cả biến dự báo (như đỉnh lưu lượng, thể tích lưu lượng, mực nước ngầm, tốc độ tuyết tan...) hoặc phép đo hoạt

động nào đấy (xem mục sau). Cả hai có thể là những thành phần của bề mặt phản ứng tương ứng của chúng trong không gian thông số. Một định nghĩa của độ nhạy của kết quả mô phỏng mô hình đối với một thông số cụ thể là gradient địa phương của bề mặt phản ứng theo hướng của trục toạ độ thông số được chọn. Định nghĩa này có thể được dùng để xác định chỉ số độ nhạy, chuẩn hoá dưới dạng sau:

i i

i x

dzdx

S  (7.1)

trong đó, Si là chỉ số độ nhạy liên quan tới thông số i với giá trị xi, và z là giá trị của biến hoặc phép đo hoạt động tại điểm đó trong không gian thông số (xem McCuen 1973). Gradient sẽ được đánh giá một cách địa phương, khi cho những giá trị của các

thông số khác, hoặc bằng giải tích cho những mô hình đơn giản, hoặc bằng phương pháp số bởi một sai phân hữu hạn, nghĩa là bằng việc đánh giá thay đổi trong z khi xi

được thay đổi bởi một lượng nhỏ (1%). Bởi vì kết qủa mô phỏng phụ thuộc và tất cả các thông số nên độ nhạy Si đối với bất kỳ thông số cụ thể i nào sẽ có xu hướng biến đổi thông qua không gian thông số (như được minh hoạ bởi hình 7.2). Chính vì lý do này,

độ nhạy thường được đánh giá trong vùng gần nhất với bộ thông số ước lượng tốt nhất hoặc bộ thông số tối ưu đã xác định, sau khi thực hiện việc hiệu chỉnh mô hình.

Tuy vậy, đây là một ước lượng rất địa phương của độ nhạy trong không gian thông số. Một phép ước lượng mang tính toàn cục hơn nhìn chung có thể cho một ước lượng tốt hơn của một thông số trong cấu trúc mô hình. Hiện sẵn có một số kỹ thuật phân tích độ nhạy toàn cục. Nhưng một từ chúng đưa ra những giả thiết tối thiểu về hình dạng của mặt phản ứng được biết với nhiều dạng như phép phân tích độ nhạy tổng quát hoá (GSA), phép phân tích độ nhạy khu vực hoá (RSA) hay phương pháp Hornberger- Spear- Young(HSY) (xem Hornberger và Spear 1981; Young 1983; Beck 1987) chúng là tiền thân của phương pháp GLUE được mô tả trong mục 7.6. Phương pháp HSY được dựa trên mô phỏng Monte-Carlo. Mô phỏng Monte-Carlo sử dụng nhiều lần chạy khác nhau của một mô hình, với mỗi lần chạy sử dụng một bộ thông số

được chọn một cách ngẫu nhiên. Trong phương pháp HSY, giá trị thông số được chọn từ những phân bố đồng nhất mở rộng giới hạn xác định của mỗi thông số. Các giới hạn sẽ phản ánh giá trị thông số khả thi trong một ứng dụng cụ thể. ý tưởng là để nhận

được một mẫu mô phỏng mô hình thông qua không gian thông số khả thi. Những mô

phỏng này được phân chia theo một số cách được coi là có hành vi và phi hành vi trong mối liên hệ với hệ thống đang nghiên cứu. Mô phỏng hành vi có thể là những mô

phỏng với một giá trị cao của một biến hoặc phép đo hoạt động chắc chắn; mô phỏng phi hành vi có thể thực hiện với giá trị thấp.

Phép phân tích độ nhạy HSY thì tìm sự khác nhau giữa chuỗi hành vi và phi hành vi đối với mỗi thông số. Thực hiện việc này bằng cách so sánh phân bố tích luỹ của thông số trong mỗi chuỗi (ví dụ hình 7.3). ở đâu có sự khác biệt lớn giữa hai phân bố đối với một thông số, có thể kết luận rằng việc mô phỏng là nhạy đối với thông số đó (hình 7.3b). Nơi nào có hai phân bố rất giống nhau có thể kết luận là việc mô phỏng không nhạy với thông số đó (hình 7.3c). Độ đo định lượng sự khác nhau giữa các phân bố có thể được tính bằng cách sử dụng thống kê d Kolmogorov-Smirnov phi thông số.

Mặc dù đối với một lượng mô phỏng lớn, cách kiểm tra này không mạnh và sẽ đưa ra rằng những khác biệt nhỏ là có ý nghĩa về mặt thống kê. Tuy nhiên thống kê d có thể

được sử dụng như là chỉ số của sự sai khác tương đối. Cách tiếp cận này có thể được mở rộng, cung cấp mẫu mô phỏng Monte-Carlo đầy đủ, cho nhiều hơn hai bộ thông số (mục mềm GLUE dùng 10 lớp khác nhau trong việc đánh giá độ nhạy). Những thí dụ khác sử dụng phương pháp HSY trong mô hình mưa-dòng chảy bao gồm Horberger (1985) sử dụng TOPMODEL và Harlm và Kung(1992) dùng mô hình HBV. Phương pháp HSY là phương pháp phi thông số của phép phân tích độ nhạy trong đó nó đưa ra những giả thiết không sớm về sự biến đổi hay hiệp phương sai của những giá trị thông số khác nhau, nhưng chỉ đánh giá những bộ giá trị thông số trong dạng hoạt

động của chúng.

Phân tích độ nhạy và bề mặt phản ứng thông số

Sự biến đổi của đường đơn vị

Số liệu số hoá độ cao