ngẫu nhiên
2.11.1 Tập số liệu ch−a đầy đủ
Trong phân tích thủy văn rất hiếm khi có đ−ợc một tập số liệu đầy đủ. Vì vậy phải chọn một số gần đúng để vận dụng các tập số liệu ch−a đầy đủ này. Thông th−ờng có xu h−ớng phù hợp các số liệu thời gian thiếu với số liệu đã phân tích. Nếu số liệu thiếu không nhiều và chúng đựơc sử dụng nh− các đ−ờng cong thời gian dòng chảy hay các quan hệ độ dày - diện tích, sau đó sử dụng một ph−ơng trình hồi qui hay một số ph−ơng pháp khác để tính thời gian bị thiếu hụt, là phù hợp. Tuy nhiên, nếu số liệu đ−ợc sử dụng trong việc phát triển một mô hình ngẫu, nhiên các ph−ơng pháp phân tích số liệu này sẽ lệch với giá trị quan trắc và nó không thích hợp.
Số liệu lịch sử liên tiếp, đặc biệt các số liệu này kết hợp với việc đánh giá cho nhiều trạm, chắc chắn không hợp lý và t−ơng đ−ơng
Với các tập số liệu không đầy đủ đó: ma trận t−ơng quan cỡ 0, M(0) có thể không thích hợp và không chính xác vì ma trận nghịch đảo của ma trận này đ−ợc sử dụng trong mô hình tự hồi quy Markov, để tính ma trận A, (ph−ơng trình (2.46) phải thích hợp. Nếu nó không thích hợp thì các giá trị ảo của nó sẽ không chính xác và một số phần tử của A sẽ là các số phức. Fering (1968) đã phát biểu rằng: nếu tất cả các giá trị ảo của M(0) là chính xác, và chúng cộng với cỡ của ma trận thì ma trận là thích hợp. Nếu ma trận không thích hợp, ông đã trình bày hai ph−ơng pháp để vận dụng nó.
- Ph−ơng pháp thứ nhất là vận dụng các giá trị ảo tùy theo một số sơ đồ đã ấn định tr−ớc hay tùy thuộc vào thuật toán.
- Ph−ơng pháp thứ hai vận dụng nó là sắp xếp ma trận bằng cách sử dụng ph−ơng pháp đơn giản tùy ý. Ph−ơng pháp đầu tiên của Fiering là tiện lợi nhất. Xem Fiering (1968).
Crosby và Maddock đã l−u ý rằng nếu các ma trận (M(0) và M(1) thích hợp tự hồi quy cấp 1. Có thể sẽ không thích hợp nếu đều đặn và liên tục từ sự khởi đầu tới khi kết thúc thời gian phân tích chúng, mặc dù mỗi chuỗi có thể đã
bắt đầu tại mỗi thời điểm khác nhau. Ma trận BBT có thể đ−ợc làm cho thích hợp bằng một ph−ơng pháp mà họ mô tả.
2.11.2 Sự t−ơng tự ngẫu nhiên của các chuỗi
Trong phần tr−ớc chúng tôi đã nhận xét t−ơng quan chệch. Trong phần này chúng tôi sẽ giải thích chi tiết hơn về tham số độ chệch và cách lựa chọn nó. Thông tin bổ sung về độ chệch đ−ợc trình bày trong phần −ớc l−ợng tham số của ch−ơng này.
Các tham số đ−ợc sử dụng để mô tả đặc điểm hiện t−ợng thủy văn và lập ra chuỗi tổng hợp bằng các ph−ơng trình khác nhau. Ngoài các tham số chính là kỳ vọng, àp, ph−ơng sai 2; độ lệch, g
p
σ p, t−ơng quan quan hệ bậc nhất, ρp (1), t−ơng quan kết hợp bậc không ρp,q(0), t−ơng quan kết hợp bậc nhất ρp,q(1) và hệ số Hursp Hp. Trong nghiên cứu các quy trình thủy văn, các giá trị thực của các tham số này ch−a biết. Vì vậy, ta phải −ớc l−ợng giá trị các tham số đó từ số liệu quan trắc lịch sử. Rất hiếm khi các giá trị quan trắc lịch sử t−ơng đối ngắn này tiến đến giá trị thực. Nó rất quan trọng do thừa nhận rằng các giá trị tính đ−ợc này không nhất thiết phải bằng các giá trị thực, và cần tính đ−ợc các độ tin cậy của các giá trị này. Các ph−ơng pháp sử dụng cho mục đích này có trong hầu hết các tài liệu thống kê. Nh− Mood (1974) và Miller và Freund (1977) đã đ−a ra nhiều ví dụ bàn về các khoảng tin cậy, cả 2 khoảng tin cậy liên tiếp đ−ợc nói đến của các hệ số hồi quy đều rất quan trọng trong việc đánh giá mô hình. Hoan (1977) và Jevjjevich (1972 a,b) đã đ−a ra các khoảng tin cậy khi họ áp dụng vào các quá trình thủy văn.
Ngoài ra, với thừa nhận giả sử: có thể chấp nhận độ lệch của một đặc tr−ng thống kê với giá trị thực của nó, ta phải lựa chọn các tham số khác nhau cho độ lệch để lập ra các chuỗi giống với số liệu lịch sử. Sự giống nhau thống kê đ−ợc định nghĩa trong cả chuỗi dài (cho chuỗi có chiều dài tiến đến tới hạn) và trong chuỗi ngắn (cho chuỗi có chiều dài số liệu quan trắc).
Gọi ω là một tham số đặc tr−ng cho một hiện t−ợng thủy văn đặc biệt. Mặc dù nó là gía trị ch−a biết, số liệu lịch sử có thể đ−ợc sử dụng để tính giá trị của nó . Nếu tham số này đ−ợc sử dụng trong khi lập các chuỗi tổng hợp thì về thực tế nó trở thành một giá trị thông dụng. Một chuỗi đ−ợc lập có chiều
dài bằng , tham số sẽ nhận giá trị ~n ω~, khi ~n→∞, xấp xỉ số liệu lịch sử ωˆ . Trong tr−ờng hợp này các chuỗi tổng hợp đ−ợc coi nh− giống với l−u l−ợng dòng chảy đã có trong chạy dài liên qua tới ωˆ . Nếu độ dài chuỗi tiến đến L và chuỗi đ−ợc lập với độ dài mỗi chuỗi ~n thì sẽ cho ta −ớc l−ợng đ−ợc tức là tính đ−ợc
n ~
ωˆ
ω
~. Giá trị kỳ vọng của chuỗi này ω~* khi ~n→∞,. Nếu giá trị nhận đ−ợc của ω~ bằng với ~ω*thì các chuỗi tổng hợp đ−ợc coi nh− bằng với l−u l−ợng dòng chảy lịch sử có trong chạy ngắn liên quan tới ωˆ . Thông th−ờng sự chạy ngắn giống nhau biểu thị với chạy dài giống nhau nh−ng chạy dài giống nhau không cần thiết phải biểu thị chạy ngắn giống nhau. Giá trị thống kê của ω~ và
chạy ngắn giống nhau không giữ lại, do đó để đạt đ−ợc chạy ngắn giống nhau, các giá trị tham số phải đ−ợc điều chỉnh tr−ớc khi nó đ−ợc sử dụng trong các mô hình (Matalar, 1977) chỉ có giá trị của à~ là một −ớc l−ợng của kỳ vọng à, trong các tham số trên là −ớc l−ợng không chệch.
Sự chỉnh độ chệch trong tất cả các tham số khác tùy thuộc vào độ dài của các chuỗi tổng hợp đ−ợc lập. Cấu trúc toán học của mẫu số liệu tổng hợp và hàm phân bố đ−ợc sử dụng để tạo ra đầu vào cho mẫu. Cách biểu diễn phân tích các điều chỉnh đã không đ−ợc phát triển. Tuy nhiên, cách tiến hành của Monte Carlo đã đ−ợc sử dụng để −ớc l−ợng sự hiệu chỉnh độ chệch, hệ số tự t−ơng quan và tham số Hurst cho một trạm đơn Markov tự hồi quy và các quá trình lọc tạp âm loại 2. Các bảng đ−ợc biểu thị để giúp tạo ra các hiệu chỉnh. Trong phát triển các hiệu chỉnh của Monte Carlo, hàm phân bố của các số liệu đầu vào tùy ý đã đ−ợc thừa nhận là có phân bố chuẩn, và một chuỗi số liệu tổng hợp có chiều dài bằng 100 đã đ−ợc sử dụng. O'Connell (1977b) đã mô tả sự
−ớc l−ợng tham số và sự hiệu chỉnh độ chệch quá trình ARIMA (1, 0, 1) theo ph−ơng pháp Monte Carlo. Giá trị của φ và θ lần l−ợt là các trễ tự hồi quy và tổng chuyển động trung bình, đ−ợc lựa chọn để −ớc l−ợng chệch các giá trị của hệ số Hurst và các hệ số tự t−ơng quan bậc nhất thay đổi. Các giá trị độ dài chuỗi, hệ số tự t−ơng quan và φ sau đó đ−ợc sử dụng để hiệu chỉnh ph−ơng sai. Trong sự phát triển của các bảng (biểu đồ) này, đầu vào cho một mô hình đã đ−ợc thừa nhận là một quá trình chuẩn, xem Matalar và Wallis (1974), Wallis và cộng sự (1974), Box và Jenkins (1976) và O'Connell để biết rõ hơn về thông tin và các biểu đồ của các cách hiệu chỉnh này.
Mặc dù thế, các ph−ơng pháp độ chệch đã không đ−ợc phát triển cho tất cả các mô hình đ−ợc giới thiệu trong ch−ơng này. Nh−ng các cách hiệu chỉnh đ−ợc nói đến ở trên áp dụng cho các mô hình thông dụng nhất đ−ợc sử dụng trong đánh giá thủy văn.
2.11.3 Tạo số ngẫu nhiên
Sử dụng các mô hình ngẫu nhiên rất có thể sẽ liên quan tới sự lập ra chuỗi các số hay các véc tơ tuỳ ý. Các chuỗi này không nhỏ vì máy tính tự động tạo số các số giả định có các tính chất t−ơng tự chúng theo tiêu chuẩn bằng con đ−ờng đã gợi ý. Việc xem xét sử dụng đ−ợc khép lại việc thay đổi mẫu có thể có nguyên nhân nào đó không thích hợp khác giữa chuỗi mới tạo và chuỗi gốc.
Ng−ời sử dụng số l−ợng mẫu bất kỳ nên kiểm tra hoặc đảm bảo rằng nó đã đ−ợc làm rõ đặc điểm khác với các giá trị lý thuyết. Đặc biệt các bài toán này có thể có ý nghĩa trong phân tích, Leweis và Payne (1973) đã lập danh sách một số cách kiểm tra có thể đ−ợc sử dụng và đã mô tả một mẫu có một số đặc tr−ng mô tả sự mở rộng các tr−ờng tái tạo luân phiên mẫu mà họ đã mô tả có thể dùng làm cho việc tính toán rất nhanh có một chu kỳ tự nhiên, lập ra một số cực lớn của các giá trị tr−ớc khi nó lặp lại tùy thuộc vào khả năng làm việc của máy tính. Các thiết bị khác nhau đ−a ra chuỗi t−ơng tự nhau và có các đặc tr−ng tốt đối với các véc tơ bất kỳ (hay ít nhất là không có đặc tr−ng tốt của một số mẫu). Thích hợp nhất cho việc này là sử dụng ch−ơng trình trên ngôn ngữ FORTRAN.
2.12 lựa chọn mô hình
Trong phần đầu của ch−ơng này đã bàn đến một số mô hình ngẫu nhiên khác nhau của các quá trình thủy văn. Trên cơ sở các thí dụ đã dẫn, ng−ời dùng có thể chọn một mô hình phù hợp nhất với yêu cầu của họ. Tuy nhiên, khái niệm mô hình này có thể không sáng sủa lắm: mô hình đ−ợc chọn không đủ mạnh để mô tả quá trình. Một số điểm có thể quan tâm trong sự lựa chọn quy trình bao gồm:
b) Tính năng sử dụng của mô hình. c) Chất l−ợng số liệu đang có.
d) Cách giải quyết dựa vào kết quả việc sử dụng mô hình.
Trong khi nghiên cứu bản chất vật lí của các quá trình có liên quan, ng−ời nghiên cứu nên đặt ra câu hỏi và cố gắng trả lời các câu hỏi đó nh−: Các quá trình mà tác động để tạo ra hiện t−ợng nghiên cứu là gì? Cách giải quyết các quá trình đó có giống nh− giải quyết các quá trình ngẫu nhiên không? Các quá trình có độc lập không? Các quá trình có phụ thuộc vào thời gian không? Quá trình có ổn định không? Các sự thay đổi mà con ng−ời đã tạo ra phải đ−ợc đ−a ra trong t−ơng lai, nếu nh− vậy thì biểu diễn nh− thế nào?
Ngoài ra trong khi nghiên cứu bản chất của các quá trình có liên quan, khả năng sử dụng của mô hình cũng phải đ−ợc quan tâm, cần bao nhiêu thông tin cho quá trình đang đ−ợc mã hóa? Số liệu cần đ−ợc xét trong khoảng thời gian ngắn hàng tháng hay số liệu đầy đủ hàng năm? Tầm quan trọng của những thứ đó (nh− hiện t−ợng Hurst) nh− thế nào, nó có đúng đ−ợc đ−a vào mô hình không? Ng−ời sử dụng mô hình ngẫu nhiên chủ yếu quan tâm đến tập hợp trạng thái của quá trình nhiều hơn là quan tâm đến việc mô tả chi tiết quá trình. Do đó ng−ời nghiên cứu cần lọc những quá trình có ý nghĩa quan trọng từ tất cả các quá trình phức tạp.
Đặc tính mô tả một hiện t−ợng của số liệu thủy văn ảnh h−ởng tới bài toán lọc thông tin hữu ích từ các quá trình phức tạp mà đã gây ảnh h−ởng. Một số mô hình có thể có khả năng mô tả quá trình t−ơng tự và với một quy mô lớn. Sự lựa chọn của con ng−ời đ−ợc sử dụng tùy thuộc vào sự so sánh số liệu mẫu và đầu ra của mô hình. Ng−ời làm mô hình cần phân tích các sự khác nhau giữa chúng. Một phần sai số có thể có trong cấu trúc của mô hình, nó không thích hợp với cấu trúc của quá trình thực. Trong một số tr−ờng hợp việc thêm vào một số thành phần của mô hình có thể cải tiến đ−ợc mô hình. Nh−ng trong một số tr−ờng hợp khác, việc thêm vào mô hình nhiều thành phần hơn, ảnh h−ởng tới các tham số mô hình bằng các sai số đó, có thể không phải luôn có, nh−ng có thể làm sai lệch, cũng có thể dẫn tới sai số biểu kiến trong khi làm mô hình. Cần cố gắng đánh giá các sai số này. Một số nguyên nhân khác dẫn
đến việc làm mô hình không đ−ợc tốt là sai số xuất hiện do mức độ cần thiết phải −ớc l−ợc giá trị tham số dựa trên số liệu quan trắc và nó có thể không tiêu biểu và rất ngắn. Khi tính tiêu biểu tăng dẫn tới các sai số này giảm.
Kết quả là, trong sự lựa chọn mô hình, việc quyết định dựa vào kết quả của việc sử dụng mô hình phải đ−ợc quan tâm. Với một quy mô lớn, các quyết định này sẽ dùng tiêu chuẩn mà có thể đ−ợc sử dụng để đánh giá việc làm mô hình. Ví dụ, giả sử rằng các chuỗi số liệu dòng chảy sẽ đ−ợc sử dụng để xác định độ rộng của một cái đập dùng để cung cấp n−ớc. Trong tr−ờng hợp này mô hình đ−ợc lựa chọn và −ớc l−ợng các tham số của nó theo cách đó để làm giảm tới mức tối thiểu chi phí vốn không chắc chắn trong các quyết định liên quan tới độ rộng của đập.
Ng−ợc lại, giả sử số liệu l−ợng m−a đã sử dụng để nghiên cứu sự thay đổi theo không gian của độ ẩm của đất trong khi đánh giá các điều kiện mùa màng. Trong tr−ờng hợp này, mô hình và các tham số của nó phải đ−ợc chọn lựa để giảm thiểu đầu t− vốn vào sự t−ới hoặc sự giảm năng suất do hạn hán kéo theo sự phát triển cực hạn. Đây là các ví dụ đơn giản nh−ng chúng có tác dụng chỉ ra những gì cần thiết cho ng−ời quyết định lựa chọn, ng−ời đó có thể ch−a biết bằng cách nào để đánh giá đ−ợc chất l−ợng của mô hình.
2.13 −ớc l−ợng các tham số
−ớc l−ợng tham số là bài toán không chỉ liên quan tới mô hình mẫu mà còn liên quan tới hầu hết các mô hình đã đ−ợc giới thiệu trong cuốn tài liệu này. Sự khác nhau chỉ nằm trong các tham số của các mô hình ngẫu nhiên, không chỉ trong các mô hình tổng số mà trong thực tế tất cả nhân tố của một mô hình ngẫu nhiên là các đặc tr−ng phân bố xác suất. Trong các phần đầu của ch−ơng này, các ph−ơng pháp −ớc l−ợng các tham số đã đ−ợc đề cập đến nh−ng d−ờng nh− chỉ nói đến một cách chung chung các cách −ớc l−ợng tham số và một số đặc tr−ng của các ph−ơng pháp −ớc l−ợng này.
2.13.1 Các đặc tr−ng của các tham số −ớc l−ợng
Để đánh giá đ−ợc mặt mạnh và yếu của các ph−ơng pháp −ớc l−ợng, tr−ớc hết các khái niệm về ph−ơng sai nhỏ nhất và tính nhất quán, tính khả
năng và tính đầy đủ khi ng−ời ta kết hợp để −ớc l−ợng thông số sẽ đ−ợc giới thiệu ngắn gọn. Các số hạng này sẽ đ−ợc dùng để diễn tả cách tiến hành 3 ph−ơng pháp −ớc l−ợng thông số: ph−ơng pháp các mô men, ph−ơng pháp bình ph−ơng tối thiểu và ph−ơng pháp thích hợp tối đa. Cuối cùng, định lý Bayes sẽ đ−ợc nghiên cứu nh− ph−ơng pháp mà có thể đ−ợc sử dụng để cải tiến việc −ớc l−ợng các giá trị thông số hoặc là với các số liệu, hoặc là với các điều kiện đ−a ra các sự sử dụng của nó. Chi tiết hơn về tất cả các quá trình này, tham khảo trong phần phụ lục của hầu hết các tài liệu thống kê toán học và các chú thích đ−ợc trích dẫn trong lời mở đầu của ch−ơng này.
Ph−ơng sai nhỏ nhất và tính không chệch: Tập hợp các thay đổi của
thủy văn có lợi nhiều đối với mô tả hệ thống của chúng ta thì còn ch−a biết. Bởi vì ta chỉ thực hiện đơn giản từ tập có sẵn các biến có thể tập hợp lại từ các thay đổi. Do chúng ta không biết tập hợp, không biết các tham số θi, mô tả trong tập hợp có nghĩa là không biết các tham số cần cho mô hình của chúng ta