1.4.1.1 Tính ngẫu nhiên trong thủy văn:
Trong nhiều lĩnh vực của cuộc sống như môi trường, thủy văn, y tế, sinh học, kinh tế…luôn tồn tại những hiện tượng có mối quan hệ lẫn nhau. Phân tích chúng bằng công cụ toán học thống kê ta thấy quan hệ giữa các hiện tượng rất đa dạng, có những quan hệ cơ bản và có những quan hệ không cơ bản. Hình thức đặc trưng cơ bản là sự liên hệ nhân quả, trong quan hệ này một hiện tượng biểu hiện sự tồn tại (xuất hiện, biến đổi, biến mất,…) phụ thuộc vào hiện tượng khác (có mưa sẽ sinh ra dòng chảy), bên cạnh đó một hiện tượng là nguyên nhân tác động đến hiện tượng khác (là hậu quả, kết quả). Như vậy trong quan hệ nhân quả này mỗi hiện tượng vừa là nguyên nhân đồng thời vừa là kết quả của một hiện tượng khác.
Để có thể nghiên cứu những hiện tượng nói trên cần phải phân lập chúng, nhưng mặt khác phải hiểu mỗi hiện tượng như là một bộ phận của cả hệ thống cũng như tính chất quan hệ tượng hỗ giữa các hiện tượng.
Mô tả và nghiên cứu các tập hợp nhiều yếu tố về thực chất là nghiên cứu mối liên hệ giữa hai hay nhiều yếu tố có tính thống kê và phản ánh những đặc trưng của tập hợp. Chúng ta cần phân tích sự liên hệ giữa các yếu tố chúng ta vẫn chưa làm rõ các tính chất của tập hợp. Cần nhấn mạnh sự liên hệ nào có ý nghĩa, liên hệ nào không có ý nghĩa.
Tùy theo mức độ liên hệ giữa một hiện tượng này với hiện tượng khác, chúng ta phân biệt hai kiểu liên hệ cơ bản:
- Liên hệ tất yếu. - Liên hệ mở.
1) Liên hệ mở là đối tượng của nghiên cứu thống kê nên gọi là liên hệ thống kê.Nghiên cứu liên hệ thống kê giữa hai hay nhiều yếu tố là nghiên cứu ảnh hưởng giữa mức độ thay đổi của biến độc lập đến mức độ thay đổi của các biến phụ thuộc. Mối liên hệ đó gọi là liên hệ hồi quy – tương quan. Nội dung nghiên cứu liên hệ thống kê bao gồm việc thực hiện hai nhiệm vụ cơ bản:
- Nghiên cứu hồi quy. - Nghiên cứu tương quan.
2) Các kiểu liên hệ tương quan: Tùy theo quan điểm khác nhau chúng ta có thể phân biệt:
- Theo số lượng yếu tố:
+ Tương quan đơn tố: phân tích liên hệ giữa hai yếu tố.
+ Tương quan đơn bội hay đa số: nghiên cứu liên hệ giữa nhiều yếu tố định lượng.
- Theo kiểu hàm hồi quy: + Liên hệ tương quan tuyến tính.
+ Liên hệ phi tuyến tính.
- Theo chiều hướng thay đổi của các yếu tố tham gia liên hệ:
+ Liên hệ tương quan dương (thuận) : sự thay đổi của yếu tố theo cùng một chiều hướng tăng hoặc giảm.
+ Liên hệ tương quan âm (nghịch) : sự thay đổi của các yếu tố không theo cùng một chiều hướng, một yếu tố tăng thì yếu tố kia giảm hoặc ngược lại.
1.4.1.2 Cơ sở của mô hình:
Phương trình tuyến tính biểu hiện mối liên hệ giữa nhiều tiêu thức có dạng tổng quát như sau:
Y x1,x2,...,xn=a0 +a1.x1 +a2.x2 +...+an.xn (3.1)
Trong đó: x1,x2,…,xn là các tiêu thức nguyên nhân. ai(i=0,1,2,3,…,n) là các tham số.
Mối quan hệ giữa đại lượng (biến) phụ thuộc và đại lượng (biến) độc lập là mối quan hệ đường thẳng.
Các đại lượng độc lập có thể là các đại lượng liên tục hoặc rời rạc. Sai số tính
toán giữa giá trị thực đo và tính toán là tuân theo luật phân bố chuẩn với giá trị trung bình là 0.
Các hệ số ai được xác định bằng phương pháp bình phương nhỏ nhất và ai - phải thõa mãn hệ phương trình sau:
Để đánh giá trình độ chặt chẽ mối liên hệ tương quan tuyến tính giữa nhiều tiêu thức người ta thường dùng hai loại hệ số tương quan là: hệ số tương quan bội và hệ số tương quan riêng.
Hệ số tương quan bội:
Hệ số tương quan bội (ký hiệu là R) dùng để đánh giá trình độ chặt chẽ của mối liên hệ giữa tiêu thức kết quả với tất cả các tiêu thức nguyên nhân được nghiên cứu.
Hệ số tương quan bội được tính theo công thức: ∑ ∑ − − − = 2 2 ,..., 2 , 1 ,..., 2 , 1 , ) ( ) ( 1 y y y y Ryx x xn x x xn (3.2) + + + + = … … … … + + + + = + + + + = + + + + = ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ 2 2 2 1 1 0 2 2 2 2 1 2 1 2 0 2 1 2 1 2 2 1 1 1 0 1 2 2 1 1 0 ... . ... ... ... . n n n n n n n n n n n n x a x x a x x a x a y x x x a x a x x a x a y x x x a x x a x a x a y x x a x a x a a n y
Hệ số tương quan bội bao giờ cũng dương và nằm trong phạm vi từ 0 đến 1. Tùy theo trị số R lớn hay nhỏ mà kết luận trình độ chặt chẽ của mối liên hệ.
Các tính chất của hệ số tương quan bội R: + Nếu R=0 thì không có liên hệ tuyến tính. + Nếu R càng gần đến 1 thì mối liên hệ càng chặt chẽ.
+ Nếu R=1 thì có mối liên hệ hàm số. Các bước phân tích hồi quy nhiều biến:
Bước 1: Xây dựng ma trận tương quan
Ma trận tương quan là ma trận đơn vị, có đường chéo chính bằng 1. Các phần tử của ma trận đối xứng qua đường chéo chính. Các phần tử của ma trận chính là các hệ số tương quan của các đại lượng ngẫu nhiên độc lập và quan hệ của các đại lượng này với đại lượng phụ thuộc.
Mục đích của việc xây dựng ma trận tương quan để nhằm loại bỏ tính đa tuyến làm méo hệ số quan hệ, đồng thời lựa chọn một cách tốt nhất các biến độc lập đưa vào phân tích tương quan, làm giảm thời gian tính toán. Điều này có thể giải thích vắn tắt như sau: khi hai biến độc lập đều có tương quan chặt chẽ với biến phụ thuộc, nhưng giữa chúng cũng có một tương quan rất chặt chẽ (hệ số tương quan lớn hơn 0.8), như vậy chúng ta có thể loại bỏ một biến độc lập khi phân tích hồi quy nhiều biến, vì sự tham gia của biến kia có thể bóp méo, hoặc làm giảm hệ số
tương quan bội. Tuy nhiên trong trường hợp hệ số tương quan bội lớn hơn hệ số tương quan của 2 biến kia, thì ta vẫn có thể giữ biến kia trong phương trình tương quan, vì nó vẫn đóng góp vào tính chặt chẽ của hệ số tương quan bội.
Bước 2: Xây dựng các phương trình hồi quy
- Có thể sử dụng phần mềm Microsoft Excel, SPSS. - Xây dựng các biến theo các tổ hợp khác nhau.
Bước 3: Kiểm định thống kê
a) Phép thử toàn cục (Ftest):
Phép thử toàn cục dùng để trắc nghiệm sự tồn tại của hệ số tương quan bội. Giả thiết H0: R2=0
Kết luận biến lượng: F=
) 1 (n−k− SSEk SSR (3.3) Nếu Ftính< Fbảng ở độ tự do k và (n-k-1): chấp nhận giả thiết H0: R2=0, biến thiên do sai lệch chiếm tỷ trọng lớn hơn so với biến thiên tương quan, R2 của hồi quy không thật sự tồn tại ở mức ý nghĩa α =0.05 hoặc 0.01. Nếu Ftính >Fbảng ở độ tự do k và (n-k-1): bác bỏ giả thiết H0, chấp nhận giả thiết H0: R2<>0, biến thiên do sai lệch chiếm tỷ trọng nhỏ hơn so với biến thiên do tương quan. R2 của hồi quy thật sự tồn tại với xác suất 1-α chứng tỏ tổ hợp tuyến tính của k góp phần có ý nghĩa vào sự biến thiên của biến phụ thuộc Y.
b) Phép thử riêng biệt (Ttest):
Nhằm đánh giá từng đại lượng ngẫu nhiên liệu có ảnh hưởng đến đại lượng dự báo không. Phép thử này đưa ra 2 giả thiết sau: Giả thiết H0: β = 0
Giả thiết H1: β ≠ 0
Trong quá trình kiểm tra ta sử dụng hàm phân bố t với bậc tự do là n-(k+1). Giá trị t giới hạn được tra bảng với độ tin cậy là 95%. Với ttt= n s X ) ( −µ (3.4) Trong đó: X : giá trị trung bình.
μ : giá trị kỳ vọng. s : sai số quân phương. n : số phần tử.
Khi giá trị ttt nằm ngoài khoảng giới hạn của tđk thì giả thiết H1 được chấp nhận. Điều này chứng tỏ đại lượng ngẫu nhiên có ảnh hưởng đến biến phụ thuộc. Ngược lại khi giả thiết H0 được chấp nhận ta phải loại bỏ đại lượng ngẫu nhiên đó ra khỏi phương trình hồi quy. Bởi đại lượng này không có ảnh hưởng đến đại lượng phụ thuộc. Ta phải xây dựng lại phương trình hồi quy với các biến còn lại.
1.4.2.3 Số liệu đầu vào của mô hình:
- Trạm Quỳ Châu: số liệu mực nước mùa lũ, số liệu mưa mùa lũ (từ 8/1/2001 đến 15/11/2007).
- Trạm Nghĩa Khánh: số liệu mực nước mùa lũ, số liệu mưa mùa lũ (từ 8/1/2001 đến 15/11/2007).
- Trạm Mường Xén: số liệu mực nước mùa lũ, số liệu mưa mùa lũ (từ 8/1/2001 đến 15/11/2007).
- Trạm Tương Dương: số liệu mực nước mùa lũ, số liệu mưa mùa lũ (từ 8/1/2001 đến 15/11/2007).
- Trạm Con Cuông: số liệu mực nước mùa lũ, số liệu mưa mùa lũ (từ 8/1/2001 đến 15/11/2007).
- Trạm Đô Lương: số liệu mực nước mùa lũ, số liệu mưa mùa lũ (từ 8/1/2001 đến 15/11/2007).
- Trạm Dừa : số liệu mực nước mùa lũ (từ 5/10/2000 đến 4/11/2000). Từ chuỗi số liệu này ta thiết lập biến phụ thuộc (yếu tố cần dự báo) và các biến độc lập, từ đó tìm quan hệ giữa các biến để xây dựng mô hình dự báo.
Mô hình dự báo cho 24h:
-Biến phụ thuộc: Mực nước trạm Dừa (H- t+1d)
-Biến độc lập:
- Mực nước Quỳ Châu trước 3 ngày (Ht-2qc); mực nước trạm Quỳ Châu trước 2 ngày (Ht-1qc);mực nước trạm Quỳ Châu trước 1 ngày (Htqc).
- Lượng mưa trước 1 ngày trạm Quỳ Châu (Xtqc); Lượng mưa trước 2 ngày trạm Quỳ Châu (Xt-1qc); Lượng mưa trước 3 ngày trạm Quỳ Châu (Xt-2qc).
- Mực nước Nghĩa Khánh trước 3 ngày (Ht-2nk); mực nước trạm Nghĩa Khánh trước 2 ngày (Ht-1nk);mực nước trạm Nghĩa Khánh trước 1 ngày (Htnk). - Lượng mưa trước 1 ngày trạm Nghĩa Khánh (Xtnk); Lượng mưa trước 2 ngày trạm Nghĩa Khánh (Xt-1nk); Lượng mưa trước 3 ngày trạm Nghĩa Khánh (Xt- 2nk).
- Lượng mưa trước 1 ngày trạm Mường Xén (Xtmx); Lượng mưa trước 2 ngày trạm Mường Xén (Xt-1mx); Lượng mưa trước 3 ngày trạm Mường Xén (Xt-2mx).
- Mực nước Tương Dương trước 3 ngày (Ht-2td); mực nước trạm Tương Dương trước 2 ngày (Ht-1td);mực nước trạm Tương Dương trước 1 ngày (Httd).
- Lượng mưa trước 1 ngày trạm Con Cuông (Xtcc)Lượng mưa trước 2 ngày trạm Con Cuông (Xt-1cc); Lượng mưa trước 3 ngày trạm Con Cuông (Xt-2cc).
- Mực nước Đô Lương trước 3 ngày (Ht-2dl); mực nước trạm Đô Lương trước 2 ngày (Ht-1dl);mực nước trạm Đô Lương trước 1 ngày (Htdl).
- Lượng mưa trước 1 ngày trạm Dừa (Xtd); Lượng mưa trước 2 ngày trạm Dừa
(Xt-1d); Lượng mưa trước 3 ngày trạm Dừa (Xt-2d).
Phương trình hồi quy đa biến: Y’= a + b1*X1+ b2*X2+ …+ bk*Xk
Với Y’ : đại lượng cần dự báo (biến phụ thuộc). Xi : đại lượng độc lập (biến độc lập).
a: đại lượng không đổi. bi : hệ số ảnh hưởng của các đại lượng độc lập.
i: số đại lượng độc lập 1÷ k Các hệ số a, b1, b2, …, bk được xác định từ hệ phương trình sau:
Y’=f(X1, X2, …, Xk)
1) Xây dựng ma trận tương quan:
Để xây dựng ma trận tương quan ta làm như sau:
Vào Menu AnalyzeCorrelateBivariate rồi đưa các biến cần phân tích tương quan vào ô Variables, sau đó chọn OK.
Hình 4.1: Xây dựng ma trận tương quan.
Kết quả phân tích tương quan:
Hình 4.3: Bảng kết quả phân tích tương quan
Từ bảng phân tích tương quan chọn ra các biến độc lập có tương quan cao và có nghĩa với biến phụ thuộc.
Bảng 4.1: Bảng các biến độc lập có tương quan cao
Biến phụ thuộc Các biến độc lập có tương quan
Ht+1d Htd Ht-1td Htdl Htqc Xt-1qc Xt-1cc Xt-1dl Xtd Xttd
2) Xây dựng phương trình tương quan: a) Hiệu chỉnh mô hình:
Hiệu chỉnh mô hình theo nguyên tắc: dùng phương pháp hiệu chỉnh để xác định các thông số của mô hình, nhằm tìm ra bộ thông số tốt nhất dùng trong tính toán. Bộ thông số
được chọn là bộ thông số tính toán ra được đường quá trình tính toán phù hợp nhất với đường thực đo.
Để bắt đầu, vào Menu
AnalyzeRegressionLinear rồi đưa biến phụ thuộc (đại lượng cần dự báo) vào ô Dependent và các biến còn lại (biến phụ thuộc) vào Independent(s).
Hình 4.5: Xây dựng phương trình tương quan
Ở ô Method chọn phương pháp Stepwise.
Tác dụng của phương pháp Stepwise được hiểu nôm na là giúp chúng ta tìm ra được những kết hợp của các biến độc lập sao cho kết quả hồi quy sẽ “tốt” theo hướng các giá trị thống kê t, F có ý nghĩa, và việc lựa chọn các kết hợp này sẽ được căn cứ vào khả năng làm gia tăng giá trị của R2.
Phương pháp
Sau đó nhấn OK, kết quả hồi quy được trình bày ở bảng sau:
Bảng 4.2: Kết quả hồi quy
Với phương trình dự báo là:
Ht+1d = 0.383Htd+0.47Ht-1td+0.11Xt-1qc+0.156Htdl+0.05Xt-1cc+Ht- 1d+0.05Xt-1cc-0.82Htcq+0.05Xt-1dl+0.08Xtd+0.07Xttd
Với các chỉ tiêu khi hiệu chỉnh là:
NASH=1 ∑ ∑ = = − − − n i tdtb tdi n i tdi tti H H H H 1 2 1 2 ) ( ) ( = 0.95
Trong đó: Htđ : là lưu lượng thực đo tại thời điểm i.
Htti : là lưu lượng tính toán tại thời điểm i.
Htđtb: là lưu lượng thực đo trung bình.
RMSE= ∑ = − N i i i Htt Htd N 1 2 ) ( 1 = 90.5
Trong đó: Qi : Giá trị thực đo tại thời điểm i. Fi : Giá trị tính toán tại thời điểm i. N: Là độ dài của chuỗi thực đo.
Nash = 0.95
Hình 4.6: Biểu đồ quan hệ giữa Htd và Htt
Với chỉ tiêu khi kiểm định:
Nash = 0.95
RMSE = 90.5
Nhận xét: Khi dùng năm mô hình SPSS để kiểm định kết quả cho thấy với số liệu như trên dùng để dự báo lũ trên sông Cả với thời gian dự kiến của mô hình là một ngày bằng thời gian chảy truyền trên lưu vực thì cho kết quả rất tốt.
1.4.3 Phương án sử dụng phương pháp mạng NƠ RON thần kinh (ANN):
Mạng trí tuệ nhân tạo (Artificial Neural Networks- ANNs) được xây dựng từ những năm 1940. Từ khi ứng dụng thuật toán quét ngược (back propagation algorithm) năm 1988, ANN đã trở nên quen thuộc trong nhiều lĩnh vực như kỹ thuật xử lý ảnh, kỹ thuật và khoa học chăn nuôi… Và từ đầu thập kỷ 90 đến nay, ANN đã được ứng dụng thành công vào ngành tài nguyên nước, đặc biệt trong dự báo và vận hành tối ưu hồ chứa,…(Ranjithan et al, 1993; Rogers and Dowla, 1994; Rizzo and Dougherty, 1996; Schaap and Bouten, 1996; Maier and Dandy, 1996; Y Shen and Y.Nakatsuji, 1999,…).
Kết luận: dựa vào chỉ tiêu kiểm định ta thấy rằng phương án dự báo lũ cho hạ lưu sông Cả bằng phương pháp SPSS sử dụng tốt cho dự báo lũ trên hệ
thống sông Cả.
Mạng Nơ ron thần kinh – ANN dựa vào đặc điểm của các hệ thống não bộ thực vật và thường là các hệ thống song song bao gồm nhiều phần tử (processing element – PE) được liên kết với nhau bằng các trọng số của các biến. Những PE này được xếp trong các lớp: một lớp đầu vào, một lớp đầu ra, và từ một đến nhiều lớp nằm ở giữa gọi là các lớp ẩn (hidden layers). Các PE trong các lớp khác nhau