a) ệ số tương quan
Hệ số tương quan Pearson (r) được sử dụng để đo lường mối quan hệ tuyến tính giữa hai biến. Giá trị của nó nằm trong khoảng từ -1 đến 1. Hệ số tương quan âm biểu thị mối quan hệ của hai biến là nghịch biến và ngược lại hệ số tương quan dương biểu thị mối quan hệ đồng biến.
∑ ̅ ̅
√∑ ̅ √∑ ̅
Trong đó: Xj, Yj là biến 1 và biến 2; ̅ , ̅ là trung bình của X và Y; i là tháng (i=1,...,12) hoặc mùa (i=1,...,2), năm j (j=1,...n); n là dung lượng mẫu.
Cụ thể trong luận văn này r được tính toán là mối quan hệ giữa các chỉ số hạn khí tượng khác nhau và giữa lượng mưa quan trắc với lượng mưa vệ tinh.
Độ tin cậy của r được kiểm nghiệm bằng giả thiết H0: H0: r = 0 Giới hạn ban đầu là d thì d phải đảm bảo sao cho:
Khi H0 đ ng ta có: Prd
Đặt: t r
và
1 r2 √ √
n 2
Khi đó, nếu Ho đ ng thì Pr t và từ đó ta xác định được t. Chỉ tiêu
kiểm nghiệm sẽ là: Nếu | | thì r là đáng kể và | | thì r là không đáng kể.
Hệ số tương quan với dung lượng mẫu n được coi là đáng kể khi th a mãn tiêu chuẩn tương ứng với α = 0,05 và 0,01. Việc đánh giá độ tin cậy của r dựa trên
sự so sánh hai giá trị t theo công thức 9 và tα thường được tra bảng theo phân bố Student hoặc có thể tính thông qua hàm TINV (tiêu chuẩn α, n-2) của Excel.
Giá trị r với bậc tự do (n-2) từ 10 đến 100 theo mức α = 0,05 và 0,01 đã được tính toán sẵn và đưa ra ở bảng 2.10. Một ví dụ, chuỗi số liệu (n=30 năm), với mức ý nghĩa =0,05 (5%), ta sẽ có giá trị r=0,349. Hay nói cách khác là với 30 năm quan trắc thì r đạt được với mức ý nghĩa 5% (hay mức độ tin cậy của r đạt 95%) sẽ là gần bằng 0,349. Điều này cho thấy với n=30 năm thì những hệ số tương quan lớn hơn 0,349 (r>0,349) đều đạt độ tin cậy trên 95%.
Trên cơ sở hệ số r được thể hiện ở bảng 2.10 và hệ số tương quan được luận văn tính toán (rtt) để đánh giá độ tin cậy cậy của rtt thay vì phải tính t và t. Một ví dụ về hệ số rtt giữa lượng mưa quan trắc và vệ tinh là 0.56, ta có n=36 (n-2=34), như vậy rtt > r với =5% và 1%. Điều này cho thấy rtt đạt độ tin cậy trên 99%.
Bảng 2. 10. Ti u chuẩn tin cậy của r [13]
n-2 10 20 30 40 50 60 70 80 90 100
α = 0,05 0,576 0,423 0,349 0,304 0,273 0,250 0,232 0,217 0,205 0,195 α = 0,01 0,708 0,537 0,449 0,393 0,362 0,325 0,302 0,283 0,267 0,254
b) Sai số trung bình
Sai số trung bình (ME) cho biết xu hướng lệch trung bình của lượng mưa vệ tinh với quan trắc; một giá trị dương chỉ ra một đánh giá quá cao về lượng mưa vệ tinh, ngược lại giá trị âm chỉ ra một đánh giá thấp so với lượng mưa quan trắc. ME không phản ánh độ lớn của sai số, giá trị ME bằng 0 là hoàn hảo.
∑
c) Sai số tuyệt đối trung bình
MAE biểu thị biên độ trung bình của sai số nhưng nó không cho biết xu hướng lệch của sai số. Khi MAE = 0 là hoàn hảo. MAE thường được sử dụng cùng với ME để đánh giá độ tin cậy. Chẳng hạn, nếu MAE của sản phẩm khác biệt hẳn so với ME thì hiệu chỉnh sai số sẽ khó khăn. Trường hợp ngược lại, khi mà MAE và ME tương đối sát với nhau thì có thể dùng ME để hiệu chỉnh sản phẩm lượng mưa vệ tinh một cách đáng tin cậy.
∑| |
d) Sai số quân phương
RMSE được sử dụng để đo độ lớn trung bình của các sai số giữa lượng mưa vệ tinh và lượng mưa quan trắc. RMSE rất nhạy với những giá trị sai số lớn; giá trị RMSE thấp hơn có nghĩa là xu hướng sai số trung tâm lớn hơn và sai số cực đoan nh . Giá trị RMSE bằng 0 là điểm hoàn hảo, do đó nếu RMSE càng gần MAE sai số mô hình càng ổn định và có thể thực hiện việc hiệu chỉnh lượng mưa vệ tinh để sử dụng có độ tin cậy cao hơn.
√ ∑
e) iểm Bias
Bias phản ánh mức độ trung bình của lượng mưa vệ tinh tương ứng với trung bình của lượng mưa quan sát được. Giá trị Bias gần với 1 cho thấy ước tính lượng mưa vệ tinh gần với lượng mưa quan trắc được. Giá trị Bias của 1 là hoàn hảo.
∑ ∑
Trong công thức từ (13) đến (16), Si và Oi tương ứng là giá trị lượng mưa được trích xuất từ vệ tinh và giá trị quan trắc, i=1,2,…, n, n là dung lượng mẫu.