2.2.1. Dự báo trung bình tổ hợp
Trong phần này, chúng tơi sử dụng các phương pháp dự báo tất định từ dự báo tổ hợp như đã trình bày trong mục 1.2.1 với mục đích tạo ra một dự báo tất định đại diện cho dự báo từ năm mơ hình GFS, GME, GSM, TLAPS và UM. Ngoại trừ phương pháp dự báo theo trung vị, mọi phương pháp đều được thử nghiệm, so sánh về mặt chất lượng dự báo, chi phí tính tốn. Các chỉ số cơ bản được sử dụng trong đánh giá chất lượng dự báo vẫn là các chỉ số đánh giá cơ bản với dự báo tất định như sai số trung bình ME và căn bậc hai của sai số bình phương trung bình RMSE. Ngồi ra, giản đồ tụ điểm cũng sẽ được sử dụng. Miền đánh giá sẽ được lấy lùi vào từ biên 50 so với miền dự báo chung của mỗi mơ hình để các giá trị trên vùng biên (chịu tác động từ quá trình lọc khơng đầy đủ trên biên) khơng ảnh hưởng tới kết quả đánh giá. Chuỗi thời gian đánh giá bắt đầu từ tháng 01/2005 đến tháng 05/2007. Do tập số liệu dự báo khơng liên tục, cĩ những ngày bị mất số liệu, chuỗi thời gian để tính tốn các chỉ số đánh giá giữa các phương pháp cĩ thể khơng giống nhau. Tuy nhiên với chuỗi thời gian đủ dài, điều này sẽ khơng ảnh hưởng đến đặc tính thống kê của các chỉ số. Trước hết, ta sẽ khảo sát đặc tính thống kê của dự báo từ 5 mơ
hình nêu trên. Bảng 2.2.1 cho ta giá trị ME từ dự báo của 5 mơ hình cùng dự báo nhận được đơn giản bằng trung bình tổ hợp EM với mục đích so sánh. Các giá trị ME nhỏ nhất từ 5 mơ hình cũng như từ dự báo trung bình tổ hợp với mỗi biến trên mỗi mực và với mỗi hạn dự báo sẽ được tơ đậm. Từ bảng 2.2.1 cĩ thể nhận thấy rằng các biến pmsl, H, u, v, T, q các mơ hình cũng như EM đều cho sai số trung bình nhỏ. Giá trị nhỏ nhất của ME biến đổi tùy thuộc từng mơ hình, hạn dự báo và biến dự báo. Cĩ thế coi với các biến này các mơ hình đều thể hiện một sai số hệ thống nhỏ. Riêng với độ cao địa thế vị, phân bố của ME cho thấy cĩ sự khác biệt đáng kể giữa các mơ hình, dẫn đến sai số hệ thống vẫn tồn tại khá lớn trong EM.
Bảng 2.2.1. Giá trị ME của các biến dự báo tại mực 850, 500mb với hạn dự báo 24, 48 giờ từ 5 mơ hình GFS, GME, GSM, TLAPS, UM và trung bình tổ hợp.
H (m) u (m/s) v (m/s) T (0K) q (g/kg) pmsl pmsl (mb) 850 500 850 500 850 500 850 500 850 500 24 -0.16 -2.4 -7.6 -0.1 -0.2 0.3 0.1 -0.1 0.0 0.2 0.3 GFS 48 0.15 0.1 -5.5 -0.0 -0.3 0.4 0.1 -0.2 0.0 0.1 0.2 24 -0.20 -4.5 -0.2 -0.2 -0.1 0.1 -0.0 0.2 0.5 -0.1 0.1 GME 48 -0.08 -3.7 2.1 -0.4 -0.3 0.2 0.1 0.2 0.6 -0.1 0.1 24 -0.32 -3.6 -4.9 -0.2 0.1 0.0 -0.1 -0.3 -0.2 -0.5 -0.2 GSM 48 -0.38 -4.1 -6.8 -0.2 -0.0 0.2 -0.1 -0.3 -0.3 -0.4 -0.2 24 -0.39 -4.0 -3.5 -0.0 0.1 0.3 0.1 -0.6 0.2 -0.3 -0.4 TLAPS 48 -0.51 -5.5 -7.0 0.2 0.3 0.3 -0.0 -0.6 0.2 -0.4 -0.4 24 -0.65 -5.8 -2.0 -0.1 0.6 0.1 0.1 0.4 0.2 0.5 0.0 UM 48 -0.90 -8.1 -2.9 -0.1 0.5 0.2 0.2 0.4 0.3 0.6 0.1 24 -0.35 -3.7 -3.3 -0.1 0.1 0.2 0.0 -0.1 0.1 -0.1 -0.1 EM 48 -0.34 -3.8 -3.6 -0.1 0.1 0.3 0.0 -0.1 0.2 -0.1 -0.1 Bảng 2.2.2 đưa ra kết quả đánh giá trị RMSE cho từng mơ hình thành phần và dự báo trung bình tổ hợp. Điểm thú vị là dự báo trung bình tổ hợp cho ta sai số nhỏ nhất khi so sánh với cả 5 mơ hình, bất kể hạn dự báo hay biến dự báo. Các
kết quả tương tự cũng tìm thấy đối với các biến trên các mực cịn lại. Điều này cho thấy quả thực EM tính tốn đơn giản nhưng lại rất hiệu quả khi đưa ra dự báo cĩ chất lượng tốt. Nếu chỉ so sánh giữa các mơ hình với nhau, mơ hình GSM tỏ ra là mơ hình cĩ kỹ năng dự báo tốt hơn cả trong khi TLAPS cho thấy kỹ năng dự báo thấp nhất. Đứng sau GSM là mơ hình GFS trong khi GME và UM cĩ thể xếp vào nhĩm thứ ba. Tuy nhiên về tổng thể, ngoại trừ TLAPS, 4 mơ hình cịn lại đều cĩ các giá trị RMSE khơng quá sai khác giữa các biến.
Bảng 2.2.2. Giá trị RMSE của các biến dự báo tại mực 850, 500mb với hạn dự báo 24, 48 giờ từ 5 mơ hình GFS, GME, GSM, TLAPS, UM và trung bình tổ hợp.
H (m) u (m/s) v (m/s) T(0K) q (g/kg) pmsl pmsl (mb) 850 500 850 500 850 500 850 500 850 500 24 1.23 9.7 9.3 1.9 2.0 1.7 1.8 0.8 0.5 1.1 0.6 GFS 48 1.32 10.2 9.3 2.3 2.5 2.1 2.2 0.9 0.7 1.2 0.6 24 1.39 11.1 7.1 1.9 2.1 1.7 2.0 0.9 0.8 1.2 0.6 GME 48 1.50 11.7 8.7 2.4 2.6 2.2 2.4 1.0 0.9 1.3 0.7 24 1.14 8.5 7.0 1.6 2.0 1.5 1.7 1.2 0.6 1.5 0.5 GSM 48 1.32 9.7 9.6 2.0 2.4 1.9 2.1 1.2 0.7 1.6 0.6 24 2.26 17.4 10.4 2.4 2.8 2.1 2.5 1.3 0.8 1.7 0.8 TLAPS 48 2.75 21.1 13.4 2.9 3.3 3.0 2.9 1.5 1.0 1.9 0.9 24 1.56 15.0 6.9 1.7 2.2 1.5 1.8 1.2 0.7 1.8 0.5 UM 48 1.87 17.4 8.9 2.1 2.7 1.9 2.3 1.3 0.8 2.0 0.6 24 0.75 6.1 5.1 1.2 1.3 1.1 1.3 0.4 0.4 0.6 0.3 EM 48 1.01 7.9 6.7 1.7 1.9 1.6 1.7 0.6 0.5 0.8 0.4
Để cĩ thể thấy rõ hơn chất lượng dự báo từ mỗi mơ hình, hình 2.2.1 mơ tả giản đồ tụ điểm dự báo độ cao địa thế vị mực 850mb hạn 72 giờ từ 5 mơ hình và trung bình tổ hợp. Trên giản đồ tụ điểm, giá trị ME sẽ tương ứng với độ lệch của tập hợp các điểm quanh đường chéo, trong khi phân tán rộng hay hẹp quanh đường chéo của tập các điểm này quyết định giá trị RMSE lớn hay nhỏ. Phù hợp với các số liệu trong bảng 2.2.1 và 2.2.2, khi ta quan sát thấy đối với biến H, 2 mơ hình TLAPS và UM thường cĩ ME cũng như RMSE lớn. Ngồi ra, từ hình 2.2.1 cĩ thể thấy dự báo của TLAPS và UM cĩ xu hướng lệch về phía trên của đường chéo tương ứng với việc dự báo thường nhỏ hơn so với phân tích. Ba mơ hình cịn lại cĩ phân bố gần như tương đương, các điểm tập trung chủ yếu quanh đường chéo dẫn đến sai số hệ thống nhỏ, phân bố hẹp hơn so với TLAPS và UM đồng nghĩa với sai số RMSE nhỏ hơn. Hiệu quả của trung bình tổ hợp cũng được thể hiện rất rõ trên hình 2.2.1. Cĩ thể thấy dự báo từ trung bình tổ hợp cĩ sai số nhỏ nhất với tương quan lớn nhất thể hiện qua độ hẹp của phân tán quanh đường chéo so với mọi dự báo thành phần. Với các biến H hay pmsl, bảng 2.2.1 cho thấy TLAPS và UM thường cĩ xu hướng xuất hiện giá trị ME lớn, dẫn đến giá trị RMSE lớn ở bảng 2.2.2 trong khi sai số hệ thống ở các mơ hình khác nhỏ hơn. Tuy nhiên, với các biến u, v, T hay q thì TLAPS và UM tương đương với các mơ hình khác. Để minh chứng điều này, hình 2.2.2 cho ta bức tranh tương tự hình 2.2.1 nhưng đối với dự báo nhiệt độ mực 500mb hạn 72 giờ. Cĩ thể thấy cả 5 mơ hình đều khơng bộc lộ một sai số hệ thống lớn khi các
quanh đường chéo với dự báo của TLAPS là lớn nhất, tương ứng giá trị RMSE lớn nhất. Điều này giải thích tại sao trong phần trên ta đã đi tới kết luận rằng TLAPS cho chất lượng dự báo thấp nhất trong 5 mơ hình. Một lần nữa, dự báo trung bình tổ hợp lại cho thấy một phân tán hẹp nhất tương ứng với sai số RMSE nhỏ nhất cũng như hệ số tương quan lớn nhất.
Hình 2.2.1. Giản đồ tụ điểm dự báo độ cao địa thế vị mực 850mb hạn 72 giờ theo các mơ hình thành phần và theo trung bình tổ hợp.
Hình 2.2.2. Giản đồ tụ điểm dự báo nhiệt độ mực 500mb hạn 72 giờ theo các mơ hình thành phần và theo trung bình tổ hợp.