Dự báo trung bình tổ hợp cĩ hiệu chỉnh sai số hệ thống

Một phần của tài liệu Nghiên cứu ứng dụng dự báo tổ hợp cho một số trường dự báo bão (Trang 62 - 66)

Khi các dự báo thành phần của hệ dự báo tổ hợp xuất hiện sai số hệ thống (bias), người ta thường hiệu chỉnh bằng cách khử bias cho các thành phần bằng một phương pháp thống kê thích hợp sau đĩ xác định lại trung bình tổ hợp. Cách làm này tuy đơn giản nhưng hiệu quả thu được là rất đáng kể. Chẳng hạn, dự báo trung bình các trường bề mặt thu được theo Stensrud và Yussouf (2005) cĩ chất lượng tương đương với dự báo từ các chương trình MOS nghiệp vụ của Hoa Kỳ. Sai số hệ thống cần được loại bỏ bởi nĩ ảnh hưởng tới sai số dự báo. Khơng chỉ cĩ tác dụng với dự báo trung bình tổ hợp, khi các dự báo thành phần đã được khử bias, dự báo xác suất thu được từ các dự báo thành phần sẽ cĩ kỹ năng và độ tin cậy cao hơn. Chính vì vậy, việc khử sai số hệ thống dự báo sẽ được thực hiện đối với cả 5 mơ hình GFS, GME, GSM ,TLAPS và UM, và áp dụng khơng chỉ trong dự báo tổ hợp tất định mà cịn trong cả dự báo xác suất. Cĩ nhiều phương pháp cho phép khử bias của dự báo dựa trên chuỗi số liệu dự báo trong quá khứ. Các phương pháp thơng dụng với tập mẫu nhỏ gồm cĩ trung bình trượt, hồi quy tuyến tính và lọc Kalman. Trong đề tài này, chúng tơi thử nghiệm khử bias với hai phương pháp trung bình trượt và hồi quy tuyến tính. Một vấn đề xuất hiện khi khử bias liên quan đến dung lượng mẫu sử dụng. Theo Woodcock và Engel (2005), đối với phương pháp trung bình trượt sử dụng dự báo từ 15 đến 20 ngày trước là đủ. Khi thực hiện nghiệp vụ, cĩ thể cĩ những ngày thiếu số liệu, do đĩ dung lượng mẫu cĩ thể lấy lên 30 ngày. Đối với phương pháp hồi quy tuyến tính, các tác giả sử dụng nhiều giá trị khác nhau từ 25 cho đến 40 hay 60 ngày. Trong nghiên cứu này, chúng tơi sử dụng dung lượng mẫu là 40 ngày, thống nhất với các phương pháp xử lý thống kê khác dưới đây như dự báo siêu tổ hợp, hồi quy Gauss khơng thuần nhất.

Với phương pháp trung bình trượt, sai số hệ thống sẽ được xác định đơn giản bằng trung bình cộng của sai số dự báo Fi-Oi (i=1,n) từ n ngày trước đĩ. Ở đây, F được ký hiệu cho giá trị dự báo, O cho giá trị quan trắc. Giá trị tính được sau đĩ sẽ được trừ đi bởi dự báo của ngày kế tiếp nhằm hiệu chỉnh giá trị dự báo

Fbcma = Fraw – bias (2.2.1) với Fbcma là giá trị dự báo đã được khử bias, Fraw là giá trị dự báo trực tiếp từ mơ hình. Các mơ hình được khử bias theo phương pháp này sẽ được ký hiệu bởi tiền tố BCMA_ như BCMA_GFS. Dự báo trung bình tổ hợp từ các mơ hình này được ký hiệu bởi EM_BCMA.

Với phương pháp hồi quy tuyến tính, ta sẽ giả định cĩ một quan hệ tuyến tính giữa quan trắc và dự báo O = a + bF với a, b là các hệ số được xác định bằng phương pháp hồi quy tuyến tính từ tập số liệu của n ngày trước đĩ. Khi quan hệ này đã được thiết lập, nĩ sẽ được áp dụng cho dự báo của ngày kế tiếp

Fbclr = a + bFraw (2.2.2) Tương tự như phương pháp BCMA, tiền tố BCLR_ sẽ được sử dụng để ký hiệu cho phương pháp hiệu chỉnh bias dựa trên phương trình hồi quy tuyến tính.

Như đã trình bày ở trên, việc khử sai số hệ thống chắc chắn sẽ tác động đáng kể tới dự báo của các biến pmslH từ hai mơ hình TLAPS và UM. Hình 2.2.3 cho ta dự báo độ cao địa thế vị mực 850mb hạn 48 giờ theo TLAPS vào thời điểm 00Z-30/07/2005 khi cơn bão Washi đang hoạt động trên biển Đơng. Để tiện so sánh, trường phân tích vào thời điểm này cũng được hiển thị. Cĩ thể thấy khử bias khơng tác động nhiều lắm đến khu vực phía đơng của miền dự báo nếu lấy kinh tuyến qua Việt Nam làm trục. Tác động thực sự chủ yếu trên phía tây của khu vực dự báo. Cĩ một số khác biệt nhỏ trong trường dự báo khi khử bias theo phương pháp hồi quy tuyến tính so với phương pháp trung bình trượt. Tuy nhiên, đây chỉ là một trường hợp cụ thể, để xem xét tác động của hai phương pháp này tới trường dự báo, ta phải khảo sát một cách thống kê như trên hình 2.2.4.

Hình 2.2.3. Độ cao địa thế vị mực 850mb theo phân tích và dự báo từ mơ hình TLAPS hạn 48 giờ vào thời điểm 00Z-30/07/2005 trước và sau khi khử bias theo

Hình 2.2.4 cho ta giản đồ tụ điểm dự báo độ cao địa thế vị mực 850mb theo TLAPS và UM trước và sau khi khử bias. Từ hình 2.2.4 cĩ thể thấy từ một phân bố lệch khỏi đường chéo trước khi khử bias, các điểm dự báo sau khi được khử bias đã tập trung hơn quanh đường chéo. Hiệu quả thu được là rất đáng kể, sai số RMSE giảm đi gần một nửa. So với UM, độ tán của TLAPS sau khi khử bias vẫn lớn hơn, do đĩ TLAPS vẫn là mơ hình cho sai số dự báo lớn nhất trong cả 5 mơ hình. Giữa hai phương pháp trung bình trượt và hồi quy tuyến tính, phương pháp hồi quy tuyến tính cho thấy sai số RMSE nhỏ hơn một chút.

Hình 2.2.4. Giản đồ tụ điểm dự báo độ cao địa thế vị mực 850mb hạn 48 giờ theo TLAPS, BCMA_TLAPS, BCLR_TLAPS, UM, BCMA_UM, BCLR_UM. Nhìn chung, sau khi được khử bias theo một trong hai phương pháp nêu trên các mơ hình đều thể hiện một phân bố tập trung hơn quanh đường chéo trên giản đồ tụ điểm. Cho nên, với các dự báo tất định dựa trên các mơ hình đã được khử bias này, ta chỉ quan tâm chủ yếu đến giá trị RMSE. Bảng 2.2.3 tương tự như bảng 2.2.2 cho ta giá trị RMSE dự báo từ các mơ hình sau khi đã khử bias bằng phương pháp hồi quy tuyến tính. Phương pháp trung bình trượt cho các kết quả gần như tương đương với phương pháp hồi quy tuyến tính nên ta sẽ khơng nêu ra ở đây mà chỉ đưa phương pháp hồi quy tuyến tính làm đại diện. Khi so sánh với bảng 2.2.2 cĩ thể thấy, sai số dự báo từ tất cả các dự báo thành phần đều bằng hoặc giảm sau khi thực hiện khử bias. Sai số đặc biệt giảm mạnh với các biến pmsl, H, Tq, trong khi ít hoặc khơng giảm với các biến u, v. Trong các mơ hình, TLAPS và UM cĩ sai số giảm mạnh nhất, cĩ khi tới hơn 50%. Khi kỹ năng dự báo thực sự của mỗi mơ hình

dự báo từ mỗi mơ hình. Trước hết trong số 5 mơ hình sử dụng, mơ hình GSM thể hiện rõ hơn, so với trước khi khử bias, kỹ năng dự báo tốt nhất. Vẫn như thường lệ, TLAPS vẫn cho thấy một chất lượng dự báo kém nhất trong tất cả các mơ hình, dù sai số đã giảm đi đáng kể. Điều đáng ngạc nhiên là UM bây giờ lại cho thấy một chất lượng dự báo tương đương với chất lượng dự báo của GFS. Chất lượng dự báo từ 2 mơ hình này chỉ xếp sau chất lượng dự báo của mơ hình GSM. Điều đáng ngạc nhiên tiếp theo là chất lượng dự báo của GME chỉ tốt hơn so với TLAPS và thực sự thấp hơn các mơ hình khác so với khi ta chỉ quan sát bảng 2.2.2. Một lần nữa, ta lại quan sát thấy dự báo trung bình tổ hợp EM_BCLR luơn cho dự báo với chất lượng tốt nhất cho mọi biến trên mọi mực với mọi hạn dự báo tương tự như với bảng 2.2.2. Nếu so sánh với dự báo trung bình trong bảng 2.2.2, ta sẽ thấy d báo trung bình sau khi kh bias cĩ cht lượng tt hơn v mi mt. Các kết quả tương tự

cũng tìm thấy đối với các biến nghiên cứu trên các mực 700mb và 300mb.

Bảng 2.2.3. Giá trị RMSE của các biến dự báo tại mực 850, 500mb với hạn dự báo 24, 48 giờ từ 5 mơ hình GFS, GME, GSM, TLAPS, UM đã được khử bias theo

phương pháp hồi quy tuyến tính và trung bình tổ hợp.

H (m) u (m/s) v (m/s) T (0K) q (g/kg) pmsl pmsl (mb) 850 500 850 500 850 500 850 500 850 500 24 0.74 5.9 5.0 1.7 1.9 1.5 1.6 0.4 0.5 0.6 0.5 BCLR_ GFS 48 0.97 8.0 7.0 2.2 2.4 2.0 2.0 0.5 0.6 0.7 0.6 24 0.92 7.4 6.5 1.9 2.0 1.7 1.8 0.6 0.6 0.8 0.5 BCLR_ GME 48 1.20 9.6 8.0 2.4 2.6 2.2 2.3 0.7 0.7 0.9 0.6 24 0.70 5.4 4.4 1.5 1.7 1.4 1.5 0.5 0.5 0.7 0.5 BCLR_ GSM 48 0.93 7.4 6.1 2.0 2.2 1.9 1.9 0.6 0.6 0.8 0.6 24 1.11 8.4 7.1 2.2 2.4 2.0 2.1 0.7 0.7 0.9 0.6 BCLR_ TLAPS 48 1.52 11.7 9.5 2.8 3.0 2.9 2.6 0.9 0.8 1.0 0.8 24 0.71 5.8 4.9 1.5 1.9 1.4 1.6 0.5 0.5 0.6 0.4 BCLR_ UM 48 0.97 8.0 7.2 2.0 2.5 2.0 2.2 0.6 0.7 0.7 0.6 24 0.58 4.7 3.7 1.3 1.4 1.2 1.3 0.4 0.4 0.6 0.4 EM _BCLR 48 0.86 7.1 5.7 1.8 2.0 1.8 1.8 0.5 0.5 0.7 0.5

Để minh họa các nhận định trên, tương tự như trên hình 2.2.3, hình 2.2.5 cho ta dự báo của các mơ hình cùng trung bình tổ hợp vào thời điểm 00Z-30/07/2005 sau khi đã khử bias. Riêng trường phân tích tại thời điểm này cĩ thể tham khảo trên hình 2.2.3. Với cơn bão Washi này, 2 mơ hình GME và TLAPS cho chất lượng dự báo thấp nhất. Về cường độ, mơ hình GSM cho dự báo tốt hơn cả (141dm so với giá trị phân tích 138dm), nhưng về vị trí mơ hình GFS và trung bình tổ hợp lại dự báo

tốt hơn. Dự báo trung bình tổ hợp về cường độ chỉ cho dự báo với giá trị 144dm, cao hơn so với mơ hình GSM. Điều này là hiển nhiên bởi do lấy trung bình, giá trị dự báo phải nằm giữa giá trị dự báo từ thành phần nhỏ nhất và thành phần lớn nhất.

Hình 2.2.5. Độ cao địa thế vị mực 850mb dự báo từ các mơ hình và trung bình tổ hợp hạn 48 giờ vào thời điểm 00Z-30/07/2005 sau khi khử bias theo BCLR

Một phần của tài liệu Nghiên cứu ứng dụng dự báo tổ hợp cho một số trường dự báo bão (Trang 62 - 66)