TS Nguyễn Lê Tâm Nguyễn Lê Tâm
1.6. NGHIÊN CỨU ỨNG DỤNG DỰ BÁO TỔ HỢP BÃO TẠI VIỆT NAM Nhưđã trình bày ở các mục trên, nĩi chung tất cả các phươ ng pháp phát sinh
EF cĩ thểđược chia thành 3 nhĩm chính như sau (xem hình 1.6.1):
- Nhĩm I: sử dụng tập hợp kết quả dự báo từ một mơ hình dự báo số trị với các điều kiện ban đầu hơi khác nhau. Trong nhĩm này, mơ hình dự báo số được giả
thiết là hồn hảo và sai số dự báo chỉ do điều kiện ban đầu gây nên. Do đĩ, điểm mấu chốt trong phương pháp này nằm ở phương pháp phát sinh ra tập hợp các điều kiện ban đầu hơi khác nhau cho mơ hình dự báo số. Hay nĩi cách khác, chìa khĩa thành cơng cho EF thuộc nhĩm thứ nhất chính là tính hiệu quả của phương pháp gây nhiễu động trường ban đầu. Các phương pháp dự báo trung bình trễ (LAF), nuơi nhiễu phát triển nhanh nhất BGM, phân tích hàm trực giao thực nghiệm (EOF), ... đều thuộc vào nhĩm EF này. Nĩi chung, đối tượng ứng dụng chính của nhĩm EF này là các bài tốn dự báo hạn vừa và khí hậu cho các mơ hình khí hậu hoặc tồn cầu để tăng chất lượng dự báo cũng như kéo dài hạn dự báo. Cách tiếp cận này đỏi hịi phải tích phân mơ hình nhiều lần, do đĩ EF dựa trên các phương pháp nhiễu
động chỉ được sử dụng tại những trung tâm dự báo lớn trên thế giới như NCEP và ECMWF. Tuy nhiên, một số nghiên cứu ứng dụng các phương pháp LAF, BGM và EOF cho EF qũy đạo bão đã cho thấy tính khả quan của nhĩm EF này trong bài tốn dự báo bão.
- Nhĩm II: sử dụng cùng một trường số liệu đầu vào nhưng cho nhiều mơ hình dự báo số trị khác nhau. Cách tiếp cận này được biết đến như là EF dựa trên phương pháp nhiễu động mơ hình. Tập hợp mơ hình dự báo số cĩ thể là nhiều phiên
bản của cùng một mơ hình nhưng cĩ các tùy chọn vật lý hoặc động lực khác nhau, hoặc là các mơ hình tồn tồn khác nhau vềđộng lực và vật lý. Trong cách tiếp cận này, giả thiết sai số trong điều kiện ban đầu bị loại bỏ và sai số dự báo chỉ do sai số
trong mơ hình gây nên. Nĩi chung, cách tiếp cận này cũng địi hỏi thời gian tính tốn lớn và tỏ ra khá phù hợp với vùng nhiệt đới (nơi mà các quá trình vật lý và
động lực vẫn chưa được mơ phỏng chính xác).
- Nhĩm III: sử dụng các kết quả dự báo từ các mơ hình dự báo số trị khác nhau với các điều kiện ban đầu khác nhau. Cách tiếp cận này cịn được biết đến như
là phương pháp EF đa hệ (multisystem) hoặc siêu tổ hợp (superensemble). Trong cách tiếp cận này, sai số trong các trường phân tích và bản thân mơ hình được đưa vào trong tính tốn EF. Cụ thể, đã cĩ rất nhiều cơng trình nghiên cứu chỉ ra dự báo siêu tổ hợp cĩ kỹ năng dự báo cao hơn với dự báo tốt nhất trong số các dự báo thành phần. Đặc biệt, các kết quả nghiên cứu này cịn đúng cho dự báo thời tiết hạn ngắn và dự báo bão
Hình 1.6.1. Phân loại các phương pháp dự báo tổ hợp theo Weber (2001) Xuất phát từ những thành cơng trong việc nghiên cứu ứng dụng EF bão trên thế giới và tại Việt Nam và với mục đích nâng cao chất lượng dự báo bão dựa trên những sản phẩm NWP và mơ hình sẵn cĩ tại TTDBTƯ, trong nghiên cứu này chúng
tơi mạnh dạn đề xuất một số hướng nghiên cứu ứng dụng EF cho bài tốn dự báo bão tại Việt Nam. Cụ thể, các hướng nghiên cứu sẽ tập trung vào:
- Xây dựng hệ thống dự báo tổ hợp qũy đạo bão từ kết quả dự báo bão của một số trung tâm dự báo bão quốc tế (nhĩm III). Cụ thể, hai cách tiếp cận chính để phát sinh EF từ tập hợp các dự báo thành phần trong trường hợp này là trung bình đơn giản và xây dựng phương trình hồi quy tuyến tính. Phần này sẽđược trình bày chi tiết trong mục 3.1 chương III.
- Xây dựng hệ thống dự báo tổ hợp qũy đạo bão dựa trên mơ hình chính áp WBAR với 6 phương án khác nhau được sử dụng để phát sinh tập hợp trường ban đầu khác nhau (nhĩm I). Ngồi ra, các bản đồ dự báo xác suất đường đi của bão dựa trên phương pháp dự báo tổ hợp hàng nghìn thành phần cũng sẽ được nghiên cứu và đánh giá. Phần này sẽđược trình bày chi tiết trong mục 3.2 chương III
- Xây dựng hệ thống dự báo tổ hợp cho một số trường khí tượng dự báo bão như trường áp suất trung bình mực biển, các trường giĩ, nhiệt, ẩm và độ cao địa thế vị tại các mực đẳng áp chuẩn 850, 700, 500 và 300mb dựa trên các sản phẩm phân tích và dự báo của các mơ hình tồn cầu và mơ hình khu vực được thu nhận tại TTDBTƯ theo thời gian thực (nhĩm III). Trong phương pháp này, các phương pháp tính tốn EF tất định từ tập hợp các dự báo thành phần như trung bình đơn giản, kết hợp hiệu chỉnh sai số hệ thống và trung bình đơn giản, siêu tổ hợp và EF từ dự báo xác suất sẽ được nghiên cứu và thử nghiệm. Ngồi ra, các phương án dự báo xác suất từ EF cũng sẽ được nghiên cứu và đánh giá dựa trên phương pháp hồi quy Gauss khơng thuần nhất. Tồn bộ các nội dung nghiên cứu này sẽ được trình bày chi tiết trong chương II.
CHƯƠNG II
XÂY DỰNG HỆ THỐNG DỰ BÁO TỔ HỢP CHO MỘT SỐ TRƯỜNG DỰ BÁO BÃO CHO MỘT SỐ TRƯỜNG DỰ BÁO BÃO
2.1. KHÁI QUÁT VỀ CÁC MƠ HÌNH DỰ BÁO THÀNH PHẦN VÀ CÁC PHƯƠNG PHÁP TIỀN XỬ LÝ TẬP SỐ LIỆU PHƯƠNG PHÁP TIỀN XỬ LÝ TẬP SỐ LIỆU
Kết quả dự báo từ các mơ hình tồn cầu được cung cấp cho TTDBTƯ theo nhiều con đường khác nhau. Dự báo từ 3 mơ hình GME, GSM và TLAPS nhận
được qua đường Internet từ ký kết thỏa thuận hợp tác giữa khí tượng Việt Nam và khí tượng các nước Đức, Nhật và Úc. Trong đĩ, TLAPS khơng phải mơ hình tồn cầu của Úc mà là mơ hình khu vực nhiệt đới. Hiện tại, thỏa thuận hợp tác với khí tượng Canada đã mở rộng thêm tập số liệu tồn cầu với mơ hình GEM. Thơng qua hệ quản trị dữ liệu LDM trên hệ NAWIPS tại trung tâm, dự báo viên cĩ thể truy cập thêm thơng tin dự báo từ 2 mơ hình GFS và UM. Hệ LDM đã được yêu cầu cung cấp thêm dự báo từ mơ hình NOGAPS của Hải quân Mỹ. Do các kết quả dự báo từ
5 mơ hình nhận được tại TTDBTƯ cĩ miền dự báo được cung cấp khác nhau (tồn cầu như GFS, UM hay khu vực như GME, GSM và TLAPS), cĩ độ phân giải khác nhau (1.250 với GFS, GSM và UM, 0.750 với TLAPS và 0.40 với GME), với định dạng khác nhau (mã GEMPAK với GFS và UM, mã GRIB với GME, GSM, TLAPS). Do đĩ, đầu tiên ta phải xác định một miền dự báo chung cho các dự báo thành phần. Mơ hình GME là mơ hình dự báo cĩ miền dự báo cung cấp nhỏ nhất trong cả 5 mơ hình do đĩ chúng tơi lựa chọn miền dự báo trùng với miền dự báo
được cung cấp của GME cĩ tọa độ 50S -350N, 80.250E-130.250E. Vấn đề thứ hai liên quan đến lựa chọn độ phân giải của hệ tổ hợp. Do hệ thống dự báo tổ hợp của ta là hệ thống dự báo trường, các dự báo thành phần cần phải tương đương về mặt quy mơ. Cho nên, các dự báo thành phần phải được đưa về cùng một độ phân giải là độ
phân giải thấp nhất cĩ được từ 5 mơ hình trên: 1.250. Khi chuyển các trường dự báo từ độ phân giải cao về độ phân giải thấp hơn, ta phải sử dụng các bộ lọc mà điển hình là bộ lọc tần thấp, loại bỏ các sĩng ngắn mà dự báo với độ phân giải cao giải
được nhưng khơng biểu diễn được trên khơng gian với độ phân giải thấp hơn. Trên thực tế, dự báo với phân giải thơ hơn so với phân giải thực của các mơ hình tồn cầu cung cấp cho Việt Nam đều được thực hiện theo một cách như vậy. Chương trình lọc chúng tơi sử dụng được xây dựng theo phương pháp Barnes 3 lần quét của Achtemeier (1989). Hình 2.1.1 cho ta so sánh giữa dự báo 48 giờđộ cao địa thế vị
mực 850mb của mơ hình GME với độ phân giải 0.40 trước khi lọc và độ phân giải 1.250 sau khi lọc. Dễ thấy chương trình lọc đã loại bỏ rất tốt các quá trình quy mơ nhỏ cĩ thể quan sát thấy trên hình 2.1.1 (bên trái). Những quá trình quy mơ vừa này,
khi dự báo trên quy mơ lớn, khơng cung cấp thêm nhiều thơng tin cho dự báo viên mà cịn cĩ tác dụng ngược lại làm mờ đi những quá trình quy mơ lớn được quan tâm. Các mực dự báo được lựa chọn bao gồm mực biển (chỉ đối với áp suất trung bình mực biển) và các mực đẳng áp cơ bản 850, 700, 500 và 300mb. Tuy nhiên, do mơ hình TLAPS khơng cung cấp dự báo trên mực 300mb nên các mực đẳng áp sẽ được giới hạn lại ở 3 mực như trên. Tuy nhiên, khi đưa ra sản phẩm dự báo dưới dạng bản đồ tem, chúng tơi vẫn cĩ thểđưa ra kết quả dự báo từ 4 mơ hình cịn lại, bỏ qua mơ hình TLAPS. Hạn dự báo ban đầu được đề xuất dự báo đến 72 giờ
nhưng do TLAPS chỉ cung cấp dự báo đến 48 giờ, chúng tơi sẽ giới hạn lại hạn dự
báo là 2 ngày với tần suất dự báo 12 giờ một. Giống như vấn đề với mực 300mb, sản phẩm dự báo đến 72 giờ từ 4 mơ hình cịn lại vẫn được đưa ra cho các dự báo viên tham khảo. Các biến dự báo ngồi áp suất mực biển pmsl, các biến trên mực
đẳng áp gồm cĩ độ cao địa thế vịh, thành phần giĩ vĩ hướng u, thành phần giĩ kinh hướng v, nhiệt độ T và độ ẩm riêng q. Trong tương lai, các biến này cần được mở
rộng thêm với các biến bề mặt như mưa, nhiệt độ và độẩm tại độ cao 2 mét, giĩ tại
độ cao 10 mét. Trường phân tích đối chứng được lựa chọn là trường phân tích trung bình của tất cả các dự báo thành phần. Chuỗi thời gian đánh giá bắt đầu từ tháng 01/2005 đến tháng 05/2007
2.2. DỰ BÁO TẤT ĐỊNH
2.2.1. Dự báo trung bình tổ hợp
Bảng 2.2.1 cho ta giá trị ME từ dự báo của 5 mơ hình cùng dự báo nhận được
đơn giản bằng trung bình tổ hợp EM với mục đích so sánh. Các giá trị ME nhỏ nhất từ 5 mơ hình cũng như từ dự báo trung bình tổ hợp với mỗi biến trên mỗi mực và với mỗi hạn dự báo sẽ được tơ đậm. Từ bảng 2.2.1 cĩ thể nhận thấy rằng các biến
pmsl, H, u, v, T, q các mơ hình cũng như EM đều cho sai số trung bình nhỏ. Giá trị
nhỏ nhất của ME biến đổi tùy thuộc từng mơ hình, hạn dự báo và biến dự báo. Cĩ thế coi với các biến này các mơ hình đều thể hiện một sai số hệ thống nhỏ. Riêng với độ cao địa thế vị, phân bố của ME cho thấy cĩ sự khác biệt đáng kể giữa các mơ hình, dẫn đến sai số hệ thống vẫn tồn tại khá lớn trong EM.
Bảng 2.2.2 đưa ra kết quảđánh giá trị RMSE cho từng mơ hình thành phần và dự báo trung bình tổ hợp. Điểm thú vị là dự báo trung bình tổ hợp cho ta sai số
nhỏ nhất khi so sánh với cả 5 mơ hình, bất kể hạn dự báo hay biến dự báo. Các
kết quả tương tự cũng tìm thấy đối với các biến trên các mực cịn lại. Điều này cho thấy quả thực EM tính tốn đơn giản nhưng lại rất hiệu quả khi đưa ra dự báo cĩ chất lượng tốt. Nếu chỉ so sánh giữa các mơ hình với nhau, mơ hình GSM tỏ ra là mơ hình cĩ kỹ năng dự báo tốt hơn cả trong khi TLAPS cho thấy kỹ năng dự báo
thấp nhất. Đứng sau GSM là mơ hình GFS trong khi GME và UM cĩ thể xếp vào nhĩm thứ ba. Tuy nhiên về tổng thể, ngoại trừ TLAPS, 4 mơ hình cịn lại đều cĩ các giá trị RMSE khơng quá sai khác giữa các biến
Bảng 2.2.1. Giá trị ME của các biến dự báo tại mực 850, 500mb với hạn dự báo 24, 48 giờ từ 5 mơ hình GFS, GME, GSM, TLAPS, UM và trung bình tổ hợp.
H (m) u (m/s) v (m/s) T (0K) q (g/kg) pmsl pmsl (mb) 850 500 850 500 850 500 850 500 850 500 24 -0.16 -2.4 -7.6 -0.1 -0.2 0.3 0.1 -0.1 0.0 0.2 0.3 GFS 48 0.15 0.1 -5.5 -0.0 -0.3 0.4 0.1 -0.2 0.0 0.1 0.2 24 -0.20 -4.5 -0.2 -0.2 -0.1 0.1 -0.0 0.2 0.5 -0.1 0.1 GME 48 -0.08 -3.7 2.1 -0.4 -0.3 0.2 0.1 0.2 0.6 -0.1 0.1 24 -0.32 -3.6 -4.9 -0.2 0.1 0.0 -0.1 -0.3 -0.2 -0.5 -0.2 GSM 48 -0.38 -4.1 -6.8 -0.2 -0.0 0.2 -0.1 -0.3 -0.3 -0.4 -0.2 24 -0.39 -4.0 -3.5 -0.0 0.1 0.3 0.1 -0.6 0.2 -0.3 -0.4 TLAPS 48 -0.51 -5.5 -7.0 0.2 0.3 0.3 -0.0 -0.6 0.2 -0.4 -0.4 24 -0.65 -5.8 -2.0 -0.1 0.6 0.1 0.1 0.4 0.2 0.5 0.0 UM 48 -0.90 -8.1 -2.9 -0.1 0.5 0.2 0.2 0.4 0.3 0.6 0.1 24 -0.35 -3.7 -3.3 -0.1 0.1 0.2 0.0 -0.1 0.1 -0.1 -0.1 EM 48 -0.34 -3.8 -3.6 -0.1 0.1 0.3 0.0 -0.1 0.2 -0.1 -0.1 Bảng 2.2.2. Giá trị RMSE của các biến dự báo tại mực 850, 500mb với hạn dự báo 24, 48 giờ từ 5 mơ hình GFS, GME, GSM, TLAPS, UM và trung bình tổ hợp.
H (m) u (m/s) v (m/s) T(0K) q (g/kg) pmsl pmsl (mb) 850 500 850 500 850 500 850 500 850 500 24 1.23 9.7 9.3 1.9 2.0 1.7 1.8 0.8 0.5 1.1 0.6 GFS 48 1.32 10.2 9.3 2.3 2.5 2.1 2.2 0.9 0.7 1.2 0.6 24 1.39 11.1 7.1 1.9 2.1 1.7 2.0 0.9 0.8 1.2 0.6 GME 48 1.50 11.7 8.7 2.4 2.6 2.2 2.4 1.0 0.9 1.3 0.7 24 1.14 8.5 7.0 1.6 2.0 1.5 1.7 1.2 0.6 1.5 0.5 GSM 48 1.32 9.7 9.6 2.0 2.4 1.9 2.1 1.2 0.7 1.6 0.6 24 2.26 17.4 10.4 2.4 2.8 2.1 2.5 1.3 0.8 1.7 0.8 TLAPS 48 2.75 21.1 13.4 2.9 3.3 3.0 2.9 1.5 1.0 1.9 0.9 24 1.56 15.0 6.9 1.7 2.2 1.5 1.8 1.2 0.7 1.8 0.5 UM 48 1.87 17.4 8.9 2.1 2.7 1.9 2.3 1.3 0.8 2.0 0.6 24 0.75 6.1 5.1 1.2 1.3 1.1 1.3 0.4 0.4 0.6 0.3 EM 48 1.01 7.9 6.7 1.7 1.9 1.6 1.7 0.6 0.5 0.8 0.4
2.2.2. Dự báo trung bình tổ hợp cĩ hiệu chỉnh sai số hệ thống
Cĩ nhiều phương pháp cho phép khử bias của dự báo dựa trên chuỗi số liệu dự
báo trong quá khứ. Các phương pháp thơng dụng với tập mẫu nhỏ gồm cĩ trung bình trượt, hồi quy tuyến tính và lọc Kalman. Trong đề tài này, chúng tơi thử
nghiệm khử bias với hai phương pháp trung bình trượt và hồi quy tuyến tính với dung lượng mẫu là 40 ngày, thống nhất với các phương pháp xử lý thống kê khác dưới đây như dự báo siêu tổ hợp, hồi quy Gauss khơng thuần nhất. Bảng 2.2.3 tương tự như bảng 2.2.2 cho ta giá trị RMSE dự báo từ các mơ hình sau khi đã khử
bias bằng phương pháp hồi quy tuyến tính. Phương pháp trung bình trượt cho các kết quả gần như tương đương với phương pháp hồi quy tuyến tính nên ta sẽ khơng nêu ra ởđây mà chỉđưa phương pháp hồi quy tuyến tính làm đại diện.
Bảng 2.2.3. Giá trị RMSE của các biến dự báo tại mực 850, 500mb với hạn dự báo 24, 48 giờ từ 5 mơ hình GFS, GME, GSM, TLAPS, UM đã được khử bias theo
phương pháp hồi quy tuyến tính và trung bình tổ hợp.
H (m) u (m/s) v (m/s) T (0K) q (g/kg) pmsl pmsl (mb) 850 500 850 500 850 500 850 500 850 500 24 0.74 5.9 5.0 1.7 1.9 1.5 1.6 0.4 0.5 0.6 0.5