KHÁI QUÁT VỀ CÁC MƠ HÌNH DỰ BÁO THÀNH PHẦN VÀ CÁC PHƯƠNG PHÁP TIỀN XỬ LÝ TẬP SỐ LIỆU

Một phần của tài liệu Nghiên cứu ứng dụng dự báo tổ hợp cho một số trường dự báo bão (Trang 52 - 58)

PHƯƠNG PHÁP TIỀN XỬ LÝ TẬP SỐ LIỆU

Kết quả dự báo từ các mơ hình tồn cầu được cung cấp cho TTDBTƯ theo nhiều con đường khác nhau. Dự báo từ 3 mơ hình GME, GSM và TLAPS nhận được qua đường Internet từ ký kết thỏa thuận hợp tác giữa khí tượng Việt Nam và khí tượng các nước Đức, Nhật và Úc. Trong đĩ, TLAPS khơng phải mơ hình tồn cầu của Úc mà là mơ hình khu vực nhiệt đới. Hiện tại, thỏa thuận hợp tác với khí tượng Canada đã mở rộng thêm tập số liệu tồn cầu với mơ hình GEM. Thơng qua hệ quản trị dữ liệu LDM trên hệ NAWIPS tại trung tâm, dự báo viên cĩ thể truy cập thêm thơng tin dự báo từ 2 mơ hình GFS và UM. Hệ LDM đã được yêu cầu cung cấp thêm dự báo từ mơ hình NOGAPS của Hải quân Mỹ. Từ “mơ hình” khơng thích hợp với các dự báo trên, chính xác hơn đây đều là các hệ thống phân tích dự báo tồn cầu nhưng do từ mơ hình đã được sử dụng quen thuộc tại Việt Nam nên ở đây chúng tơi vẫn sử dụng từ này. Dưới đây là vài nét mơ tả chung về các mơ hình dự báo này.

Mơ hình GFS (Global Forecast System) là mơ hình phổ tồn cầu được phát triển và sử dụng nghiệp vụ tại NCEP. Mơ hình này trước đây được biết đến với tên gọi AVN/MRF, tên gọi GFS bắt đầu thay thế AVN từ tháng 09/2002. Hiện tại, mơ hình cĩ độ phân giải T382L64 (khoảng 40km, 64 mực) tích phân tới 180 giờ và T190L64 (khoảng 80km, 64 mực) tích phân tới 384 giờ. Số liệu GFS được cung cấp qua hệ LDM, do giới hạn về tốc độ đường truyền cũng như yêu cầu đảm bảo dự báo thời gian thực, cĩ độ phân giải 1.250 trên 12 mực đẳng áp chuẩn với các biến dự báo cơ bản hạn 3 ngày. Số liệu này bắt đầu nhận được hàng ngày tại TTDBTƯ từ năm 2004. Ngồi ra, cĩ thể truy cập số liệu GFS hàng ngày qua đường Internet với độ phân giải 0.50 và 10 do số liệu này được NCEP cung cấp miễn phí trên mạng.

Trong khuổn khổ hợp tác giữa Trường Đại học Khoa học tự nhiên (Đại Học Quốc Gia Hà Nội), TTDBTƯ, Trường Đại học Tổng hợp Munich (Cộng Hịa Liên Bang Đức) và Cơ quan Khí tượng Đức (DWD), DWD bắt đầu cung cấp kết quả của mơ hình dự báo tồn cầu GME cho TTDBTƯ từ năm 2002. Khơng giống như với các mơ hình tồn cầu khác trên thế giới, mơ hình GME là mơ hình rời rạc khơng gian trên lưới tam giác, khơng sử dụng các hàm phổ. Hiện tại, độ phân giải của mơ hình tương đương với 40km với 40 mực thẳng đứng tích phân đến 168 giờ. Số liệu dự báo từ GME cung cấp cho Việt Nam vẫn giữ nguyên độ phân giải như đang chạy tại DWD nhưng chỉ được cho trên miền đủ rộng bao phủ khu vực Việt Nam 50S -

350N, 80.250E-130.250E. Các biến được cung cấp bao gồm các biến cơ bản như các mơ hình tồn cầu khác ngồi ra cịn cĩ các biến mây. Thời gian dự báo được cung cấp đến 78 giờ.

Thơng qua dự án hợp tác song phương giữa Tổng cục Khí tượng Thủy Văn trước đây (nay là Trung tâm Dự báo Quốc gia Khí tượng Thủy văn) và Cơ quan Khí tượng Nhật Bản (JMA), TTDBTƯ nhận được kết quả dự báo từ mơ hình tồn cầu GSM (Global Spectral Model) của Nhật Bản từ tháng 12 năm 1997. Tương tự như GFS, GSM là mơ hình phổ với độ phân giải hiện tại T319L40 (khoảng 60km, 40 mực) tích phân đến 216 giờ. Số liệu GSM được cung cấp cho TTDBTƯ cĩ độ phân giải 1.250 trong khu vực 200S-600N, 200E-2000E dự báo đến 84 giờ. Các biến được cung cấp bao gồm các biến cơ bản trên 12 mực đẳng áp chuẩn như GFS.

Kết quả dự báo của mơ hình khu vực nhiệt đới TLAPS (Tropical Limited Area Prediction System) trước đây và nay là TXLAPS (Tropical Extend Limited Area Prediction System) bắt đầu được cung cấp từ năm 2001, khi bắt đầu cĩ hợp tác giữa TTDBTƯ và Cục Khí tượng Úc (BoM). Hiện tại, độ phân giải của mơ hình TXLAPS là 0.3750 (khoảng 40km), 51 mực thẳng đứng, miền tích phân 48.750N- 450S, 60.00E-142.50W, dự báo đến 72 giờ. Dự báo TXLAPS cung cấp cho TTDBTƯ cĩ độ phân giải 0.750, hạn dự báo đến 48 giờ gồm các yếu tố khí tượng cơ bản trong khu vực 40.50N-40.50S, 70.50E-180.50E. Các yếu tố đều được cho trên 12 mực khí quyển chuẩn. Đây là mơ hình duy nhất trong 5 mơ hình của hệ tổ hợp khơng phải là mơ hình tồn cầu. Tuy nhiên, độ phân giải hiện tại của TLAPS tương đương với độ phân giải của GFS, GME và UM, do đĩ sử dụng mơ hình này như một dự báo thành phần khơng cĩ ảnh hưởng gì tới hoạt động của hệ thống.

Mơ hình UM (Unified Model) của Cơ quan Khí tượng Anh (UKMO) là một mơ hình rời rạc hĩa khí quyển trên lưới (giống như mơ hình GME). Tuy nhiên, cách thiết kế và xây dựng của UM rất mềm dẻo, tạo cho mơ hình khả năng mơ phỏng và dự báo khơng chỉ cho thời tiết mà cịn cho cả khí hậu và đại dương, khơng chỉ chạy tồn cầu mà cịn cĩ thể thực hiện cho khu vực. Hiện tại, mơ hình UM tồn cầu tại UKMO cĩ độ phân giải 0.56250 x 0.3750 (khoảng 40km), 50 mực thẳng đứng, dự báo tới 144 giờ. Dự báo của UM nhận qua hệ LDM cĩ độ phân giải 1.250, cung cấp đến 72 giờ dự báo, bao gồm các biến cơ bản trên 12 mực khí quyển chuẩn.

Như vậy cĩ thể thấy các kết quả dự báo từ 5 mơ hình nhận được tại TTDBTƯ cĩ miền dự báo được cung cấp khác nhau (tồn cầu như GFS, UM hay khu vực như GME, GSM và TLAPS), cĩ độ phân giải khác nhau (1.250 với GFS, GSM và UM, 0.750 với TLAPS và 0.40 với GME), với định dạng khác nhau (mã GEMPAK với GFS và UM, mã GRIB với GME, GSM, TLAPS). Do đĩ, đầu tiên ta phải xác định một miền dự báo chung cho các dự báo thành phần. Mơ hình GME là mơ hình dự

báo cĩ miền dự báo cung cấp nhỏ nhất trong cả 5 mơ hình do đĩ chúng tơi lựa chọn miền dự báo trùng với miền dự báo được cung cấp của GME cĩ tọa độ 50S -350N, 80.250E-130.250E. Vấn đề thứ hai liên quan đến lựa chọn độ phân giải của hệ tổ hợp. Do hệ thống dự báo tổ hợp của ta là hệ thống dự báo trường, các dự báo thành phần cần phải tương đương về mặt quy mơ. Cho nên, các dự báo thành phần phải được đưa về cùng một độ phân giải là độ phân giải thấp nhất cĩ được từ 5 mơ hình trên: 1.250. Khi chuyển các trường dự báo từ độ phân giải cao về độ phân giải thấp hơn, ta phải sử dụng các bộ lọc mà điển hình là bộ lọc tần thấp, loại bỏ các sĩng ngắn mà dự báo với độ phân giải cao giải được nhưng khơng biểu diễn được trên khơng gian với độ phân giải thấp hơn. Trên thực tế, dự báo với phân giải thơ hơn so với phân giải thực của các mơ hình tồn cầu cung cấp cho Việt Nam đều được thực hiện theo một cách như vậy.

Chương trình lọc chúng tơi sử dụng được xây dựng theo phương pháp Barnes 3 lần quét của Achtemeier (1989). Hình 2.1.1 cho ta so sánh giữa dự báo 48 giờ độ cao địa thế vị mực 850mb của mơ hình GME với độ phân giải 0.40 trước khi lọc và độ phân giải 1.250 sau khi lọc. Dễ thấy chương trình lọc đã loại bỏ rất tốt các quá trình quy mơ nhỏ cĩ thể quan sát thấy trên hình 2.1.1 (bên trái). Những quá trình quy mơ vừa này, khi dự báo trên quy mơ lớn, khơng cung cấp thêm nhiều thơng tin cho dự báo viên mà cịn cĩ tác dụng ngược lại làm mờ đi những quá trình quy mơ lớn được quan tâm.

Hình 2.1.1. Trường địa thế vị mực 850mb theo dự báo của GME khi biểu diễn với độ phân giải 0.40 (trái) và 1.250 (phải).

Các mực dự báo được lựa chọn bao gồm mực biển (chỉ đối với áp suất trung bình mực biển) và các mực đẳng áp cơ bản 850, 700, 500 và 300mb. Tuy nhiên, do mơ hình TLAPS khơng cung cấp dự báo trên mực 300mb nên các mực đẳng áp sẽ được giới hạn lại ở 3 mực như trên. Tuy nhiên, khi đưa ra sản phẩm dự báo dưới

dạng bản đồ tem, chúng tơi vẫn cĩ thể đưa ra kết quả dự báo từ 4 mơ hình cịn lại, bỏ qua mơ hình TLAPS. Hạn dự báo ban đầu được đề xuất dự báo đến 72 giờ nhưng do TLAPS chỉ cung cấp dự báo đến 48 giờ, chúng tơi sẽ giới hạn lại hạn dự báo là 2 ngày với tần suất dự báo 12 giờ một. Giống như vấn đề với mực 300mb, sản phẩm dự báo đến 72 giờ từ 4 mơ hình cịn lại vẫn được đưa ra cho các dự báo viên tham khảo. Các biến dự báo ngồi áp suất mực biển pmsl, các biến trên mực đẳng áp gồm cĩ độ cao địa thế vị h, thành phần giĩ vĩ hướng u, thành phần giĩ kinh hướng v, nhiệt độ T và độ ẩm riêng q. Trong tương lai, các biến này cần được mở rộng thêm với các biến bề mặt như mưa, nhiệt độ và độ ẩm tại độ cao 2 mét, giĩ tại độ cao 10 mét.

Tuy nhiên, do trường độ ẩm được cung cấp bởi các mơ hình thành phần được định nghĩa khác nhau (qua các biến nhiệt độ điểm sương, độ hụt điểm sương, độ ẩm tương đối hay độ ẩm riêng), do đĩ chúng tơi đã xây dựng một số chương trình chuyển đổi cần thiết để đưa về cùng một biến. Trong nghiên cứu này, biến độ ẩm riêng được sử dụng để đại diện cho trường ẩm. Các dự báo sẽ được chuyển về một định dạng chung NetCDF (Network Common Data Form) trước khi đưa vào xử lý. Ngồi ra, do các mơ hình là độc lập nên tất cả các chương trình xử lý đều được song song hĩa theo MPI, đẩy nhanh tốc độ tính tốn khi nghiên cứu cũng như khi đưa vào nghiệp vụ.

Về đánh giá dự báo, cĩ hai chiến lược đánh giá dự báo khác nhau: đánh giá dự báo dựa trên quan trắc và đánh giá dự báo dựa trên phân tích. Đánh giá dự báo dựa trên quan trắc cĩ một số ưu điểm nhất định do đây là số liệu trực tiếp nhất tại mỗi điểm dự báo. Tuy nhiên với độ phân giải 1.250, sử dụng quan trắc chắc chắn sẽ dẫn đến sai số biểu diễn (representative error) lớn. Do đĩ, với độ phân giải 1.250 sẽ thích hợp hơn nếu ta sử dụng phân tích trong đánh giá dự báo. Ta cĩ 5 phân tích từ 5 mơ hình GFS, GME, GSM, TLAPS và UM. Vấn đề đặt ra bây giờ sẽ là sử dụng phân tích của mơ hình nào khi đánh giá. Đối với một hệ tổ hợp dựa trên nhiễu động trường ban đầu như tại NCEP hay ECMWF, các nhiễu động thường được cộng vào hay trừ đi quanh một giá trị mà theo thuật ngữ của dự báo tổ hợp được gọi là phân tích đối chứng (control analysis). Phân tích đối chứng thơng thường chính là phân tích từ hệ thống phân tích dự báo của dự báo tất định khi chưa cĩ dự báo tổ hợp. Trường phân tích này sẽ được sử dụng khi đánh giá sau đĩ. Đối với những hệ tổ hợp dưa trên phương pháp đa phân tích đa mơ hình như của ta, phân tích đối chứng sẽ được lấy bằng trung bình tổ hợp của các phân tích thành phần (Jolliffe và Stephenson 2003). Cách thức này cũng được một số tác giả khác thực hiện như Richardson (2001), Eckel và Mass (2005) với lý luận rằng trường phân tích như vậy sẽ loại bỏ được những đặc điểm khơng thống nhất giữa các phân tích, giữ lại những

thơng tin quan trọng nhất mà các phân tích đều thể hiện. Nghiên cứu của các tác giả này cũng cho thấy, dự báo với trường phân tích trung bình tổ hợp cĩ chất lượng tốt hơn so với dự báo từ bất kỳ phân tích của mơ hình cụ thể nào. Do đĩ, trung bình tổ hợp của các phân tích sẽ được sử dụng khi đánh giá trong những phần sau. Hình 2.1.2 cho ta so sánh trường phân tích phân tích từ 5 mơ hình thành phần cũng như trường phân tích sau khi lấy trung bình tổ hợp cho độ cao địa thế vị mực 850mb.

Hình 2.1.2. Trường phân tích của độ cao địa thế vị mực 850mb từ 5 mơ hình GFS, GME, GSM, TLAPS, UM và trung bình tổ hợp.

Để kiểm tra chất lượng phân tích từ các mơ hình thành phần cũng như trung bình tổ hợp, ta so sánh các giá trị phân tích đã được nội suy về trạm với quan trắc trực tiếp tại trạm (xem các hình 2.1.3 đến 2.1.6). Tất nhiên sẽ xuất hiện sai số biểu diễn khi so sánh như vậy nhưng ta sẽ khơng xét đến ở đây. Mục đích đưa ra ở đây chỉ là tìm hiểu một cách định tính chất lượng của trường phân tích khi lấy trung bình so với trường phân tích riêng rẽ từ mỗi mơ hình. Với phân tích của áp suất mực biển, GSM cho thấy cĩ sai số hệ thống cũng như sai số RMSE nhỏ nhất tiếp đến là trung bình tổ hợp. Khảo sát thêm các trường khác, ta sẽ thấy sai số hệ thống cũng như sai số của GSM khơng phải nhỏ nhất trong tất cả các trường hợp. Ví dụ, với trường nhiệt độ mực 500mb, GSM lại cho thấy sai số hệ thống của nĩ khá lớn, chỉ đứng sau TLAPS. Trong trường hợp này, giữa 3 mơ hình GFS, GME và UM khĩ cĩ thể khẳng định phân tích của mơ hình nào tốt nhất. Tuy nhiên dễ dàng nhận ra trung bình tổ hợp cĩ sai số hệ thống cũng như sai số nhỏ nhất. Với các biến khác, các kết quả đánh giá là tương tự và khơng thể nĩi được phân tích nào tốt nhất trong 5 phân tích và trung bình tổ hợp là một giải pháp trung hịa tốt hơn cả.

Hình 2.1.3. Sai số phân tích ME giữa các phân tích thành phần với phân tích trung bình tổ hợp cho khí áp trung bình mực biển.

Hình 2.1.4. Sai số phân tích RMSE giữa các phân tích thành phần với phân tích trung bình tổ hợp cho khí áp trung bình mực biển.

Hình 2.1.5. Sai số phân tích ME giữa các phân tích thành phần với phân tích trung bình tổ hợp cho trường nhiệt độ tại mực 500mb.

Hình 2.1.6. Sai số phân tích RMSE giữa các phân tích thành phần với phân tích trung bình tổ hợp cho trường nhiệt độ tại mực 500mb.

Một phần của tài liệu Nghiên cứu ứng dụng dự báo tổ hợp cho một số trường dự báo bão (Trang 52 - 58)