Ngồi khả năng dự báo kỹ năng dự báo, dự báo xác suất là một trong những lý do gĩp phần hình thành dự báo tổ hợp. Với nhiều yếu tố tác động đến chất lượng dự
báo (độ bất định đến cả từđiều kiện ban đầu và mơ hình dự báo), dự báo xác suất tỏ
rõ ưu thế so với dự báo tất định truyền thống. Trong thời kỳđầu của dự báo tổ hợp, dự báo xác suất chủ yếu dựa trên tần số xuất hiện hiện tượng từ các thành phần dự
báo của hệ tổ hợp. Tuy nhiên để dự báo tin cậy, hệ tổ hợp phải thỏa mãn điều kiện trạng thái thực của khí quyển phân bố đều giữa các dự báo thành phần. Trong khi
đĩ, các hệ tổ hợp trong thực tế thường khơng thỏa mãn điều kiện này. Chính vì vậy,
đã cĩ rất nhiều nghiên cứu sau đĩ về các phương pháp xử lý sau mơ hình với dự báo
tổ hợp EMOS (Ensemble-Model Output Statistics). Các phương pháp này cịn cĩ
tên gọi các phương pháp hiệu chỉnh dự báo tổ hợp hay hiệu chỉnh dự báo xác suất. Các phương pháp EMOS khơng hiệu chỉnh mỗi thành phần của hệ tổ hợp mà giả thiết các thành phần thỏa mãn điều kiện về phân bốđều cùng trạng thái thực của khí quyển, sau đĩ dựa trên các thành phần này đưa ra dự báo xác suất như phương pháp truyền thống. Tuy nhiên khác với phương pháp truyền thống, dự báo xác suất
đưa ra là tin cậy trong khi vẫn tăng cường độ nhọn của dự báo. Các khái niệm độ tin cậy, độ nhọn và dự báo xác suất cĩ quan hệ mật thiết với đánh giá dự báo tổ hợp,
mục 1.3 sẽ làm rõ hơn các chủđề này. Các phương pháp EMOS quan trọng gồm cĩ
kỹ thuật biểu đồ hạng (Hamill và Colucci 1997, 1998, Eckel và Walters 1998), kỹ
thuần nhất (Gneiting và cộng sự 2005), hồi quy logistic (Hamill và cộng sự 2004,
Hamill và Whitaker 2006), kỹ thuật tương tự (Hamill và cộng sự 2006, Hamill và
Whitaker 2006) và kỹ thuật đồng hĩa dự báo (Stephenson và cộng sự 2005). Nghiên
cứu của Wilks (2006), Wilks và Hamill (2007) cho thấy ba phương pháp hồi quy
logistic, kỹ thuật áp nhân và hồi quy Gauss khơng thuần nhất NGR
(Nonhomogeneous Gaussian Regression) đem lại những kết quả tốt nhất. Chi tiết về
kỹ thuật NGR cùng với 2 biến thể của nĩ là NGR_EMOS và NGR_EMOSP sẽđược
trình bày chi tiết trong phụ lục III.
1.4. ĐÁNH GIÁ DỰ BÁO TỔ HỢP
Khi nĩi đến đánh giá EF, thực chất là muốn nĩi đến đánh giá dự báo xác suất. Rõ ràng, các chỉ số đánh giá dự báo tất định như sai số trung bình, sai số bình phương trung bình hay hệ số tương quan khơng thích hợp với dự báo xác suất. Dựa trên mối liên hệ giữa xác suất dự báo với tần suất xuất hiện hiện tượng, một yêu cầu cơ bản của dự báo xác suất được đưa ra, đĩ là độ tin cậy (reliability). Một dự báo
được xem là tin cậy nếu tần số xuất hiện sự kiện phù hợp về mặt thống kê với xác suất dự báo xuất hiện hiện tượng. Mở rộng sang dự báo xác suất cho một biến liên tục, dự báo là tin cậy khi phân bố xác suất mà nĩ dự báo phù hợp về mặt thống kê với hàm phân bố kinh nghiệm xác lập được. Một dự báo khí hậu luơn luơn là một dự báo tin cậy. Dự báo khí hậu là dự báo cĩ kỹ năng thấp nhất và dự báo ta đưa ra cần cĩ một kỹ năng cao hơn, cĩ khả năng đưa ra nhiều dự báo chi tiết khác nhau. Như vậy, độ tin cậy của một dự báo khơng nhất thiết đảm bảo một kỹ năng dự báo cao. Khả năng đưa ra các dự báo chi tiết khác nhau so với dự báo khí hậu của một
dự báo xác suất được biết đến trong dự báo xác suất dưới tên gọi độ nhọn
(sharpness).
Nếu dự báo xác suất đưa ra cĩ độ lệch càng lớn so với tần suất khí hậu, dự báo
được xem cĩ độ nhọn càng cao. Với biến liên tục, nếu hàm phân bố dự báo đưa ra
càng khác biệt so với phân bố khí hậu, dự báo cĩ độ nhọn càng cao. Hình 1.4.1
minh họa rõ hơn khái niệm độ nhọn với 4 hàm mật độ xác suất dự báo nhiệt độ khác nhau. Hàm mật độ xác suất gần với hàm mật độ khí hậu sẽ cĩ độ nhọn bằng khơng. Trong hai hàm mật độ cịn lại hàm mật độ nhọn hơn sẽ cĩ độ nhọn cao hơn. Khi hàm mật độ càng nhọn, dự báo ta đưa ra càng chính xác. Trong trường hợp tới hạn, hàm mật độ xác suất sẽ cĩ dạng hàm Dirac và dự báo đưa ra là dự báo tất định truyền thống với một giá trị dự báo nhiệt độ cụ thể. Lúc này độ nhọn cĩ giá trị cực
đại. Trên thực tế, độ nhọn khơng được xác định từ một dự báo xác suất hay phân bố
duy nhất mà phải được xác định trung bình trên nhiều giá trị xác suất và phân bố
một dự báo được đưa ra với mọi trường hợp. Trong trường hợp dự báo tất định hồn hảo, độ nhọn cĩ giá trị cực đại do giá trị xác suất đưa ra chỉ gồm hai giá trị 0% và 100%, hai giá trị cĩ độ lệch lớn nhất so với tần suất khí hậu.
Độ nhọn sẽ khơng cĩ nhiều ý nghĩa nếu một dự báo khơng tin cậy bởi bất kỳ
ai cũng cĩ thể đưa ra dự báo chỉ với hai giá trị 0% và 100% giống như dự báo tất
định hồn hảo. Khi dự báo khơng tin cậy, để thay thế cho khái niệm độ nhọn, người ta sử dụng khái niệm độ phân giải (resolution). Khác với độ nhọn (xem xét khả
năng đưa ra các dự báo chi tiết khác nhau so với dự báo khí hậu), độ phân giải được xem như khả năng đưa các ra các dự báo cĩ khả năng phân hoạch tần suất xuất hiện hiện tượng một cách chi tiết so với giá trị khí hậu. Đây là một khái niệm phân biệt khá tinh tế với khái niệm độ nhọn và cần được giải thích rõ hơn. Hiện nay, các nhà
nghiên cứu đang hướng đến xây dựng các phương pháp hiệu chỉnh EF dựa trên
nguyên tắc tăng độ nhọn hay độ phân giải nhưng vẫn đảm bảo dự báo tin cậy. Trong phương pháp hiệu chỉnh đơn giản như trên, ta chỉ cĩ thể tăng độ tin cậy nhưng khơng thể tăng độ phân giải. Các phương pháp phức tạp hơn cĩ thể đồng thời tăng cả độ tin cậy và độ phân giải. Phương pháp đơn giản nhất là khử sai số hệ thống từ
các dự báo thành phần trước khi đưa ra dự báo xác suất. Các phương pháp phức tạp hơn đã được nhắc đến trong mục 1.2.3 trong đĩ một phương pháp đã được trình bày chi tiết là phương pháp hồi quy Gaus khơng thuần nhất (xem phụ lục III). Các chỉ số đánh giá dự báo xác suất được sử dụng phải xoay quanh ba khái niệm cơ bản đối với dự báo xác suất: độ tin cậy, độ phân giải và độ nhọn. Phần dưới đây sẽ lần lượt giới thiệu các phương pháp đánh giá EF, chỉ rõ liên hệ của mỗi phương pháp với ba khái niệm nêu trên.