Về nguyên tắc, các chỉ số ECE có thể đƣợc xác định trực tiếp từ sản phẩm đầu ra của mô hình khu vực với các ngƣỡng nhiệt độ (T2m, Tx) hoặc lƣợng mƣa (R24) hàng ngày đã cho nhƣ trong mục 2.1. Tuy nhiên, để loại trừ phần nào ảnh hƣởng sai số hệ thống của mô hình, một số chỉ số nhƣ C13, C15, H35, H37, R50 sẽ đƣợc xác định bằng các ngƣỡng phân vị T13, T15, T35, T37, Rd50 thay cho các ngƣỡng cố định 13o
C, 15oC, 35oC, 37oC và 50mm, các chỉ số khác đƣợc xác định trực tiếp từ sản phẩm mô hình. Cụ thể:
31 Tx=1 𝑛 𝑇𝑥𝑖 Tm=1 𝑛 𝑇𝑚𝑖 TXx= MAX(Txi) TNn= MIN(Tni)
2) Các chỉ số đƣợc xác định gián tiếp từ sản phẩm mô hình qua các ngƣỡng phân vị:
C15= số ngày trong tháng có T ≤ T15 C13= số ngày trong tháng có T ≤ T13 H35= số ngày trong tháng có Txi ≥ Tx35 H37= số ngày trong tháng có Txi ≥ Tx37 R50= số ngày trong tháng có R24 ≥ Rd50
Trong đó: Txi và Tmi tƣơng ứng là giá trị nhiệt độ cực đại và cực tiểu của ngày thứ i; n là số ngày trong tháng đƣợc xét. T là nhiệt độ trung bình ngày. R24 là lƣợng mƣa tích lũy ngày. Các ngƣỡng phân vị T13, T15, Tx35, Tx37, Rd50 đƣợc xác định sao cho: P(T ≤ T15) = PC15 P(T≤ T13) = PC13 P(Tx≥Tx35) = PH35 P(Tx≥Tx37) = PH37 P(R24 ≥ Rd50) = PR50
32
Các đại lƣợng PC15, PC13, PH35, PH37, PR50 là xác suất khí hậu đƣợc xác định nhƣ sau:
Từsố liệu quan trắchàng ngày của 70 trạm khí tƣợng phân bố trên toàn lãnh thổ Việt Nam giai đoạn 1961-2010 của các yếu tố nhiệt độ trung bình ngày (T2m), nhiệt độ cực đại ngày (Tx) và lƣợng mƣa ngày R24, tính đƣợc các xác suất sau cho từng tháng trong năm: PC15= P(T2m ≤ 150 C) PC13= P(T2m ≤ 130 C) PH35= P(Tx ≥ 350 C) PH37= P(Tx ≥ 370 C) PR50= P(R ≥ 50mm)
Trong ví dụ minh họa dƣới đây (hình 4) đƣờng màu đỏ biểu diễn phân bố xác suất của nhiệt độ cực đại quan trắc, đƣờng màu xanh biểu diễn phân bố xác suất của nhiệt độ cực đại mô hình. Diện tích miền màu đỏ là PH35, ngƣỡng quan trắc tƣơng ứng bằng 350C. Diện tích miền màu xanh bằng diện tích miền tô màu đỏ và bằng PH35. Khi đó, ngƣỡng của mô hình là giá trị thỏa mãn PH35= P(Tx ≥ Tx35).
33
Hình 2.3 Xác định chỉ số ECE bằng phƣơng pháp phân vị
2.5 Phương pháp đánh giá
Do chƣa có đầy đủ các nguồn số liệu phân tích hoặc tái phân tích trên lƣới của miền dự báo nên để tiến hành đánh giá trong luận văn này sẽ so sánh trực tiếp sản phẩm của mô hình sau khi đã nội suy về mạng lƣới trạm khí tƣợng trên lãnh thổ Việt Nam với số liệu quan trắc synop tƣơng ứng tại trạm.
Số liệu quan trắc đƣợc sử dụng là bộ số liệu hàng ngày từ 172 trạm của các yếu tố: nhiệt độ trung bình ngày (T2m), nhiệt độ cực đại ngày (Tx), nhiệt độ cực tiểu ngày (Tm) và lƣợng mƣa ngày (R24).
Hai khía cạnh đƣợc quan tâm xem xét khi đánh giá ở đây là hạn dự báo (Lead time) và thời điểm đƣợc dự báo (Target month) hay đích dự báo. Do đó khi lập các tập mẫu, tất cả các lần dự báo trong một tháng đƣợc gộp lại với nhau nhằm làm tăng dung lƣợng mẫu. Mặc dù vậy dung lƣợng mẫu vẫn chƣa đủ lớn vì mới chỉ có chƣa đầy một năm làm dự báo và mỗi tháng chỉ có tối đa 4-5 lần dự báo. Bởi vậy, toàn bộ số liệu của tất cả các trạm cũng đã đƣợc gộp lại. Nói cách khác, việc đánh giá ở đây mới chỉ dừng lại ở mức độ xem xét tính hợp lý của kết quả dự báo, chƣa thể nói về độ chính xác của dự báo vì việc “trộn lẫn” đó có thể sẽ gây ra sự bất đồng nhất lớn trong tập mẫu.
Ngƣỡng quan trắc Ngƣỡng
34
Một vấn đề khác, trong dự báo hạn mùa, đơn vị thời gian dự báo (time window) tối thiểu là một tháng thay vì hàng ngày hoặc hàng giờ nhƣ trong dự báo thời tiết. Nghĩa là giá trị dự báo chỉ có ý nghĩa phản ánh “điều kiện thời tiết” trong tháng đƣợc dự báo chứ không thể chỉ rõ hiện tƣợng sẽ xảy ra vào ngày nào cụ thể. Việc so sánh giá trị dự báo với giá trị quan trắc theo đơn vị ngày vì vậy chƣa thực sự hợp lý, nhất là các đặc trƣng phản ánh sai số hệ thống, sai số quân phƣơng hay hệ số tƣơng quan. Tuy nhiên cũng vì lý do dung lƣợng mẫu bé nên trong luận văn này vẫn phải sử dụng cách xem xét đó với mục đích đánh giá sơ bộ. Ngoài ra, để hợp lý hơn, ở đây đã sử dụng thêm hai đặc trƣng khác là phân bố tần suất không điều kiện một chiều và hai chiều.
Từ đó, tập mẫu đƣợc sử dụng để đánh giá cho một tháng (target) nào đó sẽ là:
1) Là số ngày trong tháng đầu tiên đƣợc dự báo.
2) Số giá trị cho một tháng sử dụng thêm hai đặc trƣng khác là phân bố tần suất và phân bố đồng thời. Ở đây, số liệu quan trắc đƣợc lặp lại cho mỗi lần dự báo do đó luôn luôn có sự tƣơng ứng mỗi giá trị dự báo sẽ có một giá trị quan trắc. Dung lƣợng mẫu sẽ là:
N = 172 x Nday x Nfcs
Với Nday là số ngày của tháng đích (target), Nfcs là số lần chạy dự báo có thể có (ít nhất 1 lần, nhiều nhất 5 lần).
Các đặc trƣng thống kê đƣợc sử dụng trong đánh giá gồm: 1) Sai số trung bình hay sai số hệ thống ME (Mean Error)
) ( 1 1 i N i i O F N ME
Chỉ số ME biểu thị sai số trung bình của mô hình so với quan trắc, nó cho biết thiên hƣớng sai số của mô hình nhƣng không phản ánh độ lớn của sai số. ME dƣơng có nghĩa là giá trị của mô hình có xu hƣớng cao hơn quan trắc, ME âm thì mô hình thấp hơn quan trắc. Mô hình đƣợc xem là ”hoàn hảo” (không thiên lệch về một phía nào cả) nếu ME=0. Miền giá trị của ME biến thiên từ - đến +.
35 N i i i O F N RMSE 1 2 1
RMSE là căn bậc hai của MSE và là thƣớc đo của biên độ sai số nhƣng không cho biết thiên hƣớng của sai số, và còn đƣợc gọi là sai số bậc hai. Khi sai số biến động càng mạnh thì RMSE càng lớn. Đặc biệt RMSE rất nhạy cảm với những giá trị sai số lớn. Do đó, nếu RMSE càng gần MAE sai số mô hình càng ổn định và có thể thực hiện việc hiệu chỉnh sản phẩm mô hình. Giữa RMSE và MAE tồn tại bất đẳng thức MAERMSE. Dấu “=” xảy ra khi và chỉ khi mô hình hoàn toàn không có sai số, khi đó RMSE = MAE = 0.
3) Hệ số tƣơng quanCOR (Correlation Coefficient)
COR= Fi-F ( )(Oi-O) i=1 N å Fi-F ( )2 i=1 N å (Oi-O)2 i=1 N å
4) Phân bố tần suất một chiều
P1(fj, fk) = P(fj≤ F <fk) P1(oj, ok) = P(oj ≤ O<ok) 5) Phân bố tần suất hai chiều
P2(fj, fk om, ol) = P(fj ≤ F <fk; om ≤ O <ol)
Trong các công thức trên đây, Fi và Oi tƣơng ứng là giá trị mô hình và giá trị quan trắc của một biến nào đó,i=1,2,…, N, vớiN là dung lƣợng mẫu.
36
Chƣơng 3
KẾT QUẢ VÀ NHẬN XÉT
Nội dung kết quả bao gồm:
Nhiệt độ trung bình, lƣợng mƣa trung bình tháng Nhiệt độ cực đại, cực tiểu trung bình tháng Nhiệt độ cực đại, cực tiểu tuyệt đối tháng
Số ngày rét đậm C15 và số ngày rét đậm rét hại C13
Số ngày nắng nóng H35, và số ngày nắng nóng gay gắt H37 Số ngày mƣa lớn R50mm
3.1 Kết quả nhiệt độ trung bình tháng a) Nhiệt độ trung bình tháng a) Nhiệt độ trung bình tháng
Bản đồ trƣờng nhiệt độ trung bình tháng (hình 3.1) dự báo cho tháng 3 đến tháng 8 có hạn dự báo lần lƣợt từ 1 đến 6 tháng với thời điểm dự báo ban đầu là ngày 13 tháng 02 năm 2012. Kết quả dự báo cho thấy trƣờng nhiệt độ trung bình đã đƣợc mô phỏng khá tốt. Vào tháng 1, nhiệt độ không khí thấp ở phía Nam Trung Quốc do khối không khí lạnh lục địa hoạt động. Nhiệt độ tăng dần khi di chuyển xuống phía Nam. Vào các tháng tiếp theo, khi sự hoạt động của khối không khí lạnh lục địa suy yếu, nhiệt độ không khí đã tăng dần. Ngoài ra nhiệt độ không khí thấp hơn ở những nơi có địa hình cao cũng đƣợc mô phỏng khá hợp lý.
37
38
(a) (b)
(c) (d)
Hình 3.2 Nhiệt độ trung bình tháng (a), hệ số tƣơng quan (b), sai số ME (c) và sai số quân phƣơng (d) Hình 3.2 (a) biểu diễn giá trị nhiệt độ trung bình tháng với trục x là tháng dự báo (từ tháng 1 đến tháng 10), hạn dự báo từ 0 đếm 6 tháng đƣợc biểu diễn theo trục y. Thang bên dƣới là giá trị quan trắc từng tháng tƣơng ứng, thang giá trị biểu diễn nhiệt độ đơn vị là độ C. Giá trị tại mỗi ô thể hiện giá trị trung bình cho một tháng cụ thể với 1 hạn dự báo xác định. Khi so sánh giá trị trung bình tháng kết quả mô hình và quan trắc chúng ta có thể thấy kết quả mô hình thấp hơn quan trắc ở hầu hết các tháng và hầu hết các hạn dự báo. Khi xem xét với các hạn dự báo, với các thời điểm dự báo ban đầu khác nhau, chúng ta có thể thấy kết quả dự báo nhiệt độ khá đồng nhất với các đích dự báo, điều này cho thấy, mô hình cho kết quả dự báo khí hậu khá ổn định, ko bị ảnh hƣởng nhiều bởi điều kiện thời gian ban đầu khác nhau. Cần phải lƣu ý rằng, kết quả giá trị dự báo tại một tháng đƣợc so sánh với các hạn dự báo khác nhau cùng một cột giá trị.
39
Hình 3.2 (b) biểu diễn giá trị tƣơng quan của chuỗi giá trị quan trắc và mô hình, trục x là tháng dự báo (từ tháng 1 đến tháng 10), trục y là hạn dự báo (từ 0 đến 6 tháng). Thang màu biểu diễn giá trị tƣơng quan tƣơng ứng (từ 0.0 đến 1.0) với mỗi tháng cụ thể và 1 hạn dự báo xác định. Khi xem xét giá trị tƣơng quan giữa kết quả mô hình và quan trắc, chúng ta có thể thấy, đối với trƣờng nhiệt độ, mô hình cho kết quả tƣơng quan khá cao, hầu hết các dự báo cho kết quả tƣơng quan từ 0,4 đến 0,8. Đối với dự báo cho tháng 6, tháng 7 và tháng 10 cho tƣơng quan cao hơn cả. Ngoài ra, với hạn dự báo càng ngắn cho giá trị tƣơng quan càng cao, điều này cho thấy, đối với trƣờng nhiệt độ, hạn dự báo càng ngắn cho kết quả dự báo càng tốt hơn.
Hình 3.2 (c) biểu diễn tƣơng tự với giá trị sai số trung bình ME. Kết quả cho thấy mô hình cho dự báo giá trị nhiệt độ thiên thấp ở tất cả các tháng và tất cả các hạn dự báo, giá trị sai số chủ yếu trong khoảng từ -1 đến -3.50C. Trong các tháng dự báo, các tháng mùa hè tháng 7, tháng 8, tháng 9 là cho sai số dự báo nhỏ hơn cả. Các tháng chuyển mùa, tháng 4, tháng 5 và tháng 10 cho sai số lớn hơn cả. Hạn dự báo càng dài cho sai số dự báo càng lớn. Với các thời điểm dự báo khác nhau không cho giá trị sai số đáng kể.
Hình 3.2 (d) biểu diễn tƣơng tự với giá trị sai số quân phƣơng (RMSE). Ở trƣờng nhiệt độ, RMSE chủ yếu biến động trong khoảng từ 3.50C đến 5.50C. Giá trị sai số quân phƣơng lớn do sai số dự báo giá trị từng ngày của mô hình sai khác với giá trị hàng ngày của quan trắc. Trong dự báo hạn dài tối đa đến 6 tháng, rất khó để dự báo chính xác giá trị nhiệt độ từng ngày cụ thể. Kết quả cũng cho thấy dự báo cho các tháng 6, 7, 8 với hạn dự báo từ 1 đến 3 tháng cho kết quả sai số quân phƣơng là thấp nhất, Với thời điểm dự báo ban đầu là tháng 1, cho khoảng sai số quân phƣơng là lớn nhất.
Từ những đánh giá cho trƣờng nhiệt độ bề mặt cho ta thấy một số kết luận: - Đối với trƣờng nhiệt độ bề mặt, dự báo cho các tháng mùa hè (từ tháng 6 đến tháng 9) với hạn dự báo ngắn (khoảng từ 1 đến 3 tháng) cho kết quả tốt nhất. Với các thời điểm dự báo khác nhau hầu nhƣ ít cho kết quả khác nhau với cùng đích dự báo.
- Với trƣờng nhiệt độ, có thể thấy rõ ràng là mô hình cho dự báo thiên âm, với các hạn dự báo khác nhau đều cho sai số khá đồng nhất, ngoài ra chuỗi số liệu đƣợc phân tích theo giá trị từng ngày, vì mục đích của bài toán là dự báo hạn mùa, hàm phân bố các giá trị trong tháng của dự báo mới là đặc trƣng quan trọng nhất, nó cho phép đánh giá dự báo có nắm bắt đƣợc phổ giá trị hay không, đó là quyết định có dự
40
báo đƣợc các khoảng giá trị cực trị hay không. Sau đây chúng tôi sẽ phân tích hàm phân bố tần suất (hình 3.3) và phân bố đồng thời (hình 3.4) đối với trƣờng nhiệt độ trung bình.
(a) (b) (c)
(d) (e)
Hình 3.3 Đồ thị phân bố tần suất trƣờng nhiệt độ trung bình cho tháng 8 và tháng 4
Hình 3.3 biểu diễn phân bố tần suất (phân bố một chiều) trƣờng nhiệt độ trung bình cho tháng 8 và tháng 4 với các hạn dự báo khác nhau. Trục x là giá trị nhiệt độ (đơn vị độ C), trục y là tần suất (đơn vị %). Đồ thị màu đỏ biểu diễn phân bố quan trắc, đồ thị màu xanh biểu diễn phân bố mô hình. Dự báo tháng 8 với hạn dự báo 1 tháng (a), 3 tháng (b), 6 tháng (c) và dự báo tháng 4 với hạn dự báo 1 tháng (d) và 3 tháng (e).
Dựa vào đồ thị phân bố với dự báo trƣờng nhiệt độ tháng 8 với các hạn dự báo 1 tháng, 3 tháng, 6 tháng cho thấy phân bố nhiệt độ tháng 8 chủ yếu khoảng 24 đến 260C, kỳ vọng khoảng 250C trong khi giá trị quan trắc có ngƣỡng giá trị lớn hơn, khoảng 26 đến 300C, trung bình khoảng 280C. Đối với dạng phân bố của đồ thị dự báo có dạng chuẩn, đối xứng hơn, trong khi phân bố hàm quan trắc có dạng lệch phải. Giá trị quan trắc phân bố trong khoảng từ 18 đến 320C, trong khi dự báo giá trị trong khoảng 18 đến 300C. Với các hạn dự báo khác nhau hầu nhƣ có sự đồng nhất về dạng phân bố. Từ dạng phân bố của mô hình và quan trắc có thể thấy, đối với dự báo tháng 8, mô hình dự báo thiên thấp so với quan trắc từ 2-40C có tính hệ thống.
41
Phân bố tần suất giá trị nhiệt độ tháng 4 có sự khác biệt so với các tháng 6,7,8 khi mà phân bố giá trị quan trắc trải rộng trong khoảng từ 16 đến 340C và chủ yếu phân bố trong khoảng 24 đến 300C, trong khi phân bố giá trị quan trắc trong tháng 8 chủ yếu trong khoảng 28 đến 300C. Sự khác biệt trong phân bố tần suất tháng 4 và tháng 8 cho phép khảo sát về khả năng dự báo với các phân bố tần suất khác nhau.
Sự phân bố tần suất giữa 3 mùa hè, tháng 7, tháng 8, tháng 9 (xem phụ lục) với các hạn dự báo khác nhau cũng đƣợc cho thấy nền nhiệt độ dự báo đều thấp hơn quan trắc, giá trị kỳ vọng của dự báo đều thấp hơn quan trắc khoảng 2 đến 40C. Về dạng phân bố nhiệt độ dự báo tháng 7, 8, 9 hầu nhƣ tuân theo dạng phân bố chuẩn, trong khi phân bố quan trắc thƣờng có dạng chuẩn (tháng 8, 9) hoặc lệch phải (tháng 7). Giá trị dự báo hầu hết rơi vào khoảng 18 đến 300C, trong khi giá trị quan trắc phổ biến trong khoảng 20-320C. Ngoài ra, khi xem xét độ nhọn của phân bố, chúng ta có thể thấy dự báo nắm bắt khá tốt. Phân bố tần suất cao nhất khoảng 35% đối với tháng 7, 38% đối với tháng 8 và khoảng 40% đối với tháng 9. Từ các kết quả trên cũng cho thấy mô hình cho giá trị dự báo nắm bắt khá tốt phân bố giá trị quan trắc, từ đó củng cố thêm nhận định sai số có tính hệ thống của mô hình.
(a) (b) (c)
(d) (e)
Hình 3.4: Phân bố đồng thời giá trị nhiệt độ tháng 8 và tháng 4
Tiếp theo, trong hình 3.4 chúng tôi sẽ xem xét phân bố đồng thời hay phân bố tần suất 2 chiều của trƣờng nhiệt độ trung bình. Trục x là giá trị mô hình, trục y là giá trị quan trắc, giá trị tại mỗi ô là xác suất (%) có điều kiện với ngƣỡng giá trị tƣơng ứng. Phân bố đồng thời nhiệt độ tháng 4 và tháng 8 cho thấy các dự báo luôn