TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ
Bài toán đánh giá dự báo trong khí tƣợng
1.1.1 Mục đích và ý nghĩa của bài toán đánh giá Đánh giá chất lượng dự báo thời tiết nói chung là phương pháp thẩm tra đánh giá và xác định định lƣợng mức độ chính xác của mô hình hoặc mức độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quan trắc thực tế nhằm chỉ ra những ƣu điểm, nhƣợc điểm của mô hình, giúp cho các chuyên gia nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất lƣợng dự báo của mô hình
Có ba lý do quan trọng nhất để đánh giá dự báo là:
- Kiểm tra chất lƣợng dự báo – dự báo chính xác đến đâu và sẽ đƣợc cải tiến ra sao
Để nâng cao chất lượng dự báo, bước đầu tiên là xác định những sai sót mà người làm dự báo đang mắc phải.
So sánh chất lượng của các hệ thống dự báo là cần thiết để xác định mức độ hiệu quả của từng hệ thống Một hệ thống dự báo được coi là tốt hơn khi nó cung cấp kết quả chính xác và đáng tin cậy hơn so với các hệ thống khác Để đánh giá điều này, cần xem xét các yếu tố như độ chính xác, khả năng dự đoán xu hướng, và cách mà hệ thống xử lý và phân tích dữ liệu.
Các hoạt động đánh giá chỉ thực sự có giá trị khi chúng dẫn đến các quyết định liên quan đến sản phẩm dự báo Những quyết định này có thể dẫn đến thay đổi trong sản phẩm hoặc phương pháp dự báo, hoặc xác nhận rằng sản phẩm đáp ứng nhu cầu của người sử dụng và xã hội Đối với các sản phẩm dự báo công khai, cần phải được viết một cách khách quan để người sử dụng có thể kiểm tra, trong khi các số liệu quan trắc khí quyển phải phản ánh chính xác thực tế Thêm vào đó, một số phương pháp đánh giá yêu cầu quan trắc tại một điểm để đảm bảo tính đại diện và khách quan cho các hiện tượng thời tiết trong khu vực.
Trong các hoạt động đánh giá chất lượng dự báo thời tiết, việc xác định mục đích đánh giá là rất quan trọng trước khi thiết lập hệ thống Các hoạt động này có thể được phân chia thành hai mục đích chính: đánh giá hành chính và đánh giá khoa học.
Mục đích hành chính trong việc đánh giá thông tin là cung cấp dữ liệu cần thiết cho việc mua sắm trang thiết bị, chẳng hạn như máy tính có cấu hình cao và tốc độ xử lý nhanh Điều này giúp xác định thời điểm và khả năng thay thế sản phẩm hiện tại bằng các sản phẩm mới dự báo, cũng như đưa ra các quyết định khác nhằm tối ưu hóa nguồn lực con người và trang thiết bị, phục vụ cho công tác phát hành bản tin dự báo thời tiết.
Mục đích khoa học trong việc đánh giá sản phẩm dự báo là xác định một cách chi tiết các ưu điểm và nhược điểm của nó Những hoạt động này không chỉ giúp cải thiện chất lượng dự báo mà còn cung cấp thông tin cần thiết để định hướng cho nghiên cứu và phát triển trong tương lai.
Một số tác giả cũng xem xét đến mục đích kinh tế, tuy nhiên đây là một vấn đề phức tạp và sẽ không được đề cập trong giới hạn của luận văn này.
1.1.2 Mô hình chung cho đánh giá dự báo các yếu tố thời tiết
Hình 1.1 minh họa một mô hình chung nhất để đánh giá và dự báo các yếu tố thời tiết, đồng thời cũng chỉ ra rằng có thể tồn tại các mô hình đánh giá khác Mô hình này cung cấp cái nhìn chi tiết về mối quan hệ giữa các đặc trưng của phép đánh giá các đại lượng đo và các giải pháp lựa chọn Sơ đồ này hỗ trợ trong việc quyết định các bước cần thiết trước khi lựa chọn các phương pháp đánh giá cụ thể.
Tất cả các phương pháp đánh giá bắt đầu bằng việc thu thập dữ liệu quan trắc và dự báo Bước tiếp theo là xử lý dữ liệu, phụ thuộc vào quyết định của người sử dụng Việc lựa chọn mục đích đánh giá, có thể là hành chính hoặc khoa học, là yếu tố quan trọng nhất trong quá trình này.
Sau khi xác định mục đích đánh giá, việc phân loại các tập số liệu mẫu theo mục đích đã định là cần thiết Phân loại bao gồm việc chia nhỏ các phần tử trong tập mẫu thành hai hoặc nhiều nhóm dựa trên nguyên tắc đã được thiết lập trước, và sau đó tiến hành đánh giá từng nhóm một cách riêng biệt Hình 1.1 minh họa hai kiểu phân loại: “Phân loại ngoại bộ” và “Phân loại nội bộ”.
Phân loại ngoại bộ là phương pháp phân loại mà nguyên tắc lựa chọn không phụ thuộc vào các yếu tố cần đánh giá Phương pháp này thường được sử dụng để xác định sự biến đổi trong đánh giá theo thời gian trong ngày hoặc theo mùa Phân loại ngoại bộ có thể được thực hiện bất kỳ lúc nào trước khi tiến hành tính toán các đánh giá thống kê thực tế, phục vụ cho cả mục đích hành chính và mục đích khoa học.
Hình 1.1 Sơ đồ chung cho đánh giá các yếu tố thời tiết
Các tập số liệu dùng để đánh giá
Phân loại nội bộ theo dự báo
Hệ số phân tán Điểm Berier RPS Điểm kỹ năng Brier Bảng độ tin cậy
Phân loại nội bộ theo quan trắc
Biến pha Biến liên tục Biến pha Biến liên tục Đồ thị điểm Bảng liên hợp Đồ thị điểm
Nguyên lý phát hiện tín hiệu Độ lệch (BIAS)
Phân loại nội bộ theo dự báo
Biến pha Biến liên tục
Sai số trung bình tuyệt đối
Sai số bình phương trung bình Độ giảm phương sai
Để nâng cao chất lượng đánh giá khoa học, cần thiết phải có một hệ thống phân loại mẫu cao hơn Ví dụ, trong dự báo cực trị, mẫu dữ liệu cần được phân nhóm để tách biệt các giá trị cực trị khỏi chuỗi sự kiện chung Phân nhóm này được gọi là "phân loại nội bộ", vì nó dựa vào mục đích đánh giá và yếu tố chính được xem xét Có hai phương pháp thực hiện phân loại nội bộ, và Hình 1.1 minh họa sự khác biệt trong kết quả đánh giá từ hai phương pháp này.
Phân loại theo quan trắc là quá trình phân loại dựa trên giá trị của các yếu tố khí tượng được ghi nhận Từ đó, các tiêu chuẩn đánh giá có thể được tính toán cho từng nhóm giá trị quan trắc, và giá trị thống kê này được gọi là giá trị có điều kiện đối với quan trắc Một ví dụ điển hình cho phân bố có điều kiện trong dự báo là một giá trị cụ thể hoặc một khoảng các giá trị quan trắc.
Phân loại theo dự báo liên quan đến việc phân loại dựa trên giá trị của các yếu tố khí tượng được dự báo, với các giá trị thống kê được gọi là điều kiện dự báo Việc lựa chọn kiểu phân loại phụ thuộc vào mục đích đánh giá, và trong nhiều trường hợp, cần kết hợp cả hai cách phân loại để đạt được kết quả hoàn chỉnh Hơn nữa, các đại lượng đánh giá khác nhau thể hiện trong sơ đồ có thể đại diện cho những kiểu phân nhóm khác nhau, cung cấp nhiều thông tin khác nhau về sản phẩm.
Một số phương pháp và chỉ số đánh giá phổ biến
1.2.1 Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số a Những nguyên nhân gây sai số trong mô hình dự báo số Để ứng dụng đƣợc một mô hình khu vực hạn chế vào trong nghiệp vụ dự báo thời tiết đòi hỏi trước hết là phải đánh giá được sai số dự báo của mô hình so với thực tế Các nguyên nhân có thể đƣa đến dự báo sai của mô hình số có thể tóm tắt nhƣ sau:
- Các công thức toán học để mô tả các quá trình vật lý xảy ra trong khí quyển là chƣa hoàn chỉnh;
- Ảnh hưởng của địa hình đến kết quả dự báo (thường không được mô hình số mô tả hoàn chỉnh);
- Các quá trình vật lý và các sơ đồ tham số hóa chƣa thật sự hoàn thiện;
Một số giả thiết không phù hợp đã được đưa ra nhằm giải quyết hệ phương trình thủy nhiệt động lực học mô tả khí quyển thực tế.
Điều kiện biên và điều kiện ban đầu của các biến khí tượng vẫn chưa hoàn chỉnh và chịu ảnh hưởng lớn từ địa hình Sự phân bố thưa thớt của các trạm thám sát, đặc biệt là ở khu vực nhiệt đới, làm tăng thêm thách thức trong việc thu thập dữ liệu khí tượng chính xác.
Các kết quả thu được thường có sai số do việc áp dụng các phương pháp gần đúng trong giải toán Để đánh giá mô hình dự báo số một cách chính xác, cần tuân thủ nguyên lý chung trong việc phân tích và kiểm tra độ tin cậy của các dự báo này.
Hình 1.1 số liệu quan trắc và bộ số liệu này phải tương
, số liệu quan trắc có thể sẽ đƣợc phân tích về lưới dự báo hoặc phẩm Trong trường hợp này
Trong quá trình đánh giá mô hình, việc kiểm tra lại số liệu quan trắc là rất quan trọng để đảm bảo độ chính xác của kết quả Để đánh giá hiệu quả của một sản phẩm mô hình số, cần xác định rõ các vấn đề quyết định cần giải quyết trước khi thiết lập hệ thống đánh giá "Đánh giá hành chính" giúp xác định xu hướng về kỹ năng và độ chính xác của mô hình, thường được dùng để so sánh độ chính xác giữa hai mô hình khác nhau Tương tự, trong việc đánh giá các yếu tố thời tiết cho mục đích hành chính, có xu hướng giảm thiểu kết quả chỉ còn một vài con số thông qua việc sử dụng các điểm số tổng kết.
Đánh giá khoa học mô hình là quá trình cung cấp thông tin phản hồi cho c front Để thực hiện điều này, bộ số liệu đánh giá cần được sắp xếp cẩn thận dựa trên các đặc trưng, có thể theo hai hướng: dựa trên các đặc trưng quan trắc hoặc các đặc trưng dự báo.
“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá theo mùa hoặc theo thời gian chạy mô hình
Các tập số liệu dùng để đánh giá
Phân loại theo không gian
Sai số trung bình tuyệt đối Sai số bình phương trung bình Điểm kỹ năng (Độ suy giảm phương sai)
Hệ số phân tán Độ lệch (BIAS)
Tương quan dị thường Điểm số S1
Thẩm định trung tâm áp suất Các trường hợp nghiên cứu
Sai số đường đi Độ lệch trung tâm
Khi phân loại không gian cho mục đích khoa học, các khu vực nhỏ hơn lưới được ưu tiên chọn để phản ánh sự đa dạng của các chế độ khí hậu, bao gồm những vùng đồi núi, khu vực núi khuất gió và bờ biển.
1.2.2 Phương pháp đánh giá đối với biến liên tục
1.2.2.1 Phương pháp toán đồ tụ điểm
Hình 1.3 trình bày toán đồ tụ điểm cho dự báo gió biển, với trường hợp dự báo ở 00 giờ bên trái và trường hợp dự báo ở 36 giờ bên phải Dữ liệu được lấy từ trạm phao.
Toán đồ tụ điểm là phương pháp đơn giản, chủ yếu áp dụng cho các biến liên tục như nhiệt độ và gió Phương pháp này thể hiện tất cả các điểm số tương ứng giữa dự báo và quan trắc trên cùng một đồ thị với tỷ lệ hoành độ và tung độ bằng nhau Trong trường hợp lý tưởng, các điểm số sẽ nằm trên một đường thẳng đi qua gốc tọa độ và tạo với trục hoành một góc 45 độ, tức là giá trị dự báo bằng giá trị quan trắc Đường 45 độ này thường được vẽ để hỗ trợ việc nội suy các điểm rời rạc.
Hình 1.3 là một ví dụ về toán đồ tụ điểm cho dự báo gió biển Mỗi điểm
“X” biểu thị cho ít nhất một lần xuất hiện của cặp dự báo và quan trắc riêng lẻ Trên mỗi đồ thị, có một đường thẳng thứ hai không nhất thiết phải đi qua gốc tọa độ, đó là đường hồi quy bình phương tối thiểu tương ứng với tập số liệu.
Tốc độ gió mô hình PPR (kts) Tốc độ gió mô hình PPR (kts)
Hệ số tương quan = 0.595 quan trắc
Nếu dự báo hoàn hảo, đường hồi quy sẽ trùng với đường 45 độ, cho thấy chất lượng dự báo tốt Sự lệch của đường hồi quy theo chiều ngang cho thấy chất lượng dự báo giảm Nếu đường hồi quy hoàn toàn nằm ngang, điều này nghĩa là quan trắc hoàn toàn độc lập với dự báo.
Một đại lượng đánh giá quan trọng có thể ước lượng từ đồ thị điểm là sai số bình phương hoặc độ lệch Hình 1.3 minh họa một đồ thị điểm khác cho dự báo nhiệt độ khách quan từ mô hình thống kê, dựa trên tập số liệu mẫu gồm 701 trường hợp thu thập từ 11 trạm vùng Đại Tây Dương - CASSP Trong đồ thị này, các con số thay thế cho dấu “x” ở đồ thị trước, thể hiện số lượng các cặp giá trị nhiệt độ quan trắc và dự báo tương ứng.
Đồ thị điểm cung cấp cái nhìn tổng quát về phân loại các trường hợp riêng lẻ, cho phép phân tích số liệu một cách linh hoạt Khi xác định ngưỡng nhiệt độ cực trị ở -20°C và +10°C, các giá trị này có thể được rút ra từ đồ thị Các điểm có nhiệt độ quan trắc nằm trong giới hạn cực trị mà không có dự báo được gọi là miền sự kiện dự báo sót, trong khi những điểm có giá trị dự báo nằm trong phạm vi cực trị nhưng không quan trắc được gọi là miền báo động sai Đồ thị cho thấy rằng tất cả các nhiệt độ cao nhất đã bị bỏ sót do dự báo thấp hơn ngưỡng, trong khi nhiệt độ thấp lại xuất hiện trong cả hai miền dự báo sót và báo động sai.
Phân loại dựa trên quan trắc chỉ giúp xác định miền sự kiện dự báo sót, trong khi phân loại dựa trên dự báo cho phép nhận diện miền báo động sai Do đó, việc kết hợp cả hai phương pháp phân loại là cần thiết để có thông tin đầy đủ và chính xác về sản phẩm được đánh giá Ví dụ, các giá trị thấp nhất bị bỏ sót có thể được khôi phục bằng cách dịch chuyển các điểm trên đồ thị về bên trái giá trị ngưỡng 10°C, nhưng điều này dẫn đến sự gia tăng đột ngột trong miền báo động sai, điều mà chỉ phân loại dựa trên quan trắc không thể phát hiện Vì vậy, luôn có khả năng hiệu chỉnh cho các sự kiện cực trị đã bị bỏ sót.
Phân loại dự báo dựa trên các yếu tố cụ thể sẽ giúp hiểu rõ hơn về ý nghĩa thực tế của dự báo Thông tin chi tiết về ý nghĩa của dự báo cho các mức nhiệt độ khác nhau có thể được thu thập từ một chuỗi phân bố có điều kiện liên quan đến mỗi nhiệt độ dự báo hoặc trong một phạm vi nhiệt độ nhất định.
1.2.2.2 Các chỉ số đánh giá
Cơ sở lý thuyết của phương pháp đánh giá fuzzy
Các mô hình số trị có độ phân giải cao cung cấp dự báo chính xác và thông tin hữu ích cho dự báo viên Tuy nhiên, khi sử dụng phương pháp truyền thống, kết quả thường không đạt yêu cầu do khó khăn trong việc khớp hoàn toàn với quan trắc Đánh giá “fuzzy” giúp giảm yêu cầu về độ chính xác giữa dự báo và quan trắc bằng cách sử dụng cửa sổ không gian hoặc vùng lân cận Việc xử lý dữ liệu trong cửa sổ này có thể bao gồm trung bình hoặc ngưỡng, tùy thuộc vào phương pháp fuzzy cụ thể Kích thước vùng lân cận có thể điều chỉnh để đánh giá kết quả ở nhiều kích thước khác nhau, giúp xác định mức độ kỹ năng của dự báo.
Phương pháp đánh giá fuzzy cho phép vùng dự báo không nhất thiết phải trùng khớp hoàn toàn với vùng thám sát, với mức chênh lệch được xác định bởi một vùng lân cận địa phương Sự khác biệt giữa phương pháp đánh giá truyền thống và phương pháp fuzzy được minh họa trong Hình 1.5.
Không phải dễ dàng chỉ ngay ra được kích thước vùng lân cận thích hợp
Khoảng cách giữa các ô lưới, độ phân giải thời gian và trạng thái thời tiết đều ảnh hưởng đến dự báo, do đó một giá trị đơn lẻ có thể không phù hợp cho mọi loại dự báo và các miền tính khác nhau.
Phương pháp đánh giá fuzzy giúp cải thiện chất lượng dự báo bằng cách điều chỉnh kích thước miền lân cận, từ đó cung cấp thông tin chính xác hơn Hai yếu tố quan trọng trong quá trình này là quan trắc và dự báo.
(Đánh giá truyền thống) c Dự báo (Đánh giá fuzzy)
Hình 1.5 trình bày ba khía cạnh quan trọng trong việc đánh giá dữ liệu: a Miền quan trắc; b Đánh giá truyền thống yêu cầu sự tương thích về không gian và thời gian giữa dự báo và quan trắc; c Đánh giá thông qua phương pháp fuzzy, giúp cải thiện độ chính xác trong phân tích dữ liệu.
(vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc)
Một số phương pháp đánh giá fuzzy cho rằng các ô lưới lân cận của vùng quan trắc cũng được mở rộng tương ứng với vùng dự báo, thể hiện sự không chắc chắn trong quan trắc Trường hợp này được minh họa trong hình 1.6, được gọi là vùng quan trắc – vùng dự báo.
Phương pháp đánh giá fuzzy được mô tả chi tiết qua cửa sổ quan trắc và dự báo, trong đó một số ký hiệu quan trọng đã được thiết lập để hỗ trợ quá trình đánh giá.
Gọi X là giá trị quan trắc trong một ô lưới, Y là giá trị dự báo trong ô lưới tương ứng s biểu thị giá trị các ô lưới xung quanh điểm lưới đang xét, trong đó s là quy mô lưới ( ) biểu thị giá trị trung bình toàn miền tính
I x cho biết sự kiện quan trắc trong hộp lưới, với giá trị 1 nếu sự kiện xảy ra và 0 nếu không Trong khi đó, I y phản ánh sự kiện dự báo trong hộp lưới tương ứng.
I y thể hiện các sự kiện quan trắc và dự báo trong khu vực lân cận của các hộp lưới Quyết định về phương pháp xác định sự kiện trong vùng lân cận I s phụ thuộc vào từng phương pháp đánh giá fuzzy được áp dụng Một số phương pháp yêu cầu I s phải được tách riêng thành các giá trị như 0 hoặc 1, trong khi những phương pháp khác cho phép sử dụng các giá trị trung gian.
Ký hiệu P x s là thành phần của hộp lưới tại vùng lân cận quan trắc và s
P y là thành phần của hộp lưới tại vùng lân cận dự báo: n y s y n x s x I
, trong đó n là số ô lưới trong vùng dự báo
Bằng cách so sánh các dự báo với các sự kiện quan trắc, chúng ta có thể tính toán sai số quy mô phụ thuộc E s thông qua việc so sánh các giá trị trong ô lưới X s.
Phương pháp đánh giá fuzzy khá đơn giản: Chọn một tập hợp các quy mô với các chỉ số: s = 1, 2, …., S và ngưỡng cường độ sự kiện với các chỉ số k = 1,
Để tính toán các kết quả đánh giá fuzzy, đối với mỗi quy mô s, cần thu thập các ô lưới dự báo trong cửa sổ quy mô s xung quanh mỗi điểm thám sát.
Vùng thám sát và vùng dự báo sẽ thu thập các dữ liệu thám sát tương ứng trong cửa sổ tương ứng Đối với mỗi ngưỡng cường độ k, các chỉ số tính toán như I x s, I y s, P x s sẽ được áp dụng để phân tích hiệu quả.
Việc lựa chọn các biến của mô hình ảnh hưởng đến P y và E s Mỗi ngưỡng cường độ k sẽ có một điểm số đại diện cho toàn miền.
Mỗi phương pháp đánh giá fuzzy tạo ra một ma trận kích thước (k x s), trong đó chứa các điểm số đánh giá Các điểm số này sẽ thay đổi dựa trên quy mô (s) và cường độ (k) của phương pháp được áp dụng.
Tình hình nghiên cứu chung liên quan đến đề tài trên thế giới và tại Việt Nam33 CHƯƠNG 2 KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ HRM,
Một số tác giả nổi tiếng như Henry R Stanski, Laurence J Wilson và William R Burrows (1990) cùng với Murphy, A.H và R.L Winkler (2004) đã phát triển sơ đồ đánh giá sản phẩm của mô hình dự báo thời tiết số, góp phần quan trọng vào lĩnh vực nghiên cứu này.
Mỗi quốc gia trên thế giới đều phát triển hệ thống đánh giá mô hình NWP riêng, với 57% Cơ quan KTTV quốc gia có hệ thống đánh giá chính thức theo khảo sát toàn cầu của WMO năm 1997 Tuy nhiên, phương thức và bản chất đánh giá giữa các quốc gia rất khác nhau, phụ thuộc vào đặc trưng sản phẩm dự báo, yếu tố dự báo, và đôi khi là yếu tố chủ quan của người xây dựng phương pháp WMO đã nỗ lực thiết lập chuẩn mực thống nhất về đánh giá chất lượng dự báo, nhưng chưa đạt được kết quả mong muốn do mỗi quốc gia có quy định và yêu cầu riêng, dựa vào thực trạng công tác quan trắc, dự báo và trình độ khoa học công nghệ của mình.
Tại Cơ quan khí tượng Australia (BOM), dự báo mưa từ mô hình NWP được đánh giá so với lượng mưa quan trắc 24 giờ với độ phân giải 0.25° Các chỉ số đánh giá chính bao gồm BIAS, RMSE và các chỉ số cho dự báo nhị phân Cơ quan Khí tượng Canada (CMC) sử dụng BIAS và RMSE để đánh giá các yếu tố như gió, nhiệt độ, điểm sương, khí áp và độ cao địa thế, cùng với BIAS và TS cho các ngưỡng mưa khác nhau Tổng cục khí tượng Trung Quốc (CMA) đã chọn 400 trạm quan trắc để đánh giá mưa từ mô hình NWP, sử dụng BIAS và TS cho các ngưỡng 0,1; 10; 25; 50 và 100 mm/24 giờ Cơ quan khí tượng Pháp (Meteo France) đánh giá mưa, lượng mây, nhiệt độ, độ ẩm, tốc độ gió, hướng gió và cường độ gió giật với các chỉ số BIAS, RMSE và chỉ số cho dự báo nhị phân Cơ quan khí tượng Nhật Bản (JMA) chỉ tập trung vào đánh giá mưa và nhiệt độ, với dữ liệu quan trắc được chuyển đổi thành lưới đồng nhất 80 km và so sánh với dữ liệu dự báo qua các chỉ số BIAS, TS và ETS.
Cơ quan khí tượng Anh (UKMet) sử dụng MSE để đánh giá nhiệt độ và gió, trong khi ETS được áp dụng để đánh giá mưa, lượng mây và tầm nhìn xa với các ngưỡng khác nhau Tại Cơ quan khí tượng Mỹ (NWS), các yếu tố được đánh giá bao gồm nhiệt độ, gió, độ ẩm, lượng mưa, trường khí áp và độ cao địa thế Các chỉ số đánh giá hiệu suất như BIAS, ETS, POD, FAR và Odds ratio được sử dụng để phân tích kết quả.
Tại Việt Nam, sau khi áp dụng các mô hình dự báo số trị, đã có một số nghiên cứu đánh giá chất lượng dự báo mô hình số, chủ yếu tập trung vào các yếu tố khí tượng bề mặt như lượng mưa, khí áp và nhiệt độ Tuy nhiên, các nghiên cứu này chủ yếu chỉ đánh giá một số biến dự báo và khu vực nhỏ, chưa thực hiện đánh giá tổng thể về không gian, thời gian và các hình thế thời tiết Các tác giả như Nguyễn Thị Thanh Bình (2002), Trần Quang Năng (2009) và Nguyễn Văn Bảy (2004) đã thực hiện đánh giá dự báo mưa, trong khi Vũ Anh Tuấn (2003) đánh giá kết quả dự báo nhiệt độ và Nguyễn Văn Bảy (2004) cùng Hoàng Đức Cường (2004) nghiên cứu ứng dụng mô hình khí tượng động lực MM5 trong dự báo hạn ngắn ở Việt Nam.
Viện Khoa học Khí tượng Thủy văn và Môi trường đã thực hiện nhiều đề tài cấp Nhà nước, trong đó có nghiên cứu của Hoàng Đức Cường (2007) về dự báo mưa lớn ở Việt Nam sử dụng mô hình MM5 Bên cạnh đó, Đỗ Lệ Thủy (2009) cũng đã nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng thông qua phương pháp thống kê dựa trên sản phẩm của mô hình HRM.
Trung tâm Khí tượng Thủy văn Quốc gia đã thực hiện đề tài cấp Nhà nước, trong đó có báo cáo tổng kết của tác giả Dương Liên Châu và Nguyễn Viết Thi (2007) về hệ thống chỉ tiêu đánh giá chất lượng dự báo khí tượng thủy văn.
Cục Khí tượng Thủy văn và Biến đổi khí hậu đang thực hiện đề tài cấp Bộ "Nghiên cứu xây dựng và phát triển hệ thống đánh giá khách quan các sản phẩm của mô hình dự báo số cho khu vực Việt Nam" Mục tiêu của đề tài là xây dựng hệ thống đánh giá khách quan cho các sản phẩm dự báo số trị, từ đó tổ chức đánh giá và so sánh chất lượng dự báo của các mô hình thời tiết số trị hiện có tại Việt Nam Đề tài do thạc sỹ Nguyễn Thị Bình Minh làm chủ nhiệm và dự kiến hoàn thành vào tháng 12 năm 2011.
CHƯƠNG 2 KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ
Giới thiệu về mô hình MM5
Mô hình khí tượng động lực quy mô vừa thế hệ thứ 5 (MM5) của Trung tâm Quốc gia Nghiên cứu Khí quyển Mỹ (NCAR) và Trường Đại học Tổng hợp Pennsylvania (PSU) là phiên bản mới nhất trong loạt mô hình dự báo do Anthes phát triển từ những năm 1970 Qua nhiều lần thử nghiệm và cải tiến, mô hình đã được điều chỉnh để mô phỏng chính xác hơn các quá trình vật lý quy mô vừa, phù hợp với nhiều ứng dụng khác nhau Phiên bản 3.5 (MM5V3.5) ra đời năm 2001 đã được cải tiến đáng kể về kỹ thuật lồng ghép nhiều mực, động lực học bất thuỷ tĩnh, đồng hoá số liệu 4 chiều, và bổ sung các sơ đồ tham số hoá vật lý cũng như kỹ thuật tính toán.
Mô hình MM5 áp dụng hệ thống lưới lồng (nesting grid) để cải thiện việc mô phỏng các quá trình vật lý có quy mô nhỏ hơn kích thước lưới của miền tính ban đầu.
MM5 cho phép lồng ghép tối đa 9 khu vực, với tỷ lệ độ phân giải (ĐPG) theo phương ngang giữa miền tính trong và miền tính ngoài là 3:1.
Dữ liệu ban đầu và điều kiện biên cho mô hình MM5 được thu thập từ các trường phân tích và dự báo của mô hình toàn cầu GFS, do Trung tâm Dự báo Môi trường Mỹ (NCEP) cung cấp GFS là một mô hình khí tượng toàn cầu, đóng vai trò quan trọng trong việc dự báo thời tiết.
Các mô đung chính của MM5 gồm:
TERRAIN là mô đun đầu tiên trong hệ thống mô hình dự báo MM5, có chức năng nội suy các dữ liệu về độ cao địa hình, thảm thực vật, loại hình bề mặt đất và ranh giới đất – nước cho các miền tính Mô đun này sử dụng các trường số liệu đầu vào để thực hiện các phép nội suy cần thiết.
+ Thảm thực vật hay loại hình sử dụng;
+ Nhiệt độ đất các lớp sát mặt;
+ Độ nhám bề mặt đất
Môđun REGRID cung cấp các chương trình để đọc và phân tích số liệu khí tượng ở các mực khí áp theo phương ngang, đồng thời thực hiện nội suy các giá trị từ lưới thô ban đầu của các mô hình toàn cầu và khu vực vào lưới tính của mô hình Quá trình này dựa vào các phép chiếu bản đồ đã được định nghĩa trong môđun TERRAIN.
Chức năng chính của môđun INTERPF là:
+ Nội suy số liệu khí tượng theo chiều thẳng đứng vào lưới mô hình; + Bổ sung các trường bề mặt như khí áp, nhiệt độ không khí;
+ Xử lý mô hình bất thuỷ tĩnh nguyên thuỷ
MM5 là môđun đƣa ra kết quả dự báo số của mô hình, tất cả các lựa chọn của mô hình đƣợc MM5 mô phỏng và dự báo
MM5 là một công cụ mạnh mẽ trong nghiên cứu lý thuyết và ứng dụng dự báo thời tiết Nó có khả năng mô phỏng và dự báo các hiện tượng thời tiết quy mô lớn như gió mùa, bão và áp thấp, đồng thời cũng hỗ trợ mô phỏng các quá trình quy mô nhỏ hơn, từ 2 đến 200km.
2.1.3 Hệ các phương trình thủy nhiệt động lực của MM5
- Phương trình xu thế khí áp;
- Phương trình xu thế nhiệt độ;
- Các phương trình chuyển động ngang và thẳng đứng;
Để chạy mô hình dự báo thời tiết khu vực, cần thiết phải xác định các điều kiện biên xung quanh, bao gồm nhiệt độ (T), độ ẩm tương đối (RH), áp suất hoặc độ cao địa thế (H), các thành phần gió ngang (U, V) và có thể cả các trường vật lý vi mô như mây Các giá trị biên có thể được lấy từ phân tích trong tương lai, mô phỏng lưới thô hơn trước đó hoặc từ các mô hình dự báo khác trong dự báo thời gian thực, thường là từ mô hình dự báo toàn cầu Trong nghiên cứu, điều kiện biên có thể được tăng cường từ số liệu phân tích kết hợp với các thám sát bề mặt và cao không.
- Điều kiện biên bức xạ: Điều kiện biên trên bức xạ đƣợc thiết lập trên cơ sở lí thuyết sau:
+ Áp dụng vào khí quyển thì các quá trình khí quyển có thể mô tả bằng các phương trình tuyến tính hoá;
+ Tính ổn định tĩnh và dòng trung bình đƣợc coi là hằng số;
+ Hiệu ứng Coriolis đƣợc bỏ qua;
+ Áp dụng đƣợc đối với gần đúng thuỷ tĩnh
Việc thiết lập RUBC trong các mô hình phổ là tương đối đơn giản, nhưng phức tạp hơn đối với những mô hình nút lưới
2.1.5 Các quá trình tham số hóa
Tham số hóa các quá trình khí quyển quy mô dưới lưới trong MM5 gồm có:
Tham số hóa đối lưu được phân thành ba nhóm chính: thích ứng đối lưu, đối lưu xuyên thủng và sơ đồ dựa trên mô hình mây tích Hiện nay, có nhiều sơ đồ tham số hóa đối lưu nổi bật, bao gồm các sơ đồ của Manabe và cộng sự, Betts và Miller, Arakawa và Shubert, cũng như Grell, Frank và Cohen.
Tham số hóa các quá trình vi mô trong mây đóng vai trò quan trọng trong mô hình số trị, bao gồm việc xử lý các quá trình mây và mưa quy mô lưới, tính toán pha băng và tạo hạt đá, cũng như xu thế nhiệt và biến ẩm Ngoài ra, nó còn giúp tính toán mưa không phải do đối lưu và cung cấp thông tin cùng tính chất của mây cho các sơ đồ bức xạ.
Tham số hóa các quá trình vi mô trong mây bao gồm Sơ đồ Simple Ice, Sơ đồ Mixed-phase và Sơ đồ Warm Rain, cùng với một số sơ đồ ít phổ biến khác.
- Tham số hóa bức xạ: Gồm có sơ đồ tham số hóa bức xạ sóng dài và tham số hóa bức xạ sóng ngắn, theo Rodgers (1967)
Tham số hóa lớp biên hành tinh bao gồm các yếu tố quan trọng như phương trình năng lượng bề mặt, thông lượng bức xạ thuần Rn, thông lượng hiển nhiệt Hs và thông lượng ẩm E s Ngoài ra, sơ đồ tham số hóa khí động lực học (Bulk-aerodynamic) và mô hình phân giải cao của Blackadar cũng đóng vai trò quan trọng, cùng với sơ đồ khuếch tán thẳng đứng và sơ đồ khuếch tán ẩm thẳng đứng, giúp cải thiện độ chính xác trong việc mô phỏng và dự đoán các hiện tượng khí tượng.
- Tham số hóa các quá trình đất – bề mặt: Gồm các sơ đồ:
+ None: Không dự báo nhiệt độ lớp đất bề mặt;
+ Force - Restone (Blackada) scheme: Dùng cho lớp mỏng đơn thuần ngay trên bề mặt và nhiệt độ của lớp đó;
+ Five - Layer Soil Model: Dự báo nhiệt độ của 5 lớp: 1, 2, 4, 8, 16m;
+ OSU/Eta-Suface Model: Mô hình lớp đất bề mặt có thể dự báo nhiệt độ và độ ẩm của 4 lớp: 10, 30, 60, 100 cm
Hình 2.1 là miền tính sử dụng trong luận văn này là miền tính lồng ghép từ hai miền Miền tính thứ nhất (miền lớn) giới hạn trong khoảng 5-30 O N, 90-
Miền tính thứ nhất cho Việt Nam có 130 ô với 65x95 điểm tính và độ phân giải ngang 45km, trong khi phương đứng có 23 mực sigma phân bố không đều từ mặt đất đến khoảng 100mb Để cải thiện độ chi tiết, miền tính thứ hai (miền nhỏ) được lồng vào miền tính thứ nhất, với độ phân giải ngang 15km và 127x63 điểm tính, bao trùm toàn bộ lãnh thổ Việt Nam.
Hình 2.1 Sơ đồ lồng ghép hai miền tính cho MM5
Giới thiệu về mô hình HRM
Mô hình dự báo thời tiết khu vực phân giải cao HRM (High Resolution Regional Model) là một mô hình thuỷ tĩnh, áp dụng hệ phương trình nguyên thuỷ và tích hợp đầy đủ các quá trình vật lý như bức xạ, mô hình đất, các quá trình rối trong lớp biên, tạo mưa qui mô lưới, cũng như đối lưu nông và sâu Được phát triển bởi Tổng cục Thời tiết Cộng hòa liên bang Đức (DWD), mô hình HRM hiện đang được áp dụng tại nhiều cơ quan khí tượng quốc gia trên thế giới, bao gồm Philippines, Brazil, Tây Ban Nha và Đức Tại Việt Nam, mô hình HRM đã được chuyển giao và đưa vào vận hành thử nghiệm tại Trung tâm Dự báo Khí tượng Thủy văn Trung ương từ năm
Năm 2002, dự án hợp tác nghiên cứu giữa DWD, Khoa Khí tượng Thủy văn và Hải dương học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội và TTDBTƢ đã được triển khai Dữ liệu ban đầu cho mô hình HRM được lấy từ mô hình toàn cầu GME của DWD Hiện nay, mô hình HRM-14km (độ phân giải 14km, 40 mực thẳng đứng, bước thời gian 90 giây) đang được vận hành tại TTDBTƢ với hai phiên dự báo hàng ngày vào 00UTC và 12UTC HRM là mô hình dự báo thời tiết đầu tiên tại Việt Nam và đã trải qua nhiều lần cải tiến trong những năm qua.
2.2.2 Cấu trúc lưới và phương pháp số
- Lưới điều hoà hoặc lưới quay kinh-vĩ;
- Độ phân giải từ 0.25 0 đến 0.05 0 (tương ứng với 28 đến 6 km);
- Sơ đồ sai phân trung tâm bậc hai theo không gian, theo lưới C-Arakava;
- Hệ toạ độ lai với số mực từ 20 đến 40;
Sơ đồ tích phân theo thời gian Leap-frog, bán tường minh với độ chính xác bậc bốn, được áp dụng để tích phân hệ phương trình dự báo Bước tích phân theo thời gian Dt (s) được xác định theo công thức CFL (Courant-Friedrichs-Levy) và phụ thuộc vào bước tích phân theo không gian.
- Cách xử lý biên theo Davies (1976)
2.2.3 Hệ các phương trình cơ bản
Hệ phương trình nguyên thuỷ của mô hình bao gồm 6 phương trình dự báo tương ứng với 6 biến: pS, u, v, T, qV, qC
- Phương trình xu thế khí áp mặt đất;
- Hai phương trình thành phần gió ngang;
- Phương trình bảo toàn nhiệt;
- Phương trình bảo toàn hơi nước;
- Phương trình bảo toàn nước lỏng trong mây;
Bài viết đề cập đến 9 phương trình cảnh báo quan trọng, bao gồm: phương trình tốc độ thẳng đứng trong tọa độ lai, phương trình trạng thái, phương trình chuyển đổi giữa động năng và thế năng, phương trình tính tốc độ thẳng đứng trong tọa độ khí áp, quan hệ tính xoáy thế tuyệt đối, quan hệ tính động năng trên một đơn vị khối lượng, quan hệ tính địa thế vị từ tích phân phương trình thủy tĩnh, quan hệ xác định nhiệt độ ảo, và phương trình tính độ ẩm riêng bão hòa.
2.2.4 Các quá trình tham số hóa vật lý
* Sơ đồ tham số hóa đối lưu Tiedtke
Từ năm 1989, Tiedtke đã phát triển sơ đồ TSHĐL mây tích dựa trên các dòng khối gần đúng Ông phân chia động lực của mây tích thành hai phần: dòng thăng và dòng giáng Tổng thể dòng khối trong mây được xác định bởi sự kết hợp của dòng khối trong dòng thăng và dòng khối trong dòng giáng.
Tiedtke (1989) phân biệt các loại mây đối lưu như sau:
Đối lưu sâu xảy ra khi không khí hội tụ ở lớp biên trong điều kiện bất ổn định, tạo ra dòng thăng mạnh có khả năng xuyên qua tầng đối lưu.
- Đối lưu nông: bên dưới có phân kỳ nhẹ và chỉ đạt đến độ cao trong tầng đối lưu
- Đối lưu mực giữa: xuất hiện ở vùng front trong lớp giữa của khí quyển, chân mây nằm trên lớp biên khí quyển
Sơ đồ này được xây dựng dựa trên lý thuyết của sơ đồ TSHĐL Tiedtke (1989), với điểm khác biệt chính là phương pháp tính thông lượng khối lượng dòng thăng tại chân mây cho đối lưu sâu Trong sơ đồ Tiedtke, giả thuyết khép kín được xác định dựa vào hội tụ ẩm quy mô lớn ở mực thấp.
* Sơ đồ Betts-Miller-Janjic
Sơ đồ TSHĐL BMJ được phát triển dựa trên nguyên tắc điều chỉnh cấu trúc nhiệt ẩm, nhằm mô phỏng cấu trúc nhiệt ẩm thực tế trong khí quyển nhiệt đới.
Cấu trúc nhiệt động thám sát trong khí quyển nhiệt đới:
Một trong những mục đích quan trọng của nghiên cứu thám sát GATE là nghiên cứu đối lưu sâu có tổ chức phức tạp ở khu vực nhiệt đới Mục tiêu này nhằm thử nghiệm và phát triển các sơ đồ TSHĐL trong mô hình số, theo nghiên cứu của Betts.
Mục đích chính của các sơ đồ TSHĐL là đảm bảo cấu trúc thẳng đứng của nhiệt và ẩm trong đối lưu gần giống với thực tế quan sát Ý tưởng này được Betts (1973) đề xuất cho đối lưu nông và Arakawa cùng Shubert (1974) cho đối lưu sâu Cấu trúc nhiệt ẩm trong các vùng đối lưu phải được xác nhận qua quan sát, làm nền tảng cho quá trình điều chỉnh đối lưu Manable & CS (1965) đã đề xuất phương pháp điều chỉnh đối lưu sâu, nhấn mạnh rằng khí quyển nhiệt đới không đạt được cân bằng nhiệt ẩm khi có đối lưu sâu Điều này cho thấy rằng, trên quy mô lưới trong mô hình, cấu trúc thẳng đứng của nhiệt ẩm phải được duy trì giống như trong quan sát thực tế.
Bằng cách thám sát, chúng ta có thể chứng minh rằng các chế độ đối lưu khác nhau có cấu trúc nhiệt động tựa cân bằng khác nhau, điều này giúp duy trì sự tựa cân bằng giữa mây qui mô dưới lưới và các quá trình qui mô lưới Betts (1982) đã đưa ra một quan điểm lý thuyết từ các nghiên cứu thám sát như GATE, BOMEX và ATEX, dựa trên việc thiết lập điểm bão hòa Qua đó, tác giả đã xác định một tập hợp các tham số phù hợp cho đối lưu sâu và đối lưu nông trong mô hình toàn cầu.
Số liệu
Kết quả dự báo mưa và nhiệt độ trong 24 giờ của mô hình MM5 và HRM đã được đánh giá cho toàn quốc và từng khu vực Bắc Bộ, Trung Bộ, Nam Bộ trong các tháng mùa đông (12, 01, 02) và mùa hè (06, 07, 08), cũng như trung bình toàn chuỗi trong ba năm 2007, 2008, 2009 Phân tích này được thực hiện để phản ánh sự khác biệt rõ rệt về địa hình, thời tiết và khí hậu giữa các vùng miền và các mùa khác nhau tại Việt Nam Dữ liệu đánh giá được tổ chức theo không gian và thời gian nhằm cung cấp cái nhìn tổng quan và chi tiết về tình hình khí tượng.
+ Toàn Việt Nam: 7.125 0 N - 27.125 0 N; 97.125 0 E - 117.125 0 E (HRM1: 128 trạm; HRM2 và MM5: 24 trạm)
+ Khu vực Bắc Bộ: 19.5 0 N - 27.125 0 N; 97.125 0 E - 117.125 0 E (HRM1: 65 trạm; HRM2 và MM5: 12 trạm)
+ Khu vực Trung Bộ: 12 0 N - 19.5 0 N; 97.125 0 E - 117.125 0 E (HRM1: 34 trạm; HRM2 và MM5: 8 trạm)
+ Khu vực Nam Bộ: 7 0 N - 12 0 N; 97.125 0 E - 117.125 0 E (HRM1: 29 trạm; HRM2 và MM5: 4 trạm)
128 trạm quan trắc 24 trạm quan trắc
Hình 2.2 Các trạm quan trắc trong miền tính
Trước khi tiến hành đánh giá, số liệu thám sát được kiểm tra theo hướng dẫn của WMO, bao gồm việc xác minh các giá trị ngưỡng và tính phù hợp của dữ liệu theo không gian và thời gian Trong luận văn này, bộ số liệu sử dụng là từ các báo cáo nghiệp vụ hàng ngày, đã được chỉnh biên và lưu trữ tại Trung tâm dữ liệu Khí tượng Thủy văn, do đó được coi là có độ tin cậy cao.
Sản phẩm được phân tích và đánh giá trong nghiên cứu này bao gồm dự báo mưa tích lũy 24 giờ và nhiệt độ trung bình 24 giờ từ mô hình HRM, được vận hành hàng ngày tại Trung tâm Khí tượng Thủy văn Trung ương với độ phân giải 14km, cùng với dữ liệu từ mô hình MM5 do Viện Khoa học Khí tượng thực hiện.
Mô hình thủy văn và môi trường với độ phân giải 15km cho phép dự báo chính xác hơn Kết quả dự báo trên lưới của mô hình được nội suy để phù hợp với vị trí của các trạm quan trắc, đảm bảo tính chính xác trong việc theo dõi và phân tích môi trường.