1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo nghiên cứu khoa học " Tổng quan hệ thống đồng hóa lọc Kalman tổ hợp và ứng dụng cho mô hình dự báo thời tiết WRF " potx

12 703 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 809,99 KB

Nội dung

Trong bài báo này, bộ lọc Kalman và biến thể tổ hợp cho phép ứng dụng trong các mô hình dự báo số sẽ được trình bày chi tiết.. Với sự phát triển mạnh mẽ của phương tiện tính toán, EnKF

Trang 1

17

Tổng quan hệ thống đồng hóa lọc Kalman tổ hợp và ứng dụng

cho mô hình dự báo thời tiết WRF

Kiều Quốc Chánh*

Khoa Khí tượng Thủy văn và Hải dương học, Trường Đại học Khoa học Tự nhiên, ĐHQGHN,

334 Nguyễn Trãi, Hà Nội, Việt Nam

Nhận ngày 29 tháng 4 năm 2011

Tóm tắt Trong bài báo này, bộ lọc Kalman và biến thể tổ hợp cho phép ứng dụng trong các mô

hình dự báo số sẽ được trình bày chi tiết Một biến thể lọc Kalman tổ hợp địa phương sau đó sẽ được chọn thử nghiệm và đưa vào mô hình WRF Các kết quả ban đầu cho thấy bộ lọc Kalman tổ hợp có khả năng nắm bắt tốt số liệu quan trắc vệ tinh

Từ khóa: Đồng hóa số liệu, lọc Kalman, mô hình WRF, dự báo tổ hợp, lọc Kalman tổ hợp.

1 Mở đầu

Một cách tổng quát, đồng hóa số liệu là quá

trình tạo trường ban đầu tốt nhất có thể cho một

mô hình dự báo, dựa trên các mối quan hệ động

lực và xác xuất thống kê Do đặc thù của mô

hình dự báo thời tiết bằng mô hình số có tính

phụ thuộc ban đầu mạnh, các bản tin dự báo

thời tiết đôi khi cho các kết quả hoàn toàn sai

lệch do điều kiện ban đầu không chính xác [1-5]

Quá trình đồng hóa về cơ bản bao gồm hai

bước chính là 1) phân tích khách quan và 2)

ban đầu hóa [6] Theo bước phân tích khách

quan, trường quan trắc sẽ được ngoại suy về

điểm lưới của mô hình số một cách tối ưu

Trong bước tiếp theo, trường ngoại suy này sẽ

được cân bằng hóa sao cho các biến quan trắc

phụ thuộc lẫn nhau sẽ được ràng buộc bởi một

mối quan hệ động lực cho trước Điều này là

_

 ĐT: 01642541065

E-mail: chanhkq@vnu.edu.vn

cần thiết để tránh đưa vào các giá trị quan trắc tùy ý Mặc dù đồng hoá số liệu trong khí tượng

đã được quan tâm từ đầu những năm 1950 [7,8], bài toán này lại chỉ thực sự phát triển mạnh trong thời gian gần 20 năm gần đây do sự phát triển mạnh của máy tính cho phép thực hiện được các thuật toán một cách nhanh chóng

và có hiệu quả

Các thuật toán khởi điểm của đồng hoá số liệu bao gồm thuật toán Cressman và thuật toán Barner Các sơ đồ này dựa trên các phép lặp hoặc ép (nudge) số liệu quan trắc xung quanh một điểm nút lưới cho trước về một giá trị mới sau một số vòng lặp cho trước Cách tiếp cận địa phương này tuy nhiên không thoả mãn vì chúng không tính được yếu tố động lực cũng như các đòi hỏi cân bằng của mô hình Do đó rất nhiều các thuật toán ban đầu hóa đã được phát triển Theo quan điểm hiện đại, các sơ đồ đồng hóa số liệu hiện nay có thể được tạm chia hai thành 2 loại [9] Một loại, tạm gọi là bài

Trang 2

toán đồng hoá biến phân (ĐHBP), tập trung vào

việc tìm kiếm trạng thái khí quyển có khả năng

xảy ra cao nhất ứng với một tập quan trắc và

một trạng thái nền cho trước [10-15] Phụ thuộc

vào cách xử lí số liệu là tức thời hay trong một

khoảng thời gian, bài toán ĐHBP có thể chia

nhỏ thành bài toán 3 chiều (3DVAR) hay 4

chiều (4DVAR)

Cách tiếp cận chung của bài toán ĐHBP là

tìm một trường phân tích nào đó có khả năng

xảy ra cao nhất bằng cách tối thiểu hoá một

hàm độ đo sai số, còn gọi là hàm giá Phương

pháp ĐHBP có ưu điểm là hàm giá được cực

tiểu hoá trên toàn miền và do đó kết quả trường

phân tích sẽ loại bỏ được những tình huống

“mắt trâu” mà trong đó trạng thái phân tích chỉ

nhận giá trị xung quanh điểm quan trắc

Mặc dù có một số ưu điểm kể trên, ĐHBP

có một số nhược điểm lớn không thể bỏ qua

Nhược điểm thứ nhất là ĐHBP không cho phép

tính đến sự biến đổi của ma trận sai số hiệp biến

trạng thái nền theo thời gian [16] Đây là một

điểm yếu lớn vì trong thực tế sai số nền biến

thiên mạnh theo thời gian và hình thế thời tiết

Điểm yếu thứ hai của ĐHBP là việc hội tụ của

phép lặp khi tìm trạng thái phân tích phụ thuộc

nhiều vào sự tồn tại của các cực trị địa phương

không kiểm soát được Do đó, ĐHBP có thể sẽ

hội tụ đến nhưng cực tiểu địa phương không

chính xác Một nhược điểm nữa của ĐHBP là

việc nghịch đảo ma trận sai số nền trong thực tế

là không thể Do đó, rất nhiều các giả thiết đơn

giản hoá cho ma trận này phải được đưa vào để

loại bỏ các tương quan chéo không cần thiết

giữa các biến

Phương pháp đồng hóa thứ hai là phương

pháp đồng hóa dãy (ĐHD) Khác với ĐHBP,

phương pháp đồng hóa dãy dò tìm trạng thái

phân tích theo cách làm tối thiểu hoá sai số của

trạng thái phân tích so với quan trắc và trạng

thái nền Tiêu biểu nhất cho phương pháp ĐHD

là các bài toán đồng hóa lọc Kalman [17-24]

Điểm khác biệt cơ bản nhất giữa ĐHD and ĐHBP là ma trận sai số hiệp biến của trạng thái nền trong ĐHD được tích phân theo thời gian thay vì giữ không đổi như trong cách tiếp cận ĐHBP Có hai quá trình đòi hỏi khối lương tính toán rất lớn trong các phương pháp ĐHD là các tính toán nghich đảo ma trận và tính toán mô hình tiếp tuyến Các tính toán này là quá lớn ngay cả với một mô hình đơn giản, và hầu như không thể tính toán được trong các bài toán thực tế Để khắc phục nhược điểm này của lọc Kalman, một biến thể khác của lọc Kalman dưa trên dự báo Monte-Carlo có tính khả thi hơn đã được phát triển là bộ lọc Kalman tổ hợp (EnKF) Với sự phát triển mạnh mẽ của phương tiện tính toán, EnKF đã liên tục phát triển với nhiểu biến thể khác nhau và hiện đã trở thành một cách tiếp cận mũi nhọn trong việc giải quyết bài toán đồng hóa số liệu cho các mô hình dự báo Cách tiếp cận tổ hợp có ý nghĩa rất lớn không chỉ về mặt cho phép ma trận hiệp biến biến thiên theo thời gian mà điểm quan trọng là nó cho phép ước lượng độ cả bất định của mô hình Do đó, tích phân tổ hợp cho phép tính được một phổ rộng của trường dự báo thay

vì đơn thuần một dự báo duy nhất

Mặc dù EnKF có một vài nhược điểm liên quan đến tính địa phương hóa của số liệu quan trắc xung quanh các điểm nút quan trắc và sự phụ thuộc của ma trận sai số vào số lượng thành phần tổ hợp, ưu điểm nổi trội của EnKF là nó không đòi hỏi phải phát triển các mô hình tiếp tuyến như trong phương pháp ĐHBP Điều này cho phép EnKF được áp dụng dễ dàng vào hầu hết các mô hình mà không cần can thiệp vào phần lõi của mô hình Thêm vào đó, EnKF cho phép tạo ra các trường nhiễu ban đầu biến đổi theo thời gian Do đó, EnKF tại thời điểm hiện tại đang được coi là một cách tiếp cận tiềm năng nhất cho dự báo tổ hợp trong tương lai Trong nghiên cứu này, chúng tôi sẽ trình bày một phát triển của hệ thống đồng hóa lọc

Trang 3

Kalman tổ hợp dựa trên một biến thể của lọc

Kalman tổ hợp, gọi là lọc Kalman tổ hợp biến

đổi địa phương (Local Ensemble Transform

Kalman Filter, LETKF) cho mô hình Weather

Research and Forecasting (WRF, V3.2) Hệ

thống đồng hóa này sẽ là tiền đề để phát triển

hệ thống dự báo tổ hợp trong các nghiên cứu

tiếp theo

2 Cơ sở lí thuyết bộ lọc Kalman

Một cách hình thức, KF bao gồm hai bước

chính gọi là bước dự báo (forecast) và bước

phân tích (analysis) Trong bước dự báo, một

trạng thái ban đầu của khí quyển và sai số

tương ứng của trạng thái này (do trạng thái ban

đầu không phải là trạng thái thực) sẽ đồng thời

được tích phân theo thời gian Trong bước phân

tích, kết quả của bước dự báo tại một thời điểm

trong tương lai sẽ được kết hợp với số liệu quan

trắc tại thời điểm đó để tạo ra được một trạng

thái ban đầu mới và sai số của trạng thái ban

đầu này cho quá trình dự báo tiếp theo Chúng

ta sẽ đi vào từng quá trình một cách chi tiết hơn

trong các phần tiếp theo

Bước dự báo

Giả thiết khí quyển tại một thời điểm i nào

đó được đặc trưng bởi một trạng thái xa i với

một sai số εi a Đầu tiên chúng ta sẽ dự báo cho

trạng thái đến thời điểm i + 1 sẽ cho bởi:

) (

1

a i

f

x  (1)

trong đó M là mô hình dự báo Do mô hình này

là không hoàn hảo, dự báo bằng mô hình này sẽ

có một sai số nào đó kể cả khi điều kiện ban

đầu là chính xác Gọi sai số nội tại này của mô

hình là , khi đó một cách lý thuyết giá trị sai

số này sẽ được xác định như sau:

i

t

x (2)

trong đó t

i 1 ) ( 

x là trạng thái thực của khí quyển

tại thời điểm i (i + 1) Chúng ta sẽ giả thiết rằng

sai số nội tại này là không lệch và ma trận sai

số hiệp biến của nó được cho bởi một ma trận

Q, nghĩa là





Song song với dự báo trạng thái, chúng ta

sẽ dự báo cả sai số từ thời điểm thứ i đến thời

điểm thứ i + 1 sử dụng mô hình tiếp tuyến L

được định nghĩa dựa trên dạng biến phân của phương trình (1) như sau:

x x L x x

x

Với mô hình tiếp tuyến L này, sai số của

trạng thái tại thời điểm thứ i + 1 sẽ được cho

bởi

i

a i

ε1  ( ) (5) Trong thực tế, chúng ta không bao giờ biết được sai số tuyệt đối thực i và như thế không

thể dự báo được sai số cho bước tiếp theo Tuy nhiên, trong đa số các trường hợp, chúng ta lại

có thể biết hoặc xấp xỉ được đặc trưng thống kê của sai số được đặc trưng bởi ma trận sai số

hiệp biến P  < T> Thêm vào đó, ma trận này cũng sẽ được sử dụng để đồng hóa cho bước tiếp theo Do đó, chúng ta sẽ viết lại (5) cho ma trận sai số hiệp biến thay vì cho sai số tuyệt đối

i Lưu ý theo định nghĩa rằng

t i

f i

f

ε   , εi axa ixt i

chúng ta sẽ có mối quan hệ sau

Q L LP

η) ε L η) ε L

x x x x ε

ε P

T





T a i

a i

a i

T t i

f i

t i

f i

T i i

f i

( (

) )(

1

(6)

Chú ý thêm rằng chúng ta đã giả thiết là sai

số mô hình  và sai số trạng thái εa i là không

có tương quan với nhau Như vậy, cho trước giá

trị sai số mô hình Q, mô hình M, và mô hình

tiếp tuyến L, phương trình (2) và (6) cấu thành

một quá trình dự báo cơ bản trong bước dự báo

Trang 4

theo đó trạng thái a

i

x và sai số a

i

ε tại thời điểm i

sẽ được dự báo đến thời điểm i + 1

Bước phân tích

Trong bước phân tích tiếp theo, giả sử tại

thời điểm i + 1, chúng ta có một bộ số liệu quan

trắc y o với sai số quan trắc là  o Nhiệm vụ của

chúng ta trong bước này là phải kết hợp được

trạng thái dự báo xi 1 f và sai số Pi 1f với quan

trắc để tạo được một bộ số liệu đầu vào mới tốt

hơn tại thời điểm i + 1 Lưu ý rằng mặc dù

a

i

x là ước lượng tốt nhất của trạng thái khí

quyển tại thời điểm i, giá trị dự báo xi 1 f tại thời

điểm i + 1 lại không phải là tốt nhất do sai số

của mô hình và của a

i

x Do đó chúng ta cần

phải đồng hóa tại thời điểm i + 1 để trạng thái

dự báo không bị lệch khỏi trạng thái thực tại

các thời điểm này Một cách hình thức, chúng ta

sẽ ước lượng trạng thái khí quyển mới tốt hơn

tại thời điểm i + 1 như sau:

i o

f i

a

i  x  K yH x

trong đó H là một toán tử quan trắc nội suy từ

trường mô hình sang các giá trị điểm lưới, và K

là ma trận trọng số Một cách trực quan, ma trận

K càng lớn, ảnh hưởng của quan trắc lên trường

phân tích càng nhiều Do đó, ma trận K rất

quan trọng và phải được dẫn ra một cách tối ưu

nhất có thể Để thuận tiện cho việc suy dẫn K,

chúng ta định nghĩa một vài biến sai số sau:

t

i

a

i

a

ε   , εi fxi fxt i, ( t)

i o o

i y H x

Để tìm ma trận K, chúng ta trước hết phải

tính ma trận sai số hiệp biến P a cho trạng thái

phân tích a

i 1

x và sau đó cực tiểu hóa ma trận

này Theo định nghĩa:





T

T a

i

) (

)

1

t 1 i

a 1 i

t 1 i

a

1 i

a 1 i

a 1 i

x -x )(

x -x

(ε ε P

(9)

Thay (7) vào (9) và xắp xếp lại, chúng ta sẽ thu được:

T a

1 i

o 1 i

f 1 i

f 1 i

o 1 i

f 1

(

trong đó ma trận H là tuyến tính hóa của toán tử

quan trắc H

Đặt f    T

1 i

f 1

i (ε ε

P ,   o )T

1 i

o 1

i (ε ε

và giả thiết trạng thái nền không có tương quan với trạng thái phân tích, chúng ta sẽ thu được từ (10) phương trình sau:

T T

f i

a

P1 (  ) 1(  )  (11)

Ma trận trọng số K sẽ cực tiểu hóa vết của

ma trận sai số Pi 1 a khi và chỉ khi

0 )) (

a i

trace P

trong đó trace() ký hiệu vết của ma trận Ở đây,

đạo hàm theo ma trận sẽ được hiểu là đạo hàm từng thành phần của ma trận Lý do cho việc cực tiểu hóa vết của ma trận thay vì trực tiếp ma trận là do tổng các thành phần trên đường chéo của ma trận Pi 1 a sẽ chính là bình phương của tổng sai số căn quân phương trong trường hợp các biến là không tương quan chéo Do vết của một ma trận là bảo toàn trong các phép biến đổi trực chuẩn, chúng ta luôn có thể chéo hóa ma trận sai số Pi 1 a để đưa về một cơ sở mà trong

đó tổng sai số căn quân phương sẽ là tổng của các thành phần đường chéo Lấy đạo hàm vết của ma trận Pi 1 a , chúng ta khi đó sẽ thu được

từ (11) và (12)

1 1

i T

f

P

Với giá trị ma trận trọng số K cho bởi (13)

ở trên, giá trị cực tiểu của ma trận sai số hiệp biến phân tích khi đó sẽ thu được bằng cách thay (13) vào (11) Biến đổi tường minh chúng

ta sẽ thu được:

)

1

f i

a

Trang 5

Như vậy, ở bước phân tích này chúng ta đã

thu được một ước lượng ban đầu mới tốt hơn từ

một trạng thái dự báo (hay dự báo nền) và quan

trắc cho trước Sau khi thu được trạng thái mới

a

i 1

x và ma trận sai số mới a

i 1

P , quá trình dự báo lại được lặp lại cho bước đồng hóa kế tiếp

theo Một cách tóm tắt, lọc Kalman được cho

bởi minh họa trong hình 1

Hình 1 Minh họa hai bước chính của bộ lọc Kalman

Mặc dù có ưu điểm vượt trội so với các

phương pháp đồng hóa biến phân khác, lọc

Kalman cho bởi hệ các phương trình (1), (6),

(7), (13), (14) lại rất khó áp dụng trực tiếp trong

các mô hình thời tiết có tính phi tuyến cao và

bậc tự do rất lớn Ba khó khăn chính của bộ lọc

Kalman ở trên là 1) xây dựng mô hình tiếp

tuyến L; 2) lưu trữ và thao tác các ma các trận

sai số với số chiều có kích thước quá lớn; và 3)

sai số nội tại của mô hình Q không được biết

đầy đủ Khó khăn thứ nhất có thể được giải

quyết bằng cách sử dụng một biến thể của bộ

lọc Kalman, gọi là Kalman tổ hợp mở rộng

(EnKF) được đề xuất ban đầu bởi Evensen năm

1994 Khó khăn thứ hai được khắc phục bằng

cách địa phương hóa các số liệu quan trắc xung

quanh từng điểm nút lưới (localization) hoặc

đồng hóa lần lượt từng giá trị quan trắc theo

chuỗi (serial) Có nhiều các biến thể của EnKF

dựa trên việc địa phương hóa hay xử lý chuỗi

Hai trong số đó sẽ được trình bày trong mục

sau Về sai số nội tại của mô hình, đây là một

hướng phát triển còn mở của bộ lọc Kalman

trong thời gian gần đây và có rất nhiều phương

pháp xử lý Ví dụ kỹ thuật tăng cấp cộng tính,

kỹ thuật tăng cấp nhân, kỹ thuật hiệu chỉnh độ lệch hệ thống, kỹ thuật cộng nhiễu ngẫu nhiên Trong nghiên cứu gần đây, tác giả có trình bày một kỹ thuật khác, tạm gọi là kỹ thuật nhiễu lực [25] Chi tiết hơn về các thuật toán hiệu chỉnh sai số mô hình có thể được tham khảo trong [26]

Như đã đề cập trong phần giới thiệu, quá trình đồng hóa phải bao gồm hai bước chính là phân tích khách quan và ban đầu hóa Trong bước phân tích của bộ lọc Kalman trình bày ở trên, chúng ta thấy rằng dường như bộ lọc Kalman chưa có quá trình ban đầu hóa một cách cụ thể Tuy nhiên, các phân tích chi tiết cho thấy trong thực tế, bộ lọc Kalman đã tính đến quá trình ban đầu hóa một cách nội tại trong bước dự báo Điều này là do trong bước

dự báo này, ma trận sai số hiệp biến nền sẽ được tích phân theo thời gian Do đó, các tương quan chéo giữa các biến động lực sẽ được hiệu chỉnh theo thời gian Ở một giới hạn đủ dài, ma trận sai số hiệp biến nền thu được từ bộ lọc này

sẽ có khả năng phản ánh được các tương quan chéo giữa các biến động lực và như vậy thông tin quan trắc thu được của bất kỳ một biến nào cũng sẽ được cập nhất cho tất cả các biến mô hình khác Đây chính là ưu điểm của bộ lọc Kalman, đặc biệt trong vùng vĩ độ thấp tại đó không tồn tại một ràng buộc lý thuyết tường minh cho các mối quan hệ động lực giữa các biến giống như trong vùng ngoại nhiệt đới (Trong vùng ngoại nhiệt đới, mối quan hệ động lực giữa các biến thường được sử dụng là mối quan hệ địa chuyển, cân bằng thủy tĩnh, hay cân bằng gradient.) Chúng ta sẽ xem xét phần này chi tiết hơn trong các mục sau

3 Lọc Kalman tổ hợp

a) Lọc Kalman tổ hợp

Do khả năng phát triển mô hình tiếp tuyến

và tích phân ma trận sai số hiệp biến theo thời gian với mô hình tiếp tuyến là không thực tế

Trang 6

trong các mô hình dự báo thời tiết, lọc Kalman

phải được cải tiến để có thể áp dụng được cho

các bài toán nghiệp vụ Một cách tiếp cận phổ

biến nhất dựa trên tích phân ngẫu nhiên

Monte-Carlo theo đó một tập các đầu vào được tạo ra

xung quanh một giá trị trường phân tích cho

trước Lưu ý rằng tập đầu vào này không phải

được lấy bất kỳ mà được tạo ra dựa theo phân

bố xác xuất cũng như giá trị sai số của trường

phân tích Pa tại từng thời điểm1 Ví dụ nếu

phân bố của trường phân tích có dạng phân bố

chuẩn Gauss, khi đó tập đầu vào của trường

phân tích sẽ phải tuân theo phân bố:

) ( ) ( ) ( 2 1 2 / 1 2 /

1

|

| )

2

(

1 )

(

a a a T a a

trong đó xalà giá trị trường phân tích trung

bình tổ hợp thu được từ bước phân tích của lọc

Kalman như trình bày trong phần 2 Với một

tập K các đầu vào {xa k}k=1 K sinh ra từ phân bố

(15), chúng ta có thể thu được ma trận sai số

hiệp biến dự báo cho bước thời gian tiếp theo

như sau:

T f f k K

k

f f k

f

1

1

x x x x

(16) trong đó ( 1) [ a( i)]

k i

f

cứu trong [4] đã chỉ ra rằng một tổ hợp khoảng

25-50 các thành phần là đủ để lọc Kalman tổ

hợp phát huy tác dụng

Ngoài việc giản lược quá trình phát triển

mô hình tiếp tuyến, cách tiếp cận EnKF có một

vài ưu điểm nổi trội bao gồm 1) rút bớt các tính

toán với các ma trận có số chiều lớn; 2) không

cần tuyến tính hóa mô hình cũng như mô hình

liên hợp (adjoint); 3) cung cấp một tổ hợp các

nhiễu ban đầu tối ưu hóa cho việc dự báo các

ma trận sai số hiệp biến Mặc dù có nhiều điểm

thuận lợi song đến tại thời điểm này, chỉ có

_

1 Để đơn giản, trong phần này chúng ta sẽ chỉ làm việc với

một thời điểm cụ thể trong bước phân tích của bộ lọc

Kalman và do đó chỉ số thời gian i sẽ được bỏ qua

trung tâm dự báo thời tiết của Canada đã đựa lọc Kalman tổ hợp vào dự báo nghiệp vụ do khối lượng tính toán lớn EnKF hiện được coi là một hướng đi phát triển mạnh nhất trong thời gian tới cho các bài toán nghiên cứu có tính dự báo thấp như bão nhiệt đới và ngoại nhiệt đới, mưa lớn, hay dông Trong các phần tiếp theo, chúng tôi sẽ trình bày hai biến thể được phát triển phổ biến nhất hiện này của bộ lọc EnKF là

bộ lọc EnKF chuỗi (Serial EnKF), và bộc lọc

EnKF địa phương biến đổi (LETKF)

b) Lọc Kalman tổ hợp chuỗi

Về mặt bản chất, lọc EnKF chuỗi (SEnKF)

là quá trình trong đó số liệu quan trắc được đồng hóa lần lượt từng giá trị một Quá trình này sẽ làm giảm kích thước cũng như khối lượng tính toán Trong phần này, chúng tôi sẽ theo trình bày trong [17] (viết tắt là SZ03) do cách tiếp cận của SZ03 có tính ứng dụng cao và

đã được sử dụng trong một loạt các bài toán đồng hóa quy mô vừa Để thảo luận được rõ ràng, chúng ta viết lại phương trình cập nhật trạng thái phân tích như sau:

]

f

)

trong đó,

1

)

PfHT R HPfHT

Lưu ý rằng quá trình cập nhật trạng thái

phân tích này sẽ chỉ được áp dụng cho trường

trung bình tổ hợp Để tạo ra được các thành

phần tổ hợp phân tích tiếp theo, cần phải tạo

thêm một bộ nhiễu phân tích và cộng vào

trường phân tích trung bình tổ hợp xanhư sẽ trình bày trong các phần tiếp theo

Để đồng hóa các quan trắc một cách hiệu quả, chúng ta viết lại tích hiệp biến PfHT như sau:

PfHTCov ( xf, xf) HTCov ( xf, Hxf) (20)

Trang 7

trong đó chúng ta đã giả thiết rằng ma trận sai

số hiệp biến dự báo Pfđược xấp xỉ bằng một

tổ hợp K thành phần{ f

k

x }k=1 K như cho bởi

(16) Một cách tường minh, (20) có thể được

viết như sau:

1 k

x H Hx x x H

k j j k T

f

1

(21) trong đó

k

f k

f

K 1

1

x

x (22)

Về mặt ý nghĩa vật lý, tích ma trận (20)

được hiểu như là một ma trận tương quan của

trạng thái dự báo giữa các điểm nút lưới mô

hình (xf) và các điểm mà tại đó quan trắc

được cho (Hxf) Trong trường hợp chúng ta

đồng hóa lần lượt từng giá trị quan trắc một,

phương trình (17) và tích (20) sẽ được đơn giản

hóa rất nhiều Thật vậy, với chỉ một giá trị quan

trắc, Hxf sẽ trở thành một vô hướng, và do đó

tích PfHTsẽ trở thành một vector, tạm gọi là

vector c Cũng như vậy, HPfHT sẽ chỉ còn là

một vô hướng, và do đó có thể viết lại số hạng

nghịch đảo của( R  HPfHT) như là nghịch

đảo của một giá trị vô hướng, tạm gọi là d Như

vậy, (17) sẽ rút gọn thành

i

f

i

a

với chỉ số chiều của mô hình i chạy trên toàn

các nút lưới mô hình (i = 1… N) được viết

tường minh Phương trình cập nhật (23) phát

biểu rằng với mỗi giá trị quan trắc được đưa

vào y o, tương quan của giá trị quan trắc này với

tất các điểm nút lưới khác (được biểu diễn bởi

c i) sẽ lan truyền ảnh hưởng của quan trắc này

lên tất cả các điểm nút lưới (lưu ý rằng chỉ số i

chạy trên tất cả các điểm nút lưới) Mức độ ảnh

hưởng của quan trắc tới các điểm nút lưới mô

hình được cho bởi tham số d; sai số quan trắc

càng nhỏ, mức độ ảnh hưởng của quan trắc sẽ

càng lớn và ngược lại

Với một giá trị quan trắc điểm duy nhất, ma trận sai số hiệp biến phân tích theo phương trình (18) cũng được đơn giản hóa rất đáng kể:

d

T f

P

Phương trình cập nhật (24) phát biểu rằng sai số phân tích sẽ được giảm một lượng tỷ lệ với tương quan của biến được quan trắc với các điểm nút của mô hình Ma trận sai số hiệp biến

phân tích Pa đóng vai trò quan trọng trong việc xây dựng bộ nhiễu cho SEnKF Như đã đề cập

ở trên, bước phân tích chỉ được áp dụng cho trạng thái trung bình tổ hợp Để tạo ra một tổ hợp các đầu vào cho bước tích phân tiếp theo, chúng ta cần phải thực hiện thêm một bước cuối cùng là tạo ra bộ nhiễu phân tích Bộ nhiễu phân tích này không thể chọn tùy ý mà phải được xây dựng dựa trên trường sai số hiệp biến

phân tích Pa cho bởi (24) Có rất nhiều lựa chọn khác nhau, xong một lựa chọn phổ biến nhất là

sở dụng phương pháp căn quân phương ma

trận Gọi tổ hợp bộ nhiễu là

}

|

|

|

K a

a

X     , chúng ta sẽ giả thiết rằng:

T a a a

K 1 ( )

1

X X P

Một cách hình thức, nhiễu phân tích sẽ thu được như sau:

 1 / 2

) 1

Trong trường hợp số liệu quan trắc được đồng hóa lần lượt từng giá trị một theo chuỗi, chúng ta thu được kết quả sau:

f a

d H X

c I

X        (27) trong đó   [ 1  ( R / d )1/2]1 và

}

|

|

|

K f

f

minh, chúng ta có:

f k

a

c I





 

và do đó,

Trang 8

k a

a

k

a

a

k

d H x x

c I x x

x





 

Gọi N là kích thước của trạng thái nền và K

là số thành phần tổ hợp, các bước đồng hóa của

lọc SEnKF như vậy sẽ bao gồm các bước như

sau:

- Bước 1: chọn một số liệu quan trắc duy

nhất y o trong tập các số liệu quan trắc tại thời

điểm i;

- Bước 2: tính trung bình tổ hợp của trường

dự báo xftheo công thức (22), và xây dựng ma

trận nhiễu nền

}

|

|

|

K f

f f f

- Bước 3: xây dựng ma trận H (1  N) và

tính vector c  PfHT RN theo công thức

(21) dựa theo tổ hợp dự báo nền có được tại

thời điểm i;

- Bước 4: tính giá trị d  ( R  Hc ) và

1 2 /

) /

(

1

làm việc với từng giá trị quan trắc một, ma trận

R sẽ chỉ là một giá trị vô hướng đặc trưng giá

trị phương sai sai số của quan trắc y o;

- Bước 5: Tính trạng thái phân tích trung

bình tổ hợp xa dựa theo phương trình (23);

- Bước 6: Tính nhiễu tổ hợp phân tích Xa

theo (27)

- Bước 7: Cộng nhiễu tổ hợp phân tích Xa

với trung bình tổ hợp phân tích xađể thu được

một tổ hợp phân tích { xa k}kKứng với quan

trắc yo;

- Bước 8: Gán trường nền tổ hợp bằng giá

trị phân tích tổ hợp thu được ở bước 7 ở trên,

k

f

k : }

{ x  x  Lưu ý rằng bằng việc

gán liên tục trường tổ hợp nền bằng giá trị

trường phân tích mới, chúng ta sẽ tiết kiệm

được bộ nhớ rất nhiều

- Bước 9: Quay lại bước 1 với số liệu quan

trắc mới cho đến khi đồng hóa toàn bộ tập số

liệu quan trắc có được tại thời điểm i

Có thể chứng minh được tường minh rằng trong các bài toán mô hình tuyến tính, đồng hóa chuỗi từng số liệu một sẽ cho kết quả tương tự như đồng hóa đồng thời tất cả các số liệu Tuy nhiên chúng tôi sẽ không trình bày ở đây do hạn chế về độ dài của bài báo Một chú ý là quá trình tính toán sẽ được giảm rất nhiểu nếu để ý rằng số liệu quan trắc tại một điểm cho trước có

xu hướng chỉ ảnh hưởng các quan trắc ở lân cận

nó Do đó, thay vì cập nhật toàn bộ các điểm nút lưới với từng quan trắc, có thể chọn một lân cận xung quanh điểm quan trắc để cập nhật Điều này không chỉ làm giảm khối lượng tính toán mà nó còn rất cần thiết để loại bỏ các

tương quan chéo giả do số lượng thành phần tổ hợp là hữu hạn Quá trình địa phương hóa số

liệu quan trắc này sẽ được xem xét chi tiết hơn trong thuật toán đồng hóa tiếp theo

c)Lọc Kalman tổ hợp địa phương

Có thể nhận thấy rằng trong phương pháp đồng hóa chuỗi ở trên, toàn bộ quá trình đồng hóa có tính kế thừa và không thể song song hóa

để tăng tốc độ tính toán Do đó, lọc SEnKF nói chung sẽ xử lý số liệu quan trắc không hiệu quả, đặc biệt trong trường hợp số liệu quan trắc

là rất lớn Mặc dù điều này có thể được khắc phục bằng cách xử lý lựa chọn số liệu quan trắc hoặc kết hợp các quan trắc quá gần nhau bằng

phương pháp “siêu ép” (super-ob) số liệu, lọc

SEnKF vẫn chưa được tối ưu hóa hoàn toàn cho các bài toán đồng hóa lọc tổ hợp Trong phần này, chúng ta sẽ xem xét một biến thể khác của lọc EnKF cho phép xử lý số liệu một cách hiệu quả hơn rất nhiểu, được gọi là phương pháp lọc Kalman tổ hợp địa phương hóa biến đổi (Local ensemble transform Kalman filter, LETKF) Phương pháp này được đề xuất ban đầu bởi

Hunt và ccs năm 2005 và đã được đưa vào thử

Trang 9

nghiệm trong một vài nghiên cứu với các mô

hình toàn cầu Đây cũng chính là phương pháp

sẽ được lựa chọn và đưa vào mô hình thời tiết

WRF trong phần sau của chúng tôi

Một cách cơ bản, lọc LETKF là một

phương pháp theo đó tại mỗi điểm nút lưới,

chúng ta sẽ chọn một lân cận với kích thước

cho trước Với không gian con này, chúng ta sẽ

chọn ra tất cả các quan trắc cho được bên trong

không gian này và tạo ra một vector quan sát

lân cận Sau đó sử dụng ma trận nhiễu tổ hợp

nền để biến đổi từ không gian con căng bởi số

điểm nút lưới địa phương sang không gian con

căng bởi số thành phần tổ hợp Điều này sẽ làm

giảm đáng kế khối lượng tính toán ma trận vì

không gian tổ hợp thường nhỏ hơn không gian

địa phương rất nhiều Do đó, các phép toán ma

trận sẽ có độ chính xác cao hơn Để minh họa

thuật toán một cách rõ ràng, nhắc lại rằng ma

trận nhiễu tổ hợp nền Xf (có số chiều N K)

được định nghĩa như sau:

}

|

|

|

K f

f f f

trong đó xf là trung bình tổ hợp Gọi w là một

vector biến đổi trong không gian tổ hợp được

định nghĩa như sau:

w X x

xbb (30) Khi đó, hàm giá trong không gian tổ hợp

địa phương sẽ chuyển thành

] [

} ] ) ( [ ) ( { )

1

(

)

w X x

w X X X X I w w

b b

b T b b T b T J

k

J

(31)

trong đó J [ xbXbw ] là hàm giá trong không

gian mô hình Hàm giá sẽ được cực tiểu hóa

nếu w là trực giao với không gian con rỗng của

toán tử X f Lấy đạo hàm của J(w )theo w,

chúng ta sẽ thu được giá trị walàm cực tiểu

hóa hàm giá (31) như sau:

)]

( [

)

a

(32) trong đó

)]

( ), , (

), (

K f

f f f

1

) ( ) 1

Như vậy, trong không gian tổ hợp, ma trận trọng số thu được từ (32) sẽ có dạng:

1

) (

Ka f T

và do đó ma trận trọng số K trở thành

1

) (

K f fa f T

(35)

Với ma trận K thu được ở trên, giá trị trạng

thái phân tích trung bình tổ hợp tại điểm nút chúng ta đang quan tâm sẽ được cho bởi

]

f

Cũng giống như trong bộ lọc SEnKF, nhiệm

vụ cuối cùng của chúng ta là xây dựng bộ tổ hợp các trạng thái phân tích Để làm điều đó, chúng ta chú ý rằng:

K 1 ( )

1

X X P

K 1 ( )

1

X X P

Kết hợp (18) và (35) với chú ý trên, chúng

ta thu được:

T f f T f a a f T

a K

K 1 ˆ ((ˆ ) ( ) )( )

1 ) ( 1

X Y R Y P P X X

Sử dụng (34), chúng ta sẽ thu được:

Xa( Xa)T  ( K  1 ) XfP ˆa( Xf )T (38)

và do đó,

2 / 1

] ˆ 1

f

Quá trình đồng hóa theo bộ lọc LETKF như vậy có thể được tóm tắt như sau:

- Bước 1: tại mỗi điểm nút lưới, chọn một

vùng thể tích lân cận bao xung quanh điểm nút

đó để xây dựng ma trận nhiễu nền địa phương

)]

( ), ,

K f

f

- Bước 2: Trong mỗi thể tích lân cận, tìm

tất cả các quan trắc bên trong thể tích lân cận này và xây dựng ma trận quan trắc nhiễu nền

)]

( ), , (

K f

f

là toán tử tuyến tính, khi đó Y f HXf)

Trang 10

Đồng thời xây dựng ma trận sai số quan trắc R

ứng với các quan trắc bên trong thể tích;

- Bước 3: Tính ma trận sai số hiệp biến biến

đổi Pa theo (34) và sau đó ma trận trọng số K

theo (35);

- Bước 4: Cập nhật giá trị trung bình tổ hợp

địa phương xa theo (36);

- Bước 5: Tính ma trận nhiễu phân tích Xa

theo (39) và cộng vào xa để thu được tổ hợp

phân tích lân cận mới (xa kxaXa k);

- Bước 6: Chọn điểm giữa của vector tổ hợp

vector phân tích lân cận xa kvà gán điểm này

cho điểm nút lưới chọn ở bước 1

- Bước 7: Quay trở lại bước 1 và lặp cho

đến hết tất cả các điểm nút lưới

Có thể nhận thấy dễ dàng trong các bước

tính toán ở phía trên rằng các điểm nút lưới

khác nhau được thực thi một cách hoàn toàn

độc lập với nhau Đây là một ưu điểm của lọc

LETKF vì chúng ta có thể song song hóa bộ lọc

này một cách hiệu quả bằng cách chia các phần

công việc độc lập cho các lõi tính toán khác

nhau Điều này cho phép tăng tính hiệu quả tính

toán lên rất nhiều so với SEnKF

4 Hệ thống dự báo WRF-LETKF

Trong nghiên cứu này, chúng tôi xây dựng

thử nghiệm bộ lọc LETKF cho mô hình thời tiết

phổ dụng nhất hiện nay là mô hình WRF Việc

thiết kế hệ thống này, tạm gọi là WRF-LETKF,

được phát triển theo quy trình ứng dụng nghiệp

vụ chuẩn với tất cả các quá trình vào ra, cập

nhật số liệu, xử lý đồng hóa, kiểm tra chất

lượng quan trắc, tạo điều kiện biên tổ hợp, và

dự báo tổ hợp được tiến hành một cách tự động

và đồng bộ hóa theo thời gian thực Sơ đồ thiết

kế hệ thống được biểu diễn minh hóa như trong

Hình 2

Hình 2 Minh họa sơ đồ hệ thống dự báo tổ hợp

WRF-LETKF

Số liệu quan trắc đầu tiên sẽ được xử lý kiểm định chất lượng thông qua bộ chương trình chuẩn WRFDA cho trong mô hình WRF Quá trình kiểm định chất lượng này sẽ xác định các sai số cho các mực và các biến quan trắc tương ứng Số liệu quan trắc sau khi được kiểm định sẽ được kết hợp với số liệu dự báo tổ hợp hạn rất ngắn 12 giờ từ chu trình dự báo trước để tạo ra một bộ các nhiễu phân tích thông qua bộ lọc LETKF Tại chu trình này, do số liệu dự báo toàn cầu GFS được phát báo và tải về sẽ được chương trình tiền xử lý và nội suy về lưới mô hình Trường dự báo GFS sau đó sẽ được cộng với nhiễu phân tích tạo ra bởi lọc LETKF để tạo

ra một tổ hợp các trường phân tích cùng với điều kiện biên tương ứng của các trường phân tích này Bộ các đầu vào và biên tạo ra trong bước này sẽ được đưa vào mô hình WRF để dự báo thời tiết với hạn tùy ý Song song với quá trình dự báo thời tiết được xác định trước này,

mô hình WRF cũng sẽ lưu trữ một tổ hợp các

dự báo rất ngắn 12 giờ để làm trường nền cho

dự báo tiếp theo Quá trình dự báo và tổ hợp như trên được liên tục lặp lại đều đặn một ngày

2 lần (hoặc có thể lên đến 4 lần nếu hệ thống tính toán cho phép)

Để thử nghiệm quá trình đồng hóa trong hệ thống WRF-LETKF, chúng tôi chọn một tình huống giả định trong đó số liệu gió vệ tinh MTSAT được đồng hóa và đưa vào mô hình Hình 3 chỉ ra gia số quan trắc (vectors màu đen)

Ngày đăng: 20/06/2014, 00:20

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] L.F. Richardson, 1922: Weather prediction by numerical process. Cambridge University Press, Cambridge. Reprinted by Dover (1965, New York) Sách, tạp chí
Tiêu đề: Cambridge University Press
[4] E. Kalnay, Atmospheric Modeling, Data Assimilation and Predictability. Cambridge University Press, 2003, 512p Sách, tạp chí
Tiêu đề: Cambridge "University Press
[5] N. Phillips, 1960a: On the problem of the initial data for the primitive equations, Tellus, 12, 121- 126 Sách, tạp chí
Tiêu đề: Tellus
[6] R. Daley, Atmospheric data analysis. Cambridge University Press, Cambridge, 1991 Sách, tạp chí
Tiêu đề: Cambridge "University Press
[7] J. G. Charney, The use of the primitive equations of motion in numerical prediction, Tellus 7 (1955) 22 Sách, tạp chí
Tiêu đề: Tellus
[8] N. A. Phillips, 1960b: Numerical weather prediction. Adv. Computers, 1, 43-91 Kalnay 2004 Sách, tạp chí
Tiêu đề: Adv. Computers
[9] P. Courtier, O. Talagrand, Variational assimilation of meteorological observations with the adjoint vorticity equations, Part II, Numerical results.Quart. J. Roy. Meteor. Soc. 113 (1987) 1329 Sách, tạp chí
Tiêu đề: Quart. J. Roy. Meteor. Soc
[10] P. Courtier, O. Talagrand, Variational assimilation of meteorological observations with the direct and adjoint shallow water equations.Tellus. 42A (1990) 531 Sách, tạp chí
Tiêu đề: Tellus
[11] D. F. Parrish, J. D. Derber, The National Meteorological Center spectral statistical interpolation analysis system. Mon. Wea. Rev.120 (1992) 1747 Sách, tạp chí
Tiêu đề: Mon. Wea. Rev
[2] G. J. Haltiner, R. T. Williams, Numerical prediction and dynamic meteorology, John Wiley and Sons, New York, 1982 Khác
[3] T. N. Krishnamurti, L. Bounoa, An introduction to numerical weather prediction techniques.CRC Press, Boca Raton, FA., 1996 Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w