See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/277166239 Ước lượng sai số mơ hình lọc Kalman phương pháp lực nhiễu động Article · January 2010 CITATIONS READS 64 author: Chanh Q Kieu Indiana University Bloomington 74 PUBLICATIONS 413 CITATIONS SEE PROFILE Some of the authors of this publication are also working on these related projects: fluid mechanics View project Tropical Cyclone Intensity Error Characteristics View project All content following this page was uploaded by Chanh Q Kieu on 19 December 2017 The user has requested enhancement of the downloaded file Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26, Số 3S (2010) 310‐316 Ước lượng sai số mơ hình lọc Kalman phương pháp lực nhiễu động Kiều Quốc Chánh* Khoa Khí tượng Thủy văn Hải dương học, Trường Đại học Khoa học Tự nhiên, ĐHQGHN, 334 Nguyễn Trãi, Hà Nội, Việt Nam Nhận ngày 11 tháng năm 2010 Tóm tắt Trong báo này, phương pháp xác định sai số mơ hình lọc đồng hóa Kalman trình bày Kiểm định phương pháp mơ hình Lorenz 40 biến phương pháp có nhiều ưu điểm so với phương pháp tăng cấp nhân đơn Mở rộng phương pháp cho hệ với bậc tự lớn mơ hình dự báo thời tiết nghiệp vụ thảo luận Từ khóa: Đồng hóa số liệu, lọc Kalman, mơ hình Lorenz, mơ hình dự báo số Mở đầu∗ tại, tốn đồng hóa khơng toán nội suy tối ưu đơn điều kiện ban đầu xác khơng ln trơng đợi (thậm chí phép nội suy xác) liệu quan sát tiềm ẩn thành phần khơng cân mà mơ hình khơng cho phép tích phân Ví dụ sóng trọng trường kích thích lan truyền nhanh, dẫn đến phá huỷ tính ổn định mơ hình Nếu mơ hình quan trắc khơng hồn hảo rõ ràng bất định phải tính đến mơ hình cách thích hợp Trong nghiên cứu này, tập trung chủ yếu vào sai số nội mơ hình, gọi tắt sai số mơ hình Vấn đề sai số liệu quan trắc thiên toán kiểm định chất lương quan trắc nghiệp vụ không xem xét Đồng hoá số liệu chất q trình số liệu quan trắc trường đoán kết hợp với cách thống kê để thu điều kiện ban đầu tốí ưu cho mơ hình số (trong thuật ngữ ‘mơ hình’ ngụ ý phương trình biểu diễn dạng sai phân dùng để giải tốn phương trình đạo hàm riêng cách xấp xỉ với điều kiện biên điều kiện ban đầu cho trước) Đặc trưng thống kê tốn đồng hóa số liệu cốt lõi tất thuật tốn đồng hố Nếu mơ hình liệu quan sát hồn hảo, tốn đồng hóa số liệu đơn toán nội suy (hay ngoại suy) tối ưu nhiều chiều Nếu quan trắc tuyệt đối mô hình ẩn chứa sai số nội Trong thực tế, ước lượng sai số mơ hình vấn đề khó tốn đồng hố số liệu nguồn lớn sai số mơ hình lại q trình vật lí khơng hiểu biết đầy đủ _ ∗ ĐT: 84-4-38584943 E-mail: kieucq@atmos.umd.edu 310 K.Q. Chánh / Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26, Số 3S (2010) 310‐316 Ví dụ lực rối, lực ma sát hay tham số hố khơng đầy đủ q trình vật lý vi mơ mơ hình Thêm vào đó, xấp xỉ số học mơ hình nguồn sai số đáng kể thuật tốn sai phân hữu hạn chứa nghiệm phi vật lí trở nên ổn định vi phạm điều kiện tích phân Các kĩ thuật xử lí sai số mơ hình thuật tốn đồng hóa số liệu đại bao gồm kĩ thuật tăng cấp nhân [1], kĩ thuật tăng cấp cộng tính [2], hay phương pháp hiệu chỉnh sai số hệ thống [3] Một giới thiệu tổng quan đầy đủ kĩ thuật xử lí sai số mơ hình tìm thấy nghiên cứu [4] Trong nghiên cứu này, phương pháp khác dựa giả thiết nguồn sai số mô hình chủ yếu biểu diễn khơng đầy đủ q trình vật lí trình bày, tạm gọi phương pháp lực nhiễu động Trong phần tiếp theo, thiết lập sở lý thuyết phương pháp lực nhiễu động thảo luận Phần mô tả ứng dụng phương pháp mơ hình Lorenz 40biến Sự mở rộng phương pháp cho hệ với bậc tự lớn mơ hình dự báo thời tiết số xem xét phần 4, vài kết luận đưa phần cuối Cơ sở lí thuyết Xem xét phương trình mơ tả tiến triển trạng thái x có dạng tổng quát sau: dx = M (x) + F (t ) dt (1) x(t) ∈ ℜn vector trạng thái nchiều phụ thuộc vào thời gian có phân bố xác suất ban đầu đặc trưng ma trận hiệp biến Pf, M mơ hình phi tuyến mơ tả tiến triển trạng thái, F(t) ∈ ℜn vector lực1 Giả _ Để đơn giản ký hiệu, không gian Eulerian với metric đơn giản ngầm hiểu cho x phép tính 311 thiết tập hợp số liệu quan sát y io ∈ ℜp pchiều cho trước thời điểm gián đoạn {ti∈I }với phân bố xác suất đặc trưng ma trận sai số hiệp biến R Khi đó, lọc Kalman tồn phần cho phép đồng hoá tập số liệu quan sát y io cho phương trình (xem [5]) Pi f = L i −1 Pia−1LTi−1 + Q i K = Pi −f H T ( HPi −f H T + R ) −1 x ia = x if + K ( y io − H ( x if )) Pia = (I − KH ) Pi −f (2) Pi −f Pi f ma trận sai số hiệp biến (hay dự báo) thời điểm i-1 i, L mơ hình tiếp tuyến mơ hình M, Pia−1 Pia ma trận sai số hiệp biến phân tích thời điểm i-1 i, K ma trận trọng số, Qi ma trận sai số mơ hình, H tốn tử biến đổi từ khơng gian mơ hình sang khơng gian quan trắc Lọc Kalman áp dụng thời điểm i cho chu trình đồng hóa sau tích phân đến thời điểm thứ i+1 trình phân tích với lọc Kalman lại lặp lại Như thảo luận phần giới thiệu, hai nguồn sai số mơ hình đặc trưng ma trận Q xấp xỉ số học phương trình (1) lực cưỡng khơng hiểu biết đầy đủ F Mặc dù loại sai số liên quan đến thuật tốn tích phân mơ hình khắc phục cách thiết kế thuật tốn tính tốn hợp lí, loại sai số thứ hai liên quan đến tính chất vật lý khó kiểm sốt có đóng góp lớn đến sai số mơ hình tổng cộng, đặc biệt hệ phức tạp hệ thống khí quyển-đại dương Để toán thiết lập cách tường minh, giả thiết thuật toán sai phân hữu hạn phương trình (1) đủ xác cho sai số mơ hình xấp xỉ số học tạm bỏ qua tập trung hồn vào vector thực với topo tương ứng Các ký tự in đậm ngụ ý vector khơng gian mơ hình hay khơng gian quan trắc cách tương ứng 312 K.Q. Chánh / Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26, Số 3S (2010) 310‐316 loại sai số mơ hình vật lí Giả thiết lực F(t) biến ngẫu nhiên với phân bố xác suất cho trước, nhiệm vụ tìm biểu diễn cho ma trận sai số mơ hình Q với giả thiết Từ phương trình mơ hình (1), dạng biến phân có dạng d (δx) (3) = J (x)δx + δF(t ) dt gradient J(x) định nghĩa ∂M/∂x Trong trường hợp tổng qt nghiệm xác phương trình (3) khơng khả tích, với δF(t) phụ thuộc tường minh vào thời gian, nghiệm xác liên quan đến việc thừa số hố ma trận khơng khả nghịch Tuy nhiên, ý F(t) phụ thuộc vào thời gian, phân bố thống kê nhiễu lực lại giả thiết khơng phụ thuộc vào thời gian với phân bố xác xuất có biên độ cho trước, nghĩa δF không phụ thuộc vào thời gian Trong trường hợp này, nghiệm phương trình (3) có dạng ti ti + ti −1 ti ti ti −1 ti −1 )J (x(t ) + )δx ti −1 (4) δxo nhiễu động ban đầu điều kiện ban đầu khơng xác t = Với nghiệm (4), nghiệm cuối phương trình (3) cho (5) δx (t ) = δx h (t ) − J −1 ( x (t ))δF Nghiệm viết ngắn gọn việc đưa vào toán tử xếp thời gian T, định nghĩa [6] T {H (t ) H (t )} = ∑ θ (tσ − tσ ) θ (tσ − tσ ) H (σ (1)) H (σ ( n)) σ n (1) ( 2) t δx(t ) = T [exp{ ∫ dτJ (x(τ )}]δx − J −1δF (7) ti −1 hàm mũ ma trận định nghĩa An n = n! ∞ exp( A) = ∑ (8) Nghiệm (7) kiểm tra cách dễ dàng cách thay trực tiếp vào phương trình (3) Với nghiệm (7), mơ hình tiếp tuyến L định nghĩa lọc Kalman có dạng t L = T [exp{ ∫ d τJ ( x (τ )}] (9) t i −1 t 21 ∫ dt ∫ dt ∫ dt J (x(t )J (x(t ti −1 ti ≥ t j ti < t j Một cách thực chất, toán tử xếp thời gian xếp lại tất ma trận cho ma trận với thời gian trễ đứng phía bên trái Đây kĩ thuật quen thuộc tốn lí thuyết trường lượng tử [6] Với toán tử xếp thời gian T, nghiệm (5) viết lại cách cô đọng sau t1 δx h = (I + ∫ dt1 J (x(t1 ) + ∫ dt1 ∫ dt J (x(t1 )J (x(t ) ti −1 ⎧1 ⎩0 θ (ti − t j ) = ⎨ ( n −1) (n) (6) tổng σ chạy tất giao hoán (1 n), (tổng cộng có n! giao hốn) hàm Heaviside định nghĩa sai số mơ hình cho (10) Q ≡ E{( J −1δF )( J −1δF ) T } Để tính tốn sai số mơ hình Q ý có tập mẫu n phép thử với điều kiện ban đầu cho δxo = 0, rõ ràng từ phương trình (7) tất sai số tạo lực nhiễu động δF, nghĩa δx = δxh Như vậy, thu ma trận Q theo hai cách khác Tính tốn trực tiếp ma trận Q cách thống kê vector (J-1δF) Điều thực phương pháp lấy mẫu n phép thử δF để tạo mẫu n vector (J-1δF) Từ đó, ma trận sai số mơ hình Q thu cách dễ dàng từ phương trình (10) Cách tiếp cận thứ hai thực n phép tích phân mơ hình với lực F làm nhiễu cách ngẫu nhiên Các tích phân mơ hình K.Q. Chánh / Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26, Số 3S (2010) 310‐316 nhiên tiến hành với điều kiện ban đầu cho tất sai số mơ hình đầu gán cho lực bị làm nhiễu Đầu phép chạy tính tốn thống kê để thu ma trận Q Phương pháp tiếp cận thứ hai chọn nghiên cứu mở rộng cách dễ dàng mơ hình nghiệp vụ trường hợp tổng quát hơn, ví dụ điều kiện biên bị làm nhiễu thảo luận phần Thiết kế thí nghiệm Để xem xét cách đầy đủ hiệu thuật tốn lực nhiễu động, mơ hình Lorenz 40 biến sử dụng mơ hình mẫu nghiên cứu cho lọc Kalman tồn phần sử dụng Cùng với điểm bật việc sử dụng lọc Kalman tồn phần, mơ hình tích phân cách xác việc sử dụng thuật toán Runge-Kutta bậc Điều làm tối thiểu hố sai số mơ hình phương pháp tính tốn số cho phép xem xét cách đầy đủ phương pháp lực nhiễu động Để so sánh phương pháp với cách tiếp cận khác, kĩ thuật thừa số tăng cấp nhân thực song song với phương pháp lực nhiễu động trình bày phần Một so sánh đầy đủ với kỹ thuật xử lý khác bao gồm tăng cấp cộng tính hay khử sai số hệ thống đề cập đến nghiên cứu 3.1 Mơ hình Mơ hình Lorenz 40-biến cho (xem [7]) dxi = xi −1 ( xi +1 − xi − ) − xi + F ≡ M ( xi ) + F (11) dt 313 Trong F lấy xác F = 8.0 cho trạng thái thực Điều kiện ban đầu trạng thái thực chọn cách ngẫu nhiên Một chọn, điều kiện ban đầu nhiên giữ không đổi tất thí nghiệm Trạng thái thực tích phân 1000 bước thời gian in bước Điều kiện biên tuần hoàn cho xi áp dụng i = cho x0 = xN Mơ hình có tiến triển hỗn loạn sau thời gian chuyển tiếp khoảng 50 bước tích phân Bước thời gian δt = 0.01 sử dụng tất thí nghiệm 3.2 Mơ hình tiếp tuyến Mơ hình tiếp tuyến cho mơ hình Lorenz thu trực tiếp từ phương trình (9) Do khối lượng tính tốn lớn sai số làm tròn tích phân ma trận, chúng tơi giới hạn tính tốn xấp xỉ bậc bậc hai phương trình (9) Với xấp xỉ bậc một, thu dạng quen thuộc M (12) L ≈ I + δt ∑ J ( x(t i )) i =1 M số bước tích phân mà quan trắc đồng hóa Ví dụ, M = tương ứng với việc đồng hóa tất bước tích phân, M = thực đồng hóa bước tích phân Với xấp xỉ bậc hai, L cho M i i =1 j =1 L ≈ I + δt ∑ J ( x(t i ))[I + δt ∑ J ( x(t j ))] (13) Vì làm việc tường minh khơng gian ℜ40, mơ hình liên hợp đơn giản chuyển vị mơ hình tiếp tuyến (13) 3.3 Lực nhiễu động Ngoại trừ trạng thái thực lực tác dụng biết xác với F = 8.0, tổ hợp gồm n thành phần tích phân mơ hình khơng có giá trị lực tác dụng xác mà lấy từ tập hợp gồm n phép lấy ngẫu nhiên có phân bố chuẩn với độ lệch chuẩn δF = 1.0 cộng bước tích phân Như 314 K.Q. Chánh / Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26, Số 3S (2010) 310‐316 thảo luận phần 2, tất phép thử phải có điều kiện ban đầu q trình tích phân tổ hợp Ma trận sai số hiệp biến mô hình Q thu bắng cách lấy mẫu n đầu tích phân thời điểm đồng hóa Đối với số liệu quan trắc cần thiết cho việc đồng hóa, nhiễu động với phân bố Gauss độ lệch chuẩn 1.0 cộng vào thành phần trạng thái thực mơ hình 3.4 Kết Để đánh giá độ xác phương pháp khác nhau, sai số quân phương (rms) sai số trạng thái phân tích trạng thái thực thời điểm đồng hóa sử dụng với định nghĩa sau: 1/ ⎧ 40 ⎫ RMS = ⎨ ∑ ( xka − xkt ) ⎬ ⎩ 40 k =1 ⎭ Hình so sánh tiến triển theo thời gian rms cho trường hợp hiệu chỉnh sai số mơ hình (NOC), hiệu chỉnh sai số phương pháp lực nhiễu động (PF20) với 20 thành phần, phương pháp tăng cấp nhân điển hình (INF) Chúng ta nhận thấy dễ dàng tất cửa sổ đồng hóa M từ đến bước tích phân, PF20 cho kết tốt ổn định so với INF Cả PF20 INF cho kết tốt so với trường hợp sai số mơ hình khơng tính đến mơ nhìn thấy trường hợp NOC Do mơ hình tiếp tuyến có độ sai lệch tích luỹ tăng theo khoảng đồng hóa M, nhận thấy từ Hình với giá trị M lớn rms tăng nhanh Với M > 15, lọc Kalman phân kỳ tất phương pháp Sự ổn định phương pháp PF20 so với INF hiểu ý PF20 cho phép tính đến sai số nội mơ hình INF phụ thuộc vào tần số đồng hóa Nói cách khác, INF giả thiết sai số mơ hình tỷ lệ với sai số ma trận hiệp biến phân tích Hình Sự tiến triển theo thời gian rms trạng thái phân tích trạng thái thực cho thí nghiệm NOC (đường liền nhạt), INF với thừa số nhân 0.03 (đường chấm), PF20 (đường liền đậm) với M = 1, 2, 4, Để xem xét thêm độ nhậy phương pháp lực nhiễu động, loạt thí nghiệm tiến hành số lượng thành phần tổ hợp tăng dần từ 10 đến 100 với M cố định 14 Hình Mặc dù thí nghiệm với nhiều thành phần tổ K.Q. Chánh / Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26, Số 3S (2010) 310‐316 hợp cho rms nhỏ mong đợi (Hình 2), nhận thấy giảm rms dường bão hóa nhanh với 20 thành phần tổ hợp 315 Hình Sai số rms lấy trung bình khoảng 1000 bước tích phân cho phương pháp lực nhiễu động với số thành phần tổ hợp 10, 30, 50, 100 (xám), hiệu chỉnh tăng cấp (xám nhạt), khơng có hiệu chỉnh sai số mơ hình (xám đậm) số mơ hình với phương pháp lực nhiễu động làm để tạo nhiễu thích hợp Đây câu hỏi mà phụ thuộc nhiều vào mô hình mà có tốn cần thiết phải giải Một cách cụ thể, giả thiết có mơ hình bão khu vực mà muốn nghiên cứu tính dự báo tin dự báo đựờng bão Các nghiên cứu trước đường bão phụ thuộc nhiều vào yếu tố mơi trường khơng tính mơ hình số ví dụ sơ đồ tham số hóa đối lưu hay lớp biên Trong trường hợp này, cách rõ ràng để tạo trường lực nhiễu động sử dụng sơ đồ tham số khác để tạo nhiễu Các tính tốn liên tục trường sai số mơ hình với sơ đồ tham số hóa khơng đòi hỏi mơ hình tiếp tuyến hay mơ hình liên hợp có ý nghĩa thực tế Với sai số mơ hình ước lượng cách này, lọc Kalman tổ hợp kết hợp để tạo nhiễu tổ hợp thay chạy tổ hợp riêng rẽ cho điều kiện ban đầu cho sai số mơ hình Ứng dụng mở rộng Kết luận Như thảo luận phần 2, khn khổ lí thuyết phương pháp lực nhiễu động có ý nghĩa hệ cho phương trình (1) với số bậc tự nhỏ Đối với hệ phức tạp hệ trái đất-khí quyển, gần khơng thể sử dụng phương pháp lọc Kalman tồn phần số chiều mơ hình q lớn Do đó, lọc Kalman tổ hợp phải sử dụng [8] Đối với hệ vậy, mở rộng tự nhiên phương pháp lực nhiễu động lấy mẫu cách trực tiếp đầu tích phân tổ hợp mà có điều kiện ban đầu xem xét phần Vấn đề phải ý tính tốn sai Trong nghiên cứu này, phương pháp xác định sai số mơ hình cách tạo nhiễu ngẫu nhiên lực tác dụng khảo sát lý thuyết cách tường minh Phương pháp nhiễu lực dựa giả thiết nguồn gốc lớn sai số mơ hình hiểu biết khơng đầy đủ q trình vật lý mơ hình, đặc biệt hệ phức tạp khí đại dương Phương pháp lực nhiễu động kiểm nghiệm mơ hình Lorenz vài tính chất bật bao gồm 1) ổn định thuật toán khoảng rộng cửa số đồng hóa, 2) độ xác cao phương pháp tăng cấp bội tuý, 3) Điều cần với số thành phân tổ hợp nắm bắt tốt cấu trúc đặc trưng trường sai số mơ hình, ưu điểm có ý nghĩa tính tốn thực tế khối lượng tính tốn lớn mơ hình khơng cho phép có nhiều thành phần tổ hợp 1.6 1.4 1.2 0.8 0.6 0.4 0.2 NO PF10 PF20 PF40 PF60 PF80 PF100 MF 316 K.Q. Chánh / Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26, Số 3S (2010) 310‐316 độ xác trì tốt với số thành phần tổ hợp Điều trông đợi cho ứng dụng thực tế khối lương tính tốn lớn mơ hình nghiệp vụ khơng cho phép có nhiều thành phần tổ hợp Mở rộng phương pháp lực nhiễu động cho hệ thống với nhiều bậc tự thảo luận Nghiên cứu ứng dụng chi tiết phương pháp lực nhiễu động trình bày nghiên cứu tới Lời cảm ơn Tác giả muốn gửi lời cảm ơn đến TS Craig Bishop trao đổi gợi ý cho tác giả vấn đề liên quan đến sai số mơ hình cân hóa tốn lọc Kalman thời gian tác giả đến thăm phòng thí nghiên cứu hải quân Hoa Kỳ NRL Tác giả cảm ơn sinh viên Nguyễn Thị Hạnh K52 giúp đỡ chỉnh sửa thảo Tài liệu tham khảo [1] J L Anderson, and S L Anderson, A Monte Carlo implementation of the non-linear filtering problem to produce ensemble assimilations and forecasts Mon Wea Rev., 127 (1999) 2741 [2] H L Mitchell, and P L Houtekamer An adaptive ensemble Kalman filter Mon Wea Rev, 128 (2000) 416 [3] D P Dee, and A M da Silva, Data assimilation in the presence of forecast bias Quart J Roy Meteor Soc., 124 (1998) 269 [4] H Li, Local ensemble transform Kalman filter with realistic observations Ph.D dissertation University of Maryland (2007) 131p [5] E Kalnay, Atmospheric Modeling, Data Assimilation and Predictability, Cambridge University Press (2003) 512p [6] M E Peskin, and D V Schroeder Quantum field theory Westview Publisher, (1995) 842p [7] E.N Lorenz, and K.A Emanuel, Optimal Sites for Supplementary Weather Observations: Simulation with a Small Model J Atmos Sci., 55 (1998) 399 [8] G Evensen, Sequential data assimilation with a nonlinear quasigeostrophic model using Monte Carlo methods to forecast error statistics J Geophys Res., 99 (1994) 10143 Estimation of Model Error in the Kalman Filter by Perturbed Forcing Kieu Quoc Chanh Faculty of Hydro-Meteorology & Oceanography, Hanoi University of Science, VNU 334 Nguyen Trai, Hanoi, Vietnam In this report, a technique to estimate model errors for the Kalman filter is presented Implementation of the technique in the Lorenz 40-variable model shows significant improvement as compared to the multiplicative inflation approach in terms of both root mean square error and stability Potential extension of the technique to more complicated systems such as numerical weather prediction models is also discussed Keywords: ensemble data assimilation, Kalman filter, numerical weather prediction View publication stats ... L Mitchell, and P L Houtekamer An adaptive ensemble Kalman filter Mon Wea Rev, 128 (2000) 416 [3] D P Dee, and A M da Silva, Data assimilation in the presence of forecast bias Quart J Roy Meteor... Li, Local ensemble transform Kalman filter with realistic observations Ph.D dissertation University of Maryland (2007) 131p [5] E Kalnay, Atmospheric Modeling, Data Assimilation and Predictability,... Supplementary Weather Observations: Simulation with a Small Model J Atmos Sci., 55 (1998) 399 [8] G Evensen, Sequential data assimilation with a nonlinear quasigeostrophic model using Monte Carlo methods