Phương pháp phân tích thành phần chính

Một phần của tài liệu Nghiên cứu đánh giá diễn biến năng lượng bão trên Biển Đông và khả năng dự báo (Trang 75 - 77)

Để nắm bắt mối quan hệ giữa hoạt động bão và môi trường quy mô lớn, phương pháp phân tích tương quan và thành phần chính (PCA) hay còn gọi là phương pháp hàm trực giao thực nghiệm (EOF) được sử dụng khá phổ biến trong khí tượng nói chung và hoạt động của APSJ nói riêng (Lin và ctv, 2004 [100]; Zhang và ctv, 2008 [148], Huang. D và ctv, 2014 [75], Yan và ctv, 2019 [143]). Có thể khái quát về phương pháp như sau:

Ta xem xét bản đồ số liệu tại mỗi điểm lưới (1,...,M), theo thời gian (1, ...,N). Tức là, có M chuỗi thời gian số liệu có dung lượng mẫu là N. Trước tiên, chuỗi số liệu sẽ được chuẩn sai hoặc chuẩn hóa. Chúng ta xây dựng ma trận dữ liệu F với M hàng và N cột (Silvia A. Venegas, 2001 [116]).

Ma trận dữ liệu F được sử dụng để xác định ma trận hiệp phương sai RFF bằng cách nhân ma trận F với chuyển vị FT: RFF = F*FT

Chúng ta cần giải:

RFF*E=E*Λ (2.27)

M chứa các giá trị riêng k của RFF:

λ1 0 …. 0 0 λ2 …. 0

Λ= […. …. …. ….] (2.28)

0 0 …. λM

Các giá trị riêng trong Λ thường được sắp xếp theo thứ tự giảm dần, sao cho1 >2 > ...>M. Kích thước ma trận Λ là M x M thường chỉ có K giá trị riêng đầu tiênk, k = 1 ... K khác 0, trong đó K ≤ min (N, M).

Ma trận vuông E có kích thước M x M. Các vectơ cột Ek của nó là các vector riêng của RFF tương ứng với các giá trị riêng k:

E11 E12 …. E1M E= E21 E22 …. E2M (2.29) …. …. …. …. [ EM1 EM2 …. EMM ] ↓ ↓ ↓ E1 E2 EM → Vector riêng Ek

Mỗi giá trị riêng k khác không trong ma trận Λ được kết hợp vector riêng Ek trong ma

trận E. Do đó, chỉ vector riêng K được sử dụng, ứng với K giá trị riêng khác 0. Như vậy, kích thước của ma trận E là M x K, trong đó M

là vị trí không gian và K là EOF.

Ma trận vector riêng E có thuộc tính E * ET = ET*E = I, trong đó I là ma trận đơn vị. Điều này có nghĩa là các vector riêng không tương quan theo không gian, chúng trực giao với nhau. Mỗi vector riêng Ek đại diện cho kiểu EOF.

Chuỗi theo thời gian của EOF thứ k, kth (nghĩa là, kiểu Ek theo thời gian) được cho bởi chuỗi thời gian Ak (t), có được bằng cách chiếu chuỗi dữ liệu ban đầu Fm(t) lên vector riêng Ek và tính tổng tất cả các vị trí m:

M

Ak(t)= ∑ EmMFm(t) (2.30)

m=1

trận thu được bằng cách nhân các ma trận ET và F.

A=ET*F (2.31) Trong đó ET có kích thước là K x M, kính thước của F là M x N, và do đó kích thước của A là K x N. Các hàng trong ma trận A là chuỗi thời gian có

độ dài N, đó là số bước thời gian trong chuỗi thời gian ban đầu. Người ta gọi chúng là các thành phần chính hoặc PCs, hoặc chuỗi thời gian vector riêng, hoặc điểm scores. Cũng giống như kiểu không gian Ek là trực giao trong không gian, các thành phần chính Ak là trực giao theo thời gian.

Mỗi giá trị riêng k tỷ lệ với phần trăm phương sai của trường F được tính theo k. Tỷ lệ phần trăm này được tính là:

% variance mode k= λk *100 (2.32)

∑i=1K λi

Đối với phân tích thành phần chính, gói hàm trực giao thực nghiệm từ phần mềm CDO (Climate Data Operators) do “Viện Khí tượng Max Planck” (Max Planck Institute for Meteorology) cung cấp được nghiên cứu sử dụng. Cụ thể EOF được xác định trên miền kinh độ, vĩ độ (25-60oN, 80-150oE), với tối đa 37 eigenvector và các thành phần chính có thể chiếm hơn 99% tổng phương sai. PCA được áp dụng cho thành phần gió vĩ hướng 200 mb để tìm kiếm các cấu trúc hàm thực nghiệm liên quan đến biến động chủ đạo cho định nghĩa về sự thay đổi vị trí và cường độ của APSJ. Chi tiết về gói PCA do Viện Khí tượng Max Planck phát triển tại https://code.mpimet.mpg.de/projects/cdo/files.

Một phần của tài liệu Nghiên cứu đánh giá diễn biến năng lượng bão trên Biển Đông và khả năng dự báo (Trang 75 - 77)

Tải bản đầy đủ (DOC)

(165 trang)
w