Phương pháp phân tích thành phần chính

Một phần của tài liệu Nghiên cứu đánh giá diễn biến năng lượng bão trên Biển Đông và khả năng dự báo (Trang 72 - 74)

Chương 1 TỔNG QUAN CÁC NGHIÊN CỨU VỀ NĂNG LƯỢNG BÃO

2.2. Phương pháp nghiên cứu

2.2.4 Phương pháp phân tích thành phần chính

Để nắm bắt mối quan hệ giữa hoạt động bão và môi trường quy mô lớn, phương pháp phân tích tương quan và thành phần chính (PCA) hay còn gọi là phương pháp hàm trực giao thực nghiệm (EOF) được sử dụng khá phổ biến trong khí tượng nói chung và hoạt động của APSJ nói riêng (Lin và ctv, 2004 [100]; Zhang và ctv, 2008 [148], Huang. D và ctv, 2014 [75], Yan và ctv, 2019 [143]). Có thể khái quát về phương pháp như sau:

Ta xem xét bản đồ số liệu tại mỗi điểm lưới (1,...,M), theo thời gian (1, ...,N). Tức là, có M chuỗi thời gian số liệu có dung lượng mẫu là N. Trước tiên, chuỗi số liệu sẽ được chuẩn sai hoặc chuẩn hóa. Chúng ta xây dựng ma trận dữ liệu F với M hàng và N cột (Silvia A. Venegas, 2001 [116]).

Ma trận dữ liệu F được sử dụng để xác định ma trận hiệp phương sai RFF bằng cách nhân ma trận F với chuyển vị FT: RFF = F*FT

Chúng ta cần giải:

Tức là phân tích RFF thành các ma trận Λ và E. Ở đây Λ là ma trận M x M chứa các giá trị riêng k của RFF:

Λ=[ λ1 0 …. 0 0 λ2 …. 0 …. …. …. …. 0 0 …. λM ] (2.28)

Các giá trị riêng trong Λ thường được sắp xếp theo thứ tự giảm dần, sao cho 1 > 2 > ...> M. Kích thước ma trận Λ là M x M thường chỉ có K giá trị riêng đầu tiên k, k = 1 ... K khác 0, trong đó K ≤ min (N, M).

Ma trận vuông E có kích thước M x M. Các vectơ cột Ek của nó là các vector riêng của RFF tương ứng với các giá trị riêng k:

E= [ E11 E12 …. E1M E21 E22 …. E2M …. …. …. …. EM1 EM2 …. EMM ] (2.29) ↓ ↓ ↓ E1 E2 EM → Vector riêng Ek Mỗi giá trị riêng k khác không trong ma trận Λ được kết hợp vector riêng Ek trong ma trận E. Do đó, chỉ vector riêng K được sử dụng, ứng với K giá trị riêng khác 0. Như vậy, kích thước của ma trận E là M x K, trong đó M là vị trí không gian và K là EOF.

Ma trận vector riêng E có thuộc tính E * ET = ET*E = I, trong đó I là ma trận đơn vị. Điều này có nghĩa là các vector riêng không tương quan theo không gian, chúng trực giao với nhau. Mỗi vector riêng Ek đại diện cho kiểu EOF.

Chuỗi theo thời gian của EOF thứ k, kth (nghĩa là, kiểu Ek theo thời gian) được cho bởi chuỗi thời gian Ak (t), có được bằng cách chiếu chuỗi dữ liệu ban đầu Fm(t) lên vector riêng Ek và tính tổng tất cả các vị trí m:

Ak(t)=∑EMmFm(t) (2.30) M

m=1

trận 𝐴 thu được bằng cách nhân các ma trận ET và F.

A=ET*F (2.31) Trong đó ET có kích thước là K x M, kính thước của F là M x N, và do đó kích thước của A là K x N. Các hàng trong ma trận A là chuỗi thời gian có độ dài N, đó là số bước thời gian trong chuỗi thời gian ban đầu. Người ta gọi chúng là các thành phần chính hoặc PCs, hoặc chuỗi thời gian vector riêng, hoặc điểm scores. Cũng giống như kiểu không gian Ek là trực giao trong không gian, các thành phần chính Ak là trực giao theo thời gian.

Mỗi giá trị riêng k tỷ lệ với phần trăm phương sai của trường F được tính theo k. Tỷ lệ phần trăm này được tính là:

% variance mode k= λk

∑Ki=1λi*100 (2.32) Đối với phân tích thành phần chính, gói hàm trực giao thực nghiệm từ phần mềm CDO (Climate Data Operators) do “Viện Khí tượng Max Planck” (Max Planck Institute for Meteorology) cung cấp được nghiên cứu sử dụng. Cụ thể EOF được xác định trên miền kinh độ, vĩ độ (25-60oN, 80-150oE), với tối đa 37 eigenvector và các thành phần chính có thể chiếm hơn 99% tổng phương sai. PCA được áp dụng cho thành phần gió vĩ hướng 200 mb để tìm kiếm các cấu trúc hàm thực nghiệm liên quan đến biến động chủ đạo cho định nghĩa về sự thay đổi vị trí và cường độ của APSJ. Chi tiết về gói PCA do Viện Khí tượng Max Planck phát triển tại https://code.mpimet.mpg.de/projects/cdo/files.

Một phần của tài liệu Nghiên cứu đánh giá diễn biến năng lượng bão trên Biển Đông và khả năng dự báo (Trang 72 - 74)

Tải bản đầy đủ (PDF)

(161 trang)