Hệ số tương quan được sử dụng để xác định mối quan hệ tuyến tính giữa hai biến như quan hệ tương quan giữa các đặc trưng bão là số lượng bão, hay ACE,..(biến y) với trường giá trị của các yếu tố môi trường như nhiệt độ mặt nước biển, tốc độ gió kinh và vĩ hướng, xoáy tương đối, độ tán, độ đứt gió thẳng đứng, bức xạ sóng dài và vận tốc thẳng đứng (biến x) được xác định trên từng điểm lưới (i, j) với i và j là theo kinh vĩ tuyến. Khi đó hệ số tương quan sẽ được xác định theo công thức sau (Chu Thị Thu Hường, 2015 [12]):
∑t=1n (xijt -x̅ijt)(yt-y̅t) = n (2.18) √ 1∑n (xijt -x̅ ijt )2 √ 1 ∑n (y -y̅ )2 n t=1 n t t t
Trong đó: yt và xijt là giá trị của y và x trong năm t (t=1,...,n). y̅t và x̅ijt là giá trị trung bình của xijt hayt. Tương tự như rt, đánh giá độ tin cậy thống kê của dựa trên kiểm nghiện Student (áp dụng công thức 2.12 đến công thức 2.17 cho từng điểm lưới ij).
Tại mỗi điểm lưới trong không gian (i, j) có thể xác định chuỗi thời gian của các yếu tố môi trường có cùng thời gian t (37 năm từ 1982-2018 trong chương 3 hoặc 29 năm từ 1982-2010 trong chương 4); có thể là trung bình các tháng mùa xuân (tháng 3 đến tháng 5) hoặc các tháng trong mùa bão (tháng 6- 11),…Tập hợp các điểm lưới có hệ số tương quan (rij) tạo nên bản đồ về hệ số tương quan. Đây là bản đồ phân bố không gian của hệ số tương quan theo thời gian. Phân tích bản đồ sẽ cho phép chỉ ra được những vùng mà ở đó quan hệ tương quan có ý nghĩa giữa các biến môi trường đối với các biến động của bão.
Ngoài ra, hệ số tương quan còn được sử dụng để xác định mối quan hệ tương quan giữa các đặc trưng bão với các yếu tố môi trường trung bình cho một vùng được định nghĩa nào đó, có nghĩa là trung bình các yếu tố môi trường với nhiều điểm lưới (i, j) để tạo nên chuỗi có cùng thời gian t, ví dụ mối quan hệ giữa ACE với JSSTG, ISSTG và SSSTG trong chương 3);...
Để xem xét sự khác nhau trung bình của hai chuỗi số liệu, ví dụ như trung bình số cơn bão trên ô lưới được xác định trong các năm ACE cao và thấp, hay sự khác nhau của trung bình tốc độ gió vĩ hướng mực 200mb hay độ cao địa thế vị mực 200 mb, 850 mb trong năm ACE cao (gọi là chuỗi x1ij) và năm ACE thấp (gọi là chuỗi x2ij) trên từng điểm lưới (i, j) với i, j là phương kinh vĩ tuyến. Sự khác nhau trung bình của hai chuỗi với phương sai không bằng nhau được xác định (Vũ Văn Thăng, 2016 [27]; Wilks và ctv, 2006 [135]): Giả thiết cần kiểm nghiệm là: H0: μ̅1ij=μ̅2ij, vì không có μ̅1ij và μ̅2ij nên ta
thay bằng x̅1ij và x̅2ij:
μ̅ = x̅ = 1 ∑n1 x và μ̅ =x̅ =1
∑n2 x (2.19)
1ij 1ij
n 1 1ij 2ij 2ij n 1 2ij
Từ đó ta có: H0: x̅1ij= x̅2ij hay H0: x̅1ij- x̅2ij= 0
Chọn giới hạn tin cậy ban đầu d sao cho với xác suất sai lầm loại I (α) cho trước ta có: P{x̅1ij - x̅2ij} ≥ d = α (2.20) Nếu đặt: Z= (x̅ 1ij - x̅ 2ij )⁄√(s2 /n + s2 /n ) (2.21)
1ij 1ij 2ij 2ij
= d⁄√(s2 /n + s2 /n ) (2.22)
α 1ij 1ij 2ij 2ij
Ở đây: x̅1ij, x̅2ij là trung bình của hai chuỗi x1ij và x2ij. Dung lượng mẫu n1ij và n2ij tương ứng của hai chuỗi. Độ lệch tiêu chuẩn tương ứng với hai chuỗi là s1ij, s2ij được xác định: n 1ij 1 s 1ij= s* 1ij=√ n1ij-1∑(x1ij-x̅ 1ij) (2.23) 1 n 2ij 1
s1ij= s*2ij=√n2ij-1∑(x2ij-x̅2ij)
(2.24)
1
Theo Wilks (2006) [135], đối với cỡ mẫu dài vừa phải có phân bố chuẩn Gaussian N (0, 1), đối với cỡ mẫu ngắn phân bố của Z là xấp xỉ theo Student với bậc tự do tα =min (n1,n2)-1. Trong nghiên cứu này để đánh giá sự khác nhau của các yếu tố môi trường đã lựa chọn 6 năm ACE cao và 5 năm ACE thấp (chương 3). Vì dung lượng mẫu năm ACE cao (thấp) ngắn, do đó sẽ áp dụng kiểm nghiệm theo phân bố Student với định nghĩa Z = t và α = α. Như vậy:
Khi H0 đúng,
Và tiêu chuẩn kiểm nghiệm là:
{ |t| ≥ tα, thì bác bỏ H0
|t|<tα, thì chấp nhận H0
Ngưỡng của tα=5% được tra bảng phân bố Student.
Kết quả tính toán là tập hợp các điểm lưới thể hiện sự chênh lệch về trung bình hai chuỗi; ví dụ như số cơn bão được xác định trên ô lưới kinh vĩ, gió vĩ hướng hoặc độ cao địa thế vị các tầng đối lưu (mực 850mb, 500mb, 200mb) trong năm ACE cao và thấp hoặc trong năm JSSTG cao và thấp. Mức độ tin cậy về sự khác nhau của chúng trên từng điểm lưới (i,j) được xác định. Đây là bản đồ phân bố không gian về chênh lệch của trung bình hai chuỗi. Phân tích bản đồ có thể xác định phạm vi chênh lệch âm và dương, trên cơ sở đó nhận dạng và phân tích sự khác nhau của yếu tố môi trường quy mô lớn có thể liên quan đến biến động hàng năm của bão và ACE trên Biển Đông.