Giáo trình Phương pháp thống kê trong khí hậu: Phần 2 gồm có các chương: Chương 5 phân tích tương quan và hồi qui; chương 6 chỉnh lý số liệu khí hậu; chương 7 phân tích chuỗi thời gian. Mời các bạn cùng tham khảo.
Chơng Phân tích tơng quan hồi qui 5.1 Những khái niệm mở đầu Trong thực tế nghiên cứu khí tợng, khí hậu có vấn đề đợc đặt cần phải xác định đợc qui luật biến đổi tợng khí Tuy nhiên, tợng khí lại đợc phản ánh thông qua đặc trng yếu tố khí mà chúng, đến lợt mình, lại phụ thuộc vào biến đổi nhân tố bên Muốn nắm đợc qui luật biến đổi tợng khí cần thiết phải xác định liên hệ đặc trng yếu tố khí (đợc xem biến phụ thuộc) với tập hợp nhân tố ảnh hởng mà ngời ta gọi biến độc lập Điều có nghĩa là, phơng diện thống kê, thông thờng ta cần phải giải số vấn đề sau đây: 1) Xác định phân bố không gian đặc trng yếu tố khí tợng, khí hậu, tức nghiên cứu qui luật phụ thuộc vào toạ độ không gian biến khí 2) Xác định qui luật, tính chất diễn biến theo thời gian đặc trng yếu tố khí 3) Xác định mối quan hệ ràng buộc để từ tìm qui luật liên hệ đặc trng yếu tố khí với theo không gian thời gian Một phơng pháp giải vấn đề phơng pháp phân tích tơng quan hồi qui mà nội dung đợc chia thành: 1) Tơng quan hồi qui theo không gian: Là xét mối quan hệ hai hay nhiều biÕn khÝ qun víi cđa cïng mét u tè, thời gian (đồng thời) nhng khác vị trí không gian 2) Tơng quan hồi qui theo thời gian: Là xét mối quan hệ hai hay nhiỊu biÕn khÝ qun víi cđa cïng mét u tố, địa điểm nhng khác thời gian 3) Tơng quan hồi qui phổ biến: Là xÐt mèi quan hƯ gi÷a hay nhiỊu biÕn khÝ qun nhiều yếu tố, khác không gian, thời gian khôngthời gian 119 Về phơng diện toán học, vào dạng thức cđa biĨu thøc biĨu diƠn, ng−êi ta chia sù quan hệ tơng quan làm bốn dạng: 1) Tơng quan håi qui tuyÕn tÝnh mét biÕn: XÐt mèi quan hÖ tơng quan hồi qui tuyến tính bên biến phụ thuộc với bên biến độc lập 2) Tơng quan hồi qui phi tuyến biến: Xét mối quan hệ tơng quan hồi qui phi tuyến bên biến phụ thuộc với bên biến độc lập 3) Tơng quan vµ håi qui tun tÝnh nhiỊu biÕn: XÐt mèi quan hệ tơng quan hồi qui tuyến tính bên biến phụ thuộc với bên tập hợp nhiều biến độc lập 4) Tơng quan håi qui phi tun nhiỊu biÕn: XÐt mèi quan hƯ tơng quan hồi qui phi tuyến bên biến phụ thuộc với bên tập hợp nhiều biến độc lập Thông thờng để giải toán tơng quan hồi qui khí tợng, khí hậu cần phải tiến hành bớc sau: 1) Xác lập đợc dạng thức mối liên hệ tơng quan, tức tìm dạng hồi qui thích hợp: Tuyến tính hay phi tuyến, phi tuyến cụ thể dạng 2) Đánh giá đợc mức độ chặt chẽ mối liên hệ theo nghĩa quan hệ tơng quan 3) Bằng phơng pháp đó, xác lập biểu thức giải tích phơng trình hồi qui xấp xỉ mối liên hệ tơng quan, tức xây dựng hàm hồi qui Trong khí tợng, khí hậu phơng pháp phổ biến để xây dựng hàm hồi qui phơng pháp bình phơng tối thiểu 4) Đánh giá độ xác khả sử dụng phơng trình hồi qui 5.2 Tơng quan tuyến tính 5.2.1 Hệ số tơng quan tổng thể Xét hai biến ngẫu nhiên X1 X2 Khi phơng sai tổng (hiệu) hai biến đợc xác định bởi: D[X1 X2] = M[(X1 ± X2) − M(X1 ± X2)]2 = M[(X1 − MX1)± (X2 − MX2)]2 = = M[(X1 − MX1)2] + M[(X2 − MX2)2] ± 2M[(X1 − MX1)(X2 − MX2)]= = D[X1] + D[X2] ± M[(X1 − MX1)(X2 − MX2)]= = à11 + à22 + 2à12 à12 mômen tơng quan X1 X2, à11 µ22 t−¬ng øng lµ ph−¬ng sai cđa X1 vµ X2 Nếu X1 X2 không tơng quan với thì: D[X1 ± X2] = D[X1] + D[X2], suy µ12 = 120 Do vËy, ng−êi ta dïng µ12 lµm thớc đo mức độ tơng quan X1 X2 Vì à12 đại lợng có thứ nguyên (bằng tích thứ nguyên X1 X2) nên để thuận tiện việc so sánh, phân tích thay cho à12 ngời ta dùng đại lợng vô thứ nguyên: 12 = à12 à11à 22 (5.2.1) đợc gọi hệ số tơng quan hai biến X1 X2 Ngời ta gọi 12 hệ số tơng quan tổng thể hay hệ số tơng quan lý thuyết số Hệ số tơng quan có tính chất sau đây: 1) Hệ số tơng quan nhận giá trị ®o¹n [−1;1]: −1 ≤ ρ12 ≤ ThËt vËy, ta cã: X2 X1 X1 X X X1 D − M ± − M = ± DX DX1 DX DX1 DX1 DX = X X X X X X 1 2 = D − M − M +D ±2M DX DX DX DX DX DX 1 1 2 = 1 µ12 DX1 + DX ± = 2(1 ± ρ12) ≥ µ12 = ± DX1 DX DX1DX µ11µ 22 Hay ± ρ12 ≥ ⇒ đpcm 2) Điều kiện cần đủ để 12 =1 lµ X1 vµ X2 cã quan hƯ hµm tun tÝnh Điều kiện đủ: Giả sử ta có quan hệ hàm tuyến tính X1 X2: X2 = a + bX1, với a, b hệ số số Khi đó: à12 = M[(X1MX1)(X2MX2)] = M[(X1MX1)(a + bX1abMX1)]= = M[b(X1 −MX1)2] = bµ11 µ22 = M[(X2−MX2)2]=M[(a + bX1−a−bMX1)2] = b2M[(X1−MX1)2] = b2µ11 VËy ρ12 = µ12 = µ11µ 22 bµ11 b 2µ11 = b 1 = b − b > b < §iỊu kiƯn cÇn: X X2 ± Tõ hƯ thøc D = 2(1 ± ρ12) ta cã: DX DX1 121 X X2 ± NÕu (1 ± ρ12) = th× = C = Const DX DX1 µ 22 X1 + C µ 22 , tøc lµ X2 X1 tồn quan hệ hàm à11 Tõ ®ã suy X2 = ± tuyÕn tÝnh Do tính chất nên hệ số tơng quan đợc xem đại lợng đặc trng cho mức độ tơng quan tuyến tính hai biến 5.2.2 Hệ số tơng quan mÉu Cho hai biÕn khÝ qun X1, X2 víi n cặp trị số quan sát: {xt1, xt2} = {(x11, x12), (x21, x22), , (xn1, xn2)} Khi mômen tơng quan mẫu ớc lợng mômen tơng quan tổng thể à12 X1 X2 đợc xác định bởi: R12 = n ∑ ( x − x1 )( x t − x ) = ( x1 − x1 )( x − x ) n t =1 t1 (5.2.2) hệ số tơng quan mẫu: r12 = n ∑ ( x t1 − x1 )( x t − x ) n t =1 n n ( x t1 − x1 ) ∑ ∑ (x t − x )2 n t =1 n t =1 = l12 l11l 22 (5.2.3) ®ã: n l12 = ∑ ( x t1 − x1 )(x t − x ) t =1 = nR12 tổng tích độ lệch X1 X2 so với trung bình chóng ∑ (x t1 − x1 ) n l11 = t =1 = n s12 tổng bình phơng độ lệch X1 so với trung bình nã ∑ (x t − x ) n l22 = t =1 = n s 22 − tông bình phơng độ lệch X2 so với trung b×nh cđa nã x1 = n n x t1 , x = ∑ x t trung bình X1 X2 n t =1 n t =1 HƯ sè t−¬ng quan mÉu r12 ớc lợng hệ số tơng quan tổng thể 12 Nếu 12 số trái lại r12 đại lợng ngẫu nhiên Năm 1915 122 R.A.Fisher [3,5,6] đ tìm biểu thức xác hàm mật độ xác suất hệ số tơng quan mẫu r12 trờng hợp phân bố đồng thời X1 vµ X2 lµ chuÈn: 2n −3 (1 − ρ ) fn(r)= πΓ(n − 2) n −4 ∞ n −1 (1 − r ) ∑ (Γ ( i =0 n + i − ( 2ρr )i )) , i! (5.2.4) víi −1 ≤ r đây, để tiện biểu diễn ta ®∙ thay ký hiÖu r12 b»ng ký hiÖu r B»ng phép biến đổi chuỗi luỹ thừa vế phải biểu thức fn(r) ngời ta đ thu đợc dạng khác mật độ xác suất r: fn(r) = n2 (1 − ρ ) π n −1 n −4 (1 − r ) x n −2 dx ∫ (1 − ρrx ) n −1 1− x2 (5.2.5) Ta thÊy r»ng ph©n bè cđa r phụ thuộc vào dung lợng mẫu n hệ sè t−¬ng quan tỉng thĨ ρ Khi n = fn(r) = 0, điều phù hợp với kiện hệ số tơng quan đợc tính từ tập mẫu có quan trắc phải Kỳ vọng cđa hƯ sè t−¬ng quan mÉu r: M[r] = ρ Ph−¬ng sai cđa hƯ sè t−¬ng quan mÉu r: D[r] = 4à 31 4à13 40 µ 04 2µ 22 4µ ) + 222 − − ( + + 4n µ 20 µ 02 µ 20µ 20 µ11 µ11µ 20 µ11µ 02 µ ij = M [(X1 − MX1 )i (X − MX ) j ] mômen trung tâm bậc i+j Để thuận tiện tính toán thực hành, việc ớc lợng khoảng cho , ngời ta thờng dùng phép biến đổi sau Fisher: z= 1+ ρ 1+ r log , ζ = log 1− r 1− ρ (5.2.6) Fisher ®∙ chøng minh đợc với giá trị n không lớn biến z phân bố xấp xỉ chuẩn với giá trị trung bình phơng sai đợc cho biểu thức gần sau: M[z] = + ρ , D[z] = n −3 2(n − 1) (5.2.7) Vì khoảng tin cậy với độ tin cËy 1−α lµ: (z− r − uα 2(n − 1) r ,z − + uα 2(n − 1) n −3 ) n −3 (5.2.8) ®ã uα nhận đợc từ phân bố chuẩn N(0,1) hệ thức: P( u ≥ u α ) = α Tõ ®ã ta nhận đợc khoảng tin cậy 123 Trong trờng hợp = biến t = r n−2 cã ph©n bè Student víi n−2 bËc 1− r2 tự Hệ số tơng quan mẫu r ớc lợng vững nhng chệch hệ số tơng (1 ) Do tính toán thực hành quan tổng thể với độ chệch 2n nhận đợc r = điều nghĩa Và ngợc lại, r0 không khác Nếu dung lợng mẫu nhỏ = nhng giá trị r lại có ý nghĩa Vì ta cần kiểm tra xem độ lín cđa r cã ý nghÜa thùc sù hay kh«ng, hay nói cách khác cần kiểm nghiệm độ rõ rệt r Để kiểm nghiệm, ta đặt giả thiết Ho: ρ = Thay ρ ≈ r, víi giíi h¹n tin cậy ban đầu d Ho ta có P( r d ) = Đặt t= r 1− r / n − , tα = d 1− r / n − (5.2.9) Khi Ho thì: P ( t t α ) = α BiÕn t (5.2.9) cã ph©n bè Student (t) víi n−2 bËc tù Từ ta xác định đợc t Và tiêu kiểm nghiệm là: Nếu t t bác bỏ Ho đa kết luật r lớn rõ rệt Nếu t < t chấp nhận Ho kÕt ln r kh«ng lín râ rƯt VÝ dơ 5.2.1 Từ tập mẫu {xt, yt, t=1 11} ta tính đợc hệ số tơng quan rxy=0.76 Hy cho biết với giá trị nhận đợc nh hệ số tơng quan cã lín râ rƯt kh«ng nÕu lÊy møc ý nghÜa =0.01? Để trả lời câu hỏi đặt ta cần kiĨm nghiƯm gi¶ thiÕt: Ho: rxy=0 Mn vËy, ta rxy 0.76 tính đại lợng t= = =3.51 Từ =0.01 ta xác định đợc r2 / n − 0.76 / 11 − tα tõ ph©n bè Student: tα=St(11−2,0.01) = 3.25 V× t =3.51> 3.25=tα ta bác bỏ giả thiết Ho đa kÕt ln rxy lín râ rƯt Ngoµi viƯc kiĨm tra ®é râ rƯt cđa hƯ sè t−¬ng quan, thùc tế ngời ta đánh giá có nghĩa Để xác định có nghĩa r trớc hết ta tính giá trị H= r n H(n, r) Tơng ứng với giá trị dung lợng mẫu n khác nhau, cho trớc độ tin cậy p, tra bảng ta tính đợc trị số tới hạn Ho H: Ho = H(p,n) Trong bảng 5.1 đ cho giá trị tới hạn H0 ứng với độ tin cậy p dung lợng mẫu n khác Từ tiêu kiểm nghiệm cã nghÜa cđa r sÏ lµ: 124 NÕu H(n,r) > Ho(p,n) kết luận r có nghĩa với độ tin cËy i NÕu H(n,r) ≤ Ho(p,n) th× kÕt luËn r nghĩa với độ tin cậy p Bảng 5.1 Giá trị tới hạn H0(p,n) p p n 0.90 0.95 0.99 0.999 n 0.95 0.99 0.999 10 1.65 1.90 2.29 2.62 25 1.941 2.475 3.026 11 1.65 1.90 2.32 2.68 26 1.941 2.479 3.037 12 1.65 1.92 2.35 2.73 27 1.492 2.483 3.047 13 1.65 1.92 2.37 2.77 28 1.943 2.487 3.056 14 1.65 1.92 2.39 2.81 29 1.493 2.490 3.064 15 1.65 1.92 2.40 2.85 30 1.944 2.492 3.071 16 1.65 1.93 2.41 2.87 35 1.947 2.505 3.102 17 1.65 1.93 2.42 2.90 40 1.949 2.514 3.126 18 1.65 1.93 2.43 2.92 45 1.950 2.521 3.145 19 1.65 1.93 2.44 2.94 50 1.951 2.527 3.161 20 1.65 1.94 2.45 2.96 60 1.953 2.535 3.830 21 1.65 1.94 2.45 2.98 70 1.954 2.541 3.190 22 1.65 1.94 2.46 2.99 80 1.955 2.546 3.209 23 1.65 1.94 2.47 3.00 90 1.956 2.550 3.219 24 1.65 1.94 2.47 3.02 100 1.956 2.553 3.226 ∞ 1.960 2.576 3.291 5.2.3 C¸ch tÝnh hƯ số tơng quan mẫu Cho hai biến ngẫu nhiên X1, X2 với n cặp trị số quan sát: {xt1, xt2} = {(x11, x12), (x21, x22), , (xn1, xn2)} Tõ tËp mẫu tính hệ số tơng quan X1, X2 theo phơng pháp sau 5.2.3.1 Phơng pháp tính trực tiếp Phơng pháp trực tiếp tính hệ số tơng quan mẫu tính theo công thức (5.2.3) Thế nhng, thực hành ngời ta thờng biến đổi đa dạng khác R12 = ( x1 − x1 )( x − x ) = x1x − x1x + x x1 − x1 x = x1x − x1 x = x1x − x1.x = n n n x t1x t − ∑ x t1 ∑ x t ∑ n t =1 n t =1 n t =1 (5.2.10) s12 = ( x1 − x1 ) = ( x1 ) − 2x1 x1 + ( x1 ) = ( x1 ) − ( x1 ) = n n ( x t1 ) − ( ∑ x t1 ) ∑ n t =1 n t =1 (5.2.11) 125 T−¬ng tù ta cã: s 22 = n n (x t )2 − ( ∑ x t )2 ∑ n t =1 n t =1 (5.2.12) R12 s1s (5.2.13) KÕt hỵp (5.2.10)−(5.2.12) ta nhận đợc: r12 = Hoặc tính theo c«ng thøc: n r12 = n n t =1 n t =1 ∑ x t1x t − n ∑ x t1 ∑ x t t =1 n n ∑ ( x t1 ) − n ( ∑ x t1 ) t =1 t =1 n ∑ (x t ) − n ( ∑ x t )2 t =1 t =1 (5.2.14) VÝ dơ 5.2.2 Trong b¶ng 5.2 dÉn sè liệu quan trắc tổng lợng ma tháng hai trạm mà ta đặt chúng hai biến X1, X2 kết bớc tính trung gian theo công thức (5.2.14) Cột thứ số thứ tự năm (t) Hai cét tiÕp theo cđa b¶ng chøa sè liƯu hai chuỗi {xt1} {xt2} Cột thứ t tích cặp (xt1,xt2), hai cột cuối chứa bình phơng giá trị xt1 xt2 Dòng cuối bảng tổng theo cột Bảng 5.2 Số liệu lợng ma tháng kết tính trung gian t xt1 xt2 xt1xt2 (xt1)2 (xt2)2 10.6 19.1 202.46 112.36 364.81 0.9 11.8 10.62 0.81 139.24 9.6 86.9 834.24 92.16 7551.61 2.0 16.4 32.80 4.00 268.96 38.3 12.4 474.92 1466.89 153.76 0.9 9.6 8.64 0.81 92.16 46.7 26.8 1251.56 2180.89 718.24 142.5 48.7 6939.75 20306.25 2371.69 68.2 28.9 1970.98 4651.24 835.21 10 54.1 87.4 4728.34 2926.81 7638.76 11 25.9 66.1 1711.99 670.81 4369.21 12 41.3 42.7 1763.51 1705.69 1823.29 13 11.8 37.7 444.86 139.24 1421.29 14 5.0 55.1 275.50 25.00 3036.01 15 30.0 104.1 3123.00 900.00 10836.81 16 21.8 33.9 739.02 475.24 1149.21 17 26.0 39.0 1014.00 676.00 1521.00 18 6.0 38.0 228.00 36.00 1444.00 19 15.0 116.0 1740.00 225.00 13456.00 Tổng 556.6 880.6 27494.19 36595.20 59191.26 126 Đối sánh với thành phần (5.2.14) ta có: n=19 n ∑ x t1x t = 27494.19 , t =1 n ∑ ( x t1 ) =36595.20, t =1 n ∑ ( x t ) =59191.26, t =1 n n x t1 ∑ x t =556.6*880.6/19=25796, ∑ n t =1 t =1 n ( ∑ x ) =16305.45 n t =1 t1 n ( ∑ x ) =40813.49 n t =1 t Sau thay vµo vµ tÝnh ta đợc r12=0.087894 5.2.3.2 Phơng pháp biến đổi tơng đơng Khi giá trị thành phần chuỗi lớn việc tính toán trực công thức (5.2.10)(5.2.14) thờng gặp trở ngại, phức tạp dễ gây sai số, trình tính toán đợc tiến hành thủ công Do đó, nhiều trờng hợp, để đơn giản ta sử dụng phép biến đổi sau đây: y t1 = d1x t1 − C1 (*) y t = d x t − C2 (**) d1, d2, C1, C2 số đó, mà trờng hợp cụ thể, đợc chọn cho thích hợp Chẳng hạn, xử lý chuỗi số liệu nhiệt độ ta thấy chúng thờng dao ®éng xung quanh trÞ sè 20 (0C), vËy cã thĨ chọn C=20; giá trị khí áp thờng lên xuống quanh giá trị 1000 (mb) chọn C=1000, Với phÐp biÕn ®ỉi (*), (**) ta cã: x t1 = x1 = Hay Suy l12 = ∑( T−¬ng tù ta đợc: Do đó: l11 = r12 = d1 , x t2 = y t2 + C2 d2 y1 + C1 y + C2 , x2 = d1 d2 y t1 + C1 y1 + C1 y t + C y + C )( − − ) d1 d1 d2 d2 d1d = y t1 + C1 ∑ ( y t1 − y1 )( y t − y ) ′ l11 d12 l12 l11l 22 , l22 = = ′ l12 d1d l′22 d 22 ′ l12 l′ d1d ′ = = 12 = r12 ′ ′ l l 11 22 l11l 22 d1d (5.2.15) Nh− vậy, qua phép biến đổi (*) (**) hệ số tơng quan không bị thay đổi 127 5.2.4 Ma trận tơng quan Trong thực tế ta thờng gặp toán mà đòi hỏi phải khảo sát mối quan hệ tơng quan biến khác tập nhiều hai biến Khi ta hệ số tơng quan mà ma trận tơng quan Xét tập hợp m biến ngẫu nhiên X1, X2, , Xm Hệ số tơng quan tổng thể biến Xj Xk đợc xác định hệ thức: jk = jk jjà kk , j,k=1 m (5.2.16) àjk mômen tơng quan Xj Xk, àjj phơng sai Xj Tập hợp hệ số tơng quan jk lập thành ma trận tơng quan: 11 1m (ρjk) = ρ m1 ρ mm (5.2.16’) Ma trận tơng quan ma trận đối xứng có phần tử đờng chéo Nếu Xtj, j=1 m, t=1 n lµ sè liƯu thùc nghiƯm biến Xj ớc lợng rjk jk đợc xác định bởi: rjk = x j = n ∑ ( x tj − x j )(x tk − x k ) n t =1 n ( x tj − x j ) ∑ n t =1 n ( x tk − x k ) ∑ n t =1 (5.2.17) n x tj trung bình biến Xj, j=1 m n t =1 Tập hợp hệ số tơng quan rjk lập thành ma trận đối xứng: r11 r1m (rjk) = r m1 rmm (5.2.17) 5.2.5 Khảo sát mối quan hệ tơng quan hai biến Việc đánh giá mối quan hệ tơng quan hai biến đợc tiến hành thông qua việc xem xét hệ số tơng quan chúng tính đợc từ tập mẫu Giá trị tuyệt đối hệ số tơng quan lớn mối quan hệ tuyến tính hai biến chặt chẽ Hệ số tơng quan dơng phản ánh mối quan hệ chiều (đồng biến), ngợc lại, hệ số tơng quan âm biểu thị mối quan hệ ngợc (nghịch biến) 128 Có thể hình dung H(f) nh biên độ dao động điều hoà ứng với tần số dài f Giữa tần số góc tần số dài liên hệ với hƯ thøc ω=2πf HƯ thøc (7.7.1') biĨu diƠn sù ph©n bố lợng trình phân bố theo tần số Sự phân bố phản ánh cấu trúc bên trình Vấn đề chỗ ta cần xác định đợc "có lợng trình chứa khoảng tần số từ f đến f+df" Trong thùc tÕ ng−êi ta th−êng chØ xÐt miÒn biÕn đổi tần số f giá trị dơng, mặt khác giá trị H(f) miền tần số âm tần số dơng thờng không khác nhau, nên thay cho H(f), ng−êi ta sư dơng hµm: 2 S(f) = H(f ) + H (−f ) , 0≤ f < đợc gọi phổ lợng trình Nếu thể x(t) đợc cho n ®iĨm ti, i=1 n: xi=x(ti) víi ti=i∆τ, ®ã t¹i k điểm tần số rời rạc fk= , k=0,1,2, biĨu thøc (7.7.1'') sÏ cã d¹ng: n∆τ ∞ H(fk) = ∫ x ( t )e πif k t n dt ≈ ∑ x t e πif k t∆τ t =1 −∞ n ∆τ = ∆τ ∑ x t e πi k.t n (7.7.2) t =1 NÕu =1 (đơn vị thời gian), từ (7.7.2) ta có công thức biến đổi ngợc Fourier rời rạc để nhận giá trị chuỗi ban đầu: i n x t = ∑ H (f k )e n k =1 k.t n (7.7.3) Và định lý Parseval đợc viết lại dới dạng: n xt = t =1 n H (f k ) ∑ n k =1 (7.7.4) NÕu X(t) dõng cã kú väng chia vế trái (7.7.4) cho n ta nhận đợc ớc lợng phơng sai trình Nh hiểu phổ phơng sai nh hàm biểu thị phân bố lợng trung bình trình theo tần số, phổ lợng xét phân bố tổng lợng trình Trên sở biểu thức (7.7.4) ta sử dụng phơng pháp FFT để tính mật độ phổ trình Tuy nhiên, phơng ph¸p FFT cho phÐp tÝnh to¸n nhanh, nã vÉn chøa đựng hạn chế định Sau ta xét phơng pháp khác phơng pháp entropy cực đại (MEM Maximum Entropy Method) Ký hiệu tần số Nyquist lµ fc, ta cã: fc = k vµ fk = 2fc , k=0,1,2, ,n/2 n 2∆τ (7.7.5) 217 Các tần số fk nhận giá trị đoạn [−fc; fc] NÕu ta thùc hiƯn phÐp biÕn ®ỉi: z = e πif∆τ (7.7.6) ®ã cã thĨ biĨu diễn phổ lợng dới dạng: n / ∑ S(f) = xkz k (7.7.7) k = −n / Nếu x(t) xác định toàn miền vô hạn biểu thức (7.7.7) có dạng: S(f) = ∑ x k zk (7.7.8) k = −∞ Có thể biểu diễn hệ thức (7.7.7) dới dạng gần ®óng sau: S(f) ≈ m/2 ∑ ao = bk zk m ∑ akz 1+ (7.7.9) k k = −1 k =−m / Ng−êi ta gäi phÐp xấp xỉ (7.7.9) phơng pháp entropy cực đại (MEM) hay mô hình tất cực (allpoles model) mô hình tự hồi qui (autoregressive model AR) Kết hợp (7.7.7) (7.7.9) ta nhận đợc: n / −1 S(f) = ∑ xkz k ao ≈ k = −n / m 1+ (7.7.10) ∑ a k zk k = Điều có nghĩa để xác định mật độ phổ S(f) cần phải tính ®−ỵc m+1 hƯ sè ao, a1, ,am Ng−êi ta ®∙ chứng minh đợc rằng, để nhận đợc hệ số ak (k=0 m) cần phải giải phơng trình sau: ao 1+ m ≈ ∑ a k zk m ∑ R jz j (7.7.11) j= − m k = −1 Rj đợc xác định bởi: Rj vµ n− j ∑ x t x t + j , j = 0,1,2, ,n−1 n − j t =1 Rj = R j (7.7.12) (7.7.12') Số m đợc gäi lµ bËc xÊp xØ hay sè cùc xÊp xØ Về nguyên tắc m nhận số nguyên dơng n1 tổng số mômen tự tơng quan Rj có 218 thể có Thậm chí m nhận giá trị lớn dung lợng mẫu n, nhng trờng hợp cần phải ngoại suy hàm tự tơng quan Trên thực tế th−êng ng−êi ta chän m nhá h¬n n nhiỊu Cã nhiều thủ thuật để giải phơng trình (7.7.11) mà phơng pháp đa phơng trình d¹ng ma trËn: R2 R1 R1 R2 R m +1 R m R m +1 a R m a1 = R1 a m (7.7.13) Sau tÝnh đợc hệ số ak, k=0 m, ứng với giá trị tần số cho trớc fk, thay vào (7.7.10) ta xác đinh đợc mật độ phổ Chú ý giá trị tần số phải thoả mn điều kiÖn: − 1 ≤ f k ∆τ ≤ 2 (7.7.14) 7.8 Phơng pháp chuẩn sai tích luỹ phân tích xu Chuẩn sai hiệu thành phần chuỗi giá trị trung bình dt=xt x Do đó, từ chuỗi ban đầu ta thành lập đợc chuỗi chuẩn sai {dt, t=1 n} Dấu chuẩn sai cho biết trị số chuỗi tăng hay giảm, giá trị chuẩn sai đánh giá mức độ tăng hay giảm thành phần chuỗi so với trung bình Chuẩn sai tích luỹ Dt tổng chuẩn sai dt, đợc xác định bởi: t Dt = ∑ di i =1 Nh− vËy, D1 = d1, D2 = d1+d2, , Dn = d1+ d2+ + dn = 0, tức từ chuỗi {dt, t=1 n} ta thành lập đợc chuỗi {Dt, t=1 n} Ta thấy giá trị Dt phụ thuộc vào trạng thái dao động xu chuỗi Nếu chuỗi có xu tăng tuý giá trị trung bình chuỗi nằm vị trí khoảng chuỗi, thành phần đầu chuỗi chuẩn sai dt mang dấu âm thành phần cuối chuỗi mang dấu dơng Các giá trị chuẩn sai tích luỹ Dt âm t tăng khoảng chuỗi, sau giảm dần giá trị tuyệt đối (nhng mang dấu âm) Tình ngợc lại xảy chuỗi có xu giảm tuý Các hình 7.14a 7.14b đ dẫn ví dụ mô minh hoạ cho trờng hợp này, xu tăng, giảm đợc cho theo qui luật gần tuyến tính Nếu chuỗi có xu tăng giảm giảm tăng, tức theo biến trình thời gian chuỗi có cực đại cực tiểu, trị số trung bình chuỗi nằm 219 hai ví trí khoảng đoạn đầu khoảng đoạn cuối chuỗi Các chuẩn sai dt bắt đầu giá trị âm (nếu chuỗi tăng giảm) dơng (nếu chuỗi giảm tăng), khoảng đoạn đầu mang dấu ngợc lại giữ nguyên dấu đến khoảng đoạn cuối lại đổi dấu hết chuỗi Minh hoạ cho trờng hợp đợc dẫn hình 7.15a 7.15b Dt t Dt t Hình 7.14a Xu tăng tuý Hình 7.14b Xu giảm tuý Dt Dt t t Hình 7.15a Xu tăng giảm Hình 7.15b Xu giảm tăng Trên hình 7.16a 7.16b dẫn đồ thị biểu diễn biến đổi Dt theo t ứng với tình chuỗi có xu tăng giảm sau tăng giảm tăng sau giảm Từ hình 7.147.16 có thĨ nhËn thÊy mét tÝnh chÊt chung cđa chn sai tích luỹ Dt là, nhìn chung với Dt âm chuỗi có xu tăng với Dt dơng chuỗi có xu giảm Dt Dt t t Hình 7.16a Xu tăng giảm sau lại tăng 220 Hình 7.16b Xu giảm tăng sau lại giảm Trờng hợp thành phần chuỗi dao động ngẫu nhiên xung quanh giá trị trung bình, chuẩn sai dt có dấu âm dơng đan xen nhau, giá trị tuyệt đối chúng không khác nhiều, nói chuỗi xu Đồ thị chuẩn sai tích luỹ Dt theo t dao động ngẫu nhiên xung quanh trị số có rõ ràng qui luật biến đổi Ví dụ 7.8 Bảng 7.4 dẫn trích đoạn chuỗi số liệu tổng lợng ma năm trạm kết tính chuẩn sai dt chuẩn sai tích luỹ Dt chuỗi Trị số trung bình toàn chuỗi 1899.2 (mm) Kết tính toán đợc biểu diễn hình 7.17 Từ hình ta thấy biến đổi chuỗi lơng ma năm đợc chia làm hai giai đoạn Giai đoạn từ đầu kỷ đến khoảng năm đầu thập kỷ bốn mơi lợng ma có xu tăng dần theo thời gian Giai đoạn từ đầu thập kỷ bốn mơi đến cuối năm tám mơi lợng ma có xu giảm dần Tuy vậy, nhấp nhô đồ thị đ phản ánh xu biến thiên chuỗi đan xen thời kỳ có tổng lợng ma vợt chuẩn dới chuẩn Hay nói cách khác, tồn chuỗi luân phiên thời đoạn có dấu chuẩn sai dơng âm Bảng 7.4 Chuẩn sai chuẩn sai tích luỹ tổng lợng ma năm (mm) Năm Tổng lợng ma năm Chuẩn sai dt Chuẩn sai tích luỹ Dt 1907 1906.2 7.0 7.0 1908 1837.4 −61.8 −54.7 1909 1644.0 −255.2 −309.9 1910 3029.6 1130.4 820.6 1911 1233.8 −665.4 155.2 1912 1239.9 −659.3 −504.0 1985 2346.4 447.2 166.5 1986 1669.9 −229.3 −62.8 1987 1838.8 60.4 123.1 1988 2022.3 123.1 0.0 7.9 Phơng pháp hồi qui phân tích xu Một phơng pháp phân tích xu thờng đợc xét đến việc nghiên cứu dao động khí hậu phơng pháp hồi qui Phơng pháp hồi qui đợc đề cập hồi qui biến khí hậu x thời gian t, tức biến đổi x theo t: x = f(t) NÕu f(t) lµ mét hµm tuyÕn tÝnh ta cã xu thÕ biÕn ®ỉi tun tÝnh Trong trờng hợp khác ta gọi xu thÕ kh«ng tuyÕn tÝnh 221 Dt t (năm) -2 -4 -6 -8 -10 -12 -14 1905 1915 1925 1935 1945 1955 1965 1975 1985 H×nh 7.17 Đờng chuẩn sai tích luỹ tổng lợng ma năm Để nghiên cứu xu biến đổi tuyến tính ta thành lập phơng trình hồi qui: x(t) = at + b (*) a b hệ số hồi qui đợc xác định bởi: n ( x t − x )(t − t ) a= t =1 n ∑ (x t − x ) ∑ (t − t ) t =1 n , b = x − at t =1 x= n ∑ xt , n t =1 t= n ∑t n t =1 Từ phơng trình (*) ta nhận biết đợc xu biến đổi chuỗi thông qua phân tÝch hƯ sè gãc a DÊu cđa hƯ sè a xác định xu tăng (khi a>0) giảm (khi a