Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 82 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
82
Dung lượng
1,2 MB
Nội dung
PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Phạm Văn Huấn Từ khóa: Đại lượng ngẫu nhiên, luật phân bố, phân bố thống kê, trơn phân bố, tiêu chuẩn phù hợp, ước lượng tham số, xác suất tin cậy, khoảng tin cây, hệ đại lượng ngẫu nhiên, trình ngẫu nhiên, tương quan, phương pháp bình phương nhỏ nhất, khai triển phổ, phân tích điều hòa, trơn, chu trình tuần hồn, trung bình trượt, phân tích thống kê quan trắc khí tượng, hải dương học Tài liệu Thư viện điện tử Trường Đại học Khoa học Tự nhiên sử dụng cho mục đích học tập nghiên cứu cá nhân Nghiêm cấm hình thức chép, in ấn phục vụ mục đích khác khơng chấp thuận nhà xuất tác giả ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Lời nói đầu Giáo trình Phương pháp thống kê hải dương học phục vụ cho môn học tên với thời lượng hai tín chương trình đào tạo cử nhân ngành Hải dương học Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Phạm Văn Huấn PHƯƠNG PHÁP THỐNG KÊ TRONG HẢI DƯƠNG HỌC Nhà xuất Đại học Quốc gia Hà Nội - 2010 Cuốn sách chọn giới thiệu cách tóm tắt khái niệm, phương pháp lý thuyết thống kê toán học hay sử dụng phân tích số liệu quan trắc hải dương học xếp thành năm chương theo nhóm vấn đề Đầu chương thường ôn lại khái niệm cơng thức từ tốn học thống kê, sau giới thiệu ứng dụng thơng qua thí dụ để rèn luyện thói quen hiểu ý nghĩa thực tế khái niệm kỹ thực hành tính tốn cụ thể sinh viên Cuối chương có phụ lục gồm đoạn mã chương trình máy tính nhằm mục đích Những thí dụ ứng dụng phương pháp thống kê hải dương học chưa bao quát hết vấn đề hải dương học thống kê, giới thiệu mức độ giúp cho sinh viên bước đầu biết áp dụng khái niệm phương pháp, tính tốn theo cơng thức liên quan, chưa dành ý nhiều đến cách đặt vấn đề, lý giải kết phân tích ý nghĩa thực tế toán Nội dung sách chưa bao gồm kết nghiên cứu biển đại dương theo hướng thống kê hải dương học giới Việt Nam Sinh viên ngành hải dương học thấy khía cạnh môn học sở khác ngành hải dương học khu vực, thông tin dự báo khí tượng thủy văn biển, thủy triều, sóng báo khoa học, sách chuyên khảo biển Tác giả MỤC LỤC Chương – Khái niệm đại lượng ngẫu nhiên 1.1 Những đại lượng ngẫu nhiên luật phân bố 1.2 Luật phân bố chuẩn 1.3 Quantil phân bố 1.4 Một số luật phân bố khác 1.4.1 Phân bố chuẩn loga 1.4.2 Phân bố tập mẫu giá trị cực trị (phân bố Gumbel) Phụ lục chương Chương – Những khái niệm lý thuyết xử lý sô liệu quan trắc 2.1 Hàm phân bố thống kê 2.2 Sự phù hợp phân bố lý thuyết phân bố thống kê 2.2.1 Tiêu chuẩn χ 2.2.2 Sơ đồ ứng dụng tiêu chuẩn χ để đánh giá phù hợp 2.2.3 Tiêu chuẩn phù hợp Kolmogorov 2.3 Khái niệm ước lượng tham số phân bố 2.4 Ước lượng kỳ vọng toán học phương sai 2.5 Khoảng tin cậy xác suất tin cậy 2.5.1 Khoảng tin cậy kỳ vọng toán học 2.5.2 Khoảng tin cậy phương sai 2.5.3 Các phương pháp xác dựng khoảng tin cậy cho tham số đại lượng ngẫu nhiên phân bố chuẩn 2.6 Ước lượng xác suất theo tần suất Phụ lục chương Chương – Khái niệm hệ đại lượng ngẫu nhiên ứng dụng 3.1 Hệ đại lượng ngẫu nhiên 3.2 Các đặc trưng số hệ hai đại lượng ngẫu nhiên Mômen tương quan Hệ số tương quan 3.3 Phép trơn mối phụ thuộc thực nghiệm phương 5 14 19 20 20 25 28 34 34 37 38 43 45 47 47 48 51 54 58 pháp bình phương nhỏ Phụ lục chương Chương – Những khái niệm lý thuyết hàm ngâu nhiên ứng dụng 4.1 Các đặc trưng hàm ngẫu nhiên 4.2 Khái niệm hàm ngẫu nhiên dừng 4.3 Tính chất egođic hàm ngẫu nhiên dừng 4.5 Khai triển phổ hàm ngẫu nhiên dừng khoảng thời gian hữu hạn Phụ lục chương Chương - Ứng dụng lý thuyết hàm ngẫu nhiên vào phân tích số liệu hải dương học 5.1 Phân tích chuỗi thời gian hải dương học 5.1.1 Phân tích chu trình tuần hồn 5.1.2 Xác định chu trình tuần hồn phương pháp phân tích điều hòa 5.2 Phổ phương sai chuỗi thời gian 5.3 Loại bỏ chu trình tuần hồn khỏi chuỗi thời gian 5.3.1 Loại bỏ chu trình tuần hồn phân tích điều hòa 5.3.2 Loại bỏ biến trình năm từ chuỗi quan trắc năm 5.3.3 Loại bỏ chu trình tuần hồn phân tích chu trình khơng tuần hồn thực tế xử lý số liệu 5.4 Hàm tương quan hàm phổ chuỗi thời gian yếu tố hải dương học Phụ lục chương Tài liệu tham khảo 67 76 82 82 85 90 105 109 109 111 112 115 128 132 132 134 136 143 145 145 148 149 153 157 161 Chương Hàm phân bố đặc trưng vạn đại lượng ngẫu nhiên Nó tồn cho đại lượng ngẫu nhiên rời rạc lẫn liên tục Hàm phân bố có tính chất hàm không giảm, tức F ( x ) ≥ F ( x1 ) x > x1 , KHÁI NIỆM VỀ ĐẠI LƯỢNG NGẪU NHIÊN không âm vô (F ( −∞) = ) dương vô 1.1 Những đại lượng ngẫu nhiên luật phân bố (F (+∞) = 1) Đại lượng ngẫu nhiên đại lượng mà thử nghiệm nhận giá trị khơng biết trước cụ thể Những giá trị có đại lượng ngẫu nhiên rời rạc kể từ trước Những giá trị có đại lượng ngẫu nhiên liên tục khơng thể kể trước chúng phân bố liên tục khoảng Đối với đại lượng ngẫu nhiên rời rạc X , ta biết xác suất P giá trị có x1 , x , , x n , tức biết P ( X = x1 ) = p1 ; P ( X = x ) = p ; ; P ( X = xn ) = pn ; Φ ( x) = P ( X ≥ x) = − F ( x) (1.2) cho biết xác suất vượt giá trị x Hàm phân bố đại lượng ngẫu nhiên rời rạc luôn hàm bậc thang gián đoạn Trong thực tế thông thường hàm phân bố đại lượng ngẫu nhiên liên tục hàm liên tục Khi giải tốn thực tế nhiều đòi hỏi tính xác suất kiện đại lượng ngẫu nhiên rơi vào khoảng giá trị từ x đến x + Δx : ⎛ n ⎞ ⎜ ∑ pi = 1⎟ ⎝ i =1 ⎠ P ( x < X < x + Δx) = F ( x + Δx) − F ( x) ta nói đại lượng ngẫu nhiên hoàn toàn xác định phương diện xác suất Mối liên hệ giá trị có đại lượng ngẫu nhiên xác suất tương ứng chúng gọi luật phân bố đại lượng ngẫu nhiên Luật phân bố cho bảng phân bố đa giác phân bố Đối với đại lượng ngẫu nhiên liên tục, kể hết tất giá trị có, giá trị riêng biệt đại lượng ngẫu nhiên liên tục thường có xác suất khơng, nên người ta cho phân bố hàm phân bố F (x) : F ( x) = P ( X < x ) Trong thực tế, nhiều cần xác định xác suất P ( X ≥ x) , thay hàm phân bố F(x) người ta sử dụng hàm độ đảm bảo Φ (x) : (1.1) Người ta gọi F (x) hàm phân bố tích phân hay luật phân bố tích phân xác suất trung bình đơn vị độ dài khoảng giá trị F ( x + Δx) − F ( x) Δx Nếu Δx → lim Δx→0 F ( x + Δx) − F ( x) = F ′( x) = f ( x) Δx (1.3) Hàm f (x) (đạo hàm hàm phân bố) đặc trưng cho mật độ mà giá trị đại lượng ngẫu nhiên phân bố điểm cho Hàm gọi mật độ phân bố (hay “mật độ xác suất”) đại lượng ngẫu nhiên Đôi người ta gọi hàm f (x) hàm phân bố vi phân n luật phân bố vi phân đại lượng ngẫu nhiên liên tục X x p + x p + + x n p n m x = M[ X ] = 1 = p1 + p + + p n Xác suất giá trị đại lượng ngẫu nhiên X rơi vào khoảng từ α đến β β P (α < X < β ) = ∫ f ( x)dx (1.4) α Có thể biểu thị hàm mật độ phân bố qua hàm phân bố cơng thức (1.3) Ngược lại, biểu thị hàm phân bố qua hàm mật độ ∑x p i =1 n i ∑p i =1 i n = ∑ xi p i (1.6) i =1 i Như vậy, kỳ vọng toán học đại lượng ngẫu nhiên tổng tích tất giá trị có đại lượng ngẫu nhiên với xác suất giá trị (1.5) Kỳ vọng toán học có liên quan với trung bình số học Giả sử thực N thí nghiệm độc lập, lần thí nghiệm đại lượng X nhận giá trị xác định: giả sử giá trị x1 xuất m1 lần, giá trị x2 Mật độ phân bố hàm không âm ( f ( x) ≥ 0) , tích phân hàm xuất m2 lần, nói chung, giá trị xi xuất mi lần Cơng thức tính x F ( x) = ∫ f ( x)dx −∞ ∞ mật độ với giới hạn vô ( ∫ f ( x) dx = ) Như vậy, trung bình số học giá trị quan trắc đại lượng X M ∗[ X ] = −∞ đường cong phân bố luôn nằm trục hồnh, diện tích đầy đủ giới hạn đường cong phân bố trục hoành Thứ nguyên hàm phân bố F ( x) giống xác suất khơng có thứ ngun, thứ ngun mật độ phân bố f (x) nghịch đảo với thứ nguyên đại lượng ngẫu nhiên Trong nhiều vấn đề thực tế, không thiết phải đặc trưng đại lượng ngẫu nhiên cách đầy đủ hàm phân bố F (x) mà cần tham số số riêng biệt mức độ đặc trưng cho nét chủ yếu đại lượng ngẫu nhiên Đó đặc trưng số đại lượng ngẫu nhiên: 1) Kỳ vọng tốn học (giá trị trung bình) đại lượng ngẫu nhiên: = x1 n n m m m1 m + x 2 + + x n n = ∑ xi i = ∑ xi p i* N N N N i =1 i =1 pi∗ = (1.7) mi tần suất (hay xác suất thống kê) N Như vậy, trung bình số học giá trị quan trắc đại lượng ngẫu nhiên tổng tích tất giá trị có đại lượng ngẫu nhiên với tần suất giá trị Đối với đại lượng ngẫu nhiên liên tục X kỳ vọng tốn học tính theo cơng thức m x = M[ X ] = Nếu đại lượng ngẫu nhiên rời rạc X có giá trị có x1 , x , , x n với xác suất p1 , p , , p n kỳ vọng toán học đại ∞ ∫ x f ( x) dx (1.8) −∞ 2) Mốt đại lượng ngẫu nhiên giá trị hay xảy lượng ngẫu nhiên x1 m1 + x m + + x n m n x1 m1 + x m + + x n m n = m1 + m + + m n N Cụm từ “hay xảy nhất” hồn tồn xác đại lượng ngẫu nhiên rời rạc, đại lượng ngẫu nhiên liên tục mốt giá trị mà mật độ xác suất cực đại Người ta ký hiệu mốt chữ M Trên hình 1.1 biểu diễn mốt đại lượng ngẫu nhiên rời rạc liên tục n α s [X ] = ∑ xis p i Đối với đại lượng ngẫu nhiên liên tục X , mômen gốc bậc s tích phân ∞ α s [X ] = pi (1.9) i =1 ∫x s f ( x) dx (1.10) −∞ f(x) Từ công thức (1.9) (1.10) thấy kỳ vọng tốn học mơmen gốc bậc M x Các công thức (1.9) (1.10) thống thành cơng thức chung cho đại lượng ngẫu nhiên rời rạc lẫn liên tục x α s [X ] = M [X s ] M Hình 1.1 Biểu diễn mốt đại lương ngẫu nhiên rời rạc liên tục Trong trường hợp tổng quát mốt kỳ vọng tốn học đại lượng ngẫu nhiên khơng trùng Khi phân bố đối xứng có mốt (tức có mốt) tồn kỳ vọng tốn học kỳ vọng tốn học trùng với mốt tâm đối xứng phân bố 3) Trung vị đại lượng ngẫu nhiên (thường dùng cho đại lượng liên tục) giá trị Me cho (1.11) Như vậy, mômen gốc bậc s đại lượng ngẫu nhiên X kỳ vọng toán học mũ bậc s đại lượng ngẫu nhiên 5) Đại lượng ngẫu nhiên o X nhận công thức o X = X − mx (1.12) P ( X < Me) = P( X > Me) gọi đại lượng ngẫu nhiên quy tâm tương ứng đại lượng X Dễ dàng thấy kỳ vọng toán học đại lượng ngẫu nhiên quy tâm không Trên đồ thị phân bố, trung vị hoành độ điểm mà diện tích giới hạn đường cong phân bố bị chia làm đôi Trong trường hợp phân bố đối xứng có mốt trung vị trùng với kỳ vọng tốn học mốt Các mơmen đại lượng ngẫu nhiên quy tâm gọi mômen tâm Mômen tâm bậc s đại lượng ngẫu nhiên X kỳ vọng toán học luỹ thừa bậc s đại lượng ngẫu nhiên quy tâm tương ứng 4) Các mômen: o s μ s [ X ] = M[ X ] = M[( X − m x ) s ] Mômen gốc bậc s đại lượng ngẫu nhiên rời rạc X tổng dạng Đối với đại lượng ngẫu nhiên rời rạc: 10 (1.13) n μ s = ∑ ( x i − m x )s p i , (1.14) i =1 đại lượng ngẫu nhiên liên tục: μs = ∞ ∫ (x − m ) s x f ( x) dx (1.15) −∞ Rõ ràng đại lượng ngẫu nhiên mômen tâm bậc không Tồn công thức liên hệ mômen tâm gốc sau: μ1 = 0, ⎫ ⎪ μ = α − m x2 , ⎪ ⎬ μ = α − 3m xα + 2m x ,⎪ ⎪⎭ Phương sai đại lượng ngẫu nhiên đặc trưng phân tán, tản mạn giá trị đại lượng ngẫu nhiên xung quanh kỳ vọng toán học 7) Phương sai có thứ ngun bình phương đại lượng ngẫu nhiên Để đặc trưng rõ độ tản mạn người ta dùng đại lượng có thứ nguyên trùng với thứ nguyên đại lượng ngẫu nhiên gọi độ lệch bình phương trung bình σ [ X ] (hay ký hiệu σ x ): σ [ X ] = D[ X ] (1.20) Phương sai độ lệch bình phương trung bình tính theo mơmen gốc bậc hai α kỳ vọng tốn học cơng thức: D x = α − m x2 , ⎫⎪ ⎬ σ x = D x = α − m x2 ⎪⎭ (1.16) (1.21) 8) Mômen tâm bậc ba μ dùng để đặc trưng tính bất đối xứng 6) Mômen tâm bậc hai đặc trưng đặc biệt quan trọng số mômen khác, ký hiệu D [ X ] (hoặc Dx ) thường gọi phân bố Nếu phân bố đối xứng kỳ vọng tốn học μ (và tất phương sai: mômen bậc lẻ) không (xét theo cấu trúc công thức (1.14) (1.15)) o D[ X ] = μ = M[ X ] (1.17) Như vậy, phương sai đại lượng ngẫu nhiên X kỳ vọng tốn học bình phương đại lượng ngẫu nhiên quy tâm tương ứng Các cơng thức để tính trực tiếp phương sai đại lượng ngẫu nhiên rời rạc liên tục là: n D [ X ] = ∑ ( xi − m x ) p i , (1.18) i =1 ∞ D[ X ] = ∫ (x − m ) x f ( x) dx (1.19) Mơmen tâm bậc ba có thứ ngun lập phương đại lượng ngẫu nhiên Người ta dùng đại lượng Sk = (1.22) khơng có thứ ngun để đặc trưng cho tính bất đối xứng phân bố, gọi hệ số bất đối xứng Khi S k > ta có phân bố bất đối xứng dương (đường cong 1), S k < − bất đối xứng âm (đường cong 2) hình 1.2 −∞ 11 μ3 σ3 12 f (x) Ex < Ex = Ex > x Hình 1.2 Các đường cong phân bố bất đối xứng 9) Mômen tâm bậc bốn dùng để đặc trưng “độ dốc”, tức mức độ đỉnh nhọn hay đỉnh dẹt phân bố Người ta dùng đại lượng gọi độ nhọn E x đại lượng ngẫu nhiên liên quan với mơmen bậc bốn Hình 1.3 Các đường cong phân bố có độ nhọn khác 10) Nhiều người ta sử dụng mômen tuyệt đối (gốc tâm) mà số thường dùng mômen tâm tuyệt đối bậc một: sau: Ex = μ4 −3 σ4 ⎡ nhiên tỷ số ⎣ (1.223) Đối với luật phân bố chuẩn quan trọng thường gặp tự μ4 = , nên độ nhọn E x = Những phân bố có đỉnh σ4 nhọn so với phân bố chuẩn E x > , phân bố có đỉnh dẹt so với phân bố chuẩn có E x < (xem hình 1.3) 13 ⎤ γ = M ⎢ X ⎥ = M [ X − mx ], o ⎦ (1.24) gọi độ lệch trung bình số học, đặc trưng cho độ tản mạn 1.2 Luật phân bố chuẩn Trong lý thuyết xác suất người ta đặc biệt quan tâm tới kiểu luật phân bố gọi luật phân bố chuẩn (hay phân bố Gauss) Đây kiểu phân bố thường gặp thực tế Người ta chứng minh tổng số lượng đủ lớn đại lượng ngẫu nhiên độc lập (hoặc phụ thuộc ít) tuân theo quy luật phân bố xấp xỉ tuân theo quy luật chuẩn điều thể xác lấy tổng nhiều đại lượng ngẫu nhiên Điều hạn chế chủ yếu đại lượng ngẫu nhiên cộng lại phải có vai trò tương đối nhỏ tổng chung 14 Quy luật phân bố chuẩn đặc trưng mật độ xác suất dạng: f ( x) = σ 2π e − ( x −m ) 2σ , (1.25) m − kỳ vọng tốn học đại lượng ngẫu nhiên X , σ − độ lệch bình phương trung bình theo cơng thức truy hồi μ s = ( s − 1)σ μ s − ; S k = 0; E x = Để tính xác suất mà đại lượng ngẫu nhiên X tuân theo quy luật chuẩn với tham số m σ rơi vào khoảng giá trị từ α tới β phải dùng công thức tổng quát P (α < X < β ) = F ( β ) − F (α ) , (1.26) F ( x) − hàm phân bố đại lượng ngẫu nhiên X tính theo cơng thức (1.5): x F ( x) = ∫ f ( x) dx = σ σ Đường cong phân bố theo luật chuẩn có dạng hình đồi đối xứng σ 2π ứng với e − t hay e 2σ dx −∞ x−m σ ∫e 2π − t2 dt (1.27) −∞ − t2 (tích phân xác suất) lập thành bảng Thí dụ, ta dùng hàm φ ∗ ( x) = 2π x ∫ e − t2 dt , (1.28) −∞ ta tính ⎛ x−m⎞ F ( x) = φ ∗ ⎜ ⎟ ⎝ σ ⎠ Tính tốn đặc trưng số phân bố chuẩn cho kết sau: μ = 1; μ1 = (và tất mômen bậc lẻ khơng); Do μ = σ ; μ = 3σ ; μ = 15σ ; nói chung mơmen bậc s tính 15 ( x−m) Tích phân (1.27) khơng biểu thị hàm bản, tính qua hàm đặc biệt biểu thị tích phân xác định biểu thức hoành độ x = m Xa dần m mật độ phân bố giảm x → ± ∞ đường cong tiệm cận dần tới trục hoành Điểm m tâm đối xứng phân bố, gọi tâm tản mạn; tham số σ đặc trưng tản mạn Khi σ tăng tung độ cực đại giảm đường cong phân bố trở nên phẳng hơn, duỗi dài theo trục hoành, ngược lại, σ giảm đường cong phân bố nhô cao lên trên, đồng thời co hẹp hai bên lại − = t dẫn tích phân tới dạng F ( x) = Hình 1.4 Đồ thị hàm mật độ phân bố chuẩn (hình 1.4) Tung độ cực đại đường cong x−m ∫e 2π −∞ Nếu thay biến x 16 (1.29) ⎛β −m⎞ ∗⎛α − m ⎞ P (α < X < β ) = φ ∗ ⎜ ⎟ ⎟ −φ ⎜ ⎝ σ ⎠ ⎝ σ ⎠ (1.30) Như vậy, biểu thị xác suất đại lượng ngẫu nhiên X phân bố theo luật chuẩn với tham số rơi vào khoảng giá trị cho trước từ α đến β qua hàm phân bố quy chuẩn φ * ( x) ứng với luật suy ⎛E⎞ 2φ ∗ ⎜ ⎟ − = 0,5 , ⎝σ ⎠ φ ∗ ⎛⎜ E ⎞⎟ = 0,75 phân bố chuẩn đơn giản có tham số m = σ = Hàm φ * ( x) bảng hóa giá trị có sách giáo ⎝σ ⎠ khoa lý thuyết xác suất toán thống kê bất kỳ, tài liệu chuyên khảo cẩm nang toán học Bảng 1.1 dạng thuộc loại bảng f (x) Độ lệch xác suất Trong nhiều ứng dụng lý thuyết xác suất người ta thường dùng đặc trưng tản mạn gọi độ lệch xác suất, ký hiệu E Độ lệch xác suất đại lượng ngẫu nhiên X phân bố theo luật chuẩn nửa độ dài đoạn đối xứng qua tâm tản mạn mà xác suất rơi vào 0,5 (xem hình 1.5) Có thể viết m−E m m+E x Hình 1.5 Biểu diễn độ lệch xác suất P ( X − m < E ) = 0,5 Theo bảng giá trị hàm φ ∗ ta tìm ngược lại E hay σ P (m − E < X < m + E ) = 0,5 Dùng cơng thức (1.30) ta có: = 0,674 → E = 0,674σ (1.31) Ý nghĩa E với số lượng lớn thí nghiệm trung bình có nửa số giá trị đại lượng ngẫu nhiên X lệch khỏi m vượt E nửa - nhỏ E Vì E gọi độ lệch trung tâm ⎛E⎞ ⎛ E⎞ P (m − E < X < m + E ) = φ ∗ ⎜ ⎟ − φ ∗ ⎜ − ⎟ ⎝σ ⎠ ⎝ σ⎠ Theo tính chất hàm φ * φ ∗ ( x) = − φ ∗ ( − x) , 17 18 Chương ỨNG DỤNG LÝ THUYẾT HÀM NGẪU NHIÊN VÀO PHÂN TÍCH SỐ LIỆU HẢI DƯONG HỌC 5.1 Phân tích chuỗi thời gian hải dương học Hình 5.1 Nhiệt độ nước mặt biển trạm Phú Quý theo số liệu ngày Chuỗi thời gian giá trị yếu tố quan trắc xếp theo thứ tự thời gian Thường khoảng thời gian quan trắc (khoảng gián đoạn quan trắc, Δt ) không đổi Trong hải dương học khí tượng thủy văn nói chung, khoảng gián đoạn từ phần giây (khi nghiên cứu rối) đến nhiều năm (khi nghiên cứu dao động quy mơ khí hậu) Chuỗi thời gian thể dạng đồ thị với trục hoành thời gian (giây, giờ, ngày, tháng năm), trục tung giá trị quan trắc Phân tích sơ chuỗi thời gian yếu tố khí tượng thủy văn, ta dễ nhận thấy diễn biến chung, hay biến thiên chúng, gồm tổng số dao động có tính chất tuần hồn khơng tuần hồn Trên hình 5.1 thể biến thiên nhiệt độ nước mặt biển ngày trạm Phú Quý quan trắc giai đoạn 1979-1990 Thấy rằng, nhiệt độ nước tăng giảm từ ngày sang ngày khác số ngày, dao động có chu kỳ năm (biến trình năm) thể rõ nét, ngồi ra, nhiệt độ cao thấp năm khác nhau, tức dao động năm 133 Phân tích thống kê chuỗi thời gian nhằm tìm hiểu tính chất chuỗi thời gian – độ biến động đặc trưng dao động tuần hồn khơng tuần hồn; tính chất giúp tìm hiểu đặc điểm nguyên nhân biến thiên, góp phần giải toán dự báo diễn biến chuỗi thời gian tương lai Mặc dù chuỗi thời gian quan trắc khí tượng thủy văn dao động thăng giáng phức tạp, không trật tự, song đặc trưng thống kê định thường giữ không đổi giai đoạn chuỗi thời gian Khi phân tích chuỗi thời gian yếu tố khí tượng thủy văn, người ta sử dụng phương pháp lý thuyết hàm ngẫu nhiên dừng egođic tổng quan chương Trong mục xét toán ứng dụng phương pháp hàm ngẫu nhiên vào phân tích số liệu hải dương học Các công thức lý thuyết triển khai thực hành ra, trọng lý giải nội hàm kết phân tích để chứng minh tính hiệu phương pháp thống kê 134 Bảng 5.1 Nhiệt độ nước mặt biển trung bình tháng trạm Phú Quý Tháng Năm 1979 δT TBN 10 11 12 29,4 28,4 28,2 29,6 27,3 26,6 24,9 0,7 0,0 0,0 0,8 -1,1 -0,5 -0,3 1980 25,0 δT 0,2 25,6 27,7 28,6 30,2 29,4 28,7 28,4 28,6 28,5 27,1 25,4 0,0 0,7 0,1 0,7 0,8 0,4 0,2 -0,2 0,1 0,1 0,2 1981 24,4 δT -0,4 25,7 27,5 29,4 30,4 28,3 28,8 28,3 29,5 29,2 27,5 25,2 0,0 0,5 0,9 0,8 -0,4 0,4 0,1 0,7 0,8 0,5 0,0 1982 24,5 δT -0,3 25,6 27,6 28,0 29,5 27,2 27,8 28,3 28,8 27,8 25,2 0,0 0,6 -0,5 0,0 -1,2 -0,4 -0,5 0,4 0,7 0,0 1983 24,7 δT -0,1 25,5 26,5 28,8 29,6 29,3 28,6 28,6 29,5 28,2 26,4 24,9 -0,1 -0,5 0,2 0,1 0,6 0,2 0,4 0,7 -0,2 -0,6 -0,3 1984 24,1 δT -0,8 24,8 26,7 29,0 29,1 28,0 28,4 27,4 28,4 28,4 26,9 25,4 -0,8 -0,3 0,5 -0,5 -0,7 0,0 -0,8 -0,4 0,0 -0,2 0,1 1985 25,0 δT 0,2 26,5 26,7 27,6 28,9 27,7 28,1 28,0 28,6 28,4 27,0 25,8 0,8 -0,3 -0,9 -0,6 -1,0 -0,3 -0,2 -0,3 0,0 0,0 0,5 1986 24,5 δT -0,4 25,6 26,1 28,1 28,8 28,9 28,4 27,4 28,3 28,5 26,7 25,6 -0,1 -0,8 -0,4 -0,8 0,2 0,0 -0,8 -0,5 0,2 -0,3 0,3 1987 24,9 δT 0,1 25,5 27,8 29,0 30,2 29,3 28,4 29,0 28,8 29,3 28,5 25,3 -0,2 0,8 0,5 0,7 0,6 0,0 0,8 0,0 0,9 1,4 0,1 1988 25,5 δT 0,7 26,4 27,0 27,5 29,4 28,1 28,6 29,2 29,6 28,0 25,9 24,5 0,8 0,0 -1,0 -0,1 -0,6 0,3 1,0 0,8 -0,4 -1,2 -0,7 1989 25,2 δT 0,3 24,8 26,0 28,7 29,1 28,6 28,3 28,0 28,5 28,0 27,1 25,1 -0,8 -1,0 0,2 -0,4 -0,1 -0,1 -0,1 -0,3 -0,3 0,0 -0,1 1990 25,4 δT 0,6 26,1 27,1 29,1 29,6 28,6 28,6 27,9 27,9 27,9 27,0 25,5 0,4 0,2 0,5 0,1 -0,1 0,2 -0,3 -0,9 -0,5 0,0 0,3 NN 24,8 25,6 27,0 28,5 29,5 28,7 28,4 28,2 28,8 28,4 27,0 25,2 27,8 27,8 27,9 27,3 27,6 27,2 27,4 27,2 28,0 27,5 27,3 27,6 27,5 5.1.1 Phân tích chu trình tuần hồn Biến trình năm yếu tố khí tượng thủy văn dễ dàng phân tích tính giá trị trung bình yếu tố cho tháng mùa biểu diễn giá trị trung bình tháng (biến trình năm) đồ thị 135 thời gian (hình 5.2) Xem đồ thị biến trình năm, ta có khái niệm tính chất biến thiên năm yếu tố Tương tự, vẽ đồ thị giá trị nhiệt độ trung bình ngày năm Tuy nhiên, chuỗi ngày có thăng giáng ngẫu nhiên dao động khơng điều hòa chu kỳ ngắn nhận xét theo hình 5.1, gây khó khăn cho phân tích Trong khí tượng thủy văn, người ta phân biệt giá trị trung bình tháng tính cho năm cụ thể với giá trị trung bình tháng tính theo số liệu số năm quan trắc, gọi trung bình tháng nhiều năm hay chuẩn tháng Bảng 5.1 dẫn giá trị trung bình tháng trung bình tháng nhiều năm nhiệt độ nước mặt biển trạm Phú Quý thời kỳ 1979-1990 tính theo số liệu trung bình ngày Tương tự, ta có trung bình mùa, trung bình mùa nhiều năm trung bình năm, trung bình năm nhiều năm, người ta tính giá trị trung bình ngày nhiều năm Trong bảng 5.1, giá trị trung bình tháng nhiều năm ghi dòng cuối Cột cuối ghi giá trị trung bình năm Giá trị góc bên phải bảng (27,5 o C) chuẩn năm Dòng ký hiệu δT cho thấy dị thường nhiệt độ so với chuẩn tháng Thí dụ, ta thấy năm 1981-1984 có tháng giêng lạnh chuẩn từ 0,1 đến 0,8 o C , năm 1987-1990, tháng giêng ấm chuẩn khoảng 0,1 đến 0,7 o C Trên hình 5.2, biến trình năm năm cụ thể biểu diễn đường cong mảnh màu xanh, riêng năm 1980 đường đậm nét màu đỏ Biến trình năm trung bình nhiều năm biểu diễn đường gạch nối đậm nét Phân tích sơ bảng 5.1 hình 5.2 giúp ta thấy cách định tính giá trị nhiệt độ trung bình tháng biến trình năm năm khác có khác 136 triển (4.30) tính tới số hữu hạn số hạng sin cosin Cụ thể N N − số hạng chứa hàm sin số hạng chứa hàm cosin Thí dụ, 2 nhiệt độ cho chuỗi 12 giá trị trung bình tháng, biến trình năm mơ tả giá trị trung bình năm, số hạng chứa hàm sin số hạng chứa hàm cosin Với chuỗi ngày có 24 giá trị - giá trị trung bình ngày, 11 số hạng chứa sin 12 số hạng chứa cosin Viết lại công thức (4.30) thành 2π 2π 2π 2π t + B1 cos t + A2 sin 2t + B2 cos 2t + P P P P N N Như nói, tổng có − số hạng chứa hàm sin 2 số hạng chứa hàm cosin ( AN / ln khơng) Do đó, ta viết X = X + A1 sin Hình 5.2 Biến trình năm nhiệt độ nước mặt biển trạm Phú Quý (vẽ theo giá trị nhiệt độ trung bình tháng thời kỳ 1980-1990) N /2 2π 2π ⎞ ⎛ X = X + ∑ ⎜ Ai sin it + Bi cos it ⎟ P P ⎠ i =1 ⎝ Mục tiếp sau giới thiệu phương pháp áp dụng phép khai triển hàm thời gian chuỗi giá trị nhiệt độ trung bình tháng cho phép ta xác định đặc trưng định lượng dao động năm nhiệt độ nước biển Trong công thức P − chu kỳ bản, hay chu kỳ đầy đủ hàm tuần hoàn, đơn vị đo đơn vị thời gian P khơng ln ln N , N trị số khoảng gián đoạn quan trắc Δt = Đại lượng i gọi số hiệu hài điều hòa số nguyên 5.1.2 Xác định chu trình tuần hồn phương pháp phân tích điều hòa Trong khí tượng thủy văn, việc khai triển hàm thời gian theo cơng thức (4.30) gọi phân tích điều hòa Đối với trường hợp quan trắc thực sau khoảng gián đoạn Δt nhau, khoảng thời gian quan trắc P hàm X có N hữu hạn lần quan trắc, dấu tổng Σ công thức khai 137 (5.1) N Đơn vị đo t P phải Vậy hai số hạng dấu tổng biến thiên chu trình đầy đủ chu kỳ Các số hạng thứ biến thiên nhanh gấp đơi, hồn thành chu trình đầy đủ thời gian nửa chu kỳ Số hạng cuối có chu kỳ biến thiên 2P Nếu cho 12 giá trị tháng, hài điều hòa cuối N có chu kỳ tháng Các hệ số khai triển A B công thức (4.40) tìm theo 138 τ i Vậy dao động với số hiệu i đóng góp vào phương sai chung hàm cơng thức phân tích điều hòa: Ai = Bi = N N ⎛ 2π ⎞ X t sin ⎜ it ⎟, ∑ ⎝ P ⎠ t =1 i = 1, 2, , N −1, (5.2a) ⎛ 2π ⎞ cos ⎜ it ⎟, ⎝ P ⎠ i = 1, 2, , N −1 , (5.2b) N N ∑X t =1 t AN / = , BN / = N N ∑X t =1 t ⎛ πN ⎞ cos ⎜ t⎟ ⎝ P ⎠ (5.2c) (5.2d) Chú ý việc chọn điểm gốc thời gian đo chuỗi X khơng có ý nghĩa định giá trị hệ số Ai Bi biên độ chung hài điều hòa, phải nhớ phân tích kết phải sử dụng mốc gốc thời gian tính Ai Bi Thí dụ, giá trị X lượng C i2 / , ngoại trừ hài cuối cùng, C i2 Mỗi hài góp phần riêng vào phương sai chung hàm X Trong thực tế phân tích điều hòa, người ta tính số hài điều hòa đầu tiên, tỷ phần đóng góp tổng cộng chúng chiếm phần lớn phương sai hàm X , phần phương sai nhỏ lại xem không đáng kể, dao động nhiễu sai số quan trắc Thí dụ 5.1: Phân tích điều hòa biến trình năm nhiệt độ nước biển Cho 12 giá trị nhiệt độ nước mặt biển trung bình tháng nhiều năm trạm Phú Quý (xem dòng cuối bảng 5.1) Thực phân tích điều hòa theo công thức 5.2a-d) để xác định đặc điểm dao động năm nhiệt độ trạm Giải: Tính X , D x , X = 27,5 , D x = 2,2 tháng giêng X quy ước ứng với t = , tháng hai − t = , v.v , gốc tính thời gian (t = 0) tháng mười hai C1 = (0,7525) + (1,6888) = 1,85 ( o C) , Để thuận tiện giải thích kết phân tích điều hòa, số hạng chứa sin cosin số hiệu i cộng lại, ta có Ai sin τ1 = 2π i 2π 2π ⎡ ⎤ it + Bi cos it = C i ⎢cos (t − τ i )⎥ , P P P ⎣ ⎦ C12 = 1,71 ( o C ) , Ci = Ai2 + Bi2 A P arctg i τi = 2π i Bi 12 − 0,7525 arctg = 6,8 (tháng), 2π − 1,6888 (5.3) Trong thực hành tính tốn, khơng dùng máy tính, ta ghi phép tính trung gian tính hệ số Ai Bi thành dạng bảng sau (thí dụ với i = để tính A1 B1 ): Ci gọi biên độ hài thứ i , τ i − pha hài i , thời điểm mà hài thứ i đạt cực đại biến thiên Ta giải thích ý nghĩa đại lượng C i τ i sau: hài thứ i có biên độ dao động C i pha ban đầu (thời gian đạt cực đại hàm cosin) 139 C12 1,85 = 100 = 77,78% D x × 2,2 140 t Xt 2π sin t N 12 (1) (2) (3) 10 11 12 24,8 25,6 27,0 28,5 29,5 28,7 28,4 28,2 28,8 28,4 27,0 25,2 X = 27,5 0,0833 0,1443 0,1667 0,1443 0,0833 0,0000 -0,0833 -0,1443 -0,1667 -0,1443 -0,0833 0,0000 Xt × 2π sin t 12 N (4) = (2) × (3) 2,0667 3,6950 4,5000 4,1136 2,4583 0,0000 -2,3667 -4,0703 -4,8000 -4,0992 -2,2500 0,0000 A1 = Σ ( ) = -0,7525 2π cos t N 12 (5) 0,1443 0,0833 0,0000 -0,0833 -0,1443 -0,1667 -0,1443 -0,0833 0,0000 0,0833 0,1443 0,1667 Xt × 2π i ⎡ ⎤ X (t ) = X + ∑ C i ⎢cos (t − τ i ) ⎥ = 27,5 P ⎣ ⎦ i =1 o + 1,85 cos[30 (t − 6,80)] + 1,01 cos[60 o (t − 4,11)] 2π cos t 12 N (6) = (2) × (5) + 0,18 cos[90 o (t − 1,54)] + 0,09 cos[120 o (t − 1,66)] 3,5796 2,1333 0,0000 -2,3750 -4,2580 -4,7833 -4,0992 -2,3500 0,0000 2,3667 3,8971 4,2000 + 0,08 cos[150 o (t − 2,25)] + 0,08 cos[180 o (t − 1,00)] Bảng 5.2 Kết phân tích điều hòa biến trình năm nhiệt độ nước mặt biển trạm Phú Quý i B1 = Σ ( ) = -1,6888 Ai -0,7525 -0,9238 0,1167 -0,0289 -0,0308 0,0000 Bi -1,6888 -0,4000 -0,1333 -0,0833 0,0721 -0,0750 Ci ( o C ) 1,85 1,01 0,18 0,09 0,08 0,08 τ i (tháng) 6,80 4,11 1,54 1,66 2,25 1,00 C2 % 2Dx 77,8 22,6 0,7 0,2 0,1 0,2 Chú ý bảng trên, người ta tính sẵn đại lượng 2π 2π sin it cos it công thức (5.2a-b) ghi vào N 12 N 12 cột (3) (5) Do đó, tổng cột (4) (6) cho giá trị Ai , Bi Thực tính tốn tương tự, ta kết tất hài điều hòa số hiệu cao ghi bảng 5.2 Như vậy, ta khai triển biến trình năm nhiệt độ nước biển trạm Phú Quý thành tổng gồm giá trị nhiệt độ trung bình năm X = 27,5 sáu hàm điều hòa sau: 141 Thấy biến trình năm nhiệt độ nước chủ yếu hai dao động điều hòa định: dao động thứ ứng với số hiệu i = , có chu kỳ 12 tháng (tốc độ góc 30 o /tháng), biên độ 1,85 o C , pha ban đầu 6,8 tháng, tức dao động cực đại vào khoảng tháng năm, dao động gây nên 77 % phương sai chung dao động năm Dao động thứ hai ứng với số hiệu i = , có chu kỳ tháng, tốc độ góc 60 o /tháng, thực hai chu trình năm, pha ban đầu 4,11 tháng, đạt cực đại thứ vào khoảng tháng 4, cực đại thứ hai vào khoảng tháng 10, góp 22 % vào phương sai chung dao động năm Hai dao động đóng góp 99 % phương 142 sai vào dao động năm Kết hợp hai dao động tạo nên biến trình năm điển hình gồm hai cực đại nhiệt độ đầu cuối hè vùng nhiệt đới Bốn dao động lại có tần số cao đóng góp tỷ phần khoảng % phương sai Trên hình 5.3 biểu diễn dao động hài thứ (đường cong 1), hài thứ (đường cong 2), tổng nhiệt độ trung bình hai hài (đường cong 3) biến trình năm xuất phát (đường cong 4) sở để người ta lọc bỏ biến trình năm hiển nhiên khỏi chuỗi thời gian xuất phát nhằm mục đích nghiên cứu dao động với tần số cao hơn, tức dao động quy mô số ngày, quy mô synop, hải dương học Trong mục 5.3 xét phương pháp loại bỏ chu trình tuần hồn khỏi chuỗi thời gian 5.2 Phổ phương sai chuỗi thời gian Như thấy từ mục 5.1.2, đại lượng nửa bình phương biên độ ( C i2 / ) hài tuần hoàn thứ i chuỗi khai triển phần đóng góp dao động với chu kỳ tương ứng P / i vào phương sai chung hàm thời gian Ta biểu diễn tất giá trị C / hài theo chu kỳ đồ thị gọi phổ phương sai hàm thời gian Nó cho ta khái niệm phân bố phương sai hàm thời gian theo tần số (hoặc chu kỳ) dao động thành phần khác nhau, tức cho khái niệm cấu trúc tần số dao động hàm thời gian Thí dụ, hình 5.4 thể phân bố phương sai biến thiên năm nhiệt độ nước mặt biển trạm Phú Q theo kết phân tích điều hòa mục 5.1.2 Hình 5.3 Diễn biến hài điều hòa biến trình nhiệt độ nước biển trạm Phú Quý Trên hình 5.4 hồnh độ biểu diễn thang logarit để thu gọn độ dài trục ngang Tung độ biểu diễn trực tiếp nửa bình phương biên độ C / tỉ số nửa bình phương biên độ phương sai C / D x (cột cuối bảng 5.2, trường hợp Thấy rõ rằng, cần tính đến số hạng chuỗi khai triển (đường cong 3) gần hoàn toàn trùng khớp quan trắc thực (đường cong 4) Những dao động cao tần bốn hài điều hòa lại làm sai lệch chút ít, xem nhiễu ngẫu nhiên bối cảnh cho ta đồ thị phổ phương sai chuẩn hóa) Tuy nhiên, quan niệm phần phương sai dư sau loại bỏ giá trị hai hài khỏi chuỗi thời gian thí dụ nhiễu ngẫu nhiên, mà dao động tần cao chuỗi thời gian, việc khảo sát tiếp chuỗi phần dư có ý nghĩa Quan niệm Chú ý rằng, công thức khai triển 5.2–5.3 áp dụng chuỗi thời gian độ dài N Trên hình 5.5 thể phân bố phương sai theo chu kỳ dao động khác theo kết áp dụng công thức 5.2–5.3 chuỗi giá trị ngày nhiệt độ nước trạm Côn Đảo quan 143 144 trắc thời gian 12 năm (từ 1979 đến 1990) Độ dài chuỗi thời gian trường hợp N = 4230 ngày, chu kỳ P = 4230 ngày ( Δt = ngày) Đồ thị giúp ta thấy hai chu kỳ năm nửa năm chiếm phần phương sai áp đảo Có biểu tồn chu kỳ dài hơn, khoảng năm số năm, chúng rõ đồ thị Hình 5.5 Phổ phương sai nhiệt độ nước trạm Cơn Đảo (tính theo chuỗi giá trị ngày, quan trắc năm 1979-1990) Hình 5.4 Phổ phương sai nhiệt độ nước trạm Phú Quý Trong mục tiếp sau xét phương pháp loại bỏ chu trình năm nửa năm xem hiển nhiên, để nghiên cứu dao động với chu kỳ nhỏ (cỡ số ngày), lớn (cỡ số năm) chuỗi thời gian Phụ lục 5.A giới thiệu mã Fortran thủ tục để phân tích phổ thơng qua phân tích điều hòa chuỗi thời gian trường hợp độ dài chuỗi N độ gián đoạn thời gian quan trắc Δt 145 5.3 Loại bỏ chu trình tuần hồn khỏi chuỗi thời gian 5.3.1 Loại bỏ chu trình tuần hồn phân tích điều hòa Trong hải dương học thường có nhu cầu loại bỏ biến trình ngày khỏi chuỗi quan trắc với độ gián đoạn thời gian cỡ để khảo sát dao động quy mơ ngày Biến trình năm thường bị loại khỏi chuỗi quan trắc có độ gián đoạn ngày hay vài ngày để nghiên cứu dao động quy mơ synop, thăng giáng khơng tuần hồn ngày năm Ta xét phương pháp loại bỏ chu trình tuần 146 hồn khỏi chuỗi thời gian thơng qua thí dụ Thí dụ 5.2: Loại bỏ biến trình năm khỏi chuỗi số liệu ngày Số liệu xuất phát 366 giá trị ngày nhiệt độ nước biển trạm Phú Quý, quan trắc năm 1980 Đồ thị thời gian chuỗi thể hình 5.6a với biến trình năm lên rõ nét Ta xác định chu trình năm nhiệt độ nước biển ứng với năm 1980 phân tích điều hòa theo sơ đồ trình bày chi tiết thí dụ 5.1 chuỗi giá trị trung bình tháng năm 1980 (lấy từ bảng 5.1) Kết phân tích điều hòa hai chu trình năm nửa năm sau: - Các đặc trưng thống kê: trung bình X = 27,78o C , phương sai Dx = 2,52 (o C) , độ lệch chuẩn σ x = 1,59 oC - Chu trình năm: biên độ: C1 = 1,9797 , biên độ: C = 1,0010 , pha: τ = 4,2507 tháng Để tương ứng với bước thời gian ngày chuỗi thời gian giá trị ngày, pha dao động tính tháng phải chuyển đổi thành ngày sau: τ = 6,5777 tháng × 2π 4π (t − τ ) − C2 cos (t − τ ), 366 366 (5.4) t = 1, 2, , 366 Sau lọc, đặc trưng thống kê chuỗi thời gian giá trị ngày X ′(t ) có trung bình X ′ = 0,02 o C , phương sai D x′ = 0,87 ( o C) độ lệch chuẩn σ x′ = 0,93 o C Như phương sai chuỗi lọc giảm đáng kể Chuỗi giá trị ngày nhiệt độ nước trạm Phú Quý sau loại bỏ chu trình tuần hồn năm nửa năm thể đồ thị hình 5.6c Theo hai đồ thị 5.6a 5.6c hình 5.6, ta thấy cách trực quan biến trình năm bị loại bỏ tốt Phần phương sai dư 0,87 ( o C) thuộc biến thiên thăng giáng khơng tuần hồn tuần hoàn với chu kỳ nhỏ so với dao động năm nửa năm pha: τ = 6,5777 tháng - Chu trình nửa năm: X t′ = X t − X − C1 cos 366 ngày = 200,62 ngày , 12 tháng Thủ tục phân tích chuỗi quan trắc loại bỏ dao động ngày hoàn toàn tương tự Thực tế cho thấy dao động ngày thường biểu chủ yếu hài điều hòa thứ ( i = ) với chu kỳ 24 Phương pháp loại bỏ dao động năm có nhược điểm tính tốn chi tiết, phức tạp Trong thực hành xử lý số liệu, người ta loại bỏ dao động năm cách đơn giản hơn, cách lấy giá trị quan trắc ngày trừ giá trị trung bình tháng tương ứng Trên hình 5.6b dẫn đồ thị thời gian chuỗi nhiệt độ nước trạm Phú Quý lọc biến trình năm cách lấy tung độ chuỗi xuất phát X (t ) trừ giá trị nhiệt độ trung bình tháng tương ứng 366 ngày τ = 4,2507 tháng × = 129,65 ngày 12 tháng Loại bỏ biến trình năm cách lấy giá trị quan trắc ngày X (t ) trừ tổng hai chu trình năm nửa năm Ta có chuỗi lọc X ′(t ) : 147 (a) 148 tháng có tính bậc thang (12 giá trị trung bình tháng), cơng thức (5.4) cho giá trị trơn hai hàm điều hòa năm nửa năm ứng ngày năm Ngồi ra, hai phép lọc có ý nghĩa khác tùy thuộc vào mục đích xử lý số liệu 5.3.3 Loại bỏ chu trình tuần hồn phân tích chu trình khơng tuần hồn thực tế xử lý số liệu (b) Trong thực tế, việc loại bỏ chu trình tuần hồn thường nhằm mục đích nghiên cứu phân tích dao động khơng tuần hồn Do đó, việc loại bỏ chu trình tuần hồn thực từ giai đoạn tổ chức quan trắc Một số phương pháp giới thiệu thường hiệu đơn giản 1) Nếu chu kỳ chu trình tuần hồn ngắn so với chu kỳ dao động khơng tuần hồn, sử dụng hai cách sau: (c) a) Sử dụng quan trắc vào thời điểm chu trình tuần hồn; thí dụ, để tránh ảnh hưởng biến trình ngày đêm tới chuỗi nhiệt độ, sử dụng quan trắc nhiệt độ vào đêm b) Sử dụng giá trị trung bình từ tất quan trắc chu trình tuần hồn đầy đủ; thí dụ muốn tránh ảnh hưởng biến trình ngày đêm nhiệt độ, sử dụng nhiệt độ trung bình ngày Hình 5.6 Biến thiên nhiệt độ ngày trạm Phú Quý năm 1980: a - trước lọc, b - lọc trừ giá trị trung bình tháng c lọc cách loại bỏ dao động điều hòa năm nửa năm 5.3.2 Loại bỏ biến trình năm từ chuỗi quan trắc năm Cách lọc thường hay dùng xử lý số liệu khí tượng thủy văn Tuy nhiên, dễ nhận thấy loại bỏ biến trình năm theo kiểu khác với sử dụng công thức (5.4) chỗ giá trị trung bình 149 2) Nếu chu kỳ chu trình tuần hoàn dài so với chu kỳ dao động khơng tuần hồn, quan trắc biểu diễn độ lệch khỏi giá trị trung bình hay khỏi chuẩn khí hậu Thí dụ, chuỗi thời gian gồm nhiệt độ trung bình tháng, ta thay chuỗi hiệu nhiệt độ trung bình tháng chuẩn khí hậu nhiệt độ tháng 150 Chuỗi thời gian lại sau loại bỏ dao động tuần hoàn từ chuỗi xuất phát gọi chuỗi thứ sinh, hay chuỗi dư, hay chuỗi thời gian khơng tuần hồn Chuỗi xem khơng có tính tuần hồn khơng có chu trình tuần hồn biểu rõ rệt Tuy nhiên, không phụ thuộc vào chỗ thang thời gian quan trắc giây, giờ, ngày, tháng hay năm, chuỗi dư thường bao gồm số kiểu dao động: 1) Những thăng giáng chu kỳ ngắn có quy mô thời gian bé nửa độ gián đoạn quan trắc Δt Vì độ gián đoạn quan trắc lớn quy mô thời gian thăng giáng, nên khơng thể nghiên cứu dao động Nhưng loại bỏ ảnh hưởng thăng giáng chu kỳ ngắn kỹ thuật lấy trung bình đơn giản Thí dụ, có chuỗi gồm n quan trắc v1 , v , , v n , thay chuỗi chuỗi giá trị trung bình sau: x1 = v1 + v + v3 v + v3 + v v + v n −1 + v n , x2 = , , x n − = n − 3 Trong thực tế, chuỗi trơn đáng kể, loại bỏ thăng giáng chu kỳ ngắn mà ta không quan tâm khảo sát Trong thí dụ này, ta lấy trung bình ba giá trị đầu chuỗi xuất phát làm giá trị thứ chuỗi mới, trung bình ba giá trị sau giá trị thứ chuỗi xuất phát làm giá trị thứ hai chuỗi mới, v.v Giá trị cuối chuỗi trung bình ba giá trị cuối chuỗi xuất phát Kiểu lấy trung bình gọi trung bình trượt Ở chu kỳ lấy trung bình trượt T Độ dài chuỗi ngắn chuỗi xuất phát hai giá trị xi = (5.5) i = 1, , (T div 2) + T chẵn; i = 1, , (T div 2) T lẻ Chu kỳ lấy trung bình trượt T chọn tùy thuộc vào quy mô thăng giáng cần loại bỏ Thí dụ, hải dương học, cần loại bỏ thủy triều khỏi chuỗi mực nước biển quan trắc giờ, ta lấy chu kỳ trung bình trượt 25 giờ, dao động triều có chu kỳ xấp xỉ 25 ước số 25 Với cách này, ta chuỗi mực nước khơng phản ánh dao động triều để phân tích biến thiên mực nước biển nguyên nhân khác dâng, rút trường gió thay đổi từ ngày sang ngày khác, dao động áp suất khí quyển, tác động lũ, giáng thủy Khi sử dụng kỹ thuật trung bình trượt với chu kỳ lấy trung bình T , phải lưu ý chuỗi dư xi không mang thơng tin thăng giáng chu kỳ ngắn T , đồng thời giá trị chuỗi dư bị trơn Là trơn lấy trung bình trượt có tỷ trọng Kỹ thuật áp dụng muốn nhận chuỗi thứ sinh để xử lý tiếp phân tích phổ Thí dụ, lọc chuỗi số liệu xuất phát để áp dụng cho điều kiện chuỗi có biến thiên cao tần áp đảo, ta dùng cơng thức (5.5) cải biên dạng sau: Ta viết cơng thức tổng qt tính trung bình trượt sau: xi = 151 i +T −1 ∑ vk , T k =i 152 T /2 ∑ a j vi + j ; j = −T / với aj = 1⎛ 2π ⎞ j⎟ , ⎜1 + cos T⎝ T ⎠ (5.5a) đó: xi − trị số chuỗi lọc; vi − trị số chuỗi nhỏ thực đo; a j − hàm lọc; T − độ dài khoảng lấy trung bình trượt Khoảng Trong trường hợp đơn giản nhất, trend có dạng biến thiên tuyến tính Đường thẳng biểu diễn trend chọn nhờ phương pháp bình phương nhỏ Độ nghiêng đường thẳng hồi quy biến X thời gian t tính theo cơng thức [4]: lấy trung bình trượt T chọn lựa trị số khác nhằm hạn chế dao động chu kỳ ngày nửa ngày hiển nhiên tồn hạn chế số khoảng tần làm rõ khoảng tần khác Khi sử dụng kỹ thuật trơn tỷ trọng, thường người ta phải khảo sát đồ thị đường cong đặc trưng phổ hàm lọc này, tức khảo sát biến đổi biên độ dao động tùy thuộc vào tích độ dài khoảng trơn T tần số dao động f Được biết, biên độ dao động với tần số f = / T sau trơn giảm hai lần, dao k= Tính chất hàm lọc dùng để hạn chế dao động triều hiển nhiên tồn áp đảo chuỗi đo mực nước biển Đông làm dao động với tần số cao dao động toàn nhật bán nhật triều Trường hợp với mực nước thử lọc với trị số tham số T từ đến 25 [2] t − (t ) , (5.6) dấu gạch ngang bên ký hiệu phép lấy trung bình Phương trình hồi quy có dạng X − X = m (t − t ) động với tần số lớn / T thực tế không Nếu trơn chuỗi xuất phát với tham số T đủ lớn, nhận chuỗi thứ sinh với thành phần dao động tần thấp Nếu lấy chuỗi xuất phát trừ chuỗi tần thấp nhận chuỗi thứ sinh thứ hai gồm thành phần cao tần áp đảo Để lọc hiệu quả, thường phải thí nghiệm với T khác Xt − X t (5.7) Khi trend có dạng cong, ta xấp xỉ phương trình đường cong trend dạng parabôn: X = a + bt + ct (5.8) Các hệ số a , b c tính cách giải phương trình ∑ X = Na + b∑ t + c∑ t ; ∑ Xt = a∑ t + b∑ t + c∑ t ; ∑ Xt = a∑ t + b∑ t + c∑ t 2 2 3 (5.9) 5.4 Hàm tương quan hàm phổ chuỗi thời gian yếu tố hải dương học 2) Xu (trend) Đó biến đổi chậm từ từ yếu tố quan trắc suốt thời kỳ quan trắc Thực chất trend phận dao động thăng giáng, với chu kỳ dài so sánh với khoảng thời gian quan trắc Trong trường hợp hàm thời gian X (t ) quan trắc N thời điểm cách nhau, độ gián đoạn quan trắc Δt = const, cơng thức tính 3) Những dao động khơng tuần tồn với quy mô thời gian chuyển tiếp thăng giáng ngắn hạn trend hàm tương quan (4.37) viết lại thành dạng tiện lợi tính máy tính sau: Trend tách phân tích phương pháp bình phương 153 154 Ri = n −i ∑ x j x j +i − x j x j +i n − i j =1 σj = , i = 0,1, , m σ j σ j +1 n −i xj = ∑ xk , n − i k =1 x j +i 1 n = ∑ xk , n − i k =i +1 n −i ∑ ( xk ) , σ j +i = n − i k =1 R 0,5 (5.10) n ∑ ( xk ) n − i k =i +1 i Hình 5.7 Đồ thị hàm tương quan Thủ tục Fortran để tính hàm tương quan theo cơng thức (5.10) có phụ lục 5C Trong khí tượng thủy văn, giá trị hàm tương quan ứng với số i cụ thể thường gọi hệ số tự tương quan với bước trễ i Hệ số tự tương quan Ri phản ánh mức độ liên hệ tuyến tính giá trị hàm X thời điểm quan trắc cách bước trễ tương ứng Nếu bước trễ không, hệ số tự tương quan Nếu bước trễ nhỏ, hệ số tự tương quan yếu tố khí tượng thủy văn thường mang giá trị dương Nói cách khác, yếu tố khí tượng thủy văn có tính ổn định tương đối: thí dụ, hơm nhiệt độ cao chuẩn, vài ngày tới thường cao chuẩn Khi bước trễ tăng dần, hệ số tự tương quan giảm chí có giá trị âm Điều có nghĩa hôm nhiệt độ cao chuẩn, sau thời gian định nhiệt độ trở nên thấp chuẩn Đồ thị biểu diễn phụ thuộc hệ số tự tương quan bước trễ gọi đồ thị tương quan Dạng tiêu biểu đồ thị tương quan yếu tố khí tượng thủy văn vài bước trễ nhỏ, hệ số tự tương quan có giá trị dương, sau giảm nhanh, tiệm cận tới trục hồnh dao động xung quanh trục hoành bước trễ tương đối lớn (hình 5.7) 155 Trong thực hành tính tốn hệ số tự tương quan theo cơng thức (5.10), bước trễ tối đa m cần chọn theo mục đích nhiệm vụ nghiên cứu Khi phân tích chuỗi thời gian quy mơ mùa năm, thường gặp khó khăn độ dài chuỗi thời gian Phần lớn đại lượng khí tượng thủy văn thường quan trắc vài chục năm gần Trong điều kiện vậy, ước lượng hệ số tự tương quan với bước trễ lớn tin cậy Chúng ta ước lượng vài hệ số tự tương quan với bước trễ nhỏ, cỡ vài năm Những hệ số tự tương quan có ý nghĩa dự báo định, thường dùng để thiết lập mối phụ thuộc dự báo thống kê Khi cần nghiên cứu cấu trúc tần số biến thiên hàm thời gian, nhiệm vụ tính hàm mật độ phổ phần tiếp sau mục này, vài hệ số tự tương quan bước trễ nhỏ hoàn toàn khơng đủ Với q trình quy mơ nhỏ, độ dài chuỗi thời gian thường tạm đáp ứng yêu cầu phân tích Từ chương biết hàm tương quan khai triển phổ theo công thức khai triển Fourier hàm chẵn (công thức 4.39) Với trường hợp hàm tương quan tính đến bước trễ m theo cơng thức (5.10), ta viết lại cơng thức tính hàm phổ dạng thuận lợi cho lập chương trình máy tính Hàm chẵn biểu diễn thành tổng giá trị trung 156 bình chuỗi chứa hàm cosin Nếu hàm tương quan tính tới bước trễ m , chu kỳ hài thứ 2m , chu kỳ hài thứ hai m , chu kỳ hài thứ ba Phụ lục chương A Mã Fortran thủ tục phân tích điều hòa 2m , v.v Các hệ số khai triển Bi SUBROUTINE PTDH (n,x,deltat,k,c,to,p) viết ký hiệu S i tính theo cơng thức Si = R0 R 2π ij + m (−1) i + ∑ R j cos 2m m m j =1 m ! Phân tích chuỗi X dài N , độ gián đoạn DeltaT m −1 ! Cho k giá trị biên độ C pha T , chu kỳ P (5.11) PARAMETER (n0 = 100000, pi = 3.141593) REAL x(n0),c(n0/2),to(n0/2),deltat,p INTEGER n,k k = n/2 p = n*deltat g3 = 2*pi*deltat/p g4 = p/(2*pi) DO i = 1, k-1 g2 = g3*i g = g4/i a = 0.0 b = 0.0 DO j = 1, n g1 = g2*j a = a+x(j)*SIN(g1) b = b+x(j)*COS(g1) ENDDO a = 2*a/n b = 2*b/n c(i) = SQRT(a*a+b*b) to(i) = p/(2*pi*i)*Goclg(a,b) Các giá trị S S m nhận theo cơng thức phải chia đơi i , đường cong nhận 2mΔt C i2 ước lượng phổ chuẩn hóa trơn chuỗi xuất phát 2σ x2 Nếu ta vẽ đồ thị S i hàm thấy mục 5.2 Thông số m nhỏ so với độ dài chuỗi n phổ S i trơn Tuy nhiên, m trở thành đại lượng bé, hàm S i mang thơng tin dao động chu kỳ dài, chu kỳ 2mΔt 157 158 IF (s.GE.0.0) THEN g = ATAN(g) ELSE g = 2*pi-ATAN(g) ENDIF ELSE IF (s.GE.0.0) THEN g = pi-ATAN(g) ELSE g = pi+ATAN(g) ENDIF ENDIF ENDIF Goclg = g RETURN END ENDDO a = 0.0 b = 0.0 g2 = g3*k g = g4/k DO j = 1, n g1 = g2*j b = b+x(j)*COS(g1) ENDDO b = b/n c(k) = SQRT(b*b) to(k) = p/(2*pi*k)*Goclg(0.0,b) RETURN END FUNCTION Goclg (s,c) PARAMETER (pi=3.141593) REAL s,c IF (c.EQ.0.0) THEN IF (s.GE.0.0) THEN g = 0.5*pi ELSE g = 1.5*pi ENDIF ELSE g = ABS(s/c) IF (c.GT.0.0) THEN B Mã Fortran thủ tục lọc trung binh trượt SUBROUTINE LocTBT (ic,n,x,t) ! Từ chuỗi X xuất phát dài N , cho X dài N − × t / ! t lẻ, N − × t / + t chẵn, t − chu kỳ lấy trung ! bình trượt ! ic mã định kiểu lọc tần thấp ( ic = ), lọc tần cao ! ( ic = ) PARAMETER (n0 = 100000) INTEGER ic,n,t REAL x(n0),x1(n0) 159 160 m = t/2 n = n-2*m IF (MOD(t,2).EQ.0) n = n+1 DO i = 1, n x1(i) = x(i) DO j = 2, t x1(i)=x1(i)+ x(i+j-1) ENDDO x1(i) = x1(i)/t ENDDO IF (ic.EQ.1) THEN DO i = 1, n x(i) = x1(i) ENDDO ELSE IF (ic.EQ.2) THEN IF (MOD(t,2).NE.0) THEN DO i = 1, n x(i) = x(i+m)-x1(i) ENDDO ELSE DO i = 1, n j = i+m x(i) = 0.5*(x(j-1)+x(j))-x1(i) ENDDO ENDIF ENDIF RETURN END TÀI LIỆU THAM KHẢO Kazakevich Đ.I Cơ sở lý thuyết hàm ngẫu nhiên ứng dụng khí tượng thủy văn (Biên dịch: Phạm Văn Huấn, Nguyễn Thanh Sơn, Phan Văn Tân) Nxb Đại học Quốc gia Hà Nội, 2005 Phạm Văn Huấn Phổ dao động mực nước biển Đông Thông báo Khoa học trường đại học, số 2, 1992, tr 109-113 Hans A Panofsky, Glenn W Brier Some applications of statistics to meteorology University Park, Pennsylvania, 1958 Хемминг Р В Численные методы для научных работников и инженеров Наука, М., 1979 Ямпольский A Д О спектральных методах исследования океанологических процессов Океанoлoгия T 5, вып 5, 1965 161 162