PHƯƠNG PHÁP THỐNG KÊ TRONG KHÍ HẬU ( Phan Văn Tân - NXB Đại học Quốc gia Hà Nội ) - CHƯƠNG 5 pps

60 477 0
PHƯƠNG PHÁP THỐNG KÊ TRONG KHÍ HẬU ( Phan Văn Tân - NXB Đại học Quốc gia Hà Nội ) - CHƯƠNG 5 pps

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

CHƯƠNG PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI 5.1 NHỮNG KHÁI NIỆM MỞ ĐẦU Trong thực tế nghiên cứu khí tượng, khí hậu có khơng vấn đề đặt cần phải xác định qui luật biến đổi tượng khí Tuy nhiên, tượng khí lại phản ánh thơng qua đặc trưng yếu tố khí mà chúng, đến lượt mình, lại phụ thuộc vào biến đổi nhân tố bên Muốn nắm qui luật biến đổi tượng khí cần thiết phải xác định liên hệ đặc trưng yếu tố khí (được xem biến phụ thuộc) với tập hợp nhân tố ảnh hưởng mà người ta gọi biến độc lập Điều có nghĩa là, phương diện thống kê, thông thường ta cần phải giải số vấn đề sau đây: 1) Xác định phân bố không gian đặc trưng yếu tố khí tượng, khí hậu, tức nghiên cứu qui luật phụ thuộc vào toạ độ khơng gian biến khí 2) Xác định qui luật, tính chất diễn biến theo thời gian đặc trưng yếu tố khí 3) Xác định mối quan hệ ràng buộc để từ tìm qui luật liên hệ đặc trưng yếu tố khí với theo khơng gian thời gian Một phương pháp giải vấn đề phương pháp phân tích tương quan hồi qui mà nội dung chia thành: 1) Tương quan hồi qui theo không gian: Là xét mối quan hệ hai hay nhiều biến khí với yếu tố, thời gian (đồng thời) khác vị trí khơng gian 2) Tương quan hồi qui theo thời gian: Là xét mối quan hệ hai hay nhiều biến khí với yếu tố, địa điểm khác thời gian 129 3) Tương quan hồi qui phổ biến: Là xét mối quan hệ hay nhiều biến khí nhiều yếu tố, khác không gian, thời gian không−thời gian Về phương diện toán học, vào dạng thức biểu thức biểu diễn, người ta chia quan hệ tương quan làm bốn dạng: 1) Tương quan hồi qui tuyến tính biến: Xét mối quan hệ tương quan hồi qui tuyến tính bên biến phụ thuộc với bên biến độc lập 2) Tương quan hồi qui phi tuyến biến: Xét mối quan hệ tương quan hồi qui phi tuyến bên biến phụ thuộc với bên biến độc lập 3) Tương quan hồi qui tuyến tính nhiều biến: Xét mối quan hệ tương quan hồi qui tuyến tính bên biến phụ thuộc với bên tập hợp nhiều biến độc lập 4) Tương quan hồi qui phi tuyến nhiều biến: Xét mối quan hệ tương quan hồi qui phi tuyến bên biến phụ thuộc với bên tập hợp nhiều biến độc lập Thông thường để giải tốn tương quan hồi qui khí tượng, khí hậu cần phải tiến hành bước sau: 1) Xác lập dạng thức mối liên hệ tương quan, tức tìm dạng hồi qui thích hợp: Tuyến tính hay phi tuyến, phi tuyến cụ thể dạng 2) Đánh giá mức độ chặt chẽ mối liên hệ theo nghĩa quan hệ tương quan 3) Bằng phương pháp đó, xác lập biểu thức giải tích phương trình hồi qui xấp xỉ mối liên hệ tương quan, tức xây dựng hàm hồi qui Trong khí tượng, khí hậu phương pháp phổ biến để xây dựng hàm hồi qui phương pháp bình phương tối thiểu 4) Đánh giá độ xác khả sử dụng phương trình hồi qui 130 5.2 TƯƠNG QUAN TUYẾN TÍNH 5.2.1 Hệ số tương quan tổng thể Xét hai biến ngẫu nhiên X1 X2 Khi phương sai tổng (hiệu) hai biến xác định bởi: D[X1 ± X2] = M[(X1 ± X2) − M(X1 ± X2)]2 = M[(X1 − MX1)± (X2 − MX2)]2 = = M[(X1 − MX1)2] + M[(X2 − MX2)2] ± 2M[(X1 − MX1)(X2 − MX2)]= = D[X1] + D[X2] ± M[(X1 − MX1)(X2 − MX2)]= = μ11 + μ22 + ± 2μ12 μ12 mômen tương quan X1 X2, μ11 μ22 tương ứng phương sai X1 X2 Nếu X1 X2 không tương quan với thì: D[X1 ± X2] = D[X1] + D[X2], suy μ12 = Do vậy, người ta dùng μ12 làm thước đo mức độ tương quan X1 X2 Vì μ12 đại lượng có thứ ngun (bằng tích thứ nguyên X1 X2) nên để thuận tiện việc so sánh, phân tích thay cho μ12 người ta dùng đại lượng vô thứ nguyên: ρ12 = μ 12 μ 11μ 22 (5.2.1) gọi hệ số tương quan hai biến X1 X2 Người ta gọi ρ12 hệ số tương quan tổng thể hay hệ số tương quan lý thuyết số Hệ số tương quan có tính chất sau đây: 1) Hệ số tương quan nhận giá trị đoạn [−1;1]: −1 ≤ ρ12 ≤ Thật vậy, ta có: ⎡ X1 D⎢ ± ⎣ DX1 ⎡ X1 ⎤⎞ ⎛ X ⎡ X ⎤⎞ ⎤ X ⎤ ⎡⎛ X1 ⎥ = ⎢⎜ ⎜ DX − M ⎢ DX ⎥⎟ ± ⎜ DX − M ⎢ DX ⎥⎟ ⎥ = ⎟ ⎜ ⎟ DX ⎦ ⎢⎝ ⎝ 1 ⎦⎠ 2 ⎦⎠ ⎥ ⎣ ⎣ ⎣ ⎦ 131 ⎡⎛ X ⎡ X1 ⎤ ⎡ X2 ⎤ ⎡ X ⎤⎞ ⎤ ⎡ X1 ⎤⎞ ⎛ X − M⎢ − M⎢ ⎥ +D ⎢ ⎥ ±2M ⎢⎜ ⎥⎟ ⎥ ⎥⎟ ⎜ ⎟ ⎟⎜ ⎢⎜ DX1 ⎢ DX ⎥ ⎢ DX ⎥⎠ ⎥ ⎢ DX1 ⎥⎠ ⎝ DX ⎢ DX1 ⎥ ⎝ ⎣ ⎦ ⎦ ⎦ ⎣ ⎦ ⎣ ⎣ ⎦ ⎣ = D⎢ = μ 12 1 = 2(1 ± ρ12) ≥ μ 12 = ± DX1 + DX ± DX1 DX μ 11μ 22 DX1 DX Hay ± ρ12 ≥ ⇒ đpcm 2) Điều kiện cần đủ để ρ12 =1 X1 X2 có quan hệ hàm tuyến tính Điều kiện đủ: Giả sử ta có quan hệ hàm tuyến tính X1 X2: X2 = a + bX1, với a, b hệ số số Khi đó: μ12 = M[(X1−MX1)(X2−MX2)] = M[(X1−MX1)(a + bX1−a−bMX1)]= = M[b(X1 −MX1)2] = bμ11 μ22 =M[(X2−MX2)2]=M[(a + bX1−a−bMX1)2] = b2M[(X1−MX1)2] = b2μ11 Vậy ρ12 = bμ 11 μ 12 = μ 11μ 22 b μ 11 = b ⎧1 =⎨ b ⎩− b > b < Điều kiện cần: ⎡ X1 ± Từ hệ thức D ⎢ ⎢ DX1 ⎣ X2 ⎤ ⎥ = 2(1 ± ρ12) ta có: DX ⎥ ⎦ ⎡ X1 Nếu (1 ± ρ12) = ⎢ ± ⎢ DX1 ⎣ Từ suy X2 = ± X2 ⎤ ⎥ = C = Const DX ⎥ ⎦ μ 22 X1 + C μ 22 , tức X2 X1 tồn quan μ 11 hệ hàm tuyến tính Do tính chất nên hệ số tương quan xem đại lượng đặc trưng cho mức độ tương quan tuyến tính hai biến 132 5.2.2 Hệ số tương quan mẫu Cho hai biến khí X1, X2 với n cặp trị số quan sát: {xt1, xt2} = {(x11, x12), (x21, x22), , (xn1, xn2)} Khi mơmen tương quan mẫu - ước lượng mômen tương quan tổng thể μ12 - X1 X2 xác định bởi: R12 = n ∑ ( x − x1 )( x t − x ) = ( x1 − x1 )( x − x ) n t = t1 (5.2.2) hệ số tương quan mẫu: r12 = đó: l12 = n ∑ ( x − x1 )( x t − x ) n t = t1 n n ∑ ( x t − x1 ) n ∑ ( x t − x ) n t =1 t =1 = l 12 l 11l 22 (5.2.3) n ∑ ( x t1 − x1 )( x t − x ) = nR12 tổng tích độ lệch t =1 X1 X2 so với trung bình chúng n l11 = ∑ ( x t − x1 ) t =1 = n s1 - tổng bình phương độ lệch X1 so với trung bình n l22 = ∑ (x t2 − x2 ) t =1 = n s - tổng bình phương độ lệch X2 so với trung bình x1 = n n x t1 , x = ∑ x t - trung bình X1 X2 ∑ n t =1 n t =1 Hệ số tương quan mẫu r12 ước lượng hệ số tương quan tổng thể ρ12 Nếu ρ12 số trái lại r12 đại lượng ngẫu nhiên Năm 1915 R.A.Fisher [3,5,6] tìm biểu thức xác hàm mật độ xác suất hệ số tương quan mẫu r12 trường hợp phân bố đồng thời X1 X2 133 chuẩn: 2n−3 fn(r)= (1 − ρ2 ) πΓ ( n − 2) n −1 n−4 ∞ (1 − r ) ∑ (Γ ( i=0 n + i − (2ρr ) i , )) i! (5.2.4) (−1 ≤ r ≤ 1) Ở đây, để tiện biểu diễn ta thay ký hiệu r12 ký hiệu r Bằng phép biến đổi chuỗi luỹ thừa vế phải biểu thức fn(r) người ta thu dạng khác mật độ xác suất r: n− (1 − ρ ) fn(r) = π n −1 n− (1 − r ) x n− ∫ (1 − ρrx) dx n−1 − x2 (5.2.5) Ta thấy phân bố r phụ thuộc vào dung lượng mẫu n hệ số tương quan tổng thể ρ Khi n = fn(r) = 0, điều phù hợp với kiện hệ số tương quan tính từ tập mẫu có quan trắc phải ±1 Kỳ vọng hệ số tương quan mẫu r: M[r] = ρ Phương sai hệ số tương quan mẫu r: D[r] = 2μ 22 4μ 4μ 31 4μ 13 ρ μ 40 μ 04 + 222 − − ( + + ) μ 11 μ 11μ 20 μ 11μ 02 n μ 20 μ 02 μ 20 μ 20 [ ] μ ij = M ( X1 − MX1 ) i ( X − MX ) j - mômen trung tâm bậc i+j Để thuận tiện tính tốn thực hành, việc ước lượng khoảng cho ρ, người ta thường dùng phép biến đổi sau Fisher: z= 1+ r 1+ ρ , ζ = log log 1− r 1− ρ (5.2.6) Fisher chứng minh với giá trị n không lớn biến z phân bố xấp xỉ chuẩn với giá trị trung bình phương sai cho biểu thức gần sau: M[z] = ζ + ρ , D[z] = 2( n − 1) n−3 134 (5.2.7) Vì khoảng tin cậy ζ với độ tin cậy 1−α là: (z − r − uα 2( n − 1) r ,z − + uα 2( n − 1) n−3 ) n−3 (5.2.8) uα nhận từ phân bố chuẩn N(0,1) hệ thức: P( u ≥ u α ) = α Từ ta nhận khoảng tin cậy ρ Trong trường hợp ρ = biến t = r n− 1− r2 có phân bố Student với n−2 bậc tự Hệ số tương quan mẫu r ước lượng vững chệch hệ số −ρ(1 − ρ ) Do tính tốn thực tương quan tổng thể ρ với độ chệch 2n hành nhận r = điều khơng có nghĩa ρ Và ngược lại, r≠0 khơng ρ khác Nếu dung lượng mẫu nhỏ ρ = giá trị r lại có ý nghĩa Vì ta cần kiểm tra xem độ lớn r có ý nghĩa thực hay khơng, hay nói cách khác cần kiểm nghiệm độ rõ rệt r Để kiểm nghiệm, ta đặt giả thiết Ho: ρ = Thay ρ ≈ r, với giới hạn tin cậy ban đầu d Ho ta có P( r ≥ d ) = α Đặt t= r 1− r2 / n − , tα = d 1− r2 / n − (5.2.9) Khi Ho thì: P ( t ≥ t α ) = α Biến t (5.2.9) có phân bố Student (t) với n−2 bậc tự Từ ta xác định tα Và tiêu kiểm nghiệm là: Nếu t ≥ tα bác bỏ Ho đưa kết luật r lớn rõ rệt Nếu t < tα chấp nhận Ho kết luận r khơng lớn rõ rệt Ví dụ 5.2.1 Từ tập mẫu {xt, yt, t=1 11} ta tính hệ số tương quan rxy=0.76 Hãy cho biết với giá trị nhận hệ số tương quan có lớn 135 rõ rệt không lấy mức ý nghĩa α=0.01? Để trả lời câu hỏi đặt ta cần kiểm nghiệm giả thiết: Ho: rxy=0 Muốn vậy, ta tính đại lượng t= rxy 1− r / n − = 0.76 − 0.76 / 11 − =3.51 Từ α=0.01 ta xác định tα từ phân bố Student: tα=St(11−2,0.01) = 3.25 Vì t =3.51> 3.25=tα ta bác bỏ giả thiết Ho đưa kết luận rxy lớn rõ rệt Ngoài việc kiểm tra độ rõ rệt hệ số tương quan, thực tế người ta cịn đánh giá có nghĩa Để xác định có nghĩa r trước hết ta tính giá trị H= r n − ≡ H(n, r) Tương ứng với giá trị dung lượng mẫu n khác nhau, cho trước độ tin cậy p, tra bảng ta tính trị số tới hạn Ho H: Ho = H(p,n) Trong bảng 5.1 cho giá trị tới hạn H0 ứng với độ tin cậy p dung lượng mẫu n khác Từ tiêu kiểm nghiệm có nghĩa r là: Nếu H(n,r) > Ho(p,n) kết luận r có nghĩa với độ tin cậy p Nếu H(n,r) ≤ Ho(p,n) kết luận r khơng có nghĩa với độ tin cậy p Bảng 5.1 Giá trị tới hạn H0(p,n) p p n 0.90 0.95 0.99 0.999 n 0.95 0.99 0.999 10 1.65 1.90 2.29 2.62 25 1.941 2.475 3.026 11 1.65 1.90 2.32 2.68 26 1.941 2.479 3.037 12 1.65 1.92 2.35 2.73 27 1.492 2.483 3.047 13 1.65 1.92 2.37 2.77 28 1.943 2.487 3.056 14 1.65 1.92 2.39 2.81 29 1.493 2.490 3.064 15 1.65 1.92 2.40 2.85 30 1.944 2.492 3.071 16 1.65 1.93 2.41 2.87 35 1.947 2.505 3.102 136 p p n 0.90 0.95 0.99 0.999 n 0.95 0.99 0.999 17 1.65 1.93 2.42 2.90 40 1.949 2.514 3.126 18 1.65 1.93 2.43 2.92 45 1.950 2.521 3.145 19 1.65 1.93 2.44 2.94 50 1.951 2.527 3.161 20 1.65 1.94 2.45 2.96 60 1.953 2.535 3.830 21 1.65 1.94 2.45 2.98 70 1.954 2.541 3.190 22 1.65 1.94 2.46 2.99 80 1.955 2.546 3.209 23 1.65 1.94 2.47 3.00 90 1.956 2.550 3.219 24 1.65 1.94 2.47 3.02 100 1.956 2.553 3.226 ∞ 1.960 2.576 3.291 5.2.3 Cách tính hệ số tương quan mẫu Cho hai biến ngẫu nhiên X1, X2 với n cặp trị số quan sát: {xt1, xt2} = {(x11, x12), (x21, x22), , (xn1, xn2)} Từ tập mẫu tính hệ số tương quan X1, X2 theo phương pháp sau 5.2.3.1 Phương pháp tính trực tiếp Phương pháp trực tiếp tính hệ số tương quan mẫu tính theo cơng thức (5.2.3) Thế nhưng, thực hành người ta thường biến đổi đưa dạng khác R12 = ( x1 − x1 )( x − x ) = x1x − x1x + x x1 − x1 x = x1x − x1 x = x1 x − x x = n n n x t1 x t − ∑ x t1 ∑ x t ∑ n t =1 n t =1 n t =1 s1 = ( x1 − x1 ) = ( x1 ) − x1 x1 + ( x1 ) = ( x1 ) − ( x1 ) 137 (5.2.10) = n n ( x t1 ) − ( ∑ x t1 ) ∑ n t =1 n t =1 (5.2.11) Tương tự ta có: s2 = n n (x t2 )2 − ( ∑ x t2 )2 ∑ n t =1 n t =1 R 12 s1s Kết hợp (5.2.10)-(5.2.12) ta nhận được: r12 = (5.2.12) (5.2.13) Hoặc tính theo cơng thức: n ∑ x t1 x t − r12 = t =1 n n n x t1 ∑ x t ∑ n t =1 t =1 n ( x t1 ) − ( ∑ x t1 ) ∑ n t =1 t =1 n n ( x t ) − (∑ x t ) ∑ n t =1 t =1 (5.2.14) Ví dụ 5.2.2 Trong bảng 5.2 dẫn số liệu quan trắc tổng lượng mưa tháng hai trạm mà ta đặt chúng hai biến X1, X2 kết bước tính trung gian theo cơng thức (5.2.14) Cột thứ số thứ tự năm (t) Hai cột bảng chứa số liệu hai chuỗi {xt1} {xt2} Cột thứ tư tích cặp (xt1,xt2), hai cột cuối chứa bình phương giá trị xt1 xt2 Dòng cuối bảng tổng theo cột Đối sánh với thành phần (5.2.14) ta có: n=19 n n n t =1 t =1 ∑ x t1x t = 27494.19 , n ∑ x t1 ∑ x t =556.6*880.6/19=25796, t =1 n ∑ ( x t1 ) =36595.20, t =1 n ∑ ( x t ) =59191.26, t =1 n ( ∑ x t1 ) =16305.45 n t =1 n ( ∑ x t ) =40813.49 n t =1 Sau thay vào tính ta r12=0.087894 138 s= Q n−m (5.5.24) làm thước đo sai số hồi qui Nó gọi chuẩn sai thặng dư 5.5.4 Tương quan riêng Các hệ số tương quan rki dùng để đo mức độ tương quan tuyến tính hai biến Xk Xi gọi hệ số tương quan toàn phần Nếu ta xét mối quan hệ Xk Xi đồng thời với việc xét m−2 biến cịn lại thì, mức độ đó, xem độ biến thiên Xk Xi biến thiên biến khác gây nên Để loại trừ ảnh hưởng biến thiên biến khác đến biến thiên Xk Xi ta xét mối quan hệ tương quan riêng chúng Giả sử có m biến X1, ,Xm Xét hai thặng dư: q1 = x1 − m ∑ a i xi , q2 = x2 − i=3 m ∑ bi xi (5.5.25) i=3 Từ mục (5.5.3) ta thấy q1 q2 biểu thị phần lại X1 X2 sau trừ biến cho ước lượng tuyến tính tốt chúng theo biến X3, ,Xm Vậy xem hệ số tương quan hai thặng dư độ đo mức độ tương quan X1 X2 sau khử phần độ biến thiên ảnh hưởng biến X3, ,Xm gây nên Ta gọi hệ số tương quan riêng X1 X2 X3, ,Xm ký hiệu r12.34 m Ta có: r12.34 m = q 1q 2 q1 q 2 (5.5.26) Bây ta xây dựng cơng thức tính r12.34 m Muốn vậy, ta đưa vào số ký hiệu qui ước ký hiệu có mục (5.5.3): (Mjj) ma trận ma trận (Rki) sau bỏ hàng thứ j, cột thứ j Δjj.ki phần phụ đại số phần tử Mjj.ki (hàng k cột i Mjj) 174 Lưu ý số i,j,k lấy tương ứng theo biến Xi, Xj, Xk Khi đó, theo (5.5.23) ta có: Δ 22 Δ Δ 11 = 22 , s2 = q = q Δ 22.11 Δ 11.22 Δ 11.22 s21 = q = q (5.5.27) m ⎛ ⎛m ⎞ ⎞ q 1q = ⎜ x1 − ∑ a i x i ⎟ q = x1q − ⎜ ∑ a i x i ⎟ q = ⎝ ⎝ i=3 ⎠ ⎠ i=3 m ∑ a i xiq = x1 q − i=3 Hạng thứ hai vế phải i≠2 Do đó: m ⎛ ⎞ q q = x q = x1 ⎜ x − ∑ b i x i ⎟ ⎝ ⎠ i=3 Vì bi = − Δ 11.2 i , (i=3 m) nên suy ra: Δ 11.22 m q 1q = x1 ∑ i = Δ 11.22 = Δ11.22 Δ11.2 i x i = m ∑ Δ11.2i x1x i = Δ11.22 m i=2 Δ 12 ∑ Δ11.2i R1i = − Δ i=2 (5.5.28) 11.22 Thay (5.5.27) (5.5.28) vào (5.5.26) ta được: Δ 12 Δ 11.22 Δ 12 =− Δ 11Δ 22 Δ 11 Δ 22 Δ 11.22 Δ 11.22 − r12.34 m = (5.5.29) Một cách tổng quát, hệ số tương quan riêng hai biến Xk, Xi m−2 biến cịn lại tính cơng thức: rki.12 k-1,k+1 i-1,i+1 m = − Trường hợp riêng, m = ta có: 175 Δ ki Δ kk Δ ii (5.5.30) ⎛ R11 ⎜ (Rki) = ⎜ R 21 ⎜ ⎝ R 31 R 13 ⎞ ⎟ R 23 ⎟ ⎟ R 33 ⎠ R 12 R 22 R 32 R 21 Δ12 = (−1)(1+2) R R 23 R 33 = −(R21R33 − R23R31) = −s1s2 s (r12 −r23r31) R 22 Δ11 = (−1)(1+1) R 32 R 23 2 R 33 = R22R33 − R23R32 = s2 s (1 − r23 ) R 11 Δ22 = (−1)(2+2) R R 13 2 R 33 = R11R33 − R13R31 = s1 s (1 − r13 ) 31 31 Do r12.3 = − − ( R 21R 33 − R 23R 31 = ( R 22 R 33 − R 23R 32 )( R 11R 33 − R 31R 13 ) = r12− − r13r23 2 (1 − r13 )(1 − r23 ) (5.5.31) Khi biến không tương quan với hệ số tương quan riêng 0, cịn biến có tương quan với nói chung hệ số tương quan riêng khác hệ số tương quan tồn phần: r12.3 m ≠ r12 chí chúng cịn ngược dấu Cơng thức (5.5.31) cho thấy tính hệ số tương quan riêng từ hệ số tương quan toàn phần Trong trường hợp m > ta có cơng thức truy hồi sau: r12.34 m = r12.34 m−1 − r1m.34 m−1r2 m.34 m−1 (1 − r12m.34 m−1 )(1 − r2 m.34 m−1 ) (5.5.32) Hay viết dạng ma trận: r12.34 m = − P12 P11P22 (5.5.33) ký hiệu Pki có ý nghĩa Δki ma trận xuất phát ma trận tương quan chuẩn hoá (rki) 176 Cũng hệ số tương quan tồn phần, ta kiểm nghiệm độ rõ rệt hệ số tương quan riêng kiểm nghiệm t, với t= r 1− r2 / n − m , t có phân bố Student với (n−m) bậc tự 5.5.5 Tương quan bội $ Bây ta xét mối quan hệ X1 X1 hồi qui tuyến tính X1 lên biến X2, ,Xm Ta có phương trình hồi qui xác lập sở tập số liệu quan trắc {xti, t=1 n, i=1 m}: $ x1 = a2x2 + + amxm = m ∑ a i xi i=2 Ở ta giả thiết x i = , (i=1 m) Người ta chứng minh $ tất tổ hợp tuyến tính X1 theo Xi (i=2 m) X1 có tương $ quan tốt với X1 Như xem hệ số tương quan X1 X đặc trưng tương quan bên biến phụ thuộc X1 bên tập hợp m−1 biến độc lập X2, ,Xm Ta gọi hệ số tương quan bội hay hệ số tương quan tập hợp ký hiệu r1.23 m: r1.23 m = hay: [ $ M X1 X1 ] [ ] [ ] $2 M X1 M X1 r1.23 m = $ x1 x1 2 $ x1 x1 2 $ Ta có: x1x1 = x1 ( x1 − q ) = x1 − x1q = x1 − x1q q1 thặng dư x1 x2, , xm Theo (5.5.23) x1 q = q 177 (5.5.34) 2 $ x1x1 = x1 − q = s1 − Do đó: Δ Δ = R 11 − Δ 11 Δ 11 (5.5.35) 2 2 $2 x1 = ( x − q ) = x1 + q − x1 q = x1 + q − x1 q = = s1 + Δ Δ Δ Δ = s1 − = R 11 − −2 Δ 11 Δ 11 Δ 11 Δ 11 (5.5.36) Thay (5.5.35) (5.5.36) vào (5.5.34) ta được: R 11 − r1.23 m = Δ Δ 11 Δ R 11 ( R 11 − ) Δ 11 = 1− Δ Δ 11 = Δ (1 − ) Δ 11R 11 R 11 − = R 11 Δ R 11Δ 11 (5.5.37) Hoặc dạng khác: r1.23 m = − P P11 (5.5.38) P định thức ma trận tương quan chuẩn hoá, P11 phần phụ đại số phần tử r11 ma trận tương quan chuẩn hố Theo [4] với ma trận đối xứng xác định dương (Rki) ta có: < Δ ≤ R11Δ11 nên hệ thức dấu (5.5.37) không âm Vậy r1.23 m ≥ Với r1.23 m =1 nói chắn biến X1 tổ hợp tuyến tính biến X2, ,Xm Khi tồn điểm thực nghiệm nằm siêu phẳng hồi qui Hệ số tương quan bội r1.23 m tất r1i (i=2 m) 0, tức biến X1 không tương quan với biến X2, ,Xm Ví dụ 5.5 Từ số liệu quan trắc sản lượng lúa vụ thu (x1 − kg/ha) 178 nhiệt độ không khí trung bình mùa đơng năm trước (x2 − oC), nhiệt độ khơng khí trung bình mùa hè (thời gian gieo trồng) (x3 − oC), tổng lượng mưa suốt thời gian gieo trồng (x4 − mm) khu vực A 30 năm, ta cần nghiên cứu mối liên hệ x1 x2, x3, x4 để từ tiến hành xây dựng phương trình hồi qui dự báo sản lượng lúa Muốn ta tính hệ số tương quan cặp, hệ số tương quan riêng, hệ số tương quan bội hệ số hồi qui Kết tính tốn cho ta: 1) Ma trận tương quan chuẩn hoá: 0.59107 0.41082 0.46120⎞ ⎛ ⎜ ⎟ 0.67028 0.31838⎟ ⎜ 0.59107 (rki) = ⎜ 0.41082 0.67028 010720⎟ ⎜ ⎟ ⎠ ⎝ 0.46120 0.31838 0.10720 rki hệ số tương quan xk xi Bằng kiểm nghiệm độ rõ rệt hệ số tương quan, ta thấy tất rki, trừ r24 r34, lớn rõ rệt với mức ý nghĩa 5% Điều cho phép ta bác bỏ giả thiết không phụ thuộc x1 vào x2, x3, x4 Hơn nữa, từ ma trận tương quan ta có r12 lớn r13 cách đáng kể Như vậy, nhiệt độ mùa đơng năm trước có ảnh hưởng đến sản lượng lúa nhiệt độ mùa hè 2) Các hệ số tương quan riêng: r12.3=0.4666 r13.2=0.0244 r14.2=0.3570 r12.4=0.5281 r13.4=0.4096 r14.3=0.4602 Nếu lấy mức ý nghĩa α=1% để kiểm nghiệm độ rõ rệt hệ số tương quan riêng có r12.4 đạt tiêu chuẩn Các hệ số r12.3 r14.3 gần với tiêu chuẩn So sánh r13 (0.41082) với r13.2 r13.4 ta thấy bỏ qua ảnh hưởng nhiệt độ mùa đông năm trước (x2) làm giảm tương quan sản lượng x1 nhiệt độ mùa hè x3 xuống đến mức khơng đáng kể (r13.2=0.0244); cịn bỏ qua tác động lượng mưa (x4) không ảnh hưởng tới tương quan Cũng cách so sánh tương tự ta thấy tương 179 quan sản lượng nhiệt độ mùa đông không giảm nhiều bỏ qua ảnh hưởng nhiệt độ mùa hè lượng mưa Từ suy rằng, nhiệt độ mùa đông năm trước lượng mưa hai nhân tố quan trọng thực Trên ta tính hệ số tương quan riêng xét đến nhân tố ảnh hưởng Ta làm tương tự cho hệ số tương quan riêng r12.34, 3) Đối với hệ số tương quan bội: r1.23=0.5914 r1.24=0.6575 r1.34=0.5872 r1.234=0.6606 Việc so sánh r12 r1.23 cho ta nhận xét rằng, biết x2 việc biết thêm x3 khơng có ý nghĩa Hay nói cách khác, nhân tố x3 khơng cung cấp thêm lượng thông tin cho x1 có nhân tố x2 Tương tự vậy, giá trị r1.24 không nhỏ r1.234 5.5.6 Đánh giá chất lượng phương trình hồi qui tuyến tính nhiều biến Phương trình (5.5.6) ước lượng tuyến tính biến X1 theo biến X2, ,Xm hệ số (i=1 m) tìm sở tập số liệu ban đầu Nó thơng tin phản ánh mối quan hệ tuyến tính X1 biến X2, ,Xm Tuy nhiên để sử dụng cho mục đích xác định giá trị biến phụ thuộc X1 cần thiết phải đánh giá mức độ tin cậy đến đâu Điều có nghĩa ta cần phải trả lời câu hỏi mối liên hệ phụ thuộc X1 biến X2, ,Xm có ý nghĩa hay khơng Nói cách khác, ta cần kiểm tra giả thiết hệ số tương quan bội r1.23 m=0 (mà thực chất giả thiết tương đương với giả thiết a2=a3= =am=0) Để kiểm nghiệm giả thiết r1.23 m = ta lập biến mới: f= U = n $ ∑ ( x t1 − x1 ) U / ( m − 1) Q / ( n − m) tổng bình phương biến sai hồi qui, t =1 180 (5.5.39) Q= n $ ∑ ( x t1 − x t1 ) tổng bình phương biến sai thặng dư t =1 m $ x t1 = a1 + ∑ a i x ti giá trị hồi qui x1 theo x2, ,xm i=2 (m−1) (n−m) theo thứ tự bậc tự U Q Biến f (5.5.39) có phân bố Fisher với (m−1,n−m) bậc tự Vậy, ứng với xác suất phạm sai lầm loại I (α) ta hoàn toàn xác định giá trị Fα, tiêu kiểm nghiệm là: Nếu f ≥ Fα bác bỏ giả thiết đưa kết luận phụ thuộc tuyến tính X1 X2, ,Xm có ý nghĩa Nếu f < Fα chấp nhận giả thiết, tức chấp nhận không tồn quan hệ tuyến tính X1 X2, ,Xm Trong tính tốn thực hành, thay cho (5.5.39) người ta thường tính f theo cơng thức: f= r1223 m 1− r1223 m n−m m−1 (5.5.40) 5.6 TƯƠNG QUAN VÀ HỒI QUI PHI TUYẾN NHIỀU BIẾN Sự phụ thuộc tương quan biến phụ thuộc X1 m−1 biến độc lập X2, ,Xm tuyến tính Và nhiều trường hợp quan hệ (5.5.6) không phản ánh thực chất mối quan hệ X1 biến X2, ,Xm Bởi X1 số biến Xi (i=2 m) tồn quan hệ phi tuyến mà việc xấp xỉ hàm tuyến tính khơng chấp nhận Vậy vấn đề đặt làm để xây dựng quan hệ hàm: x1 = m1(x2, ,xm) (*) biểu diễn phụ thuộc X1 X2, ,Xm? Giải vấn đề nhiệm vụ toán hồi qui phi tuyến nhiều biến Sau ta xét 181 số phương pháp nghiên cứu phụ thuộc phi tuyến nhiều biến Cũng cần nhấn mạnh rằng, số biến độc lập lớn nói chung ta khơng hy vọng tìm hàm dạng (*) theo nghĩa kỳ vọng có điều kiện X1 với điều kiện X2=x2, Xm=xm Do đó, sau ta xét số phương pháp nghiên cứu phụ thuộc phi tuyến nhiều biến thường ứng dụng khí tượng, khí hậu 5.6.1 Liên kết mối quan hệ riêng rẽ Phương pháp tiến hành theo bước: 1) Nghiên cứu mối tương quan riêng biệt (cặp) X1 biến Xi để tìm qui luật phụ thuộc chúng Kết bước cho ta m−1 quan hệ hàm: x1 = f2(x2) x1 = f3(x3) x1 = fm(xm) Ở fi(xi) hồi qui II x1 lên xi: m1(xi) ≈ fi(xi) 2) Xác lập qui tắc liên kết fi(xi), (i=2 m), cho qui tắc biểu diễn phụ thuộc X1 vào Xi Tức cần tìm tốn tử tác dụng L cho: x1 = m1(x2, ,xm) ≈ f(x2, ,xm) f(x2, ,xm) = L{ f1(x1), f2(x2), , fm(xm)} Trong trường hợp L tốn tử tuyến tính ta biểu diễn: f(x2, ,xm) = m ∑ α i fi ( x i ) (5.6.1) i=2 $ 3) Xây dựng phương trình hồi qui x1 = f ( x , x , , x m ) , tức tìm hệ số hồi qui thực nghiệm, theo nguyên lý bình phương tối thiểu: R= n ∑ ( x t1 − f ( x t , x t , , x tm ) ⎯⎯→ t =1 Bước thực cách tuyến tính hố thành phần 182 phi tuyến thông qua việc đặt biến để đưa hàm phi tuyến f(x2, ,xm) dạng tuyến tính Người ta gọi cách làm tuyến tính bên phi tuyến bên ngồi Để dễ hình dung ta lấy ví dụ sau làm minh hoạ Giả sử cần xây dựng phương trình hồi qui Y với X1 X2: Y = f(X1, X2) Các bước cần tiến hành là: 1) Lập ma trận số liệu ban đầu {Yt, Xt1, Xt2, t=1 n} xây dựng quan hệ Y=f1(X1), Y = f2(X2) từ tập số liệu thực nghiệm Có thể tiến hành bước phương pháp đồ thị kết hợp tính tốn liên tiếp Để đơn giản, ta giả thiết quan hệ có dạng sau: f1(x1) = a x1 + bx1 + c f2(x2) = αe − x2 2) Chọn qui tắc liên kết tổ hợp tuyến tính: f(x1,x2) = A f1(x1) + B f2(x2) Khi đó, khai triển ta được: f(x1,x2) = Aa x1 + Abx1 + Ac + B αe − x2 Hay f(x1,x2) = βo + β1 x1 + β2x1 + β3 e − x2 3) Xây dựng phương trình hồi qui: Đây bước xác định hệ sô βi (i=0 3) phương trình Muốn vậy, ta đặt biến mới: u = x1 , v = x1 w = e − x2 đưa phương trình dạng f(x1,x2) = g(u,v,w) = βo + β1u + β2v + β3w Rõ ràng phương trình tuyến tính u, v, w Sử dụng cơng thức trình bày mục trước ta dễ dàng tìm được: y = βo + β1 x1 + β2x1 + β3 e − x2 (5.6.2) 5.6.2 Dạng phụ thuộc bậc hai (dạng toàn phương) Trong nhiều trường hợp, thay cho việc nghiên cứu tỷ mỉ mà chi hiệu phương pháp đây, người ta giả thiết phụ thuộc X1 vào Xi biểu diễn dạng đa thức bậc hai: 183 m m i=2 x1 = a1 + i=2 ∑ a i xi + ∑ bi x2 + i m ∑ c ij x i x j i, j= 2,i < j Như vậy, vế phải có tất M = (m−1)+(m−1)+ ( m − 1)( m − ) hạng tử chứa xi Muốn xây dựng phương trình hồi qui ta phải tìm tất (m−1) + (m−1) + ( m − 1)( m − ) +1 = (M+1) hệ số ai, bi, cij Tuy nhiên nhận thấy rằng, so với số biến độc lập ban đầu (m−1) số thành phần phương trình hồi qui tăng lên cách đáng kể Chẳng hạn, m=4, phương trình hồi qui chứa tất 3+3+3=9 hạng tử vế phải chứa biến ta phải tìm 10 hệ số hồi qui Để tìm hệ số hồi qui thông thường ta đặt biến mới: zi-1 = xi, i=2 m, zm-1+i-1 = x , i=2 m, i z2m-2+k = xixj, i,j=2 m, i

Ngày đăng: 10/08/2014, 01:21

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan