Luận văn thạc sĩ phân tích thống kê thổ nhưỡng đất trồng trọt của huyện thanh ba phú thọ

62 2 0
Luận văn thạc sĩ phân tích thống kê thổ nhưỡng đất trồng trọt của huyện thanh ba   phú thọ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN NGUYỄN THỊ HUYỀN PHÂN TÍCH THỐNG KÊ THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA – PHÚ THỌ LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội – Năm 2012 z ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN NGUYỄN THỊ HUYỀN PHÂN TÍCH THỐNG KÊ THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA – PHÚ THỌ Chuyên ngành: Mã số: Lý thuyết xác suất thống kê toán học 60 46 15 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS HỒ ĐĂNG PHÚC Hà Nội – Năm 2012 z Mục lục Lời nói đầu Một số kiến thức thống kê liên quan 1.1 Các khái niệm 1.1.1 Vectơ ngẫu nhiên 1.1.2 Tích vơ hướng hai vectơ 1.1.3 Chuẩn vectơ 1.1.4 Khoảng cách hai vectơ 1.1.5 Các loại khoảng cách thường dùng 1.2 Phân tích chùm 1.2.1 Phân tích chùm gì? 1.2.2 Khái quát phân tích chùm 1.2.3 Các bước phân tích chùm 1.2.4 Kiểm tra độ phù hợp phân nhóm 1.3 Phân tích thành phần 1.3.1 Cấu trúc thành phần 1.3.2 Các thành phần biến chuẩn hóa 1.3.3 Phân tích thành phần dựa mẫu 1.3.4 Các kết luận thống kê dựa mẫu lớn Ứng dụng phân tích thổ nhưỡng đất trồng trọt huyện Thanh Ba - Phú Thọ 2.1 Phần mềm trợ giúp việc tính toán 2.1.1 Giới thiệu chung 2.1.2 Phần mềm SPSS 2.1.3 Sử dụng SPSS phân tích chùm 2.1.4 Sử dụng SPSS phân tích thành phần 2.2 Số liệu thổ nhưỡng đất 2.2.1 Thổ nhưỡng đất z 5 10 10 11 11 13 13 14 16 26 28 28 34 36 38 40 40 40 40 41 43 46 46 MỤC LỤC 2.3 2.4 2.2.2 Sơ lược điều tra đất 2.2.3 Một số vấn đề phẫu diện đất Thanh Ba - Phú Thọ Kết áp dụng phương pháp phân tích chùm Kết áp dụng phương pháp phân tích thành phần Tài liệu tham khảo 47 47 50 54 60 z LỜI NĨI ĐẦU Phân tích chùm (Cluster Analysis - CA) phương pháp thống kê nhằm phân loại đối tượng (các biến) cho đối tượng (biến) giống so với đối tượng (biến) khác nhóm dựa vào vài tiêu chí xác định trước Phân tích thành phần (Principal Component Analysis - PCA) phương pháp thống kê nhằm rút gọn số liệu, biểu diễn giải thích tập số liệu dựa việc biến đổi phân tích cấu trúc ma trận hiệp phương sai vectơ ngẫu nhiên thơng qua việc phân tích tổ hợp tuyến tính thành phần Trong khn khổ thời gian cho phép luận văn Thạc sĩ, mục tiêu luận văn tìm hiểu, hệ thống lại kiến thức có liên quan đến Phân tích chùm, Phân tích thành phần góc độ sở tốn học ứng dụng từ phân tích số liệu cụ thể Luận văn chia làm hai chương: Chương đề cập đến số kiến thức thống kê liên quan Các khái niệm lý thuyết xác suất thống kê liên quan đến Phân tích chùm Phân tích thành phần vectơ ngẫu nhiên, khoảng cách hai vectơ Sau trình bày chi tiết Phân tích chùm Phân tích thành phần chính, sở toán học cho ứng dụng luận văn Chương hai giới thiệu sơ lược phần mềm trợ giúp việc tính tốn, thổ nhưỡng đất Từ đó, đưa kết luận cho số liệu thổ nhưỡng đất trồng trọt huyện Thanh Ba - Phú Thọ Với kiến thức chuyên ngành chưa sâu sắc nên luận văn đưa số kết ban đầu Tuy nhiên, kết có phù hợp với phân tích chuyên ngành thực tế z Lời cảm ơn Trước tiên xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo hướng dẫn - Phó giáo sư, Tiến sĩ Hồ Đăng Phúc, người thầy động viên, giúp đỡ hướng dẫn tơi tận tình q trình hồn thành luận văn Tôi xin gửi lời cảm ơn chân thành tới thầy cô giáo tổ Xác suất Thống kê giúp đỡ tơi nhiều q trình học tập làm luận văn Đặc biệt, xin gửi lời cảm ơn đến thầy giáo Lê Đức Vĩnh - Ngun trưởng mơn Tốn Trường Đại học Nơng Nghiệp Hà Nội nhiệt tình giúp đỡ, cung cấp liệu xác số kiến thức giúp tơi hồn thành luận văn Cuối lời cảm ơn chân thành tới gia đình, bạn bè người động viên, giúp đỡ tơi q trình thực luận văn Hà Nội, tháng 02 năm 2012 z Chương Một số kiến thức thống kê liên quan 1.1 Các khái niệm 1.1.1 Vectơ ngẫu nhiên Vectơ ngẫu nhiên n chiều ánh xạ từ khơng gian mẫu Ω vào Rn Hay nói cách khác, vectơ ngẫu nhiên X = (X1 , , Xn) vectơ mà thành phần X1 , , Xn biến ngẫu nhiên Ma trận ngẫu nhiên Nếu X = (Xi j ) ma trận cấp n × p mà thành phần Xi j biến ngẫu nhiên gọi ma trận ngẫu nhiên Vectơ trung bình ma trận phương sai Cho X = (X1 , , Xn)T ma trận ngẫu nhiên n×1 Vectơ EX = (EX1 , , EXn)T = (μ1 , , μn )T gọi vectơ giá trị trung bình Đại lượng σii = E(Xi − μi )2, i = 1, , n gọi phương sai Xi ; σi j = E(Xi −μi )(X j −μi ) với μi = E(Xi ), μ j = E(X j ) gọi hiệp phương sai hai biến Xi X j , dễ dàng nhận thấy σi j = +∞  +∞  −∞ −∞ (xi − μi )(x j − μ j ) fi j (xi , x j )dxi dx j = +∞  +∞  −∞ −∞ xi x j fi j (xi , x j )dxi dx j − μi μ j (Xi , X j ) có mật độ đồng thời fi j (xi , x j ),   (xi − μi )(x j − μ j )pi j (xi , x j ) = xi x j pi j (xi , x j ) − μi μ j σi j = xi x j xi x j (Xi , X j ) biến ngẫu nhiên rời rạc với xác suất đồng thời P(Xi = xi , X j = x j ) = pi j (xi , x j ) tổng chạy theo tất xi (tương ứng x j ) miền giá trị biến ngẫu nhiên Xi (tương ứng X j ) Nếu i  j σi j = biến ngẫu nhiên Xi X j gọi không tương quan Xi X j gọi độc lập z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN P(Xi < xi , X j < x j ) = P(Xi < xi )P(X j < x j ), ∀xi , x j ∈ R1 Đẳng thức tương đương với đẳng thức sau fi j (xi , x j ) = fi (xi ) f j (x j ), ∀xi , x j , Xi , X j có mật độ đồng thời fi j mật độ riêng fi (xi ), f j (x j ), p j (xi , x j ) = pi (xi )p j (x j ) Xi , X j biến ngẫu nhiên rời rạc có xác suất đồng thời p j (xi , x j ) xác suất riêng pi (xi ), p j (x j ) Ta gọi EX = (EXi j ) ma trận giá trị trung bình, ⎧  ⎪ xi j p j (xi j ) Nếu Xi j biến ngẫu nhiên rời rạc có hàm xác suất pi j (xi j ) ⎪ ⎪ ⎪ ⎪ ⎨ xi j +∞ EXi j = ⎪  ⎪ ⎪ ⎪ xi j fi j (x)dx Nếu Xi j biến ngẫu nhiên liên tục có hàm mật độ fi j (xi j ) ⎪ ⎩ −∞ Chú ý, Xi X j độc lập σi j = 0, điều ngược lại trường hợp Xi , X j có phân phối chuẩn Ma trận hiệp phương sai: Kí hiệu cov(X − μ)(X − μ)T = [E(Xi − μi )(X j − μ j )]  gọi ma trận hiệp phương sai vectơ X Đặt = cov(X) = (σi j )  ma trận đối xứng xác định không âm cấp n σi j ; σii = Hệ số tương quan ma trận tương quan: Đại lượng ρi j = √ σii σ j j gọi hệ số tương quan Xi X j , ma trận ⎤ ⎡ ⎡ ⎤ ⎢⎢⎢ ρ12 ρ1n ⎥⎥⎥ ⎢⎢⎢ ρ12 ρ1n ⎥⎥⎥ ⎥ ⎢ ⎢⎢⎢ ⎥ ⎢⎢⎢ ρ21 ρ2n ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ ρ2n ⎥⎥⎥⎥⎥ ⎥⎥ ⎥⎥ = ⎢⎢ ρ = ⎢⎢⎢⎢ ⎢⎢⎢ ⎥⎥⎥⎥⎥ ⎢⎢⎢⎢⎢ ⎥⎥⎥⎥⎥ ⎥⎦⎥ ⎥⎦⎥ ⎢⎣⎢ ⎢⎣⎢ ρn1 ρn2 gọi ma trận tương quan véc tơ X  Ta tính ma trận ρ từ ma trận sau: ⎡ ⎤ ⎢⎢⎢ σ11 ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎢⎢⎢ σ22 ⎥⎥⎥⎥⎥ ⎥⎥ = diag(σ11 , σ22 , , σnn ) V = ⎢⎢⎢⎢ ⎢⎢⎢ ⎥⎥⎥⎥⎥ ⎢⎣⎢ ⎥⎦⎥ 0 σnn z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN Đặt √ √ √ V 1/2 = diag( σ11 , σ22 , , σnn ) 1 V −1/2 = diag( √ , √ , , √ ) σ11 σ22 σnn Khi ρ = V −1/2 ΣV −1/2 Vectơ giá trị trung bình ma trận hiệp phương sai tổ hợp tuyến tính vectơ ngẫu nhiên Cho X1, X2 , , Xn biến ngẫu nhiên thực, a, b, c, c1, , cn số thực Khi ta có E(cX1) = cE(X1 ) var(cX1) = E(cX1 − cμ1 )2 = c2 E(X1 − μ1 )2 = c2 var(X1 ) cov(aX1 , bX2) = E(aX1 − aμ1 )(bX2 − bμ2) = abE(X1 − μ1 )(X2 − μ2 ) = abcov(X1 , X2) var(aX1 + bX2 ) = E(aX1 + bX2 − aμ1 − bμ2 )2 = E[a(X1 − μ1 ) + b(X2 − μ2 )]2 = E[a2(X1 − μ1)2 + b2(X2 − μ2 )2 + 2ab(X1 − μ1 )(X2 − μ2 )] = a2σ11 + b2σ22 + 2abσ12 Đặt C T = [a, b], ⎤ ⎡ ⎢⎢⎢ X1 ⎥⎥⎥ ⎥⎥⎦ = C T X, aX1 + bX2 = [a b] ⎢⎢⎣ X2 aEX1 + bEX2 = aμ1 + bμ2 = C T EX Vậy, E(C T X) = C T EX, ⎡ ⎢⎢ σ11 σ12 var(aX1 + bX2) = var(C T X) = C T ⎢⎢⎢⎣ σ21 σ22 z ⎤ ⎥⎥⎥ ⎥⎥⎦ C CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN Một cách tổng quát, tổ hợp tuyến tính C T X = c1 X1 + c2 X2 + + cn Xn ta có E(C T X) = C T EX, var(C T X) = C T  C Tổng quát hơn, ta xét q tổ hợp tuyến tính z1 = c11 X1 + c12 X2 + + c1n Xn , z2 = c21 X1 + c22 X2 + + c2n Xn , zq = cq1 X1 + cq2 X2 + + cqn Xn dạng ma trận ⎡ ⎢⎢⎢ z1 ⎢⎢⎢ ⎢⎢⎢ z2 Z = ⎢⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎣ zq ⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ c11 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ c21 ⎥⎥⎥ = ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎦ ⎣ cq1 ⎤⎡ ⎤ ⎥⎥⎥ ⎢⎢⎢ X1 ⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥ ⎥⎥⎥ ⎢⎢⎢ X2 ⎥⎥⎥⎥⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ = CX ⎢ ⎥ ⎢ ⎥ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥⎥⎥ ⎥⎦ ⎦⎥ ⎣⎢ cq2 cqn Xq c12 c1n c22 c2n EZ = CEX;  Z = cov(Z) = cov(CX) = C  XC T Vectơ trung bình mẫu ma trận hiệp phương sai mẫu Xét véc tơ ngẫu nhiên X T = (X1 , X2, , X p ) Ta thực n quan sát độc lập X T Giả sử quan sát lần thứ ta thu X1 = (x11 , x12 , , x1p ), quan sát lần thứ hai ta thu X2 = (x21 , x22 , , x2p ), , quan sát thứ n ta thu Xn = (xn1 , xn2 , , xnp ) Kí hiệu ⎡ T ⎢⎢⎢ X1 ⎢⎢⎢ ⎢⎢⎢ X T X = ⎢⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎣ XnT ⎤ ⎡ ⎥⎥⎥ ⎢⎢⎢ x11 ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ x21 ⎥⎥⎥ = ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎥⎥⎥ ⎢⎢⎢ ⎦ ⎣ xn1 ⎤ x12 x1p ⎥⎥⎥ ⎥⎥⎥ x22 x2p ⎥⎥⎥⎥ ⎥⎥ ⎥⎥⎥⎥ ⎥⎥⎦ xn2 xnp ma trận tạo quan sát Đặt z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN  0.172 = 0.0215 = 2.15% E( j )2/(σ11 + σ22 + σ33 ) = 1.3.2 Các thành phần biến chuẩn hóa Vì tính tốn với ma trận tương quan ρ ổn định so với việc tính tốn  ma trận hiệp phương sai nên người ta hay xét thành phần biến chuẩn hóa Z1 = (X1 − μ1 )/σ1/2 11 , Z2 = (X2 − μ2 )/σ1/2 22 , ······ Zk = (Xk − μk )/σ1/2 kk Đặt Z = (Z1 , Z2 , , Zk )T ta có Z = V −1/2 (X − μ), V = diag(σ11 , σ22 , , σkk ) Khi đó, EZ = 0, var(Z) = V −1/2  V −1/2 = ρ, thành phần Z xác định nhờ vectơ riêng ρ, vectơ  riêng nói chung khác với vectơ riêng Mệnh đề sau cho công thức định thành phần biến chuẩn hóa Mệnh đề 1.3.9 Thành phần thứ i vectơ chuẩn hóa Z = (Z1 , Z2 , , Zk ) với ma trận tương quan ρ xác định Yi0 = eTi Z = eTi V −1/2 (X − μ), i = 1, k Hơn nữa, k  i=1 D(Yi0 ) = k  i=1 D(Zi ) = k, 34 z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN √ ρ(Yi0 , Z j ) = ei j λi , i, j = 1, k, (λ1 , e1 ), , (λk , ek ) vectơ riêng ρ với λ1 ≥ λ2 ≥ · · · ≥ λk Ví dụ 1.3.10 Giả sử X = (X1, X2 ) có ma trận hiệp phương sai ⎤ ⎡ ⎢⎢⎢ ⎥⎥⎥ ⎥⎥⎦ Σ = ⎢⎢⎣ 225 ma trận tương quan tương ứng ⎡ ⎤ ⎢⎢⎢ 0.6 ⎥⎥⎥ ⎥⎥⎦ ρ = ⎢⎢⎣ 0.6 Σ có cặp giá trị riêng vectơ riêng λ1 = 225.36, eT1 = (0.04; 0.997) λ2 = 0.64, eT2 = (0.997; −0.04) Cịn ρ có cặp giá trị riêng vectơ riêng λ1 = 1.6, eT1 = (0.707; 0.707) λ2 = 0.4, eT2 = (0.707; −0.707) Các thành phần (X1, X2 )T Y1 = 0.04(X1 − μ1) + 0.997(X2 − μ2 ) Y2 = 0.997(X1 − μ1 ) − 0.04(X2 − μ2 ) Còn thành phần (Z1 , Z2 )T Y10 = 0.707Z1 + 0.707Z2 = 0.707(X1 − μ1 ) + 0.707(X2 − μ2 )/15 = 0.707(X1 − μ1 ) + 0.047(X2 − μ2 ) Y20 = 0.707Z1 − 0.707Z2 = 0.707(X1 − μ1 ) − 0.707(X2 − μ2 ) = 0.707(X1 − μ1 ) − 0.047(X2 − μ2 ) 35 z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN 1.3.3 Phân tích thành phần dựa mẫu Bây ta chuyển sang tìm hiểu tính chất thống kê phân tích thành phần sử dụng ma trận hiệp phương sai mẫu Giả sử ta có n quan sát độc lập  X1 , X2 , , Xn vectơ ngẫu nhiên k chiều, X có EX = μ var(X) = Các số liệu sinh vectơ trung bình mẫu X, ma trận hiệp phương sai mẫu S ma trận tương quan mẫu R Với Xm = (xm1, xm2 , , xmk )T ∈ Rk 1 X= Xm , X = (x1 , x2 , , xk )T , n m=1 n 1 S = (si j )i, j=1,k , si j = (xmi − xi )(xm j − x j ), n m=1 si j R = (ri j )i, j=1,n , ri j = (sii s j j )1/2 n Ta xây dựng tổ hợp tuyến tính thành phần số đo Xi cho tổ hợp khơng tương quan với có phương sai mẫu lớn Với a ∈ Rk , tổ hợp tuyến tính aT1 Xm = a11 xm1 + a12 xm2 + + a1k xmk , m = 1, n quan sát biến ngẫu nhiên (aT X) Vì dãy (aT1 Xm )nm=1 mẫu (aT X) với trung bình mẫu aT X phương sai mẫu aT S a Hơn nữa, hai dãy (aT1 Xm )nm=1 (aT2 Xm )nm=1 có hiệp phương sai mẫu aT1 S a2 Các thành phần mẫu định nghĩa sau: Y2m, ,  Ykm thành phần mẫu thứ 1, 2, , k mẫu X1 , X2, , Xn Gọi  Y1m ,  Y1m = aT1 Xm Vectơ a1 chọn Thành phần thứ ( Y1m )nm=1 với  cho phương sai mẫu aT1 S a1 đạt giá trị lớn với điều kiện aT1 a1 = Thành phần thứ hai ( Y2m )nm=1 với  Y2m = aT2 Xm Vectơ a2 chọn cho phương sai mẫu aT2 S a2 đạt giá trị lớn với điều kiện aT1 S a2 = 0; aT2 a2 = 36 z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN Thành phần thứ k ( Ykm )nm=1 với  Ykm = aTk Xm Vectơ ak chọn cho phương sai mẫu aTk S ak đạt giá trị lớn với điều kiện aTi S ak = 0, ∀i = 1, k − 1; aTk ak = Khi đó, ta xác định thành phần mẫu thứ i mệnh đề sau: Mệnh đề 1.3.11 Giả sử ( λ1 , e1 ), , ( λk , ek ) k cặp giá trị riêng vectơ riêng ma trận hiệp phương sai mẫu S Khi đó, thành phần mẫu thứ i  Yim =  eTi Xm =  ei1 xm1 +  ei2 xm2 + +  eik xmk , i = 1, k; m = 1, n, λ2 ≥ ≥  λk Tổng quát, x = (x1 , , xk )T quan sát  λ1 ≥  vectơ ngẫu nhiên X = (X1, , Xk )T  yi =  eTi X =  ei1 x1 +  ei2 x2 + +  eik xk , i = 1, k thành phần mẫu thứ i, ứng với quan sát x, dựa mẫu X1, , Xn Hơn λi , i = 1, k Hiệp phương sai mẫu  yi  y j nữa, phương sai mẫu  yi  0, ∀i  j k  λ1 +  λ2 + +  λk , hệ số tương quan mẫu Phương sai mẫu tổng cộng sii =  i=1 ryi ,x j   ei j  λi = √ ; i, j = 1, k sjj Nếu ta thay mẫu X1, , Xn mẫu rút gọn X10 , , Xn0 Xm0 = (x0m1 , , x0mk )T với x0mi = (xmi − xi )/s1/2 ii , i = 1, k, m = 1, n ma trận hiệp phương sai mẫu mẫu X , , Xn0 R thành phần mẫu  Y mẫu X , , Xn0 im 1 thực tương tự thay S R Ví dụ 1.3.12 Xét lại Ví dụ 1.2.1 tìm hiểu mối liên hệ giống lúa, thời gian sinh trưởng đặc điểm hình thái 16 dòng lúa vụ mùa năm 2009 Gia Lâm - Hà Nội Từ bảng số liệu ta tính X = [123.8125; 103.84375; 26.98125; 31.69375; 1.50625; 10.89375] ma trận phương sai 37 z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN ⎡ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎢⎢ ⎢⎣ ⎤ 4.652 1.033 1.678 0.174 0.189 1.036 ⎥⎥⎥ ⎥⎥⎥ 1.033 10.490 2.540 0.230 0.253 1.026 ⎥⎥⎥⎥ ⎥⎥ 1.678 2.540 3.963 3.856 0.146 0.818 ⎥⎥⎥⎥ ⎥⎥⎥ 0.174 0.230 3.856 15.077 0.099 0.149 ⎥⎥⎥⎥ ⎥⎥ 0.189 0.253 0.146 0.099 0.026 0.113 ⎥⎥⎥⎥⎥ ⎥⎦ 1.036 1.026 0.818 0.149 0.113 0.632 ta nhận hệ số thành phần mẫu (các thành phần vectơ  ei ) hệ số tương quan (trong dấu ngoặc) thành phần  yi với thành phần x j sau: Các biến  e1 (ry1 ,x j )  e2 (ry2 ,x j )  e3  e4  e5  e6 thoigian 0.082(0.155) 0.203(0.318) 0.871 -0.404 0.172 0.005 caocay 0.197(0.247) 0.901(0.939) -0.329 -0.197 0.050 0.010 caobong 0.334(0.683) 0.214(0.363) 0.291 0.860 0.137 -0.016 dailadong 0.917(0.961) -0.925(-0.804) -0.122 -0.237 -0.028 0.009 rongladong 0.013(0.328) 0.025(0.523) 0.026 -0.012 -0.168 -0.985 gocla 0.044(0.225) 0.118(0.501) 0.180 0.048 -0.959 0.172 Phương sai ( λi ) 16.555 11.392 5.017 1.571 0.300 0.004 % tổng phương sai 47.52% 80.22% 94.62% 99.13% 99.99% 100% Vấn đề đặt cần giữ lại thành phần giải thích vấn đề có liên quan đến thành phần Thơng thường thành phần ứng với  λi với  λi ≈ khơng đóng vai trị phân tích số liệu ta loại Như ví dụ ta cần giữ lại ba thành phần chúng giải thích 94.62% biến thiên số liệu Trong thực hành, khảo sát mẫu số liệu cụ thể số thành phần chọn cịn phụ thuộc vào ý nghĩa thực tế Dựa vào cấu trúc thành phần người ta giải thích vai trò biến Xi thành phần từ có lý giải vai trò nhân tố tự nhiên xã hội 1.3.4 Các kết luận thống kê dựa mẫu lớn Việc giữ lại thành phần dựa giá trị riêng λi ma trận hiệp phương sai lớn hay bé Tuy nhiên, λi chưa biết Hơn nữa, chất lượng thành phần thứ i phụ thuộc vào λi vectơ riêng ei Vì vậy, việc tìm khoảng tin cậy λi , vectơ riêng ei thành phần Yi dựa 38 z CHƯƠNG MỘT SỐ KIẾN THỨC THỐNG KÊ LIÊN QUAN mẫu ngẫu nhiên X1 , , Xn cần nghiên cứu Tuy vậy, việc xác định phân bố ei khó Tuy nhiên, người ta thu phân bố mẫu  λi  λi   ei sau Phân bố mẫu  λi  ei Giả thiết X1, , Xn n quan sát độc lập vectơ X có phân bố chuẩn Nk (μ, Σ), Σ ma trận xác định dương với giá trị riêng λ1 > λ2 > > λk > chưa biết Giả sử ( λi , ei ) cặp giá trị riêng vectơ riêng ma λ2 ≥ ≥  λk Khi đó, trận hiệp phương sai mẫu S cho  λ1 ≥  Đặt Λ ma trận chéo với giá trị riêng λ1 , λ2 , , λk đường chéo √ λ − λ) có phân bố gần chuẩn Nk (0, 2Λ2), λT = Khi n( (λ1 , λ2 , , λk ),  λT = ( λ1 ,  λ2 , ,  λk ) Đặt Ei = λi λj e eT , i j (λ − λ ) j=1, ji j i k  e j vectơ riêng ứng với giá trị riêng λ j có phân bố xấp xỉ chuẩn Nk (0, Ei)  √ Khi n( ei − ei ) Mỗi  λi có phân bố độc lập với phần tử  ei Từ kết luận ta nhận α  √ P{| λi − λi | ≤ u λi 2/n} = − α khoảng tin cậy với mức tin cậy − α λi   λi λi < λ < i α  √ α  √ 1+u 2/n 1−u 2/n 2 Ví dụ 1.3.13 Xét Ví dụ 1.2.1 ta có Khoảng tin cậy mức 0.95(α = 0.05) λ1 λ6 16.555 16.555 < λ1 < √ √ + 1.96 2/16 − 1.96 2/16 9.779 < λ1 < 53.918 0.3 0.3 < λ6 < √ √ + 1.96 2/16 − 1.96 2/16 0.177 < λ6 < 0.977 39 z Chương Ứng dụng phân tích thổ nhưỡng đất trồng trọt huyện Thanh Ba - Phú Thọ 2.1 Phần mềm trợ giúp việc tính tốn 2.1.1 Giới thiệu chung Qua Ví dụ 1.2.1 sử dụng phân tích chùm phân tích thành phần phần lý thuyết trên, ta thấy rằng, ngun tắc hồn tồn tính tốn bình thường dùng phần mềm thống kê Maple, Minitab, SPSS Luận văn sử dụng phần mềm Maple cho việc tính tốn với lượng số liệu ví dụ, dùng phần mềm Minitab để chạy thử số liệu ứng dụng Tuy nhiên với số lượng liệu lớn hai phần mềm Maple Minitab khơng hiệu Vì luận văn trình bày ứng dụng sử dụng phần mềm SPSS 2.1.2 Phần mềm SPSS SPSS tên viết tắt phần mềm thống kê tiếng "Statistical Packages for Social Sciences" công ty SPSS (Mỹ) Phần mềm phát triển từ năm 1960, lúc đầu hoạt động máy tính lớn Khi máy tính cá nhân trở thành phổ biến, công ty SPSS thành công việc đưa phiên SPSS chạy hệ điều hành Windows SPSS trở thành công cụ phân tích thống kê khơng thể thiếu để thực phương pháp phân tích định lượng Gần đây, cơng 40 z CHƯƠNG ỨNG DỤNG TRONG PHÂN TÍCH THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA - PHÚ THỌ ty SPSS đổi tên phần mềm SPSS thành PASW (Predictive Analytics Software) Statistics nhằm thể ý tưởng kết hợp cơng cụ thống kê tốn học với việc phân tích dự báo Sau trình bày lại Ví dụ1.2.1 mối liên hệ giống lúa, thời gian sinh trưởng đặc điểm hình thái 16 dòng lúa vụ mùa năm 2009 Gia Lâm - Hà Nội trình bày 2.1.3 Sử dụng SPSS phân tích chùm Mở tệp liệu gionglua.sav vào analyze Classify Hierarchical cluster Chọn tất biến vào Variables Label cases by Dòng Trong statistics, Plots Method chọn hình sau 41 z CHƯƠNG ỨNG DỤNG TRONG PHÂN TÍCH THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA - PHÚ THỌ Ta kết sau: Hình 2.1: Phân nhóm khơng gian biến 42 z CHƯƠNG ỨNG DỤNG TRONG PHÂN TÍCH THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA - PHÚ THỌ Hình 2.1 biểu diễn phân nhóm khơng gian biến theo liên kết đơn Từ đồ thị ta thấy Nếu cắt đồ thị mức ta ba nhóm (34), (56), (1)và (2) Cắt mức ta hai nhóm (3456) (12) Và cuối (123456) lập thành nhóm Giống với việc tính tốn Ví dụ 1.2.1 Tuy nhiên, khơng phải tính tốn nhiều, có đồ thị minh họa trực quan hơn, số liệu lượng lớn làm Ngồi cịn phân tích chùm khơng gian đối tượng 2.1.4 Sử dụng SPSS phân tích thành phần Mở tệp Gionglua.sav vào analyze Data reduction Factor analysis Chọn biến vào Variables Trong Descriptives, Extraction, Ratation, Scores Options chọn sau: 43 z CHƯƠNG ỨNG DỤNG TRONG PHÂN TÍCH THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA - PHÚ THỌ 44 z CHƯƠNG ỨNG DỤNG TRONG PHÂN TÍCH THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA - PHÚ THỌ Từ ta có kết quả: Hình 2.2: Đồ thị biểu diễn thành phần Từ đồ thị ta nên chọn hai thành phần Tuy nhiên để biết thành phần thứ liên quan đến đối tượng nào, thành phần thứ hai liên quan đến đối tượng ta xem ma trận tương quan sau Hình 2.3: Ma trận tương quan Dựa vào ma trận ta biết thành phần thứ liên quan chủ yếu đến chiều rộng địng góc Cũng có liên quan thời gian 45 z CHƯƠNG ỨNG DỤNG TRONG PHÂN TÍCH THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA - PHÚ THỌ sinh trưởng chiều cao bơng Thành phần thứ hai liên quan chủ yếu chiều dài địng Hình 2.4: Biểu diễn đối tượng mặt phẳng Từ mặt phẳng ta biết phân bố đối tượng Tuy nhiên, số liệu Ví dụ q kết luận cụ thể khó đưa Chúng ta sử dụng hai loại phân tích với phần mềm SPSS để khảo sát liệu lớn sau 2.2 Số liệu thổ nhưỡng đất 2.2.1 Thổ nhưỡng đất Thổ nhưỡng đất mặt tơi xốp vỏ lục địa, có độ dầy khác nhau, sản suất sản phẩm trồng Nguồn gốc đất từ đá mẹ nằm thiên nhiên lâu đời bị phá hủy tác dụng yếu tố lý học, hóa học sinh học Tiêu chuẩn để phân biệt đá mẹ đất độ phì nhiêu, chưa có độ phì nhiêu, thực vật cao cấp chưa sống chưa gọi thổ nhưỡng Các yếu tố hình thành đất đá mẹ, mẫu chất, sinh vật (động vật, thực vật vi sinh vật), khí hậu, địa hình, thời gian người Các loại đá nằm thiên nhiên chịu tác dụng lý học, hóa học sinh học bị phá hủy thành sản phẩm gọi mẫu chất Trong mẫu chất có 46 z CHƯƠNG ỨNG DỤNG TRONG PHÂN TÍCH THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA - PHÚ THỌ nguyên tố hóa học chứa đá mẹ sinh nó, cịn thiếu số thành phần quan trọng chất hữu cơ, đạm nước thực vật cao cấp chưa sống Trải qua thời gian dài nhờ tác dụng sinh vật tích lũy chất hữu đạm, thực vật cao cấp sống được, có nghĩa hình thành thổ nhưỡng Dù đất nơng nghiệp, đất lâm nghiệp, đất đồng cỏ, chí đất hoang gồm có thành phần cụ thể thổ nhưỡng gồm chất rắn (chất vô cơ, chất hữu cơ), khe hở hạt (không khí, nước) lồi sinh vật 2.2.2 Sơ lược điều tra đất Địa điểm đào phẫu diện phải thật đại diện cho khu vực điều tra Sau đào phẫu diện đào đến gặp tầng cứng rắn, đá mẹ đến độ sâu tối thiểu 125cm chưa gặp tầng cứng rắn, chiều rộng 70 - 80cm, chiều dài 1.2 - 2.0m Khi gặp loại đất giống đất phẫu diện gần đào phẫu diện phụ sâu 100cm Lấy mẫu đất phân tích theo trình tự sau: lấy mẫu đất đáy phẫu diện, sau lấy dần lên tầng trên, lấy tất tầng phát sinh, lấy theo độ dày tầng đất, tầng dày chưa đến 50cm lấy mẫu, tầng dày 50 - 90cm lấy hai mẫu, tầng dày 90cm lấy ba mẫu mẫu đất phải lấy đủ trọng lượng 1kg Lấy đất tầng cho vào ngăn hộp tiêu giấy, gỗ nhựa Đất cho vào hộp phải giữ dạng tự nhiên đặc trưng cho tất tầng đất Sau mơ tả phẫu diện đất 2.2.3 Một số vấn đề phẫu diện đất Thanh Ba - Phú Thọ Dựa vào số liệu điều tra ta biết phẫu diện đất Cụ thể số liệu luận văn sau Số liệu điều tra xã Hanh Cù, Vô Lao, Thanh Xá, n Nội, Đơng Lĩnh, Chí Tiến, TT Thanh Ba, Thái Ninh, Đồng Xuân, Thanh Vân, Lương Lỗ, Đỗ Sơn, Đông Thành, Năng Yên, Quảng Nạp, Khải Xuân, Hoàng Cương, Thanh Hà, Đỗ Xuyên, Yểu Khê, Sơn Cương, Mạn Lan, Phương Lĩnh, Ninh Dân huyện Thanh Ba tỉnh Phú Thọ Trong đó, điều tra địa hình, thành phần giới, màu sắc, 47 z ... NGUYỄN THỊ HUYỀN PHÂN TÍCH THỐNG KÊ THỔ NHƯỠNG ĐẤT TRỒNG TRỌT CỦA HUYỆN THANH BA – PHÚ THỌ Chuyên ngành: Mã số: Lý thuyết xác suất thống kê toán học 60 46 15 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI... qua việc phân tích tổ hợp tuyến tính thành phần Trong khn khổ thời gian cho phép luận văn Thạc sĩ, mục tiêu luận văn tìm hiểu, hệ thống lại kiến thức có liên quan đến Phân tích chùm, Phân tích thành... cho số liệu thổ nhưỡng đất trồng trọt huyện Thanh Ba - Phú Thọ Với kiến thức chuyên ngành chưa sâu sắc nên luận văn đưa số kết ban đầu Tuy nhiên, kết có phù hợp với phân tích chuyên ngành thực

Ngày đăng: 16/03/2023, 09:43

Tài liệu cùng người dùng

Tài liệu liên quan