Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 189 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
189
Dung lượng
2,72 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Nguyễn Xuân Cự BÀI GIẢNG PHƯƠNGPHÁPTHỐNGKÊ TRONG KHOA HỌC NÔNG NGHIỆP VÀ MÔITRƯỜNG (Lưu hành nội bộ) Hà Nội , 2008 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ MỤC LỤC I H C QU C GIA HÀ N IĐẠ Ọ Ố Ộ 1 TR NG I H C KHOA H C T NHIÊNƯỜ ĐẠ Ọ Ọ Ự 1 Nguy n Xuân Cễ ự 1 BÀI GI NGẢ 1 PH NG PHÁP TH NG KÊƯƠ Ố 1 TRONG KHOA H C NÔNG NGHI PỌ Ệ 1 VÀ MÔI TR NGƯỜ 1 (L u h nh n i b )ư à ộ ộ 1 H N i , 2008à ộ 1 M C L CỤ Ụ 2 PH N 1. PH NG PHÁP TH NG KÊ MÔ TẦ ƯƠ Ố Ả 3 CH NG 3. LÝ THUY T XÁC SU TƯƠ Ế Ấ 25 CH NG 4. GI I THI U V CÁC KHÁI NI M L Y M UƯƠ Ớ Ệ Ề Ệ Ấ Ẫ 46 Ch ng 5. C L NG CÁC THAM Sươ ƯỚ ƯỢ Ố 62 S TRUNG BÌNH VÀ T L PH N TR MỐ Ỷ Ệ Ầ Ă 62 PH N 3. KI M NH GI THI T TH NG KÊẦ Ể ĐỊ Ả Ế Ố 71 V CÁC THAM S C TR NG M UỀ ỐĐẶ Ư Ẫ 71 Ch ng 6. KI M NH GI THI T TRONG TR NG H P M T M Uươ Ể ĐỊ Ả Ế ƯỜ Ợ Ộ Ẫ 71 Ch ng 7. KI M TRA GI THI T TRONG TR NG H P HAI M Uươ Ể Ả Ế ƯỜ Ợ Ẫ 88 Ch ng 8. PHÂN T CH PH NG SAIươ Í ƯƠ 101 PH N 4 PH NG PHÁP KI M NH PHI THAM SẦ ƯƠ Ể ĐỊ Ố 124 CH NG 9 PHÂN T CH KHI BÌNH PH NG ( 2)ƯƠ Í ƯƠ χ 124 Ch ng 10. M T S PH NG PHÁP KHÁCươ Ộ Ố ƯƠ 138 KI M NH PHI THAM SỂ ĐỊ Ố 138 PH N 5. KI M TRA S LIÊN K T VÀ D OÁNẦ Ể Ự Ế ỰĐ 152 Ch ng 11. T NG QUAN VÀ H I QUY N GI Nươ ƯƠ Ồ ĐƠ Ả 152 Ch ng 12. T NG QUAN B I (H I QUI NHI U BI N)ươ ƯƠ Ộ Ồ Ề Ế 171 2 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ PHẦN 1. PHƯƠNGPHÁPTHỐNGKÊ MÔ TẢ Chương 1. GIỚI THIỆU CHUNG Thốngkê có vai trò to lớn trong phân tích các số liệu thí nghiệm và giải thích các kết quả nghiên cứu. Học phần này nhằm cung cấp những khái niệm và các yêu cầu cơ bản của phép thốngkê trong khoa học nông nghiệp và khoa học môi trường. Từ thốngkê có nghĩa riêng và có nghĩa chung. Theo nghĩa riêng thốngkê (statistics) là một lĩnh vực khoa học tương tự như nông học, đất, khoa học môi trường, theo nghĩa chung nó là những tập hợp các số liệu được thu thập được. Trong thốngkê bao gồm cả lý thuyết và phươngpháp xử lý tính toán. Thốngkê là phươngpháp và công cụ dùng phân tích các tập hợp số liệu để có những quyết định tốt hơn. Phươngphápthốngkê có nghĩa rất lớn trong phân tích và đánh giá số liệu và được áp dụng cho nhiều ngành khoa học khác nhau. Ví dụ các nhà khoa học trồng trọt khi giúp nông dân nâng cao năng suất cây trồng từ các thí nghiệm đồng ruộng có nhiều khác biệt với các vùng sản xuất khác nhau. Các nhà kinh tế nông nghiệp lại sử dụng để dự báo yêu cầu trong tương lai. Chương 2. PHƯƠNGPHÁPTHÔNGKÊ MÔ TẢ Mục tiêu: - Tổ chức và tóm tắt số liệu một cách có hiệu quả - Tính toán các xu hướng tập trung, phân tán và các tham số đặc trưng mẫu (số liệu trung bình, trung vị, số trội, và ý nghĩa của nó). - Tính toán sự biến động của số liệu (khoảng dao động, phương sai, độ lệch chuẩn) và ý nghĩa của chúng. 3 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ 2.1. Giới thiệu về thốngkê mô tả Các số liệu được thu thập trong khoa học môitrường cũng như nông nghiệp nói chung và khoa học đất nói riêng khi chưa dược xử lý và phân tích sẽ rất khó đánh giá và đưa ra những quyết định đúng đắn trong việc sử dụng số liệu này. Tập hợp các số liệu quan trắc có thể có nhiều cách xử lý khác nhau. Thông thường có thể tổ chức theo thứ tự từ giá trị nhỏ nhất đến giá trị lớn nhất. Cách sắp xếp này có thể cung cấp được nhiều thông tin có ý nghĩa. Ví dụ 2.1. Một nhà khoa học nông nghiệp khi phân tích ảnh hưởng của Thiamine hydrochloride (vitamin B1) dến sinh trưởng của cây cà chua. Có 50 cây cà chua được xử lý bằng Thiamine hydrochloride được đo chiều cao một cách ngẫu nhiên, sau 14 ngày xử lý cho kết quả như sau: Bảng 2.0. Ảnh hưởng của Thiamine hydrochloride dến chiều cao cây cà chua (cm) 21,8 21,6 22,5 21,8 21,8 23,4 22,7 21,5 24,0 22,9 22,0 21,8 23,0 22,2 23,2 23,3 22,6 23,2 23,9 22,7 22,3 23,1 22,4 22,1 22,6 21,9 22,8 22,2 24,2 23,2 22,1 23,2 22,9 22,5 23,8 22,6 23,7 22,8 22,8 23,5 22.9 23,3 23,0 23,0 22,9 22,5 22,1 23,5 22,5 23,6 Giải: Bước 1: Sắp xếp các số liệu quan trắc ở bảng 2.0 theo thứ tự từ nhỏ dến lớn như ở Bảng 2.1. Các số liệu này đã cho ta biết một số thông tin cơ bản, ví dụ như độ cao của cây cà chua dao động từ 21,5 đến 24,5 cm. Sự chênh lệch giữa cây thấp nhất và cây cao nhất quan sát dược là 2,7 cm. Số cây có độ cao 21,5 - 22,8 cm chiếm 50% số cây quan trắc và 50% số cây cao từ 22,8 cm đến 24,2 cm. Hơn nữa sự sắp xếp này cũng chỉ rõ mức độ tập trung hoặc phân tán của các giá trị quan trắc xung quanh độ cao trung bình. Trong thí nghiệm này, cây có độ cao phổ biến ở khoảng 22,5 - 22,9 và 23,2 cm. Trong khi đó ít cây có độ cao 21,5 - 21,6 - 23,1 – 24,0 và 24,2 cm. Bảng 2.1. dãy số liệu quan trắc chiều cao cây cà chua theo thứ tự từ nhỏ đến lớn 21,5 22,8 4 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ 21,6 21,8 21,8 21,8 21,9 21,9 22,0 22,1 22,1 22,1 22,2 22,2 22,3 22,4 22,5 22,5 22,5 22,5 22,6 22,6 22,6 22,7 22,7 22,8 22,8 22,9 22,9 22,9 22,9 23,0 23,0 23,0 23,1 23,2 23,2 23,2 23,2 23,3 23,3 23,4 23,5 23,5 23,6 23,7 23,8 23,9 24,0 24,2 Tuy nhiên với cách sắp xếp này chúng ta cũng rất khó xác định độ cao trung bình của cây cà chua, đặc biệt là khi số liệu quan trắc càng lớn. 5 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ Để có cách nhìn rõ ràng hơn người ta sắp xếp dãy số liệu quan trắc theo tần suất xuất hiện của chúng và được gọi là sự phân bố tần suất. 2.2. Phân bố tần suất Trong phân bố tần suất, các số quan trắc được sắp xếp theo thứ tự lớn dần của các giá trị quan trắc bắt gặp và số lần quan trắc (Bảng2.2). Bảng 2.2 Phân bố tần suất cho số liệu ở Bảng 2.1 Chiều cao cây cà chua (cm) Tần suất 21,5 21,6 21,8 21,9 22,0 22,1 22,2 22,3 22,4 22,5 22,6 22,7 22,8 22,9 23,0 23,1 23,2 23,3 23,4 23,5 23,6 1 1 3 2 1 3 2 1 1 4 3 2 3 4 3 1 4 2 1 2 1 6 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ 23,7 23,8 23,9 24,0 24,2 1 1 1 1 1 Cũng có thể sắp xếp các số liệu theo từng nhóm giá trị không trùng lặp nhau. Số lượng các nhóm giá trị phân chia phụ thuộc vào số liệu các quan trắc. Khi các só liệu quan trắc càng nhiều thì số các nhóm cũng càng lớn. Tuy nhiên thông thường người ta chia thành 5 đến 15 nhóm giá trị khác nhau. Theo Sturges (1926) số lượng các nhóm được xác định theo công thức sau: k= 1+3,322(lgn) [2.1] Trong đó: k = Số lượng nhóm n= số lần quan trắc Theo luật Sturges, các số liệu ở bảng 2.0 sẽ được chia thành 7 nhóm như sau được trình bày ở Bảng 2.3. Trong đó số nhóm k được xác định như sau: k = 1 + 3,322 (lg50) = 1 + 3,322 (1,6989) = 7 Như vậy với tập hợp của 50 giá trị quan trắc, các số liệu sẽ được chia thành 7 nhóm (Bảng 2.3). Sự sắp xếp như ở Bảng 2.3 đã chỉ rõ các nhóm giá trị và tần suất của các giá trị quan trắc của chúng. Cụ thể là 5 cây cà chua có độ cao 21,5 - 21,8 và 8 cây có độ cao 21,9 - 22,2 cm, Các số liệu ở bảng 2.3 cũng có thể được biểu diến dưới dạng biểu đồ đa giác tần suất hoặc nối các điểm giữa giá trị các nhóm. -Tính tần suất tương dối: Tần suất tương đối là khi giá trị tần suất được biểu thị dưới dạng các tỷ lệ tương đối hay tỷ lệ phần trăm. Tần suất tương đối n Fi = Trong đó: Fi = tần suất của nhóm thứ i 7 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ n = số lần quan trắc Bảng 2.3 Phân bố tần suất theo nhóm Nhóm Độ cao (cm) Tần suất 1 2 3 4 5 6 7 21,5-21,8 21,9-22,2 22,3-22,6 22.7-23,0 23,1-23,4 23,5-23,8 23,9-24,2 5 8 9 12 8 5 3 Ví dụ như ở nhóm 2 (Bảng 2.3) ta có: Tần suất tương đối của nhóm thứ hai là 8/50 = 0,16 hay biểu diễn dưới dạng phần trăm ta có: Số phần trăm là %16100 50 8 100 == xx n Fi Từ số liệu bảng 2.1 có thể biểu diễn dưới dạng tần suất tương đối như sau (Bảng 2.4). Bảng 2.4 Tần suất tương đối và phần trăm cho số liệu ở Bảng 2.3 Nhóm chiều cao (cm) Tần suất (f) Tần suất tương đối (f/n) Phần trăm (f/n) x100 21,5-21,8 21,9-22,2 22,3-22,6 22,7-23,0 23,1-23,8 5 8 9 12 8 0,10 0,16 0,18 0,24 0,16 10 16 18 24 16 8 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ 23,5-23,8 23,9-24,2 5 3 0,10 0,06 10 6 n = 50 2.3. Xác định xu hướng tập trung của các giá trị quan trắc Thông thường người ta hay nói đến giá trị trung bình. Tuy nhiên giá trị trung bình chỉ đơn thuần là giá trị ở giữa của một tập hợp nhiều giá trị quan trắc. Do vậy để đặc trưng cho xu hướng tập trung của mẫu có nhiều giá trị khác nhau được sử dụng như số trung bình cộng, số trung vị và số trội. - Số trung bình cộng (Mean): Đây là giá trị được xác định bằng thương số của tổng các giá trị quan trắc với số lần quan trắc được biểu diễn là X : ]32[ −= ∑ N X X ∑ = = +++ = n i n n Xi n XXX X 1 21 Nếu Xi có tần suất là m i ta có ∑∑ == = +++ +++ = k i iii k i k kk mXm mmm XmXmXm X 11 21 2211 Chú ý: ∑ ∑ = = = k i n i iii XXm 1 1 và ∑ = = k i i nm 1 Ví dụ 2.3: Giá thóc trung bình bán ra ở 20 trang trại được thốngkê như sau, hãy xác định giá thóc trung bình được bán ra? Trang trại Giá thóc (đ/kg) Trang trại Giá thóc (đ/kg) 1 2 3 2000 3500 2100 11 12 13 2200 2250 1750 9 Ph¬ng ph¸p thèng kª trong Khoa häc N«ng nghiÖp vµ M«i trêng ________________________________________________________________________ 4 5 6 7 8 9 10 3000 2400 3100 2600 2300 3000 2100 14 15 16 17 18 19 20 1800 3200 2900 3100 3600 3400 3800 Giải: 2705 20 38003400 35002000 = ++++ =X (đ/kg) Như vậy giá thóc trung bình được bán ra là 2795 nghìn đồng/kg. Ý nghĩa của số trung bình cộng: + Trung bình cộng là một giá trị tổng hợp cô đọng đặc trưng tiêu biểu cho toàn bộ các giá trị quan trắc của một tập hợp. + Trung bình cộng là biểu diễn xu hướng tập trung của mẫu quan trắc trên một đặc trưng giống nhau. Nhưng trung bình cộng chưa biểu thị được đặc điểm thứ hai của một mẫu là xu hướng phân tán của các số liệu. . + Tổng sai số các giá trị quan trắc Xi với giá trị trung bình cộng X luôn bằng 0. Tức là: ( ) 0 1 =− ∑ = n i i xx - Số trung bình trọng số (Weighted mean): Trong nhiều trường hợp, tập hợp mẫu quan trắc bao gồm từ nhiều nhóm có những dặc tính khác nhau. Số trung bình chung được tính từ các số trung bình của từng nhóm riêng rẽ. Như vậy nếu tính trung bình cộng có nghĩa là ta coi sự đóng góp của các nhóm là như nhau. Để phân biệt sự tham gia không ngang nhau của các 10 [...]...Phơng phápthốngkê trong Khoa học Nông nghiệp và Môi trờng nhúm ta cn thit phi thờm cỏc trng s bo m tớnh cõn bng khi tớnh s trung bỡnh chung Ta cú: Xw = wX w Trong ú w = trng s ỏp dng cho giỏ... trng s (din tớch) cho tng tng ging ngụ Hay ta nhõn ct (1) vi ct (2) Theo cỏch tớnh s trung bỡnh trng s ta cú: Xw = wX w = 32815,7 = 134,49 (t/ha) 254 - S trung v (Median): 11 Phơng phápthốngkê trong Khoa học Nông nghiệp và Môi trờng S trung v (Med) c xỏc nh l s ng gia ca mt dóy s liu c sp xp theo trt t gim dn hoc tng dn Trong trng hp tng s quan trc l l thỡ tr s s... ca chỳng Gii: Trc ht ta phi sp xp t l phn trm P 2O5 ca cỏc loi phõn bún theo th t tng dn nh sau: 20-34-39-46-48-62 p dng cụng thc tớnh Med ta cú: Med = 39 + 46 = 42,5 2 12 Phơng phápthốngkê trong Khoa học Nông nghiệp và Môi trờng Gi s ta ch cú 5 loi phõn bún khỏc nhau (khụng cú loi phõn th 6), lỳc ú ta cú Med = 39 Núi túm li trong trng hp dóy s liu vi n l s l... Tớnh toỏn s trung v ca phõn b tn xut Thu nhp hng nm S ngi dõn Tn sut tớch lu (triu ng) (f) (CF) 10,000-14,999 5 5 15,000-19,999 7 12 20,000-24,999 10 22 24,999-29,999 12 34 13 Phơng phápthốngkê trong Khoa học Nông nghiệp và Môi trờng 30.000-34,999 14 48 35,000-39,999 20 68 40,000-44,999 16 84 45,000-49,999 19 103 50,000 tr lờn 17 120 Tng 120 Gii: - Bc 1: Cn xỏc nh... vy s trung v s ly giỏ tr 12/20 trong khong 34,9995 v 39,9995 p dng cụng thc [2-7] ta cú: n 2 CF 120 2 48 Med = L + ( i ) = 34,9995 + ( 5,000) = 37,9995 f 20 14 Phơng pháp thốngkê trong Khoa học Nông nghiệp và Môi trờng Nh vy s trung v v thu nhp ca ngi sn xut l 37,9995 triu ng/nm Hay cú mt na s ngi sn xut cú thu nhp di 37,9995 triu ng/nm v mt na cũn... l lp tri Do vy s tri c tớnh nh sau: 35,000 + 4,999 = 37,4995 2 Khi phõn b tn sut khụng thun nht cỏc lp, ta s tớnh s tri theo cụng thc: d1 ( i) Mod = L + d1 + d 2 15 Phơng phápthốngkê trong Khoa học Nông nghiệp và Môi trờng Trong ú L: Giỏ tr thp hn gii hn di ca ca lp tri d1: S khỏc nhau gia tn sut ca lp tri vi tn sut ca lp trc nú d2: S khỏc nhau gia tn sut... (Range): L s sai khỏc gia giỏ tr nh nht v ln nht trong dóy s liu: R= X max X min [2-9] Vớ d 2.8: Trong dóy s liu l 4,2-6,7-3,4-2,3-7,9 ta cú khong dao ng l: R= 7,9-2,3=5,6 16 Phơng pháp thốngkê trong Khoa học Nông nghiệp và Môi trờng Vic xỏc nh khong dao ng l n gin, tuy nhiờn nú ch cp n 2 giỏ tr trong dóy s liu nờn khụng phn ỏnh chớnh xỏc phõn tỏn thc ca mu - lch... bỡnh lch bỡnh phng ca cỏc giỏ tr quan trc so vi giỏ tr trung bỡnh Phng sai ca bin ngu nhiờn l mt s khụng õm dựng ch mc phõn tỏn ca bin ngu nhiờn xung quanh tõm ca nú 17 Phơng pháp thốngkê trong Khoa học Nông nghiệp và Môi trờng Cụng thc tớnh phng sai ca mt tng th nh sau: Trong ú 2 ( X = i à) 2 N 2 = Phng sai ca mt tng th x = Giỏ tr quan trc à = Giỏ tr trung... nh phng sai ca qun th vi sinh vt ny 32 56 72 45 52 74 53 42 58 61 59 40 36 76 55 75 62 48 35 39 Gii: à= X N = 1079 = 53,95 20 Ta cú: 2 ( X à) = 2 N 18 = 3780,9 = 189,0 20 Phơng pháp thốngkê trong Khoa học Nông nghiệp và Môi trờng X X à ( X à)2 32 -21,95 48,18 65 11,05 122,1 72 18,05 325,8 45 -8,95 80,1 52 -1,95 3,8 74 20,05 402,0 53 -0,95 0,9 42 -11,95 142,8... 4,05 16,4 61 7,05 49,7 59 5,05 25,5 40 -13,95 191,6 36 -17,95 322,2 76 22,05 486,2 55 1,05 1,1 75 21,05 443,1 62 8,05 64,8 48 -5,95 35,4 35 -18,95 359,1 39 -14,95 223,5 19 Phơng pháp thốngkê trong Khoa học Nông nghiệp và Môi trờng 1079 0,0 3780,9 Giỏ tr phng sai ch cú ngha so sỏnh phõn tỏn mu ca 2 hoc nhiu mu nghiờn cu Trong mt mu giỏ tr phng sai khụng cú ý ngha