1. Trang chủ
  2. » Giáo án - Bài giảng

Ứng dụng toán trong nghiên cứu sinh thái học

147 483 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 147
Dung lượng 3,64 MB

Nội dung

Thời gian qua, trong nhiều các lĩnh vực nghiên cứu nhất là trong sinh vật học và nông nghiệp ngời ta đã tiến hành thựchiện các thực nghiệm đợc bố trí triển khai trong phòng cũng nhngoài tự nhiên, hơn nữa các thực nghiệm của hầu hết các đề tài dự án cần phải xử lý các kết quả mà trong đó việc sử dụng các phơng pháp toán học hoặc biểu diễn các kết quả điều tra hay các quy luật ngẫu nhiên bằng các mô hình toán học là khó tránh khỏi. Gần đây do sự bùng nổ của các công trình nghiên cứu trong sinhthái học với hàng ngàn các công trình nghiên cứu đợc đăng tải trong các tạp chí chuyên ngành thuộc lĩnh vực sinh học trong và ngoài nớc đòi hỏi tính chính xác và chuẩn mực trong các kết quả thì ứng dụng toán học là không thể thiếu đợc. Tuy nhiên, những hiểu biết cơ bản nhất, chung nhất, đặc biệt là các bài toánứng dụng thực tế về sử dụng những phơng pháp toán h?c trong nghiên cứu sinh thái học, các mô hình sinh thái cơ bản trong hệ thống sinh thái học của các sinh viên, học viên kể cả các cán bộ nghiên cứu trong ngành sinh học còn rất hạn chế. Sinh học là lĩnh vực của khoa họccàng ngày nó càng chứng tỏ vai trò đóng góp to lớn cho sự pháttriển kinh tế xã hội, trong đó toán học đã xâm nhập sâu sắc vào sinh học đến mức tạo thành một bộ môn khoa học “Toán Sinh” (Mathematical Biology). Chính vì vậy, để làm tài liệu cơ sở cho các học viên cao học, các nghiên cứu sinh cũng nhcác nhà nghiên cứu trong lĩnh lực sinh học. Chúng tôi biên soạn giáo trình “ứng dụng toán trong nghiên cứu sinh thái học” nhằm giúp đỡ họ biết cách khai thác hiệu quả nhất những tính toán, những phân tích thống kê các số liệu nghiên cứu trong phòng thí nghiệm cũng nhở ngoài tự nhiên, thiết lập các bài toán sinh thái và các mô hình toán cơ bản trong hệ thống sinh thái học.

Trang 1

ViÖn sinh th¸i vµ Tµi nguyªn Sinh vËt

Lª Xu©n C¶nh - Tr−¬ng Xu©n Lam

øng dông to¸n trong nghiªn cøu

sinh th¸i häc

Hµ Néi, 2007

Trang 2

viÖn sinh th¸i vµ Tµi nguyªn Sinh vËt

Lª Xu©n C¶nh - Tr−¬ng Xu©n Lam

Gi¸o tr×nh

øng dông to¸n trong nghiªn cøu

sinh th¸i häc

Hµ Néi, 2007

Trang 3

1.2 Kh¸i niÖm vÒ to¸n sinh häc

1.3 §èi t−îng nghiªn cøu cña to¸n sinh th¸i

1.4 DÊu hiÖu quan s¸t

1.5 C¸c thuËt ng÷ thèng kª cña mÉu

1.6 Mét sè lo¹i ph©n bè th−êng gÆp

Ch−¬ng 2: C¸c quy tr×nh xö lý sè liÖu thèng kª

2.1 Tæng qu¸t vÒ Microsoft Excel

2.1.1 B¶ng tÝnh trong Microsoft Excel

2.1.2 Lµm viÖc víi Excel

Trang 4

3.2.1 Khái niệm

3.2.2.Tiêu chuẩn phi tham số của Kruskal và Wallis

3.2.3 Trường hợp có 2 mẫu liên hệ

3.2.4 Trường hợp có nhiều mẫu liên hệ

3.2.5 Trường hợp so sánh các mẫu về chất

3.3 Các bài toán ứng dụng và thực hành

Chương 4: Phân tích phương sai (ANOVA)

4.1 Phân tích phương sai một nhân tố

4.2 Phân tích phương sai hai nhân tố với 1 lần lặp lại

4.3 Phân tích phương sai hai nhân tố với 2 lần lặp lại

4.4 Phân tích phương sai hai nhân tố với m lần lặp lại

4.5 Phân tích thống kê nhiều biến số (Multivariate analysis)

4.6 Các bài toán ứng dụng và thực hành

Chương 5: Hồi quy tuyến tính và phi tuyến tính

5.1 Hồi quy tuyến tính một lớp

5.2 Hồi quy tuyến tính nhiều lớp

5.3 Liên hệ phi tuyến tính

5.4 Thiết lập biểu đồ tương quan

5.5 Các bài toán ứng dụng và thực hành

Trang 5

Chương 6: Phương pháp hệ số đường ảnh hưởng

6.1 Khái niệm và hệ số đường ảnh hưởng

6.2 Quan hệ giữa nguyên nhân và kết quả

6.2.1 Các nguyên nhân độc lập

6.2.2 Các nguyên nhân có quan hệ với nhau

6.3 Quan hệ giữa hiệu quả với chuỗi các biến số tương quan nhiều biến 6.4 Các bài toán ứng dụng và thực hành

Chương 7: Mô hình toán trong hệ thống sinh thái học

7.1 Mô hình ổn định của hệ k quần thể (tiêu chuẩn Routh-Hurwitz) 7.2 Hệ thống - thú dữ - con mồi - mô hình động học Lotka-Volterra 7.3 Mô hình đa dạng sinh học không gian k quần thể

7.4 Mô hình phân loại trong mô hình cấu trúc

7.4.1 Các loại thước đo (Metric)

7.4.2 Tiêu chuẩn phân loại cực tiểu biến phân

7.4.3 Tiêu chuẩn so sánh tổng thể

7.4.4 Mô hình xắp xếp quần xã

7.4.5 Mô hình đánh giá

Chương 8: Phân tích sự đa dạng sinh học bằng phần mền PRIMER

8.1 Giới thiệu về phần mền PRIMER

8.2 Đa dạng sinh học trong PRIMER và ứng dụng

8.3 Một số vị dụ minh họa

Tài liệu tham khảo

Trang 6

Lời nói đầu

Thời gian qua, trong nhiều các lĩnh vực nghiên cứu nhất là trong sinh vật học và nông nghiệp người ta đã tiến hành thực hiện các thực nghiệm được

bố trí triển khai trong phòng cũng như ngoài tự nhiên, hơn nữa các thực nghiệm của hầu hết các đề tài dự án cần phải xử lý các kết quả mà trong đó việc sử dụng các phương pháp toán học hoặc biểu diễn các kết quả điều tra hay các quy luật ngẫu nhiên bằng các mô hình toán học là khó tránh khỏi Gần đây

do sự bùng nổ của các công trình nghiên cứu trong sinh thái học với hàng ngàn các công trình nghiên cứu được đăng tải trong các tạp chí chuyên ngành thuộc lĩnh vực sinh học trong và ngoài nước đòi hỏi tính chính xác và chuẩn mực trong các kết quả thì ứng dụng toán học là không thể thiếu được Tuy nhiên, những hiểu biết cơ bản nhất, chung nhất, đặc biệt là các bài toán ứng dụng thực

tế về sử dụng những phương pháp toán học trong nghiên cứu sinh thái học, các mô hình sinh thái cơ bản trong hệ thống sinh thái học của các sinh viên, học viên kể cả các cán bộ nghiên cứu trong ngành sinh học còn rất hạn chế

Sinh học là lĩnh vực của khoa học càng ngày nó càng chứng tỏ vai trò

đóng góp to lớn cho sự phát triển kinh tế xã hội, trong đó toán học đã xâm nhập sâu sắc vào sinh học đến mức tạo thành một bộ môn khoa học “Toán Sinh” (Mathematical Biology) Chính vì vậy, để làm tài liệu cơ sở cho các học viên cao học, các nghiên cứu sinh cũng như các nhà nghiên cứu trong lĩnh lực sinh học Chúng tôi biên soạn giáo trình “ứng dụng toán trong nghiên cứu sinh thái học” nhằm giúp đỡ họ biết cách khai thác hiệu quả nhất những tính toán, những phân tích thống kê các số liệu nghiên cứu trong phòng thí nghiệm cũng như ở ngoài tự nhiên, thiết lập các bài toán sinh thái và các mô hình toán cơ bản trong hệ thống sinh thái học

Giáo trình được cấu trúc thành 6 chương bao gồm:

Chương 1: Trình bày một số khái niệm và các thuật ngữ cơ bản trong

việc ứng dụng toán trong nghiên cứu sinh thái học Chương 2: Trình bày tổng quát về Excel, các quy trình chọn mẫu, biểu

thị phân bố thực nghiệm, vẽ biểu đồ phân bố, tính các chỉ

Trang 7

số thống kê bằng, ước lượng các tham số đặc trưng của tổng thể và một số phân bố lý thuyết thường gặp

Chương 3: Trình bày quy trình so sánh các mẫu quan sát và thí nghiệm

độc lập và mẫu liên hệ Chương 4: Trình bày quy trình phân tích phương sai một nhân tố, hai

nhân tố với 1 lần lặp lại và hai nhân tố với nhiều lần lặp lại Chương 5: Trình bày quy trình tính toán hồi quy tuyến tính 1 lớp, tuyến

tính nhiều lớp, phi tuyến tính và mối quan hệ giữa hiệu quả với chuỗi các biến số tương quan

Chương 6: Trình bày phương pháp hệ số đường ảnh hưởng, quan hệ giữa

hiệu quả với chuỗi các biến số và một số ứng dụng Chương 7: Trình bày cách thiết lập, tìm nghiệm và trạng thái cân bằng

của một số mô hình cơ bản như: mô hình ổn định của hệ K quần thể, hệ thống “thú dữ - con mồi“, mô hình đa dạng sinh học không gian và mô hình phân loại trong mô hình cấu trúc

Chương 8: Giới thiệu về phần mền PRIMER và một số ứng dụng trong

việc phân tích sự đa dạng sinh học bằng phần mền PRIMER

Do sự rộng lớn, đa dạng và phức tạp trong lĩnh vực sinh thái học, cho nên chắc chắn rằng giáo trình này chưa thể đáp ứng thật đầy đủ các công cụ toán ứng dụng trong sinh thái học cho nhu cầu nghiên cứu của độc giả và không thể tránh được những thiếu sót Chúng tôi hy vọng rằng, sẽ nhận được

sự phê bình và góp ý của các bạn đồng nghiệp và học viên để cuốn sách được hoàn thiện hơn trong những lần soạn sau

Trang 8

Chương 1 Một số khái niệm và các thuật ngữ cơ bản

1.1 Sinh thái học là gì ?

Sinh thái học là môn khoa học nghiên cứu về sự phân bố và sinh sống của những sinh vật sống và các tác động qua lại giữa các sinh vật và môi trường sống của chúng Môi trường sống của một sinh vật hàm chứa: Tổng hòa các nhân tố vật lý như khí hậu và địa lý được gọi là ổ sinh thái và các sinh vật khác sinh sống trong cùng ổ sinh thái

Các hệ sinh thái thường được nghiên cứu ở nhiều cấp độ khác nhau từ cá thể và các quần thể cho đến các hệ sinh thái và sinh quyển Sinh thái học là môn khoa học đa ngành, nghĩa là dựa trên nhiều ngành khoa học khác nhau

1.2 Khái niệm về toán sinh học

Toán sinh học (Mathematical biology hay Biomathematics) là một lĩnh vực giao thoa của nghiên cứu học thuật nhằm vào mô hình hoá các quá trình sinh học trong tự nhiên với kĩ thuật và công cụ là toán học Nó vừa mang tính ứng dụng vừa mang tính lý thuyết trong nghiên cứu sinh học

Toán sinh thái học (Ecological Mathematics) là những nghiên cứu sinh thái học bằng các phương pháp toán học Nó rất đa dạng và muôn hình muôn

vẻ Từ việc sử dụng những phương pháp thống kê đơn giản tới những mô hình hiện đại có sử dụng những máy tính điện tử hiện đại như hiện nay Theo cấu trúc của toán sinh thái học thì nó cũng là bộ môn khoa học như những bộ môn khác (toán, lý, hóa, văn ) Đối tượng nghiên cứu chủ yếu là các hệ sinh thái còn phương pháp nghiên cứu là toán học Chúng ta biết rằng “Khoa học là một phương pháp” và đối với toán sinh thái học ta cũng khẳng định rằng đó cũng là một phương pháp để giải quyết những vấn đề nghiên cứu về sinh thái cũng như

về sinh học nói chung

Những người nghiên cứu toán sinh thái học hiện nay bao gồm: (1) Những nhà nghiên cứu toán học chuyển sang nghiên cứu về sinh thái học; (2) Những nhà nghiên cứu sinh thái học áp dụng các phương pháp toán học trong

Trang 9

các kết quả nghiên cứu; (3) Những nhà nghiên cứu song song đồng thời cả hai chuyên ngành Cả 3 dạng trên đều được đánh giá cao nhưng dạng thứ 3 là mô hình thích hợp nhất cho công tác đào tạo cho chuyên ngành này ở tương lai

1.3 Đối tượng nghiên cứu của toán sinh thái

Toán sinh thái học nghiên cứu tính chất của hàng loạt những hiện tượng trong sinh học, sinh thái học, y học Những vấn đề đó thường là rất phức tạp

về sự phong phú và đa dạng Để có được sự hiểu biết đúng đắn những đặc điểm của hàng loạt những hiện tượng và có thể đưa ra những đánh giá chắc chắn phải có sự nhận xét hoặc phân tích tổng hợp Chính vì vậy chúng ta cần thống nhất một số khái niệm sau đây

1.3.1 Khái niệm về tổng thể, phần tử và mẫu

Tổng thể là toàn bộ đối tượng ta cần nghiên cứu, đối tượng trong tổng thể được gọi là một phần tử, số phần tử của tổng thể được coi là dung lượng của tổng thể (ký hiệu là N), dung lượng tổng thể có thể là một số hữu hạn hoặc vô hạn

Ví dụ: Một lô hạt giống trong đó hạt giống là các phần tử, một lô cây con trong vườn ươm trong đó cây con là phân tử, tập hợp các loài sâu hại trong

đó mỗi loài sâu hại là phần tử, khu rừng trồng thuần cây Lim trong đó mõi cây Lim là một phần tử

Mẫu là một bộ phận của tổng thể, trên đó người ta tiến hành điều tra, đo

đếm và tiến hành thu thập số liệu, số phần tử của mẫu gọi là dung lượng mẫu (ký hiệu là n), dung lượng mẫu là một số hữu hạn

Ví dụ : Đường kính của 30 cây keo trong lô keo 6 tuổi thì trong đó: lô keo 6 tuổi là tổng thể, 30 cây keo là mẫu và cây keo là phần tử Dung lượng của mẫu (cây keo) n = 30

Trên cơ sở những số liệu quan sát được của mẫu, sử dụng công cụ toán học chủ yếu dựa trên cơ sở lý thuyết xác suất để nói lên những qui luật, những hiện tượng của tổng thể đó chính là phương pháp nghiên cứu của toán sinh thái học Để việc nghiên cứu đảm bảo độ tin cậy và chính xác thì mẫu chọn phải

đại diện được cho toàn bộ tổng thể, muốn vậy việc chọn mẫu phải mang tính ngẫu nhiên tức là mọi phần tử đều có khả năng được nhận vào mẫu như nhau

Trang 10

đo đếm để tạo thành mẫu

Cách thức chọn mẫu theo quy tắc rất hay được sử dụng trong nghiên cứu động, thực vật ngoài thiên nhiên và thường đựơc chia ra gồm:

* Phương pháp chọn mẫu theo tuyến: Toàn bộ diện tích điều tra được chia ra theo các tuyến (song song hoặc cách đều nhau) và trên các tuyến chọn các mẫu điều tra Nếu trong diện tích điều tra S và các mẫu có diện tích là Sothì dung lượng của tổng thể N = S/So

* Phương pháp chọn mẫu theo mắt lưới: Toàn bộ diện tích điều tra được chia ra theo các tuyến song song hoặc cách đều nhau theo 2 hướng và trên các

điểm giao nhau chọn các mẫu điều tra

Tổng thể (N=95)

Mẫu (n=10)

Phần tử

Trang 11

* Phương pháp chọn mẫu có phân khối: Tổng thể được chia ra theo các khối thuần nhất, trong các khối chọn các mẫu đại diện chung cho khối (có thể

sử dụng các phương pháp trên để chọn mẫu trong khối)

1.4 Khái niệm về dấu hiệu quan sát

Các đặc điểm hay một tính chất nào đó được điều tra, quan sát, đong

đếm và thu thập được gọi là dấu hiệu quan sát hay được gọi là số liệu quan sát

Ví dụ: Số lượng cá thể của một loài, chiều cao cây Đường kính ngang ngực, số loài, các số liệu về kích thước của hình thái của 1 loài

Bảng 1.4.1 Số liệu của đường kính đo ngang ngực ở các lô trong

Các số liệu quan sát được định lượng thì được gọi là đại lượng quan sát

Ví dụ: Mật độ cá thể con/m2, mật độ cây/m2, số lần bắt gặp/km, số lượng/cm2, chiều cao cây, đường kính ngang ngực

Bảng 1.4.2 Mật độ cá thể con/m 2 của loài côn trùng hại rau

Mẫu(A)

5.85 4.62 4.68 5.21 4.52 4.85 5.9 6.41 4.36 5.51 4.16 5.89 5.31 6.86 6.12 3.85 6.02 4.72 6.72 5.12 6.64

I

6.54 3.41 5.74 4.41 5.62 5.64 6.54

Trang 12

5.85 4.62 4.68 5.21 4.52 4.85 5.9 6.81 4.01 6.24 4.22 6.35 6.01 7.21 6.81 4.01 6.24 4.22 6.35 6.01 7.21 5.62 4.57 5.65 5.02 5.85 4.57 5.89 III

5.62 4.57 5.65 5.02 5.85 4.57 5.89 6.54 3.41 5.74 4.41 5.62 5.64 6.54 5.62 4.57 5.65 5.02 5.85 4.57 5.89

IV

6.41 4.36 5.51 4.16 5.89 5.31 6.86 5.85 4.62 4.68 5.21 4.52 4.85 5.9 6.54 3.41 5.74 4.41 5.62 5.64 6.54

V

6.12 3.85 6.02 4.72 6.72 5.12 6.64 6.54 3.41 5.74 4.41 5.62 5.64 6.54

VI

6.81 4.01 6.24 4.22 6.35 6.01 7.21 Các số liệu quan sát không định lượng được gọi là số liệu quan sát về chất

Ví dụ: Cây tốt, cây xấu, cây trung bình, tần xuất bắt gặp , mức độ phân

bố rộng , hẹp vv

Bảng 1.4.3 Số liệu về tần xuất bắt gặp của đường kính đo ngang

ngực của rừng trồng Lim thuần

Trang 13

1.5 Các thuật ngữ thống kê của mẫu

1.5.1 Giá trị trung bình cộng (Xtb - Mean):

Số trung bình cộng của mẫu là giá trị trung bình của một dẫy hữu hạn các

số liệu quan sát và được tính theo công thức sau:

1.5.2 Số trung vị mẫu (M - Median):

Số trung vị mẫu là giá trị của số liệu quan sát ở khoảng giữa của mẫu

* Nếu tập hợp mẫu có dung lượng mẫu là lẻ thì số trung vị là giá trị trung tâm

Ví dụ: (2.9; 2.6; 2.4; 2.3; 2.2) n=5 (lẻ) số trung vị M=2.4

* Nếu tập hợp mẫu là chẵn thì số trung vị là giá trị trung bình của 2 giá trị phần tử trung tâm

Ví dụ: (2.9; 2.6; 2.3; 2.2) n=4 số trung vị M=(2.6+2.3)/2 = 2.45

1.5.3 Phương sai (S2) và sai tiêu chuẩn (S):

+ Phương sai (S2 - Sample Variance) là một đại lượng biểu thị tổng của bình phương các độ lệch riêng rẽ so với giá trị trung bình của các phần tử mẫu trong cùng một điều kiện như nhau và đựơc tính theo công thức sau:

Trang 14

+ Sai tiêu chuẩn (S - Standard error) của mẫu có khi còn gọi là độ lệch chuẩn (Standard deviation) là đại lượng để đo độ chính xác của kết quả thực nghiệm, độ lệch chuẩn càng lớn thì độ chính xác càng kém được tính bởi công thức như sau:

S = S2 =

1 1

2

) (

+ Hệ số biện động (S%) của mẫu hay còn gọi là độ lêch chuẩn tương

đối (relative standard deviation) biểu thị mức độ biến động bình quân tương

đối của dãy trị số quan sát được tính bởi biểu thức

S S% = * 100

Xtb+ Phạm vi biến động của mẫu (R) là hiệu số của trị số quan sát lớn nhất

và trị số quan sát nhỏ nhất và được tính bởi biểu thức

R = Max(Xi) – Min(Xi)

1 5.5 Độ lệch (Sk) và độ nhọn (K)

+ Độ lệch (Sk - Skewness) là chỉ tiêu cho thấy mức độ chênh lệch của

đỉnh đường cong so với trị số trung bình mẫu và đựơc tính bằng:

Trang 15

Sk < 0 thì đường cong lệch phải so với giá trị trung bình

+ Độ nhọn (K - Kurtosis) là chỉ tiêu cho thấy mức độ biến động của trị

số quan sát so với trị số trung bình mẫu và đựơc tính bằng

Nếu: K = 0 thì đường cong thực nghiệm tiệm cẩn chuẩn

K>0 thì đường cong có dạng bẹt so với tiệm cận chuẩn

K<0 thì đường cong có dạng nhọn so với tiệm cận chuẩn

Trong đó:

R=0 nghĩa là hai đại lượng X và Y độc lập với nhau

Trang 16

R=1 nghĩa là hai đại lượng X và Y có quan hệ hàm số

0 < R ≤ 0.3 hai đại lượng X và Y có quan hệ yếu

0.3 < R ≤ 0.5 hai đại lượng X và Y có quan hệ vừa

0.5 < R ≤ 0.7 hai đại lượng X và Y có quan hệ tương đối chặt

0.7 < R ≤ 0.9 hai đại lượng X và Y có quan hệ chặt

0.9 < R ≤ 1 hai đại lượng X và Y có quan hệ rất chặt

1.6 Một số loại phân bố thường gặp

1.6.1 Phân bố tần số thực nghiệm một chiều

Việc biểu diễn các kết quả quan sát theo tần số xuất hiện của nó là rất

quan trọng Chúng được trình bày dưới các điểm riêng biệt trên một trục số

đã chia tuyến tính (một chiều) sau đó đánh giá về mật độ xuất hiện Sự phân bố

này được gọi là phân bố thực nghiệm một chiều Để xây dựng biểu đồ này, ta

sẽ tập hợp các giá trị thành k cấp có độ rộng là d theo các công thức sau:

k = n Trong đó : n - là dung lượng của mẫu quan sát và

5 < k < 20 hay ta phải có dung lượng mẫu n ≥ 25

Độ rộng d thường tính là:

(Xmax – Xmin)

d =

1 + 3,322 Log(n)

Ví dụ1: Giả sử ta có 60 kết quả quan sát với giá trị quan sát Max = 42

và giá trị nhỏ Min = 16 khi đó ta có:

k= 60 = 8 và d = (42-16)/(1+3.322Log(60)) = 3.76 ≈ 4

Để xác định giá trị ứng với mỗi tần số ta lấy giá trị nhỏ nhất cộng với

giá trị d và tăng dần hay lấy giá trị lớn nhất trừ đi với d và giảm dần Khi đó ta

xác định đựợc các lớp giá trị với k = 8 Kết quả thu được theo bảng sau:

Trang 17

gi¸ trÞ ta chia líp b»ng c¸ch: lÊy gi¸ trÞ trung b×nh cña líp nhá nhÊt céng víi

gi¸ trÞ d vµ t¨ng dÇn hay lÊy gi¸ trÞ cña líp lín nhÊt trõ ®i gi¸ trÞ d vµ gi¶m dÇn

B¶ng 1.6.2: Gi¸ trÞ cña c¸c líp ( k=10 vµ d = 1)

Trang 18

Ta giả thiết rằng dung lượng mẫu (n →∞), khi dó d → 0 và sự phân bố

tần số của một giá trị có thể mô tả bằng hàm xác xuất sau:

Y là tấn số xuất hiện của mỗi giá trị lệch (x - μ)

Đây là hàm phân bố chuẩn Gauss Sự phân bố bởi đường cong Gauss có

một số đặc điểm sau

+ Kết quả thuờng gặp nhất là giá trị trung bình μ

+ Các kết quả đối xứng xung quanh giá trị trung bình μ

Từ phương trình (1) mô tả mật độ xác xuất của phân bố chuẩn, trong đó

2 tham số δ μ hết sức quan trọng Cực đại của đừong cong nằm ở x=μ, và

các điểm uốn nằm ở x-μvà x+μ(hình 1.6.2) Độ lệch chuẩn δ càng bé độ

Trang 19

chính xác càng cao và đường cong càng nhọn và ngược lại độ lệch chuẩn càng lớn độ chính xác càng thấp và đường cong càng tù

Xtb - ε < μ < Xtb + ε

Trong đó:

t.S

ε = α n

Khi đó μ-ε đến μ+εđược gọi là khoảng tin cậy

1.6.4 Phân bố chuẩn F

Phân bố này được sử dụng để so sánh độ chính xác của 2 tập dữ liệu trong cùng một phòng thí nghiệm hoặc của 2 phương pháp phân tích khác nhau

Trang 20

trên cùng một mẫu (hay nói chính xác là so sánh sự khác biệt về mặt thống kê của 2 phương sai) Về mặt thống kê F được định nghĩa là

- Nếu Ftt > Ftl → 2 tập dữ liệu có sự khác biệt về mặt thống kê

- Ngược lại nếu Ftt < Ftl → 2 tập dữ liệu không có sự khác biệt về mặt thống kê

Ví dụ: Có 2 dẫy quan sát thực nghiệm, dẫy 1 có độ lệch chuẩn S1 = 0.05

và dẫy 2 có độ lệch chuẩn S2 = 0.02 Kiểm tra xem liệu độ lệch chuẩn S1 cao hơn S2 có ý nghĩa hay không? và biết rằng f1=6 và f2= 4

Tra bảng tính sẵn cho thấy Ftl(0.95,5,3) = 9.01

Từ công thức tính toán cho thấy Ftt =(0.05)2/(0.02)2 = 6.25

Kết quả cho thấy: Ftt<Ftl nghĩa là 2 tập dữ liệu không có sự khác biệt về mặt thống kê hay giả thiết “không” là có cơ sở

1.6.5 Phân bố χ2

Giả sử nếu có một mẫu với các đại lượng ngẫu nhiên x1,x2,x3 xn có phân bố chuẩn thì có thể thu được một đại lượng ngẫu nhiên với số bậc tự do f= n -1 có hàm phân bố χ2 được tính như sau:

Trang 21

Trong đó: Xi : Số liệu quan sát

Trong đó:

x : là trị số quan sát

d: là trị số giữa cỡ dmin: là trị số quan sát bé nhất

β và γ là hai tham số của phân bố Weibull

Trang 22

Chương 2Các quy trình xử lý số liệu thống kê

2.1 Tổng quát về Microsoft Excel 5.0

2.1.1 Khởi động và màn hình Excel

+ Thanh tiêu đề (Title bar): Dòng trên cùng, ở đó có tên của bảng tính đang thực hiện

+ Thanh thực đơn (Menu bar): gồm 9 thực đơn chính

- Menu File (hay Alt + F ): bao gồm các menu như Winword

- Menu Edit: bao gồm các menu quen thuộc như Winword ngoài ra Delete Sheet (bỏ cả trang) và More or Copy Sheet (di chuyển và sao chép)

- Menu View: bao gồm các menu quen thuộc như Winword ngoài ra Chart Windows (hiện của sổ đồ họa trong Sheet)

- Menu Insect: Ngoài các lệnh chèn ô, chèn hàng, chèn cột còn có Chart (vẽ đồ họa), Function (gọi hàm)

- Menu Format: có Cells (tạo thuộc tính cho ô đã chọn), nếu muốn tạo cả trang thì chọn Style

- Menu Tools: Có phần Add-Ins để nhập thêm một số phần như Solver, Data analysis, View manager Ngoài ra còn có thêm lệnh Macro (để viết lệnh

và chương trình con)

- Menu Data: menu này chuyên về quản lý số liệu như Table (bảng), Sort (sắp xếp thứ tự), Filter (lọc), Pivot table (Bảng tổng kết) sẽ học kỹ ở phần sau

- Menu Windows: là menu điều khiển

- Menu Help: giúp đỡ

+ Thanh công cụ (Standard Toolbar): chứa các biểu tượng của các lệnh thường dùng Thanh này có thể thêm hoặc bớt các biểu tượng (Icon)

+ Thanh công thức (formula bar): để đưa thông tin vào một ô (cell)

+ Bảng tính Worksheet: Thường có 16 trang ghi từ sheet 1 tới sheet 16 Mỗi sheet có 256 cột (A,B AA,BB ) và 16384 hàng (khoảng 4 triệu ô) Mỗi ô

có 1 địa chỉ dạng (cột, hàng)

Trang 23

Ví dụ A12 (cột A, hàng 12)

Địa chỉ tương đối (địa chỉ tương đối là địa chỉ mà ô trong công thức sẽ

được điều chỉnh khi công thức được sao chép) ký hiệu A1, hoặc B10 Địa chỉ tuyệt đối (địa chỉ tuyệt đối là địa chỉ mà ô trong công thức sẽ không thay đổi khi công thức được sao chép) ghi dưới dạng $A$1 hoặc $B$10 và tuyệt đối một phần $A3, B$10 Một nhóm các ô liền nhau tạo thành một hình chữ nhật A3:B10, các ô rời nhau được cách nhau bằng dấu phẩy A3:B10, D5:H12, I19:K12

+ Thanh cuốn (Scoll Bar) gồm thanh cuốn dọc (Vertical Scoll Bar) và thanh cuốn ngang (Horizontal Scoll Bar)

2.1.2 Làm việc với Excel

a) Nhập và sửa đổi số liệu

- Nhập và sửa đổi số liệu: có thể nhập văn bản và nhập dữ liệu số

- Sao chép các nội dung trong Sheet: sử dụng lệnh Fill

- Nhập các công thức tính toán: +, -, *, / và ^

- Di chuyển và sao chép các bản tính: sử dụng More or Copy Sheet (hoặc sử dụng rê chuột và giữ Ctrl)

Trang 24

b) Tạo lập các đồ thị bằng Excel

Bước 1: Chọn số liệu để tạo lập đồ thị

Bước 2: Chọn các kiểu đồ thị sử dụng Chart (trong menu Insert) hoặc

Icon Chart (trên Menu bar) , thực hiện theo 04 bước

Bước 3:(Format đồ thị) là bước tu chỉnh, chỉnh sửa và thay đổi tiêu đề

phức tạp Dạng thức tổng quỏt: <TấN HÀM> (Tham số 1, Tham số 2, )

Trong đú: <TấN HÀM> là tờn qui ước của hàm, khụng phõn biệt chữ hoa hay thường

Cỏc tham số: Đặt cỏch nhau bởi dấu "," hoặc ";" tuỳ theo khai bỏo trong Control Panel

Trang 25

- Công dụng: Làm tròn số thập phân m đến n chữ số lẻ Nếu n dương thì làm tròn phần thập phân Nếu n âm thì làm tròn phần nguyên

Trang 26

- Công dụng: Trả về chuỗi s sau khi đã cắt bỏ các ký tự trống ở hai đầu

- Ví dụ: TRIM(“ EXCEL ”) ® “EXCEL”

@ Chú ý: Nếu các hàm LEFT, RIGHT không có tham số n thì Excel sẽ hiểu

- Cú pháp: COUNTIF (phạm vi, điều kiện)

- Công dụng: Đếm số ô thỏa mãn điều kiện trong phạm vi

@ Chú ý: Trừ trường hợp điều kiện là một con số chính xác thì các trường

hợp còn lại đều phải bỏ điều kiện trong một dấu ngoặc kép

Trang 27

- Cú pháp: SUMIF(vùng chứa điều kiện, điều kiện, vùng cần tính tổng)

- Công dụng: Hàm dùng để tính tổng có điều kiện Chỉ những ô nào trên vùng chứa điều kiện thoả mãn điều kiện thì sẽ tính tổng những ô tương ứng trên vùng cần tính tổng

Cã thÓ chän 01 mÉu ngÉu nhiªn trong tæng thÓ cã dung l−îng h÷u h¹n

qua Excel b»ng c¸c lÖnh Tools → Data analysis → Sampling

VÝ dô: Gi¶ sö cã mét tæng thÓ cã dung l−îng N = 100 phÇn tö, cÇn t¹o 1 mÉu cã 10 phÇn tö th× thùc hiÖn theo c¸c b−íc cña qui tr×nh 1

Trang 28

Qui trình 1

Bước 1: vào dãy số có thứ tự từ 1 đến 100 (A1:A100)

Bước 2: Chọn Tools trên thanh công cụ

Bước 3: Chọn Data Analysis, chọn Sampling và OK

Bước 4: Trong hộp thoại Sampling chọn:

- Input Range A1:A100

- Number of samples: 10

- Output range B1:B10

2.3 Phương pháp biểu thị phân bố thực nghiệm 1 biến số và vẽ biểu đồ phân bố

Phân bố thực nghiệm là quy luật phân bố của các trị số điều tra hoặc đo

đếm được ở mẫu Bằng Excel ta có thể biểu thị phân bố và vẽ biểu đồ phân bố theo quy trình 2

Quy trình 2

Bước 1: Nạp số liệu

Bước 2: Chọn Tools → Data Analysis → Histogram và OK

Bước 3: Trong Histogram chọn:

- Input Range: Khai khối dữ liệu của mẫu

- Bin range: Khai khối dữ liệu phạm vi các tổ

- Output range: Khai vùng xuất kết quả

- Cumulative Percentage (phần trăm tần số tích luỹ)

- Chart output: Vẽ biểu đồ Bước 3: OK

Trang 29

Ví dụ: Lập phân bố thực nghiệm và vẽ biểu đồ phân bố của một loài sâu hại trên lúa (mật độ là con/m2) Điều tra với 30 điểm, mỗi điểm điều tra 1m2,

điểm được chọn ngẫu nhiên trong ruộng lúa đang đẻ nhánh, kết quả điều tra

+ A1:E6 - Mật độ sâu hại là con/m2

+ A9:A13 - Ngưỡng mật đô k=1 (Bin range)

+ B9:B14 - Frequency (Tần số tương ứng với các ngưỡng mật độ)

+ C9:C14 - Cumulative % (Phần trăm tần số tích lũy tương ứng)

Trang 30

Hình 2.3.1: phân bố thực nghiệm của loài sâu hại trên lúa

Bước 2: Đưa con trỏ về vị trí sẽ để (Out put) kết quả

Bước 3: Chọn “ fx” hay menu Insert

- Chọn Statistical → Chọn hàm “= Average”

- Đưa vùng số liệu vào

Bước 4: Finish

Trang 31

Bảng 2.4.1: Bảng tính giá trị trung bình cộng của 30 mẫu cây

Ví dụ : Bình phương toàn phương của mật độ loài sâu hại trên lúa (mật

độ là con/m2) với 12 điểm điều tra ta có:

Trang 32

2.4.3 Ph−¬ng sai vµ sai tiªu chuÈn

Gi¶ sö cã mét mÉu cã dung l−îng mÉu lµ (n) víi c¸c phÇn tö cña mÉu lµ:

x1,x2,x3 xn th× ph−¬ng sai cña mÉu ®−îc tÝnh theo c«ng thøc sau:

S2 = (1/(n-1)) * SUM((x1-xtb)^2, (x2-Xtb)^2, , (xn-xtb)^2)

Sai tiªu chuÈn cña mÉu ®−îc tÝnh theo c«ng thøc:

S = SQRT(S2)

Quy tr×nh 5

B−íc 1: Vµo sè liÖu ( A1:An vïng chøa sè liÖu)

B−íc 2: TÝnh ph−¬ng sai cña mÉu (S2) sö dông hµm

Trang 33

Bảng 2.4.3: Phương sai và sai tiêu chuẩn của mẫu

Giả sử có một mẫu có dung lượng mẫu là (n) với các phần tử của mẫu là:

x1,x2,x3 xn thì hệ số biến động của mẫu được tính:

S% = (S/xtb)*100 Phạm vi biến động của mẫu được tính:

Trang 34

lệch của đỉnh đường cong so với giá trị trung bình) và độ nhọn (mức độ biến

động của trị số quan sát so với trung bình) được tính như sau:

Độ lệch (S k ) :

Sk = {n/((n-1)*(n-2))}*SUM{(x1-xtb)^3, (x2-xtb)^3, ,(xn-xtb)^3}/S^3

Nếu: Sk = 0 thì phân bố là đối xứng

Sk>0 thì đường công lệch trái so với giá trị trung bình

Sk<0 thì đường cong lệch phải so với giá trị trung bình

Độ nhọn (K):

K={n*(n+1)/((n-1)*(n-2)*(n-3))}*SUM{(x1-xtb)^4,(x2-xtb)^4, ,(xn

-xtb)^4)/S^4} - 3*(n-1)^2/{(n-2)*(n-3)}

Nếu: K = 0 thì đường cong thực nghiệm tiệm cận chuẩn

K>0 thì đường cong có dạng bẹt so với tiệm cận chuẩn

K<0 thì đường cong có dạng nhọn so với tiệm cận chuẩn

Trong Excel đã có sãn 2 hàm để tính toán độ lệch và độ nhọn, vì thế chúng ta có thể thực hiện theo bước sau:

Quy trình 6

Bước 1: Nạp số liệu ( A1:An vùng chứa số liệu)

Bước 2: Chọn biểu tượng “fx” trên Tool bars →Statistical

+ Chọn hàm độ lệch SKEW hoặc độ nhọn KURT → NEXT

+ Input Range: Khai khối dữ liệu của mẫu

+ Output range: Khai vùng xuất kết quả

Bước 3: OK

Trang 35

Ví dụ: Giả sử có một mẫu có dung l−ợng mẫu là (n=12) với các phần tử

của mẫu thì độ lệch và độ nhọn của mẫu đ−ợc tính trong bảng 2.4.5

Trang 36

2.4.6 Khoảng tin cậy:

Khoảng tin cậy của mẫu được tính xtb ± m

Bước 1: Chọn Menu tools trên thanh thực đơn

Bước 2: Chọn Data Analysis, chon Descriptive Statistical và OK

Bước 3: Chọn Input Range (Khai khối dữ liệu)

+ Grouped by (Dữ liệu đầu vào theo cột Columns hay Rows)

+ Confidence level for Mean (sai số cực hạn của trung bình)

+ Kth Largest (trị số quan sát lớn thứ K)

+ Kth Smallest (Trị số quan sát bé thứ K)

Bước 4: Output range (Khai vùng xuất kết quả)

+ Summary Statistics (Thông tin tóm lược các đặc trưng)

Bước 5: OK

Bảng 2.4.7: Xác định các đặc trưng thống kê của 12 đặc điểm

1 6.2 Column1

2 6.5

Trang 37

9 8.2 Kurtosis (Độ nhọn của mẫu) 0.15

2.5.1 Một số khái niệm cơ bản

Giả sử ta có một tổng thể với dung lượng N phụ thuộc vào 2 tham số à

và δ2 , chúng ta viết là N(à, δ2) Nếu chúng ta có một phần tử X trong tổng thể

N, có nghĩa là X thuộc N(à, δ2) Bài toán ước lượng thống kê đặt ra là từ những

số liệu quan sát ở mẫu, dùng các công thức toán học và lý thuyết thống kê sắc suất để ước lượng các đặc trưng của tổng thể N Người ta giải quyết bài toán

ước lượng hiệu nghiệm nhất đối với số trung bình tổng thể với phương sai D(x)

=δ2/n

Trang 38

Ngoài ra số trung bình mẫu còn là hàm ước lượng không chệch và hội

tụ đối với tham số à của tổng thể

Do vậy công thức tính à của tổng thể là:

à = Xtb ± SQRT(D(x)) Với SQRT(D(x)) là sai tiêu chuẩn số trung bình mẫu ký hiệu là:

δ(x) = SQRT(D(x)) Vì phương sai tổng thể hầu như không biết nên chúng ta dùng phương sai mẫu nghĩa là: δ(x)≈ Sx= S/SQRT(n)

Nếu qua điều tra sơ bộ chúng ta có thể biết được hệ số biến động (S%)

và cho trước hệ số chính xác P% thì dung lượng cần điều tra là nct = (S%/P%)^2

Trang 39

+ Nếu cho trước hệ số chính xác P%

Khi đó:

Dung lượng mẫu cần thiết Nct = (S%/P%)2

Ví dụ: Giả sử chúng ta có số liệu đo đường kính của 30 cây trồng thuần Bài toán đặt ra là: nếu muốn hệ số chính xác không vượt quá 5% (tức là P% ≤ 5%) thì dung lượng mẫu quan sát phải là bao nhiêu cây?

Chúng ta thực hiện theo các bước trong quy trình 8 và thu được kết quả bảng ở 2.5.2.1

Bảng 2.5.2.1: Tính dung lượng mẫu quan sát

Điều đó có nghĩa là dung lượng mẫu quan sát cần thiết (nếu P% =5%)

là 56 cây và số cây quan sát thêm là 56 - 30 = 26 cây

2.5.2.2 Phương pháp ước lượng điểm thành số tổng thể Pt

Trang 40

Giả sử ta có một tổng thể có dung l−ợng N phần tử đ−ợc phân biệt nhau bởi dấu hiệu nào đó (nh− sống, chết, tốt, xấu ), trong đó có M phần tử mang

đặc điểm A và N-M phần tử mang đặc điểm khác A (đặc điểm B)

Tỷ số Pt = M/N đ−ợc gọi là thành số tổng thể của nh−ng phần tử mang

đặc điểm A

Nếu từ tổng thể ta rút ngẫu nhiên hoàn lại một mẫu có dung l−ợng n, trong đó có m phần tử mang đặc điểm A, thì tỷ lệ Pm = m/n đ−ợc gọi là thành

số mẫu của những phần tử mang đặc điểm A Do vậy công thức −ớc l−ợng

điểm đối với thành số tổng thể là:

Pt = Pm ± SQRT(Pm*(1 - Pm)/n) Nếu muốn sai số trung bình giữa thành số mẫu và thành số tổng thể không v−ợt quá giới hạn cho phép (εc) thì dung l−ợng cần quan sát sẽ là: nct ≥ (Pm(1-Pm))/ εc^2

Ví dụ: Kiểm nghiệm tỷ lệ nảy mầm của lô hạt giống Lấy ngẫu nhiên

200 hạt đi gieo thử có 140 hạt nảy mầm Hãy −ớc l−ợng tỷ lệ nảy mầm của toàn bộ lô? Nếu sai số không v−ợt quá 0.05 (εc ≤ 0.05) thì cần quan sát bao nhiêu hạt

Ta có Pm=140/200 = 0.7 và δpm = SQRT(Pm(1-Pm))/n = 0.0324

Vậy Pt = Pm ± δpm = 0.7 ± 0.0324

Nếu muốn sai số không v−ợt quá 0.05 thì dung l−ợng cần là:

Nct = (Pm(1-Pm)/ εc^2 = 84 hạt

Ngày đăng: 13/08/2015, 17:26

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w