1. Trang chủ
  2. » Nông - Lâm - Ngư

Thống kê sinh học-Chương 1 pdf

53 962 13

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 3,84 MB

Nội dung

Dấu hiệu quan sátTrong Lâm nghiệp khi nghiên cứu một vấn đề nào đó về mặt định lượng người ta đều phải quan sát, thu thập số liệu, hoặc làm một số thí nghiệm có liên quan và sau cùng th

Trang 1

THỐNG KÊ SINH HỌC

GVGD: Th.S Cao Thị Thu Hiền

Trang 2

Chương 1

THỐNG KÊ MÔ TẢ

Trang 3

1.1 Dấu hiệu quan sát

Trong Lâm nghiệp khi nghiên cứu một vấn

đề nào đó về mặt định lượng người ta đều phải quan sát, thu thập số liệu, hoặc làm một số thí nghiệm có liên quan và sau cùng thu thập những kết quả

Ví dụ 1: muốn nghiên cứu tốc độ sinh trưởng của loài Bạch đàn bằng một biện pháp kỹ thuật nào đó thì người ta tiến hành hai thí nghiệm:

Trang 4

một trồng theo biện pháp kỹ thuật mới và một đối chứng Sau một thời gian thu thập kết quả về sinh trưởng đường kính, chiều cao của cả hai thí nghiệm để so sánh và đánh giá kết quả.

Ví dụ 2:

Để nghiên cứu ảnh hưởng của độ ẩm đối với sự nảy mầm của hạt Keo, người ta đem gieo loại hạt giống này trên những lô đất có độ ẩm khác nhau (những điều kiện khác như nhau)

Trang 5

Từ tỷ lệ hạt nảy mầm và không nảy mầm của các lô hạt thí nghiệm có thể giúp ta so sánh kết quả và từ đó rút ra kết luận xem ở độ ẩm nào cho độ nảy mầm cao hơn.

Như vậy qua hai ví dụ trên cho thấy để đạt mục đích nghiên cứu cần phải tiến hành làm một số thí nghiệm và sau cùng quan sát hoặc đo đếm những kết quả đã đạt được.

Trang 6

Trong “Thống kế sinh học” người ta gọi chung những đại lượng hoặc những tính

chất nào đó cần phải quan sát hoặc đo đếm

dấu hiệu quan sát.

Như vậy, ở ví dụ 1 thì dấu hiệu quan sát là chiều cao hoặc đường kính, ở ví dụ 2 thì

dấu hiệu quan sát là chất lượng nảy mầm

của hạt giống.

Kí hiệu dấu hiệu quan sát về lượng bằng chữ X (hoặc Y, Z…)

Trang 7

* Các loại dấu hiệu quan sát:

Có 2 loại là dấu hiệu về lượng và dấu hiệu về chất.

Dấu hiệu quan sát về lượng (đại lượng, biến định lượng): Là đại lượng có thể điều tra, đo đếm

một cách chính xác bằng các dụng cụ điều tra (cân, đong, đo, đếm).

Trang 8

Dấu hiệu quan sát về lượng lại được chia

ra làm 2 loại là đại lượng liên tục và đại lượng đứt quãng.

Đại lượng liên tục là những đại lượng có thể lấy giá trị bất kỳ trong khoảng xác định Ví

dụ như đường kính, chiều cao, hình số, …

Đại lượng đứt quãng là những đại lượng chỉ lấy giá trị là những số tròn, nguyên dương, đếm được Ví dụ: Số sâu/lá, số cành/cây, số lá/cành, ……

Trang 9

Dấu hiệu quan sát về chất (biến định tính) phân biệt với nhau là đặc điểm hoặc tính

chất nào đó.

Dấu hiệu quan sát về chất cũng được chia làm 2 loại là có thứ bậc và không có thứ bậc.

Ví dụ: Số hạt này mầm và số hạt không nảy mầm hay số sản phẩm được sản xuất ra từ 1

cỗ máy có màu sắc khác nhau, … Được gọi là

không có thứ bậc.

Trang 10

Ví dụ: vị trí chân đồi, sườn đồi, đỉnh đồi là có thứ bậc

Câu hỏi: Có thể chuyển đại lượng đứt quãng thành đại lượng liên tục không?

+ Có thể chuyển dấu hiệu quan sát về chất thành dấu hiệu quan sát về lượng được không?

Trang 11

1.2 Tổng thể và mẫu

1.2.1 Tổng thể

Tổng thể là một tập hợp hữu hạn hoặc vô hạn các phần tử (gọi là dung lượng tổng thể) có cùng một số tính chất chung nào đó.

Ví dụ 1: Tập hợp các cây rừng trong một khu rừng rộng lớn

Ví dụ 2: Số sinh viên của trường Đại học LN

Dung lượng tổng thể ký hiệu là N

Trang 13

* Phương pháp rút thăm:

Ở phương pháp này, các phần tử của tổng thể được đánh số thứ tự từ 1 đến hết (1, 2, 3, …, N) rồi dùng các thăm cũng được đánh số tương tự (1, 2, 3,…, N) Phần tử được quan sát, đo đếm là phần tử có số hiệu trùng với số hiệu của thăm được bốc ngẫu nhiên.

Trang 14

Ưu điểm: Khách quan, dễ thực hiện, đảm bảo hoàn toàn ngẫu nhiên

Nhược điểm: Các phần tử ở mẫu có thể không phân bố đều trong tổng thể, rất khó thực hiện khi số phần tử của tổng thể là quá lớn.

* Dùng bảng số ngẫu nhiên

Là 1 bảng gồm các dãy số nguyên gồm hay nhiều chữ số được thiết lập một cách ngẫu nhiên

từ 10 số: 0, 1, 2, 3, …, 9

Trang 15

Để thiết lập một mẫu ngẫu nhiên bằng bảng số ngẫu nhiên, phải đánh số các

phần tử của tổng thể từ 1 đến hết, rồi dùng bảng số ngẫu nhiên để chọn các phần tử

Ví dụ: Muốn dùng bảng số ngẫu nhiên để lấy 1 mẫu gồm 10 phần tử từ 1 tổng thể 100 phần tử Trước hết đem các phần tử của tổng thể đánh dấu từ 1 đến 100

Trang 16

Ta dùng bảng số ngẫu nhiên đọc trên bảng

1 dãy các con số có 2 chữ số và làm tiếp tục như vậy cho đến khi có được 10 số Mẫu của ta là những phần tử tương ứng với các số đó.

Ưu điểm: Mẫu ngẫu nhiên khách quan, đảm bảo độ tin cậy cao, có thể tính sai số rút mẫu bằng các tiêu thức thống kê.

Nhược điểm: Phương pháp này

ít được dùng trong lâm nghiệp vì

những tổng thể lâm nghiệp có số lượng

Trang 17

phần tử quá lớn rất khó khăn trong việc đánh số các phần tử của nó.

1.3.2 Rút mẫu hệ thống

Đây là phương pháp thường được dùng trong lâm nghiệp, người ta đưa ra những quy tắc cách đều theo không gian hoặc thời gian, từ đó định ra những phần tử cho chúng ta chọn mẫu.

Ví dụ: tiến hành đo cây: Cứ 5 ngày người

ta đo 1 lần về D, H (phương pháp này được gọi là

cách đều theo thời gian).

Trang 18

Ở phương pháp này, trên diện tích rừng người ta kẻ nhiều đường thẳng song song cách đều và trên đo đặt những ô cách đều có diện tích như nhau để tiến hành quan sát các đại lượng như đường kính, chiều cao Ví dụ như hình vẽ sau:

Trang 19

Ưu điểm: Các phần tử ở mẫu rải đều, trong tổng thể tính đại diện của mẫu cao

Nhược điểm: Tính hệ thống sẽ bị vi phạm nếu gặp các chướng ngại vật khi mở tuyến

và đặt ô quan sát

1.3.3 Chọn mẫu điển hình

Trong một khu rừng người ta chọn hẳn cả một giải rừng mang tính chất điển hình cho đại lượng quan sát để thu thập số liệu.

Trang 20

Ưu điểm: Đơn giản, dễ thực hiện Nhược điểm: Ít khách quan, độ chính xác phụ thuộc vào kinh nghiệm của điều tra viên Phương pháp này không tính được sai số chọn mẫu.

1.4 Mô tả đại lượng quan sát bằng bảng tần số

Trong nhiều trường hợp nghiên cứu về rừng người ta cần tìm hiểu những quy luật phân

bố tần số hoặc tần suất tồn tại một cách khách quan.

Trang 21

Chẳng hạn muốn xây dựng được những phương pháp đo tính trữ sản lượng cho một khu rừng nào đó, việc tìm hiểu những quy luật kết cấu của cây rừng như quy luật phân bố số cây theo chiều cao (N/H VN ) hoặc theo đường kính (N/D 1.3 ) là rất cần thiết Ở những điều kiện xác định nào đó những quy luật này có thể biểu thị bằng một dạng toán học khá chính xác đủ phục cho những mục đích thực tiễn.

Trang 22

1.4.1 Định nghĩa phân bố lý thuyết

Những quy luật phân bố tồn tại một cách khách quan trong tổng thể và có thể biểu thị một cách gần đúng bằng một biểu thức toán học gọi là quy luật phân bố lý thuyết.

1.4.2 Định nghĩa phân bố thực nghiệm

Phân bố giá trị của các phần tử quan sát được ở một mẫu thí nghiệm và từ đó có thể khái quát hóa thành những dạng lý thuyết,

người ta gọi là phân bố thực nghiệm.

Trang 23

Xây dựng được phân bố thực nghiệm

để từ đó có thể khái quát hoá thành những

phân bố lý thuyết là một trong những nhiệm

vụ rất cơ bản của người làm thồng kê Song làm thế nào để có thể phát hiện được những quy luật khách quan trên cơ sở những tài liệu quan sát

Để giải quyết vấn đề này điều cơ bản

là các số liệu quan sát được phải đem sắp xếp lại theo một quy tắc nào đó.

Trang 24

Ví dụ sắp xếp các giá trị quan sát theo thứ tự từ nhỏ đến lớn và thống kê số những phần tử có cùng một giá trị (đối với đại lượng đứt quãng) hoặc thống kê những phần tử có những giá trị chứa trong những khoảng xác định (đối với đại lượng liên tục)

Cách làm như vậy gọi là phân tổ tài liệu

quan sát. Việc phân tổ tài liệu quan sát

ngoài ý nghĩa trên còn giúp cho việc

Trang 25

* Chú ý khi chỉnh lý tài liệu quan sát

1) Nếu tài liệu không nhiều

quá 30 thì không nên phân tổ vì phân tổ sẽ làm giảm độ chính xác của tài liệu.

2) Đối với đại lượng liên tục số tổ chia cũng không nên nhiều quá Nhiều quá không thể hiện được quy luật Ít quá quy luật sẽ bị phá hoại Theo Brooks và Carruther số tổ có thể tính theo công thức:

Trang 26

Ví dụ: Bảng 1.3 (trang 8)

m

x x

k  max  min

Trang 27

B3: Tính tần số và tần xuất thực nghiệm.

B4: Vẽ biểu đồ.

Trang 28

b) Đại lượng liên tục

B1: Chia tổ, ghép nhóm theo công thức kinh nghiệm:

Số tổ được chia m = 5.lg(n)

Với n là dung lượng mẫu

Cự li tổ:

x max : Giá trị lớn nhất của dãy trị số quan sát.

x min : Giá trị bé nhất của dãy trị số quan sát.

k: Khoảng cách giữa các tổ (cự li tổ).

m

x x

k  max·  min

Trang 29

B2: Lập bảng phân bố tần suất và tần

số Thống kê các phần tử có cùng giá trị

theo kiểu bầu cử (kiểm phiếu bầu cử).

B3: Tính fi và tần số luỹ tích F (cộng dồn).

B4: Vẽ biểu đồ: Đa giác tần số, hình chữ nhật, luỹ tích.

Trang 30

Quy trình lập bảng tần số bằng Excel như

1 Tools/Data analysis/Histogram

2 Khai báo dãy số liệu quan sát chưa qua phân tổ vào Input range

3 Khai báo dãy số liệu được chia theo tổ (để

ở một cột) vào Bin range

4 Đánh dấu vào các mục cần thiết như Cumulative Percentage, Chart output

5 Chọn một cell bất kỳ để xuát kết quả

6 Ok

Trang 31

1.4 Mô tả đại lượng quan sát bằng biểu đồ

Có 3 loại biểu đồ thường dùng: biểu đồ đa

giác tần số, biểu đồ chữ nhật và biểu đồ lũy tích

1.4.1 Biểu đồ đa giác tần số

Dùng để biểu thị phân bố tần số của những đại lượng đứt quãng, trục hoành biểu thị các giá trị quan sát (giá trị giữa cỡ) và trục tung biểu thị tần số (hoặc tần suất) tương ứng.

Ví dụ: Vẽ biểu đồ cho ví dụ 1.3 (trang 8)

Trang 32

Đối với đại lượng liên tục nếu muốn biểu thị bằng biểu đồ đa giác thì trục hoành biểu thị bằng trị số giữa tổ.

Trang 34

x n

x

1

3 2

x

1

.

1

Trang 35

b) Số trung bình toàn phương:

Cho một dãy các trị số z 1 , z 2 , z 3 ,… z n thì trị

số được tính theo công thức:

Gọi là số trung bình toàn phương Trong lâm nghiệp người ta đã vận dụng số trung bình này để tính đường kính thân cây trung bình về tiết diện ngang ở độ cao 1.3m.

z

1

2.

1

Trang 36

Ví dụ: Đường kính ngang ngực của 5 cây được cho như sau:

4 i

Trang 37

1

2 2

.

1 4 4

2.

d

1

2 2

1

Trang 38

c) Trung vị mẫu

Trị số tương ứng với phần tử thứ i thoả mãn điều kiện: số phần tử có giá trị lớn hơn và nhỏ hơn bằng nhau khi dãy quan sát được sắp xếp theo thứ tự từ nhỏ đến lớn thì được gọi là

trung vị mẫu.

Khi các trị số quan sát sắp xếp theo thứ tự

từ nhỏ đến lớn Nếu số lần quan sát n là lẻ (n = 2p + 1) thì tương ứng với phần tử thứ p + 1.

x

x x

Trang 39

Trong trường hợp đại lượng quan sát đứt quãng mà n chẵn thì số trung vị mẫu không tồn tại mà chỉ tồn tại khoảng trung vị Trường hợp

đại lượng liên tục đã qua phân tổ thì số trung vị được xác định theo công thức:

Trong đó: x i là trị số giới hạn dưới của tổ chứa

x i+1 là trị số giới hạn trên của tổ chứa

i

n

x

x Ni

n x

2

x x

Trang 41

1.5.2 Đặc trưng biến động:

Có 4 chỉ tiêu thống kê là phương sai mẫu, sai tiêu chuẩn mẫu, hệ số biến động, phạm

vi biến động.

a) Phương sai và sai tiêu chuẩn mẫu

+ Sai tiêu chuẩn (độ lệch chuẩn) là số bình quân toàn phương về độ lệch giữa các giá trị quan sát với số trung bình của nó, công thức

hiệu đính được viết như sau:   

i x

x n

S

1

2

1 1

Trang 42

Trường hợp mẫu nhỏ n < 30, tài liệu chưa qua chỉnh lý:

n i

i

i

n

x x

Qx

1

2

1 2

Trang 43

Trường hợp mẫu lớn , tài liệu đã qua chỉnh lý:

Ý nghĩa: Sai tiêu chuẩn cho biết mức độ phân hoá giữa các trị số quan sát so với trị số trung bình.

Trang 44

+ Phương sai: Là bình phương của sai tiêu chuẩn

b) Hệ số biến động S%

Hệ số biến động là chỉ tiêu biểu thị mức độ biến động bình quân tương đối của dãy trị số quan sát.

100

%

x S

S

Trang 45

c) Phạm vi biến động

Phạm vi biến động là khoảng chênh lệch giữa trị số quan sát lớn nhất và trị số quan sát bé nhất.

Trang 46

dùng chỉ tiêu thống kê là độ lệch phân bố.

Khi S K = 0, phân bố đối xứng Khi S K > 0, đỉnh đường cong thực nghiệm lệch trái so với số trung bình.

Khi S K < 0, đỉnh đường cong thực nghiệm lệch phải so với số trung bình.

3

3

.S n

x

x

Trang 47

b) Độ nhọn

Để đặc trưng cho mức độ tập trung hay phân tán của các trị số quan sát xung quanh trị số trung bình, người ta dùng chỉ tiêu thống kê là độ nhọn.

Khi E X = 0, phân bố thực nghiệm tiệm cận phân bố chuẩn.

Khi E X > 0, phân bố thực nghiệm nhọn so với phân bố chuẩn.

3 4

x x

Trang 48

Khi E X < 0, phân bố thực nghiệm bẹt so với phân bố chuẩn.

1.5.4 Các đặc trưng sai số rút mẫu

a) Sai số của số trung bình mẫu

b) Hệ số chính xác

Nói lên sai số tương đối của số trung bình

n

S S

x

n S

P%  %

Trang 49

1.6 Tính trung bình và độ lệch chuẩn của những mẫu quan sát về chất

Giả sử 1 tổng thể nào đó có N phần tử chia làm 2 loại, trong đó có M phần tử mang đặc điểm A, N - M phần tử mang đặc điểm khác A, người ta gọi tỷ số: P = M/N là thành số tổng thể của những phần tử mang đặc điểm A.

Tỷ số Q = (N – M)/N = 1 – P được gọi là thành số tổng thể của những phần tử mang đặc

điểm khác A

Trang 50

Từ tổng thể rút ngẫu nhiên 1 mẫu với dung lượng đủ lớn n ≥ 30, trong đó có m phần tử mang đặc điểm A, n - m phần tử mang đặc điểm khác A, thì tỷ số: p = m/n được gọi là thành số mẫu của những phần tử mang đặc điểm A.

Tỷ số q = (n – m)/n = 1 – p được gọi là thành số mẫu của những phần tử

mang đặc điểm khác A.

Trang 51

Bây giờ nếu gán cho phần tử mang đặc điểm A giá trị là 1 và phần tử mang đặc điểm khác A giá trị 0 thì ta có bảng phân bố tần số thực nghiệm sau:

m n

q    1 

Trang 52

Số trung bình của mẫu quan sát về chất:

Độ lệch chuẩn của mẫu quan sát về chất:

n

m n

m m

n x

f n

1 )

.(

0 1

S

n

n

m m

n

m m

n S

2 2

~ (  )(0  )  (1 )

Trang 53

m

n n

m

S   

~

Ngày đăng: 19/06/2014, 15:20

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w