Dấu hiệu quan sátTrong Lâm nghiệp khi nghiên cứu một vấn đề nào đó về mặt định lượng người ta đều phải quan sát, thu thập số liệu, hoặc làm một số thí nghiệm có liên quan và sau cùng th
Trang 1THỐNG KÊ SINH HỌC
GVGD: Th.S Cao Thị Thu Hiền
Trang 2Chương 1
THỐNG KÊ MÔ TẢ
Trang 31.1 Dấu hiệu quan sát
Trong Lâm nghiệp khi nghiên cứu một vấn
đề nào đó về mặt định lượng người ta đều phải quan sát, thu thập số liệu, hoặc làm một số thí nghiệm có liên quan và sau cùng thu thập những kết quả
Ví dụ 1: muốn nghiên cứu tốc độ sinh trưởng của loài Bạch đàn bằng một biện pháp kỹ thuật nào đó thì người ta tiến hành hai thí nghiệm:
Trang 4một trồng theo biện pháp kỹ thuật mới và một đối chứng Sau một thời gian thu thập kết quả về sinh trưởng đường kính, chiều cao của cả hai thí nghiệm để so sánh và đánh giá kết quả.
Ví dụ 2:
Để nghiên cứu ảnh hưởng của độ ẩm đối với sự nảy mầm của hạt Keo, người ta đem gieo loại hạt giống này trên những lô đất có độ ẩm khác nhau (những điều kiện khác như nhau)
Trang 5Từ tỷ lệ hạt nảy mầm và không nảy mầm của các lô hạt thí nghiệm có thể giúp ta so sánh kết quả và từ đó rút ra kết luận xem ở độ ẩm nào cho độ nảy mầm cao hơn.
Như vậy qua hai ví dụ trên cho thấy để đạt mục đích nghiên cứu cần phải tiến hành làm một số thí nghiệm và sau cùng quan sát hoặc đo đếm những kết quả đã đạt được.
Trang 6Trong “Thống kế sinh học” người ta gọi chung những đại lượng hoặc những tính
chất nào đó cần phải quan sát hoặc đo đếm
là dấu hiệu quan sát.
Như vậy, ở ví dụ 1 thì dấu hiệu quan sát là chiều cao hoặc đường kính, ở ví dụ 2 thì
dấu hiệu quan sát là chất lượng nảy mầm
của hạt giống.
Kí hiệu dấu hiệu quan sát về lượng bằng chữ X (hoặc Y, Z…)
Trang 7* Các loại dấu hiệu quan sát:
Có 2 loại là dấu hiệu về lượng và dấu hiệu về chất.
Dấu hiệu quan sát về lượng (đại lượng, biến định lượng): Là đại lượng có thể điều tra, đo đếm
một cách chính xác bằng các dụng cụ điều tra (cân, đong, đo, đếm).
Trang 8Dấu hiệu quan sát về lượng lại được chia
ra làm 2 loại là đại lượng liên tục và đại lượng đứt quãng.
Đại lượng liên tục là những đại lượng có thể lấy giá trị bất kỳ trong khoảng xác định Ví
dụ như đường kính, chiều cao, hình số, …
Đại lượng đứt quãng là những đại lượng chỉ lấy giá trị là những số tròn, nguyên dương, đếm được Ví dụ: Số sâu/lá, số cành/cây, số lá/cành, ……
Trang 9Dấu hiệu quan sát về chất (biến định tính) phân biệt với nhau là đặc điểm hoặc tính
chất nào đó.
Dấu hiệu quan sát về chất cũng được chia làm 2 loại là có thứ bậc và không có thứ bậc.
Ví dụ: Số hạt này mầm và số hạt không nảy mầm hay số sản phẩm được sản xuất ra từ 1
cỗ máy có màu sắc khác nhau, … Được gọi là
không có thứ bậc.
Trang 10Ví dụ: vị trí chân đồi, sườn đồi, đỉnh đồi là có thứ bậc
Câu hỏi: Có thể chuyển đại lượng đứt quãng thành đại lượng liên tục không?
+ Có thể chuyển dấu hiệu quan sát về chất thành dấu hiệu quan sát về lượng được không?
Trang 111.2 Tổng thể và mẫu
1.2.1 Tổng thể
Tổng thể là một tập hợp hữu hạn hoặc vô hạn các phần tử (gọi là dung lượng tổng thể) có cùng một số tính chất chung nào đó.
Ví dụ 1: Tập hợp các cây rừng trong một khu rừng rộng lớn
Ví dụ 2: Số sinh viên của trường Đại học LN
Dung lượng tổng thể ký hiệu là N
Trang 13* Phương pháp rút thăm:
Ở phương pháp này, các phần tử của tổng thể được đánh số thứ tự từ 1 đến hết (1, 2, 3, …, N) rồi dùng các thăm cũng được đánh số tương tự (1, 2, 3,…, N) Phần tử được quan sát, đo đếm là phần tử có số hiệu trùng với số hiệu của thăm được bốc ngẫu nhiên.
Trang 14Ưu điểm: Khách quan, dễ thực hiện, đảm bảo hoàn toàn ngẫu nhiên
Nhược điểm: Các phần tử ở mẫu có thể không phân bố đều trong tổng thể, rất khó thực hiện khi số phần tử của tổng thể là quá lớn.
* Dùng bảng số ngẫu nhiên
Là 1 bảng gồm các dãy số nguyên gồm hay nhiều chữ số được thiết lập một cách ngẫu nhiên
từ 10 số: 0, 1, 2, 3, …, 9
Trang 15Để thiết lập một mẫu ngẫu nhiên bằng bảng số ngẫu nhiên, phải đánh số các
phần tử của tổng thể từ 1 đến hết, rồi dùng bảng số ngẫu nhiên để chọn các phần tử
Ví dụ: Muốn dùng bảng số ngẫu nhiên để lấy 1 mẫu gồm 10 phần tử từ 1 tổng thể 100 phần tử Trước hết đem các phần tử của tổng thể đánh dấu từ 1 đến 100
Trang 16Ta dùng bảng số ngẫu nhiên đọc trên bảng
1 dãy các con số có 2 chữ số và làm tiếp tục như vậy cho đến khi có được 10 số Mẫu của ta là những phần tử tương ứng với các số đó.
Ưu điểm: Mẫu ngẫu nhiên khách quan, đảm bảo độ tin cậy cao, có thể tính sai số rút mẫu bằng các tiêu thức thống kê.
Nhược điểm: Phương pháp này
ít được dùng trong lâm nghiệp vì
những tổng thể lâm nghiệp có số lượng
Trang 17phần tử quá lớn rất khó khăn trong việc đánh số các phần tử của nó.
1.3.2 Rút mẫu hệ thống
Đây là phương pháp thường được dùng trong lâm nghiệp, người ta đưa ra những quy tắc cách đều theo không gian hoặc thời gian, từ đó định ra những phần tử cho chúng ta chọn mẫu.
Ví dụ: tiến hành đo cây: Cứ 5 ngày người
ta đo 1 lần về D, H (phương pháp này được gọi là
cách đều theo thời gian).
Trang 18Ở phương pháp này, trên diện tích rừng người ta kẻ nhiều đường thẳng song song cách đều và trên đo đặt những ô cách đều có diện tích như nhau để tiến hành quan sát các đại lượng như đường kính, chiều cao Ví dụ như hình vẽ sau:
Trang 19Ưu điểm: Các phần tử ở mẫu rải đều, trong tổng thể tính đại diện của mẫu cao
Nhược điểm: Tính hệ thống sẽ bị vi phạm nếu gặp các chướng ngại vật khi mở tuyến
và đặt ô quan sát
1.3.3 Chọn mẫu điển hình
Trong một khu rừng người ta chọn hẳn cả một giải rừng mang tính chất điển hình cho đại lượng quan sát để thu thập số liệu.
Trang 20Ưu điểm: Đơn giản, dễ thực hiện Nhược điểm: Ít khách quan, độ chính xác phụ thuộc vào kinh nghiệm của điều tra viên Phương pháp này không tính được sai số chọn mẫu.
1.4 Mô tả đại lượng quan sát bằng bảng tần số
Trong nhiều trường hợp nghiên cứu về rừng người ta cần tìm hiểu những quy luật phân
bố tần số hoặc tần suất tồn tại một cách khách quan.
Trang 21Chẳng hạn muốn xây dựng được những phương pháp đo tính trữ sản lượng cho một khu rừng nào đó, việc tìm hiểu những quy luật kết cấu của cây rừng như quy luật phân bố số cây theo chiều cao (N/H VN ) hoặc theo đường kính (N/D 1.3 ) là rất cần thiết Ở những điều kiện xác định nào đó những quy luật này có thể biểu thị bằng một dạng toán học khá chính xác đủ phục cho những mục đích thực tiễn.
Trang 221.4.1 Định nghĩa phân bố lý thuyết
Những quy luật phân bố tồn tại một cách khách quan trong tổng thể và có thể biểu thị một cách gần đúng bằng một biểu thức toán học gọi là quy luật phân bố lý thuyết.
1.4.2 Định nghĩa phân bố thực nghiệm
Phân bố giá trị của các phần tử quan sát được ở một mẫu thí nghiệm và từ đó có thể khái quát hóa thành những dạng lý thuyết,
người ta gọi là phân bố thực nghiệm.
Trang 23Xây dựng được phân bố thực nghiệm
để từ đó có thể khái quát hoá thành những
phân bố lý thuyết là một trong những nhiệm
vụ rất cơ bản của người làm thồng kê Song làm thế nào để có thể phát hiện được những quy luật khách quan trên cơ sở những tài liệu quan sát
Để giải quyết vấn đề này điều cơ bản
là các số liệu quan sát được phải đem sắp xếp lại theo một quy tắc nào đó.
Trang 24Ví dụ sắp xếp các giá trị quan sát theo thứ tự từ nhỏ đến lớn và thống kê số những phần tử có cùng một giá trị (đối với đại lượng đứt quãng) hoặc thống kê những phần tử có những giá trị chứa trong những khoảng xác định (đối với đại lượng liên tục)
Cách làm như vậy gọi là phân tổ tài liệu
quan sát. Việc phân tổ tài liệu quan sát
ngoài ý nghĩa trên còn giúp cho việc
Trang 25* Chú ý khi chỉnh lý tài liệu quan sát
1) Nếu tài liệu không nhiều
quá 30 thì không nên phân tổ vì phân tổ sẽ làm giảm độ chính xác của tài liệu.
2) Đối với đại lượng liên tục số tổ chia cũng không nên nhiều quá Nhiều quá không thể hiện được quy luật Ít quá quy luật sẽ bị phá hoại Theo Brooks và Carruther số tổ có thể tính theo công thức:
Trang 26Ví dụ: Bảng 1.3 (trang 8)
m
x x
k max min
Trang 27B3: Tính tần số và tần xuất thực nghiệm.
B4: Vẽ biểu đồ.
Trang 28b) Đại lượng liên tục
B1: Chia tổ, ghép nhóm theo công thức kinh nghiệm:
Số tổ được chia m = 5.lg(n)
Với n là dung lượng mẫu
Cự li tổ:
x max : Giá trị lớn nhất của dãy trị số quan sát.
x min : Giá trị bé nhất của dãy trị số quan sát.
k: Khoảng cách giữa các tổ (cự li tổ).
m
x x
k max· min
Trang 29B2: Lập bảng phân bố tần suất và tần
số Thống kê các phần tử có cùng giá trị
theo kiểu bầu cử (kiểm phiếu bầu cử).
B3: Tính fi và tần số luỹ tích F (cộng dồn).
B4: Vẽ biểu đồ: Đa giác tần số, hình chữ nhật, luỹ tích.
Trang 30Quy trình lập bảng tần số bằng Excel như
1 Tools/Data analysis/Histogram
2 Khai báo dãy số liệu quan sát chưa qua phân tổ vào Input range
3 Khai báo dãy số liệu được chia theo tổ (để
ở một cột) vào Bin range
4 Đánh dấu vào các mục cần thiết như Cumulative Percentage, Chart output
5 Chọn một cell bất kỳ để xuát kết quả
6 Ok
Trang 311.4 Mô tả đại lượng quan sát bằng biểu đồ
Có 3 loại biểu đồ thường dùng: biểu đồ đa
giác tần số, biểu đồ chữ nhật và biểu đồ lũy tích
1.4.1 Biểu đồ đa giác tần số
Dùng để biểu thị phân bố tần số của những đại lượng đứt quãng, trục hoành biểu thị các giá trị quan sát (giá trị giữa cỡ) và trục tung biểu thị tần số (hoặc tần suất) tương ứng.
Ví dụ: Vẽ biểu đồ cho ví dụ 1.3 (trang 8)
Trang 32Đối với đại lượng liên tục nếu muốn biểu thị bằng biểu đồ đa giác thì trục hoành biểu thị bằng trị số giữa tổ.
Trang 34x n
x
1
3 2
x
1
.
1
Trang 35b) Số trung bình toàn phương:
Cho một dãy các trị số z 1 , z 2 , z 3 ,… z n thì trị
số được tính theo công thức:
Gọi là số trung bình toàn phương Trong lâm nghiệp người ta đã vận dụng số trung bình này để tính đường kính thân cây trung bình về tiết diện ngang ở độ cao 1.3m.
z
1
2.
1
Trang 36Ví dụ: Đường kính ngang ngực của 5 cây được cho như sau:
4 i
Trang 371
2 2
.
1 4 4
2.
d
1
2 2
1
Trang 38c) Trung vị mẫu
Trị số tương ứng với phần tử thứ i thoả mãn điều kiện: số phần tử có giá trị lớn hơn và nhỏ hơn bằng nhau khi dãy quan sát được sắp xếp theo thứ tự từ nhỏ đến lớn thì được gọi là
trung vị mẫu.
Khi các trị số quan sát sắp xếp theo thứ tự
từ nhỏ đến lớn Nếu số lần quan sát n là lẻ (n = 2p + 1) thì tương ứng với phần tử thứ p + 1.
x
x x
Trang 39Trong trường hợp đại lượng quan sát đứt quãng mà n chẵn thì số trung vị mẫu không tồn tại mà chỉ tồn tại khoảng trung vị Trường hợp
đại lượng liên tục đã qua phân tổ thì số trung vị được xác định theo công thức:
Trong đó: x i là trị số giới hạn dưới của tổ chứa
x i+1 là trị số giới hạn trên của tổ chứa
i
n
x
x Ni
n x
2
x x
Trang 411.5.2 Đặc trưng biến động:
Có 4 chỉ tiêu thống kê là phương sai mẫu, sai tiêu chuẩn mẫu, hệ số biến động, phạm
vi biến động.
a) Phương sai và sai tiêu chuẩn mẫu
+ Sai tiêu chuẩn (độ lệch chuẩn) là số bình quân toàn phương về độ lệch giữa các giá trị quan sát với số trung bình của nó, công thức
hiệu đính được viết như sau:
i x
x n
S
1
2
1 1
Trang 42Trường hợp mẫu nhỏ n < 30, tài liệu chưa qua chỉnh lý:
n i
i
i
n
x x
Qx
1
2
1 2
Trang 43Trường hợp mẫu lớn , tài liệu đã qua chỉnh lý:
Ý nghĩa: Sai tiêu chuẩn cho biết mức độ phân hoá giữa các trị số quan sát so với trị số trung bình.
Trang 44+ Phương sai: Là bình phương của sai tiêu chuẩn
b) Hệ số biến động S%
Hệ số biến động là chỉ tiêu biểu thị mức độ biến động bình quân tương đối của dãy trị số quan sát.
100
%
x S
S
Trang 45c) Phạm vi biến động
Phạm vi biến động là khoảng chênh lệch giữa trị số quan sát lớn nhất và trị số quan sát bé nhất.
Trang 46dùng chỉ tiêu thống kê là độ lệch phân bố.
Khi S K = 0, phân bố đối xứng Khi S K > 0, đỉnh đường cong thực nghiệm lệch trái so với số trung bình.
Khi S K < 0, đỉnh đường cong thực nghiệm lệch phải so với số trung bình.
3
3
.S n
x
x
Trang 47b) Độ nhọn
Để đặc trưng cho mức độ tập trung hay phân tán của các trị số quan sát xung quanh trị số trung bình, người ta dùng chỉ tiêu thống kê là độ nhọn.
Khi E X = 0, phân bố thực nghiệm tiệm cận phân bố chuẩn.
Khi E X > 0, phân bố thực nghiệm nhọn so với phân bố chuẩn.
3 4
x x
Trang 48Khi E X < 0, phân bố thực nghiệm bẹt so với phân bố chuẩn.
1.5.4 Các đặc trưng sai số rút mẫu
a) Sai số của số trung bình mẫu
b) Hệ số chính xác
Nói lên sai số tương đối của số trung bình
n
S S
x
n S
P% %
Trang 491.6 Tính trung bình và độ lệch chuẩn của những mẫu quan sát về chất
Giả sử 1 tổng thể nào đó có N phần tử chia làm 2 loại, trong đó có M phần tử mang đặc điểm A, N - M phần tử mang đặc điểm khác A, người ta gọi tỷ số: P = M/N là thành số tổng thể của những phần tử mang đặc điểm A.
Tỷ số Q = (N – M)/N = 1 – P được gọi là thành số tổng thể của những phần tử mang đặc
điểm khác A
Trang 50Từ tổng thể rút ngẫu nhiên 1 mẫu với dung lượng đủ lớn n ≥ 30, trong đó có m phần tử mang đặc điểm A, n - m phần tử mang đặc điểm khác A, thì tỷ số: p = m/n được gọi là thành số mẫu của những phần tử mang đặc điểm A.
Tỷ số q = (n – m)/n = 1 – p được gọi là thành số mẫu của những phần tử
mang đặc điểm khác A.
Trang 51Bây giờ nếu gán cho phần tử mang đặc điểm A giá trị là 1 và phần tử mang đặc điểm khác A giá trị 0 thì ta có bảng phân bố tần số thực nghiệm sau:
m n
q 1
Trang 52Số trung bình của mẫu quan sát về chất:
Độ lệch chuẩn của mẫu quan sát về chất:
n
m n
m m
n x
f n
1 )
.(
0 1
S
n
n
m m
n
m m
n S
2 2
~ ( )(0 ) (1 )
Trang 53m
n n
m
S
~