Hoặc tổng số cây rừng trong một lâm phần.. Chọn mẫu hệ thống Các phần tử quan sát rải đều trong tổng thể.. Chọn mẫu điển hình Dựa vào một số thông tin đã biết trước về tổn
Trang 1ĐỀ CƯƠNG BÀI GIẢNG
THỐNG KÊ TOÁN HỌC TRONG LÂM NGHIỆP
Trang 2Chương 1 PHÂN BỐ THỰC NGHIỆM VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG
CÁC THAM SỐ ĐẶC TRƯNG CỦA TỔNG THỂ
Số tiết: 7 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành: 0 tiết)
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ Các phương pháp chọn mẫu
+ Phân bố thực nghiệm
+ Ước lượng điểm, ước lượng khoảng
- Kỹ năng: Vận dụng được để tính toán các đặc trưng mẫu, lập các phân bố thực nghiệm
- Thái độ: Chủ động, tích cực trong việc tìm hiểu các đặc trưng mẫu và phân bố thực nghiệm
1.1 Một số khái niệm
1.1.1 Tổng thể và mẫu
1.1.1.1 Tổng thể
- Khái niệm: Tổng thể là toàn bộ đối tượng cần nghiên cứu, số lượng các phần tử của
tổng thể được gọi là dung lượng tổng thể
- Ký hiệu: N là dung lượng của tổng thể Dung lượng của tổng thể có thể là một số hữuhạn hoặc vô hạn
- Ví dụ: Tổng số dân trong tỉnh Phú Thọ Hoặc tổng số cây rừng trong một lâm phần
1.1.1.2 Mẫu
- Khái niệm: Mẫu là một bộ phận của tổng thể, mà trên đó người ta tiến hành điều tra, đođếm và thu thập tài liệu Số lượng các phần tử của mẫu được gọi là dung lượng mẫu
- Ký hiệu: n là dung lượng mẫu, dung lượng mẫu luôn là một số hữu hạn
- Ví dụ: Số cây trong OTC đo đếm Số người trong xã được phỏng vấn
1.1.2 Các phương pháp chọn mẫu
1.1.2.1 Chọn mẫu ngẫu nhiên
Chúng ta đem đánh số các phần tử và sau đó bốc thăm tạo thành mẫu Có thể dựa vàoBảng số ngẫu nhiên, rút thăm hay trình lệnh T-D-S trong Excel
1.1.2.2 Chọn mẫu hệ thống
Các phần tử quan sát rải đều trong tổng thể
- Chọn mẫu theo tuyến song song cách đều:
0
S
S
Sr: diện tích rừng; So: diện tích 1 ô; N: dung lượng tổng thể
- Chọn mẫu theo mắt lưới
1.1.2.3 Chọn mẫu điển hình
Dựa vào một số thông tin đã biết trước về tổng thể sau đó sẽ lấy mẫu là những phần tửđiển hình, đại diện nhất cho tổng thể Những phần tử này cho phép kết luận cho toàn bộ tổng thể
1.1.3 Dấu hiệu quan sát (tiêu thức thống kê)
1.1.3.1 Dấu hiệu quan sát về lượng (đại lượng quan sát)
- Khái niệm: Dấu hiệu quan sát về lượng là đại lượng có thể cân, đong đo, đếm một cáchchính xác bằng các dụng cụ điều tra
Trang 3- Ký hiệu: Đại lượng quan sát là các chữ cái in: X, Y, Z…
- Ví dụ: Chiều cao vút ngọn (Hvn), đường kính ngang ngực (D1.3),
- Đại lượng quan sát liên tục: Là đại lượng có thể nhận bất kỳ giá trị nào trong mộtkhoảng xác định nào đó
- Ví dụ: Chiều cao cây rừng, bề dày sản phẩm, độ dài sợi nấm…
- Đại lượng đứt quãng: Là những đại lượng chỉ có thể nhận các giá trị là những số trònđếm được
- Ví dụ: Số quả có trên một cành, số sâu có trên một cây, số sản phẩm được sản xuất/1 cacủa một cỗ máy…
1.1.3.2 Dấu hiệu quan sát về chất
- Khái niệm: Đại lượng có các phần tử phân biệt nhau bởi 1 đặc điểm hay tính chất
- Ví dụ: Hạt nảy mầm, không nảy mầm; cây bị bệnh, không bị bệnh; cây tốt, xấu,…
- Bằng cách gán cho các phần tử mang đặc điểm A giá trị 0 và các phần tử mang đặcđiểm khác A giá trị là 1, khi đó nhận được dấu hiệu quan sát về lượng 2 giá trị 0,1 – là đại lượngđứt quãng
1.2 Phân bố thực nghiệm
1.2.1 Khái niệm
Quy luật phân bố của những giá trị quan sát được ở mẫu có thể khái quát hoá thành phânbố lý thuyết gọi là phân bố thực nghiệm
Phân bố thực nghiệm được lập khi dung lượng mẫu đủ lớn (n30)
1.2.1.1 Lập phân bố thực nghiệm cho đại lượng đứt quãng
- Bước 1: Tìm giá trị lớn nhất, giá trị nhỏ nhất (Xmax, Xmin) trong dãy quan sát
- Bước 2: Lập bảng phân bố tần số thực nghiệm
- Bước 3: Thống kê các phần tử cùng giá trị theo kiểu kiểm phiếu bầu cử
- Bước 4: Tính tần số, tần suất thực nghiệm
- Bước 5: Vẽ biểu đồ phân bố thực nghiệm
- Ví dụ 1.1: Lập phân bố thực nghiệm số ô theo số cây thông nhựa tái sinh tự nhiên có
trong 60 ô quan sát ở khu vực Uông Bí – Quảng Ninh
1.2.1.2 Lập phân bố thực nghiệm cho đại lượng liên tục
- Bước 1: Chia tổ ghép nhóm
) lg(
+ Xmax, Xmin là trị số quan sát lớn nhất và bé nhất
- Bước 2: Lập bảng phân bố tần số và tần suất thực nghiệm
- Bước 3: Thống kê các phần tử có cùng giá trị theo kiểu kiểm phiếu bầu cử
- Bước 4: Tính tần số thực nghiệm
- Bước 5: Vẽ biểu đồ
- Ví dụ 1.2: Lập phân bố thực nghiệm cho bề dày của 50 sản phẩm gỗ
1.2.2 Các đặc trưng của phân bố thực nghiệm (đặc trưng mẫu)
Trang 41.2.2.1 Số trung bình mẫu
a Trung bình mẫu giản đơn
- Khái niệm: Giả sử có một dãy trị số quan sát: x1, x2,… xn, thì trị số:
x
1
(1.4)
được gọi là số trung bình mẫu giản đơn
- Chú ý: Số trung bình mẫu giản đơn thường tính với mẫu nhỏ (n<30), tài liệu chưa qua
chỉnh lý
- Ví dụ 1.3: Tính trung bình về chiều cao cây rừng từ số liệu đo cao 10 cây
b Trung bình gia quyền
Trong trường hợp mẫu lớn (n30), tài liệu đã qua chỉnh lý, số trung bình mẫu được tínhtheo công thức sau:
x n
1
m i i
i x f
1
(1.5)
Với xi là trị số giữa tổ, fi là tần số tương ứng với mỗi tổ
- Ví dụ 1.4: Tính trung bình về chiều cao cây rừng từ số liệu đo cao 30 cây
1.2.2.2 Số trung bình toàn phương
- Khái niệm: Giả sử có 1 dãy các trị số quan sát: z1, z2,… zn thì số bình quân:
n i i
z n
z
1 21
(1.6)được gọi là số trung bình toàn phương
Trong lâm nghiệp, đã vận dụng số trung bình toàn phương để tính đường kính bình quâncây rừng theo công thức:
n i i
d n
d
1 21
(1.7)
- Ví dụ 1.5: Tính đường kính bình quân toàn phương của 6 cây rừng sau: d1=8.2 cm;
d2=7.5 cm; d3=6.4 cm; d4=9.0 cm; d5=8.0 cm; d6=7.3 cm
1.2.2.3 Phương sai và sai tiêu chuẩn
a Sai tiêu chuẩn mẫu
- Khái niệm: Là số bình quân toàn phương về độ lệch giữa các giá trị quan sát với sốtrung bình mẫu của nó
- Công thức hiệu đính sai tiêu chuẩn mẫu được viết như sau:
i x x n
S
1
)(1
n
i i i
x
n
x x
Q
1
1
2 2
)(
(1.9)
+ Ví dụ 1.6: Tính sai tiêu chuẩn về chiều cao từ số liệu đo chiều cao 10 cây rừng
Trang 5+ Trong trường hợp mẫu lớn (n>30), tài liệu đã qua chỉnh lý:
n i i i i
i x
n
x f x
f Q
1
1
2 2
)(
(1.10)
+ Ví dụ 1.7: Từ tài liệu chỉnh lý số sản phẩm theo bề dày của 50 sản phẩm được sản xuất
ở 1 cỗ máy chế biến, tính sai tiêu chuẩn về bề dầy sản phẩm
b Phương sai mẫu
- Bình phương sai tiêu chuẩn mẫu được gọi là phương sai mẫu
- Phương sai mẫu ký hiệu là: S2
1.2.2.4 Hệ số biến động
- Khái niệm: Biểu thị mức độ biến động bình quân tương đối của dãy trị số quan sát
100
- Ví dụ 1.8: Khu rừng A có chiều cao bình quân là 8,5m và sai tiêu chuẩn về chiều cao là
1.2m, khu rừng B có chiều cao bình quân là 10,5m và sai tiêu chuẩn về chiều cao là 1,2m Hỏikhu rừng nào có mức độ phân hoá về chiều cao mạnh hơn?
1.2.2.5 Phạm vi biến động
- Khái niệm: Phạm vi biến động là khoảng chênh lệch giữa trị số quan sát lớn nhất và bénhất của dãy trị số quan sát
R=Xmax-Xmin
Trong đó: Xmax và Xmin là trị số quan sát lớn nhất và bé nhất của dãy quan sát
1.2.2.6 Sai số của số trung bình mẫu
Là đại lượng xác định bởi công thức:
S
100
1.2.2.8 Độ lệch (SK)
- Khái niệm: Độ lệch là đại lượng đặc trưng cho mức độ chênh lệch của đỉnh đường cong
so với số trung bình
3 1
3
)(
S n
x x S
n
i i K
Nếu SK=0 thì phân bố là đối xứng
SK>0 thì đỉnh đường cong lệch trái so với số trung bình
SK<0 thì đỉnh đường cong lệch phải so với số trung bình
Trang 6)(4 1
x x E
n
i i X
(1.14)
EX=0 thì đường cong thực nghiệm tiệm cận chuẩn
EX>0 thì đỉnh đường cong nhọn so với phân bố chuẩn
EX<0 thì đỉnh đường cong bẹt hơn so với phân bố chuẩn
1.3 Phương pháp ước lượng các tham số đặc trưng của tổng thể
Giả sử X là một biến ngẫu nhiên có phân bố xác suất phụ thuộc vào một số hữu hạn cáctham số: 1, 2,…, n Từ biến ngẫu nhiên này thực hiện n quan sát và tạo thành một mẫu
1.3.1 Phương pháp ước lượng điểm
- Khái niệm: Là phương pháp ước lượng thống kê, trong đó người ta dùng trị số của hàmước lượng được tính toán ở mẫu thay thế một cách gần đúng cho tham số của tổng thể cần ước lượng
- Công thức tổng quát của phương pháp ước lượng điểm tham số của tổng thể như sau:
+ là tham số của tổng thể cần ước lượng
+ Tn là hàm ước lượng của tham số
+ t là trị số thực của hàm ước lượng Tn
+ DT(n) là phương sai của hàm ước lượng Tn
- Ví dụ 1.9: Để ước lượng số trung bình tổng thể , người ta đã chứng minh được rằng:
số trung bình mẫu ( x ) là hàm ước lượng tốt nhất thoả mãn cả 3 tính chất của 1 hàm ước lượng:
không chệch, hội tụ và hiệu nghiệm Công thức ước lượng điểm như sau:
n
S x S
S x được gọi là sai số của số trung bình mẫu
1.3.2 Phương pháp ước lượng khoảng
- Khái niệm: Là phương pháp ước lượng thống kê trong đó tham số cần ước lượng củatổng thể chứa trong một khoảng xác định được cấu tạo từ những kết quả quan sát ở mẫu với mộtxác suất (hay độ tin cậy) cho trước
- Công thức tổng quát của phương pháp ước lượng khoảng tham số của tổng thể:
+ P = 1- = là độ tin cậy của ước lượng
+ là mức ý nghĩa, trong lâm nghiệp thường chọn bằng 0,05; 0,01 hay 0,001
+ Gd, Gtr là giới hạn dưới và giới hạn trên của khoảng ước lượng
là sai số tương đối của ước lượng
1.3.2.1 Ước lượng khoảng số trung bình tổng thể
Trang 7a Ước lượng khoảng số trung bình tổng thể trong trường hợp mẫu nhỏ (n<30), tài liệu chưa quachỉnh lý và tổng thể có phân bố chuẩn
- Người ta đã chứng minh được rằng, nếu tổng thể có phân bố chuẩn XN(,2) thì đại lượng:
n S
x n
S t
x
Trong đó:
+ xlà số trung bình mẫu
+ S là sai tiêu chuẩn mẫu
+ t/2(k) là giá trị tra bảng của phân bố t
- Sai số cực hạn của ước lượng là:
S t
4 2 2 / 2
%).(
)(
10
c
ct
x
S t n
- Ví dụ 1.11: Ước lượng chiều cao bình quân của 9 cây quế con trong vườn ươm dưới
công thức dàn che 50%, với =0,05 Nếu muốn sai số không vượt quá 3% thì dung lượng quansát cần thiết bằng bao nhiêu? Biết rằng phân bố số cây theo chiều cao là tuân theo luật chuẩn
b Ước lượng khoảng số trung bình tổng thể trong trường hợp mẫu lớn (n≥30)
Để ước lượng số trung bình tổng thể , cần rút ngẫu nhiên một mẫu với dung lượng đủlớn (n30) Theo định luật số lớn thì phân bố xác suất của số trung bình mẫu tiệm cận luậtchuẩn, vì vậy công thức ước lượng khoảng số trung bình tổng thể sẽ là:
S U x
Trị số U/2 được tra trong phụ biểu 1 ứng với xác suất 1-
Nếu =0,05 > 1- =0,95 > U/2=1,96Nếu =0,01 > 1- =0,99 > U/2=2,58Nếu =0,001 > 1- =0,999 > U/2=3,29Trong công thức (1.19):
n
S U x
G d /2
n
S U x
G tr /2
n
S U G
G
L tr d 2 /2
Trang 8S U
% / 2
n x
S U x
Trường hợp nếu cho trước sai số tương đối (%) thì dung lượng quan sát cần thiết đượcxác định theo công thức sau:
2 2
4 2 2 / 2
%).(
)(
10
c ct
x
S U n
/ 2
%)(
%).(
c ct
S U
1.3.2.2 Ước lượng khoảng phương sai tổng thể ( 2 )
Giả sử một tổng thể có phân bố chuẩn XN(,2), trong đó phương sai tổng thể 2 là 1tham số chưa biết cần ước lượng
Người ta đã chứng minh được rằng, nếu XN(,2) thì biến ngẫu nhiên:
1()
1(
) ( 2 / 1
2 2
2 ) ( 2 /
2
k k
S n S
và bậc tự
do k=n-1
- Ví dụ 1.12: Để khảo sát độ chính xác của một dụng cụ đo cao, người ta đo trên cùngmột mục tiêu 10 lân bằng cùng một dụng cụ với phương sai S2 =0,25 m2 Hãy ước lượng độchính xác của dụng cụ đo cao với độ tin cậy =0,95
1.3.3.3 Ước lượng khoảnh thành số tổng thể (P t )
Giả sử một tổng thể có N phần tử phân biệt nhau bởi một dấu hiệu nào đã trong đó có Mphần tử mang đặc điểm A và N-M phần tử mang đặc điểm khác A thì tỷ số:
Q t 1 t được gọi là thành số tổng thể của những phần tử mang đặc điểmkhác A
Trang 9Từ tổng thể rút ngẫu nhiên 1 mẫu với dung lượng đủ lớn (n>30), trong đó có m phần tửmang đặc điểm A và n-m phần tử mang đặc điểm khác A, thì tỷ số:
q m 1 m là thành số mẫu của những phần tử mang đặc điểm khác A
Người ta đã chứng minh được rằng, khi n đủ lớn mà Pt không gần 0 và 1 hoặc n Pr 5thì phân bố xác suất của Pm là tiệm cận chuẩn, vì vậy công thức ước lượng khoảng sẽ là:
)26.1(1
1
p P U P
m t m m
p p U n
- Ví dụ 1.13: Một khu rừng có diện tích rất lớn, người ta điều tra ngẫu nhiên một mẫu với
dung lượng n = 450 cây, trong đó có 120 cây bị bệnh sâu róm thông Hãy ước lượng tỷ lệ cây bịbệnh của cả khu rừng với = 0,05 Nếu muốn sai số không vượt quá 0,04 thì dung lượng quansát cần thiết bằng bao nhiêu?
*) Bài tập
1 Kết quả điều tra sinh trưởng đường kính ngang ngực (D1.3) của rừng trồng Keo lai, mật độ
2500 cây/ha cho trong tài liệu sau:
Hãy ước lượng đường kính ngang ngực (D1.3) trung bình của lâm phần với độ tin cậy α =0,05 Nếu muốn sai số của ước lượng không vượt quá 5% thì dung lượng quan sát cần thiết bằngbao nhiêu?
2 Kết quả điều tra sinh trưởng chiều cao vút ngọn (Hvn) của rừng trồng Keo lai, mật độ 1666cây/ha cho trong tài liệu sau:
Hãy ước lượng chiều cao vút ngọn (Hvn) trung bình của lâm phần với độ tin cậy α = 0,05.Nếu muốn sai số của ước lượng không vượt quá 5% thì dung lượng quan sát cần thiết bằng baonhiêu?
*) Tài liệu học tập
1 Ngô Kim Khôi (1998), Thống kê toán học trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
2 Nguyễn Hải Tuất (2006), Xử lý thống kê trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
*) Câu hỏi ôn tập
Trang 101 Thế nào là tổng thể, mẫu? Cho biết một số cách chọn mẫu trong lâm nghiệp?
2 Các phương pháp mô tả một phân bố thực nghiệm? Ý nghĩa và nội dung từng phương pháp?
3 Cho biết ý nghĩa và cách tính 5 đặc trưng mẫu: Trung bình, sai tiêu chuẩn, hệ số biến động, saisố của số trung bình và hệ số chính xác?
Trang 11Chương 2
MÔ HÌNH HÓA QUY LUẬT CẤU TRÚC TẦN SỐ
Số tiết: 8 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành: 1 tiết )
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ Kiểm định giả thuyết bằng tiêu chuẩn
+ Mô phỏng được phân bố theo các hàm phân bố Weibull, khoảng cách, Meyer
- Kỹ năng: Vận dụng được để mô phỏng các phân bố thực nghiệm bằng các hàm phân bố
- Thái độ: Chủ động, tích cực trong việc tính toán mô phỏng các phân bố thực nghiệm
2.1 Ý nghĩa của việc mô hình hoá quy luật cấu trúc tần số
- Tạo tiền đề để đề xuất các giải pháp kỹ thuật lâm sinh hợp lý, chẳng hạn: cần thiết phảiđiều chỉnh mật độ lâm phần ứng với từng giai đoạn tuổi lâm phần để điều tiết không gian dinhdưỡng thông qua biện pháp tỉa thưa (đối với rừng sản xuất) trên cơ sở nghiên cứu quy luật phânbố số cây theo mặt phẳng nằm ngang (n/D1.3), hay điều tiết cấu trúc theo mặt phẳng đứng tạonhững lâm phần nhiều tầng tán, đa tác dụng (đối với rừng phòng hộ) trên cơ sở nghiên cứu quyluật phân bố số cây theo mặt phẳng đứng (n/Hvn)
- Ví dụ: Quy luật phân bố số cây theo đường kính (n/D1.3) quy luật phân bố số cây theo
chiều cao vút ngọn (n/Hvn)
2.2 Kiểm tra giả thuyết về luật phân bố
- Bước 1: Đặt giả thuyết: H0: Fx(x)= F0(x)
Fx(x) là phân bố thực nghiệm của đại lượng quan sát
F0(x) là hàm phân bố lý thuyết đã xác định (phân bố chuẩn, phân bố giảm…)
- Bước 2: Nếu giả thuyết H0 đúng và dung lượng mẫu đủ lớn để sao cho tần số lý thuyết ở
các tổ lớn hơn hoặc bằng 5 thì đại lượng ngẫu nhiên:
f
f f
+ ft là tần số thực nghiệm
+ l là số tổ sau khi gộp (đó là số tổ có tần số lý luận 5)
+ r là số tham số của phân bố lý thuyết
- Bước 3: Kết luận về giả thuyết
Trang 12
)2.2(2
a x
b x
2
.2
1
2
1 2 2
dx e
b b t a X b t
a
P
Đặt
b
a x
u ta có:
t b
a b t a b
a x
u
t b
a b t a b
a x
1 1
2
1
t a x b t
Trong đó:
t
u du t
với t1 = |U1| và t2 = |U2|
- Trường hợp II: U1 âm và U2 dương:
- Trường hợp III: U1 và U2 đều dương và U2 > U1:
Trang 132.3.1.3 Nắn phân bố thực nghiệm theo dạng chuẩn
- Chỉnh lý tài liệu quan sát, tính các đặc trưng mẫu x , S.
- Thay thế một cách gần đúng x và S
- Tính xác suất để X lấy giá trị trong các tổ của đại lượng điều tra
- Tính tần số lý thuyết: fl=n.pi
- Kiểm tra giả thuyết H0 về luật phân bố theo tiêu chuẩn phù hợp 2
f
f f
1
2
có phân bố 2 với k=l-r-1 bậc tự do
So sánh n tính theo (2.1) với 2 0.5(k)
- Vẽ biểu đồ phân bố tần số thực nghiệm và lý thuyết
Ví dụ 2.1: Nắn phân bố thực nghiệm số sản phẩm theo bề dày (ví dụ 1.2) theo phân bố chuẩn
2.3.2 Phân bố giảm (phân bố mũ)
2.3.2.1 Khái niệm
Phân bố giảm là phân bố xác suất của biến ngẫu nhiên liên tục với hàm mật độ:
P x (x)=.e -x (x>0)
Trong đó là tham số của phân bố giảm
Đường cong phân bố giảm, giảm khi x tăng, càng lớn thì đường cong càng lõm vàngược lại, càng bé thì đường cong càng bẹt
2.3.2.2 Nắn phân bố thực nghiệm theo dạng hàm Meyer
Hàm Meyer có dạng: y=.e -x (2.12)
Trong đó và là hai tham số của hàm Meyer Để xác định và phải logarit hoá 2 vếphương trình (2.12):
lny=ln-.x
Đặt:
b a
y y
ˆln
Nhận được phương trình hồi quy tuyến tính 1 lớp:
bx a
m
y x y x
Q
m
x x
Q
y
x
2 2
2 2
)(
)16.2()
(
Trang 14Sau khi xác định được a và b theo công thức (2.14), dễ dàng tìm được các tham số và của hàm Meyer:
với f 0 là tần số quan sát tổ thứ nhất
Khi 1-= thì phân bố khoảng cách trở về dạng phân bố hình học:
2.3.3.2 Ước lượng các tham số của phân bố khoảng cách
)23.2()
(1
)22.2(0
f n n
)
Tham số đặc trưng cho độ nhọn của đường cong phân bố
)25.2()
n
i l
Trong đó a là trị số quan sát bé nhất, xi là trị giữa tổ
2.3.4.2 Nắn phân bố thực nghiệm theo hàm Weibull
Tham số được chọn sao cho kết quả tính trị số n theo công thức (2.1) là bé nhất vànhỏ hơn 052 tra bảng với bậc tự do k=l-r-1
(1-)(1-)X-1với x1
Trang 15Nếu giả thuyết không được chấp nhận thì tiến hành chọn tham số khác phù hợp hơn.
- Ví dụ 2.4: Nắn phân bố thực nghiệm n/D1.3 lâm phần mỡ trồng thuần loài đều tuổi theohàm Weibull theo kết quả điều tra sau đây (với =3)
2 Nắn phân bố số cây theo đường kính (n/D1.3) trạng thái rừng IIIA1 tại Tùng Di-Cát Bà, theo tài
liệu điều tra sau:
2.Đưa các biến kiểm định vào Variables trong Test distribution
3.Tiếp theo chọn phân bố lý thuyết cần mô phỏng như phân bố chuẩn (Normal) Weibull.…Trong Distribution parameters chọn Estimation from data trong proportion Estimation formula chọn Blom's
4.OK
2 Kiểm định theo dạng chuẩn chiều cao của 70 cây rừng
Quy trình:
1 Analyze\ Nonparametric Tests\ 1-Sample K- S
2 Trong hộp thoại Test variable lists, đưa biến kiểm tra (chẳng hạn hvn) vào và đánh dấudạng phân bố cần kiểm định: Normal, Poisson
3 Trong Options của hộp thoại One Sample Kolmogorov Smirnov Test, nếu muốn biết chitiết các đặc trưng mẫu, cần lựa chọn thêm Descriptive và nhấn Continue để trở về thực đơncủa hộp thoại One Sample Kolmogorov Smirnov Test
4 OK
*) Tài liệu học tập
1 Ngô Kim Khôi (1998), Thống kê toán học trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
2 Nguyễn Hải Tuất (2006), Xử lý thống kê trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
*) Câu hỏi ôn tập
Trang 161 Ý nghĩa của việc mô hình hóa cấu trúc tần số?
2 Trình tự các bước kiểm định giả thuyết bằng tiêu chuẩn
3 Vai trò, ý nghĩa của các hàm phân bố Weibull, khoảng cách, Meyer trong nghiên cứu lâm nghiệp?
Trang 17Chương 3 PHƯƠNG PHÁP SO SÁNH CÁC MẪU QUAN SÁT
VÀ THÍ NGHIỆM TRONG LÂM NGHIỆP
Số tiết: 10 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành 3 tiết)
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ So sánh các mẫu trong trường hợp: 2 mẫu độc lập, k mẫu độc lập
+ So sánh các mẫu trong trường hợp mẫu liên hệ
+ Kiểm tra thuần nhất các mẫu về chất
- Kỹ năng: Vận dụng được để tính toán, đưa ra kết luận cho các mẫu trong trường hợpđộc lập và liên hệ
- Thái độ: Chủ động, tích cực trong quá trình tính toán và đưa ra nhận xét
3.1 Các bước cơ bản khi giải bài toán so sánh
- Bước 1: Đặt giả thuyết:
- Bước 2: Tính toán các tiêu chuẩn thống kê phù hợp
- Bước 3: So sánh giá trị tính toán với giá trị tra bảng có 2 khả năng xảy ra:
+ Nếu giá trị tính toán giá trị tra bảng thì H0+ (chấp nhận giả thuyết H0)
+ Nếu giá trị tính toán > giá trị tra bảng thì H0- (bác bỏ giả thuyết H0)
3.2 Trường hợp hai mẫu độc lập
Mẫu độc lập hay thí nghiệm độc lập là những thí nghiệm được bố trí xa nhau, để có thểloại bỏ những tác động tác động giống nhau về hoàn cảnh (đất đai, khí hậu…)
3.2.1 Tiêu chuẩn t của Student
- Điều kiện áp dụng: Tiêu chuẩn t của Student được dùng trong trường hợp:
+ So sánh 2 mẫu về lượng độc lập
+ Hai tổng thể phải có phân bố chuẩn, phương sai của hai tổng thể bằng nhau (1=2 ).+ Dung lượng mẫu: n1, n2 < 30
- Các bước tiến hành:
+ Đặt giả thuyết: H0: 1=2
H1: 12 + Kiểm tra giả thuyết H0 bằng tiêu chuẩn t:
3.1
11.2
)1()1(
2 1 2
1
2 2 2
2 1 1
2 1
n
S n S n
x x t
+ Kết luận: So sánh /t/ với t05 (k) tra bảng với bậc tự do k=n1+n2-2
- Ví dụ 3.1: Hãy so sánh sinh trưởng đường kính ngang ngực (D1.3) của hai lô rừng thông
trồng thuần loài đều tuổi dưới hai công thức mật độ trồng rừng khác nhau (1500 cây/ha và 2000cây/ha)
Trường hợp: Nếu bài toán chưa cho trước về sự bằng nhau của 2 phương sai tổng thể thì
trước khi so sánh bằng tiêu chuẩn t phải kiểm tra sự bằng nhau của 2 phương sai (kiểm tra điềukiện), bằng tiêu chuẩn F (Fisher)
- Đặt giả thuyết: H0: 1 =2
Trang 18H1: 1 >2 (nếu S1 > S2)
- Giả thuyết được kiểm tra bằng công thức:
2 2
2 1
S
S
Trong đó: S1, S2 là sai tiêu chuẩn của mẫu 1 và mẫu 2
- So sánh F với F05 (k1,k2) với bậc tự do k1=n1-1, k2=n2-1
- Ví dụ 3.2: So sánh khối lượng thể tích của ván dăm (g/cm3) được sản xuất ra từ hai nhàmáy chế biến gỗ Biết rằng khối lượng thể tích của ván dăm là tuân theo luật chuẩn, cho trước
=0.05
3.2.2 Tiêu chuẩn U của phân bố chuẩn tiêu chuẩn
Điều kiện áp dụng: n1,n230, hai mẫu độc lập về lượng, không cần biết trước về luậtphân bố của hai tổng thể thì ta sử dụng tiêu chuẩn U của phân bố chuẩn tiêu chuẩn
- Đặt giả thuyết: H0: 1=2
2 1
2 1
n
S n S
x x U
- So sánh /U/ với 1.96
- Ví dụ 3.3: Hãy so sánh sinh trưởng đường kính của cây trồng trên hai vị trí địa hình với
=0.05
3.2.3 Các tiêu chuẩn phi tham số
Cách xếp hạng các trị số quan sát:
- Sắp xếp các trị số quan sát của từng mẫu theo thứ tự từ bé đến lớn
- Xếp hạng các trị số quan sát chung cho cả hai mẫu
* Tiêu chuẩn U của Mann và Whiney
- Điều kiện áp dụng:
+ Không biết trước luật phân bố của đại lượng quan sát
- Bước 2: Sắp xếp các trị số quan sát theo thứ tự từ bé đến lớn chung cho cả hai mẫu
- Bước 3: Xếp hạng các trị số quan sát
- Bước 4: Tính tổng hạng cho mỗi mẫu và kiểm tra việc xếp hạng Nếu Rx, Ry là tổnghạng của hãi mẫu thì công thức kiểm tra là:
2
)1(
Trang 19y y
y y x y
x x
x y x x
R n
n n n
U
R n
n n n
2
)1(
Với: U y n x n y U x
- Bước 6: Dùng Ux và Uy để kiểm tra giả thuyết H0 theo tiêu chuẩn U của Mann và
Whiney sau:
)1(
y x x
n n n n
n n U U
- So sánh /U/ với 1.96
Chú ý:
+ Nếu đã tính Ux theo (3.6) thì Uy có thể tính theo công thức thứ 2 sau:
x y x
y x x
n n U
n n U U
Trong đó:
T trong đó t là số lần lặp lại 1 trị số quan sát nào đó
+ Khi dùng tiêu chuẩn U của Mann và Whiney để so sánh 2 mẫu độc lập, dung lượngquan sát của 2 mẫu không cần đủ lớn, song theo Wander Walden thì nx4, ny4 và nx+ ny>20
- Ví dụ 3.4: Hãy so sánh sinh trưởng chiều cao cây rừng trồng thuần loài đề tuổi dưới 2công thức mật độ trồng rừng khác nhau (1500c/ha và 2000c/ha)
3.2.4 Tiêu chuẩn Kruskal and Wallis
Tiêu chuẩn dùng so sánh k (nhiều) mẫu độc lập
- Điều kiện áp dụng là:
+ Phân bố đại lượng quan sát phải liên tục
+ Phải có từ 3 mẫu trở lên
- Bước 1: Đặt giả thuyết: H0: F(X1)= F(X2)= = F(Xk)
H1: F(X1) F(X2)= = F(Xk) (Chỉ cần có một sự sai khác.)
- Bước 2: Sắp xếp các trị số quan sát chung của các mẫu (k mẫu) theo thứ tự từ bé đến lớn.
- Bước 3: Xếp hạng các trị số quan sát chung cho K mẫu.
- Bước 4: Tính tổng hạng cho mỗi mẫu và kiểm tra việc xếp hạng
2
11
K i
Trong đó:
Trang 20Ri là tổng hạng của mẫu thứ i.
n là tổng dung lượng quan sát của toàn thí nghiệm: nn1 n2 n k
- Bước 5: Kiểm tra giả thuyết H0 về sự thuần nhất của các mẫu bằng tiêu chuẩn 2 sau đây:
R n
n
i i i
- So sánh 2 với 052 tra bảng với k=n-1 bậc tự do
3.3 Trường hợp các mẫu liên hệ
Là các mẫu quan sát không độc lập với nhau mà có liên hệ với nhau ở một mức độ nào
đó, các mẫu như thế gọi là mẫu liên hệ Các mẫu liên hệ luôn đi theo từng cặp
Ví dụ: Trong đo cao cây rừng, người ta có thể dùng một trong hai loại thước đo cao:Thước kẹp sào và thước Blumeleise
3.3.1 Tiêu chuẩn t của Student để so sánh hai mẫu liên hệ
Điều kiện áp dụng: n1, n2 phải được rút ra từ tổng thể có phân bố chuẩn
+ Đặt giả thuyết: H0: x=y
H1: xy+ Kiểm tra giả thuyết H0 bằng công thức sau:
3.21
n S
d t
d
Trong đó: di là hiệu sai (di=xi-yi)
d là trung bình của hiệu sai di
Q n
Q
i d
d d
2 2
+ So sánh /t/ với t05 (k=n-1)
- Ví dụ 3.8: Người ta đo đường kính ngang ngực cây rừng (D1.3) bằng hai loại thước:Thước kẹp kính và thước đo vanh Kết quả đo đường kính được cho ở bảng 3.9 Hỏi hai kết quả
đo đường kính bằng hai loại thước khác nhau có sai khác nhau rõ rệt không?
3.3.2 Tiêu chuẩn tổng hạng theo dấu của Wilcoxon
Đây là tiêu chuẩn phi tham số dùng để kiểm tra sai dị giữa hai mẫu liên hệ
Điều kiện áp dụng là: + F(X), F(Y) phải liên tục
+ r25 (r là số cặp hiệu sai di0)
- Bước 1: Đặt giả thuyết: H0: F(X)=F(Y)
H1: F(X)F(Y)
- Bước 2: Tính các hiệu sai (hay sai dị) di=xi-yi, trong đó xi và yi là các giá trị thực nghiệm
tương ứng của đại lượng X và Y của hai mẫu
- Bước 3: Xếp hạng các hiệu sai theo thứ tự từ bé đến lớn, khi xếp hạng bỏ qua những sai
dị bằng 0 (di= xi-yi=0) và không để ý đến dấu của các sai dị là âm hay dương
- Bước 4: Tính tổng hạng theo dấu âm (R-) và tổng hạng theo dấu dương (R+), kiểm traviệc xếp hạng và tính tổng hạng theo công thức sau:
Trong đó r là số cặp có sai dị khác 0
- Bước 5: Kiểm tra giả thuyết H0 theo tiêu chuẩn U của Wilcoxon:
Trang 21
24
12141
r r R
r
r r R U
- Bước 6: So sánh /U/ với 1.96
- Ví dụ 3.7: Người ta đo chiều cao của 26 cây trồng thuần loài đề tuổi được kết quả ở
bảng 3.8 bằng hai loại thước đo cao là thước Blumeleise và thước kẹp sào Hỏi kết quả đo chiềucao cây bằng hai loại thước khác nhau có thuần nhất với nhau không?
3.4 Kiểm tra thuần nhất các mẫu về chất
3.4.1 So sánh hai mẫu về chất bằng tiêu chuẩn U
- Đặt giả thuyết: H0: Pt1=Pt2
H1: Pt1Pt2Trong đó: H1: Pt1, Pt2 là thành số mẫu 1 và thành số mẫu 2
- Để kiểm tra giả thuyết H0 ta dùng công thức sau:
2 1
m
p
m
m p p U
Trong đó Pm là sai số của thành số mẫu, được tính theo công thức sau:
11
2
1 1 2
n n
P n P n
2 1
2 2
1 1
n
p p
- Kết luận: So sánh /U/ với 1.96
- Ví dụ 3.9: So sánh tỷ lệ cây bị bệnh ở hai khu rừng thông trồng thuần loài đều tuổi
- Ví dụ 3.10: So sánh tỷ lệ sản phẩn được sản xuất ra từ 2 cỗ máy chế biến của 1 xínghiệp chế biến lâm sản
3.4.2 Kiểm tra thuần nhất các mẫu về chất (kiểm tra tính độc lập)
- Giả sử cần so sánh a mẫu về chất, mỗi mẫu về chất chia ra b cấp chất lượng, đặt giảthuyết H0: Các mẫu về chất là thuần nhất
H1: Các mẫu về chất là không thuần nhất
Kết quả được sắp xếp vào bảng gồm các hàng và cột như sau:
Bảng 3.10: Sắp xếp kết quả nghiên cứu
Trang 22fij
fib
fab
Ta1Ta2
Tai
Taa
fij là tần số quan sát của mẫu i cấp chất lượng j
Tai là tổng tần số quan sát của mẫu thứ i
Tbj là tổng tần số quan sát của cấp chất lượng j
TS là tổng tần số quan sát của toàn thí nghiệm
b j ij b
j j a
i
i Tb f Ta
TS
1 1 1
ij n
Tb Ta
f TS
- Kết luận: So sánh n với 052 tra bảng, k=(a-1)(b-1) bậc tự do
- Ví dụ 3.11: So sánh chất lượng rừng trồng trên 3 khu vực trồng rừng khác nhau
*) Bài tập
1 Hãy so sánh sinh trưởng đường kính ngang ngực (D1.3) của hai lô rừng thông trồng thuần loài
đều tuổi dưới hai công thức mật độ trồng rừng khác nhau (1500 cây/ha và 2000 cây/ha) theo tàiliệu sau: + Công thức mật độ 1500 cây/ha: x1=10.5 cm, S1=1.2 cm2, n1=16 cây
+ Công thức mật độ 2000 cây/ha: x2=8.6 cm, S2 =1.1 cm2, n2=19 cây
Biết rằng phân bố số cây theo đường kính của hai lâm phần tuân theo luật chuẩn vàphương sai của hai tổng thể bằng nhau
2 Người ta đo khối lượng thể tích của ván dăm (g/cm3) được sản xuất ra từ hai nhà máy chế biến
gỗ, kết quả được cho ở bảng sau:
Trang 23Hãy so sánh sinh trưởng đường kính của cây trồng trên hai vị trí địa hình với =0.05.Trong đó ft(1) là tần số quan sát ứng với vị trí trồng rừng chân đồi, ft(2) là tần số quan sát ứngvới vị trí trồng rừng đỉnh đồi.
4 Hãy so sánh sinh trưởng chiều cao cây rừng trồng thuần loài đề tuổi dưới 2 công thức mật độtrồng rừng khác nhau (1500c/ha và 2000c/ha) theo tài liệu điều tra sau:
5 Người ta đo chiều cao của 26 cây trồng thuần loài đề tuổi được kết quả ở bảng sau, bằng hailoại thước đo cao là thước Blumeleise và thước kẹp sào Hỏi kết quả đo chiều cao cây bằng hailoại thước khác nhau có thuần nhất với nhau không?
1234567891011121314151617181920212223242526
2.43.12.82.53.33.53.64.13.42.62.02.52.93.74.13.82.53.43.23.73.02.92.22.73.03.2
2.63.02.52.72.83.43.64.53.72.32.42.32.63.84.03.32.83.03.13.23.12.42.22.53.32.8
6 Hai khu rừng thông trồng thuần loài đều tuổi có diện tích rất lớn bị nhiễm bệnh rơm lá trông
Từ mỗi khu rừng lập 1 ô tiêu chuẩn điển hình 2000 m2 và thống kê số cây bị nhiễm bệnh Kếtquả điều tra như sau:
- Khu rừng I: n1=70 cây, m1=24 cây bị bệnh
- Khu rừng II: n2=75 cây, m2=36 cây bị bệnh