ý nghĩa của việc mô hình hoá quy luật cấu trúc tần số - Khái niệm: Biểu thức toán học và dạng đồ thị của nó dùng để mô phỏng cho quy luật phân bố của đại lượng quan sát được gọi là phâ
Trang 1Bài giảng chương 2
Lý thuyết: 7 tiết
Bài tập: 3 tiết
Người soạn: Bùi Mạnh Hưng
Trang 22 tiết Chương 2 Mô hình hoá quy luật cấu trúc tần số 2.1 ý nghĩa của việc mô hình hoá quy luật cấu trúc tần số
- Khái niệm: Biểu thức toán học và dạng đồ thị của nó dùng để mô phỏng
cho quy luật phân bố của đại lượng quan sát được gọi là phân bố lý thuyết
- Việc mô hình hoá các quy luật cấu trúc tần số trong thực tiễn và nghiên cứu
nông lâm nghiệp có ý nghĩa to lớn Một mặt nó cho biết các quy luật phân bố vốn
tồn tại khách quan trong tổng thể, mặt khác các quy luật phân bố này có thể biểu thị
một cách gần đúng bằng các biểu thức toán học cho phép xác định tần suất hoặc tần
số tương ứng với mỗi tổ của đại lượng điều tra nào đó
Ví dụ: Quy luật phân bố số cây theo đường kính (n/D1.3) quy luật phân bố số
cây theo chiều cao vút ngọn (n/Hvn) được xem là những quy luật phân bố quan trọng
nhất của quy luật kết cấu lâm phần, biết được quy luật phân bố này, có thể dễ dàng
xác định được số cây tương ứng từng cỡ đường kính hay cỡ chiều cao, làm cơ sở
xây dựng các loại biểu chuyên dùng phục vụ mục tiêu kinh doanh rừng, biểu thể
tích, biểu thương phẩm, biểu sản lượng
Giảng:
Ngoài ra, việc nghiên cứu các quy luật phân bố còn tạo tiền đề để đề xuất các
giải pháp kỹ thuật lâm sinh hợp lý, chẳng hạn: cần thiết phải điều chỉnh mật độ lâm
phần ứng với từng giai đoạn tuổi lâm phần để điều tiết không gian dinh dưỡng thông
qua biện pháp tỉa thưa (đối với rừng sản xuất) trên cơ sở nghiên cứu quy luật phân
bố số cây theo mặt phẳng nằm ngang (n/D1.3), hay điều tiết cấu trúc theo mặt phẳng
đứng tạo những lâm phần nhiều tầng tán, đa tác dụng (đối với rừng phòng hộ) trên
cơ sở nghiên cứu quy luật phân bố số cây theo mặt phẳng đứng (n/Hvn)
Nắm được các quy luật phân bố còn là cơ sở để xác định các phương pháp
thống kê ứng dụng, chẳng hạn: nếu tổng thể có phân bố chuẩn thì việc ước lượng
trung bình tổng thể có thể dùng mẫu nhỏ theo tiêu chuẩn t của Student, còn nếu
tổng thể không tuân theo luật chuẩn thì phải dùng mẫu lớn để ước lượng theo tiêu
chuẩn U của phân bố chuẩn tiêu chuẩn…
2.2 Kiểm tra giả thuyết về luật phân bố
Trang 3Có nhiều tiêu chuẩn thống kê để kiểm tra giả thuyết về luật phân bố, tuy
nhiên trong chương trình này chúng ta sử dụng tiêu chuẩn phù hợp 2, đây là tiêu
chuẩn đơn giản dễ tính toán, có thể dùng cho phân bố liên tục hoặc đứt quãng
Khi tiến hành mô hình hoá quy luật cấu trúc tần số theo một phân bố lý
thuyết nào đó, cần thiết phải kiểm tra giả thuyết về luật phân bố được tiến hành qua
các bước chính như sau:
Bước 1: Đặt giả thuyết:
H0: Fx(x)= F0(x) Trong đó: Fx(x) là phân bố thực nghiệm (có thể là phân bố tần số hoặc tần
suất) của đại lượng quan sát
F0(x) là hàm phân bố lý thuyết đã xác định (phân bố chuẩn, phân bố giảm…)
Bước 2: Người ta đã chứng minh được rằng, nếu giả thuyết H0 đúng và dung lượng
mẫu đủ lớn để sao cho tần số lý thuyết ở các tổ lớn hơn hoặc bằng 5 thì đại lượng
ngẫu nhiên:
l
l t n
f
f f
1
2
có phân bố 2 với k=l-r-1 bậc tự do
Trong đó: + fl=n.pi là tần số lý luận tương ứng với từng tổ của đại lượng
điều tra, với pi là xác suất tương ứng mỗi tổ tính theo phân bố
lý thuyết đã lựa chọn
+ ft là tần số thực nghiệm
+ l là số tổ sau khi gộp (đó là số tổ có tần số lý luận 5)
+ r là số tham số của phân bố lý thuyết
Bước 3: Kết luận về giả thuyết
Nếu n2 tính theo (2.1) > 2
0.5(k) thì giả thuyết H0 bị bác bỏ ở mức ý nghĩa
=0.05, nghĩa là phân bố ta chọn không phù hợp với phân bố thực nghiệm
Ngược lại nếu n2 tính theo (2.1) 2
0.5(k) thì giả thuyết H0 tạm thời được chấp nhận, có nghĩa phân bố ta chọn F0(x) phù hợp với phân bố thực nghiệm
Trang 4Trị số 20.5(k) tra bảng trong phụ biểu số 5 ứng với mức ý nghĩa =0.05 (cũng
có thể =0.01, chỉ giảng thôi) và bậc tự do k
2.3 Một số phân bố lý thuyết thường gặp trong lâm nghiệp
2.3.1 Phân bố chuẩn
2.3.1.1 Khái niệm
Là phân bố xác suất của biến ngẫu nhiên liên tục Nếu X là biến ngẫu nhiên
liên tục có phân bố chuẩn thì hàm mật độ xác suất có dạng:
) 2 2 ( 2
.
2
2b a x
b x P
Trong đó:
a: là kỳ vọng toán, đường cong đồ thị đối xứng qua đường x=a, khi a thay đổi thì đỉnh đường cong sẽ di chuyển trên đường thẳng song song với trục hoành có tung độ:
2
1
b
y (Hình 2.1)
b: là sai tiêu chuẩn, khi b thay đổi đỉnh đường cong di chuyển
trên đường thẳng song song với trục tung có hoành độ: x = a (Hình 2.2)
a1 a2 a3
Px(X
)
X
Trang 5Trường hợp đặc biệt, khi a = 0 và b = 1 thì ta có phân bố chuẩn tiêu chuẩn
hay phân bố chuẩn 0, 1, ký hiệu là X N(0,1) Đường cong phân bố chuẩn tiêu
chuẩn đối xứng qua trục tung Mật độ xác suất của phân bố chuẩn tiêu chuẩn được
viết như sau:
2
(Người ta lập bảng tra cho phân bố này còn các phân bố chuẩn khác không
lập được bảng tra)
2.3.1.2 Cách tính xác suất theo phân bố chuẩn tiêu chuẩn
Trong thực tế, người ta thường tính xác suất để biến ngẫu nhiên X lấy giá trị
có độ chênh lệch so với kỳ vọng không quá t lần b lớn hơn và nhỏ hơn Xác suất
này được tính toán như sau:
) 4 2 (
2
1
.
2
1 2 2
2
x
x b a x
dx e
b b t a X b t a P
Đặt
b
a x
u ta có:
t b
a b t a b
a x u
t b
a b t a b
a x u
.
.
2 2
1 1
2
1
2
t
t
u
du e b
t a x b t a P
Do tính chất đối xứng của hàm x(u) nên
t
0
vì thế (2.5) có thể viết:
P(a-t.b X a+t.b) = 2 (t) (2.6)
(2 (t) là giá trị tra bảng của phân bố chuẩn.)
Trong đó:
t
t
0
.
Hàm (t) gọi là hàm số tích phân luôn luôn dương và bằng 0,5 khi t=+
Người ta đã lập sẵn phụ biểu để tính hàm (t) và 2(t) khi t có những giá trị khác
nhau (Phụ biểu số 2)
Trang 6Ví dụ: t = 1,96 thì (t) = 0,4750; 2(t) = 0,95
t = 2,58 thì (t) = 0,4959; 2(t) = 0,99
t = 3,29 thì (t) = 0,4995; 2(t) = 0,999 Các giá trị U1 và U2 tính được có thể âm hoặc dương, nhưng do tính chất đối
xứng của hàm x(u) nên mặc dù trị số U1 hoặc U2 có thể âm hoặc dương nhưng vẫn
có thể dựa vào trị số dương của t để tính toán, khi đó đặc |U| = t Có thể xảy ra 3
trường hợp sau:
* Trường hợp I: Cả U1 và U2 đều âm, nhưng U1 có giá trị tuyệt đối lớn hơn
U2 Khi đó xác suất sao cho X lấy giá trị trong khoảng x1 và x2 sẽ là:
P(x 1 X x 2 ) = (t 1 ) – (t 2 ) (2.8) với t1 = |U1| và t2 = |U2|
* Trường hợp II: U1 âm và U2 dương:
P(x 1 X x 2 ) = (t 1 ) + (t 2 ) (2.9)
* Trường hợp III: U1 và U2 đều dương và U2 > U1:
P(x 1 X x 2 ) = (t 2 ) – (t 1 ) (2.10)
2.3.1.3 Nắn phân bố thực nghiệm theo dạng chuẩn
Việc tính tần số lý thuyết cho từng tổ của các đại lượng điều tra như trên gọi
là nắn phân bố thực nghiệm theo dạng chuẩn Trình tự các bước có thể tóm tắt như
sau:
Chỉnh lý tài liệu quan sát, tính các đặc trưng mẫu x, S
Thay thế một cách gần đúng x và S
Tính xác suất để X lấy giá trị trong các tổ của đại lượng điều tra theo các
công thức đã trình bày
Tính tần số lý thuyết: fl=n.pi
Kiểm tra giả thuyết H0 về luật phân bố theo tiêu chuẩn phù hợp 2
H0: Fx(x)= F0(x) Tính đại lượng:
l
l t n
f
f f
1
2
có phân bố 2 với k=l-r-1 bậc tự do
Trang 7Nếu n2 tính theo (2.1) > 20.5(k) thì giả thuyết H0 bị bác bỏ ở mức ý nghĩa
=0.05, nghĩa là phân bố chuẩn không phù hợp với phân bố thực nghiệm
Ngược lại, nếu n2 tính theo (2.1) 2
0.5(k) thì giả thuyết H0 tạm thời được chấp nhận, có nghĩa phân bố chuẩn phù hợp với phân bố thực nghiệm
Vẽ biểu đồ phân bố tần số thực nghiệm và lý thuyết
Trang 82 tiết
Ví dụ 2.1: Nắn phân bố thực nghiệm số sản phẩm theo bề dày (ví dụ 1.2)
theo phân bố chuẩn
- Bước 1: Chỉnh lý tài liệu, tính toán các đặc trưng mẫu x, S Bước này đã
thực hiện ở chương 1, với x=8.37 cm và S=0.68 cm
- Bước 2: Thay thế một cách gần đúng số trung bình mẫu cho số trung bình
tổng thể (x), sai tiêu chuẩn mẫu cho sai tiêu chuẩn tổng thể (S)
- Bước 3: Tính xác suất để X lấy giá trị trong các tổ:
Tổ thứ nhất: x1=- và x2=6.75cm
6 75 2 38 0 0087
4913 0 38 2 38
2 68
0
37 8 75 6
5 0 ) ( 68
0
37 8
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ hai: x1=6.75 và x2=7.25 cm
6 75 7 25 2 38 1 65 0 0408
4505 0 65 1 65
1 68
0
37 8 25 7
4913 0 38 2 38
2 68
0
37 8 75 6
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ ba: x1=7.25 và x2=7.75 cm
7 25 7 75 1 65 0 91 0 1391
3186 0 91 0 91
0 68
0
37 8 75 7
4505 0 65 1 65
1 68
0
37 8 25 7
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ tư: x1=7.75 và x2=8.25 cm
7 25 7 75 1 65 0 91 0 1391
3186 0 91 0 91
0 68
0
37 8 75 7
4505 0 65 1 65
1 68
0
37 8 25 7
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ tư: x1=7.75 và x2=8.25 cm
Trang 9
7 75 8 25 0 91 0 18 0 0714
0714 0 18 0 18
0 68
0
37 8 25 8
3186 0 91 0 91
0 68
0
37 8 75 7
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ năm: x1=8.25 và x2=8.75 cm
8 25 8 75 0 18 0 56 0 2837
2123 0 56 0 56
0 68
0
37 8 75 8
0714 0 18 0 18
0 68
0
37 8 25 8
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ sáu: x1=8.75 và x2=9.25 cm
8 75 9 25 0 56 1 29 0 1892
4015 0 29 1 29
1 68 0
37 8 25 9
2123 0 56 0 56
0 68
0
37 8 75 8
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ bảy: x1=9.25 và x2=9.75 cm
9 25 9 75 1 29 2 02 0 0768
4783 0 02 2 02
2 68
0
37 8 75 9
4015 0 29 1 29
1 68
0
37 8 25 9
2 2
1 1
x P
b
a x u
b
a x u
Tổ thứ tám: x1=9.75 và x2= cm
9 75 2 02 0 0217
5 0 68
0
37 8
4783 0 02 2 02
2 68
0
37 8 75 9
2 2
1 1
x P
b
a x u
b
a x u
- Bước 4: Tính tần số lý luận cho từng tổ của đại lượng quan sát theo công
thức: fl=n.pi, trong đó n là dung lượng mẫu, pi là tần suất (hay xác suất) tương ứng
của mỗi tổ
- Bước 5: Kiểm tra giả thuyến về luật phân bố chuẩn theo tiêu chuẩn phù hợp
2
(công thức 2.1) với giả thuyết H0: Fx(x)= F0(x), trong đó F0(x) là hàm phân bố
chuẩn Kết quả tính toán được cho ở bảng 2.1 sau đây:
Trang 10Bảng 2.1: Bảng nắn phân bố thực nghiệm số sản phẩm theo bề dày
và kiểm tra giả thuyết về luật phân bố
--6.75
6.75-7.25
7.25-7.75
7.75-8.25
8.25-8.75
8.75-9.25
9.25-9.75
9.75-
1
2
5
11
18
9
3
1
0.0087 0.0408 0.1391 0.2472 0.2837 0.1892 0.0768 0.0217
0.44 2.04 6.96 12.35 14.18 9.46 3.84 1.08
9.44
12.35 14.18 14.38
0.220
0.148 1.029 0.132
Phân bố chuẩn có 2 tham số cần ước lượng là và 2, vì vậy bậc tự do:
k=l-r-1=4-2-1=1 suy ra: n2
(k=1)=3.84
n2=1.529<n2(k=1)=3.84 nên giả thuyết H0 về phân bố lý thuyết là phân bố chuẩn
biểu thị phân bố sản phẩm theo bề dày tạm thời được chấp nhận ở mức =0.05
- Bước 6: Vẽ biểu đồ phân bố số sản phẩm theo bề dày sản phẩm thực nghiệm
và lý thuyết
Hình 2.3: Biểu đồ phân bố số sản phẩm theo bề dày
2.3.2 Phân bố giảm (Phân bố mũ)
2.3.2.1 Khái niệm
0 5 10 15 20
Ft Fl
Trang 11Phân bố giảm là phân bố xác suất của biến ngẫu nhiên liên tục với hàm mật
độ:
P x (x)= e - x (x>0) (2.11)
Trong đó là tham số của phân bố giảm
Đường cong phân bố giảm, giảm khi x tăng, càng lớn thì đường cong càng
lõm và ngược lại, càng bé thì đường cong càng bẹt (hình 2.4)
Hình 2.4: Đường cong phân bố giảm
2.3.2.2 Nắn phân bố thực nghiệm theo dạng hàm Meyer
Trong lâm nghiệp người ta thường vận dụng phân bố giảm dạng hàm Meyer
để nắn các phân bố thực nghiệm của một số nhân tố điều tra
Hàm Meyer có dạng: y= e - x (2.12)
Trong đó và là hai tham số của hàm Meyer Để xác định và phải
logarit hoá 2 vế phương trình (2.12):
lny=ln - x
Đặt:
b a
y y
ln
ˆ ln
Nhận được phương trình hồi quy tuyến tính 1 lớp:
) 13 2 (
y
Để xác định các tham số a và b của phương trình hồi quy tuyến tính 1 lớp
(2.13) có thể dùng các công thức sau:
P x (x)
x
Trang 12xy
Q
Q
b và a yb x ( 2 14 )
Trong đó:
) 15 2 (
.
m
y x y x
m
y y
Q
m
x x
Q
y
x
2 2
2 2
) (
) 16 2 ( )
(
m
y 1 và x
m
x 1 (2.17) Với m là số tổ được chia theo biến số x
Sau khi xác định được a và b theo công thức (2.14), dễ dàng tìm được các
tham số và của hàm Meyer:
Vì:
a
lg nên =10a (2.18)
b
e
lg nên
e
b
lg
Trang 132 tiết
Ví dụ 2.2:
Nắn phân bố số cây theo đường kính (n/D1.3) của ô tiêu chuẩn 2000m2 trạng
thái rừng IIIA1 theo tài liệu ở bảng 2.2 dưới đây:
Bảng 2.2: Nắn phân bố số cây theo đường kính (n/D 1.3 ) trạng thái rừng IIIA 1
D 1.3 (x) F t lgf t (y) x 2 x.y f l (f t -f l ) 2 /f l
8
12
16
20
24
28
32
13
17
14
10
11
7
2
1.1139 1.2305 1.1461 1.0000 1.0414 0.8451 0.3010
64
144
156
400
576
784
1024
8.9115 14.7653 18.3380 20.0000 24.9934 23.6627 9.6330
20.96 15.96 12.15 9.25 7.05 5.37 4.09
3.020 0.068 0.281 0.060 2.220 0.021
140 74 6.6780 3248 120.3041 74.83 n 2 =5.67
Từ bảng 2.2 tính được:
2567 13 7
678 6 140 0341 120
.
x y x m y
Q xy
0 448 7
140 3248 )
2
Q x
Vậy:
02959 0 0
448
2567 13
x
xy
Q
Q b
5458 1 7
140 02959 0 7
6780 6
y b x a
Phương trình hồi quy tuyến tính 1 lớp lập được là:
Vì: lg =a mà a=1.5458 =10a=101.5458
=35.1419
Vì: -lge=b 0 06808
72 2 lg
02959 0
e
b
x
Trang 14Phương trình chính tắc hàm Meyer biểu thị quy luật phân bố số cây theo
đường kính lập được là:
Để kiểm tra mức độ phù hợp giữa phân bố lý thuyết là hàm Meyer với phân
bố thực nghiệm số cây theo đường kính thực nghiệm có thể dùng tiêu chuẩn phù
hợp n2 (công thức 2.1), kết quả kiểm tra cho thấy:
l
l t n
f
f f
1
2
Vì n2=5.67<05 2(k=3)=7.81 nên giả thuyết về luật phân bố giảm dạng hàm
Meyer được chấp nhận, nghĩa là phân bố số cây theo đường kính (n/D1.3) trạng thái
rừng IIIA1 tuân theo luật phân bố giảm dạng hàm Meyer Trên hình 2.5 là biểu đồ
phân bố số cây theo đường kính thực nghiệm và lý thuyết
Hình 2.5: Phân bố n/D 1.3 thực nghiệm và lý thuyết
Phân bố giảm đóng một vai trò quan trọng trong lý thuyết bền vững (độ bền
của máy móc) và trong nhiều tính toán thực tế khác Trong lâm nghiệp, phân bố
giảm thường dùng để đặc trưng cho quy luật phân bố số cây theo đường kính của
những lâm phần hỗn loài khác tuổi qua khai thác chọn không quy tắc nhiều lần
Trên cơ sở mô hình hoá quy luật cáu trúc tần số số cây theo cỡ kính này, có thể xác
định được tần suất, hay tần số (số cây) tương ứng với từng cỡ kính phù hợp với mục
tiêu kinh doanh Ngoài ra, nếu kết hợp với việc nghiên cứu quan hệ giữa đường kính
và chiều cao cây rừng còn có thể xác định được tổng thể tích (trữ lượng) của từng cỡ
kính theo mục tiêu kinh doanh
2.3.3 Phân bố khoảng cách
2.3.3.1 Khái niệm
Phân bố khoảng cách là phân bố xác suất của biến ngẫu nhiên đứt quãng,
hàm toán học có dạng:
F(x)= (2.20)
Trong đó:
n
f0
với f 0 là tần số quan sát tổ thứ nhất
Px(x)=35.1419.e-0.06808.x
(1-)(1-)X-1 với x1