Đề cương tính toán thống kê chuyên ngành thú y. Tính toán thống kê là một môn học quan trọng trong chương trình đào tạo bác sỹ thú y tương lai , giúp sinh viên có kiến thức toán học cụ thể, có tính toán ước lượng thống kê trong ngành nghề.
Trang 1PHẦN I: ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH:
A ƯỚC LƯỢNG KIỂM ĐỊNH 1 GIÁ TRỊ TRUNG BÌNH: Ví dụ M-1.3:
( Kiểm định 1 hằng số C có phải thuộc quần thể đó hay không?)
Các bước tiến hành:
Bước 1: Tóm tắt và trình bày dữ liệu:
Bước 2: Giả thiết H0 và đối thiết H1:
Bước 3: Kiểm tra điều kiện:
Bước 4: Tính xác suất P:
Bước 5: So sánh P với α rút ra kết luận:
BÀI LÀM
Bước 1: Tóm tắt và trình bày dữ liệu:
Vào Stat/Basic Statistics/ Display Descriptive Statistics…
Variable N(n) N* Mean(X ) SE Mean(SE) StDev(S) Variance CoefVar(Cv) Minimum Maximum
P 36 0 599.19 3.11 18.66 348.05 3.11 559.00 636.00
Tăng trọng trung bình của giống lợn Landrace:
Bước 2: Giả thiết H0 và đối thiết H1:
Ho: Tăng trọng trung bình của toàn đàn lợn trong trại là 607 gram/ngày.
µ = 607 gram/ngày
H1: Tăng trọng trung bình của toàn đàn lợn trong trại khác 607 gram/ngày.
µ ≠ 607 gram/ngày
Bước 3: Kiểm tra điều kiện:
Vào Stat/Basic Statistics/ Normality Test…
Kiểm tra phải tuân theo phân phối chuẩn:
P-Value = 0,997 > 0,05 Số liệu có phân phối chuẩn.
Điều kiện:
P-Value ≥ 0,05 tuân theo phân phối chuẩn.
P-Value < 0,05 không tuân theo phân phối chuẩn.
Bước 4: Tính xác suất P:
1 Trường hợp đã biết độ lệch chuẩn σ ( Standard Deviation) và µ ( Mean cần kiểm định ) = 607.
Ví dụ M-1.3 có σ = 21,75 gram.
Sử dụng phép thử Z ( 1Z): Stat/Basic Statistics/ 1-Sample Z…
Nhập giá trị σ = 21,75 gram vào ô Standard Deviation.
Nhập giá trị µ = 607 gram vào ô Hypothesized mean.
One-Sample Z: P
Test of mu = 607 vs not = 607
The assumed standard deviation = 21.75
Variable N Mean StDev SE Mean 95% CI Z P
P 36 599.19 18.66 3.63 (592.09, 606.30) -2.15 0.031
P = 0.031 Bước 5: So sánh P với α rút ra kết luận:
P = 0.031 < 0.05 nên bác bỏ giả thiết H0 và chấp nhận giả thiết H1.
Trang 2Kết luận: Tăng trọng trung bình của toàn đàn lợn trong trại khác 607 gram/ngày ( µ ≠ 607 gram/ngày.
Điều kiện:
P > α ( =0,05) chấp nhận H0.
P < α ( =0,05) bác bỏ H0, chấp nhận H1.
2 Trường hợp chưa biết độ lệch chuẩn σ ( Standard Deviation) và đã biết µ ( Mean cần kiểm định ) = 607.
Bước 4: Tính xác suất P:
Sử dụng phép thử T (1T): Stat/Basic Statistics/ 1-Sample t…
Nhập giá trị µ = 607 gram vào ô Hypothesized mean.
One-Sample T: P
Test of mu = 607 vs not = 607
Variable N Mean StDev SE Mean 95% CI T P
P 36 599.19 18.66 3.11 (592.88, 605.51) -2.51 0.017
P = 0,017
Bước 5: So sánh P với α rút ra kết luận:
P = 0,017 < 0,05 nên bác bỏ giả thiết H0 và chấp nhận giả thiết H1.
Kết luận: Tăng trọng trung bình của toàn đàn lợn trong trại khác 607 gram/ngày ( µ ≠ 607 gram/ngày)
B SO SÁNH 2 GIÁ TRỊ TRUNG BÌNH CỦA 2 BIẾN CHUẨN:
I SO SÁNH 2 GIÁ TRỊ TRUNG BÌNH CỦA 2 BIẾN CHUẨN KHI LẤY MẪU ĐỘC LẬP: không có tương quan với nhau.
1 Phương sai đồng nhất: VÍ DỤ: M-1.4: So sánh 2 µ khi biết phương sai (σ 2 ) đồng nhất
Các bước tiến hành:
Bước 1: Tóm tắt và trình bày dữ liệu:
Bước 2: Giả thiết H0 và đối thiết H1:
Bước 3: Kiểm tra điều kiện:
Bước 4: Tính xác suất P:
Bước 5: So sánh P với α rút ra kết luận:
BÀI LÀM
Bước 1: Tóm tắt và trình bày dữ liệu:
Vào Stat/Basic Statistics/ Display Descriptive Statistics…
Descriptive Statistics: KL
Variable GIONG N N* Mean SE Mean StDev Variance CoefVar Minimum
KL 1 12 0 196.17 3.06 10.62 112.70 5.41 180.30
2 15 0 153.70 3.18 12.30 151.32 8.00 135.30
Variable GIONG Maximum
KL 1 221.10
2 181.80
Khối lượng của hai bò giống:
Bước 2: Giả thiết H0 và đối thiết H1:
Trang 3Ho: Khối lượng của hai giống bò bằng nhau
µGiống 1 = µGiống 2
µGiống 1 ≠ µGiống 2
Bước 3: Kiểm tra điều kiện:
Vào Stat/Basic Statistics/ Normality Test…
a Kiểm tra phải tuân theo phân phối chuẩn:
Giống 1:
P-Value =0,530 > 0,05 Số liệu có phân phối chuẩn.
Giống 2:
P-Value =0.407 > 0,05 Số liệu có phân phối chuẩn.
b Kiểm tra phương sai đồng nhất:
Vào: Stat/ Basic Statistics/ 2 Variances…
Test and CI for Two Variances: GIONG1, GIONG2
Method
Null hypothesis Sigma(GIONG1) / Sigma(GIONG2) = 1
Alternative hypothesis Sigma(GIONG1) / Sigma(GIONG2) not = 1
Significance level Alpha = 0.05
Statistics
Variable N StDev Variance
GIONG1 12 10.616 112.700
GIONG2 15 12.301 151.324
Ratio of standard deviations = 0.863
Ratio of variances = 0.745
95% Confidence Intervals
CI for
Distribution CI for StDev Variance
of Data Ratio Ratio
Normal (0.491, 1.582) (0.241, 2.502)
Continuous (0.390, 1.658) (0.152, 2.749)
Tests
Test
Method DF1 DF2 Statistic P-Value
F Test (normal) 11 14 0.74 0.631
Levene's Test (any continuous) 1 25 0.46 0.503
P-Value của F Test: P-Value = 0,631 > 0,05 nên chấp nhận H0, hai phương sai đồng nhất.
Bước 4: Tính xác suất P:
Sử dụng phép thử T( 2t): Stat/ Basic Statistics/ 2-Sample t…
Chú ý:
- Nếu hai phương sai đồng nhất thì (V) vào ô Assume equal variances.
- Nếu hai phương sai đồng nhất thì không tích (V) vào ô Assume equal variances.
Two-sample T for GIONG1 vs GIONG2
N Mean StDev SE Mean
GIONG1 12 196.2 10.6 3.1
GIONG2 15 153.7 12.3 3.2
Trang 4Difference = mu (GIONG1) - mu (GIONG2)
Estimate for difference: 42.48
95% CI for difference: (33.23, 51.72)
T-Test of difference = 0 (vs not =): T-Value = 9.46 P-Value = 0.000 DF = 25
Both use Pooled StDev = 11.5901
P-Value = 0,000 < 0,05( α)
Bước 5: So sánh P với α rút ra kết luận:
P-Value = 0,000 < 0,05( α) nên bác bỏ giả thiết H0, chấp nhận giả thiết H1.
Kết luận: Khối lượng của hai giống bò không bằng nhau (µGiống 1 ≠ µGiống 2) ( P<0,05).
2 Phương sai không đồng nhất: VÍ DỤ: M-1.4: So sánh 2 µ khi biết phương sai (σ 2 ) không đồng nhất
Các bước tiến hành:
Bước 1: Tóm tắt và trình bày dữ liệu:
Bước 2: Giả thiết H0 và đối thiết H1:
Bước 3: Kiểm tra điều kiện:
Bước 4: Tính xác suất P:
Bước 5: So sánh P với α rút ra kết luận:
BÀI LÀM
Bước 1: Tóm tắt và trình bày dữ liệu:
Vào Stat/Basic Statistics/ Display Descriptive Statistics…
Descriptive Statistics: KL
Variable GIONG N N* Mean SE Mean StDev Variance CoefVar Minimum
KL 1 12 0 196.17 3.06 10.62 112.70 5.41 180.30
2 15 0 153.70 3.18 12.30 151.32 8.00 135.30
Variable GIONG Maximum
KL 1 221.10
2 181.80
Khối lượng của hai bò giống:
Bước 2: Giả thiết H0 và đối thiết H1:
Ho: Khối lượng của hai giống bò bằng nhau
µGiống 1 = µGiống 2
µGiống 1 ≠ µGiống 2
Bước 3: Kiểm tra điều kiện:
Vào Stat/Basic Statistics/ Normality Test…
a Kiểm tra phải tuân theo phân phối chuẩn:
Giống 1:
P-Value =0,530 > 0,05 Số liệu có phân phối chuẩn.
Giống 2:
P-Value =0.407 > 0,05 Số liệu có phân phối chuẩn.
b Kiểm tra phương sai đồng nhất:
Vào: Stat/ Basic Statistics/ 2 Variances…
Test and CI for Two Variances: GIONG1, GIONG2
Trang 5Null hypothesis Sigma(GIONG1) / Sigma(GIONG2) = 1
Alternative hypothesis Sigma(GIONG1) / Sigma(GIONG2) not = 1
Significance level Alpha = 0.05
Statistics
Variable N StDev Variance
GIONG1 12 10.616 112.700
GIONG2 15 12.301 151.324
Ratio of standard deviations = 0.863
Ratio of variances = 0.745
95% Confidence Intervals
CI for
Distribution CI for StDev Variance
of Data Ratio Ratio
Normal (0.491, 1.582) (0.241, 2.502)
Continuous (0.390, 1.658) (0.152, 2.749)
Tests
Test
Method DF1 DF2 Statistic P-Value
F Test (normal) 11 14 0.74 0.631
Levene's Test (any continuous) 1 25 0.46 0.503
P-Value của F Test: P-Value = 0,631 > 0,05 nên H0 được chấp nhận, hai phương sai đồng nhất.
Bước 4: Tính xác suất P:
Sử dụng phép thử T( 2t): Stat/ Basic Statistics/ 2-Sample t…
Chú ý:
- Nếu hai phương sai không đồng nhất thì không tích (V) vào ô Assume equal variances.
Two-Sample T-Test and CI: GIONG1, GIONG2
Two-sample T for GIONG1 vs GIONG2
N Mean StDev SE Mean
GIONG1 12 196.2 10.6 3.1
GIONG2 15 153.7 12.3 3.2
Difference = mu (GIONG1) - mu (GIONG2)
Estimate for difference: 42.48
95% CI for difference: (33.37, 51.58)
T-Test of difference = 0 (vs not =): T-Value = 9.62 P-Value = 0.000 DF = 24
P-Value = 0,000 < 0,05( α)
Bước 5: So sánh P với α rút ra kết luận:
P-Value = 0,000 < 0,05( α) nên bác bỏ giả thiết H0, chấp nhận giả thiết H1.
Kết luận: Khối lượng của hai giống bò không bằng nhau (µGiống 1 ≠ µGiống 2) ( P<0,05).
II SO SÁNH 2 GIÁ TRỊ TRUNG BÌNH CỦA 2 BIẾN CHUẨN KHI LẤY MẪU THEO CẶP: tương quan với nhau: gia đình, anh em, trước sau Ví dụ: M-1.5.
Các bước tiến hành:
B1: Nhập số liệu thành hai cột –Tính cột hiệu (giữa từng cặp số liệu); Tóm tắt và trình bày dữ liệu
Trang 6B2: Giả thiết H0 và đối thiết H1.
B3: Kiểm tra phân bố chuẩn cho cột hiệu.
B4: Tìm P-value và kết luận.
BÀI LÀM:
B1: Nhập số liệu thành hai cột –Tính cột hiệu (giữa từng cặp số liệu); Tóm tắt và trình bày dữ liệu
Vào Stat/Basic Statistics/ Display Descriptive Statistics…
Variable N N* Mean SE Mean StDev Variance CoefVar Minimum Maximum
A 10 0 42.80 1.21 3.82 14.62 8.93 38.00 51.00
B 10 0 38.20 1.31 4.13 17.07 10.81 34.00 48.00
Tăng trọng của hai cách chăm sóc khác nhau
B2: Giả thiết H0 và đối thiết H1.
Ho: Tăng trọng trung bình của hai cách chăm sóc như nhau
µcách A = µcách B
H1: Tăng trọng trung bình của hai cách chăm sóc khác nhau
µcách A ≠ µcách B
B3: Kiểm tra phân bố chuẩn cho cột hiệu.
Vào Stat/Basic Statistics/ Normality Test…
P-Value = 0,592 > 0,05 Số liệu có phân phối chuẩn.
B4: Tìm P-value và kết luận.
Sử dụng phép thử T cặp đôi( t-t): Vào Stat/ Basic Statistics/ Paired t…
Paired T-Test and CI: A, B
Paired T for A - B
N Mean StDev SE Mean
A 10 42.80 3.82 1.21
B 10 38.20 4.13 1.31
Difference 10 4.600 1.955 0.618
95% CI for mean difference: (3.201, 5.999)
T-Test of mean difference = 0 (vs not = 0): T-Value = 7.44 P-Value = 0.000
P-Value = 0,000 < 0,05 nên bác bỏ giả thiết H0, chấp nhận H1.
Kết luận: Tăng trọng trung bình của hai cách chăm sóc khác nhau (µcách A ≠ µcách B)
PHẦN II: PHÂN TÍCH PHƯƠNG SAI
I THÍ NGHIỆM 1 YẾU TỐ HOÀN TOÀN NGẪU NHIÊN:
Bước 1: Tóm tắt và trình bày dữ liệu
Bước 2: Giả thiết H0 và đối thiết H1
Bước 3: Kiểm tra điều kiện
Bước 4: Tính xác suất P
Bước 5: So sánh P với α rút kết luận
BÀI LÀM:
Bước 1: Tóm tắt và trình bày dữ liệu
Vào Stat/Basic Statistics/ Display Descriptive Statistics…
Trang 7Descriptive Statistics: KL
Variable CT N N* Mean SE Mean StDev Variance CoefVar Minimum
KL A 4 0 0.8875 0.0239 0.0479 0.0023 5.39 0.8500
B 4 0 0.4250 0.0104 0.0208 0.0004 4.90 0.4000
C 4 0 0.7625 0.0473 0.0946 0.0090 12.41 0.7000
D 4 0 0.9375 0.0239 0.0479 0.0023 5.11 0.9000
E 4 0 0.9500 0.0204 0.0408 0.0017 4.30 0.9000
Variable CT Maximum
KL A 0.9500
B 0.4500
C 0.9000
D 1.0000
E 1.0000
Bước 2: Giả thiết H0 và đối thiết H1
Ho: Tăng trọng của cá ở 5 công thức nuôi bằng nhau
µA =µ B= µC =µ D=µE
H1: Tăng trọng của cá ở 5 công thức nuôi khác nhau
µA ≠µ B≠ µC ≠µ D≠µE
Bước 3: Kiểm tra điều kiện
a Phân phối chuẩn:
- Tìm cột RESI( phần dư) bằng: Vào Stat/ ANOVA/ One-Ways… tích vào cột Store residuals
- Vào Stat/Basic Statistics/ Normality Test… kiểm tra phân phối chuẩn của cột RESI
P-Value = 0,159 > 0,05 nên phân phối chuẩn.
b Phương sai đồng nhất: Vào Stat/ ANOVA/ Test for Equal Variances…
P-Value của Levene’s Test: P-Value = 0,539 > 0,05 nên chấp nhận H0, phương sai đồng nhất.
Bước 4: Tính xác suất P
Vào Stat/ ANOVA/ One-Ways…
Test for Equal Variances: KL versus CT
One-way ANOVA: KL versus CT
Source DF SS MS F P
CT 4 0.76325 0.19081 60.99 0.000
Error 15 0.04692 0.00313
Total 19 0.81017
S = 0.05593 R-Sq = 94.21% R-Sq(adj) = 92.66%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev
+ -+ -+ -+ -A 4 0.8875 0.0479 ( * )
B 4 0.4250 0.0208 ( * )
C 4 0.7625 0.0946 ( * )
D 4 0.9375 0.0479 ( * )
E 4 0.9500 0.0408 (-* )
0.40 0.60 0.80 1.00
Pooled StDev = 0.0559
Trang 8Nguồn biến
động
Bậc tự do ( DF) Tổng bình
phương(SS)
Trung bình bình phương(MS)
P = 0,000
Bước 5: So sánh P với α rút kết luận
P= 0,000 < 0,05 nên bác bỏ H0 và chấp nhận H1.
Kết luận: Tăng trọng của cá ở 5 công thức nuôi khác nhau( µA ≠µ B≠ µC ≠µ D≠µE )
2 So sánh cặp: nếu bác bỏ H0 và chấp nhận H1:
Minitab 16: Vào Stat/ ANOVA/ One-Ways… tích vào ô Comparison… sau đó tích vào Turkey’s, family error rate.
Grouping Information Using Tukey Method
CT N Mean Grouping
E 4 0.95000 A
D 4 0.93750 A
A 4 0.88750 A
C 4 0.76250 B
B 4 0.42500 C
Means that do not share a letter are significantly different
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons among Levels of CT
Individual confidence level = 99.25%
CT = A subtracted from:
CT Lower Center Upper
-+ -+ -+ -+-B -0.58471 -0.46250 -0.34029 ( -* )
C -0.24721 -0.12500 -0.00279 ( * -)
D -0.07221 0.05000 0.17221 ( * -)
E -0.05971 0.06250 0.18471 ( -* )
-0.35 0.00 0.35 0.70 CT = B subtracted from: CT Lower Center Upper
-+ -+ -+ -+-C 0.21529 0.33750 0.45971 ( -* )
D 0.39029 0.51250 0.63471 ( -* )
E 0.40279 0.52500 0.64721 ( * )
-0.35 0.00 0.35 0.70 CT = C subtracted from: CT Lower Center Upper
-+ -+ -+ -+-D 0.05279 0.17500 0.29721 ( * )
E 0.06529 0.18750 0.30971 ( * -)
-0.35 0.00 0.35 0.70 CT = D subtracted from: CT Lower Center Upper
Trang 9-+ -+ -+ -+-E -0.10971 0.01250 0.13471 ( * -)
-0.35 0.00 0.35 0.70
- So sánh giữa các công thức:
+ Xắp xếp các giá trị trung bình theo thứ tự giảm dần:
E = 0.95000 | - a
D = 0.93750 | | - a
A = 0.88750 | | | - a
C = 0.76250 | - b
B = 0.42500 | - c
+ Bằng nhau nối nét liền, khác nhau dừng lại sang phải và xuống dưới.
+ Đường nối dài hơn thì lấy, đường nối ngắn hơn thì xóa bỏ.
+ Bằng nhau khi dấu ở Lower và Upper khác dấu, Khác nhau khi cùng dấu.
Kết quả :
II THÍ NGHIỆM 1 YẾU TỐ KHỐI NGẪU NHIÊN ĐẦY ĐỦ: Ví dụ: M-1.7
Bước 1: Tóm tắt và trình bày dữ liệu
Bước 2: Giả thiết H0 và đối thiết H1
Bước 3: Kiểm tra điều kiện
Bước 4: Tính xác suất P
Bước 5: So sánh P với α rút kết luận
BÀI LÀM:
Bước 1: Tóm tắt và trình bày dữ liệu
Vào Stat/Basic Statistics/ Display Descriptive Statistics…
Descriptive Statistics: TB
Variable THUOC N N* Mean SE Mean StDev Variance CoefVar Minimum
TB A 5 0 6.420 0.271 0.606 0.367 9.44 5.600
B 5 0 5.720 0.297 0.665 0.442 11.62 5.100
C 5 0 6.060 0.340 0.760 0.578 12.55 5.000
D 5 0 5.660 0.273 0.611 0.373 10.79 5.200
Variable THUOC Maximum
TB A 7.100
B 6.700
C 7.100
D 6.700
Số lượng tế bào lympho ở chuột khi sử dụng 4 loại thuốc :
Thuốc A X1000 tb mm-3 máu 5 6.420 ± 0.271 0.606 9.44 Thuốc B X1000 tb mm-3 máu 5 5.720 ±0.297 0.665 11.62 Thuốc C X1000 tb mm-3 máu 5 6.060 ± 0.340 0.760 12.55 Thuốc D X1000 tb mm-3 máu 5 5.660 ± 0.273 0.611 10.79
Bước 2: Giả thiết H0 và đối thiết H1
µA =µ B= µC =µ D
Trang 10H1: Ảnh hưởng của 4 thuốc đến tế bào lympho khác nhau
µA ≠µ B≠ µC ≠µ D
Bước 3: Kiểm tra điều kiện
a Phân phối chuẩn:
- Tìm cột RESI( phần dư) bằng: Vào Stat/ ANOVA/ Two-Ways… tích vào cột Store residuals
- Vào Stat/Basic Statistics/ Normality Test… kiểm tra phân phối chuẩn của cột RESI
P-Value = 0,104 > 0,05 nên số liệu có phân phối chuẩn.
b Phương sai đồng nhất: Vào Stat/ ANOVA/ Test for Equal Variances…
P-Value của Levene’s Test: P-Value = 0,977 > 0,05 nên chấp nhận H0, phương sai đồng nhất.
Bước 4: Tính xác suất P
Vào Stat/ ANOVA/ Two-Ways…
Two-way ANOVA: TB versus THUOC, LUA
Source DF SS MS F P
THUOC 3 1.8455 0.61517 11.59 0.001
LUA 4 6.4030 1.60075 30.16 0.000
Error 12 0.6370 0.05308
Total 19 8.8855
S = 0.2304 R-Sq = 92.83% R-Sq(adj) = 88.65%
Nguồn biến
động
Bậc tự do ( DF) Tổng bình
phương(SS)
Trung bình bình phương(MS)
Cách 2: Sử dụng (GLM)
Vào Stat/ ANOVA/ General Linear Model…
Test for Equal Variances: TB versus THUOC
General Linear Model: TB versus THUOC, LUA
Factor Type Levels Values
THUOC fixed 4 A, B, C, D
LUA fixed 5 1, 2, 3, 4, 5
Analysis of Variance for TB, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
THUOC 3 1.8455 1.8455 0.6152 11.59 0.001
LUA 4 6.4030 6.4030 1.6008 30.16 0.000
Error 12 0.6370 0.6370 0.0531
Total 19 8.8855
S = 0.230398 R-Sq = 92.83% R-Sq(adj) = 88.65%
P = 0,001
Bước 5: So sánh P với α rút kết luận
P= 0,001 < 0,05 nên bác bỏ H0 và chấp nhận H1.
Kết luận: Ảnh hưởng của 4 thuốc đến tế bào lympho khác nhau (µA ≠µ B≠ µC ≠µ D)
2 So sánh cặp: nếu bác bỏ H0 và chấp nhận H1:
Minitab 16: Vào Stat/ ANOVA/ One-Ways… tích vào ô Comparison… sau đó tích vào Turkey’s, family error rate.
General Linear Model: TB versus THUOC, LUA