Ví dụ 3.3: Khối lượng của gà Hồ (gram) qua các tuần tuổi (từ0 đến 32 tuần tuổi) được trình bày ở bảng sau: Tuần tuổi 0 1 2 3 4 5 6 7 8 9 10 Khối lượng 35 45 72 134 199 303 374 529 672 717 899 Tuần tuổi 11 12 13 14 15 16 17 18 19 20 21 Khối lượng 933 1042 1228 1386 1541 1729 1711 1726 1771 1927 2032 Tuần tuổi 22 23 24 25 26 27 28 29 30 31 32 Khối lượng 2158 2232 2557 2632 2718 2818 2937 2960 2964 2967 2977
Số liệu có thểphân tích theo hàm sinh trưởng Gompertz theo mô hình sau: Y = 𝒎𝒆−𝒂𝒆−𝒃𝒙
= m * EXP [-a * EXP (-bx)]
Trong đó:
Y = khối lượng gà (g),
m = khối lượng tiệm cận trên – khối lượng trưởng thành (g) ,
a = hằng số tích hợp liên quan đến khối lượng sơ sinh (0 tuần tuổi), b = tỷ lệ tốc độtăng trưởng tối đa so với khối lượng trưởng thành của gà x = tuổi (tuần).
EXP = cơ số logarit tự nhiên e (2,71828).
121
Số liệu được nhập vào trong cửa sổ Worksheet của phần mềm Minitab; bao gồm 2 cột: 1) cột Tuần tuổi C1 (TT),
2) cột Khối lượng C2 (KL)
Stat Regression Nonlinear Regression...
122
Kích chuột vào option Use Calculator của mục Expectation Funtionđể khai báo mô hình hồi quy (ví dụ: Gompertz Growth).
Kích chuột vào option Parameters để khai các tham số tham số Theta1, Theta2 và Theta3
123
Nonlinear Regression: KL = Theta1 * exp(-Theta2 * exp(-Theta3 * TT)) Method
Algorithm Gauss-Newton Max iterations 200 Tolerance 0.00001 Starting Values for Parameters Parameter Value Theta1 2980 Theta2 4.4 Theta3 0.14 Equation KL = 3734.33 * exp(-3.86255 * exp(-0.0932028 * TT)) Parameter Estimates
Parameter Estimate SE Estimate Theta1 3734.33 155.331 Theta2 3.86 0.191 Theta3 0.09 0.006
KL = Theta1 * exp(-Theta2 * exp(-Theta3 * TT))
Lack of Fit
There are no replicates.
Minitab cannot do the lack of fit test based on pure error.
Summary Iterations 8 Final SSE 239613 DFE 30 MSE 7987.09 S 89.3705
Trong đó: Kết phân tích hồi quy phi tuyến đối với biến phụ thuộc khối lượng (KL);
Giá trị xuất phát «Starting Value» », các giá trịnày đưa vào mô hình dựa trên số liệu của mô hình và/hoặc các nghiên cứu tương tự. Ví dụ giá trị m = 2980 dựa vào khối lượng của gà Hồở
tuần tuổi 32 (2977g), giá trị a và b lấy từ kết quả nghiên cứu của (Nassim et al. 2011); Mô hình hồi quy phi tuyến đểước tính khối lượng gà Hồnhư sau:
Khối lượng = 3734,33 * exp(-3,86 * exp(-0,09 * tuần))
Các tham số ước tính (Theta1 = 3734,33; Theta2 = 3,86 và Theta3 = 0,09) và sai số tiêu chuẩn ước tính (SE Estimate);
Tuổi tại điểm uốn xPI = ln(a)/b = ln(3,8625)/0,0932 = 14,5 tuần
Khối lượng gà Hồ tại điểm uốn YPI = m/e = 3734;3/2,71828 = 1373,77 g
Tăng khối lượng tuyệt đối (g/tuần) tại điểm uốn: MWGPI = mb/e = 3734.3*0.0932/2,71828 = 128 g.
124 35 30 25 20 15 10 5 0 3000 2500 2000 1500 1000 500 0 TT K L
Fitted Line Plot
KL = 3734.33 * exp(-3.86255 * exp(-0.0932028 * TT))
3.2.5. Hồi quy Logistic
Hồi quy logistic có thể sử dụng để đánh giá ảnh hưởng của yếu tố nghiên cứu đến tỷ lệ mắc bệnh. Trong trường nàybiến phụ thuộc là biến định tính và biến độc lập là biến liên tục. Ví dụ dưới đây minh họa việc sử dụng mô hình hồi quy logit để phân tích số liệu định tính.
Ví dụ 3.4: Một thí nghiệm nhằm nghiên cứu ảnh hưởng của tuổi đẻ lần đầu (tháng) đến tỷ lệ
viêm vú ở bò. Số liệu thu thập trên 21 bò về tình trạng viêm vú (0 = không mắc bệnh và 1= mắc bệnh) như sau: Bò số 1 2 3 4 5 6 7 8 9 10 11 Tuổi (tháng) 19 20 20 20 21 21 21 22 22 22 23 Viêm vú 1 1 0 1 0 1 1 1 1 0 1 Bò số 12 13 14 15 16 17 18 19 20 21 Tuổi (tháng) 26 27 27 27 27 29 30 30 31 32 Viêm vú 1 0 1 0 0 1 0 0 0 0
Số liệu có thể phân tích theo phương trình hồi quy logit sau:
log[pi /(1-pi)] = β0+ β1xi
Trong đó:
pi = tỷ lệ mắc bệnh của bò thứ i,
xi = tuổi đẻ lần đầu của bò thứ i,
0 = hệ sốtung độ gốc,
1 = hệ số góc.
125
Số liệu được nhập vào trong cửa sổ Worksheet của phần mềm Minitab; bao gồm 2 cột: 1) cột Tuần tuổi C1 (TT),
2) cột Viêm C2 (VIEM)
Stat Regression Binary Logistic Regression...
126
Khai báo biến TT vào ô Model.
Kích chuột vào option Prediction và khai báo biến TT vào ô Predicted event proabilities for new observations để lấy xác suất dự báo, sai số tiêu chuẩn và khoảng tin cậy
Chọn OKđể có kết quả
Binary Logistic Regression: VIEM versus TT Link Function: Logit
Response Information Variable Value Count
VIEM 1 11 (Event) 0 10
Total 21
Logistic Regression Table
Ođs 95% CI Predictor Coef SE Coef Z P RatioLower Upper Constant 6.74392 3.26397 2.07 0.039
TT -0.270079 0.131468 -2.05 0.040 0.76 0.59 0.99
Log-Likelihood = -11.921
Test that all slopes are zero: G = 5.223, DF = 1, P-Value = 0.022
Goodness-of-Fit Tests
Method Chi-Square DF P Pearson 6.56585 9 0.682 Deviance 7.88565 9 0.546 Hosmer-Lemeshow 3.29593 6 0.771
Table of Observed and Expected Frequencies:
127 Group Value 1 2 3 4 5 6 7 8 Total 1 Obs 0 0 2 2 2 2 2 1 11 Exp 0.3 0.4 1.7 1.1 2.1 2.2 2.4 0.8 0 Obs 2 2 3 0 1 1 1 0 10 Exp 1.7 1.6 3.3 0.9 0.9 0.8 0.6 0.2 Total 2 2 5 2 3 3 3 1 21 Measures of Association:
(Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures
Concordant 80 72.7 Somers' D 0.54 Discordant 21 19.1 Goodman-Kruskal Gamma 0.58 Ties 9 8.2 Kendall's Tau-a 0.28 Total 110 100.0
Predicted Event Probabilities for New Observations New Obs Prob SE Prob 95% CI 1 0.833747 0.122317 (0.470752, 0.965841) 2 0.792875 0.127699 (0.454699, 0.946160) 3 0.792875 0.127699 (0.454699, 0.946160) 4 0.792875 0.127699 (0.454699, 0.946160) 5 0.745027 0.129559 (0.434262, 0.917512) 6 0.745027 0.129559 (0.434262, 0.917512) 7 0.745027 0.129559 (0.434262, 0.917512) 8 0.690442 0.128282 (0.407529, 0.878528) 9 0.690442 0.128282 (0.407529, 0.878528) 10 0.690442 0.128282 (0.407529, 0.878528) 11 0.629974 0.125509 (0.372110, 0.830248) 12 0.430913 0.131203 (0.209696, 0.683629) 13 0.366280 0.138140 (0.152564, 0.649812) 14 0.366280 0.138140 (0.152564, 0.649812) 15 0.366280 0.138140 (0.152564, 0.649812) 16 0.366280 0.138140 (0.152564, 0.649812) 17 0.251926 0.145214 (0.069230, 0.603925) 18 0.204493 0.142315 (0.044231, 0.588122) 19 0.204493 0.142315 (0.044231, 0.588122) 20 0.164033 0.135160 (0.027642, 0.575259) 21 0.130267 0.124745 (0.017013, 0.564488) Values of Predictors for New Observations
New Obs TT 1 19 2 20 3 20 4 20 5 21 6 21 7 21 8 22 9 22 10 22 11 23 12 26 13 27 14 27 15 27 16 27 17 29 18 30 19 30
128
20 31 21 32
Trong đó:
Kết phân tích hồi quy Logistic đối với biến VIEM; Tần suất quan sát của biến Viêm (1:
có viêm = 11 con và 0: không viêm = 10 con) Hệ số hồi quy 0 = 6.74392 và 1 = -0.2701;
Giá trị xác suất của từng hệ số; Tỷ suất chênh (OR = 0,76); Khoảng tin cậy (95%) của tỷ suất chênh; Xác suất P=0,022 nên kết luận tuổi đẻ lứa đầu có ảnh đến tỷ lệ mắc bệnh viêm
vú ở bò; Xác xuất dự báo viêm theo tuổi đẻ lứa đầu; Sai số tiêu chuẩn của xác suất dự
báo và Khoảng tin cậy của xác xuất dự báọ