Peter Thomson and Louise Helby, Short Course Manual on Development of Research and Teaching Skills in Experimental Design and Statistical Analysis – Part A: Basic Applied Sta[r]
(1)Ph
ầ
n
T
ươ
ng quan H
ồ
i quy v
ớ
i ph
ầ
n m
ề
m SAS
3.1.
T
ươ
ng quan h
ồ
i quy
ðể
tính h
ệ
s
ố
t
ươ
ng quan xây d
ự
ng ph
ươ
ng trình h
ồ
i quy, s
ố
li
ệ
u ln ph
ả
i t
ạ
o thành t
ừ
ng
c
ặ
p
đượ
c nh
ậ
p vào t
ừ
ng c
ộ
t
ñố
i t
ừ
ng ch
ỉ
tiêu
Ví d
ụ
11: Ti
ế
n hành cân kh
ố
i l
ượ
ng (P),
đ
o
đườ
ng kính l
ớ
n (D)
đườ
ng kính bé (d) c
ủ
a 22
qu
ả
tr
ứ
ng gà S
ố
li
ệ
u thu
đượ
c trình bày
ở
b
ả
ng d
ướ
i
ñ
ây
P (gram)
66,80 60,10 71,20 61,60 61,20 59,00 67,90 59,00 51,50 62,60 64,20
D (mm)
58,37 54,95 60,58 56,73 57,36 53,26 57,07 58,17 52,28 55,62 56,82
d (mm)
45,12 44,35 45,56 44,34 43,57 44,86 46,27 42,82 41,91 44,95 44,79
P (gram)
71,20 54,20 54,50 69,10 55,90 66,00 68,00 62,00 56,70 67,00 53,80
D (mm)
61,15 54,24 54,99 60,99 54,41 58,19 59,93 56,80 55,66 58,49 52,44
d (mm)
46,00 42,58 42,32 44,85 42,62 45,69 45,50 44,20 42,41 45,56 43,38
3.1.1.
H
ệ
s
ố
t
ươ
ng quan
Gi
ả
thi
ế
t
ñố
i v
ớ
i ki
ể
m
đị
nh hai phía H
0: ρ =
đố
i thi
ế
t H
1: ρ ≠ 0,
đ
ó ρ t
ươ
ng quan
gi
ữ
a bi
ế
n nghiên c
ứ
u
SAS CODE
DATA
SAS12;
INPUT
KL DL DN;
CARDS
;
(2)PROC
CORR
;
VAR
KL DL DN;
RUN
;
K
ế
t qu
ả
t
ừ
SAS:
The CORR Procedure
Variables: KL DL DN
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum KL 22 61.97727 5.94426 1364 51.50000 71.20000 DL 22 56.75000 2.61551 1249 52.28000 61.15000 DN 22 44.25682 1.34160 973.65000 41.91000 46.27000
Pearson Correlation Coefficients, N = 22 Prob > |r| under H0: Rho=0
KL DL DN KL 1.00000 0.89667 0.90527 <.0001 <.0001 DL 0.89667 1.00000 0.64802 <.0001 0.0011 DN 0.90527 0.64802 1.00000 <.0001 0.0011
H
ệ
s
ố
t
ươ
ng quan m
ẫ
u gi
ữ
a kh
ố
i l
ượ
ng
đườ
ng kính l
ớ
n 0,89667; kh
ố
i l
ượ
ng
đườ
ng kính bé 0,90527;
đườ
ng kính l
ớ
n
đườ
ng kính bé 0,64802 Xác su
ấ
t
ñố
i v
ớ
i
t
ừ
ng h
ệ
s
ố
t
ươ
ng quan (p-values)
đề
u bé h
ơ
n 0,05 (α) v
ậ
y k
ế
t lu
ậ
n t
ồ
n t
ạ
i m
ố
i quan h
ệ
gi
ữ
a
các ch
ỉ
tiêu
3.1.2.
Ph
ươ
ng trình h
ồ
i quy tuy
ế
n tính
Có th
ể
xây d
ự
ng h
ồ
i quy
ñơ
n bi
ế
n y = a + bx ho
ặ
c
ñ
a bi
ế
n y = a + b
1x
1+ b
2x
2+ +b
nx
nV
ớ
i
ví d
ụ
11, ta có th
ể
xây d
ự
ng ph
ươ
ng trình h
ồ
i tuy
ế
n tính
đơ
n bi
ế
n quy
ướ
c tính kh
ố
i l
ượ
ng
tr
ứ
ng thơng qua
đườ
ng kính l
ớ
n/
đườ
ng kính bé ho
ặ
c
đ
a bi
ế
n thơng qua
đườ
ng kính l
ớ
n
đườ
ng kính bé
V
ớ
i SAS CODE sau
đ
ây ta có th
ể
xây d
ự
ng ph
ươ
ng trình h
ồ
i quy tuy
ế
n tính v
ớ
i bi
ế
n ph
ụ
thu
ộ
c Y kh
ố
i l
ượ
ng tr
ứ
ng bi
ế
n
ñộ
c l
ậ
p X
đườ
ng kính l
ớ
n:
SAS CODE
PROC
REG
;
MODEL
KL = DL;
(3)K
ế
t qu
ả
t
ừ
SAS
The REG Procedure Model: MODEL1 Dependent Variable: KL
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F Model 596.59551 596.59551 82.05 <.0001 Error 20 145.42313 7.27116
Corrected Total 21 742.01864
Root MSE 2.69651 R-Square 0.8040 Dependent Mean 61.97727 Adj R-Sq 0.7942 Coeff Var 4.35080
Parameter Estimates Parameter Standard
Variable DF Estimate Error t Value Pr > |t| Intercept -53.67124 12.78032 -4.20 0.0004 DL 2.03786 0.22498 9.06 <.0001
Ph
ươ
ng trình h
ồ
i quy v
ớ
i bi
ế
n ph
ụ
thu
ộ
c - kh
ố
i l
ượ
ng (Y) bi
ế
n
độ
c l
ậ
p -
đườ
ng kính l
ớ
n
(X) t
ừ
ph
ầ
n m
ề
m SAS thu
ñượ
c nh
ư
sau:
Y = -53,7 + 2,04X
Ph
ầ
n
Parameter Estimates, cho ta k
ế
t qu
ả
ki
ể
m
ñị
nh h
ệ
s
ố
c
ủ
a ph
ươ
ng trình h
ồ
i quy V
ớ
i
xác su
ấ
t P = 0,0004 P < 0,0001 ta có th
ể
k
ế
t lu
ậ
n h
ệ
s
ố
ph
ươ
ng trình h
ồ
i quy
khác (P < 0,05) H
ệ
s
ố
xác
ñị
nh c
ủ
a ph
ươ
ng trình R² = 80,40%, hi
ệ
u ch
ỉ
nh R² = 79,4%
Ta c
ũ
ng có th
ể
xây d
ự
ng h
ồ
i quy v
ớ
i bi
ế
n
độ
c l
ậ
p
đườ
ng kính l
ớ
n
đườ
ng kính bé v
ớ
i
SAS CODE sau:
SAS CODE
PROC
REG
;
MODEL
KL = DL DN;
RUN
;
K
ế
t qu
ả
t
ừ
SAS:
(4)Sum of Mean
Source DF Squares Square F Value Pr > F Model 731.05126 365.52563 633.24 <.0001 Error 19 10.96738 0.57723
Corrected Total 21 742.01864
Root MSE 0.75976 R-Square 0.9852 Dependent Mean 61.97727 Adj R-Sq 0.9837 Coeff Var 1.22586
Parameter Estimates Parameter Standard
Variable DF Estimate Error t Value Pr > |t| Intercept -116.55512 5.47204 -21.30 <.0001 DL 1.21473 0.08323 14.60 <.0001 DN 2.47638 0.16226 15.26 <.0001
Ta có k
ế
t qu
ả
hồn tồn t
ươ
ng t
ự
nh
ư
vi
ệ
c xây d
ự
ng ph
ươ
ng trình h
ồ
i quy
ñơ
n gi
ả
n
Y = - 116,55512 + 1.21473X
1+ 2.47638X
2Trong
đ
ó:
Y = kh
ố
i l
ượ
ng tr
ứ
ng,
X
1=
đườ
ng kính l
ớ
n
X
2=
đườ
ng kính bé
ð
i
ề
u khác bi
ệ
t tr
ườ
ng h
ợ
p h
ệ
s
ố
xác
ñị
nh R² = 98,5% l
ớ
n h
ơ
n nhi
ề
u so v
ớ
i
tr
ườ
ng h
ợ
p
ñơ
n bi
ế
n R² = 80,4%
V
ớ
i tr
ườ
ng h
ợ
p ph
ươ
ng trình
đượ
c xây d
ự
ng t
ừ
nhi
ề
u bi
ế
n
độ
c l
ậ
p, c
ầ
n ph
ả
i xác
đị
nh rõ vai
trị c
ủ
a t
ừ
ng bi
ế
n Có nh
ữ
ng bi
ế
n
độ
c l
ậ
p
đư
a vào ph
ươ
ng trình
đ
óng góp khơng
đ
áng k
ể
vào mơ hình v
ậ
y c
ầ
n lo
ạ
i b
ỏ
xây d
ự
ng ph
ươ
ng trình
ðể
có th
ể
tìm
đượ
c ph
ươ
ng trình
h
ồ
i quy t
ố
t nh
ấ
t c
ầ
n có thêm l
ệ
nh ph
ụ
khác
SAS CODE
PROC
REG
;
MODEL
KL = DL DN /
SSE
CP
AIC
SELECTION
=
CP
;
RUN
;
K
ế
t qu
ả
t
ừ
SAS :
The REG Procedure Model: MODEL1 Dependent Variable: KL C(p) Selection Method Number in
Model C(p) R-Square AIC SSE Variables in Model 3.0000 0.9852 -9.3146 10.96738 DL DN
(5)