Thể tích huyết tương và trọng lượng cơ thể ở 8 người đàn ông khỏe mạnh Ðối tượng trọng lượng cơ thể kg Thể tích huyết tương lít... Chọn lựa kiểm định phù hợpBiến phụ thuộc hậu quả Biến
Trang 1Tương quan &
Hồi quy tuyến tính
Trang 2Thể tích huyết tương và trọng lượng
cơ thể ở 8 người đàn ông khỏe mạnh
Ðối tượng trọng lượng cơ thể (kg) Thể tích huyết tương (lít)
Trang 3Chọn lựa kiểm định phù hợp
Biến phụ
thuộc
(hậu quả)
Biến độc lập (nguyên nhân)
Nhị giá Danh định Thứ tự -Định lượng
Chi bình phương Hồi quy logistic Hồi quy Poisson
Sống còn Wilcoxon Wilcoxon Hồi quy Cox
Phi tham số - Phân tích đa biến – Biến sống còn
Trang 4Phân loại biến số
Theo giá trị của biến số
Trang 5Liên hệ giữa hai biến số
t-test (biến định tính là nhị giá)
T-test với phương sai không đồng nhất (biến số định tính là nhị giá – còn gọi là z-test khi cỡ mẫu lớn)
định lượng - định lượng
Tương quan và hồi quy
Trang 6Phân tán đ c a th tích huy t t ng và tr ng l ng ồ ủ ể ế ươ ọ ượ
c th cùng v i đ ng h i quy tuy n tính ơ ể ớ ườ ồ ế
Trang 8(eTương quan âm không hoàn toàn ) tương quan âm hoàn toàn (f
Trang 9Hệ số tương quan (coefficient correlation)
Hệ số tương quan
Tính chất
Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]
Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm chứng tỏ hai biến số là nghịch biến.
R2 nói lên tỉ lệ sự biến thiên của biến số phụ thuộc được giải thích bởi biến số độc lập
Nếu r=0 (hay r < 0,1) , không có mối liên hệ tuyến tính giữa hai biến số Nếu r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan
hệ trung bình và trên 0,5 là quan hệ mạnh.
Trị số tuyệt đối của hệ số tương quan r nói lên mức độ liên quan
1
/ )
( )
( )
(
) )(
s
y x n
xy y
y x
x
y y
x
x r
y x i
i
i i
Trang 13 Tương quan giữa trọng lượng cơ thể và thể tích huyết tương là
thuận hay nghịch?
Trọng lượng cơ thể giải thích cho bao nhiêu phần của sự thay đổi của thể tích huyết tương?
0.57623281
Trang 14Tính hệ số tương quan với calculator
Vào chế độ hồi quy:
Mode – 3 (reg) – 1 (linear)
Xóa thống kê cũ: Shift – Mode 1- =
Trang 15 Giả thuyết Ho: hệ số tương quan = 0
Kiểm định hệ số tương quan
2
, 87 ,
2 265 , 0
76 , 0 2
Trang 16Hồi quy tuyến tính
y = a + bx
trị quan sát đến số liệu của đường thẳng
x
ys
s r Sxx
Sxy x
x
y y x x
) )(
(
Trang 18Phương trình hồi quy
Trang 19Source | SS df MS Number of obs = 8 -+ - F( 1, 6) = 8.16 Model | 390684335 1 390684335 Prob > F = 0.0289 Residual | 287265681 6 047877614 R-squared = 0.5763 -+ - Adj R-squared = 0.5057 Total | 677950016 7 096850002 Root MSE = 21881
plasma | Coef Std Err t P>|t| [95% Conf Interval] -+ - weight | .0436153 .0152684 2.86 0.029 006255 .0809757 _cons | .0857244 1.023998 0.08 0.936 -2.419909 2.591358 -
-SS: sum of square –
tổng bình phương
sai lệch df: degree of freedom Độ tự do
MS: Mean of square: trung
bình bình phương
Coef: hệ số Cons: Hằng số
Trang 20Source | SS df MS Number of obs = 8
-+ - F( 1, 6) = 8.16 Model | 390684335 1 390684335 Prob > F = 0.0289 Residual | 287265681 6 047877614 R-squared = 0.5763 -+ - Adj R-squared = 0.5057 Total | 677950016 7 096850002 Root MSE = 21881
plasma | Coef Std Err t P>|t| [95% Conf Interval] -+ - weight | .0436153 .0152684 2.86 0.029 006255 .0809757 _cons | .0857244 1.023998 0.08 0.936 -2.419909 2.591358 -
Trang 21Tổng bình phương các đoạn thẳng màu đỏ là SS total
Trang 22Tổng bình phương các đoạn màu xanh là SS residual
Trang 23Tổng bình phương các đoạn thẳng màu đỏ là SS total
Tổng bình phương các đoạn màu xanh là SS residual
Trang 24Source | SS df MS Number of obs = 8
-+ - F( 1, 6) = 8.16 Model | 390684335 1 390684335 Prob > F = 0.0289 Residual | 287265681 6 047877614 R-squared = 0.5763 -+ - Adj R-squared = 0.5057 Total | 677950016 7 096850002 Root MSE = 21881
plasma | Coef Std Err t P>|t| [95% Conf Interval] -+ - weight | .0436153 .0152684 2.86 0.029 006255 .0809757 _cons | .0857244 1.023998 0.08 0.936 -2.419909 2.591358 -
Trang 25regress plasma weight
Source | SS df MS Number of obs = 8
Trang 26Bài tập
theo tuổi thai (có và không có đường hồi quy)
sinh và tuổi thai; tuổi mẹ và tuổi thai; tuổi
mẹ và trọng lượng sơ sinh
quy của trọng lượng sơ sinh theo tuổi thai
Trang 27regress bweight gestwks
Source | SS df MS Number of obs = 641
-+ - F( 1, 639) = 762.25
Model | 148354317 1 148354317 Prob > F = 0.0000
Residual | 124365805 639 194625.673 R-squared = 0.5440
-+ - Adj R-squared = 0.5433
Total | 272720122 640 426125.19 Root MSE = 441.16
bweight | Coef Std Err t P>|t| [95% Conf Interval]
df: Độ tự do MS: Mean of square: trung
bình bình phương
Trang 28Trọng lượng sơ sinh =-4865,2 + tuổi thai x 206,6
Trang 30regress tlsosinh tuoithai gioi tang_ha
Source | SS df MS Number of obs = 641
df: Độ tự do MS: Mean of square: trung
bình bình phương
Trọng lượng sơ sinh =-4729 + tuổi thai x 201 +
[167 nếu nam] – [142 nếu mẹ tăng ha]
Trang 31Trọng lượng thai = -4865.25 + 206.64 x tuổi thai
Trang 33Ứng dụng: hồi quy về trung bình
x là cholesterol trước điều trị; y là cholesterol sau khi điều trị bằng placebo
Trang 35Phương trình hồi quy đa biến
Y= a + b1x1 + b2x2+…+bnxn
A: hằng số
B1: hệ số của biến x1: mức độ thay đổi của biến phụ thuộc khi biến x1 thay đổi một đơn
vị và các biến số khác không thay đổi
B1: tác động của biến x1 lên biến phụ thuộc
có kiểm soát cho các biến số gây nhiễu x2-xn
Hồi quy đa biến có thể kiểm soát cho các yếu tố gây nhiễu
Trang 36 Có 2 người đàn ông đẩy được 350 kg
Có 1 người đàn ông đẩy được 150 kg
Hồi quy đơn biến
TL=- 50 + 200 x đàn ông
Trang 37 Có 2 người đàn ông và 3 đàn bà đẩy được 350 kg
Có 1 người đàn ông và 1 đàn bà đẩy được 150 kg
Hồi quy đơn biến
TL=- 50 + 200 x đàn ông
Trang 38 Có 2 người đàn ông và 3 đàn bà đẩy được 350 kg
Có 1 người đàn ông và 1 đàn bà đẩy được 150 kg
Hồi quy đơn biến
TL=- 50 + 200 x đàn ông
Hồi quy đa biến
TL = (100 x đàn ông) + (50 x đàn bà)
Trang 39Hồi quy đa biến
Khi mô hình hồi quy có thêm biến
x k làm thay đổi hệ số của biến số
x 1 , chúng ta nói biến x k là biến số gây nhiễu của biến x 1 và biến y
Hệ số cũ của biến x 1 : tác động của biến x 1 và biến x k
Trang 40Hồi quy đa biến
Khi mô hình hồi quy có thêm biến x k làm thay đổi hệ số của biến số x 1 , chúng ta nói biến x k là biến số gây nhiễu của biến x 1 và biến y
Hệ số cũ của biến x 1 : tác động của biến x 1 và biến x k
Hệ số mới của biến x 1 : tác động của biến x 1 và độc lập với biến x k
Trang 41Một số định lí về biến đổi biến số
Nếu biến số x là biến đổi tuyến tính của biến X và biến số y là biến đổi tuyến tính của biến Y
r(x,y) = r(X,Y) = r(x,Y)= r(Y,X) =r(X,y)
Nếu x tăng gấp mấy lần so với X thì sx tăng gấp bấy nhiều lần so với Sx
Liên hệ giữa x và X tương tự liên hệ giữa x và X
B
A X
x B
A X
x
B
s s
Trang 42Phép kiểm 2 đuôi - 1 đuôi
Nếu biến số x là biến đổi tuyến tính của biến X và biến số y là biến đổi tuyến tính của biến Y
r(x,y) = r(X,Y) = r(x,Y)= r(Y,X)
Nếu x tăng gấp mấy lần so với X thì sx tăng gấp bấy nhiều lần so với Sx
Liên hệ giữa x và X tương tự liên hệ giữa x và X
B
A X
x B
A X
x
B
s s
Trang 43 Phép kiểm 1 đuôi
Đối thuyết Ha:
x1>x2hay x1<x2
2 1
1 1
) (
n n
s
x x
2 1
1 1
|
|
n n
s
x x
t
Trang 44Công thức về sai số chuẩn
22
6
7 )
1
( 2
r syn
n s
22
22
6
7 )
1
( 2
s
Trang 45 Hướng dẫn tính phương sai và độ lệch chuẩn s x
)
( 1
1
2 2
2
2 2
n n
x n
x
n
n x
n x s
Trang 46Công thức về sai số chuẩn
Sai số
chuẩn của
hệ số
0152
0
7 416
5
04788
0 1
) (
) (
s x
x
s b
e
s
x
Trang 53Công thức về sai số chuẩn
2 2
2 2 2
2
) 1 ( 2 1
2
/ )
( )
2 (
) (
)
( )
2 (
) )
( (
y
s r n
n
n
Sxx Sxy
Syy n
x x b
y
y n
bx x
b y y s
2
) 1 (
) (
) (
.
x
s n
s x
x
s b
e s
2 2
2 2
) 1 ( )
(
1 )
.(
.
x
s n
s x
n
s x
x
x n
s a
e s
) 1 (
) ' ( 1 1 )
(
1 1 )'
.(
.
x
s n
x
x n
s x
x
x n
s y
e s
Trang 55 Giả thuyết Ho: hệ số góc = 0
, 87 ,
2 0153 ,
0
0436 ,
0 )
.(
b e s
b t
0153 ,
0 38
, 205
2189 ,
0 )
(
) (
x
s b
e s
Trang 56Ghi nhận giá trị x, y và
bổ sung các giá trị x 2 , y 2 và xy
3364,00 58,00 159,50 2,75 7,56 4900,00 70,00 200,20 2,86 8,18 5476,00 74,00 249,38 3,37 11,36 4032,25 63,50 175,26 2,76 7,62 3844,00 62,00 162,44 2,62 6,86 4970,25 70,50 246,05 3,49 12,18 5041,00 71,00 216,55 3,05 9,30 4356,00 66,00 205,92 3,12 9,73
Trang 57Tính tổng các cột và tổng các sai lệch bình phương
3364,00 58,00 159,50 2,75 7,56 4900,00 70,00 200,20 2,86 8,18 5476,00 74,00 249,38 3,37 11,36 4032,25 63,50 175,26 2,76 7,62 3844,00 62,00 162,44 2,62 6,86 4970,25 70,50 246,05 3,49 12,18 5041,00 71,00 216,55 3,05 9,30 4356,00 66,00 205,92 3,12 9,73 535,0 35983,5 535,00 1615,30 24,02 72,80 24,02
Trang 58Kí hiệu tổng bình phương sai lệch
Sxx = Σ (x-x)2=Σ x2-(Σ x)2/n
Sxy = Σ (x-x)(y-y)=Σ xy- (Σ x)(Σ y)/n
Syy = Σ (y-y)2=Σ y2-(Σ y)2/n
x xx x xy y yy y Toång
Σ Σx Σx 2 Σx Σxy Σy Σy 2 Σy Toång bình phöông phaàn dö S
2
/ )
( )
2 (
) (
)
( )
2 (
) )
Syy n
x x b
y
y n
bx x
b y y
s
Trang 59 hồi quy bweight theo gestwks
Tạo biến yhat (tiên đoán của hồi quy tuyến tính)
Vẽ biểu đồ bằng lệnh Graphics:: Overlaid
Trang 61 Có 5 biến số được quan tâm: tuổi (age), cholesterol toàn phần, hút thuốc lá, HDL cholesterol và huyết áp Trong các biến này biến nào là biến
tương tác và tương tác với biến số nào
biến nào có tác động đều và biến nào tác động không đều.