1. Trang chủ
  2. » Giáo án - Bài giảng

Tương quan và hồi quy tuyến tính

61 970 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 61
Dung lượng 1,32 MB

Nội dung

Thể tích huyết tương và trọng lượng cơ thể ở 8 người đàn ông khỏe mạnh Ðối tượng trọng lượng cơ thể kg Thể tích huyết tương lít... Chọn lựa kiểm định phù hợpBiến phụ thuộc hậu quả Biến

Trang 1

Tương quan &

Hồi quy tuyến tính

Trang 2

Thể tích huyết tương và trọng lượng

cơ thể ở 8 người đàn ông khỏe mạnh

Ðối tượng trọng lượng cơ thể (kg) Thể tích huyết tương (lít)

Trang 3

Chọn lựa kiểm định phù hợp

Biến phụ

thuộc

(hậu quả)

Biến độc lập (nguyên nhân)

Nhị giá Danh định Thứ tự -Định lượng

Chi bình phương Hồi quy logistic Hồi quy Poisson

Sống còn Wilcoxon Wilcoxon Hồi quy Cox

Phi tham số - Phân tích đa biến – Biến sống còn

Trang 4

Phân loại biến số

 Theo giá trị của biến số

Trang 5

Liên hệ giữa hai biến số

 t-test (biến định tính là nhị giá)

 T-test với phương sai không đồng nhất (biến số định tính là nhị giá – còn gọi là z-test khi cỡ mẫu lớn)

 định lượng - định lượng

 Tương quan và hồi quy

Trang 6

Phân tán đ c a th tích huy t t ng và tr ng l ng ồ ủ ể ế ươ ọ ượ

c th cùng v i đ ng h i quy tuy n tính ơ ể ớ ườ ồ ế

Trang 8

(eTương quan âm không hoàn toàn ) tương quan âm hoàn toàn (f

Trang 9

Hệ số tương quan (coefficient correlation)

 Hệ số tương quan

 Tính chất

 Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]

 Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm chứng tỏ hai biến số là nghịch biến.

 R2 nói lên tỉ lệ sự biến thiên của biến số phụ thuộc được giải thích bởi biến số độc lập

 Nếu r=0 (hay r < 0,1) , không có mối liên hệ tuyến tính giữa hai biến số Nếu r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan

hệ trung bình và trên 0,5 là quan hệ mạnh.

 Trị số tuyệt đối của hệ số tương quan r nói lên mức độ liên quan

1

/ )

( )

( )

(

) )(

s

y x n

xy y

y x

x

y y

x

x r

y x i

i

i i

Trang 13

 Tương quan giữa trọng lượng cơ thể và thể tích huyết tương là

thuận hay nghịch?

 Trọng lượng cơ thể giải thích cho bao nhiêu phần của sự thay đổi của thể tích huyết tương?

 0.57623281

Trang 14

Tính hệ số tương quan với calculator

 Vào chế độ hồi quy:

 Mode – 3 (reg) – 1 (linear)

 Xóa thống kê cũ: Shift – Mode 1- =

Trang 15

 Giả thuyết Ho: hệ số tương quan = 0

Kiểm định hệ số tương quan

2

, 87 ,

2 265 , 0

76 , 0 2

Trang 16

Hồi quy tuyến tính

y = a + bx

trị quan sát đến số liệu của đường thẳng

x

ys

s r Sxx

Sxy x

x

y y x x

) )(

(

Trang 18

Phương trình hồi quy

Trang 19

Source | SS df MS Number of obs = 8 -+ - F( 1, 6) = 8.16 Model | 390684335 1 390684335 Prob > F = 0.0289 Residual | 287265681 6 047877614 R-squared = 0.5763 -+ - Adj R-squared = 0.5057 Total | 677950016 7 096850002 Root MSE = 21881

plasma | Coef Std Err t P>|t| [95% Conf Interval] -+ - weight | .0436153 .0152684 2.86 0.029 006255 .0809757 _cons | .0857244 1.023998 0.08 0.936 -2.419909 2.591358 -

-SS: sum of square –

tổng bình phương

sai lệch df: degree of freedom Độ tự do

MS: Mean of square: trung

bình bình phương

Coef: hệ số Cons: Hằng số

Trang 20

Source | SS df MS Number of obs = 8

-+ - F( 1, 6) = 8.16 Model | 390684335 1 390684335 Prob > F = 0.0289 Residual | 287265681 6 047877614 R-squared = 0.5763 -+ - Adj R-squared = 0.5057 Total | 677950016 7 096850002 Root MSE = 21881

plasma | Coef Std Err t P>|t| [95% Conf Interval] -+ - weight | .0436153 .0152684 2.86 0.029 006255 .0809757 _cons | .0857244 1.023998 0.08 0.936 -2.419909 2.591358 -

Trang 21

Tổng bình phương các đoạn thẳng màu đỏ là SS total

Trang 22

Tổng bình phương các đoạn màu xanh là SS residual

Trang 23

Tổng bình phương các đoạn thẳng màu đỏ là SS total

Tổng bình phương các đoạn màu xanh là SS residual

Trang 24

Source | SS df MS Number of obs = 8

-+ - F( 1, 6) = 8.16 Model | 390684335 1 390684335 Prob > F = 0.0289 Residual | 287265681 6 047877614 R-squared = 0.5763 -+ - Adj R-squared = 0.5057 Total | 677950016 7 096850002 Root MSE = 21881

plasma | Coef Std Err t P>|t| [95% Conf Interval] -+ - weight | .0436153 .0152684 2.86 0.029 006255 .0809757 _cons | .0857244 1.023998 0.08 0.936 -2.419909 2.591358 -

Trang 25

regress plasma weight

Source | SS df MS Number of obs = 8

Trang 26

Bài tập

theo tuổi thai (có và không có đường hồi quy)

sinh và tuổi thai; tuổi mẹ và tuổi thai; tuổi

mẹ và trọng lượng sơ sinh

quy của trọng lượng sơ sinh theo tuổi thai

Trang 27

regress bweight gestwks

Source | SS df MS Number of obs = 641

-+ - F( 1, 639) = 762.25

Model | 148354317 1 148354317 Prob > F = 0.0000

Residual | 124365805 639 194625.673 R-squared = 0.5440

-+ - Adj R-squared = 0.5433

Total | 272720122 640 426125.19 Root MSE = 441.16

bweight | Coef Std Err t P>|t| [95% Conf Interval]

df: Độ tự do MS: Mean of square: trung

bình bình phương

Trang 28

Trọng lượng sơ sinh =-4865,2 + tuổi thai x 206,6

Trang 30

regress tlsosinh tuoithai gioi tang_ha

Source | SS df MS Number of obs = 641

df: Độ tự do MS: Mean of square: trung

bình bình phương

Trọng lượng sơ sinh =-4729 + tuổi thai x 201 +

[167 nếu nam] – [142 nếu mẹ tăng ha]

Trang 31

Trọng lượng thai = -4865.25 + 206.64 x tuổi thai

Trang 33

Ứng dụng: hồi quy về trung bình

 x là cholesterol trước điều trị; y là cholesterol sau khi điều trị bằng placebo

Trang 35

Phương trình hồi quy đa biến

 Y= a + b1x1 + b2x2+…+bnxn

 A: hằng số

 B1: hệ số của biến x1: mức độ thay đổi của biến phụ thuộc khi biến x1 thay đổi một đơn

vị và các biến số khác không thay đổi

 B1: tác động của biến x1 lên biến phụ thuộc

có kiểm soát cho các biến số gây nhiễu x2-xn

 Hồi quy đa biến có thể kiểm soát cho các yếu tố gây nhiễu

Trang 36

 Có 2 người đàn ông đẩy được 350 kg

 Có 1 người đàn ông đẩy được 150 kg

 Hồi quy đơn biến

 TL=- 50 + 200 x đàn ông

Trang 37

 Có 2 người đàn ông và 3 đàn bà đẩy được 350 kg

 Có 1 người đàn ông và 1 đàn bà đẩy được 150 kg

 Hồi quy đơn biến

 TL=- 50 + 200 x đàn ông

Trang 38

 Có 2 người đàn ông và 3 đàn bà đẩy được 350 kg

 Có 1 người đàn ông và 1 đàn bà đẩy được 150 kg

 Hồi quy đơn biến

 TL=- 50 + 200 x đàn ông

 Hồi quy đa biến

 TL = (100 x đàn ông) + (50 x đàn bà)

Trang 39

Hồi quy đa biến

 Khi mô hình hồi quy có thêm biến

x k làm thay đổi hệ số của biến số

x 1 , chúng ta nói biến x k là biến số gây nhiễu của biến x 1 và biến y

 Hệ số cũ của biến x 1 : tác động của biến x 1 và biến x k

Trang 40

Hồi quy đa biến

 Khi mô hình hồi quy có thêm biến x k làm thay đổi hệ số của biến số x 1 , chúng ta nói biến x k là biến số gây nhiễu của biến x 1 và biến y

 Hệ số cũ của biến x 1 : tác động của biến x 1 và biến x k

 Hệ số mới của biến x 1 : tác động của biến x 1 và độc lập với biến x k

Trang 41

Một số định lí về biến đổi biến số

 Nếu biến số x là biến đổi tuyến tính của biến X và biến số y là biến đổi tuyến tính của biến Y

 r(x,y) = r(X,Y) = r(x,Y)= r(Y,X) =r(X,y)

 Nếu x tăng gấp mấy lần so với X thì sx tăng gấp bấy nhiều lần so với Sx

 Liên hệ giữa x và X tương tự liên hệ giữa x và X

B

A X

x B

A X

x     

B

s s

Trang 42

Phép kiểm 2 đuôi - 1 đuôi

 Nếu biến số x là biến đổi tuyến tính của biến X và biến số y là biến đổi tuyến tính của biến Y

 r(x,y) = r(X,Y) = r(x,Y)= r(Y,X)

 Nếu x tăng gấp mấy lần so với X thì sx tăng gấp bấy nhiều lần so với Sx

 Liên hệ giữa x và X tương tự liên hệ giữa x và X

B

A X

x B

A X

x     

B

s s

Trang 43

 Phép kiểm 1 đuôi

 Đối thuyết Ha:

x1>x2hay x1<x2

2 1

1 1

) (

n n

s

x x

2 1

1 1

|

|

n n

s

x x

t

Trang 44

Công thức về sai số chuẩn

22

6

7 )

1

( 2

r syn

n s

22

22

6

7 )

1

( 2

s

Trang 45

 Hướng dẫn tính phương sai và độ lệch chuẩn s x

)

( 1

1

2 2

2

2 2

n n

x n

x

n

n x

n x s

Trang 46

Công thức về sai số chuẩn

 Sai số

chuẩn của

hệ số

0152

0

7 416

5

04788

0 1

) (

) (

s x

x

s b

e

s

x

Trang 53

Công thức về sai số chuẩn

2 2

2 2 2

2

) 1 ( 2 1

2

/ )

( )

2 (

) (

)

( )

2 (

) )

( (

y

s r n

n

n

Sxx Sxy

Syy n

x x b

y

y n

bx x

b y y s

2

) 1 (

) (

) (

.

x

s n

s x

x

s b

e s

2 2

2 2

) 1 ( )

(

1 )

.(

.

x

s n

s x

n

s x

x

x n

s a

e s

) 1 (

) ' ( 1 1 )

(

1 1 )'

.(

.

x

s n

x

x n

s x

x

x n

s y

e s

Trang 55

 Giả thuyết Ho: hệ số góc = 0

, 87 ,

2 0153 ,

0

0436 ,

0 )

.(

b e s

b t

0153 ,

0 38

, 205

2189 ,

0 )

(

) (

x

s b

e s

Trang 56

Ghi nhận giá trị x, y và

bổ sung các giá trị x 2 , y 2 và xy

3364,00 58,00 159,50 2,75 7,56 4900,00 70,00 200,20 2,86 8,18 5476,00 74,00 249,38 3,37 11,36 4032,25 63,50 175,26 2,76 7,62 3844,00 62,00 162,44 2,62 6,86 4970,25 70,50 246,05 3,49 12,18 5041,00 71,00 216,55 3,05 9,30 4356,00 66,00 205,92 3,12 9,73

Trang 57

Tính tổng các cột và tổng các sai lệch bình phương

3364,00 58,00 159,50 2,75 7,56 4900,00 70,00 200,20 2,86 8,18 5476,00 74,00 249,38 3,37 11,36 4032,25 63,50 175,26 2,76 7,62 3844,00 62,00 162,44 2,62 6,86 4970,25 70,50 246,05 3,49 12,18 5041,00 71,00 216,55 3,05 9,30 4356,00 66,00 205,92 3,12 9,73 535,0 35983,5 535,00 1615,30 24,02 72,80 24,02

Trang 58

Kí hiệu tổng bình phương sai lệch

Sxx = Σ (x-x)2=Σ x2-(Σ x)2/n

Sxy = Σ (x-x)(y-y)=Σ xy- (Σ x)(Σ y)/n

Syy = Σ (y-y)2=Σ y2-(Σ y)2/n

x xx x xy y yy y Toång

Σ Σx Σx 2 Σx Σxy Σy Σy 2 Σy Toång bình phöông phaàn dö S

2

/ )

( )

2 (

) (

)

( )

2 (

) )

Syy n

x x b

y

y n

bx x

b y y

s

Trang 59

 hồi quy bweight theo gestwks

 Tạo biến yhat (tiên đoán của hồi quy tuyến tính)

 Vẽ biểu đồ bằng lệnh Graphics:: Overlaid

Trang 61

 Có 5 biến số được quan tâm: tuổi (age), cholesterol toàn phần, hút thuốc lá, HDL cholesterol và huyết áp Trong các biến này biến nào là biến

tương tác và tương tác với biến số nào

biến nào có tác động đều và biến nào tác động không đều.

Ngày đăng: 02/10/2014, 20:16

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w