Đánh giá đường hồi quy• Vấn đề: – Phương pháp bình phương tối thiểu sẽ cho chúng ta đường hồi qui kể cả khi không có mối quan hệ tuyến tính giữa x và y... Ví dụ 1Trong 1 NC về cao huyết
Trang 1Hồi quy tuyến tính và tương quan
Lớp CN YTCC K10
Trang 2Thể tích huyết tương và trọng lượng cơ thể
ở 8 người đàn ông khỏe mạnh
Trang 3• Chiều cao và FEV1 của 20 sinh viên
Trang 8Hồi quy tuyến tính
• Sự liên quan giữa hai biến định lượng
thông qua mô hình hồi quy
Trang 9Hồi quy tuyến tính
• Mô hình hồi quy tuyến tính
Trang 10Hồi quy tuyến tính
• Có nhiều đường hồi quy
Vậy đường hồi quy nào là tốt nhất?
Trang 11Đường hồi quy tốt nhất
1
4
(1,2)
2 2
Trang 12Đường hồi quy tốt nhất
Là một đường thẳng mà từ đó trung bình tổng bình phương tới đường thẳng là nhỏ nhất (tối thiểu)
Trang 13Làm thế nào để xây dựng đường hồi quy
Đường hồi quy:
y = a + bx
Hệ số
a = ?, b = ?
Trang 14n i
i i
n i
n i
n i
i i
i i n
i
i
n i
i i
n
x x
n
y
x y
x x
x
y y
x
x b
1
1
2 2
) )(
(
) (
) )(
(
x b y
Trang 15Ví dụ
• Đường hồi quy mô tả mối quan hệ giữa
FEV và chiều cao sẽ là:
FEV=-8,45 + 0,0744*chiều cao
Đây là giá trị độ dốc, phiên giải:
Với mỗi cm cao lên thì FEV1 sẽ tăng 0,0744 lít
Trang 16Ví dụ
• Đường hồi quy mô tả mối quan hệ giữa tuổi thai và trọng lượng sơ sinh
TLSS = -4865.245 + 206.641 x tuổi thai (tính theo tuần).
Phiên giải?
Trang 17Đánh giá đường hồi quy
• Vấn đề:
– Phương pháp bình phương tối thiểu sẽ cho chúng ta
đường hồi qui kể cả khi không có mối quan hệ tuyến tính giữa x và y
Trang 18Đánh giá độ dốc
– Khi không có mối quan hệ tuyến tính giữa hai
biến, đường hồi qui sẽ nằm ngang
các giá tr (x) khác nhau cho ị (x) khác nhau cho
k t qu khác nhau (y) ết quả khác nhau ở (y) ả khác nhau ở (y) ở (y)
Kh Có mối quan hệ tuyến tính
các giá trị (x) khác nhau cho kết quả không khác nhau ở (y)
đ d c ộ dốc ốc β b ng không (0)ằng không (0)
Có m i quan h tuy n tính ối quan hệ tuyến tính ệ tuyến tính ến tính
Trang 19• Chúng ta có thể suy luận từ b bằng cách kiểm định:
s s
i b
y
y n
Trang 20• Như vậy:
• b=0,0744
• s b =0,025
• Tra bảng t với bậc tự do n-2=20-2=18
• Kết luận: độ dốc đường hồi qui khác 0 có ý
nghĩa TK, đường hồi qui là mô tả tốt nhất
031 ,
3
025 0
0744 ,
b t
b
Tính toán
Trang 21Ví dụ 1
Trong 1 NC về cao huyết áp, số liệu cân nặng (X) và
cholesterol (Y) của 15 người thu được như sau
Xây dựng phương trình hồi quy mô tả mối liên quan giữa
2 biến số này
Đường hồi quy này có ý nghĩa hay không? (Kiểm định độ dốc)
Trang 22n i
i i
n i
n i
n i
i i
i i n
i
i
n i
i i
n
x x
n
y
x y
x x
x
y y
x
x b
1
1
2 2
) )(
(
) (
) )(
s s
y
y n
Trang 23Lập bảng số liệu tính theo công thức
Trang 24Kết quả
Trang 25Hệ số tương quan
• Hệ số tương quan
• Tính chất
– Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]
– Hệ số tương quan r dương chứng tỏ hai biến số là đồng
biến; hệ số tương quan r âm chứng tỏ hai biến số là nghịch biến.
– Nếu r=0 (hay r < 0,1) , không có mối liên hệ tuyến tính giữa hai biến số Nếu r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan hệ trung bình và trên 0,5 là quan hệ mạnh.
– Trị số tuyệt đối của hệ số tương quan r nói lên mức độ liên quan giữa hai biến số
1
/ )
( )
( )
(
) )(
s
y x n
xy y
y x
x
y y
x
x r
y x
i i
i i
Trang 26Hệ số tương quan
Correlations
1.000 062.062 1.000
.414.414
cholesterolcannangcholesterolcannangcholesterolcannang
Pearson Correlation
Sig (1-tailed)
N
cholesterol cannang
Trang 28Tóm tắt
• Xây dựng đường hồi quy dựa trên nguyên
lý bình phương tối thiểu
• Cần kiểm định hệ số hồi quy b
• Hệ số tương quan R và các tính chất của
hệ số tương quan R
Trang 29Hệ số xác định R2
Trang 30Các giá trị
• SST: total sum of square – tổng bình phương
chung
– Sự thay đổi của yi so với
• SSR: regression sum of square – tổng bình
phương được giải thích bằng hồi quy
– Sự thay đổi của yi-hat so với
• SSE: residual (error) sum of square – tổng bình phương không giải thích được bằng hồi quy
– Sự thay đổi của yi so với yi-hat
Trang 32Ví dụ
Trang 33Ý nghĩa
• Hệ số xác định:
– Phần trăm sự thay đổi của biến phụ thuộc
được giải thích bằng biến độc lập trong mô hình hồi quy
– Ví dụ: tuổi thai có thể giải thích được 54.2%
sự thay đổ của cân nặng sơ sinh trẻ
Trang 34Hệ số tương quan
• Không tính hệ số xác định
• Hệ số tương quan: căn bậc hai của hệ số xác định
Trang 35Hệ số tương quan
• Hệ số tương quan
1
/ )
( )
( )
(
) )(
s
y x n
xy y
y x
x
y y
x
x r
y x
i i
i i
Trang 36Hệ số tương quan (tt)
• Tính chất
– Hệ số tương quan luôn luôn nằm trong đoạn [-1,1]– Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm chứng tỏ hai biến số là nghịch biến
– Nếu r=0 (hay r < 0,1) , không có mối liên hệ tuyến tính giữa hai biến số Nếu r từ 0,1 đến 0,3 là quan
hệ yếu, từ 0,3 đến 0,5 quan hệ trung bình và trên 0,5 là quan hệ mạnh
– Trị số tuyệt đối của hệ số tương quan r nói lên
mức độ liên quan giữa hai biến số
– R2 nói lên tỉ lệ sự biến thiên của biến số phụ thuộc được giải thích bởi biến số độc lập
Trang 38Biểu đồ chấm điểm
Nhận xét?
Trang 39Hệ số tương quan
• R=0.691
• R2 = 0.477
• Phiên giải?
Trang 40Ước lượng từ mô hình
• Ước lượng KTC của giá trị trung bình y từ
Trang 41Tóm tắt
• Xây dựng đường hồi quy dựa trên nguyên
lý bình phương tối thiểu
• Cần kiểm định hệ số hồi quy b
• Hệ số tương quan R và các tính chất của
hệ số tương quan R
• Ước lượng từ mô hình hồi quy