Hồi quy tuyến tính bội là một phần mở rộng của hồi quy tuyến tính đơn. Nó được sử dụng khi chúng ta muốn dự đoán giá trị của một biến phản hồi dựa trên giá trị của hai hoặc nhiều biến giải thích khác. Biến chúng ta muốn dự đoán được gọi là biến phản hồi (hoặc đôi khi là biến phụ thuộc). Các biến mà chúng ta đang sử dụng để dự đoán giá trị của biến phản hồi được gọi là các biến giải thích (hoặc đôi khi là biến dự báo, biến phụ thuộc). Ví dụ, chúng ta có thể sử dụng hồi quy bội số để hiểu liệu có thể dự đoán kết quả kỳ thi Toán giải thích dựa trên thời gian ôn tập, và giới tính của sinh viên hay không.
Trang 1MÔ HÌNH HỒI QUY TUYẾN TÍNH BỘI
GIẢNG VIÊN CAO CẤP
TS NGUYỄN HUY HOÀNG
Trang 3• Giả sử có n quan sát, mỗi quan sát có k giá trị (Yi, X2i, …, Xki)
• Ký hiệu
• Khi đó dạng ma trận
3
Trang 4• Các giả thiết của mô hình
GT1: Biến độc lập là phi ngẫu nhiên
GT2: Kỳ vọng của các SSNN bằng 0
E(Ui) = 0 i
GT3: Phương sai của các SSNN không đổi ( bằng nhau )
Var(Ui) = Var(Uj) = 2 i ≠ j
GT4: Các SSNN không tuơng quan với nhau
Cov(Ui ,Uj) = 0 i ≠ j
GT5: Các SSNN và biến độc lập không tương quan với nhau
Cov(Ui , Xmi) = 0 i,m
GT6: Các sai số ngẫu nhiên có phân phối chuẩn
GT7: Các biến giải thích không có quan hệ tuyến tính – Ma trận X là
không suy biến (Không xảy ra đa cộng tuyến).
Trang 5• Trong tổng thể
• Trong mẫu
là các ước lượng điểm của β1,β2,…,βk
là ước lượng điểm của E(Y/X2i, X3i ,…,Xki)
ei là ước lượng điểm của Ui
Trang 7• Phương pháp ước lượng OLS Tìm véc tơ sao cho:
• Véc tơ là nghiệm của hệ
Trang 8Hệ số xác định bội R2
• Ý nghĩa: R2 cho biết tỷ lệ % sự biến thiên của Y được giải thích thông qua toàn bộ các biến độc lập của mô hình
Trang 9Hệ số xác định bội đã hiệu chỉnh
- Mục đích của việc hiệu chỉnh là để xem xét việc có nên đưa thêm biến giải thích vào
mô hình hay không
- Một biến mới sẽ được đưa vào mô hình nếu hệ số của biến mới đưa vào mô hình
có ý nghĩa thống kê và hệ số xđ bội hiệu chỉnh còn tăng
Trang 10Ý nghĩa của các hệ số hồi quy:
Hệ số β1 = E(Y/X2i = X3i = …= Xki = 0) là giá trị
trị trung bình của Y thay đổi như thế nào, trong
đổi.
Trang 11• Ta có do đó với độ tin cậy (1 - ) ta có:
- Khoảng tin cậy đối xứng
- Khoảng tin cậy bên phải dùng để ước lượng giá trị tối thiểu.
- Khoảng tin cậy bên trái dùng để ước lượng giá trị tối đa:
( )
ˆ
ˆ ( )
j
Se
ˆ ( )ˆ n k ˆ ( )ˆ n k 1
( )
ˆ ( )ˆ n k 1
( )
ˆ ( )ˆ n k 1
P Se T
Trang 12Kiểm định giả thiết đối với j( j 1 k)
cặp giả thiết
- Với cặp giả thiết (1)
- Với cặp giả thiết (2)
- Với cặp giả thiết (3)
ˆ ( )
j
T
Se
( ) 2 ( )
( )
:
: :
n k
n k
n k
W T T T
W T T T
W T T T
Trang 13Kiểm định sự phù hợp của hàm hồi quy
• R2
tổng thể = 0 : hàm hồi qui không phù hợp
• Kiểm định cặp giả thiết:
• Ta có TCKĐ:
Miền bác bỏ giả thiết H0 với mức ý nghĩa cho trước
• Sử dụng phương pháp so sánh mức ý nghĩa với giá trị P-value
+ Nếu > P thì bác bỏ giả thiết H0
+ Nếu < P thì không có cơ sở bác bỏ giả thiết H0
2
2
k j
2 2
/( 1)
( 1, ) (1 )/( )
R k
W F F F k n k
Trang 14Dự báo
• Xét mô hình k biến
• Sử dụng SRF ước lượng được để dự báo về biến phụ thuộc
- Dự báo giá trị trung bình của biến phụ thuộc (biết X0T = (1, X02, X03,…,X0k) cần dự báo giá trị E(Y/X0))
- Dự báo giá trị cá biệt của biến phụ thuộc
(biết X0T = (1, X02, X03,…,X0k) cần dự báo giá trị (Y0 = Y/X0))
47
1 2 2 3 3
Y X X X U
Trang 15Dự báo giá trị trung bình của biến phụ thuộc
48
Trang 16Dự báo giá trị cá biệt của biến phụ thuộc
SRF cho ta một ước lượng điểm của Y0 = (Y/X0) trên mẫu
Để dự báo Y0 của tổng thể ta ƯL khoảng tin cậy của nó.
Ta có
Do đó với độ tin cậy (1- ) cho trước
49
Trang 17Xin cảm ơn!