cả các giá trị của x được thỏa, và mô hình hồi qui giả định là một biểu diễn đầy đủ của mối quan hệ giữa các biến, thì. Đồ thị phần dư sẽ cho một ấn tượng[r]
(1)HỒI QUI
(2)HỒI QUI TUYẾN TÍNH ĐƠN BIẾN
• Mơ hồi qui tuyến tính đơn
• Phương pháp bình phương tối thiểu • Hệ số xác định
• Các giả định mơ hình • Kiểm định mức ý nghĩa
• Sử dụng mơ hình hồi qui ước lượng để ước lượng dự đốn
• Lời giải máy tính
(3)MƠ HÌNH
HỒI QUI TUYẾN TÍNH ĐƠN BIẾN
y = b0 + b1x +e
Với:
b0 b1 gọi tham số mơ hình, e biến ngẫu nhiên gọi số hạng sai số
▪ Mơ hình hồi qui tuyến tính đơn biến là:
▪ Phương trình mơ tả y liên hệ với x
(4)PHƯƠNG TRÌNH
HỒI QUI TUYẾN TÍNH ĐƠN BIẾN
▪ Phương trình hồi qui tuyến tính đơn là:
• E(y) giá trị kỳ vọng y giá trị x cho trước
• b1 độ dốc đường hồi qui
• b0 tung độ gốc đường hồi qui
• Đồ thị phương trình hồi qui đường thẳng
(5)PHƯƠNG TRÌNH
HỒI QUI TUYẾN TÍNH ĐƠN BIẾN
▪ Quan hệ tuyến tính đồng biến
E(y)
x Độ dốc b1
dương Đường hồi qui
Tung độ gốc
(6)PHƯƠNG TRÌNH
HỒI QUI TUYẾN TÍNH ĐƠN BIẾN
▪ Quan hệ tuyến tính nghịch biến
E(y)
x Độ dốc b1
âm
Đường hồi qui Tung độ gốc
(7)PHƯƠNG TRÌNH
HỒI QUI TUYẾN TÍNH ĐƠN BIẾN
▪ Khơng quan hệ
E(y)
x Độ dốc b1
Bằng
Đường hồi qui Tung độ gốc
(8)PHƯƠNG TRÌNH HỒI QUI
TUYẾN TÍNH ĐƠN BIẾN ƯỚC LƯỢNG
▪ Phương trình hồi qui tuyến tính đơn ước lượng
y^ = b0 + b1x
• y^ là giá trị ước lượng y giá trị x cho trước
• b1 độ dốc đường
• b0 tung độ gốc đường
(9)QUI TRÌNH ƯỚC LƯỢNG
Mơ hình hồi qui
y = b0 + b1x +e
Phương trình hồi qui
E(y) = b0 + b1x
Tham số chưa biết
b0, b1
Dữ liệu mẫu x y x1 y1
xn yn
b0 b1
Ước lượng
b0 b1
Phương trình hồi qui ước lượng
Trị thống kê mẫu b0, b1
0
ˆ
(10)PHƯƠNG PHÁP
BÌNH PHƯƠNG TỐI THIỂU
▪ Tiêu chí bình phương tối thiểu
min ( yi − yi )2
Với:
yi = giá trị quan sát biến phụ thuộc quan sát thứ i
(11)▪ Độ dốc phương trình hồi qui ước lượng
1 2
( )( )
( )
i i
i
x x y y
b
x x
− −
=
−
PHƯƠNG PHÁP
(12)Tung độ gốc phương trình hồi qui ước lượng
PHƯƠNG PHÁP
BÌNH PHƯƠNG TỐI THIỂU
0
b = −y b x
Với:
xi = giá trị biến độc lập quan sát thứ i
n = tổng số quan sát
_
y = giá trị trung bình biến phụ thuộc
_
x = giá trị trung bình biến độc lập
(13)HỒI QUI TUYẾN TÍNH ĐƠN BIẾN
Ví dụ: Doanh số xe
Quảng cáo TV
Doanh số xe
3
(14)PHƯƠNG TRÌNH
HỒI QUI ƯỚC LƯỢNG
ˆ 10 5
y = + x
1 2
( )( ) 20
5
( )
i i
i
x x y y
b x x − − = = = −
0 20 5(2) 10
b = y − b x = − =
▪ Độ dốc phương trình hồi qui ước lượng
▪ Tung độ gốc phương trình hồi qui ước lượng
(15)ĐỒ THỊ PHÂN TÁN ĐIỂM VÀ ĐƯỜNG XU HƯỚNG
y = 5x + 10
0 5 10 15 20 25 30
0 1 2 3 4
Quảng cáo TV
(16)HỆ SỐ XÁC ĐỊNH
▪ Mối liên hệ SST, SSR, SSE
Với:
SST = Tổng bình phương tồn phần SSR = Tổng bình phương hồi qui
SSE = Tổng bình phương sai số
SST = SSR + SSE
2
(y yi − )
( ˆ )2
i
y y
= − ( ˆ )2
i i
y y
(17)▪ Hệ số xác định là:
HỆ SỐ XÁC ĐỊNH
Với:
SSR = Tổng bình phương hồi qui SST = Tổng bình phương toàn phần
(18)HỆ SỐ XÁC ĐỊNH
r2 = SSR/SST = 100/114 = 8772
Mối quan hệ hồi qui mạnh; 88%
sự biến thiên doanh số xe giải thích mối quan hệ tuyến tính
(19)HỆ SỐ TƯƠNG QUAN MẪU
2 1)
of
(sign b r rxy =
ion Determinat of t Coefficien ) of (sign b1 rxy =
Với
b1 = độ dốc phương trình hồi qui ước lượng
x b b
(20)2 1)
of
(sign b r rxy =
Dấu b1 phương trình “+”
ˆ 10 5
y = + x
= + 8772
xy
r
HỆ SỐ TƯƠNG QUAN MẪU
(21)CÁC GIẢ ĐỊNH VỀ SỐ HẠNG SAI SỐ e
1 Sai số e biến ngẫu nhiên với trung bình Phương sai e , ký hiệu 2, giống
đối với tất giá trị biến độc lập
3 Các giá trị e độc lập
(22)KIỂM ĐỊNH Ý NGHĨA
Để kiểm định ý nghĩa mối quan hệ hồi qui, chúng Ta phải tiến hành kiểm định giả thuyết xác định xem
giá trị b1 có hay không
Hai kiểm định dùng phổ biến là:
t Test F Test
Cả kiểm định t F yêu cầu ước lượng
(23)▪ Ước lượng của
KIỂM ĐỊNH Ý NGHĨA
− = − − = 2 ) ( ) ˆ (
SSE yi yi yi b b xi
Với
s2 = MSE = SSE/(n − 2)
(24)KIỂM ĐỊNH Ý NGHĨA
▪ Ước lượng của
2 SSE MSE
− =
=
n s
• Để ước lượng lấy bậc hai 2.
(25)▪ Giả thuyết
▪ Trị thống kê
KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH t
0: 0
H b =
1
: 0
a
H b
1
1
b
b t
s
(26)▪ Qui tắc bác bỏ
KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH t
Với
t dựa phân phối t với bậc tự n -2 Bác bỏ H0 p-value <
(27)1 Xác định giả thuyết
2 Xác định mức ý nghĩa
3 Lựa chọn trị thống kê kiểm định
= 05
4 Qui tắc bác bỏ Bác bỏ H0 p-value < 05 hay|t| > 3.182 (với độ tự 3)
KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH t
0: 0
H b =
1
: 0
a
H b
(28)KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH t
5 Tính giá trị trị thống kê kiểm định
6 Xác định có bác bỏ H0 hay khơng
t = 4.541 cho diện tích 01 phần
phía Vì vậy, p-value nhỏ 02 (Cũng vậy, t = 4.63 > 3.182.) bác bỏ H0
1
1 5 4.63
1.08
b b t
s
(29)KHOẢNG TIN CẬY CỦA b1
▪ H0 bị bác bỏ giá trị giả thuyết b1
không nằm khoảng tin cậy b1
(30)▪ Công thức khoảng tin cậy đối với b1 là:
KHOẢNG TIN CẬY CỦA b1
1
1 /2 b b t s
Với giá trị t cho diện tích
/2 phần phía phân phối t
Với độ tự n -
2 /
t
b1 ước
(31)KHOẢNG TIN CẬY CỦA b1
Bác bỏ H0 không nằm
khoảng tin cậy b1
0 không nằm khoảng tin cậy Bác bỏ H0
= +/- 3.182(1.08) = +/- 3.44
2 / t sb
b
or 1.56 to 8.44
▪ Qui tắc bác bỏ
▪ Khoảng tin cậy 95% b1
(32)▪ Giả thuyết
▪ Trị thống kê
KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH F
F = MSR/MSE
0: 0
H b =
1
: 0
a
(33)▪ Qui tắc bác bỏ
KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH F
Với:
F dựa phân phối F với độ tự tử số độ tự n - mẫu số
Bác bỏ H0
(34)1 Xác định giả thuyết Xác định mức ý nghĩa
3 Lựa chọn trị thống kê kiểm định
= 05
4 Qui tắc bác bỏ Bác bỏ H0 p-value < 05 hay F > 10.13 (với d.f tử số
là d.f mẫu số 3)
KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH F
0: 0
H b =
1
: 0
a
H b
(35)KIỂM ĐỊNH Ý NGHĨA: KIỂM ĐỊNH F
5 Tính giá trị trị thống kê kiểm định
6 Xác định có bác bỏ H0 hay không
F = 17.44 cho diện tích 025 phần
đi phía Vì vậy, p-value tương ứng với F = 21.43 nhỏ 2(.025) = 05 Vì vậy, bác bỏ H0
F = MSR/MSE = 100/4.667 = 21.43
(36)MỘT VÀI LƯU Ý VỀ
GIẢI THÍCH CÁC KIỂM ĐỊNH Ý NGHĨA
▪ Bác bỏ H0: b1 = kết luận mối quan hệ x y có ý nghĩa, kết
(37)SỬ DỤNG PHƯƠNG TRÌNH HỒI QUI ƯỚC LƯỢNG ĐỂ ƯỚC LƯỢNG VÀ DỰ ĐOÁN
/
yp t 2syp
Với:
hệ số tin cậy -
t/2 dựa phân phối t
/2 ind p
y t s
▪ Khoảng tin cậy của E(yp)
(38)Nếu quảng cáo TV tiến hành trước bán, kỳ vọng trung bình doanh số xe hơi là:
ƯỚC LƯỢNG ĐIỂM
^
(39)▪ Kết khoảng tin cậy từ Excel
D E F G
1 CONFIDENCE INTERVAL
2 xp
3 x bar 2.0
4 xp-x bar 1.0 5 (xp-x bar)2 1.0 6 (xp-x bar)2 4.0 7 Variance of y hat 2.1000 8 Std Dev of y hat 1.4491
9 t Value 3.1824
10 Margin of Error 4.6118 11 Point Estimate 25.0 12 Lower Limit 20.39
(40)Ước lượng khoảng tin cậy 95% trung bình doanh số xe quảng cáo TV thực là:
KHOẢNG TIN CẬY CỦA E(yp)
(41)▪ Kết khoảng dự đoán từ Excel
H I
1 PREDICTION INTERVAL
2 Variance of y ind 6.76667
3 Std Dev of y ind 2.60128
4 Margin of Error 8.27845
5 Lower Limit 16.72
6 Upper Limit 33.28
7
(42)Ước lượng khoảng dự đoán 95% doanh số xe
trong tuần cụ thể quảng cáo TV thực là:
KHOẢNG DỰ ĐOÁN CỦA yp
(43)PHÂN TÍCH PHẦN DƯ
ˆ
i i
y − y
▪ Rất nhiều phân tích phần dư dựa việc khảo sát đồ thị phần dư
▪ Phần dư quan sát thứ i
▪ Các phần dư cho thông tin tốt e .
▪ Nếu giả định số hạng sai số e khơng đảm bảo
thì kiểm định giả thuyết ý nghĩa mối quan hệ hồi qui kết ước lượng khoảng khơng cịn
(44)ĐỒ THỊ PHẦN DƯ THEO X
▪ Nếu giả định phương sai e giống tất
cả giá trị x thỏa, mơ hình hồi qui giả định biểu diễn đầy đủ mối quan hệ biến,
Đồ thị phần dư cho ấn tượng
(45)x ˆ
y y−
0
Dạng tốt
Phần
dư
(46)ĐỒ THỊ PHẦN DƯ THEO X
x ˆ
y y−
0
Ph
ần
dư
(47)ĐỒ THỊ PHẦN DƯ THEO X
x ˆ
y y−
0
Ph
ần
dư
(48)▪ Phần dư
Observation Predicted Cars Sold Residuals
1 15 -1
2 25 -1
3 20 -2
4 15
5 25
(49)ĐỒ THỊ PHẦN DƯ THEO X
Đồ thị phần dư
-3 -2 -1 0 1 2 3
0 1 2 3 4
Quảng cáo TV
Ph
ần
d
(50)