[r]
(1)BÀI 8: TƯƠNG QUAN VÀ HỒI QUY
Nội dung Mục tiêu
• Hệ số tương quan mẫu
• Đường hồi quy trung bình tuyến tính thực nghiệm
Thời lượng
• tiết
• Giới thiệu hệ số tương quan mẫu đường hồi quy bình phương trung bình tuyến tính thực nghiệm hai biến ngẫu nhiên
• Kiến thức quan trọng cho sinh viên tiếp thu kiến thức môn học Kinh tế lượng sau
Hướng dẫn học
Trong chương bạn cần nắm vững kiến thức sau:
• Các khái niệm hệ số tương quan hai biến định lượng ý nghĩa, tính chất hệ số
tương quan, cách dùng hệ số tương quan đểđánh giá mối quan hệ hai đại lượng
• Phương trình hồi quy tuyến tính đơn, đường hồi quy thực nghiệm, ý nghĩa phương trình hồi quy hệ số hồi quy, tính chất đường hồi quy thực nghiệm
(2)TÌNH HUỐNG KHỞI ĐỘNG BÀI
Tình
Siêu thị ABC muốn mở 01 siêu thị khu dân cư Vạn Phúc Để xác định quy mô siêu thị, doanh nghiệp cần biết chi phí nhu yếu phẩm người dân vùng Biết chi phí nhu yếu phẩm 01 cá nhân phụ thuộc vào mức thu nhập cá nhân Siêu thị tiến hành điều tra mức thu nhập (X) chi tiêu (Y) cho nhu cầu yếu phẩm cá nhân Kết cho bảng số liệu sau (đơn vị triệu đồng):
X\Y 0,5 0,8 1,0
1,5
2,0
2,5
3,0 1
Câu hỏi
1 Tính hệ số tương quan mẫu
2. Viết phương trình hồi quy tuyến tính mẫu
3.Ước lượng sai số hồi quy
(3)8.1 Hệ số tương quan mẫu
Trong trước đưa khái niệm hệ số
tương quan mẫu cách tính giá trị hệ số tương quan mẫu ứng với mẫu cụ thể Trong phần xác suất ta biết hệ số tương quan hai biến ngẫu nhiên X, Y
Cov(X, Y) E(XY) (EX)E(Y)
X Y X Y
−
ρ = =
σ σ σ σ
Ý nghĩa hệ số tương quan đo mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên X Y Trong thực tế nhiều ta chưa biết phân phối X Y, hệ
số tương quan lý thuyết ρ X Y chưa biết Vậy ta cần dựa vào mẫu quan sát véc tơ ngẫu nhiên (X, Y) để tìm cách ước lượng cho hệ số tương quan ρ
Giả sử ta có mẫu ngẫu nhiên (X1, Y1), (X2, Y2), …, (Xn, Yn) rút từ véc tơ ngẫu nhiên (X, Y) với giá trị mẫu (x1, y1), (x2, y2), …, (xn, yn) Hệ số tương quan mẫu định nghĩa qua công thức:
XY (X)(Y) R
S S X Y
−
=
trong thống kê n k k
k
1
XY X Y
n =
= ∑ Lúc R ước lượng hệ số tương quan lý thuyếtρ Với mẫu cụ thể, giá trị R là:
xy (x)(y) r
s s X Y
−
=
8.2 Đường hồi quy trung bình tuyến tính thực nghiệm Ta kiểm tra thấy hệ số tương quan
ρ ước lượng r đại lượng có giá trị tuyệt đối nhỏ Khi | |ρ gần mức độ phụ thuộc tuyến tính X Y chặt chẽ, tức ta tính xấp xỉ Y theo X qua biểu thức dạng f(X) = aX + b Thông thường | | 0,8ρ >
thì cách tính xấp xỉ gọi chặt chẽ
Lúc ta biểu diễn giá trị Yqua giá trị X phương trình dạng Y aX b= + + ε,
trong đóε sai số phép lấy xấp xỉ
(4)đơn vị giá trị biến Y tăng hay giảm đơn vị Hệ số b gọi số hồi quy (intercept), cho biết phương trình hồi quy có qua gốc tọa độ hay không điểm xuất phát Y X Các hệ số a b
được gọi hệ số hồi quy
Trong phương trình biến Y gọi biến giải thích hay biến phụ thuộc, biến X gọi biến giải thích biến độc lập, phương trình hồi quy gọi phương trình hồi quy tuyến tính đơn Nếu biến Y biểu diễn qua phương trình dạng tuyến tính với nhiều biến giải thích phương trình gọi hồi quy tuyến tính bội
Với mẫu ngẫu nhiên (x1, y1), (x2, y2), …, (xn, yn) ta xây dựng hàm hồi quy mẫu (hàm hồi quy thực nghiệm) có dạng:
ˆ ˆ ˆy ax b.= +
Xét quan sát thứ i ta có ˆyi axi b
ˆ ˆ ˆ
y y a.x b
i i i i i
= +
= + ε = + + ε
) )
trong εi giá trị củaε quan sát thứ i, a, b) ) ước lượng a b Ta cần xác định hệ số a, b) ) cho tổng sai số bình phương trung bình đạt giá trị nhỏ
n 2 n 2 n 2
ˆ ˆ ˆ
L i (yi y )i (yi a.xi b)
i i i
= ∑ ε = ∑ − = ∑ − − →
= = =
Điều kiện cần để hàm L đạt là: n
L ˆ
ˆ
2 (y a.x b)
ˆ i i
b i 1
n
L ˆ
ˆ
2 (yi a.xi b)xi ˆa i 1
⎧∂ = − − − = ∑
⎪ ∂
⎪ =
⎨ ∂
⎪ = − ∑ − − = ⎪ ∂
(5)Giải hệ phương trình, ta có:
n n
ˆ ˆ
n.b a x y
i i
i i
n n 2 n
ˆ ˆ
b x a x x y
i i i i
i i i
⎧ + ∑ = ∑ ⎪ ⎪ = = ⎨ ⎪ + = ∑ ∑ ∑ ⎪ ⎩ = = =
Từđó ta có nghiệm
( )( ) ( ) n i i y i n 2 x i i ˆ ˆ
b y a.x
x y x y
S
ˆa r
1 x x S
n = = = − − = = − ∑ ∑ Do đó, ta có:
( ) y y i i x x y i i x S S
ˆy r x y r x
S S
S
ˆy y r x x S
= + −
⇒ − = −
Vậy phương trình hồi quy mẫu (đường
hồi quy trung bình tuyến tính thực nghiệm) có dạng:
s s
y y ˆ ˆ
ˆy r x y r x ax b
s s
x x
= + − = +
Phương pháp ước lượng cho hệ số a, b cịn gọi phương pháp bình phương nhỏ Phương trình hồi quy xác định có số tính chất sau:
• Hàm hồi quy mẫu qua điểm (x, y)
• Các ước lượng ˆa, b ˆ xác định
• Giá trị trung bình sai số 0: n
1
0 i n i
ε = ∑ ε = =
• Giá trị trung bình ˆy bi ằng giá trị trung bình quan sát y : i ˆy y.=
Sai số y yˆ
i i i
ε = − gọi phần dư (residual) biểu thị sai khác quan sát yi giá trị ˆy tính i từ phương trình hồi quy ˆy ax b=ˆ +ˆ
Đặt:
n 2
RSS i
i
(6)RSS gọi tổng bình phương phần dư ta có
2
RSS ns (1 r ) y
= −
Ký hiệu y / x
ε ước lượng sai số ε, ta có n
1 RSS
2 ( ) s (1 r )2
y / x n i n y
i
ε = ∑ ε − ε = = −
=
Các đại lượng sẽđược dùng đểđánh giá chất lượng mơ hình hồi quy
Một ứng dụng quan trọng hồi quy dự báo giá trị biến Y biến X nhận giá trị Nếu biến Xnhận giá trị x0, ta có:
0 ˆ ˆ
ˆy =ax +b
0
ˆy ước lượng điểm tương ứng cho giá trị y0 Y
Ví dụ 1:
Theo dõi mức lãi suất (Y) tỷ lệ lạm phát (X) số nước ta có số liệu sau: Y 17,5 15,6 9,8 5,3 7,9 10,0 19,2 13,1 X 14,2 11,7 6,4 2,1 4,8 8,1 15,4 9,8 Hãy:
• Tính hệ số tương quan mẫu
• Xây dựng phương trình hồi quy mẫu
• Ước lượng sai số hồi quy
• Dự báo giá trị mức lãi suất tỷ lệ lạm phát 22,5
Giải:
• Với số liệu mẫu ta tính
x 9,0625; y 12,3; xy 130,9813;
sx 18,59; sx 4,312
s 20,76; s 4,56 y
= = =
= =
= =
Vậy hệ số tương quan mẫu 130,9813 9,0625.12,3
r 0,99
4,56.4,312
−
= =
Ta có:
sy 4,56
ˆa r 0,99 1,045
s 4,312
x
ˆ ˆ
b y a.x 12,3 1,045.9,0625 2,83
= = =
(7)• Vậy ta có phương trình hồi quy mẫu ˆy 1,045.x 2,83.= +
• Ước lượng sai số hồi quy là:
2 2
y / x s (1 r ) 20,76(1 0,99 ) 0, 413y
ε = − = − =
• Nếu tỷ lệ lạm phát x0 = 22,5 mức lãi suất ngân hàng là:
0
y = 1,045.22,5 + 2,83 = 26,343
Ví dụ 2:
Điều tra mức thu nhập (X) chi tiêu (Y) cho nhu cầu yếu phẩm cá nhân ta có bảng số
liệu sau (đơn vị triệu đồng)
Hãy
• Tính hệ số tương quan mẫu
• Viết phương trình hồi quy tuyến tính mẫu
• Ước lượng sai số hồi quy
• Dự báo giá trị Y mức thu nhập X 4,0 triệu đồng
Giải:
• Với số liệu cho tính tốn ví dụ ta có: x 2, 23; y 0,72; xy 1,695;
2
s x 0, 27; sx 0,52;
s 0,04; s 0,
y y
= = =
= =
= =
Vậy, hệ số tương quan mẫu là: 1,695 2, 23.0,72
r 0,86
0,52.0,
−
= =
Y X
0,5 0,8 1,0