Mọi đường thẳng hồi quy đều đi qua giá trị trung bình X_mu, mean, Y_mu, mean, nếu hằng số được đưa vào.. Mọi tổng của số dư luôn luôn là zero , nếu hằng số được đưa vào... R2 cho
Trang 1Tính toán ước lượng bằng phương pháp Bình phương tối thiểu (OLS)
Trang 2Ordinary Least Square (OLS) Phương pháp bình phương tối thiểu
Mục đích là tìm kiếm đường thẳng “tốt nhất” của mô hình
tuyến tính : tìm kiếm 1_mu, mu, 2_mu, mu
Yi = 1_mu, mu + 2_mu, mu.X2i + ei
Trang 4Định nghĩa
hàm hồi quy ngẫu nhiên sai số
giá trị dự báo, hồi quy mẫu
hệ số ước lượng ei số dư
y 1 2 2
i i
i i
y ˆ1 ˆ2 2 ˆ
Trang 5i i
y ˆ1 ˆ2 2 ˆ
Trang 6Bài toán tối thiểu*
Vi phân của hàm mục tiêu
F.O.C
w.r.t 1 w.r.t 2
Trang 7
Giải hệ ta được:
Ta được hệ phương trình chuẩn:
Trang 8Ước lượng OLS
Công thức ước lượng OLS của 1 and 2
2_mu, mu = Cov(X,Y) / Var(X)
1_mu, mu = Y_mu, mean - 2_mu, mu * X_mu, mean
1
2 1
1
2
1 2
ˆ
x n x
y x n y
x
x x
y y
x x
n i
n i
i i n
i
i
i
n i
Trang 9Hệ quả
Trong hồi quy đơn, dấu của 2 _mu, mu = dấu của hệ số tương
quan giữa X và Y.
Mọi đường thẳng hồi quy đều đi qua giá trị trung bình
(X_mu, mean, Y_mu, mean), nếu hằng số được đưa vào.
Mọi tổng của số dư luôn luôn là zero , nếu hằng số được đưa
vào.
Ước lượng OLS của 1 and 2 là ƯL tốt nhất (không
chệch và hội tụ)
Khác
Trang 102
2 2
x n
Var
2
2 2
Trang 11ˆ ˆ
i
2
2 2
i x x
x n
Var
2
2 2
1
1 ˆ
i x x
x
2 2
2 ˆ
1 ˆ
ˆ
Trang 13i i
Trang 14Đánh giá kết quả hồi quy (i)
R2 (Hệ số xác định)
R2 = ESS / TSS = 1 - RSS / TSS
Đo lường sự phù hợp của dữ liệu với mô hình
R2 cho biết tỷ lệ mà mô hình được giải thích bởi
ước lượng đường thẳng hồi quy; 0 <= R2 <= 1
trong trường hợp hồi quy đơn, nó là bình phương
của hệ số tương quan (r2)
i i
y y
y
y
2 2
ˆ
R y
n
i
1 1
1
2 1
2 2
Trang 15RSS ESS
TSS
e y
y y
y
i
i t
i i
1
2 1
2 2
i i
Trang 1707/04/24 17
Định nghĩa
0 R 2 1
R 2 1 : phương sai của biến x được giải thích hoàn toàn bởi mô hình
R 2 0 : phương sai của biến x không được giải thích hoàn toàn bởi mô hình
Kiểm định độ phù hợp của mô hình
y
y
2 2
t
t i
1
2 1
2 2
Trang 18Bảng phân tích phương sai
Nguồn
biến thiên
Tổng bình phương
Bậc tự do Trung bình
bình phương
Trang 19 Đặc điểm của R-bình phương
R2 luôn luôn tăng khi thêm biến giải thích
F-test* được xây dựng trên cơ sở của đặc điểm này.
Như thế, RSS luôn luôn giảm khi thêm biến giải
thích
Trang 20Kiểm định giả thiết mô hình
tuân theo luật Student với n-2 bậc tự do
- so sánh các hệ số hồi quy với một giá trị đã cho trước.
- so sánh hai hệ số hồi quy từ hai mẫu khác nhau
- xác định khoảng tin cậy của một tham số.
Trang 21Đánh giá kết quả hồi quy (ii)
_mu, mu = RSS / (n-2)
(n = # của obs., k = # của hồi quy có hằng số, n-2 là bậc tự do)
Nó được sử dụng để tìm kiếm độ lệch chuẩn của
2_mu, mu, và từ đó có thể tìm kiếm t-stat
t* = (2_mu, mu - 0) / std error của _mu, mu
Trang 22Mô hình hồi quy đơn
kiểm định giả thiết - 1 Kiểm định giả thiết về a
Tính
Kiểm định (H 0 ) i = 0 đối nghịch với (H 1 ) i 0
Đặt bằng t* Thống kê Student Đọc trong bảng phân phối Student của t /2 tương ứng với một mức cho trước.
So sánh t* và ta /2 t* < t/2 (H 0 ) được chấp nhận
t* t/2 (H 0 ) bị bác bỏ
i i
ˆ
ˆ
Chấp nhận H1
Trang 23(a) tìm kiếm 0_mu, mu and 1_mu, mu.
(b) tìm kiếm R 2 , std error của 1_mu, mu, and thống kê t.
Trang 24Using EXCEL, SPSS
Nhập dữ liệu, và đạt được kết quả hồi quy
Quảng cáo và Doanh thu
tạo file, và chạy hồi quy
Trang 25Khoảng tin cậy IC
))
ˆ (
ˆ );
ˆ (
ˆ ( 2 tn/22se 2 2 tn/22se 2
Trang 26Dependent var : Doanh thu
Method: Least squareds
R-squared 0.710901 Mean dependent var 1829.481
Adj R- squared 0.705341 S.D dependent var 632.7382
S.E của hồi quy 343.4660 Akaike info criterion 14.55239
Sum squared resid 6134381 Schwarz criterion 14.62605
Log likelihood -390.914 F-statistic 127.8691
Durbin-Watson stat 0.581593 Prob(F-statistic) 0.000000
Trang 28Tóm tắt
Để tính hồi quy làm thế nào.
1_mu, mu, R2, t-stat, and etc.
Sử dụng Excel, SPSS như thế nào
Sử dụng R2.
Ý nghĩa nó thế nào
đặc điểm nó thế nào : sử dụng ra sao
Trang 29DỰ BÁO BẰNG MÔ HÌNH HỒI QUY
Khi thêm biến.
R-bình phương luôn luôn tăng
RSS luôn luôn giảm
Đo lường để chọn lọc mô hình
Adjusted R-bình phương
AIC or BIC
Trang 30kiểm định giả thiết - 3
Kiẻm định sự phù hợp của mô hình
2
*2
/1
1
/
n R
Trang 312
1 2
ˆ
x n x
y x n y
x
x x
y y
x x
n i
n i
i i n
i
i
i
n i
i i
i i
y ˆ1 ˆ2 2 ˆ
Trang 32Giả thiết cổ điển
I Tuyến tính
quyết mô hình
II Trung bình Zero: E(i) = 0
III Không có tương quan giữa sai số và biến độc
lập: Cov( xi, i) = 0
Trang 33Giả thiết cổ điển
IV Không có hiện tượng tự tương quan giữa các sai số:
Cov(i, j) = 0
• nếu không, GLS (chuỗi thời gian) (Bài sau)
V Đồng đẳng: Var(i) = 2
• nếu không, sử dụng phương pháp GLS (Bài sau)
VI Sai số phân phối chuẩn
• nếu không, sai số tuân theo phân phối không chuẩn vaì
Trang 34y 1 2 2
i i
y ˆ1 ˆ2 2
Trang 366- Khoảng tin cậy của
se
t
ˆ
2 2
/
Trang 37)
ˆ (
ˆ
1 2
2 2
2
2 /
2 ( n 2 ) ˆ ˆ
) 2 n
(
Trang 40ª Neáu p <
Trang 41Bài toán kiểm định giả thuyết về tham số
Ví dụ về các giả thuyết muốn kiểm định:
Cung tiền không ảnh hưởng đến lạm phát?
Xu hướng tiêu dùng cận biên <= 1?
Chi tiêu của chính phủ và đầu tư tư nhân có ảnh hưởng như
nhau đến tăng trưởng kinh tế
Chi tiêu cho quảng cáo có tác động đến lợi nhuận không bé
hơn chi tiêu cho R&D
Hàm sản xuất của doanh nghiệp có tính hiệu quả không đổi
theo quy mô
Giá phân bón và giá điện đều cùng không ảnh hưởng đến
Trang 42Thực hiện kiểm định giả thuyết
Trang 43Kiểm định T
Ví dụ: Y= β1+ β2TV+ β3IN +β4P+ u ; n=100
Y: lợi nhuận của công ty; TV: Quảng cáo trên
tivi; IN: Quảng cáo trên mạng, P: giá bán của sản phẩm
Kết quả chạy hồi quy:
1 5
1
0 7
.
1 )
ˆ (
0 ˆ
Trang 44Bảng tóm tắt về cặp giả thuyết và miền bác bỏ