Theo phương pháp này, người phân tích sẽ không sử dụng một số quan sát cuối cùng (chẳng hạn, 10% số quan sát cuối cùng) trong việc ước lượng mô hình, nhưng sẽ sử dụng các ước lượng thô[r]
(1)Chương
M
MÔÔ HHÌÌNNHH HHỒỒII QQUUYY TTUUYYẾẾNN TTÍÍNNHH ĐĐƠƠNN
Ở chương phát biểu bước phân tích kinh tế lượng việc thiết lập mơ hình mơ tả hành vi đại lượng kinh tế Tiếp theo nhà phân tích kinh tế/ kinh doanh thu thập liệu thích hợp ước lược mơ hình nhằm hỗ trợ cho việc quyết định Trong chương giới thiệu mô hình đơn giản phát triển phương pháp ước lượng, phương pháp kiểm định giả thuyết phương pháp dự báo Mơ hình đề cập đến biến độc lập (Y) biến phụ thuộc (X) Đó mơ hình hồi quy tuyến tính đơn Mặc dù mơ hình đơn giản, phi thực tế, việc hiểu biết vấn đề mơ hình tảng cho việc tìm hiểu mơ hình phức tạp Thực tế, mơ hình hồi quy đơn tuyến tính giải thích cho nhiều phương pháp kinh tế lượng Trong chương đưa kết luận mơ hình hồi quy tuyến tính đơn biến Cịn phần khác phần tính tốn giới thiệu phần phụ lục Vì vậy, đối với người đọc có kiến thức tốn học, thích, đọc phần phụ lục để hiểu rõ kết lý thuyết
3.1 Mơ Hình Cơ Bản
Chương trình bày ví dụ mơ hình hồi quy đơn đề cập đến mối liên hệ giá ngơi nhà diện tích sử dụng (xem Hình 1.2) Chọn trước số loại diện tích, sau liệt kê số lượng nhà có tổng thể tương ứng với diện tích chọn Sau tính giá bán trung bình loại nhà vẽ đồ thị (quy ước điểm biểu thị X) Giả thuyết mơ hình hồi quy tuyến tính đơn trị trung bình nằm đường thẳng (biểu thị + SQFT), hàm hồi quy tổng thể trung bình có điều kiện (kỳ vọng) GIÁ theo SQFT cho trước Công thức tổng quát mơ hình hồi quy tuyến tính đơn dựa Giả thiết 3.1
GIẢ THIẾT 3.1 (Tính Tuyến Tính Mơ Hình)
Yt = + Xt + ut (3.1)
trong đó, Xt Yt trị quan sát thứ t (t = đến n) biến độc lập biến phụ thuộc, tiếp
theo tham số chưa biết ước lượng; ut là số hạng sai số không
quan sát giả định biến ngẫu nhiên với số đặc tính định mà đề cập kỹ phần sau gọi hệ số hồi quy (t thể thời điểm chuỗi thời gian trị quan sát chuỗi liệu chéo.)
(2)của nam với chiều cao người cha họ để “hồi quy” (hoặc di chuyển) cho chiều cao trung bình tồn tổng thể + Xb gọi phần xác định mơ hình trung
bình có điều kiện Y theo X, E(YtXt) = + Xt Thuật ngữ tuyến tính dùng để
rằng chất thông số tổng thể tuyến tính (bậc nhất) khơng phải
là Xt tuyến tính Do đó, mơ hình Yt Xt ut
2
gọi hồi quy quyến tính đơn
mặc dầu có X bình phương Sau ví dụ phương trình hồi quy phi tuyến tính Yt =
+ X + ut Trong sách khơng đề cập đến mơ hình hồi quy phi tuyến tính mà
tập trung vào mơ hình có tham số có tính tuyến tính mà thơi Những mơ hình tuyến tính bao gồm số hạng phi tuyến tính biến giải thích (Chương 6) Để nghiên cứu sâu mơ hình hồi quy phi tuyến tính, tham khảo tài liệu: Greene (1997), Davidson MacKinnon (1993), Griffths, Hill, Judg (1993)
Số hạng sai số ut (hay gọi số hạng ngẫu nhiên) thành phần ngẫu nhiên không
quan sát sai biệt Yt phần xác định + Xt Sau tổ hợp bốn
nguyên nhân ảnh hưởng khác nhau:
1 Biến bỏ sót Giả sử mơ hình thực Yt = + Xt + Zt +vt đó, Zt biến giải
thích khác vt số hạng sai số thực sự, ta sử dụng mơ hình Y = + Xt
+ut ut = Zt +vt Vì thế, ut bao hàm ảnh hưởng biến Z bị bỏ sót Trong ví dụ
địa ốc phần trước, mơ hình thực bao gồm ảnh hưởng phòng ngủ phòng tắm bỏ qua hai ảnh hưởng mà xét đến diện tích sử dụng số hạng u bao hàm ảnh hưởng phòng ngủ phòng tắm lên giá bán nhà
2 Phi tuyến tính ut bao gồm ảnh hưởng phi tuyến tính mối quan hệ Y X
Vì thế, mơ hình thực Yt Xt Xt2ut , lại giả định phương trình Y = + Xt +ut , ảnh hưởng Xt2 sẽ bao hàm ut
3 Sai số đo lường Sai số việc đo lường X Y thể qua u Ví dụ, giả sử Yt giá trị việc xây dựng ta muốn ước lượng hàm Yt = + rt +vt rt
là lãi suất nợ vay vt sai số thật (để đơn giản, ảnh hưởng thu nhập biến
khác lên đầu tư loại bỏ) Tuy nhiên thực ước lượng, lại sử dụng mơ hình Yt = + Xt +ut Xt = rt +Zt lãi suất Như lãi
suất đo lường sai số Zt thay rt = Xt – Zt vào phương trình ban đầu, ta
Yt = +(Xt – Zt)+vt = + Xt – Zt + vt = + Xt + ut
Cần lưu ý tính ngẫu nhiên số hạng ut bao gồm sai số đo lường lãi suất
nợ vay cách xác
4 Những ảnh hưởng khơng thể dự báo Dù mơ hình kinh tế lượng tốt chịu ảnh hưởng ngẫu nhiên dự báo Những ảnh hưởng được thể qua số hạng sai số ut
Như đề cập ban đầu, việc thực điều tra toàn tổng thể để xác định hàm hồi quy tổng thể không thực tế Vì vậy, thực tế, người phân tích thường chọn mẫu bao gồm nhà cách ngẫu nhiên đo lường đặc tính mẫu để thiết lập hàm hồi quy cho mẫu Bảng 3.1 trình bày liệu mẫu gồm 14 nhà bán khu vực San Diego Số liệu có sẵn đĩa mềm với tên tập tin DATA3-1 Trong Hình 3.1, cặp giá trị (Xt, Yt) vẽ đồ thị Đồ thị gọi đồ thị phân tán
(3)sử, thời điểm, ta biết giá trị Ta vẽ đường thẳng + X trên biểu đồ Đây đường hồi quy tổng thể Khoảng cách chiếu thẳng xuống từ giá thực (Yt) đến đường hồi quy + X sai số ngẫu nhiên ut Độ dốc đường thẳng ()
cũng Y/X, lượng thay đổi Y đơn vị thay đổi X Vì diễn
dịch ảnh hưởng cận biên X lên Y Do đó, 0.14, điều có nghĩa
mét vng diện tích tăng thêm làm tăng giá bán nhà lên, mức trung bình, 0.14 ngàn la (lưu ý đơn vị tính) hay 140 la Một cách thực tế hơn, diện tích sử dụng nhà tăng thêm 100 mét vng hy vọng giá bán trung bình ngơi nhà tăng thêm $14.000 đô la Mặc dầu tung độ gốc giá trị trị trung bình Y X 0, số hạng
vẫn hiểu giá trung bình lơ đất trống Nguyên nhân
cũng ẩn chứa biến bỏ sót khơng có cách giải thích cho (điều đề cập kỹ Phần 4.5)
BẢNG 3.1 Giá trị trung bình ước lượng trung bình thực tế giá nhà diện tích sử dụng (mét vng)
t SQFT Giá bán1 Giá trung bình
ước lượng2
1 1.065 199,9 200,386
2 1.254 288 226,657
3 1.300 235 233,051
4 1.577 285 271,554
5 1.600 239 274,751
6 1.750 293 295,601
7 1.800 285 302,551
8 1.870 365 312,281
9 1.935 295 321,316
10 1.948 290 323,123
11 2.254 385 365,657
12 2.600 505 413,751
13 2.800 425 441,551
14 3.000 415 469,351
HÌNH 3.1 Biểu Đồ Phân Tán Của Mẫu Trình Bày Mối Liên Hệ Giữa Giá SQFT
(4)
Y
X
+ X
t
X
X ,tYt
t
u
t
X
100 200 300 400 500 600
1000 1400 1800 2200 2600 3000
HÌNH 3.2 Phương Trình Hồi Quy Tổng Thể Mẫu
Y
X
X
ˆ ˆ D
C B
0 A
(Hoài qui tổng thể)
+ X
(Hồi qui maãu)
t t X
Yˆˆˆ t t t EY X X
X ,tYt
t
uˆ
t u
Mục tiêu nhà kinh tế lượng sử dụng liệu thu thập để ước lượng hàm hồi quy tổng thể, là, ước lượng tham số tổng thể Ký hiệu
ˆ ước lượng mẫu ˆ ước lượng mẫu Khi mối quan hệ trung bình ước lượng Y^ = ^ + ^X Đây gọi hàm hồi quy mẫu Ứng với giá trị quan sát cho trước t, ta có Y^t = ^ + ^Xt Đây giá trị dự báo Y với giá trị cho trước Xt
Lấy giá trị quan sát Yt trừ cho giá trị này, ta ước lượng ut được gọi phần
dư ước lượng, đơn giản phần dư, ký hiệu uˆt 1và thể phương
trình sau:
u^t = Yt – Y^t = Yt – ^ – ^Xt
Sắp xếp lại số hạng trên, ta có
1 Một số tác giả giảng viên thích sử dụng a thay cho ^, b thay cho ^ e
t thay cho u^t Chúng ta sử dụng dấu hiệu ^
(5)t t
t X u
Y ˆ ˆ ˆ (3.3)
Việc phân biệt hàm hồi quy tổng thể Y = + X hàm hồi quy mẫu
X
Yˆt ˆˆ quan trọng Hình 3.2 trình bày hai đường sai số phần dư (cần
nghiên cứu kỹ vấn đề này) Lưu ý ut ký hiệu “sai số”, uˆtlà ký hiệu “phần
dư”
BÀI TẬP 3.1
Xem xét phương trình sau đây:
a Yt X ut
b Yt ˆˆX uˆt
c Yt ˆˆX ut
d Yˆt X
e Yˆt X uˆt
f Yˆt ˆ ˆX uˆt
Giải thích kỹ phương trình (a) (b) đúng, (c), (d), (e) (f) sai Hình 3.2 có ích việc trả lời câu hỏi
3.2 Ước lượng mơ hình phương pháp bình phương tối thiểu thông thường
Trong phần trước, nêu rõ mơ hình hồi quy tuyến tính phân biệt hồi quy của tổng thể hồi quy mẫu Mục tiêu sử dụng liệu X Y tìm kiếm ước lượng “tốt nhất” hai tham số tổng thể Trong kinh tế lượng, thủ tục ước lượng dùng phổ biến phương pháp bình phương tối thiểu Phương pháp thường gọi bình phương tối thiểu thơng thường, để phân biệt với phương pháp bình phương tối thiểu khác thảo luận chương sau Ký hiệu ước lượng ˆ ˆ, phần dư ước lượng uˆt Yt ˆˆXt Tiêu
chuẩn tối ưu sử dụng phương pháp bình phương tối thiểu cực tiểu hóa hàm mục tiêu
2
1
2
) ˆ ˆ ( ˆ
) ˆ , ˆ
( t
n t
t t n
t
t
t Y X
u
ESS
với tham số chưa biết ˆ ˆ ESS tổng phần dư bình phương phương
pháp OLS cực tiểu tổng phần dư bình phương2 Cần nên lưu ý ESS khoảng cách
(6)
bình phương đo lường từ đường hồi quy Sử dụng khoảng cách đo lường này, nói phương pháp OLS tìm đường thẳng “gần nhất” với liệu đồ thị
Trực quan hơn, giả sử ta chọn tập hợp giá trị ˆ vàˆ, đường thẳng
X
ˆ ˆ Có thể tính độ lệch Y
t từ đường thẳng chọn theo phần dư ước lượng
X Y
uˆt t ˆ ˆ Sau bình phương giá trị cộng tất giá trị bình phương tồn mẫu quan sát Tổng phần dư bình phương trị quan sát [được xem tổng bình phương sai số (ESS)] ˆ2
t
u Tương ứng với điểm đường
thẳng có một trị tổng bình phương sai số Phương pháp bình phương tối thiểu chọn giá trị ˆ ˆ cho ESS nhỏ
Việc bình phương sai số đạt hai điều sau Thứ nhất, bình phương giúp loại bỏ dấu sai số xem sai số dương sai số âm Thứ hai, bình phương tạo bất lợi cho sai số lớn cách đáng kể Ví dụ, giả sử phần dư mẫu 1, 2, –1 –2 hệ số hồi quy chọn trước trị ˆ ˆ chọn trước So sánh giá trị với mẫu khác có phần dư –1, –1, –1 Tổng giá trị sai số tuyệt đối hai trường hợp Mặc dù mẫu chọn thứ hai có sai số tuyệt đối thấp từ đến 1, điều dẫn đến sai số lớn khơng mong muốn Nếu ta tính ESS cho hai trường hợp ESS trường hợp đầu 10 (12
+ 22+ 12+ 22), ESS cho trường hợp sau 12 (12 + 12+ 12+ 32) Phương pháp bình phương tối thiểu áp đặt bất lợi lớn cho sai số lớn đường thẳng trường hợp đầu chọn Phần 3.3 tiếp tục trình bày đặc tính cần thiết khác phương pháp cực tiểu ESS
Phương Pháp Thích Hợp Cực Đại
Phần đề cập sơ phương pháp thích hợp cực đại Phương pháp trình bày chi tiết phần 2.A.4 Phần 3.A.5 trình bày nguyên tắc áp dụng mơ hình hồi quy tuyến tính đơn Mặc dù phương pháp thích hợp cực đại dựa tiêu chuẩn tối ưu khác, thông số ước lượng giống thông số ước lượng phương pháp OLS Nói đơn giản, phương pháp thích hợp cực đại chọn ước lượng cho xác suất xảy mẫu quan sát lớn
Phần thảo luận trước cho thấy thực hai phương pháp ước lượng khác cách xác dẫn đến kết Như cần phải xem xét hai phương pháp? Câu trả lời chương sau, ta thấy số giả thiết mơ hình giảm nhẹ, thực tế, hai phương pháp ước lượng khác cho kết khác Một phương pháp khác cho kết khác nữa, phương pháp cực
tiểu tổng sai số tuyệt đối uˆt Nhưng phương pháp không dùng phổ biến
kinh tế lượng khó tính tốn
Phương Trình Chuẩn
(7)
uˆt 0 (Yt ˆˆXt) Yt(nˆ)ˆ Xt (3.4)
)] ˆ ˆ ( [ ) ˆ
(Xtut Xt YtXt
= (3.5)
Trong Phương trình (3.4), cần lưu ý ˆ n ˆ số hạng có ˆ có n số hạng Chuyển vế số hạng âm Phương trình (3.4) sang phải chia số hạng cho n, ta
t Xt
n Y
n
1 ˆ ˆ
(3.6)
(1/n)Yt trung bình mẫu Y, ký hiệu Y , (1/n)Yt trung bình mẫu X, ký
hiệu X Sử dụng kết thay vào Phương trình (3.6), ta phương trình sau
X
Y ˆˆ (3.7)
Đường thẳng ^ +^ X đường ước lượng đường hồi quy mẫu, đường
thẳng thích hợp Có thể thấy từ Phương trình (3.7) đường hồi quy mẫu qua điểm trung bình X ,Y Trong Bài tập 3.12c, ta thấy tính chất khơng đảm bảo trừ số hạng số có mơ hình
Từ Phương trình (3.5), cộng tất theo số hạng, đưa ˆ ˆ làm thừa số
chung, ta
0 ˆ
ˆ )
( XtYt Xt Xt hay
ˆ ˆ
)
(XtYt Xt Xt (3.8)
Lời Giải Phương Trình Chuẩn
Để thuận lợi cho việc đáp án hai phương trình chuẩn, tính chất sau cần thiết Những tính chất chứng minh Phụ lục Phần 3.A.2
TÍNH CHẤT 3.1
Sxx = (Xt – X
–
)2 = Xt2 – nX
–
)2 = Xt2 –
1 n(Xt)2
TÍNH CHẤT 3.2
Sxy = (Xt – X
–
)(Yt – Y
–
) = (XtYt) – n X
(8)Từ Phương trình (3.7),
t Xt
n Y n X
Y ˆ ˆ1
ˆ
(3.9)
Thay ˆ vào (3.8)
ˆ
) ( ˆ t t t t t
t X X X
n Y n Y
X
Nhóm số hạng có thừa số ˆ:
X nX
n Y X Y
Xt t t t t t
2
2
ˆ
Tìm ˆ ta
n X X n Y X Y X t t t t t t 2 ˆ
Sử dụng ký hiệu đơn giản giới thiệu Tính chất 3.1 3.2, diễn tả sau xx xy S S
ˆ (3.10)
trong
n X X
Sxx t t
2 (3.11) n Y X Y X
Sxy t t t t (3.12)
Ký hiệu Sxx Sxy nhớ cách trực quan sau, định nghĩa xt Xt X yt Yt Y , ký hiệu ngang trung bình mẫu Do xt yt ký hiệu độ lệch X Y so với giá trị X Y trung bình Kết sau chứng minh phần Phụ lục Phần 2.A.1 3.A.2
xt =
2 2 ) (
t t t t
(9)
t t t t t t t t
xy X Y
n Y X Y
Y X X y
x
S ( )( ) (3.14)
Sxy “tổng giá trị xt nhân yt “ Tương tự, Sxx “tổng giá trị xt nhân xt , hay
tổng xt bình phương
Phương trình (3.9) (3.10) lời giải cho phương trình chuẩn [(3.4) (3.5)] cho ta ước lượng ˆ ˆ mẫu cho tham số tổng thể
Cần lưu ý xác định ước lượng Phương trình (3.10)
0 )
(
2
x X X
Sxx t t Sxx không xt khơng, có nghĩa
khi Xt Điều dẫn đến giả thuyết sau
GIẢ THIẾT 3.2 (Các Giá Trị Quan Sát X Là Khác Nhau)
Không phải tất giá trị Xt Có giá trị Xt khác so với giá trị
còn lại Nói cách khác, phương sai mẫu ( )2
1 )
( X X
n X
Var t
không
không
Đây giả thiết quan trọng luôn phải tuân theo khơng mơ hình khơng thể ước lượng Một cách trực quan, Xt không đổi, ta khơng thể giải thích
được Yt thay đổi Hình 3.3 minh họa giả thuyết hình ảnh Trong ví dụ địa
ốc, giả sử thông tin thu thập tập trung vào loại nhà có diện tích sử dụng 1.500 mét vng Đồ thị phân tán mẫu thể Hình 3.3 Từ đồ thị thấy rõ liệu không đầy đủ cho việc ước lượng đường hồi quy tổng thể +X
HÌNH 3.3 Ví Dụ Giá Trị X Không Đổi
Y
X
0 1,500
Ví dụ 3.1
Theo thuật ngữ dùng phổ biến kinh tế lượng, ta sử dụng liệu Bảng 3.1 thực “hồi quy Y (GIÁ) theo số hạng số X (SQFT)”, ta xác định được mối quan hệ ước lượng (hay hàm hồi quy mẫu) Yˆt 52,3510,13875351Xt
t
Yˆ là giá ước lượng trung bình (ngàn la) tương ứng với Xt (xem Bảng 3.1) Hệ số hồi quy
(10)Do vậy, diện tích sử dụng tăng lên đơn vị, giá trung bình ước lượng kỳ vọng tăng thêm 0,13875 ngàn đô la ($138.75) Một cách thực tế, 100 mét vuông tăng thêm diện tích sử dụng, giá bán ước lượng kỳ vọng tăng thêm, mức trung bình, $ 13.875
Hàm hồi quy mẫu dùng để ước lượng giá nhà trung bình dựa diện tích sử dụng cho trước (Bảng 3.1 có trình bày giá trung bình cột cuối.) Do đó, nhà có diện tích 1.800 mét vng giá bán kỳ vọng trung bình $302.551[ = 52,351 + (0,139
1.800)] Nhưng giá bán thực nhà $285.000 Mơ hình ước lượng giá bán
vượt q $17.551 Ngược lại, nhà có diện tích sử dụng 2.600 mét vng, giá bán trung bình ước lượng $413.751, thấp giá bán thực $505.000 cách đáng kể Sự khác biệt xảy bỏ qua yếu tố ảnh hưởng khác lên giá bán nhà Ví dụ, ngơi nhà có sân vườn rộng và/ hay hồ bơi, có giá cao giá trung bình Điều nhấn mạnh tầm quan trọng việc nhận diện biến giải thích ảnh hưởng đến giá trị biến phụ thuộc đưa ảnh hưởng vào mơ hình thiết lập Ngồi ra, cần thiết việc phân tích độ tin cậy ước lượng tung độ hệ số độ dốc Phương trình (3.1), mức độ “thích hợp” mơ hình liệu thực tế
BÀI TẬP 3.2
Sao chép hai cột số liệu Bảng 3.1 vào bảng Trong cột bảng tính chép giá trị Yt (GIÁ) Xt (SQFT) cột thứ hai Sử dụng máy tính
tính thêm giá trị cho hai cột khác Bình phương giá trị cột thứ hai điền giá trị vào cột thứ ba (x) Nhân giá trị cột thứ với giá trị tương ứng cột hai điền kết qua vào cột thứ tư (XtYt) Tiếp theo, tính tổng cột đánh giá
các tổng sau đây:
753 26
Xt 55.462.515
2
Xt
9 , 444
Yt 9.095.985,5
2
Yt
Để tránh tình trạng nhiều sai số làm tròn, cần sử dụng nhiều số thập phân càng tốt Sau đó, tính Sxy từ Phương trình (3.12) Sxx từ Phương trình (3.11) Cuối cùng,
tính ˆ theo (3.10) ˆ theo (3.9) kiểm tra lại giá trị trình bày ban đầu
3.3 Tính chất ước lượng
Mặc dù phương pháp bình phương cho kết ước lượng mối quan hệ tuyến tính phù hợp với liệu sẵn có, cần trả lời số câu hỏi sau Ví dụ, Đặc tính thống kê ˆ ˆ? Thơng số dùng để đo độ tin cậy ˆ ˆ? Bằng cách để
có thể sử dụng ˆ ˆ để kiểm định giả thuyết thống kê thực dự báo? Sau
chúng ta vào thảo luận vấn đề Sẽ hữu ích bạn ơn lại Phần 2.6, phần đưa tóm tắt tính chất cần thiết thơng số ước lượng
Tính chất cần xem xét độ khơng thiên lệch Cần lưu ý Phần 2.4 thông số ước lượng ˆ ˆ? tự thân chúng biến ngẫu nhiên tuân theo phân phối
(11)có thể đạt nhiều giá trị ước lượng Sau tính tỷ số số lần mà ước lượng rơi vào khoảng giá trị xác định Kết sẽ cho phân phối ước lượng mẫu Phân phối có giá trị trung bình phương sai Nếu trung bình phân phối mẫu thông số thực (trong trường hợp ), ước lượng không thiên lệch Độ không thiên lệch rõ ràng điều ln mong muốn vì, điều có nghĩa là, mức trung bình, giá trị ước lượng với giá trị thực tế, số trường hợp cá biệt điều khơng
Có thể nói thơng số ước lượng OLS đưa Phần 3.2 có tính chất
khơng thiên lệch Tuy nhiên, để chứng minh điều này, cần đặt số giả thuyết bổ sung Xt ut Cần nhớ rằng, Giả thiết 3.1 giảm nhẹ phần sau,
nhưng Giả thuyết 3.2 3.3 luôn cần thiết phải tuân theo Sau giả thiết bổ sung cần thiết
GIẢ THIẾT 3.3 (Sai Số Trung Bình Zero) Mỗi u biến ngẫu nhiên với E(u) =
Trong Hình 3.1 cần lưu ý số điểm quan sát nằm đường + X số
điểm nằm Điều có nghĩa có giá trị sai số mang dấu dương số sai số mang dấu âm Do + X đường trung bình, nên giả định sai số ngẫu nhiên bị loại trừ nhau, mức trung bình, tổng thể Vì thế, giả định ut là
biến ngẫu nhiên với giá trị kỳ vọng hoàn toàn thực tế
GIẢ THIẾT 3.4 (Các Giá Trị X Được Cho Trước Không Ngẫu Nhiên)
Mỗi giá trị Xt cho trước không biến ngẫu nhiên Điều ngầm đồng
phương sai tổng thể Xt ut, Cov(Xt, ut) = E(Xt, ut) – E(Xt)E(ut) = XtE(ut) – XtE(ut)
= Do Xt ut khơng có mối tương quan (xem Định nghĩa 2.4 2.5)
Theo trực giác, X u có mối tương quan, X thay đổi, u thay đổi Trong trường hợp này, giá trị kỳ vọng Y không + X Nếu giá trị X khơng ngẫu nhiên giá trị kỳ vọng có điều kiện Y theo giá trị X + X Kết việc vi phạm Giả thiết 3.4 trình bày phần sau, đặc biệt nghiên cứu mơ hình hệ phương trình (Chương 13) Tính chất 3.3 phát biểu hai giả thiết bổ sung, thông số ước lượng OLS không thiên lệch
TÍNH CHẤT 3.3
(Độ Khơng Thiên Lệch)
Trong hai giả thiết bổ sung 3.3 3.4, [E(ut) = 0, Cov(Xt, ut) = 0], thông số ước lượng, thơng
số ước lượng bình phương tối thiểu ˆ ˆ không thiên lệch; nghĩa làE ˆ ,
ˆ ˆ
E
(12)Từ Phương trình (3.10), E ˆ ESxy Sxx Nhưng theo Giả thuyết 3.4, Xt không ngẫu
nhiên Sxx khơng ngẫu nhiên Điều có nghĩa tính giá trị kỳ vọng,
số hạng liên quan đến Xt đưa ngồi giá trị kỳ vọng Vì vậy, ta có
xy
xx S E S
E ˆ Trong Phương trình (3.12), thay Yt từ Phương trình (3.1) thay
bằng n
n u X n X u X X
Sxy t t t t t t
(3.15) n u X n X X u X X
Xt t t t t t t t
2
2
n u X u X n X
Xt t t t t t
2 xu xx S S
trong Sxx cho Phương trình (3.13)
n u X u X
Sxu t t t t (3.16)
t t t
t
tu X u X X u
X
X trung bình mẫu X, Xt không ngẫu nhiên, X xuất số hạng, kỳ vọng
của tổng số hạng tổng giá trị kỳ vọng Do vậy,
Sxu EXtutXE ut XtE ut XE ut 0 E
theo Giả thiết 3.3 Do đó, E(Sxy) = Sxx, nghĩa E ˆ E(Sxy) Sxx Như ước lượng không thiên lệch Chứng minh tương tự cho ^ Cần nhận thấy việc chứng minh độ không thiên lệch phụ thuộc chủ yếu vào Giả thiết 3.4 Nếu E(Xtut) 0, ˆcó thể bị
thiên lệch
BÀI TẬP 3.3
Sử dụng Phương trình (3.9) để chứng minh ˆ không thiên lệch Nêu rõ giả
thuyết cần thiết chứng minh
(13)khác ~ = (Y2 – Y1)/(X2 – X1) Lưu ý
~
đơn giản độ dốc đường thẳng nối hai điểm (X1, Y1) (X2, Y2) Rất dễ nhận thấy
~
không thiên lệch
1
1
1
1
2
1
1
~
X X
u u
X X
u X u
X
X X
Y Y
Như nói trước đây, giá trị X không ngẫu nhiên E(u2) = E(u1) = Do đó,
~
khơng thiên lệch Thực ra, ta xây dựng chuỗi vô hạn thông số ước lượng khơng thiên lệch Bởi ~ loại bỏ giá trị quan sát từ đến n, cách trực quan thông số ước lượng “tốt” Trong Bài tập 3.6, tất giá trị quan sát sử dụng thể thiết lập thông số ước lượng không thiên lệch khác, tương tự là thông số ước lượng không thiên lệch tốt Do đó, cần có tiêu chuẩn bổ sung để đánh giá “độ tốt” thông số ước lượng
Tiêu chuẩn thứ hai cần xem xét tính quán, tính chất mẫu lớn định nghĩa Phần 2.6 (Định nghĩa 2.10) Giả sử ta chọn ngẫu nhiên mẫu có n phần tử tìm ˆ ˆ Sau chọn mẫu lớn ước lượng lại thông số
này Lặp lại q trình nhiều lần để có chuỗi thơng số ước lượng Tính qn tính chất địi hỏi thơng số ước lượng phù hợp cỡ mẫu tăng lên vô hạn Ước lượng ~ trình bày rõ ràng khơng đạt tính qn cỡ mẫu tăng lên khơng ảnh hưởng đến thơng số Tính chất 3.4 phát biểu điều kiện để ước lượng có tính qn
TÍNH CHẤT 3.4 (Tính Nhất Quán)
Theo Giả thiết (3.2), (3.3) (3.4), ước lượng bình phương tối thiểu có tính chất qn Do đó, điều kiện để đạt tính quán E(ut) = 0, Cov(Xt, ut) = Var(Xt)
CHỨNG MINH (Nếu độc giả khơng quan tâm, bỏ qua phần này.)
Từ Phương trình (3.15) (3.10)
n S
n S
xx xu
/ / ˆ
(3.17)
Theo quy luật số lớn (Tính chất 2.7a), Sxu/n đồng quy với kỳ vọng nó,
Cov(X, u) Tương tự, Sxx/n đồng quy với Var(X) Do dẫn tới điều, n hội tụ đến vô
cùng, đồng quy với + [Cov(X,u)/Var(X), Cov(X,u) = – nghĩa X u không tương quan Như vậy, ˆ ước lượng quán
(14)Nói cách đơn giản, ước lượng khơng thiên lệch có tính hiệu ước lượng có phương sai nhỏ Để thiết lập tính hiệu quả, cần có giả thiết sau ut
GIẢ THIẾT 3.5 (Phương sai sai số không đổi)
Tất giá trị u phân phối giống với phương sai 2
, cho
2
)
(ut Eut
Var Điều gọi phương sai sai số không đổi (phân tán
đều)
GIẢ THIẾT 3.6 (Độc Lập Theo Chuỗi)
Giá trị u phân phối độc lập cho Cov(ut, us) = E(utus) = t s Đây
được gọi chuỗi độc lập
Các giả thiết ngầm phần dư phân có phân phối giống phân phối độc lập (iid) Từ Hình 1.2 ta thấy ứng với giá trị X có giá trị phân phối Y để xác định phân phối có điều kiện Sai số ut độ lệch từ trung bình có điều kiện + Xt Giả
thiết 3.5 ngầm định phân phối ut có phương sai (2) với phân phối us cho
một quan sát khác s Hình 3.4a ví dụ phương sai sai số thay đổi (hoặc không phân tán đều) phương sai thay đổi tăng theo giá trị quan sát X Giả thuyết 3.5 giảm nhẹ Chương Phần 3.6 Phụ chương có trình bày mô tả ba chiều giả thuyết
Giả thiết 3.6 (sẽ giảm nhẹ Chương 9) ngầm định ut us độc lập
vậy khơng có mối tương quan Cụ thể là, sai số liên tiếp không tương quan khơng tập trung Hình 3.4b ví dụ tự tương quan giả thuyết bị vi phạm Chú ý giá trị quan sát tập trung lại, có khả sai số có tương quan
HÌNH 3.4 Ví Dụ Phương Sai Của Sai Số Thay Đổi Tự Hồi Quy
Y
X
(15)Y
X
b Tự hồi quy
TÍNH CHẤT 3.5
(Hiệu quả, BLUE Định lý Gauss-Markov)
Theo Giả thiết 3.2 đến 3.6, ước lượng bình phương tối thiểu thơng thường (OLS) ước lượng tuyến tính khơng thiên lệch có hiệu ước lượng Vì phương pháp OLS đưa Ước Lượng Không Thiên lệch Tuyến Tính Tốt Nhất (BLUE)
Kết (được chứng minh Phần 3.A.4) gọi Định lý Gauss–Markov, theo lý thuyết ước lượng OLS BLUE; nghĩa tất tổ hợp tuyến tính khơng thiên lệch Y, ước lượng OLS có phương sai bé
Tóm lại, áp dụng phương pháp bình phương tối thiểu (OLS) để ước lượng hệ số hồi quy mơ hình mang lại số tính chất mong muốn sau: ước lượng (1) không thiên lệch, (2) có tính qn (3) có hiệu Độ khơng thiên lệch tính qn địi hỏi phải kèm theo Giả thuyết E(ut) = Cov(Xt, ut) = Yêu cầu tính hiệu
BLUE, cần có thêm giả thuyết, Var(ut) = 2 Cov(ut, us) = 0, với t s
3.4 Độ Chính Xác Ước Lượng Mức Độ Thích Hợp Mơ Hình
Sử dụng liệu ví dụ địa ốc ta ước lượng thông số sau ˆ52.351và
13875 , ˆ
Câu hỏi ước lượng tốt mức độ thích hợp
hàm hồi quy mẫu Yˆt 52,3510,13875351X với liệu Phần thảo luận phương pháp xác định thông số đo lường độ xác ước lượng độ phù hợp
Độ Chính Xác Các Ước Lượng
(16)Do ˆ vàˆ thuộc vào giá trị Y, mà Y lại phụ thuộc vào biến ngẫu nhiên u1, u2, …,
un, nên chúng biến ngẫu nhiên với phân phối tương ứng Sau phương trình
được rút Phần 3.A.6 phần phụ lục chương
xx S E Var 2 ˆ ) ˆ
( (3.18)
2 2 ˆ ˆ ) ˆ ( xx t nS X E
Var (3.19)
ˆ ˆ ˆ ˆ ) ˆ , ˆ ( xx S X E
Cov (3.20)
trong Sxx định nghĩa theo Phương trình (3.11) 2 phương sai sai số Cần
lưu ý Sxx tăng, giá trị phương sai đồng phương sai (trị tuyệt đối) giảm Điều
này cho thấy biến thiên X cao cỡ mẫu lớn tốt điều cho chứng tỏ độ thơng số ước lượng
Các biểu thức phương sai tổng thể ẩn số 2
ẩn số Tuy nhiên, thơng số ước lượng 2 có thể ước lượng dựa mẫu Lưu
ý Yˆt ˆˆXtlà đường thẳng ước lượng Do đó, uˆt Yˆtˆ ˆXt ước lượng của ut, phần dư ước lượng Một ước lượng dễ thấy 2 uˆt /n
2
ước lượng
này ngẫu nhiên bị thiên lệch Một ước lượng khác 2
cho sau (xem chứng minh Phần 3.A.7)
2 ˆ ˆ 2 n u
s t (3.21)
Lý chia tử số cho n – tương tự trường hợp chia chi-square cho n – 1, thảo luận Phần 2.7 n – áp dụng xi xcó điều kiện Để áp dụng chia cho n – 2, cần có hai điều kiện Phương trình (3.4) (3.5) Căn bậc hai phương sai ước lượng gọi sai số chuẩn phần dư hay sai số chuẩn hồi quy Sử dụng ước lượng này, ta tính ước lượng phương sai đồng phương sai
ˆ ˆ Căn bậc hai phương sai gọi sai số chuẩn hệ số hồi quy ký hiệu
ˆ
s s Phương sai ước lượng đồng phương sai hệ số hồi quy ước lượng ˆ
xx S s 2 ˆ ˆ
(3.22)
2 2 ˆ ˆ xx t nS X
s (3.23)
2 ˆˆ ˆ xx S X
(17)Tóm lại: Trước tiên, cần tính hệ số hồi quy ước lượng ˆ ˆ cách áp dụng
Phương trình (3.9) (3.10) Kết cho cho mối quan hệ ước lượng Y X sau tính giá trị dự báo Yt theo Yˆt ˆˆXt Từ đó, ta tính phần dư uˆ theo t Yt Yˆt Sau tính tốn ước lượng phương sai ut dựa theo Phương trình (3.21) Thay kết
quả vào Phương trình (3.18), (3.19) (3.20), ta giá trị phương sai đồng phương sai ˆ ˆ
Cần lưu ý để công thức tính phương sai phần dư s2 được cho Phương trình
3.21 có ý nghĩa, cần có điều kiện n > Khơng có giả thuyết này, phương sai ước lượng khơng xác định âm Điều kiện tổng quát phát biểu Giả thuyết 3.7, bắt buộc phải tuân theo
GIẢ THIẾT 3.7 (n > 2)
Số lượng quan sát (n) phải lớn số lượng hệ số hồi quy ước lượng (k) Trong trường hợp hồi quy tuyến tính đơn biến, điều kiện n > khơng có
Ví dụ 3.2
Sau sai số chuẩn ví dụ giá nhà, Sai số chuẩn phần dư = s = ˆ = 39,023 Sai số chuẩn ˆ sˆ 37,285
Sai số chuẩn ˆ sˆ 0,01873
Đồng phương sai ˆ ˆ sˆˆ 0,671
Thực hành máy tính Phần 3.1 Phụ chương D cho kết tương tự
Mặc dù có đại lượng đo lường số học độ xác ước lượng, tự thân đo lường không sử dụng đo lường lớn nhỏ cách tùy tiện cách đơn giản thay đổi đơn vị đo lường (xem thêm Phần 3.6) Các đo lường sử dụng chủ yếu việc kiểm định giả thuyết, đề tài thảo luận chi tiết Phần 3.5
Độ Thích Hợp Tổng Qt
Hình 3.1 cho thấy rõ khơng có đường thẳng hồn tồn “thích hợp” với liệu có nhiều giá trị dự báo đường thẳng cách xa với giá trị thực tế Để đánh giá mối quan hệ tuyến tính mơ tả giá trị quan sát có tốt mối quan hệ tuyến tính khác hay khơng, cần phải có đo lường tốn học độ thích hợp Phần phát triển thơng số đo lường
Khi thực dự báo biến phụ thuộc Y, ta có thơng tin giá trị quan sát Y có từ số phân phối xác suất, có lẽ cách tốt là ước lượng giá trị trung bình Y phương sai sử dụng ˆ2 2 1
n Y Yt Y
Nếu cần dự
(18)phương cho tất mẫu, ta tính tổng phương sai Yt so với Y
2
Y Y Đây
tổng bình phương tồn phần (TSS) Độ lệch chuẩn mẫu Y đo lường độ phân tán của Yt xung quanh giá trị trung bình Y, nói cách khác độ phân tán sai số sử
dụng Y làm biến dự báo, cho sau ˆY TSS n1
Giả sử ta cho Y có liên quan đến biến X khác theo Phương trình (3.1) Ta hy vọng biết trước giá trị X giúp dự báo Y tốt dùng Y Cụ thể là, ta có ước lượng ˆ ˆ biết giá trị X Xt, ước lượng Yt là
t
t X
Yˆ ˆˆ Sai số ước lượng uˆt Yt Yˆt Bình phương giá trị sai số tính tổng sai số cho tồn mẫu, ta có tổng bình phương sai số (ESS), hay tổng bình phương phần dư, ESS = ˆ2
t
u Sai số chuẩn phần dư ˆ ESS(n2) Giá trị đo lường độ phân tán sai số sử dụng Yˆ làm biến dự báo thường t
so sánh với ˆ cho để xem xét mức độ giảm xuống Bởi ESS Y
càng nhỏ tốt, mức độ giảm xuống nhiều Trong ví dụ đưa ra, ˆY 88,498
023 , 39 ˆ
, giảm phân nửa so với giá trị ban đầu
Phương pháp khơng hồn tồn tốt lắm, nhiên sai số chuẩn nhạy cảm đơn vị đo lường Y nên cần có thơng số đo lường khác không nhạy cảm với đơn vị đo lường Vấn đề đề cập sau
HÌNH 3.5 Các Thành Phần Y
Y
X
X ,tYt
t uˆ
X Yˆˆˆ
Y Yˆt Y
X t
Y
t X Y Yt
Thông số đo lường tổng biến thiên Yˆtso với Y (là giá trị trung bình Yˆ ) cho tồn t
mẫu Yˆt Y2 Được gọi tổng bình phương hồi quy (RSS) Phần 3.A.8 cho thấy
ˆ ˆ2
t t
t Y Y Y u
Y (3.25)
(19)Nếu mối quan hệ X Y “chặt chẽ”, điểm phân tán (Xt, Yt) nằm gần đường
thẳng ˆˆX nói cách khác ESS nhỏ RSS lớn Tỷ số
TSS ESS TSS
RSS
1
được gọi hệ số xác định đa biến ký hiệu R2 Thuật ngữ đa biến không áp dụng
hồi quy đơn biến có biến phụ độc lập X Tuy nhiên, biểu thức R2
trong hồi quy đơn biến giống hồi quy đa biến nên dùng thuật ngữ
TSS
RSS TSS ESS Y Y u R t t
ˆ
2
0 R2 1 (3.26)
Rõ ràng rằng, R2
nằm khoảng từ đến R2 khơng có thứ ngun tử số mẫu số có đơn vị Điểm quan sát gần đường thẳng ước lượng, “độ thích hợp” cao, nghĩa ESS nhỏ R2
lớn Do vậy, R2 thông số đo lường độ thích hợp, R2 càng cao tốt ESS cịn gọi biến thiên khơng giải thích uˆ ảnh t hưởng biến khác ngồi Xt khơng có mơ hình RSS biến thiên giải
thích Như vậy, TSS, tổng biến thiên Y, phân thành hai thành phần: (1) RSS, phần giải thích theo X; (2) ESS, phần khơng giải thích Giá trị R2
nhỏ nghĩa có nhiều biến thiên Y khơng thể giải thích X Ta cần phải thêm vào biến khác có ảnh hưởng đến Y
Ngoài ý nghĩa tỷ lệ tổng biến thiên Y giải thích qua mơ hình, R2 cịn có ý nghĩa khác Đó thơng số đo lường mối tương quan giá trị quan sát Yt và giá
trị dự báo ˆ( ˆ)
t tY
Y t r
Y Cần xem lại phần trình bày hệ số tương quan mẫu tổng thể
ở Phần 2.3 3.5 Phần 3.A.9 trình bày
2 2 ˆ ) ˆ ( ) ( ) ˆ ( R TSS RSS Y Var Y Var Y Y Cov r t t t t Y
Y (3.26a)
Như vậy, bình phương hệ số tương quan đơn biến giá trị quan sát Yt và giá trị dự báo
t
Yˆ bằng phương trình hồi quy cho kết với giá trị R2 định nghĩa Phương trình (3.26a) Kết trường hợp có nhiều biến giải thích, miễn là hồi quy có số hạng số
Có thắc mắc phổ biến độ thích hợp tổng thể, “bằng cách để xác định rằng R2
cao hay thấp?” Khơng có quy định chuẩn hay nhanh chóng để kết luận R2
như cao hay thấp Với chuỗi liệu theo thời gian, kết R2
thường lớn có nhiều biến theo thời gian chịu ảnh hưởng xu hướng tương quan với nhiều Do đó, giá trị quan sát R2
thường lớn 0.9 R2 bé 0.6 0.7 xem thấp Tuy nhiên, đối với liệu chéo, đại diện cho dạng yếu tố thay đổi vào thời điểm đó, R2
thường thấp Trong nhiều trường hợp, R2
(20)giá mơ hình xem dấu hệ số hồi quy có phù hợp với lý thuyết kinh tế, trực giác kinh nghiệm người nghiên cứu hay khơng
Ví dụ 3.3
Trong tập giá nhà, TSS, ESS R2
có giá trị sau (xem lại kết Phần thực hành máy tính 3.1):
TSS = 101.815 ESS = 18.274 R2 = 0,82052
Như vậy, 82,1% độ biến thiên giá nhà mẫu giải thích diện tích sử dụng tương ứng Trong chương 4, thấy thêm vào biến giải thích khác, số lượng phòng ngủ phòng tắm cải thiện độ thích hợp mơ hình
3.5 Kiểm Định Giả Thuyết Thống Kê
Như đề lúc đầu, kiểm định giả thuyết thống kê nhiệm vụ nhà kinh tế lượng Trong mơ hình hồi quy (3.1), 0, giá trị dự báo Y độc lập
với X, nghĩa X khơng có ảnh hưởng Y Do đó, cần có giả thuyết = 0, ta kỳ
vọng giả thuyết bị bác bỏ Hệ số tương quan () hai biến X Y đo lường
độ tương ứng hai biến Ước lượng mẫu cho Phương trình (2.11) Nếu
= 0, biến khơng có tương quan Do cần kiểm định giả thuyết = Phần
này thảo luận phương pháp kiểm định giả thuyết Kiểm định giả thuyết đối với p trình bày phần sau Cần lưu ý rằng, trước tiếp tục phần tiếp theo, bạn nên xem lại Phần 2.8 kiểm định giả thuyết Phần 2.7 loại phân phối
Kiểm định giả thuyết bao gồm ba bước sau: (1) thiết lập hai giả thuyết trái ngược (Giả thuyết không Giả thuyết ngược lại), (2) đưa kiểm định thống kê phân phối xác suất cho giả thuyết không, (3) đưa quy luật định để bác bỏ hay chấp nhận giả thuyết không Trong ví dụ giá nhà, Giả thuyết khơng Ho : = Bởi kỳ
vọng dương, Giả thuyết ngược lại H1: 0 Để thực kiểm định này, ˆ
sai số chuẩn ước lượng s sử dụng để đưa thống kê kiểm định Để đưa phân phối mẫu cho , mà điều ảnh hưởng gián tiếp đến số hạng sai số ngẫu nhiên u1, u2,
…un (xem Phương trình 3.15), cần bổ sung giả thuyết phân phối ut
GIẢ THIẾT 3.8 (Tính Chuẩn Tắc Sai Số)
Mọi giá trị sai số ut tuân theo phân phối chuẩn N(0, 2) , nghĩa mật độ có điều kiện Y
theo X tuân theo phân phối N( + X, 2)
Như vậy, số hạng sai số u1, u2, …un được giả định độc lập có phân phối chuẩn
giống với giá trị trung bình khơng phương sai 2
(21)BẢNG 3.2 Các Giả Thiết Mô Hình Hồi Quy Tuyến Tính Đơn Biến
3.1 Mơ hình hồi quy đường thẳng với ẩn số hệ số ; Yt = + Xt + ut, với t = 1, 2, 3…, n
3.2 Tất giá trị quan sát X khơng giống nhau; phải có giá trị khác biệt
3.3 Sai số ut biến ngẫu nhiên với trung bình khơng; nghĩa là, E(ut) =
3.4 Xt cho không ngẫu nhiên, điều ngầm định không tương quan với ut;
nghĩa Cov (Xt, ut) = E(Xtut) – E(Xt)E(ut)=
3.5 ut có phương sai khơng đổi với t; nghĩa Var(ut) = E ut2 2
3.6 ut us có phân phối độc lập t s, cho Cov(ut, us) = E(ut us)
3.7 Số lượng quan sát (n) phải lớn số lượng hệ số hồi quy ước lượng (ở n > 2)
3.8 ut tuân theo phân phối chuẩn ut ~ N(0, 2), nghĩa ứng với giá trị Xt cho trước, Yt ~ N(
+ Xt, 2)
Xác Định Trị Thống Kê Kiểm Định
Phần chứng minh kiểm định thống kê tc ˆ0 sˆ tuân theo phân phối Student
t, theo giả thuyết không, với bậc tự n – (bởi ta ước lượng hai tham số ) Lưu ý Giả thuyết 3.7 cần để chắn bậc tự dương
CHỨNG MINH (Độc giả khơng quan tâm đến nguồn gốc vấn đề, bỏ qua phần này)
Trước hết cần xem xét tính chất sau
TÍNH CHẤT 3.6
a ˆ ˆ có phân phối chuẩn
b 2 ˆ2
) (
ˆ
ut n có phân phối chi-bình phương với bậc tự n–2
c ˆ ˆ phân phối độc lập với ˆ2
Tính chất 3.6a xuất phát từ thực tế ˆ ˆ tổ hợp tuyết tính ut ut có
phân phối chuẩn Để chứng minh tính chất b c, nên tham khảo tài liệu Hogg Graig (1978, trang 296-298) Tận dụng kết qua ta
), , ( ~
ˆ
ˆ
N ˆ ~N(,2ˆ),
2
~ ˆ
2
n t
X u
trong
ˆ
ˆ
phương sai ˆ ˆ theo Phương trình (3.18) (3.19) Bằng cách
(22) ), , ( ~ ˆ ˆ ˆ N ), , ( ~ ˆ ˆ ˆ N
2 ~ ˆ 2 n X n
Trong phần 2.7, phân phối t định nghĩa tỷ số số chuẩn chuẩn hóa bậc hai chi-square độc lập với Thay vào cho áp dụng phương trình (3.18), (3.19) (3.22), ta
ˆ ˆ 2 ˆ ~ ˆ ˆ ˆ ˆ ˆ ˆ
tn
s t ˆ ˆ ˆ ˆ ˆ xx xx S S s ˆ
s sai số chuẩn ước lượng ˆ theo Phương trình (3.22)
t trình bày trị thống kê kiểm định dựa quy luật định thiết lập sau Kiểm định gọi kiểm định t Các bước kiểm định thống kê phân hai trường hợp kiểm định phía kiểm định hai phía trình bày sau
Quy Tắc Ra Quyết Định
Kiểm định t-test phía
BƯỚC H0: = 0 H1: 0
BƯỚC Kiểm định thống kê tc ˆ0 sˆ , tính dựa mẫu Theo giả
thuyết không, kiểm định thống kê có phân phối t với bậc tự n – Nếu tc
tính “lớn”, ta nghi ngờ khơng 0 Điều dẫn
đến bước
BƯỚC Trong bảng tra phân phối t trang bìa trước sách, tra bậc tự n – Và chọn mức ý nghĩa () xác định điểm t*n–2() cho P(t > t*) =
BƯỚC Bác bỏ H0 tc > t* Nếu giả thuyết ngược lại < 0 , tiêu chuẩn kiểm định
để bác bỏ H0 tc < –t*
Kiểm định minh họa hình ảnh qua Hình 3.6 (ký hiệu sử dụng để
chỉ mức ý nghĩa để tránh nhầm lẫn với tung độ) Nếu tc rơi vào diện tích in đậm
hình vẽ (được gọi vùng tới hạn) nghĩa tc >t* Trong trường hợp đó, giả thuyết khơng
(23)HÌNH 3.6 Kiểm Định Một Phía với H0: = 0 H1: 0
Chấp nhận Ho Bác bỏ Ho
Diện tích a
0 f(tn-2)
tn-2
t*n-2(a)
Ví dụ 3.4
Trong ví dụ giá nhà, ta có 0 = Do đó, tc ˆ sˆ , kiểm định thống kê đơn giản
tỷ số hệ số hồi quy ước lượng sai số chuẩn Tỷ số gọi trị thống kê t Các ước lượng ˆ 0,13875, theo ví dụ 3.2 ta biết sˆ 0,01873 Do đó, trị thống kê t tính tc = 0,13875/0,01873 = 7.41 Bậc tự n – = 14 – = 12 Cho mức ý nghĩa
là 1%, nghĩa = 1% Tra bảng phân phối t, ta t*n–2=2,681 Do tc > t*, giả thuyết
H0 bị bác bỏ kết luận lớn zero cách đáng kể với mức ý nghĩa 1%
Lưu ý hệ số có ý nghĩa trường hợp mức ý nghĩa 0,05% t*12(0,0005) = 4,318
Trị thống kê t ˆ cho tc = 52,351/37,285 = 1.404 nhỏ t*12(0,0005) =
1.782 Do khơng thể bác bỏ H0 thay vào có thể kết luận khơng
lớn zero xét mặt thống kê với mức ý nghĩa 5% Các điểm ˆ không nghĩa hai
điểm sau Thứ nhất, X = hồn tồn năm ngồi khoảng mẫu ước lượng Yˆ X
= không đáng tin cậy (xem thêm Phần 3.9) Thứ nhì, từ Hình 3.1 thấy đặc điểm hai biến khơng đầy đủ để giải thích độ biến thiên giá giá trị quan sát Trong
chương cho thấy ˆ bao hàm ảnh hưởng trung bình biến bị bỏ sót tính phi
tuyến, X Các ảnh hưởng làm cho ˆ khơng có ý nghĩa
Một Số Lưu Ý Sử Dụng Kiểm Định t-Test
Mặc dù kiểm định t-test hữu ích việc xác định ý nghĩa thống kê hệ số, nhiên dễ nhầm lẫn ý nghĩa kiểm định Ví dụ, Ví dụ 3.4 kiểm định t-test đối
với bác bỏ giả thuyết không = Như có phải kiểm định “chứng
minh” = hay khơng? Câu trả lời khơng Có thể chắn rằng, theo tập liệu
và mơ hình mơ tả, khơng có chứng cho thấy > Trong chương 4, đề
(24)tích thêm kiểm định chuẩn đoán cần thiết để đưa kết luận ý nghĩa (ổn định theo đặc điểm mô hình)
Phương Pháp p-value Kiểm Định Giả thuyết
Kiểm định t-test thực theo phương pháp khác tương đương Trước tiên tính xác suất để biến ngẫu nhiên t lớn trị quan sát tc, nghĩa
p-value = P(t>tc ) = P (sai lầm loại I)
Xác suất (được gọi p-value) phần diện tích bên phải tc phân phối t (xem Hình
3.7) xác suất sai lầm loại I – nghĩa xác suất loại bỏ giả thuyết H0 Xác suất
cao cho thấy hậu việc loại bỏ sai lầm giả thuyết H0 nghiêm trọng p-value
bé nghĩa hậu việc loại bỏ giả thuyết H0 không nghiêm trọng (nghĩa là, xác
suất xảy sai lầm loại I thấp) yên tâm bác bỏ H0 Như vậy, quy luật
quyết định không bác bỏ H0 p -value lớn, ví dụ: lớn 0,1, 0,2, 0,3 Nói cách
khác, p-value lớn mức ý nghĩa , kết luận hệ số hồi quy không lớn
0 mức ý nghĩa Nếu p-value nhỏ , giả thuyết H0 bị bác bỏ kết luận
lớn 0 cách đáng kể
Để thấy tương đương hai phương pháp, lưu ý Hình 3.7 xác suất P(t>tc ) bé mức ý nghĩa , điểm tương ứng tc phải nằm bên phải điểm t*n-2()
Nghĩa tc rơi vào miền bác bỏ Tương tự, xác suất P(t>tc ) lớn mức ý nghĩa ,
điểm tương ứng tc phải nằm bên trái điểm t*n-2() rơi vào miền chấp nhận Sau
đây bước bổ sung phương pháp p-value sau:
HÌNH 3.7 Kiểm Định Giả thuyết theo Phương Pháp p-value
Bác bỏ Ho nếu
p- value< a
0 f(tn-2)
tn-2
t* tc
BƯỚC 3a Tính xác suất (ký hiệu p-value) để t lớn tc , nghĩa tính phần diện tích
bên phải giá trị tc
BƯỚC 4a Bác bỏ H0 kết luận hệ số có ý nghĩa p-value bé mức ý nghĩa
(25)Tóm lại, xem lớn 0 cách đáng kể trị thống kê t lớn hay p-value
bé, mức độ lớn bé định người nghiên cứu Phương pháp phổ biến kiểm định giả thuyết xác định giá trị mốc t* Tuy nhiên theo hương pháp tính p-value, lại cần tính tốn phần diện tích đầu ứng với giá trị tc cho trước Ngày
có nhiều phần mềm máy tính tính tốn sẵn p-value (chương trình SHAZAM ESL giới thiệu sách này) phương pháp dễ ứng dụng dễ dàng Tuy nhiên, cần cẩn thận kiểm tra lại giá trị p-value dùng cho kiểm phía hay kiểm định hai phía
Ví dụ 3.4a
Để áp dụng phương pháp p-value cho ví dụ giá nhà, ta tính xác suất để t lớn giá trị quan sát = 7.41 Sử dụng ESL để tính tốn ta p < 0,0001 (tham khảo phần kết phần Thực hành máy tính 3.1) Điều có nghĩa là, ta bác bỏ giả thuyết khơng, cơ hội để xảy sai lầm loại I bé 0,01%, hồn tồn n tâm bác bỏ Ho
kết luận lớn Đối với tham số , p-value 0,093, nghĩa P(t>1,404) = 0,093 Nếu H0: = bị bác bỏ, xác suất để xảy sai lầm loại I 9,3%, lớn 5% Do
đó, khơng thể bác bỏ H0 mức ý nghĩa 5%, nghĩa ta có kết luận phương
pháp đầu, mức ý nghĩa 5%, không lớn zero xét mặt thống kê Như phương pháp p-value có ưu điểm là, ta biết xác mức độ mà hệ số có ý nghĩa
và đánh giá xem mức ý nghĩa đủ thấp hay không để xem xét bác bỏ H0 Cuối
cùng, không cần lo lắng giá trị 0,01, 0,05 0,1
Kiểm Định t-test Hai Phía
Bao gồm bước sau:
BƯỚC H0: = 0 H1: 0
BƯỚC Kiểm định thống kê tc ˆ0 sˆ , tính dựa mẫu Theo giả
thuyết không, kiểm định thống kê có phân phối t tn-2.
BƯỚC Trong bảng tra phân phối t trang bìa trước sách, tra bậc tự n – chọn mức ý nghĩa () xác định điểm t*n–2() cho P(t>t*) = /2 (phân
nửa mức ý nghĩa)
BƯỚC 3a Áp dụng phương pháp - value, tính giá trị p
- value = P(t > tc t < –tc ) = 2P(t > tc)
phân phối t đối xứng
BƯỚC Bác bỏ H0 tc > t* kết luận khác với 0 cách đáng kể mức ý
nghĩa
BƯỚC 4a Bác bỏ H0 p-value < , mức ý nghĩa
Kiểm định minh họa hình ảnh qua Hình 3.8 Bậc tự trường hợp này n–2 Nếu trị thống kê t (tc ) rơi vào vùng diện tích đen, giả thuyết khơng bị bác bỏ
và kết luận khác với 0 giá trị t* = sử dụng quy luật để đánh giá mức
(26)HÌNH 3.8 Kiểm Định Hai Phía với H0: = 0 H1: 0
Diện tích a/2
0 f(tn-2)
tn-2
t*n-2(a/2)
Diện tích a/2
Chấp
nhận Ho Bác bỏ Ho
Bác bỏ Ho
-t*n -2(a/2)
Ví dụ 3.5
Theo cách tính tc ví dụ giá nhà có giá trị cách tính theo t-test, ˆ 7.41và
404 ˆ
Tra bảng giá trị t, ta có * (0.005) 3.055
12
t , điều có nghĩa diện tích
phía tương ứng với giá trị 3.055 0.01 Bởi ˆthì tc>t* ta loại giả thuyết
H0và kết luận khác với mức ý nghĩa 1% Đối với ˆ t12* (0.025)2.179lớn
hơn giá trị tc Do ta khơng thể bác bỏ giả thuyết H0 (lưu ý ta dùng kiểm định
giá trị mức ý nghĩa 5%) Từ bước 3a ta suy giá trị p-value
) 404 ( ˆ P t
= 0.186 (lưu ý giá trị p-value tương ứng với tc trường hợp kiểm định
2 phía gấp lần giá trị trường hợp kiểm định phía) Do sai lầm loại I có giá trị 18.6% chấp nhận nên ta bác bỏ giả thuyết H0: = Điều
này có nghĩa khơng có ý nghĩa thống kê lại có
BÀI TẬP 3.4
Trong ví dụ giá nhà, kiểm định giả thuyết H0: = 0.1 giả thuyết H1: 0.1 lần
lượt mức ý nghĩa 0.05 0.01
BÀI TẬP 3.5
Chứng minh hệ số có ý nghĩa mức 1% hệ số có ý nghĩa mức cao
BÀI TẬP 3.6
Hãy chứng minh hệ số khơng có ý nghĩa mức 10% hệ số khơng có ý nghĩa mức ý nghĩa thấp 10%
Kiểm Định 2
Mặc dù thống kê kiểm định mức ý nghĩa phương sai sai số2không phổ biến trình bày đầy đủ phần Kiểm định 2gồm bước sau:
(27)BƯỚC Trị kiểm định
0
2
ˆ ˆ ) (
n
Qc Sau tra bảng phân phối Chi-square với
bậc tự n-2 Nếu Q có giá trị “lớn” ta nghi ngờ 2
không
0
BƯỚC Trong bảng tra phân phối Chi-square trang bìa trước sách, tra giá trị Q*n-2() cho diện tích bên phải
BƯỚC Bác bỏ H0 mức ý nghĩa Qc> Q*n-2()
Nguyên nhân tổng quát làm cho kiểm định không phổ biến người kiểm định khơng có thơng tin sơ cấp ban đầu giá trị 2sử dụng giả thuyết H
0
Kiểm Định Độ Thích Hợp
Ta thực kiểm định độ thích hợp Gọi p hệ số tương quan tổng thể X Y định nghĩa Phương trình (2.7) Theo phương trình (2.11), ta thấy giá trị ước lượng p2 xác định rxy2 Sxy2 /(SxxSyy)trong Sxx Sxy định nghĩa theo Phương
trình (3.8) (3.9),
TSS Y
Y n
Y Y
Syy t t t
2
2
)
( (3.27)
Ở Phần 3.A.10 người ta chứng minh r2
xy với R2 (điều
trường hợp hồi qui đơn biến mà thôi) Ở Phần kiểm định giả thuyết 2.8 trình bày phương pháp kiểm định giả thuyết cho X Y khơng có mối tương quan Kiểm định gọi kiểm định F (F-test) Kiểm định F-test gồm bước sau:
BƯỚC H0: xy = H1: xy
BƯỚC Trị thống kê kiểm định Fc = R2(n – 2)/(1 – R2) Fc tính
theo cơng thức sau Fc = RSS(n – 2)/ESS Theo giả thuyết H0, trị thống kê
tuân theo phân phối F với bậc tự tử số n – bậc tự mẫu số
BƯỚC Tra bảng F theo bậc tự tử số n – bậc tự mẫu số tìm giá trị F* 1, n – 2
() cho phần diện tích phía phải F* , mức ý nghĩa BƯỚC Bác bỏ giả thuyết H0 (tại mức ý nghĩa ) Fc > F*
Nên lưu ý giả thuyết H0 khơng hợp lệ có nhiều giá trị X Như
trình bày chương 4, kiểm định F sử dụng H0 khác
Ví dụ 3.6
Trong ví dụ giá nhà, R2
= 0,82052 Fc = 0,82052(14 – 2)/(1 – 0,82052) = 54,86 Theo ví dụ
3.5, ESS = 18.274, RSS = TSS – ESS = 83.541 Vì Fc cịn tính theo cơng
thức khác bước 2: Fc = 83.541 (14 – 2)/18.274 = 54,86 Bậc tự tử số 1,
mẫu số 12 Với mức ý nghĩa = 5%, tra bảng A.4b ta F*1, 12(0.05) = 4,75 Vì Fc >
(28)Thực ra, Fc > F*1, 12(0.01) (tra bảng A.4a), giả thuyết H0 bị bác bỏ mức ý nghĩa
1% Như vậy, giá trị R2
nhỏ 1, khác đáng kể
Trình Bày Các Kết Quả Hồi Quy
Các kết phân tích hồi quy trình bày theo nhiều cách Theo cách thơng thường, người ta viết phương trình ước lượng kèm với trị thống kê t hệ số hồi quy sau:
SQFT 13875 , 351 , 52
GIAÙ
(1,404) (7,41)
821
2
R df 12 ˆ 39.023
Một cách khác điền sai số chuẩn hệ số hồi quy:
SQFT 13875 , 351 , 52
GIAÙ
(37.29) (0.019)
Nếu nhiều mơ hình hồi quy ước lượng, việc trình bày kết dạng bảng Bảng 4.2 thuận tiện
Việc tách tổng bình phương tồn phần thành thành phần thường tóm tắt dạng bảng Phân Tích Phương Sai (ANOVA) Bảng 3.3
3.6 Thang Đo Đơn Vị Đo
Giả sử tính GIÁ theo đơn vị đồng đơla thay theo ngàn đồng đôla Cột GIÁ bảng 3.1 chứa giá trị 199.900, 228.000, v.v Những ước lượng hệ số hồi quy, các sai số chuẩn chúng, R2, v.v bị ảnh hưởng thay đổi đơn vị này?
Câu hỏi khảo sát GIÁ SQFT tính đơn vị khác Đầu tiên chạy lại mơ hình
GIÁ = + SQFT + u
Gọi GIÁ*
giá tính theo la thường Như GIÁ* = 1.000 GIÁ Nhân số hạng
trong phương trình với 1.000 thay GIÁ* vào vế trái Chúng ta có
GIÁ* = 1.000 + 1.000SQFT + 1.000u = GIÁ* = * + *SQFT + u*
Nếu áp dụng phương pháp OLS cho phương trình cực tiểu hóa (u*t)2,
chúng ta tìm giá trị ước lượng *
* Dễ dàng nhận thấy hệ số hồi quy hệ số cũ nhân với 1,000 Như vậy, thay đổi thang đo biến phụ thuộc mơ hình hồi quy làm cho thang đo hệ số hồi quy thay đổi theo tương ứng Vì u* = 1,000u, phần dư sai số chuẩn nhân lên 1.000 Tổng bình phương nhân thêm triệu (1.000 bình phương) Cần lưu ý trị thống kê t, F, R2
(29)BẢNG 3.3 Phân Tích Phương Sai
Nguồn Tổng bình phương
(SS)
Bậc tự (d.f.)
Bình phương trung bình
(SSd.f.)
F
Hồi quy (RSS)
) ˆ (Yt Y
= 83.541 83.541 5486
ESS n RSS
, ) (
Sai số (ESS) ˆ2
t
u = 18.274 N – = 12 1.523
Tổng (TSS)
) (Yt Y
= 101.815 N – = 13 7.832
Tác động việc thay đổi thang đo biến độc lập sao? Giả sử SQFT tính theo đơn vị trăm mét vng thay theo mét vng thơng thường, GIÁ tính theo đơn vị ngàn đơla trước Gọi SQFT’ biến tính theo trăm mét vng Vậy SQFT= 100SQFT’ Thay vào phương trình ban đầu ta có:
GIÁ = + 100SQFT’ + u
Rõ ràng theo phương trình này, hồi quy GIÁ theo số SQFT’, hệ số bị ảnh hưởng hệ số SQFT Nếu ’ hệ số SQFT’, ˆ'100ˆ Sai số chuẩn nhân với 100 Tuy nhiên, tất số đo khác – ESS, giá trị thống kê t, F, R2
chẳng hạn khơng bị ảnh hưởng Tóm lại, mơ hình hồi quy tuyến tính, thang đo biến độc lập thay đổi hệ số hồi quy sai số chuẩn tương ứng thay đổi tương ứng trị thống kê khác không thay đổi
Có lý đáng để thay đổi thang đo giá trị cho số sau thay đổi không lớn không nhỏ tương tự với giá trị biến khác Điều số có giá trị lớn lấn át sai số số nhỏ gây sai số làm tròn, đặc biệt tính giá trị tổng bình phương, việc làm ảnh hưởng xấu đến độ xác kết
Để hiểu cách thực tế hậu việc thay đổi đơn vị, Thực Hành Máy Tính phần 3.2 phụ lục D
BÀI TẬP 3.7
Giả sử đặt biến X*
= SQFT – 1.000 (nghĩa là, X* phần diện tích vng
trên 1.000) ước lượng mơ hình GIÁ = a + bX*
+ v Giải thích cách bạn có thể tìm aˆ bˆ từ ˆ ˆ mà khơng phải ước lượng lại mơ hình
3.7 Ứng dụng: Ước Lượng Đường Engel Biểu Diễn Quan Hệ Giữa Chi Tiêu cho Chăm Sóc Sức Khỏe Thu Nhập
(30)EXPHLTH = Chi tiêu tổng hợp (đơn vị tỷ đôla) cho chăm sóc sức khỏe bang vào năm 1993, Bảng 153, trang 111, khoảng từ 0,998-9,029
INCOME = Thu nhập cá nhân (đơn vị tỷ đôla) bang vào năm 1993, Bảng 712, trang 460, khoảng từ 9,3-64,1
Mơ hình đường Engel tìm ví dụ 1.4 áp dụng với tổng chi tiêu cho chăm sóc sức khỏe Mỹ hàm số theo tổng thu nhập cá nhân Phần Ứng Dụng Máy Tính 3.3 (xem phụ lục bảng D.1) trình bày hướng dẫn để tìm kết Bản thích báo cáo in từ máy tính, sử dụng chương trình ESL tập tin PS3-3.ESL, trình bày bảng 3.4 Phần in đậm nhập lượng chương trình phần in nghiêng nhận xét kết Bạn nên tìm hiểu thích cẩn thận sử dụng chương trình hồi quy bạn có để chạy lại kết (tập tin PS3-3.SHZ chứa dòng lệnh để sử dụng phần mềm SHAZAM) Dưới mơ hình ước lượng với trị thống kê mẫu t ngoặc đơn, p-value (giá trị xác suất p) ngoặc vuông:
INCOME 141652
, 176496 ,
0
EXPHLTH
(0.378) (49.272)
[0.707] [<0.0001]
R2 = 0,98 d.f = 49 F = 2.428 ˆ = 2,547
Mơ hình thích hợp với số liệu 98% biến đổi chi tiêu cho chăm sóc sức khỏe giải thích biến thu nhập Như giải thích Bảng 3.3, số hạng số khơng có ý nghĩa mặt thống kê phù hợp với tiêu chuẩn lý thuyết đề ví dụ 1.4, = Để biết thêm chi tiết, xem thích Bảng 3.4
3.8 Khoảng Tin Cậy
Như Phần 2.9, cách để xem xét trực tiếp đến việc ước lượng điều kiện không chắn xác định khoảng tin cậy Như vậy, ví dụ, thay nói ˆ =
0,139 nói với mức xác suất cho trước, ^ nằm khoảng từ 0,09 đến 0,17 Từ kết giá trị thống kê kiểm định phần 3.5 ta có:
2
~ ˆ
n t s
ˆ ~tn2 s
Đặt t*
n-2(0,025) điểm name phân phối t với n-2 bậc tự cho P(t>t*) = 0,025
Điều tương đương với P(- t*
t t*) = 0,95 Như vậy,
BẢNG 3.4 Báo Cáo từ Máy Tính Kèm Theo Chú Giải cho Phần 3.7 Các lệnh ESL in đậm nhận xét in nghiêng
Danh sách biến
(0) Hằng số (1) exphlth (2) income
(31)EXPHLTH
94,178 | o |
|
78,648 +
| |
| o |
52,764 +
| o | o
| o | o o 26,881 + o
| o o | o
| o ooo | oooo o
0,998 + ooo
| +++++++
9,3 income 683,5
Ước lượng OLS với 51 quan sát 1-51 Biến phụ thuộc EXPHLTH
Biến Hệ số Sai số chuẩn T-stat Prob(t >T)
(0) 0,176496 0,467509 0,377525 0,707414
(1) income 0,141652 0,002875 49,271792 <0,0001***
Giá trị ước lượng hệ số biến thu nhập ˆ = 0,141652 ước lượng số hạng
hằng số ˆ = 0,176496 Trị thống kê t (hệ số chia cho sai số chuẩn) biến thu nhập
49,271792, giá trị ý nghĩa 2Prob(t >T) vùng diện tích hai đầu phân phối t chặn giá trị kiểm định t giá trị p-value xác suất sai lầm loại I (đối với kiểm định phía) Nếu p-value nhỏ (trong trường hợp này, nhỏ 0,0001), “an toàn” khi bác bỏ giả thuyết Ho = 0, kết luận hệ số biến thu nhập khác đáng kể Giá trị p-value số hạng số 0,707414 gợi ý bác bỏ
giả thuyết Ho cho = 0, phạm phải sai lầm loại I 70,7 % số lần
Vì mức sai lầm cao, bác bỏ giả thuyết Ho Như kết luận số hạng số không khác đáng kể Lưu ý ví dụ 1.4, việc suy diễn lý thuyết đường Engel ám khơng có số hạng số Số hạng số khơng có ý nghĩa phù hợp với kết theo lý thuyết Xu hướng chi tiêu cận biên cho việc chăm sóc sức khỏe lấy từ thu nhập 0,141652; nghĩa là, với khoản tăng thu nhập 100 đơla, chúng ta kỳ vọng cá nhân chi trung bình 14,17 đơla cho chăm sóc sức khỏe
Giá trị R2 (R-square) 98% biến đổi chi tiêu giải thích biến
thu nhập Sự khác giá trị R2
(32)Giá trị thống kê mẫu Durbin-Watson hệ số tương quan chuỗi bậc giải thích chương 9, nhằm giải vi phạm giả thiết 3.6 cho số hạng sai số
hai quan sát không tương quan Giá trị trung bình biến phụ thuộc Y S.D độ
lệch chuẩn Sy
Giá trị trung bình biến phụ thuộc
15,068863 S.D biến phụ thuộc 17,926636
Tổng bình phương sai số (ESS)
317,898611 Sai số chuẩn phần dư 2,547102
R- bình phươngkhơng hiệu chỉnh
0,980 R- hiệu chỉnh 0,980
Trị thống kê F 2427,709468 p-value =
Prob(F>2427.709)
<0,0001
Trị thống kê Durbin-Watson
2,209485 Hệ số tự tương quan bậc
nhất
-0,121
Giá trị thống kê mẫu để chọn mơ hình
SGMASQ HQ GCV
6,487727 6,939901 6,752532
AIC
SCHWARZ RICE
6,741876 7,272471 6,7638
FPE SHIBATA
6,742147 6,722193
?genr ut=uhat (lưu ước lượng phần dư máy vào ut.) Generated var no (ut)
?genr =exphlth-ut (giá trị “thích hợp” = exphlth quan sát trừ phần dư)
Generated var no (yhat)
?print –o exphlth yhat ut; (In giá trị chi tiêu thực dự báo, giá trị phần dư Dấu hiệu –o chỉ in dạng bảng)
Obs exphlth yhat ut
1 0,998 1,493862 -0,49586172
2 1,499 1,763001 -0,26400087
3 4,285 2,598749 1,686251
4 1,573 2,131297 -0,55829655
5 2,021 1,720505 0,30049479
6 2,26 2,343775 -0,08377483
7 1,953 1,989644 -0,03664435
8 2,103 2,244618 -0,1416183
9 3,428 3,179523 0,24847729
10 2,277 2,910384 -0,63338356
11 3,452 3,731965 -0,27996523
12 3,485 4,057766 -0,57276526
13 3,433 3,476992 -0,0439923
14 3,747 4,652705 -0,90570543
15 4,4 4,666871 -0,26687065
(33)17 5,197 4,341071 0,85592937
18 4,118 4,426062 -0,30806194
19 6,111 5,672601 0,43839884
20 6,903 7,301601 -0,39850129
21 6,187 5,686766 0,50023362
22 7,341 7,485749 -0,14474913
23 7,999 8,533975 -0,53497529
24 8,041 7,967367 0,07353344
25 12,216 13,250993 -1,034993
26 10,066 11,027054 -0,96105374
27 9,029 8,84561 0,1833899
28 10,384 9,256401 1,127599
29 10,635 10,276297 0,35870284
30 12,06 10,318793 1,741207
31 13,014 10,276297 2,737703
32 14,194 13,619289 0,57471128
33 15,154 16,96228 -1,80828
34 14,502 14,32755 0,17445035
35 16,203 13,477637 2,725363
36 15,949 14,68168 1,26732
37 15,129 16,395672 -1,256672
38 16,401 15,701576 0,69942416
39 23,421 20,985202 2,435798
40 6,682 20,036133 -13,354133
41 20,104 19,002072 1,101928
42 18,241 18,56295 -0,32194997
43 25,741 30,093438 -4,352438
44 27,136 27,756177 -0,62017675
45 33,456 31,042507 2,413493
46 34,747 37,516012 -2,769012
47 41,521 36,439456 5,081544
48 44,811 40,320726 4,490274
49 49,816 49,0465 0,7694999
50 67,033 64,004971 3,028029
51 94,178 96,995765 -2,817765
s t s
t P t
s t
P( * ˆ *)0.95 (ˆ * ˆ *
Từ rút khoảng tin cậy 95% ˆt*svà ˆt*s
Ví dụ 3.7
Trong ví dụ giá nhà, sai số chuẩn ˆ ˆ
ˆ
s = 37,285 sˆ= 0,18373 Đồng thời, từ bảng t, ta có t*
(34)Đối với : 52,351 (2,179x37,285) = (-28,893; 133,595)
Đối với : 0,13875 (2,179x0,018373) = (0,099; 0,179)
Lưu ý khoảng tin cậy tương đối rộng Đây dấu hiệu cho thấy mơ hình hồi quy tuyến tính thích hợp với tập liệu Một mơ hình hồi quy thích hợp cho khoảng tin cậy hẹp
BÀI TẬP 3.8
Xác định khoảng tin cậy Phần Ứng Dụng 3.7
3.9 Dự Báo
Như đề cập trước đây, ứng dụng phổ biến mơ hình hồi quy để dự báo (chủ đề thảo luận chi tiết chương 11) Trong ví dụ giá nhà, đặt câu hỏi giá bán dự báo ngơi nhà có diện tích 2,000 mét vng Mơ hình hồi quy ước lượng Yˆ 52.3510.13875X Như vậy, X = 2,000, giá trị dự báo củaY 52,351 + (2,000x0,13875) = 329,851 Vì giá tính theo đơn vị ngàn đơla, giá trị dự báo có đơn vị ngàn đơla Vì vậy, theo mơ hình, giá trung bình ước lượng hộ diện tích 2,000 mét vng 329.851 đôla Một cách tổng quát, dễ dàng nhận thấy X có giá trị X0 giá trị dự báo Y0 Yˆ0 ˆˆX0 Giá trị trung
bình có điều kiện biến dự đốn Y cho trước X = X0
) (
) ˆ ( )
ˆ ( ) ˆ
(Y X X0 E X0E X0 E Y X X0
E
Như Y giá trị dự báo có điều kiện khơng thiên lệch giá bán trung bình Xˆ0 0
Khoảng Tin Cậy cho Giá Trị Dự Báo Trung Bình
Vì ước lượng có sai số, giá trị dự báo Y chịu sai số Để xét đến yếu tố ˆ0 này, tính sai số chuẩn khoảng tin cậy cho giá trị dự báo trung bình Dưới ước lượng phương sai giá trị dự báo (xem chứng minh Phần 3.A.11 )
xx Y
S X X n s
2
2 ˆ ( )
0 (3.28)
Khoảng tin cậy giá trị dự báo trung bình
] ˆ
, ˆ
[
0
0 ˆ
* ˆ *
0 t sY Y t sY
Y
trong t*
giá trị ngưỡng phân phối t Lưu ý X0 lệch xa giá trị trung
bình X ,
0 ˆ
Y
s lớn khoảng tin cậy tương ứng rộng Điều có nghĩa
(35)Nếu X0 = X , khoảng tin cậy hẹp Hình 3.9 cho ý niệm “dải tin cậy” với giá
trị X0
HÌNH 3.9 Dải Khoảng Tin Cậy Các Giá Trị Dự Báo
Khoảng Tin Cậy cho Dự Báo Điểm
Phương sai mẫu trình bày phần trước dùng để dự báo giá trị trung bình Bên cạnh chúng ta muốn tìm phương sai sai số dự báo cho giá trị thực Y0 tương ứng với
X0 Công thức lấy từ Phụ lục 3.A.12:
2 ˆ 2
0
ˆ
0
) (
1 ˆ ) ˆ (
Y xx
u s
S X X n u
Var
s
(3.29)
trong uˆ0 Y0 Yˆ0 sai số dự báo điểm Khoảng tin cậy tính theo
0 ˆu
s thay
0 ˆ
Y
s Khi cỡ mẫu lớn, số hạng thứ hai thứ ba không đáng kể so với
0 ˆu
s giá
trị gần ˆ Ngoài ra, t*
gần trường hợp mức ý nghĩa 95% Như vậy, khoảng tin cậy mẫu có kích thước lớn Yˆ02ˆ
Ví dụ 3.8
Trong ví dụ giá nhà, có
ˆ
Y
s = 111,555 2ˆ
0
u
s =1634,353 khoảng tin cậy tương ứng X0 = 2.000 (307, 353) (242, 418) Khoảng tin cậy với cỡ mẫu lớn
(252,408) (Xem phần Thực Hành Máy Tính 3.4 để chạy lại kết này)
(36)khoảng tin cậy theo phương trình rộng nhiều khoảng tin cậy dựa phương trình (3.28)
So Sánh Các Giá Trị Dự Báo
Các nhà phân tích kinh tế kinh doanh thường sử dụng nhiều mơ hình để dự báo Một số đo thường dùng để so sánh lực dự báo mơ hình khác sai số bình phương trung bình (hoặc đơi người ta sử dụng bậc hai nó, gọi bậc hai sai số bình phương trung bình)
Gọi Yf
t giá trị dự báo biến phụ thuộc cho quan sát t, Yt giá trị thực Sai số bình
phương trung bình tính sau:
2 n
Y Y
MSE tf t
( ) RMSE MSE
Nếu hai mơ hình sử dụng để dự báo Y, mơ hình có MSE nhỏ đánh giá mơ hình tốt cho mục đích dự báo
Một số đo hữu ích khác sai số phần trăm tuyệt đối trung bình (MAPE)
t f t t
Y Y Y 100 n
1 MAPE
Số đo có ý nghĩa tất giá trị Y dương (xem Phần Ứng Dụng 3.11) Một cách khác, tính sai số phần trăm bình phương trung bình (MSPE)
2
t f t t
Y Y Y 100 n
1
MSPE RMSPE MSPE
Một phương pháp khác để đánh giá mơ hình lực dự báo thực dự báo hậu mẫu Theo phương pháp này, người phân tích khơng sử dụng số quan sát cuối (chẳng hạn, 10% số quan sát cuối cùng) việc ước lượng mơ hình, sử dụng ước lượng thông số từ tập quan sát để dự báo Yt cho phần mẫu để dành
Sau tính MSE MAPE cho giai đoạn hậu mẫu Mơ hình có giá trị đo lường thấp tốt cho mục đích dự báo
3.10 Tính Nhân Quả Mơ Hình Hồi Quy
Khi định mơ hình dạng Y = + X + u, ngầm giả định X gây Y Mặc dù
R2 đo độ thích hợp, khơng thể sử dụng để xác định tính nhân Nói cách khác,
(37)tạo Lấy ví dụ khác thực tế hơn, giả sử hồi quy số lượng vụ trộm thành phố với số hạng số số nhân viên cảnh sát (X) sau quan sát thấy hệ số góc ước lượng có giá trị dương, có nghĩa có tương quan thuận X Y Phải điều có nghĩa việc tăng số lượng cảnh sát làm tăng số vụ trộm, ngầm kéo theo phải có sách giảm lực lượng cảnh sát? Rõ ràng kết luận khơng thể chấp nhận Điều xảy mối quan hệ nhân ngược lại, có nghĩa thành phố nên thuê thêm cảnh sát số vụ trộm tăng lên, việc hồi quy X theo Y hợp lý Tuy nhiên, thực tế, hai biến xác định kết hợp nên định rõ hai phương trình, với Y theo X biến khác phương trình cịn lại với X theo Y các biến khác Việc xác định đồng thời biến trình bày chi tiết chương 13 Như thấy chương ước lượng thu cách bỏ qua tính đồng thời bị sai lệch và khơng quán Cũng tương quan cao quan sát X Y hồn tồn biến khác khơng biến số chúng trực tiếp gây biến cịn lại Những ví dụ nhấn mạnh tầm quan trọng việc cân nhắc kỹ lưỡng chất chế hành vi tiềm ẩn gì, tức là, trình phát liệu (DGP), lập mơ hình cách phù hợp Lý thuyết kinh tế, kiến thức nhà phân tích hành vị tiềm ẩn, kinh nghiệm khứ, v.v phải gợi ý mơ hình nên phải xác định Tuy nhiên, kiểm định phương hướng nhân cách rõ ràng (chi tiết trình bày chương 10) Độc giả quan tâm đến vấn đề tham khảo viết Granger (1969) Sims (1972)
Để minh họa tầm quan trọng việc xác định xác nhân quả, giả sử đảo ngược vị trí X Y ước lượng mơ hình:
Xt = * + *Yt + vt (3.1’)
Liệu tìm đường thẳng giống trước khơng? Câu trả lời, nói chung, khơng Vì thủ tục bình phương nhỏ áp dụng cho phương trình (3.1) cực tiểu hóa tổng bình phương độ lệch đứng từ đường thẳng (xem hình 3.10) Trái lại, đường thẳng nghịch cực tiểu hóa tổng bình phương độ lệch ngang vt Tìm Yt theo Xt,
Phương trình (3.1’) viết lại sau:
' ' ' * *
* *
1
t t t
t
t X v
v X
Y
Việc cực tiểu hóa ˆ2
t
u , làm tương tự với phương trình (3.1), cực tiểu hóa vˆt2sẽ thường cho kết khác Cụ thể hơn, giá trị ước lượng ’ khác với giá trị
(38)HÌNH 3.10 Cực Tiểu Hóa Tổng Bình Phương theo Trục Tung Trục Hồnh
Ví dụ 3.9
Quan hệ ước lượng ˆ2
t
u cực tiểu hóa (xem Phần Thực Hành Máy Tính 3.5)
SQFT 13875 351 52
GIAÙ , ,
Khi quan hệ nhân đảo ngược ˆ2
t
v cực tiểu hóa, có
GIÁ 913666
385 33
SQFT , ,
Nghịch đảo quan hệ ước lượng thứ hai biểu diễn GIÁ hàm SQFT, ta có
SQFT 169 645 SQFT 913666
5 913666
385 33
GIAÙ
Lưu ý dấu số hạng số bị nghịch đảo độ dốc hoàn tồn khác
Như điều kiện hai đường ước lượng nhau? Để trả lời câu hỏi này, áp dụng OLS cho phương trình (3.1’); nghĩa cực tiểu hóaˆ2
t
v Hoán đổi X Y
trong phương trình 3.10, ta có:
' *
ˆ ˆ
yy xy
(39)Và ˆ' S /yy Sxy Ước lượng bình phương nhỏ làm cực tiểu u ˆt2 ˆ S /xy Sxx Để ˆ'bằngˆ , điều kiện
1
2
yy xx
xy
xy yy
xx xy
S S
S hoặc S
S
S S
Nhưng vế trái phương trình thứ hai rxy2, bình phương hệ số hồi quy đơn X
và Y (định nghĩa phương trình 2.11) Như vậy, điều kiện cần X Y phải tương quan hoàn hảo Tính chất 2.4d nói tồn tương quan hồn hảo hai biến, phải tồn quan hệ tuyến tính xác chúng Vì vậy, thích hợp X Y phải hồn hảo nhận đường hồi quy cho dù áp dụng OLS cho phương trình (3.1) hay (3.1’) Nhìn chung, tương quan X Y khơng hồn hảo, khơng nhận đường thẳng hồi quy Điều nhấn mạnh tầm quan trọng việc xác định hướng quan hệ nhân thay việc chọn thiếu suy xét biến X Y
Như minh họa trước ví dụ tội phạm, quan hệ nhân theo hai chiều, tình gọi phản hồi Quan hệ giá bán lượng bán ví dụ tượng Vì giá lượng bán xác định lúc quan hệ tương tác cung cầu, ảnh hưởng Tương tự, tượng phản hồi tìm thấy quan hệ thu nhập tổng hợp tiêu dùng hay đầu tư Những tình trình bày chủ đề mơ hình hồi quy hệ phương trình chương 13
3.11 Ứng Dụng: Quan Hệ Bằng Sáng Chế Chi Phí cho Hoạt Động Nghiên Cứu Phát Triển (R&D)
Phần trình bày ví dụ “diễn tập” khác phân tích hồi quy Dữ liệu dùng ví dụ tập tin DATA3.3, mà đề cập đến biến sau:
PATENTS = Số ứng dụng sáng chế ghi nhận, đơn vị ngàn, giao động từ 84,5 - 189,4
R&D = Chi phí cho nghiên cứu phát triển, đơn vị tỉ đôla 1992, xác định
tỉ số chi phí theo đơla hành số giảm phát tổng sản phẩm quốc nội gộp (GDP), giao động từ 57,94 đến 166,7
Dữ liệu theo năm lấy vòng 34 năm từ 1960 đến 1993 cho tồn nước Mỹ Nguồn trình bày phụ lục D
(40)Mơ hình hồi quy tuyến tính ước lượng trình bày kèm với trị thống kê mẫu t ngoặc đơn (Phần Thực Hành Máy Tính 3.6 hướng dẫn cách lập lại kết phần Bảng 3.5 trình bày kết quả.)
D R 792 571 34
SÁNGCHẾ , , &
(5,44) (13,97)
R2 = 0,859 d.f = 32
Fc (1,32) =195,055 ˆ 11,172
Để kiểm định mô hình ý nghĩa tổng thể, sử dụng trị thống kê F, có giá trị bằng 195,055 Theo giả thuyết H0 số sáng chế chi phí cho R&D khơng tương
quan, Fc tuân theo phân phối F với bậc tự tử số bậc tự mẫu số 32 (= 34 –
2) Từ bảng A.4a (cũng bìa sau) có nhận xét giá trị ngưỡng F(1,32) mức ý nghĩa 1% nằm 7,31 7,56 Vì Fc cao nhiều so với giá trị này, kết
luận số sáng chế chi phí cho R&D tương quan đáng kể Kết luận cố thêm thông qua giá trị thống kê mẫu t Kiểm định hai đầu với mức ý nghĩa 1%, bảng t bìa trước sách (hay Bảng A.2) cho thấy giá trị ngưỡng với 32 bậc tự nằm 2,704 2,75 Vì giá trị quan sát tc cao giá trị nhiều kết
luận số hạng tung độ gốc độ dốc có giá trị khác cách đáng kể Số đo độ thích hợp R2
cho biết mơ hình giải thích 85,9% biến đổi biến phụ thuộc Mặc dù dường thích hợp tốt, nhiên thấy từ hình 3.11 mơ hình khơng hồn tồn thể biến đổi thực tế số sách chế Đường thẳng hồi quy đường liền khơng đại diện đầy đủ chất đường cong liệu quan sát Chính điều mơ hình dự báo số lượng sáng chế nhiều năm
Điểm nêu rõ Bảng 3.5, bảng có nhiều trị thống kê hữu ích khác Cột thứ tư giá trị trung bình ước lượng Yˆt , cột năm giá trị phần dư tính giá trị quan sát trừ giá trị trung bình ước lượng uˆt YtYˆt cột cuối sai số phần trăm tuyệt đối (APE), tính 100u /ˆt Yt Giá trị dự báo trình bày bảng 3.5 làm tròn đến chữ số thập phân Vì liệu gốc số sáng chế có số thập phân, nên việc cố gắng có giá trị dự báo có độ xác đến số thập phân khơng có ý nghĩa
HÌNH 3.11 Số Bằng Sáng Chế Theo Chi Phí cho R&D Nước Mỹ
Số sáng chế (ngàn)
(41)BẢNG 3.5 Báo Cáo Máy Tính có Chú Thích cho Phần Ưng Dụng Phần 3.11
Các lệnh ELS in đậm lời nhận xét in nghiêng Danh sách biến
(0) Hằng số (1) Năm (2) R&D (3) PATENTS (SÁNG CHẾ)
Thời đoạn: 1, quan sát lớn nhất: 34, phạm vi quan sát: suốt 1960-1993, hành 1960-1993 (Ước lượng mơ hình theo OLS)
Ước lượng theo OLS sử dụng 34 quan sát từ 1960-1993 Biến phụ thuộc – PATENTS
Biến Hệ số Sai số chuẩn T stat 2Prob(t > T)
(0) Hằng (2) R&D
34,571064 0,791935
6,357873 0,056704
5,437521 13,966211
< 0,0001*** < 0,0001*** Giá trị trung bình
biến phụ thuộc
119,238235 S.D biến phụ thuộc
29,305827
Tổng bình phương sai số (ESS)
3994,300257 Sai số chuẩn phần dư
11,172371
R-bình phương khơng hiệu chỉnh
0,859 R- bình phương hiệu chỉnh
0,855
Trị thống kê F 195,055061 p-value =
Prob(F>2427.709)
<0,0001
Trị Durbin-Watson 0,233951 Hệ số tự tương quan
bậc
0,945
Các giá trị thống kê để chọn mơ hình
SGMASQ HQ GCV
124,821883 136,255226 132,623251
AIC
SCHWARZ RICE
132,146377 144,560215 133,143342
FPE SHIBATA
132,164347 131,300527
?genr ut=uhat (lưu ước lượng phần dư ) ?genr temp = PATENTS -ut (tính giá trị “gắn”)
genr fitted = int (0.5+ (10*temp))/10 (làm tròn đến số thập phân) ?genr error = PATENTS – fitted (tính sai số dự báo)
?genr abspcerr = int (0.5 + (1000*abs(error)/PATENTS))/100 (tính sai số % tuyệt đối
làm tròn đến hai chữ số thập phân)
?print –o R&D PATENTS fitted error abspcerr; (in giá trị dạng bảng)
OBS R&D Patens Fited Error ABSPCERR
1960 57,94 84,5 80,5 4,0 4,73
1961 60,59 S6,2 82,6 5,6 6,35
1962 64,44 90,4 85,6 4,8 5,31
1963 70,66 91,1 90,5 0,6 0,66
(42)1965 80,00 100,4 97,9 2,5 2,49
1966 84,82 93,5 101,7 -8,2 8,77
1967 86,84 93,0 103,3 -10,3 11,08
1968 88,81 98,7 104,9 -6,2 6,28
1969 88,28 104,4 104,5 -0,1 0,10
1970 85,29 109,4 102,1 7,3 6,67
1971 83,18 111,1 100,4 10,7 9,63
1972 85,07 105,3 101,9 3,4 3,23
1973 86,72 109,6 103,2 6,4 5,84
1974 85,45 107,4 102,2 5,2 4,84
1975 83,41 108,0 100,6 7,4 6,85
1976 87,44 110,0 103,8 6,2 5,64
1977 90,11 109,0 105,9 3,1 2,84
1978 94,50 109,3 109,4 -0,1 0,09
1979 99,28 108,9 113,2 -4,3 3,95
1980 103,64 113,0 116,6 -3,5 3,19
1981 108,77 114,5 120,7 -6,2 5,41
1982 113,96 118,4 124,8 -6,4 5,41
1983 121,72 112,4 131,0 -18,5 16,55
1984 133,33 120,6 140,2 -19,6 -16,25
1985 144,78 127,1 149,2 -22,1 17,39
1986 148,39 133,0 152,1 -19,1 14,36
1987 150,90 139,8 154,1 -14,3 10,23
1988 154,36 151,9 156,8 -4,9 3,23
1989 157,19 166,3 159,1 7,2 4,33
1990 161,86 176,7 162,8 13,9 7,87
1991 164,54 178,4 164,9 13,5 7,57
1992 166,70 187,2 166,6 20,6 11,00
1993 165,20 189,4 155,4 24,0 12,67
Nhiều giá trị APE lớn 5%, số năm chúng vượt qua 10%, tỉ lệ lớn Chúng ta quan sát thấy điểm phân tán co cụm lại với năm từ 1966-1977, yếu tố khác chi phí R&D gây thay đổi số sáng chế Do đó, quan sát kỹ kết cho thấy xác định sai mơ hình Trong chương 6, dùng tập liệu để ước lượng mơ hình đường cong xem xét xem liệu việc xác định tốt biến đổi quan sát số sáng chế khơng
TĨM TẮT
Mặc dù mơ hình hồi quy tuyến tính đơn hai biến sử dụng chương này, hầu hết khía cạnh việc tiến hành phân tích thực nghiệm đề cập Thật hữu ích tóm tắt lại kết thảo luận từ đầu đến
Một mơ hình hồi quy tuyến tính đơn Yt = + Xt + ut (t = 1, 2, …, n) Xt Yt quan
sát thứ t biến độc lập biến phụ thuộc, thông số tổng thể không biết ước lượng từ liệu X Y, ut số hạng sai số không quan sát được,
đây biến ngẫu nhiên với tính chất đề cập đây, n tổng số quan sát Độ dốc () diễn dịch ảnh hưởng cận biên tăng đơn vị giá trị Xt lên Yt , + Xt trị trung bình có điều kiện Y cho trước X = Xt
Thủ tục bình phương nhỏ thơng thường (OLS) cực tiểu hóa tổng bình phương sai số
t
(43)Yêu cầu để thực việc ước lượng thông số theo OLS n có giá trị nhỏ giá trị X khác – nghĩa là, tất giá trị X
Nếu ut biến ngẫu nhiên có giá trị trung bình 0, Xt cho trước không ngẫu
nhiên, E(ut) = E(Xtut) = Các phương trình chuẩn uˆt 0 Xtuˆt 0 Lời giải phương trình cho kết ước lượng theo OLS
Dưới giả định vừa nêu ra, ước lượng theo OLS không thiên lệch quán Sự quán giữ nguyên Xt ngẫu nhiên, miễn Cov(X, u) = <
Var(X) < - nghĩa là, miễn X u không tương quan X không số
Nếu giá trị u tuân theo phân phối độc lập tương tự (iid) với phương sai xác định, ˆ ˆ ước lượng không thiên lệch tuyến tính tốt (BLUE); tức
là, số tất tổ hợp tuyến tính khơng thiên lệch giá trị Y, ˆ ˆ
ˆ
có phương sai nhỏ Kết gọi định lý Gauss-Markov có nghĩa rằng, ngồi tính chất khơng thiên lệch quán, ước lượng theo OLS ước lượng hiệu Nếu giá trị u tuân theo phân phối chuẩn độc lập tương tự N(0, 2
), ước lượng theo OLS ước lượng thích hợp (MLE)
Từ ˆ vàˆ, giá trị dự báo Yt (ký hiệu là
t
Yˆ ) thu bằngYˆt ˆˆXt, phần dư ước lượng uˆt Yt Yˆt Sai số chuẩn phần dư ước lượng độ
lệch chuẩn tính theo cơng thức ˆ uˆt2(n2)1/2 Từ kết này, ta suy sai số chuẩn ˆ ˆ (
ˆ
s s ) Các sai số chuẩn nhỏ, độ xác ˆ
của ước lượng thông số lớn Sự biến đổi X lớn tốt điều có khuynh hướng cải thiện độ xác ước lượng riêng lẻ
Các bước tiến hành kiểm định đối thuyết đầu tiến hành sau:
BƯỚC H0: = 0 H1: > 0
BƯỚC Trị thống kê kiểm định tc ˆ 0/sˆ, s sai số chuẩn ước ˆ
lượng ˆ Theo giả thuyết H0, giá trị tuân theo phân phối t với n –
bậc tự
BƯỚC Tra bảng t với giá trị ứng với n – bậc tự mức ý nghĩa cho trước (chẳng hạn ), tìm điểm t*
n-2() cho P(t> t*) =
BƯỚC Bác bỏ H0 mức ý nghĩa tc > t* Nếu giả thuyết ngược lại H1 < 0, H0 bị bác bỏ tc < - t*
Kiểm định thực theo cách tương đương Các bước điều chỉnh sau:
BƯỚC 3a Tính xác suất (ký hiệu p-value) cho t > tc
BƯỚC 4a Bác bỏ H0 kết luận hệ số có ý nghĩa p-value nhỏ mức ý
(44)Các bước kiểm định giả thuyết ngược lại H1 có tính hai phía thực sau:
BƯỚC H0: = 0 H1: 0
BƯỚC Trị thống kê kiểm định tc ˆ0/sˆ Theo giả thuyết H0, giá trị tuân
theo phân phối t với n – bậc tự
BƯỚC Tra bảng t với giá trị ứng với n – bậc tự mức ý nghĩa cho trước (chẳng hạn ), tìm điểm t*
n-2(/2) cho P(t> t*) = /2 (một mức
ý nghĩa)
BƯỚC Bác bỏ H0 mức ý nghĩa tc > t*
Các bước hiệu chỉnh để thực kiểm định theo phương pháp p-value sau: BƯỚC 3a Tính p-value = 2P(t > tc)
BƯỚC 4a Bác bỏ H0 p-value nhỏ mức ý nghĩa ()
Trị thống kê đo lường độ thích hợp mơ hình R2
= 1- (ESS/TSS),
ˆ2
t
u
ESS
2
t Y
Y
TSS
R2 có giá trị từ đến Giá trị cao độ thích
hợp tốt R2
mang hai ý nghĩa: (1) tỷ lệ tổng phương sai Y mà mơ hình giải thích, (2) bình phương hệ số tương quan giá trị quan sát (Yt) biến
phụ thuộc giá trị dự báo Yˆ t
Kiểm định độ thích hợp tổng thể mơ hình thực cách sử dụng giá trị R2 Các bước tiến hành sau (
xy hệ số tương quan tổng thể hai
biến X Y):
BƯỚC H0: xy = H1: xy
BƯỚC Trị thống kê kiểm định Fc = R2(n – 2)/(1 – R2) Theo giả thuyết H0, trị thống
kê tuân theo phân phối F với bậc tự tử số n – bậc tự mẫu số
BƯỚC Tra bảng F theo tử số bậc tự mẫu số n – bậc tự mức ý nghĩa cho trước (chẳng hạn ) tìm gí trị F*
cho: P(F>F*) = BƯỚC Bác bỏ giả thuyết H0 (tại mức ý nghĩa ) Fc > F*
Khoảng tin cậy 95% xác định sau:
ˆ t*sˆ,ˆt*sˆ
Dự báo có điều kiện Y, cho trước X X0, Y ˆˆX0 Phương sai
(phép đo độ tin cậy dự báo) tỉ lệ thuận với khoảng cách X0 so với giá trị trung bình
X Như vậy, X0 xa khỏi giá trị trung bình X, giá trị dự báo tin cậy
Thay đổi thang đo biến phụ thuộc dẫn đến thay đổi tương ứng thang đo hệ số hồi quy Tuy nhiên, giá trị R2
(45)độc lập thay đổi, hệ số hồi quy hệ sai số chuẩn tương ứng bị thay đổi thang đo, nhiên tất trị thống kê khác không thay đổi
Việc xác định xác quan hệ nhân quan trọng mơ hình hồi quy Giả thiết chuẩn X gây Y Tuy nhiên, X Y tráo đổi, mơ hình ước lượng Xt = * + *Yt + vt, đường thẳng hồi quy nói chung khác với đường xác
định từ mơ hình Yt = + Xt + ut
THUẬT NGỮ
Analysis of variance (ANOVA) Phân tích phương sai
Best linear unbiased estimator (BLUE) Ước lượng không thiên lệch tuyến tính tốt
nhất
Coefficient of multiple determination Hệ số xác định bội
Conditional mean of Y given X Giá trị trung bình điều kiện Y biết trước
X
Critical region Vùng ngưỡng (vùng tới hạn)
Data-generating process (DGP) Quá trình phát liệu
Engel curve Đường cong Engel
Error sum of square (ESS) Tổng bình phương sai số
Estimated residual Phần dư ước lượng
Explained variation Sự biến đổi giải thích
Feedback Phản hồi
Fitted straight line Đường thẳng thích hợp
F-test Kiểm định F
Gauss-Markov theorem Định lý Gauss-Markov
Goodness of fit Độ khớp
Heteroscedasticity Phương sai sai số thay đổi
Homoscedasticity Đồng phương sai sai số (tính chất phương
sai sai số không thay đổi)
Joinly determined Được xác định lúc
Linear estimator Ước lượng tuyến tính
Marginal effect of X on Y Hiệu ứng cận biên X lên Y
Mean absolute percent error (MAPE) Sai số phần trăm tuyệt đối trung bình
Mean squared error (MSE) Sai số bình phương trung bình
Mean squared percentage error (MSPE) Sai số phần trăm bình phương trung bình
Method of least square Phương pháp bình phương tối thiểu
Nonlinear regression model Mơ hình hồi quy phi tuyến
Normal equation Phương trình chuẩn
Ordinary least squares (OLS) Bình phương tối thiểu thường
Population parameters Tham số tổng thể
Population regression function Hàm hồi quy tổng thể
Population regression line Đường hồi quy tổng thể
Population variance Phương sai tổng thể
Postsample forecast Dự báo hậu mẫu
p-value Giá trị p
(46)Regression sum of squares (RSS) Tổng bình phương hồi quy
Residual Phần dư
Root mean squared error Căn bậc hai sai số bình phương trung
bình
Sample estimate Ước lượng mẫu
Sample regression line Đường hồi quy mẫu
Sample regression function Hàm hồi quy mẫu
Sample scatter diagram Biểu đồ phân tán mẫu
Serial correlation Tương quan chuỗi
Serial independence Độc lập chuỗi
Significanly different from zero Khác cách đáng kể
Significanly greater from zero Lớn cách đáng kể
Simple linear regression model Mơ hình hồi quy tuyến tính đơn
Spurious correlation Tương quan giả tạo
Spurious regression Hồi quy giả tạo
Standard error of a regression coefficient
Sai số chuẩn hệ số hồi quy
Standard error of the regression Sai số chuẩn hồi quy
Standard error of the residuals Sai số chuẩn phần dư
Statistically insignificant Khơng có ý nghĩavề thống kê
Statistically not greater than zero Không lớn mặt thống kê
Statistically significant Có ý nghĩa thống kê
Sum of squares of the residuals (ESS) Tổng bình phương phần dư
Total sum of squares (TSS) Tổng bình phương toàn phần
Total variance Phương sai tổng
t-statistic Trị thống kê t
t-test Kiểm định t
Unexplained variation Biến đổi khơng giải thích
Well-behaved errors Sai số thay đổi ngẫu nhiên
White-noise errors Sai số nhiễu trắng
3.A PHỤ LỤC
Chứng Minh Các Phương Trình
3.A.1 Biểu diễn chiều mơ hình tuyến tính đơn
Hình 3.A.1 biểu diễn đồ thị giả thiết liệt kê bảng 3.2 cho trường hợp mơ hình hồi qui biến đơn Trục X Y đại diện cho giá trị biến X Y Trục Z hàm mật độ xác suất f(u) sai số ngẫu nhiên u Đường thẳng + X trung bình có điều kiện Y với X cho trước, giả sử tuyến tính Các phân phối thống kê vẽ xung quanh đường trung bình cho giá trị X1, X2 X3 phân phối có điều kiện tương ứng Như đề cập bài, giả thiết
Var(ut) = 2 gọi phương sai sai số khơng đổi, có nghĩa “phân tán nhau” Hình
3.A.1 mơ tả tính bất biến phương sai sai số cho tất quan sát Nếu phương sai không bất biến mà thay đổi theo t [như vậy, Var(ut) 2t], ta có phương sai sai số thay đổi
(47)X3 X
f(u)
0
X1 X2
Y
+ X
Hình 3.A.2 Minh họa phương sai sai số không đổi
Hình 3.A.1 Biểu diễn đồ thị Mơ hình Hồi Qui Tuyến Tính Đơn
0 f(u)
X X1 X2
Y
+ X
(48) 3.A.2 Các Kết Quả Của Phép Tính Tổng
Các tính chất 3.1 3.2 chứng minh
TÍNH CHẤT 3.1
2
t t 2 t t
xx X X X n X X n1 X
S ( ) ( )
Chứng minh
t t t t
t X X 2X X X X 2XX X
X ) ( ) ( )
(
Như trước đây, X với giá trị t Do vậy, biểu thức =
t
t 2X X n X
X ( ) Hơn Xt nX Do đó, biểu thức trở thành
2
t 2XnX n X
X ( )
Kết hợp số hạng thứ hai ba biểu thức ta phần thứ
của tính chất Ta biết X = (Xt)/n Thay vào, ta có phần thứ hai tính chất
TÍNH CHẤT 3.2
X Y n
Y X Y X n Y X Y Y X X
Sxy ( t )( t ) t t t t t t /
Chứng minh
) (
) )(
(Xt X Yt Y XtYt XtYYtXXY
XtYt Y Xt X Yt nXY
Y X n Y n X X n Y Y
Xt t
Y X n Y Xt t
Thay X(Xt)/n Y(Yt)/n, ta có đẳng thức thứ hai
3.A.3 Chứng Minh Các Phương Trình Chuẩn Bằng Phép Bình Phương Nhỏ Nhất
Trong phần ta áp dụng phương pháp bình phương nhỏ nhất, trình bày phần 3.2 chứng minh phương trình chuẩn (3.4) (3.5) Tiêu chuẩn bình phương nhỏ chọn giá trị ˆ ˆ làm tối thiểu tổng bình phương sai số:
t n
1 t t t n t t
t Y X
u
(49)Để tối thiểu ESS với ˆ ˆ, ta cho đạo hàm riêng (xem phần 2.A.3 đạo hàm riêng) ESS/ ˆ
ESS/ ˆ giải phương trình Ta có
u 2u u 2 u 1 2 Y X 1 0 ESS t t t t t
t
) )( ˆ ˆ ( ) ( ˆ ˆ ˆ ˆ ˆ ˆ ˆ
ESS u 2u u 2 u X 2 Y X X 0
t t t t t t t t ) )( ˆ ˆ ( ) ( ˆ ˆ ˆ ˆ ˆ ) ˆ ( ˆ
Từ ta thu phương trình sau:
(Ytˆ ˆXt)0 (YtˆˆXt)Xt 0
Lấy tổng số hạng lưu ý ˆ ˆ không phụ thuộc vào t thừa số chung đưa tổng, ta
Yt nˆ ˆ Xt
t t
t
tX X X
Y ˆ ˆ
Phương trình tương đương với phương trình (3.4) phương trình thứ tương đương với phương trình (3.5)
3.A.4 Ước Lượng Khơng Thiên Lệch Tuyến Tính Tốt Nhất (Blue) Và Định Lý Gauss-Markov
Từ lý thuyết thống kê ta biết tính chất mong muốn cho ước lượng ước lượng tuyến tính khơng thiên lệch phương sai nhỏ (xem định nghĩa 2.8) Nói cách khác, tổ hợp tuyến tính biến phụ thuộc khơng thiên lệch, ta chọn biến có phương sai nhỏ Đây ước lượng không thiên lệch tốt (BLUE) Trong phần ta chứng minh định lý
Gauss-Markov, định lý cho ước lượng OLS rút phần 3.2 có tính chất BLUE
Đầu tiên lưu ý ước số OLS ˆ thực biểu diễn tổ hợp tuyến tính
Yt Để thấy điều này, ta viết lại phương trình (3.12)
(3.12)
n Y X Y X
S t t
t t xy
Lưu ý XXt/n, kết biểu diễn
t t
t t
tY X Y X X Y
X ( )
(50)Vì ˆ = Sxy/Sxx từ phương trình (3.10), ta có
t t t
xx
t Y Y
S X
X
ˆ
Đây tổ hợp tuyến tính Yt với trọng số
xx t
t S
X X
phụ thuộc vào Xt Bây xem tổng tổ
hợp tuyến tính giá trị Y có dạngatYt
~
, với at có tính khơng ngẫu nhiên Ước lượng
khơng thiên lệch tốt (BLUE) có tính chất: (1) ~không thiên lệch (2) Var(~) nhỏ
Chứng minh
Gọi dt = at - t hiệu số trọng số (lưu ý dt phụ thuộc biến X xem
không ngẫu nhiên) Vậy at = t + dt Tiếp theo
~ ( t dt)Yt ˆ dtYt
) (
) ( )
( )
~
( EdtYt dtE Yt dt Xt E
t t
t dX
d
Để có tính khơng thiên lệch, kết phải , điều xảy
dt = dtXt =
Phương sai ước lượng ~được xác định Var[(t + dt)Yt] Từ tính chất 2.A.5c, phương sai
của tổng biến ngẫu nhiên độc lập tổng phương sai (tính độc lập đảm bảo giả thiết 3.6) Hơn nữa, giả thiết 3.5 phương sai sai số không đổi, ut Yt có phương sai
khơng đổi 2 Từ ta có
Var(~) = 2(t + dt)2 = 22t + 2d2t + 22tdt
Số hạng thứ tdt = d
S X X
t xx
t
, điều kiện tính khơng thiên lệch dt =
0 dtXt = làm cho số hạng tổng Trong biểu thức phương sai
~
, số hạng đầu độc lập với biến chọn dt Bởi số hạng thứ hai tổng bình phương, có cách
duy để tối thiểu số hạng chọn giá trị ds Điều làm cho at = t
ˆ
~
(51)3.5 3.6 phương sai sai số khơng đổi tính độc lập theo chuỗi Nếu giả thiết bị vi phạm, phương pháp OLS khơng cho ước lượng hiệu
3.A.5 Ước Lượng Thích Hợp Nhất
Lý phương pháp ước lượng thích hợp diễn tả chi tiết phần 2.A.4 Bạn đọc xem phần trước bắt đầu phần Trong phần đó, phương pháp áp dụng cho trường hợp ước lượng giá trị trung bình phương sai phân phối chuẩn Ở ta áp dụng kỹ thuật tương tự vào tốn hồi qui Bởi ngun lý thích hợp đòi hỏi kiến thức phân phối toán, nên ta cần giả thiết 3.7 Các bước để xác định ước lượng thích hợp dễ hiểu Trước tiên, lập hàm thích hợp liên kết hàm mật độ quan sát với thông số chưa biết Để cực đại hàm này, lấy vi phân riêng phần logarit hàm thích hợp cho thơng số chưa biết cho Kế đến giải điều kiện bậc để tìm ước lượng thích hợp Hàm mật độ u xác định theo [xem phương trình (2.4)]
2 2 u e u
f
/ ) ( ) (
Bởi quan sát độc lập nhau, hàm thích hợp u1, u2,…,un
L(, , 2) = f(u1) f(u2) f(u3) f(un)
= /( ) ) ( 2 t u n e
1
= ( ) /( ) ) ( 2 t
t X
Y n e
2
1
Thực cực đại hóa logarit hàm thích hợp dễ hơn, giá trị cực đại với giá trị lớn L loga có tính chất tăng đều; nghĩa ab, ln(a)ln(b)
t 2 t
2 X Y n n
L ln ln( ) ( )
ln 2 SSE n n
ln ln( )
Trong SSE = (Yt - -Xt)2 xuất số hạng SSE Do đó, lnL lớn
với SEE nhỏ (bởi có dấu âm trước SSE) Nhưng SSE nhỏ nghĩa ước lượng bình phương nhỏ Do đó, ước lượng bình phương nhỏ MLE với điều kiện sai số u tuân theo phân phối N(0,2) Bởi ước lượng thích hợp đồng hiệu
cách tiệm cận, nên ước lượng OLS
Để có MLE 2, lấy vi phân riêng phần lnL theo
(52)0 SEE n
L
3
(ln )
Giải phương trình tìm 2
ta 2 = SSE/n Nhưng SSE phụ thuộc vào Tuy nhiên, ta dùng ước lượng chúng ˆ ˆ Do ta thu MLE phương sai ut với
n u2
t
/ ˆ ~
Như phát biểu trước đó, giá trị không thiên lệch Một ước lượng không thiên
lệch tìm cách chia uˆ cho n-2 dùng 2t ˆ2đã xác định phương trình (3.21)
Điều kiện không thiên lệch chứng minh phục lục phần 3.A.7
3.A.6 Tìm Các Phương Sai Của Các Ước Lượng
Từ phương trình (3.10), ta có ˆ= Sxy/Sxx. Vì X không ngẫu nhiên theo giả thiết 3.4, Sxx không
ngẫu nhiên Var(ˆ) = Var(Sxy)S2xx Từ phương trình (3.15), Sxy = Sxx + Sxu
Var(Sxy) = Var(Sxu) Từ phương trình (3.16) ta lưu ý Sxu = (Xt X)ut Tính chất 2.A.5c cho
thấy phương sai tổng biến ngẫu nhiên tổng phương sai với điều kiện đồng phương sai (covariance) số hạng Theo giả thiết 3.6, ut us không tương quan với ts
đồng phương sai Do đó,
( ) ( ) ( ) ( )
)
(Sxu Var Xt X ut Var Xt X ut Xt X 2Var ut
Var
Với giả thiết 3.5, Var(ut) = 2 Do đó, Var(Sxu) = 2(Xt X)2=2Sxx Từ có
xx
2 xx
2 xx
xy
S S
S S
S Var
Var xx
ˆ) ( )
(
Vậy ta chứng minh phương trình (3.18) Thủ tục để chứng minh phương trình (3.19) (3.20) tương tự tập cho bạn đọc
3.A.7 Ước Lượng Không Thiên Lệch Của Phương Sai Của Số Hạng Sai Số
Theo phương trình (3.21), s2
= ˆ2(uˆt2)/(n2)là ước lượng không thiên lệch 2 Điều chứng minh sau
t t
t t
t Y X Y Y X X
uˆ ˆ ˆ ( ˆ )ˆ
Dùng phương trình (3.9) cho ˆ Vì Yt xác định phương trình (3.1), YXu với u
bằng ut/n Do đó, nhóm tất số hạng ta có,
t t
t
t X u X u X X
uˆ ( )( )ˆ ˆ
) )(
ˆ ( )
(ut u Xt X
(53)Tổng bình phương uˆ xác định theo t
uˆ2t (utu)2(ˆ )2(Xt X)22(ˆ)(Xt X)(ut u)
xu xx
2
uu S S
S (ˆ) (ˆ)
Dùng ký hiệu tương tự phương trình (3.11) (3.16) Từ phương trình (3.15), Sxu= Sxy - Sxx = Sxx(ˆ - ) Thay kết vào phương trình kết hợp số hạng thứ hai ba ta có
xx uu
2
t S S
uˆ (ˆ)
Để tính giá trị kỳ vọng tổng bình phương sai số, ta cần E(Suu)và E[(ˆ - )2] Từ tính chất
2.11b ta lưu ý
E(Suu) = (n-1)Var(u) = (n-1)2 Hơn nữa,
E[(ˆ - )2] = Var(ˆ) =
xx
S
Từ phương trình (3.18) Đặt tất kết quả, ta có
2 2
xx uu
t E S S E n n
u
Eˆ ( ) [(ˆ) ]( ) ( )
Chia cho n-2 ta có kết mong muốn
2 t
2 n
u E
E
ˆ ) ˆ
(
Vậy, ˆ2là ước lượng không thiên lệch 2
3.A.8 Chứng Minh Phương Trình 3.25
Giá trị tổng bình phương viết lại sau:
t t t
t Y Y Y Y Y
Y ) ( ˆ ˆ )
(
= (Yt Yˆt)2 (Yˆt Y)2 2(Yt Yˆt)(Yˆt Y)
Với uˆt Yt Yˆt, hai số hạng hai số hạng có phương trình (3.25) Bây tất điều ta cần phải chứng minh (Yt Yˆt)(Yˆt Y)uˆt(Yˆt Y)0
(54)Từ phương trình chuẩn (3.4), uˆt (Yt ˆ ˆXt)0 Từ phương trình (3.5),
uˆtXt (Yt ˆ ˆXt)Xt 0, kết chứng minh
3.A.9 Chứng Minh Phương Trình 3.26a
Để chứng minh phương trình (3.26a), trước tiên ta tìm đồng phương sai mẫu (ký hiệu Cov) Yt Yˆ Từ phương trình (2.10), t
Cov (Yt, Yˆ ) = t n11(Yt Y)(Yˆt Y)
Lưu ý trung bình Yˆ t Ybởi ˆ ˆXY Vậy,
) ˆ ( ˆ ) ˆ ( ) ˆ
(Y Y Y Y u Y Y
Y
Yt t t t t t
Do đó,
Cov (Yt, Yˆ ) = t n 1
Y Y
n
Y Y
u
t t
t
ˆ (ˆ ) (ˆ )
Phần trước cho thấy số hạng thứ Do vậy, đồng phương sai Yt Yˆ với số t
hạng thứ hai, RSS/(n-1);
Cov (Yt, Yˆ ) = t
1 n RSS
Ta có
Var(Yt) =
1 n TSS
Var(Yˆ ) = t n
RSS
n Y
Y
t
(ˆ )
Từ phương trình (2.7) ta nhớ lại bình phương hệ số tương quan đơn Yt và Yˆ xác định t
Thay đồng phương sai phương sai từ biểu thức vừa rút bỏ n-1, ta có
2
2 Y
Y TSS R
RSS RSS
TSS RSS
r ˆ
) ˆ ,
( t t
2 Y Y
Cov
) ˆ ( )
(Yt Var Yt Var
2 Y Y
(55)Vậy, bình phương tương quan đơn giá trị quan sát Yt và giá trị Yˆ dự báo mô hình t hồi qui R2
định nghĩa phương trình (3.26)
3.A.10 Chứng Minh Rằng r2
xy = R2 Cho Mơ Hình Hồi Qui Đơn
Trong phần ta chứng minh trường hợp mơ hình hồi qui đơn, R2
với bình
phương tương quan đơn X Y Từ phương trình (2.11), r2
xy = S2xy/(SxxSyy) Syy với
tổng bình phương TSS Hơn nữa, RSS =
t Y
Yˆ )
( Vì Yˆt ˆ ˆXt Yˆ ˆX, ta có )
( ˆ
ˆ Y X X
Yt t Do đó,
xx 2 t 2
t Y X X S
Y
RSS(ˆ ) βˆ ( ) βˆ
Từ phương trình (3.10), ˆ = Sxy/Sxx Thay kết cho số hạng ˆ trên, ta thu
xy xx
xx
xy S S
S S
RSS
ˆ ( ) ˆ
Thay Sxy từ kết lưu ý Syy = TSS, ta có
2 xy xx xy xy yy xx xy
xy TSS R
S TSS S S S S S S
r ˆ
Kết chứng minh
3.A.11 Chứng Minh Phương Trình 3.28
2 0
0 EY E YX
Y
Var(ˆ ) [ˆ (ˆ )]
2
2
0 X E X
X
E[ˆ ˆ ] [(ˆ ) (ˆ)]
) ˆ , ˆ ( ) ˆ ( ) ˆ (
Var X2Var 2X0Cov
0
Trong phép biến đổi trên, ta dùng tính chất 2.4a Thay từ phương trình (3.18), (3.19) (3.20), ta xx xx o xx t S X X S X nS X Y
Var(ˆ )
Với Sxx =
2
t nX
X
(56)
xx 2
xx 2
0 S
X X n S
X X X X n Y
Var(ˆ ) ( )
Kết phương trình (3.28)
3.A.12 Chứng minh phương trình 3.29
Gọi uˆ0 Y0Yˆ0là sai số điểm dự báo Y0, với Yˆ0 ˆ ˆX0là giá trị dự báo trung bình
Do ta có
) ˆ , ( )
ˆ ( )
( )
ˆ
(u0 Var Y0 Var Y0 2Cov Y0 Y0
Var
Vì Y0 = + X0 + u0, Var(Y0) = 2 Mặt khác, Var(Yˆ ) xác định phương trình (3.26) Cuối
cùng, Cov(Y0,Yˆ ) = 0, u0 khơng tương quan với số dư khác khơng tương quan
với ˆ ˆ Vậy ta có
xx 2
0 S
X X n 1 u
(57)BÀI TẬP
Câu Hỏi Lý Thuyết
3.1 Tất tổng bốn biểu thức dùng để tính liệu mẫu, khơng phải dành cho tập hợp hồn chỉnh Hãy biểu thức sai Giải thích biểu thức hay sai
a tn1uˆt 0 b tn1 Xtuˆt 0 c tn1ut 0 d tn1 Xt ut 0
3.2 Có khác biệt số hạng sai số phần dư? Hãy giải thích khác biệt ut
E(ut) Sau đó, chứng minh E(uˆt)0 Và giải thích giá trị kỳ vọng nghĩa nêu giả thiết cần thiết để chứng minh biểu thức
3.3 Cho mơ hình tuyến tính đơn biến Yt Xt ut, chứng minh giả thiết định, phương pháp ước lượng OLS cho kết ước lượng không
chệch? Có nghĩa cần phải chứng minh ( ( )
^
t t E Y Y
E Hãy nêu giả thiết
cần thiết cho việc chứng minh
3.4 Nêu giả thiết cần thiết cho phát biểu sau Đồng thời giải thích lý giả thiết cần cho phát biểu
e Để ước lượng phương pháp OLS
f Để chứng minh ước lượng thông số theo phương pháp OLS không chệch quán
g Để chứng minh ước lượng theo phương pháp OLS hiệu h Để thực kiểm định t F
3.5 Những câu hỏi sau hay sai? Nếu câu hỏi phần, bạn phần Giải thích lý câu (phần)
i Các ước lượng hệ số góc theo phương pháp OLS xác giá trị X gần với trị trung bình mẫu chúng
j Nếu Xt ut tương quan, ước lượng không chệch
k Các ước lượng ước lượng khơng lệch tuyến tính tốt (BLUE) tất giá trị ut tuân theo phân bố chuẩn
l Nếu số hạng sai số khơng tn theo phân phối chuẩn kiểm định t F thực
m Nếu phương sai ut lớn khoảng tin cậy ước lượng lớn (rộng)
n Nếu phương sai X lớn khoảng tin cậy ước lượng hẹp o Khi trị số p-value lớn hệ số khác cách đáng kể