1. Trang chủ
  2. » Văn bán pháp quy

Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10

57 30 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 57
Dung lượng 1,41 MB

Nội dung

Theo phương pháp này, người phân tích sẽ không sử dụng một số quan sát cuối cùng (chẳng hạn, 10% số quan sát cuối cùng) trong việc ước lượng mô hình, nhưng sẽ sử dụng các ước lượng thô[r]

(1)

Chương

M

MÔÔ HHÌÌNNHH HHII QQUUYY TTUUYYNN TTÍÍNNHH ĐĐƠƠNN

Ở chương phát biểu bước phân tích kinh tế lượng việc thiết lập mơ hình mơ tả hành vi đại lượng kinh tế Tiếp theo nhà phân tích kinh tế/ kinh doanh thu thập liệu thích hợp ước lược mơ hình nhằm hỗ trợ cho việc quyết định Trong chương giới thiệu mô hình đơn giản phát triển phương pháp ước lượng, phương pháp kiểm định giả thuyết phương pháp dự báo Mơ hình đề cập đến biến độc lập (Y) biến phụ thuộc (X) Đó mơ hình hồi quy tuyến tính đơn Mặc dù mơ hình đơn giản, phi thực tế, việc hiểu biết vấn đề mơ hình tảng cho việc tìm hiểu mơ hình phức tạp Thực tế, mơ hình hồi quy đơn tuyến tính giải thích cho nhiều phương pháp kinh tế lượng Trong chương đưa kết luận mơ hình hồi quy tuyến tính đơn biến Cịn phần khác phần tính tốn giới thiệu phần phụ lục Vì vậy, đối với người đọc có kiến thức tốn học, thích, đọc phần phụ lục để hiểu rõ kết lý thuyết

3.1 Mơ Hình Cơ Bản

Chương trình bày ví dụ mơ hình hồi quy đơn đề cập đến mối liên hệ giá ngơi nhà diện tích sử dụng (xem Hình 1.2) Chọn trước số loại diện tích, sau liệt kê số lượng nhà có tổng thể tương ứng với diện tích chọn Sau tính giá bán trung bình loại nhà vẽ đồ thị (quy ước điểm biểu thị X) Giả thuyết mơ hình hồi quy tuyến tính đơn trị trung bình nằm đường thẳng (biểu thị  + SQFT), hàm hồi quy tổng thể trung bình có điều kiện (kỳ vọng) GIÁ theo SQFT cho trước Công thức tổng quát mơ hình hồi quy tuyến tính đơn dựa Giả thiết 3.1

GIẢ THIẾT 3.1 (Tính Tuyến Tính Mơ Hình)

Yt = + Xt + ut (3.1)

trong đó, Xt Yt trị quan sát thứ t (t = đến n) biến độc lập biến phụ thuộc, tiếp

theo  tham số chưa biết ước lượng; ut là số hạng sai số không

quan sát giả định biến ngẫu nhiên với số đặc tính định mà đề cập kỹ phần sau  gọi hệ số hồi quy (t thể thời điểm chuỗi thời gian trị quan sát chuỗi liệu chéo.)

(2)

của nam với chiều cao người cha họ để “hồi quy” (hoặc di chuyển) cho chiều cao trung bình tồn tổng thể  + Xb gọi phần xác định mơ hình trung

bình có điều kiện Y theo X, E(YtXt) = + Xt Thuật ngữ tuyến tính dùng để

rằng chất thông số tổng thể tuyến tính (bậc nhất) khơng phải

là Xt tuyến tính Do đó, mơ hình Yt   Xtut

2

 gọi hồi quy quyến tính đơn

mặc dầu có X bình phương Sau ví dụ phương trình hồi quy phi tuyến tính Yt =

+ X + ut Trong sách khơng đề cập đến mơ hình hồi quy phi tuyến tính mà

tập trung vào mơ hình có tham số có tính tuyến tính mà thơi Những mơ hình tuyến tính bao gồm số hạng phi tuyến tính biến giải thích (Chương 6) Để nghiên cứu sâu mơ hình hồi quy phi tuyến tính, tham khảo tài liệu: Greene (1997), Davidson MacKinnon (1993), Griffths, Hill, Judg (1993)

Số hạng sai số ut (hay gọi số hạng ngẫu nhiên) thành phần ngẫu nhiên không

quan sát sai biệt Yt phần xác định + Xt Sau tổ hợp bốn

nguyên nhân ảnh hưởng khác nhau:

1 Biến bỏ sót Giả sử mơ hình thực Yt = + Xt + Zt +vt đó, Zt biến giải

thích khác vt số hạng sai số thực sự, ta sử dụng mơ hình Y = + Xt

+ut ut = Zt +vt Vì thế, ut bao hàm ảnh hưởng biến Z bị bỏ sót Trong ví dụ

địa ốc phần trước, mơ hình thực bao gồm ảnh hưởng phòng ngủ phòng tắm bỏ qua hai ảnh hưởng mà xét đến diện tích sử dụng số hạng u bao hàm ảnh hưởng phòng ngủ phòng tắm lên giá bán nhà

2 Phi tuyến tính ut bao gồm ảnh hưởng phi tuyến tính mối quan hệ Y X

Vì thế, mơ hình thực Yt Xt Xt2ut , lại giả định phương trình Y = + Xt +ut , ảnh hưởng Xt2 sẽ bao hàm ut

3 Sai số đo lường Sai số việc đo lường X Y thể qua u Ví dụ, giả sử Yt giá trị việc xây dựng ta muốn ước lượng hàm Yt = + rt +vt rt

là lãi suất nợ vay vt sai số thật (để đơn giản, ảnh hưởng thu nhập biến

khác lên đầu tư loại bỏ) Tuy nhiên thực ước lượng, lại sử dụng mơ hình Yt = + Xt +ut Xt = rt +Zt lãi suất Như lãi

suất đo lường sai số Zt thay rt = Xt – Zt vào phương trình ban đầu, ta

Yt = +(Xt – Zt)+vt = + Xt – Zt + vt = + Xt + ut

Cần lưu ý tính ngẫu nhiên số hạng ut bao gồm sai số đo lường lãi suất

nợ vay cách xác

4 Những ảnh hưởng khơng thể dự báo Dù mơ hình kinh tế lượng tốt chịu ảnh hưởng ngẫu nhiên dự báo Những ảnh hưởng được thể qua số hạng sai số ut

Như đề cập ban đầu, việc thực điều tra toàn tổng thể để xác định hàm hồi quy tổng thể không thực tế Vì vậy, thực tế, người phân tích thường chọn mẫu bao gồm nhà cách ngẫu nhiên đo lường đặc tính mẫu để thiết lập hàm hồi quy cho mẫu Bảng 3.1 trình bày liệu mẫu gồm 14 nhà bán khu vực San Diego Số liệu có sẵn đĩa mềm với tên tập tin DATA3-1 Trong Hình 3.1, cặp giá trị (Xt, Yt) vẽ đồ thị Đồ thị gọi đồ thị phân tán

(3)

sử, thời điểm, ta biết giá trị   Ta vẽ đường thẳng  + X trên biểu đồ Đây đường hồi quy tổng thể Khoảng cách chiếu thẳng xuống từ giá thực (Yt) đến đường hồi quy  + X sai số ngẫu nhiên ut Độ dốc đường thẳng ()

cũng Y/X, lượng thay đổi Y đơn vị thay đổi X Vì diễn

dịch ảnh hưởng cận biên X lên Y Do đó,  0.14, điều có nghĩa

mét vng diện tích tăng thêm làm tăng giá bán nhà lên, mức trung bình, 0.14 ngàn la (lưu ý đơn vị tính) hay 140 la Một cách thực tế hơn, diện tích sử dụng nhà tăng thêm 100 mét vng hy vọng giá bán trung bình ngơi nhà tăng thêm $14.000 đô la Mặc dầu  tung độ gốc giá trị trị trung bình Y X 0, số hạng

vẫn hiểu giá trung bình lơ đất trống Nguyên nhân 

cũng ẩn chứa biến bỏ sót khơng có cách giải thích cho  (điều đề cập kỹ Phần 4.5)

BẢNG 3.1 Giá trị trung bình ước lượng trung bình thực tế giá nhà diện tích sử dụng (mét vng)

t SQFT Giá bán1 Giá trung bình

ước lượng2

1 1.065 199,9 200,386

2 1.254 288 226,657

3 1.300 235 233,051

4 1.577 285 271,554

5 1.600 239 274,751

6 1.750 293 295,601

7 1.800 285 302,551

8 1.870 365 312,281

9 1.935 295 321,316

10 1.948 290 323,123

11 2.254 385 365,657

12 2.600 505 413,751

13 2.800 425 441,551

14 3.000 415 469,351

HÌNH 3.1 Biểu Đồ Phân Tán Của Mẫu Trình Bày Mối Liên Hệ Giữa Giá SQFT

(4)

Y

X

+ X

t

X



X ,tYt

t

u

t

X

100 200 300 400 500 600

1000 1400 1800 2200 2600 3000

HÌNH 3.2 Phương Trình Hồi Quy Tổng Thể Mẫu

Y

X

X

 ˆ  ˆ D

C B

0 A

(Hoài qui tổng thể)

+ X

(Hồi qui maãu)

t t X

Yˆˆˆ   t t t EY X X    

X ,tYt

t

t u

Mục tiêu nhà kinh tế lượng sử dụng liệu thu thập để ước lượng hàm hồi quy tổng thể, là, ước lượng tham số tổng thể   Ký hiệu

ˆ ước lượng mẫu  ˆ ước lượng mẫu  Khi mối quan hệ trung bình ước lượng Y^ = ^ + ^X Đây gọi hàm hồi quy mẫu Ứng với giá trị quan sát cho trước t, ta có Y^t = ^ + ^Xt Đây giá trị dự báo Y với giá trị cho trước Xt

Lấy giá trị quan sát Yt trừ cho giá trị này, ta ước lượng ut được gọi phần

dư ước lượng, đơn giản phần dư, ký hiệu t 1và thể phương

trình sau:

u^t = Yt – Y^t = Yt – ^ – ^Xt

Sắp xếp lại số hạng trên, ta có

1 Một số tác giả giảng viên thích sử dụng a thay cho ^, b thay cho ^ e

t thay cho u^t Chúng ta sử dụng dấu hiệu ^

(5)

t t

t X u

Y ˆ ˆ  ˆ (3.3)

Việc phân biệt hàm hồi quy tổng thể Y = + X hàm hồi quy mẫu

X

Yˆt ˆˆ quan trọng Hình 3.2 trình bày hai đường sai số phần dư (cần

nghiên cứu kỹ vấn đề này) Lưu ý ut ký hiệu “sai số”, tlà ký hiệu “phần

dư”

BÀI TẬP 3.1

Xem xét phương trình sau đây:

a Yt Xut

b Yt ˆˆXuˆt

c Yt ˆˆXut

d Yˆt X

e Yˆt Xuˆt

f Yˆt ˆ ˆXuˆt

Giải thích kỹ phương trình (a) (b) đúng, (c), (d), (e) (f) sai Hình 3.2 có ích việc trả lời câu hỏi

3.2 Ước lượng mơ hình phương pháp bình phương tối thiểu thông thường

Trong phần trước, nêu rõ mơ hình hồi quy tuyến tính phân biệt hồi quy của tổng thể hồi quy mẫu Mục tiêu sử dụng liệu X Y tìm kiếm ước lượng “tốt nhất” hai tham số tổng thể   Trong kinh tế lượng, thủ tục ước lượng dùng phổ biến phương pháp bình phương tối thiểu Phương pháp thường gọi bình phương tối thiểu thơng thường, để phân biệt với phương pháp bình phương tối thiểu khác thảo luận chương sau Ký hiệu ước lượng   ˆ ˆ, phần dư ước lượng uˆtYt ˆˆXt Tiêu

chuẩn tối ưu sử dụng phương pháp bình phương tối thiểu cực tiểu hóa hàm mục tiêu

2

1

2

) ˆ ˆ ( ˆ

) ˆ , ˆ

( t

n t

t t n

t

t

t Y X

u

ESS     

  

với tham số chưa biết ˆ ˆ ESS tổng phần dư bình phương phương

pháp OLS cực tiểu tổng phần dư bình phương2 Cần nên lưu ý ESS khoảng cách

(6)

bình phương đo lường từ đường hồi quy Sử dụng khoảng cách đo lường này, nói phương pháp OLS tìm đường thẳng “gần nhất” với liệu đồ thị

Trực quan hơn, giả sử ta chọn tập hợp giá trị ˆ vàˆ, đường thẳng

X

ˆ ˆ Có thể tính độ lệch Y

t từ đường thẳng chọn theo phần dư ước lượng

X Y

uˆtt ˆ ˆ Sau bình phương giá trị cộng tất giá trị bình phương tồn mẫu quan sát Tổng phần dư bình phương trị quan sát [được xem tổng bình phương sai số (ESS)] ˆ2

t

u Tương ứng với điểm đường

thẳng có một trị tổng bình phương sai số Phương pháp bình phương tối thiểu chọn giá trị ˆ ˆ cho ESS nhỏ

Việc bình phương sai số đạt hai điều sau Thứ nhất, bình phương giúp loại bỏ dấu sai số xem sai số dương sai số âm Thứ hai, bình phương tạo bất lợi cho sai số lớn cách đáng kể Ví dụ, giả sử phần dư mẫu 1, 2, –1 –2 hệ số hồi quy chọn trước trị ˆ ˆ chọn trước So sánh giá trị với mẫu khác có phần dư –1, –1, –1 Tổng giá trị sai số tuyệt đối hai trường hợp Mặc dù mẫu chọn thứ hai có sai số tuyệt đối thấp từ đến 1, điều dẫn đến sai số lớn khơng mong muốn Nếu ta tính ESS cho hai trường hợp ESS trường hợp đầu 10 (12

+ 22+ 12+ 22), ESS cho trường hợp sau 12 (12 + 12+ 12+ 32) Phương pháp bình phương tối thiểu áp đặt bất lợi lớn cho sai số lớn đường thẳng trường hợp đầu chọn Phần 3.3 tiếp tục trình bày đặc tính cần thiết khác phương pháp cực tiểu ESS

Phương Pháp Thích Hợp Cực Đại

Phần đề cập sơ phương pháp thích hợp cực đại Phương pháp trình bày chi tiết phần 2.A.4 Phần 3.A.5 trình bày nguyên tắc áp dụng mơ hình hồi quy tuyến tính đơn Mặc dù phương pháp thích hợp cực đại dựa tiêu chuẩn tối ưu khác, thông số ước lượng giống thông số ước lượng phương pháp OLS Nói đơn giản, phương pháp thích hợp cực đại chọn ước lượng cho xác suất xảy mẫu quan sát lớn

Phần thảo luận trước cho thấy thực hai phương pháp ước lượng   khác cách xác dẫn đến kết Như cần phải xem xét hai phương pháp? Câu trả lời chương sau, ta thấy số giả thiết mơ hình giảm nhẹ, thực tế, hai phương pháp ước lượng khác cho kết khác Một phương pháp khác cho kết khác nữa, phương pháp cực

tiểu tổng sai số tuyệt đối uˆt Nhưng phương pháp không dùng phổ biến

kinh tế lượng khó tính tốn

Phương Trình Chuẩn

(7)

 

uˆt 0 (Yt ˆˆXt) Yt(nˆ)ˆ Xt (3.4)

)] ˆ ˆ ( [ ) ˆ

(Xtut  Xt YtXt

 = (3.5)

Trong Phương trình (3.4), cần lưu ý ˆ n ˆ số hạng có ˆ có n số hạng Chuyển vế số hạng âm Phương trình (3.4) sang phải chia số hạng cho n, ta

t   Xt

n Y

n

1 ˆ ˆ

(3.6)

(1/n)Yt trung bình mẫu Y, ký hiệu Y , (1/n)Yt trung bình mẫu X, ký

hiệu X Sử dụng kết thay vào Phương trình (3.6), ta phương trình sau

X

Y ˆˆ (3.7)

Đường thẳng ^ +^ X đường ước lượng đường hồi quy mẫu, đường

thẳng thích hợp Có thể thấy từ Phương trình (3.7) đường hồi quy mẫu qua điểm trung bình X ,Y Trong Bài tập 3.12c, ta thấy tính chất khơng đảm bảo trừ số hạng số  có mơ hình

Từ Phương trình (3.5), cộng tất theo số hạng, đưa ˆ ˆ làm thừa số

chung, ta

0 ˆ

ˆ )

(       XtYtXtXt hay

 

  ˆ  ˆ

)

(XtYtXtXt (3.8)

Lời Giải Phương Trình Chuẩn

Để thuận lợi cho việc đáp án hai phương trình chuẩn, tính chất sau cần thiết Những tính chất chứng minh Phụ lục Phần 3.A.2

TÍNH CHẤT 3.1

Sxx = (Xt – X

)2 = Xt2 – nX

)2 = Xt2 –

1 n(Xt)2

TÍNH CHẤT 3.2

Sxy = (Xt – X

)(Yt – Y

) = (XtYt) – n X

(8)

Từ Phương trình (3.7),

 

 

t Xt

n Y n X

Y ˆ ˆ1

ˆ  

(3.9)

Thay ˆ vào (3.8)

 

 

     ˆ

) ( ˆ t t t t t

t X X X

n Y n Y

X  

Nhóm số hạng có thừa số ˆ:

                         

X nX

n Y X Y

Xt t t t t t

2

2

ˆ

Tìm ˆ ta

             n X X n Y X Y X t t t t t t 2 ˆ 

Sử dụng ký hiệu đơn giản giới thiệu Tính chất 3.1 3.2, diễn tả sau xx xy S S

ˆ (3.10)

trong

 

n X X

Sxx t t

2     (3.11)    n Y X Y X

Sxy  t t   tt (3.12)

Ký hiệu Sxx Sxy nhớ cách trực quan sau, định nghĩa xtXtX ytYtY , ký hiệu ngang trung bình mẫu Do xt yt ký hiệu độ lệch X Y so với giá trị X Y trung bình Kết sau chứng minh phần Phụ lục Phần 2.A.1 3.A.2

xt =

 2 2 ) (        

t t t t

(9)

  

  

 

     

t t t t t t t t

xy X Y

n Y X Y

Y X X y

x

S ( )( ) (3.14)

Sxy “tổng giá trị xt nhân yt “ Tương tự, Sxx “tổng giá trị xt nhân xt , hay

tổng xt bình phương

Phương trình (3.9) (3.10) lời giải cho phương trình chuẩn [(3.4) (3.5)] cho ta ước lượng ˆ ˆ mẫu cho tham số   tổng thể

Cần lưu ý xác định ước lượng  Phương trình (3.10)

0 )

(

2   

xX X

Sxx t t Sxx không xt khơng, có nghĩa

khi Xt Điều dẫn đến giả thuyết sau

GIẢ THIẾT 3.2 (Các Giá Trị Quan Sát X Là Khác Nhau)

Không phải tất giá trị Xt Có giá trị Xt khác so với giá trị

còn lại Nói cách khác, phương sai mẫu ( )2

1 )

( X X

n X

Vart

 không

không

Đây giả thiết quan trọng luôn phải tuân theo khơng mơ hình khơng thể ước lượng Một cách trực quan, Xt không đổi, ta khơng thể giải thích

được Yt thay đổi Hình 3.3 minh họa giả thuyết hình ảnh Trong ví dụ địa

ốc, giả sử thông tin thu thập tập trung vào loại nhà có diện tích sử dụng 1.500 mét vng Đồ thị phân tán mẫu thể Hình 3.3 Từ đồ thị thấy rõ liệu không đầy đủ cho việc ước lượng đường hồi quy tổng thể  +X

HÌNH 3.3 Ví Dụ Giá Trị X Không Đổi

Y

X

0 1,500

Ví dụ 3.1

Theo thuật ngữ dùng phổ biến kinh tế lượng, ta sử dụng liệu Bảng 3.1 thực “hồi quy Y (GIÁ) theo số hạng số X (SQFT)”, ta xác định được mối quan hệ ước lượng (hay hàm hồi quy mẫu) Yˆt 52,3510,13875351Xt

t

là giá ước lượng trung bình (ngàn la) tương ứng với Xt (xem Bảng 3.1) Hệ số hồi quy

(10)

Do vậy, diện tích sử dụng tăng lên đơn vị, giá trung bình ước lượng kỳ vọng tăng thêm 0,13875 ngàn đô la ($138.75) Một cách thực tế, 100 mét vuông tăng thêm diện tích sử dụng, giá bán ước lượng kỳ vọng tăng thêm, mức trung bình, $ 13.875

Hàm hồi quy mẫu dùng để ước lượng giá nhà trung bình dựa diện tích sử dụng cho trước (Bảng 3.1 có trình bày giá trung bình cột cuối.) Do đó, nhà có diện tích 1.800 mét vng giá bán kỳ vọng trung bình $302.551[ = 52,351 + (0,139

 1.800)] Nhưng giá bán thực nhà $285.000 Mơ hình ước lượng giá bán

vượt q $17.551 Ngược lại, nhà có diện tích sử dụng 2.600 mét vng, giá bán trung bình ước lượng $413.751, thấp giá bán thực $505.000 cách đáng kể Sự khác biệt xảy bỏ qua yếu tố ảnh hưởng khác lên giá bán nhà Ví dụ, ngơi nhà có sân vườn rộng và/ hay hồ bơi, có giá cao giá trung bình Điều nhấn mạnh tầm quan trọng việc nhận diện biến giải thích ảnh hưởng đến giá trị biến phụ thuộc đưa ảnh hưởng vào mơ hình thiết lập Ngồi ra, cần thiết việc phân tích độ tin cậy ước lượng tung độ hệ số độ dốc Phương trình (3.1), mức độ “thích hợp” mơ hình liệu thực tế

BÀI TẬP 3.2

Sao chép hai cột số liệu Bảng 3.1 vào bảng Trong cột bảng tính chép giá trị Yt (GIÁ) Xt (SQFT) cột thứ hai Sử dụng máy tính

tính thêm giá trị cho hai cột khác Bình phương giá trị cột thứ hai điền giá trị vào cột thứ ba (x) Nhân giá trị cột thứ với giá trị tương ứng cột hai điền kết qua vào cột thứ tư (XtYt) Tiếp theo, tính tổng cột đánh giá

các tổng sau đây:

753 26

Xt 55.462.515

2 

Xt

9 , 444

Yt 9.095.985,5

2 

Yt

Để tránh tình trạng nhiều sai số làm tròn, cần sử dụng nhiều số thập phân càng tốt Sau đó, tính Sxy từ Phương trình (3.12) Sxx từ Phương trình (3.11) Cuối cùng,

tính ˆ theo (3.10) ˆ theo (3.9) kiểm tra lại giá trị trình bày ban đầu

3.3 Tính chất ước lượng

Mặc dù phương pháp bình phương cho kết ước lượng mối quan hệ tuyến tính phù hợp với liệu sẵn có, cần trả lời số câu hỏi sau Ví dụ, Đặc tính thống kê ˆ ˆ? Thơng số dùng để đo độ tin cậy ˆ ˆ? Bằng cách để

có thể sử dụng ˆ ˆ để kiểm định giả thuyết thống kê thực dự báo? Sau

chúng ta vào thảo luận vấn đề Sẽ hữu ích bạn ơn lại Phần 2.6, phần đưa tóm tắt tính chất cần thiết thơng số ước lượng

Tính chất cần xem xét độ khơng thiên lệch Cần lưu ý Phần 2.4 thông số ước lượng ˆ ˆ? tự thân chúng biến ngẫu nhiên tuân theo phân phối

(11)

có thể đạt nhiều giá trị ước lượng Sau tính tỷ số số lần mà ước lượng rơi vào khoảng giá trị xác định Kết sẽ cho phân phối ước lượng mẫu Phân phối có giá trị trung bình phương sai Nếu trung bình phân phối mẫu thông số thực (trong trường hợp  ), ước lượng không thiên lệch Độ không thiên lệch rõ ràng điều ln mong muốn vì, điều có nghĩa là, mức trung bình, giá trị ước lượng với giá trị thực tế, số trường hợp cá biệt điều khơng

Có thể nói thơng số ước lượng OLS   đưa Phần 3.2 có tính chất

khơng thiên lệch Tuy nhiên, để chứng minh điều này, cần đặt số giả thuyết bổ sung Xt ut Cần nhớ rằng, Giả thiết 3.1 giảm nhẹ phần sau,

nhưng Giả thuyết 3.2 3.3 luôn cần thiết phải tuân theo Sau giả thiết bổ sung cần thiết

GIẢ THIẾT 3.3 (Sai Số Trung Bình Zero) Mỗi u biến ngẫu nhiên với E(u) =

Trong Hình 3.1 cần lưu ý số điểm quan sát nằm đường  + X số

điểm nằm Điều có nghĩa có giá trị sai số mang dấu dương số sai số mang dấu âm Do  + X đường trung bình, nên giả định sai số ngẫu nhiên bị loại trừ nhau, mức trung bình, tổng thể Vì thế, giả định ut

biến ngẫu nhiên với giá trị kỳ vọng hoàn toàn thực tế

GIẢ THIẾT 3.4 (Các Giá Trị X Được Cho Trước Không Ngẫu Nhiên)

Mỗi giá trị Xt cho trước không biến ngẫu nhiên Điều ngầm đồng

phương sai tổng thể Xt ut, Cov(Xt, ut) = E(Xt, ut) – E(Xt)E(ut) = XtE(ut) – XtE(ut)

= Do Xt ut khơng có mối tương quan (xem Định nghĩa 2.4 2.5)

Theo trực giác, X u có mối tương quan, X thay đổi, u thay đổi Trong trường hợp này, giá trị kỳ vọng Y không + X Nếu giá trị X khơng ngẫu nhiên giá trị kỳ vọng có điều kiện Y theo giá trị X + X Kết việc vi phạm Giả thiết 3.4 trình bày phần sau, đặc biệt nghiên cứu mơ hình hệ phương trình (Chương 13) Tính chất 3.3 phát biểu hai giả thiết bổ sung, thông số ước lượng OLS không thiên lệch

TÍNH CHẤT 3.3

(Độ Khơng Thiên Lệch)

Trong hai giả thiết bổ sung 3.3 3.4, [E(ut) = 0, Cov(Xt, ut) = 0], thông số ước lượng, thơng

số ước lượng bình phương tối thiểu ˆ ˆ không thiên lệch; nghĩa làE ˆ ,

 ˆ ˆ

E

(12)

Từ Phương trình (3.10), E ˆ ESxy Sxx Nhưng theo Giả thuyết 3.4, Xt không ngẫu

nhiên Sxx khơng ngẫu nhiên Điều có nghĩa tính giá trị kỳ vọng,

số hạng liên quan đến Xt đưa ngồi giá trị kỳ vọng Vì vậy, ta có

   xy

xx S E S

E ˆ  Trong Phương trình (3.12), thay Yt từ Phương trình (3.1) thay 

bằng n

                      n u X n X u X X

Sxy t t t t t t

    (3.15)                                 n u X n X X u X X

Xt t t t t t t t

2

2  

                              n u X u X n X

Xt t t t t t

2  xu xx S S  

trong Sxx cho Phương trình (3.13)

   n u X u X

Sxu  t t  tt (3.16)

tt t

t

tu X u X X u

X  

   

X trung bình mẫu X, Xt không ngẫu nhiên, X xuất số hạng, kỳ vọng

của tổng số hạng tổng giá trị kỳ vọng Do vậy,

 Sxu EXtutXE ut XtE utXE ut 0 E

theo Giả thiết 3.3 Do đó, E(Sxy) = Sxx, nghĩa E ˆ E(Sxy) Sxx  Như  ước lượng không thiên lệch  Chứng minh tương tự cho ^ Cần nhận thấy việc chứng minh độ không thiên lệch phụ thuộc chủ yếu vào Giả thiết 3.4 Nếu E(Xtut)  0, ˆcó thể bị

thiên lệch

BÀI TẬP 3.3

Sử dụng Phương trình (3.9) để chứng minh ˆ không thiên lệch Nêu rõ giả

thuyết cần thiết chứng minh

(13)

khác ~ = (Y2 – Y1)/(X2 – X1) Lưu ý

~

đơn giản độ dốc đường thẳng nối hai điểm (X1, Y1) (X2, Y2) Rất dễ nhận thấy

~

không thiên lệch

   

1

1

1

1

2

1

1

~

X X

u u

X X

u X u

X

X X

Y Y

    

       

     

Như nói trước đây, giá trị X không ngẫu nhiên E(u2) = E(u1) = Do đó,

~

khơng thiên lệch Thực ra, ta xây dựng chuỗi vô hạn thông số ước lượng khơng thiên lệch Bởi ~ loại bỏ giá trị quan sát từ đến n, cách trực quan thông số ước lượng “tốt” Trong Bài tập 3.6, tất giá trị quan sát sử dụng thể thiết lập thông số ước lượng không thiên lệch khác, tương tự là thông số ước lượng không thiên lệch tốt Do đó, cần có tiêu chuẩn bổ sung để đánh giá “độ tốt” thông số ước lượng

Tiêu chuẩn thứ hai cần xem xét tính quán, tính chất mẫu lớn định nghĩa Phần 2.6 (Định nghĩa 2.10) Giả sử ta chọn ngẫu nhiên mẫu có n phần tử tìm ˆ ˆ Sau chọn mẫu lớn ước lượng lại thông số

này Lặp lại q trình nhiều lần để có chuỗi thơng số ước lượng Tính qn tính chất địi hỏi thơng số ước lượng phù hợp cỡ mẫu tăng lên vô hạn Ước lượng ~ trình bày rõ ràng khơng đạt tính qn cỡ mẫu tăng lên khơng ảnh hưởng đến thơng số Tính chất 3.4 phát biểu điều kiện để ước lượng có tính qn

TÍNH CHẤT 3.4 (Tính Nhất Quán)

Theo Giả thiết (3.2), (3.3) (3.4), ước lượng bình phương tối thiểu có tính chất qn Do đó, điều kiện để đạt tính quán E(ut) = 0, Cov(Xt, ut) = Var(Xt)

CHỨNG MINH (Nếu độc giả khơng quan tâm, bỏ qua phần này.)

Từ Phương trình (3.15) (3.10)

n S

n S

xx xu

/ / ˆ 

(3.17)

Theo quy luật số lớn (Tính chất 2.7a), Sxu/n đồng quy với kỳ vọng nó,

Cov(X, u) Tương tự, Sxx/n đồng quy với Var(X) Do dẫn tới điều, n hội tụ đến vô

cùng,  đồng quy với  + [Cov(X,u)/Var(X), Cov(X,u) = – nghĩa X u không tương quan Như vậy, ˆ ước lượng quán 

(14)

Nói cách đơn giản, ước lượng khơng thiên lệch có tính hiệu ước lượng có phương sai nhỏ Để thiết lập tính hiệu quả, cần có giả thiết sau ut

GIẢ THIẾT 3.5 (Phương sai sai số không đổi)

Tất giá trị u phân phối giống với phương sai 2

, cho

 2

)

(utEut 

Var Điều gọi phương sai sai số không đổi (phân tán

đều)

GIẢ THIẾT 3.6 (Độc Lập Theo Chuỗi)

Giá trị u phân phối độc lập cho Cov(ut, us) = E(utus) = t s Đây

được gọi chuỗi độc lập

Các giả thiết ngầm phần dư phân có phân phối giống phân phối độc lập (iid) Từ Hình 1.2 ta thấy ứng với giá trị X có giá trị phân phối Y để xác định phân phối có điều kiện Sai số ut độ lệch từ trung bình có điều kiện + Xt Giả

thiết 3.5 ngầm định phân phối ut có phương sai (2) với phân phối us cho

một quan sát khác s Hình 3.4a ví dụ phương sai sai số thay đổi (hoặc không phân tán đều) phương sai thay đổi tăng theo giá trị quan sát X Giả thuyết 3.5 giảm nhẹ Chương Phần 3.6 Phụ chương có trình bày mô tả ba chiều giả thuyết

Giả thiết 3.6 (sẽ giảm nhẹ Chương 9) ngầm định ut us độc lập

vậy khơng có mối tương quan Cụ thể là, sai số liên tiếp không tương quan khơng tập trung Hình 3.4b ví dụ tự tương quan giả thuyết bị vi phạm Chú ý giá trị quan sát tập trung lại, có khả sai số có tương quan

HÌNH 3.4 Ví Dụ Phương Sai Của Sai Số Thay Đổi Tự Hồi Quy

Y

X

(15)

Y

X

b Tự hồi quy

TÍNH CHẤT 3.5

(Hiệu quả, BLUE Định lý Gauss-Markov)

Theo Giả thiết 3.2 đến 3.6, ước lượng bình phương tối thiểu thơng thường (OLS) ước lượng tuyến tính khơng thiên lệch có hiệu ước lượng Vì phương pháp OLS đưa Ước Lượng Không Thiên lệch Tuyến Tính Tốt Nhất (BLUE)

Kết (được chứng minh Phần 3.A.4) gọi Định lý Gauss–Markov, theo lý thuyết ước lượng OLS BLUE; nghĩa tất tổ hợp tuyến tính khơng thiên lệch Y, ước lượng OLS   có phương sai bé

Tóm lại, áp dụng phương pháp bình phương tối thiểu (OLS) để ước lượng hệ số hồi quy mơ hình mang lại số tính chất mong muốn sau: ước lượng (1) không thiên lệch, (2) có tính qn (3) có hiệu Độ khơng thiên lệch tính qn địi hỏi phải kèm theo Giả thuyết E(ut) = Cov(Xt, ut) = Yêu cầu tính hiệu

BLUE, cần có thêm giả thuyết, Var(ut) = 2 Cov(ut, us) = 0, với t s

3.4 Độ Chính Xác Ước Lượng Mức Độ Thích Hợp Mơ Hình

Sử dụng liệu ví dụ địa ốc ta ước lượng thông số sau ˆ52.351và

13875 , ˆ

 Câu hỏi ước lượng tốt mức độ thích hợp

hàm hồi quy mẫu Yˆt 52,3510,13875351X với liệu Phần thảo luận phương pháp xác định thông số đo lường độ xác ước lượng độ phù hợp

Độ Chính Xác Các Ước Lượng

(16)

Do ˆ vàˆ thuộc vào giá trị Y, mà Y lại phụ thuộc vào biến ngẫu nhiên u1, u2, …,

un, nên chúng biến ngẫu nhiên với phân phối tương ứng Sau phương trình

được rút Phần 3.A.6 phần phụ lục chương

  xx S E Var 2 ˆ ) ˆ

(      (3.18)

 

 

2 2 ˆ ˆ ) ˆ (     xx t nS X E

Var     (3.19)

  

 

ˆ ˆ ˆ ˆ ) ˆ , ˆ (        xx S X E

Cov      (3.20)

trong Sxx định nghĩa theo Phương trình (3.11) 2 phương sai sai số Cần

lưu ý Sxx tăng, giá trị phương sai đồng phương sai (trị tuyệt đối) giảm Điều

này cho thấy biến thiên X cao cỡ mẫu lớn tốt điều cho chứng tỏ độ thơng số ước lượng

Các biểu thức phương sai tổng thể ẩn số 2

ẩn số Tuy nhiên, thơng số ước lượng 2 có thể ước lượng dựa mẫu Lưu

ý Yˆt ˆˆXtlà đường thẳng ước lượng Do đó, uˆtYˆtˆ ˆXt ước lượng của ut, phần dư ước lượng Một ước lượng dễ thấy 2 uˆt /n

2

 ước lượng

này ngẫu nhiên bị thiên lệch Một ước lượng khác 2

cho sau (xem chứng minh Phần 3.A.7)

2 ˆ ˆ 2     n u

st (3.21)

Lý chia tử số cho n – tương tự trường hợp chia chi-square cho n – 1, thảo luận Phần 2.7 n – áp dụng xixcó điều kiện Để áp dụng chia cho n – 2, cần có hai điều kiện Phương trình (3.4) (3.5) Căn bậc hai phương sai ước lượng gọi sai số chuẩn phần dư hay sai số chuẩn hồi quy Sử dụng ước lượng này, ta tính ước lượng phương sai đồng phương sai

ˆ ˆ Căn bậc hai phương sai gọi sai số chuẩn hệ số hồi quy ký hiệu

ˆ

s s Phương sai ước lượng đồng phương sai hệ số hồi quy ước lượng ˆ

xx S s 2 ˆ ˆ 

  (3.22)

2 2 ˆ ˆ  xx t nS X

s   (3.23)

2   ˆˆ ˆ xx S X

(17)

Tóm lại: Trước tiên, cần tính hệ số hồi quy ước lượng ˆ ˆ cách áp dụng

Phương trình (3.9) (3.10) Kết cho cho mối quan hệ ước lượng Y X sau tính giá trị dự báo Yt theo Yˆt ˆˆXt Từ đó, ta tính phần dư uˆ theo t YtYˆt Sau tính tốn ước lượng phương sai ut dựa theo Phương trình (3.21) Thay kết

quả vào Phương trình (3.18), (3.19) (3.20), ta giá trị phương sai đồng phương sai ˆ ˆ

Cần lưu ý để công thức tính phương sai phần dư s2 được cho Phương trình

3.21 có ý nghĩa, cần có điều kiện n > Khơng có giả thuyết này, phương sai ước lượng khơng xác định âm Điều kiện tổng quát phát biểu Giả thuyết 3.7, bắt buộc phải tuân theo

GIẢ THIẾT 3.7 (n > 2)

Số lượng quan sát (n) phải lớn số lượng hệ số hồi quy ước lượng (k) Trong trường hợp hồi quy tuyến tính đơn biến, điều kiện n > khơng có

Ví dụ 3.2

Sau sai số chuẩn ví dụ giá nhà, Sai số chuẩn phần dư = s = ˆ = 39,023 Sai số chuẩn ˆ sˆ 37,285

Sai số chuẩn ˆ sˆ 0,01873

Đồng phương sai ˆ ˆ sˆˆ 0,671

Thực hành máy tính Phần 3.1 Phụ chương D cho kết tương tự

Mặc dù có đại lượng đo lường số học độ xác ước lượng, tự thân đo lường không sử dụng đo lường lớn nhỏ cách tùy tiện cách đơn giản thay đổi đơn vị đo lường (xem thêm Phần 3.6) Các đo lường sử dụng chủ yếu việc kiểm định giả thuyết, đề tài thảo luận chi tiết Phần 3.5

Độ Thích Hợp Tổng Qt

Hình 3.1 cho thấy rõ khơng có đường thẳng hồn tồn “thích hợp” với liệu có nhiều giá trị dự báo đường thẳng cách xa với giá trị thực tế Để đánh giá mối quan hệ tuyến tính mơ tả giá trị quan sát có tốt mối quan hệ tuyến tính khác hay khơng, cần phải có đo lường tốn học độ thích hợp Phần phát triển thơng số đo lường

Khi thực dự báo biến phụ thuộc Y, ta có thơng tin giá trị quan sát Y có từ số phân phối xác suất, có lẽ cách tốt là ước lượng giá trị trung bình Y phương sai sử dụng ˆ2   2 1

n Y Yt Y

 Nếu cần dự

(18)

phương cho tất mẫu, ta tính tổng phương sai Yt so với Y  

2

YY Đây

tổng bình phương tồn phần (TSS) Độ lệch chuẩn mẫu Y đo lường độ phân tán của Yt xung quanh giá trị trung bình Y, nói cách khác độ phân tán sai số sử

dụng Y làm biến dự báo, cho sau ˆYTSSn1

Giả sử ta cho Y có liên quan đến biến X khác theo Phương trình (3.1) Ta hy vọng biết trước giá trị X giúp dự báo Y tốt dùng Y Cụ thể là, ta có ước lượng ˆ ˆ biết giá trị X Xt, ước lượng Yt

t

t X

Yˆ ˆˆ Sai số ước lượng uˆtYtYˆt Bình phương giá trị sai số tính tổng sai số cho tồn mẫu, ta có tổng bình phương sai số (ESS), hay tổng bình phương phần dư, ESS = ˆ2

t

u Sai số chuẩn phần dư ˆ  ESS(n2) Giá trị đo lường độ phân tán sai số sử dụng Yˆ làm biến dự báo thường t

so sánh với ˆ cho để xem xét mức độ giảm xuống Bởi ESS Y

càng nhỏ tốt, mức độ giảm xuống nhiều Trong ví dụ đưa ra, ˆY 88,498

023 , 39 ˆ 

 , giảm phân nửa so với giá trị ban đầu

Phương pháp khơng hồn tồn tốt lắm, nhiên sai số chuẩn nhạy cảm đơn vị đo lường Y nên cần có thơng số đo lường khác không nhạy cảm với đơn vị đo lường Vấn đề đề cập sau

HÌNH 3.5 Các Thành Phần Y

Y

X

X ,tYt

t

X Yˆˆˆ

Y YˆtY

X t

Y

t X Y Yt

Thông số đo lường tổng biến thiên Yˆtso với Y (là giá trị trung bình Yˆ ) cho tồn t

mẫu YˆtY2 Được gọi tổng bình phương hồi quy (RSS) Phần 3.A.8 cho thấy

    

   ˆ   ˆ2

t t

t Y Y Y u

Y (3.25)

(19)

Nếu mối quan hệ X Y “chặt chẽ”, điểm phân tán (Xt, Yt) nằm gần đường

thẳng ˆˆX nói cách khác ESS nhỏ RSS lớn Tỷ số

TSS ESS TSS

RSS  

1

được gọi hệ số xác định đa biến ký hiệu R2 Thuật ngữ đa biến không áp dụng

hồi quy đơn biến có biến phụ độc lập X Tuy nhiên, biểu thức R2

trong hồi quy đơn biến giống hồi quy đa biến nên dùng thuật ngữ

  TSS

RSS TSS ESS Y Y u R t t      



ˆ

2

0 R2 1 (3.26)

Rõ ràng rằng, R2

nằm khoảng từ đến R2 khơng có thứ ngun tử số mẫu số có đơn vị Điểm quan sát gần đường thẳng ước lượng, “độ thích hợp” cao, nghĩa ESS nhỏ R2

lớn Do vậy, R2 thông số đo lường độ thích hợp, R2 càng cao tốt ESS cịn gọi biến thiên khơng giải thích uˆ ảnh t hưởng biến khác ngồi Xt khơng có mơ hình RSS biến thiên giải

thích Như vậy, TSS, tổng biến thiên Y, phân thành hai thành phần: (1) RSS, phần giải thích theo X; (2) ESS, phần khơng giải thích Giá trị R2

nhỏ nghĩa có nhiều biến thiên Y khơng thể giải thích X Ta cần phải thêm vào biến khác có ảnh hưởng đến Y

Ngoài ý nghĩa tỷ lệ tổng biến thiên Y giải thích qua mơ hình, R2 cịn có ý nghĩa khác Đó thơng số đo lường mối tương quan giá trị quan sát Yt và giá

trị dự báo ˆ( ˆ)

t tY

Y t r

Y Cần xem lại phần trình bày hệ số tương quan mẫu tổng thể

ở Phần 2.3 3.5 Phần 3.A.9 trình bày

2 2 ˆ ) ˆ ( ) ( ) ˆ ( R TSS RSS Y Var Y Var Y Y Cov r t t t t Y

Y    (3.26a)

Như vậy, bình phương hệ số tương quan đơn biến giá trị quan sát Yt và giá trị dự báo

t

bằng phương trình hồi quy cho kết với giá trị R2 định nghĩa Phương trình (3.26a) Kết trường hợp có nhiều biến giải thích, miễn là hồi quy có số hạng số

Có thắc mắc phổ biến độ thích hợp tổng thể, “bằng cách để xác định rằng R2

cao hay thấp?” Khơng có quy định chuẩn hay nhanh chóng để kết luận R2

như cao hay thấp Với chuỗi liệu theo thời gian, kết R2

thường lớn có nhiều biến theo thời gian chịu ảnh hưởng xu hướng tương quan với nhiều Do đó, giá trị quan sát R2

thường lớn 0.9 R2 bé 0.6 0.7 xem thấp Tuy nhiên, đối với liệu chéo, đại diện cho dạng yếu tố thay đổi vào thời điểm đó, R2

thường thấp Trong nhiều trường hợp, R2

(20)

giá mơ hình xem dấu hệ số hồi quy có phù hợp với lý thuyết kinh tế, trực giác kinh nghiệm người nghiên cứu hay khơng

Ví dụ 3.3

Trong tập giá nhà, TSS, ESS R2

có giá trị sau (xem lại kết Phần thực hành máy tính 3.1):

TSS = 101.815 ESS = 18.274 R2 = 0,82052

Như vậy, 82,1% độ biến thiên giá nhà mẫu giải thích diện tích sử dụng tương ứng Trong chương 4, thấy thêm vào biến giải thích khác, số lượng phòng ngủ phòng tắm cải thiện độ thích hợp mơ hình

3.5 Kiểm Định Giả Thuyết Thống Kê

Như đề lúc đầu, kiểm định giả thuyết thống kê nhiệm vụ nhà kinh tế lượng Trong mơ hình hồi quy (3.1),  0, giá trị dự báo Y độc lập

với X, nghĩa X khơng có ảnh hưởng Y Do đó, cần có giả thuyết = 0, ta kỳ

vọng giả thuyết bị bác bỏ Hệ số tương quan () hai biến X Y đo lường

độ tương ứng hai biến Ước lượng mẫu  cho Phương trình (2.11) Nếu

= 0, biến khơng có tương quan Do cần kiểm định giả thuyết = Phần

này thảo luận phương pháp kiểm định giả thuyết   Kiểm định giả thuyết đối với p trình bày phần sau Cần lưu ý rằng, trước tiếp tục phần tiếp theo, bạn nên xem lại Phần 2.8 kiểm định giả thuyết Phần 2.7 loại phân phối

Kiểm định giả thuyết bao gồm ba bước sau: (1) thiết lập hai giả thuyết trái ngược (Giả thuyết không Giả thuyết ngược lại), (2) đưa kiểm định thống kê phân phối xác suất cho giả thuyết không, (3) đưa quy luật định để bác bỏ hay chấp nhận giả thuyết không Trong ví dụ giá nhà, Giả thuyết khơng Ho :  = Bởi kỳ

vọng  dương, Giả thuyết ngược lại H1: 0 Để thực kiểm định này, ˆ

sai số chuẩn ước lượng s sử dụng để đưa thống kê kiểm định Để đưa phân phối mẫu cho  , mà điều ảnh hưởng gián tiếp đến số hạng sai số ngẫu nhiên u1, u2,

…un (xem Phương trình 3.15), cần bổ sung giả thuyết phân phối ut

GIẢ THIẾT 3.8 (Tính Chuẩn Tắc Sai Số)

Mọi giá trị sai số ut tuân theo phân phối chuẩn N(0, 2) , nghĩa mật độ có điều kiện Y

theo X tuân theo phân phối N( + X, 2)

Như vậy, số hạng sai số u1, u2, …un được giả định độc lập có phân phối chuẩn

giống với giá trị trung bình khơng phương sai 2

(21)

BẢNG 3.2 Các Giả Thiết Mô Hình Hồi Quy Tuyến Tính Đơn Biến

3.1 Mơ hình hồi quy đường thẳng với ẩn số hệ số  ; Yt = + Xt + ut, với t = 1, 2, 3…, n

3.2 Tất giá trị quan sát X khơng giống nhau; phải có giá trị khác biệt

3.3 Sai số ut biến ngẫu nhiên với trung bình khơng; nghĩa là, E(ut) =

3.4 Xt cho không ngẫu nhiên, điều ngầm định không tương quan với ut;

nghĩa Cov (Xt, ut) = E(Xtut) – E(Xt)E(ut)=

3.5 ut có phương sai khơng đổi với t; nghĩa Var(ut) = E ut2 2

3.6 ut us có phân phối độc lập t s, cho Cov(ut, us) = E(ut us)

3.7 Số lượng quan sát (n) phải lớn số lượng hệ số hồi quy ước lượng (ở n > 2)

3.8 ut tuân theo phân phối chuẩn ut ~ N(0, 2), nghĩa ứng với giá trị Xt cho trước, Yt ~ N(

+ Xt, 2)

Xác Định Trị Thống Kê Kiểm Định

Phần chứng minh kiểm định thống kê tc ˆ0 sˆ tuân theo phân phối Student

t, theo giả thuyết không, với bậc tự n – (bởi ta ước lượng hai tham số  ) Lưu ý Giả thuyết 3.7 cần để chắn bậc tự dương

CHỨNG MINH (Độc giả khơng quan tâm đến nguồn gốc vấn đề, bỏ qua phần này)

Trước hết cần xem xét tính chất sau

TÍNH CHẤT 3.6

a ˆ ˆ có phân phối chuẩn

b  2  ˆ2

) (

ˆ     

ut n có phân phối chi-bình phương với bậc tự n–2

c ˆ ˆ phân phối độc lập với ˆ2

Tính chất 3.6a xuất phát từ thực tế ˆ ˆ tổ hợp tuyết tính ut ut

phân phối chuẩn Để chứng minh tính chất b c, nên tham khảo tài liệu Hogg Graig (1978, trang 296-298) Tận dụng kết qua ta

), , ( ~

ˆ

ˆ

 

N ˆ ~N(,2ˆ),

2

~ ˆ

2 

n t

X u

trong

ˆ

 ˆ

 phương sai ˆ ˆ theo Phương trình (3.18) (3.19) Bằng cách

(22)

  ), , ( ~ ˆ ˆ ˆ N       ), , ( ~ ˆ ˆ ˆ N   

   

2 ~ ˆ 2   n X n  

Trong phần 2.7, phân phối t định nghĩa tỷ số số chuẩn chuẩn hóa bậc hai chi-square độc lập với Thay vào cho  áp dụng phương trình (3.18), (3.19) (3.22), ta

      ˆ ˆ 2 ˆ ~ ˆ ˆ ˆ ˆ ˆ ˆ             

tn

s t                         ˆ ˆ ˆ ˆ ˆ    xx xx S S s ˆ

s sai số chuẩn ước lượng ˆ theo Phương trình (3.22)

t trình bày trị thống kê kiểm định dựa quy luật định thiết lập sau Kiểm định gọi kiểm định t Các bước kiểm định thống kê phân hai trường hợp kiểm định phía kiểm định hai phía trình bày sau

Quy Tắc Ra Quyết Định

Kiểm định t-test phía

BƯỚC H0:  = 0 H1: 0

BƯỚC Kiểm định thống kê tc ˆ0 sˆ , tính dựa mẫu Theo giả

thuyết không, kiểm định thống kê có phân phối t với bậc tự n – Nếu tc

tính “lớn”, ta nghi ngờ  khơng 0 Điều dẫn

đến bước

BƯỚC Trong bảng tra phân phối t trang bìa trước sách, tra bậc tự n – Và chọn mức ý nghĩa () xác định điểm t*n–2() cho P(t > t*) =

BƯỚC Bác bỏ H0 tc > t* Nếu giả thuyết ngược lại < 0 , tiêu chuẩn kiểm định

để bác bỏ H0 tc < –t*

Kiểm định minh họa hình ảnh qua Hình 3.6 (ký hiệu  sử dụng để

chỉ mức ý nghĩa để tránh nhầm lẫn với  tung độ) Nếu tc rơi vào diện tích in đậm

hình vẽ (được gọi vùng tới hạn) nghĩa tc >t* Trong trường hợp đó, giả thuyết khơng

(23)

HÌNH 3.6 Kiểm Định Một Phía với H0:  = 0 H1:  0

Chấp nhận Ho Bác bỏ Ho

Diện tích a

0 f(tn-2)

tn-2

t*n-2(a)

Ví dụ 3.4

Trong ví dụ giá nhà, ta có 0 = Do đó, tc ˆ sˆ , kiểm định thống kê đơn giản

tỷ số hệ số hồi quy ước lượng sai số chuẩn Tỷ số gọi trị thống kê t Các ước lượng ˆ 0,13875, theo ví dụ 3.2 ta biết sˆ 0,01873 Do đó, trị thống kê t tính tc = 0,13875/0,01873 = 7.41 Bậc tự n – = 14 – = 12 Cho mức ý nghĩa

là 1%, nghĩa  = 1% Tra bảng phân phối t, ta t*n–2=2,681 Do tc > t*, giả thuyết

H0 bị bác bỏ kết luận  lớn zero cách đáng kể với mức ý nghĩa 1%

Lưu ý hệ số có ý nghĩa trường hợp mức ý nghĩa 0,05% t*12(0,0005) = 4,318

Trị thống kê t ˆ cho tc = 52,351/37,285 = 1.404 nhỏ t*12(0,0005) =

1.782 Do khơng thể bác bỏ H0 thay vào có thể kết luận  khơng

lớn zero xét mặt thống kê với mức ý nghĩa 5% Các điểm ˆ không nghĩa hai

điểm sau Thứ nhất, X = hồn tồn năm ngồi khoảng mẫu ước lượng Yˆ X

= không đáng tin cậy (xem thêm Phần 3.9) Thứ nhì, từ Hình 3.1 thấy đặc điểm hai biến khơng đầy đủ để giải thích độ biến thiên giá giá trị quan sát Trong

chương cho thấy ˆ bao hàm ảnh hưởng trung bình biến bị bỏ sót tính phi

tuyến, X Các ảnh hưởng làm cho ˆ khơng có ý nghĩa

Một Số Lưu Ý Sử Dụng Kiểm Định t-Test

Mặc dù kiểm định t-test hữu ích việc xác định ý nghĩa thống kê hệ số, nhiên dễ nhầm lẫn ý nghĩa kiểm định Ví dụ, Ví dụ 3.4 kiểm định t-test đối

với  bác bỏ giả thuyết không  = Như có phải kiểm định “chứng

minh”  = hay khơng? Câu trả lời khơng Có thể chắn rằng, theo tập liệu

và mơ hình mơ tả, khơng có chứng cho thấy > Trong chương 4, đề

(24)

tích thêm kiểm định chuẩn đoán cần thiết để đưa kết luận ý nghĩa (ổn định theo đặc điểm mô hình)

Phương Pháp p-value Kiểm Định Giả thuyết

Kiểm định t-test thực theo phương pháp khác tương đương Trước tiên tính xác suất để biến ngẫu nhiên t lớn trị quan sát tc, nghĩa

p-value = P(t>tc ) = P (sai lầm loại I)

Xác suất (được gọi p-value) phần diện tích bên phải tc phân phối t (xem Hình

3.7) xác suất sai lầm loại I – nghĩa xác suất loại bỏ giả thuyết H0 Xác suất

cao cho thấy hậu việc loại bỏ sai lầm giả thuyết H0 nghiêm trọng p-value

bé nghĩa hậu việc loại bỏ giả thuyết H0 không nghiêm trọng (nghĩa là, xác

suất xảy sai lầm loại I thấp) yên tâm bác bỏ H0 Như vậy, quy luật

quyết định không bác bỏ H0 p -value lớn, ví dụ: lớn 0,1, 0,2, 0,3 Nói cách

khác, p-value lớn mức ý nghĩa , kết luận hệ số hồi quy không lớn

0 mức ý nghĩa  Nếu p-value nhỏ , giả thuyết H0 bị bác bỏ kết luận 

lớn 0 cách đáng kể

Để thấy tương đương hai phương pháp, lưu ý Hình 3.7 xác suất P(t>tc ) bé mức ý nghĩa , điểm tương ứng tc phải nằm bên phải điểm t*n-2()

Nghĩa tc rơi vào miền bác bỏ Tương tự, xác suất P(t>tc ) lớn mức ý nghĩa ,

điểm tương ứng tc phải nằm bên trái điểm t*n-2() rơi vào miền chấp nhận Sau

đây bước bổ sung phương pháp p-value sau:

HÌNH 3.7 Kiểm Định Giả thuyết theo Phương Pháp p-value

Bác bỏ Ho nếu

p- value< a

0 f(tn-2)

tn-2

t* tc

BƯỚC 3a Tính xác suất (ký hiệu p-value) để t lớn tc , nghĩa tính phần diện tích

bên phải giá trị tc

BƯỚC 4a Bác bỏ H0 kết luận hệ số có ý nghĩa p-value bé mức ý nghĩa

(25)

Tóm lại,  xem lớn 0 cách đáng kể trị thống kê t lớn hay p-value

bé, mức độ lớn bé định người nghiên cứu Phương pháp phổ biến kiểm định giả thuyết xác định giá trị mốc t* Tuy nhiên theo hương pháp tính p-value, lại cần tính tốn phần diện tích đầu ứng với giá trị tc cho trước Ngày

có nhiều phần mềm máy tính tính tốn sẵn p-value (chương trình SHAZAM ESL giới thiệu sách này) phương pháp dễ ứng dụng dễ dàng Tuy nhiên, cần cẩn thận kiểm tra lại giá trị p-value dùng cho kiểm phía hay kiểm định hai phía

Ví dụ 3.4a

Để áp dụng phương pháp p-value cho ví dụ giá nhà, ta tính xác suất để t lớn giá trị quan sát  = 7.41 Sử dụng ESL để tính tốn ta p < 0,0001 (tham khảo phần kết phần Thực hành máy tính 3.1) Điều có nghĩa là, ta bác bỏ giả thuyết khơng, cơ hội để xảy sai lầm loại I bé 0,01%, hồn tồn n tâm bác bỏ Ho

kết luận  lớn Đối với tham số , p-value 0,093, nghĩa P(t>1,404) = 0,093 Nếu H0:  = bị bác bỏ, xác suất để xảy sai lầm loại I 9,3%, lớn 5% Do

đó, khơng thể bác bỏ H0 mức ý nghĩa 5%, nghĩa ta có kết luận phương

pháp đầu, mức ý nghĩa 5%,  không lớn zero xét mặt thống kê Như phương pháp p-value có ưu điểm là, ta biết xác mức độ mà hệ số có ý nghĩa

và đánh giá xem mức ý nghĩa đủ thấp hay không để xem xét bác bỏ H0 Cuối

cùng, không cần lo lắng giá trị 0,01, 0,05 0,1

Kiểm Định t-test Hai Phía

Bao gồm bước sau:

BƯỚC H0: = 0 H1: 0

BƯỚC Kiểm định thống kê tc ˆ0 sˆ , tính dựa mẫu Theo giả

thuyết không, kiểm định thống kê có phân phối t tn-2.

BƯỚC Trong bảng tra phân phối t trang bìa trước sách, tra bậc tự n – chọn mức ý nghĩa () xác định điểm t*n–2() cho P(t>t*) = /2 (phân

nửa mức ý nghĩa)

BƯỚC 3a Áp dụng phương pháp - value, tính giá trị p

- value = P(t > tc t < –tc ) = 2P(t > tc)

phân phối t đối xứng

BƯỚC Bác bỏ H0tc> t* kết luận khác với 0 cách đáng kể mức ý

nghĩa

BƯỚC 4a Bác bỏ H0 p-value < , mức ý nghĩa

Kiểm định minh họa hình ảnh qua Hình 3.8 Bậc tự trường hợp này n–2 Nếu trị thống kê t (tc ) rơi vào vùng diện tích đen, giả thuyết khơng bị bác bỏ

và kết luận  khác với 0 giá trị t* = sử dụng quy luật để đánh giá mức

(26)

HÌNH 3.8 Kiểm Định Hai Phía với H0:  = 0 H1:  0

Diện tích a/2

0 f(tn-2)

tn-2

t*n-2(a/2)

Diện tích a/2

Chấp

nhận Ho Bác bỏ Ho

Bác bỏ Ho

-t*n -2(a/2)

Ví dụ 3.5

Theo cách tính tc ví dụ giá nhà có giá trị cách tính theo t-test, ˆ 7.41và

404 ˆ 

Tra bảng giá trị t, ta có * (0.005) 3.055

12 

t , điều có nghĩa diện tích

phía tương ứng với giá trị 3.055 0.01 Bởi ˆthì tc>t* ta loại giả thuyết

H0và kết luận  khác với mức ý nghĩa 1% Đối với ˆ t12* (0.025)2.179lớn

hơn giá trị tc Do ta khơng thể bác bỏ giả thuyết H0 (lưu ý ta dùng kiểm định

giá trị  mức ý nghĩa 5%) Từ bước 3a ta suy giá trị p-value

) 404 ( ˆ  P t

= 0.186 (lưu ý giá trị p-value tương ứng với tc trường hợp kiểm định

2 phía gấp lần giá trị trường hợp kiểm định phía) Do sai lầm loại I có giá trị 18.6% chấp nhận nên ta bác bỏ giả thuyết H0:  = Điều

này có nghĩa  khơng có ý nghĩa thống kê  lại có

BÀI TẬP 3.4

Trong ví dụ giá nhà, kiểm định giả thuyết H0: = 0.1 giả thuyết H1:   0.1 lần

lượt mức ý nghĩa 0.05 0.01

BÀI TẬP 3.5

Chứng minh hệ số có ý nghĩa mức 1% hệ số có ý nghĩa mức cao

BÀI TẬP 3.6

Hãy chứng minh hệ số khơng có ý nghĩa mức 10% hệ số khơng có ý nghĩa mức ý nghĩa thấp 10%

Kiểm Định 2

Mặc dù thống kê kiểm định mức ý nghĩa phương sai sai số2không phổ biến trình bày đầy đủ phần Kiểm định 2gồm bước sau:

(27)

BƯỚC Trị kiểm định

0

2

ˆ ˆ ) (

 

  n

Qc Sau tra bảng phân phối Chi-square với

bậc tự n-2 Nếu Q có giá trị “lớn” ta nghi ngờ 2

không

0

BƯỚC Trong bảng tra phân phối Chi-square trang bìa trước sách, tra giá trị Q*n-2() cho diện tích bên phải

BƯỚC Bác bỏ H0 mức ý nghĩa  Qc> Q*n-2()

Nguyên nhân tổng quát làm cho kiểm định không phổ biến người kiểm định khơng có thơng tin sơ cấp ban đầu giá trị 2sử dụng giả thuyết H

0

Kiểm Định Độ Thích Hợp

Ta thực kiểm định độ thích hợp Gọi p hệ số tương quan tổng thể X Y định nghĩa Phương trình (2.7) Theo phương trình (2.11), ta thấy giá trị ước lượng p2 xác định rxy2 Sxy2 /(SxxSyy)trong Sxx Sxy định nghĩa theo Phương

trình (3.8) (3.9),

 

TSS Y

Y n

Y Y

Syy t tt  

    

   

  

2

2

)

( (3.27)

Ở Phần 3.A.10 người ta chứng minh r2

xy với R2 (điều

trường hợp hồi qui đơn biến mà thôi) Ở Phần kiểm định giả thuyết 2.8 trình bày phương pháp kiểm định giả thuyết cho X Y khơng có mối tương quan Kiểm định gọi kiểm định F (F-test) Kiểm định F-test gồm bước sau:

BƯỚC H0: xy = H1: xy

BƯỚC Trị thống kê kiểm định Fc = R2(n – 2)/(1 – R2) Fc tính

theo cơng thức sau Fc = RSS(n – 2)/ESS Theo giả thuyết H0, trị thống kê

tuân theo phân phối F với bậc tự tử số n – bậc tự mẫu số

BƯỚC Tra bảng F theo bậc tự tử số n – bậc tự mẫu số tìm giá trị F* 1, n – 2

() cho phần diện tích phía phải F* , mức ý nghĩa BƯỚC Bác bỏ giả thuyết H0 (tại mức ý nghĩa ) Fc > F*

Nên lưu ý giả thuyết H0 khơng hợp lệ có nhiều giá trị X Như

trình bày chương 4, kiểm định F sử dụng H0 khác

Ví dụ 3.6

Trong ví dụ giá nhà, R2

= 0,82052 Fc = 0,82052(14 – 2)/(1 – 0,82052) = 54,86 Theo ví dụ

3.5, ESS = 18.274, RSS = TSS – ESS = 83.541 Vì Fc cịn tính theo cơng

thức khác bước 2: Fc = 83.541 (14 – 2)/18.274 = 54,86 Bậc tự tử số 1,

mẫu số 12 Với mức ý nghĩa  = 5%, tra bảng A.4b ta F*1, 12(0.05) = 4,75 Vì Fc >

(28)

Thực ra, Fc > F*1, 12(0.01) (tra bảng A.4a), giả thuyết H0 bị bác bỏ mức ý nghĩa

1% Như vậy, giá trị R2

nhỏ 1, khác đáng kể

Trình Bày Các Kết Quả Hồi Quy

Các kết phân tích hồi quy trình bày theo nhiều cách Theo cách thơng thường, người ta viết phương trình ước lượng kèm với trị thống kê t hệ số hồi quy sau:

SQFT 13875 , 351 , 52

GIAÙ 

(1,404) (7,41)

821

2 

R df 12 ˆ 39.023

Một cách khác điền sai số chuẩn hệ số hồi quy:

SQFT 13875 , 351 , 52

GIAÙ 

(37.29) (0.019)

Nếu nhiều mơ hình hồi quy ước lượng, việc trình bày kết dạng bảng Bảng 4.2 thuận tiện

Việc tách tổng bình phương tồn phần thành thành phần thường tóm tắt dạng bảng Phân Tích Phương Sai (ANOVA) Bảng 3.3

3.6 Thang Đo Đơn Vị Đo

Giả sử tính GIÁ theo đơn vị đồng đơla thay theo ngàn đồng đôla Cột GIÁ bảng 3.1 chứa giá trị 199.900, 228.000, v.v Những ước lượng hệ số hồi quy, các sai số chuẩn chúng, R2, v.v bị ảnh hưởng thay đổi đơn vị này?

Câu hỏi khảo sát GIÁ SQFT tính đơn vị khác Đầu tiên chạy lại mơ hình

GIÁ =  + SQFT + u

Gọi GIÁ*

giá tính theo la thường Như GIÁ* = 1.000 GIÁ Nhân số hạng

trong phương trình với 1.000 thay GIÁ* vào vế trái Chúng ta có

GIÁ* = 1.000 + 1.000SQFT + 1.000u = GIÁ* = * + *SQFT + u*

Nếu áp dụng phương pháp OLS cho phương trình cực tiểu hóa  (u*t)2,

chúng ta tìm giá trị ước lượng *

* Dễ dàng nhận thấy hệ số hồi quy hệ số cũ nhân với 1,000 Như vậy, thay đổi thang đo biến phụ thuộc mơ hình hồi quy làm cho thang đo hệ số hồi quy thay đổi theo tương ứng Vì u* = 1,000u, phần dư sai số chuẩn nhân lên 1.000 Tổng bình phương nhân thêm triệu (1.000 bình phương) Cần lưu ý trị thống kê t, F, R2

(29)

BẢNG 3.3 Phân Tích Phương Sai

Nguồn Tổng bình phương

(SS)

Bậc tự (d.f.)

Bình phương trung bình

(SSd.f.)

F

Hồi quy (RSS)

) ˆ (YtY

 = 83.541 83.541 5486

ESS n RSS

, ) (

 

Sai số (ESS) ˆ2

t

u = 18.274 N – = 12 1.523

Tổng (TSS)

) (YtY

 = 101.815 N – = 13 7.832

Tác động việc thay đổi thang đo biến độc lập sao? Giả sử SQFT tính theo đơn vị trăm mét vng thay theo mét vng thơng thường, GIÁ tính theo đơn vị ngàn đơla trước Gọi SQFT’ biến tính theo trăm mét vng Vậy SQFT= 100SQFT’ Thay vào phương trình ban đầu ta có:

GIÁ =  + 100SQFT’ + u

Rõ ràng theo phương trình này, hồi quy GIÁ theo số SQFT’, hệ số bị ảnh hưởng hệ số SQFT Nếu  hệ số SQFT’, ˆ'100ˆ Sai số chuẩn nhân với 100 Tuy nhiên, tất số đo khác – ESS, giá trị thống kê t, F, R2

chẳng hạn khơng bị ảnh hưởng Tóm lại, mơ hình hồi quy tuyến tính, thang đo biến độc lập thay đổi hệ số hồi quy sai số chuẩn tương ứng thay đổi tương ứng trị thống kê khác không thay đổi

Có lý đáng để thay đổi thang đo giá trị cho số sau thay đổi không lớn không nhỏ tương tự với giá trị biến khác Điều số có giá trị lớn lấn át sai số số nhỏ gây sai số làm tròn, đặc biệt tính giá trị tổng bình phương, việc làm ảnh hưởng xấu đến độ xác kết

Để hiểu cách thực tế hậu việc thay đổi đơn vị, Thực Hành Máy Tính phần 3.2 phụ lục D

BÀI TẬP 3.7

Giả sử đặt biến X*

= SQFT – 1.000 (nghĩa là, X* phần diện tích vng

trên 1.000) ước lượng mơ hình GIÁ = a + bX*

+ v Giải thích cách bạn có thể tìm aˆ bˆ từ ˆ ˆ mà khơng phải ước lượng lại mơ hình

3.7 Ứng dụng: Ước Lượng Đường Engel Biểu Diễn Quan Hệ Giữa Chi Tiêu cho Chăm Sóc Sức Khỏe Thu Nhập

(30)

EXPHLTH = Chi tiêu tổng hợp (đơn vị tỷ đôla) cho chăm sóc sức khỏe bang vào năm 1993, Bảng 153, trang 111, khoảng từ 0,998-9,029

INCOME = Thu nhập cá nhân (đơn vị tỷ đôla) bang vào năm 1993, Bảng 712, trang 460, khoảng từ 9,3-64,1

Mơ hình đường Engel tìm ví dụ 1.4 áp dụng với tổng chi tiêu cho chăm sóc sức khỏe Mỹ hàm số theo tổng thu nhập cá nhân Phần Ứng Dụng Máy Tính 3.3 (xem phụ lục bảng D.1) trình bày hướng dẫn để tìm kết Bản thích báo cáo in từ máy tính, sử dụng chương trình ESL tập tin PS3-3.ESL, trình bày bảng 3.4 Phần in đậm nhập lượng chương trình phần in nghiêng nhận xét kết Bạn nên tìm hiểu thích cẩn thận sử dụng chương trình hồi quy bạn có để chạy lại kết (tập tin PS3-3.SHZ chứa dòng lệnh để sử dụng phần mềm SHAZAM) Dưới mơ hình ước lượng với trị thống kê mẫu t ngoặc đơn, p-value (giá trị xác suất p) ngoặc vuông:

INCOME 141652

, 176496 ,

0

EXPHLTH 

(0.378) (49.272)

[0.707] [<0.0001]

R2 = 0,98 d.f = 49 F = 2.428 ˆ = 2,547

Mơ hình thích hợp với số liệu 98% biến đổi chi tiêu cho chăm sóc sức khỏe giải thích biến thu nhập Như giải thích Bảng 3.3, số hạng số khơng có ý nghĩa mặt thống kê phù hợp với tiêu chuẩn lý thuyết đề ví dụ 1.4,  = Để biết thêm chi tiết, xem thích Bảng 3.4

3.8 Khoảng Tin Cậy

Như Phần 2.9, cách để xem xét trực tiếp đến việc ước lượng   điều kiện không chắn xác định khoảng tin cậy Như vậy, ví dụ, thay nói ˆ =

0,139 nói với mức xác suất cho trước, ^ nằm khoảng từ 0,09 đến 0,17 Từ kết giá trị thống kê kiểm định phần 3.5 ta có:

2

~ ˆ

n t s

 

ˆ ~tn2 s

 

Đặt t*

n-2(0,025) điểm name phân phối t với n-2 bậc tự cho P(t>t*) = 0,025

Điều tương đương với P(- t*

t t*) = 0,95 Như vậy,

BẢNG 3.4 Báo Cáo từ Máy Tính Kèm Theo Chú Giải cho Phần 3.7 Các lệnh ESL in đậm nhận xét in nghiêng

Danh sách biến

(0) Hằng số (1) exphlth (2) income

(31)

EXPHLTH

94,178 | o |

|

78,648 +

| |

| o |

52,764 +

| o | o

| o | o o 26,881 + o

| o o | o

| o ooo | oooo o

0,998 + ooo

| +++++++

9,3 income 683,5

Ước lượng OLS với 51 quan sát 1-51 Biến phụ thuộc EXPHLTH

Biến Hệ số Sai số chuẩn T-stat Prob(t >T)

(0) 0,176496 0,467509 0,377525 0,707414

(1) income 0,141652 0,002875 49,271792 <0,0001***

Giá trị ước lượng hệ số biến thu nhập ˆ = 0,141652 ước lượng số hạng

hằng số ˆ = 0,176496 Trị thống kê t (hệ số chia cho sai số chuẩn) biến thu nhập

49,271792, giá trị ý nghĩa 2Prob(t >T) vùng diện tích hai đầu phân phối t chặn giá trị kiểm định t giá trị p-value xác suất sai lầm loại I (đối với kiểm định phía) Nếu p-value nhỏ (trong trường hợp này, nhỏ 0,0001), “an toàn” khi bác bỏ giả thuyết Ho = 0, kết luận hệ số biến thu nhập khác đáng kể Giá trị p-value số hạng số 0,707414 gợi ý bác bỏ

giả thuyết Ho cho = 0, phạm phải sai lầm loại I 70,7 % số lần

Vì mức sai lầm cao, bác bỏ giả thuyết Ho Như kết luận số hạng số không khác đáng kể Lưu ý ví dụ 1.4, việc suy diễn lý thuyết đường Engel ám khơng có số hạng số Số hạng số khơng có ý nghĩa phù hợp với kết theo lý thuyết Xu hướng chi tiêu cận biên cho việc chăm sóc sức khỏe lấy từ thu nhập 0,141652; nghĩa là, với khoản tăng thu nhập 100 đơla, chúng ta kỳ vọng cá nhân chi trung bình 14,17 đơla cho chăm sóc sức khỏe

Giá trị R2 (R-square) 98% biến đổi chi tiêu giải thích biến

thu nhập Sự khác giá trị R2

(32)

Giá trị thống kê mẫu Durbin-Watson hệ số tương quan chuỗi bậc giải thích chương 9, nhằm giải vi phạm giả thiết 3.6 cho số hạng sai số

hai quan sát không tương quan Giá trị trung bình biến phụ thuộc Y S.D độ

lệch chuẩn Sy

Giá trị trung bình biến phụ thuộc

15,068863 S.D biến phụ thuộc 17,926636

Tổng bình phương sai số (ESS)

317,898611 Sai số chuẩn phần dư 2,547102

R- bình phươngkhơng hiệu chỉnh

0,980 R- hiệu chỉnh 0,980

Trị thống kê F 2427,709468 p-value =

Prob(F>2427.709)

<0,0001

Trị thống kê Durbin-Watson

2,209485 Hệ số tự tương quan bậc

nhất

-0,121

Giá trị thống kê mẫu để chọn mơ hình

SGMASQ HQ GCV

6,487727 6,939901 6,752532

AIC

SCHWARZ RICE

6,741876 7,272471 6,7638

FPE SHIBATA

6,742147 6,722193

?genr ut=uhat (lưu ước lượng phần dư máy vào ut.) Generated var no (ut)

?genr =exphlth-ut (giá trị “thích hợp” = exphlth quan sát trừ phần dư)

Generated var no (yhat)

?print –o exphlth yhat ut; (In giá trị chi tiêu thực dự báo, giá trị phần dư Dấu hiệu –o chỉ in dạng bảng)

Obs exphlth yhat ut

1 0,998 1,493862 -0,49586172

2 1,499 1,763001 -0,26400087

3 4,285 2,598749 1,686251

4 1,573 2,131297 -0,55829655

5 2,021 1,720505 0,30049479

6 2,26 2,343775 -0,08377483

7 1,953 1,989644 -0,03664435

8 2,103 2,244618 -0,1416183

9 3,428 3,179523 0,24847729

10 2,277 2,910384 -0,63338356

11 3,452 3,731965 -0,27996523

12 3,485 4,057766 -0,57276526

13 3,433 3,476992 -0,0439923

14 3,747 4,652705 -0,90570543

15 4,4 4,666871 -0,26687065

(33)

17 5,197 4,341071 0,85592937

18 4,118 4,426062 -0,30806194

19 6,111 5,672601 0,43839884

20 6,903 7,301601 -0,39850129

21 6,187 5,686766 0,50023362

22 7,341 7,485749 -0,14474913

23 7,999 8,533975 -0,53497529

24 8,041 7,967367 0,07353344

25 12,216 13,250993 -1,034993

26 10,066 11,027054 -0,96105374

27 9,029 8,84561 0,1833899

28 10,384 9,256401 1,127599

29 10,635 10,276297 0,35870284

30 12,06 10,318793 1,741207

31 13,014 10,276297 2,737703

32 14,194 13,619289 0,57471128

33 15,154 16,96228 -1,80828

34 14,502 14,32755 0,17445035

35 16,203 13,477637 2,725363

36 15,949 14,68168 1,26732

37 15,129 16,395672 -1,256672

38 16,401 15,701576 0,69942416

39 23,421 20,985202 2,435798

40 6,682 20,036133 -13,354133

41 20,104 19,002072 1,101928

42 18,241 18,56295 -0,32194997

43 25,741 30,093438 -4,352438

44 27,136 27,756177 -0,62017675

45 33,456 31,042507 2,413493

46 34,747 37,516012 -2,769012

47 41,521 36,439456 5,081544

48 44,811 40,320726 4,490274

49 49,816 49,0465 0,7694999

50 67,033 64,004971 3,028029

51 94,178 96,995765 -2,817765

 

  

 

s t s

t P t

s t

P( *  ˆ  *)0.95 (ˆ *   ˆ *

Từ rút khoảng tin cậy 95%   ˆt*svà ˆt*s

Ví dụ 3.7

Trong ví dụ giá nhà, sai số chuẩn ˆ ˆ

ˆ

s = 37,285 sˆ= 0,18373 Đồng thời, từ bảng t, ta có t*

(34)

Đối với : 52,351  (2,179x37,285) = (-28,893; 133,595)

Đối với : 0,13875  (2,179x0,018373) = (0,099; 0,179)

Lưu ý khoảng tin cậy tương đối rộng Đây dấu hiệu cho thấy mơ hình hồi quy tuyến tính thích hợp với tập liệu Một mơ hình hồi quy thích hợp cho khoảng tin cậy hẹp

BÀI TẬP 3.8

Xác định khoảng tin cậy   Phần Ứng Dụng 3.7

3.9 Dự Báo

Như đề cập trước đây, ứng dụng phổ biến mơ hình hồi quy để dự báo (chủ đề thảo luận chi tiết chương 11) Trong ví dụ giá nhà, đặt câu hỏi giá bán dự báo ngơi nhà có diện tích 2,000 mét vng Mơ hình hồi quy ước lượng Yˆ 52.3510.13875X Như vậy, X = 2,000, giá trị dự báo củaY 52,351 + (2,000x0,13875) = 329,851 Vì giá tính theo đơn vị ngàn đơla, giá trị dự báo có đơn vị ngàn đơla Vì vậy, theo mơ hình, giá trung bình ước lượng hộ diện tích 2,000 mét vng 329.851 đôla Một cách tổng quát, dễ dàng nhận thấy X có giá trị X0 giá trị dự báo Y0 Yˆ0 ˆˆX0 Giá trị trung

bình có điều kiện biến dự đốn Y cho trước X = X0

) (

) ˆ ( )

ˆ ( ) ˆ

(Y X X0 E X0E X0 E Y X X0

E        

Như Y giá trị dự báo có điều kiện khơng thiên lệch giá bán trung bình Xˆ0 0

Khoảng Tin Cậy cho Giá Trị Dự Báo Trung Bình

Vì   ước lượng có sai số, giá trị dự báo Y chịu sai số Để xét đến yếu tố ˆ0 này, tính sai số chuẩn khoảng tin cậy cho giá trị dự báo trung bình Dưới ước lượng phương sai giá trị dự báo (xem chứng minh Phần 3.A.11 )

   

 

 

xx Y

S X X n s

2

2 ˆ ( )

0  (3.28)

Khoảng tin cậy giá trị dự báo trung bình

] ˆ

, ˆ

[

0

0 ˆ

* ˆ *

0 t sY Y t sY

Y  

trong t*

giá trị ngưỡng phân phối t Lưu ý X0 lệch xa giá trị trung

bình X ,

0 ˆ

Y

s lớn khoảng tin cậy tương ứng rộng Điều có nghĩa

(35)

Nếu X0 = X , khoảng tin cậy hẹp Hình 3.9 cho ý niệm “dải tin cậy” với giá

trị X0

HÌNH 3.9 Dải Khoảng Tin Cậy Các Giá Trị Dự Báo

Khoảng Tin Cậy cho Dự Báo Điểm

Phương sai mẫu trình bày phần trước dùng để dự báo giá trị trung bình Bên cạnh chúng ta muốn tìm phương sai sai số dự báo cho giá trị thực Y0 tương ứng với

X0 Công thức lấy từ Phụ lục 3.A.12:

2 ˆ 2

0

ˆ

0

) (

1 ˆ ) ˆ (

Y xx

u s

S X X n u

Var

s 

  

   

  (3.29)

trong uˆ0 Y0 Yˆ0 sai số dự báo điểm Khoảng tin cậy tính theo

0 ˆu

s thay

0 ˆ

Y

s Khi cỡ mẫu lớn, số hạng thứ hai thứ ba không đáng kể so với

0 ˆu

s giá

trị gần ˆ Ngoài ra, t*

gần trường hợp mức ý nghĩa 95% Như vậy, khoảng tin cậy mẫu có kích thước lớn Yˆ02ˆ

Ví dụ 3.8

Trong ví dụ giá nhà, có

ˆ

Y

s = 111,555 2ˆ

0

u

s =1634,353 khoảng tin cậy tương ứng X0 = 2.000 (307, 353) (242, 418) Khoảng tin cậy với cỡ mẫu lớn

(252,408) (Xem phần Thực Hành Máy Tính 3.4 để chạy lại kết này)

(36)

khoảng tin cậy theo phương trình rộng nhiều khoảng tin cậy dựa phương trình (3.28)

So Sánh Các Giá Trị Dự Báo

Các nhà phân tích kinh tế kinh doanh thường sử dụng nhiều mơ hình để dự báo Một số đo thường dùng để so sánh lực dự báo mơ hình khác sai số bình phương trung bình (hoặc đơi người ta sử dụng bậc hai nó, gọi bậc hai sai số bình phương trung bình)

Gọi Yf

t giá trị dự báo biến phụ thuộc cho quan sát t, Yt giá trị thực Sai số bình

phương trung bình tính sau:

2 n

Y Y

MSE tf t

  

 ( ) RMSE MSE

Nếu hai mơ hình sử dụng để dự báo Y, mơ hình có MSE nhỏ đánh giá mơ hình tốt cho mục đích dự báo

Một số đo hữu ích khác sai số phần trăm tuyệt đối trung bình (MAPE)

 

t f t t

Y Y Y 100 n

1 MAPE

Số đo có ý nghĩa tất giá trị Y dương (xem Phần Ứng Dụng 3.11) Một cách khác, tính sai số phần trăm bình phương trung bình (MSPE)

 

  

 

2

t f t t

Y Y Y 100 n

1

MSPE RMSPE MSPE

Một phương pháp khác để đánh giá mơ hình lực dự báo thực dự báo hậu mẫu Theo phương pháp này, người phân tích khơng sử dụng số quan sát cuối (chẳng hạn, 10% số quan sát cuối cùng) việc ước lượng mơ hình, sử dụng ước lượng thông số từ tập quan sát để dự báo Yt cho phần mẫu để dành

Sau tính MSE MAPE cho giai đoạn hậu mẫu Mơ hình có giá trị đo lường thấp tốt cho mục đích dự báo

3.10 Tính Nhân Quả Mơ Hình Hồi Quy

Khi định mơ hình dạng Y = + X + u, ngầm giả định X gây Y Mặc dù

R2 đo độ thích hợp, khơng thể sử dụng để xác định tính nhân Nói cách khác,

(37)

tạo Lấy ví dụ khác thực tế hơn, giả sử hồi quy số lượng vụ trộm thành phố với số hạng số số nhân viên cảnh sát (X) sau quan sát thấy hệ số góc ước lượng có giá trị dương, có nghĩa có tương quan thuận X Y Phải điều có nghĩa việc tăng số lượng cảnh sát làm tăng số vụ trộm, ngầm kéo theo phải có sách giảm lực lượng cảnh sát? Rõ ràng kết luận khơng thể chấp nhận Điều xảy mối quan hệ nhân ngược lại, có nghĩa thành phố nên thuê thêm cảnh sát số vụ trộm tăng lên, việc hồi quy X theo Y hợp lý Tuy nhiên, thực tế, hai biến xác định kết hợp nên định rõ hai phương trình, với Y theo X biến khác phương trình cịn lại với X theo Y các biến khác Việc xác định đồng thời biến trình bày chi tiết chương 13 Như thấy chương ước lượng thu cách bỏ qua tính đồng thời bị sai lệch và khơng quán Cũng tương quan cao quan sát X Y hồn tồn biến khác khơng biến số chúng trực tiếp gây biến cịn lại Những ví dụ nhấn mạnh tầm quan trọng việc cân nhắc kỹ lưỡng chất chế hành vi tiềm ẩn gì, tức là, trình phát liệu (DGP), lập mơ hình cách phù hợp Lý thuyết kinh tế, kiến thức nhà phân tích hành vị tiềm ẩn, kinh nghiệm khứ, v.v phải gợi ý mơ hình nên phải xác định Tuy nhiên, kiểm định phương hướng nhân cách rõ ràng (chi tiết trình bày chương 10) Độc giả quan tâm đến vấn đề tham khảo viết Granger (1969) Sims (1972)

Để minh họa tầm quan trọng việc xác định xác nhân quả, giả sử đảo ngược vị trí X Y ước lượng mơ hình:

Xt = * + *Yt + vt (3.1’)

Liệu tìm đường thẳng giống trước khơng? Câu trả lời, nói chung, khơng Vì thủ tục bình phương nhỏ áp dụng cho phương trình (3.1) cực tiểu hóa tổng bình phương độ lệch đứng từ đường thẳng (xem hình 3.10) Trái lại, đường thẳng nghịch cực tiểu hóa tổng bình phương độ lệch ngang vt Tìm Yt theo Xt,

Phương trình (3.1’) viết lại sau:

' ' ' * *

* *

1

t t t

t

t X v

v X

Y   

                   

  

 

 

Việc cực tiểu hóa ˆ2

t

u , làm tương tự với phương trình (3.1), cực tiểu hóa vˆt2sẽ thường cho kết khác Cụ thể hơn, giá trị ước lượng ’ khác với giá trị

(38)

HÌNH 3.10 Cực Tiểu Hóa Tổng Bình Phương theo Trục Tung Trục Hồnh

Ví dụ 3.9

Quan hệ ước lượng ˆ2

t

u cực tiểu hóa (xem Phần Thực Hành Máy Tính 3.5)

SQFT 13875 351 52

GIAÙ ,  ,

Khi quan hệ nhân đảo ngược ˆ2

t

v cực tiểu hóa, có

GIÁ 913666

385 33

SQFT ,  ,

Nghịch đảo quan hệ ước lượng thứ hai biểu diễn GIÁ hàm SQFT, ta có

SQFT 169 645 SQFT 913666

5 913666

385 33

GIAÙ   

Lưu ý dấu số hạng số bị nghịch đảo độ dốc hoàn tồn khác

Như điều kiện hai đường ước lượng nhau? Để trả lời câu hỏi này, áp dụng OLS cho phương trình (3.1’); nghĩa cực tiểu hóaˆ2

t

v Hoán đổi X Y

trong phương trình 3.10, ta có:

' *

ˆ ˆ

  

yy xy

(39)

Và ˆ' S /yy Sxy Ước lượng bình phương nhỏ làm cực tiểu u ˆt2 ˆ S /xy Sxx Để ˆ'bằngˆ , điều kiện

1

2

 

yy xx

xy

xy yy

xx xy

S S

S hoặc S

S

S S

Nhưng vế trái phương trình thứ hai rxy2, bình phương hệ số hồi quy đơn X

và Y (định nghĩa phương trình 2.11) Như vậy, điều kiện cần X Y phải tương quan hoàn hảo Tính chất 2.4d nói tồn tương quan hồn hảo hai biến, phải tồn quan hệ tuyến tính xác chúng Vì vậy, thích hợp X Y phải hồn hảo nhận đường hồi quy cho dù áp dụng OLS cho phương trình (3.1) hay (3.1’) Nhìn chung, tương quan X Y khơng hồn hảo, khơng nhận đường thẳng hồi quy Điều nhấn mạnh tầm quan trọng việc xác định hướng quan hệ nhân thay việc chọn thiếu suy xét biến X Y

Như minh họa trước ví dụ tội phạm, quan hệ nhân theo hai chiều, tình gọi phản hồi Quan hệ giá bán lượng bán ví dụ tượng Vì giá lượng bán xác định lúc quan hệ tương tác cung cầu, ảnh hưởng Tương tự, tượng phản hồi tìm thấy quan hệ thu nhập tổng hợp tiêu dùng hay đầu tư Những tình trình bày chủ đề mơ hình hồi quy hệ phương trình chương 13

3.11 Ứng Dụng: Quan Hệ Bằng Sáng Chế Chi Phí cho Hoạt Động Nghiên Cứu Phát Triển (R&D)

Phần trình bày ví dụ “diễn tập” khác phân tích hồi quy Dữ liệu dùng ví dụ tập tin DATA3.3, mà đề cập đến biến sau:

PATENTS = Số ứng dụng sáng chế ghi nhận, đơn vị ngàn, giao động từ 84,5 - 189,4

R&D = Chi phí cho nghiên cứu phát triển, đơn vị tỉ đôla 1992, xác định

tỉ số chi phí theo đơla hành số giảm phát tổng sản phẩm quốc nội gộp (GDP), giao động từ 57,94 đến 166,7

Dữ liệu theo năm lấy vòng 34 năm từ 1960 đến 1993 cho tồn nước Mỹ Nguồn trình bày phụ lục D

(40)

Mơ hình hồi quy tuyến tính ước lượng trình bày kèm với trị thống kê mẫu t ngoặc đơn (Phần Thực Hành Máy Tính 3.6 hướng dẫn cách lập lại kết phần Bảng 3.5 trình bày kết quả.)

D R 792 571 34

SÁNGCHẾ ,  , &

(5,44) (13,97)

R2 = 0,859 d.f = 32

Fc (1,32) =195,055 ˆ 11,172

Để kiểm định mô hình ý nghĩa tổng thể, sử dụng trị thống kê F, có giá trị bằng 195,055 Theo giả thuyết H0 số sáng chế chi phí cho R&D khơng tương

quan, Fc tuân theo phân phối F với bậc tự tử số bậc tự mẫu số 32 (= 34 –

2) Từ bảng A.4a (cũng bìa sau) có nhận xét giá trị ngưỡng F(1,32) mức ý nghĩa 1% nằm 7,31 7,56 Vì Fc cao nhiều so với giá trị này, kết

luận số sáng chế chi phí cho R&D tương quan đáng kể Kết luận cố thêm thông qua giá trị thống kê mẫu t Kiểm định hai đầu với mức ý nghĩa 1%, bảng t bìa trước sách (hay Bảng A.2) cho thấy giá trị ngưỡng với 32 bậc tự nằm 2,704 2,75 Vì giá trị quan sát tc cao giá trị nhiều kết

luận số hạng tung độ gốc độ dốc có giá trị khác cách đáng kể Số đo độ thích hợp R2

cho biết mơ hình giải thích 85,9% biến đổi biến phụ thuộc Mặc dù dường thích hợp tốt, nhiên thấy từ hình 3.11 mơ hình khơng hồn tồn thể biến đổi thực tế số sách chế Đường thẳng hồi quy đường liền khơng đại diện đầy đủ chất đường cong liệu quan sát Chính điều mơ hình dự báo số lượng sáng chế nhiều năm

Điểm nêu rõ Bảng 3.5, bảng có nhiều trị thống kê hữu ích khác Cột thứ tư giá trị trung bình ước lượng Yˆt , cột năm giá trị phần dư tính giá trị quan sát trừ giá trị trung bình ước lượng uˆtYtYˆt cột cuối sai số phần trăm tuyệt đối (APE), tính 100u /ˆt Yt Giá trị dự báo trình bày bảng 3.5 làm tròn đến chữ số thập phân Vì liệu gốc số sáng chế có số thập phân, nên việc cố gắng có giá trị dự báo có độ xác đến số thập phân khơng có ý nghĩa

HÌNH 3.11 Số Bằng Sáng Chế Theo Chi Phí cho R&D Nước Mỹ

Số sáng chế (ngàn)

(41)

BẢNG 3.5 Báo Cáo Máy Tính có Chú Thích cho Phần Ưng Dụng Phần 3.11

Các lệnh ELS in đậm lời nhận xét in nghiêng Danh sách biến

(0) Hằng số (1) Năm (2) R&D (3) PATENTS (SÁNG CHẾ)

Thời đoạn: 1, quan sát lớn nhất: 34, phạm vi quan sát: suốt 1960-1993, hành 1960-1993 (Ước lượng mơ hình theo OLS)

Ước lượng theo OLS sử dụng 34 quan sát từ 1960-1993 Biến phụ thuộc – PATENTS

Biến Hệ số Sai số chuẩn T stat 2Prob(t > T)

(0) Hằng (2) R&D

34,571064 0,791935

6,357873 0,056704

5,437521 13,966211

< 0,0001*** < 0,0001*** Giá trị trung bình

biến phụ thuộc

119,238235 S.D biến phụ thuộc

29,305827

Tổng bình phương sai số (ESS)

3994,300257 Sai số chuẩn phần dư

11,172371

R-bình phương khơng hiệu chỉnh

0,859 R- bình phương hiệu chỉnh

0,855

Trị thống kê F 195,055061 p-value =

Prob(F>2427.709)

<0,0001

Trị Durbin-Watson 0,233951 Hệ số tự tương quan

bậc

0,945

Các giá trị thống kê để chọn mơ hình

SGMASQ HQ GCV

124,821883 136,255226 132,623251

AIC

SCHWARZ RICE

132,146377 144,560215 133,143342

FPE SHIBATA

132,164347 131,300527

?genr ut=uhat (lưu ước lượng phần dư ) ?genr temp = PATENTS -ut (tính giá trị “gắn”)

genr fitted = int (0.5+ (10*temp))/10 (làm tròn đến số thập phân) ?genr error = PATENTS – fitted (tính sai số dự báo)

?genr abspcerr = int (0.5 + (1000*abs(error)/PATENTS))/100 (tính sai số % tuyệt đối

làm tròn đến hai chữ số thập phân)

?print –o R&D PATENTS fitted error abspcerr; (in giá trị dạng bảng)

OBS R&D Patens Fited Error ABSPCERR

1960 57,94 84,5 80,5 4,0 4,73

1961 60,59 S6,2 82,6 5,6 6,35

1962 64,44 90,4 85,6 4,8 5,31

1963 70,66 91,1 90,5 0,6 0,66

(42)

1965 80,00 100,4 97,9 2,5 2,49

1966 84,82 93,5 101,7 -8,2 8,77

1967 86,84 93,0 103,3 -10,3 11,08

1968 88,81 98,7 104,9 -6,2 6,28

1969 88,28 104,4 104,5 -0,1 0,10

1970 85,29 109,4 102,1 7,3 6,67

1971 83,18 111,1 100,4 10,7 9,63

1972 85,07 105,3 101,9 3,4 3,23

1973 86,72 109,6 103,2 6,4 5,84

1974 85,45 107,4 102,2 5,2 4,84

1975 83,41 108,0 100,6 7,4 6,85

1976 87,44 110,0 103,8 6,2 5,64

1977 90,11 109,0 105,9 3,1 2,84

1978 94,50 109,3 109,4 -0,1 0,09

1979 99,28 108,9 113,2 -4,3 3,95

1980 103,64 113,0 116,6 -3,5 3,19

1981 108,77 114,5 120,7 -6,2 5,41

1982 113,96 118,4 124,8 -6,4 5,41

1983 121,72 112,4 131,0 -18,5 16,55

1984 133,33 120,6 140,2 -19,6 -16,25

1985 144,78 127,1 149,2 -22,1 17,39

1986 148,39 133,0 152,1 -19,1 14,36

1987 150,90 139,8 154,1 -14,3 10,23

1988 154,36 151,9 156,8 -4,9 3,23

1989 157,19 166,3 159,1 7,2 4,33

1990 161,86 176,7 162,8 13,9 7,87

1991 164,54 178,4 164,9 13,5 7,57

1992 166,70 187,2 166,6 20,6 11,00

1993 165,20 189,4 155,4 24,0 12,67

Nhiều giá trị APE lớn 5%, số năm chúng vượt qua 10%, tỉ lệ lớn Chúng ta quan sát thấy điểm phân tán co cụm lại với năm từ 1966-1977, yếu tố khác chi phí R&D gây thay đổi số sáng chế Do đó, quan sát kỹ kết cho thấy xác định sai mơ hình Trong chương 6, dùng tập liệu để ước lượng mơ hình đường cong xem xét xem liệu việc xác định tốt biến đổi quan sát số sáng chế khơng

TĨM TẮT

Mặc dù mơ hình hồi quy tuyến tính đơn hai biến sử dụng chương này, hầu hết khía cạnh việc tiến hành phân tích thực nghiệm đề cập Thật hữu ích tóm tắt lại kết thảo luận từ đầu đến

Một mơ hình hồi quy tuyến tính đơn Yt = + Xt + ut (t = 1, 2, …, n) Xt Yt quan

sát thứ t biến độc lập biến phụ thuộc,   thông số tổng thể không biết ước lượng từ liệu X Y, ut số hạng sai số không quan sát được,

đây biến ngẫu nhiên với tính chất đề cập đây, n tổng số quan sát Độ dốc () diễn dịch ảnh hưởng cận biên tăng đơn vị giá trị Xt lên Yt ,  + Xt trị trung bình có điều kiện Y cho trước X = Xt

Thủ tục bình phương nhỏ thơng thường (OLS) cực tiểu hóa tổng bình phương sai số

 t

(43)

Yêu cầu để thực việc ước lượng thông số theo OLS n có giá trị nhỏ giá trị X khác – nghĩa là, tất giá trị X

Nếu ut biến ngẫu nhiên có giá trị trung bình 0, Xt cho trước không ngẫu

nhiên, E(ut) = E(Xtut) = Các phương trình chuẩn uˆt 0 Xtuˆt 0 Lời giải phương trình cho kết ước lượng theo OLS  

Dưới giả định vừa nêu ra, ước lượng theo OLS không thiên lệch quán Sự quán giữ nguyên Xt ngẫu nhiên, miễn Cov(X, u) = <

Var(X) < - nghĩa là, miễn X u không tương quan X không số

Nếu giá trị u tuân theo phân phối độc lập tương tự (iid) với phương sai xác định, ˆ ˆ ước lượng không thiên lệch tuyến tính tốt (BLUE); tức

là, số tất tổ hợp tuyến tính khơng thiên lệch giá trị Y, ˆ ˆ

ˆ

có phương sai nhỏ Kết gọi định lý Gauss-Markov có nghĩa rằng, ngồi tính chất khơng thiên lệch quán, ước lượng theo OLS ước lượng hiệu Nếu giá trị u tuân theo phân phối chuẩn độc lập tương tự N(0, 2

), ước lượng theo OLS ước lượng thích hợp (MLE)

Từ ˆ vàˆ, giá trị dự báo Yt (ký hiệu là

t

Yˆ ) thu bằngYˆt ˆˆXt, phần dư ước lượng uˆtYtYˆt Sai số chuẩn phần dư ước lượng độ

lệch chuẩn  tính theo cơng thức ˆ uˆt2(n2)1/2 Từ kết này, ta suy sai số chuẩn ˆ ˆ ( 

ˆ

s s ) Các sai số chuẩn nhỏ, độ xác ˆ

của ước lượng thông số lớn Sự biến đổi X lớn tốt điều có khuynh hướng cải thiện độ xác ước lượng riêng lẻ

Các bước tiến hành kiểm định đối thuyết đầu  tiến hành sau:

BƯỚC H0: = 0 H1: > 0

BƯỚC Trị thống kê kiểm định tc ˆ 0/sˆ, s sai số chuẩn ước ˆ

lượng ˆ Theo giả thuyết H0, giá trị tuân theo phân phối t với n –

bậc tự

BƯỚC Tra bảng t với giá trị ứng với n – bậc tự mức ý nghĩa cho trước (chẳng hạn ), tìm điểm t*

n-2() cho P(t> t*) =

BƯỚC Bác bỏ H0 mức ý nghĩa  tc > t* Nếu giả thuyết ngược lại H1 < 0, H0 bị bác bỏ tc < - t*

Kiểm định thực theo cách tương đương Các bước điều chỉnh sau:

BƯỚC 3a Tính xác suất (ký hiệu p-value) cho t > tc

BƯỚC 4a Bác bỏ H0 kết luận hệ số có ý nghĩa p-value nhỏ mức ý

(44)

Các bước kiểm định giả thuyết ngược lại H1 có tính hai phía thực sau:

BƯỚC H0: = 0 H1: 0

BƯỚC Trị thống kê kiểm định tc ˆ0/sˆ Theo giả thuyết H0, giá trị tuân

theo phân phối t với n – bậc tự

BƯỚC Tra bảng t với giá trị ứng với n – bậc tự mức ý nghĩa cho trước (chẳng hạn ), tìm điểm t*

n-2(/2) cho P(t> t*) = /2 (một mức

ý nghĩa)

BƯỚC Bác bỏ H0 mức ý nghĩa tc > t*

Các bước hiệu chỉnh để thực kiểm định theo phương pháp p-value sau: BƯỚC 3a Tính p-value = 2P(t > tc)

BƯỚC 4a Bác bỏ H0 p-value nhỏ mức ý nghĩa ()

Trị thống kê đo lường độ thích hợp mơ hình R2

= 1- (ESS/TSS),

 ˆ2

t

u

ESS

2

t Y

Y

TSS  

  

 

R2 có giá trị từ đến Giá trị cao độ thích

hợp tốt R2

mang hai ý nghĩa: (1) tỷ lệ tổng phương sai Y mà mơ hình giải thích, (2) bình phương hệ số tương quan giá trị quan sát (Yt) biến

phụ thuộc giá trị dự báo  Yˆ t

Kiểm định độ thích hợp tổng thể mơ hình thực cách sử dụng giá trị R2 Các bước tiến hành sau (

xy hệ số tương quan tổng thể hai

biến X Y):

BƯỚC H0: xy = H1: xy

BƯỚC Trị thống kê kiểm định Fc = R2(n – 2)/(1 – R2) Theo giả thuyết H0, trị thống

kê tuân theo phân phối F với bậc tự tử số n – bậc tự mẫu số

BƯỚC Tra bảng F theo tử số bậc tự mẫu số n – bậc tự mức ý nghĩa cho trước (chẳng hạn ) tìm gí trị F*

cho: P(F>F*) =  BƯỚC Bác bỏ giả thuyết H0 (tại mức ý nghĩa ) Fc > F*

Khoảng tin cậy 95%  xác định sau:

ˆ t*sˆ,ˆt*sˆ

Dự báo có điều kiện Y, cho trước X X0, Y ˆˆX0 Phương sai

(phép đo độ tin cậy dự báo) tỉ lệ thuận với khoảng cách X0 so với giá trị trung bình

X Như vậy, X0 xa khỏi giá trị trung bình X, giá trị dự báo tin cậy

Thay đổi thang đo biến phụ thuộc dẫn đến thay đổi tương ứng thang đo hệ số hồi quy Tuy nhiên, giá trị R2

(45)

độc lập thay đổi, hệ số hồi quy hệ sai số chuẩn tương ứng bị thay đổi thang đo, nhiên tất trị thống kê khác không thay đổi

Việc xác định xác quan hệ nhân quan trọng mơ hình hồi quy Giả thiết chuẩn X gây Y Tuy nhiên, X Y tráo đổi, mơ hình ước lượng Xt = * + *Yt + vt, đường thẳng hồi quy nói chung khác với đường xác

định từ mơ hình Yt = + Xt + ut

THUẬT NGỮ

Analysis of variance (ANOVA) Phân tích phương sai

Best linear unbiased estimator (BLUE) Ước lượng không thiên lệch tuyến tính tốt

nhất

Coefficient of multiple determination Hệ số xác định bội

Conditional mean of Y given X Giá trị trung bình điều kiện Y biết trước

X

Critical region Vùng ngưỡng (vùng tới hạn)

Data-generating process (DGP) Quá trình phát liệu

Engel curve Đường cong Engel

Error sum of square (ESS) Tổng bình phương sai số

Estimated residual Phần dư ước lượng

Explained variation Sự biến đổi giải thích

Feedback Phản hồi

Fitted straight line Đường thẳng thích hợp

F-test Kiểm định F

Gauss-Markov theorem Định lý Gauss-Markov

Goodness of fit Độ khớp

Heteroscedasticity Phương sai sai số thay đổi

Homoscedasticity Đồng phương sai sai số (tính chất phương

sai sai số không thay đổi)

Joinly determined Được xác định lúc

Linear estimator Ước lượng tuyến tính

Marginal effect of X on Y Hiệu ứng cận biên X lên Y

Mean absolute percent error (MAPE) Sai số phần trăm tuyệt đối trung bình

Mean squared error (MSE) Sai số bình phương trung bình

Mean squared percentage error (MSPE) Sai số phần trăm bình phương trung bình

Method of least square Phương pháp bình phương tối thiểu

Nonlinear regression model Mơ hình hồi quy phi tuyến

Normal equation Phương trình chuẩn

Ordinary least squares (OLS) Bình phương tối thiểu thường

Population parameters Tham số tổng thể

Population regression function Hàm hồi quy tổng thể

Population regression line Đường hồi quy tổng thể

Population variance Phương sai tổng thể

Postsample forecast Dự báo hậu mẫu

p-value Giá trị p

(46)

Regression sum of squares (RSS) Tổng bình phương hồi quy

Residual Phần dư

Root mean squared error Căn bậc hai sai số bình phương trung

bình

Sample estimate Ước lượng mẫu

Sample regression line Đường hồi quy mẫu

Sample regression function Hàm hồi quy mẫu

Sample scatter diagram Biểu đồ phân tán mẫu

Serial correlation Tương quan chuỗi

Serial independence Độc lập chuỗi

Significanly different from zero Khác cách đáng kể

Significanly greater from zero Lớn cách đáng kể

Simple linear regression model Mơ hình hồi quy tuyến tính đơn

Spurious correlation Tương quan giả tạo

Spurious regression Hồi quy giả tạo

Standard error of a regression coefficient

Sai số chuẩn hệ số hồi quy

Standard error of the regression Sai số chuẩn hồi quy

Standard error of the residuals Sai số chuẩn phần dư

Statistically insignificant Khơng có ý nghĩavề thống kê

Statistically not greater than zero Không lớn mặt thống kê

Statistically significant Có ý nghĩa thống kê

Sum of squares of the residuals (ESS) Tổng bình phương phần dư

Total sum of squares (TSS) Tổng bình phương toàn phần

Total variance Phương sai tổng

t-statistic Trị thống kê t

t-test Kiểm định t

Unexplained variation Biến đổi khơng giải thích

Well-behaved errors Sai số thay đổi ngẫu nhiên

White-noise errors Sai số nhiễu trắng

3.A PHỤ LỤC

Chứng Minh Các Phương Trình

 3.A.1 Biểu diễn chiều mơ hình tuyến tính đơn

Hình 3.A.1 biểu diễn đồ thị giả thiết liệt kê bảng 3.2 cho trường hợp mơ hình hồi qui biến đơn Trục X Y đại diện cho giá trị biến X Y Trục Z hàm mật độ xác suất f(u) sai số ngẫu nhiên u Đường thẳng  + X trung bình có điều kiện Y với X cho trước, giả sử tuyến tính Các phân phối thống kê vẽ xung quanh đường trung bình cho giá trị X1, X2 X3 phân phối có điều kiện tương ứng Như đề cập bài, giả thiết

Var(ut) = 2 gọi phương sai sai số khơng đổi, có nghĩa “phân tán nhau” Hình

3.A.1 mơ tả tính bất biến phương sai sai số cho tất quan sát Nếu phương sai không bất biến mà thay đổi theo t [như vậy, Var(ut) 2t], ta có phương sai sai số thay đổi

(47)

X3 X

f(u)

0

X1 X2

Y

 + X

Hình 3.A.2 Minh họa phương sai sai số không đổi

Hình 3.A.1 Biểu diễn đồ thị Mơ hình Hồi Qui Tuyến Tính Đơn

0 f(u)

X X1 X2

Y

 + X

(48)

 3.A.2 Các Kết Quả Của Phép Tính Tổng

Các tính chất 3.1 3.2 chứng minh

TÍNH CHẤT 3.1

 2

t t 2 t t

xx X X X n X X n1 X

S (  )   ( )   

Chứng minh

    

       

t t t t

t X X 2X X X X 2XX X

X ) ( ) ( )

(

Như trước đây, X với giá trị t Do vậy, biểu thức =

   

t

t 2X X n X

X ( ) Hơn Xt nX Do đó, biểu thức trở thành

2

t 2XnX n X

X   ( )

 Kết hợp số hạng thứ hai ba biểu thức ta phần thứ

của tính chất Ta biết X = (Xt)/n Thay vào, ta có phần thứ hai tính chất

TÍNH CHẤT 3.2

    X Y n

Y X Y X n Y X Y Y X X

Sxy ( t  )( t  ) t t   t t   t  t /

Chứng minh

) (

) )(

(Xt X Yt Y  XtYt XtYYtXXY

     

 XtYt Y Xt X Yt nXY

Y X n Y n X X n Y Y

Xt t  



Y X n Y Xt t



Thay X(Xt)/n Y(Yt)/n, ta có đẳng thức thứ hai

 3.A.3 Chứng Minh Các Phương Trình Chuẩn Bằng Phép Bình Phương Nhỏ Nhất

Trong phần ta áp dụng phương pháp bình phương nhỏ nhất, trình bày phần 3.2 chứng minh phương trình chuẩn (3.4) (3.5) Tiêu chuẩn bình phương nhỏ chọn giá trị ˆ ˆ làm tối thiểu tổng bình phương sai số:

            

 t n

1 t t t n t t

t Y X

u

(49)

Để tối thiểu ESS với ˆ ˆ, ta cho đạo hàm riêng (xem phần 2.A.3 đạo hàm riêng) ESS/ ˆ

ESS/ ˆ giải phương trình Ta có

 u 2u u 2 u 1 2 Y X 1 0 ESS t t t t t

t      

               ) )( ˆ ˆ ( ) ( ˆ ˆ ˆ ˆ ˆ ˆ ˆ                    

ESS u 2u u 2 u X 2 Y X X 0

t t t t t t t t ) )( ˆ ˆ ( ) ( ˆ ˆ ˆ ˆ ˆ ) ˆ ( ˆ

Từ ta thu phương trình sau:

(Ytˆ ˆXt)0 (YtˆˆXt)Xt 0

Lấy tổng số hạng lưu ý ˆ ˆ không phụ thuộc vào t thừa số chung đưa tổng, ta

 Yt nˆ ˆ Xt

 

  

t t

t

tX X X

Y ˆ ˆ

Phương trình tương đương với phương trình (3.4) phương trình thứ tương đương với phương trình (3.5)

 3.A.4 Ước Lượng Khơng Thiên Lệch Tuyến Tính Tốt Nhất (Blue) Và Định Lý Gauss-Markov

Từ lý thuyết thống kê ta biết tính chất mong muốn cho ước lượng ước lượng tuyến tính khơng thiên lệch phương sai nhỏ (xem định nghĩa 2.8) Nói cách khác, tổ hợp tuyến tính biến phụ thuộc khơng thiên lệch, ta chọn biến có phương sai nhỏ Đây ước lượng không thiên lệch tốt (BLUE) Trong phần ta chứng minh định lý

Gauss-Markov, định lý cho ước lượng OLS rút phần 3.2 có tính chất BLUE

Đầu tiên lưu ý ước số OLS ˆ thực biểu diễn tổ hợp tuyến tính

Yt Để thấy điều này, ta viết lại phương trình (3.12)

(3.12)   

          n Y X Y X

S t t

t t xy

Lưu ý XXt/n, kết biểu diễn

t t

t t

tY X Y X X Y

X   (  )

(50)

Vì ˆ = Sxy/Sxx từ phương trình (3.10), ta có

t t t

xx

t Y Y

S X

X 

   

  

 

 ˆ

Đây tổ hợp tuyến tính Yt với trọng số 

  

 

 

xx t

t S

X X

phụ thuộc vào Xt Bây xem tổng tổ

hợp tuyến tính giá trị Y có dạngatYt

~

, với at có tính khơng ngẫu nhiên Ước lượng

khơng thiên lệch tốt (BLUE) có tính chất: (1) ~không thiên lệch (2) Var(~) nhỏ

Chứng minh

Gọi dt = at - t hiệu số trọng số (lưu ý dt phụ thuộc biến X xem

không ngẫu nhiên) Vậy at = t + dt Tiếp theo

   

~ ( t dt)Yt ˆ dtYt

) (

) ( )

( )

~

( EdtYt dtE Yt dt Xt E    

t t

t dX

d 

 

   

Để có tính khơng thiên lệch, kết phải , điều xảy

dt = dtXt =

Phương sai ước lượng ~được xác định Var[(t + dt)Yt] Từ tính chất 2.A.5c, phương sai

của tổng biến ngẫu nhiên độc lập tổng phương sai (tính độc lập đảm bảo giả thiết 3.6) Hơn nữa, giả thiết 3.5 phương sai sai số không đổi, ut Yt có phương sai

khơng đổi 2 Từ ta có

Var(~) = 2(t + dt)2 = 22t + 2d2t + 22tdt

Số hạng thứ tdt = d

S X X

t xx

t 

   

 

 , điều kiện tính khơng thiên lệch dt =

0 dtXt = làm cho số hạng tổng Trong biểu thức phương sai 

~

, số hạng đầu độc lập với biến chọn dt Bởi số hạng thứ hai tổng bình phương, có cách

duy để tối thiểu số hạng chọn giá trị ds Điều làm cho at = t 

  ˆ

~

(51)

3.5 3.6 phương sai sai số khơng đổi tính độc lập theo chuỗi Nếu giả thiết bị vi phạm, phương pháp OLS khơng cho ước lượng hiệu

 3.A.5 Ước Lượng Thích Hợp Nhất

Lý phương pháp ước lượng thích hợp diễn tả chi tiết phần 2.A.4 Bạn đọc xem phần trước bắt đầu phần Trong phần đó, phương pháp áp dụng cho trường hợp ước lượng giá trị trung bình phương sai phân phối chuẩn Ở ta áp dụng kỹ thuật tương tự vào tốn hồi qui Bởi ngun lý thích hợp đòi hỏi kiến thức phân phối toán, nên ta cần giả thiết 3.7 Các bước để xác định ước lượng thích hợp dễ hiểu Trước tiên, lập hàm thích hợp liên kết hàm mật độ quan sát với thông số chưa biết Để cực đại hàm này, lấy vi phân riêng phần logarit hàm thích hợp cho thơng số chưa biết cho Kế đến giải điều kiện bậc để tìm ước lượng thích hợp Hàm mật độ u xác định theo [xem phương trình (2.4)]

2 2 u e u

f  

   / ) ( ) (

Bởi quan sát độc lập nhau, hàm thích hợp u1, u2,…,un

L(, , 2) = f(u1) f(u2) f(u3) f(un)

= /( ) ) ( 2 t u n e

1  

  = ( ) /( ) ) ( 2 t

t X

Y n e

2

1   

 

Thực cực đại hóa logarit hàm thích hợp dễ hơn, giá trị cực đại với giá trị lớn L loga có tính chất tăng đều; nghĩa ab, ln(a)ln(b)

                

 t 2 t

2 X Y n n

L ln ln( ) ( )

ln 2 SSE n n      

 ln ln( )

Trong SSE =  (Yt -  -Xt)2   xuất số hạng SSE Do đó, lnL lớn

với SEE nhỏ (bởi có dấu âm trước SSE) Nhưng SSE nhỏ nghĩa ước lượng bình phương nhỏ Do đó, ước lượng bình phương nhỏ MLE với điều kiện sai số u tuân theo phân phối N(0,2) Bởi ước lượng thích hợp đồng hiệu

cách tiệm cận, nên ước lượng OLS

Để có MLE 2, lấy vi phân riêng phần lnL theo 

(52)

0 SEE n

L

3 

       (ln )

Giải phương trình tìm 2

ta 2 = SSE/n Nhưng SSE phụ thuộc vào   Tuy nhiên, ta dùng ước lượng chúng ˆ ˆ Do ta thu MLE phương sai ut với

n u2

t

/ ˆ ~ 

 Như phát biểu trước đó, giá trị không thiên lệch Một ước lượng không thiên

lệch tìm cách chia uˆ cho n-2 dùng 2t ˆ2đã xác định phương trình (3.21)

Điều kiện không thiên lệch chứng minh phục lục phần 3.A.7

 3.A.6 Tìm Các Phương Sai Của Các Ước Lượng

Từ phương trình (3.10), ta có ˆ= Sxy/Sxx. Vì X không ngẫu nhiên theo giả thiết 3.4, Sxx không

ngẫu nhiên Var(ˆ) = Var(Sxy)S2xx Từ phương trình (3.15), Sxy = Sxx + Sxu

Var(Sxy) = Var(Sxu) Từ phương trình (3.16) ta lưu ý Sxu = (Xt X)ut Tính chất 2.A.5c cho

thấy phương sai tổng biến ngẫu nhiên tổng phương sai với điều kiện đồng phương sai (covariance) số hạng Theo giả thiết 3.6, ut us không tương quan với ts

đồng phương sai Do đó,

 ( )  ( )  ( ) ( )

)

(Sxu Var Xt X ut Var Xt X ut Xt X 2Var ut

Var       

Với giả thiết 3.5, Var(ut) = 2 Do đó, Var(Sxu) = 2(Xt X)2=2Sxx Từ có

xx

2 xx

2 xx

xy

S S

S S

S Var

Var xx 

   

ˆ) ( )

(

Vậy ta chứng minh phương trình (3.18) Thủ tục để chứng minh phương trình (3.19) (3.20) tương tự tập cho bạn đọc

 3.A.7 Ước Lượng Không Thiên Lệch Của Phương Sai Của Số Hạng Sai Số

Theo phương trình (3.21), s2

= ˆ2(uˆt2)/(n2)là ước lượng không thiên lệch 2 Điều chứng minh sau

t t

t t

t Y X Y Y X X

uˆ  ˆ ˆ  ( ˆ )ˆ

Dùng phương trình (3.9) cho ˆ Vì Yt xác định phương trình (3.1), YXu với u

bằng ut/n Do đó, nhóm tất số hạng  ta có,

t t

t

t X u X u X X

uˆ (  )(  )ˆ ˆ

) )(

ˆ ( )

(ut u   Xt X

(53)

Tổng bình phương uˆ xác định theo t

uˆ2t (utu)2(ˆ )2(Xt X)22(ˆ)(Xt X)(ut u)

xu xx

2

uu S S

S (ˆ)  (ˆ)

Dùng ký hiệu tương tự phương trình (3.11) (3.16) Từ phương trình (3.15), Sxu= Sxy - Sxx = Sxx(ˆ - ) Thay kết vào phương trình kết hợp số hạng thứ hai ba ta có

xx uu

2

t S S

uˆ  (ˆ) 

Để tính giá trị kỳ vọng tổng bình phương sai số, ta cần E(Suu)và E[(ˆ - )2] Từ tính chất

2.11b ta lưu ý

E(Suu) = (n-1)Var(u) = (n-1)2 Hơn nữa,

E[(ˆ - )2] = Var(ˆ) =

xx

S

Từ phương trình (3.18) Đặt tất kết quả, ta có

  2 2

xx uu

t E S S E n n

u

Eˆ  ( ) [(ˆ) ](  )  (  )

Chia cho n-2 ta có kết mong muốn

2 t

2 n

u E

E 

       

 

ˆ ) ˆ

(

Vậy, ˆ2là ước lượng không thiên lệch 2

 3.A.8 Chứng Minh Phương Trình 3.25

Giá trị tổng bình phương viết lại sau:

     

t t t

t Y Y Y Y Y

Y ) ( ˆ ˆ )

(

= (Yt Yˆt)2 (Yˆt Y)2 2(Yt Yˆt)(Yˆt Y)

Với uˆt Yt Yˆt, hai số hạng hai số hạng có phương trình (3.25) Bây tất điều ta cần phải chứng minh (Yt Yˆt)(Yˆt Y)uˆt(Yˆt Y)0

(54)

Từ phương trình chuẩn (3.4), uˆt (Yt ˆ ˆXt)0 Từ phương trình (3.5), 

uˆtXt  (Yt ˆ ˆXt)Xt 0, kết chứng minh

 3.A.9 Chứng Minh Phương Trình 3.26a

Để chứng minh phương trình (3.26a), trước tiên ta tìm đồng phương sai mẫu (ký hiệu Cov) Yt Yˆ Từ phương trình (2.10), t

Cov (Yt, Yˆ ) = t n11(Yt Y)(Yˆt Y)

Lưu ý trung bình Yˆ t Ybởi ˆ ˆXY Vậy,

) ˆ ( ˆ ) ˆ ( ) ˆ

(Y Y Y Y u Y Y

Y

Yt   t  t  t   t  t 

Do đó,

Cov (Yt, Yˆ ) = t n 1

Y Y

n

Y Y

u

t t

t

  

 

ˆ (ˆ ) (ˆ )

Phần trước cho thấy số hạng thứ Do vậy, đồng phương sai Yt Yˆ với số t

hạng thứ hai, RSS/(n-1);

Cov (Yt, Yˆ ) = t

1 n RSS

Ta có

Var(Yt) =

1 n TSS

 Var(Yˆ ) = t n

RSS

n Y

Y

t

  

(ˆ )

Từ phương trình (2.7) ta nhớ lại bình phương hệ số tương quan đơn Yt Yˆ xác định t

Thay đồng phương sai phương sai từ biểu thức vừa rút bỏ n-1, ta có

2

2 Y

Y TSS R

RSS RSS

TSS RSS

r ˆ   

) ˆ ,

( t t

2 Y Y

Cov

) ˆ ( )

(Yt Var Yt Var

2 Y Y

(55)

Vậy, bình phương tương quan đơn giá trị quan sát Yt và giá trị Yˆ dự báo mô hình t hồi qui R2

định nghĩa phương trình (3.26)

 3.A.10 Chứng Minh Rằng r2

xy = R2 Cho Mơ Hình Hồi Qui Đơn

Trong phần ta chứng minh trường hợp mơ hình hồi qui đơn, R2

với bình

phương tương quan đơn X Y Từ phương trình (2.11), r2

xy = S2xy/(SxxSyy) Syy với

tổng bình phương TSS Hơn nữa, RSS =  

t Y

Yˆ )

( Vì Yˆt ˆ ˆXt Yˆ ˆX, ta có )

( ˆ

ˆ Y X X

Yt   t Do đó,

xx 2 t 2

t Y X X S

Y

RSS(ˆ  ) βˆ (  ) βˆ

Từ phương trình (3.10), ˆ = Sxy/Sxx Thay kết cho số hạng ˆ trên, ta thu

xy xx

xx

xy S S

S S

RSS  

       ˆ ( ) ˆ

Thay Sxy từ kết lưu ý Syy = TSS, ta có

2 xy xx xy xy yy xx xy

xy TSS R

S TSS S S S S S S

r   ˆ 

Kết chứng minh

 3.A.11 Chứng Minh Phương Trình 3.28

2 0

0 EY E YX

Y

Var(ˆ ) [ˆ  (ˆ )]

2

2

0 X E X

X

E[ˆ ˆ  ]  [(ˆ ) (ˆ)]

 ) ˆ , ˆ ( ) ˆ ( ) ˆ (    

Var X2Var 2X0Cov

0

Trong phép biến đổi trên, ta dùng tính chất 2.4a Thay từ phương trình (3.18), (3.19) (3.20), ta              xx xx o xx t S X X S X nS X Y

Var(ˆ )

Với Sxx =

2

t nX

X 

(56)

   

 

      

  

  

xx 2

xx 2

0 S

X X n S

X X X X n Y

Var(ˆ ) ( )

Kết phương trình (3.28)

3.A.12 Chứng minh phương trình 3.29

Gọi uˆ0 Y0Yˆ0là sai số điểm dự báo Y0, với Yˆ0 ˆ ˆX0là giá trị dự báo trung bình

Do ta có

) ˆ , ( )

ˆ ( )

( )

ˆ

(u0 Var Y0 Var Y0 2Cov Y0 Y0

Var   

Vì Y0 =  + X0 + u0, Var(Y0) = 2 Mặt khác, Var(Yˆ ) xác định phương trình (3.26) Cuối

cùng, Cov(Y0,Yˆ ) = 0, u0 khơng tương quan với số dư khác khơng tương quan

với ˆ ˆ Vậy ta có

   

 

   

xx 2

0 S

X X n 1 u

(57)

BÀI TẬP

Câu Hỏi Lý Thuyết

3.1 Tất tổng bốn biểu thức dùng để tính liệu mẫu, khơng phải dành cho tập hợp hồn chỉnh Hãy biểu thức sai Giải thích biểu thức hay sai

a tn1uˆt 0 b tn1 Xtuˆt 0 c tn1ut 0 d tn1 Xt ut 0

3.2 Có khác biệt số hạng sai số phần dư? Hãy giải thích khác biệt ut

E(ut) Sau đó, chứng minh E(uˆt)0 Và giải thích giá trị kỳ vọng nghĩa nêu giả thiết cần thiết để chứng minh biểu thức

3.3 Cho mơ hình tuyến tính đơn biến Yt Xtut, chứng minh giả thiết định, phương pháp ước lượng OLS cho kết ước lượng không

chệch? Có nghĩa cần phải chứng minh ( ( )

^

t t E Y Y

E  Hãy nêu giả thiết

cần thiết cho việc chứng minh

3.4 Nêu giả thiết cần thiết cho phát biểu sau Đồng thời giải thích lý giả thiết cần cho phát biểu

e Để ước lượng   phương pháp OLS

f Để chứng minh ước lượng thông số theo phương pháp OLS không chệch quán

g Để chứng minh ước lượng theo phương pháp OLS hiệu h Để thực kiểm định t F

3.5 Những câu hỏi sau hay sai? Nếu câu hỏi phần, bạn phần Giải thích lý câu (phần)

i Các ước lượng hệ số góc theo phương pháp OLS xác giá trị X gần với trị trung bình mẫu chúng

j Nếu Xt ut tương quan, ước lượng không chệch

k Các ước lượng ước lượng khơng lệch tuyến tính tốt (BLUE) tất giá trị ut tuân theo phân bố chuẩn

l Nếu số hạng sai số khơng tn theo phân phối chuẩn kiểm định t F thực

m Nếu phương sai ut lớn khoảng tin cậy ước lượng lớn (rộng)

n Nếu phương sai X lớn khoảng tin cậy ước lượng hẹp o Khi trị số p-value lớn hệ số khác cách đáng kể

Ngày đăng: 14/01/2021, 13:05

HÌNH ẢNH LIÊN QUAN

BẢNG 3.1 Giá trị trung bình ước lượng và trung bình thực tế của giá nhà và diện tích sử dụng (mét vuơng)  - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
BẢNG 3.1 Giá trị trung bình ước lượng và trung bình thực tế của giá nhà và diện tích sử dụng (mét vuơng) (Trang 3)
HÌNH 3.2 Phương Trình Hồi Quy của Tổng Thể và của Mẫu - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
HÌNH 3.2 Phương Trình Hồi Quy của Tổng Thể và của Mẫu (Trang 4)
khơng tập trung. Hình 3.4b là một ví dụ về tự tương quan khi giả thuyết trên bị vi phạm. - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
kh ơng tập trung. Hình 3.4b là một ví dụ về tự tương quan khi giả thuyết trên bị vi phạm (Trang 14)
3.4 Độ Chính Xác của Ước Lượng và Mức Độ Thích Hợp của Mơ Hình - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
3.4 Độ Chính Xác của Ước Lượng và Mức Độ Thích Hợp của Mơ Hình (Trang 15)
HÌNH 3.5 Các Thành Phần củaY - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
HÌNH 3.5 Các Thành Phần củaY (Trang 18)
BƯỚC 3 Trong bảng tra phân phối tở trang bìa trước của sách, tra bậc tự do là n–2. Và chọn mức ý nghĩa () và xác định điểm t* n–2() sao cho P(t &gt; t*) =  - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
3 Trong bảng tra phân phối tở trang bìa trước của sách, tra bậc tự do là n–2. Và chọn mức ý nghĩa () và xác định điểm t* n–2() sao cho P(t &gt; t*) =  (Trang 22)
HÌNH 3.6 Kiểm Định Một Phía với H0: = 0 H1:  0 - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
HÌNH 3.6 Kiểm Định Một Phía với H0: = 0 H1:  0 (Trang 23)
Xác suất này (được gọi là p-value) là phần diện tích bên phải tc trong phân phố it (xem Hình 3.7) và là xác suất sai lầm loại I – nghĩa là xác suất loại bỏ giả thuyết H 0 - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
c suất này (được gọi là p-value) là phần diện tích bên phải tc trong phân phố it (xem Hình 3.7) và là xác suất sai lầm loại I – nghĩa là xác suất loại bỏ giả thuyết H 0 (Trang 24)
HÌNH 3.8 Kiểm Định Hai Phía với H0: = 0 H1:  0 - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
HÌNH 3.8 Kiểm Định Hai Phía với H0: = 0 H1:  0 (Trang 26)
BẢNG 3.3 Phân Tích Phương Sai - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
BẢNG 3.3 Phân Tích Phương Sai (Trang 29)
Nếu X0 = X, khoảng tin cậy sẽ hẹp nhất. Hình 3.9 cho ý niệm về “dải tin cậy” với các giá trị X 0 - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
u X0 = X, khoảng tin cậy sẽ hẹp nhất. Hình 3.9 cho ý niệm về “dải tin cậy” với các giá trị X 0 (Trang 35)
HÌNH 3.10 Cực Tiểu Hĩa Tổng Bình Phương theo Trục Tung và Trục Hồnh - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
HÌNH 3.10 Cực Tiểu Hĩa Tổng Bình Phương theo Trục Tung và Trục Hồnh (Trang 38)
Mơ hình hồi quy tuyến tính ước lượng được trình bày dưới đây kèm với các trị thống kê mẫu t trong ngoặc đơn (Phần Thực Hành Máy Tính 3.6 hướng dẫn cách lập lại kết quả của  phần này và Bảng 3.5 trình bày kết quả.)  - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
h ình hồi quy tuyến tính ước lượng được trình bày dưới đây kèm với các trị thống kê mẫu t trong ngoặc đơn (Phần Thực Hành Máy Tính 3.6 hướng dẫn cách lập lại kết quả của phần này và Bảng 3.5 trình bày kết quả.) (Trang 40)
Mặc dù mơ hình hồi quy tuyến tính đơn hai biến được sử dụng trong chương này, nhưng hầu hết các khía cạnh cơ bản của việc tiến hành phân tích thực nghiệm đã được đề cập - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
c dù mơ hình hồi quy tuyến tính đơn hai biến được sử dụng trong chương này, nhưng hầu hết các khía cạnh cơ bản của việc tiến hành phân tích thực nghiệm đã được đề cập (Trang 42)
Hình 3.A.2 Minh họa về phương sai của sai số khơng đổi - Bài đọc 14-1. Nhập môn kinh tế lượng với các ứng dụng - 5th ed. Chương 3: Mô hình hồi quy tuyến tính đơn. Phần 3.5-3.6 và 3.8-3.10
Hình 3. A.2 Minh họa về phương sai của sai số khơng đổi (Trang 47)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w