Bài đọc 12-2. Kinh tế lượng cơ sở - 3rd. ed.. Chương 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản; Chương 3: Mô hình hồi quy hai biến: Vấn đề ước lượng. Phần 3.1-3.2

68 30 0
Bài đọc 12-2. Kinh tế lượng cơ sở - 3rd. ed.. Chương 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản; Chương 3: Mô hình hồi quy hai biến: Vấn đề ước lượng. Phần 3.1-3.2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Biểu thức thứ hai là một ví dụ của mô hình hồi qui không tuyến tính (theo các thông số); chúng ta sẽ không bàn tới những mô hình nhƣ vậy trong tài liệu này. Trong hai cách giải thích về[r]

(1)

C

CHHƯƯƠƠNNGG22

P

PHHÂÂNN TTÍÍCCHH HHII QQUUYY HHAAII BBIINN:: M

MTT SS ÝÝ TTƯƯNNGG CCƠƠ BBN N

Trong chƣơng thảo luận khái niệm hồi quy cách tổng quát Trong chƣơng tiếp cận vấn đề cách tƣơng đối hệ thống Đặc biệt, chƣơng ba chƣơng giúp bạn đọc làm quen với lý thuyết làm tảng cho phân tích hồi quy đơn giản có đƣợc, gọi hồi quy hai biến Chúng ta xem xét trƣờng hợp trƣớc, không thiết khả thực tế nó, mà trình bày cho ý tƣởng phân tích hồi quy cách đơn giản đƣợc số ý tƣởng đƣợc minh họa biểu đồ hai chiều Hơn nữa, nhƣ thấy, đứng nhiều phƣơng diện trƣờng hợp phân tích hồi quy bội tổng quát mở rộng hợp lý trƣờng hợp hồi quy hai biến

2.1 MỘT VÍ DỤ GIẢ THIẾT

Nhƣ Phần 1.2, phân tích hồi quy chủ yếu để ƣớc lƣợng và/hay dự đốn trung bình (tổng thể) giá trị trung bình biến độc lập sở giá trị biết xác định (các) biến giải thích Để hiểu điều đƣợc thực nhƣ nào, xem xét ví dụ sau

Giả thiết có quốc gia với tổng thể1

60 gia đình Giả sử quan tâm đến việc nghiên cứu mối quan hệ Y chi tiêu tiêu dùng hàng tuần gia đình X thu nhập khả dụng hàng tuần gia đình hay thu nhập sau đóng thuế Nói cách cụ thể giả định muốn dự đoán mức trung bình (tổng thể) chi tiêu tiêu dùng hàng tuần biết thu nhập hàng tuần gia đình Để thực điều này, giả sử chia 60 gia đình thành 10 nhóm có thu nhập tƣơng đối nhƣ xem xét chi tiêu tiêu dùng gia đình nhóm thu nhập Các liệu giả thiết nằm Bảng 2.1 (Với mục đích để thảo luận, giả định mức thu nhập đƣa bảng 2.1 thật đƣợc quan sát.)

Bảng 2.1 đƣợc giải thích nhƣ sau: Ví dụ nhƣ, tƣơng ứng với thu nhập hàng tuần 80 đơla, có năm gia đình có mức chi tiêu tiêu dùng hàng tuần khoảng 55 đến 75 đôla Tƣơng tự, với X = 240$, có sáu gia đình có mức chi tiêu tiêu dùng hàng tuần nằm khoảng 137$ 189$ Nói cách khác, cột dọc (dãy đứng) Bảng 2.1 cho thấy phân phối chi tiêu tiêu dùng Y tƣơng ứng với mức thu nhập X cố định: có nghĩa là, cho thấy phân phối có điều kiện Y phụ thuộc vào giá trị định X

Lƣu ý liệu Bảng 2.1 tiêu biểu cho tổng thể, dễ dàng tính tốn các xác suất có điều kiện Y, p(Y X), xác suất Y với điều kiện X nhƣ sau.2 Ví dụ, với X= 80$, có giá trị Y: 55$, 60$, 65$, 70$, 75$ Do đó, với X=80, xác suất để

1 Ý nghĩa thống kê thuật ngữ tổng thể đƣợc giải thích phần phụ lục A Nói đơn giản, tập hợp tất

các kết xảy thí nghiệm hay đo đạc, ví dụ: tung đồng tiền nhiều lần hay ghi chép lại giá tất chứng khóan Thị trƣờng Trao đổi Chứng khoán New York vào cuối ngày kinh doanh

2 Giải thích ký hiệu: biểu thức p(Y X) hay p(Y X

i) viết tắt cho p(Y=Yj X=Xi), có nghĩa là, xác suất để biến

ngẫu nhiên (rời rạc) Y có giá trị số Yj với điều kiện biến ngẫu nhiên (rời rạc) X có giá trị số Xi Tuy

nhiên để tránh làm lộn xộn ký hiệu, dùng số dƣới i (chỉ số quan sát) cho hai biến Nhƣ vậy, p(Y X) hay p(Y Xi) thay cho p(Y=Yi X=Xi), có nghĩa là, xác suất để Y có giá trị Yi X lấy giá trị Xi,

(2)

có đƣợc số chi tiêu tiêu dùng 1/5 Biểu thị ký hiệu toán học p(Y= 55 X = 80) = 1/5 Tƣơng tự, p(Y= 150 X = 260) = 1/7, v.v Xác suất có điều kiện liệu Bảng 2.1 đƣợc trình bày Bảng 2.2

Bây phân phối xác suất có điều kiện của Y tính đƣợc số trung bình giá trị trung bình nó, đƣợc gọi trung bình có điều kiện hay kỳ vọng có điều kiện, đƣợc thể E(Y X = Xi) đƣợc diễn giải "giá trị kỳ vọng Y X

nhận giá trị cụ thể Xi," để đơn giản hóa mặt ký hiệu viết lại thành nhƣ sau: E(Y

Xi) (Lƣu ý: giá trị kỳ vọng đơn trung bình tổng thể hay giá trị trung bình) Đối

với liệu giả thiết chúng ta, kỳ vọng có điều kiện đƣợc tính tốn cách dễ dàng cách nhân giá trị Y tƣơng ứng Bảng 2.1 với xác suất có điều kiện chúng Bảng 2.2 cộng kết lại Để minh họa, trung bình có điều kiện tức kỳ vọng có điều kiện Y với X = 80 55(1/5) + 60(1/5) + 65(1/5) + 70(1/5) + 75(1/5) = 65 Nhƣ kết trung bình có điều kiện đƣợc đặt hàng cuối Bảng 2.2

BẢNG 2.1

Thu nhập gia đình hàng tuần X, $

X 

Y  80 100 120 140 160 180 200 220 240 260

Chi tiêu 55 65 79 102 102 110 120 135 137 150 tiêu dùng 60 70 84 93 107 115 136 137 145 152 gia đình 65 74 90 95 110 120 140 140 155 175

hàng 70 80 94 103 116 130 144 152 165 178

tuần Y, $ 75 85 98 108 118 135 145 157 175 180

_ 88 _ 113 125 140 _ 160 189 185

_ _ _ 115 _ _ _ 162 _ 191

Tổng cộng 325 462 445 707 678 750 685 1043 966 1211

Trƣớc tiếp tục, việc xem xét liệu Bảng 2.1 đồ thị phân tán giúp cho ta nhiều điều bổ ích, nhƣ hình 2.1 Đồ thị phân tán cho thấy phân phối có điều kiện Y ứng với giá trị khác X Mặc dù có biến đổi chi tiêu tiêu dùng gia đình, Hình 2.1 cho thấy cách rõ ràng chi tiêu tiêu dùng mặt trung bình tăng thu nhập tăng Nói cách khác, đồ thị phân tán cho thấy giá trị trung bình (có điều kiện ) Y tăng X tăng Có thể nhận thấy quan sát cách sinh động tập trung vào điểm có kích thƣớc lớn thể trung bình có điều kiện khác Y Đồ thị phân tán cho thấy trung bình có điều kiện nằm hàng thẳng với độ dốc đồng biến.3

Đƣờng thẳng đƣợc gọi đƣờng hồi qui tổng thể, gọi cách khái quát, đƣờng cong hồi qui tổng thể Đơn giản hơn, đƣờng thẳng hồi qui của Y X

3Các bạn đọc cần nhớ liệu ta giả thiết Ở khơng gợi ý trung bình có điều kiện

(3)

BẢNG 2.2

Xác suất có Điều kiện p(Y Xi) liệu Bảng 2.1

p(Y Xi) X

 80 100 120 140 160 180 200 220 240 260 Xác suất 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 có điều kiện 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 p(Y Xi) 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 _ 1/6 _ 1/7 1/6 1/6 _ 1/7 1/6 1/7

_ _ _ 1/7 _ _ _ 1/7 _ 1/7

Trung bình có

điều kiện Y 65 77 89 101 113 125 137 149 161 173

Như mặt hình học, đường cong hồi qui tổng thể đơn giản quỹ tích trung bình có điều kiện hay kỳ vọng có điều kiện biến số phụ thuộc giá trị xác định (các) biến giải thích Có thể vẽ đƣờng nhƣ hình 2.2, cho thấy Xi có tổng thể giá trị Y (đƣợc giả định có phân phối chuẩn lý chúng tơi

giải thích sau) trung bình (có điều kiện ) tƣơng ứng Và đƣờng thẳng hay đƣờng cong hồi qui ngang qua giá trị trung bình có điều kiện Với cách giải thích đƣờng cong hồi qui bạn có lẽ cảm thấy bổ ích đọc lại định nghĩa hồi qui cho phần 1.2

Hình 2.1

(4)

2.2 KHÁI NIỆM HÀM HỒI QUI TỔNG THỂ (PRF)

Từ phần thảo luận trƣớc đặc biệt từ hai hình 2.1 2.2, rõ ràng trung bình có điều kiện E(Y Xi) hàm Xi Thể ký hiệu:

E(Y Xi) = f (Xi) (2.2.1)

trong f (Xi) hàm biến giải thích Xi [Trong ví dụ giả thiết chúng ta, E(Y Xi) hàm

tuyến tính Xi.] Phƣơng trình (2.2.1) đƣợc gọi hàm hồi qui tổng thể (hai biến) (PRF), hay

một cách ngắn gọn hồi qui tổng thể (PR) Phát biểu cách đơn giản là, trung bình (tổng thể) phân phối Y với điều kiện Xi có quan hệ hàm số với Xi Nói cách khác, cho

biết giá trị trung bình Y biến đổi nhƣ so với X

Hàm f (Xi) có dạng nhƣ nào? Câu hỏi quan trọng tình thực

tế khơng có sẵn tồn tổng thể để xem xét Do đó, dạng hàm PRF vấn đề thực nghiệm, trƣờng hợp cụ thể lý thuyết giúp cho ta mơt vài điều Ví dụ, nhà kinh tế học giả thiết chi tiêu tiêu dùng có quan hệ tuyến tính với thu nhập Nhƣ vậy, giả thiết gần giả định PRF E(Y Xi) hàm tuyến tính Xi, giả dụ thuộc loại

E(Y Xi) = i + 2Xi (2.2.2)

trong 1 2 là thông số nhƣng không thay đổi đƣợc gọi hệ số hồi

qui; 1 2 đƣợc gọi hệ số tung độ gốc hệ số độ dốc Phƣơng trình (2.2.2)

đƣợc gọi hàm hồi qui tổng thể tuyến tính Một số biểu thức thay đƣợc dùng tài liệu mơ hình hồi qui tổng thể tuyến tính hay phƣơng trình hồi qui tổng thể tuyến tính Trong phần sau, thuật ngữ hồi qui, phƣơng trình hồi qui, mơ hình hồi qui đƣợc dùng với nghĩa nhƣ

Khi phân tích hồi qui mối quan tâm để dự đoán PRF nhƣ (2.2.2), có nghĩa là, dự đốn giá trị 1 2 sở quan sát Y X Vấn đề đƣợc

nghiên cứu chi tiết Chƣơng Hình 2.2

(5)

2.3 Ý NGHĨA CỦA THUẬT NGỮ "TUYẾN TÍNH"

Bởi tài liệu quan tâm chủ yếu đến mơ hình tuyến tính nhƣ (2.2.2), điều cần thiết phải biết thuật ngữ "tuyến tính" thật có ý nghĩa gì, hiểu từ theo hai cách khác

Sự tuyến tính theo Biến số

Ý nghĩa có lẽ “tự nhiên” tuyến tính kỳ vọng có điều kiện Y một hàm tuyến tính Xi, ví dụ nhƣ (2.2.2).4 Về mặt hình học, đƣờng cong tuyến tính

trƣờng hợp đƣờng thẳng Theo cách giải thích này, hàm tuyến tính nhƣ E(Y Xi)

= 1 + 2Xi2 khơng phải hàm tuyến tính biến số X xuất với số mũ hay lũy thừa

2

Sự tuyến tính theo Thơng số

Cách giải thích thứ hai tuyến tính kỳ vọng có điều kiện Y , E(Y Xi), hàm

tuyến tính theo thơng số, ; tuyến tính khơng tuyến tính theo biến X.5 Theo cách giải thích này, E(Y Xi) = 1 + 2Xi2 mơ hình tuyến tính nhƣng E(Y Xi) = 1 + 2 Xi khơng phải Biểu thức thứ hai ví dụ mơ hình hồi qui khơng tuyến tính (theo thông số); không bàn tới mơ hình nhƣ tài liệu

Trong hai cách giải thích tuyến tính, tuyến tính theo thơng số có liên quan đến phát triển lý thuyết hồi qui dƣới Do đó, từ trở đi, thuật ngữ hồi qui "tuyến tính" ln có nghĩa hồi qui tuyến tính theo thơng số, , (có nghĩa là, thơng số có lũy thừa mà thơi); có tuyến tính khơng tuyến tính theo biến giải thích, tức giá trị X Điều đƣợc trình bày cách sơ đồ hóa Bảng 2.3 Nhƣ vậy, E(Y Xi) = 1 + 2Xi tuyến tính theo thơng số theo biến số, LRM, E(Y Xi) = 1 + 2Xi2 vậy, tuyến tính theo thơng số nhƣng khơng tuyến tính theo biến số X

BẢNG 2.3

Các Mơ hình Hồi qui Tuyến tính

Mơ hình tuyến tính theo thơng số ? Mơ hình tuyến tính theo biến số ?

Phải Không phải Phải LRM LRM Không phải NLRM NLRM Chú ý: LRM = mơ hình hồi qui tuyến tính

4

Hàm Y = f(x) đƣợc coi tuyến tính theo X X xuất với lũy thừa hay số mà thơi (có nghĩa những số hạng nhƣ X2

, X v.v đƣợc loại bỏ) không đƣợc nhân hay chia với biến khác (ví dụ, X *Z hay X/Z, Z biến khác) Nếu Y phụ thuộc vào X, cách khác để nói Y có quan hệ tuyến tính với X tỉ lệ thay đổi Y so với X (có nghĩa độ dốc, hay đạo hàm, Y so với X, dY/dX) không phụ thuộc vào giá trị X Nhƣ vậy, Y=4X, dY/dX=4, tức kết không phụ thuộc vào giá trị X Nhƣng Y=4X2, dY/dX =8X, tức có phụ thuộc vào giá trị X Do hàm khơng tuyến tính theo X

5 Một hàm đƣợc gọi tuyến tính theo thơng số , ví dụ nhƣ 

1, 1 xuất với lũy thừa không nhân

(6)

NLRM = mơ hình hồi qui khơng tuyến tính

2.4 ĐẶC TRƢNG NGẪU NHIÊN CỦA PRF

Từ hình 2.1 ta thấy rõ thu nhập gia đình tăng, chi tiêu tiêu dùng gia đình mặt trung bình tăng theo Nhƣng chi tiêu tiêu dùng gia đình so với mức thu nhập (khơng đổi) sao? Từ hình 2.1 Bảng 2.1 ta thấy rõ chi tiêu tiêu dùng gia đình khơng thiết phải tăng mức thu nhập tăng Ví dụ, Bảng 2.1 quan sát thấy tƣơng ứng với mức thu nhập 100 đơla có gia đình với mức chi tiêu tiêu dùng 65 đơla thấp mức chi tiêu tiêu dùng hai gia đình mà mức thu nhập hàng tuần có 80 đôla Nhƣng lƣu ý mức chi tiêu tiêu dùng trung bình gia đình với thu nhập hàng tuần 100 đôla lớn mức chi tiêu tiêu dùng trung bình gia đình có mức thu nhập hàng tuần 80 đơla (77 đôla so với 65 đôla)

Nhƣ vậy, nói mối tƣơng quan mức chi tiêu tiêu dùng gia đình cá thể mức thu nhập định? Từ hình 2.1 thấy với mức thu nhập Xi, mức chi tiêu tiêu dùng gia đình cá thể nằm xung quanh chi tiêu trung bình tất

các gia đình Xi, có nghĩa xung quanh kỳ vọng có điều kiện Do đó,

diễn đạt độ lệch Yi xung quanh giá trị kỳ vọng nhƣ sau:

ui = Yi - E(Y Xi)

hay

Yi = E(Y Xi) + ui (2.4.1)

trong độ lệch ui là biến số ngẫu nhiên khơng thể quan sát có giá trị âm dƣơng

Diễn đạt thuật ngữ chuyên môn, ui đƣợc gọi số hạng nhiễu ngẫu nhiên hay số hạng sai

số ngẫu nhiên

Chúng ta giải thích (2.4.1) nhƣ nào? Chúng ta nói chi tiêu gia đình cá thể, biết mức thu nhập nó, đƣợc thể nhƣ tổng hai thành tố, (1) E(Y Xi), đơn giản chi tiêu tiêu dùng trung bình tất gia đình có mức thu nhập

Thành tố đƣợc gọi thành tố tất định hay hệ thống, (2) ui, thành tố ngẫu nhiên hay

không hệ thống Chúng ta nhanh chóng xem xét chất số hạng nhiễu ngẫu nhiên, nhƣng tạm thời giả định số hạng thay hay đại diện cho tất biến số ta bỏ ngồi hay bỏ sót mà ảnh hƣởng đến Y nhƣng không đƣợc (hay không thể) đƣa vào mơ hình hồi qui

Nếu E(Y Xi) đƣợc giả định tuyến tính theo Xi , nhƣ (2.2.2), phƣơng trình (2.4.1) có

thể đƣợc biểu thị nhƣ sau:

Yi = E(Y Xi) + ui

= 1 + 2Xi + ui (2.4.2)

Phƣơng trình (2.4.2) giả định chi tiêu tiêu dùng gia đình có quan hệ tuyến tính đối với thu nhập cộng với số hạng nhiễu Nhƣ vậy, chi tiêu tiêu dùng gia đình, với X = 80$ (xem Bảng 2.1), đƣợc biểu thị nhƣ sau

Y = 55 = 1 + 2(80) + u1

Y2 = 60 = 1 + 2(80) + u2

Y3 = 65 = 1 + 2(80) + u3 (2.4.3)

(7)

Y5 = 75 = 1 + 2(80) + u5

Bây lấy giá trị kỳ vọng (2.4.2) hai vế, đƣợc

E(Yi Xi) = E[E(Y Xi)] + E(ui Xi)

= E(Y Xi) + E(ui Xi) (2.4.4)

trong ta vận dụng đặc tính giá trị kỳ vọng số số đó.6

Lƣu ý cẩn thận (2.4.4) lấy giá trị kỳ vọng có điều kiện, phụ thuộc vào giá trị X cho

Bởi E(Yi Xi) E(Y Xi), phƣơng trình (2.4.4) cho thấy

E(ui Xi) = (2.4.5)

Nhƣ vậy, giả định cho đƣờng hồi qui ngang qua giá trị trung bình có điều kiện Y (xem hình 2.2) có nghĩa giá trị trung bình có điều kiện ui (phụ thuộc vào giá trị

X) zero

Từ lý luận thấy rõ ràng (2.2.2) (2.4.2) hình thức tƣơng đƣơng E(ui Xi) = 0.7 Nhƣng đặc trƣng ngẫu nhiên (2.4.2) có ƣu điểm chỗ cho thấy cách

rõ ràng có biến số khác ngồi thu nhập ảnh hƣởng đến chi tiêu tiêu dùng giải thích cách đầy đủ chi tiêu tiêu dùng gia đình (những) biến số nằm mơ hình hồi qui

2.5 Ý NGHĨA CỦA SỐ HẠNG NHIỄU NGẪU NHIÊN

Nhƣ đƣợc lƣu ý Phần 2.4, số hạng nhiễu ui số hạng thay cho tất biến số

bị bỏ khỏi mơ hình nhƣng tất biến số tập hợp lại có ảnh hƣởng đến Y Câu hỏi đặt là: Tại không đƣa thẳng biến vào mơ hình cách cơng khai? Nói cách khác, khơng phát triển mơ hình hồi qui bội với nhiều biến tốt? Có nhiều lý

1 Sự mơ hồ lý thuyết: Lý thuyết định hành vi Y, có thể, thƣờng là, khơng hồn chỉnh Chúng ta biết chắn thu nhập hàng tuần X ảnh hƣởng đến chi tiêu tiêu dùng hàng tuần Y, nhƣng khơng biết biến khác ảnh hƣởng đến Y Do đó, ui đƣợc sử dụng làm biến thay cho tất biến bị

loại bỏ hay bỏ khỏi mơ hình

2 Dữ liệu khơng có sẵn: Ngay biết số biến bị loại bỏ biến xem xét đến hồi qui bội thay vào hồi qui đơn, chƣa có đƣợc thông tin định lƣợng biến Một kinh nghiệm thƣờng gặp phân tích thực nghiệm liệu lý tƣởng mà muốn có thơng thƣờng lại khơng có đƣợc Ví dụ, nguyên tắc đƣa giàu có gia đình vào làm biến giải thích thêm với biến thu nhập để giải thích chi tiêu tiêu dùng gia đình Nhƣng khơng may thơng tin giàu có gia đình thơng thƣờng khơng có Do buộc phải loại bỏ biến giàu có khỏi mơ hình có tầm quan trọng lý thuyết lớn cần thiết để giải thích chi tiêu tiêu dùng

6

Xem Phụ lục A phần thảo luận đặc tính toán tử kỳ vọng E Chú ý E(Y Xi), giá trị Xi

là không đổi, số

7 Sự thật là, phƣơng pháp bình phƣơng tối thiểu đƣợc phát triển chƣơng 3, giả định cách rõ

(8)

3 Các biến cốt lõi (core) biến ngoại vi (peripheral): Giả định ví dụ thu nhập- chi tiêu chúng ta, thu nhập X1 ra, số gia đình X2, giới tính X3, tơn giáo

X4, giáo dục X5, khu vực địa lý X6 ảnh hƣởng đến chi tiêu tiêu dùng Nhƣng hồn tồn có

thể ảnh hƣởng chung tất hay vài biến nhỏ chí khơng hệ thống ngẫu nhiên đến mức xét phƣơng diện thực tế lý chi phí việc đƣa chúng vào mơ hình cách rõ ràng khơng có ích lợi Chúng ta hy vọng rằng ảnh hƣởng kết hợp chung chúng đƣợc xử lý nhƣ biến ngẫu nhiên ui.8

4 Bản chất ngẫu nhiên hành vi người: Ngay thành công việc đƣa tất biến liên quan vào mơ hình, chắn cịn số "ngẫu nhiên" thuộc chất cá thể Y mà khơng thể giải thích đƣợc có cố gắng đến Các biến nhiễu, biến số u, thể đƣợc chất ngẫu nhiên

5 Các biến thay kém: Mặc dù mơ hình hồi qui cổ điển (sẽ đƣợc phát triển chƣơng 5) giả định biến Y X đƣợc tính tốn cách xác, thực tế liệu khơng xác sai số tính tốn Ví dụ nhƣ xem lý thuyết tiếng Milton Friedman hàm chi tiêu.9

Ông xem tiêu thụ thường xuyên (Yp) hàm thu nhập thường xuyên (Xp) Nhƣng liệu biến số trực tiếp quan sát đƣợc, thực tế dùng biến thay thế, ví dụ nhƣ chi tiêu thời (Y) thu nhập thời (X), là biến mà quan sát đƣợc Bởi Y X quan sát đƣợc khơng tƣơng đƣơng với Yp

Xp, ta gặp phải vấn đề sai sót tính tốn Nhƣ số hạng nhiễu u trƣờng hợp cịn tƣợng trƣng cho sai sót tính toán Nhƣ thấy chƣơng sau, có sai sót nhƣ tính tốn, chúng có tác động nghiêm trọng việc tính tốn hệ số hồi qui 

6 Nguyên tắc chi li: Tuân theo nguyên tắc Lƣỡi dao Occam,10 chúng tơi muốn giữ cho mơ hình hồi qui đơn giản tốt Nếu giải thích hành vi Y "một cách đầy đủ" hai hay ba biến giải thích lý thuyết khơng đủ mạnh ta thấy đƣa biến khác vào, đƣa thêm biến vào? Hãy để ui biểu thị tất

những biến khác Dĩ nhiên, không nên loại bỏ biến quan trọng liên quan nhằm để giữ cho mơ hình đơn giản

7 Dạng hàm sai: Ngay mặt lý thuyết có đƣợc biến để giải thích cho tƣợng thu đƣợc liệu biến này, thông thƣờng dạng quan hệ hàm số biến hồi qui phụ thuộc biến hồi qui độc lập Có tiêu tiêu dùng hàm (theo biến số) tuyến tính thu nhập hàm khơng tuyến tính (theo biến số)? Nếu trƣờng hợp đầu, Yi = 1 + 2Xi + ui quan hệ hàm số

thích hợp Y X, nhƣng trƣờng hợp sau, Yi = 1 + 2Xi + 2Xi2 + ui dạng

hàm đúng.Trong mơ hình hai biến suy xét dạng hàm mối quan hệ từ đồ thị phân tán Nhƣng mô hình hồi qui bội, khơng dễ dàng xác định dạng hàm thích hợp, khơng thể tƣởng tƣợng đƣợc đồ thị phân tán không gian đa chiều

Vì tất lý này, số hạng nhiễu ui đóng vai trị vơ quan trọng

phân tích hồi qui, thấy điều tiếp tục

8 Một khó khăn biến nhƣ giới tính, giáo dục, tơn giáo v.v khó định lƣợng

9 Milton Friedman, A Theory of the Consumption Function ( Một lý thuyết hàm tiêu dùng) , Princeton University

Press, Princeton, N.J., 1957

10

(9)

2.6 HÀM HỒI QUI MẪU (SRF)

Cho tới cách giới hạn thảo luận vào tổng thể giá trị Y tƣơng ứng với các giá trị không đổi X, cố tình tránh khơng xem xét đến việc lấy mẫu (lƣu ý liệu Bảng 2.1 tiêu biểu cho tổng thể, mẫu) Nhƣng đến lúc phải đối diện với vấn đề lấy mẫu, hầu hết tình thực tế có mẫu giá trị Y tƣơng ứng với số X khơng đổi Do đó, nhiệm vụ phải tính tốn PRF sở thông tin mẫu

Bảng 2.4

Một mẫu ngẫu nhiên từ tổng thể Bảng 2.1

Y X

70 80

65 100

90 120

95 140

110 160

115 180

120 200

140 220

155 240

150 260

Để minh họa, giả vờ chƣa biết đƣợc tổng thể Bảng 2.1 thông tin chúng ta có mẫu lựa chọn ngẫu nhiên giá trị Y tƣơng ứng với X không đổi cho trong Bảng 2.4 Không giống nhƣ Bảng 2.1, có giá trị Y tƣơng ứng với giá trị X biết; Y (đã biết Xi) Bảng 2.4 đƣợc chọn cách ngẫu nhiên từ

Y tƣơng tự tƣơng ứng với Xi từ tổng thể Bảng 2.1

Vấn đề là: Từ mẫu Bảng 2.4 liệu tiên đoán đƣợc chi tiêu tiêu dùng hàng tuần trung bình Y tổng thể tƣơng ứng với X đƣợc chọn? Nói cách khác, liệu tính đƣợc PRF từ liệu mẫu khơng? Nhƣ bạn đọc chắn nghi vấn, khơng thể tính đƣợc PRF "một cách xác" giao động việc lấy mẫu Để thấy đƣợc điều này, giả sử lấy mẫu ngẫu nhiên khác từ tổng thể Bảng 2.1, nhƣ đƣợc trình bày Bảng 2.5

(10)

Hình 2.3 Đƣờng hồi quy dựa hai mẫu khác

Bảng 2.5

Một mẫu ngẫu nhiên khác từ tổng thể Bảng 2.1

Y X

55 80

88 100

90 120

80 140

118 160

120 180

145 200

135 220

145 240

175 260

Giờ đây, tƣơng tự nhƣ đƣờng PRF nằm dƣới đƣờng hồi qui tổng thể, phát triển khái niệm hàm hồi qui mẫu (SRF) để thể đƣờng hồi qui mẫu Biểu thức mẫu tƣơng ứng với (2.2.2) đƣợc viết thành

Yi = 1 + 2Xi (2.6.1)

trong Yđƣợc đọc "Y mũ"

Yi = hàm ƣớc lƣợng E(Y Xi)

trong 1 = hàm ƣớc lƣợng 12 = hàm ƣớc lƣợng 2

(11)

tổng thể từ thông tin đƣợc cung cấp từ mẫu xem xét Một giá trị số định thu đƣợc cách áp dụng hàm ƣớc lƣợng đƣợc gọi giá trị ƣớc lƣợng.11

Cũng giống nhƣ biểu diễn PRF qua hai biểu thức tƣơng đƣơng (2.2.2) (2.4.2), biểu diễn SRF (2.6.1) dƣới dạng ngẫu nhiên nhƣ sau:

Yi = 1+2Xi + ui (2.6.2)

trong đó, ngồi ký hiệu mà định nghĩa, ui là số hạng phần dƣ (mẫu) Về mặt

khái niệm ui cũng tƣơng tự nhƣ ui đƣợc xem nhƣ ước lượng ui Nó đƣợc đƣa

vào SFR với lý nhƣ ui đƣợc đƣa vào PRF

Nói tóm lại, mục tiêu phân tích hồi quy để tính PRF

Yi = 1 +2Xi + ui (2.4.2)

trên sở SRF

Yi = 1+2Xi + ui (2.6.2)

bởi thơng thƣờng phƣơng pháp phân tích đƣợc dựa mẫu lấy từ tổng thể Nhƣng giao động việc lấy mẫu ƣớc lƣợng PRF sở SRF gần tốt Sự gần đƣợc đƣa thể biểu đồ thơng qua hình 2.4

Đối với X = Xi, có quan sát (mẫu) Y = Yi Theo SRF, thể Yi

quan sát đƣợc nhƣ sau

Yi = Y1+ ui (2.6.3)

và theo PRF đƣợc thể nhƣ sau

Yi = E(Y Xi) + ui (2.6.4)

Rõ ràng hình 2.4 Yi ước lượng cao E(Y Xi) thực Xi hình 2.4 Cũng

tƣơng tự nhƣ vậy, Xi nằm bên trái điểm A, SRF ước lượng thấp

PRF thực Nhƣng bạn dễ dàng thấy ƣớc lƣợng cao thấp điều tránh khỏi giao động việc lấy mẫu

Bây câu hỏi quan trọng là: Giả sử SRF gần PRF, liệu đặt quy luật hay phƣơng pháp để đƣa ƣớc lƣợng "gần" đƣợc khơng? Nói cách khác, làm cách để thiết lập SRF cho 1 "gần" với 1 thực 2 "gần" với 2 thực biết đƣợc 1 và 2 thực?

11 Nhƣ lƣu ý phần Giới thiệu, dấu mũ biến số tƣợng trƣng cho hàm ƣớc lƣợng giá trị tổng thể

(12)

Hình 2.4 Mẫu đƣờng hồi quy dân số

Câu trả lời cho vấn đề chiếm nhiều cơng sức giải thích chƣơng Ở lƣu ý phát triển phƣơng pháp cho làm cách để thiết lập SRF để thể PRF cách trung thực Quan niệm làm điều đƣợc khơng thật xác định đƣợc PRF điều lý thú

2.7 TÓM TẮT VÀ KẾT LUẬN

1 Khái niệm làm tảng cho phân tích hồi qui khái niệm hàm hồi qui tổng thể (PRF)

2 Tập sách đề cập đến PRF tuyến tính, có nghĩa là, hồi qui tuyến tính theo tham số chƣa biết Chúng tuyến tính hay khơng tuyến tính theo biến phụ thuộc hay biến hồi qui phụ thuộc Y biến độc lập hay (các) biến hồi qui độc lập X

3 Vì mục đích thực nghiệm, PRF ngẫu nhiên điều quan trọng Số hạng nhiễu ngẫu nhiên ui đóng vai trị định việc ƣớc lƣợng PRF

4 Đƣờng PRF khái niệm lý tƣởng hóa, thực tế đƣợc tồn tổng thể mà cần Thông thƣờng, có đƣợc mẫu quan sát từ tổng thể Do đó, dùng hàm hồi qui mẫu ngẫu nhiên (SRF) để ƣớc lƣợng PRF Chúng ta thấy điều đƣợc thực nhƣ chƣơng

BÀI TẬP

2.1 Bảng dƣới cho ta suất sinh lời dự đoán năm dự án đầu tƣ xác suất liên quan chúng

Suất sinh lời Xác suất

X, % pi

-20 0.10

-10 0.15

(13)

25 0.25

30 0.05

Sử dụng định nghĩa cho bảng phụ lục A, thực yêu cầu sau: a) Tính suất sinh lời kỳ vọng, E(X)

b) Tính phƣơng sai (2) độ lệch chuẩn () suất sinh lời

c) Hãy tính hệ số độ biến thiên, V, đƣợc định nghĩa V =  / E(X) Chú ý: V thƣờng đƣợc nhân với 100 để biểu thị dƣới dạng phần trăm

d) Dùng định nghĩa độ lệch (skewness), tính độ lệch phân phối suất sinh lời cho bảng Phân phối suất sinh lời ví dụ lệch dƣơng hay lệch âm?

e) Dùng định nghĩa độ nhọn (kurtosis), tính độ nhọn ví dụ Phân phối suất sinh lời cho bảng có độ nhọn vƣợt chuẩn (dạng hẹp) hay dƣới chuẩn (đuôi dài)?

2.2 Bảng dƣới cho ta phân phối xác suất liên kết, p(X,Y), biến X Y

X

Y

1 0.03 0.06 0.06

2 0.02 0.04 0.04

3 0.09 0.18 0.18

4 0.06 0.12 0.12

Sử dụng định nghĩa cho bảng phụ lục A, tính yêu cầu sau: a) Phân phối xác suất không điều kiện hay xác suất biên X Y

b) Tính phân phối xác suất có điều kiện p(X Yi) p(Y Xi)

c) Các kỳ vọng có điều kiện E(X Yi) E(Y Xi)

2.3 Bảng dƣới cho ta phân phối xác suất liên kết, p(X,Y), biến ngẫu nhiên X Y X = suất sinh lời năm (%) kỳ vọng đạt đƣợc từ dự án A Y = suất sinh lời năm (%) kỳ vọng đạt đƣợc từ dự án B

X

Y -10 0 20 30

20 0.27 0.08 0.16 0.00

50 0.00 0.04 0.10 0.35

a) Tính suất sinh lời kỳ vọng dự án A, E(X) b) Tính suất sinh lời kỳ vọng dự án B, E(Y)

c) Các suất sinh lời hai dự án có độc lập khơng? (Gợi ý: E(XY) =E(X)E(Y)?) Lƣu ý

E(X Y) = X Y p X Yi j

j i

i j

 

1

( )

(14)

X

Y 20 30 40 50 60 70 Tổng

20 1

30 11 14

40 10 15

50 10

60

70

Tổng 15 14 50

Nhƣ vậy, nhóm tuổi ngƣời chồng nằm 35 45 tuổi ngƣời vợ giữa 25 35, giá trị Y X lần lƣợt (đƣợc tập trung vào) 40 30, tần số

a) Xác định trung bình dãy, có nghĩa là, hàng ngang cột dọc

b) Đặt biến X hoành độ biến Y tung độ, vẽ đồ thị cho trung bình dãy (hay có điều kiện) tính đƣợc câu Các Anh/Chị sử dụng ký hiệu + cho trung bình cột dọc  cho trung bình hàng ngang

c) Chúng ta đƣa nhận xét quan hệ X Y?

d) Các trung bình cột dọc hàng ngang có điều kiện có nằm đƣờng tƣơng đối thẳng không? Vẽ đƣờng hồi qui

2.5 Bảng dƣới cung cấp kết định mức (X) lãi suất hoàn vốn (yield to maturity) Y (%) 50 trái phiếu, việc định mức đƣợc đánh giá theo cấp: X=1 (Bbb), X=2 (Bb), X=3 (B) Theo định mức Công ty Per Standard & Poor, Bbb, Bb B tất trái phiếu chất lƣợng trung bình, Bb đƣợc đánh giá cao B Bbb lại đƣợc đánh giá cao Bb

X Tổng

Y Bbb Bb B cộng

8.5 13 18

11.5 14 18

17.5 13 14

Tổng cộng 15 20 15 50

a) Chuyển Bảng thành bảng cung cấp phân phối xác suất liên kết, p(X,Y), ví dụ, p(X=1, Y=8.5) = 13/50 = 26

b) Tính p(Y X =1), p(Y X =2), p(Y X =3) c) Tính E(Y X =1), E(Y X =2), E(Y X =3)

d) Các kết suất sinh lợi câu (c) có phù hợp với kỳ vọng tiên nghiệm mối quan hệ định mức trái phiếu lãi suất hồn vốn khơng?

2.6 Hàm mật độ (density) liên kết hai biến ngẫu nhiên tiên tục X Y nhƣ sau f(X,Y) = - X - Y  X  1; 0 Y 

= trƣờng hợp khác a) Tính hàm mật độ biên, f(X) f(Y)

b) Tính hàm mật độ có điều kiện f(X Y) f(Y X)

(15)

c) Tính E(X) E(Y) d) Tính E(X Y = 0.4)

2.7 Xem xét liệu dƣới

Lƣơng trung vị nhà kinh tế học theo nhóm kinh nghiệm tuổi tác chọn lọc, sổ sách quốc gia, 1966 (ngàn đôla)

Số năm kinh nghiệm chuyên môn

Tuổi 0-2 2-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44*

20-24 7.5

25-29 9.0 9.1 10.0

30-34 9.0 9.5 11.0 12.6

35-39 10.0 11.7 13.2 15.0

40-44 9.6 11.0 13.0 15.5 17.0

45-49 12.0 15.0 17.0 20.0

50-54 11.3 13.3 15 18.2 20.0

55-59 13.8 16.0 18.0 19.0

60-64 13.1 16.0 17.2 18.8

65-69 13.8 17.0

70-74† #

12.5

Ghi chú: Các nhóm đƣợc chọn bao gồm tất ngƣời 25 ngƣời đại diện trả lời hơn, họ báo cho biết kết hợp tuổi tác kinh nghiệm nhƣ

* Nhóm thực gồm có 40 # Nhóm thực gồm có 70

Nguồn: N Arnold Tolles and Emanuel Melichar, “Studies of the Structure of Economists‟ Salaries and Income” (Các nghiên cứu Cấu trúc lƣợng Thu nhập Nhà kinh tế), American Economic Review, vol.57, no 5, pt.2, Suppl., December 1968, bảng H, trang 119

a) Các liệu cho ta thấy gì?

b) Tuổi tác hay kinh nghiệm có quan hệ gần mức lƣơng hay không? Làm Anh /Chị biết?

c) Hãy vẽ hai hình riêng biệt, trình bày mức lƣơng trung vị quan hệ với tuổi tác trình bày mức lƣơng trung vị quan hệ với kinh nghiệm nghề nghiệp (tính năm)

2.8 Xem xét liệu dƣới

a) Dùng trục Y để biểu thị thu nhập tiền trung bình trục X để tƣợng trƣng cho trình độ học vấn - năm trở xuống, 1-3 năm học trung học, năm trung học, 1-3 năm đại học, năm đại học năm đại học trở lên - vẽ đồ thị cho liệu nam nữ riêng biệt cho nhóm tuổi

b) Anh / Chị rút đƣợc kết luận tổng quát gì?

Tiểu Trung học Đại học

Tổng

học, năm

hay Tổng 1-3 Tổng 1-3

(16)

65 tuổi trở lên 33,145 17,028 24,003 19,530 25,516 44,424 34,323 43,092 52,149 Nữ, tổng cộng 22,768 13,322 18,469 15,381 18,954 27,493 22,654 28,911 35,827 25 đến 34 tuổi 21,337 11,832 16,673 13,385 17,076 25,194 20,872 27,210 32,563 35 đến 44 tuổi 24,453 13,714 19,344 15,695 19,886 29,287 23,307 31,631 37,599 45 đến 54 tuổi 23,429 13,490 19,500 16,651 19,986 29,334 24,608 29,242 38,307 55 đến 64 tuổi 21,388 13,941 18, 607 15,202 19,382 26,930 23,364 27,975 33,383 65 tuổi trở lên 19,194 * 18,281 * 18,285 23,277 * * * *Các giá trị sở nhỏ để thỏa mãn tiêu chuẩn thống kê độ tin cậy số tính đƣợc

Nguồn: Statistical Abstract of United States (Tóm Lƣợc Thống Kê Mỹ), 1992, Bộ thƣơng mại Mỹ, Bảng 713, trang 454.

2.9 Xem xét bảng trang bên cạnh:

a) Vẽ đồ thị mức lƣơng trung vị ba nhóm so với giá trị khoảng theo số lƣợng năm kinh nghiệm khác vẽ đƣờng hồi qui

b) Những yếu tố giải thích cho khác biệt mức lƣơng ba nhóm kinh tế gia? Đặc biệt nhà kinh tế có cử nhân kiếm đƣợc nhiều tiền đồng nghiệp họ có tiến sĩ có 15 năm kinh nghiệm trở lên? Quan sát có ngụ ý cho thấy có tiến sĩ khơng có ích lợi hay khơng?

Các mức lƣơng trung vị nhà kinh tế học (ngàn đôla) theo cấp đại học, 1966

Năm kinh nghiệm Tiến sĩ Thạc sĩ Cử nhân

Dƣới 9.8 8.0 9.0

2 - 10.0 8.8 8.9

5-9 11.5 10.5 10.6

10-14 13.0 12.3 13.0

15-19 15.0 15.0 15.6

20-24 16.2 15.6 17.0

25-29 18.0 17.0 20.0

30-34 17.9 17.7 20.0

35-39 16.9 16.2 20.5

40-14* 17.5 14.2 22.0

*Số nhóm thực 40

Nguồn: N Arnold Tolles and Emanuel Melichar, "Studies of the Structure of Economists' Salaries and Income," America EconomicReview, vol 57, no 5, pt 2, Suppl., December 1968, bảng III-B-3,trang 92

2.10 Xem xét Bảng dƣới đây:

Số lƣợng nhà kinh tế học theo năm kinh nghiệm tuổi tác (chỉ nhà kinh tế học làm việc toàn thời gian chuyên nghiệp)

Số năm kinh nghiệm

Nhóm tuổi 0-2 - 5-9 10-14 15-19 20-24* Tổng cộng

(năm)

20-24 24 13 - - - 38

25-29 121 405 184 - - - 710

30-34 77 497 825 197 - 1599

35-39 18 125 535 780 194 1653

40-44 36 161 652 761 235 1851

45-49 15 48 183 433 751 1431

50-54 19 52 119 784 980

(17)

60-64 - 382 400

65-69 - 1 206 214

70-74Å - - - - 27 28

Tổng cộng 250 1099 1787 1890 1550 2998 9574

*Số nhóm thực 20 hay nhiều Å Số nhóm thực 70 hay cao

Source: Adapted from "The Structure of Economists' Employment and Salaries, 1964," American Economic Review, vol 55, no 4, December 1965, table VII, p 40

Bảng cho thấy tần số tuyệt đối liên kết biến tuổi tác năm kinh nghiệm Dùng tần số tƣơng đối (chia tần số tuyệt đối cho tổng số) làm số đo xác suất, thực yêu cầu sau:

a) Tính phân phối xác suất liên kết tuổi tác năm kinh nghiệm

b) Tính phân phối xác suất có điều kiện tuổi tác cho năm kinh nghiệm khác

c) Tính phân phối xác suất có điều kiện năm kinh nghiệm cho mức tuổi tác khác

d) Dùng điểm khoảng mức tuổi tác khoảng năm kinh nghiệm, tính trung bình có điều kiện kết phân phối câu (b) (c)

e) Vẽ đồ thị phân tán thích hợp thể trung bình có điều kiện khác f) Nếu liên kết trung bình có điều kiện câu (e), Anh / Chị thu đƣợc gì? g) Anh / Chị có nhận xét mối quan hệ năm kinh nghiệm tuổi tác?

2.11 Xem xét xem mơ hình sau có tuyến tính theo thơng số hay biến hay khơng, hay có hai Mơ hình số mơ hình sau mơ hình hồi qui tuyến tính?

Mơ hình Từ mơ tả

a) Y

X u

i

i i

  

 

  

1 2 Nghịch đảo

b) Yi 12lnXi ui Nửa logarít

c) lnYi 12Xiui Nửa logarít nghịch

d) lnYi ln12lnXiui Logarít hay logarít bội

e) lnY

X u

i

i i

  

 

  

1 2

1 Logarít nghịch đảo

Chú ý: ln = logarít tự nhiên (có nghĩa là, log với số e); ui số hạng nhiễu ngẫu nhiên Chúng

ta nghiên cứu mơ hình chƣơng

2.12 Những mơ hình sau có phải mơ hình hồi qui tuyến tính khơng? Tại sao?

a) Yi e

Xi ui

 12 

b) Y

e

iXi ui

  

1

1

 

c) lnY

X u

i

i i

  

 

  

(18)

d) Yi e   u X

i

     

1

2 75 2

( )

e) Yi 12Xiui

3

2.13 Nếu 2= 0.8 (d) 2.12, mơ hình có trở thành mơ hình hồi qui tuyến tính khơng? Tại sao?

2.14 Xem xét mơ hình khơng ngẫu nhiên Chúng có phải mơ hình tuyến tính khơng, có nghĩa là, mơ hình có tuyến tính theo thơng số hay khơng? Nếu khơng, phép tốn đại số thích hợp chuyển chúng thành mơ hình tuyến tính hay khơng?

a) Y

X i

i

 

1

1

 

b) Y X

X i

i

i

 

1 2

c)

 

Y

X

i

i

  

1 exp 1 2

2.15 Một biến ngẫu nhiên rời rạc X có phân phối tam giác (rời rạc) PDF có dạng sau:

f(X) = 1/k với X = X1, X2, ,Xk [Xi Xj i j ]

a) Chứng minh phân phối E(X)= Xi 1/k phƣơng sai

 

   

2X  XiE Xi  1/k trong E(X)là giống

b) Nếu X = 1,2, , k giá trị E(X) X

2

bao nhiêu?

2.16 Bảng dƣới cung cấp liệu điểm Kiểm tra Năng khiếu Học đƣờng (SAT) trung bình học sinh năm cuối lên đại học 1967-1990

a) Dùng trục hoành cho năm trục tung cho điểm SAT để vẽ hai đồ thị riêng biệt điểm toán điểm vấn đáp cho nam nữ

b) Chúng ta rút đƣợc kết luận gì?

c) Khi biết điểm vấn đáp nam nữ , làm cách bạn tiên đốn đƣợc điểm toán họ?

(19)

Điểm Kiểm Tra Năng Khiếu Học Đƣờng (SAT) Trung Bình Của Những Học Sinh Năm Cuối Sắp Lên Đại Học, 1967-1 990*

Vấn đáp Verl~nl NI.Ith Toán

Năm Nam Nữ Tổng cộng Nam Nữ Tổng cộng

1967 463 468 466 514 46 492

1968 464 466 466 512 470 492

1969 459 466 463 513 470 191

1970 459 461 460 509 465 488

1971 454 457 455 507 466 488

1972 454 452 453 505 461 484

1973 446 443 445 502 460 431

1974 447 442 444 501 459 480

1975 437 431 434 495 449 472

1976 433 430 431 497 446 472

1977 431 427 429 497 445 470

1978 433 425 429 494 444 468

1979 431 423 427 493 443 467

1980 428 420 424 491 443 466

1981 430 418 424 492 443 466

1982 431 421 426 493 443 467

1983 430 420 425 493 445 468

1984 433 420 426 495 449 471

1985 437 425 431 499 452 475

1986 437 426 431 501 451 475

1987 435 425 430 500 453 476

1988 435 422 428 498 455 476

1989 434 421 427 500 454 476

1990 429 419 424 499 455 476

* Dữ liệu cho 1967-1971 số ƣớc lƣợng

Source: The College Board The NewYork Times, Aug 28, 1990, p.B-5

(20)

C

CHHƯƯƠƠNNGG33

M

MƠƠ HHÌÌNNHH HHII QQUUYY HHAAII BBIINN::

V

VNN ĐĐ ƯƯCC LLƯƯNNGG

Nhƣ lƣu ý Chƣơng 2, nhiệm vụ ƣớc lƣợng xác tối đa hàm hồi quy tổng thể (PRF) sở hàm hồi quy mẫu (SRF) Có nhiều phƣơng pháp xây dựng hàm SRF, nhƣng nay, liên quan tới q trình phân tích hồi quy, phƣơng pháp bình phƣơng tối thiểu thông thƣờng (OLS)12

phƣơng pháp đƣợc sử dụng nhiều phổ biến Trong chƣơng này, ta thảo luận phƣơng pháp cho mơ hình hồi quy hai biến Sau đó, Chƣơng 7, ta xem xét tổng quát hố phƣơng pháp cho mơ hình hồi quy đa biến

3.1 PHƢƠNG PHÁP BÌNH PHƢƠNG TỐI THIỂU THƠNG THƢỜNG:

Phƣơng pháp bình phƣơng tối thiểu thơng thƣờng Carl Friedrich Gauss, nhà tốn học ngƣời Đức đƣa Dựa giả thiết định (đƣợc thảo luận Phần 3.2), phƣơng pháp bình phƣơng tối thiểu có số tính chất thống kê hấp dẫn làm cho trở thành phƣơng pháp phân tích hồi quy mạnh phổ biến Để hiểu phƣơng pháp này, trƣớc tiên ta phải giải thích ngun tắc bình phƣơng tối thiểu

Ta nhắc lại hàm PRF hai biến:

i i

i X u

Y  ˆ1 ˆ2  (2.4.2)

Tuy nhiên nhƣ lƣu ý Chƣơng 2, hàm PRF quan sát trực tiếp đƣợc Ta ƣớc lƣợng từ hàm SRF:

i i

i X u

Y ˆ1ˆ2  ˆ (2.6.2)

i i u

Yˆ  ˆ

 (2.6.3)

trong Yˆ giá trị ƣớc lƣợng (giá trị trung bình có điều kiện ) Yi i

Nhƣng ta xác định hàm SRF nhƣ nào? Để thấy đƣợc điều này, ta tiến hành nhƣ sau Đầu tiên, ta biểu thị (2.6.3) thành :

i i

i i i

X Y

Y Y u

2 ˆ ˆ

ˆ ˆ

    

 

(3.1.1)

biểu thức rằng, uˆi( phần dƣ ) đơn giản chênh lệch giá trị thực giá trị

ƣớc lƣợng Y

Bây giờ, cho n cặp quan sát X Y, ta muốn xác định hàm SRF cách để gần với giá trị thực Y, Để đạt đƣợc đích này, ta chọn tiêu chuẩn sau đây: chọn hàm SRF cho tổng phần dƣ uˆi (YiYˆi) nhỏ tốt Tuy nhiên, hấp dẫn trực giác, tiêu chuẩn tốt lắm, nhƣ thấy đồ thị phân tán giả thiết (hình 3.1)

12 Một phƣơng pháp khác , đƣợc biết gọi “Phương pháp thích hợp tối đa” đƣợc xem xét ngắn gọn

(21)

X2

X1 X3 X4

X Y

   

   

 

1 uˆ

2 uˆ

    

    

3 uˆ

4 uˆ

  

  

 

i i ˆ ˆ Xˆ Yˆ  

SRF Hàm Hồi qui mẫu

Hình 3.1

Tiêu chuẩn bình phương tối thiểu

Nếu ta chấp nhận điều kiện cực tiểu tổng uˆi, hình 3.1 cho thấy phần dƣ

2

ˆu ˆu nhƣ phần dƣ 3 ˆu 1 ˆu có trọng số tổng 4 (uˆ1 uˆ2 uˆ3 uˆ4), hai phần dƣ đầu gần hàm SRF nhiều so với hai phần dƣ sau Nói cách khác, tất phần dƣ có vai trò quan trọng nhƣ nhau, quan sát riêng biệt có gần hay phân tán rộng tới đâu so với hàm SRF Hậu điều hồn tồn có khả tổng đại số

i

uˆ nhỏ (thậm chí 0) uˆ đƣợc phân tán rộng xung quanh hàm SRF Để thấy i

đƣợc điều này, ta cho ˆu ,1 ˆu ,2 ˆu ,3 ˆu hình 3.1 có giá trị tƣơng ứng 10,-2,+2 4 –10 Tổng đại số phần dƣ 0, ˆu 1 ˆu phân tán rộng xung 4 quanh hàm SRF so với ˆu 2 ˆu Chúng ta tránh đƣợc vấn đề ta chấp nhận tiêu 3 chuẩn bình phương tối thiểu, khẳng định hàm SRF đƣợc cố định theo cách để

 

    

 

2

2

) ˆ ˆ (

) ˆ ( ˆ

i i

i i i

X Y

Y Y u

(3.1.2)

càng nhỏ tốt, ˆ2

i

u bình phƣơng phần dƣ Bằng cách bình phƣơng uˆ , i phƣơng pháp cho phần dƣ ˆu 1 ˆu hình 3.1 trọng số lớn phần dƣ 4 ˆu 2

3

(22)

bình phƣơng tối thiểu, uˆ lớn (về giá trị tuyệt đối) iu lớn Một minh chứng ˆi2 cho phƣơng pháp bình phƣơng tối thiểu nằm thực tế hàm ƣớc lƣợng thu đƣợc từ phƣơng pháp có số tính chất thống kê nhƣ mong muốn, nhƣ ta thấy sau

Rõ ràng từ (3.1.2) ta có

) ˆ , ˆ ( ˆ2  1 2

ui f (3.1.3)

nghĩa tổng bình phƣơng phần dƣ hàm hàm ƣớc lƣợngˆ1 vàˆ2 Với liệu cho trƣớc bất kỳ, việc chọn giá trị khác cho ˆ1 vàˆ2sẽ cho giá trị khác dẫn tới giá trị khác uˆi2 Để thấy rõ điều này, xét liệu giả thiết Y X cho cột đầu Bảng 3.1 Ta thực hai thử nghiệm Trong thử nghiệm 1, cho ˆ1 1.572 ˆ2 1.357 (ngay lúc đừng lo lắng việc làm ta thu đƣợc giá trị này, coi nhƣ dự đoán)13 Sử dụng giá trị ˆ và giá trị X cho cột (2) Bảng 3.1, ta dễ dàng tính giá trị ƣớc lƣợng Yi

của Yˆ nhƣ giá trị Y1i i cho cột (3) bảng (chỉ số ký hiệu cho thử nghiệm

1) Bây giờ, thực thử nghiệm 2, nhƣng lần này, ta sử dụng giá trị ˆ1 3

1 ˆ

2 

Các giá trị ƣớc lƣợng Yi từ thử nghiệm đƣợc cho nhƣ Yˆ cột (6) 2i

Bảng 3.1 Vì giá trị ˆ hai thử nghiệm khác nhau, ta thu đƣợc giá trị khác cho phần dƣ ƣớc lƣợng, nhƣ bảng; uˆ phần dƣ từ thử nghiệm đầu 1i uˆ 2i phần dƣ từ thử nghiệm thứ Các bình phƣơng phần dƣ đƣợc cho cột (5) (8) Rõ ràng, nhƣ kỳ vọng từ (3.1.3), tổng phần dƣ bình phƣơng khác chúng dựa giá trị ˆ khác

Bảng 3.1

Thông số thử nghiệm hàm SRF

Yi

(1) Xi

(2)

i

Yˆ1 (3)

i

uˆ 1 (4)

2 ˆi u

(5)

i

Yˆ 2 (6)

i

uˆ 2 (7)

2 ˆ i u

(8)

4 2,929 1,071 1,147 0

5 7,000 -2,000 4,000 -2

7 8,357 -1,357 1,841 -1

12 9,714 2,286 5,226 9

Cộng: 28 16 0,0 12,214 14

Chú ý

i

Yˆ = 1.572 + 1.357 X1 i ( với 1=1.572 2 = 1.357)

i

Yˆ =3.0 + 1.0 X2 i ( với 1=3 2 = 1.0)

i

uˆ = (Yi -1 Yˆ ) 1i

i

uˆ = (Y2 i -Yˆ ) 2i

13 Để thoả mãn tính tị mị, giá trị thu đƣợc từ phƣơng pháp bình phƣơng tối thiểu, đƣợc nói đến cách

(23)

Bây giờ, ta nên chọn giá trị ˆ đây? Vì giá trị ˆ thử nghiệm thứ cho ta

ˆ2

i

u (=12,214) thấp thử nghiệm thứ (=14), ta nói cácˆ thử nghiệm thứ giá trị “tốt nhất” Nhƣng làm ta biết? Bởi vì, có đƣợc thời gian lịng kiên nhẫn vơ hạn, ta làm thêm nhiều thử nghiệm nhƣ thế, cách chọn ˆ khác lần so sánh kết ˆ2

i

u , cuối lọc giá trị ˆ cho ta giá trị

ˆ2

i

u nhỏ có thể, giả định ta xem xét tất giá trị tính tới đƣợc 1

và2 Tuy nhiên, thời gian lịng kiên nhẫn ngƣời nói chung hoi, ta cần xem xét số đƣờng tắt tới trình thử-và-sai May mắn phƣơng pháp bình phƣơng tối thiểu cho ta cách làm tắt Nguyên tắc phƣơng pháp bình phƣơng tối thiểu chọn

1 ˆ

 vàˆ2 theo cách để với mâu liệu cho u nhỏ tốt Nói cách ˆi2 khác, mẫu cho trƣớc, phƣơng pháp bình phƣơng tối thiểu cho ta giá trị ƣớc lƣợng 1 và2, giá trị cho giá trị nhỏ có đƣợc củauˆi2 Cơng việc đƣợc thực nhƣ nào? Đây tập đơn giản tốn giải tích Nhƣ nói Phụ lục 3A, Phần 3A.1, trình vi phân cho phƣơng trình sau để ƣớc lƣợng 1 và2:

Yinˆ1ˆ2 Xi (3.1.4) 

  

2 ˆ ˆ i i i

iX X X

Y (3.1.5)

trong n cỡ mẫu Phƣơng trình đƣợc gọi phƣơng trình chuẩn Giải hệ phƣơng trình chuẩn này, ta thu đƣợc:

                2 2 ) ( ) )( ( ) ( ˆ i i i i i i i i i i i i x y x X X Y Y X X X X n Y X Y X n (3.1.6)

trong X Y trung bình mẫu cuả X Y ta định nghĩa xiXiX Y

Y

yii Từ trở sau, ta chọn quy ước đặt chữ viết thường để biểu thị độ lệch

khỏi giá trị trung bình

X Y X X n Y X X Y X i i i i i i i 2 2 ˆ ) ( ˆ              (3.1.7)

Bƣớc cuối (3.1.7) thu đƣợc trực tiếp từ (3.1.4) vài biến đổi đại số đơn giản

(24)

 

 

 

 

 

2

2 2

ˆ

X n X

y X

X n X

Y x x

y x

i i i i

i i i

i i

(3.1.8)14

nó giảm gánh nặng tính tốn cho sử dụng máy tính tay để giải toán hồi quy với liệu nhỏ

Hàm ƣớc lƣợng thu đƣợc gọi hàm ƣớc lƣợng bình phƣơng tối thiểu, chúng đƣợc xác định từ nguyên tắc bình phƣơng tối thiểu Lƣu ý tính chất số sau hàm ƣớc lƣợng thu đƣợc từ phƣơng pháp bình phƣơng tối thiểu thơng thƣờng : “Các tính chất số tính chất thể nhƣ hệ việc dùng bình phƣơng tối thiểu thơng thƣờng, kiệu đƣợc tạo nhƣ nào.”15

Nói ngắn hơn, ta xem xét các tính chất thống kê hàm ƣớc lƣợng bình phƣơng tối thiểu thơng thƣờng, tức là, tính chất “có đƣợc có giả định liệu đƣợc tạo nên.”16

(Xem mơ hình hồi quy tuyến tính cổ điển Phần 3.2)

I Các hàm ƣớc lƣợng bình phương tối thiểu thơng thường OLS đƣợc biểu thị dƣới dạng số lƣợng (nghĩa X Y) quan sát đƣợc (nghĩa mẫu) Do chúng có thể tính đƣợc dễ dàng

II Chúng hàm ƣớc lƣợng điểm, nghĩa cho trƣớc mẫu hàm ƣớc lƣợng cho giá trị đơn lẻ (điểm) thông số tổng thể phù hợp (Trong Chƣơng 5, ta xét gọi hàm ƣớc lƣợng khoảng, chúng cung cấp khoảng giá trị có thông số tổng thể chƣa biết )

III Một thu đƣợc ƣớc lƣợng bình phương tối thiểu thông thường OLS từ liệu mẫu, ta dễ dàng vẽ đƣợc đường hồi quy mẫu Đƣờng hồi quy thu đƣợc nhƣ có tính chất sau:

1 Nó qua giá trị trung bình mẫu Y X Thực tế đƣợc thấy rõ từ (3.1.7), dịng sau viết thành Y ˆ1 ˆ2X, biểu thức đƣợc mô tả

bằng đồ thị hình 3.2

2 Giá trị trung bình ƣớc lƣợng YYˆi giá trị trung bình Y thực

14

Lƣu ý 1:xi2 (XiX)2Xi22XiX X2Xi22XiXiX2, X số

Sau lƣu ý XinX va X2nX2 với X số, thu đƣợc 2

X n X xi  i

Lƣu ý 2: xiyi xi(YiY)xiYiYxi xiYiY(XiX)xiYiY số tổng độ lệch biến so với giá trị trung bình [ ví dụ (XiX) ] ln ln Nghĩa là,

yi (YiY)0

15 Cuốn Estimation and Inference in Econometrics Russell Davidson James G MacKinnon, nhà xuất

Oxford University Press, New York, 1993, trang

16 Như sách

(25)

) (

ˆ

ˆ ) ˆ (

ˆ ˆ ˆ

2

2

2

X X Y

X X

Y X Y

i

i i

i

   

    

   

(3.1.9)

Lấy tổng hai vế đẳng thức cuối giá trị mẫu chia cho cỡ mẫu n, cho ta:

Y

Yˆ  (3.1.10)17

trong ứng dụng đƣợc lập thực tế: (XiX)0 (Tại sao?)

Hình 3.2

Đồ thị cho thấy đường hồi qui mẫu xuyên qua giá trị trung bình mẫu X Y

3 Giá trị trung bình phần dƣ uˆ Từ phụ lục 3A, Phần 3A.1, phƣơng trình i là:

   

2 (Yi ˆ1 ˆ2Xi)

17 Lƣu ý: Kết mơ hình hồi quy có số hạng tung độ gốc 

1 Nhƣ phụ lục 6A, Phần

6A.1, kết khơng áp dụng thiếu 1 mơ hình

X Y

SRF

Hàm Hồi qui mẫu i

(26)

Nhƣng uˆiYi ˆ1ˆ2Xi, phƣơng trình giảm xuống cịn 2uˆi 0,

0 ˆ 

u 18

Do tính chất trên, hồi quy mẫu:

Yi ˆ1ˆ2Xiuˆi (2.6.2)

có thể biểu diễn theo dạng khác thay Y X đƣợc biểu thị nhƣ độ lệch từ giá trị trung bình chúng Để thấy điều này, ta lấy tổng (2.6.2) cho vế để có:

uˆ X ˆ ˆ n uˆ X ˆ ˆ n Y i i i i i                (3.1.11)

Chia phƣơng trình (3.1.11) cho n , ta có:

X

Y ˆ1ˆ2 (3.1.12)

biểu thức giống nhƣ (3.1.7) Lấy phƣơng trình (2.6.2) trừ (3.1.12), ta có:

i i

i Y X X u

Y  ˆ2(  ) ˆ

yi ˆ2xiuˆi (3.1.13)

trong yi xi, theo quy ƣớc chúng ta, độ lệch từ giá trị trung bình tƣơng

ứng (mẫu) chúng

Phƣơng trình (3.1.13) đƣợc biết nhƣ dạng độ lệch Lƣu ý số hạng tung độ gốc ˆ1 khơng cịn có mặt phƣơng trình Nhƣng số hạng tung độ gốc ln đƣợc ƣớc lƣợng (3.1.7), nghĩa là, từ thực tế đƣờng hồi quy mẫu qua trung bình mẫu Y X Một ƣu điểm dạng độ lệch ln đơn giản hố phép tính số học phải làm việc máy tính bàn Tuy nhiên kỷ nguyên thông tin này, lợi điểm trở nên thứ yếu

Nhân đây, xin lƣu ý dạng độ lệch, hàm SRF đƣợc viết nhƣ là:

i i x

yˆ ˆ2 (3.1.14)

trong Yˆi  ˆ1 ˆ2Xi đơn vị đo lƣờng gốc, nhƣ thấy (2.6.1)

4 Các phần dƣ uˆ không tƣơng quan với giá trị dự báo Yi i Có thể kiểm chứng điều

nhƣ sau, sử dụng cách dạng độ lệch, ta viết:

                     2 2 2 2 2 2 i i i i i i i i i i i i x x x y x x y x u x u y ˆ ˆ ˆ ˆ ) ˆ ( ˆ ˆ ˆ ˆ ˆ 18

(27)

= (3.1.15) ứng dụng đƣợc lập thực tế   

2 ˆ

i i iy x

x

5 Các phần dƣ uˆ không tƣơng quan với Xi i, nghĩa làuˆiXi 0 Điều từ

phƣơng trình (2) phụ lục 3A, Phần 3A.1

3.2 MƠ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN: GIẢ THIẾT CƠ SỞ CỦA PHƢƠNG PHÁP

BÌNH PHƢƠNG TỐI THIỂU

Nếu nhƣ mục đích ƣớc lƣợng 1 2 phương pháp bình phương tối thiểu OLS thảo luận phần đủ Nhƣng xin đƣợc nhắc lại Chƣơng 2, phân tích hồi quy, mục đích khơng dừng việc tính đƣợc ˆ1 vàˆ2 mà phải rút kết luận giá trị thực cuả 1 2 Ví dụ, ta muốn biết ˆ1 vàˆ2 gần nhƣ thành phần tƣơng ứng chúng tổng thể Yˆ gần nhƣ tới giá trị thực i E(Y Xi) Để trả lời câu hỏi đó, định đƣợc dạng hàm số phƣơng trình, nhƣ (2.4.2), mà cịn phải đƣa giả thiết chắn cách thức Yi đƣợc sinh Để hiểu

địi hỏi cần thiết, nhìn vào hàm PRF: Yi 12Xiuˆi Nó cho thấy Yi phụ

thuộc vào Xi ui Do đó, rõ đƣợc Xi ui đƣợc tạo nhƣ nào, ta khơng có

cách để suy diễn thống kê Yi, nhƣ ta thấy, khơng thể làm đƣợc điều 1 2 Do đó, giả thiết đƣa biến Xi số hạng sai số tới hạn cách giải thích hiệu

lực phép ƣớc lƣợng hồi quy

Mơ hình hồi quy tuyến tính cổ điển hay mơ hình chuẩn, mơ hình Gauss (CLRM) đƣợc coi tảng hầu hết lý thuyết kinh tế lƣợng, đƣa 10 giả thiết19 Đầu tiên, ta thảo luận giả thiết cho trƣờng hợp mơ hình hồi quy hai biến, Chƣơng ta mở rộng chúng mô hình hồi quy đa biến, nghĩa mơ hình có nhiều biến hồi qui độc lập:

Giả thiết 1: Mơ hình hồi quy tuyến tính Mơ hình hồi quy tuyến tính theo thơng số, nhƣ đƣợc thấy (2.4.2)

Yi 12Xiuˆi (2.4.2)

Ta thảo luận mơ hình (2.4.2) Chƣơng Vì mơ hình hồi quy tuyến tính thông số khởi điểm cho CLRM, trì giả thiết suốt sách Hãy nhớ biến hồi qui phụ thuộc Y biến hồi qui độc lập X tự chúng khơng tuyến tính, nhƣ đề cập Chƣơng 2.20

19 Nó đƣợc coi cổ điển theo cảm giác đƣợc phát triển lần Gauss vào năm 1821 từ đƣợc coi

một khn mẫu hay tiêu chuẩn mà đƣợc so sánh với mơ hình hồi quy khơng thỏa mãn gỉa thiết Gauss

20

(28)

Giả thiết 2: Các giá trị X đƣợc cố định việc lấy mẫu lập lại Các giá trị rút biến hồi qui độc lập X đƣợc coi cố định mẫu lập lại Nói rõ hơn, X đƣợc giả thiết không ngẫu nhiên

Giả thiết ngụ ý phần thảo luận ta hàm PRF Chƣơng Nhƣng điều quan trọng ta hiểu đƣợc khái niệm “các giá trị cố định việc lấy mẫu lặp lại”, đƣợc giải thích dƣới dạng ví dụ cho Bảng 2.1 Xét tổng thể Y khác tƣơng ứng với mức thu nhập đƣợc trình bày bảng Giữ cho giá trị thu nhập X cố định giả sử $80, ta rút cách ngẫu nhiên gia đình ngẫu nhiên quan sát chi tiêu hàng tuần Y gia đình đó, giả sử $60 Vẫn giữ X mức $80, ta lại rút cách ngẫu nhiên gia đình khác thấy giá trị quan sát Y $75 Trong lần rút gia đình để xem xét (nghĩa lấy mẫu lặp lại), giá trị X đƣợc cố định mức $80 Ta lặp lại q trình cho tất giá trị X ghi Bảng 2.1 Thực ra, liệu mẫu ghi bảng 2.4 2.5 đƣợc rút theo cách

Tất điều có nghĩa phân tích hồi quy ta phân tích hồi quy có điều kiện, nghĩa có điều kiện với giá trị cho (các) biến hồi qui độc lập X

Giả thiết 3: Giá trị trung bình khơng nhiễu ui Cho trƣớc giá trị X, giá trị

trung bình hay kỳ vọng số hạng nhiễu ui Nói rõ hơn, giá trị trung bình có điều

kiện ui Về mặt ký hiệu, ta có:

E(ui Xi)=0 (3.2.1)

Giả thiết cho rằng, giá trị trung bình ui, có điều kiện theo với Xi cho,

Bằng hình học, giả thiết đƣợc vẽ hình 3.3, vài giá trị biến X tổng thể Y liên kết với chúng Nhƣ thấy, tổng thể Y tƣơng ứng với X cho trƣớc đƣợc phân phối xung quanh giá trị trung bình (có thể thấy đƣợc nhờ chấm đƣợc khoanh tròn PRF) với vài giá trị Y phía dƣới Khoảng cách phía và dƣới giá trị trung bình khơng nhƣng ui mà (3.2.1) địi hỏi giá trị trung

bình độ lệch tƣơng ứng với X cho phải 021

Davidson James MacKinnon, NXB Oxford University Press, New York, 1993 Cuốn sách không dành cho ngƣời bắt đầu

21 Để minh họa, ta coi u đƣợc phân bố đối xứng nhƣ hình 3.3 Nhƣng Chƣơng ta

(29)

Hình 3.3

Phân bố có điều kiện nhiễu ui

Từ cách nhìn nhận thảo luận Phần 2.4 (xem phƣơng trình 2.4.5), giả thiết khơng có khó hiểu Tất mà giả thiết khẳng định yếu tố không bao gồm rõ rệt mơ hình đƣợc kể vào ui, khơng ảnh hƣởng cách có hệ

thống đến giá trị trung bình Y; cho nên, nói, giá trị ui dƣơng triệt tiêu giá trị ui

âm cho trung bình chúng ảnh hƣởng lên Y 0.22

Nhân đây, lƣu ý giả thiết E(ui Xi)0 ngụ ý E(Yi Xi)i 2 Xi (Tại

sao?) Do đó, hai giả thiết tƣơng đƣơng

Giả thiết 4: Phƣơng sai có điều kiện khơng đổi hay phƣơng sai ui Cho

giá trị X, phƣơng sai ui nhƣ tất quan sát Nghĩa là, phƣơng sai

điều kiện ui đồng Về mặt ký hiệu, ta có:

22 Để hiểu thêm mà giả thiết cần thiết đọc Statistical Methods of Econometrics (Phƣơng pháp thống

kê kinh tế lƣợng E.Malinvaud, NXB Rand McNally, 1996, trang 75 Xem thêm tập 3.3

X Y

PRF =

Hàm Hồi qui tổng thể

i

i Xˆ

Yˆ  

Mean (Trung bình)

X1 X2 X3 X4

     ui

(30)

2

  

 

) (

] ) ( [

) var(

2

2

i i

i i i

i i

X u E

X u E u E X u

(3.2.2) trong var phƣơng sai

Phƣơng trình (3.2.2) khẳng định phƣơng sai ui cho Xi (nghiã là, phƣơng sai điều

kiện ui) số dƣơng 2 Một cách kỹ thuật, phƣơng trình (3.2.2) thể

hiện giả thiết phƣơng sai có điều kiện khơng đổi, đẳng truyền, phương sai bằng Nói cách khác, (3.2.2) có nghĩa tổng thể Y tƣơng ứng với giá trị X khác có phƣơng sai nhƣ Về mặt đồ thị, điều đƣợc mơ tả hình 3.4

Ngƣợc lại, xét hình 3.5, phƣơng sai điều kiện tổng thể Y biến thiên đối với X Ngƣời ta gọi tƣợng cách gần phƣơng sai sai số thay đổi hay truyền bất đẳng, phương sai Về mặt ký hiệu, trƣờng hợp này, (3.2.2) có thể viết thành

var(ui Xi)i2 (3.2.3)

Lƣu ý số 2

phƣơng trình (3.2.3), rõ phƣơng sai tổng thể Y khơng cịn số

(do giả thiết 3)

Hình 3.4

(31)

Hình 3.5

Phương sai sai số thay đổi

Để làm rõ khác biệt hai trƣờng hợp trên, gọi Y mức chi tiêu tiêu dùng hàng tuần X thu nhập hàng tuần Hình 3.4 3.5 cho thấy thu nhập tăng chi tiêu tiêu dùng trung bình tăng Nhƣng hình 3.4, phƣơng sai mức chi tiêu tiêu dùng giữ nguyên tất mức thu nhập, hình 3.5 phƣơng sai lại tăng mức thu nhập tăng Nói cách khác, mức chi phí trung bình gia đình giàu lớn mức chi phí gia đình nghèo hơn, nhƣng có biến thiên lớn mức chi tiêu tiêu dùng gia đình giàu

Để hiểu đƣợc lý đằng sau giả thiết này, ta tham khảo hình 3.5 theo var( uX1 ) < var( u X2 ) , , < var( u Xi ) Do đó, quan sát Y từ tổng thể với

X = X1 gần tới hàm hồi quy tổng thể PRF quan sát từ tổng thể tƣơng ứng với X = X2 , X = X3 , v.v Nói gọn hơn, tất giá trị Y tƣơng ứng với X khác đáng tin cậy nhƣ Độ tin cậy đƣợc đánh giá giá trị Y phân phối gần hay xa xung quanh vị trí trung bình chúng, nghĩa điểm hàm PRF Nếu đúng có trƣờng hợp đó, ta có nên coi trọng mẫu lấy từ tổng thể Y gần giá trị trung bình mẫu với giá trị phân phối rộng hay không? Nhƣng làm nhƣ có nghĩa là giới hạn biến đổi ta có đƣợc thơng qua giá trị X

Bằng cách dẫn giả thiết 4, ta nói giai đoạn này, tất giá trị Y tƣơng ứng với X khác quan trọng nhƣ Trong Chƣơng 11 ta thấy điều xảy khơng phải trƣờng hợp có phƣơng sai sai số thay đổi

Nhân đây, xin lƣu ý, giả thiết ngụ ý phƣơng sai điều kiện Yi

phƣơng sai có điều kiện khơng đổi Nghĩa là:

)

var(Yi Xi  (3.2.4)

(32)

Giả thiết 5: Khơng có tự tƣơng quan nhiễu Cho trƣớc hai giá trị X bất kỳ, Xi Xj (i

j), tƣơng quan ui uj (i j) Về mặt ký hiệu:

0

) )( (

] ) ( ][

) ( [

) , , cov(

 

 

j j i i

j j j

i i i

j i j i

X u X u E

X u E u X u E u E X X u u

(3.2.5) trong i j hai quan sát khác cov nghĩa đồng phƣơng sai

Nói hơn, (3.2.5) định nhiễu ui uj khơng tƣơng quan Nói thuật

ngữ, giả thiết khơng có tƣơng quan chuỗi, khơng có tự tƣơng quan Điều có nghĩa với Xi cho, độ lệch hai giá trị Y từ giá trị trung bình chúng

đều không biểu kiểu nhƣ mô tả hình 3.6a 3.6b Trên hình 3.6a ta thấy u tƣơng quan đồng biến, giá trị u dƣơng đƣợc có giá trị u dƣơng u âm có từ giá trị u âm Trên hình 3.6b, u lại tƣơng quan nghịch, giá trị u dƣơng tiếp theo u âm ngƣợc lại

Nếu nhiễu (các độ lệch) tuân theo kiểu hệ thống, nhƣ kiểu hình 3.6a b, tƣơng quan chuỗi tự tƣơng quan, mà giả thiết đòi hỏi vắng mặt kiểu tƣơng quan Hình 3.6c khơng có kiểu hệ thống u, tƣơng quan zero (khơng tƣơng quan)

Hình 3.6

Các kiểu tương quan nhiễu (a) tương quan chuỗi đồng biến; (b) tương quan chuỗi nghịch biến; (c) tương quan zero

(tại sao?)

+ui +ui

-ui

-ui

(a)

-ui

(b)

+ui +ui

-ui

(c)

+ui +ui

-ui

(33)

Tầm quan trọng toàn diện giả thiết đƣợc giải thích kỹ Chƣơng 12 Nhƣng ta giải thích trực giác nhƣ sau Trong hàm PRF (Yt = 1 + 2Xt + ut ) ta cho ut ut-1 tƣơng quan đồng biến Thì Yt khơng phụ thuộc vào Xt mà

còn phụ thuộc vào ut-1, ut-1 với vài mở rộng định ut Tại giai đoạn phát triển

này đối tƣợng nghiên cứu, cách dẫn chứng giả thiết 5, ta nói ta xét ảnh hƣởng có tính hệ thống, có, Xt Yt khơng quan tâm đến ảnh hƣởng khác tác động

đến Y nhƣ kết tự tƣơng quan có u Thế nhƣng, nhƣ lƣu ý Chƣơng 12, ta thấy tƣơng quan nhiễu đƣợc đƣa vào phép phân tích nhƣ nào, với kết

Giả thiết 6: Đồng phƣơng sai zero ui Xi, E(ui,Xi) = Nói chung,

, ), ( ), ( ) ( ) ( ))], ( ( [ )] ( )][ ( [ ) , cov(          i i i i i i i i i i i i i i i X u E u E X E X u E X E X u E X E X u E u E X u (3.2.6)

Giả thiết phát biểu nhiễu u biến giải thích X không tƣơng quan Lý căn cho giả thiết nhƣ sau: Khi biểu thị hàm PRF (2.4.2), ta cho X u ( đại diện cho ảnh hƣởng tất biến bị bỏ qua) có ảnh hƣởng riêng (và bổ sung) tới Y Thế nhƣng, X u có tƣơng quan, ta đánh giá ảnh hƣởng biến tới Y Do đó, X u tƣơng quan dƣơng, X tăng u tăng X giảm u giảm Tƣơng tự, X u tƣơng quan âm, X tăng u giảm X giảm u tăng Trong trƣờng hợp, khó khăn để tách rời ảnh hƣởng X u lên Y

Giả thiết đƣợc đáp ứng cách tự động biến X không ngẫu nhiên giả thiết đƣợc áp dụng, trƣờng hợp đó, cov(ui,Xi)=[Xi-E(Xi)]E[ui-E(ui)]=0 (tại sao?) Nhƣng

bởi ta cho biến X ta không không ngẫu nhiên, mà giả thiết giá trị cố định mẫu lặp lại23, giả thiết giới hạn chúng ta, đƣợc nêu thấy lý thuyết hồi quy đƣợc trình bày kết suy diễn logic đúng chí X ngẫu nhiên, miễn chúng độc lập, hay khơng tƣơng quan với nhiễu ui24 (Ta kiểm tra hệ kéo nới lỏng thiết Phần II)

Giả thiết 7: Số lƣợng quan sát n phải lớn số lƣợng thông số đƣợc ƣớc lƣợng Một cách khác, số lƣợng quan sát n phải lớn số lƣợng biến giải thích

23 Nhắc lại thu đƣợc mẫu nhƣ đƣợc trình bày Bảng 2.4 2.5, ta giữ cho giá trị X nhƣ 24

Nhƣ ta thảo luận Phần II, X ngẫu nhiên nhƣng phân bố độc lập với ui, tính chất hàm ƣớc

lƣợng nhỏ thảo luận ngắn gọn việc tiếp tục đƣợc áp dụng, nhƣng biến ngẫu nhiên X không tƣơng quan với ui, tính chất hàm ƣớc lƣợng bình phƣơng tối thiểu thơng thƣờng OLS kích

cỡ mẫu thật lớn Tuy nhiên, giai đoạn này, không cần thiết phải sa lầy vào điểm lý thuyết E( ui ) =

E(Xi) khơng ngẫu nhiên

E( ui ) =

(34)

Giả thiết không vơ thƣởng vơ phạt nhƣ ta thống nghĩ Trong ví dụ giả định Bảng 3.1, tƣởng tƣợng ta có cặp quan sát cho Y X (4 1) Từ quan sát đơn này, khơng có cách để ƣớc lƣợng hai đại lƣợng chƣa biết 1 2 Ta cần hai cặp quan sát để ƣớc lƣợng hai đại lƣợng chƣa biết Trong Chƣơng sau ta thấy tầm quan trọng giả thiết

Giả thiết 8: Sự biến thiên giá trị X Các giá trị X mẫu cho trƣớc tất Nói theo từ ngữ kỹ thuật, var(X) phải sốdƣơng hữu hạn25

Giả thiết khơng phải vơ thƣởng vơ phạt Hãy nhìn vào phƣơng trình (3.1.6) Nếu tất giá trị X đồng nhất, XiX (tại sao?) mẫu số phƣơng trình 0, nên khơng thể tính đƣợc 2 1 Một cách trực giác, ta sẵn sàng thấy

giả thiết lại quan trọng Nhìn vào ví dụ chi tiêu tiêu dùng gia đình Chƣơng 2, nhƣ có biến thiên nhỏ thu nhập gia đình, ta khơng thể giải thích nhiều biến thiên chi tiêu tiêu dùng Độc giả nên nhớ biến thiên Y X điều thiết yếu để sử dụng phép phân tích hồi quy nhƣ cơng cụ nghiên cứu Nói ngắn gọn: biến phải biến đổí!

Giả thiết 9: Mơ hình hồi quy đƣợc xác định cách đắn Nói cách khác, mơ hình đƣợc sử dụng phép phân tích thực nghiệm khơng có độ thiên lệch sai số đặc trƣng

Nhƣ đề cập Phần Giới thiệu, phƣơng pháp luận kinh tế lƣợng cổ điển giả thiết điều ẩn ý, lộ rõ, mơ hình đƣợc sử dụng để kiểm định lý thuyết kinh tế “đƣợc xác định cáh đắn” Giả thiết đƣợc giải thích cách khơng thức nhƣ sau Một điều tra kinh tế lƣợng bắt đầu với việc định rõ mơ hình kinh tế lƣợng sở tƣợng cần quan tâm Một số câu hỏi quan trọng phát sinh việc xác định mơ hình là: (1) Những biến nên đƣợc bao gồm mơ hình? (2) dạng hàm số mơ hình nhƣ nào? Nó tuyến tính theo thông số, biến hai? (3) Ta đặt giả thiết có tính xác suất Yi, Xi, ui đƣa chúng vào mơ hình?

Đó câu hỏi quan trọng nhƣ ta Chƣơng 13, cách bỏ qua biến quan trọng khỏi mơ hình, hay cách chọn dạng hàm số sai, cách đặt giả thiết ngẫu nhiên sai cho biến mơ hình, tính hiệu lực đắn cách giải thích hồi quy ƣớc lƣợng mang độ nghi vấn cao Để có cảm giác thực điều này, ta tham khảo đƣờng cong Philips hình 1.3, (cho ta chọn hai mơ hình sau để mơ tả mối liên quan sở tỉ lệ thay đổi tiền lƣơng tỉ lệ thất nghiệp:

i i

i X u

Y 12  (3.2.7)

25

Phƣơng sai mẫu X

1 ) ( ) var(

2

  

n X X

(35)

i i

i u

X

Y 

     

1 2 (3.2.8)

trong Yi tỉ lệ thay đổi tiền luơng Xi tỉ lệ thất nghiệp

Mơ hình hồi quy (3.2.7) tuyến tính theo thơng số biến số (3.2.8) tuyến tính theo thơng số (do đó, mơ hình hồi quy tuyến tính với định nghĩa ta) nhƣng phi tuyến tính biến số X Bây ta xét hình 3.7 cuối trang

Nếu mơ hình (3.2.8) mơ hình “đúng” mơ hình “thực” làm thích hợp mơ hình (3.2.7) vào điểm phân tán hình 3.7 cho ta dự báo sai: Giữa hai điểm A, B đối với giá trị Xi cho trƣớc, mơ hình (3.2.7) ƣớc lƣợng q cao giá trị trung bình thực Y,

trong phía trái A ( hay phiá phải B) ƣớc lƣợng thấp (hay ƣớc lƣợng cao, khi nói trị tuyệt đối) giá trị trung bình thực Y

Ví dụ minh họa cho gọi độ thiên lệch đặc trƣng sai số đặc trƣng; độ thiên lệch có chọn dạng hàm số sai Ta thấy loại sai số đặc trƣng khác Chƣơng 13

Thật không may thực tế, ngƣời ta biết biến để đặt vào mơ hình hàm mơ hình giả thiết xác suất biến nhập vào mô hình lý thuyết tảng kiểm tra cụ thể, (ví dụ nhƣ đánh đổi tỉ lệ thay đổi tiền thƣởng tỉ lệ thay đổi thất nghiệp kiểu Phillips) khơng đủ mạnh hay vững để trả lời câu hỏi Do đó, thực hành, nhà kinh tế lƣợng phải sử dụng phán chọn số lƣợng biến nhập vào mơ hình dạng hàm mơ hình phải đặt vài giả thiết chất ngẫu nhiên cuả biến mô hình Để mở rộng, có vài cách thử sai liên quan đến việc chọn mơ hình “đúng” cho phép phân tích thực nghiệm.26

26

(36)

Hình 3.7

Các đường cong tuyến tính phi tuyến tính Phillips

Nếu điều phán xét đƣợc đòi hỏi việc chọn mơ hình điều cần thiềt giả thiết 9? Không cần vào chi tiết (xem Chƣơng 13), giả thiết có mặt để nhắc nhở ta phép phân tích hồi quy ta, đó, kết dựa phép phân tích có điều kiện kèm theo với mơ hình đƣợc chọn để báo trƣớc cho ta ta nên suy nghĩ thật cẩn thận thiết lập mơ hình kinh tế lƣợng, đặc biệt mà có nhiều học thuyết cạnh tranh cố muốn giải thích tƣợng kinh tế, nhƣ tỷ lệ lạm phát, nhu cầu tiền, hay việc xác định giá trị cân hay giá trị cân thích hợp cổ phiếu hay trái phiếu Vì vậy, nhƣ sau ta thấy, việc xây dựng mơ hình kinh tế lƣợng thƣờng nghiêng phần nghệ thuật khoa học

Việc thảo luận giả thiết sở mơ hình hồi quy tuyến tính cổ điển đến hoàn tất Rất quan trọng để lƣu ý tất giả thiết gắn liền với hàm PRF không gắn với hàm SRF Nhƣng thật thú vị quan sát thấy phƣơng pháp bình phƣơng tối thiểu đề cập lại có vài tính chất tƣơng tự nhƣ giả thiết mà ta phải đặt hàm PRF Ví dụ, việc tìm uˆi 0, uˆ 0 giống với giả thiết

0 ) (ui Xi

E Cũng giống nhƣ vậy, việc tìm uˆiXi 0 tƣơng tự với giả thiết cov( ui,Xi ) = Cũng lƣu ý phƣơng pháp bình phƣơng tối thiểu cố gắng “phó

bản” giả thiết mà ta phải đặt cho hàm PRF

Đƣơng nhiên, hàm SRF không làm phó cho tất giả thiết mơ hình hồi quy tuyến tính cổ điển Nhƣ ta sau này, cov( uj,uj ) = giả thiết, không

sự thực cov( uj,uj ) mẫu = ( i j ) Thực ra, ta sau phần dƣ

không tự tƣơng quan mà chúng cịn có phƣơng sai sai số thay đổi (xem Chƣơng 12) Khi bƣớc ngồi mơ hình hai biến xem xét mơ hình hồi quy đa biến, nghĩa là, mơ hình chứa nhiều biến hồi qui độc lập, ta phải bổ sung giả thiết sau

A

B

Ty

û le

ä th

ay

đ

ổi

ti

ền

ơn

g

Tỉ lệ thất nghiệp %

         

i i

X

Y

i

i X

(37)

Giả thiết 10: Khơng có tính đa cộng tuyến hồn tồn Nghĩa khơng có mối tương quan tuyến tính hồn tồn biến để giải thích

Ta thảo luận giả thiết Chƣơng 7, nói mơ hình hồi quy đa biến Các mơ hình giả thiết thực tế đến mức nào?

Câu hỏi đáng giá triệu đô la là: Tất giả thiết có tính thực tiễn nhƣ nào? “Tính thực tiễn giả thiết” câu hỏi xƣa triết lý khoa học Có ngƣời lập luận khơng cần thiết phải để ý xem giả thiết có tính thực tiễn hay không Sự việc dự báo dựa giả thiết Milton Friedman ngƣời đƣợc ý, luận đề „‟tính khơng thích hợp giả thiết” Theo ơng, tính phi thực tiễn giả thiết lợi tích cực: “Để trở thành quan trọng Mỗi giả thiết phải điều giả dối cách mô tả giả thiết nó.”27

Ngƣời ta khơng thể tán thành hoàn toàn với quan điểm này, nhƣng nên nhắc lại nghiên cứu khoa học bất kỳ, ta đƣa giả thiết định chúng hỗ trợ phát triển chủ thể bƣớc xa hơn, chúng cần có tính thực tiễn cảm giác chúng lập lại thực tế cách xác Nhƣ tác giả viết “ Nếu nhƣ tính đơn giản tiêu chuẩn mong muốn lý thuyết tốt, tất lý thuyết tốt lý tƣởng hoá đơn giản hoá cách mãnh liệt.28

Một phép tƣơng tự có ích Các sinh viên kinh tế đƣợc giới thiệu chung mơ hình cạnh tranh hồn hảo trƣớc họ đƣợc giới thiệu mô hình cạnh tranh khơng hồn hảo nhƣ cạnh tranh độc quyền cạnh tranh nhóm, ý tiềm ẩn xuất phát từ mơ hình làm cho ta đánh giá tốt mơ hình cạnh tranh khơng hồn hảo, khơng phải mơ hình cạnh tranh hồn hảo mang tính thực tiễn cần thiết Mơ hình hồi quy tuyến tính cổ điển kinh tế lƣợng tƣơng đƣơng với mơ hình cạnh tranh hồn hảo lý thuyết giá!

Trong kế hoạch ta, điều cần làm tìm hiểu tính chất mơ hình hồi quy tuyến tính cổ điển cách lý tƣởng, sau đó, chƣơng sau xem xét thật sâu điều xảy nhƣ hay vài giả thiết mơ hình hồi quy tuyến tinh cổ điển không đƣợc thực Ở cuối chƣơng này, Bảng 3.5 cung cấp dẫn để ngƣời quan tâm tìm điều xảy với mơ hình hồi quy tuyến tính cổ điển giả thiết riêng khơng đƣợc thoả mãn

Một đồng nghiệp cho ta xem lại cơng trình nghiên cứu ngƣơi khác đó, ta cần phải xem xét giả thiết nhà nghiên cứu đặt có thích hợp với liệu vấn đề không Rất thƣờng xảy trƣờng hợp cơng trình phát hành dựa vào giả thiết ẩn tàng vấn đề liệu, mà vấn đề liệu chƣa sinh ƣớc lƣợng dựa giả thiết Rõ hơn, ngƣời đọc có kiến thức nên nhận thức vấn đề, lựa chọn cách tiếp cận nghiêm khắc cơng trình nghiên cứu Các giả thiết liệt kê Bảng 3.5 cung cấp danh sách kiểm tra để hƣớng dẫn nghiên cứu để đánh giá nghiên cứu ngƣời khác

27 Milton Friedman, Essay in Positive Economics (Luận văn Kinh tế học Thực chứng), University of Chicago

Press, Chicago, 1953, trang 14

28 Mark Blaug, The Methodology of Economics: Or How Economists Explain (Phƣơng pháp luận kinh tế

lƣợng: hay nhà kinh tế lƣợng giải thích nhƣ nào, 2nd Edition, NXB Cambidge University Press, New York,

(38)

Với bƣớc nhỏ quay lại, ta sẵn sàng nghiên cứu mơ hình hồi quy tuyến tính cổ điển Nói riêng ta muốn tìm tính chất thống kê bình phƣơng tối thiểu thơng thƣờng OLS đƣợc so sánh với tính chất số mà ta thảo luận trƣớc Các tính chất thống kê bình phƣơng tối thiểu thông thƣờng dựa giả thiết mô hình hồi quy tuyến tính cổ điển đƣợc thảo luận giữ gìn định lý Gauss-Markov tiếng Nhƣng trƣớc quay với định lý này, định lý cung cấp công nhận lý thuyết tính phổ biến các bình phƣơng tối thiểu thơng thƣờng, ta cần xét tính xác sai số chuẩn phép ƣớc lƣợng bình phƣơng tối thiểu

3.3 TÍNH CHÍNH XÁC HAY LÀ CÁC SAI SỐ CHUẨN CỦA CÁCH ƢỚC LƢỢNG BÌNH PHƢƠNG TỐI THIỂU

Từ phƣơng trình (3.1.6) (3.1.7) ta thấy rõ ƣớc lƣợng bình phƣơng tối thiểu hàm liệu mẫu Nhƣng liệu có khả thay đổi từ mẫu sang mẫu khác nên ƣớc lƣợng thay đổi từ việc Vì vậy, cần thiết có đại lƣợng đo “độ tin cậy” tính chính xác hàm ƣớc lƣợng ˆ1 vàˆ2 Trong mơn thống kê, tính xác ƣớc lƣợng đƣợc đo sai số chuẩn nó29 Cho giả thiết Gauss nhƣ phụ lục 3A, Phần 3A.3 rõ sai số chuẩn ƣớc lƣợng bình phƣơng tối thiểu thông thƣờng OLS, ta thu đƣợc nhƣ sau:

 22

2) ˆ var(

i

x

 (3.3.1)

2 2)

ˆ (

i

x

se   (3.3.2)

2 2

1) ˆ

var(   

i i x n

X

(3.3.3)

 

 

 2

2

1) ˆ (

i i x n

X

se (3.3.4)

trong var phƣơng sai se sai số chuẩn s2

phƣơng sai có điều kiện khơng đổi hay phƣơng sai số ui, giả thiết

Trừ đại lƣợng s2, tất số lƣợng nhập vào phƣơng trình tính từ liệu Nhƣ mục 3A, Phần 3A.5, s2

tự đƣợc tính cơng thức sau:

2 ˆ ˆ

2

 

n ui

 (3.3.5)

29 Sai số chuẩn khơng nhƣng độ lệch chuẩn phân phối mẫu hàm ƣớc lƣợng, phân phối mẫu

(39)

trong ˆ2

hàm ƣớc lƣợng bình phƣơng tối thiểu thông thƣờng OLS giá trị thực nhƣng chƣa biết s2 và n-2 số bậc tự (df) ,ˆ2

i

u tổng bình phƣơng phần dƣ tổng bình phƣơng phần (RSS) 30

Nếu biết ˆ2

i

u , ˆ2có thể tính đƣọc dễ dàng ˆ2

i

u tự đƣợc tính từ (3.1.2) từ biểu thức sau (xem chứng minh phần 3.5)

   2

2

2 ˆ

ˆi yi xi

u  (3.3.6)

So sánh với phƣơng trình (3.1.2), phƣơng trình (3.3.6) dễ sử dụng, khơng địi hỏi phải tính tốn uˆ cho quan sát tính tốn có ích vế phải i (nhƣ ta xem Chƣơng 11 12)

 

 2

2 ˆ

i i i

x y x

dạng biểu thay cho việc tính ˆ2

i

u là:

 

   2

2

2 ( )

ˆ

i i i i

i

x y x y

u (3.3.7)

Nhân thể, lƣu ý bậc hai dƣơng ˆ2 :

2 ˆ ˆ

2

 

n ui

 (3.3.8)

đƣợc biết nhƣ sai số chuẩn ƣớc lƣợng Nó đơn giản độ lệch chuẩn giá trị Y so với đƣờng hồi quy ƣớc lƣợng thƣờng đƣợc sử dụng nhƣ đại lƣợng đo “độ thích hợp” đƣờng hồi quy ƣớc lƣợng, nội dung đƣợc thảo luận Phần 3.5

Trƣớc đây, ta lƣu ý rằng, cho trƣớc Xi, s2

đại diện cho phƣơng sai (điều kiện) hai đại luợng ui Yi Vì vậy, sai số chuẩn ƣớc lƣợng gọi độ lệch chuẩn (điều

kiện) ui Yi Đƣơng nhiên, nhƣ thông thƣờng, sY2 sY đại diện tƣơng ứng cho phƣơng

sai không điều kiện độ lệch chuẩn không điều kiện Y

Lƣu ý đặc tính sau phƣơng sai (vì vậy, sai số chuẩn) ˆ1 ˆ2

1 Phƣơng sai 2 tỷ lệ thuận với s2 nhƣng tỷ lệ nghịch vớixi2 Nghĩa là, cho truớc s2, sự biến thiên X lớn phƣơng sai ˆ2 nhỏ, đó, tính xác b2 ƣớc lƣợng đƣợc tăng Ngắn gọn hơn, cho trƣớc s2, có biến thiên thực đối với giá trị X (coi lại giả thiết 8), b2 đƣợc xác định xác Xi không biến thiên thực Cũng nhƣ vậy, cho trƣớc 

i

x , phƣơng sai s2 lớn phƣơng sai b2 lớn Lƣu ý rằng, cỡ mẫu n tăng số lƣợng số hạng

30 Thuật ngữ số bậc tự nghĩa số lƣợng tổng cộng quan sát mẫu (= n) trừ số ràng buộc hay giới hạn

(40)

tổng 

i

x tăng Vì n tăng tính xác mà với 2 ƣớc lƣợng đƣợc tăng (Tại sao?)

2 Phƣơng sai ˆ1 tỷ lệ thuận với s2 X nhƣng tỷ lệ nghịch với i2 x kích thƣớc n i2 mẫu

3 Vì ˆ1 ˆ2 hàm ƣớc lƣợng, chúng không biến đổi từ mẫu đến mẫu khác, mà mẫu cho trƣớc, chắn chúng phụ thuộc lẫn nhau, phụ thuộc đƣợc đo đồng phƣơng sai chúng Điều đƣợc đề cập đến phụ lục 3A, Phần 3A.4, nhƣ sau:

    

    

 

2 2

1, ˆ ) var(ˆ ) ˆ

cov(

i

x X X

  

(3.3.9)

Vì phƣơng sai biến var (ˆ2) luôn dƣơng, chất đồng phƣơng sai giữaˆ1 vàˆ2 phụ thuộc vào dấu X Nếu X dƣơng, theo cơng thức, đồng phƣơng sai âm Vì vậy, hệ số góc b2 đƣợc ước lượng cao (nghĩa độ dốc dốc), hệ số tung độ 1 đƣợc ước lượng thấp (nghĩa tung độ gốc nhỏ) Sau này, (đặc biệt Chƣơng 10 tính đa cộng tuyến), ta thấy rõ lợi ích việc nghiên cứu đồng phƣơng sai hệ số hồi quy đƣợc ƣớc lƣợng

Các phƣơng sai sai số chuẩn hệ số hồi quy ƣớc lƣợng đƣa ngƣời ta đến việc phán xét tính thực tiễn ứớc lƣợng nhƣ nào? Đây vấn đề suy diễn thống kê đƣợc đƣa vào Chƣơng

3.4 CÁC TÍNH CHẤT CỦA HÀM ƢỚC LƢỢNG: ĐỊNH LÝ GAUSS-MARKOV31

Nhƣ đề cập trƣớc đây, cho trƣớc giả thiết mơ hình hồi quy tuyến tính cổ điển, phép ƣớc lƣợng bình phƣơng tối thiểu đặt vài tính chất tối ƣu lý tƣởng Các tính chất đƣợc chứa đựng định lý Gauss-Markov tiếng Để hiểu lý thuyết này, ta cần xét tính chất khơng thiên lệch tuyến tính tốt hàm ƣớc lƣợng.32

Nhƣ giải thích phụ lục A, hàm ƣớc lƣợng, gọi hàm ƣớc lƣợng bình phƣơng tối thiểu thông thƣờng

2 ˆ

, đƣợc cho hàm ƣớc lƣợng không thiên lệch tuyến tính tốt (BLUE) b2 nhƣ theo điều sau:

1 Nó tuyến tính, nghĩa hàm tuyến tính biến ngẫu nhiên, nhƣ biến phụ thuộc Y mơ hình hồi quy

2 Nó khơng thiên lệch, nghĩa giá trị trung bình giá trị kỳ vọng, E(ˆ2), giá trị thực 2

3 Nó có phƣơng sai nhỏ nhóm tất hàm ƣớc lƣợng khơng thiên lệch tuyến tính; hàm ƣớc lƣợng không thiên lệch với phƣơng sai tối thiểu đƣợc gọi hàm ƣớc lƣợng hiệu quả

31

Tuy gọi lý thuyết Gauss-Markov nhƣng phép tính gần bình phƣơng tối thiểu Gauss xảy trƣớc (1821) phép tính gần phƣơng sai cực tiểu Markov(1900)

32 Bạn đọc nên tham khảo phụ lục A để biết tầm quan trọng hàm ƣóc lƣợng tuyến tính nhƣ cách thảo

(41)

Trong nội dung hồi quy, đƣợc chứng minh hàm ƣớc lƣợng bình phƣơng tối thiểu thông thƣờng hàm ƣớc lƣợng không thiên lệch tuyến tính tốt Đây thực chất định lý Gauss-Markov tiếng, lý thuyết đƣợc phát biểu nhƣ sau:

Định lý Gauss-Markov: Cho trƣớc giả thiết mơ hình hồi quy tuyến tính cổ điển, hàm ƣớc lƣợng bình phƣơng tối thiểu, nhóm hàm ƣớc lƣợng tuyến tính khơng thiên lệch, có phƣơng sai nhỏ nhất, nghĩa chúng hàm ƣớc lƣợng không thiên lệch tuyến tính tốt nhất.(BLUE)

Bằng chứng định lý đƣợc phác họa Phụ lục 3A, Phần 3A.6 Sự xâm nhập rộng rãi định lý Gauss-Markov trở nên rõ ràng ta xa Sẽ không thừa muốn lƣu ý định lý có tầm quan trọng lý thuyết nhƣ thực hành.33

Tất ý nghĩa đƣợc giải thích hình 3.8

Trong hình 3.8(a) ta phân phối mẫu hàm ƣớc lƣợng bình phƣơng tối thiểu thơng thƣờngˆ2, nghĩa phân phối giá trị lấy ˆ2 thử nghiệm lấy mẫu lặp lại (nhắc lại Bảng 3.1) Để thuận lợi, ta giả thiết ˆ2 phân phối đối xứng (nhiều xem Chƣơng 4) Nhƣ hình đƣa ra, trung bình giá trị ˆ2, E(ˆ2) giá trị thực b2 Ở đây, ta nói ˆ2 hàm ước lượng khơng thiên lệch b2 Trong hình 3.8(b) ta thấy phân phối mẫu b2*, hàm ƣớc lƣợng thay b2 thu đƣợc phƣơng pháp khác (nghiã phƣơng pháp bình phƣơng tối thiểu thơng thƣờng) Để tiện lợi, ta giả sử b2*

giống nhƣ ˆ2 không thiên lệch , nghĩa trung bình giá trị kỳ vọng chúng b2 Tiếp theo, ta giả sử ˆ2 b2* hàm ƣớc lƣợng tuyến tính , nghĩa chúng hàm tuyến tính Y Ta chọn hàm ƣớc lƣợng nào: ˆ2 hay b2*?

Để trả lời câu hỏi này, ta chồng hai hình lên nhƣ hình (3.8)(c) Rõ ràng

2 ˆ

b2* không thiên lệch, phân phối b2* phân tán trải rộng so với phân phối ˆ2 xung quanh giá trị trung bình Nói cách khác, phƣơng sai b2* rộng phƣơng sai củaˆ2 Bây giờ, cho trƣớc hai hàm ƣớc lƣợng, khơng thiên lệch tuyến tính, ta cần chọn hàm ƣớc lƣợng với phƣơng sai nhỏ gần với b2 hàm thay Nói gọn hơn, ta nên chọn hàm ƣớc lƣợng khơng thiên lệch tuyến tính tốt nhất.(BLUE)

33 Ví dụ: cho kết hợp tuyến tính b nhƣ (b

1-2b2), đƣợc ƣớc lƣợng (ˆ12ˆ2),

(42)

2

ˆ

2 2)

ˆ (   E

2 *

)

(2  

E

*

(a) Phân phối mẫu 2

(b) Phân phối mẫu 

2

ˆ 

(c) Phân phối mẫu 2 * 2

2

ˆ 

*

Các tính chất thống kê mà ta vừa thảo luận đƣợc biết nhƣ tính chất mẫu hữu hạn: Các tính chất thỏa mãn mong muốn cỡ mẫu, tảng hàm ƣớc lƣợng Sau này ta có dịp xét tính chất tiệm cận, nghĩa tính chất áp dụng cỡ mẫu lớn (nghĩa vô hạn) Một thảo luận chung tính chất mẫu hữu hạn mẫu lớn hàm ƣớc lƣợng đƣợc đƣa vào phụ lục A

3.5 HỆ SỐ XÁC ĐỊNH r2

: ĐẠI LƢỢNG ĐO “SỰ THÍCH HỢP”

Cho đến ta đề cập đến vấn đề ƣớc lƣợng hệ số hồi quy, sai số chuẩn chúng, một số tính chất chúng Bây ta xét đến thích hợp đƣờng hồi quy thích hợp với liệu ; nghiã là, ta tìm đƣờng hồi quy mẫu thích hợp “tốt” nhƣ với liệu Từ hình 3.1 rõ ràng ta thu đƣợc thích hợp “hồn hảo” nhƣ tất quan sát nằm đƣờng hồi quy, nhƣng trƣờng hợp thật Nói chung, có vài uˆ dƣơng i

Hình 3.8

Phân phối mẫu hàm ƣớc lƣợng bình phƣơng tối thiểu thơng thƣờng ˆ2và hàm ƣớc lƣợng thay b

(43)

và vài uˆ âm Điều mà ta hy vọng phần dƣ xung quanh đƣờng hồi quy nhỏ i càng tốt Hệ số xác định r2

(trƣờng hợp hai biến) R2 (hồi quy đa biến) đại lƣợng cho ta đƣờng hồi quy mẫu thích hợp tốt nhƣ với liệu

Trƣớc rõ r2

đƣợc tính nhƣ ta xét giải thích có tính khai phá r2 đồ thị, phƣơng pháp đồ thị Venn, Ballentine, nhƣ hình 3.934

Hình 3.9 Quan điểm Ballentine r2

: (a) r2 = 0; (f) r2 =

Trong hình vịng trịn Y tƣợng trƣng cho biến thiên biến phụ thuộc Y vòng X tƣợng trƣng cho biến thiên biến giải thích X35 Vùng chồng lên hai vịng trịn (vùng tối) rõ phạm vi mà độ biến thiên Y đƣợc giải thích biến thiên X (cho theo hƣớng hồi quy bình phƣơng tối thiểu thông thƣờng OLS) Phạm vi vùng chồng lên lớn, độ biến thiên Y đƣợc giải thích X lớn r2

đơn giản đại lƣợng đo số cho vùng tối Trong hình, ta di chuyển từ trái sang phải, vùng tối tăng dần nghĩa tỷ lệ biến thiên Y đƣợc giải thích X liên tục tăng Nói ngắn hơn, r2 tăng Khi khơng có vùng tối, r2 rõ ràng 0, nhƣng vùng tối hoàn chỉnh, r2

1, 100% độ biến thiên Y đƣợc giải thích X Ta thấy ngắn gọn r2

nằm Để tính r2, ta làm nhƣ sau Nhắc lại rằng:

i i i Y u

Y  ˆ  ˆ (2.6.3)

hay dạng độ lệch:

i i i y u

y  ˆ  ˆ (3.5.1)

trong sử dụng (3.1.13) (3.1.14) Bình phƣơng (3.5.1) cho hai vế lấy tổng mẫu, ta có:

34 Xem “Ballentine: A Graphical Aid for Econometrics” (Ballentine: Một hỗ trợ đồ thị cho Kinh tế lƣợng)

của Peter Kennedy, Australian Economics Papers, Vol 20, 1981, 414-416 Tên gọi Ballentine xuất phát từ huy hiệu bia Ballentine tiếng với vịng cuả

35 Thuật ngữ biến thiên phương sai khác Biến thiên tổng bình phƣơng độ lệch biến số với

(44)

                2 2 2 2 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ i i i i i i i i i u x u y u y u y y (3.5.2)

vì yiuˆi 0 (tại sao) yˆi  ˆ2xi

Các tổng khác bình phƣơng xuất (3.5.2) đƣợc mơ tả nhƣ sau: yi2 (YiY)2 độ lệch tổng cộng giá trị thực Y so với trung bình mẫu chúng, đƣợc gọi tổng bình phƣơng toàn phần (TSS)

       

  2

2 2 ˆ ) ˆ ( ) ˆ ˆ (

ˆi Yi Y Yi Y xi

ychênh lệch giá trị ƣớc lƣợng Y với trung

bình chúng(Yˆ Y), đƣợc gọi cách gần tổng bình phƣơng

hồi quy [nghĩa (các) biến giải thích] đƣợc giải thích hồi quy, hay đơn giản tổng bình phƣơng giải thích đƣợc (tổng bình phƣơng hồi qui) (ESS)  

i

u phần dƣ biến thiên khơng giải thích giá trị Y với đƣờng hồi quy, hay đơn giản tổng bình phƣơng phần dƣ (tổng bình phƣơng sai số (RSS) Vì vậy, (3.5.2) là:

TSS = ESS + RSS (3.5.3)

và rằng, độ lệch tổng cộng giá trị Y đƣợc quan sát so với giá trị trung bình đƣợc phân hai phần, phần đƣờng hồi quy phần khác bắt buộc ngẫu nhiên vì tất quan sát thực tế Y nằm đƣờng thích hợp Một cách hình học, ta có hình 3.10:

Bây ta chia vế (3.5.3) cho TSS, ta đƣợc:

          2 2 ) ( ˆ ) ( ) ˆ ( Y Y u Y Y Y Y TSS RSS TSS ESS i i i i (3.5.4)

Ta định nghiã r2

(45)

Hay ta viết

TSS RSS

Y Y

u r

i i

 

 



1

) (

ˆ

1 2

2

(3.5.5a)

Hình 3.10

Sự chia độ biến thiên YI hai thành phần

Số lƣợng r2

đƣợc xác định nhƣ gọi hệ số xác định đại lƣợng đƣợc sử dụng chung để đo tính thích hợp tốt đƣờng hồi quy Bằng lời, r2

đo tỷ số phần trăm độ lệch tổng cộng Y giải thích mơ hình hồi quy

Ta lƣu ý tính chất r2

: 1 Nó số khơng âm (Tại sao?)

2 Giới hạn nó0r2 1 r2 nghĩa hoàn toàn phù hợp, nghĩa YˆiYi với i Ở đầu khác, r2

= nghĩa dù (nghĩa ˆ2 0) khơng có liên quan

biến hồi qui phụ thuộc biến hồi qui độc lập Trong trƣờng hợp này, nhƣ (3.1.9) rõ, Y

Yˆi ˆ1  , nghĩa là, dự báo tốt giá trị Y đơn giản giá trị trung bình nó Vì vậy, đƣờng hồi quy đƣờng nằm ngang so với trục X

      

      

 

Y tổngcộng Yi

qui hồi Do Y YÂi 

  

  

 

X Xi

Y

0

  

  

 

phần Do i

SRF: Hàm Hồi qui mẫu

i X

Â

Â

1

Yi

(46)

Tuy r2 đƣợc tính trực tiếp từ định nghĩa (3.5.5), tính đƣợc nhanh từ công thức sau:

                 2 2 2 2 2 ˆ ˆ ˆ i i i i i i y x y x y y TSS ESS r   (3.5.6)

Nếu ta chia tử số mẫu số (3.5.6) cho cỡ mẫu n (hay n-1 cỡ mẫu nhỏ), ta có:

       

 22

2 ˆ y x S S

r  (3.5.7)

trong Sy2 Sx2 tƣơng ứng phƣơng sai mẫu Y X

Vì ˆ2 xiyixi2 , phƣơng trình (3.5.6) biểu thị nhƣ

 

 2 2

2

2 ( )

i i i i y x y x r (3.5.8)

và biểu thức tính dễ dàng

Cho trƣớc định nghĩa r2, ta biểu thị ESS RSS đƣợc thảo luận trƣớc nhƣ

sau:     2 i y r TSS r ESS (3.5.9)        ) ( 2 r yi ESS/TSS) -TSS(1 ESS TSS RSS (3.5.10)

Do đó, ta viết:

        2 2 ) ( i i

i r y r y

y

RSS ESS TSS

(3.5.11)

biểu thức mà bổ ích sau

Giá trị số quan hệ gần, nhƣng khái niệm, r2

khác xa với hệ số tƣơng quan, đại lƣợng đo bậc kết hợp hai biến (nhƣ Chƣơng lƣu ý) Nó tính từ biểu thức:

2 r

(47)

Y

X

Y

X

Y

X r = -1

r = +1 r gần tới +1

(a) (b) (c)

r gần tới -1

(d) (e)

Y

X

r dương gần Y

X

Y

X r âm

gần

Y

X

(f)

r =

(g)

Y

X (h)

Y = X2

nhöng r =

hay từ định nghĩa

] ) ( ][

) (

[

) )( (

) )( (

2

2

2

   

 

  

 

 

i i

i i

i i i

i i i

i i

Y Y

n X X

n

Y X

Y X n

y x

y x r

(3.5.13)

đƣợc xem hệ số tƣơng quan mẫu36

Một vài tính chất r nhƣ sau (xem hình 3.11):

Hình 3.11

Các kiểu tương quan (theo Henri Theil, Nhập môn Kinh tế lượng, Prentice Hall, Englewood Cliffs, N.J, 1978, trang 86)

36

(48)

1 r dƣơng âm, dấu r phụ thuộc vào dấu số hạng tử số (3.5.13), đo đồng phuơng sai mẫu hai biến

2 r nằm từ –1 đến +1 , nghĩa 1r1

3 Ban chất r đối xứng ; nghĩa hệ số tƣơng quan X Y (rXY ) hệ số

giữa Y X (rYX )

4 r độc lập gốc tọa độ tỷ lệ; nghĩa ta định nghĩa Xi* = aXi + c Yi* = bYi + d, a > 0, b > c, d số, X*

Y* có giá trị r giống nhƣ giá trị r biến nguyên thủy X Y

5 Nếu X Y độc lập theo quan điểm thống kê (xem phụ lục A để có khái niệm), hệ số tƣơng quan chúng 0; nhƣng r = 0, điều khơng có nghĩa hai biến độc lập Nói cách khác, hệ số tƣơng quan zero khơng ngụ ý có tính độc lập (xem hình 3.11(h))

6 r đại lƣợng đo kết hợp tuyến tính phụ thuộc tuyến tính; r khơng có ý nghĩa để mơ tả quan hệ phi tuyến tính Vì vậy, hình 3.11(h), Y = X2

quan hệ xác nhƣng r = (Tại sao?)

7 Mặc dù r đại lƣợng đo kết hợp tuyến tính hai biến, r khơng ngụ ý có mối liên quan nhân nào, nhƣ ta lƣu ý Chƣơng

Trong nội dung hồi quy, r2

đại lƣợng có đủ ý nghĩa r, cho ta biết tỷ lệ độ biến thiên biến phụ thuộc đƣợc giải thích (các) biến giải thích đó, cho ta thƣớc toàn diện phạm vi mà độ biến thiên biến xác định độ biến thiên biến khác: Đại lƣợng sau khơng thể có giá trị đó37 Hơn nữa, nhƣ ta thấy sau này, việc chứng minh r (= R) mơ hình hồi quy đa biến giá trị mơ hồ Tuy nhiên ta cịn phải nói nhiều r2

Chƣơng

Nhân tiện đây, xin lƣu ý r2, nhƣ định nghĩa đƣợc tính bình

phương hệ số tương quan giá trị thực Yi giá trị ước lượng Yi, gọi Yˆ i

Nghiã sử dụng (3.5.13) ta viết:

   

 

 2 2

2

) ˆ ( ) (

)] ˆ )( (

[

Y Y Y

Y

Y Y Y Y r

i i

i i

Nghĩa

 

) ˆ ( ) (

) ˆ (

2

2

i i

i i

y y

y y

r (3.5.14)

trong Yi = Y thực, Yˆ = Y ƣớc lƣợng, i YYˆ = giá trị trung bình Y Để có thêm

chứng xin xem tập 3.15 Biểu thức (3.5.14) chứng minh r2

đại lƣợng đo thích hợp, rõ giá trị Y ƣớc lƣợng gần nhƣ tới giá trị thực chúng

3.6 MỘT VÍ DỤ BẰNG SỐ

Ta minh họa lý thuyết kinh tế lƣợng đƣợc phát triển xem xét hàm giả thiết Keynes thảo luận Phần Giới thiệu Nhắc lại Keynes phát biểu: “Luật

37 Trong việc mơ hình hồi quy, lý thuyết tảng hƣớng nguyên nhân Y X, đại lƣợng tổng

(49)

tâm lý đàn ông [phụ nữ] sẵn sàng, nhƣ quy tắc mặt trung bình, tăng chi tiêu thu nhập họ tăng, nhƣng

BẢNG 3.2

Dữ liệu giả thiết mức chi tiêu tiêu dùng và thu nhập hàng tuần gia đình

Y($) X($)

70 80

65 100

90 120

95 140

110 160

115 180

120 200

140 220

155 240

150 260

BẢNG 3.3

Dữ liệu thô dựa Bảng 3.2

Yi Xi YiXi

i

X XiX YiY

i

x xiyi Yˆ i YiYˆi Y ˆˆ iui

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) 70 80 5600 6400 -90 -41 8100 3690 65.1818 4.8181 314.0524 65 100 6500 10000 -70 -46 4900 3220 75.3636 -10.3636 -781.0382 90 120 10800 14400 -50 -21 2500 1050 85.5454 4.4545 381.0620 95 140 13300 19600 -30 -16 900 480 95.7272 -0.7272 -69.6128 110 160 17600 25600 -10 -1 100 10 105.9090 4.0909 433.2631 115 180 20700 32400 10 100 40 116.0909 -1.0909 -126.6434 120 200 24000 40000 30 900 270 125.2727 -6.2727 -792.0708 140 220 30800 48400 50 29 2500 1450 136.4545 3.5454 483.7858 155 240 37200 57600 70 44 4900 3080 145.6363 8.3636 1226.4073 150 260 39000 67600 90 39 8100 3510 156.8181 -6.8181 -1069.2014 TC 1110 1700 205500 322000 0 33000 16800 1109.9995 0.0040

1110.0  0.0

TB 111 170 nc nc 0 nc nc 110 0

5091

000 , 33 / 800 , 16 ˆ

2

  

 

i i i

x y x

4545 24

) 170 ( 5091 111

ˆ ˆ

2

  

 YX

Lưu ý :  nghĩa “xấp xỉ bằng”; nc đƣợc hiểu “khơng tính đƣợc“

(50)

cho Bảng 3.3 Dƣạ vào liệu thơ này, ta có tính tốn nhƣ sau bạn đọc nên kiểm tra lại

4545 24 ˆ

1 

 var(ˆ1)41.1370 se(ˆ1)6.4138

5091 ˆ

2 

 var(ˆ2)0.0013 se(ˆ2)0.0357

(3.6.1)

8 9809

9621

1591 42 ˆ 2172 ) ˆ , ˆ cov(

2

2

1

 

 

df r

r

 

Do đƣờng hồi quy ƣớc lƣợng là:

i

i X

Yˆ 24.45450.5091 (3.6.2)

đã đƣợc trình bày hình học hình 3.12

Hình 3.12

Đường hồi qui mẫu dựa liệu Bảng 3.2

Tiếp theo Chƣơng 2, hàm hồi quy mẫu SRF [Phƣơng trình (3.6.2)] đƣờng hồi quy kết hợp đƣợc giải thích nhƣ sau: điểm đƣờng hồi quy cho ước lượng giá trị trung bình hay giá trị kỳ vọng Y tƣơng ứng với giá trị X chọn; nghĩa là, Yˆ ƣớc lƣợng củai

) (Y Xi

E Giá trị ˆ2 0.5091 đo độ dốc đƣờng, rằng, dải mẫu giá

trị X nằm 80 đô la 260 đô la cho tuần, X tăng, cho la, lƣợng gia tăng đƣợc ƣớc lƣợng cách trung bình hàng tuần chi tiêu tiêu dùng vào khoảng 51 cent Giá trị ˆ1 24.4545 tung độ gốc đƣờng, mức chi tiêu tiêu dùng trung bình hàng tuần mà thu nhập hàng tuần Tuy nhiên, giải thích cách máy móc số hạng tung

4545 24

   

11 ) (Y

170 ) ( X

i

i X

Yˆ 24.45450.5091

1

5091 ˆ

2 

(51)

độ gốc Trong phép phân tích hồi quy, kiểu giải thích theo nghĩa đen số hạng tung độ gốc nhƣ lúc có ý nghĩa, ví dụ tại, đƣợc lập luận gia đình khơng có thu nhập (do thất nghiệp, bị sa thải, ) trì mức chi tiêu tiêu dùng tối thiểu từ vay mƣợn, từ tiết kiệm Nhƣng nói chung, ngƣời ta cần phải sử dụng độ nhạy cảm chung việc giải thích số hạng tung độ gốc cả dải mẫu giá trị X vốn khơng bao gồm số nhƣ giá trị quan sát

Có lẽ, tốt giải thích số hạng tung độ gốc nhƣ trị trung bình ảnh hƣởng trung bình lên Y tất biến đƣợc bỏ qua từ mơ hình hồi quy Giá trị r2 0.9621 nghĩa khoảng 96 phần trăm độ biến thiên chi tiêu tiêu dùng hàng tuần đƣợc giải thích thu nhập Khi r2

gần nhƣ 1, giá trị r2 có đƣợc từ mẫu quan sát cho thấy đƣờng hồi quy mẫu thích hợp tốt với liệu38 Hệ số tƣơng quan 0.9809 nói lên hai biến chi tiêu tiêu dùng thu nhập tƣơng quan đồng biến cao Các sai số mẫu đƣợc ƣớc lƣợng hệ số tƣơng quan đƣợc giải thích Chƣơng

3.7 CÁC VÍ DỤ MINH HỌA

Sự tiêu thụ Cà phê Mỹ năm 1970-1980 Xét liệu cho Bảng 3.439

Từ môn kinh tế vi mô, ta biết nhu cầu loại hàng nói chung phụ thuộc vào giá hàng đó, giá hàng khác cạnh tranh bổ sung hàng đó, thu nhập ngƣời tiêu dùng Để ghép tất biến vào hàm nhu cầu, ta cho liệu có, địi hỏi ta phải tiến tới mơ hình hồi quy đa biến Chúng ta cịn chƣa đƣợc chuẩn bị cho bƣớc Do đó, điều mà ta làm giả thiết hàm cầu riêng phần (các yếu tố khác đƣợc giữ cho khơng đổi), lƣợng cầu liên quan với giá Vì lúc này, ta giả sử biến khác nhập vào hàm cầu số

BẢNG 3.4

Tiêu thụ cà phê Mỹ (Y) tƣơng quan với giá bán lẻ thực tế trung bình (X)*

, 1970-1980

Năm

Y

(số tách ngƣời uống mỗi ngày)

X

($ lb)

1970 2.57 0.77

1971 2.50 0.74

1972 2.35 0.72

1973 2.30 0.73

1974 2.25 0.76

1975 2.20 0.75

1976 2.11 1.08

1977 1.94 1.81

1978 1.97 1.39

1979 2.06 1.20

1980 2.02 1.17

38 Cách kiểm định thức mức ý nghĩa r2 đề cập Chƣơng

(52)

*Lưu ý: giá danh nghĩa đƣợc lấy từ số giá tiêu dùng (CPI) cho thực phẩm đồ uống , 1967=100

Nguồn: Dữ liệu Y lấy từ tóm lƣợc cơng trình nghiên cứu Quốc gia uống Cà phê, Nhóm liệu, Elkins Park, Penn., 1981 liệu X danh nghĩa (nghĩa X tính theo giá tại) lấy từ Niealsen Food Index A.C.Nielsen, New York, 1981

Sau ta dùng mơ hình tuyến tính hai biến để làm thích hợp với liệu cho Bảng 3.4, ta thu đƣợc kết nhƣ sau (bản in từ máy tính SAS cho phụ lục 3A, Phần 3A.7) 6628 01656 ˆ ; 01140 ) ˆ ( ; 0129 ) ˆ var( 1216 ) ˆ ( ; 0148 ) ˆ var( 4795 6911 ˆ 2 2 1         r se se X

Yt t

     (3.7.1)

Có thể giải thích hồi quy đƣợc ƣớc lƣợng nhƣ sau: giá bán lẻ trung bình thực tế pound cà phê tăng, cho la, lƣợng cà phê tiêu thụ trung bình ngày kỳ vọng giảm khoảng nửa tách Nếu giá cà phê 0, lƣợng cà phê kỳ vọng tiêu thụ trung bình cho ngƣời làvào khoảng 2.69 tách ngày Đƣơng nhiên, nhƣ nói trƣớc đây, đa phần ta khơng thể gắn nghĩa vật lý vào tung độ gốc Tuy nhiên, nhớ chí giá cà phê 0, ngƣời sử dụng lƣợng cà phê mức ảnh hƣởng xấu cafein tới sức khỏe Giá trị r2

có nghĩa vào khoảng 66 phần trăm độ biến thiên mức tiêu thụ cà phê cho ngƣời ngày đƣợc giải thích độ biến thiên giá bán lẻ cà phê

Mơ hình mà ta vừa làm thích hợp với liệu có tính thực tế nhƣ nào? Lƣu ý không bao gồm tất biến liên quan, ta khơng thể nói hàm cầu hồn chỉnh cà phê Mơ hình đơn giản đƣợc chọn cho ví dụ đƣơng nhiên cho mục đích sƣ phạm giai đoạn trình nghiên cứu Trong Chƣơng 7, ta giới thiệu hàm cầu hoàn chỉnh (Xem tập 7.23, cho ta hàm cầu tiêu dùng gà Mỹ)

Hàm tiêu thụ Keynes cho Hoa Kỳ , 1980-1991

Trở laị với liệu Bảng I.1 Phần Giới thiệu Trên tảng liệu này, hồi quy bình phƣơng tối thiểu thơng thƣờng OLS đƣợc ƣớc lƣợng, Y đại diện cho chi tiêu tiêu dùng cá nhân (P.C.E) tính tỷ đô la năm 1987 X đại diện cho Tổng sản phẩm nội điạ (GDP), đại lƣợng đo mức thu nhập , tính tỷ la năm 1987 (các kết thu đƣợc sử dụng SHAZAM TM

kiểu 7.0 ):

9909 02175 ) ˆ ( ; 9453 ) ˆ ( 71943 80 231 ˆ 2       r se se X

Yt t

 (3.7.2)

(53)

trong trƣờng hợp ngồi dãy giá trị mà ta quan tâm đến, khơng thể đại diện cho kết thực tế Giá trị r2

vào khoảng 0.99 nghĩa GDP giải thích khoảng 99% độ lệch chi tiêu tiêu dùng trung bình, giá trị cao

Tuy giá trị r2

cao, ngƣời ta thƣờng hay hỏi: Liệu hàm tiêu dùng Keynes đơn giản có phải mơ hình thích hợp để giải thích cấu chi tiêu tiêu dùng Mỹ Đôi khi, mơ hình hồi quy đơn giản (2 biến ) cho thơng tin bổ ích Các ƣớc lƣợng xu hƣớng cận biên tiêu dùng (MPC) cho Hoa Kỳ dựa mơ hình phức tạp MPC vào khoảng 0.7 Nhƣng ta phải nói nhiều mơ hình đầy đủ chƣơng sau

3.8 KẾT QUẢ CỦA MÁY VI TÍNH ĐỐI VỚI HÀM CẦU VỀ CÀ PHÊ

Nhƣ lƣu ý phần giới thiệu, suốt sách này, ta sử dụng máy vi tính nhiều để trả lời cho ví dụ minh họa bạn đọc quen với vài chƣơng trình hồi quy Trong phụ lục C ta thảo luận chi tiết vài chƣơng trình Các ví dụ minh họa sách sử dụng hay vài chƣơng trình Đối với hàm cầu cà phê, kết máy vi tính SAS đƣợc trình bày Phụ lục 3A, Phần 3A.7

3.9 LƢU Ý VỀ CÁC THỬ NGHIỆM MONTE CARLO

Trong chƣơng này, ta rõ dƣới giả thiết mẫu hồi quy tuyến tính cổ điển hàm ƣớc lƣợng bình phƣơng tối thiểu có đặc tính thống kê mong muốn định đƣợc tóm lƣợc tính chất BLUE Trong Phụ lục Chƣơng này, ta chứng minh tính chất cách thức Nhƣng thực tế, ngƣời ta biết tính chất áp dụng nhƣ nào? Ví dụ nhƣ làm để tìm hàm ƣớc lƣợng bình phƣơng tối thiểu thơng thƣờng khơng bị thiên lệch? Lời giải đáp cho câu hỏi gọi thử nghiệm Monte Carlo, chất mơ hay lấy mẫu hay thử nghiệm máy vi tính

Để giới thiệu ý tƣởng bản, ta xét hàm hồi quy tổng thể hai biến PRF:

i i

i X u

Y 1 2  (3.9.1)

Thử nghiệm Monte Carlo tiến hành nhƣ sau:

1 Giả sử giá trị thực thông số nhƣ sau: b1 = 20 b2 = 0.6 2 Bạn chọn cỡ mẫu n, cho n = 25

3 Bạn cố định giá trị X cho quan sát Trong tất quan sát bạn có 25 giá trị X

4 Giả sử bạn lấy bảng số ngẫu nhiên, chọn 25 giá trị, gọi chúng ui (hiện hầu hết

các phần mềm thống kê có xây dựng phận phát số ngẫu nhiên)40 5 Khi biết b1, b2, Xi ui,sử dụng (3.9.1) ta có 25 giá trị Yi

6 Bây giờ, ta sử dụng 25 giá trị Yi sinh ra, ta hồi quy chúng 25 giá trị X đƣợc chọn bƣớc 3, thu đƣợc ˆ1 ˆ2 hàm ƣớc lƣợng bình phƣơng tối thiểu

7 Giả sử bạn lặp lại thí nghiệm 99 lần, lần lại sử dụng giá trị b1, b2 X Đƣơng nhiên, giá trị ui khác thí nghiệm khác Do bạn có tất

40 Trong thực tế, ngƣời ta cho u

i tuân theo phân phối xác suất đó, giả sử phân phối chuẩn, với thơng

(54)

100 thí nghiệm chúng sinh 100 giá trị b1 b2 (Trong thực tế, nhiều thí nghiệm nhƣ đƣợc thực hiện, có tới 1000 hay 2000 )

8 Bạn lấy trung bình cộng 100 ƣớc lƣợng gọi chúng ˆ1 ˆ2

9 Nếu giá trị trung bình gần giống với giá trị thực b1 b2 giả thiết bƣớc 1, thử nghiệm Monte Carlo “thiết lập” hàm ƣớc lƣợng bình phƣơng tối thiểu khơng thiên lệch Nhắc lại dƣới mơ hình hồi quy tuyến tính cổ điển E(ˆ1)1

E(ˆ2)2

Các bƣớc đặc trƣng cho chất chung thử nghiệm Monte Carlo Các thử nghiệm kiểu thƣờng đƣợc sử dụng để nghiên cứu tính chất thống kê phƣơng pháp ƣớc lƣợng thông số tổng thể khác Chúng có ích để nghiên cứu diễn biến hàm ƣớc lƣợng mẫu nhỏ hay mẫu hữu hạn Các thử nghiệm phƣơng tiện tốt để đƣa khái niệm lấy mẫu lặp lại, tảng hầu hết kết luận thống kê cổ điển, nhƣ ta thấy Chƣơng Chúng tơi cung cấp nhiều ví dụ thử nghiệm Monte Carlo tập cho lớp (Xem tập 3.26)

3.10 TÓM TẮT VÀ KẾT LUẬN:

Các đề mục khái niệm quan trọng đƣợc phát triển chƣơng đƣợc tóm tắt lại nhƣ sau:

1 Cái khung phép phân tích hồi quy mơ hình hồi quy tuyến tính cổ điển (CRLM)

2 Các mơ hình hồi quy tuyến tích cổ điển dựa tập hợp giả thiết

3 Dựa giả thiết này, hàm ƣớc lƣợng bình phƣơng tối thiểu có tính chất định, tính chất đƣợc tóm tắt định lý Gauss-Markov, phát biểu nhóm hàm ƣớc lƣợng khơng thiên lệch tuyến tính, hàm ƣớc lƣợng bình phƣơng tối thiểu có phƣơng sai nhỏ Ngắn gọn hơn, chúng hàm ƣớc lƣợng khơng thiên lệch tuyến tính tốt (BLUE)

4 Tính xác hàm bình phƣơng tối thiểu thông thƣờng OLS đƣợc đo sai số chuẩn Trong Chƣơng ta thấy sai số chuẩn đƣa ta đến việc rút suy diễn về thông số tổng thể, hệ số b, nhƣ

5 Độ thích hợp tồn diện mơ hình hồi quy đƣợc đo hệ số xác định r2 Nó tỷ lệ mà độ biến thiên biến phụ thuộc biến hồi qui phụ thuộc đƣợc giải thích bởi biến giải thích, biến hồi qui độc lập Đại lƣợng r2

nằm 1; r2 gần tới độ thích hợp tốt

6 Khái niệm liên quan đến hệ số xác định hệ số tƣơng quan r Nó đại lƣợng đo kết hợp tuyến tính hai biến nằm –1 +1

BẢNG 3.5

Điều xảy giả thiết mơ hình hồi quy tuyến tính cổ điển bị vi phạm?

Số thứ tự

giả thiết Loại vi phạm Nghiên cứu đâu ?

1 Phi tuyến tính thơng số Khơng có sách biến hồi qui độc lập ngẫu nhiên Giới thiệu cho Phần II Giá trị trung bình ui khác Giới thiệu cho Phần II

4 Phƣơng sai sai số thay đổi Chƣơng 11 Các nhiễu tự tƣơng quan Chƣơng 12

(55)

lập khác

7 Các quan sát mẫu nhỏ số biến hồi qui độc

lập Chƣơng 10

8 Tính biến thiên khơng hiệu các biến

hồi qui độc lập Chƣơng 10

9 Độ thiên lệch đặc trƣng Chƣơng 13,14

10 Đa cộng tuyến Chƣơng 10

11* Tính khơng theo qui luật chuẩn nhiễu Giới thiệu cho Phần I

* Lưu ý: Giả thiết nhiễu ui phân phối chuẩn phần CLRM Nhƣng

biết nhiều Chƣơng

7 Mơ hình hồi quy tuyến tính cổ điển CLRM phép xây dựng lý thuyết trừu tƣợng dựa tập hợp giả thiết nghiêm ngặt “không thực tế” Nhƣng phép trừu tƣợng cần thiết giai đoạn bƣớc vào đƣờng tìm hiểu lĩnh vực cuả kiến thức Một CLRM đƣợc lập ra, ngƣời ta biết đƣợc điều xảy vài giả thiết khơng đƣợc thỏa mãn Phần đầu sách giành cho việc tìm hiểu mơ hình hồi quy tuyến tính cổ điển Trong phần khác sách việc xem xét cải tiến CLRM Bảng 3.5 cho ta đồ đƣờng tới phía trƣớc

BÀI TẬP Các câu hỏi

3.1 Cho trƣớc giả thiết cột bảng sau, giả thiết cột tƣơng đƣơng với chúng

Các giả thiết mơ hình cổ điển

(1) (2)

2 ) var( , ) , cov( ) (      i i j i i i X u j i u u X u E 2 ) var( , ) , cov( ) (         i i j i i i X Y j i Y Y X X Y E

3.2 Chứng minh ƣớc lƣợng ˆ1 1.572 ˆ2 1.357 đƣợc sử dụng thử nghiệm Bảng 3.1 hàm ƣớc lƣợng bình phƣơng tối thiểu thông thƣờng OLS

3.3 Theo Malinvaud (xem thích 11), giả thiết E( ui  Xi ) = vô quan trọng Để thấy điều đó, xét hàm hồi qui tổng thể PRF Yi = b1 + b2Xi + ui Bây xét

trƣờng hợp: (i) b1 = 0, b2 = 1; E(ui) = 0; (ii) b1 = 1, b2 = 0; E(ui) = (Xi – 1) Bây ta lấy giá trị dự tính hàm PRF có điều kiện

theo với X trƣờng hợp ta xem liệu đồng ý với Malinvaud ý nghĩa giả thiết E( ui  Xi ) = hay không

3.4 Xét hồi quy mẫu:

i i

i X u

(56)

Đặt giới hạn (i)uˆi 0 (ii) uˆiXi 0, xác định đƣợc hàm ƣớc lƣợng ˆ1

và ˆ2và chúng đồng với hàm ƣớc lƣợng bình phƣơng tối thiểu cho (3.1.6) (3.1.7) Phƣơng pháp xác định hàm ƣớc lƣợng đƣợc gọi nguyên tắc tƣơng tự Hãy cho biện giải trực giác giới hạn đƣợc áp đặt (i) (ii) (Gợi ý: Hãy nhắc lại giả thiết mơ hình hồi quy tuyến tính cổ điển CLRM ui) Nhân đây, lƣu ý nguyên tắc tƣơng đồng việc ƣớc lƣợng thông

số chƣa biết đƣợc gọi phƣơng pháp momen mà momen mẫu (ví dụ trung bình mẫu) đƣợc sử dụng để ƣớc lƣợng momen tổng thể (ví dụ trung bình tổng thể) Nhƣ đƣợc lƣu ý Phụ lục A, momen trị thống kê tổng hợp phân phối xác suất, nhƣ giá trị kỳ vọng phƣơng sai

3.5 Chứng tỏ r2 đƣợc định nghĩa (3.5.5) biến đổi Bạn sử dụng bất đẳng thức Cauchy-Schwaze, cho biến X Y ngẫu nhiên mối quan hệ sau đúng:

E(XY)2 E(X2)E(Y2)

3.6 Gọi ˆYX ˆXY độ dốc hồi quy tƣơng ứng Y X X Y Hãy :

2 ˆ

ˆ r

XY YX 

trong r hệ số tƣơng quan X Y

3.7 Trong tập 3.6 giả sử ˆYXˆXY 1 Điều xảy ta hồi quy Y X hay

là hồi quy X Y? Hãy giải thích cách chi tiết

3.8 Hệ số tƣơng quan dãy hạng Spearman rs đƣợc định nghĩa nhƣ sau:

) (

1 2

2

 

 

n n

d rs

trong d = khác biệt hạng đƣợc quy cho cá thể hay tƣợng giống nhau

n = số lƣợng cá thể tƣợng đƣợc hạng

rs đƣợc lấy từ r đƣợc xác định (3.5.13) Gợi ý: Sắp hạng giá trị X Y từ

đến n Lƣu ý tổng hạng X Y n(n+1)/2 giá trị trung bình chúng (n+1)/2

3.9 Xét công thức sau hàm PRF hai biến: Mơ hình 1: Yi 1 2Xiui

Mơ hình 2: Yi 12(XiX)ui

a Tìm hàm ƣớc lƣợng b1 1 Chúng có đồng khơng? Phƣơng sai chúng có đồng khơng?

b Tìm hàm ƣớc lƣợng b2 2 Chúng có đồng khơng? Các phƣơng sai cuả chúng có đồng khơng?

(57)

3.10 Giả sử bạn tiến hành hồi quy sau:

i i

i x u

y ˆ1ˆ2  ˆ

trong đó, nhƣ thƣờng lệ, yi xi độ lệch so với giá trị trung bình tƣơng ứng

của chúng Giá trị ˆ1 nhƣ nào? Tại sao? ˆ2 có giống nhƣ đại lƣợng thu đƣợc từ phƣơng trình (3.1.6) khơng? Tại sao?

3.11 Cho r1 = hệ số tƣơng quan n cặp giá trị (Yi, Xi) r2 = hệ số tƣơng quan n cặp

giá trị (aXi + b, cYi + d) a, b, c, d số Chứng tỏ r1 = r2

thiết lập nguyên tắc cho hệ số tương quan bất biến theo thay đổi thang tỷ lệ thay đổi gốc tọa độ

Gợi ý: Ứng dụng định nghĩa r cho (3.5.13)

Lưu ý: Các toán tử aXi, Xi + bvà aXi + b đƣợc gọi tƣơng ứng thay đổi thang tỷ lệ, thay đổi gốc tọa độ thay đổi thang tỷ lệ lẫn gốc tọa độ

3.12 Nếu r, hệ số tƣơng quan n cặp giá trị ( Xi,Yi ) dƣơng, xác định phát biểu sau hay sai:

(a) r (-Xi, -Yi ) có giá trị dƣơng

(b) r ( -Xi, Yi ) r (Xi, -Yi) dƣơng âm

(c) Cả hai hệ số độ dốc byx bxy có giá trị dƣơng, byx = hệ số độ dốc trong hồi quy Y X bxy = hệ số độ dốc hồi quy X Y

3.13 Nếu X1 , X2 X3 biến không tƣơng quan biến có độ lệch chuẩn nhƣ Hãy chứng tỏ hệ số tƣơng quan X1 + X2 X2 + X3 ½ Tại hệ số tƣơng quan lại khác 0?

3.14 Trong hồi quy Yi = b1 + b2Xi + ui giả sử ta nhân giá trị X với số, giả sử Nó có làm thay đổi phần dƣ giá trị Y không? Giải thích Sẽ ta thêm giá trị số, cho 2, vào giá trị X ?

3.15 Hãy chứng tỏ (3.5.14) thực chất đo hệ số xác định Gợi ý: Áp dụng định nghĩa r cho (3.5.13) nhắc lại    ˆ ˆ2

) ˆ ˆ (

ˆi i i i i

iy y u y y

y nhớ biểu thức

(3.5.6)

Các vấn đề

3.16 Bạn đƣợc cho dãy hạng điểm thi kỳ cuối kỳ 10 sinh viên môn thống kê Hãy tính hệ số Spearman‟s tƣơng quan hạng giải thích

Sinh viên

Dãy A B C D E F G H I J

Giữa Kỳ 10

Cuối Kỳ 10

3.17 Bảng sau cho biết liệu tỷ lệ bỏ việc với 100 công nhân sản xuất tỷ lệ thất nghiệp sản xuất, Hoa Kỳ giai đoạn 1960-1972

(58)

Tỷ lệ thất nghiệp bỏ việc sản xuất Hoa Kỳ, năm 1960-1972

Tỷ lệ bỏ việc Tỷ lệ thất nghiệp Năm 100 công nhân, Y (%), X

1960 1.3 6.2

1961 1.2 7.8

1962 1.4 5.8

1963 1.4 5.7

1964 1.5 5.0

1965 1.9 4.0

1966 2.6 3.2

1967 2.3 3.6

1968 2.5 3.3

1969 2.7 3.3

1970 2.1 5.6

1971 1.8 6.8

1972 2.2 5.6

Nguồn: Báo cáo nguồn nhân lực tổng thống, 1973, Các Bảng C-10 A-18

(a) Vẽ liệu lên đồ thị phân tán

(b) Giả sử tỷ lệ bỏ việc Y tƣơng quan tuyến tính với tỷ lệ thất nghiệp X nhƣ Yi = b1 + b2Xi + ui Xác định b1, b2 sai số chuẩn chúng

(c) Tính r2 r

(d) Giải thích kết bạn

(e) Vẽ phần dƣ uˆ Bạn rút điều từ phần dƣ này? i

(f) Bằng cách sử dụng số liệu hàng năm cho giai đoạn 1966-1978 cách sử dụng mơ hình nhƣ (b) trên, ta thu đƣợc kết sau :

i

i X

Yˆ 3.12370.1714

00210 )

ˆ (2 

se r2 0.8575

Nếu kết khơng giống với ta có (b), bạn giải thích nhƣ cho khác biệt

3.18 Dựa mẫu 10 quan sát, ta có kết sau:

Yi 1110 Xi 1700 XiYi 205,500

Xi2 322,000 Yi2 132,100

với hệ số tƣơng quan r = 0.9758 Nhƣng kiểm tra lại tính tốn này, ta thấy hai cặp quan sát đƣợc ghi nhƣ sau :

Y X Y X

90 120 thay 80 110

140 220 150 200

(59)

3.19 Bảng sau cho ta liệu giá vàng, số giá tiêu dùng (CPI), số trao đổi cổ phiếu New York (NYSE) Mỹ cho giai đoạn 1977-1991 Chỉ số NYSE bao gồm hầu hết cổ phiếu liệt kê NYSE, có khoảng 1500 giá trị

Giá vàng New York

Chỉ số giá tiêu thụ (CPI),

Chỉ số trao đổi cổ phiếu New York (NYSE), Năm $ cho troy ounce 1982-84=100 31 tháng 12-1965=100

1977 147.98 60.6 53.69

1978 193.44 65.2 53.70

1979 307.62 72.6 58.32

1980 612.51 82.4 68.10

1981 459.61 90.9 74.02

1982 376.01 96.5 68.93

1983 423.83 99.6 92.63

1984 360.29 103.9 92.46

1985 317.30 107.6 108.90

1986 367.87 109.6 136.00

1987 446.50 113.6 161.70

1988 436.93 118.3 149.91

1989 381.28 124.0 180.02

1990 384.08 130.7 183.46

1991 362.04 136.2 206.33

Nguồn: Dữ liệu số CPI NYSE lấy từ báo cáo kinh tế tổng thống, tháng 1/93 tƣơng ứng bảng B-59 B-91 Giá vàng lấy từ Phòng Thƣơng mại Hoa Kỳ, Văn phòng phân tích Kinh tế, Thống kê kinh doanh, 1963-1991, trang 68

(a) Trên đồ thị phân tán, vẽ đồ thị số giá vàng , CPI NYSE

(b) Một việc đầu tƣ đƣợc cho hàng rào ngăn lạm phát giá vàng suất thu lợi việc đầu tƣ kìm giữ đƣợc nhịp độ lạm phát Để kiểm định giả thiết này, giả sử bạn bạn định làm thích hợp mơ hình sau đây, giả thiết đồ thị (a) gợi ý mơ hình thích hợp là:

Giá vàngt = 1 + 2CPIt + ut

Chỉ số NYSEt = 1 + 2CPIt + ut

Nếu giả thiết đúng, ta kỳ vọng giá trị 2

(c) Hàng rào chống lại lạm phát tốt hơn? Giá vàng hay thị trƣờng chứng khoán? 3.20 Làm cho mơ hình tuyến tính thích hợp với liệu tƣơng quan đến số giá tiêu

dùng cung tiền Nhật cho giai đoạn q 1/1988 đến q 2/1992, bình luận kết thu đƣợc bạn

Giá tiêu dùng cung tiền Nhật cho giai đoạn quý 1/1988 đến quý 3/1992

Năm quý CPI Chỉ số giá tiêu dùng (1985 = 100)

Lƣợng tiền (M1)

(tỷ yên)

1988-1 101.0 101,587

1988-2 101.1 102,258

1988-3 101.6 104,653

1988-4 102.1 107,561

1989-1 102.1 109,525

1989-2 103.7 108,442

1989-3 104.4 109,176

(60)

1990-1 105.7 111,600

1990-2 106.3 111,929

1990-3 107.1 112,753

1990-4 108.5 112,155

1991-1 109.7 113,150

1991-2 109.9 115,827

1991-3 110.5 120,718

1991-4 111.5 125,891

1992-1 111.7 123,589

1992-2 112.4 125,583

1992-3 112.5 126,816

Nguồn: Ngân hàng dự trữ liên bang St.Louis, Các điều kiện Kinh tế Quốc tế tháng 2/1993, trang 26,28

3.21 Bảng sau cho liệu số lƣợng máy điện thoại cho 1000 ngƣời (Y) cho tổng sản phẩm nội địa theo đầu ngƣời (GDP), mức giá cấu (X) (tính theo đồng la Singapore năm 1968), Singapore khoảng thời gian 1960-1981 Có mối quan hệ hai biến hay không? Làm để bạn biết đƣợc?

Sự sở hữu máy điện thoại số GDP theo đầu ngƣời Tại Singapore, 1960-1981

Năm

Y

X Năm Y X

1960 36 1299 1971 90 2723

1961 37 1365 1972 102 3033

1962 38 1409 1973 114 3317

1963 41 1549 1974 126 3487

1964 42 1416 1975 141 3575

1965 45 1473 1976 163 3784

1966 48 1589 1977 196 4025

1967 54 1757 1978 223 4286

1968 59 1974 1979 262 4628

1969 67 2204 1980 291 5038

1970 78 2462 1981 317 5472

Nguồn: Lim Chong-Yah, Economic Restructuring in Singapore (Cấu trúc lại Kinh tế Singapore), Federal Publications, Pvt Ltd., 1984, trang 110-113

3.22 Bảng sau cho biết tổng giá trị sản phẩm nội địa (GDP) Hoa Kỳ cho năm 1972-1991

Tổng giá trị sản phẩn nội địa (GDP) tính theo la hành và đô la 1987, năm 1972-1991

GDP GDP

Năm ( đô la hành, tỷ ) ( đô la 1987, tỷ )

1972 1207.0 3107.1

1973 1349.6 3268.6

1974 1458.6 3248.1

1975 1585.9 3221.7

1976 1768.4 3380.8

1977 1974.1 3533.3

1978 2232.7 3703.5

1979 2488.6 3796.8

(61)

1981 3030.6 3843.1

1982 3149.6 3760.3

1983 3405.0 3906.6

1984 3777.2 4148.5

1985 4038.7 4279.8

1986 4268.6 4404.5

1987 4539.9 4539.9

1988 4900.4 4718.6

1989 5250.8 4838.0

1990 5522.2 4877.5

1991 5677.5 4821.0

Nguồn: Báo cáo Kinh tế Tổng thống, tháng 1/1993, Bảng B-1 B-2, trang 348-349

(a) Vẽ đồ thị GDP đô la hành đô la không đổi (năm 1987) theo thời gian (b) Gọi Y GDP, X thời gian (theo chiều thời gian cho năm 1972, cho

1973 20 cho năm 1991), xem mơ hình sau có thích hợp với liệu GDP không:

Yt = 1 + 2Xt + ut

Ƣớc lƣợng mơ hình cho GDP theo đô la hành đô la không đổi (c) Bạn giải thích 2 nhƣ nào?

(d) Nếu có khác biệt 2 đƣợc ƣớc lƣợng cho GDP theo đô la hành 2 ƣớc lƣợng cho GDP đô la không đổi, Điều giải thích khác biệt đó?

(e) Từ kết mình, bạn nói chất lạm phát Hoa Kỳ qua thập niên mẫu?

3.23 Dùng liệu cho Bảng I.1 Phần giới thiệu , kiểm chứng lại phƣơng trình (3.7.2)

3.24 Với ví dụ S.A.T cho 2.16, thực công việc sau: (a) Vẽ đồ thị thể điểm vấn đáp nữ theo điểm vấn đáp nam

(b) Nếu đồ thị phân tán gợi ý quan hệ tuyến tính hai đại lƣợng hầu nhƣ thích hợp, tìm hồi quy điểm vấn đáp nữ điểm vấn đáp nam

(c) Nếu có mối liên hệ hai điểm vấn đáp, có phải quan hệ nhân không?

3.25 Cũng giống nhƣ tập 3.24 nhƣng thay điểm vấn đáp điểm Toán

3.26 Bài tập lớp nghiên cứu Monte Carlo:

Tham khảo 10 giá trị X cho Bảng 3.2, coi 1 = 25 2 = 0.5 Giả sử uiN(0,9),

nghĩa ui tuân theo phân phối chuẩn với giá trị trung bình phƣơng sai

Hãy phát 100 mẫu, cách sử dụng giá trị thu đƣợc 100 ƣớc lƣợng

(62)

PHỤ LỤC 3A

3A.1 ĐẠO HÀM CỦA CÁC ƢỚC LƢỢNG BÌNH PHƢƠNG TỐI THIỂU

Lấy vi phân (3.1.2) phần theo ˆ1 ˆ2, ta có:

         i i i i u X Y u ˆ ) ˆ ˆ ( ˆ ) ˆ ( 1    (1)          i i i i i i X u X X Y u ˆ ) ˆ ˆ ( ) ˆ ( 2  

 (2)

Cho phƣơng trình 0, sau trình biến đổi đại số, cho ta hàm ƣớc lƣợng cho phƣơng trình (3.1.6) (3.1.7)

3A.2 CÁC TÍNH CHẤT TUYẾN TÍNH VÀ KHƠNG THIÊN LỆCH CỦA CÁC HÀM ƢỚC LƢỢNG BÌNH PHƢƠNG TỐI THIỂU

Từ (3.1.8) ta có:

 

 

i i

i i i Y k x Y x 2 ˆ  (3) đó:   ) ( i2

i i

x x k

chứng tỏ ˆ2 hàm ƣớc lƣợng tuyến tính hàm tuyến tính Y; thực trung bình trọng số Yi với ki đóng vai trị nhƣ trọng số Bằng cách tƣơng tự đƣợc ˆ1 hàm ƣớc lƣợng tuyến tính

Nhân đây, lƣu ý tính chất trọng số ki:

1 Vì Xi giả sử không ngẫu nhiên, ki không ngẫu nhiên

2 ki 0 3 ki2 1/xi2

(63)

             i i i i i i i i i i u k u k X k k u X k 2

2 ( )

ˆ       2

2) ( )

ˆ (     

 kiE ui E Ví dụ: , , 2           

     i

i i i i x x x x k

Bây ta hàm hồi quy tổng thể Yi = 1 + 2Xi + ui vào (3) để thu đƣợc

(4)

trong ứng dụng tính chất ki nhƣ lƣu ý trƣớc

Bây lấy kỳ vọng (4) vế lƣu ý ki không ngẫu nhiên,

đƣợc xử lý nhƣ số, ta có:

(5)

vì theo giả thiết E(ui) = Do ˆ2 hàm ƣớc lƣợng không thiên lệch 2 Tƣơng tự nhƣ vậy, chứng minh ˆ1 hàm ƣớc lƣợng không thiên lệch 1

3A.3 CÁC PHƢƠNG SAI VÀ SAI SỐ CHUẨN CỦA CÁC HÀM ƢỚC LƢỢNG BÌNH PHƢƠNG TỐI THIỂU

Bây giờ,theo định nghĩa phƣơng sai, ta viết:

    ) 2 ( , ) ˆ ( , ) ˆ ( ) ˆ ( ˆ ) ˆ var( 1 2 2 2 2 2 2 2 2 2 2 n n n n n n i i u u k k u u k k u k u k u k E u k E E E E E                          (6)

Vì theo giả thiết, E(ui2) = 2 cho i E( ui, uj ) = 0, i j,

2 2 2 , ) ˆ var( i i i k x k nghĩa định dụng sử       

= phƣơng trình (3.3.1) (7)

vì mẫu cho trƣớc,

i

x biết

vì x (tổng độ lệch giá trị i trung bình) ln

(64)

Phƣơng sai ˆ1 tính đƣợc tuân theo lý luận giống nhƣ Một xác định đƣợc phƣơng sai củaˆ1 ˆ2, bậc hai dƣơng chúng cho ta sai số chuẩn tƣơng ứng

3A.4 ĐỒNG PHƢƠNG SAI GIỮA ˆ1 ˆ2

Từ định nghĩa :

     ) ˆ var( ) ˆ ( ?) ( ) ˆ )( ˆ ( ) ˆ ( ˆ ) ˆ ( ˆ ) ˆ , ˆ cov( 2 2 2 1 2 1              X E X E E E E            Vì

= phƣơng trình (3.3.9) (8)

trong ứng dụng kiện ˆ1 Y ˆ2XE(ˆ1)Y ˆ2X cho,

) ˆ ( ) ˆ ( ˆ 2

1   

 E X Lưu ý: var(ˆ2) cho (3.3.1)

3A.5 HÀM ƢỚC LƢỢNG BÌNH PHƢƠNG TỐI THIỂU CỦA 2

Nhắc lại rằng:

i i

i X u

Y 1 2  (9)

Do đó:

u X

Y 12  (10)

Lấy (9) trừ (10) ta có:

) ( 2x u u

yi  ii  (11)

Cũng nhắc lại rằng:

i i

i y x

uˆ  ˆ2 (12)

Do đó, (11) vào (12) ta đƣợc:

i i

i

i x u u x

uˆ 2 (  )ˆ2 (13)

Thu thập số hạng, bình phƣơng lên lấy tổng hai vế, ta đƣợc:

ˆ (ˆ  )  (  ) 2( ˆ2  2) (  ) 2 2 2 u u x u u x

ui   i i   i i (14)

Lấy kỳ vọmg hai vế cho:

    C B A u u x E u u E E x u

E i i i i i

          

ˆ )  ( ˆ ) ( ) (ˆ ) ( )

( 2

2

2 2

2    

(15)

Bây giờ, từ giả thiết mơ hình hồi quy tuyến tính cổ điển vài số kết thiết lập nên, đƣợc kiểm chứng rằng:

(65)

B= (n-1)2 C= -22 Vì giá trị vào (15) ta đƣợc

 2

) (

ˆ   

u n

E i (16)

Do đó, ta định nghĩa

2 ˆ ˆ

2

2   

n ui

 (17)

giá trị kỳ vọng

 2

2 ˆ ) ˆ (  

Eui n

E sử dụng (16) (18)

nó ˆ2

hàm ƣớc lƣợng không thiên lệch 2 thực

3A.6 TÍNH CHẤT PHƢƠNG SAI NHỎ NHẤT CỦA CÁC HÀM ƢỚC LƢỢNG BÌNH PHƢƠNG TỐI THIỂU:

Trong Phụ lục 3A, Phần 3A.2, ta trình bày hàm ƣớc lƣợng bình phƣơng tối thiểu ˆ2 tuyến tính khơng thiên lệch (điều với ˆ1) Để chứng tỏ hàm ƣớc lƣợng phƣơng sai nhỏ nhóm tất hàm ƣớc lƣợng khơng thiên lệch tuyến tính, ta xét hàm ƣớc lƣợng bình phƣơng tối thiểu ˆ2:

kiYi

2 ˆ  đó:     

 2 2

) ( i i i i i x x X X X X

k (xem phụ lục 3A.2) (19)

nó chứng tỏ ˆ2 trung bình trọng số Y, với ki đóng vai trị trọng lƣợng Ta định nghĩa hàm ƣớc lƣợng tuyến tính thay 2 nhƣ sau:

wiYi *

2

 (20)

trong wi trọng lƣợng, không thiết ki Bây giờ:

         i i i i i i i X w w X w Y E w E 2 * ) ( ) ( ) (      (21)

Do đó, 2* khơng thiên lệch ta phải có:

(66)

1

wiXi (23)

Ta viết:

) ( ) ( ) ( ) ( ) ( ) ( ) ( var var ) var( 2 2 2 2 2 2 2 2 2 2 2 *                             i i i i i i i i i i i i i i i i i i i i i i i i x x x w x x x x w x x x x w x x x x w w Y w Y w         (24) số hạng cuối biểu thức áp chót triệt tiêu (Tại sao? )

Vì số hạng cuối (24) số, phƣơng sai (2*) cực tiểu

ta biến đổi số hạng thứ Nếu ta coi:

  2 i i i x x w

Phƣơng trình (24) giảm tới

) ˆ var( ) var( 2 *     

xi (25)

Nói gọn lại, với trọng số wi = ki trọng số bình phƣơng tối thiểu, phƣơng sai hàm

ƣớc lƣợng tuyến tính *

 phƣơng sai hàm ƣớc lƣợng bình phƣơng tối thiểu ˆ2; ngƣợc lại, var(2*)>var(2) Để đặt khác đi, có hàm ƣớc lƣợng khơng thiên lệch tuyến tính

với phƣơng sai nhỏ 2, phải hàm ƣớc lƣợng bình phƣơng tối thiểu Tƣơng tự, có

thể đƣợc chứng tỏ ˆ1 hàm ƣớc lƣợng khơng thiên lệch tuyến tính với phƣơng sai nhỏ 1

3A.7 KẾT QUẢ SAS CỦA HÀM CẦU VỀ CÀ PHÊ (3.7.1)

Vì lần ta trình bày đến kết SAS, bổ ích ta giới thiệu ngắn gọn kết quả Các kết đƣợc thu từ trình HỒI QUY SAS Biến phụ thuộc Y (số tách cho một ngƣời ngày ) biến hồi qui độc lập X2 [giá lẻ thực tế trung bình, tính $ cho pound Lƣu ý biến X (3.7.1)] Với mục đích trình bày, kết đề cập trang sau đƣợc chia làm phần Lƣu ý nhiều số thập phân đƣợc rõ kết nhƣng thực tế, ta cần lấy số

[ Lưu ý: var Yi = var ui = 2 ]

[ Lưu ý: cov ( Yi,Yj ) = (i j)]

(67)

Phần I: Phần cho ta Bảng phép phân tích phƣơng sai (ANOVA) mà ta thảo luận Chƣơng

Phần II: Căn MSE nghĩa bậc sai số bình phƣơng trung bình (=ˆ2 ), nghĩa cho ta sai số chuẩn ƣớc lƣợngˆ

Trung bình Dep nghĩa giá trị trung bình biến phụ thuộc Y (=Y ) C.V hệ số biến thiện đƣợc xác định nhƣ (2/Y)100, biểu thị tính biến thiên khơng giải thích đƣợc trì liệu (nghĩa biến Y) liên quan tới giá trị trung bình Y

R2 = hệ số xác định

R = R2 điều chỉnh (xem Chƣơng )

Phần III: Phần cho giá trị ƣớc lƣợng thông số, sai số chuẩn chúng, tỷ số t chúng mức ý nghĩa tỷ số t Hai đại lƣợng sau đƣợc trình bày đầy đủ Chƣơng

Phần IV: Phần cho ta đƣợc gọi ma trận phƣơng sai- đồng phƣơng sai thông số ƣớc lƣợng phần tử đƣờng chéo chạy từ góc trái-trên đến góc phải-dƣới cho phƣơng sai (nghĩa bình phƣơng sai số chuẩn cho Phần III)41

phần tử không nằm đƣờng chéo cho đồng phƣơng sai thông số ƣớc lƣợng, cov(ˆ1,ˆ2) nhƣ định nghĩa (3.3.9)

Phần V: Phần cho giá trị thực Yi Xi , giá trị ƣớc lƣợng Y (

i

 ), phần dƣ uˆi (YiYˆi)

Phần VI: Phần cho thống kê d Durbin-Watson hệ số tƣơng quan bậc nhất, chủ đề đƣợc thảo luận Chƣơng 12

BIẾN DEP: Y

I Nguồn DF Tổng bình

phƣơng

Bình phƣơng trung bình

Giá trị F PROB>F

Mơ hình 0.292975 0.292975 17.687 0.0023

Sai số 0.149080 0.016564

Tổng số C 10 0.442055

II Căn MSE 0.128703 R-bình phƣơng 0.6628 TBình DEP 2.206364 ADJ R-SC 0.6253

C.V 5.833255

Thông số Sai số T cho HO

III Biến DF ƣớc lƣợng chuẩn Thông số=0 PROB>T

41 Vì vậy, 0.01479 phƣơng sai

1

ˆ

(68)

Tung độ gốc 2.691124 0.121622 22.127 0.0001

X -0.479529 0.114022 -4.206 0.0023

IV Đồng phƣơng sai ƣớc lƣợng

COVB Tung độ gốc X

Tung độ gốc 0.01479203 -0.0131428

X -0.0131428 0.01300097

V OBS Y X YHAT YRESID = uˆ i

1 2.57 0.77 2.32189 0.24811

2 2.50 0.74 2.33627 0.16373

3 2.35 0.72 2.34586 0.00414

4 2.25 0.73 2.34107 -0.04107

5 2.20 0.76 2.32668 -0.07668

6 2.20 0.75 2.33148 -0.13148

7 2.11 1.08 2.17323 -0.06323

8 1.94 1.81 1.82318 0.11682

9 1.97 1.39 2.02458 -0.05458

10 2.06 1.20 2.11569 -0.05569

11 2.02 1.17 2.13007 -0.11007

VI d DURBIN-WATSON 0.727

Ngày đăng: 14/01/2021, 13:06

Tài liệu cùng người dùng

Tài liệu liên quan