PHÂN TÍCH HỒI QUY HAI BIẾN: MỘT SỐ Ý TƯỞNG CƠ BẢN

19 489 1
PHÂN TÍCH HỒI QUY HAI BIẾN: MỘT SỐ Ý TƯỞNG CƠ BẢN

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2010-2012 Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Chương PHÂN TÍCH HỒI QUY HAI BIẾN: MỘT SỐ Ý TƯỞNG CƠ BẢN Trong chương ñã thảo luận khái niệm hồi quy cách tổng quát Trong chương tiếp cận vấn ñề cách tương ñối hệ thống ðặc biệt, chương ba chương giúp bạn ñọc làm quen với lý thuyết làm tảng cho phân tích hồi quy ñơn giản có ñược, gọi hồi quy hai biến Chúng ta xem xét trường hợp trước, không thiết khả thực tế nó, mà trình bày cho ý tưởng phân tích hồi quy cách ñơn giản ñược số ý tưởng ñược minh họa biểu ñồ hai chiều Hơn nữa, thấy, ñứng nhiều phương diện trường hợp phân tích hồi quy bội tổng quát mở rộng hợp lý trường hợp hồi quy hai biến 2.1 MỘT VÍ DỤ GIẢ THIẾT Như ñã Phần 1.2, phân tích hồi quy chủ yếu ñể ước lượng và/hay dự ñoán trung bình (tổng thể) giá trị trung bình biến ñộc lập sở giá trị ñã biết ñã xác ñịnh (các) biến giải thích ðể hiểu ñiều ñược thực nào, xem xét ví dụ sau Giả thiết có quốc gia với tổng thể1 60 gia ñình Giả sử quan tâm ñến việc nghiên cứu mối quan hệ Y chi tiêu tiêu dùng hàng tuần gia ñình X thu nhập khả dụng hàng tuần gia ñình hay thu nhập sau ñã ñóng thuế Nói cách cụ thể giả ñịnh muốn dự ñoán mức trung bình (tổng thể) chi tiêu tiêu dùng hàng tuần biết thu nhập hàng tuần gia ñình ðể thực ñiều này, giả sử chia 60 gia ñình thành 10 nhóm có thu nhập tương ñối xem xét chi tiêu tiêu dùng gia ñình nhóm thu nhập Các liệu giả thiết nằm Bảng 2.1 (Với mục ñích ñể thảo luận, giả ñịnh mức thu nhập ñưa bảng 2.1 thật ñược quan sát.) Bảng 2.1 ñược giải thích sau: Ví dụ như, tương ứng với thu nhập hàng tuần 80 ñôla, có năm gia ñình có mức chi tiêu tiêu dùng hàng tuần khoảng 55 ñến 75 ñôla Tương tự, với X = 240$, có sáu gia ñình có mức chi tiêu tiêu dùng hàng tuần nằm khoảng 137$ 189$ Nói cách khác, cột dọc (dãy ñứng) Bảng 2.1 cho thấy phân phối chi tiêu tiêu dùng Y tương ứng với mức thu nhập X cố ñịnh: có nghĩa là, cho thấy phân phối có ñiều kiện Y phụ thuộc vào giá trị ñịnh X Lưu ý liệu Bảng 2.1 tiêu biểu cho tổng thể, dễ dàng tính toán các xác suất có ñiều kiện Y, p(Y X), xác suất Y với ñiều kiện X sau.2 Ví dụ, với X= 80$, có giá trị Y: 55$, 60$, 65$, 70$, 75$ Do ñó, với X=80, xác suất ñể có ñược số chi tiêu tiêu dùng 1/5 Biểu thị ký hiệu toán Ý nghĩa thống kê thuật ngữ tổng thể ñược giải thích phần phụ lục A Nói ñơn giản, tập hợp tất kết xảy thí nghiệm hay ño ñạc, ví dụ: tung ñồng tiền nhiều lần hay ghi chép lại giá tất chứng khóan Thị trường Trao ñổi Chứng khoán New York vào cuối ngày kinh doanh Giải thích ký hiệu: biểu thức p(Y X) hay p(Y Xi) viết tắt cho p(Y=Yj X=Xi), có nghĩa là, xác suất ñể biến ngẫu nhiên (rời rạc) Y có giá trị số Yj với ñiều kiện biến ngẫu nhiên (rời rạc) X có giá trị số Xi Tuy nhiên ñể tránh làm lộn xộn ký hiệu, dùng số i (chỉ số quan sát) cho hai biến Như vậy, p(Y X) hay p(Y Xi) thay cho p(Y=Yi X=Xi), có nghĩa là, xác suất ñể Y có giá trị Yi X lấy giá trị Xi, vấn ñề gặp phải ñây làm sáng tỏ phạm vi giá trị Y X Trong Bảng 2.1, X=$220, Y nhận giá trị khác nhau, X = $120, Y nhận giá trị Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng học p(Y= 55 X = 80) = 1/5 Tương tự, p(Y= 150 X = 260) = 1/7, v.v Xác suất có ñiều kiện liệu Bảng 2.1 ñược trình bày Bảng 2.2 Bây ñối với phân phối xác suất có ñiều kiện của Y tính ñược số trung bình giá trị trung bình nó, ñược gọi trung bình có ñiều kiện hay kỳ vọng có ñiều kiện, ñược thể E(Y X = Xi) ñược diễn giải "giá trị kỳ vọng Y X nhận giá trị cụ thể Xi," ñể ñơn giản hóa mặt ký hiệu viết lại thành sau: E(Y Xi) (Lưu ý: giá trị kỳ vọng ñơn trung bình tổng thể hay giá trị trung bình.) ðối với liệu giả thiết chúng ta, kỳ vọng có ñiều kiện ñược tính toán cách dễ dàng cách nhân giá trị Y tương ứng Bang 2.1 với xác suất có ñiều kiện chúng Bảng 2.2 cộng kết lại ðể minh họa, trung bình có ñiều kiện tức kỳ vọng có ñiều kiện Y với X = 80 55(1/5) + 60(1/5) + 65(1/5) + 70(1/5) + 75(1/5) = 65 Như kết trung bình có ñiều kiện ñược ñặt hàng cuối Bảng 2.2 BẢNG 2.1 Thu nhập gia ñình hàng tuần X, $ X→ Y↓ Chi tiêu tiêu dùng gia ñình hàng tuần Y, $ Tổng cộng 80 55 60 65 70 75 _ _ 325 100 65 70 74 80 85 88 _ 462 120 79 84 90 94 98 _ _ 445 140 102 93 95 103 108 113 115 707 160 102 107 110 116 118 125 _ 678 180 110 115 120 130 135 140 _ 750 200 120 136 140 144 145 _ _ 685 220 135 137 140 152 157 160 162 1043 240 137 145 155 165 175 189 _ 966 260 150 152 175 178 180 185 191 1211 Trước tiếp tục, việc xem xét liệu Bảng 2.1 ñồ thị phân tán giúp cho ta nhiều ñiều bổ ích, hình 2.1 ðồ thị phân tán cho thấy phân phối có ñiều kiện Y ứng với giá trị khác X Mặc dù có biến ñổi chi tiêu tiêu dùng gia ñình, Hình 2.1 cho thấy cách rõ ràng chi tiêu tiêu dùng mặt trung bình tăng thu nhập tăng Nói cách khác, ñồ thị phân tán cho thấy giá trị trung bình (có ñiều kiện ) Y tăng X tăng Có thể nhận thấy quan sát cách sinh ñộng tập trung vào ñiểm có kích thước lớn thể trung bình có ñiều kiện khác Y ðồ thị phân tán cho thấy trung bình có ñiều kiện nằm hàng thẳng với ñộ dốc ñồng biến.3 ðường thẳng ñược gọi ñường hồi qui tổng thể, gọi cách khái quát, ñường cong hồi qui tổng thể ðơn giản hơn, ñường thẳng ñó hồi qui Y X BẢNG 2.2 Xác suất có ðiều kiện p(Y Xi) liệu Bảng 2.1 p(Y Xi) X → 80 100 120 140 160 180 200 ↓ Xác suất 1/5 1/6 1/5 1/7 1/6 1/6 1/5 có ñiều kiện 1/5 1/6 1/5 1/7 1/6 1/6 1/5 220 1/7 1/7 240 1/6 1/6 260 1/7 1/7 Các bạn ñọc cần nhớ liệu ta giả thiết Ở ñây không gợi ý trung bình có ñiều kiện nằm ñường thẳng; chúng nằm ñường cong Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng 1/5 1/5 1/5 _ _ 1/6 1/6 1/6 1/6 _ 1/5 1/5 1/5 _ _ 1/7 1/7 1/7 1/7 1/7 1/6 1/6 1/6 1/6 _ 1/6 1/6 1/6 1/6 _ 1/5 1/5 1/5 _ _ 1/7 1/7 1/7 1/7 1/7 1/6 1/6 1/6 1/6 _ 1/7 1/7 1/7 1/7 1/7 Trung bình có ñiều kiện Y 65 77 89 101 113 125 137 149 161 173 p(Y Xi) Như mặt hình học, ñường cong hồi qui tổng thể ñơn giản quỹ tích trung bình có ñiều kiện hay kỳ vọng có ñiều kiện biến số phụ thuộc ñối với giá trị xác ñịnh (các) biến giải thích Có thể vẽ ñường hình 2.2, cho thấy ñối với Xi có tổng thể giá trị Y (ñược giả ñịnh có phân phối chuẩn lý giải thích sau) trung bình (có ñiều kiện ) tương ứng Và ñường thẳng hay ñường cong hồi qui ñi ngang qua giá trị trung bình có ñiều kiện Với cách giải thích ñường cong hồi qui bạn có lẽ cảm thấy bổ ích ñọc lại ñịnh nghĩa hồi qui ñã cho phần 1.2 Hình 2.1 Phân phối có ñiều kiện chi tiêu ñối với mức ñộ thu nhập khác (dữ liệu Bảng 2.1) Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Hình 2.2 ðường hồi quy tổng thể (dữ liệu Bảng 2.10) 2.2 KHÁI NIỆM HÀM HỒI QUI TỔNG THỂ (PRF) Từ phần thảo luận trước ñặc biệt từ hai hình 2.1 2.2, rõ ràng trung bình có ñiều kiện E(Y Xi) hàm Xi Thể ký hiệu: E(Y Xi) = f (Xi) (2.2.1) ñó f (Xi) hàm biến giải thích Xi [Trong ví dụ giả thiết chúng ta, E(Y Xi) hàm tuyến tính Xi.] Phương trình (2.2.1) ñược gọi hàm hồi qui tổng thể (hai biến) (PRF), hay cách ngắn gọn hồi qui tổng thể (PR) Phát biểu cách ñơn giản là, trung bình (tổng thể) phân phối Y với ñiều kiện Xi có quan hệ hàm số với Xi Nói cách khác, cho biết giá trị trung bình Y biến ñổi so với X Hàm f (Xi) có dạng nào? Câu hỏi quan trọng tình thực tế sẵn toàn tổng thể ñể xem xét Do ñó, dạng hàm PRF vấn ñề thực nghiệm, trường hợp cụ thể lý thuyết giúp cho ta môt vài ñiều Ví dụ, nhà kinh tế học giả thiết chi tiêu tiêu dùng có quan hệ tuyến tính với thu nhập Như vậy, giả thiết gần ñúng hay ñúng ñầu tiên giả ñịnh PRF E(Y Xi) hàm tuyến tính Xi, giả dụ thuộc loại E(Y Xi) = βi + β2Xi (2.2.2) ñó β1 β2 thông số không thay ñổi ñược gọi hệ số hồi qui; β1 β2 ñược gọi hệ số tung ñộ gốc hệ số ñộ dốc Phương trình (2.2.2) ñược gọi hàm hồi qui tổng thể tuyến tính Một số biểu thức thay ñược dùng tài liệu mô hình hồi qui tổng thể tuyến tính hay phương trình hồi qui tổng thể tuyến tính Trong phần sau, thuật ngữ hồi qui, phương trình hồi qui, mô hình hồi qui ñược dùng với nghĩa Khi phân tích hồi qui mối quan tâm ñể dự ñoán PRF (2.2.2), có nghĩa là, dự ñoán giá trị β1 β2 sở quan sát Y X Vấn ñề ñược nghiên cứu chi tiết Chương 2.3 Ý NGHĨA CỦA THUẬT NGỮ "TUYẾN TÍNH" Bởi tài liệu quan tâm chủ yếu ñến mô hình tuyến tính (2.2.2), ñó ñiều cần thiết phải biết thuật ngữ "tuyến tính" thật có ý nghĩa gì, hiểu từ theo hai cách khác Sự tuyến tính theo Biến số Ý nghĩa ñầu tiên có lẽ "tự nhiên" tuyến tính ñó kỳ vọng có ñiều kiện Y hàm tuyến tính Xi, ví dụ (2.2.2).4 Về mặt hình học, ñường cong tuyến tính Hàm Y = f(x) ñược coi tuyến tính theo X X xuất với lũy thừa hay số mà (có nghĩa số hạng X2, X v.v ñược loại bỏ) không ñược nhân hay chia với biến khác (ví dụ, X *Z hay X/Z, ñó Z biến khác) Nếu Y phụ thuộc vào X, cách khác ñể nói Y có quan hệ tuyến tính với X tỉ lệ thay ñổi Y so với X (có nghĩa ñộ dốc, hay ñạo hàm, Y so với X, dY/dX) Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng trường hợp ñường thẳng Theo cách giải thích này, hàm tuyến tính E(Y Xi) = β1 + β2Xi2 hàm tuyến tính biến số X xuất với số mũ hay lũy thừa Sự tuyến tính theo Thông số Cách giải thích thứ hai tuyến tính kỳ vọng có ñiều kiện Y , E(Y Xi), hàm tuyến tính theo thông số, β; tuyến tính không tuyến tính theo biến X.5 Theo cách giải thích này, E(Y Xi) = β1 + β2Xi2 mô hình tuyến tính E(Y Xi) = β1 + β Xi Biểu thức thứ hai ví dụ mô hình hồi qui không tuyến tính (theo thông số); không bàn tới mô tài liệu Trong hai cách giải thích tuyến tính, tuyến tính theo thông số có liên quan ñến phát triển lý thuyết hồi qui ñây Do ñó, từ ñây trở ñi, thuật ngữ hồi qui "tuyến tính" có nghĩa hồi qui tuyến tính theo thông số, β, (có nghĩa là, thông số có lũy thừa mà thôi); có tuyến tính không tuyến tính theo biến giải thích, tức giá trị X ðiều ñược trình bày cách sơ ñồ hóa Bảng 2.3 Như vậy, E(Y Xi) = β1 + β2Xi tuyến tính theo thông số theo biến số, LRM, E(Y Xi) = β1 + β2Xi2 vậy, tuyến tính theo thông số không tuyến tính theo biến số X BẢNG 2.3 Các Mô hình Hồi qui Tuyến tính Mô hình tuyến tính theo thông số ? Mô hình tuyến tính theo biến số ? Phải LRM NLRM Phải Không phải Không phải LRM NLRM Chú ý: LRM = mô hình hồi qui tuyến tính NLRM = mô hình hồi qui không tuyến tính 2.4 ðẶC TRƯNG NGẪU NHIÊN CỦA PRF Từ hình 2.1 ta thấy rõ thu nhập gia ñình tăng, chi tiêu tiêu dùng gia ñình mặt trung bình tăng theo Nhưng chi tiêu tiêu dùng gia ñình so với mức thu nhập (không ñổi) sao? Từ hình 2.1 Bảng 2.1 ta thấy rõ chi tiêu tiêu dùng gia ñình không thiết phải tăng mức thu nhập tăng Ví dụ, Bảng 2.1 quan sát thấy tương ứng với mức thu nhập 100 ñôla có gia ñình với mức chi tiêu tiêu dùng 65 ñôla thấp mức chi tiêu tiêu dùng hai gia ñình mà mức thu nhập hàng tuần có 80 ñôla Nhưng lưu ý mức chi tiêu tiêu dùng trung bình gia ñình với thu nhập hàng tuần 100 ñôla lớn mức chi tiêu tiêu dùng trung bình gia ñình có mức thu nhập hàng tuần 80 ñôla (77 ñôla so với 65 ñôla) không phụ thuộc vào giá trị X Như vậy, Y=4X, dY/dX=4, tức kết không phụ thuộc vào giá trị X Nhưng Y=4X2, dY/dX =8X, tức có phụ thuộc vào giá trị X Do ñó hàm không tuyến tính theo X Một hàm ñược gọi tuyến tính theo thông số , ví dụ β1, β1 xuất với lũy thừa không nhân hay chia thông số khác (ví dụ β1β2, β2/β1, v.v.) Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Như vậy, nói mối tương quan mức chi tiêu tiêu dùng gia ñình cá thể mức thu nhập ñịnh? Từ hình 2.1 thấy với mức thu nhập Xi, mức chi tiêu tiêu dùng gia ñình cá thể nằm xung quanh chi tiêu trung bình tất gia ñình Xi, có nghĩa xung quanh kỳ vọng có ñiều kiện Do ñó, diễn ñạt ñộ lệch Yi xung quanh giá trị kỳ vọng sau: ui = Yi - E(Y Xi) hay (2.4.1) Yi = E(Y Xi) + ui ñó ñộ lệch ui biến số ngẫu nhiên quan sát có giá trị âm dương Diễn ñạt thuật ngữ chuyên môn, ui ñược gọi số hạng nhiễu ngẫu nhiên hay số hạng sai số ngẫu nhiên Chúng ta giải thích (2.4.1) nào? Chúng ta nói chi tiêu gia ñình cá thể, biết mức thu nhập nó, ñược thể tổng hai thành tố, (1) E(Y Xi), ñơn giản chi tiêu tiêu dùng trung bình tất gia ñình có mức thu nhập Thành tố ñược gọi thành tố tất ñịnh hay hệ thống, (2) ui, thành tố ngẫu nhiên hay không hệ thống Chúng ta nhanh chóng xem xét chất số hạng nhiễu ngẫu nhiên, tạm thời giả ñịnh số hạng thay hay ñại diện cho tất biến số ta bỏ hay bỏ sót mà ảnh hưởng ñến Y không ñược (hay không thể) ñưa vào mô hình hồi qui Nếu E(Y Xi) ñược giả ñịnh tuyến tính theo Xi , (2.2.2), phương trình (2.4.1) ñược biểu thị sau: Yi = E(Y Xi) + ui = β1 + β2Xi + ui (2.4.2) Phương trình (2.4.2) giả ñịnh chi tiêu tiêu dùng gia ñình có quan hệ tuyến tính ñối với thu nhập cộng với số hạng nhiễu Như vậy, chi tiêu tiêu dùng gia ñình, với X = 80$ (xem Bảng 2.1), ñược biểu thị sau Y = 55 = β1 + β2(80) + u1 Y2 = 60 = β1 + β2(80) + u2 Y3 = 65 = β1 + β2(80) + u3 (2.4.3) Y4 = 70 = β1 + β2(80) + u4 Y5 = 75 = β1 + β2(80) + u5 Bây lấy giá trị kỳ vọng (2.4.2) hai vế, ñược E(Yi Xi) = E[E(Y Xi)] + E(ui Xi) = E(Y Xi) + E(ui Xi) (2.4.4) ñó ta vận dụng ñặc tính giá trị kỳ vọng số số ñó.6 Lưu ý cẩn thận (2.4.4) ñã lấy giá trị kỳ vọng có ñiều kiện, phụ thuộc vào giá trị X ñã cho Bởi E(Yi Xi) E(Y Xi), phương trình (2.4.4) cho thấy E(ui Xi) = (2.4.5) Xem Phụ lục A phần thảo luận ñặc tính toán tử kỳ vọng E Chú ý E(Y Xi), giá trị Xi không ñổi, số Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Như vậy, giả ñịnh cho ñường hồi qui ñi ngang qua giá trị trung bình có ñiều kiện Y (xem hình 2.2) có nghĩa giá trị trung bình có ñiều kiện ui (phụ thuộc vào giá trị X) zero Từ lý luận thấy rõ ràng (2.2.2) (2.4.2) hình thức tương ñương E(ui Xi) = 0.7 Nhưng ñặc trưng ngẫu nhiên (2.4.2) có ưu ñiểm chỗ cho thấy cách rõ ràng có biến số khác thu nhập ảnh hưởng ñến chi tiêu tiêu dùng giải thích cách ñầy ñủ chi tiêu tiêu dùng gia ñình (những) biến số nằm mô hình hồi qui 2.5 Ý NGHĨA CỦA SỐ HẠNG NHIỄU NGẪU NHIÊN Như ñã ñược lưu ý Phần 2.4, số hạng nhiễu ui số hạng thay cho tất biến số bị bỏ khỏi mô hình tất biến số tập hợp lại có ảnh hưởng ñến Y Câu hỏi ñặt là: Tai không ñưa thẳng biến vào mô hình cách công khai? Nói cách khác, không phát triển mô hình hồi qui bội với nhiều biến tốt? Có nhiều lý Sự mơ hồ lý thuyết: Lý thuyết ñịnh hành vi Y, có thể, thường là, không hoàn chỉnh Chúng ta biết chắn thu nhập hàng tuần X ảnh hưởng ñến chi tiêu tiêu dùng hàng tuần Y, không biết biến khác ảnh hưởng ñến Y Do ñó, ui ñược sử dụng làm biến thay cho tất biến bị loại bỏ hay bỏ khỏi mô hình Dữ liệu sẵn: Ngay biết số biến bị loại bỏ biến ñó xem xét ñến hồi qui bội thay vào hồi qui ñơn, chưa có ñược thông tin ñịnh lượng biến Một kinh nghiệm thường gặp phân tích thực nghiệm liệu lý tưởng mà muốn có thông thường lại ñược Ví dụ, nguyên tắc ñưa giàu có gia ñình vào làm biến giải thích thêm với biến thu nhập ñể giải thích chi tiêu tiêu dùng gia ñình Nhưng không may thông tin giàu có gia ñình thông thường Do ñó buộc phải loại bỏ biến giàu có khỏi mô hình có tầm quan trọng lý thuyết lớn cần thiết ñể giải thích chi tiêu tiêu dùng Các biến cốt lõi (core) biến ngoại vi (peripheral): Giả ñịnh ví dụ thu nhậpchi tiêu chúng ta, thu nhập X1 ra, số gia ñình X2, giới tính X3, tôn giáo X4, giáo dục X5, khu vực ñịa lý X6 ảnh hưởng ñến chi tiêu tiêu dùng Nhưng hoàn toàn ảnh hưởng chung tất hay vài biến nhỏ chí không hệ thống ngẫu nhiên ñến mức xét phương diện thực tế lý chi phí việc ñưa chúng vào mô hình cách rõ ràng ích lợi Chúng ta hy vọng ảnh hưởng kết hợp chung chúng ñược xử lý biến ngẫu nhiên ui.8 Bản chất ngẫu nhiên hành vi người: Ngay thành công việc ñưa tất biến liên quan vào mô hình, chắn số "ngẫu nhiên" thuộc chất cá thể Y mà giải thích ñược có cố gắng ñến Các biến nhiễu, biến số u, ñã thể ñược chất ngẫu nhiên Sự thật là, phương pháp bình phương tối thiểu ñược phát triển chương 3, giả ñịnh cách rõ ràng E(ui Xi) = Xem Phần 2.3 Một khó khăn biến giới tính, giáo dục, tôn giáo v.v khó ñịnh lượng Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Các biến thay kém: Mặc dù mô hình hồi qui cổ ñiển (sẽ ñược phát triển chương 5) giả ñịnh biến Y X ñược tính toán cách xác, thực tế liệu không xác sai số tính toán Ví dụ xem lý thuyết tiếng Milton Friedman hàm chi tiêu.9 Ông xem tiêu thụ thường xuyên (Yp) hàm thu nhập thường xuyên (Xp) Nhưng liệu biến số trực tiếp quan sát ñược, thực tế dùng biến thay thế, ví dụ chi tiêu thời (Y) thu nhập thời (X), biến mà quan sát ñược Bởi Y X quan sát ñược không tương ñương với Yp Xp, ta gặp phải vấn ñề sai sót tính toán Như số hạng nhiễu u trường hợp tượng trưng cho sai sót tính toán Như thấy chương sau, có sai sót tính toán, chúng có tác ñộng nghiêm trọng ñối với việc tính toán hệ số hồi qui β Nguyên tắc chi li: Tuân theo nguyên tắc Lưỡi dao Occam,10 muốn giữ cho mô hình hồi qui ñơn giản tốt Nếu giải thích hành vi Y "một cách ñầy ñủ" hai hay ba biến giải thích lý thuyết không ñủ mạnh ñể cho ta thấy ñưa biến khác vào, ñưa thêm biến vào? Hãy ñể ui biểu thị tất biến khác Dĩ nhiên, không nên loại bỏ biến quan trọng liên quan nhằm ñể giữ cho mô hình ñơn giản Dạng hàm sai: Ngay mặt lý thuyết có ñược biến ñúng ñể giải thích cho tượng thu ñược liệu biến này, thông thường dạng quan hệ hàm số biến hồi qui phụ thuộc biến hồi qui ñộc lập Có tiêu tiêu dùng hàm (theo biến số) tuyến tính thu nhập hàm không tuyến tính (theo biến số)? Nếu trường hợp ñầu, Yi = β1 + β2Xi + ui quan hệ hàm số thích hợp Y X, trường hợp sau, Yi = β1 + β2Xi + β2Xi2 + ui dạng hàm ñúng Trong mô hình hai biến suy xét dạng hàm mối quan hệ từ ñồ thị phân tán Nhưng mô hình hồi qui bội, không dễ dàng xác ñịnh dạng hàm thích hợp, tưởng tượng ñược ñồ thị phân tán không gian ña chiều Vì tất lý này, số hạng nhiễu ui ñóng vai trò vô quan trọng phân tích hồi qui, thấy ñiều tiếp tục 2.6 HÀM HỒI QUI MẪU (SRF) Cho tới cách giới hạn thảo luận vào tổng thể giá trị Y tương ứng với giá trị không ñổi X, ñã cố tình tránh không xem xét ñến việc lấy mẫu (lưu ý liệu Bảng 2.1 tiêu biểu cho tổng thể, mẫu) Nhưng ñây ñã ñến lúc phải ñối diện với vấn ñề lấy mẫu, hầu hết tình thực tế có mẫu giá trị Y tương ứng với số X không ñổi Do ñó, nhiệm vụ phải tính toán PRF sở thông tin mẫu Bảng 2.4 Một mẫu ngẫu nhiên từ tổng thể Bảng 2.1 X Y Milton Friedman, A Theory of the Consumption Function ( Một lý thuyết hàm tiêu dùng) , Princeton University Press, Princeton, N.J., 1957 10 " Nên giữ cho diễn tả ñơn giản tốt cho ñến tỏ không thoả ñáng thôi," The World of Mathematics ( Thế giới toán học) , tập 2, J R Newman, Simon & Schuster, New York, 1956, trang 1247, hay "Không nên nhân ñối tượng vượt mức cần thiết," Donald F Morrison, Applied Linear Sattistical Methods, Prentice Hall, Englewood Cliffs, N.J., 1983, trang 58 Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright 70 65 90 95 110 115 120 140 155 150 Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng 80 100 120 140 160 180 200 220 240 260 ðể minh họa, giả vờ chưa biết ñược tổng thể Bảng 2.1 thông tin có mẫu lựa chọn ngẫu nhiên giá trị Y tương ứng với X không ñổi ñã cho Bảng 2.4 Không giống Bảng 2.1, ñây có giá trị Y tương ứng với giá trị X ñã biết; Y (ñã biết Xi) Bảng 2.4 ñược chọn cách ngẫu nhiên từ Y tương tự tương ứng với Xi từ tổng thể Bảng 2.1 Vấn ñề là: Từ mẫu Bảng 2.4 liệu tiên ñoán ñược chi tiêu tiêu dùng hàng tuần trung bình Y tổng thể tương ứng với X ñược chọn? Nói cách khác, liệu tính ñược PRF từ liệu mẫu không? Như bạn ñọc chắn ñã nghi vấn, tính ñược PRF "một cách xác" giao ñộng việc lấy mẫu ðể thấy ñược ñiều này, giả sử lấy mẫu ngẫu nhiên khác từ tổng thể Bảng 2.1, ñược trình bày Bảng 2.5 Vẽ ñồ thị liệu Bảng 2.4 2.5, ñạt ñược ñồ thị phân tán hình 2.3 Trong ñồ thị phân tán hai ñường hồi qui mẫu ñược vẽ cho tương ñối "thích hợp" với ñiểm rời rạc: SRF1 ñược vẽ sở mẫu thứ nhất, SRF2 sở mẫu thứ hai ðường hai ñường hồi qui thể ñường hồi qui tổng thể "thực"? Nếu không xem hình 2.1, ñược cho thể PR, cách hoàn toàn chắn hai ñường hồi qui hình 2.3 thể ñường (ñường cong) hồi qui tổng thể thực ðường hồi qui hình 2.3 ñược gọi ñường hồi qui mẫu Chúng ñược xem thể ñường hồi qui tổng thể, giao ñộng việc lấy mẫu chúng gần ñường PR thật Nhìn chung, thu ñược N lần SRF khác cho N mẫu khác nhau, SRF có khả giống Damodar N Gujarati Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Hình 2.3 Regression lines based on two different samples Bảng 2.5 Một mẫu ngẫu nhiên khác từ tổng thể Bảng 2.1 Y X 55 80 88 100 90 120 80 140 118 160 120 180 145 200 135 220 145 240 175 260 Giờ ñây, tương tự ñường PRF nằm ñường hồi qui tổng thể, phát triển khái niệm hàm hồi qui mẫu (SRF) ñể thể ñường hồi qui mẫu Biểu thức mẫu tương ứng với (2.2.2) ñược viết thành Yi = β1 + β2 Xi (2.6.1) ñó Y ñược ñọc "Y mũ" Yi = hàm ước lượng E(Y Xi) ñó β1 = hàm ước lượng β1 β2 = hàm ước lượng β2 Lưu ý hàm ước lượng, ñược biết trị thống kê (mẫu), ñơn giản quy tắc hay công thức hay phương pháp cho biết làm cách ñể tính toán thông số Damodar N Gujarati 10 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng tổng thể từ thông tin ñược cung cấp từ mẫu ñang xem xét Một giá trị số ñịnh thu ñược cách áp dụng hàm ước lượng ñược gọi giá trị ước lượng.11 Cũng giống ñã biểu diễn PRF qua hai biểu thức tương ñương (2.2.2) (2.4.2), biểu diễn SRF (2.6.1) dạng ngẫu nhiên sau: Yi = β1 + β2 Xi + ui (2.6.2) ñó, ký hiệu mà ñã ñịnh nghĩa, ui số hạng phần dư (mẫu) Về mặt khái niệm ui tương tự ui ñược xem ước lượng ui Nó ñược ñưa vào SFR với lý ui ñược ñưa vào PRF Nói tóm lại, mục tiêu phân tích hồi quy ñể tính PRF (2.4.2) Yi = β1 + β2 Xi + ui sở SRF Yi = β1 + β2 Xi + ui (2.6.2) thông thường phương pháp phân tích ñược dựa mẫu lấy từ tổng thể Nhưng giao ñộng việc lấy mẫu ước lượng PRF sở SRF gần ñúng tốt Sự gần ñúng ñược ñưa thể biểu ñồ thông qua hình 2.4 ðối với X = Xi, có quan sát (mẫu) Y = Yi Theo SRF, thể Yi quan sát ñược sau (2.6.3) Yi = Y1 + ui theo PRF ñược thể sau Yi = E(Y Xi) + ui (2.6.4) Rõ ràng hình 2.4 Yi ước lượng cao E(Y Xi) thực ñối với Xi hình 2.4 Cũng tương tự vậy, ñối với Xi nằm bên trái ñiểm A, SRF ước lượng thấp PRF thực Nhưng bạn dễ dàng thấy ước lượng cao thấp ñiều tránh khỏi giao ñộng việc lấy mẫu Bây câu hỏi quan trọng là: Giả sử SRF gần ñúng PRF, liệu ñặt quy luật hay phương pháp ñể ñưa ước lượng "gần" ñúng ñược không? Nói cách khác, làm cách ñể thiết lập SRF cho β1 "gần" với β1 thực β2 "gần" với β2 thực biết ñược β1 β2 thực? 11 Như ñã lưu ý phần Giới thiệu, dấu mũ biến số tượng trưng cho hàm ước lượng giá trị tổng thể liên quan Damodar N Gujarati 11 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Hình 2.4 Sample and population regression lines Câu trả lời cho vấn ñề chiếm nhiều công sức giải thích chương Ở ñây lưu ý phát triển phương pháp cho làm cách ñể thiết lập SRF ñể thể PRF cách trung thực Quan niệm làm ñiều ñược không thật xác ñịnh ñược PRF ñiều lý thú 2.7 TÓM TẮT VÀ KẾT LUẬN Khái niệm làm tảng cho phân tích hồi qui khái niệm hàm hồi qui tổng thể (PRF) Tập sách ñề cập ñến PRF tuyến tính, có nghĩa là, hồi qui tuyến tính theo tham số chưa biết Chúng tuyến tính hay không tuyến tính theo biến phụ thuộc hay biến hồi qui phụ thuộc Y biến ñộc lập hay (các) biến hồi qui ñộc lập X Vì mục ñích thực nghiệm, PRF ngẫu nhiên ñiều quan trọng Số hạng nhiễu ngẫu nhiên ui ñóng vai trò ñịnh việc ước lượng PRF ðường PRF khái niệm lý tưởng hóa, thực tế ñược toàn tổng thể mà cần Thông thường, có ñược mẫu quan sát từ tổng thể Do ñó, dùng hàm hồi qui mẫu ngẫu nhiên (SRF) ñể ước lượng PRF Chúng ta thấy ñiều ñược thực chương BÀI TẬP 2.1 Bảng ñây cho ta suất sinh lời dự ñoán năm dự án ñầu tư xác suất liên quan chúng Suất sinh lời X, % -20 -10 10 Damodar N Gujarati Xác suất pi 0.10 0.15 0.45 12 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright 25 30 0.25 0.05 Sử dụng ñịnh nghĩa ñã cho bảng phụ lục A, thực yêu cầu sau: a) Tính suất sinh lời kỳ vọng, E(X) b) Tính phương sai (σ2) ñộ lệch chuẩn (σ) suất sinh lời c) Hãy tính hệ số ñộ biến thiên, V, ñược ñịnh nghĩa V = σ / E(X) Chú ý: V thường ñược nhân với 100 ñể biểu thị dạng phần trăm d) Dùng ñịnh nghĩa ñộ lệch (skewness), tính ñộ lệch phân phối suất sinh lời cho bảng Phân phối suất sinh lời ví dụ lệch dương hay lệch âm? e) Dùng ñịnh nghĩa ñộ nhọn (kurtosis), tính ñộ nhọn ví dụ Phân phối suất sinh lời cho bảng có ñộ nhọn vượt chuẩn (dạng ñuôi hẹp) hay chuẩn (ñuôi dài)? 2.2 Bảng ñây cho ta phân phối xác suất liên kết, p(X,Y), biến X Y X Y 0.03 0.02 0.09 0.06 0.06 0.04 0.18 0.12 0.06 0.04 0.18 0.12 Sử dụng ñịnh nghĩa ñã cho bảng phụ lục A, tính yêu cầu sau: a) Phân phối xác suất không ñiều kiện hay xác suất biên X Y b) Tính phân phối xác suất có ñiều kiện p(X Yi) p(Y Xi) c) Các kỳ vọng có ñiều kiện E(X Yi) E(Y Xi) 2.3 Bảng ñây cho ta phân phối xác suất liên kết, p(X,Y), biến ngẫu nhiên X Y ñó X = suất sinh lời năm ñầu tiên (%) kỳ vọng ñạt ñược từ dự án A Y = suất sinh lời năm ñầu tiên (%) kỳ vọng ñạt ñược từ dự án B X Y 20 50 -10 0.27 0.00 0.08 0.04 20 0.16 0.10 30 0.00 0.35 a) Tính suất sinh lời kỳ vọng dự án A, E(X) b) Tính suất sinh lời kỳ vọng dự án B, E(Y) c) Các suất sinh lời hai dự án có ñộc lập không? (Gợi ý: E(XY) =E(X)E(Y)?) Lưu ý E(X Y) = ∑ ∑ X Y p( X Y ) i j i j i =1 j =1 2.4 Có 50 cặp vợ chồng, tuổi (tính năm) người vợ X chồng Y ñược xếp thành nhóm bảng sau với khoảng nhóm 10 năm, tần số nhóm khác ñược trình bày phần Bảng Các giá trị X Y giá trị nhóm Damodar N Gujarati 13 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng X Y 20 30 40 50 60 70 Tổng 20 30 40 11 10 15 14 50 60 70 2 Tổng 14 15 10 50 Như vậy, ñối với nhóm ñó tuổi người chồng nằm 35 45 tuổi người vợ 25 35, giá trị Y X (ñược tập trung vào) 40 30, tần số a) Xác ñịnh trung bình dãy, có nghĩa là, hàng ngang cột dọc b) ðặt biến X hoành ñộ biến Y tung ñộ, vẽ ñồ thị cho trung bình dãy (hay có ñiều kiện) ñã tính ñược câu Các Anh / Chị sử dụng ký hiệu + cho trung bình cột dọc ⊕ cho trung bình hàng ngang c) Chúng ta ñưa nhận xét quan hệ X Y? d) Các trung bình cột dọc hàng ngang có ñiều kiện có nằm ñường tương ñối thẳng không? Vẽ ñường hồi qui 2.5 Bảng ñây cung cấp kết ñịnh mức (X) lãi suất hoàn vốn (yield to maturity) Y (%) 50 trái phiếu, ñó việc ñịnh mức ñược ñánh giá theo cấp: X=1 (Bbb), X=2 (Bb), X=3 (B) Theo ñịnh mức Công ty Per Standard & Poor, Bbb, Bb B tất ñều trái phiếu chất lượng trung bình, Bb ñược ñánh giá cao B Bbb lại ñược ñánh giá cao Bb X Y 8.5 11.5 17.5 Tổng cộng Bbb 13 15 Bb 14 20 B 13 15 Tổng cộng 18 18 14 50 a) Chuyển Bảng thành bảng cung cấp phân phối xác suất liên kết, p(X,Y), ví dụ, p(X=1, Y=8.5) = 13/50 = 26 b) Tính p(Y X =1), p(Y X =2), p(Y X =3) c) Tính E(Y X =1), E(Y X =2), E(Y X =3) d) Các kết suất sinh lợi câu (c) có phù hợp với kỳ vọng tiên nghiệm mối quan hệ ñịnh mức trái phiếu lãi suất hoàn vốn không? 2.6∗ ∗ Hàm mật ñộ (density) liên kết hai biến ngẫu nhiên tiên tục X Y sau f(X,Y) = - X - Y ≤ X ≤ 1; 0≤ Y ≤ =0 trường hợp khác Tùy ý Damodar N Gujarati 14 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi a) b) c) d) Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright Tính hàm mật ñộ biên, f(X) f(Y) Tính hàm mật ñộ có ñiều kiện f(X Y) f(Y X) Tính E(X) E(Y) Tính E(X Y = 0.4) 2.7 Xem xét liệu ñây Lương trung vị nhà kinh tế học theo nhóm kinh nghiệm tuổi tác chọn lọc, sổ sách quốc gia, 1966 (ngàn ñôla) Số năm kinh nghiệm chuyên môn Tuổi 0-2 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74† # 7.5 9.0 9.0 2-4 5-9 9.1 9.5 10.0 9.6 10.0 11.0 11.7 11.0 10-14 15-19 12.6 13.2 13.0 12.0 11.3 15.0 15.5 15.0 13.3 20-24 17.0 17.0 15 13.8 25-29 30-34 20.0 18.2 16.0 13.1 20.0 18.0 16.0 35-39 40-44* 19.0 17.2 13.8 18.8 17.0 12.5 Ghi chú: Các nhóm ñược chọn bao gồm tất người 25 người ñại diện trả lời hơn, họ báo cho biết kết hợp tuổi tác kinh nghiệm * Nhóm thực gồm có 40 # Nhóm thực gồm có 70 Nguồn: N Arnold Tolles and Emanuel Melichar, “Studies of the Structure of Economists’ Salaries and Income” (Các nghiên cứu Cấu trúc lượng Thu nhập Nhà kinh tế), American Economic Review, vol.57, no 5, pt.2, Suppl., December 1968, bảng H, trang 119 a) Các liệu cho ta thấy gì? b) Tuổi tác hay kinh nghiệm có quan hệ gần ñối với mức lương hay không? Làm Anh /Chị biết? c) Hãy vẽ hai hình riêng biệt, trình bày mức lương trung vị quan hệ với tuổi tác trình bày mức lương trung vị quan hệ với kinh nghiệm nghề nghiệp (tính năm) 2.8 Xem xét liệu ñây a) Dùng trục Y ñể biểu thị thu nhập tiền trung bình trục X ñể tượng trưng cho trình ñộ học vấn - năm trở xuống, 1-3 năm học trung học, năm trung học, 1-3 năm ñại học, năm ñại học năm ñại học trở lên - vẽ ñồ thị cho liệu nam nữ riêng biệt cho nhóm tuổi b) Anh / Chị rút ñược kết luận tổng quát gì? Tuổi giới tính Nam, tổng cộng 25 ñến 34 tuổi 35 ñến 44 tuổi Damodar N Gujarati Tổng cộng 34,886 27,743 37,958 Tiểu học, năm hay 19,188 15,887 18,379 ðại học Trung học Tổng cộng 27,131 23,255 28,205 1-3 năm 22,564 19,453 23,621 15 năm 28,043 24,038 28,927 Tổng cộng 43,217 33,003 45,819 1-3 năm 34,188 28,298 36,180 năm 44,554 35,534 47,401 năm hay 55,831 39,833 58,542 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright 45 ñến 54 tuổi 55 ñến 64 tuổi 65 tuổi trở lên 40,231 37,469 33,145 19,686 22,379 17,028 31,235 29,460 24,003 24,133 25,280 19,530 32,862 30,779 25,516 50,545 50,585 44,424 39,953 36,954 34,323 50,718 55,518 43,092 62,902 61,647 52,149 Nữ, tổng cộng 25 ñến 34 tuổi 35 ñến 44 tuổi 45 ñến 54 tuổi 55 ñến 64 tuổi 65 tuổi trở lên 22,768 21,337 24,453 23,429 21,388 19,194 13,322 11,832 13,714 13,490 13,941 * 18,469 16,673 19,344 19,500 18, 607 18,281 15,381 13,385 15,695 16,651 15,202 * 18,954 17,076 19,886 19,986 19,382 18,285 27,493 25,194 29,287 29,334 26,930 23,277 22,654 20,872 23,307 24,608 23,364 * 28,911 27,210 31,631 29,242 27,975 * 35,827 32,563 37,599 38,307 33,383 * *Các giá trị sở nhỏ ñể thỏa mãn tiêu chuẩn thống kê ñối với ñộ tin cậy số tính ñược Nguồn: Statistical Abstract of United States (Tóm Lược Thống Kê Mỹ), 1992, Bộ thương mại Mỹ, Bảng 713, trang 454 2.9 Xem xét bảng trang bên cạnh: a) Vẽ ñồ thị mức lương trung vị ba nhóm so với giá trị khoảng theo số lượng năm kinh nghiệm khác vẽ ñường hồi qui b) Những yếu tố giải thích cho khác biệt mức lương ba nhóm kinh tế gia? ðặc biệt nhà kinh tế có cử nhân kiếm ñược nhiều tiền ñồng nghiệp họ có tiến sĩ có 15 năm kinh nghiệm trở lên? Quan sát có ngụ ý cho thấy có tiến sĩ ích lợi hay không? Các mức lương trung vị nhà kinh tế học (ngàn ñôla) theo cấp ñại học, 1966 Năm kinh nghiệm Dưới 25-9 10-14 15-19 20-24 25-29 30-34 35-39 40-14* Tiến sĩ 9.8 10.0 11.5 13.0 15.0 16.2 18.0 17.9 16.9 17.5 Thạc sĩ 8.0 8.8 10.5 12.3 15.0 15.6 17.0 17.7 16.2 14.2 Cử nhân 9.0 8.9 10.6 13.0 15.6 17.0 20.0 20.0 20.5 22.0 *Số nhóm thực 40 Nguồn: N Arnold Tolles and Emanuel Melichar, "Studies of the Structure of Economists' Salaries and Income," America EconomicReview, vol 57, no 5, pt 2, Suppl., December 1968, bảng III-B-3,trang 92 2.10 Xem xét Bảng ñây: Số lượng nhà kinh tế học theo năm kinh nghiệm tuổi tác (chỉ nhà kinh tế học làm việc toàn thời gian chuyên nghiệp) Nhóm tuổi (năm) Damodar N Gujarati Số năm kinh nghiệm 0-2 25-9 10-14 16 15-19 20-24* Tổng cộng Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74Å 24 121 77 18 1 1 - 13 405 497 125 36 15 - 184 825 535 161 48 19 10 - 197 780 652 183 52 18 - Tổng cộng 250 1099 1787 1890 194 761 433 119 27 1550 Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng 235 751 784 612 382 206 27 38 710 1599 1653 1851 1431 980 670 400 214 28 2998 9574 *Số nhóm thực 20 hay nhiều Å Số nhóm thực 70 hay cao Source: Adapted from "The Structure of Economists' Employment and Salaries, 1964," American Economic Review, vol 55, no 4, December 1965, table VII, p 40 Bảng cho thấy tần số tuyệt ñối liên kết biến tuổi tác năm kinh nghiệm Dùng tần số tương ñối (chia tần số tuyệt ñối cho tổng số) làm số ño xác suất, thực yêu cầu sau: a) Tính phân phối xác suất liên kết tuổi tác năm kinh nghiệm b) Tính phân phối xác suất có ñiều kiện tuổi tác cho năm kinh nghiệm khác c) Tính phân phối xác suất có ñiều kiện năm kinh nghiệm cho mức tuổi tác khác d) Dùng ñiểm khoảng mức tuổi tác khoảng năm kinh nghiệm, tính trung bình có ñiều kiện kết phân phối câu (b) (c) e) Vẽ ñồ thị phân tán thích hợp thể trung bình có ñiều kiện khác f) Nếu liên kết trung bình có ñiều kiện câu (e), Anh / Chị thu ñược gì? g) Anh / Chị có nhận xét mối quan hệ năm kinh nghiệm tuổi tác? 2.11 Xem xét xem mô hình sau ñây có tuyến tính theo thông số hay biến hay không, hay có hai Mô hình số mô hình sau mô hình hồi qui tuyến tính? Từ mô tả Mô hình  1 a) Yi = β + β   + ui  Xi  b) Yi = β + β lnX i + ui c) lnYi = β + β X i + ui d) lnYi = lnβ + β lnX i + ui Nghịch ñảo Nửa logarít Nửa logarít nghịch Logarít hay logarít bội Logarít nghịch ñảo  1 e) lnYi = β − β   + ui  Xi  Chú ý: ln = logarít tự nhiên (có nghĩa là, log với số e); ui số hạng nhiễu ngẫu nhiên Chúng ta nghiên cứu mô hình chương 2.12 Những mô hình sau ñây có phải mô hình hồi qui tuyến tính không? Tại sao? Damodar N Gujarati 17 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng a) Yi = eβ + β X i + ui b) Yi = β + β X i + ui 1+ e  1 c) lnYi = β + β   + ui  Xi  d) Yi = β + ( 0.75 − β ) e − β ( X − ) + ui e) Yi = β + β 32 X i + ui 2.13 Nếu β = 0.8 (d) 2.12, mô hình có trở thành mô hình hồi qui tuyến tính không? Tại sao? 2.14 Xem xét mô hình không ngẫu nhiên Chúng có phải mô hình tuyến tính không, có nghĩa là, mô hình có tuyến tính theo thông số hay không? Nếu không, phép toán ñại số thích hợp chuyển chúng thành mô hình tuyến tính hay không? a) Yi = β + β Xi Xi b) Yi = c) Yi = + exp( − β − β X i ) β + β Xi 2.15 Một biến ngẫu nhiên rời rạc X có phân phối ñều tam giác (rời rạc) PDF có dạng sau: f(X) = 1/k với X = X1, X2, ,Xk [Xi ≠ Xj i≠ j ] a) Chứng minh ñối với phân phối E(X)= ∑ X i (1/ k ) phương sai σ 2X = ∑ X i − E ( X i ) • (1 / k ) ñó E(X)là giống [ ] b) Nếu X = 1,2, , k giá trị E(X) σ 2X bao nhiêu? 2.16 Bảng ñây cung cấp liệu ñiểm Kiểm tra Năng khiếu Học ñường (SAT) trung bình học sinh năm cuối lên ñại học 1967-1990 a) Dùng trục hoành cho năm trục tung cho ñiểm SAT ñể vẽ hai ñồ thị riêng biệt ñiểm toán ñiểm vấn ñáp cho nam nữ b) Chúng ta rút ñược kết luận gì? c) Khi ñã biết ñiểm vấn ñáp nam nữ , làm cách bạn tiên ñoán ñược ñiểm toán họ? d) Vẽ ñồ thị ñiểm SAT tổng cộng nữ so với ñiểm SAT tổng cộng nam Vẽ ñường hồi qui ñi qua ñiểm rời rạc Các Anh / Chị quan sát ñược gì? Damodar N Gujarati 18 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Các phương pháp ñịnh lượng Bài ñọc ðiểm Kiểm Tra Năng Khiếu Học ðường (SAT) Trung Bình Của Những Học Sinh Năm Cuối Sắp Lên ðại Học, 1967-1 990* Năm Nam Vấn ñáp Nữ 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 463 464 459 459 454 454 446 447 437 433 431 433 431 428 430 431 430 433 437 437 435 435 434 429 468 466 466 461 457 452 443 442 431 430 427 425 423 420 418 421 420 420 425 426 425 422 421 419 Tổng cộng Nam Toán Nữ 466 466 463 460 455 453 445 444 434 431 429 429 427 424 424 426 425 426 431 431 430 428 427 424 514 512 513 509 507 505 502 501 495 497 497 494 493 491 492 493 493 495 499 501 500 498 500 499 46 470 470 465 466 461 460 459 449 446 445 444 443 443 443 443 445 449 452 451 453 455 454 455 Tổng cộng 492 492 191 488 488 484 431 480 472 472 470 468 467 466 466 467 468 471 475 475 476 476 476 476 * Dữ liệu cho 1967-1971 số ước lượng Source: The College Board The NewYork Times, Aug 28, 1990, p.B-5 2.17 ðường hồi quy hình 1.3 Phần Giới thiệu có ñường PRF hay SRF? Tại sao? Các Anh / Chị giải thích ñiểm rời rạc nằm quanh ñường hồi quy nào? Ngoài GDP, có yếu tố nào, hay biến nào, ñịnh ñến chi tiêu tiêu dùng cá nhân? Damodar N Gujarati 19 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi [...]... Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản tổng thể từ các thông tin ñược cung cấp từ mẫu ñang xem xét Một giá trị bằng số nhất ñịnh thu ñược bằng cách áp dụng hàm ước lượng ñược gọi là một giá trị ước lượng.11 Cũng giống như chúng ta ñã biểu diễn PRF qua hai biểu thức tương ñương (2.2.2) và (2.4.2), chúng ta có thể... hiện như thế nào ở chương 3 BÀI TẬP 2.1 Bảng dưới ñây cho ta các suất sinh lời dự ñoán trong một năm của một dự án ñầu tư và các xác suất liên quan của chúng Suất sinh lời X, % -20 -10 10 Damodar N Gujarati Xác suất pi 0.10 0.15 0.45 12 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản Các phương pháp ñịnh lượng Bài ñọc... Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản 1 235 751 784 612 382 206 27 38 710 1599 1653 1851 1431 980 670 400 214 28 2998 9574 *Số nhóm thực là 20 hay nhiều hơn Å Số nhóm thực là 70 hay cao hơn Source: Adapted from "The Structure of Economists' Employment and Salaries, 1964," American Economic Review, vol 55, no 4, December 1965, table VII, p 40 Bảng ở trên... suất hoàn vốn không? 2.6∗ ∗ Hàm mật ñộ (density) liên kết của hai biến ngẫu nhiên tiên tục X và Y là như sau f(X,Y) = 4 - X - Y nếu 0 ≤ X ≤ 1; 0≤ Y ≤ 1 =0 những trường hợp khác Tùy ý Damodar N Gujarati 14 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi a) b) c) d) Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy... ñịnh lượng Bài ñọc Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản Hình 2.4 Sample and population regression lines Câu trả lời cho vấn ñề này sẽ chiếm nhiều công sức giải thích trong chương 3 Ở ñây chúng ta lưu ý rằng chúng ta có thể phát triển những phương pháp có thể chỉ cho chúng ta làm cách nào ñể thiết lập SRF ñể thể hiện PRF một cách trung thực nhất Quan niệm... Fulbright Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản X Y 20 30 40 50 60 70 Tổng 20 1 2 3 30 40 11 4 1 10 3 15 14 50 1 6 2 9 60 70 1 3 1 5 2 2 4 Tổng 1 14 15 10 7 3 50 Như vậy, ñối với nhóm trong ñó tuổi của người chồng nằm giữa 35 và 45 và tuổi của người vợ là giữa 25 và 35, các giá trị của Y và X lần lượt (ñược tập trung vào) là 40 và 30, và tần số là 4 a) Xác ñịnh... hình này ở chương 6 2.12 Những mô hình sau ñây có phải là những mô hình hồi qui tuyến tính không? Tại sao? Damodar N Gujarati 17 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp ñịnh lượng Bài ñọc Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản a) Yi = eβ 1 + β 2 X i + ui 1 b) Yi = β 1 + β 2 X i + ui 1+ e  1... 43,217 33,003 45,819 1-3 năm 34,188 28,298 36,180 4 năm 44,554 35,534 47,401 5 năm hay hơn 55,831 39,833 58,542 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản Các phương pháp ñịnh lượng Bài ñọc Chương trình Giảng dạy Kinh tế Fulbright 45 ñến 54 tuổi 55 ñến 64 tuổi 65 tuổi trở lên 40,231 37,469 33,145 19,686 22,379 17,028... ñiểm rời rạc này Các Anh / Chị quan sát ñược gì? Damodar N Gujarati 18 Biên dịch: Thạch Quân Hiệu ñính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Kinh tế lượng cơ sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng cơ bản Các phương pháp ñịnh lượng Bài ñọc ðiểm Kiểm Tra Năng Khiếu Học ðường (SAT) Trung Bình Của Những Học Sinh Năm Cuối Sắp Lên ðại Học, 1967-1 990* Năm Nam Vấn ñáp Nữ... ñược PRF là một ñiều lý thú 2.7 TÓM TẮT VÀ KẾT LUẬN 1 Khái niệm chính làm nền tảng cho phân tích hồi qui là khái niệm hàm hồi qui tổng thể (PRF) 2 Tập sách này ñề cập ñến PRF tuyến tính, có nghĩa là, những hồi qui tuyến tính theo các tham số chưa biết Chúng có thể tuyến tính hay có thể không tuyến tính theo các biến phụ thuộc hay biến hồi qui phụ thuộc Y và các biến ñộc lập hay (các) biến hồi qui ñộc

Ngày đăng: 27/05/2016, 15:44

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan