Biểu thức thứ hai là một ví dụ của mô hình hồi quy không tuyến tính (theo các thông số); chúng ta sẽ không bàn tới những mô hình như vậy trong tài liệu này. Trong hai cách giải thích về[r]
Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2012-2014 Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng CHƯƠNG PHÂN TÍCH HỒI QUY HAI BIẾN: MỘT SỐ Ý TƯỞNG CƠ BẢN Trong chương thảo luận khái niệm hồi quy cách tổng quát Trong chương tiếp cận vấn đề cách tương đối hệ thống Đặc biệt, chương ba chương giúp bạn đọc làm quen với lý thuyết làm tảng cho phân tích hồi quy đơn giản có được, gọi hồi quy hai biến Chúng ta xem xét trường hợp trước, không thiết khả thực tế nó, mà trình bày cho ý tưởng phân tích hồi quy cách đơn giản số ý tưởng minh họa biểu đồ hai chiều Hơn nữa, thấy, đứng nhiều phương diện trường hợp phân tích hồi quy bội tổng quát mở rộng hợp lý trường hợp hồi quy hai biến 2.1 MỘT VÍ DỤ GIẢ THIẾT Như Phần 1.2, phân tích hồi quy chủ yếu để ước lượng và/hay dự đốn trung bình (tổng thể) giá trị trung bình biến độc lập sở giá trị biết xác định (các) biến giải thích Để hiểu điều thực nào, xem xét ví dụ sau Giả thiết có quốc gia với tổng thể1 60 gia đình Giả sử quan tâm đến việc nghiên cứu mối quan hệ Y chi tiêu tiêu dùng hàng tuần gia đình X thu nhập khả dụng hàng tuần gia đình hay thu nhập sau đóng thuế Nói cách cụ thể giả định muốn dự đốn mức trung bình (tổng thể) chi tiêu tiêu dùng hàng tuần biết thu nhập hàng tuần gia đình Để thực điều này, giả sử chia 60 gia đình thành 10 nhóm có thu nhập tương đối xem xét chi tiêu tiêu dùng gia đình nhóm thu nhập Các liệu giả thiết nằm Bảng 2.1 (Với mục đích để thảo luận, giả định mức thu nhập đưa bảng 2.1 thật quan sát.) Bảng 2.1 giải thích sau: Ví dụ như, tương ứng với thu nhập hàng tuần 80 đơla, có năm gia đình có mức chi tiêu tiêu dùng hàng tuần khoảng 55 đến 75 đôla Tương tự, với X = 240$, có sáu gia đình có mức chi tiêu tiêu dùng hàng tuần nằm khoảng 137$ 189$ Nói cách khác, cột dọc (dãy đứng) Bảng 2.1 cho thấy phân phối chi tiêu tiêu dùng Y tương ứng với mức thu nhập X cố định: có nghĩa là, cho thấy phân phối có điều kiện Y phụ thuộc vào giá trị định X Lưu ý liệu Bảng 2.1 tiêu biểu cho tổng thể, dễ dàng tính tốn các xác suất có điều kiện Y, p(Y X), xác suất Y với điều kiện X sau.2 Ví dụ, với X= 80$, có giá trị Y: 55$, 60$, 65$, 70$, 75$ Do đó, với X=80, xác suất để có số chi tiêu tiêu dùng 1/5 Biểu thị ký hiệu toán Ý nghĩa thống kê thuật ngữ tổng thể giải thích phần phụ lục A Nói đơn giản, tập hợp tất kết xảy thí nghiệm hay đo đạc, ví dụ: tung đồng tiền nhiều lần hay ghi chép lại giá tất chứng khóan Thị trường Trao đổi Chứng khoán New York vào cuối ngày kinh doanh Giải thích ký hiệu: biểu thức p(Y X) hay p(Y Xi) viết tắt cho p(Y=Yj X=Xi), có nghĩa là, xác suất để biến ngẫu nhiên (rời rạc) Y có giá trị số Yj với điều kiện biến ngẫu nhiên (rời rạc) X có giá trị số Xi Tuy nhiên để tránh làm lộn xộn ký hiệu, dùng số i (chỉ số quan sát) cho hai biến Như vậy, p(Y X) hay p(Y Xi) thay cho p(Y=Yi X=Xi), có nghĩa là, xác suất để Y có giá trị Yi X lấy giá trị Xi, vấn đề gặp phải làm sáng tỏ phạm vi giá trị Y X Trong Bảng 2.1, X=$220, Y nhận giá trị khác nhau, X = $120, Y nhận giá trị Damodar N Gujarati Biên dịch: Thạch Quân Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng học p(Y= 55 X = 80) = 1/5 Tương tự, p(Y= 150 X = 260) = 1/7, v.v Xác suất có điều kiện liệu Bảng 2.1 trình bày Bảng 2.2 Bây phân phối xác suất có điều kiện của Y tính số trung bình giá trị trung bình nó, gọi trung bình có điều kiện hay kỳ vọng có điều kiện, thể E(Y X = Xi) diễn giải "giá trị kỳ vọng Y X nhận giá trị cụ thể Xi," để đơn giản hóa mặt ký hiệu viết lại thành sau: E(Y Xi) (Lưu ý: giá trị kỳ vọng đơn trung bình tổng thể hay giá trị trung bình) Đối với liệu giả thiết chúng ta, kỳ vọng có điều kiện tính tốn cách dễ dàng cách nhân giá trị Y tương ứng Bảng 2.1 với xác suất có điều kiện chúng Bảng 2.2 cộng kết lại Để minh họa, trung bình có điều kiện tức kỳ vọng có điều kiện Y với X = 80 55(1/5) + 60(1/5) + 65(1/5) + 70(1/5) + 75(1/5) = 65 Như kết trung bình có điều kiện đặt hàng cuối Bảng 2.2 BẢNG 2.1 Thu nhập gia đình hàng tuần X, $ X Y Chi tiêu tiêu dùng gia đình hàng tuần Y, $ Tổng cộng 80 55 60 65 70 75 _ _ 325 100 65 70 74 80 85 88 _ 462 120 79 84 90 94 98 _ _ 445 140 102 93 95 103 108 113 115 707 160 102 107 110 116 118 125 _ 678 180 110 115 120 130 135 140 _ 750 200 120 136 140 144 145 _ _ 685 220 135 137 140 152 157 160 162 1043 240 137 145 155 165 175 189 _ 966 260 150 152 175 178 180 185 191 1211 Trước tiếp tục, việc xem xét liệu Bảng 2.1 đồ thị phân tán giúp cho ta nhiều điều bổ ích, hình 2.1 Đồ thị phân tán cho thấy phân phối có điều kiện Y ứng với giá trị khác X Mặc dù có biến đổi chi tiêu tiêu dùng gia đình, Hình 2.1 cho thấy cách rõ ràng chi tiêu tiêu dùng mặt trung bình tăng thu nhập tăng Nói cách khác, đồ thị phân tán cho thấy giá trị trung bình (có điều kiện ) Y tăng X tăng Có thể nhận thấy quan sát cách sinh động tập trung vào điểm có kích thước lớn thể trung bình có điều kiện khác Y Đồ thị phân tán cho thấy trung bình có điều kiện nằm hàng thẳng với độ dốc đồng biến.3 Đường thẳng gọi đường hồi quy tổng thể, gọi cách khái quát, đường cong hồi quy tổng thể Đơn giản hơn, đường thẳng hồi quy Y X Các bạn đọc cần nhớ liệu ta giả thiết Ở chúng tơi khơng gợi ý trung bình có điều kiện ln nằm đường thẳng; chúng nằm đường cong Damodar N Gujarati Biên dịch: Thạch Quân Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng BẢNG 2.2 Xác suất có Điều kiện p(Y Xi) liệu Bảng 2.1 p(Y Xi) X Xác suất có điều kiện p(Y Xi) Trung bình có điều kiện Y 80 1/5 1/5 1/5 1/5 1/5 _ _ 100 1/6 1/6 1/6 1/6 1/6 1/6 _ 120 1/5 1/5 1/5 1/5 1/5 _ _ 140 1/7 1/7 1/7 1/7 1/7 1/7 1/7 160 1/6 1/6 1/6 1/6 1/6 1/6 _ 180 1/6 1/6 1/6 1/6 1/6 1/6 _ 200 1/5 1/5 1/5 1/5 1/5 _ _ 220 1/7 1/7 1/7 1/7 1/7 1/7 1/7 240 1/6 1/6 1/6 1/6 1/6 1/6 _ 260 1/7 1/7 1/7 1/7 1/7 1/7 1/7 65 77 89 101 113 125 137 149 161 173 Như mặt hình học, đường cong hồi quy tổng thể đơn giản quỹ tích trung bình có điều kiện hay kỳ vọng có điều kiện biến số phụ thuộc giá trị xác định (các) biến giải thích Có thể vẽ đường hình 2.2, cho thấy Xi có tổng thể giá trị Y (được giả định có phân phối chuẩn lý chúng tơi giải thích sau) trung bình (có điều kiện ) tương ứng Và đường thẳng hay đường cong hồi quy ngang qua giá trị trung bình có điều kiện Với cách giải thích đường cong hồi quy bạn có lẽ cảm thấy bổ ích đọc lại định nghĩa hồi quy cho phần 1.2 Hình 2.1 Phân phối có điều kiện chi tiêu mức độ thu nhập khác (dữ liệu Bảng 2.1) Damodar N Gujarati Biên dịch: Thạch Quân Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng Hình 2.2 Đường hồi quy tổng thể (dữ liệu Bảng 2.10) 2.2 KHÁI NIỆM HÀM HỒI QUI TỔNG THỂ (PRF) Từ phần thảo luận trước đặc biệt từ hai hình 2.1 2.2, rõ ràng trung bình có điều kiện E(Y Xi) hàm Xi Thể ký hiệu: E(Y Xi) = f (Xi) (2.2.1) f (Xi) hàm biến giải thích Xi [Trong ví dụ giả thiết chúng ta, E(Y Xi) hàm tuyến tính Xi.] Phương trình (2.2.1) gọi hàm hồi quy tổng thể (hai biến) (PRF), hay cách ngắn gọn hồi quy tổng thể (PR) Phát biểu cách đơn giản là, trung bình (tổng thể) phân phối Y với điều kiện Xi có quan hệ hàm số với Xi Nói cách khác, cho biết giá trị trung bình Y biến đổi so với X Hàm f (Xi) có dạng nào? Câu hỏi quan trọng tình thực tế khơng có sẵn tồn tổng thể để xem xét Do đó, dạng hàm PRF vấn đề thực nghiệm, trường hợp cụ thể lý thuyết giúp cho ta mơt vài điều Ví dụ, nhà kinh tế học giả thiết chi tiêu tiêu dùng có quan hệ tuyến tính với thu nhập Như vậy, giả thiết gần giả định PRF E(Y Xi) hàm tuyến tính Xi, giả dụ thuộc loại E(Y Xi) = i + 2Xi (2.2.2) 1 2 thơng số khơng biết không thay đổi gọi hệ số hồi quy; 1 2 gọi hệ số tung độ gốc hệ số độ dốc Phương trình (2.2.2) gọi hàm hồi quy tổng thể tuyến tính Một số biểu thức thay dùng tài liệu mơ hình hồi quy tổng thể tuyến tính hay phương trình hồi quy tổng thể tuyến tính Trong phần sau, thuật ngữ hồi quy, phương trình hồi quy, mơ hình hồi quy dùng với nghĩa Khi phân tích hồi quy mối quan tâm để dự đoán PRF (2.2.2), có nghĩa là, dự đốn giá trị khơng biết 1 2 sở quan sát Y X Vấn đề nghiên cứu chi tiết Chương Damodar N Gujarati Biên dịch: Thạch Qn Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright 2.3 Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng Ý NGHĨA CỦA THUẬT NGỮ “TUYẾN TÍNH” Bởi tài liệu quan tâm chủ yếu đến mơ hình tuyến tính (2.2.2), điều cần thiết phải biết thuật ngữ "tuyến tính" thật có ý nghĩa gì, hiểu từ theo hai cách khác Sự tuyến tính theo Biến số Ý nghĩa có lẽ “tự nhiên” tuyến tính kỳ vọng có điều kiện Y hàm tuyến tính Xi, ví dụ (2.2.2).4 Về mặt hình học, đường cong tuyến tính trường hợp đường thẳng Theo cách giải thích này, hàm tuyến tính E(Y Xi) = 1 + 2Xi2 khơng phải hàm tuyến tính biến số X xuất với số mũ hay lũy thừa Sự tuyến tính theo Thơng số Cách giải thích thứ hai tuyến tính kỳ vọng có điều kiện Y , E(Y Xi), hàm tuyến tính theo thơng số, ; tuyến tính khơng tuyến tính theo biến X.5 Theo cách giải thích này, E(Y Xi) = 1 + 2Xi2 mô hình tuyến tính E(Y Xi) = 1 + Xi khơng phải Biểu thức thứ hai ví dụ mơ hình hồi quy khơng tuyến tính (theo thơng số); khơng bàn tới mơ tài liệu Trong hai cách giải thích tuyến tính, tuyến tính theo thơng số có liên quan đến phát triển lý thuyết hồi quy Do đó, từ trở đi, thuật ngữ hồi quy "tuyến tính" ln có nghĩa hồi quy tuyến tính theo thơng số, , (có nghĩa là, thơng số có lũy thừa mà thơi); có tuyến tính khơng tuyến tính theo biến giải thích, tức giá trị X Điều trình bày cách sơ đồ hóa Bảng 2.3 Như vậy, E(Y Xi) = 1 + 2Xi tuyến tính theo thông số theo biến số, LRM, E(Y Xi) = 1 + 2Xi2 vậy, tuyến tính theo thơng số khơng tuyến tính theo biến số X BẢNG 2.3 Các Mơ hình Hồi quy Tuyến tính Mơ hình tuyến tính theo thơng số ? Mơ hình tuyến tính theo biến số ? Phải LRM NLRM Phải Không phải Không phải LRM NLRM Chú ý: LRM = mơ hình hồi quy tuyến tính NLRM = mơ hình hồi quy khơng tuyến tính Hàm Y = f(x) coi tuyến tính theo X X xuất với lũy thừa hay số mà thơi (có nghĩa số hạng X2, X v.v loại bỏ) không nhân hay chia với biến khác (ví dụ, X *Z hay X/Z, Z biến khác) Nếu Y phụ thuộc vào X, cách khác để nói Y có quan hệ tuyến tính với X tỉ lệ thay đổi Y so với X (có nghĩa độ dốc, hay đạo hàm, Y so với X, dY/dX) không phụ thuộc vào giá trị X Như vậy, Y=4X, dY/dX=4, tức kết không phụ thuộc vào giá trị X Nhưng Y=4X2, dY/dX =8X, tức có phụ thuộc vào giá trị X Do hàm khơng tuyến tính theo X Một hàm gọi tuyến tính theo thơng số , ví dụ 1, 1 xuất với lũy thừa không nhân hay chia thơng số khác (ví dụ 12, 2/1, v.v.) Damodar N Gujarati Biên dịch: Thạch Qn Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright 2.4 Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng ĐẶC TRƯNG NGẪU NHIÊN CỦA PRF Từ hình 2.1 ta thấy rõ thu nhập gia đình tăng, chi tiêu tiêu dùng gia đình mặt trung bình tăng theo Nhưng cịn chi tiêu tiêu dùng gia đình so với mức thu nhập (khơng đổi) sao? Từ hình 2.1 Bảng 2.1 ta thấy rõ chi tiêu tiêu dùng gia đình khơng thiết phải tăng mức thu nhập tăng Ví dụ, Bảng 2.1 quan sát thấy tương ứng với mức thu nhập 100 đơla có gia đình với mức chi tiêu tiêu dùng 65 đôla thấp mức chi tiêu tiêu dùng hai gia đình mà mức thu nhập hàng tuần có 80 đơla Nhưng lưu ý mức chi tiêu tiêu dùng trung bình gia đình với thu nhập hàng tuần 100 đơla lớn mức chi tiêu tiêu dùng trung bình gia đình có mức thu nhập hàng tuần 80 đôla (77 đôla so với 65 đôla) Như vậy, nói mối tương quan mức chi tiêu tiêu dùng gia đình cá thể mức thu nhập định? Từ hình 2.1 thấy với mức thu nhập Xi, mức chi tiêu tiêu dùng gia đình cá thể nằm xung quanh chi tiêu trung bình tất gia đình Xi, có nghĩa xung quanh kỳ vọng có điều kiện Do đó, diễn đạt độ lệch Yi xung quanh giá trị kỳ vọng sau: ui = Yi - E(Y Xi) hay Yi = E(Y Xi) + ui (2.4.1) độ lệch ui biến số ngẫu nhiên khơng thể quan sát có giá trị âm dương Diễn đạt thuật ngữ chuyên môn, ui gọi số hạng nhiễu ngẫu nhiên hay số hạng sai số ngẫu nhiên Chúng ta giải thích (2.4.1) nào? Chúng ta nói chi tiêu gia đình cá thể, biết mức thu nhập nó, thể tổng hai thành tố, (1) E(Y Xi), đơn giản chi tiêu tiêu dùng trung bình tất gia đình có mức thu nhập Thành tố gọi thành tố tất định hay hệ thống, (2) ui, thành tố ngẫu nhiên hay khơng hệ thống Chúng ta nhanh chóng xem xét chất số hạng nhiễu ngẫu nhiên, tạm thời giả định số hạng thay hay đại diện cho tất biến số ta bỏ ngồi hay bỏ sót mà ảnh hưởng đến Y không (hay không thể) đưa vào mơ hình hồi quy Nếu E(Y Xi) giả định tuyến tính theo Xi , (2.2.2), phương trình (2.4.1) biểu thị sau: Yi = E(Y Xi) + ui = 1 + 2Xi + ui (2.4.2) Phương trình (2.4.2) giả định chi tiêu tiêu dùng gia đình có quan hệ tuyến tính thu nhập cộng với số hạng nhiễu Như vậy, chi tiêu tiêu dùng gia đình, với X = 80$ (xem Bảng 2.1), biểu thị sau Y = 55 = 1 + 2(80) + u1 Y2 = 60 = 1 + 2(80) + u2 Y3 = 65 = 1 + 2(80) + u3 (2.4.3) Y4 = 70 = 1 + 2(80) + u4 Y5 = 75 = 1 + 2(80) + u5 Bây lấy giá trị kỳ vọng (2.4.2) hai vế, Damodar N Gujarati Biên dịch: Thạch Qn Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng E(Yi Xi) = E[E(Y Xi)] + E(ui Xi) = E(Y Xi) + E(ui Xi) (2.4.4) ta vận dụng đặc tính giá trị kỳ vọng số số Lưu ý cẩn thận (2.4.4) lấy giá trị kỳ vọng có điều kiện, phụ thuộc vào giá trị X cho Bởi E(Yi Xi) E(Y Xi), phương trình (2.4.4) cho thấy E(ui Xi) = (2.4.5) Như vậy, giả định cho đường hồi quy ngang qua giá trị trung bình có điều kiện Y (xem hình 2.2) có nghĩa giá trị trung bình có điều kiện ui (phụ thuộc vào giá trị X) zero Từ lý luận thấy rõ ràng (2.2.2) (2.4.2) hình thức tương đương E(ui Xi) = 0.7 Nhưng đặc trưng ngẫu nhiên (2.4.2) có ưu điểm chỗ cho thấy cách rõ ràng có biến số khác ngồi thu nhập ảnh hưởng đến chi tiêu tiêu dùng khơng thể giải thích cách đầy đủ chi tiêu tiêu dùng gia đình (những) biến số nằm mơ hình hồi quy 2.5 Ý NGHĨA CỦA SỐ HẠNG NHIỄU NGẪU NHIÊN Như lưu ý Phần 2.4, số hạng nhiễu ui số hạng thay cho tất biến số bị bỏ khỏi mơ hình tất biến số tập hợp lại có ảnh hưởng đến Y Câu hỏi đặt là: Tại không đưa thẳng biến vào mơ hình cách cơng khai? Nói cách khác, khơng phát triển mơ hình hồi quy bội với nhiều biến tốt? Có nhiều lý Sự mơ hồ lý thuyết: Lý thuyết định hành vi Y, có thể, thường là, khơng hồn chỉnh Chúng ta biết chắn thu nhập hàng tuần X ảnh hưởng đến chi tiêu tiêu dùng hàng tuần Y, khơng biết biến khác ảnh hưởng đến Y Do đó, ui sử dụng làm biến thay cho tất biến bị loại bỏ hay bỏ khỏi mơ hình Dữ liệu khơng có sẵn: Ngay biết số biến bị loại bỏ biến xem xét đến hồi quy bội thay vào hồi quy đơn, chưa có thông tin định lượng biến Một kinh nghiệm thường gặp phân tích thực nghiệm liệu lý tưởng mà muốn có thơng thường lại khơng có Ví dụ, ngun tắc đưa giàu có gia đình vào làm biến giải thích thêm với biến thu nhập để giải thích chi tiêu tiêu dùng gia đình Nhưng khơng may thơng tin giàu có gia đình thơng thường khơng có Do buộc phải loại bỏ biến giàu có khỏi mơ hình có tầm quan trọng lý thuyết lớn cần thiết để giải thích chi tiêu tiêu dùng Các biến cốt lõi (core) biến ngoại vi (peripheral): Giả định ví dụ thu nhậpchi tiêu chúng ta, thu nhập X1 ra, số gia đình X2, giới tính X3, tơn giáo X4, giáo dục X5, khu vực địa lý X6 ảnh hưởng đến chi tiêu tiêu dùng Nhưng hoàn toàn có Xem Phụ lục A phần thảo luận đặc tính tốn tử kỳ vọng E Chú ý E(Y Xi), giá trị Xi không đổi, số Sự thật là, phương pháp bình phương tối thiểu phát triển chương 3, giả định cách rõ ràng E(ui Xi) = Xem Phần 2.3 Damodar N Gujarati Biên dịch: Thạch Qn Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng thể ảnh hưởng chung tất hay vài biến nhỏ chí khơng hệ thống ngẫu nhiên đến mức xét phương diện thực tế lý chi phí việc đưa chúng vào mơ hình cách rõ ràng khơng có ích lợi Chúng ta hy vọng ảnh hưởng kết hợp chung chúng xử lý biến ngẫu nhiên ui.8 Bản chất ngẫu nhiên hành vi người: Ngay thành công việc đưa tất biến liên quan vào mơ hình, chắn số "ngẫu nhiên" thuộc chất cá thể Y mà khơng thể giải thích có cố gắng đến Các biến nhiễu, biến số u, thể chất ngẫu nhiên Các biến thay kém: Mặc dù mơ hình hồi quy cổ điển (sẽ phát triển chương 5) giả định biến Y X tính tốn cách xác, thực tế liệu khơng xác sai số tính tốn Ví dụ xem lý thuyết tiếng Milton Friedman hàm chi tiêu.9 Ông xem tiêu thụ thường xuyên (Yp) hàm thu nhập thường xuyên (Xp) Nhưng liệu biến số trực tiếp quan sát được, thực tế dùng biến thay thế, ví dụ chi tiêu thời (Y) thu nhập thời (X), biến mà quan sát Bởi Y X quan sát khơng tương đương với Yp Xp, ta gặp phải vấn đề sai sót tính tốn Như số hạng nhiễu u trường hợp cịn tượng trưng cho sai sót tính tốn Như thấy chương sau, có sai sót tính tốn, chúng có tác động nghiêm trọng việc tính tốn hệ số hồi quy Nguyên tắc chi li: Tuân theo nguyên tắc Lưỡi dao Occam,10 chúng tơi muốn giữ cho mơ hình hồi quy đơn giản tốt Nếu giải thích hành vi Y "một cách đầy đủ" hai hay ba biến giải thích lý thuyết khơng đủ mạnh ta thấy đưa biến khác vào, đưa thêm biến vào? Hãy để ui biểu thị tất biến khác Dĩ nhiên, không nên loại bỏ biến quan trọng liên quan nhằm để giữ cho mơ hình đơn giản Dạng hàm sai: Ngay mặt lý thuyết có biến để giải thích cho tượng thu liệu biến này, thông thường dạng quan hệ hàm số biến hồi quy phụ thuộc biến hồi quy độc lập Có tiêu tiêu dùng hàm (theo biến số) tuyến tính thu nhập hàm khơng tuyến tính (theo biến số)? Nếu trường hợp đầu, Yi = 1 + 2Xi + ui quan hệ hàm số thích hợp Y X, trường hợp sau, Yi = 1 + 2Xi + 2Xi2 + ui dạng hàm đúng.Trong mơ hình hai biến suy xét dạng hàm mối quan hệ từ đồ thị phân tán Nhưng mơ hình hồi quy bội, khơng dễ dàng xác định dạng hàm thích hợp, tưởng tượng đồ thị phân tán khơng gian đa chiều Vì tất lý này, số hạng nhiễu ui đóng vai trị vơ quan trọng phân tích hồi quy, thấy điều tiếp tục Một khó khăn biến giới tính, giáo dục, tơn giáo v.v khó định lượng Milton Friedman, A Theory of the Consumption Function ( Một lý thuyết hàm tiêu dùng) , Princeton University Press, Princeton, N.J., 1957 10 " Nên giữ cho diễn tả đơn giản tốt tỏ khơng thoả đáng thơi," The World of Mathematics ( Thế giới toán học) , tập 2, J R Newman, Simon & Schuster, New York, 1956, trang 1247, hay "Không nên nhân đối tượng vượt mức cần thiết," Donald F Morrison, Applied Linear Sattistical Methods, Prentice Hall, Englewood Cliffs, N.J., 1983, trang 58 Damodar N Gujarati Biên dịch: Thạch Quân Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright 2.6 Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng HÀM HỒI QUI MẪU (SRF) Cho tới cách giới hạn thảo luận vào tổng thể giá trị Y tương ứng với giá trị không đổi X, cố tình tránh khơng xem xét đến việc lấy mẫu (lưu ý liệu Bảng 2.1 tiêu biểu cho tổng thể, mẫu) Nhưng đến lúc phải đối diện với vấn đề lấy mẫu, hầu hết tình thực tế có mẫu giá trị Y tương ứng với số X khơng đổi Do đó, nhiệm vụ phải tính tốn PRF sở thông tin mẫu Bảng 2.4 Một mẫu ngẫu nhiên từ tổng thể Bảng 2.1 Y X 70 65 90 95 110 115 120 140 155 150 80 100 120 140 160 180 200 220 240 260 Để minh họa, giả vờ chưa biết tổng thể Bảng 2.1 thông tin có mẫu lựa chọn ngẫu nhiên giá trị Y tương ứng với X không đổi cho Bảng 2.4 Không giống Bảng 2.1, có giá trị Y tương ứng với giá trị X biết; Y (đã biết Xi) Bảng 2.4 chọn cách ngẫu nhiên từ Y tương tự tương ứng với Xi từ tổng thể Bảng 2.1 Vấn đề là: Từ mẫu Bảng 2.4 liệu tiên đốn chi tiêu tiêu dùng hàng tuần trung bình Y tổng thể tương ứng với X chọn? Nói cách khác, liệu tính PRF từ liệu mẫu không? Như bạn đọc chắn nghi vấn, khơng thể tính PRF "một cách xác" giao động việc lấy mẫu Để thấy điều này, giả sử lấy mẫu ngẫu nhiên khác từ tổng thể Bảng 2.1, trình bày Bảng 2.5 Vẽ đồ thị liệu Bảng 2.4 2.5, đạt đồ thị phân tán hình 2.3 Trong đồ thị phân tán hai đường hồi quy mẫu vẽ cho tương đối "thích hợp" với điểm rời rạc: SRF1 vẽ sở mẫu thứ nhất, SRF2 sở mẫu thứ hai Đường hai đường hồi quy thể đường hồi quy tổng thể "thực"? Nếu khơng xem hình 2.1, cho thể PR, khơng có cách hồn tồn chắn hai đường hồi quy hình 2.3 thể đường (đường cong) hồi quy tổng thể thực Đường hồi quy hình 2.3 gọi đường hồi quy mẫu Chúng xem thể đường hồi quy tổng thể, giao động việc lấy mẫu chúng gần đường PR thật Nhìn chung, thu N lần SRF khác cho N mẫu khác nhau, SRF có khả giống Damodar N Gujarati Biên dịch: Thạch Qn Hiệu đính: Cao Hào Thi Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch.3: Mơ hình hồi quy hai biến: Vấn đề ước lượng Hình 2.3 Đường hồi quy dựa hai mẫu khác Bảng 2.5 Một mẫu ngẫu nhiên khác từ tổng thể Bảng 2.1 Y 55 88 90 80 118 120 145 135 145 175 X 80 100 120 140 160 180 200 220 240 260 Giờ đây, tương tự đường PRF nằm đường hồi quy tổng thể, phát triển khái niệm hàm hồi quy mẫu (SRF) để thể đường hồi quy mẫu Biểu thức mẫu tương ứng với (2.2.2) viết thành Yi = 1 + 2 Xi (2.6.1) Y đọc "Y mũ" Yi = hàm ước lượng E(Y Xi) 1 = hàm ước lượng 1 2 = hàm ước lượng 2 Lưu ý hàm ước lượng, biết trị thống kê (mẫu), đơn giản quy tắc hay công thức hay phương pháp cho biết làm cách để tính tốn thơng số Damodar N Gujarati 10 Biên dịch: Thạch Quân Hiệu đính: Cao Hào Thi ... định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch .3: Mơ hình hồi quy hai biến: Vấn đề ước lượng Số năm kinh nghiệm chuyên môn Tuổi 0-2 2-4 5-9 1 0-1 4... Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch .3: Mơ hình hồi quy hai biến: Vấn đề ước. .. Chương trình Giảng dạy Kinh tế Fulbright Các phương pháp định lượng Bài đọc Kinh tế lượng sở - 3rd ed Ch 2: Phân tích hồi quy hai biến: Một số ý tưởng Ch .3: Mơ hình hồi quy hai biến: Vấn đề ước