Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 18 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
18
Dung lượng
159,61 KB
Nội dung
Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến CHƯƠNG Đa cộng tuyến Các biến giải thích xác định mô hình kinh tế lượng thường xuất phát từ lý thuyết hiểu biết hành vi cố gắng thiết kế mô hình, từ kinh nghiệm khứ Dữ liệu biến đặc biệt xuất phát từ thực nghiệm không kiểm soát thường tương quan với Điều đặc biệt biến chuỗi thời gian thường có xu hướng tiềm ẩn thông thường Ví dụ, dân số tổng sản phẩm quốc nội hai chuỗi liệu tương quan chặt lẫn Trong chương trước, phát biểu hệ số hồi qui biến cụ thể số đo tác động riêng phần biến này, nghóa tác động tất biến khác mô hình giữ mức cố định có giá trị biến thay đổi Tuy nhiên, hai biến giải thích tương quan chặt; đơn giản giữ biến không đổi thay đổi biến lại biến sau thay đổi biến đầu thay đổi Trong trường hợp này, thật khó tách biệt ảnh hưởng riêng phần biến đơn Cũng vậy, thay đổi mô hình cách loại bỏ thêm vào biến làm thay đổi kết cách nghiêm trọng, khiến cho việc diễn dịch ước lượng khó khăn Đây vấn đề đa cộng tuyến, vấn đề xuất biến giải thích có quan hệ gần tuyến tính Chương khảo sát hệ đa cộng tuyến phạm vi ước lượng thông số, khảo sát tính chất chúng kiểm định giả thuyết hệ Trước hết trình bày ví dụ vấn đề đa cộng tuyến phát sinh thực tế sau khảo sát vấn đề cách chi tiết 5.1 Các Ví Dụ Về Đa Cộng Tuyến Chúng trình bày hai ví dụ việc thêm vào biến nhạy làm thay đổi đáng kể kết Trước hết, kiểm tra lại ví dụ nhà Phần 4.5, ví dụ liên hệ số lượng nhà xây với số biến tổng hợp; ví dụ thứ hai, liên hệ chi tiêu tích lũy cho việc bảo trì xe với tuổi xe số dặm xe chạy VÍ DỤ 5.1 Đặt HOUSING số hộ (đơn vị hàng ngàn) có Hoa Kỳ năm t, POPt dân số Hoa Kỳ đơn vị tính hàng triệu, GNPt tổng sản phẩm quốc gia tính tỷ đô la năm 1982, INTRATE, tỷ lệ chấp nhà tính theo phần trăm Sử dụng tập tin DATA4-3 mô tả Phụ lục D, ba mô hình sau ước lượng: kết trình bày Bảng 5.1 (xem Bài thực hành máy tính Phần 5.1) Mô hình A: HOUSINGt = α1 + α2INTRATEt + α3POPt + u1t Mô hình B: HOUSINGt = β1 + β2INTRATEt + β3GNPt + u2t Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Mô hình C: Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyeán HOUSINGt = γ1 + γ2INTRATEt + γ3POPt + γ4GNPt + u3t Chúng ta kỳ vọng số hộ bị ảnh hưởng kích thước dân số lẫn mức thu nhập Vậy mà Mô hình C, có hai biến này, trị thống kê t thấp ý nghóa Tuy nhiên, có POP GNP đưa vào, hệ số tương ứng có ý nghóa Một kiểm định Wald việc loại bỏ POP GNP khỏi Mô hình C cho kết trị thống kê F 6,42, có ý nghóa mức phần trăm, cho thấy biến có ý nghóa cách liên kết biến riêng rẽ lại ý nghóa Vì vậy, phần kết luận vô lý Kết thứ hai là, hệ số POP GNP Mô hình C hoàn toàn khác hệ số Mô hình A B Tuy nhiên, hệ số INTRATE biến động Mặc dù trước nghó dân số thu nhập có mô hình, kết lại cho thấy biến có mặt đồng thời mô hình xuất thay đổi nghiêm trọng Điều dân số, tổng sản phẩm quốc lãi suất có tương quan cao Các hệ số tương quan cặp GNP, POP INTRATE r(GNP, POP) = 0,99 r(GNP, INTRATE) = 0,88 r(POP, INTRATE) = 0,91 Baûng 5.1 Các Ước Lượng Của Các Quan Hệ Nhà Ở Biến Hằng số INTRATE POP Mô hình A − 3812,93 Mô hình B 687,90 Mô hình C – 1315,75 -198,40 –169,66 –184,75 (−2,40) (1,80) (–3,87) (–3,87) 33,82 (-3,18) 14,90 (3,61) (0,41) GNP d.f −2 R MSE MAPE (–0,27) 0,91 0,52 (3,64) (0,54) 20 0,371 20 0,375 19 0,348 75,029 12,14 74,557 12,54 77,801 12,23 Ghi chú: MSE trung bình bình phương sai số dự báo ( = ^ ) MAPE trung bình trị tuyệt đối sai số phần σ trăm Các giá trị ngoặc trị thống kê t Vì vậy, tồn quan hệ tuyến tính gần hoàn hảo GNP POP, có quan hệ gần hoàn hảo với INTRATE Như trình bày sau này, thay đổi hệ số tuyến tính quan sát trị thống kê t kết trực tiếp tương quan chặt Có thể nhấn mạnh tương quan chặt biến phụ thuộc biến độc lập cho trước không không gây vấn đề mà thực tế tương quan mong đợi Chính mối quan hệ chặt, tuyến tính biến giải thích ảnh hưởng đến kết mô hình Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến VÍ DỤ 5.2 Đặt Et chi tiêu tích lũy thời điểm t cho việc bảo trì (không tính xăng dầu) xe cho trước, MILES, số dặm xe chạy, tính hàng ngàn dặm, AGE, tuổi xe tính tuần kể từ mua lần đầu Xem xét ba mô hình sau: Mô hình A: Mô hình B: Mô hình C: Et = α1 + α2AGEt + u1t Et = β1 + β2MILESt + w2t Et = γ1 + γ2AGEt + γ3MILESt + u3t Moät xe chạy nhiều cần nhiều chi phí bảo trì Tương tự, xe cũ chi phí bảo trì nhiều Cũng hai xe tuổi chạy nhiều cần nhiều chi phí bảo trì Vì vậy, kỳ vọng α2, β2, γ2 γ3 dương Bảng 5.2 trình bày hệ số ước lượng trị thống kê t (trong ngoặc) ba mô hình, dựa liệu thực trạm xe Toyota Dữ liệu tập tin DATA3-7 mô tả Phụ lục D (xem Bài thực hành máy tính Phần 5.2 để chứng minh kết này) Thật lý thú thấy hệ số MILES có giá trị dương Mô hình B, hệ số lại âm cách có ý nghóa Mô hình C Vì vậy, có đổi ngược nghiêm trọng dấu Hệ số AGE có thay đổi quan trọng Thứ hai, trị thống kê t AGE MILES Mô hình C thấp nhiều Ở vậy, nguyên nhân thay đổi có ý nghóa kết tương quan cao hai biến giải thích, trường hợp làAGE MILES, hệ số tương quan chúng 0,996 Bảng 5.2 Các mô hình chi tiêu cho xe Biến Mô hình A Hằng số − 626,24 (−5,98) AGE (−5,91) 7,35 Mô hình C 7,29 (0,06) 27,58 (22,16) (9,58) MILES d.f −2 R MSE MAPE Mô hình B −796,07 53,45 −151,15 (18,27) (−7,06) 55 0,897 55 0,856 54 0,946 135,861 227,9 190,941 278,2 72,010 47,3 Ghi chuù: MSE trung bình bình phương sai số dự báo ( = ^ ) MAPE trung bình trị tuyệt đối sai số phần σ trăm Các giá trị ngoặc trị thống kê t Từ ví dụ thấy tương quan cao biến giải thích khiến cho hệ số hồi qui trở nên ý nghóa làm đổi dấu chúng Đa cộng tuyến không giới hạn hai biến độc lập Tính chất có thể, thường xảy nhiều biến độc lập có mối quan hệ gần tuyến tính Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 5.2 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Đa Cộng Tuyến Chính Xác Nếu hai nhiều hai biến độc lập có quan hệ tuyến tính hai biến nhiều biến, có đa cộng tuyến xác (hoặc hoàn hảo) Trong trường hợp này, lời giải cho phương trình chuẩn rút từ nguyên tắc bình phương tối thiểu Điều minh họa với mô hình có hai biến độc lập, X2 X3, cộng số Mô hình nhö sau (5.1) yt = β2xt2 + β3xt3 + vt số hạng không đổi bị loại khỏi cách diễn tả biến sai biệt so với giá trị trung bình biến (xem Phần 4.A.1) Các phương trình chuẩn tương ứng sau (bỏ qua t nhoû): ^ ^ β2 ∑x22 + β3 ∑x2x3 = ∑yx2 (5.2) β2 ∑x2x3 + β3 ∑x32 = ∑yx3 (5.3) ^ ^ Trước hết xem xét trường hợp đơn giản đa cộng tuyến xác, với x3 = 2x2 Mặc dù người thắc mắc nhà nghiên cứu lại đưa biến x3 vào mô hình, vậy, thấy chương tiếp theo, tình xuất cách thiếu cân nhắc Thay x3 Phương trình (5.3), có ^ ^ β2 ∑x2(2x2) + β3 ∑x3(2x2) = ∑y(2x2) Chuùng ta dễ dàng thấy là, bỏ thừa số chung 2, phương trình giống Phương trình (5.2) Vì vậy, hai phương trình chuẩn không độc lập với nhau, giản lược thành phương trình Một phương trình đơn không đủ để có lời ^ ^ giải cho hai biến chưa biết β2 β3 Vì vậy, hệ số hồi qui trường hợp đa cộng tuyến xác Tổng quát hơn, giả sử x2 x3 hoàn toàn đa cộng tuyến với tương quan tuyến tính x3= ax2 + b Khi Phương trình (5.3) viết lại sau ^ hoaëc ^ β2 ∑x2x3 + β3 ∑x3x3 = ∑yx3 ^ ^ β2 ∑x2(ax2 + b) + β3 ∑x3(ax2 + b) = ∑y(ax2 + b) ^ ^ ^ ^ aβ2 ∑x22 + bβ2 ∑x2 + aβ3 ∑x2x3 + bβ3 ∑x3 = a∑yx2 + b∑y x2, x3 y tính từ giá trị trung bình chúng, có, từ Tính chất 2.A.4, ∑x2 = ∑x3 = ∑y = Do đó, phương trình rút gọn (sau đơn giản a) thành ^ ^ β2 ∑x22 + β3 ∑x2x3 = ∑yx2 Phương trình giống Phương trình chuẩn (5.2) Trong mô hình hồi qui bội số biến độc lập biểu diễn tổ hợp tuyến tính biến Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến độc lập khác, hệ số hồi qui tương ứng ước lượng Tuy nhiên, ước lượng tổ hợp tuyến tính thông số Nếu nhà nghiên cứu tình cờ hồi qui mô hình có đa cộng tuyến xác, hầu hết chương trình hồi qui báo lỗi dạng “ma trận suy biến” “vấn đề cộng tuyến xác” Khi điều xảy ra, nên loại nhiều biến khỏi mô hình Tuy nhiên, trường hợp thường gặp tình quan hệ gần tuyến tính (nhưng không xác) tồn Các hệ trường hợp xem xét sau 5.3 Gần Đa Cộng Tuyến Khi biến giải thích tương quan gần tuyến tính, phương trình chuẩn thường giải để có ước lượng Các câu hỏi đặt trường hợp (1) hệ việc bỏ qua tính đa cộng tuyến gì, (2) xác định tồn đa cộng tuyến nào, (3) biện pháp sẵn có để nhà nghiên cứu sử dụng nhằm tránh vấn đề này? Bây xem xét vấn đề Các Hệ Quả Của Việc Bỏ Qua Tính Đa Cộng Tuyến Một câu hỏi tự nhiên xuất đa cộng tuyến có làm hiệu lực định lý Gauss−Markov, định lý cho OLS tạo ước lượng không thiên lệch, tuyến tính tốt (BLUE) Chúng ta thấy từ phát biểu định lý Gauss−Markov (xem Phần 3.3) cần có Giả định 3.2 đến 3.7 để chứng minh định lý Một tương quan chặt biến giải thích không vi phạm giả định Do đó, ước lượng OLS BLUE; nghóa là, chúng không thiên lệch, quán hiệụ Cũng vậy, cộng tuyến cao tác động đến giả thiết 3.8 Do đó, phân phối trị thống kê t không bị ảnh hưởng Tiếp tục làm Phần 3.A.5, thấy ước lượng OLS thích hợp nhiều quán Các dự báo không thiên lệch khoảng tin cậy có hiệu lực Do kết kết trước bị ảnh hưởng đa cộng tuyến Mặc dù sai số chuẩn trị thống kê t hệ số hồi qui bị ảnh hưởng mặt trị số, kiểm định dựa giá trị có hiệu lực KHÔNG THIÊN LỆCH VÀ CÁC TÍNH CHẤT KHÁC Mặc dù đa cộng tuyến ảnh hưởng hệ số hồi qui riêng lẻ, tác động đến dự báo thường nghiêm trọng lại tác động có lợi Ví dụ, Bảng 5.1, sai số bình phương trung bình (MSE) thời đoạn mẫu giá trị dự báo sai số phần trăm tuyệt đối trung bình (MAPE) diện mô hình Lưu ý rằng, hệ số thay đổi lớn mô hình, MSE thay đổi lớn Các giá trị MSE MAPE trình bày Bảng 5.2 Thật thú vị Mô hình C có hệ số MILES ngược với hệ số Mô hình B, hoạt động tốt xét khía cạnh MSE MAPE so với hai mô hình lại Vì vậy, trường hợp này, diện đa cộng tuyến thực có lợi cho việc dự báo ẢNH HƯỞNG ĐẾN DỰ BÁO Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Từ thảo luận rõ ràng đa cộng tuyến không gây thiệt hại tính chất lý thuyết kiểm định thống kê Vậy lại quan tâm đến đa cộng tuyến? Ngay ta thấy ước lượng BLUE, sai số chuẩn thường cao hơn, khiến trị thống kê t thấp ý nghóa Đối với mô hình (5.1), phương trình sau rút từ Phụ lục 4.A (r tương quan X2 X3, S22 S33 định nghóa Phụ luïc 4.A) ^ σ2 (5.4) Var(β2) = S22 (1 − r2) ^ σ2 (5.5) Var(β3) = S33 (1 − r2) ^ ^ − σ2 r Cov(β2, β3) = (5.6) S22S33 (1 − r2) Giả sử r2 gần 1; nghóa là, r gần ±1 (gần đa cộng tuyến) Rõ ràng từ Phương trình ẢNH HƯỞNG ĐẾN SAI SỐ CHUẨN ^ ^ (5.4) (5.5) phương sai sai số chuẩn, β2 β3 lớn r2 gần Một phương sai lớn có nghóa độ xác trị thống kê t thấp, dẫn đến ý nghóa Điều giải thích sao, ví dụ đầu tiên, tìm thấy dân số GNP đưa vào, hệ số chúng trở nên ý nghóa Thứ hai, xem từ Phương trình (5.6) đồng phương sai hệ số hồi qui lớn, giá trị tuyệt đối, r gần +1 −1 Nếu ước lượng tương quan nhau, hệ số giải thích phần ảnh hưởng X2 X3 đến Y Nói cách khác, giữ X3 không đổi tăng X2, X3 có tương quan với X2, nên kết thay đổi Các kết phần thảo luận tóm tắt Tính chất 5.1 Tính chất 5.1 Các hệ việc bỏ qua tính đa cộng tuyến sau: a Nếu hai nhiều biến giải thích mô hình hồi qui bội có quan hệ tuyến tính cách xác, mô hình ước lượng b Nếu số biến giải thích có quan hệ gần tuyến tính, tham số ước lượng OLS (và dự báo vào chúng) BLUE MLE không bị thiên lệch, có hiệu quả, quán c Tác động tính chất gần đa cộng tuyến biến giải thích làm gia tăng sai số chuẩn hệ số hồi qui làm giảm trị thống kê t, làm cho hệ số ý nghóa (và chí ý nghóa) Tuy nhiên, kiểm định giả thuyết có hiệu lực d Đồng phương sai hệ số hồi qui cặp biến có tương quan cao cao, giá trị tuyệt đối, khó diễn dịch hệ số riêng lẻ e Tính đa cộng tuyến ảnh hưởng đến việc thực dự báo mô hình chí cải thiện dự báo Trong mô hình với vài biến, hội xuất tính đa cộng tuyến lớn việc diễn dịch kết khó khăn Tính đa cộng tuyến gây việc làm mức ý nghóa nhiều hệ số, phù hợp số hệ số lại tạo hệ số có ý nghóa Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Sự nguy hiểm tính đa cộng tuyến đề tài tranh cãi không nhỏ phản biện lại việc sử dụng không phân biệt biến giải thích Tầm quan trọng lý thuyết việc lập mô hình lần nên nhấn mạnh Có thể có lý thuyết phục mặt lý thuyết cho việc đưa vào biến tính đa cộng tuyến khiến cho hệ số bị ý nghóa Trong trường hợp này, biến cần trì mô hình tính chất đa cộng tuyến tồn SỰ VẮNG MẶT CỦA TÍNH ĐA CỘNG TUYẾN Để hoàn tất, xem xét trường hợp cực đoan khác, r = 0, có nghóa trường hợp X2 X3 tương quan (có nghóa tính đa cộng tuyến) ngược với tương quan hoàn toàn Trong trường hợp này, S23 = hai công thức thông thường trở thành sau (xem Phụ lục 5.A) Xin lưu ý công thức giống công thức thông thường Y hồi qui cách riêng biệt theo X2 X3 Đó chứng cho thấy S23 = 0, giá trị ^ β2, có từ việc có X2 X3 mô hình, đồng với giá trị có Y ^ hồi qui theo số hạng không đổi có X2 Một kết tương tự β3 Đồng phương sai hai hệ số hồi qui, có giá trị không, cho thấy tác động riêng phần hoàn toàn biến đưa vào tác động gián tiếp từ biến có khác Một cách lý tưởng, thích r phải tiến tới không, thực tế điều thường không xảy Nhận dạng Tính chất Đa cộng tuyến Trong tình thực tế, tính đa cộng tuyến thường xuất số dạng GIÁ TRỊ R2 CAO VỚI CÁC GIÁ TRỊ CỦA TRỊ THỐNG KÊ t THẤP Như thấy Bài tập 5.2, tìm thấy tình mà hệ số hồi qui ý nghóa (nghóa có giá trị t thấp) trị thống kê F kiểm định Wald lại có ý nghóa Tương tự, Ví dụ 5.1, giá trị F kiểm định Wald nhóm hệ số có ý nghóa cho dù giá trị t riêng lẻ ý nghóa Các tương quan cặp biến giải thích cao, giống Ví dụ 5.1 5.2 Nói chung thực hành tốt để đạt tương quan cặp biến mô hình hồi qui kiểm tra giá trị cao biến giải thích Xin lưu ý hệ số tương quan cao biến phụ thuộc biến độc lập dấu hiệu tính đa cộng tuyến Thực tương quan mong muốn NHỮNG GIÁ TRỊ CAO CHO CÁC HỆ SỐ TƯƠNG QUAN Mặc dù tương quan cao cặp biến độc lập điều kiện đủ cho tính đa cộng tuyến, điều kiện đảo lại không cần thiết phải Nói cách khác, tính đa cộng tuyến diện tương quan hai biến giải thích thể không cao Điều ba hay nhiều biến gần tuyến tính Tuy vậy, tương quan cặp không cao Kmenta (1986, trang 434) đưa ví dụ ba biến có liên hệ tuyến tính cách xác, CÁC HỆ SỐ HỒI QUI NHẠY VỚI ĐẶC TRƯNG Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến tương quan cặp không cao 0,5 Trong trường hợp vậy, chứng thật tính đa cộng tuyến quan sát cho thấy hệ số hồi qui bị thay đổi đáng kể (ngay dấu đảo ngược lại, Ví dụ 5.2) biến thêm vào bỏ Mặc dù kiểm định đề nghị, thủ tục đề cập thoáng qua chúng gây nhiều tranh cãi Do tính đa cộng tuyến vấn đề liệu tự thân mô hình, nhiều nhà kinh tế lượng lý luận kiểm định thông thường không vô nghóa chẳng thu thập (xem Maddala, 1977, trang 186) Farrar Glauber (1967) đề nghị nhóm kiểm định để nhận dạng tính nghiêm trọng tính chất đa cộng tuyến Các kiểm định bao gồm kiểm định Chi bình phương, kiểm định F, kiểm định t Kiểm định chi bình phương để xác định xem tính đa cộng tuyến nói chung có diện hay không Sau kiểm định F, để tìm xem có biến gây tính đa cộng tuyến, cuối kiểm định t để phát chất tính đa cộng tuyến Những kiểm định thiết lập dạng khái niệm có liên quan đến kiến thức đại số tuyến tính Những độc giả có quan tâm với kiến thức đại số ma trận muốn đọc báo tác giả Belsley, Kuh, Welsch (1980, chương 3) đề nghị thủ tục gồm hai bước để kiểm định tính đa cộng tuyến Bước thứ để tính toán “con số điều kiện” cho ma trận số liệu Các vấn đề cần quan tâm tính cộng tuyến số vượt 30 Trong bước hai, đại lượng đo lường “sự phân tán phương sai” sử dụng Phương pháp họ đòi hỏi hiểu biết đại số tuyến tính vượt phạm vi sách CÁC KIỂM ĐỊNH THÔNG THƯỜNG ĐỐI VỚI TÍNH ĐA CỘNG TUYẾN Các giải pháp Không có lời giải đơn lẻ lần loại bỏ tính đa cộng tuyến Việc xử lý vấn đề đòi hỏi suy xét phức tạp Tuy nhiên, có số phương pháp tổng quát định hữu ích cho việc xử lý tính đa cộng tuyến, phương pháp thảo luận nội dung sau Nếu nhà phân tích quan tâm đến việc diễn dịch hệ số riêng lẻ lại trọng nhiều vào việc dự báo, tính đa cộng tuyến vấn đề nghiêm trọng Người ta bỏ qua mà chịu hậu xấu đáng kể Một cách tương tự, có tương quan cao biến độc lập, hệ số hồi qui có ý nghóa có dấu giá trị có ý nghóa, người ta bận tâm vấn đề đa cộng tuyến Nếu hệ số có ý nghóa trường hợp có diện tính đa cộng tuyến, rõ ràng kết mạnh Cuối cùng, biến thuộc mô hình lý mặt lý thuyết, an toàn giữ biến lại có tính đa cộng tuyến SỰ BỎ QUA NHẸ NHÀNG Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Vì tính đa cộng tuyến mối quan hệ chặt chẽ biến giải thích, cách chắn để loại bỏ giảm bớt tác động tính đa cộng tuyến bỏ nhiều biến khỏi mô hình Như lưu ý nhiều ví dụ trước, thủ tục thường làm cải thiện sai số chuẩn hệ số lại làm cho biến không ý nghóa trước trở thành có ý nghóa, việc loại bỏ biến làm giảm tính đa cộng tuyến biến gây Mô hình B Bảng 5.1 chứng tỏ điểm Việc loại bỏ POP, biến có trị thống kê t thấp (không kể số hạng không đổi mà không bị loại bỏ nắm giữ tác động quân bình biến bị loại bỏ), làm cho GNP trở nên có ý nghóa làm tăng giá trị t hai hệ số khác Thủ tục đơn giản hóa mô hình dựa sở liệu, đề cập chương trước, cách hiệu để giảm thiểu tính đa cộng tuyến Các nhà khảo sát thường hay gộp nhiều biến vào mô hình sợ không gặp phải thiên lệch biến bị loại bỏ mô tả Phần 4.5 trường hợp vậy, việc loại bỏ biến có trị thống kê t thấp nói chung làm cải thiện mức ý nghóa biến lại Điều quan trọng xảy tình biến lại có khả nắm giữ tác động biến bị loại bỏ có liên quan chặt chẽ với chúng Người ta nhận thấy đơn giản hóa mô hình dựa liệu cốt lõi phương pháp mô hình hóa Hendry/LSE từ tổng quát-đến-đơn giản Tuy nhiên, có điểm nguy hiểm việc loại bỏ nhiều biến khỏi đặc trưng mô hình, việc dẫn đến thiên lệch ước lượng Nói chung thực tế thích hợp để xem xét tầm quan trọng mặt lý thuyết việc trì biến không ý nghóa trị số thống kê giá trị tuyệt đối giá trị p nhỏ 0,25 Các trị số thống kê lựa chọn mô hình thảo luận Chương nên hướng dẫn hữu ích công việc Tuy nhiên, xin nhớ hai biến giải thích có tương quan chặt chẽ bị loại khỏi mô hình, biến lại chịu tác động hai biến không tác động biến lại Điểm hữu ích cho việc xem xét thảo luận thiên lệch biến bị loại bỏ Phần 4.5 LOẠI BỎ CÁC BIẾN Trong nhiều tình huống, tái xác định mô hình làm giảm tính đa cộng tuyến Ví dụ diễn đạt biến theo kiểu tính đầu người đưa dân số vào biến giải thích Trong Ví dụ 5.1 chẳng hạn, biến phụ thuộc HOUSING/POP và, thay POP GNP cách riêng biệt, có GNP/POP GNP đầu người có tương quan với biến INTRATE biến GNP POP Mô hình ước lượng trở thành (xem Phần Thực hành máy tính 5.3) TÁI THIẾT LẬP MÔ HÌNH GNP HOUSING − 0,698 INTRATE = 2,079 + 0,936 POP POP (0,62) (2,55) (- 3,75) – R2 = 0,377 d.f = 20 r(GNP/POP, INTRATE) = 0,843 Mặc dù R2 có hiệu chỉnh cao Ví dụ 5.1, hai giá trị so sánh với biến phụ thuộc khác Tính đa cộng tuyến không bị loại bỏ mà làm giảm Ramu Ramanathan Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Do biến chuỗi thời gian có nhấn mạnh vào xu hướng cách đặc trưng, người ta kỳ vọng tính cộng tuyến cao chúng Một cách phổ biến để tránh điều hình thành mô hình khác biệt đầu tiên, nghóa sử dụng biến thay đổi từ thời đoạn sang thời đoạn khác Chẳng hạn, thay hình thành hàm tiêu thụ Ct = β1 + β2Ct-1 + β3Yt + β4Yt-1 + ut Trong tất biến giải thích có tương quan cao, đặt mối liên hệ thay đổi tiêu thụ với thay đổi thu nhập Từ thu Ct − Ct-1 = α1 + α2 (Yt − Yt-1) + vt Nên ý hai cách trình bày không tương đương và, cụ thể cách trình bày thứ giải thích mức độ tiêu thụ cách thứ hai diễn tả thay đổi tiêu thụ Người ta dùng lý thuyết để định ưu tiên xem biến phù hợp Nếu mục tiêu để dự báo chi phí cho tiêu dùng, so sánh dự báo thực sau sử dụng mô hình thứ hai để phát dự báo mức độ tiêu dùng cho thời đoạn Tất bước đòi hỏi suy nghó cân nhắc kỹ lưỡng Đôi mô hình tái thiết lập với kết hợp tuyến tính biến tương quan sử dụng thay từøng biến biến riêng biệt Một vấn đề xuất việc định trọng số cho kết hợp tuyến tính Phân tích thành phần sở cách để thể vấn đề (xem Judge et al., 1985) Phương pháp sử dụng thông tin bên thường áp dụng nghiên cứu ước lượng hàm nhu cầu Dữ liệu chuỗi thời gian thu nhập giá mặt hàng thường thể tương quan cao, mà làm cho việc ước lượng độ co giãn giá thu nhập trở nên khó khăn Một giải pháp cho vấn đề ước lượng độ co giãn thu nhập từ nghiên cứu chéo sau sử dụng thông tin mô hình chuỗi thời gian để ước lượng độ co giãn giá Độ co giãn giá ước lượng từ liệu chéo người tiêu dùng hoàn toàn khác mức thu nhập, họ phải chịu loại giá Do khác giá bán, yếu tố quan trọng đối việc ước lượng thành công độ co giãn giá (tham khảo phần thảo luận Giả thiết 3.2 Chương 3) Một vấn đề nghiêm trọng phương pháp độ co giãn thu nhập chéo độ co giãn thu nhập theo chuỗi thời gian đo lường thứ hoàn toàn khác Điểm Meyer Kuh thảo luận năm 1957 SỬ DỤNG THÔNG TIN BÊN NGOÀI Thủ tục để gia tăng kích thước mẫu đề xuất dựa sở cho việc gia tăng làm cải thiện độ xác ước lượng giảm thiểu yếu tố phản tác dụng tính đa cộng tuyến Điểm lưu ý phương trình (5.4) (5.5) kích thước mẫu tăng S22 S33 tăng Nếu giá trị r2, bao gồm mẫu mới, giảm xuống gần không đổi, phương sai giảm đáng kể giảm tác động tính đa cộng tuyến Tuy nhiên, r tăng nhiều việc tăng kích thước mẫu ích Hơn nữa, nhà khảo sát thu thập cụ thể tất liệu sẵn có (phụ thuộc vào ràng buộc ngân sách thời gian), việc thêm liệu không khả thi vấn đề thực tế TĂNG KÍCH THƯỚC MẪU Ramu Ramanathan 10 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến CÁC BIỆN PHÁP KHÁC Một số phương pháp đưa sở lý thuyết, hầu hết chúng không theo thể thức, không trí cho nhà kinh tế lượng mức độ hữu ích phương pháp Hai số kỹ thuật hồi qui sóng phân tích thành phần Các kỹ thuật không thảo luận chúng đòi hỏi kiến thức đại số tuyến tính thống kê toán học vượt phạm vi sách Đối với độc giả có tảng kiến thức trên, tìm thấy phương cách xử lý tính đa cộng tuyến hay sách Judge, Griffiths, Hill, Lee (1985) Còn có đọc tham khảo khác hữu ích liệt kê phần tài liệu tham khảo, số tài liệu đòi hỏi phải nắm vững kiến thức đại số ma trận phương pháp trình bày Chương11 5.4 Các ứng dụng Chi phí bảo trì ngành ô-tô Người ta thấy tác động tính đa cộng tuyến làm thay đổi hệ số hồi qui cách đáng kể Tuy nhiên, mối quan hệ gần tuyến tính biến độc lập đưa vào xem xét, khác biệt không lớn Chẳng hạn như, ví dụ Toyota, biến MILES hồi qui theo số biến AGE, có (xem Phần Thực hành máy tính 5.4) MILES = 4,191 + 0,134 AGE (8,74) (88,11) – Các trị thống kê t ngoặc đơn mức ý nghóa cao, giá trị R2 0,993, cho ta thấy ăn khớp gần hoàn hảo Nếu mối quan hệ thay Mô hình C Bảng 5.2, coù ^ E = 7,29 + 27,58 AGE – 151,15(4,191 + 0,134 AGE) = - 626,18 + 7,33 AGE số gần với giá trị Mô hình A Vì vậy, cho dù Mô hình C thể khác biệt nhiều so với Mô hình A, mối quan hệ hai biến độc lập MILES AGE đưa vào xem xét rõ ràng, hai mô hình gần với Tuy nhiên, thực tế, việc cố đạt tất quan hệ có sử dụng toàn chúng điều không tưởng Lời giải để nhận dạng biến thừa loại bỏ chúng khỏi mô hình Các Tỷ Lệ Mức Độ Nghèo Khó Và Các Yếu Tố Quyết Định Bảng Dữ liệu 4-6 có liệu tỷ lệ nghèo khó số yếu tố tác động đến tỷ lệ 58 địa hạt California Biến phụ thuộc lấy tên povrate xác định phần trăm gia đình có thu nhập mức nghèo khó Các biến độc lập xác định sau (xem thêm chi tiết Phụ lục D Phần Thực hành máy tính 5.5): urb = Phần trăm tổng dân số thành thị Ramu Ramanathan 11 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 famsize unemp highschl college Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Số người hộ gia đình Tỷ lệ phần trăm thất nghiệp Phần trăm dân số (25 tuổi trở lên) có trình độ học vấn bậc trung học Phần trăm dân số (25 tuổi trở lên) hoàn tất chương trình cao đẳng đại học trở lên medinc = Giá trị trung vị thu nhập gia đình tính theo đơn vị ngàn đô-la Bảng 5.3 có phần in từ máy tính có kèm thích để nghiên cứu Bảng 5.3 = = = = Phần in từ máy tính có thích cho Ứng dụng Phần 5.4 [Ma trận hệ số tương quan theo cặp trình bày Cột cuối số biến Vì vậy, tương quan biến #5 (highschl) biến #4 (unemp) - 0,109 Các giá trị đường chéo 1,000 tương quan biến Xin lưu ý hệ số tương quan cho thấy vài giá trị cao Như kỳ vọng, tỷ lệ trình độ bậc cao đẳng đại học có tương quan dương với trung vị thu nhập tương quan âm với tỷ lệ thất nghiệp Chúng ta kỳ vọng tương quan cho thấy xuất tính đa cộng tuyến biến có tác động đến kết hồi qui.] Các hệ số tương quan, sử dụng số quan sát – 58 3) famsize 4) unemp 5) highschl 6) college 0.350 0.110 0.211 - 0.358 1.000 0.485 - 0.508 - 0.300 1.000 - 0.109 - 0.757 1.000 - 0.358 1.000 7) medinc - 0.084 (2 - 0.035 (3 - 0.714 (4 - 0.280 (5 0.848 (6 1.000 (7 [Ước lượng mô hình tổng quát với tất biến giải thích.] 2) urb 1.000 (2 (3 (4 (5 (6 MODEL 1: OLS estimates using the 58 observations 1-58 Dependent variable: povrate VARIABLE 0) 2) 3) 4) 5) 6) 7) COEFFICIENT STDERROR T STAT 2Prob(t > |T|) const urb famsize unemp highschl college medinc 16.8176 -0.0187 6.0918 -0.0118 -0.1186 0.1711 -0.5360 8.5026 0.0148 1.8811 0.1195 0.0681 0.0982 0.0704 1.978 -1.270 3.238 -0.099 -1.741 1.743 -7.619 0.053350 0.210010 0.002116 0.921724 0.087742 0.087355 0.000000 Mean of dep var Error Sum of Sq (ESS) Unadjusted R-squared F-statistic (6 51) Durbin-Watson stat Ramu Ramanathan 9.903 146.0911 0.836 43.3875 1.904 S.D of dep variable Std Err of Resid (sgmahat) Adjusted R-squared p-value for F() First-order autocorr coeff 12 * *** * * *** 3.955 1.6925 0.817 0.000000 0.040 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến MODEL SELECTION STATISTICS SGMASQ HQ GCV 2.86453 3.53259 3.2577 AIC SCHWARZ RICE 3.20646 4.11172 3.32025 FPE SHIBATA 3.21025 3.1268 Excluding the constant p-value was highest for variable (uemp) Bảng 5.3 (tiếp theo) [Ta lưu ý biến urb unemp có giá trị p cao mức chấp nhận hợp lý biến bị loại khỏi mô hình đặc biệt lý thuyết lý để giữ chúng lại Nghiêm trọng hơn, ta lưu ý biến college có dấu dương không kỳ vọng, dấu dương Mọi yếu tố khác nhau, quốc gia có phần trăm dân số có trình độ đại học cao hơn, ta kỳ vọng tỷ lệ nghèo quốc gia thấp Như ta kỳ vọng dấu âm cho biến college, điều trái với ước lượng thực tế Sự đa cộng tuyến gây nên dấu “sai”? Bởi biến unemp không ý nghóa, với giá trị p 90%, ta loại bỏ cách an toàn mà không sợ ảnh hưởng kết quaû.] MODEL 2: OLS estimates using the 58 observations 1-58 Dependent variable: povrate VARIABLE STDERROR T STAT 2Prob(t > |T|) const urb famsize highschl college medinc 0) 2) 3) 5) 6) 7) COEFFICIENT 16.5654 -0.0184 6.0496 -0.1166 0.1746 -0.5343 8.0325 0.0142 1.8145 0.0646 0.0905 0.0677 2.062 -1.296 3.334 -1.805 1.929 -7.894 0.044192 0.200710 0.001583 0.076822 0.059138 0.000000 Mean of dep var Error Sum of Sq (ESS) Unadjusted R-squared F-statistic (5 52) Durbin-Watson stat 9.903 146.1190 0.836 53.0737 1.901 ** *** * * *** S.D of dep variable 3.955 Std Err of Resid (sgmahat) 1.6763 Adjusted R-squared 0.820 p-value for F() 0.000000 First-order autocorr coeff 0.041 MODEL SELECTION STATISTICS SGMASQ HQ GCV 2.80998 3.36659 3.13421 AIC SCHWARZ RICE 3.09837 3.83444 3.1765 FPE SHIBATA 3.10067 3.04053 Excluding the constant p-value was highest for variable (urb) Of the model selection statistics have improved [Không có thay đổi hệ số ước lượng độ lệch chuẩn Urb ý nghóa loại bỏ tiếp theo.] MODEL 3: OLS estimates using the 58 observations 1-58 Dependent variable: povrate VARIABLE Ramu Ramanathan COEFFICIENT STDERROR 13 T STAT 2Prob(t > |T|) Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 0) 3) 5) 6) 7) const famsize highschl college medinc Phương pháp phân tích Bài đọc 19.1721 5.4140 -0.1388 0.1953 -0.5523 7.8263 1.7581 0.0627 0.0897 0.0667 Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến 2.450 3.079 -2.214 2.178 -8.274 0.017634 0.003283 0.031161 0.033882 0.000000 ** *** ** ** *** Bảng 5.3 (tiếp theo) Mean of dep var Error Sum of Sq (ESS) Unadjusted R-squared F-statistic (4 53) Durbin-Watson stat 9.903 150.8385 0.831 65.0877 2.025 S.D of dep variable 3.955 Std Err of Resid (sgmahat) 1.6870 Adjusted R-squared 0.818 p-value for F() 0.000000 First-order autocorr coeff -0.025 MODEL SELECTION STATISTICS SGMASQ HQ GCV 2.84601 3.31139 3.1145 AIC SCHWARZ RICE 3.09003 3.69066 3.14247 FPE SHIBATA 3.09135 3.04905 Of the model selection statistics have improved [Bây tất hệ số có ý nghóa mức 5%, hệ số biến college có dấu sai Những hệ số khác thay đổi cách đáng kể Bởi trung vị thu nhập xác định phần trăm tốt nghiệp trung học đại học, loại bỏ biến khỏi mô hình có ý nghóa có hệ số có ý nghóa Hiệu ứng biến thể cách gián tiếp biến highscl college Tham khảo phần thảo luận phần 4.7, diễn giải hệ số hồi qui.] MODEL 4: OLS estimates using the 58 observations 1-58 Dependent variable: povrate VARIABLE 0) 3) 5) 6) COEFFICIENT STDERROR T STAT 2Prob(t > |T|) const famsize highschl college 53.2862 -3.9594 -0.4137 -0.4744 9.9879 2.0194 0.0798 0.0582 5.335 -1.961 -5.182 -8.151 0.000002 0.055081 0.000003 0.000000 Error Sum of Sq (ESS) Unadjusted R-squared F-statistic (3 54) 346.1406 0.612 28.3753 *** * *** *** Std Err of Resid (sgmahat) 2.5318 Adjusted R-squared 0.590 p-value for F() 0.000000 MODEL SELECTION STATISTICS SGMASQ HQ GCV 6.41001 7.24045 6.88483 AIC SCHWARZ RICE 6.85058 7.8966 6.92281 FPE SHIBATA 6.85208 6.79111 [Một điều đáng quan tâm biến college có dấu âm kỳ vọng có ý nghóa Sự thay đổi xảy đa cộng tuyến tồn biến medinc vài tất biến giải thích khác Tuy nhiên, có giảm đáng kể giá trị R từ 0,818 xuống 0,590 Ramu Ramanathan 14 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Ngoài ra, tất trị thống kê lựa chọn mô hình trở nên xấu Bởi dấu dương biến college nghóa mặt lý thuyết, ta không nên đặt biến medinc vào lại mô hình nhằm để tăng độ phù hợp có hiệu chỉnh để cải thiện tiêu lựa chọn Từ rõ thấy cần phải có xét đoán tốt kinh nghiệm đánh giá kết Dựa mù quáng đo lường cứng nhắc dẫn ta lạc lối Để chứng thực đa cộng tuyến đáng ngờ, ta liên kết biến medinc với yếu tố định nó.] Bảng 5.3 (tieáp theo) MODEL 5: OLS estimates using the 58 observations 1-58 Dependent variable: medinc VARIABLE STDERROR T STAT 2Prob(t > |T|) const famsize unemp highschl college 0) 3) 4) 5) 6) COEFFICIENT -44.9132 16.8193 -0.4677 0.3649 0.9921 15.3482 2.6613 0.2193 0.1222 0.1287 -2.926 6.320 -2.133 2.986 7.707 0.005042 0.000000 0.037586 0.004277 0.000000 Mean of dep var Error Sum of Sq (ESS) Unadjusted R-squared F-statistic (4 53) 35.338 589.6206 0.849 74.2331 *** *** ** *** *** S.D of dep variable 8.264 Std Err of Resid (sgmahat) 3.3354 Adjusted R-squared 0.837 p-value for F() 0.000000 MODEL SELECTION STATISTICS SGMASQ HQ GCV 11.1249 12.9441 12.1744 AIC SCHWARZ RICE 12.0788 14.4266 12.2838 FPE SHIBATA 12.084 11.9186 [Tất hệ số ý nghóa có dấu kỳ vọng Ngoài ra, bình phương R có hiệu chỉnh có giá trị cao, khẳng định đa cộng tuyến hẳn phải lý dấu dương không kỳ vọng biến college mô hình tỷ lệ nghèo.] Tóm tắt Nếu mối quan hệ tuyến tính đắn tồn hai hay nhiều biến giải thích, biến gọi đa cộng tuyến cách xác Trong tình vậy, hệ số hồi qui tương ứng với biến độc lập ước lượng cách Nếu vài biến giải thích gần đa cộng tuyến, ước lượng OLS không thiên lệch, quán, ước lượng không thiên lệch tuyến tính tốt (BLUE) Do đó, dự báo không thiên lệch quán Hơn nữa, tất kiểm định giả thuyết hiệu lực Hiệu ứng gần đa cộng tuyến tăng độ lệch chuẩn hệ số hồi qui giảm trị thống kê t chúng Điều có khuynh hướng làm cho hệ số ý nghóa đa cộng tuyến Do đó, nên ý rút suy luận không đưa kết luận biến ý nghóa nên bị loại bỏ Ramu Ramanathan 15 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Nếu hai biến gần đa cộng tuyến, đồng phương sai cặp hệ số hồi qui cao, hệ số thể phần qua hiệu ứng biến khác Có thể có dấu ngược thêm vào hay bỏ biến Điều làm cho việc diễn giải hệ số hồi qui riêng lẻ khó khăn Do vậy, hiệu ứng riêng phần biến đơn khó đo lường Nếu cặp biến độc lập không tương quan, hệ số hồi qui biến không thay đổi cho dù biến đưa vào mô hình hay không Đa cộng tuyến nhận dạng cách khảo sát dạng tương quan biến giải thích Vì biến chuỗi thời gian có chiều hướng phát triển nhau, mô hình dựa chúng thiên toán đa cộng tuyến mô hình chéo Nếu bỏ hay nhiều biến độc lập làm biến đổi mạnh kết quả, chắn đa cộng tuyến nguyên nhân Không có giải pháp để loại bỏ đa cộng tuyến Nếu trọng tâm dự báo, đa cộng tuyến thường làm ngơ khả dự báo thường không bị tác đôïng nhiều Nếu biến tương tự có mặt mô hình, khuyên nên loại bỏ biến thừa Các biến loại bỏ biến có giá trị t thấp Đơn giản hóa mô hình dựa liệu cách tiếp cận dùng Tuy nhiên, ta nên nhớ việc loại bỏ biến quan trọng gây thiên lệch Nên dùng kiến thức lý thuyết để định nên hay không giữ biến lại vấn đề đa cộng tuyến có Tăng kích thước mẫu lời khuyên, với điều kiện liệu có cộng tuyến liệu gốc Các phương pháp khác hồi qui sóng phân tích thành phần dùng, thủ tục không theo thể thức trí hữu dụng chúng nhà kinh tế lượng Thuật ngữ Absence of multicollinearity Exact multicollinearity First differences Multicollinearity Near multicollinearity Perfect multicollinearity Ramu Ramanathan Sự vắng mặt đa cộng tuyến Đa cộng tuyến xác Sai phân bậc Đa cộng tuyến Gần đa cộng tuyến Đa cộng tuyến hoàn hảo 16 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến 5.A PHỤ LỤC Chứng Minh Phương Trình (5.4) đến (5.6) Dùng ký hiệu Phần 4.A.1 Phương trình chuẩn (5.2) (5.3) giải cho hệ số β sau (xem Phương trình 4.A.6 đến 4.A.15) ˆ β2 = S y S33 - S y S 23 ˆ β3 = Trong (5.A.1) ∆ S y S22 - S y S23 (5.A.2) ∆ (5.A.3) E(Sy2) = β2S22 + β3S23 (5.A.4) E(Sy3) = β2S23 + β3S33 (5.A.5) Sy2 = ∑yx2 = ∑x2(β2x2 + β3x3 + v) = β2S22 + β3S23 + Sv2 Dễ dàng thấy ∆ = S22S33 – S223 (5.A.6) Ta có Sử dụng phương trình (5.1) Bởi E(v) = x không ngẫu nhiên E(Sv2) = E(∑vx2) = ∑x2E(v) = Do E(Sy2) = β2S22 + β3S23, phương trình (5.A.4) chứng minh Chứng minh phương trình (5.A.5) tương tự Tiếp theo ta chứng minh σ S33 ∆ (5.A.7) σ S22 ˆ Var (β ) = ∆ (5.A.8) ˆ Var (β ) = - σ S23 ˆ ˆ Cov(β , β ) = ∆ (5.A.9) Từ (5.A.6) Tính chất 2.8c Var(Sy2) = Var(Sv2) Từ Tính chất 2.9e Var (Sy2) = ∑x22Var(v) = σ2∑x22 = σ2S22 Ramu Ramanathan 17 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Var (Sy3) = ∑x32Var(v) = σ2∑x32 = σ2S33 Cov(Sy2, Sy3) = ∑x2x3Var(v) = σ2S23 Ngoài ra, từ Tính chất 2.4a ˆ Var(β ) = = = [S33 Var (S y ) + S2 Var (S y ) - 2S33 S23 Cov(S y , S y )] 23 ∆ σ2 [S33 S 22 + S2 S33 - 2S33 S23 S23 ] 23 ∆2 σ2 ∆2 [ S 33 S 22 - S2 S33 ] = 23 σ2 ∆2 S 33 [ S 33 S 22 - S2 ] = 23 σ S 33 ∆ Vậy phương trình (5.A.7) chứng minh xong Thủ tục chứng minh (5.A.8) (5.A.9) tương tự Gọi r hệ số tương quan X2 X3 (xem Phương trình 2.11) Theo định nghóa, r = S2 /(S22 S33 ) Do 23 ∆ = S22S33(1 – r2) Dùng kết vào Phương trình (5.A.7) (5.A.8), (5.A.9), ta Phương trình (5.4) (5.5), (5.6) Ramu Ramanathan 18 Thuc Doan/Hao Thi ... Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến 5.A PHỤ LỤC Chứng Minh Phương Trình (5 .4) đến... Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến Sự nguy hiểm tính đa cộng tuyến đề tài tranh... Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với ứng dụng Chương 5: Đa cộng tuyến độc lập khác, hệ số hồi qui tương ứng ước lượng