Phần 2 của giáo trình Kinh tế lượng tiếp tục cung cấp cho học viên những nội dung về: đa cộng tuyến; hồi qui với biến giả; phương sai sai số thay đổi; kiểm định Goldfeld-Quandt (G-Q); tương quan chuỗi;... Mời các bạn cùng tham khảo!
CHƯƠNG IV ĐA CỘNG TUYẾN Các biến giải thích xác định mơ hình kinh tế lượng thường xuất phát từ lý thuyết hiểu biết từ kinh nghiệm khứ Dữ liệu biến đặc biệt xuất phát từ thực nghiệm khơng kiểm sốt thường tương quan với Ví dụ, dân số tổng sản phẩm quốc nội hai chuỗi liệu tương quan chặt lẫn Trong chương trước, phát biểu hệ số hồi qui biến cụ thể số đo tác động riêng phần biến này, nghĩa tác động tất biến khác mơ hình giữ mức cố định có giá trị biến thay đổi Tuy nhiên, hai biến giải thích tương quan chặt; đơn giản giữ biến khơng đổi thay đổi biến cịn lại biến sau thay đổi biến đầu thay đổi Cũng vậy, thay đổi mơ hình cách loại bỏ thêm vào biến làm thay đổi kết cách nghiêm trọng, khiến cho việc diễn dịch ước lượng khó khăn Đây vấn đề đa cộng tuyến, vấn đề xuất biến giải thích có quan hệ gần tuyến tính 4.1 Bản chất đa cộng tuyến Trường hợp lý tưởng biến tương quan với nhau; biến Xj chứa thông tin riêng Y, thông tin không chứa biến Xj khác Trong thực tế, điều xảy ta không gặp tượng đa cộng tuyến Ở trường hợp ngược lại, ta gặp tượng đa cộng tuyến Giả sử ta phải ước lượng hàm hồi qui Y gồm k biến giải thích X1,X2, , Xk: Yi= β1+ β2X2i+ β3X3i, + βkXki + ui Đa cộng tuyến xảy biến giải thích biểu diễn dạng tổ hợp tuyến tính biến giải thích cịn lại điểm tập số liệu Hay nói, tồn λi không đồng làm cho: λ2x2i + λ3x3i + + λkxki +νi = 0; Trong νi nhiễu; E(νi)=0; Var(νi)=σ νi ≥0 Trường hợp nói có đa cộng tuyến Nói chung hồi qui đa biến có đa cộng tuyến, vấn đề mức Trường hợp Var(νi)= 0, => νi = E(νi)=0, ta có λ2x2i + λ3x3i + + λkxki = 0, trường hợp gọi đa cộng tuyến hồn hảo Nhưng thực tế Var(νi)= khó xảy ra, có số liệu q đưa vào xi sai Khi Var(νi)> 0, ta có đa cộng tuyến khơng hồn hảo, Var(νi) lớn đa cộng tuyến thấp Ví dụ: Giả sử ước lượng hàm tiêu dùng Y = tiêu dùng, X2 = thu nhập X3 = cải 52 Y = β1 + β2X2 + β3X3 + u; X3 = 5X2 Y = β1 + β2X2 + β35X2 + u Y = β1 + (β2 + 5β3)X2 + u Chúng ta ước lượng (β2 + 5β3) không ước lượng riêng hệ số hồi qui Hay nói khơng thể có nghiệm cho hệ số hồi qui (xem lại cách tính hệ số hồi qui) Như hệ số hồi qui không xác định 4.2 Nguồn gốc đa cộng tuyến ¾ Do phương pháp thu thập liệu: • Các giá trị biến độc lập phụ thuộc lẫn mẫu, không phụ thuộc lẫn tổng thể • Ví dụ: người có thu nhập cao khuynh hướng có nhiều cải Điều với mẫu mà khơng với tổng thể Trong tổng thể có quan sát cá nhân có thu nhập cao khơng có nhiều cải ngược lại ¾ Các biến độc lập vĩ mô quan sát theo liệu chuỗi thời gian Ví dụ: Nhập quốc gia phụ thuộc vào GDP CPI (các số thu thập từ dự liệu chuỗi thời gian) 4.3 Ước lượng có đa cộng tuyến hồn hảo Khi có đa cộng tuyến hồn hảo hệ số hồi qui khơng xác định cịn sai số tiêu chuẩn vô hạn Chúng ta dễ dàng thấy từ ví dụ phần 4.1 Ta sử dụng cơng thức tính βˆ2 & βˆ3 trình bày phần hồi qui đa biến, ta thấy βˆ & βˆ không xác định tử số mẫu số = 4.4 Ước lượng có đa cộng tuyến khơng hồn hảo Trường hợp giả thiết x2 x3 có đa cộng tuyến khơng hồn hảo theo nghĩa: x2i = αx3i + νi Trong α ≠ 0, νi nhiễu ngẫu nhiên Trong trường hợp này, theo phương pháp bình phương bé ta thu βˆ2 & βˆ3 việc giải thích gặp nhiều khó khăn 53 4.5 Hậu đa cộng tuyến Khi có tượng đa cộng tuyến mơ hình, gặp phải hậu sau: − Sai số chuẩn hệ số hồi qui lớn, làm cho khoảng tin cậy lớn thống kê t ý nghĩa ước lượng khơng thật xác Chúng ta dễ đến khơng có sở bác bỏ giả thiết “không” thực tế không Hay nói làm cho khơng xác định tác động biến độc lập đến biến phụ thuộc, chí hệ số hồi qui bị ước lượng sai dấu − Các mẫu ngẫu nhiên khác cho kết ước lượng khác nhiều, Var ( βˆ j ) lớn 4.6 Phát đa cộng tuyến Tính đa cộng tuyến thường xuất số đặc điểm sau: Giá trị R2 cao với giá trị trị thống kê t thấp: Mọi hệ số hồi qui khơng có ý nghĩa (nghĩa có giá trị t thấp) trị thống kê F kiểm định lại có ý nghĩa Những giá trị cao cho hệ số tương quan: Các tương quan cặp biến giải thích cao, Xin lưu ý hệ số tương quan cao biến phụ thuộc biến độc lập khơng phải dấu hiệu tính đa cộng tuyến Thực tương quan mong muốn Các hệ số hồi qui nhạy với đặc trưng: Mặc dù tương quan cao cặp biến độc lập điều kiện đủ cho tính đa cộng tuyến, điều kiện đảo lại khơng cần thiết phải Nói cách khác, tính đa cộng tuyến diện tương quan hai biến giải thích thể khơng cao Điều ba hay nhiều biến gần tuyến tính Trong trường hợp vậy, chứng thật tính đa cộng tuyến quan sát cho thấy hệ số hồi qui bị thay đổi đáng kể biến thêm vào bỏ Dưới số cách thông dụng để phát đa cộng tuyến: 4.6.1 Xét hệ số tương quan tương quan riêng: Xây dựng ma trận hệ số tương quan cặp quan sát để nhận diện độ mạnh tương quan cặp biến số độc lập Giả sử Yi = β1 + β2X2i + β3X3i + β4X4i +ui Nếu tương quan R(X2,X3); R(X2,X4); R(X3,X4) đủ lớn có đa cộng tuyến Hoặc tương quan R(Y,X2) lớn mà sau kiểm định tác động X2 đến y không bác bỏ giả thiết H0 nói có đa cộng tuyến 54 4.6.2 Phát qua hồi qui phụ: Hồi qui biến giải thích mà phụ thuộc tuyến tính vào biến giải thích khác (có hệ số chặn) gọi hồi qui phụ Nếu hồi qui Xj = α1+ Σ αiXi (i ≠ j) kiểm định F: F = [R2/(k-1)] /[(1-R2)/(n-k)] k số biến độc lập hồi qui phụ Nếu F > F* kết luận R2 khác khơng có ý nghĩa thống kê điều có nghĩa có đa cộng tuyến 4.6.3 Thừa số tăng phương sai (Variance inflation factor-VIF) Với Xj, làm hồi qui phụ: Xj = α1+ Σ αiXi (i ≠ j) Tính: VIF = 1/(1-Rj2) Ta thấy Rj2 tăng làm VIF tăng làm tăng mức độ đa cộng tuyến Người ta quan niệm Khi VIF ≥ 10 có đa cộng tuyến 4.6.4 Độ đo Theil: Ý tưởng phương pháp khơng có đa cộng tuyến đóng góp cá thể đóng góp chung cịn có đa cộng tuyến đóng góp cá thể nhỏ nhiều đóng góp chung Thực sau: Ước lượng k-1 hồi qui, bỏ Xj khỏi mơ hình Khi hàm hồi qui là: Yi = β1+ Σ βiXi + εi (i ≠ j); Sau hồi qui người ta tìm R2(-j), độ phù hợp hàm hồi qui (khơng có Xj), sau tính R2 - R2(-j) phần đóng góp Xj cho Y Tính m = R2 – Σ(R2 - R2(-j)) Người ta quan niệm m/R2 > 0.5 có đa cộng tuyến 4.7 Các giải pháp khắc phục 4.7.1 Bỏ qua đa cộng tuyến: Nếu quan tâm đến việc đánh giá tác động biến độc lập đến biến phụ thuộc mà trọng chủ yếu vào việc dự báo, tính đa cộng tuyến khơng phải vấn đề nghiêm trọng Khi ta bỏ qua mà khơng phải chịu hậu xấu đáng kể Hay nói phục vụ dự báo bỏ qua đa cộng tuyến 55 4.7.2 Loại bỏ biến: Tính đa cộng tuyến mối quan hệ chặt chẽ biến giải thích, cách chắn để loại bỏ giảm bớt tác động tính đa cộng tuyến bỏ nhiều biến khỏi mơ hình Việc loại bỏ biến có trị thống kê t thấp nói chung làm cải thiện mức ý nghĩa biến lại Điều quan trọng xảy tình biến cịn lại có khả nắm giữ tác động biến bị loại bỏ có liên quan chặt chẽ với chúng 4.7.3 Tái thiết lập mơ hình: Trong nhiều tình huống, tái xác định mơ hình làm giảm tính đa cộng tuyến 4.7.4 Bổ sung liệu tìm liệu mới: Vì đa cộng tuyến đặc trưng cho mẫu, nên lấy mẫu khác liên quan đến biến mẫu ban đầu mà đa cộng tuyến khơng cịn nghiêm trọng Do việc bổ sung liệu tìm liệu đơi đề xuất dựa sở cho việc gia tăng kích thước mẫu làm cải thiện độ xác ước lượng giảm thiểu yếu tố phản tác dụng tính đa cộng tuyến 4.7.5 Sử dụng thơng tin tiền nghiệm: Ví dụ biết tác động biên của cải lên tiêu dùng 1/10 so với tác động biên thu nhập lên tiêu dùng β3 = 0.10 β2 Chạy mơ hình với điều kiện tiền nghiệm Y = β1 + β2X2 + 0.10 β2X3 + u Y= β1 + β2X X = X2 + 0.1X3 Khi ước lượng β2 suy β3 từ mối quan hệ tiền nghiệm BÀI TẬP THỰC HÀNH Sau ước lượng hàm tiêu dùng, với X2 thu nhập X3 cải Chúng ta thu kết sau: Yˆ = 1.60 − 0.10 X + 0.18 X p − value 0.25 0.86 0.24 R = 0.99 PF = 0.03 Từ kết quả, cho thấy rằng: − R2 cao giải thích 99% biến đổi hàm tiêu dùng − Khơng có biến độc lập có ý nghĩa (thống kê t thấp) 56 − Có biến sai dấu − Giá trị thống kê F cao dẫn đến bác bỏ giả thuyết “khơng” cho mơ hình ước lượng có ý nghĩa Chúng ta thấy rằng, điều nguyên nhân biến thu nhập cải tương quan mạnh với khơng thể ước lượng tác động biên xác cho thu nhập cải lên tiêu dùng Xét tương quan X2 X3 ta có: R(X2,X3) = 0,99, thực tương quan mạnh, hay nói có đa cộng tuyến hồn hảo X2 X3 Hồi qui tiêu dùng theo thu nhập: Yˆ = 1.57 + 0.82 X p − value 0.03 0.001 R = 0.99 PF = 0.001 Ta thấy biến thu nhập trở nên có ý nghĩa thống kê, trước lúc mơ hình đầu khơng có ý nghĩa Hay tương tự hồi qui thu nhập Y theo cải: Yˆ = 1.57 + 0.34 X p − value 0.03 0.012 R = 0.99 PF = 0.012 Biến cải trở nên có ý nghĩa thống kê, trước lúc mơ hình đầu khơng có ý nghĩa Qua kết đó, kết luận có tượng đa cộng tuyến mơ hình, hay có quan hệ tuyến tính chặt hai biến thu nhập cải Khi phải sử dụng biện pháp để khắc phục tình trạng 57 CHƯƠNG V HỒI QUI VỚI BIẾN GIẢ 5.1 Bản chất biến giả Tất biến giới thiệu chương trước biến định lượng; nghĩa biến có đặc tính đo lường số Tuy nhiên, hành vi biến kinh tế phụ thuộc vào nhân tố định tính giới tính, trình độ học vấn, mùa, v.v…ví dụ xem xét mơ hình hồi qui tuyến tính đơn sau: Y = β1 + β2X + u Gọi Y mức tiêu thụ lượng ngày X nhiệt độ trung bình Khi nhiệt độ tăng mùa hè, kỳ vọng mức tiêu thụ lượng tăng Vì vậy, hệ số độ dốc β có khả số dương Tuy nhiên, mùa đông, nhiệt độ tăng ví dụ từ 20 đến 40 độ, lượng dùng để sưởi ấm hơn, mức tiêu thụ giảm nhiệt độ tăng Điều cho thấy β âm mùa đơng Vì vậy, chất quan hệ mức tiêu thụ lượng nhiệt độ kỳ vọng phụ thuộc vào biến định tính “mùa” Vậy phải làm để mơ tả tác động biến định tính, hay làm để đưa biến định tính vào mơ hình Cơng cụ xử lý biến giả (dummy) Chúng ta giải thích nhiều trường hợp khác từ đơn giản đến phức tạp Biến giả thể biến định tính – Mơ hình có biến giải thích biến giả – Mơ hình có biến giải thích định lượng biến giả Biến giả thường ký hiệu D, nhận giá trị Ví dụ: Chúng ta bắt đầu với việc xem xét trường hợp đơn giản biến định tính có hai lựa chọn Ví dụ, hai ngơi nhà có đặc trưng, có hồ bơi ngơi nhà cịn lại khơng có Tương tự, hai nhân viên cơng ty có tuổi, học vấn, kinh nghiệm v.v…, người nam người nữ Vậy làm để đo lường tác động giới tính đến lương tác động diện hồ bơi đến giá nhà Cụ thể xem xét ví dụ lương đặt Yi tiền lương hàng tháng nhân viên thứ i công ty Để đơn giản, bỏ qua biến khác có ảnh hưởng đến lương tập trung vào giới tính Vì biến giới tính khơng phải biến định lượng nên định nghĩa biến giả (gọi D), biến giả nhận giá trị giá trị, nhân viên nam nhân viên nữ Chúng ta thiết lập ước lượng mô hình sử dụng biến biến giải thích Dạng đơn giản mơ sau: Y = β1 + β2D + u 58 Chúng ta giả sử số hạng sai số ngẫu nhiên thỏa mãn tất giả thiết phương pháp bình phương nhỏ Chúng ta lấy kỳ vọng có điều kiện Y với D cho trước phương trình sau: Nam: E(Y|D = 1) = β1 + β2 Nữ: E(Y|D = 0) = β1 Trong đó: • Hệ số chặn β1 hồi qui tuyến tính tiền lương trung bình nhân viên nữ, độ dốc β2 đường hồi qui đo khác tiền lương nhân viên nam nữ • Kiểm định giả thiết H0: β2 =0 cung cấp kiểm định giả thiết khơng có khác tiền lương nhân viên nam nhân viên nữ • Thủ tục biến giả dễ dàng mở rộng cho trường hợp có nhiều lựa chọn (phạm trù) 5.2 Hồi qui với biến giả Phần ta xét mơ hình hồi qui có biến lượng biến chất, với số phạm trù nhiều Trường hợp có nhiều biến lượng biến chất thủ tục làm tương tự 5.2.1 Trường hợp biến chất có lựa chọn (2 phạm trù): Giả sử phải ước lượng mối quan hệ tiền lương người lao động số năm công tác họ yi = β1 + β2xi +ui Trong đó: yi = tiền lương hàng năm người lao động i xi = số năm công tác người lao động i Ở hoàn tồn chưa nói người lao động nam hay nữ Bây giả sử muốn tìm hiểu xem xem liệu có phải người lao động nữ bị phân biệt đối xử việc trả lương họ không? Ta bắt đầu việc ước lượng chung cho người lao động nam nữ cách xác định biến ghi nhận có mặt hay vắng mặt thuộc tính "nữ “ Di = quan sát i thuộc người lao động nữ Di = quan sát i thuộc người lao động nam Khi mơ hình hồi qui có dạng sau: 59 yi = β1 + β2Di + β3xi +ui Giá trị kỳ vọng có điều kiện sau: E(y|Di =0)= β1 + β3xi nữ E(y|Di =1)= (β1 + β2) + β3xi nam Y Tiền lương lao động nam Tiền lương lao động nữ β2 X Hệ số β2 chênh lệch tung độ gốc Dễ dàng kiểm định xem liệu chênh lệch có ý nghĩa thống kê hay khơng: đơn giản tính giá trị thống kê t cho β2 so với giá trị tới hạn tra bảng t* làm kiểm định ý nghĩa thống kê hệ số hồi qui 5.2.2 Trường hợp với biến lượng hai biến chất: Giả sử phải ước lượng mối quan hệ tiền lương đối tượng số năm công tác họ, giả thiết thêm rằng, ngồi giới tính vùng mà lao động làm việc ảnh hưởng tới thu nhập Như ta có hai biến chất: – Vùng có phạm trù – Giới tính có phạm trù Mơ hình có dạng: yi = β1 + β2D1i + β3D2i + β4D3i + β5xi +ui Trong đó: yi = thu nhập hàng năm người lao động i xi = số năm công tác người lao động i D1 = lao động doanh nghiệp miền Bắc 60 D1 = lao động không thuộc doanh nghiệp miền Bắc D2 = lao động doanh nghiệp miền Nam D2 = lao động không thuộc doanh nghiệp miền Nam D3 = lao động nam D3 = lao động nữ Phạm trù cở người lao động thuộc doanh nghiệp miền Trung Giả sử E(ui)=0, thu nhập trung bình lao động nữ doanh nghiệp miền Trung là: E(y|D1 =0, D2 =0, D3 =0, xi)= β1 + β5xi 5.3 Mô tả tác động biến chất (biến định tính): 5.3.1 Tác động làm thay đổi tung độ gốc (hệ số chặn): Trường hợp xem xét tác động biến định tính việc thay đổi tung độ gốc, ta thiết lập dạng hàm tổng quát sau: Yi = β1 + β2Xi + β3Di + ui Lấy kỳ vọng tương ứng với D = D = cho ta thấy thay đổi tung độ gốc tác động biến định tính E (Y D = 0) = β + β X i E (Y D = 1) = ( β + β ) + β X i Hình 4.1: Ví dụ việc dịch chuyển tung độ gốc Y Yˆi = ( βˆ1 + βˆ3 ) + βˆ2 X i Yˆi = βˆ1 + βˆ2 X i βˆ3 X 61 Từ kết kiểm định LM, ta có nR2 = 4.033; p-value = 0.044617