1. Trang chủ
  2. » Giáo án - Bài giảng

Chuong 7 Hoi quy voi bien gia

36 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

CHƯƠNG 7 HỒI QUI VỚI BIẾN GIẢ VÀ BIẾN BỊ CHẶN  Bản chất của biến giả - Biến giả cho sự thay đổi trong hệ số chặn  Biến giả cho sự thay đổi trong hệ số góc  Biến giả và Kiểm định tính [r]

(1)CHƯƠNG HỒI QUI VỚI BIẾN GIẢ VÀ BIẾN BỊ CHẶN  Bản chất biến giả - Biến giả cho thay đổi hệ số chặn  Biến giả cho thay đổi hệ số góc  Biến giả và Kiểm định tính ổn định cấu trúc mô hình  Hồi qui tuyến tính khúc  Biến phụ thuộc là biến giả  Mô hình xác suất tính tuyến tính (LPM)  Mô hình Probit và Logit  Biến bị chặn: mô hình Tobit (2) Bản chất biến giả - Biến giả cho thay đổi hệ số chặn Trong phân tích hồi qui, có loại biến chính: biến định lượng và biến định tính  Các biến định lượng: giá trị quan sát đó là số  Biến định tính thường biểu thị có hay không có tính chất biểu thị các mức độ khác tiêu thức thuộc tính nào đó, chẳng hạn giới tính, tôn giáo, chủng tộc, nơi cư trú, …  Những biến định tính này có ảnh hưởng biến phụ thuộc và phải đưa vào mô hình hồi quy (3) Bản chất biến giả - Biến giả cho thay đổi hệ số chặn  Biến giả (D) thường có giá trị:  D = 1: quan sát có thuộc tính nào đó, và  D = 0: không có thuộc tính đó  Biến giả đưa vào mô hình hồi quy giống biến định lượng,  Chúng dùng để khác biệt nhóm quan sát: có và không có thuộc tính nào đó (4) Bản chất biến giả - Biến giả cho thay đổi hệ số chặn  Ví dụ: giả sử ta muốn xem có khác biệt nào không tiền công nam và nữ với điều kiện công việc  Hàm hồi quy ngẫu nhiên cho quan sát: wagei = 0 + 1Di + ’X + ui, Trong đó D là biến giả giới tính: D = là nam và là nữ; X là vector đặc điểm cá nhân và công việc  Nếu D=1: wagei = 0 + 1 + ’X + ui,  Nếu D=0: wagei = 0 + ’X + ui,  Vậy hệ số 1 đo lường khác biệt hệ số 0 nhóm nam và nữ (5)  Biến giả cho thay đổi hệ số chặn (hệ số tự do) Wagei = 0 + 1 + ’X + ui y           Wagei = 0 + ’X + ui           x Hình 7.1 Đường hồi qui với hệ số góc giống và hệ số chặn khác (6)  Nếu biến định tính chia m nhóm, chúng ta phải sử dụng (m -1) biến giả  Ví dụ: Ta có thể chia trình độ học vấn thành các cấp học: 1) cấp trở xuống, 2) cấp hai, 3) cấp ba và 4) cao  để so sánh tiền công người lao động có các trình độ học vấn khác nhau, ta dùng biến giả: D 1: cấp hai; D2: cấp ba và D3: cấp học cao  Các hệ số ước lượng D1; D2 và D3: khác biệt tiền công các cấp học tương ứng và cấp trở xuống  Nhóm không biểu diễn biến giả đgl nhóm sở, hay nhóm đối ứng, hay nhóm so sánh, …  Giả định hệ số góc  là giống cho các nhóm và phần sai số ngẫu nhiên u có cùng phân phối cho các nhóm (7) Biến giả cho thay đổi hệ số chặn  Lưu ý: mô hình hồi quy có thể bao gồm biến giả  Khi đó, mô hình đgl “Mô hình phân tích phương sai” (ANOVA model)  Hệ số các biến giả cho biết khác biệt giá trị trung bình biến phụ thuộc các nhóm (8)  Một ví dụ khác, giả sử chúng ta có số liệu tiêu dùng C và thu nhập Y số hộ gia đình Thêm vào đó, chúng ta có số liệu về: 1) S: giới tính chủ hộ 2) A: tuổi chủ hộ, chia sau: < 25 tuổi, từ 25 đến 50, > 50 tuổi 3) E: trình độ học vấn chủ hộ, chia thành nhóm: < trung học,  trung học < đại học,  đại học (9)  Chúng ta sử dụng biến định tính này các biến sau: D1 = D2 = giới tính là nam là nữ tuổi nhỏ 25 nhóm tuổi khác tuổi từ 25 đến 50 nhóm tuổi khác học vấn < trung D4 = học nhóm học vấn khác học vấn  trung học < đại học trở lên D5 nhóm học vấn khác = D3 = (10)  Khi đó chúng ta chạy phương trình hồi qui: C =  + Y + 1D1 + 2D2 + 3D3 + 4D4 + 5D5 + u  Ví dụ, chủ hộ là nam, nhỏ 25 tuổi, có đại học, chúng ta có D1 = 1, D2 = 1, D3 = 0, D4 = 0, D5 = => hệ số chặn là  + 1 + 2  Khi chủ hộ là nữ, lớn 50 tuổi, có đại học, chúng ta có D1 = 0, D2 = 0, D3 = 0, D4 = 0, D5 = và hệ số chặn là  (11) Biến giả cho thay đổi hệ số góc  Ví dụ, phương trình hồi qui cho nhóm: y1 =  + 1x + u cho nhóm thứ và y2 =  + 2x + u cho nhóm thứ hai Giả sử có khác biệt hệ số góc nhóm: y2 =  + (1 + )x + u =  + 1x + x +u Phương trình hồi quy cho quan sát i là: yi =  + 1xi + Dixi + ui =  + 1xi + Dixi + ui Do vậy, hệ số biến Dixi () cho biết khác biệt hệ số góc hai nhóm (12) Biến giả và Kiểm định tính ổn định cấu trúc mô hình  Ta có bảng số liệu sau thu nhập và tiết kiệm Mỹ từ năm 1970 – 1995  Vào năm 1982, Mỹ rơi vào khủng hoảng kinh tế  Ta có thể giả định có thay đổi cấu trúc mối quan hệ tiết kiệm và thu nhập,  Ta chia số liệu giai đoạn và đặt:  D = 1: cho số liệu từ 1982 và cho giai đoạn trước đó (13) (14) Biến giả và Kiểm định tính ổn định cấu trúc mô hình  Ta có mô hình hồi quy: Yt = α1 + α2Dt + β1Xt + β2(DtXt) + ut (15) Hồi qui tuyến tính khúc  Hệ số góc biến độc lập, X, có thể thay đổi X đạt mức ngưỡng nào đó  Phân tích mô hình có thay đổi độ dốc, giới hạn trường hợp đoạn thẳng ước lượng là liên tục  Công ty trả hoa hồng cho các đại lý dựa vào doanh thu, doanh thu mức x* thì cách tính tiền hoa hồng khác với cách tính tiền hoa hồng doanh thu trên mức x* (16) y tiền hoa hồng                   x* Hình 7.3: Đường hồi qui tuyến tính khúc x doanh thu (17) Ước lượng hàm: y =  + x + xD + u (7.8)  Trong đó: y: tiền hoa hồng; x: doanh thu x*: giá trị ngưỡng doanh thu  D = Kiểm định  = x > x* x  x* (18) Biến phụ thuộc là biến giả  Biến giả có thể có nhiều giá trị trường hợp này chúng ta xem xét trường hợp nó có giá trị:  mô hình xác suất tuyến tính (LPM)  Ví dụ: y= y= sinh viên tốt nghiệp trường không tốt nghiệp gia đình có vay vốn từ ngân hàng không vay (19) Mô hình xác suất tuyến tính và hàm phân biệt tuyến tính  Chúng ta viết mô hình xác suất tuyến tính dạng hồi qui thông thường sau: yi = Pi = E(yi|xi) = i’xi + ui (7.9) với E(ui) =  Kỳ vọng có điều kiện E(yi|xi) = ’ixi giải thích là xác suất có điều kiện để kiện xảy biến xi đã xảy (20) Mô hình xác suất tuyến tính  Vì E(yi|xi) là xác suất nên:   E(yi|xi)   Tuy OLS không đòi hỏi ui phải có phân phối chuẩn, ta giả định nó có phân phối chuẩn để phục vụ cho việc suy diễn  Giả định này bị vi phạm, vì thực ui theo phân phối Bernoulli  Xét mô hình LPM biến, ta có: (21) Mô hình xác suất tuyến tính ui = Yi - 1 - 2Xi Khi Yi = 1, ui = - 1 - 2Xi, với xác suất pi, Khi Yi = 0, ui = -1 -2Xi, với xác suất 1- pi,  Ước lượng OLS không chệch, nên dùng để ước lượng điểm, kết tin cậy  Có tượng phương sai sai số thay đổi, ui theo phân phối Bernoulli nên: Var(ui) = Pi(1 – Pi) với Pi = ’iXi  E(yi|xi) có thể vượt khoảng (0,1) Xi có giá trị lớn  R2 nhỏ (22) Đường hồi qui tuyến tính y       Đường hồi qui thích hợp  Hình 7.4: Dự báo từ mô hình xác suất tuyến tính x (23) Mô hình Probit và Logit  Trong mô hình LPM, ta có: yi = Pi = E(yi|xi) = F(i’xi) = i’xi + ui, Trong đó: i’xi = 0 + 1x1 + 2x2 + … + kxk  Do yi là xác suất nên thay vì ta dùng F(i’xi) là hàm tuyến tính LPM, ta có thể cho F(xi) là hàm tích lũy xác suất (c.d.f)  Khi đó, chắn  E(yi|xi) = F(i’xi)   Tùy theo dạng F(i’xi) chọn, ta có các mô hình: “lựa chọn nhị phân” (binary choice) khác nhau:  F(i’xi) là c.d.f phân phối chuẩn: probit model  F(i’xi) là c.d.f phân phối logistic: logit model (24) “Biến ẩn” và Mô hình Probit và Logit  Gọi yi* là “biến ẩn”, không quan sát từ quan sát i: yi* = xi’ + vi, Trong đó vi thỏa các giả định CLRM  Giả sử ta quan sát yi yi* vượt ngưỡng nào đó, chẳng hạn, 0, với: yi = yi* > 0, và yi = yi*   Do vi có p.d.f đối xứng nên: 1-F(-xi’) = F(xi’) Ta có: P(y = 1|xi) = P(y* > 0|xi) = P(vi > -xi’) = - F(-xi’) = F(xi’) (25) Mô hình logit và probit  Tác động biên (marginal effect) x i lên Pi là:   Pi F x'i    i f x'i  x i x i   Trong đó f(.) là p.d.f F(.)  Ta thấy tác động phần này có cùng dấu với i và phụ thuộc vào giá trị x i, không giống các mô hình tuyến tính  Do vậy, ta có thể tính tác động biên x i lên Pi ứng với các giá trị cụ thể các x i (26) Mô hình logit và probit Hàm c.d.f các mô hình: x'i  e ' E  yi xi  P i F  xi    Mô hình logit: x'i  1 e ' xi  Mô hình probit:  x'i  / ' P i F x i   e F(.) là c.d.f   2 phân phối chuẩn tắc Đây là các mô hình phi tuyến tính nên ước lượng phương pháp ML (Maximum Likelihood)    (27) Mô hình logit và probit (28) Ước lượng ML mô hình Logit và Probit  Để ước lượng mô hình ML, ta phải xây dựng hàm log-likelihood các quan sát i  Xác suất có điều kiện yi ứng với xi là: f(y|xi, ) = [F(xi’)]y[1 - F(xi’)](1-y), y = 0,  Hàm log-likelihood quan sát i là: i     yi log F  xi    1  yi  log1  F  xi     Hàm log-likelihood mẫu n quan sát: L= n (*)     i (29) Ước lượng ML mô hình Logit và Probit  Thông thường, ta có thể giải (*) để tìm ước lượng   cho L() cực đại    là các ước lượng chệch vững và xấp xỉ phân phối chuẩn  Do vậy, ta có thể dùng các thống kê t, F để kiểm định mức ý nghĩa các ước lượng  Lưu ý, các ước lượng ML là vững và theo phân phối xấp xỉ nên để có độ tin cậy cao, cở mẫu n phải lớn (30) Mô hình logit: k Pi ln( )     j xij  Pi j 1  Vế trái phương trình này gọi là tỉ số log-odds  phân phối tích luỹ ui (7.10) là logistic (31) Mô hình Probit: các phần dư ui phương trình (7.10) theo phân phối chuẩn k Z i     j xij j 1 (32) Biến bị chặn: mô hình Tobit  Mô hình Tobit sử dụng để phân tích lý thuyết kinh tế lượng lần đầu tiên nhà kinh tế học James Tobin năm 1958 yi = yi* = xi + ui >0  với ui ~ IN(0, 2) yi* yi*  (33)  Nó còn có tên gọi khác là mô hình hồi qui chuẩn kiểm duyệt (censored regression model)  mô hình hồi qui có biến phụ thuộc bị chặn (limited dependent variable regression model)  vì có số quan sát biến phụ thuộc y* bị chặn hay giới hạn (34)  Ví dụ, Tobin xem xét vấn đề chi tiêu cho việc mua xe ôtô  Chúng ta muốn ước lượng hệ số co giãn thu nhập nhu cầu mua xe ôtô  Đặt y* là chi tiêu cho mua xe ôtô và x là thu nhập, mô hình Tobit trình bày sau:  y* = xi + ui ui ~ IN(0, 2) (35)  Mô hình Tobit: chi tiêu mua xe ô tô yi =  Hi = yi = xi + ui cho các quan sát có chi tiêu mua xe là số dương cho các quan sát không có chi tiêu mua xe cho số làm việc mô hình yi = xi + ui cho người có việc làm cho người không làm  mô hình tiền lương Wi = yi = xi + ui cho người có việc làm cho người không làm (36) k     i xi i 1 y = n2 cá nhân thuộc nhóm 1 (nhóm n1 + I) n1 n2 n1+n2 cá nhân thuộc nhóm 2  Bây ước lượng phương trình hồi qui bội (nhóm II) y = 0 + 1x1 + 2x2 + … + kxk + u  Thu tổng bình phương các phần dư RSS Khi đó:   RSS  i  i n1  n  (37)

Ngày đăng: 09/06/2021, 09:01

w