Bài giảng 21. Mô hình với Biến phụ thuộc bị giới hạn tài liệu, giáo án, bài giảng , luận văn, luận án, đồ án, bài tập lớ...
Mơ hình với Biến Phụ thuộc bị Giới hạn (Models with Limited Dependent Variables) Lê Việt Phú Chương trình Giảng dạy Kinh tế Fulbright Ngày 21 tháng 11 năm 2015 / 34 Table of contents ◦ Thế biến phụ thuộc không bị giới hạn bị giới hạn ◦ Một số mơ hình sử dụng biến phụ thuộc bị giới hạn ◦ Sử dụng hồi quy tuyến tính biến phụ thuộc bị giới hạn ◦ Phương pháp tối đa hoá xác suất - MLE → Ước lượng mơ hình hồi quy Logit Probit ◦ Thực hành STATA / 34 Thế biến phụ thuộc không bị giới hạn bị giới hạn Các loại biến phụ thuộc mơ hình hồi quy: Liên tục rời rạc: tăng trưởng GDP liên tục, có số bất kỳ, ví dụ 6.1025%; số lần học muộn rời rạc, ví dụ muộn 0, 1, lần Khơng bị giới hạn bị giới hạn: lợi nhuận công ty khơng giới hạn (lỗ nhận giá trị âm, lãi dương); số nhân viên bị giới hạn (bị chặn dưới, nhân viên cơng ty) Biến phụ thuộc định tính định lượng: có hút thuốc hay khơng biến định tính; hút điếu thuốc ngày định lượng bị giới hạn (ít điếu) Hầu hết biến số kinh tế bị giới hạn Sử dụng hồi quy tuyến tính liệu bị giới hạn kết bị sai lệch, khó giải thích ý nghĩa mặt kinh tế / 34 Một số mơ hình sử dụng biến phụ thuộc bị giới hạn (1) Mơ hình xác suất xảy kiện hay biến cố Ví dụ đối tượng vị thành niên hút thuốc, học đại học, phụ nữ dân tộc thiểu số tham gia lao động thức Biến phụ thuộc có khơng (mã hố cho câu trả lời có, cho câu trả lời khơng) Đối với biến phụ thuộc định tính khơng có cách xếp hạng câu trả lời (có/khơng) biến phụ thuộc định lượng (nhiều/ít) Mơ hình xác suất đa lựa chọn thay hai lựa chọn, ví dụ anh/chị đến trường phương tiện gì: ơ-tơ, xe máy, xe đạp, / 34 Một số mô hình sử dụng biến phụ thuộc bị giới hạn (2) Mơ hình số lần xảy kiện Ví dụ số lần học viên MPP học muộn, số gia đình, số sản phẩm bị hỏng ngày, số lần khám bệnh năm Biến phụ thuộc có giá trị số nguyên dương (1, 2, ) Mô hình mơ tả xếp hạng kiện, ví dụ cảm quan anh/chị mơn học q khó/khó/trung bình/tương đối dễ/q dễ Mơ hình với biến phụ thuộc bị chặn Ví dụ thu nhập dương; số tiền người làm từ thiện năm tối thiểu dương; số làm việc tuần khơng thể q 24 × = 168 / 34 Tên gọi mơ hình sử dụng biến phụ thuộc có giới hạn Mơ hình xác suất (Logit, Probit, Multinomial Logit) Mơ hình số lần xảy kiện (Poisson) Mơ hình với biến phụ thuộc bị chặn (Tobit, Censored, Truncated Regression) / 34 Điều xảy sử dụng cơng cụ OLS giả định mơ hình CLRM vào liệu có biến phụ thuộc bị giới hạn? Xem xét mơ hình: SMOKINGi = β0 + β1 ∗ PRICEi + ui (1) SMOKINGi biến định tính cho hành vi hút thuốc trẻ vị thành niên, nhận giá trị có hút thuốc khơng Biến giải thích giá bán lẻ SMOKINGi = for for smoker non − smoker Trong mơ hình thơng thường, β1 thay đổi biến phụ thuộc SMOKING biến giải thích PRICE tăng đơn vị Đối với biến phụ thuộc nhị phân, SMOKINGi nhận giá trị 1, ý nghĩa β1 gì? / 34 Mơ hình xác suất tuyến tính - Linear Probability Model (LPM) Với giả thiết kỳ vọng biến dư 0, E [u|PRICE ] = 0: E [SMOKING |PRICE ] = β0 + β1 ∗ PRICE (2) Đồng thời: E [SMOKING ] = ∗ P(SMOKING = 1) + ∗ P(SMOKING = 0) = P(SMOKING = 1) ⇒ P(SMOKING = 1|PRICE ) = β0 + β1 ∗ PRICE Điều có nghĩa xác suất quan sát vị thành niên hút thuốc mơ hình tuyến tính biến giải thích PRICE Ví dụ β = −0.1, giá bán tăng đơn vị xác suất vị thành niên hút thuốc giảm 10% / 34 Mơ hình xác suất tuyến tính (2) Những vấn đề mơ hình xác suất tuyến tính: Nếu β1 = −0.1 tăng giá bán thêm 20 đơn vị có làm cho xác suất hút thuốc giảm hay chí âm không? Tác động biên giá bán cố định có hợp lý khơng? Ví dụ giá thuốc tăng từ 10.000đ lên 20.000đ/bao có khác so với tăng từ 100.000đ lên 110.000đ/bao không? Giả định phương sai khơng đổi mơ hình CLRM, Var (ui ) = σ , bị vi phạm Khi này: Var (ui |Xi) = Pi ∗ (1 − Pi ) , với Pi = β0 + β1 ∗ PRICEi ⇒ Var (ui |PRICEi ) ∈ PRICEi , hay nói cách khác, phương sai sai số thay đổi.1 Biến phụ thuộc Yi phân phối Bernoulli với xác suất Pi = β0 + β1 ∗ Xi nên ui phân phối Bernoulli với xác suất Pui = − β0 − β1 ∗ Xi Phương sai phân phối Bernoulli Var (ui ) = Pui ∗ (1 − Pui ) / 34 Phương pháp xác suất tối đa - Maximum Likelihood Estimation (MLE) Khắc phục nhược điểm nêu trên, để (a) ước lượng xác suất nằm khoảng [0,1] với giá trị biến giải thích PRICE, (b) tác động biên biến giải thích khơng cố định, cần cách tiếp cận không sử dụng phương pháp OLS Giả định xác suất việc hút thuốc xác định hàm phân phối xác suất tích luỹ G(.): P(SMOKINGi = 1|PRICE ) = G (β0 + β1 ∗ PRICEi ) (3) Với hàm G (β0 + β1 ∗ PRICEi ) nhận giá trị nằm khoảng [0,1] với giá trị biến giải thích PRICE Hàm phân phối xác suất G(.) thường trước, phải dựa vào giả định lý thuyết kinh tế 10 / 34 Thực hành STATA (1) Sử dụng liệu MROZ.DTA để ước lượng mơ hình giải thích nhân tố ảnh hưởng việc tham gia lao động thức phụ nữ có gia đình sum inlf nwifeinc educ exper age kidslt6 kidsge6 Bảng mô tả liệu Variable Description Mean Std Dev Min Max inlf nwifeinc educ exper age kidslt6 kidsge6 Tham gia lao động Thu nhập ròng hộ gia đình Số năm học Số năm kinh nghiệm Tuổi Số tuổi Số từ tuổi trở lên 0.57 20.13 12.29 10.63 42.54 0.24 1.35 0.50 11.63 2.28 8.07 8.07 0.52 1.32 -0.03 30 0 96 17 45 60 N = 753 20 / 34 Thực hành STATA (2) Xác suất tham gia giả định bị ảnh hưởng yếu tố thu nhập ròng (tổng thu nhập gia đình trừ mức lương tối thiểu), trình độ học vấn, số năm kinh nghiệm làm việc (với tác động phi tuyến qua kinh nghiệm bình phương), tuổi, số nhỏ tuổi: inlfi = β0 + β1 ∗ nwifeinci + β2 ∗ educi + β3 ∗ experi + β4 ∗ experi2 +β5 ∗ agei + β6 ∗ kidslt6i + β7 ∗ kidsge6i + ui Mơ hình ước lượng phương pháp OLS cho mơ hình xác suất tuyến tính (LPM), phương pháp MLE cho mơ hình Logit Probit 21 / 34 Thực hành STATA (3) gen exper2 = exper*exper reg inlf nwifeinc educ exper exper2 age kidslt6 kidsge6, robust logit inlf nwifeinc educ exper exper2 age kidslt6 kidsge6 probit inlf nwifeinc educ exper exper2 age kidslt6 kidsge6 22 / 34 Diễn giải so sánh LPM với MLE nào? Các ước lượng mơ hình LPM diễn giải trực tiếp tác động biên biến giải thích, ví dụ có thêm tuổi khiến xác suất tham gia lao động phụ nữ giảm 26% Tác động biên ước lượng MLE phải tính cơng thức (12) (13) Do tác động biên thay đổi tuỳ thuộc vào giá trị gốc nên ví dụ tính tác động biên giá trị trung bình biến giải thích Sử dụng lệnh: logit inlf nwifeinc educ exper exper2 age kidslt6 kidsge6 mfx, at(mean) Lưu ý: trị kiểm định mơ hình LPM t-test, mơ hình Logit Probit z-test 23 / 34 Giải thích mơ hình Logit (1) Tại giá trị trung bình biến giải thích Bảng mơ tả liệu, số năm học tăng năm, xác suất tham gia lao động tăng 5.4% Có thể tính tác động biên giá trị khác biến độc lập lệnh: mfx, at(mean kidslt6=0) mfx, at(mean kidslt6=1) mfx, at(mean kidslt6=2) 24 / 34 Giải thích mơ hình Logit (2) Có thể kiểm tra tác động biên biến giáo dục công thức: ∂P ∂X ∂P ∂X = g (β0 + β1 ∗ X1 + + β6 ∗ X6 ) ∗ βeduc (14) educ = g (−.0213∗20.13+.221∗12.29+.206∗10.63−.00315∗10.632 educ (15) −.088 ∗ 42.54 − 1.443 ∗ 24 + 0601 ∗ 1.35 + 425) ∗ 221 = g (.537) ∗ 221 với hàm mật độ phân phối Logistic g (.) = ∂P ∂X = educ ez : (1+e z )2 2.718.537 ∗ 221 = 0515 (1 + 2.718.537 )2 (16) ⇒ Kết tương đồng với kết luận 25 / 34 Giải thích mơ hình Logit (3) Có thể tính tác động biên lệnh sau STATA: logit inlf nwifeinc educ exper exper2 age kidslt6 kidsge6 qui sum nwifeinc scalar _x1 = r(mean) qui sum educ scalar _x2 = r(mean) qui sum exper scalar _x3 = r(mean) qui sum age scalar _x4 = r(mean) qui sum kidslt6 scalar _x5 = r(mean) qui sum kidsge6 scalar _x6 = r(mean) scalar xb = (_b[_cons] + _b[nwifeinc]*_x1 + _b[educ]*_x2 + _b[exper]*_x3 + _b[exper2]*_x3 ^ + _b[age]*_x4 + _b[kidslt6]*_x5 + _b[kidsge6]*_x6) di ‘Tac dong bien cua mot nam hoc =’ exp(xb)/(1+exp(xb)) ^ * _b[educ] 26 / 34 Giải thích mơ hình Logit (4) Đối với biến số nhỏ tuổi, số ước lượng 35% biến liên tục Do số biến rời rạc, phải sử dụng công thức (13) để tính tác động biên việc có thêm Ví dụ xác suất tham gia lao động thay đổi phụ nữ chưa có nhỏ tuổi chuyển sang có nhỏ tuổi? ∆P = Gˆ(β0 +β1 ∗X1 + +βkidslt6 )− Gˆ(β0 +β1 ∗X1 + ) (17) với G(.) hàm phân phối tích luỹ Logistic, G (z) = ez 1+e z : ∆P = Gˆ(−.559) − Gˆ(.884) = 364 − 708 = −.344 ⇒ xác suất tham gia lao động giảm 34.4% 27 / 34 Khả dự báo mơ hình xác suất (1) Khả dự báo mơ hình: thể xác suất mơ hình dự đoán thực tế, bao gồm dự báo việc tham gia không tham gia Một dự báo coi xác suất tham gia ước lượng > 0.5 người tham gia thực tế, xác suất tham gia ước lượng < 0.5 người không tham gia thực tế Ma trận dự báo Dự báo Có Có X1 [Đúng] Không X2 [Sai] X3 [Sai] X1 + X3 X4 [Đúng] X2 + X4 Tổng số X1 + X2 Thực tế Không Tổng số Khả dự báo mô hình γ = X3 + X4 Xi X 1+X X 1+X 2+X 3+X 28 / 34 Khả dự báo mơ hình xác suất (2) logit inlf nwifeinc educ exper exper2 age kidslt6 kidsge6 predict p, pr di ‘tinh xac suat du bao dung voi phu nu di lam’ count if p>0.5 & inlf==1 count if inlf == di ‘tinh xac suat du bao dung voi phu nu khong di lam’ count if p chi2 = 0.0000 ⇒ bác bỏ H0 Ít hai biến giải thích, hai có ý nghĩa thống kê mơ hình 32 / 34 Tự thực hành Học viên ước tính tác động biên sử dụng mơ hình Probit giá trị khác biến giải thích: giá trị tối đa/tối thiểu, tứ phân vị So sánh tác động biên với ước lượng từ mơ hình LPM Học viên so sánh tác động biên khả dự báo mơ hình Logit Probit 33 / 34 Tài liệu tham khảo Verbeek, Marno 2000 A Guide to Modern Econometrics, John Wiley & Sons (Chapter & 7) Wooldridge, Jeffrey M 2002 Introductory Econometrics: A Modern Approach, South-Western (2nd edition, Chapter 17) 34 / 34 ...Table of contents ◦ Thế biến phụ thuộc không bị giới hạn bị giới hạn ◦ Một số mơ hình sử dụng biến phụ thuộc bị giới hạn ◦ Sử dụng hồi quy tuyến tính biến phụ thuộc bị giới hạn ◦ Phương pháp tối... 0, 1, lần Không bị giới hạn bị giới hạn: lợi nhuận công ty không giới hạn (lỗ nhận giá trị âm, lãi dương); số nhân viên bị giới hạn (bị chặn dưới, nhân viên cơng ty) Biến phụ thuộc định tính... hố xác suất - MLE → Ước lượng mơ hình hồi quy Logit Probit ◦ Thực hành STATA / 34 Thế biến phụ thuộc không bị giới hạn bị giới hạn Các loại biến phụ thuộc mơ hình hồi quy: Liên tục rời rạc: tăng