Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 29 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
29
Dung lượng
3,57 MB
Nội dung
Chương Các mơ hình logit probit Domadar N Gujarati (Econometrics by example, 2011) Người dịch diễn giải: Phùng Thanh Bình, MB (25/12/2017) Biến phụ thuộc hầu hết mơ hình hồi quy số, thường đo theo thang đo tỷ lệ (ratio scale) Nhưng nhiều ứng dụng biến phụ thuộc định danh (nominal) theo nghĩa chúng biểu phân loại (categories), nam nữ, có gia đình chưa có gia đình, có việc làm thất nghiệp, lực lượng lao động không thuộc lực lượng lao động Giả sử có liệu người trưởng thành, số họ hút thuốc số khác khơng Hơn nữa, giả sử muốn biết nhân tố định việc người hút thuốc hay không Vì biến tình trạng hút thuốc biến định danh; bạn hút thuốc bạn khơng hút thuốc Chúng ta mơ hình hóa biến định danh thế nào? Chúng ta sử dụng kỹ thuật hồi quy cổ điển hay cần kỹ thuật chuyên biệt? Các mơ hình hồi quy liên quan đến biến có thang đo định danh ví dụ lớp mơ hình gọi chung mơ hình hồi quy phản ứng định tính (qualitative response regression models) Có nhiều loại mơ thế, chương xem xét loại đơn giản mơ hình đó, có tên gọi mơ hình hồi quy có biến phụ thuộc biến giả biến nhị phân (binary or dichotomous) Trong chương tiếp theo, xem xét loại khác mơ hình hồi quy phản ứng định tính Mục tiêu chương nhằm cho thấy mơ hình hồi quy biến nhị phân ước lượng theo phương pháp bình phương bé nhất, mơ thường ước lượng theo phương pháp đặc biệt, chẳng hạn logit probit Trước hết cho thấy phương pháp bình phương bé khơng thích hợp sau xem xét mơ hình logit probit Chúng ta bắt đầu ví dụ 8.1 Một ví dụ minh họa: hút không hút Dữ liệu sử dụng mẫu ngẫu nhiên gồm 1.196 nam1 Dữ liệu dung cấp tập tin Table 8.1, tìm thấy trang web đồng hành sách Các biến sử dụng phân tích sau đây: Smoker = cho người hút thuốc cho người khơng hút thuốc Age = tuổi tính theo năm Education = số năm học Income = thu nhập gia đình Pcigs = giá thuốc hút bang riêng lẻ vào năm 1979 Các liệu từ trang web Michael P Murray, Econometrics: A Modern Introduction, Addison-Wesley, Boston, 2006 Xem http://www.aw.bc.com/murray Nhưng liệu sử dụng John Mullay, Instrumental variable estimation of count data models: an application to models of cigarette smoking behavior, The Review of Economics and Statistics, 1997 8.2 Mơ hình xác suất tuyến tính (LPM) Vì biến phụ thuộc, người hút thuốc, biến định danh, nên nhận giá trị (cho người hút thuốc) (cho người không hút thuốc) Giả sử thường lệ áp dụng phương pháp bình phương bé thơng thường (OLS) để xác định hành vi hút thuốc mối quan hệ với biến tuổi, giáo dục, thu nhập gia đình, giá thuốc Nghĩa là, sử dụng mô hình sau đây: Để đơn giản, viết lại sau: Mơ hình (8.2) gọi mơ hình xác suất tuyến tính (LPM – linear probability model) kỳ vọng có điều kiện biến phụ thuộc (tình trạng hút thuốc), cho trước giá trị biến giải thích, giải thích xác suất có điều kiện (conditional probability) mà biến cố (tức có hút thuốc) xảy ra2 Sử dụng Eviews, có kết Bảng 8.2 Chúng ta phân tích kết bảng Lưu ý tất biến, trừ thu nhập, có ý nghĩa thống kê mức ý nghĩa 10% Tuổi, giáo dục, giá thuốc có tác động âm lên hút thuốc, điều kết ngạc nhiên Tất biến giải thích đồng thời có ý nghĩa thống kê, giá trị ước lượng thống kê F 12.00 có giá trị xác suất p Nếu Pi = Pr(Yi = 1) (1 - Pi) = Pr(Yi = 0), giá trị kỳ vọng Yi = E(Yi) = 1.Pi + 0.(1 - Pi) = Pi Nhớ lại giá trị F dùng để kiểm định giả thuyết tất hệ số độ dốc đồng thời Bảng 8.2: Mơ hình LPM hút khơng hút thuốc Vì ước lượng mơ hình xác suất tuyến tính, nên việc giải thích hệ số hồi quy sau Nếu giữ nguyên tất biến khác, xác suất hút thuốc giảm với tỷ lệ 0.005 tăng thêm tuổi, điều tác động xấu hút thuốc lên sức khỏe Tương tự, yếu tố khác giữ nguyên, tăng số năm học thêm năm giảm xác suất hút thuốc khoảng 0.02 Tương tự, giá thuốc tăng thêm đơla, xác suất hút thuốc giảm khoảng 0.005, giữ biến khác không đổi Giá trị R2 0.038 dường thấp, đừng đặt quan trọng nhiều vào thống kê biến phụ thuộc biến định danh, nhận giá trị Chúng ta cải thiện (refine) mơ hình cách đưa thêm biến tương tác (interaction terms), tuổi nhân với giáo dục, giáo dục nhân với thu nhập, đưa thêm biến bình phương giáo dục bình phương tuổi vào mơ hình để xem liệu có tác động phi tuyến biến lên hút thuốc hay khơng Nhưng khơng có sở để làm điều này, LPM thân có nhiều hạn chế Thứ nhất, mơ hình LPM giả định xác suất hút thuốc có mối quan hệ tuyến tính với giá trị biến giải thích, khơng cần biết giá trị lớn nhỏ Thứ hai, theo lơgic, giá trị xác suất phải nằm Nhưng khơng có đảm bảo giá trị xác suất ước lượng từ mơ hình LPM nằm giới hạn Điều OLS khơng tính đến ràng buộc xác suất ước lượng phải nằm giới hạn Thứ ba, giả định thông thường hạng nhiễu theo phân phối chuẩn thỏa mãn biến phụ thuộc nhận giá trị Cuối cùng, hạng nhiễu mơ hình LPM có phương sai thay đổi, điều làm cho kiểm định ý nghĩa truyền thống khơng thể tin cậy Vì tất lý này, mà mơ hình LPM khơng phải lựa chọn ưa thích để mơ hình hóa biến nhị phân Các mơ hình thay thảo luận lý thuyết mơ hình logit mơ hình probit 8.3 Mơ hình logit Trong ví dụ người hút thuốc, mục tiêu ước lượng xác suất hút thuốc, cho trước giá trị biến giải thích Khi xây dựng hàm xác suất thế, cần nhớ hai điều kiện: (1) Xi, giá trị (các) biến giải thích thay đổi, xác suất ước lượng nằm khoảng – 1, (2) mối quan hệ Pi Xi phi tuyến, nghĩa là, “xác suất tiến gần với đốc độ chậm dần Xi nhỏ tiến gần với tốc độ chậm dần Xi lớn”3 Các mơ hình logit probit thỏa mãn điều kiện John H Aldridge and Forrest Nelson, Linear Probability, Logit and Probit Models, Sage Publications, 1984, p.26 Trước hết xem xét mơ hình logit tương đối đơn giản mặt tốn học Giả sử ví dụ chúng ta, định cá nhân có hút thuốc hay không phụ thuộc vào số hữu dụng quan sát (unobservable utility index) I*i, số phụ thuộc vào biến giải thích tuổi, giáo dục, thu nhập gia đình giá thuốc lá4 Chúng ta thể số sau: Trong đó, i = cá nhân thứ i, u = hạng nhiễu, BX định nghĩa phương trình (8.2) Nhưng số khơng thể quan sát có quan hệ với định thực hút hay không hút? Thật hợp lý để giả định rằng: Yi = (một người hút thuốc) I*i Yi = (một người không hút thuốc) I*i < Nghĩa là, số hữu dụng I người lớn mức ngưỡng I*, người hút nhỏ I*, người khơng hút Lưu ý khơng có gợi ý hút thuốc tốt hay xấu cho sức khỏe, có nhiều nghiên cứu y khoa khuyến cáo hút thuốc xấu cho sức khỏe Để làm cho lựa chọn thực được, nghĩ theo xác suất việc thực lựa chọn, ví dụ lựa chọn hút thuốc (tức Y = 1): Chỉ số hữu dụng gọi biến tiềm ẩn (latent variable) Bây xác suất phụ thuộc vào phân phối xác suất Yi, đến lượt lại phụ thuộc vào phân phối xác suất hạng nhiễu, ui5 Nếu phân phối xác suất đối xứng quanh giá trị trung bình (bằng 0) nó, phương trình (8.4) viết lại là: Rõ ràng Pi phụ thuộc vào phân phối xác suất cụ thể ui Nhớ xác suất mà biến ngẫu nhiên nhận giá trị nhỏ giá trị xác định cho hàm phân phối tích lũy (CDF – cumulative distribution function) biến đó6 Mơ hình logit giả định phân phối xác suất ui theo phân phối xác suất logistic (logistic probability distribution), ví dụ viết lại sau: Trong đó, Pi = xác suất hút thuốc (tức Yi = 1) Lưu ý B cố định phi ngẫu nhiên giá trị X cho trước Vì thế, biến thiên Yi xuất phát từ biến thiên ui Nhớ lại từ thống kê hàm phân phối tích lũy biến ngẫu nhiên X, F(X), định nghĩa F(X) = Pr(X x), x giá trị cụ thể X Cũng nhắc lại bạn vẽ đồ thị CDF, trơng giống hình chữ S kéo dài (elongated S) Xác suất Y = 0, nghĩa là, người người hút thuốc, cho bởi: Lưu ý: Dấu Zi phương trình (8.7) (8.8) khác Biến đổi phương trình (8.9)? −Zi − Pi = − = −Zi 1+ e −1 e = = + e−Zi + e−Zi + e−Zi 1 e−Zi + e−Zi = e−Zi e−Zi = + e−Zi e−Zi 1 = = (8.9) eZi + 1 + eZi e−Zi Chúng ta dễ dàng xác nhận Zi chạy từ - đến + , Pi chạy từ đến Pi có quan hệ phi tuyến với Zi (tức Xi), thỏa mãn hai điều kiện vừa thảo luận trên7 Chúng ta ước lượng mơ hình (8.7) nào, phi tuyến khơng X mà tham số Bs? Chúng ta sử dụng cách chuyển hóa đơn giản để làm cho mơ hình tuyến tính Xs hệ số Lấy tỷ số phương trình (8.7) (8.9), nghĩa xác suất mà người người hút thuốc xác suất mà người khơng phải người hút thuốc, có: Lý Pi có quan hệ phi tuyến với, ví dụ, thu nhập thu nhập tăng lên người hút thuốc tăng tiêu dùng họ cho thuốc với mức giảm dần quay luật hiệu suất giảm dần (law of diminishing returns) Điều với hầu hết hàng hóa thơng thường Diễn giải chút: Zi 1+e + e−Zi + eZi 1+e + eZi eZi = = Zi = = eZi = (8.10) Z i e +1 1+ e + Zi Z i e e Zi Giải thích thêm: Pi = eZi => Pi = (1 − Pi ) eZi = eZi − Pi eZi − Pi Zi Zi Zi ) => Pi + Pi e = e => Pi (1 + e eZi = e => Pi = + eZi Zi Bây giờ, Pi/(1 - Pi) đơn giản tỷ số odds (odds ratio) ủng hộ việc hút thuốc – tỷ số xác suất mà người người hút thuốc so với xác suất mà người khơng phải người hút thuốc Lấy log (tự nhiên) phương trình (8.10), có kết thú vị, là: Phương trình (8.11) phát biểu log tỷ số odds hàm tuyến tính Bs biến Xs Li gọi logit (log tỷ số odds) có tên mơ hình logit (logit model) cho mơ hình giống (8.11) Điều thú vị mà ta quan sát thấy mơ hình xác suất tuyến tính thảo luận trước giả định Pi có quan hệ tuyến tính với Xi, mơ hình logit giả định log tỷ số odds có quan hệ tuyến tính với Xi Một số tính chất mơ hình logit sau: Khi Pi, xác suất tăng từ đến 1, logit Li từ - đến + Nghĩa là, xác suất nằm 1, logit khơng có giới hạn Mặc dù Li tuyến tính theo Xi, thân xác suất khơng Điều trái với mơ hình LPM xác suất tăng tuyến tính với Xi Nếu Li, logit, dương, có nghĩa giá trị (các) biến giải thích tăng, tỷ số odds hút thuốc tăng, âm, tỷ số odds hút thuốc giảm Sự giải thích mơ hình logit (8.11) sau: hệ số dốc cho biết log odds ủng hộ việc hút thuốc thay đổi giá trị biến X thay đổi đơn vị Một hệ số mơ hình logit ước lượng, dễ dàng tính xác suất hút thuốc, khơng có tỷ số odds hút thuốc, từ (8.7) Trong mơ hình LPM, hệ số dốc đo lường ảnh hưởng biên (marginal effect) thay đổi đơn vị biến giải thích lên xác suất hút thuốc, giữ nguyên biến khác Điều khơng với mơ hình logit, ảnh hưởng biên thay đổi đơn vị biến giải thích khơng phụ thuộc vào hệ số biến đó, mà phụ thuộc vào mức xác suất từ mà thay đổi đo lường Nhưng mức xác suất phụ thuộc vào giá trị tất biến giải thích mơ hình8 Tuy nhiên, phần mềm thống kê Eviews Stata tính tốn ảnh hưởng biên với hướng dẫn đơn giản Bây câu hỏi đặt là: ước lượng tham số mơ hình logit nào? Các bạn đọc có khả giải tích xác nhận điều bạn lấy đạo hàm (riêng phần) phương trình (8.7) theo biến giải thích phù hợp, lưu ý Zi = BX Lưu ý: sử dụng quy tắc dây chuyền (hàm hàm, chain rule): Pi/Xi = Pi/Zi Zi/Xi 10 theo phân phối Chi bình phương với số bậc tự với số biến giải thích: ví dụ Như Bảng 8.3 cho thấy, giá trị thống kê LR khoảng 47.26 giá trị xác suất p (tức mức ý nghĩa xác) thực tế 0, bác bỏ giả thuyết Ho Vì nói bốn biến đưa vào mơ hình logit nhân tố định quan trọng thói quen hút thuốc • Lưu ý kỹ thuật số 1: Bảng 8.3 đưa hai thống kê log likelihood – unrestricted likelihood (= - 770.84) restricted likelihood (= -794.47) Thống kê thứ hai có cách giả sử khơng có biến giải thích mơ hình, có hệ số cắt, unrestricted likelihood giá trị có với tất biến giải thích (kể hệ số cắt) mơ hình Thống kê LR (= ) khoảng 47.27 Bảng 8.3 tính từ cơng thức trình bày Phụ lục cuối chương Đối với ví dụ chúng ta, tỷ số hợp lý tính tốn (computed likelihood ratio) 47.27 có ý nghĩa thống kê cao, giá trị xác suất thực tế 012 Điều nói mơ hình khơng bị ràng buộc (unrestricted model) bao gồm tất biến giải thích mơ hình phù hợp ví dụ Nói theo cách khác, mơ hình bị ràng buộc khơng hợp lý trường hợp • Lưu ý kỹ thuật số 2: Lưu ý sai số chuẩn Huber/White báo cáo Bảng 8.3 không thiết cải thiện phương sai thay đổi (robust to heteroscedasticity) cải thiện nhằm tránh sai dạng phân phối xác suất (robust to certain misspecification of the underlying probability distribution) biến phụ thuộc 12 Như lưu ý Phụ lục cuối chương 1, giả thuyết Ho hệ số tất biến giải thích mơ hình 0, thống kê LR theo phân phối Chi bình phương với bậc tự số biến giải thích (loại trừ hệ số cắt), ví dụ 15 Cải thiện mơ hình (model refinement) Mơ hình logit cho Bảng 8.3 cải thiện Ví dụ, đưa thêm ảnh hưởng tương tác biến giải thích Từng biến riêng lẻ giáo dục có tác động âm thu nhập có tác động dương lên xác suất hút thuốc, ảnh hưởng thu nhập khơng có ý nghĩa thống kê Nhưng ảnh hưởng kết hợp giáo dục thu nhập lên xác suất sao? Những người có trình độ giáo dục cao mức thu nhập cao hút hay nhiều người có đặc điểm khác? Để biết điều này, đưa thêm ảnh hưởng tương tác hai biến biến giải thích tăng thêm vào mơ hình Các kết trình bày Bảng 8.4 Bảng 8.4: Mơ hình logit hút thuốc với biến tương tác 16 Các kết thú vị Trong Bảng 8.3, xét biến biến giáo dục có ảnh hưởng âm có ý nghĩa lên logit (vì lên xác suất hút thuốc) biến thu nhập khơng có tác động có ý nghĩa thống kê Bây giáo dục thân khơng có tác động có ý nghĩa thống kê lên logit, thu nhập có tác động dương có ý nghĩa thống kê cao Nhưng bạn xem xét biến tương tác, giáo dục nhân với thu nhập, có tác động âm có ý nghĩa lên logit Nghĩa là, người với trình độ giáo dục cao có thu nhập cao có khả người hút thuốc so với người có giá dục cao có thu nhập cao Điều gợi cho tác động biến lên xác suất hút thuốc bị suy yếu tăng lên có diện (các) biến khác Bạn đọc khuyến khích làm thử tương tác khác biến giải thích để xem có tìm thấy kết khác hay khơng Ước lượng mơ hình logit với liệu nhóm Giả sử nhóm liệu người hút thuốc thành 20 nhóm với khoảng 60 quan sát cho nhóm Đối với nhóm, biết số người hút thuốc, ví dụ ni Chúng ta chia ni cho 60 để có giá trị ước lượng xác suất (thực nghiệm) người hút thuốc cho nhóm đó, ví dụ pi Vì thế, có ta có 20 giá trị pi ước lượng (estimated pi) Chúng ta sử dụng xác suất để ước lượng hồi quy logit phương trình (8.11) theo OLS Khi liệu có sẵn phân chia theo nhóm, việc phân thành nhóm theo cách vừa đề nghị đoạn có nhiều vấn đề Thứ nhất, phải định hình thành nhóm Nếu hình thành q nhóm, có pi để ước lượng phương trình (8.11) Trái lại, hình thành q nhiều nhóm, có vài quan sát nhóm, điều khó mà ước lượng pi cách hiệu 17 Thứ hai, chí có số nhóm vừa phải (right number of groups), vấn đề với ước lượng mơ hình logit theo nhóm hạng nhiễu (8.11) có phương sai thay đổi Vì phải thận trọng với vấn đề phương sai thay đổi cách chuyển hóa thích hợp sử dụng sai số chuẩn cải thiện theo phương pháp White, chủ đề thảo luận chương Chúng ta không minh họa ước lượng mơ hình logit với liệu nhóm với liệu người hút thuốc lý thảo luận Ngồi ra, có liệu cấp vi mơ sử dụng phương pháp ML để ước lượng mơ hình logit, thấy phần (nhưng xem Bài tập 8.4) 8.4 Mơ hình probit Trong mơ hình LPM, hạng nhiễu khơng có phân phối chuẩn; mơ hình logit, hạng nhiễu có phân phối logistic Một mơ hình ‘đối thủ’ khác mơ hình probit, hạng nhiễu có phân phối chuẩn Với giả định phân phối chuẩn cho trước, xác suất để I*i nhỏ Ii tính từ hàm phân phối tích lũy chuẩn hóa (CDF – standard normal cumulative distribution function) sau13: Trong đó, Pr(Y|X) có nghĩa xác suất mà biết cố xảy (ví dụ có hút thuốc) cho trước giá trị biến X Z biến chuẩn hóa (tức biến chuẩn với trung bình phương sai 1) F CDF chuẩn hóa, ngữ cảnh viết lại sau: Nếu biến X theo phân phối chuẩn với trung bình phương sai 2, hàm mật độ xác suất (PDF) 2 𝑋0 là: f(X) = (1/𝜎√𝜋)𝑒 −(𝑋− 𝜇) /2𝜎 hàm phân phối tích lũy (CDF) là: F(X0) = ∫−∞ (1/ 13 2 𝜎√𝜋)𝑒 −(𝑋− 𝜇) /2𝜎 𝑑𝑋, X0 giá trị cụ thể X Nếu = 2 = 1, PDF CDF thể PDF CDF chuẩn hóa 18 Vì P thể xác suất mà người hút thuốc, nên đo phần diện tích đường cong CDF chuẩn hóa từ - đến Ii Trong ngữ cảnh tại, F(Ii) gọi hàm probit Mặc dù việc ước lượng số hữu dụng BX tham số Bs phức tạp mơ hình probit, phương pháp ML sử dụng để ước lượng chúng Đối với ví dụ chúng ta, giá trị ước lượng theo ML mơ hình probit trình bày Bảng 8.5 Bảng 8.5: Mơ hình probit hút thuốc 19 Mặc dù giá trị số hệ số hồi quy logit probit khác nhau, mặt định tính kết tương tự nhau: hệ số tuổi, giáo dục giá thuốc có ý nghĩa thống kê mức ý nghĩa 10% Tuy nhiên, hệ số thu nhập khơng có ý nghĩa Có cách so sánh hệ số mơ hình logit probit Mặc dù phân phối logistic chuẩn (standard logistic, tảng logit) phân phối chuẩn hóa (standard normal, tảng probit) có trung bình phương sai chúng khác nhau: phân phối chuẩn hóa 2/3 phân phối logistic, 22/7, tức khoảng 3.14 Vì thế, nhân hệ số probit cho khoảng 1.81 ( /√3), có xấp xỉ hệ số logit Ví dụ, hệ số probit biến tuổi = -0.0129 Nếu nhân hệ số với 1.81, có -0.0233, số so sánh trực tiếp với hệ số tuổi mơ hình logit Bảng 8.3 [Ở đây, Gujarati nhầm -0.01296 Bảng 8.5 với -0.0235] Chúng ta giải thích hệ số mơ hình probit cho Bảng 8.5 nào? Ví dụ, ảnh hưởng biên lên xác suất hút thuốc tuổi tăng thêm năm, giữ nguyên yếu tố khác khơng đổi Ảnh hưởng biên tính cách lấy hệ số biến tuổi, -0.0130, nhân với giá trị hàm mật độ chuẩn đánh giá cho tất X cho cá nhân Để minh họa, xem liệu người hút thuốc số mẫu chúng ta, thông tin người sau: tuổi = 21, giáo dục = 12, thu nhập = 8.500, giá = 60.6 Thế giá trị vào hàm mật độ chuẩn cho thích 13, có: f(BX) = 0.3983 Nhân giá trị với -0.0130, có 0.0051 Con số có nghĩa với giá trị cho trước biến giải thích, xác suất mà người hút thuốc giảm khoảng 0.005 tuổi tăng thêm năm Nhớ lại có trường hợp tương tự tính ảnh hưởng biên biến giải thích lên xác suất hút thuốc mơ hình logit 20 Như bạn thấy, tính tốn ảnh hưởng biên biến giải thích lên xác suất hút thuốc cá nhân theo cách công việc chán ngắt, phần mềm Stata Eviews làm cơng việc tương đối nhanh chóng Nhân tiện, ước lượng mơ hình probit cho ảnh hưởng tương tác mơ hình logit trình bày Bảng 8.6 Bảng 8.6: Mơ hình probit hút thuốc với biến tương tác [ Như bạn thấy, kết Bảng 8.4 8.6 giống Nhưng bạn phải sử dụng hệ số chuyển đổi (conversion factor) khoảng 1.81 21 để làm cho hệ số mơ hình probit so sánh trực tiếp với hệ số mơ hình logit14 Nhân tiện, lưu ý ước lượng mơ hình probit cho liệu nhóm, gọi mơ hình probit liệu nhóm, tương tự mơ hình logit liệu nhóm Nhưng không theo đuổi việc Logit với probit Các mơ hình logit probit nói chung cho kết tương tự; khác biệt hai mơ hình phân phối logistic có đuôi mỏng [Gujarati dùng từ fatter, dầy không đúng]; nhớ lại phương sai biến ngẫu nhiên theo phân phối logistic khoảng 2/3, biến ngẫu nhiên theo phân phối chuẩn hóa Điều nói lên rằng, xác suất có điều kiện Pi tiến với tốc độ chậm mơ hình logit so với mơ hình probit Nhưng thực tế khơng có lý thuyết phục để chọn mơ hình khơng phải mơ hình Nhiều nhà nghiên cứu thích chọn logit tương đối đơn giản mặt tốn học 8.5 Tóm tắt kết luận Trong chương này, thảo luận mơ hình hồi quy phản ứng định tính đơn giản biến phụ thuộc biến nhị phân, nhận giá trị có thuộc tính giá trị khơng có thuộc tính Mặc dù mơ hình biến phụ thuộc nhị phân ước lượng OLS, trường hợp chúng gọi mô hình xác suất tuyến tính (LPM), OLS khơng phải phương pháp ước lượng ưa thích cho mơ hai hạn chế: (1) xác suất ước lượng từ LPM không thiết nằm giới hạn 1, (2) LPM giả định xác suất phản 14 Một hệ hệ chuyển đổi để so sánh mơ hình LPM mơ hình logit cho Bài tập 8.1 22 ứng dương tăng tuyến tính với mức độ biến giải thích, điều phản trực quan Bạn kỳ vọng tốc độ tăng xác suất giảm sau điểm Các mơ hình hồi quy phản ứng nhị phân ước lượng mơ hình logit probit Mơ hình logit sử dụng phân phối xác suất logistic để ước lượng tham số mơ hình Mặc dù dường phi tuyến, log tỷ số odds, gọi logit, làm cho mơ hình logit trở thành tuyến tính tham số Nếu có liệu theo phân nhóm, ước lượng mơ hình logit OLS Nhưng có liệu vi mơ, phải sử dụng phương pháp hợp lý tối đa (ML) Trong trường hợp liệu theo phân nhóm, phải điều chỉnh phương sai thay đổi hạng nhiễu Không giống mơ hình LPM, ảnh hưởng biên biến giải thích mơ hình logit phụ thuộc khơng vào hệ số biến mà giá trị tất biến giải thích mơ hình Một mơ hình khác với logit mơ hình probit Phân phối xác suất probit phân phối chuẩn Các tham số mơ hình probit thường ước lượng phương pháp hợp lý tối đa (ML) Giống mơ hình logit, ảnh hưởng biên biến giải thích mơ hình probit liên quan đến tất biến giải thích mơ hình Các hệ số logit probit khơng thể so sánh cách trực tiếp Nhưng bạn nhân hệ số mơ hình probit cho 1.81, chúng so sánh với hệ số mơ hình logit Sự chuyển đổi cần thiết phương sai phân phối logistic phân phối chuẩn khác 23 Trong thực tế, mơ hình logit probit cho kết tương tự Sự lựa chọn chúng phụ thuốc vào sẵn có phần mềm dễ dàng việc giải thích kết quả./ Hướng dẫn Stata (😊) use "D:\My Blog\Econometrics by example\Table8_1.dta" , clear 24 quietly logit smoker age educ income pcigs79 outreg2 using model1, ti(Chapter 8, Gujarati) ct(Logit Model) replace quietly probit smoker age educ income pcigs79 outreg2 using model1, ti(Chapter 8, Gujarati) ct(Probit Model) append 25 26 quietly logit smoker age educ income pcigs79 quietly fitstat, saving(mod1) quietly logit smoker age educ income pcigs79 educincome fitstat, using(mod1) 27 28 29 ... làm cho hệ số mô hình probit so sánh trực tiếp với hệ số mơ hình logit1 4 Nhân tiện, lưu ý ước lượng mơ hình probit cho liệu nhóm, gọi mơ hình probit liệu nhóm, tương tự mơ hình logit liệu nhóm... ước lượng mơ hình logit probit Mơ hình logit sử dụng phân phối xác suất logistic để ước lượng tham số mơ hình Mặc dù dường phi tuyến, log tỷ số odds, gọi logit, làm cho mơ hình logit trở thành... thích mơ hình logit phụ thuộc không vào hệ số biến mà giá trị tất biến giải thích mơ hình Một mơ hình khác với logit mơ hình probit Phân phối xác suất probit phân phối chuẩn Các tham số mơ hình probit