kinh tế lượng (econometrics) là một bộ phận của kinh tế học, được hiểu theo nghĩa rộng là môn khoa học kinh tế giao thoa với thống kê học và toán kinh tế.
Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 1 Thuc Doan/Hao Thi CHƯƠNG 12 Biến Phụ Thuộc Đònh Tính Và Giới Hạn Trong tất cả các chủ đề đã thảo luận trước đây, chúng ta đều xem xét các giá trò của một biến phụ thuộc như thể chúng thay đổi liên tục. Tuy nhiên, nhiều tình huống xuất hiện không phải là trường hợp như vậy. Ví dụ, giả sử chúng ta mong muốn lập mô hình ra quyết đònh mua của một hộ gia đình, cụ thể hơn, quyết đònh có nên mua một chiếc xe hơi hay không. Tại thời điểm khảo sát, một gia đình nào đó hoặc sẽ mua hoặc không mua một chiếc xe. Trong tình huống này, chúng ta có một biến phụ thuộc đònh tính – tức là, ta sẽ cho ra giá trò 1 nếu hộ gia đình này mua xe và giá trò 0 nếu không mua. Những quyết đònh của các hộ gia đình khác ví dụ như có mua một ngôi nhà, đồ trang trí nội thất, dụng cụ điện, hoặc những hàng hóa lâu bền khác hay không là những ví dụ mà biến phụ thuộc có thể là một biến giả. Trong thò trường lao động, quyết đònh có gia nhập lực lượng lao động, sa thải một nhân viên, hoặc tham gia vào công đoàn hay không là những ví dụ của các loại biến phụ thuộc nhò nguyên. Trong những trường hợp này, diễn giải của biến phụ thuộc này đó là một phương pháp xác suất mà nó nhận giá trò 0 hoặc 1, mặc dù giá trò lý thuyết có thể là bất kỳ giá trò trung gian nào. Trong Chương 7, chúng ta đã giới thiệu các biến giả (hoặc là biến nhò nguyên) và mô tả sự hữu dụng của chúng trong việc có được những tác động của các biến độc lập đònh lượng lên biến phụ thuộc. Các vấn đề đặc biệt nảy sinh khi biến phụ thuộc là biến nhò nguyên. Những mô hình có các biến phụ thuộc loại này được xem như những mô hình lựa chọn rời rạc hay những mô hình phản ứng đònh tính. Biến phụ thuộc cũng có thể có nhiều dạng khác mà chúng không liên tục. Ví dụ, trong ví dụ mua xe, giả sử, trong một thời đoạn cho trước, chúng ta liên hệ chi phí cho một xe với một số biến quyết đònh ví dụ như thu nhập và độ lớn của gia đình. Trong ví dụ như vậy, biến phụ thuộc sẽ liên tục, nhưng với một bước nhảy lớn ở điểm 0 – chi phí sẽ là 0 nếu hộ gia đình không mua xe. Do đó, mẫu có thể bao gồm một số quan sát với giá trò 0 cùng với những giá trò hàng ngàn. Tình huống này cũng cần phải có một dạng phân tích đặc biệt. Các biến phụ thuộc của loại này được biết đến như là những biến phụ thuộc giới hạn. Chương này xem xét đến những vấn đề đặc biệt xuất phát từ các biến phụ thuộc đònh tính và giới hạn và những kỹ thuật cần thiết để giải quyết các vấn đề này. Bởi vì phương pháp sử dụng ở đây là nguyên lý thích hợp cực đại (mô tả trong phần phụ lục của Chương 2 và 3), mà nó vượt xa phạm vi của quyển sách này, nên ở đây chỉ giới thiệu phần mở đầu cho những chủ đề này. Tuy nhiên, những ví dụ thực nghiệm được trình bày để minh họa cho những kỹ thuật đó. Để biết thêm chi tiết về các phương pháp, xem Green (2000), Maddala (1983), và Amemiya (1981), GRETL, SHAZM, và Eviews về những lệnh cần thiết cho những kỹ thuật này. } 12.1 Mô Hình Xác Suất Tuyến Tính (hoặc Lựa Chọn Nhò Nguyên) Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 2 Thuc Doan/Hao Thi Trong ví dụ mua xe, đặt Yt là xác suất mà một hộ gia đình cụ thể nào đó (thứ t trong mẫu) sẽ mua xe trong năm cho trước. Xt là thu nhập của hộ gia đình. Xem xét mô hình hồi qui đơn Yt = α + βXt + ut. Mặc dầu diễn dòch của Yt là một xác suất, nhưng giá trò quan sát được của một hộ gia đình hoặc bằng 0 hoặc bằng 1 bởi vì, trong giai đoạn khảo sát, hộ gia đình hoặc sẽ mua xe hoặc không mua xe. Do đó, biến phụ thuộc ở đây có dạng nhò nguyên. Các mô hình như vậy được biết đến như mô hình xác suất tuyến tính hoặc mô hình lựa chọn nhò nguyên. Tại sao việc này lại gây nên những vấn đề? Tại sao không ước lượng α và β bằng cách lấy hồi qui biến giả Y theo một hằng số và thu nhập? Câu trả lời sẽ được chỉ ra ngay sau đây đó là trong trường hợp của biến giả, các phần dư sẽ là phương sai của sai số thay đổi, và do đó ứng dụng của OLS sẽ mang lại những giá trò ước lượng không hiệu quả. Gọi pt là xác suất để cho Yt = 1, hoặc cũng tương đương với, ut = 1 – α – βXt (xem Bảng 12.1). Và 1 – pt là xác suất để cho Yt = 0, hoặc ut = - α – βXt. Do đó biến ngẫu nhiên ut không tuân theo phân phối chuẩn, mà chúng thường được giả đònh là như vậy, mà là phân phối nhò thức (xem Phần 2.1) chỉ với hai giá trò. Giá trò mong đợi của ut phải bằng zero, và do đó ta có 0 = E(ut) = pt (1 – α – βXt) + (1 – pt)( - α – βXt) Giải phương trình này tìm pt, ta được pt = α + βXt. Phương sai của ut(2tσ) là E(2tu) bởi vì E(ut) = 0. Theo đònh nghóa, 2tσ= pt (1 – α – βXt)2 + (1 – pt)( - α – βXt)2 = pt(1 – pt)2 + (1 – pt)2tp = pt(1 – pt) lợi dụng dữ kiện α + βXt = pt. Từ đây 2tσ= (1 – α – βXt)(α + βXt), mà chúng thay đổi theo t, vì vậy tạo ra phương sai của sai số thay đổi của các sai số ut. } Bảng 12.1 Phân Phối Xác Suất Của ut ut Xác suất 1 – α – βXt pt – α – βXt 1 – pt Ngay cả khi giả thiết chuẩn của ut bò vi phạm, thì những giá trò ước lượng của α và β không thiên lệch và nhất quán nhưng không hiệu quả bởi vì hiện tượng phương sai của sai số thay đổi. Các kiểm đònh giả thuyết chủ yếu phụ thuộc vào sự chuẩn hóa. Tuy nhiên, chúng ta có thể dẫn chứng đònh lý giới hạn trung tâm (Tính Chất 2.7b), phát biểu rằng nếu nhiều biến ngẫu nhiên được phân phối một cách đồng nhất, thì giá trò trung bình sẽ gần chuẩn ngay cả khi các biến ngẫu nhiên ban đầu không phải là chuẩn. Bởi vì các giá trò ước lượng OLS là những tổ hợp tuyến tính của những biến như vậy, nên sự chuẩn hóa cũng sẽ được duy trì cho những cỡ mẫu lớn. Tuy nhiên, bởi vì phương sai của sai số thay đổi làm mất hiệu lực của những kiểm đònh, nên chúng không còn giá trò nữa. Như đã thấy trong Chương 8 là chúng ta có thể nhận Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 3 Thuc Doan/Hao Thi được những giá trò ước lượng gần hiệu quả bằng cách sử dụng thủ tục bình phương tối thiểu trọng số (WLS) ở đây, miễn là chúng ta có thể nhận được các giá trò ước lượng của 2tσ. Sử dụng những giá trò ước lượng OLS αˆ và βˆ, chúng ta có thể ước lượng phương sai phần dư như sau 2ˆtσ= (αˆ + βˆXt)(1 - αˆ - βˆXt) = tYˆ(1 - tYˆ) Bây giờ, chúng ta có thể đặt wt = 1/tσˆ và áp dụng bình phương tối thiểu trọng số như cách đã được mô tả trong chương 8. Tuy nhiên, một vấn đề tiềm ẩn sẽ nảy sinh khi giá trò tiên đoán tYˆ là 0 hoặc 1, hoặc điểm nào đó nằm ngoài khoảng 0 và 1. Trong trường hợp này, 2ˆtσ sẽ không mang giá trò dương. Không có một sự đảm bảo nào là OLS sẽ không tạo ra những giá trò ước đoán không thể chấp nhận được như vây. Tuy nhiên, khi điều đó xảy ra, chúng ta có thể hiệu chỉnh lại thủ tục chút ít. Nếu giá trò 2tσ ước đoán không có giá trò dương, đặt wt bằng zero. Điều này tương đương với việc bỏ qua những quan sát như vậy. Các bước ước lượng một mô hình xác suất tuyến tính như sau: Bước 1 Ước lượng mô hình bằng thủ tục bình phương tối thiểu thông thường và nhận được những giá trò ước đoán của biến phụ thuộc (tYˆ). Bước 2 Ước lượng phương sai phần dư 2ˆtσ = tYˆ(1 - tYˆ), Bước 3 Xây dựng trọng số cho quan sát thứ t khi wt = 1/tσˆ, với điều kiện 2ˆtσ dương. Nếu 2ˆtσbằng 0 hoặc âm, đặt wt bằng 0 . Bước 4 Nhận được giá trò ước lượng bình phương tối thiểu trọng số (xem Phần 8.3) sử dụng wt như trọng số cho quan sát thứ t. Như đã đề cập đến, bởi vì những giá trò ước đoán không được đảm bảo là nằm giữa 0 và 1 (ngay cả sau khi áp dụng WLS), nên mô hình này ngày nay không được sử dụng nhiều nữa. } 12.2 Mô Hình Đơn Vò Xác Suất (Probit) Một lựa chọn khác với mô hình xác suất tuyến tính được mô tả trong phần trước là mô hình đơn vò xác suất. Để minh họa rằng mô hình này không có những nhược điểm của mô hình trước, xem xét một ví dụ của một nhân viên của một công ty quyết đònh có nên tham gia nghiệp đoàn hay không. Giả thiết theo phân tích đơn vò xác suất là có một phương trình phản ứng dưới dạng *tY= α + βXt + ut, với Xt là biến có thể quan sát được nhưng *tY là biến không thể quan sát được. σtu là phân phối chuẩn chuẩn hóa. Những gì chúng ta quan sát được trong thực tế là Yt, nó mang giá trò 1 nếu *tY> 0 và bằng 0 nếu các giá trò khác. Do đó chúng ta có Yt = 1 nếu α + βXt + ut > 0 Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 4 Thuc Doan/Hao Thi Yt = 0 nếu α + βXt + ut ≤ 0 Nếu chúng ta ký hiệu F(z) là hàm xác suất tích lũy của phân phổi chuẩn chuẩn hóa, tức là, F(z) = P(Z ≤ z), thì P (Yt = 1) = P (ut > – α – βXt) = 1 – F −−σβαtX P (Yt = 0) = P (ut ≤ – α – βXt) = F −−σβαtX Mật độ xác suất kết hợp của mẫu các quan sát (gọi là hàm thích hợp trong phụ lục Chương 2) do vậy được cho bởi L = ∏∏==−−−−−101ttYtYtXFXFσβασβα với ∏ ký hiệu tích số của các số hạng. Ước lượng thông số α và β bằng cách cực đại biểu thức này, mà nó rõ ràng không tuyến tính giữa các thông số và không thể ước lượng bằng những chương trình hồi qui thông thường. Những chương trình như LIMDEP, Eviews, GRETL, SHAZAM, PROBIT, MIDAS, và SAS có thể thực hiện việc tối ưu phi tuyến đặc biệt cần thiết ở đây. Một Ví Dụ Thực Nghiệm: Mô Hình Đơn Vò Xác Suất Đối Với Hành Vi Chương Trình Truyền Hình Foster and Hull (1986) sử dụng phân tích đơn vò xác suất để lập mô hình quyết đònh xem một chương trình truyền hình có nên đăng ký với Mã Truyền Hình của Hiệp Hội Quốc Gia về Phát Thanh Truyền Hình (NAB) hay không. Mẫu dữ liệu cho 89 chương trình truyền hình thương mại của Mỹ được bán ra từ giữa tháng Giêng 1976 đến tháng Ba 1982, khi NAB tạm hoãn những điều khoản quảng cáo có mã. Đặt *tC là danh mục những khuyến khích của chương trình thứ t tuân theo mã số, mà nó phụ thuộc vào một số đặc tính. Mô hình sử dụng bởi Foster và Hull như sau (bỏ qua chỉ số t ở dưới): C* = β1 + β2A + β3Ca + β4Nc + β5Y + β6V + + β7N + β8Cpo + β9%∆CP + β10T + ut với C = 1 nếu C* > 0 và bằng 0 nếu các giá trò khác. Các biến giải thích như sau (xem bài báo gốc để biết thêm chi tiết về những biến này cũng như rất nhiều những mô hình khác được ước lượng bởi những tác giả này): A = Số lượng khán giả của chương trình Ca = Phần trăm hộ gia đình khu vực thò trường chỉ đònh (DMA) có truyền hình cáp Nc = Số chương trình truyền hình thương mại lớn có thể xem được Y = Thu nhập đầu người trong khu vực Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 5 Thuc Doan/Hao Thi V = 1 nếu trạm truyền hình có kênh VHF, 0 nếu kênh khác N = 1 nếu trạm truyền hình là mạng lưới chi nhánh, 0 nếu trường hợp khác Cpo = Chỉ số của hiệu quả phối hợp tiềm tàng CP = Chỉ số khác của hiệu quả phối hợp tiềm tàng T = Số tháng từ ngày bán đến tháng Ba 1982 Mô hình ước lượng là (với giá trò tuyệt đối của các tỉ số t trong ngoặc đơn) C^* = - 3,281 + 0,015A + 0,008Ca – 0,113Nc + 0,380Y – 0,551V (1,22) (3,02) (0,55) (1,29) (1,90) (1,42) + 1,081N – 0,002CP0 + 0,0003%∆CP + 0,004T (2,12) (0,11) (0,02) (0,42) Nếu những tác động phối hợp là quan trọng, chúng ta có thể mong muốn Cpo, %∆CP, và T có tác động đồng biến ý nghóa lên xác suất của việc đăng ký với Mã Truyền Hình; tức là, β8, β9, và β10 sẽ dương. Tuy nhiên, khi các tác giả kiểm đònh giả thuyết không cho rằng β8 =β9 = β10 = 0, nó không thể bò bác bỏ ở mức 10 phần trăm. Nếu tất cả các biến không có ý nghóa bò loại khỏi từ phương trình đặc trưng, thì mô hình ước lượng như sau: C^* = - 3,450 + 0,013A + 0,347Y – 0,982N (2,45) (2,93) (1,92) (2,57) Những giá trò số của hồi qui này không có một diễn dòch cụ thể nào. Tuy nhiên, chúng ta có thể kết luận rằng số lượng khán giả truyền hình càng cao hoặc là thu nhập bình quân đầu người trong khu vực càng cao, thì khả năng đăng ký truyền hình với Mã Truyền Hình NAB càng cao. Tương tự như vậy, mạng lưới chi nhánh có một ảnh hưởng đồng biến lên khả năng đăng ký. Những biến khác trong mô hình ban đầu không có tác động một cách ý nghóa lên cơ hội đăng ký trạm truyền hình mã. } 12.3 Mô Hình Logit Trong Phần 6.12, chúng ta đã giới thiệu mô hình logit (cũng được biết đến dưới tên mô hình logistic) và cho thấy sự hữu dụng của mô hình khi biến phụ thuộc chỉ nhận giá trò giữa 0 và 1 (hoặc là từ 0 đến 100, nếu dưới dạng phần trăm). Mô hình logistic có dạng phương trình như sau: ln−PP1= α + βX + u (12.1) với P là giá trò của biến phụ thuộc từ 0 đến 1. Nguyên do có dạng này có thể được thấy bằng cách giải phương trình tìm P (trước tiên lấy mũ của cả hai vế). Tiếp theo chúng ta thu được giá trò P như sau: P = )(11uXe++−+βα (12.2) Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 6 Thuc Doan/Hao Thi Dễ dàng thấy rằng nếu βX → + ∞, P → 1, và khi βX → - ∞,, thì P tiến đến 0. Do đó, P không thể nào nằm ngoài khoảng [0,1]. Thủ tục ước lượng phụ thuộc vào giá trò quan sát P có nằm giữa 0 và 1 hay không, hoặc là đó có phải là số nhò nguyên có giá trò 0 hoặc 1 hay không. Các mô hình mà biến phụ thuộc là nhò nguyên được gọi là những mô hình logit nhò nguyên. Wunnava và Ewing (2000) có một ví dụ tuyệt vời về mô hình như vậy. Trong trường hợp mà P đúng là nằm giữa khoảng 0 và 1 (ví dụ, P là phần nhỏ của số hộ gia đình mua một xe hơi), phương pháp chỉ đơn giản là biến đổi P và thu được Y = ln[P/(1 – P)]. Tiếp theo chúng ta lấy hồi qui Y theo một hằng số và X (có thể dễ dàng thêm vào nhiều biến giải thích). Tuy nhiên, nếu P là số nhò nguyên, thì lôgarít của P/(1 – P) sẽ không thể xác đònh được khi P có giá trò hoặc 0 hoặc 1. Thủ tục sử dụng trong trường hợp như thế chính là phương pháp thích hợp cực đại đã được thảo luận trong Phần 2.A.3 và 3.A.5. Tác động cận biên của X lên P được tính toán bằng cách lấy đạo hàm riêng phần của P theo X. Tác động cận biên ước lượng được cho như sau: )ˆ1(ˆˆ]1[ˆˆ2)ˆˆ()ˆˆ(PPeeXPXX−=+=∆∆+−+−βββαβα Một số chương trình máy tính ước lượng mô hình logit theo phạm vi rộng hơn. Những chương trình này bao gồm GRETL, Eviews, SAS, SHAZAM, MLOGIT, và QUAIL. Tham khảo nghiên cứu vào năm 1981 của Amemiya để biết thêm chi tiết. } VÍ DỤ 12.1 Trong ví dụ này chúng ta sử dụng mô hình logistic để ước lượng quan hệ giữa tỉ lệ tham gia của lực lượng lao động nữ và những yếu tố của chúng. Mô hình ước lượng sử dụng dữ liệu trong DATA 4-5 (xem Phần Thực Hành Máy Tính 12.1) là ln=−WLFPWLFP100- 0,355 + 0,03316YF + 0,01175EDUC - 0,0587 UE – 0,00315URB – 0,00414WH (-5,53) (-2,71) (-2,75) Bởi vì biến phụ thuộc ở đây không phải là WLEP, nên các hệ số hồi qui không thể so sánh được cũng như các giá trò R2 hiệu chỉnh. Một cách để so sánh độ thích hợp của mô hình tuyến tính với độ thích hợp của mô hình logit là sử dụng mô hình logit để dự báo WLEF và tiếp đến tính tổng bình phương sai số và những trò thống kê của mô hình chọn lựa. Khi thực hiện xong việc này, chúng ta nhận thấy rằng mô hình logit là tốt hơn. Xem Phần Thực Hành Máy Tính 12.1 để biết thêm chi tiết. (-1,53) (5,03) (4,17) Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 7 Thuc Doan/Hao Thi Ví Dụ Thực Nghiệm: Sự Gián Đoạn Trong Nghề Nghiệp Sau Khi Sinh Con Even (1987) đã sử dụng mô hình logit để xem xét tác động của việc sinh con lên xác suất mà một người phụ nữ sẽ trở lại công việc.1 Giả thiết căn bản của mô hình ông ta sử dụng là “một người phụ nữ sẽ bắt đầu lại công việc trong thời gian đầu tiên ngay sau khi sinh nếu như tiền lương toàn bộ của cô ta (W) cao hơn giá trò của thời gian ở nhà hoặc là cao hơn tiền lương giữ chỗ (R).” Dữ liệu sử dụng lấy từ Cuộc Khảo Sát Quốc Gia vào năm 1973 về Sự Tăng Trưởng Gia Đình, cho 866 phụ nữ da trắng đã lập gia đình, có ít nhất một con và thỉnh thoảng làm việc trong suốt thời gian mang thai. Các biến giải thích như sau: s = Số lần sinh con KIDS = Số con trong gia đình DKIDS = Biến KIDS nhân với số q gián đoạn công việc do sinh con AGE = Tuổi của người mẹ tại thời điểm sinh gần nhất HINC = Thu nhập của người cha ngay thời điểm phỏng vấn MQPRIOR = Số tháng người mẹ ngưng làm việc trước thời điểm sinh con gần nhất EXP = Số năm kinh nghiệm làm việc DEXP = Biến EXP nhân với số q không làm việc do việc sinh con OCC = 1 nếu nghề nghiệp của người mẹ là chuyên nghiệp hay kỹ thuật, 0 cho các trường hợp khác. EDUC = Số năm đi học DEDUC = Biến EDUC nhân với số q không làm việc do sinh con Bảng 12.2 trình bày các hệ số ước lượng (với trò thống kê t trong ngoặc đơn) của một số đặc trưng mô hình thay thế, biến phụ thuộc là xác suất của sự trở lại làm việc. Chúng ta lưu ý rằng EDUC không có ý nghóa thống kê trong bất kỳ mô hình nào, trong khi chúng ta kỳ vọng sẽ có một tác động đồng biến lên tiền lương. Như một lời giải thích, Even gợi ý rằng mức lương cao có thể làm cho một người phụ nữ đòi hỏi một đứa trẻ được nuôi dạy tốt, và vì vậy, cô ta có thể bỏ công việc để nâng cao chất lượng của việc nuôi dạy trẻ. Sự không ý nghóa của số hạng tương tác DEDUC cho biết tác động biên của EDUC không phụ thuộc vào số q nghỉ việc do sinh con. Hệ số của KIDS cũng không ý nghóa, nhưng hệ số của DKIDS tương tác thì đồng biến một cách ý nghóa (ở mức ý nghóa 5 phần trăm). Điều này có nghóa là thêm một đứa trẻ có một tác động không đáng kể lên xác suất ngay sau khi sinh, nhưng tác động cận biên tăng theo thời gian. Điều này có thể là do những đứa trẻ lớn hơn cần ít sự chú ý hơn và do đó sự hiện hữu của chúng có thể làm tăng nhu cầu của hàng hóa trên thò trường. AGE mang dấu âm như kỳ vọng và có ý nghóa. Tương tự như vậy, thu nhập của người chồng càng cao, xác suất trở lại làm việc càng thấp. Kinh nghiệm cũng như biến giả đối với người phụ nữ làm công việc chuyên nghiệp có tác động đồng biến như kỳ vọng lên xác suất. 1 Cụ thể hơn, những gì được lập mô hình chính là tỉ lệ may rủi, xác suất có điều kiện của việc trở lại làm việc tại thời điểm t, biết rằng người phụ nữ sẽ không trở lại làm việc trước thời điểm t. Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 8 Thuc Doan/Hao Thi } Bảng 12.2 Các Mô Hình Logit Ước Lượng (1) (2) (3) (4) (5) (6) Hằng số -0,286 -0,45 0,095 0,34 0,75 0,97 (0,69) (1,08) (0,18) (0,66) (1,44) (1,80) s * * -0,12 -0,28 -0,58 -0,79 (1,62) (4,01) (6,31) (5,45) s2 * * * 0,0097 0,050 0,096 (7,02) (6,13) (3,67) s3/100 * * * * -0,13 -0,47 (4,90) (2,54) s4/100 * * * * * 0,077 (1,88) DKIDS * 0,018 0,023 0,015 0,013 0,013 (2,29) (2,78) (2,03) (1,82) (1,82) DEXP * -0,0080 -0,0074 -0,0053 -0,0055 -0,0055 (2,77) (2,49) (2,03) (2,23) (2,23) DEDUC * -0,010 -0,0019 -0,0031 -0,0026 -0,0025 (5,21) (0,31) (0,65) (0,54) (0,53) KIDS 0,082 0,026 0,0040 0,047 0,051 0,051 (1,70) (0,41) (0,02) (0,76) (0,81) (0,81) AGE -0,046 -0,046 -0,045 -0,044 -0,044 -0,045 (2,87) (2,78) (2,73) (2,67) (2,66) (2,69) HING -0,027 -0,016 -0,016 -0,015 -0,015 -0,015 (3,83) (2,27) (2,28) (2,12) (2,13) (2,12) MQPRIOR -0,148 -0,12 -0,12 -0,12 -0,12 -0,12 (8,06) (6,63) (6,55) (6,30) (6,16) (6,11) EXP 0,033 0,076 0,073 0,063 0,063 0,064 (2,26) (3,84) (3,66) (3,30) (3,29) (3,30) OCC 0,311 0,28 0,29 0,27 0,25 0,25 (2,45) (2,12) (2,20) (2,02) (1,90) (1,97) EDUC -0,025 0,025 -0,014 -0,0090 -0,0091 -0,0089 (0,92) (0,89) (0,38) (0,26) (0,26) (0,25) Log-thích hợp (log–likelihood) -1806,8 -1698,1 -1696,8 -1674,8 -1661,6 -1659,9 Trò thống kê độ thích hợp 459,65 98,84 97,14 61,34 37,82 33,91 (goodness of fit statistics) (0) (2,2E-11) (4,4E-11) (2,0E-5) (0,027) (0,066) Nguồn: Trích dẫn từ Even, 1987, Bảng 2, t.266. Được in lại dưới sự chấp thuận của Nhà Xuất Bản Đại Học Chicago Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 9 Thuc Doan/Hao Thi Biến MQPRIOR, là số tháng người mẹ ngưng làm việc trước khi sinh, có một tác động nghòch biến rất mạnh. Do đó, bỏ việc sớm trong thời gian mang thai làm tăng xác suất mà người mẹ sẽ không (hoặc không thể) trở lại công việc. } 12.4 Biến Phụ Thuộc Giới Hạn Như đã đề cập trong phần giới thiệu của chương này, những giá trò quan sát của một biến độc lập đôi khi có một bước nhảy rời rạc tại điểm zero. Ví dụ, nếu chúng ta lấy một mẫu ngẫu nhiên của phụ nữ và ghi nhận mức lương của họ, thì chúng ta có thể quan sát nhiều giá trò zero bởi vì chỉ ghi nhận được tiền lương đối với những người phụ nữ đang làm việc. Do vậy, trong mô hình hồi qui đơn Yt = α + βXt + ut, chúng ta chỉ quan sát được biến phụ thuộc khi Yt > 0. Theo một ví dụ khác, nếu chúng ta thu thập một mẫu ngẫu nhiên các hộ gia đình và ghi lại chi tiêu của họ cho những hàng hóa lâu bền, một vài giá trò có thể bằng zero trong khi những giá trò khác dương. Do đó, chúng ta không bao giờ quan sát được những giá trò âm. Hậu quả của việc không để ý đến dữ kiện này và lấy hồi qui Y theo một hằng số và X là gì? Chúng ta lưu ý trong tình huống này, các sai số sẽ không thỏa mãn điều kiện E(ui) = 0, là điều kiện cần thiết để các giá trò ước lượng không thiên lệch. Một biến phụ thuộc với tính chất có một bước nhảy rời rạc ở điểm zero (hay bất kỳ giá trò ngưỡng nào khác) được biết đến như một biến phụ thuộc giới hạn. Tobin (1958) đã đưa ra một trong những ứng dụng đầu tiên (trong kinh tế học) của mô hình biến phụ thuộc giới hạn. Ông ta đã áp dụng mô hình này vào mô hình chi tiêu hộ gia đình đối với xe hơi. Những mô hình như vậy được nhắc đến như mô hình tobit hay hồi qui kiểm duyệt. Mô Hình Tobit (hay Hồi Qui Kiểm Duyệt) Trong mô hình Tobit, có một sự không đối xứng giữa các quan sát với giá trò dương của Y và giữa các quan sát với giá trò âm. Trong trường hợp này, mô hình trở thành −−≤≤−−>>++=tttttttttXuYXuYuXYβαβαβαhoặc0 nếu0hoặc0 nếu Giả thiết cơ bản đằng sau mô hình này là có tồn tại một hàm số chỉ số It = α + βXt + ut đối với mỗi nhà kinh tế đang tiến hành nghiên cứu. Nếu It ≤ 0, thì giá trò của biến phụ thuộc được đặt bằng 0. Nếu It > 0, giá trò của biến phụ thuộc được đặt bằng It. Giả sử u có phân phối chuẩn với trò trung bình bằng không và phương sai σ2. Chúng ta lưu ý Z = u/σ là một biến ngẫu nhiên chuẩn chuẩn hóa. Ký hiệu f(z) là mật độ xác suất của biến Z chuẩn chuẩn hóa, và F(z) là xác suất tích lũy – tức là, P[Z ≤ z]. Mật độ xác suất kết hợp của những quan sát đó với Yt dương được cho bởi biểu thức sau: (xem Phần 3.A.5) P1 = ∏==−−miiiiXYf11σβασ Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 2003-2004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Ramu Ramanathan 10 Thuc Doan/Hao Thi với ∏ là ký hiệu tích số và m là số quan sát trong từng mẫu con mà Y có giá trò dương. Đối với mẫu con thứ hai (cỡ mẫu là n) trong đó giá trò Y quan sát là bằng không, biến ngẫu nhiên u ≤ - α – βX. Xác suất của dữ kiện này là P2 []∏==−−≤=njjjjXuP1βα = ∏==−−njjjXF1σβα Do đó xác suất kết hợp của tổng thể mẫu là L = P1P2. Bởi vì các hệ số α và β là phi tuyến, thủ tục OLS không thích hợp ở đây. Thủ tục để có được những giá trò ước lượng của α và β là làm cực đại L theo các thông số. Đó là thủ tục thích hợp cực đại được mô tả trong Phần 3.A.5. Trong các chương trình máy tính, những chương trình như Eviews, LIMDEP, SAS, SHAZAM, và TSP có các thủ tục để ước lượng mô hình Tobit. Ví Dụ Thực Nghiệm: Mô Hình Tobit Của Việc Đóng Góp Từ Thiện Reece (1979), sử dụng một mô hình Tobit, đã thực hiện một nghiên cứu về những đóng góp từ thiện. Mặc dù ông ta xác đònh được một số thành phần của đóng góp từ thiện, nhưng ở đây chúng ta chỉ quan tâm đến ba thành phần: tổng của tất cả đóng góp, đóng góp từ thiện, và một nhóm được gọi là “CONTRIB”, mà nó loại tất cả những đóng góp quà tặng đến những thành viên không gia đình và một vài đóng góp khác. Phần lớn những dữ liệu thu thập được (cho những số lượng lớn hộ gia đình) từ Khảo Sát Chi Tiêu Tiêu Dùng của Cục Thống Kê Lao Động năm 1972 và 1973. Những hộ gia đình từ một số Khu Vực Thống Kê Đô Thò Tiêu Chuẩn (SMSA). Các nguồn dữ liệu khác từ cục Thống Kê về Điều Tra Dân Số và Bộ Sức Khỏe, Giáo Dục, và Phúc Lợi của Mỹ. Bảng 12.3 trình bày những độ co dãn ước lượng thể hiện bằng các hệ số của hàm chỉ số, bản thân các hệ số, và những trò thống kê t tương ứng. Các biến độc lập như sau: PRICE = Giá của những đóng góp INCOME = thu nhập (trước thuế) trung bình của gia đình trong năm hiện hành và những năm trước đó cộng với thu nhập ròng do việc sở hữu nhà ASSISTANCE = Trợ giúp công cộng trung bình RECIPIENT = Thu nhập gia đình bậc dưới năm đối với SMSA COL = Một chỉ số của ngân sách gia đình đối với SMSA AGE = Tuổi của chủ hộ SECOND = 1 cho mẫu của năm 1973, 0 cho mẫu của năm 1972 Reece đònh nghóa giá của một đôla đóng góp là lượng tiêu dùng mất đi của hộ gia đình do việc họ làm từ thiện. Bởi vì thuế có thể được khấu trừ do việc đóng góp, nên giá nói chung sẽ nhỏ hơn 1. Để biết thêm chi tiết và đại lượng chính xác được sử dụng, những người quan [...]... Bảng 12. 3 Những Mô Hình Tobit Ước Lượng Các Phương trình (2) All -1 ,401 (3) Contrib -1 ,192 -1 14,60 (-2 ,67) -7 87,88 (-4 ,63) -3 96,71 (-4 ,15) 1,423 0,550 0,877 0,0095 (9,99) 0,0176 (4,87) 0,0166 (8,01) 0,309 0,484 0,380 0,8808 (1,44) 6,60 (2,79) 3,06 (2,30) -0 ,097 -0 ,186 0,102 -0 ,0108 (-0 ,29) -0 ,0996 (-0 ,67) 0,0322 (0,39) -0 ,138 0,327 0,351 -0 ,0017 (-0 ,37) 0,0190 (1,06) 0, 0121 (1,20) -1 ,511 0,518 -0 ,542 -0 ,1420... -0 ,542 -0 ,1420 (-1 ,21) 0,2329 (0,51) -0 ,1443 (-0 ,57) -0 ,016 0,005 -0 , 012 -3 ,42 (-0 ,27) 5,32 (0,11) -7 ,30 (-0 ,26) CONSTANT 124 ,70 (0,95) 113,33 (0,22) 183,61 (0,64) 1-e’e/s2 1-e’e/y’y 0,342 0,466 0,175 0,405 0,282 0,529 PRICE INCOME AGE ASSISTANCE RECIPIENT COL SECOND Ramu Ramanathan (1) Charity + Deducted -0 ,976 11 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3-2 004 Phương pháp... điều kiện E(u) = 0 (u là số hạng sai số) cần thiết cho những ước lượng không thiên lệch, không được thỏa mãn Thủ tục thích hợp ở đây là phương pháp thích hợp cực đại Ramu Ramanathan 12 Thuc Doan/Hao Thi Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3-2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Thuật Ngữ Binary choice.. .Chương trình Giảng dạy Kinh tế Fulbright Niên khóa 200 3-2 004 Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn tâm nên tham khảo bài báo gốc Để xem xét những khác biệt về giá của hàng hóa tiêu dùng giữa những hộ gia đình, sử dụng biến chỉ số mức sống (COL) Biến RECIPIENT được sử dụng để ước lượng gần đúng tác động... Phương pháp phân tích Bài đọc Nhập môn kinh tế lượng với các ứng dụng Chương 12: Biến phụ thuộc đònh tính và giới hạn Lưu ý: Độ co dãn, hệ số, và trò thống kê t (trong ngoặc đơn) được cung cấp cho từng biến Nguồn: Trích dẫn từ Reece, 1979, Bảng 1, t.147 Được in lại dưới sự chấp thuận của Hiệp Hội Kinh Tế Hoa Kỳ Hai hàng cuối cùng trong Bảng 12. 3 cho thấy hai đại lượng đo mức độ thích hợp Mặc dù chúng... từ thiện là yếu tố quan trọng trong việc xác đònh số lượng đóng góp và (2) những tổ chức tôn giáo thu được lợi nhiều hơn khi những đóng góp được khấu trừ thuế Tóm Tắt Chương này tập trung vào những nghiên cứu đặc biệt cần thiết khi biến phụ thuộc (Y) hoặc có dạng nhò nguyên hoặc có một bước nhảy rời rạc tại giá trò 0 Khi quyết đònh một nhà kinh tế dưới dạng thực hiện hay không thực hiện một hành động... một mô hình nhò nguyên, ta có thể ước lượng phương sai của sai số thay đổi và áp dụng bình phương tối thiểu trọng số Tuy nhiên, không có sự bảo đảm là những giá trò ước đoán của biến phụ thuộc (được diễn dòch là một đại lượng xác suất) sẽ nằm giữa 0 và 1 Để tránh sự khó khăn này, những mô hình logit thường được sử dụng Bây giờ biến phụ thuộc sẽ có dạng ln[P/(1 - P)], với P là phân đoạn thời gian quan... mức độ thích hợp Mặc dù chúng không quá cao, nhưng chúng hợp lý, xét đến trường hợp để có được những đo lường mức độ thích hợp cao đối với những dữ liệu chéo là rất khó khăn (đặc biệt là một đối với số lượng lớn hộ gia đình) Biến phụ thuộc CHARITY + DEDUCTED bao gồm tất cả các khoản đóng góp từ thiện, không cần biết đến chúng có được khấu trừ từ khoản chi trả hay không Các biến PRICE và INCOME có ý nghóa . -0 ,015 -0 ,015 -0 ,015 (3,83) (2,27) (2,28) (2 ,12) (2,13) (2 ,12) MQPRIOR -0 ,148 -0 ,12 -0 ,12 -0 ,12 -0 ,12 -0 ,12 (8,06) (6,63) (6,55) (6,30) (6,16) (6,11). -1 ,511 0,518 -0 ,542 -0 ,1420 0,2329 -0 ,1443 (-1 ,21) (0,51) (-0 ,57) SECOND -0 ,016 0,005 -0 , 012 -3 ,42 5,32 -7 ,30 (-0 ,27) (0,11) (-0 ,26) CONSTANT 124 ,70