Trong nhiều trường hợp, chính mức giá trị của các biến định lượng cũng làm thay đổi quan hệ của chúng một cách cơ bản.. Nói tóm lại, trong hầu hết các quan hệ định lượng có sự can thiệp
Trang 1định lượng được
Trong nhiều trường hợp, chính mức giá trị của các biến định lượng cũng làm thay đổi quan hệ của chúng một cách cơ bản Có thể dễ dàng nhận ra rằng, khi tiền lương tăng đến một mức nào đó thì lượng cung lao động không còn tăng mà
có thể giảm, điều này đã được mô tả trong nhiều nghiên cứu về thị trường lao
động Cũng như vậy, thu nhập ở những mức khác nhau có thể tương ứng với những tỷ lệ tiết kiệm khác nhau
Nói tóm lại, trong hầu hết các quan hệ định lượng có sự can thiệp của các biến không định lượng mà ở đây ta gọi là các biến định tính Cần có một kỹ thuật đưa các biến như vậy vào trong các mô hình, không chỉ với tư cách các biến giải thích mà còn với tư cách là các biến phụ thuộc
Trang 22 Kỹ thuật biến giả
2.1 Hồi quy với biến giải thích là biến định tính (mô hình ANOVA)
a Biến định tính có hai phạm trù
Lúc đó dùng một biến giả để thay thế cho nó
VD: Thu nhập có phụ thuộc giới tính ?
Nếu 2 0 thì TN trung bình có phụ thuộc giới tính
Biến D dùng như trên gọi là biến giả (Dummy variable)
Trang 3Ví dụ: Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm
Biến giới: m = nam; f = nữ
Kết quả ước lượng hồi quy: Yi = 18 + 3,28Di + ei
Giá trị T 3,54 4,265
Dễ dàng thấy rằng, 2 khác không, hơn thế nữa, hệ số này dương có ý nghĩa Kết luận đầu tiên của chúng ta là: lương khởi điểm trung bình của nam cao hơn nữ Ước lượng cụ thể về các mức này như sau:
Lương khởi điểm trung bình của nữ E(Y/D=0) = 1 , ước lượng được là 18,00 (nghìn $)
Lương khởi điểm trung bình của nam E(Y/D=1)= 1 + 2 , ước lượng được
là 21,28 (nghìn $)
Qui tắc đặt biến giả
- Biến giả chỉ nhận giá trị 0 và 1
Trang 4- Cá thể nào cũng phải có giá trị
- Biến giả chia tổng thể thành những thành phần riêng biệt
b Biến định tính có k phạm trù
Lúc đó dùng k-1 biến giả để thay thế cho chúng
Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn?
Yi: Chi phí cho văn hoá phẩm.
hoc tieu do trinh co neu
hoc trung do trinh co neu
hoc dai do trinh co neu
Trang 51 Nếu làm việc ở thành thị Nếu làm việc ở nông thôn
E(Y/D2i, D3i) = 1 + 2D2i + 3D3i + ui
Các chú ý:
Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là
n1, n2, nk thì phải dùng tổng cộng n1 + n2 + + nk – k biến giả
Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùnh để so sánh với các phạm trù khác
Trang 6Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng Để tính đến điều đó ta thêm vào mô hình biến tương tác
Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc?
Trang 7Asỏt quan 1
Như vậy việc sử dụng biến giả có thể cho phép đánh giá chính sách
Ví dụ: Tệp số liệu ch4bt1 chứa các số liệu mức tiêu dùng thực tế theo đầu người(CS) và thu nhập thực tế theo đầu người của Mỹ(Y) giai đoạn 1929-
1970
Trong giai đoạn này đã xảy ra thế chiến II(1941-1946) và từ 1960 Mỹ đã tham chiến tại Việt nam Vậy chiến tranh có ảnh hưởng đến tiêu dùng của
Trang 8R-squared 0.957064 Mean dependent var 1498.548
Adjusted R-squared 0.955991 S.D dependent var 403.0243
S.E of regression 84.54767 Akaike info criterion 11.75896
Sum squared resid 285932.3 Schwarz criterion 11.84170
Log likelihood -244.9381 F-statistic 891.6289
Durbin-Watson stat 0.337500 Prob(F-statistic) 0.000000
Thªm biÕn gi¶ D1=1trong thêi kú 1941-1946 vµ håi quy thu ®îc kÕt qu¶ sau:
R-squared 0.989402 Mean dependent var 1498.548
Adjusted R-squared 0.988858 S.D dependent var 403.0243
S.E of regression 42.54105 Akaike info criterion 10.40757
Sum squared resid 70579.89 Schwarz criterion 10.53168
Log likelihood -215.5589 F-statistic 1820.424
Durbin-Watson stat 1.634232 Prob(F-statistic) 0.000000
Trang 9Håi quy CS víi D1 y vµ D1*Y cho kÕt qu¶ sau:
R-squared 0.992417 Mean dependent var 1498.548
Adjusted R-squared 0.991819 S.D dependent var 403.0243
S.E of regression 36.45391 Akaike info criterion 10.12037
Sum squared resid 50497.74 Schwarz criterion 10.28586
Log likelihood -208.5277 F-statistic 1657.796
Durbin-Watson stat 1.267117 Prob(F-statistic) 0.000000
Thªm biÕn D2=1trong thêi kú tõ 1960 trë ®i vµ håi quy cho kÕt qu¶ sau:
R-squared 0.989927 Mean dependent var 1498.548
Adjusted R-squared 0.989132 S.D dependent var 403.0243
S.E of regression 42.01552 Akaike info criterion 10.40435
Sum squared resid 67081.54 Schwarz criterion 10.56984
Log likelihood -214.4913 F-statistic 1244.826
Durbin-Watson stat 1.639287 Prob(F-statistic) 0.000000
Trang 102.4 Kiểm định sự thay đổi cấu trúc của mô hình
H
0:
H
2 4 2
3
1
4 3
Lấy mẫu W1 kích thước n1 trong A1 hồi qui MH thu được RSS1
Lấy mẫu W2 kích thước n2 trong A2 hồi qui MH thu được RSS2Với mẫu W = W1 W2 kích thước n1 + n2, hồi qui thu được RSS
Tính RSS= RSS1 + RSS2
F qs =
k
k n n RSS
RSS RSS 1 2 2
Nếu Fqs > F(k ; n1 + n2 – 2k) : bác bỏ H0
Trang 11b Dùng biến giả để kiểm định sự thay đổi cấu trúc
Với mẫu W = W1 W2 kích thước n1 + n2 hồi quy mô hình:
Trang 12Chow Breakpoint Test: 1955
R-squared 0.952626 Mean dependent var 0.773333
Adjusted R-squared 0.942475 S.D dependent var 0.642806
S.E of regression 0.154173 Akaike info criterion -0.708351
Sum squared resid 0.332771 Schwarz criterion -0.510490
Log likelihood 10.37516 F-statistic 93.84109
Durbin-Watson stat 1.468099 Prob(F-statistic) 0.000000
Kiểm định F về thu hẹp hồi quy:
Wald Test:
Equation: Untitled
Null Hypothesis: C(2)=0
C(4)=0 F-statistic 5.037060 Probability 0.022493
Chi-square 10.07412 Probability 0.006493
Ví dụ: Xu hướng dài hạn trong tỷ giá mậu dịch
Một trong những vấn đề được nhiều người quan tâm trong các tài liệu về kinh tế của các nước đang phát triển là vấn đề tỷ giá mậu dịch giữa các nước sản xuất nguyên liệu và các
Trang 13nước sản xuất hàng hoá công nghiệp Hầu như phổ biến các nước bán sản phẩm thô hay nguyên liệu là các nước nghèo hay kém phát triển còn những nước bán hàng hoá là sản phẩm chế biến là các nước giàu Một trong các quan điểm kinh tế phổ biến là tỷ giá mậu dịch có khả năng dịch chuyển liên tục ngược lại đối với các nước bán sản phẩm thô Quan điểm này dựa trên lý thuyết về sự phụ thuộc theo đó, người ta gọi các nước sản xuất công nghiệp là các trung tâm còn các nước khác là các nước ngoại vi Hay theo quan điểm của trường phái tân cổ
điển thì có một sự khác biệt rất lớn về tính co giãn của cung và cầu trong hai loại hàng hoá như vậy
Để trả lời cho câu hỏi có hay không sự chuyển dịch ngược của tỷ giá mậu dịch trước tiên, ta nhắc lại một vài khái niệm liên quan giữa khối lượng trao đổi mậu dịch NBTT (hàng đổi
Biểu thức trên đo lường khối lượng xuất khẩu đảm bảo tài chính cho khối lượng nhập khẩu
Tỷ số này tăng cho thấy một xu hướng tốt; tỷ lệ này giảm cho thấy một tác động (sự di chuyển) ngược đối với quốc gia tương ứng Thu nhập từ trao đổi mậu dịch của một quốc gia
khẩu:
M
X X
P
PQ
YTT có thể dùng để đo sức mua của xuất khẩu Rõ ràng là có thể tăng thu nhập từ trao
đổi mậu dịch dù cho có sự biến động ngược lại của NBTT; chẳng hạn, có thể tăng khối lượng hàng hoá xuất khẩu nhanh hơn tốc độ giảm giá của đơn vị hàng hoá
Giả thiết Prebisch-Singer chỉ liên quan đến sự thay đổi của NBTT với hai yếu tố giá sản phẩm thô và giá hàng hoá công nghiệp Để kiểm tra giả thiết có sự biến động NBTT ngược chiều đối với các sản phẩm thô, ta cần các số liệu về NBTT theo thời gian và tiến hành hồi quy mô hình, trong đó, NBTT thay đổi theo thời gian
Vấn đề quan tâm là phải chăng dấu hiệu suy giảm của tỷ giá mậu dịch như là một dấu hiệu của sự biến đổi ngược lại trong tỷ giá mậu dịch của các nước phát triển, nó tạo khả năng các nước giàu tự mình mở rộng sản xuất các sản phẩm thô còn các nước đang phát triển tăng cường xuất khẩu các sản phẩm công nghiệp Kiểm định giả thiết về sự suy thoái của tỷ giá mậu dịch có thể thực hiện nhờ hồi quy sau đây:
Trang 14Đây là một mô hình nửa logarit và b 2 thể hiện sự thay đổi của NBTT theo thời gian
Spaor đã dùng một số hồi quy với các dãy số liệu theo thời gian và thời kỳ khác nhau Chúng
ta có thể nghiên cứu hai kết quả hồi quy trên cơ sở số liệu của những năm 1900 - 1938 và 1900 -
Theo kết quả trên, có thể kết luận rằng, thời kỳ 1900 - 1938 có sự suy giảm của NBTT (mỗi
dịch trong thời kỳ dài
Bây giờ ta xem xét kết quả của Sapsford (1985), trong đó ông ta chỉ xem thời kỳ sau chiến tranh được xác định từ 1950 trở đi và chia tệp số liệu trên thành hai thời kỳ 1900 - 1938 và
1950 - 1970 (xem như có sự bất bình thường trong những năm 1939 - 1949) Tiến hành các hồi quy và kiểm định Chow, ta nhận được các kết quả sau:
Thời kỳ 1900 - 1970:
lnNBTT t = 4,438 - 0,00134T RSS N =1,245 Thời kỳ 1900 - 1938:
lnNBTT t = 4,572 - 0,00725T RSS n1 = 0,5172 Thời kỳ 1950 - 1970:
lnNBTT t = 5,523 - 0,01540T RSS n2 = 0,0087 Thống kê F :
33,50,0087)/49
(0,5172
0,0087))/2(0,5172
Trang 15hạn mức 5%, ta kết luận rằng có sự suy giảm của tỷ giá mậu dịch qua hai thời kỳ
Nếu sử dụng biến giả D để kiểm tra giả thiết nói trên, ta có thể xét hồi quy sau:
lnNBTT t = b 1 + b 2 T + b 3 D t , Với D=1 từ 1950 về sau và D=0 ở các năm khác
Ước lượng nhận được là:
lnNBTT t = 4,594 - 0,00836T + 0,5003D t R 2 = 0,56
Se (độ lệch tiêu chuẩn) (0,00142) (0,0649)
Kết luận gì từ kết quả này?
2.5 Dùng biến giả để phân tích biến động mùa vụ ( season)
quy la neu
quy la neu
quy la neu
Trang 16VÝ dô: Cã sè liÖu sau vÒ tæng lîi nhuËn vµ tæng doanh sè cña ngµnh c«ng nghiÖp chÕ biÕn
Trang 17a Hãy hồi quy lợi nhuận với doanh số và cho nhận xét
b Vẽ đồ thị của lợi nhuận và doanh số theo thời gian và cho nhận xét
c Từ đó hãy tìm cách hoàn thiện mô hình
Hồi quy lợi nhuận theo doanh số:
R-squared 0.347206 Mean dependent var 12838.54
Adjusted R-squared 0.317533 S.D dependent var 1433.284
S.E of regression 1184.058 Akaike info criterion 17.07094
Sum squared resid 30843858 Schwarz criterion 17.16911
Log likelihood -202.8513 F-statistic 11.70128
Durbin-Watson stat 1.116103 Prob(F-statistic) 0.002447
Thêm các biến mùa vụ D2, D3, D4 thu được kết quả:
Dependent Variable: LN
Method: Least Squares
Date: 11/21/08 Time: 10:23
Sample(adjusted): 1965:3 1970:4
Included observations: 22 after adjusting endpoints
Variable Coefficient Std Error t-Statistic Prob
R-squared 0.480284 Mean dependent var 12978.64
Adjusted R-squared 0.357998 S.D dependent var 1393.952
S.E of regression 1116.904 Akaike info criterion 17.07122
Sum squared resid 21207060 Schwarz criterion 17.31919
Log likelihood -182.7835 F-statistic 3.927548
Durbin-Watson stat 0.440938 Prob(F-statistic) 0.019502
Trang 182.6 Hồi qui tuyến tớnh từng khỳc
Hàm hồi quy tuyến tính gấp khúc tại đIểm X = Xt0
:1
t
t
X X
X X
E(Y/Xt, Dt) = 1 + 2Xt + 3( Xt – Xt0)Dt
Nếu có nhiều hơn một điểm gấp khúc thì cũng tiến hành tương tự
2.7 Các giả thiết của OLS trong hồi quy với biến giả
a Phương sai của các sai số Ui không đồng đều
Chẳng hạn trong ví dụ về tiết kiệm ở Anh Quốc Nếu hồi quy không có biến giả thì mọi thủ tục phát hiện, khắc phục hiện tượng vi phạm giả thiết này đã
được trình bày ở các bài trước Vấn đề chỉ đặt ra khi phương sai của các sai số ở hai thời kỳ khác nhau Những kiểm định chỉ áp đặt trên từng hồi quy là hoàn toàn tin cậy được, nếu các giả thiết khác được thoả mãn
Với hồi quy có biến giả, rõ ràng là các kiểm định và ước lượng sẽ không giữ
được tính chính xác và mức tin cậy mà chúng ta đã đặt ra, thậm chí cả những kiểm định cốt lõi trong các hồi quy này, đó là các kiểm định đặt trên các hệ số của biến giả cũng có thể mất ý nghĩa Việc khắc phục hiện tượng này cần tiến hành trên tệp số liệu của các biến định tính trước khi sử dụng biến giả để phân tích hồi quy
b Các sai số Ui , Uj phụ thuộc tương quan tuyến tính (hiện tượng tự tương quan)
Giả thiết không có tự tương quan trong các sai số ngẫu nhiên Ut có thể
không thoả mãn như trong các hồi quy không có biến giả Trong trường hợp hồi quy không có biến giả, chúng ta đã biết cách khắc phục hiện tượng này, Trong
Trang 19hồi quy có biến giả, có một vài điểm cần vận dụng sửa đổi do đặc điểm của biến giả là biến chỉ nhận hai giá trị 0 và 1
Giả sử mô hình hồi quy tiết kiệm và thu nhập ở Anh đã nói ở trên gặp hiện tượng tự tương quan cấp 1 (AR(1)) Để khắc phục hiện tượng này cần ước lượng hệ
số tự tương quan trong hàm Ut = Ut-1 + t Khi đã có ước lượng của , ta sử dụng phương trình sai phân tổng quát ước lượng các tham số trong mô hình này và từ
đó suy ra ước lượng của các tham số ban đầu Các phép đổi biến được tiến hành như sau:
1 Với biến D, các giá trị trong thời kỳ đầu (1946-1954) nhận giá trị 0; giá trị ứng với quan sát đầu tiên của thời kỳ sau (1955-1963) nhận giá trị 1/(1- ), các giá trị ứng với các quan sát sau đó nhận giá trị 1
2 Các giá trị quan sát của biến Yt biến đổi theo công thức (Yt -Yt-1)
3 Các giá trị DtYt nhận giá trị 0 trong các quan sát ở thời kỳ đầu; giá trị đầu tiên trong thời kỳ sau DtYt=Yt còn các giá trị quan sát sau đó (DtYt -Dt-1Yt-1) nhận giá trị (Yt -Yt-1)
4 Các giá trị quan sát của S, thực hiện biến đổi như với hồi quy thông thường
Trang 203 Hồi quy với biến phụ thuộc là định tính
Có nhiều hiện tượng kinh tế mà biến phụ thuộc lại là định tính nên phải
dùng biến giả để đặc trưng cho chúng Chẳng hạn , có nhà hay không có nhà, có
Y i là biến phụ thuộc rời rạc, chỉ nhận hai giá trị bằng 0 hoặc 1
b Các giả thiết của OLS trong mô hình LPM
Trong mô hình LPM phương sai của sai số ngẫu nhiên không đồng đều Thật vậy, ui = Yi - 1 - 2Xi
Var(ui) = Var( Yi - 1 - 2Xi) = Var(Yi)
Do Yi A(Pi) Var(Yi) = Pi(1 - Pi)
Var(ui) = Pi(1 - Pi)
Trang 21 Các sai số ngẫu nhiên không phân phối chuẩn Phương pháp OLS không đòi hỏi ui phân phối chuẩn, song để tiến hành các suy diễn thống kê thì cần đến giả thiết này Trong LPM thì ui là biến ngẫn nhiên rời rạc với bảng phân phối xác suất như sau:
u i - 1 - 2 X i 1 - 1 - 2 X i
P i 1 - P i P i
Tuy nhiên dù ui không phân phối chuẩn thì các ước lượng OLS vẫn là không chệch, và với mẫu lớn thì ui sẽ tiệm cận chuẩn Do đó có thể dùng OLS để ước lượng (1)
* Các ước lượng của E(Y/Xi) là Yˆi chưa chắc đã thoả mãn điều kiện 0 Yˆi 1
ước Lượng của hệ số xác định R2 có thể thấp hơn thực tế
c ước lượng mô hình
Với các đặc điểm trên, thủ tục ước lượng mô hình LPM như sau
Bước 1 Dùng OLS ước lượng (1) thu được Yˆi
Bước 2 Do ui có phương sai của sai số thay đổi nên phải khắc phục bằng phép
đổi biến số
Do chưa biết Pi nên dùng ước lượng của nó là Yˆi Trước hết phải loại đi các quan sát có Yˆi 0 và Yˆi 1 và đặt:
W i = Yˆi(1 - Yˆi)
đổi biến số và ước lượng mô hình sau:
Yi/ ƯWi = 1(1/ Wi) + 2(Xi/ Wi) + ui/ Wi (2)
Từ kết quả ước lượng (2) suy ra ước lượng của mô hình xuất phát