Bạn hãy cho biết ý nghĩa kinh tế của hệ số hồi quy đứng trước biến manager, biến teamleader.. Hệ số hồi quy đứng trước biến educmale là ˆ4 1089.28, nghĩa là trong điều kiện các yếu k
Trang 1Bài 1 Ta có các biến sau:
Jobcat (vị trí công việc) 1: nhân viên, 2: trưởng nhóm/tổ trưởng/Quản đốc , 3:quản lý
salary tiền lương hiện tại trong một năm (USD)
salbegin tiền lương khởi điểm trong một năm (USD)
a Dùng eviews, ước lượng mô hình sau:
Salary= β1+ β2educ + β3male + β4educmale + β5teamleader + β6manager +u
Ta có bảng kết quả eviews như sau:
Dependent Variable: SALARY
Method: Least Squares
Date: 01/05/12 Time: 16:07
Sample (adjusted): 2 474
Included observations: 473 after adjustments
Variable Coefficient Std Error t-Statistic Prob
C 13309.06 3345.060 3.978721 0.0001
EDUC 931.4081 266.7575 3.491591 0.0005
MALE -9096.511 4827.937 -1.884140 0.0602
EDUCMALE 1089.276 355.8938 3.060677 0.0023
TEAMLEADER 6145.301 2100.716 2.925336 0.0036
MANAGER 25941.59 1437.853 18.04190 0.0000
R-squared 0.728337 Mean dependent var 34371.83
Adjusted R-squared 0.725429 S.D dependent var 17062.05
Trang 2S.E of regression 8940.439 Akaike info criterion 21.04716
Sum squared resid 3.73E+10 Schwarz criterion 21.09992
Log likelihood -4971.654 Hannan-Quinn criter 21.06791
F-statistic 250.4084 Durbin-Watson stat 1.804007
Prob(F-statistic) 0.000000
Mô hình ước lượng: SALARY = 13309.06 + 931.41*EDUC - 9096.51*MALE + 1089.28*EDUCMALE + 6145.30*TEAMLEADER + 25941.59*MANAGER
b Bạn hãy cho biết ý nghĩa kinh tế của hệ số hồi quy đứng trước biến manager, biến teamleader.
Ý nghĩa kinh tế của hệ số hồi quy đứng trước biến manager ˆ6
Ta có ˆ6 25941.59nghĩa là trong trường hợp các yếu tố khác không đổi, tiền lương trung bình của người quản lý cao hơn so người nhân viên là 25941.59 USD/năm
Ta có ˆ5 6145.30nghĩa là trong trường hợp các yếu tố khác không đổi, tiền lương trung bình của người trưởng nhóm cao hơn so người nhân viên là 6145.30 USD/năm
c Hệ số hồi quy đứng trước biến educmale là ˆ4 1089.28, nghĩa là trong điều kiện các yếu không đổi, khi số năm đi học tăng thêm một năm thì tiền lương trung bình của của người nam tăng nhiều hơn người
nữ 1089.28 USD/năm
d Phương trình để ước tính tiền lương cho nam:
Phương trình để ước tính tiền lương cho nữ:
Do đó, trong điều kiện cố định các yếu tố khác, trung bình mức chênh lệch tiền lương của nam so với nữ
là 3 2.educ
f Mức lương trung bình của một người có 16 năm đi học, ở chức vụ quản lý, là nam, có tuổi bằng 34,
đã từng làm việc trong nghề là 5 năm, có một vợ hai con.
Mô hình ước lượng:
6145.30*TEAMLEADER + 25941.59*MANAGER
Thay educ = 16, male = 1, manager = 1, teamleader = 0 vào mô hình ước luong, ta có mức lương trung bình của người này là: SALARY = 13309.06 – 9096.51 + (931.41 + 1089.28)*16 + 25941.59 = 62485.18 (USD/năm)
g Ước lượng mô hình:
Trang 3Salary= α1+ α2educ + α3female + α4clerical + α6manager + v
Ta có bảng kết quả eviews như sau:
Dependent Variable: SALARY
Method: Least Squares
Date: 01/05/12 Time: 22:30
Sample (adjusted): 2 474
Included observations: 473 after adjustments
Variable Coefficient Std Error t-Statistic Prob
C 15822.42 2661.445 5.945049 0.0000
EDUC 1484.162 198.0727 7.493018 0.0000
FEMALE -5389.284 961.8406 -5.603095 0.0000
CLERICAL -4023.357 2000.666 -2.011009 0.0449
MANAGER 23246.72 2466.586 9.424657 0.0000
R-squared 0.722888 Mean dependent var 34371.83
Adjusted R-squared 0.720519 S.D dependent var 17062.05
S.E of regression 9020.012 Akaike info criterion 21.06279
Sum squared resid 3.81E+10 Schwarz criterion 21.10676
Log likelihood -4976.351 Hannan-Quinn criter 21.08009
F-statistic 305.2115 Durbin-Watson stat 1.810217
Prob(F-statistic) 0.000000
Hàm hồi quy ước lượng: SALARY = 15822.42 + 1484.16*EDUC 5389.28*FEMALE
-4023.36*CLERICAL + 23246.72*MANAGER
Nhận xét:
Vì P-value( t-Stat) của tất cả các hệ số hồi quy đều nhỏ hơn 5%, nên tất cả các tham số có trong mô hình đều khác 0 ở mức ý nghĩa 5% Hay nói cách khác các biến có trong mô hình đều có
ý nghĩa thống kê ở mức 5%
Vì Prob(F-stat) = 0.0000 nên mô hình phù hợp ở mọi mức ý nghĩa
Trang 4 Vì R2= 0.72 nên mô hình đã giải thích được 72% sự biến thiên của Salary.
Dữ liệu ở file data 4-8.wf1 của Ramanathan về các hệ thống cáp của một mẫu gồm 40 thị trường truyền
hình, có các biến sau:
Sub: số người đăng ký thuê bao trên mỗi hệ thống (ngàn người)
Home: số lượng nhà mà hệ thống đi qua
Inst: chi phí lắp đặt (USD)
Svc: chi phí dịch vụ hàng tháng của mỗi hệ thống (USD)
Tv: số lượng tín hiệu truyền tải bởi mỗi hệ thống cáp
Age: tuổi của mỗi hệ thống (năm)
Air: số lượng tín hiệu truyền hình miễn phí nhận được
Y: thu nhập bình quân đầu người của mỗi thị trường cáp truyền hình (USD)
a Bạn hãy ước lượng mô hình không giới hạn sau và giải thích kết quả
Sub=β1+β2age+β3age2+β4air+β5air2+β6y+β7y2+β8home+β9svc+β10tv+β11inst+u (1)
Dùng Eview, ta có:
Dependent Variable: SUB
Method: Least Squares
Date: 12/25/11 Time: 18:13
Sample: 1 40
Included observations: 40
Variable Coefficient Std Error t-Statistic Prob
C -474.0426 194.8894 -2.432367 0.0214
AGE -1.139888 1.221231 -0.933393 0.3583
AGE2 0.117436 0.057656 2.036834 0.0509
AIR 16.60937 4.470360 3.715444 0.0009
AIR2 -1.428268 0.298763 -4.780611 0.0000
Y 0.090681 0.043775 2.071518 0.0473
Y2 -4.84E-06 2.36E-06 -2.046183 0.0499
HOME 0.492678 0.030764 16.01483 0.0000
INST -0.211522 0.392045 -0.539536 0.5936
SVC 0.353465 1.948934 0.181363 0.8573
Trang 5TV 0.576447 0.506629 1.137809 0.2645
R-squared 0.946099 Mean dependent var 24.50850
Adjusted R-squared 0.927513 S.D dependent var 33.53720
S.E of regression 9.029360 Akaike info criterion 7.467256
Sum squared resid 2364.351 Schwarz criterion 7.931698
Log likelihood -138.3451 Hannan-Quinn criter 7.635184
F-statistic 50.90272 Durbin-Watson stat 2.035560
Prob(F-statistic) 0.000000
Hàm hồi quy:
SUB = -474.04 - 1.14AGE + 0.12AGE2 + 16.61AIR - 1.43AIR2 + 0.09Y - 4.84e-06Y2 + 0.49HOME -0.21INST + 0.35SVC + 0.58TV + ˆu
Dựa vào kết quả Eview, ta thấy R2= 0.95 Vậy hàm hồi quy đã giải thích được 95% cho tổng thể hay phù hợp với tập dữ liệu mẫu
Ngoài ra, vì P-value của các biến AGE, INST, SVC, TV khá lớn nên các biến này không có ý nghĩa thống kê
b Theo bạn, Mô hình (1) có bị vi phạm sai số đặc trưng: thừa biến không cần thiết hay không? Nếu có, hãy khắc phục sai số đặc trưng này (giả sử bạn quan tâm đến độ tin cậy ít nhất là 90%) bằng cách loại lần lượt các biến không có ý nghĩa thống kê ra khỏi mô hình và chỉ ra mô hình mà bạn chọn Nếu không khắc phục, theo bạn, mô hình sẽ có những trục trặc gì?
Nhận thấy R2của mô hình khá cao nhưng có nhiều biến không có ý nghĩa thống kê, như vậy trong mô hình có thể có hiện tượng thừa biến không cần thiết
Do biến SVC có P-value = 0.86 là rất lớn nên trước tiên ta loại biến này ra khỏi mô hình Khi đó ta có:
Dependent Variable: SUB
Method: Least Squares
Date: 12/25/11 Time: 18:46
Sample: 1 40
Included observations: 40
Variable Coefficient Std Error t-Statistic Prob
C -489.5868 172.1874 -2.843337 0.0080
Trang 6AGE -1.281073 0.925668 -1.383944 0.1766
AGE2 0.123682 0.045488 2.719017 0.0108
AIR 16.61292 4.397672 3.777663 0.0007
AIR2 -1.425278 0.293460 -4.856807 0.0000
Y 0.094536 0.037647 2.511077 0.0177
Y2 -5.04E-06 2.04E-06 -2.469768 0.0194
HOME 0.494411 0.028765 17.18769 0.0000
INST -0.185738 0.359421 -0.516770 0.6091
TV 0.586987 0.495106 1.185578 0.2451
R-squared 0.946038 Mean dependent var 24.50850
Adjusted R-squared 0.929850 S.D dependent var 33.53720
S.E of regression 8.882628 Akaike info criterion 7.418390
Sum squared resid 2367.033 Schwarz criterion 7.840610
Log likelihood -138.3678 Hannan-Quinn criter 7.571051
F-statistic 58.43881 Durbin-Watson stat 2.041747
Prob(F-statistic) 0.000000
Theo kết quả trên, sau khi bỏ biến SVC thì R2, R2-hiệu chỉnh hầu như không thay đổi nhưng ý nghĩa thống kê của các biến được cải thiện đáng kể
Do biến INST có P-value = 0.61 là rất lớn nên ta tiếp tục loại biến này ra khỏi mô hình Khi đó ta có:
Dependent Variable: SUB
Method: Least Squares
Date: 12/25/11 Time: 18:53
Sample: 1 40
Included observations: 40
Variable Coefficient Std Error t-Statistic Prob
Trang 7AGE -1.311035 0.912864 -1.436178 0.1610
Adjusted R-squared 0.931508 S.D dependent var 33.53720
S.E of regression 8.776992 Akaike info criterion 7.377252
Sum squared resid 2388.103 Schwarz criterion 7.757250
Log likelihood -138.5450 Hannan-Quinn criter 7.514648
F-statistic 67.30152 Durbin-Watson stat 1.990931
Prob(F-statistic) 0.000000
Theo kết quả trên, sau khi bỏ biến INST thì R2không thay đổi, nhưng R2-hiệu chỉnh được cải thiện hơn và biến AGE, TV có ý nghĩa thống kê hơn Vậy biến INST thật sự là biến không cần thiết
Tiếp tục bỏ biến TV, ta có:
Dependent Variable: SUB
Method: Least Squares
Date: 12/25/11 Time: 18:57
Sample: 1 40
Included observations: 40
Variable Coefficient Std Error t-Statistic Prob
Trang 8AIR2 -1.417655 0.291945 -4.855898 0.0000
Adjusted R-squared 0.929930 S.D dependent var 33.53720
S.E of regression 8.877524 Akaike info criterion 7.381779
Sum squared resid 2521.934 Schwarz criterion 7.719555
Log likelihood -139.6356 Hannan-Quinn criter 7.503908
F-statistic 74.94125 Durbin-Watson stat 2.068971
Prob(F-statistic) 0.000000
Theo kết quả trên, sau khi bỏ biến TV thì R2, nhưng R2-hiệu chỉnh vẫn tốt và các biến còn lại trong mô hình đều có ý nghĩa thống kê ở mức 10% Vậy biến TV thật sự là biến không cần thiết
Nếu không khắc phục hiện tượng thừa biến thì kết quả ước lượng sẽ thiếu chính xác, các biến có ý nghĩa thống kê sẽ trở thành không có ý nghĩa, chẳng hạn như biến AGE
c Về mặt thống kê, từ mô hình (1), bằng kiểm định Wald bạn hãy đưa ra kết luận xem có nên loại đồng thời cả ba biến inst, tv, svc ra khỏi mô hình (1) hay không?
Thực hiện kiểm định Wald trong mô hình (1) với cặp giả thuyết: 0 9 10 11
:
H
H khong phai H
Ta có:
Wald Test:
Equation: Untitled
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std Err
Trang 9C(9) 0.353465 1.948934
Ta có P-value(F-stat) = 0.59, vì vậy ta không thể bác bỏ H0hay các biến INST, TV, SVC thật sự không cần thiết với mô hình
d Về mặt thống kê, bằng kiểm định nhân tử Lagrange, bạn hãy đưa ra kết luận xem mô hình mà bạn chọn
ở câu b có bị thiếu ba biến quan trọng sau đây hay không: inst, tv, svc.
Để thực hiện kiểm định nhân tử Lagrange, ta tiến hành các bước sau:
Đặt giả thuyết: 0 9 10 11
:
H
H khong phai H
Hồi quy mô hình (1) bằng Eview
Tính phần dư : trong bảng kết xuất Eview, ta vào Proc, chọn Make residual series Khi đó ta sẽ có thêm biến phandu
Ước lượng mô hình
phandu=β1+β2age+β3age2+β4air+β5air2+β6y+β7y2+β8home+β9svc+β10tv+β11inst+v
Ta có:
Dependent Variable: PHANDU
Method: Least Squares
Date: 12/25/11 Time: 19:33
Sample: 1 40
Included observations: 40
Variable Coefficient Std Error t-Statistic Prob
Trang 10HOME 2.68E-14 0.030764 8.72E-13 1.0000
R-squared 0.000000 Mean dependent var -1.69E-14
Adjusted R-squared -0.344828 S.D dependent var 7.786166
S.E of regression 9.029360 Akaike info criterion 7.467256
Sum squared resid 2364.351 Schwarz criterion 7.931698
Log likelihood -138.3451 Hannan-Quinn criter 7.635184
F-statistic 1.12E-15 Durbin-Watson stat 2.035560
Prob(F-statistic) 1.000000
Vì R2= 0 nên nR2= 0 nên ta không thể bác bỏ H0 Vì vậy ba biến INST, SVC, TV là ba biến không cần thiết, không nên đưa vào mô hình
e Hãy xem mô hình mà bạn lựa chọn ở câu b có bị sai số đặc trưng không bằng thống kê Durbin-Watson.
Theo kết quả hồi quy ở câu b) thì giá trị Durbin-Watson stat = 2.07
Với cỡ mẫu n = 40, số biến độc lập là 7, theo bảng tra Durbin- Watson ta có: dL 1.120, dU 1.924 Vậy giá trị Durbin-Watson stat = 2.07 thuộc khoảng dU; 4 dU
Do đó ta không thể bác bỏ giả thuyết H0: 0 hay ta có thể kết luận mô hình ở câu b không bị sai số đặc trưng
f Hãy sử dụng kiểm định RESET của Ramsey để xem xét mô hình mà bạn đã chọn ở câu b có bị sai số đặc trưng hay không, và cho biết nhận xét của bạn từ kết quả tính toán.
Hồi quy mô hình sau:
Dependent Variable: SUB
Method: Least Squares
Date: 12/25/11 Time: 22:25
Sample: 1 40
Included observations: 40
Variable Coefficient Std Error t-Statistic Prob
Trang 11C -72.55425 163.5784 -0.443544 0.6606
Adjusted R-squared 0.959315 S.D dependent var 33.53720
S.E of regression 6.764656 Akaike info criterion 6.873618
Sum squared resid 1372.817 Schwarz criterion 7.295838
Log likelihood -127.4724 Hannan-Quinn criter 7.026279
F-statistic 103.1751 Durbin-Watson stat 1.634277
Prob(F-statistic) 0.000000
Ta có RU2 0.97; RR2 0.94 Suy ra
2
/ 0.97 0.94 / 2
15
1 0.97 / 40 10
U
F
Vì giá trị thống kê F lớn nên ta không thể bác bỏ H0hay mô hình không có sai số đặc trưng
g Với mô hình mà bạn đã chọn ở câu b, hãy cho biết tác động biên của Y theo các biến có ở trong mô hình (nếu tác động biên phụ thuộc vào một biến giải thích khác, hãy tính tác động biên này ở giá trị trung bình của các biến giải thích)?
Tác động biên của SUB theo biến AGE:
1.56 0.28 1.56 0.28 8.57 0.84
SUB
AGE AGE
Tác động biên của Y theo biến AIR:
SUB
AIR AIR
Tác động biên của SUB theo biến Y:
Trang 120.11 2 0.000006 0.11 2 0.000006 9209.68 0.22
SUB
Y Y
Tác động biên của SUB theo biến HOME: SUB 0.5
HOME
h Anh Tèo đã ước lượng mô hình sau:
(2)
Trong mô hình trên, nếu biến home có ý nghĩa thống kê ở mức ý nghĩa 10%, và ít nhất một trong 2 biến age, age2có ý nghĩa thống kê ở mức ý nghĩa 10% thì Tèo có thể sử dụng Theo bạn, từ thông tin của mẫu,
hệ số ước lượng của α4cho Tèo biết điều gì?
Hồi quy mô hình (2), ta có:
Dependent Variable: LNSUB
Method: Least Squares
Date: 12/25/11 Time: 22:58
Sample: 1 40
Included observations: 40
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.594655 S.D dependent var 1.282355
S.E of regression 0.816433 Akaike info criterion 2.526895
Sum squared resid 23.99626 Schwarz criterion 2.695783
Log likelihood -46.53791 Hannan-Quinn criter 2.587960
F-statistic 20.07146 Durbin-Watson stat 1.353227
Prob(F-statistic) 0.000000
Trang 13Hệ số ước lượng ˆ4 0.011 cho ta biết khi số lượng nhà mà hệ thống đi qua tăng lên 1 đơn vị thì số người đăng ký thuê bao tăng lên 1.1%
i Với mô hình 2, từ thông tin của mẫu, xét tại giá trị trung bình của home, age, theo bạn tác động biên, và
hệ số co giãn của sub theo age sẽ là bao nhiêu?
dSUB
dSUB
Tác động biên của sub theo age là: dSUB 1.51
Ta có:
/
/
dSUB
dSUB SUB
Hệ số co giãn của sub theo age là: /
0.007 /
dSUB SUB
Bài 2 (50 điểm)
Một nghiên cứu của tác giả Tô Trung Thành1về “Đầu tư công ‘lấn át’ đầu tư tư nhân? Góc nhìn
từ mô hình thực nghiệm VECM” có kết quả của hàm hồi quy đồng liên kết như sau:
Ln(Y)=6.57 +0.23ln(GI) +0.33ln(PI) + ˆ u
Hàm trên sử dụng số liệu theo năm, từ 1986-2010 với nguồn số liệu của Tổng cục thống kê Biến
Y là GDP, biến GI là đầu tư khu vực nhà nước, và PI là đầu tư của khu vực tư nhân; các biến này đều lấy theo giá so sánh năm 1994.
a Bạn hãy cho biết biến ln(GI) có ý nghĩa thống kê ở độ tin cậy 99% hay không?
Kiểm định cặp giả thuyết: 0 2
1 2
H H
Với độ tin cậy 99%, giá trị tra bảng t0.005;22 2.819
Giá trị thống kê t stat 30.46
Ta có t stat t0.005;22, do đó bác bỏ H0 Hay nói cách khác với độ tin cậy 99% thì 2 0 và do
đó biến ln(GI) có ý nghĩa thống kê ở độ tin cậy 99%.
b Bạn hãy cho biết biến ln(PI) có ý nghĩa thống kê ở độ tin cậy 95% hay không?
Trang 14Kiểm định cặp giả thuyết: 0 3
1 3
H H
Với độ tin cậy 95%, vì giá trị t-stat của ˆ3 là 28.17 nên áp dụng quy tắc 2t ta có thể bác bỏ giả thuyết H0 Hay nói cách khác với độ tin cậy 95% thì 3 0 và do đó biến ln(PI) có ý nghĩa thống kê ở độ tin cậy 95%
c Bạn nhận định gì về mức độ hiệu quả của đầu tư công so với đầu tư tư nhân?
Do hệ số co giãn của GDP theo đầu tư công bằng 0.23 nhỏ hơn hệ số co giãn của GDP theo đầu
tư tư nhân bằng 0.33 nên mức độ hiệu quả của đầu tư công thấp hơn so với đầu tư tư nhân.
d Có người cho rằng hệ số co giãn của GDP theo đầu tư công là rất lớn, và bằng 0.42 ; bạn nhận định gì về phát biểu này.
Kiểm định cặp giả thuyết: 0 2
1 2
H H
2
ˆ
Giá trị thống kê: 2
2
ˆ 0.42 0.23 0.42
25
t se
Vì giá trị thống kê t rất lớn nên ta có thể bác bỏ H0ở mọi mức ý nghĩa Hay nói cách khác, lời phát biểu trên là sai.
e Bạn hãy ước lượng khoảng tin cậy 95% của hệ số hồi quy đứng trước biến ln(PI).
Với mức ý nghĩa 5% , ta có giá trị tra bảng t0.025;22 2.074
3
ˆ
Khi đó biên của sai số t0.025;22 se ˆ3 2.074 0.0117 0.024
Suy ra: 3 ˆ3 ; ˆ3 0.33 0.024;0.33 0.024 0.306;0.354
Bài 3 (50 điểm)
Mùa Noel đến, hơi lạnh một chút, được nhóm phân công, sau một hồi hì hục tìm kiếm lý thuyết
và dữ liệu, anh Tèo và chị Tý đã thu thập được một số bài báo, một số dữ liệu từ 1990-2007 của biến Export (xuất khẩu), exrate (tỷ giá giữa đồng USD và đồng VND, ví dụ 1 USD = 16000 VND), GDPVN (GDP của Việt Nam), GDPWorld (GDP của thế giới), FDI (FDI vào Việt Nam)
từ nguồn dữ liệu của Cơ quan thống kê Liên Hiệp Quốc và Tổng Cục thống kê của Việt Nam.