Mô hình 1: Giả sử hồi quy với biến phụ thuộc WAGE dạng tuyến tính — tuyến tính.. Bước 2: Giải thích ý nghĩa hệ số xác định và kiếm định mô hình: Ý nghĩa hệ số xác định: Cho biết 82.63%
Trang 1BO GIAO DUC VA DAO TAO
TRUONG DAI HOC KINH TE - TAI CHINH
THANH PHO HO CHI MINH
UNIVERSITY OF ECONOMICS & FINANCE
BAI BAO CAO NHOM
Trang 2Dữ liệu Excel: ENGIN.XLS
WAGE Mức lương tháng monthly salary Baht Thai SWAGE Mức lương khởi điểm starting wage Baht Thai EXPER Số năm làm công việc hiện tai years on current job Nam PEXPER Kinh nghiệm trước đây previous experience Nam EDUC Cấp học cao nhất đã hoàn thành | highest grade completed Cấp MALE = 1 nếu là nam =1 if male
HIGHDROP | =1 nếu không tốt nghiệp cấp3 | =l if no high school degree
HIGHGRAD_ | =1 nếu tốt nghiệp cấp 3 =1 if high school graduate
COLLEGE = 1 néu tét nghiép dai học =1 if college graduate
GRAD = 1 nếu tốt nghiệp nhiều trường | =1 if some graduate school
dai hoc POLYTECH = I nếu học trường bách khoa =l ifa polytech
Trang 3
I Mô hình 1: Giả sử hồi quy với biến phụ thuộc WAGE dạng tuyến tính — tuyến tính
1 Bước 1:
Dependent Variable: WAGE
Method: Least Squares
Adjusted R-squared 0.822367 S.D dependent var 17041.55
S.E of regression 7182.420 Akaike info criterion 20.62116
Sum squared resid 2.03E+10 Schwarz criterion 20.72039
Log likelihood -4145.164 Hannan-Quinn criter 20.66045
F-statistic 207.7882 Durbin-Watson stat 1.886737
Prob(F-statistic) 0.000000
Wage= -5483.978 + 1.647304 swage + 567.8851 exper — 235.9290 pexper + 4055.360 college + 425.2747 educ + 2897.879 grad — 1574.726 highgrad + 2433.097 male — 1509.407 polytech
Ý nghĩa: Theo số liệu gồm 403 quan sát, với điều kiện các yếu tố khác không đổi:
Ø„a„= 1.647304: Khi lương khới điểm tăng 1 Bath thi tiền lương tháng trung binh tang 1.647304 Bath Bexper = 567.8851: Khi sé nam làm công việc hiện tại tăng l năm thì lương tháng trung bình tăng
567.8851 Bath
Bpexper = 235.9290: Khi kinh nghiệm trước đây tăng 1 năm thi lương tháng trung bình giảm 235.9290 Bath
Ø.o¿.= 4055.360: Cho biết mức chênh lệch về lương tháng trung bình giữa người tốt nghiệp đại học cao
hơn người không tốt nghiệp đại học là 4055.360 Bath
Ø.a.= 425.2747: Khi cấp học cao nhất đã hoàn thành tăng 1 bật thì tiền lương tháng trung bình tăng 425.2747 Bath
Ø „4a = 2897.879: Cho biết mức chênh lệch lương tháng trung bình giữa người tốt nghiệp nhiều trường đại học cao hơn người tốt nghiệp một trường đại học 2897.879 Bath
wuu„¿a= 1574.726: Cho biết mức chênh lệch lương tháng trung bình giữa người tốt nghiệp cấp 3 thấp hơn người không tốt nghiệp cấp 3 là 1574.726 Bath.
Trang 4Bath
Ø;ø„¿= 1509.407: Cho biết mức chênh lệch lương tháng trung bình giữa người học bách khoa thấp hơn
người không học bách khoa là 1509.407 Bath
2 Bước 2: Giải thích ý nghĩa hệ số xác định và kiếm định mô hình:
Ý nghĩa hệ số xác định: Cho biết 82.63% sự biến động về lương tháng được giải thích bởi lương khởi điểm, cấp học cao nhất hoàn thành, số năm làm công việc hiện tại, kinh nghiệm trước đây có trong mô hình hồi quy mẫu gồm 403 quan sát, còn lại 17.37% được giải thích bởi các yêu tố ngoài mô hình
3 Bước 3: Xác định khoảng tin cậy và giải thích ý nghĩa:
Khoảng tin cậy:
Coefficient Confidence Intervals
Ý nghĩa: Theo số liệu gồm 403 quan sát, với điều kiện các yếu tố khác không đổi:
Bowage: Khi lwong khoi diém tang 1 Bath thi tiền lương tháng trung bình tăng từ 1.4672 Bath đến 1.8274
Trang 5Beottege Khéng có ý nghĩa
sac: Không có ý nghĩa
z«a¿: Không có ý nghĩa
imzgaa: Không có ý nghĩa
Ø„„.: Cho biết mức chênh lệch lương tháng trung bình giữa nam cao hơn nữ từ 58§3.2944 Bath dén
4282.9 Bath
so: Không có ý nghĩa
4 Bước 4: Kiểm định mỗi quan hệ có ý nghĩa giữa biến phụ thuộc và các biến độc lập:
Quan sát kết quá hồi quy mô hình ta thấy rằng các biến déc lap swage, exper, pexper, male đều có p_value < o=0.05
Kết luận: Các biên đều có ý nghĩa đối với biến phụ thuộc ở mức ý nghĩa 5%
Các biến độc lập còn lại có p_value > œ=0.05
Kết luận: Các biên đều không có ý nghĩa đối với biến phụ thuộc ở mức ý nghĩa 5%
5 Bước 5: Kiểm tra đa cộng tuyến:
Variance Inflation Factors
Trang 6Date: 10/25/23 Time: 21:48
Không có VIF nào lớn hơn 10
Kết luận: Không có hiên tượng đa cộng tuyến
6 Bước 6: Wald Test: Kiếm định thừa biến:
Dependent Variable: WAGE
Method: Least Squares
Date: 10/25/23 Time: 21:49
Sample: 1 403
Included observations: 403
Variable Coefficient Std Error — t-Statistic Prob
Cc -7629.731 3769041 -2.024316 0.0436 SWAGE 1.647333 0.091482 1800727 0.0000 EXPER 5690322 206.1751 2.759947 0.0061 PEXPER -236.0498 3577228 -6598680 0.0000 COLLEGE 1862.190 1404816 1325576 0.1857 EDUC 694.8717 2257742 3.077729 0.0022 HIGHGRAD -2682.452 1207558 -2221385 00269 MALE 2448991 9372743 2612886 00093 POLYTECH -3419.912 1379121 -2479777 0.0136 R-squared 0.826320 Mean dependent var 34683.44 Adjusted R-squared 0.822794 S.D dependent var 17041.55 S.E of regression 7173.792 Akaike info criterion 20.61634 Sum squared resid 2.03E+10 Schwarz criterion 20.70564 Log likelihood -4145.192_ Hannan-Quinn criter 20.65169 F-statistic 234.3176 Durbin-Watson stat 1.888069 Prob(F-statistic) 0.000000
Trang 7
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std Err
C(8) 1862190 1404816
Restrictions are linear in coefficients
H0: Mô hình có I biến thừa
Ta có: p-value=0.1857 > œ=0.05 => chấp nhận H0 Kết luận: Mô hình có 1 biến thừa => loại bỏ 1 biến thừa
® Sau khi loại bỏ 1 biến thừa:
Dependent Variable: WAGE
Method: Least Squares
Date: 10/25/23 Time: 21:51
- 1403
Included observations: 403
Variable Coefficient Std Error t-Statistc Prob
Cc -7797.041 3770535 -2067887 00393 SWAGE 1.613808 0088000 1833867 00000 EXPER 579.9674 2062073 2812546 0.0052 PEXPER -235.7890 35.80601 -6585180 00000 EDUC 796.6968 2125082 3749017 00002 HIGHGRAD -3448.784 1061196 -3249903 00013 MALE 2431819 9380826 2592330 0.0099 POLYTECH -4380.871 1174342 -3730490 00002 R-squared 0.825545 Mean dependent var 34683 44 Adjusted R-squared 0.822454 S.D dependent var 17041.55 S.E of regression 7180665 Akaike info criterion 20.61582 Sum squared resid 2.04E+10 Schwarz criterion 20.69521 Log likelihood -4146.088 Hannan-Quinn criter 20.64725 F-statistic 267.0286 Durbin-Watson stat 1.865886 Prob(F-statistic) 0.000000
Trang 8
Equation: UNTITLED
Omitted Variables: Squares of fitted values
Specification: WAGE C SWAGE EXPER PEXPER EDUC HIGHGRAD
Kết luận: Mô hình không sót biến
8 Bước 8: Kiểm định phương sai của sai số thay đối
Heteroskedasticity Test: Breusch-Pagan-Godfrey
Null hypothesis: Homoskedasticity
F-statistic 5.625523 Prob F(7,395) 0.0000
Obs*R-squared 3653402 Prob Chi-Square(7) 0.0000
Scaled explained SS 212.1688 Prob Chi-Square(7) 0.0000
H0: Phương sai sai số không đổi
p_value =0 < ø=0.05 => bác bỏ H0
Kết luận: Phương sai sai số thay đôi
9 Bước 9: Serial Correclation Test: Kiếm định hiện tượng tự tương quan của sai số
Breusch-Godfrey Serial Correlation LM Test:
Null hypothesis: No serial correlation at up to 2 lags
F-statistic 1.949829 Prob F(2,393) 0.1437
Obs*R-squared 3.959597 Prob Chi-Square(2) 0.1381
H0: Không có tự tương quan
p_value=0.1381 > a=0.05 => Chấp nhận H0
Kết luận: Mô hình không có hiện tượng tự tương quan
10 Đánh giá mô hình:
Trang 9Method: Least Squares
R-squared 0.825545 Mean dependent var 34683 44
Adjusted R-squared 0.822454 SD dependent var 17041.55
S.E of regression 7180.665 Akaike info criterion 20.61582
Sum squared resid 2.04E+10 Schwarz criterion 20.69521
Log likelihood -4146.088 Hannan-Quinn criter 20.64725
F-statistic 267.0286 Durbin-Watson stat 1.865886
Prob(F-statistic) 0.000000
- Tat cả các biến độc lập đưa vào mô hình đều có ý nghĩa thống kê ở mức ý nghĩa 5%
- Các biến độc lập có trong mô hình giải thích được 82.55% sự biến động của lương tháng
- Mô hỉnh không mắc các lỗi: thừa biến, thiếu biến
- Mô hinh không xảy ra hiện tượng tự tương quan
- Tuy nhiên mô hình hồi quy mẫu có phương sai sai số thay đổi
IL Mô hình 2: Giả sử hồi quy với biến phụ thuộc WAGE dạng tuyến tính — log
1 Bước 1:
Dependent Variable: WAGE
Method: Least Squaras
Sum squared resid 2.16E+10 Schwarz criterion 20.78294
F-statistic 192.5421 Durbin-Watson stat 1.878075
Trang 10highgrad — 12.8431 male + 547.2385 exper — 253.0683 pexper — 6550.662 polytech
2915.133
Ý nghĩa: Theo số liệu gồm 403 quan sat, với điều kiện các yếu tố khác không đổi:
Broz(svage) = 38365.89: Khi lương khởi điểm tăng 1% thì tiền lương tháng trung bình tăng 383.6589 Bath
Ø.a.= 812.9565: Khi cấp học cao nhất đã hoàn thành tăng 1 bật thì tiền lương tháng trung bình tăng 812.9565 Bath
exper = 547.2385: Khi so nam làm công việc hiện tại tăng 1 năm thì lương tháng trung bình giảm 547.2385 Bath
Bpexper = 547.2385: Khi kinh nghiệm trước đây tăng 1 nam thi luong tháng trung bình giảm 547.2385 Bath
Beotege = 2496.447: Cho biét mire chénh léch vé long thang trung binh gitra ngudi tét nghiệp đại học
thấp hơn người không tốt nghiệp đại học là 2496.447 Bath
Ø„aa= 2915.133: Cho biết mức chênh lệch lương tháng trung bình giữa người tốt nghiệp nhiều trường
đại học thấp hơn người tốt nghiệp một trường đại học 2915.133 Bath
uz„¿á = 3820.504: Cho biết mức chênh lệch lương tháng trung bình giữa người tốt nghiệp cấp 3 thấp hơn người không tốt nghiệp cấp 3 là 3820.504 Bath
Bmate= 12.8431: Cho biét mire chénh lệch lương tháng trung bình giữa nam thấp hơn nữ là 12.8431 Bath Ø;oy¿= 6550.662: Cho biết mức chênh lệch lương tháng trung bình giữa người học bách khoa thấp hơn người không học bách khoa là 6550.662 Bath
2 Bước 2: Giải thích ý nghĩa hệ số xác định và kiểm định mô hình:
Ý nghĩa hệ số xác định: Cho biết 81.51% sự biến động về lương tháng được giải thích bởi lương khởi
điểm, cấp học cao nhất hoàn thành, số năm làm công việc hiện tại, kinh nghiệm trước đây có trong mô
hình hỏi quy mẫu gồm 403 quan sát, còn lai 18.49% được giải thích bởi các yếu tố ngoài mô hình
3 Bước 3: Xác định khoảng tin cậy và giải thích ý nghĩa:
Khoảng tin cậy:
Trang 11Ý nghĩa: Theo số liệu gồm 403 quan sat, với điều kiện các yếu tố khác không đổi:
fozrs¿¿¿: Khi lương khởi điểm tăng 1 Bath thì tiền lương tháng trung bình tăng từ 33858.45 Bath dén
42873.34 Bath
Ø.a-: Không có ý nghĩa
Ø.„„: Khi số năm làm công việc hiện tại tăng 1 năm thì lương tháng trung bình giảm từ 128.4761 Bath
đến 966.0010 Bath
Øp«„ø: Khi kinh nghiệm trước đây tăng 1 năm thì lương tháng trung bình giám từ 326.3143 Bath đến
179.8224 Bath
Peollege Khong 06 y nghia
Perot Khong cé y nghia
Prigngraa’ Khong có ý nghĩa
„ae: Không có ý nghĩa
Protect: Khong 06 y nghia
4 Bước 4: Kiếm định mối quan hệ có ý nghĩa giữa biến phụ thuộc và các biến độc lập:
Quan sát kết quá hồi quy mô hình ta thấy rằng các biến độc lập /og(swage), exper, pexper đều có p_value < o=0.05
Kết luận: Các biên đều có ý nghĩa đối với biến phụ thuộc ở mức ý nghĩa 5%
Các biến độc lập còn lại có p_value > œ=0.05
Kết luận: Các biên đều không có ý nghĩa đối với biến phụ thuộc ở mức ý nghĩa 5%
5 Bước 5: Kiểm tra đa cộng tuyến:
Trang 12EXPER 4536910 61.81854 1.018364 PEXPER 1388.009 2.418035 1.115077
Co 5 VIF > 10
Kết tuận: Có hiện tượng đa cộng tuyến
Test lại: bỏ biến GRAD có VIE lớn nhất
Không có VIF nao > 10
Kết luận: Không có hiện tượng đa cộng tuyến
Trang 13Method: Least Squares
Date: 10/25/23 Time: 23:57
R-squared 0.815111 Mean dependent var 34683.44 Adjusted R-squared 0.811357 S.D dependent var 17041.55 S.E of regression 7401.663 Akaike info criterion 20.67888 Sum squared resid 2.16E+10 Schwarz criterion 20.76818
Log likelihood -4157.794 Hannan-Quinn criter 20.71423 F-statistic 217.1263 Durbin-Watson stat 1.876472 Prob(F-statistic ) 0.000000
Null Hypothesis: C(3)=C(6)=0
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std Err
Restrictions are linear in coefficients
H0: Mô hình có 2 biến thừa
Ta có: p-value=0.9789 > œ=0.05 => chấp nhận H0 Kết luận: Mô hình có 2 biến thừa
© Sau khi bỏ 2 biến thừa:
Trang 14Method: Least Squares
7 Budc 7: Ramsay Test: Kiếm định sót biến:
Ramsey RESET Test
Equation: UNTITLED
Omitted Variables: Powers of fitted values from 2 to 9
Specification: WAGE C LOG(SWAGE) EDUC HIGHGRAD EXPER
Kết luận: Mô hình sót 8 biến
8 Bước 8: Kiểm định phương sai của sai số thay đối
Heteroskedasticity Test: Breusch-Pagan-Godfrey
Null hypothesis: Homoskedasticity
F-statistic 6.231808 Prob F(6,396) 0.0000
Obs*R-squared 34.76887 Prob Chi-Square(6) 0.0000
Scaled explained SS 172.3913 Prob Chi-Square(6) 0.0000
Trang 15Null hypothesis: No serial correlation at up to 2 lags
Dependent Variable: WAGE
Method: Least Squares
- Tat cá các biến độc lập đưa vào mô hình đều có ý nghĩa thống kê ở mức ý nghĩa 5%
- Các biến độc lập có trong mô hình giải thích được 81.51% sự biến động của lương tháng
- Mô hình không mắc các lỗi: thừa biến
- Mô hinh không xảy ra hiện tượng tự tương quan
- Tuy nhiên mô hình hồi quy mẫu có phương sai sai số thay đổi và thiếu biến
II Mô hình3: Giả sử hồi quy với biến phụ thuộc WAGE dạng log — tuyến tính
1 Bước l:
Trang 16Method: Least Squares
R-squared 0.833058 Mean dependent var 10.36319
Adjusted R-squared 0.829234 S_D dependent var 0.401836
S.E of regression 0.166054 Akaike info criterion -0.728508
Sum squared resid 1083654 Schwarz criterion -0.629278
Log likelihood 156.7943 Hannan-Quimn criter -0.689223
F-statistic 217.9006 Durbin-Watson stat 1.965638
Prob(F-statistic) 0.000000
Log(wage) = 9.383058 + 3.33x10 swage + 0.016496 exper — 0.05793 pexper + 0.210576 college + 0.009145 educ + 0.164306 grad — 0.0007 highgrad + 0.124510 male + 0.059276 polytech
Ý nghĩa: Theo số liệu gồm 403 quan sát, với điều kiện các yếu tố khác không đổi:
Ø»„a„= 3.33x10””: Khi lương khởi điểm tăng 1 Bath thì tiền lương tháng trung bình tăng 3.33x10 3%,
Ø„„e= 0.016496: Khi số năm làm công việc hiện tại tăng 1 năm thì lương tháng trung bình tăng 1.6496
%
Bpexper= 0.05793: Khi kinh nghiém trudc day tang | năm thì lương tháng trung bình giảm 5.793 %, Ø.o¿= 0.210576: Cho biết mức chênh lệch về lương tháng trung bình giữa người tốt nghiệp đại học cao
hơn người không tốt nghiệp đại học là 21.0576 %
Ø.a = 0.009145: Khi cấp học cao nhất đã hoàn thành tăng 1 bật thì tiền lương tháng trung bình tăng 0.9145 %
Barat = 9.164306: Cho biét mire chénh léch long tháng trung bình giữa người tốt nghiệp nhiều trường đại học cao hơn người tốt nghiệp một trường đại học 16.4306 %
„¿2ä = 0.0007: Cho biết mức chênh lệch lương tháng trung bình giữa người tốt nghiệp cấp 3 cao hơn người không tốt nghiệp cấp 3 là 0.07%
Bmate= 0.124510: Cho biét mite chénh lệch lương tháng trung bình giữa nam cao hơn nữ là 12.4510 % Bpovrech = 0.059276: Cho biét mire chénh lệch lương tháng trung bình giữa người học bách khoa cao hơn
người không học bách khoa là 5.9276 %