Đề tài KTL: NHỮNG NHÂN TỐ ẢNH HƯỞNG ĐẾN ĐIỂM TRUNG BÌNH HỌC TẬP CỦA SINH VIÊN HỌC VIỆN TÀI CHÍNHKhắc phục khuyết tật Phương sai sai số thay đổi (PSSSTĐ)Mô hình có đa cộng tuyếnXét thấy mô hình mắc khuyết tật đa cộng tuyến ở mức thấp. Biện pháp khắc phục đề xuất là gia tăng kích cỡ mẫu bằng cách thu thập thêm số liệu
Trang 1TRƯỜNG HỌC VIỆN TÀI CHÍNH
KHOA KẾ TOÁN
- -BÀI TẬP NHÓM KINH TẾ LƯỢNG
TÊN ĐỀ TÀI CÁC YẾU TỐ TÁC ĐỘNG ĐẾN ĐIỂM TRUNG BÌNH TÍCH LŨY
SINH VIÊN HỌC VIỆN TÀI CHÍNH K54
GV hướng dẫn:
Nhóm thực hiện:
HÀ NỘI - 2018
Trang 2LỜI NÓI ĐẦU
Kinh tế lượng hiểu theo nghĩa hẹp, là ứng dụng toán, đặc biệt là các phương pháp thống kê vào tinh tế Kinh tế lượng lý thuyết nghiên cứu các thuộc tính thống kê của các quy trình kinh tế lượng, ví dụ như: xem xét tính hiệu quả của việc lấy mẫu, của thiết Kinh tế lượng thực nghiệm bao gồm:
1./ Ứng dụng các phương pháp kinh tế lượng vào đánh giá các lý thuyết kinh tế
2./ Phát triển và sử dụng các mô hình kinh tế lượng
Hai mục đích chính của kinh tế lượng là:
1./ Kiểm nghiệm lý thuyết kinh tế bằng cách xây dựng các mô hình kinh tế (mà có khả năng kiểm định được).
2./ Chạy (estimate) và kiểm tra mô hình đó xem chúng đưa ra kết quả chấp nhận hay phủ quyết lý thuyết thống kê.
Đây là bộ môn khoa học kinh tế gồm các hệ thống phương pháp giúp tiến hành các nghiên cứu định lượng và thực chứng Vì thế nếu chỉ biết đến lý thuyết suông mà chưa áp dụng vào thực tế cuộc sống thì chưa thấy được tính hữu dụng, sự thú vị và hay ho của môn học Vì vậy, khi được giao bài tập nhóm từ Giảng viên bộ môn, chúng em rất vui vì có cơ hội đem những lý thuyết học trên lớp ứng dụng vào cuộc sống xung quanh Nhóm chúng em gồm 6 sinh viên đã tiến hành làm báo cáo cho đề tài này dưới sự hướng dẫn của cô Quỳnh Châm,giảng viên bộ môn kinh tế lượng Học viện Tài chính Bảng báo cáo này được thực hiện trong tháng 5 năm 2018 Tất cả số liệu trong bài đều là số liệu thật từ những bạn sinh viên được khảo sát Dù đã rất cố gắng nhưng có lẽ cũng khó tránh khỏi những sai sót ngoài mong muốn Tuy nhiên qua đề tài này chúng em hiểu hơn về lý thuyết KTL được giảng trên trường, phát hiện
ra một điều gì đó thú vị và cảm thấy yêu thích môn học này hơn, qua những gì mà nhóm em đã cảm nhận được qua quá trình thục hiện, với chúng em, đó đã là niềm vui lớn nhất rồi
Trang 3
I Đặt vấn đề
1 Lý do chọn đề tài
GPA viết tắt của Grade point Average - điểm trung bình; là một chỉ số để đánh giá một học sinh hoặc sinh viên Chỉ số này được tính bằng cách cộng các điểm trung bình của các môn học rồi chia đều ra để lấy số trung bình GPA được tính theo thang điểm 4, khác với thang điểm của việt nam là 10, trong đó 4 là cao nhất.
Đây là chỉ số quan trọng dùng để xếp loại tốt nghiệp, đồng thời cũng là một trong số nhiều chỉ tiêu nhà tuyển dụng chú ý tới khi các bạn sinh viên mới ra trường xin việc sau này
Có lẽ bạn sinh viên nào cũng muốn biết làm thế nào để có điểm tích lũy cao đến khi ra trường Cũng là sinh viên, đây cũng là vấn đề mà chúng em rất thắc mắc, quan tâm và muốn tìm hiểu
2 Yếu tố khảo sát
Vì tính phức tạp và đa dạng của các nhân tố ảnh hưởng đến GPA, nhóm chúng
em chỉ tiến hành nghiên cứu một ở một nội dung nhỏ là ảnh hưởng của thời gian học, yếu tố giới tính, và việc có người yêu hay chưa tác động như thế nào đến điểm tích lũy.
GPA
Thời gian
tự học
Người yêu Giới tính
Thời gian nghe giảng
Trang 4II Xây dựng mô hình hồi quy
Mô hình đề xuất : GPAi= β1 + β2*THi + β3*NGi + β4*GTi + β5*NYi + Ui
1 Giải thích biến
1.1 Biến phụ thuộc
GPA : Điểm trung bình tích lũy của các bạn sinh viên k54 Học viện tài
chính tính đến thời điểm khảo sát (tháng5/2018)
1.2 Biến độc lập
Biến định lượng
TH : Thời gian tự học mỗi tối trong suốt giai đoạn (Đơn vị: giờ)
NG : Thời gian tập trung nghe giảng trên lớp (Đơn vị: giờ)
Biến định tính
GT: Giới tính của bạn sinh viên làm khảo sát
− 1: Nam
− 0: Nữ
NY: Tình trạng có người yêu hay chưa của bạn sinh viên làm khảo sát
− 1: Đã có người yêu
− 0: Chưa có người yêu
2 Kì vọng dấu
β2 > 0: thời gian tự học càng nhiều, điểm của các bạn càng cao
β3 > 0: thời gian nghe giảng càng nhiều, tiếp thu kiến thức tốt hơn, điểm GPA càng cao
β4 < 0: các bạn nữ thường có điểm cao hơn các bạn nam
Trang 5β5 < 0: các bạn chưa có người yêu điểm cao hơn các bạn đã có người yêu Do ít bị phân tâm hơn
3 Bộ số liệu
Nam(1) hay Nữ(0) Điểm GPA hiện tại Thời gian tự học ở nhà Thời gian nghe giảng Có người yêu(1)hay Chưa có NY(0)
Trang 60 2.2 1 2 0
Nguồn: theo khảo sát của nhóm nghiên cứu
III Mô hình hồi quy
1 Ước lượng các tham số của mô hình
Với bộ số liệu trên, sử dụng EVIEW để ước lượng thu được kết quả: Dependent Variable: GPA
Method: Least Squares
Date: 05/22/18 Time: 15:10
Sample: 1 66
Included observations: 66
Variable Coefficient Std Error t-Statistic Prob
C 2.472202 0.156762 15.77045 0.0000
TH 0.080691 0.041773 1.931625 0.0581
NG 0.142858 0.048653 2.936280 0.0047
GT -0.076939 0.108884 -0.706617 0.4825
NY -0.283703 0.107801 -2.631730 0.0107
R-squared 0.390359 Mean dependent var 2.936364
Adjusted R-squared 0.350382 S.D dependent var 0.493850
S.E of regression 0.398038 Akaike info criterion 1.068194
Sum squared resid 9.664475 Schwarz criterion 1.234077
Log likelihood -30.25041 Hannan-Quinn criter 1.133742
F-statistic 9.764716 Durbin-Watson stat 2.103872
Trang 7Prob(F-statistic) 0.000004
Từ bảng kết quả trên ta thấy
− biến TH, NG, NY có P_value lần lượt là 0.0581, 0.0047, 0.0107 đều
< 0.1 nên β2, β3,β5 có ý nghĩa thống kê với mức ý nghĩa 10%
− biến GT có P_value = 0.4825 > 0.1 nên β4 không có ý nghĩa thống kê với mức ý nghĩa 10%
==> Ta tiến hành loại bỏ biến GT và chạy lại thu được kết quả:
Dependent Variable: GPA
Method: Least Squares
Date: 05/22/18 Time: 15:16
Sample: 1 66
Included observations: 66
Variable Coefficient Std Error t-Statistic Prob
C 2.429154 0.143855 16.88608 0.0000
TH 0.076042 0.041085 1.850829 0.0690
NG 0.152649 0.046449 3.286343 0.0017
NY -0.280275 0.107256 -2.613137 0.0112
R-squared 0.385369 Mean dependent var 2.936364
Adjusted R-squared 0.355629 S.D dependent var 0.493850
S.E of regression 0.396427 Akaike info criterion 1.046043
Sum squared resid 9.743582 Schwarz criterion 1.178750
Log likelihood -30.51943 Hannan-Quinn criter 1.098482
F-statistic 12.95783 Durbin-Watson stat 2.146052
Prob(F-statistic) 0.000001
Với kết quả mới, ta thấy P_value của các biến TH, NG, NY lần lượt là
0.069, 0.0017, 0.0112 , các giá trị này đều < 0.1 nên β2, β3,β5 có ý nghĩa thống
kê với mức ý nghĩa 10%
2 SFM và ý nghĩa hệ số hồi quy
SRM: GPAi= 2.429154 + 0.076042*THi + 0.152649*NGi - 0.280275*NYi+ ei
Ý nghĩa
β1 = 2.429154 cho biết khi thời gian tự học và thời gian nghe giảng bằng 0, thì điểm GPA trung bình của sinh viên chưa có người yêu là 2.429154
Trang 8β2= 0.076042 cho biết khi thời gian tự học mỗi tối ở nhà tăng thêm 1 giờ thì điểm GPA trung bình tăng 0.076042 điểm.
β3= 0.152649 cho biết khi thời gian nghe giảng tăng 0.152649 giờ học thì điểm GPA trung bình tăng 0.152649 điểm.
β4 = -0.280275 cho biết nếu thời gian tự học mỗi tối ở nhà và thời gian nghe giảng trên lớp như nhau thì điểm trung bình của sinh viên chưa có người yêu cao hơn điểm trung bình của sinh viên đã có người yêu 0.280275 điểm.
==> Các hệ số hồi quy phù hợp với lý thuyết
3 Kiểm định sự phù hợp
Lập cặp giả thuyết H0: R2=0
H1: R2>0 Tiêu chuẩn kiểm định F : F ~ Fα(k-1, n-4)
Miền bác bỏ: Wα = { F: F > Fα(k-1, n-4 }
Dựa vào mẫu:
Fqs=12.95783
Fα(k-1, n-4)=F0.05( 3, 62)= 2.76
Fqs > Fα(k-1, n-4) ==> Fqs € Wα ==> Bác bỏ Ho, chấp nhận H1 Vậy với mức ý nghĩa α = 0.05 , mô hình hồi quy phù hợp.
IV Kiểm tra khyết tật
1 Kiểm định Ramsey
PTKĐ: GPAi= β1 + β2*THi + β3*NGi + β4*NYi + β5*(Ymũ)2 + β6*(Ymũ)3
Lập cặp giả thuyết: H0: Mô hình không bỏ sót biến thích hợp: β5=β6=0
H1: Mô hình không bỏ sót biến thích hợp: tồn tại βj ≠ 0(j=5,6)
Trang 9Ramsey RESET Test
Equation: UNTITLED
Specification: GPA C TH NG NY
Omitted Variables: Powers of fitted values from 2 to 3
Value df Probability F-statistic 0.324231 (2, 60) 0.7243
Likelihood ratio 0.709481 2 0.7014
F-test summary:
Sum of Sq df SquaresMean Test SSR 0.104180 2 0.052090
Restricted SSR 9.743582 62 0.157155
Unrestricted SSR 9.639402 60 0.160657
LR test summary:
Value df Restricted LogL -30.51943 62
Unrestricted LogL -30.16469 60
Unrestricted Test Equation:
Dependent Variable: GPA
Method: Least Squares
Date: 05/22/18 Time: 16:18
Sample: 1 66
Included observations: 66
Variable Coefficient Std Error t-Statistic Prob
C 20.43787 53.35140 0.383080 0.7030
TH 0.946270 2.730931 0.346501 0.7302
NG 1.901653 5.475676 0.347291 0.7296
NY -3.497243 10.06717 -0.347391 0.7295
FITTED^2 -4.363934 12.57373 -0.347068 0.7298
FITTED^3 0.544061 1.457186 0.373364 0.7102
R-squared 0.391940 Mean dependent var 2.936364
Adjusted R-squared 0.341269 S.D dependent var 0.493850
S.E of regression 0.400820 Akaike info criterion 1.095900
Sum squared resid 9.639402 Schwarz criterion 1.294959
Log likelihood -30.16469 Hannan-Quinn criter 1.174557
F-statistic 7.734909 Durbin-Watson stat 2.163771
Prob(F-statistic) 0.000011
Theo kết quả , ta thấy
Probability F-statistic 0.7243 Likelihood ratio 0.7014 P_value = 0.7243 > 0.05 ==> với mức ý nghĩa 5%, mô hình không bỏ sót biến.
Trang 102 Kiểm định sự tự tương quan
2.1 Phương pháp Đồ thị
Ta thấy đồ thị của resid theo resid(-1) không tuân theo quy luật mà khá lộn xộn => độ phân tán của resid theo resid(-1) không có mức độ phụ thuộc => khả năng không có tự tương quan.
2.2 Kiểm định Durbin-Watson
Durbin-Watson stat 2.103872
k'=3, n= 66
0 > dL dL > dU dU >4- dU 4- dU > 4 - dL 4 - dL > 4
Tự tương quan không kết luận Không tự không kết luận Tự tươngquan
Trang 11+ tương quan
-Ta thấy Dqs = 2.103872 nằm trong khoảng dU >4- dU Vậy theo kiểm định Durbin-Watson,với mức ý nghĩa 5%, không có tự tương quan
2.3 Kiểm định Breusch-Godfrey( BG)
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.209012 Prob F(2,60) 0.8120
Obs*R-squared 0.456645 Prob Chi-Square(2) 0.7959
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/22/18 Time: 17:54
Sample: 1 66
Included observations: 66
Presample missing value lagged residuals set to zero
Variable Coefficient Std Error t-Statistic Prob
TH 0.002318 0.041777 0.055474 0.9559
NG -0.002375 0.047568 -0.049928 0.9603
NY 0.024212 0.115016 0.210514 0.8340
C -0.008443 0.147007 -0.057434 0.9544
RESID(-1) -0.088196 0.137194 -0.642855 0.5228
RESID(-2) -0.015178 0.130622 -0.116201 0.9079
R-squared 0.006919 Mean dependent var 9.40E-16
Adjusted R-squared -0.075838 S.D dependent var 0.387171
S.E of regression 0.401584 Akaike info criterion 1.099706
Sum squared resid 9.676167 Schwarz criterion 1.298766
Log likelihood -30.29031 Hannan-Quinn criter 1.178364
F-statistic 0.083605 Durbin-Watson stat 1.987703
Prob(F-statistic) 0.994557
F-statistic 0.209012 Prob F(2,60) 0.8120 Obs*R-squared 0.456645 Prob Chi-Square(2) 0.7959
C1: Dựa vào kết quả thấy Prob Chi-Square(2) = 0.7959 > 0.05
==> Với mức ý nghĩa 5%, không có hiện tượng tự tương quan
C2: Kiểm định F
Trang 12Kiểm định cặp giả thuyết: H0: không có sự tự tương quan
H1: có sự tự tương quan Tiêu chuẩn kiểm định F : F ~ Fα(2, 60)
Miền bác bỏ: Wα = { F: F > Fα(2, 60) }
Dựa vào mẫu:
Fqs= 0.209012 ; Fα(2, 60) = 3.15
Fqs= 0.209012 < Fα(2, 60) = 3.15 => Fqs € Wα ==> Chấp nhận H0
Với mức ý nghĩa 5%, không có hiện tượng tự tương quan
3 Đa cộng tuyến
3.1 Ma trận hệ số tương quan
GT 1.000000 -0.118047 0.052979 -0.235374 -0.088345
GPA -0.118047 1.000000 0.477088 0.482559 -0.370225
TH 0.052979 0.477088 1.000000 0.449597 -0.330638
NG -0.235374 0.482559 0.449597 1.000000 -0.054785
NY -0.088345 -0.370225 -0.330638 -0.054785 1.000000
Từ kết quả trên, ta có thể thấy giữa các biến giải thích có mối quan hệ tương quan tuyến tính khá thấp => khả năng không có tương quan cặp
=> khả năng mô hình không có đa cộng tuyến
3.2 Hồi quy phụ
Sử dụng eview có bảng Nhân tử phóng đại phương sai
Variance Inflation Factors
Date: 05/23/18 Time: 00:55
Sample: 1 66
Included observations: 66
Coefficient Uncentered Centered Variable Variance VIF VIF
C 0.020694 8.690988 NA
Trang 13TH 0.001688 5.639008 1.420574
NG 0.002158 8.388314 1.269085
NY 0.011504 1.830027 1.136835
VIF( TH) =1.420574 VIF( NG) = 1.269085 VIF( NY) =1.136835
Dễ thấy VIF < 2 => Khả năng mô hình không có đa cộng tuyến
3.3 Độ đo Theil
- GPA theo NG và NY
Dependent Variable: GPA
Method: Least Squares
Date: 05/22/18 Time: 23:32
Sample: 1 66
Included observations: 66
Variable Coefficient Std Error t-Statistic Prob
C 2.530109 0.135651 18.65155 0.0000
NG 0.192013 0.042081 4.562885 0.0000
NY -0.348385 0.102667 -3.393355 0.0012
R-squared 0.351410 Mean dependent var 2.936364
Adjusted R-squared 0.330819 S.D dependent var 0.493850
S.E of regression 0.403987 Akaike info criterion 1.069519
Sum squared resid 10.28193 Schwarz criterion 1.169049
Log likelihood -32.29413 Hannan-Quinn criter 1.108848
F-statistic 17.06687 Durbin-Watson stat 2.253409
Prob(F-statistic) 0.000001
R22= 0.351410
- GPA theo TH và NY Dependent Variable: GPA
Method: Least Squares
Date: 05/22/18 Time: 23:34
Sample: 1 66
Included observations: 66
Variable Coefficient Std Error t-Statistic Prob
C 2.691354 0.128677 20.91561 0.0000
TH 0.137865 0.039263 3.511289 0.0008
NY -0.241026 0.114580 -2.103559 0.0394
R-squared 0.278303 Mean dependent var 2.936364
Adjusted R-squared 0.255392 S.D dependent var 0.493850
S.E of regression 0.426147 Akaike info criterion 1.176322
Sum squared resid 11.44086 Schwarz criterion 1.275852
Trang 14Log likelihood -35.81864 Hannan-Quinn criter 1.215651
F-statistic 12.14715 Durbin-Watson stat 2.175718
Prob(F-statistic) 0.000035
R32= 0.278303
- GPA theo TH và NG
Dependent Variable: GPA
Method: Least Squares
Date: 05/22/18 Time: 23:35
Sample: 1 66
Included observations: 66
Variable Coefficient Std Error t-Statistic Prob
C 2.271018 0.136411 16.64835 0.0000
TH 0.112877 0.040337 2.798357 0.0068
NG 0.139133 0.048249 2.883667 0.0054
R-squared 0.317675 Mean dependent var 2.936364
Adjusted R-squared 0.296014 S.D dependent var 0.493850
S.E of regression 0.414360 Akaike info criterion 1.120224
Sum squared resid 10.81671 Schwarz criterion 1.219753
Log likelihood -33.96738 Hannan-Quinn criter 1.159552
F-statistic 14.66569 Durbin-Watson stat 2.299268
Prob(F-statistic) 0.000006
R42= 0.317675 Tính độ đo thiel:
m= R2- ∑( R2- Rj2) = 0.17665 => Mô hình có đa cộng tuyến thấp.
Kết luận : Mô hình có đa cộng tuyến Tuy nhiên nhân từ phóng đại phương sai VIF và độ đo theil m đều ở mức nhỏ Xét thấy mô hình mắc khuyết tật đa cộng tuyến ở mức thấp
Biện pháp khắc phục đề xuất là gia tăng kích cỡ mẫu bằng cách thu thập thêm số liệu Tuy nhiên do điều kiện hạn chế, nhóm không thể thử thực hiện.
Vì VIF < 10, đa cộng tuyến ở mức chấp nhận được nên nhóm không tiên hành loại bỏ biến khỏi mô hình
4 Kiểm định White về PSSSTĐ và Khắc phục
4.1: Kiểm định White
Trang 15Heteroskedasticity Test: White
F-statistic 8.723726 Prob F(8,57) 0.0000
Obs*R-squared 36.32885 Prob Chi-Square(8) 0.0000
Scaled explained SS 40.49999 Prob Chi-Square(8) 0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/22/18 Time: 19:40
Sample: 1 66
Included observations: 66
Collinear test regressors dropped from specification
Variable Coefficient Std Error t-Statistic Prob
C 0.073373 0.142535 0.514772 0.6087
TH^2 -0.022294 0.012113 -1.840415 0.0709
TH*NG 0.016014 0.021660 0.739317 0.4627
TH*NY -0.038743 0.039254 -0.986984 0.3278
TH 0.080275 0.080622 0.995700 0.3236
NG^2 0.001041 0.014437 0.072081 0.9428
NG*NY 0.211759 0.048234 4.390226 0.0000
NG -0.059656 0.062934 -0.947906 0.3472
NY^2 -0.262370 0.142981 -1.834994 0.0717
R-squared 0.550437 Mean dependent var 0.147630
Adjusted R-squared 0.487340 S.D dependent var 0.236461
S.E of regression 0.169306 Akaike info criterion -0.588089
Sum squared resid 1.633885 Schwarz criterion -0.289500
Log likelihood 28.40695 Hannan-Quinn criter -0.470103
F-statistic 8.723726 Durbin-Watson stat 2.009185
Prob(F-statistic) 0.000000
Nhận thấy P_value = 0.00000 < 0.05 => Có hiện tượng phương sai sai số
thay đổi.
4.2: Khắc phục khuyết tật PSSSTĐ
Từ mô hình hồi quy ban đầu, chia 2 vế cho Nghegiang (NG) GPAi= β1 + β2*THi + β3*NGi + β4*NYi + Ui
= + +β3 + + u
Định lại mẫu với biến nghegiang(NG) để loại các giá trị bằng 0
Hồi quy với trọng số 1/NG, kết quả Eview cho: