Điểm trungbình tích lũy GPA cao là một trong những mục tiêu quan trọng nhất của chúng takhi còn là sinh viên ngồi trên ghế nhà trường.. Qua kết quả khảo sát, chúng ta có cơ hội x
Trang 1M C L C ỤC LỤC ỤC LỤC
1 Tổng quan về bài nghiên cứu 2
1.1 Ý nghĩa của việc lựa chọn đề tài 2
1.2 Mục tiêu, phạm vi và câu hỏi nghiên cứu 2
1.3 Phương pháp nghiên cứu 3
2 Thiết lập mô hình hồi quy 4
2.1 Xây dựng mô hình tổng quát 4
2.1.1 Mô hình tổng quát 4
2.1.2 Giải thích các biến 4
2.2 Mô hình hồi quy gốc 6
2.2.1 Bảng dữ liệu sau khi sau khi xử lý dữ liệu với phần mềm stata 6
2.2.2 Phương trình hồi quy gốc 6
2.3 Kiểm định giả thiết về các hệ số hồi quy và sự phù hợp của hàm hồi quy 7
2.3.1 Kiểm định giả thiết về các hệ số hồi quy 7
2.3.2 Kiểm định sự phù hợp của hàm hồi quy 11
2.4 Kiểm định và khắc phục các bệnh của mô hình 11
2.4.1 Kiểm định hiện tượng đa cộng tuyến 11
2.4.2 Tự tương quan 15
2.4.3 Phương sai sai số thay đổi 16
3 Kết quả 19
3.1 Mô hình hồi qui cuối cùng sau khi loại bỏ các biến không có ý nghĩa 19
3.1.1.Bảng kết quả sau khi xử lý dữ liệu với phần mềm Stata 19
3.1.2.Mô hình hồi quy cuối cùng: 19
3.2 Nhận xét mô hình hồi quy cuối cùng 19
3.2.1 Nhận xét về hệ số xác định 19
3.2.2 Nhận xét về ý nghĩa các biến độc lập 20
3.3 Đề xuất của nhóm 21
3.4 Những khó khăn và thuận lợi khi thực hiện đề tài 21
3.4.1 Những khó khăn 21
3.4.2 Những thuận lợi 22
Trang 21 Tổng quan về bài nghiên cứu
1.1 Ý nghĩa của việc lựa chọn đề tài
Là sinh viên, chắc hẳn chúng ta ai cũng quan tâm đến điểm số Điểm trungbình tích lũy GPA cao là một trong những mục tiêu quan trọng nhất của chúng takhi còn là sinh viên ngồi trên ghế nhà trường Thế nhưng đã bao giờ bạn tự hỏiGPA có bị ảnh hưởng bởi cách thức bạn học, các điểm số bạn đạt được trong quátrình học tập? Có rất nhiều yếu tố làm ảnh hưởng đến điểm trung bình tích lũy GPAcủa bạn, nhưng yếu tố nào ảnh hưởng nhiều nhất và ảnh hưởng như thế nào? Đóchính là trăn trở chung của nhiều người cũng như của nhóm chúng tôi, vì thế chúngtôi quyết định chọn đề tài này để khảo sát
Qua kết quả khảo sát, chúng ta có cơ hội xem xét lại một số vấn đề khiến chođiểm GPA của bạn không cao, từ đó để những hướng khắc phục hiệu quả nhất cũngnhư giúp bạn có một phương pháp học tập tốt để đạt được kết quả cao nhất
Với việc thực hiện đề tài này, nhóm nghiên cứu mong muốn đưa ra một cáinhìn tổng quan về cách tích lũy điểm của sinh viên hiện nay Đồng thời, nhóm cũng
hi vọng từ các kết quả nghiên cứu, nhóm sẽ kiến nghị một số biện pháp khắc phụchiện trạng không biết phương pháp học tập như thế nào cho hiệu quả nhất trongsinh viên
1.2 Mục tiêu, phạm vi và câu hỏi nghiên cứu
Thực tế cho thấy số điểm trung bình tích lũy của một sinh viên không chỉ bịảnh hưởng bởi điểm thi cuối kỳ, điểm trung bình kỳ học, mà còn do nhiều yếu tốchi phối khác như: số phần trăm số lớp theo học trong học kỳ, số phần trăm bài tậpvề nhà làm,số điểm tích lũy được từ năm nhất, năm hai… Nhằm nhiên cứu rõ hơnảnh hưởng của các yếu tố này đến điểm trung bình tích lũy GPA của sinh viên, từđó rút ra kết luận và có những lời khuyên hữu ích cho các bạn sinh viên, nhómchúng tôi đã tiến hành thực hiện đề tài này
Trang 3Để thực hiện điều đó, nhóm nghiên cứu đã quyết định lựa chọn làm đề tài này với sự trợ giúp về số liệu cũng như chuyên môn của giảng viên Đinh Thị Diệu Bình, với đối tượng nghiên cứu được đặt ra là: số điểm tích lũy trung bình GPA của sinhviên và các yếu tố ảnh hưởng.
1.3 Phương pháp nghiên cứu
Thu thập số liệu: đã được cho sẵn
Xử lý số liệu: tiến hành hồi quy với sự trợ giúp của Stata, MS Excel, MSWord, MS Access
Tổng hợp kết quả và hoàn chỉnh bài viết
Trang 42 Thiết lập mô hình hồi quy
2.1 Xây dựng mô hình tổng quát
2.1.1 Mô hình tổng quát
a Hàm hồi quy tổng thể PRF có dạng
des termgpa ACT final atndrte hwrte frosh soph
storage display value
variable name type format label variable label
-
-termgpa float %9.0g GPA for term
ACT byte %8.0g ACT score
final byte %8.0g final exam score
atndrte float %9.0g percent classes attended
hwrte float %9.0g percent homework turned in
frosh byte %8.0g =1 if freshman
soph byte %8.0g =1 if sophom
Trang 5a Biến phụ thuộc
Y (termgpa) Điểm trung bình tích lũy của
kì học của sinh viên đại học
cuối kì cao
X 2
(atndrte)
% số lớptheo học
100,00
±
X 3 (hwrte) % làm bài
tập về nhà
100,00
+ Làm bài t p về nhà càng nhiều thì ập về nhà càng nhiều thì
điểm TB càng cao
36,00
+ Sinh viên có điểm ACT cao
có thể cũng có điểm bìnhtích lũy cũng cao
c Biến độc lập định tính
Trang 62.2.1 Bảng dữ liệu sau khi sau khi xử lý dữ liệu với phần mềm stata
reg termgpa final atndrte hwrte ACT frosh soph
Source | SS df MS Number of obs = 674
-2.2.2 Phương trình hồi quy gốc
Đường hồi quy mẫu SRF:
^
Y = -1.901456 + 0.0545636 X1 + 0.0156125 X2 + 0.0090133 X3 + 0.0058978 X4 – 0.0171568 D1 + 0.0646773 D2
Trang 72.3 Kiểm định giả thiết về các hệ số hồi quy và sự phù hợp của hàm hồi quy
2.3.1 Kiểm định giả thiết về các hệ số hồi quy
Các cặp giả thuyết đặt ra:
Trang 8Kết luận: Hệ số β0 có ý nghĩa thống kê.
|Tqs| =12.61 > 3.291 có cơ sở bác bỏ giả thuyết H0, thừa nhận giả thiết H1.
Kết luận: biến độc lập “ final ” có ý nghĩa với biến phụ thuộc
|Tqs| =10.90 > 3.291 có cơ sở bác bỏ giả thuyết H0, thừa nhận giả thiết H1.
Kết luận: biến độc lập “atndrte” có ý nghĩa với biến phụ thuộc
d Hệ số β 3
Cặp giả thuyết cần kiểm định là:
{H0: β3=0
H1: β3≠ 0
Trang 9Miền bác bỏ giả thuyết H0:
W α={T :|T|>t0.025668 =3.291}
|Tqs| =7.24 > 3.291 có cơ sở bác bỏ giả thuyết H0, thừa nhận giả thiết H1.
Kết luận: biến độc lập “hwrte” có ý nghĩa với biến phụ thuộc
|Tqs| =7.32 > 3.291 có cơ sở bác bỏ giả thuyết H0, thừa nhận giả thiết H1
Kết luận; biến độc lập “ACT” có ý nghĩa với biến phụ thuộc
|Tqs| =0.30< 3.291 chưa có cơ sở bác bỏ giả thuyết H0
Kết luận: không có sự khác nhau giữa 2 trạng thái D=0 và D=1
Trang 10g Hệ số β 6
Đây là hệ số tương ứng với biến giả D2i =soph với D=1 if sophomore
Cặp giả thuyết cần kiểm định là:
{H0: β6=0
H1: β6≠ 0
Miền bác bỏ giả thuyết H0:
W α={T :|T|>t0.025668 =3.291}
|Tqs| =1.32 < 3.291 chưa có cơ sở bác bỏ giả thuyết H0
Kết luận: không có sự khác nhau giữa 2 trạng thái D=0 và D=1 của biến D2i.
h Kiểm định sự cần thiết của hai biến giả “frosh” và “soph”
Sau khi kiểm định hệ số của 2 các biến độc lập D1i= frosh và D2i= soph đều cho rakết quả β i=0 Ta sử dụng kiểm định Wald để xem xét sự cần thiết của 2 biến nàytrong mô hình hồi quy
Đặt giả thuyết:
{ H0: Loại bỏ 2biến D1 i v à D 2 i
H1: Kh ô ng loại bỏ 2 biến D1 i v à D2 i
Quy tắc kiểm định:
Nếu F-statistic > F(m,n-k) thì bác bỏ giả thiết (m là số biến muốn loại, n là
số quan sát, k là số biến)
Nếu p-value < α, bác bỏ giả thiết
Trang 11Lệnh test các biến độc lập D1i= frosh và D2i= soph
test frosh soph
Ta có thể loại bỏ hai biến D1i và D2i ra khỏi mô hình
2.3.2 Kiểm định sự phù hợp của hàm hồi quy
Sử dụng phương pháp giá trị tới hạn
Lập giả thuyết : {H0: β =0
H1: β ≠ 0
Sử dụng kết quả chạy lệnh hồi quy ta có:
Fqs=144,11 F α(6;667)=2.11
Ta có Fqs> F α(6;667) : chưa có cơ sở bác bỏ H0
Kết luận: hàm SRF không phù hợp
2.4 Kiểm định và khắc phục các bệnh của mô hình
2.4.1 Kiểm định hiện tượng đa cộng tuyến
a Phát hiện đa cộng tuyến
Ta có ma trận tương quan của các biến như sau:
Trang 12corr final atndrte hwrte ACT frosh soph
Xem xét ma trận tương quan của các biến, ta thấy 2 biến X3 ( hwrte) và X2
( atndrte) có mức tương quan khá cao: 0.6263 nên nghi ngờ có hiện tượng đa cộngtuyến
Để kiểm định đa cộng tuyến chúng tôi xây dựng mô hình hồi quy phụ X2 (atndrte)theo X1 ( final), X3 (hwrte), X4 ( ACT), D1 (frosh), D2 ( Soph)
Mô hình hồi quy ban đầu
reg atndrte final hwrte ACT frosh soph
Source | SS df MS Number of obs = 674
Trang 13-Ta kiểm định cặp giả thuyết:
H0 : R22 = 0 ( Mô hình hồi quy ban đầu không có hiện tượng đa cộng tuyến)
H1 : R22≠ 0 ( Mô hình hồi quy ban đầu có hiện tượng đa cộng tuyến)
Từ mô hình hồi quy phụ, ta thấy Fqs = 92.27
F0.05( 5,668 )= 2.23 < Fqs → bác bỏ giả thiết Ho, thừa nhận giả thiết H1
Kết luận: Mô hình hồi quy ban đầu có hiện tượng đa cộng tuyến
Mặt khác, ta cũng thể bác bỏ giả thiết Ho dựa vào giá trị p- value = 0.0000 < 0.05
b Khắc phục hiện tượng đa cộng tuyến
Có rất nhiều biện pháp khắc phục hiện tượng đa cộng tuyến như: sử dụng thông tintiên nhiệm, thu thập thêm số liệu hoặc lấy thêm mẫu mới,bỏ biến, sử dụng phân saicấp 1, Trong bài này, tôi sẽ dùng biện pháp bỏ biến vì đây là biện pháp đơn giảnnhất và khá dễ thực hiện
Mô hình hồi quy loại bỏ biến X2 ( atndrte)
reg termgpa final hwrte ACT frosh soph
Source | SS df MS Number of obs = 674 -+ - F( 5, 668) = 126.80
Trang 14Model | 172.256775 5 34.451355 Prob > F = 0.0000 Residual | 181.491883 668 271694436 R-squared = 0.4869 -+ - Adj R-squared = 0.4831 Total | 353.748658 673 525629507 Root MSE = 52124
termgpa | Coef Std Err t P>|t| [95% Conf Interval] -+ - final | .0603694 .0046585 12.96 0.000 0512224 .0695165 hwrte | .0172359 .0010737 16.05 0.000 0151278 .0193441 ACT | .0346952 .0063411 5.47 0.000 0222443 047146 frosh | .0148374 .0627909 0.24 0.813 -.108454 .1381287 soph | .0748513 .0532618 1.41 0.160 -.0297293 .1794319 _cons | -1.290928 .1829381 -7.06 0.000 -1.650131 -.9317253 -
-^
Yi = 1.290928 + 0.0603694X1i + 0.0172359 X3i + 0.0346952 X4i + 0.0148374
D1i + 0.0748513 D2i
R loại X 22 = 0.4869
Mô hình hồi quy loại bỏ biến X3 (hwrte)
reg termgpa final atndrte ACT frosh soph
Source | SS df MS Number of obs = 680
Trang 15R loại X 32 = 0.5422
Kết luận: So sánh R2 ở 2 mô hình hồi quy ta thấy R loại X 22 < R loại X 32 Vậy, loại bỏ biến
X3 ( hwrte)ra khỏi mô hình thì mô hình sẽ tốt hơn
2.4.2 Tự tương quan
a Kiểm định hiện tượng tự tương quan
Ho: Mô hình không có hiện tượng tự tương quan
H1: Mô hình có hiện tượng tự tương quan
Kiểm định d của Durbin-Watson:
Trang 162.4.3 Phương sai sai số thay đổi
a Kiểm định hiện tượng phương sai thay đổi:
Ho: Mô hình không có hiện tượng phương sai thay đổi
H1: Mô hình có hiện tương phương sai thay đổi
Kiểm định Breusch-Pagan
hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Trang 17Variables: fitted values of termgpa
chi2(1) = 25.91
Prob > chi2 = 0.0000
Ta thấy p-value = 0.0000 < 5% nên bác bỏ giả thiết Ho
Kết luận: mô hình có hiện tượng phương sai sai số thay đổi.
Kiểm định White:
imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
Trang 18Total | 71.45 19 0.0000
-Ta thấy p-value = 0.0003 < 5% nên bác bỏ giả thiết Ho
Kết luận: mô hình có hiện tượng phương sai sai số thay đổi
Khắc phục phương sai thay đổi:
reg termgpa final atndrte ACT, robus
Linear regression Number of obs = 680 F( 3, 676) = 242.42 Prob > F = 0.0000 R-squared = 0.5366 Root MSE = 50254
| Robust
termgpa | Coef Std Err t P>|t| [95% Conf Interval] -+ - final | .0567909 .0045616 12.45 0.000 0478343 .0657476 atndrte | .0233344 .0014407 16.20 0.000 0205055 .0261632 ACT | .041973 .0060985 6.88 0.000 0299988 .0539472 _cons | -1.720851 .1800982 -9.56 0.000 -2.07447 -1.367231
Trang 193 Kết quả
3.1 Mô hình hồi qui cuối cùng sau khi loại bỏ các biến không có ý nghĩa
3.1.1.Bảng kết quả sau khi xử lý dữ liệu với phần mềm Stata
regress termgpa final atndrte ACT
Source | SS df MS Number of obs = 680
3.2 Nhận xét mô hình hồi quy cuối cùng
3.2.1 Nhận xét về hệ số xác định
Hệ số xác định R2= 53.66% tuy không cao nhưng vẫn mang ý nghĩa hồi quy, đây làkết quả sau khi thực hiện:
Trang 20 Loại bỏ các biến D1, D2 không ảnh hưởng tới biến Y ra khỏi mô hình.
Loại bỏ biến X3 ra khỏi mô hình do hiện tượng đa cộng tuyến
Khắc phục hiện tượng phương sai sai số thay đổi
Kết luận: 53.66% sự thay đổi của biến phụ thuộc Y(điểm GPA của học kỳ) đượcgiải thích bởi sự thay đổi của các biến độc lập ( X1: điểm thi cuối kỳ , X2: phần trămlớp tham gia, X4: điểm ACT)
3.2.2 Nhận xét về ý nghĩa các hệ số hồi quy
Diễn giải
số lớp theo học ( X 2 = 0), không điểm ACT ( X 4 = 0) thì điểm GPA là -1.720851
chiều
^β1 = 0.0567909 có nghĩa là khi các yếu tố khác không đổi, nếu điểm thi cuối kỳ tăng lên 1 điểm, thì GPA tăng trung bình 0.0567909 điểm
chiều
^β2 = 0.0233344 có nghĩa là khi các yếu tố khác không đổi, nếu phần trăm số lớp tham gia học của học sinh tăng 1% thì GPA tăng trung bình 0.000233344 điểm
chiều
^β4 = 0.041973 có nghĩa là khi cac yếu tố khác không đổi, nếu điểm ACT đầu vào của sinh viên tăng 1 điểm thì GPA tăng trung bình 0.041973 điểm
3.3 Đề xuất của nhóm
Sau khi tiến hành nghiên cứu và phân tích mô hình hồi quy từ sốliệu đã được thống
kê trên phần mềm STATA, nhóm nghiên cứu chúng tôi xin đưa ra một số đề xuấtsau :
Trang 21 Điểm thi cuối kỳ có tác động rất lớn tới điểm GPA, vì vậy, chúng ta cần ôntập kỹ lưỡng trước kỳ thi, cố gắng đạt thành tích tốt nhất có thể.
Số lớp học mà bạn dự định tham gia trong một kỳ cũng đóng vai trò quantrọng Kiến thức của một môn học đều có sự liên hệ, gắn kết với các mônhọc khác nên cần đăng ký học các môn cơ sở, làm nền tảng các môn học sau
Điểm ACT đầu vào là một tiêu chí đánh giá vốn kiến thức nền tảng của bạntrước khi bước vào trường đại học Đầu vào cao có liên quan lớn đến kết quảhọc tập của bạn trong trường đại học sau này
3.4 Những khó khăn và thuận lợi khi thực hiện đề tài
3.4.1 Những khó khăn
Quá trình lựa chọn biến còn nhiều sai sót khiến kết quả R2 không cao lắm.Nhiều biến độc lập được chọn ban đầu đã bị loại ra khỏi mô hình, một sốbiến còn thiếu nên chưa thể đưa ra những kết quả hồi quy chính xác nhất
Thời gian thực hiện đề tài ngắn (2 tuần) Các thành viên trong nhóm đã phải
cố gắng hoàn thành tốt ở bài này và cả bài học ở những môn học khác
Thời gian học tập và nghiên cứu môn Kinh Tế Lượng chưa nhiều, hiểu biếtvề môn KTL của các thành viên trong nhóm còn nhiều hạn chế Vì thế dẫnđến những sai sót trong khâu chọn đề tài, chọn biến
Là lần đầu tiên xây dựng đề tài nên còn nhiều vấn đề bỡ ngỡ Một sốvấn đềsai sót do chủ quan của nhóm…
3.4.2 Những thuận lợi
Các thành viên trong nhóm đều có trách nhiệm cao đối với công việc chung của nhóm, tích cực tìm tòi nghiên cứu, tham khảo thêm các tài liệu về kinh tế lượng phục vụ cho bài nghiên cứu