Vấn đề nghiên cứuKhảo sát các yếu tố tác động tới điểm học tập GPA của sinh viên đại học Bách Khoa kỳ 20222 2.. Thời gian tự học trung bình mỗi ngày giờ của bạn là?6.. Thời gian làm thêm
Trang 1ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ
-* -BÀI TẬP LỚN MÔN THỐNG KÊ ỨNG DỤNG
CHỦ ĐỀ: Khảo sát các yếu tố tác động tới điểm học tập GPA của sinh viên đại
học Bách Khoa kỳ 20222
GVHD: Cô Ngô Thu Giang
Sinh viên thực hiện:
Hà Nội, tháng 11/2023
MỤC LỤC
Trang 21 Vấn đề nghiên cứu
Khảo sát các yếu tố tác động tới điểm học tập GPA của sinh viên đại học Bách Khoa kỳ 20222
2 Dữ liệu nghiên cứu
Dữ liệu cần thu thập để tiến hành nghiên cứu:
1 Thông tin về sinh viên
2 Tình hình học tập của sinh viên
3 Sự phân bổ thời gian của sinh viên
3 BẢNG CÂU HỎI KHẢO SÁT
1 Giới tính của bạn là?
- Nam
- Nữ
2 Điểm GPA kỳ gần nhất của bạn là bao nhiêu?
3 Nhóm ngành bạn học là?
- Kinh tế
- Kỹ thuật
4 Số tín chỉ bạn đăng ký kỳ 20222 vừa rồi là bao nhiêu tín
Trang 35 Thời gian tự học trung bình mỗi ngày (giờ) của bạn là?
6 Thời gian làm thêm trung bình mỗi ngày (giờ) của bạn là?
4 MẪU NGHIÊN CỨU
- Đối tượng nghiên cứu: Sinh viên đại học Bách Khoa Hà Nội
- Nguồn dữ liệu là dữ liệu sơ cấp
- Cách thức lấy mẫu: Mẫu được lấy mẫu qua điều tra sinh viên qua khảo sát bằng cách sử dụng bảng hỏi
- Phương pháp chọn mẫu: Phương pháp chọn mẫu ngẫu nhiên
- Số lượng mẫu thu thập được: 53
Trang 45 BẢNG DỮ LIỆU THU THẬP ĐƯỢC
Giới
tính
Điểm GPA kỳ gần nhất
của bạn là bao nhiêu
Nhóm ngành bạn học
Số tín chỉ bạn đăng
ký kỳ vừa rồi
Thời gian tự học mỗi ngày (giờ) của bạn là?
Thời gian làm thêm mỗi ngày (giờ) của bạn là?
Trang 5Nữ 3.05 Kỹ thuật 10 3 0.0
Trang 6Nữ 3.91 Kinh tế 17 6 0.0
Trang 76 BẢNG DỮ LIỆU THU THẬP ĐƯỢC (coding)
GPA GENDE R FIELD CREDIT_NU M STUDY_TIM E WORK_TIM E
Trang 83.5 1 1 10 5 0.0
Điểm GPA kỳ gần nhất của
Số tín chỉ bạn đăng ký kỳ
Thời gian tự học mỗi ngày
Thời gian làm thêm mỗi
7 THỐNG KÊ MÔ TẢ
7.1 Dữ liệu định tính
Qua tính toán
ta có kết quả như
sau:XGENDE R
Nhận xét: chúng em thấy có sự phân phối đồng đều về giới tính với nữ có 28/53
mẫu chiếm 53% và nam gồm 25/53 mẫu chiếm 47%
Trang 952.83%
GENDER
Nam Nữ
FIELD Tần số Tần suất
Nhận xét: Về nhóm ngành thì nhóm ngành kinh tế có 26/53 mẫu chiếm 49%, nhóm
ngành kỹ thuật có 27/53 mẫu chiếm 51%
49.06%
50.94%
FIELD
Kinh tế Kỹ thuật
7.2 Dữ liệu định lượng
Qua tính toán ta có kết quả như sau:
GPA:
Giá trị
Trang 10Trung bình 3.089056604
Tứ phân vị
Ta có biểu đồ Histogram:
Nhận xét:
- Điểm GPA cao nhất là 3.92 và thấp nhất là 1.91
- Trung bình điểm GPA của sinh viên ở mức khá là 3.08
- Ta thấy trung bình < trung vị nên dữ liệu lệch phải
CREDIT_NUM:
Giá trị
Tứ phân vị
Trang 11Ta có biểu đồ Histogram:
Nhận xét:
- Số tín chỉ đăng ký cao nhất là 24 và thấp nhất là 10 (có thể là sinh viên năm cuối)
- Số tín chỉ đăng ký của sinh viên trung bình là 17.8 ~ 18 tín/kỳ
- Ta thấy trung bình < trung vị nên dữ liệu lệch phải
STUDY_TIME:
Giá trị
Tứ phân vị
Ta có biểu đồ Histogram:
Trang 12Nhận xét:
- Thời gian tự học cao nhất là 6 giờ/ngày và thấp nhất là 0 giờ
- Thời gian tự học của sinh viên trung bình là 2.92 giờ/ngày
- Dữ liệu phân bố không theo quy luật rõ ràng
WORK_TIME:
Giá trị
Tứ phân vị
Ta có biểu đồ Histogram:
Nhận xét:
- Thời gian đi làm thêm cao nhất là 8 giờ/ngày và thấp nhất là 0 giờ
- Thời gian đi làm thêm của sinh viên trung bình là 2.33 giờ/ngày
- Dữ liệu lệch trái do trung bình lớn hơn trung vị
8 THỐNG KÊ SUY DIỄN (ĐƠN BIẾN)
1 Giới tính có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là GENDER
Trang 13Phương trình hồi quy có dạng: GPA = b0 + b1.GENDER với b0 là hệ số chặn, b1 là
hệ số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.101245844
R Square 0.010250721
Adjusted R Square -0.009156128
Standard Error 0.489760955
Observations 53
ANOVA
df SS MS F Significance F
Regression 1 0.126697402 0.126697 0.528201209 0.470686963
Residual 51 12.23315543 0.239866
Total 52 12.35985283
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.1408 0.097952191 32.06462 1.80173E-35 2.944152771 3.337447229 2.944152771 3.337447229 GENDER -0.097942857 0.134763746 -0.72677 0.470686963 -0.368492366 0.172606652 -0.368492366 0.172606652
Ta được kết quả: GPA = 3.1408 - 0.09794.GENDER
H1: giới tính không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = 0.47 > 0.05 nên bác bỏ giả thuyết H0, chấp nhận giả thuyết H1
Vì vậy nên giới tính không có tác động tới điểm GPA Phương trình hồi quy không
có ý nghĩa
2 Nhóm ngành có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là FIELD
Phương trình hồi quy có dạng: GPA = b0 + b1.FIELD với b0 là hệ số chặn, b1 là hệ
số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
Trang 14SUMMARY OUTPUT
Regression Statistics
Multiple R 0.089525569
R Square 0.008014828
Adjusted R Square -0.011435862
Standard Error 0.49031384
Observations 53
ANOVA
df SS MS F Significance F
Regression 1 0.099062089 0.099062 0.412058787 0.523801319
Residual 51 12.26079074 0.240408
Total 52 12.35985283
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.045 0.096158455 31.66648 3.30708E-35 2.851953846 3.238046154 2.851953846 3.238046154 FIELD 0.086481481 0.134723554 0.641918 0.523801319 -0.183987339 0.356950302 -0.183987339 0.356950302
Ta được kết quả: GPA = 3.045 - 0.0864.FIELD
H1: nhóm ngành không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = 0.52 > 0.05 nên bác bỏ giả thuyết H0, chấp nhận giả thuyết H1
Vì vậy nên nhóm ngành không có tác động tới điểm GPA Phương trình hồi quy không có ý nghĩa
3 Số lượng tín chỉ đăng ký có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là CREDIT_NUMBER
Phương trình hồi quy có dạng: GPA = b0 + b1.CREDIT_NUMBER với b0 là hệ số chặn, b1 là hệ số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.100416274
R Square 0.010083428
Adjusted R Square -0.009326701
Standard Error 0.489802344
Observations 53
ANOVA
df SS MS F Significance F
Regression 1 0.124629687 0.12463 0.519493102 0.474348955
Residual 51 12.23522314 0.239906
Total 52 12.35985283
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.378765024 0.407541086 8.290612 5.11836E-11 2.560592155 4.196937893 2.560592155 4.196937893 CREDIT_NUM -0.016213882 0.022495576 -0.72076 0.474348955 -0.061375635 0.028947871 -0.061375635 0.028947871
Ta được kết quả: GPA = 3.3787 - 0.0162.CREDIT_NUMBER
Trang 15Kiểm định giả thuyết: H0: Số lượng tín chỉ đăng ký có tác động tới điểm GPA
H1: Số lượng tín chỉ đăng ký không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = 0.47 > 0.05 nên bác bỏ giả thuyết H0, chấp nhận giả thuyết H1
Vì vậy nên Số lượng tín chỉ đăng ký không có tác động tới điểm GPA Phương trình hồi quy không có ý nghĩa
4 Thời gian tự học có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là STUDY_TIME
Phương trình hồi quy có dạng: GPA = b0 + b1.STUDY_TIME với b0 là hệ số chặn, b1 là hệ số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.924577745
R Square 0.854844007
Adjusted R Square 0.851997811
Standard Error 0.187559492
Observations 53
ANOVA
df SS MS F Significance F
Regression 1 10.56574612 10.56575 300.3461543 5.07567E-23
Residual 51 1.794106714 0.035179
Total 52 12.35985283
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 2.453469973 0.044819219 54.74147 5.64363E-47 2.363491636 2.54344831 2.363491636 2.54344831 STUDY_TIME 0.217329622 0.012540299 17.3305 5.07567E-23 0.192153922 0.242505323 0.192153922 0.242505323
Ta được kết quả: GPA = 2.4534 + 0.2173.STUDY_TIME
H1: Thời gian tự học không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = < 0.05 nên ta chấp nhận giả thuyết H0
Vì vậy nên thời gian tự học có tác động đồng biến tới điểm GPA (do hệ số =
0.21733 dương)
R Square = 0.8548 nên STUDY_TIME giải thích được 85.48% sự biến động của GPA
5 Thời gian đi làm thêm có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là WORK_TIME
Phương trình hồi quy có dạng: GPA = b0 + b1.WORK_TIME với b0 là hệ số chặn, b1 là hệ số hồi quy
Trang 16Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.89780242
R Square 0.806049186
Adjusted R Square 0.802246229
Standard Error 0.216804037
Observations 53
ANOVA
df SS MS F Significance F
Regression 1 9.962649315 9.962649 211.9532663 8.45339E-20
Residual 51 2.397203515 0.047004
Total 52 12.35985283
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.449500078 0.038727648 89.07074 1.21047E-57 3.371751081 3.527249075 3.371751081 3.527249075 WORK_TIME -0.154327212 0.010600405 -14.5586 8.45339E-20 -0.175608413 -0.133046011 -0.175608413 -0.133046011
Ta được kết quả: GPA = 3.4495 - 0.1543.WORK_TIME
Kiểm định giả thuyết: H0: Thời gian đi làm thêm có tác động tới điểm GPA
H1: Thời gian đi làm thêm không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = < 0.05 nên ta chấp nhận giả thuyết H0
Vì vậy nên thời gian đi làm thêm có tác động nghịch biến tới điểm GPA (do hệ số = -0.15433 âm)
R Square = 0.8060 nên STUDY_TIME giải thích được 80.60% sự biến động của GPA
9 THỐNG KÊ SUY DIỄN (ĐA BIẾN)
- Gọi biến phụ thuộc Y là biến GPA; biến độc lập X1 X2 X3 X4 X5 lần lượt là là GENDER, FIELD, CREDIT_NUM, STUDY_TIME, WORK_TIME
- Phương trình hồi quy có dạng:
GPA = b0 + b1.GENDER + b2.FIELD + b3.CREDIT_NUM +
b4.STUDY_TIME + b5.WORK_TIME
với b0 là hệ số chặn, b1, b2, b3,b4,b5 là hệ số hồi quy
- Chạy hồi quy trong excel ta có kết quả như sau:
Trang 17SUMMARY OUTPUT
Regression Statistics
Multiple R 0.95125533
R Square 0.904886703
Adjusted R Square0.894768268
Standard Error 0.158153329
Observations 53
ANOVA
df SS MS F Significance F
Regression 5 11.18426648 2.236853296 89.42950476 7.81669E-23
Residual 47 1.175586348 0.025012475
Total 52 12.35985283
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 2.928161847 0.17849777 16.40447303 4.41781E-21 2.569070652 3.287253042 2.569070652 3.287253042 GENDER -0.042528527 0.049704509 -0.855627132 0.39654511 -0.142521101 0.057464048 -0.142521101 0.057464048 FIELD 0.011959152 0.050814341 0.235349934 0.814959604 -0.090266117 0.11418442 -0.090266117 0.11418442 CREDIT_NUM -0.002174139 0.007627351 -0.285045132 0.776861898 -0.017518391 0.013170112 -0.017518391 0.013170112 STUDY_TIME 0.131883442 0.020256904 6.510542905 4.52469E-08 0.091131808 0.172635076 0.091131808 0.172635076 WORK_TIME -0.072606923 0.014604922 -4.971401066 9.26569E-06 -0.101988235 -0.04322561 -0.101988235 -0.04322561
- Kiểm định hệ số hồi quy riêng tương tự như hồi quy đơn biến ta thấy
+ Với độ tin cậy 95%, ta thấy rằng P-value của STUDY_TIME và WORK_TIME
có giá trị nhỏ hơn 0.05, các biến còn lại lớn hơn 0.05
Vậy nên thời gian tự học và thời gian đi làm thêm có tác động tới điểm GPA của sinh viên
+ Ta được phương trình hồi quy:
GPA = 2.9281 + 0.1318STUDY_TIME - 0.0726WORK_TIME
+ R Square = 0.9048 nên STUDY_TIME và WORK_TIME giải thích được 90.48%
sự biến động của GPA
+ Như vậy ta có thể thấy rằng hồi quy đa biến có thể giải thích được nhiều hơn sự biến động của GPA so với hồi quy đơn biến