trình độ học vấn nào chiếm tỷ lệ thấp nhất...1 3.Vẽ đồ thị hình chiếc bánh pie chart thể hiện tỷ lệ phần trăm của số quan sát phân theo Giới tính nam 1, nữ 0.. Phân tích trong mẫu nghiên
Trang 1BỘ GIÁO DỤC & ĐÀO TẠO ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH KHOA KINH DOANH QUỐC TẾ - MARKETING
BÀI TẬP NHÓM CUỐI KỲ
XỬ LÝ DỮ LIỆU VÀ VIẾT BÁO CÁO THEO YÊU CẦU
Nhóm : 05
Mã lớp HP : 23D1BUS50318015
Trang 2
DANH SÁCH THÀNH VIÊN NHÓM
Trang 3MỤC LỤC
1 Thu thập và xây dựng file dữ liệu SPSS theo các yêu cầu 1
2 Lập bảng tần số về Trình độ học vấn Yêu cầu có: (i) số quan sát ứng với từng trình độ và (ii) tỷ lệ phần trăm cụ thể cho từng trình độ Phân tích trong mẫu nghiên cứu, trình độ học vấn nào chiếm tỷ lệ cao nhất? trình độ học vấn nào chiếm tỷ lệ thấp nhất 1 3.Vẽ đồ thị hình chiếc bánh (pie chart) thể hiện tỷ lệ phần trăm của số quan sát phân theo Giới tính (nam 1, nữ 0) Yêu cầu có tỷ lệ phần trăm cụ thể cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao hơn 1 4.So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính, có sự khác biệt có ý nghĩa thống kê nào giữa 2 nhóm Giới tính về Thu nhập hay không? 2
5 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn, có sự khác biệt có ý nghĩa thống
kê nào giữa các Trình độ học vấn về Thu nhập hay không? 2 6.Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không? 3
7 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập 4
8 Tạo biến tương tác (interaction variable) giữa Tuổi và Tập thể dục Phân tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập 5 TÀI LIỆU THAM KHẢO 8
Trang 41 Thu thập và xây dựng file dữ liệu SPSS theo các yêu cầu
2 Lập bảng tần số về Trình độ học vấn Yêu cầu có: (i) số quan sát ứng với từng trình độ và (ii) tỷ lệ phần trăm cụ thể cho từng trình độ Phân tích trong mẫu nghiên cứu, trình độ học vấn nào chiếm tỷ lệ cao nhất? trình độ học vấn nào chiếm tỷ lệ thấp nhất?
Nhận xét:
- Trình độ học vấn Đại học chiếm tỷ lệ cao nhất Chiếm 86% trên tổng số 100%
- Trình độ học vấn Trung học phổ thông chiếm tỷ lệ thấp nhất Chiếm 14% trên tổng số 100%
3.Vẽ đồ thị hình chiếc bánh (pie chart) thể hiện tỷ lệ phần trăm của số quan sát phân theo Giới tính (nam 1, nữ 0) Yêu cầu có tỷ lệ phần trăm cụ thể cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao hơn
Trang 5=> Theo kết quả thống kê từ cuộc khảo sát cho thấy rằng nữ chiếm tỷ lệ cao nhất
là 64% trong khi nam chỉ chiếm 36% trong tổng số
4.So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính, có sự khác biệt có
ý nghĩa thống kê nào giữa 2 nhóm Giới tính về Thu nhập hay không?
Nhận xét: Kiểm định F: Sig là 0.654 > 0.05 -> Phương sai 2 nhóm không khác
nhau Do vậy, chúng ta sẽ sử dụng kết quả kiểm định t ở hàng Equal variances assumed, Sig kiểm định t là 0.808 > 0.5, nghĩa là không có sự khác biệt của trung bình hai nhóm
Như vậy, không có sự khác biệt giữa 2 nhóm giới tính nam, nữ về thu nhập
5 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn, có sự khác biệt có ý nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập hay không?
Nhóm sử dụng T-Test vì dữ liệu khảo sát thu về của biến Trình độ học vấn chỉ có
2 nhóm là Trung học phổ thông và Đại học
Trang 6Nhận xét: Sig = 0.202 > 0.05 => Sử dụng kết quả hàng equal variances assumed
Sig (2- tailed ) = 0.321 > 0.05 => no significant => không có sự khác biệt có ý nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập
6.Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không?
Nhận xét:
- Biến giới tính không có đa cộng tuyến với biến độ tuổi ( - 0,171 < 0,7)
Trang 7- Biến trình độ học vấn không có đa cộng tuyến với biến độ tuổi ( 0,248 < 0,7)
- Biến trình độ học vấn không có đa cộng tuyến với biến giới tính ( -0,118 < 0,7)
- Biến tình trạng hôn nhân không có đa cộng tuyến với biến tuổi (0,030 < 0,7)
- Biến tình trạng hôn nhân không có đa cộng tuyến với biến giới tính (-0,010 <0,7)
- Biến tình trạng hôn nhân không có đa cộng tuyến với biến trình độ học vấn (0,071 <0,7)
- Biến tập thể dục không có đa cộng tuyến với biến độ tuổi ( - 0,0201< 0,7)
- Biến tập thể dục không có đa cộng tuyến với biến giới tính (0,00392 < 0,7)
- Biến tập thể dục không có đa cộng tuyến với biến trình độ học vấn ( -0,178 < 0,7)
- Biến tập thể dục không có đa cộng tuyến với biến tình trạng hôn nhân ( -0,132
<0,7)
Trang 87 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập
Nhận xét:
Xét biến Tuổi
Sig = 0.000 <0.01 -> có ý nghĩa thống kê cao
Unstrandardized B= 0.957
- Hệ số của biến Tuổi có ý nghĩa thống kê và có có dấu dương Điều này cho thấy
Tuổi có tác động tích cực lên Thu nhập
- Ý nghĩa kinh tế: Trong trường hợp các yếu tố khác không đổi, nếu Tuổi tăng lên
1 đơn vị, thì thu nhập tăng lên 95.7%
Xét biến Giới tính
Sig = 0.836 > 0.1
- Hệ số của biến Giới tính không có ý nghĩa thống kê
Xét biến Thu nhập
Sig = 0.230 >0.1
- Hệ số của biến Thu nhập không có ý nghĩa thống kê
Xét biến Trình độ học vấn
Trang 9Sig = 0.763 >0.1
- Hệ số của biến Thu nhập không có ý nghĩa thống kê
Xét biến Tình trạng hôn nhân
Sig = 0.289 >0.1
- Hệ số của biến Tình trạng hôn nhân không có ý nghĩa thống kê
Xét biến Tập thể dục
Sig = 0.128 >0.1
- Hệ số của biến Tình trạng hôn nhân không có ý nghĩa thống kê
8 Tạo biến tương tác (interaction variable) giữa Tuổi và Tập thể dục Phân tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập
8.1 Variables entered/ Remove
Nhận xét: Bảng này dùng để đánh giá độ phù hợp của mô hình phân tích hồi quy
đa biến, hệ số R bình phương hiệu chỉnh Adjusted R Square là 0.346 Nghĩa là 34.6% biến thiên của biến phụ thuộc X được giải thích bởi 2 nhân tố độc lập Điều này cho
Trang 10thấy mô hình hồi quy tuyến tính này phù hợp với tập dữ liệu của mẫu ở mức 34.6%, tức là các biến độc lập giải thích được 34.6% biến thiên của biến phụ thuộc X
8.2 Anova
ANOVA a
Model
Sum of Squares df
Mean Square F Sig
1 Regression 183.795 3 61.265 18.471 000b
Residual 318.410 96 3.317
Total 502.205 99
a Dependent Variable: Thu nhập
b Predictors: (Constant), X, Tuổi, Tập thể dục
Nhận xét: Nhìn vào bảng ANOVA hình trên, kiểm định giả thuyết về độ phù hợp
với tổng thể của mô hình, giá trị F = 18.471 với sig = 000 < 0.05 Chứng tỏ R bình phương của tổng thể khác 0 Đồng nghĩa với việc mô hình hồi quy tuyến tình xây dựng được là phù hợp với tổng thể (chi tiết hơn R bình phương tổng thể ta không thể tính cụ thể được, nhưng ta biết chắc chắn sẽ khác 0, mà khác 0 thì chứng tỏ là các biến độc lập có tác động đến các biến phụ thuộc)
8.3 Coefficients
Trang 11Nhận xét: Nhìn vào bảng Coefficients hình trên, kiểm định các giả thuyết sử
dụng phần mềm SPSS: cái giá trị ở cột Sig của đều <5% chứng tỏ 3 biến độc lập đều tác động có ý nghĩa thống kê đến biến phụ thuộc
Nhìn vào bảng ta thấy được biến X có sig kiểm định t nhỏ hơn 0.05 và hệ số hồi quy chuẩn hóa Beta và chưa chuẩn hóa B mang giá trị âm Như vậy, tập thể dục có tác động điều tiết tiêu cực lên Tuổi và Thu nhập
TÀI LIỆU THAM KHẢO
Sách điện tử:
Evans, James Robert - Business analytics_ methods, models, and decisions 2nd edition
%2C%20James%20Robert%20%20Business%20analytics_%20methods%2C
IBM SPSS Statistics 25 Step By Step_ A Simple Guide And Reference-Routledge (2019)
%20SPSS%20Statistics%2025%20Step%20By%20Step_%20A%20Simple