Chúng ta sẽ sử dụng 2 biến : Thu nhập hằng tháng và Giới tính e Biến độc lập: Biến Giới tính có các giá trị là “1”Nam hoặc “2” Nữ e _ Biến phụ thuộc: Biến Thu nhập hằng tháng Sau khi ch
Trang 1
BO GIAO DUC VA DAO TAO
TRUONG DAI HOC KINH TE THANH PHO HO CHi MINH
UEH
UNIVERSITY
NHOM 1 - THUYET TRINH NHOM CUOI KI
PHAN TICH KINH DOANH VA DU BAO
XU LY DU LIEU VA VIET BAO CAO
CHO DE TAI PHAN TICH HANH VI TAP THE DUC
CUA NGUOI DAN VIET NAM
Danh sách thành viên nhóm
Thành phố Hồ Chí Minh —- Năm 2023
Trang 2
MUC LUC
NOL DUNG oo eeecescsssscsseesssesseessvsssvssecsssessvesssesevessvsssessevsssesssesevessesssessevsssesssesssetsnsssessensasessees 1
1.1 M6 ta dit OU cece .Aa sa KG (ccrccd< 1
2.1 Lap bang tan $6 vé Trinh d6 hoc Van ccecccecscceeseeeseseceseccerecesesevccereesverecereacenteereats 1
3.1 Vẽ đồ thi hinh chiéc banh (pie chart) thể hiện ty lệ phần trăm của số quan sát phân
theo GIới tính (nam, nữ) cv ST HT KT 11 Kà 2
4.1 So sánh gia tri trung bình về Thu nhập của 2 nhóm Gidi tinh, co sy khác biệt có ý
nghĩa thông kê nào giữa 2 nhóm Giới tính về Thu nhập hay không? . 3
5.1 So sánh giá trị trung bình về Thu nhập của các Trinh d6 học vấn, có sự khác biệt có
ý nghĩa thống kê nào giữa các Trình độ học vẫn về Thu nhập hay không? 4
6.1 Kiểm tra có đa cộng tuyến (multcollinearity) giữa các biển Tuổi, Giới tính, Trình
độ học van, Tình trạng hôn nhân, Tập thé dục hay không? .- ¿25+ +s5x 552 4
7.1 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của
các biến Tuôi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thê dục lên biến
n0 .ÁaÁa 6
§.1 Tạo biến tương tác (interaction variable) giữa Tuôi và Tập thể dục Phân tích tác
dong diéu tiét (moderating effect) của việc Tập thê dục lên mối quan hệ giữa Tuổi và
n0 .ÁaÁa 7
IV )80i1))009:70/8.4:7(93aẶ 10
Trang 3NOI DUNG
1.1 Mô tả dữ liệu
* Thu thập và xây dựng file dữ liệu SPSS với các yêu cau sau:
Có các biến:
._ Họ và tên: chuỗi ký tự (strine) không dấu
._ Thu nhập: triệu vnđ“háng
Tuổi
Gidi tinh: nam (1), nữ (0)
Trinh độ học vấn: thpt (1), dai học (2), thạc si (3), tién si (4)
Tinh trạng hôn nhan: déc than (1), c6 gia dinh (2)
Tập thê dục: có tập thé dục thường xuyên (trên 20 phút mỗi ngày) (1), không tập
NO
oO
0
N
>
thê dục thường xuyên (đưới 20 phút mỗi ngày) (0)
- _ Số quan sát: 103 biến
Bang 1: Descriptive Statistics
Thu nhap thang
T
Gid1
Trình độ học
Tình trạng hôn nhân
Thói quen tập dục
2.1 Lập bảng Trình độ học
Yêu câu có: (ï) số quan sát ứng với từng trình độ và (ii) ty 16 phan trăm cụ thê cho từng trình
độ Phân tích trong mẫu nghiên cứu, trình độ học vấn nào chiếm tỷ lệ cao nhất? trình độ học
vấn nào chiếm tỷ lệ thấp nhất?
2.1.1 Kết quả chạy SPSS
Bang 2: Két qud chay SPSS trinh d6 hoc van
Trinh độ học vẫn
Valid Cumulative
Frequency Percent) Percent Percent
Valid | THPT 4 3.9 3.9 3.9
Dai hoc 91 88.3 88.3 92.2
1
Trang 4Thạc sĩ
Ti
si
rinh dé hoc
2.1.2 Kết luận
- _ Trong tổng số 103 người tham gia trả lời phiếu khảo sát, có: 4 người có trình độ THPT
chiếm tỷ trọng 3.9%, 91 người có trinh độ Đại học chiếm 88.3%, 7 người có trinh độ
Thạc sĩ chiếm 6.8%, 1 người có trình độ Tiến sĩ chiếm 1%,
- _ Từ kết quả này có thê thấy, Trình độ Đại học chiếm tỷ lệ cao nhất (88.3%) và trình độ
Tiến sĩ chiếm tỷ lệ thấp nhất (1%)
3.1 Vẽ đồ thị hình chiếc bánh (pie chart) thể hiện ty lệ phần trăm của số quan sát phân
theo Giới tính (nam, nữ)
Yêu cầu có tỷ lệ phần trăm cụ thê cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên
cứu, nam hay nữ chiếm tỷ lệ cao hơn
Hình 1: Biểu đồ thể hiện phan tram gidi tinh
Pie Chart Percent of Giới tính
Giới
Ñ Nam
nữ
% Trong mẫu nghiên cứu của chúng tôi, có số quan sát phân theo giới tính như sau:
Trang 5- _ Có tổng 103 mẫu khảo sát, trong đó:
© 56 người là Nam (chiếm 54,37%)
© 47 người là Nữ (chiếm 45,63%)
- _ Tỷ lệ người Nam khảo sát nhiều hơn so với Nữ là 9 người
4.1 So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính, có sự khác biệt có ý
nghĩa thống kê nào giữa 2 nhóm Giới tính về Thu nhập hay không?
Đề phân tích về Thu nhập của 2 nhóm giới tính (Nam và Nữ) có sự khác biệt có ý nghĩa
thống kê nào hay không Chúng ta sẽ sử dụng 2 biến : Thu nhập hằng tháng và Giới tính
e Biến độc lập: Biến Giới tính có các giá trị là “1”(Nam) hoặc “2” (Nữ)
e _ Biến phụ thuộc: Biến Thu nhập hằng tháng
Sau khi chạy SPSS, nhóm chúng tôi đã cho thấy các kết quả sau:
Báng 3: Ké quá chạy SPSS Group Statistics
p
Giới tính
Bang 4: Két qua chay Independent Samples Test
Independent Samples Test
Levene's Tes
for Equality
of Variances t-test for Equality of Means
95% Confidence Interval of th
Sig (2- Mean Std Error Difference
F Sig t df tailed) Difference Difference Lower Upper
Thu Equal variance 92.226 1139 2.609 101 010 5814399.69¢ 2228547.85! 1393560.224 10235239 16
nhap assumed
hang Equal variance 2.496] 70.494 015| 5814399.69/ 2329938.654 1168056.261 10460743.13|
tháng not assumed
s* Kết luận:
- _ Phân tích kiếm định Levene: Kết quả kiểm định của 2 phương sai tong thể có giá trị
Sig= 0.139 > 0.05 nên phương sai của 2 tổng thê không khác nhau, chúng ta sẽ sử dụng
kết quả kiêm định t 6 dong Equal variances assumed dé xem tiép kết quả phân tích của
bài
- _ Phân tích Independent Samples T-test
Trang 6e Két qua Sig (2-tailed) = 0.010 < 0.05 nên chúng ta kết luận có sự khác biệt có
ý nghĩa về trung bình của 2 tổng thể Nói cách khác, giữa hai nhóm giới tính
Nam và Nữ thì có bằng chứng cho thấy có sự khác nhau về trung bình của thu
nhập hăng tháng Trong đó thu nhập trung bình của Nam cao hơn thu nhập
trung bình của Nữ
e _ Theo kết quả khảo sát, thu nhập trung bình của Nam là 23,234,042 đồng và của
Nữ là 17,419, 642 đồng
e _ Thu nhập hằng tháng trung bình của Nam nhiều hơn là 5,814,399 đồng so với
Nữ
5.1 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn, có sự khác biệt có ý
nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập hay không?
Để so sánh giá trị trung bình của các nhóm, ta sử dụng ANOVA
Bang 5: Két qué chay Test of Homogeneity of Variances
Statistic df
u on
nhap on
hang on
thang on mean
=> Taco Sig 0.69>0.05, do do ta cé du điều kiện dé phan tich Anova
Bang 6: Két qud chay ANOVA
Mean Square
= Tai bang ANOVA, ta có Sig Anova 0.60>0.05, đo đó có thê kết luận không có sự khác
biệt thu nhập trưng bình có ý nghĩa giữa các nhóm có trình độ khác nhau
6.1 Kim tra có đa cộng tuyến ) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình
trạng hôn nhân, Tập thể dục hay không?
Trang 7Bang 7: Két qud chay Correlations
Correlations
Giới Trìinhđộ Tinh trang Thói quen
Tuổi tính họcvấn hôn nhân tập thể dục
Tuôi Pearson 1 -.001 086 390" 018
Correlation
Sig (2-tailed) 994 386 000 857
N 103 103 103 103 103
Giới tính Pearson -.001 1 -.037 109 239”
Correlation
Sig (2-tailed) 994 711 271 015
N 103 103 103 103 103
Trinh dé hoc van Pearson 086 -.037 1 -.013 -.059
Correlation
Sig (2-tailed) 386 860.711 898 555
N 103 103 103 103 103
Tình trạng hôn nhân Pearson 390” 109 -.013 1 335”
Correlation
Sig (2-tailed) 000.271 898 001
N 103 103 103 103 103
Thói quen tập thé due Pearson 018 239 -.059 335" 1
Correlation
Sig (2-tailed) 857.015 555 001
N 103 103 103 103 103
** Correlation is significant at the 0.01 level (2-tailed)
* Correlation is significant at the 0.05 level (2-tailed)
Từ bảng trên ta có thê thây:
- Cặp biến Tuổi và Tình trạng hôn nhân có giá trị sig tương quan là 0.000 < 0.05, hai biến
có tương quan với nhau, hệ số tương quan Pearson có giá trị là 0.39 < 0.7, không xáy ra
đa cộng tuyến giữa cặp biến này
-_ Cặp biến Giới tính và thói quen tập thé dục có giá trị sig tương quan là 0.015 < 0.05, hai
biến có tương quan với nhau, hệ số tương quan Pearson có giá trị là 0.239 < 0,7, không
xảy ra đa cộng tuyến giữa cặp biến này
Trang 8- _ Cặp biến Tình trạng hôn nhân và thói quan tập thể dụng có giá tri sig tương quan là
0.001 < 0.05, hai biến có tương quan với nhau, hệ số tương quan Pearson có giá trị là
0.335 < 0.7, không xảy ra đa cộng tuyến giữa cặp biến này
- _ Các biến còn lại có sig > 0.05, hai biến không có tương quan, không có khá năng xảy ra
đa cộng tuyến giữa 2 biến này
7.1 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của
các biến Tuôi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thế dục lên biến
Thu nhập
Bang 8: Két qud chay SPSS Model Summary
Model Summary
Model R R Square Adjusted R | Std Error of the
Square Estimate
1 5044 254 215 10258730.00
a Predictors: (Constant), Théi quen tap thé dục, Tuôi, Trình độ
hoc van, Gidi tinh, Tinh trạng hôn nhân
Bang 9: Két qud chay ANOVA
ANOVA?
Model Sum of Squares dt Mean Square F Sig
Regression 3473274378012542 5¢ 694654875602508 5d 6.601 000°
Residual 10208429505482600.0/ 97] 1052415412936535.01
Total 13681703883495142.0¢ 102
ƠI
=
a Dependent Variable: Thu nhap hang thang
b Predictors: (Constant), Théi quen tap thé duc, Tudi, Trinh dé hoc van, Gidi tinh, Tinh tra
hôn nhân
Trong bảng kết quá ANOVA, kết qua bién Sig là 0.000 cho thấy mô hình hôi quy là phù hợp
Bang 10: Két qua chay Coefficients?
Coefficients
1 |T
Giới tính
Trang 9Trinh dé hoc van 3935975.499 2687380.924 129} 1.465 146
Tình trạng hôn nhân 1066402.73( 2744135.991 040 389 698
Thói quen tập thể
dục
=
Dependent Variable: Thu nhap hang thang
Trong bang két qua Coefficients:
Gia tri Sig (hay p-value) cua biến Tuổi là 0.000 < 0.01 cho thấy có tác động có ý nghĩa
thống kê mạnh mẽ đến biến phụ thuộc Thu nhập
Gia tri Siø (hay p-value) của biến Giới tính là 0.014 < 0.05 cho thấy có tác động có ý
nghĩa thống kê đến biến phụ thuộc Thu nhập
Gia tri Sig (hay p-value) của biến Trình độ học vấn là 0.146 > 0.05 cho thấy biến Trình
độ học vấn không có tác động đến biến Thụ nhập
Giá trị Sig (hay p-value) của biến Tình trạng hôn nhân là 0.698 > 0.05 cho thấy biến
Tình trạng hôn nhân không có tác động đến biến Thu nhập
Giá trị Sig (hay p-value) của biến Thói quen tập thé dục là 0.272 > 0.05 cho thấy biến
Thới quen tập thể dục không có tác động đến biến Thu nhập
Xét hệ số của các biến có tác động đến biến Thu nhập:
Hệ số của biến Tuổi có ý nghĩa thống kê và có có dấu đương Điều này cho thấy độ Tuôi
có tác động tích cực lên Thu nhập
Hệ số của biến Giới tính có ý nghĩa thống kê và có đấu âm Điều này cho thấy Giới tính
có tác động tiêu cực lên Thu nhập
8.1 Tạo biến tương tác (interaction variable) giữa Tuôi và Tập thế dục Phân tích tác động
điều tiết (moderating effect) của việc Tập thế dục lên mối quan hệ giữa Tuổi và Thu nhập
Tạo biến Tương tác giữa Tuổi và Tập thể dụng bằng cách sử dụng Transform >
2 Reon
Compute variable, sau dé ta tạo 1 biến tương tác bằng cách nhân 2 bién “Tudi” va “Tap
thê dục”, sau đó nhắn OK
Tiếp theo, để phân tích tác động điều tiết của việc Tập thể dục lên mối quan hệ giữa
Tuổi và Thu nhập, ta sử dụng Analyze, chọn Regression va chon myc Linear
Trong bang Linear Regression, ta sẽ chọn Thu nhập là biến phụ thuộc và để vào ô
Dependent, va để ba biến còn lại là Tuổi, Tập thé duc va bién Tương tac vira tao vao 6
Independent(s), sau dé chon OK
Ta sẽ được kết quả sau:
-2474916.96) 2240324.684 -.106} -1.105 272
Trang 10
Bang 11: Ket qud chay Variables Entered/Removed?
Variables Entered/Removed?
Variables Variables
Model Entered Removed | Method
1 Bến tương | Enter
tac, Tuổi,
Thói quen tập
thé duc?
a Dependent Variable: Thu nhap hang thang
b All requested variables entered
Bang 12: Két qua chay Model Summary
Model Summary
Adjusted R | Std Error of
Model R RSquarg Square the Estimate
1 434? 189 164| 10588322.6
7
a Predictors: (Constant), Bién tuong tac, Tuoi, Thoi quen
tap thé duc
Bang 13: Két qud chay ANOVA
ANOVA?
a Vị
b Predictors: (Constant), Biên tương tác, Tuôi, Thói quen tập thê dục
Báng 14: Kết qua chay Coefficients?
Coefficients?
Standardized
Unstandardized Coefficients Coefficients
Model B Std Error Beta t Sig
Trang 11
(Constant) -9579519.554 22314659.69¢ -.429 669
Tudi 1241613.20 789148.09 506 1.573 119
Thói quen tập thê đục 530688.774 13122651.81 023 040 968
Biển tương tác -147745.919 462115.754 -.207 -.320 750
a Dependent Variable: Thu nhap hang thang
Kết luận
Tw ban Model Summary, ta co:
e —R: Hệ số tương quan bội (R) đo lường mức độ và chiều hướng của mối quan hệ
tuyến tính giữa biến phụ thuộc (Thu nhập hằng tháng hoặc Thu nhập hàng tháng) và
các biến độc lập (Biến tương tác, Tuổi, Thói quen tập thể dục) Trong trường hợp
này, R là 0,434, cho thấy mối tương quan dương vừa phải giữa các biến
e R Square (R?2): Day la hé sé xác định, biểu thị tỷ lệ phương sai của biến phụ thuộc
(Thu nhập hàng tháng) được giải thích bởi các biến độc lập trong mô hình Ở đây,
R? là 0,189, có nghĩa là khoảng 18,9% phương sai trong Thu nhập hàng tháng được
giải thích bằng các biến độc lập trong mô hình
e Adjusted R Square: R? điều chỉnh độ phức tạp của mô hình Ở đây, R bình phương
đã điều chỉnh là 0,164
e Std Error of the Estimate: Day là ước tính độ lệch chuẩn của các lỗi trong mô
hình Trong trường hợp này, nó xắp xỉ 10.588.322,66
Kết hợp với bảng ANOVA, ta có thể kết luận rằng mô hình hồi quy có ý nghĩa thống kê
vì giá trị p liên quan đến thống kê F rat thấp (p < 0,001) Điều này cho thấy rằng các
biến độc lập, với tư cách là một nhóm, có tác động đáng kể đến việc giải thích sự khác
biệt trong thu nhập hàng tháng
Tuy nhiên, dựa vào bảng Coefñcients, ta có thể thấy tất cả các hệ số điều có giá tri Sig
lớn hơn 0.05, do đó có thể kết luận không có biến độc lập nào (Tuổi, Thói quen tập thé
dục, Biến tương tác) có tác động đáng kê về mặt thống kê đến Thu nhập hàng tháng
Các hệ số được tiêu chuẩn hóa gợi ý hướng và cường độ tương đối của các mối quan
hệ, nhưng giá trị p không có ý nghĩa chỉ ra rằng các mối quan hệ này không khác 0 một
cách có ý nghĩa Dó đó đề kiểm tra thêm về mối quan hệ này ta có thẻ thu thập thêm dữ
liệu bổ sung đề đưa ra kết luận có ý nghĩa về các mối quan hệ trong mô hình này
Phương trình đề xuất:
Thu nhập hằng tháng = -9579519.558 - 147745.919 * Biến tương tác + 1241613.201
* Tuổi + 53068§.775 * Thói quen tập thé duc + std error
Lưu ý rằng các hệ số trên không có ý nghĩa đo có hệ số p lớn hơn 0.05