Kiểm tra có đa cộng tuyến multicollinearity giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không?...76.. Phân tích tác động của các biến Tuổi, Giới
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH KHOA KINH DOANH QUỐC TẾ - MARKETING
- -BÀI BÁO CÁO CUỐI KÌ
Môn học: Phân tích kinh doanh Giảng viên: TS Nguyễn Văn Dũng
Mã lớp học phần: 24D4BUS50318005
NHÓM 5
TP Hồ Chí Minh, ngày 19 tháng 4 năm 2024
Trang 2MỤC LỤC
I Đề Bài 1
II Tóm Tắt 1
III Giới Thiệu 2
IV Nội Dung Khảo Sát 3
1 Bảng tần số của trình độ học vấn 3
2 Biểu Đồ Thị hình chiếc bánh (pie chart) Của Giới Tính 4
3 So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính 4
4 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn 5
5 Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không? 7
6 Phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập 9
7 Phân tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập 10
KẾT LUẬN 11
TÀI LIỆU THAM KHẢO 12
Trang 3I Đề Bài
1 Thu thập và xây dựng file dữ liệu SPSS với các yêu cầu sau:
i Có các biến:
1 Họ và tên: chuỗi ký tự (string) không dấu
2 Thu nhập: triệu vnđ/tháng
3 Tuổi
4 Giới tính: nam (1), nữ (0)
5 Trình độ học vấn: thpt (1), đại học (2), thạc sĩ (3), tiến sĩ (4)
6 Tình trạng hôn nhân: độc thân (0), có gia đình (1)
7 Tập thể dục: có tập thể dục thường xuyên (trên 20 phút mỗi ngày) (1), không tập thể dục thường xuyên (dưới 20 phút mỗi ngày) (0)
ii Số quan sát: 100 quan sát
2 Lập bảng tần số về Trình độ học vấn Yêu cầu có: (i) số quan sát ứng với từng trình độ và (ii)
tỷ lệ phần trăm cụ thể cho từng trình độ Phân tích trong mẫu nghiên cứu, trình độ học vấn nào chiếm tỷ lệ cao nhất? trình độ học vấn nào chiếm tỷ lệ thấp nhất?
3 Vẽ đồ thị hình chiếc bánh (pie chart) thể hiện tỷ lệ phần trăm của số quan sát phân theo Giới tính (nam, nữ) Yêu cầu có tỷ lệ phần trăm cụ thể cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao hơn
4 So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính, có sự khác biệt có ý nghĩa thống
kê nào giữa 2 nhóm Giới tính về Thu nhập hay không?
5 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn, có sự khác biệt có ý nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập hay không?
6 Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không?
7 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập
8 Tạo biến tương tác (interaction variable) giữa Tuổi và Tập thể dục Phân tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập
II Tóm Tắt
Báo cáo này tập trung vào việc đánh giá sự tương tác giữa các biến Thu nhập, Tuổi, Giới tính, Trình
độ học vấn, Tình trạng hôn nhân và Thói quen tập thể dục của người dân Việt Nam Mẫu nghiên cứu
Trang 4bao gồm 100 người được khảo sát trực tuyến Người tham gia bài khảo sát này tập trung ở độ tuổi từ
17 đến 49, đang sinh sống, học tập và làm việc tại Thành phố Hồ Chí Minh
Kết quả nghiên cứu cho thấy rằng không có sự khác nhau về ý nghĩa thống kê của Thu nhập giữa hai nhóm giới tính Tuy nhiên, có sự khác biệt về ý nghĩa thống kê của Thu nhập giữa các nhóm Trình
độ học vấn Bên cạnh đó, không xảy ra đa cộng tuyến giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục
Kết quả nghiên cứu cũng cho thấy tất cả các biến đều có tác động đến Thu nhập Điều này chỉ ra rằng mỗi yếu tố đều đóng góp vào việc xác định thu nhập của cá nhân
Cuối cùng, khi xét đến tác động điều tiết của biến Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập, kết quả cho thấy thói quen tập thể dục thường xuyên có tác động tích cực đến mối quan hệ giữa tuổi và thu nhập Điều này có thể thấy rằng việc duy trì thói quen tập thể dục là một yếu tố quan trọng để tăng cường thu nhập đối với các cá nhân ở các độ tuổi khác nhau
III.Giới Thiệu
Thói quen tập thể dục không chỉ là một phần của lối sống lành mạnh, mà còn là một yếu tố quyết định đối với sức khỏe và tài chính của mỗi cá nhân Trong một thời đại mà sức khỏe được coi là tài sản vô giá và thu nhập được xem xét một cách tỉ mỉ, việc hiểu sâu hơn về mối quan hệ giữa các yếu
tố xã hội và thói quen tập thể dục trở nên vô cùng quan trọng
Báo cáo này đi sâu vào việc đánh giá sự tương tác giữa thu nhập, tuổi, giới tính, trình độ học vấn, tình trạng hôn nhân và thói quen tập thể dục của người dân Việt Nam Mục tiêu chính của nghiên cứu là đánh giá mối tương tác giữa thu nhập, tuổi, giới tính, trình độ học vấn, tình trạng hôn nhân và thói quen tập thể dục Trong bài khảo sát, chủ yếu khảo sát nhóm tuổi từ 17 đến 50 đang sinh sống
và làm việc tại thành phố Hồ Chí Minh, một nhóm đang chịu nhiều áp lực và có nhu cầu về sức khỏe và tài chính cao
Với việc thu thập dữ liệu từ một mẫu gồm 100 người thông qua cuộc khảo sát trực tuyến, nghiên cứu này mong muốn xác định mối liên hệ giữa các biến và tác động của chúng đối với thu nhập cá nhân Kết quả không chỉ làm sáng tỏ vai trò của mỗi yếu tố đối với thu nhập, mà còn làm nổi bật
Trang 5tầm quan trọng của thói quen tập thể dục trong việc cải thiện chất lượng cuộc sống và thu nhập của mỗi cá nhân
IV Nội Dung Khảo Sát
Nội dung khảo sát bao gồm các câu hỏi sau:
- Họ và tên
- Giới tính
- Độ tuổi
- Trình độ học vấn (hiện tại)
- Thu nhập trung bình tháng
- Tình trạng hôn nhân
- Tập thể dục
1 Bảng tần số của trình độ học vấn.
Bước 1: Ta lập bảng trình độ học vấn.
Trình độ học vấn cao nhất của Anh/Chị (tính tới thời điểm hiện tại)
Frequency Percent Valid Percent Cumulative
Percent
Valid
Cột Frequency: Thể hiện tần số của từng nhóm trình độ học vấn.
Cột Percent: Tỷ lệ phần trăm của từng nhóm trình độ học vấn.
Cột Valid Percent: Tỷ lệ phần trăm hợp lệ của từng nhóm trình độ học vấn.
Cột Cumulative Percent: Phần trăm cộng dồn.
Nhận xét: Ở biến Trình Độ Học Vấn, đối tượng khảo sát là THPT, Đại Học, Thạc Sĩ, Tiến Sĩ
với tổng số là 100 người
Trang 6- Đối tượng khảo sát THPT có số lượng là 19/100 người với tỷ lệ 19%.
- Đối tượng khảo sát Đại Học có số lượng là 75/100 người với tỷ lệ 75%
- Đối tượng khảo sát Thạc Sĩ có số lượng là 3/100 người với tỷ lệ 3%
- Đối tượng khảo sát Tiến Sĩ có số lượng là 3/100 người với tỷ lệ 3%
Như vậy dựa vào số liệu của bảng tần số về Trình Độ Học Vấn thì Trình Độ Đại Học chiếm tỷ
lệ phần trăm cao nhất với 75% và trình độ chiếm tỷ lệ thấp nhất là Trình Độ Thạc Sĩ và Trình
Độ Tiến Sĩ cùng với tỷ lệ phần trăm là 3%
2 Biểu Đồ Thị hình chiếc bánh (pie chart) của Giới tính
Bước 2: Ta vẽ đồ thị hình chiếc bánh (pie chart) của giới tính:
Nhận xét: Thông qua biểu đồ trên, ta có thể thấy nam chiếm 29%, nữ chiếm 71% Vậy tỷ lệ nữ
tham gia mẫu nghiên cứu này cao hơn nam
3 So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính
Bước 3: Ta thực hiện phân tích T Test để so sánh giá trị trung bình về Thu nhập của hai nhóm Giới tính Từ đó rút ra kết luận có ý nghĩa thống kê giữa hai nhóm giới tính về thu nhập hay không.
Group Statistics
Trang 7Giới tính N Mean Std.
Deviation
Std Error Mean Thu nhập bình quân 1 tháng
(Đơn vị: triệu VND/tháng)
Nhìn vào bảng trên, ta thấy:
- Có 71 quan sát Nữ (Female), giá trị trung bình là 13.14
- Có 29 quan sát Nam (Male), giá trị trung bình là 19.9
- Thu nhập Nam (Male) phân tán hơn so với Nữ (Female) vì độ lệch chuẩn càng lớn thì giá trị càng phân tán xung quanh gía trị trung bình
Independent Samples Test
Levene's Test for Equality of Variances
t-test for Equality of Means
(2-tailed)
Mean Differ ence
Std
Error Diffe rence
95% Confidence Interval of the Difference Lower Upper Thu nhập
bình quân 1
tháng (Đơn
vị: triệu
VND/tháng
)
Equal variances assumed
13.07 1
.00 0
Equal variances not assumed
Nhận xét:
- Phân tích kiểm định Levene: Giá trị Sig trong kiểm định Levene (kiểm định F) ở đây là 0.000 < 0.05 => Nên chấp nhận giả thuyết H0: Có sự khác nhau về phương sai của 2 tổng thể => ta sử dụng kết quả kiểm định t ở dòng Equal variances not assumed
- Phân tích Independent-samples T-test: Ta có chỉ số Sig (2-tailed) là 0.074 > 0.05 (mức ý nghĩa •) => Nên kết luận không có sự khác biệt có ý nghĩa về giá trị trung bình của 2 tổng thể Nói cách khác, giữa hai nhóm nam và nữ, không có bằng chứng cho thấy sự khác biệt về thu nhập trung bình
Trang 8Thông qua bảng Group Statistics ta thấy chênh lệch giữa thu nhập trung bình giữa nam và nữ lớn nhưng từ bảng Independent Samples Test ta vẫn kết luận rằng không có bằng chứng cho thấy sự khác biệt về thu nhập trung bình Nguyên nhân có thể là kích thước mẫu nghiên cứu nhỏ và đồng thời độ lệch chuẩn ở giới tính nam cũng tương đối lớn làm giảm khả năng đạt đến ý nghĩa thống
kê khi so sánh giữa các nhóm Vì vậy để đánh giá sự khác biệt giữa thu nhập trung bình của nam
và nữ một cách chính xác hơn, ta nên xem xét việc sử dụng mô hình hồi quy tuyến tính bội
4 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn
Bước 4: ta sử dụng phân tích Oneway ANOVA để so sánh giá trị trung bình về Thu nhập của các Trình độ học vấn Từ đó rút ra kết luận có sự khác biệt có ý nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập hay không.
Descriptives
Thu nhập bình quân 1 tháng (Đơn vị: triệu VND/tháng)
Std
Deviation
Std
Error
95% Confidence Interval
for Mean
Minimum Maximum
Lower Bound
Upper Bound
Bảng Descriptives cho chúng ta các thông số mô tả của từng trình độ học vấn:
- Giá trị trung bình THPT (Mean) là 8.95 triệu VND
- Giá trị trung bình Đại Học (Mean)) là 13.77 triệu VND
- Giá trị trung bình Thạc Sĩ (Mean) là 35.67 triệu VND
- Giá trị trung bình Tiến Sĩ (Mean) là 71.67 triệu VND
Trang 9 Như vậy người có trình độ học vấn bậc Thạc sĩ, Tiến sĩ có thu nhập cao hơn hẳn người có trình
độ học vấn bậc THPT và Đại học Thu thập của người có Trình độ học vấn Tiến Sĩ có thu nhập cao hơn hẳn người có trình độ THPT, Đại học và Thạc Sĩ
Test of Homogeneity of Variances
Levene Statistic df1 df2 Sig Thu nhập bình quân
1 tháng (Đơn vị:
triệu VND/tháng)
Based on Median and with adjusted df 5.345 3 11.226 016
Nhìn vào bảng Test of Homogeneity of Variances:
Sig kiểm định Levene bằng 0.000 < 0.05, bác bỏ giả thiết H0: “Phương sai bằng nhau”, có sự khác biệt phương sai giữa các Trình độ học vấn, chúng ta sẽ sử dụng kết quả kiểm định Welch ở bảng Robust Test of Equality of Means
ANOVA
Thu nhập bình quân 1 tháng (Đơn vị: triệu VND/tháng)
Nhìn vào bảng Welch ở bảng Robust Test of Equality of Means :
Sig = 0.016 < 0.05, nghĩa là có sự khác biệt có ý nghĩa thống kê giữa ít nhất 2 nhóm trình độ học vấn về giá trị trung bình của thu nhập bình quân
Robust Tests of Equality of Means
Thu nhập bình quân 1 tháng (Đơn vị: triệu VND/tháng)
a Asymptotically F distributed
Trang 10Multiple Comparisons
Dependent Variable: Thu nhập bình quân 1 tháng (Đơn vị: triệu VND/tháng)
Tukey HSD
(I) Trình độ học
vấn
(J) Trình độ học vấn
Mean Difference (I-J)
Std
Error Sig
95% Confidence Interval Lower
Bound
Upper Bound
* The mean difference is significant at the 0.05 level
Các giá trị Sig đều < 0.05 -> Có sự khác biệt có ý nghĩa thống kê giữa ít nhất các trình độ học vấn
về thu nhập bình quân
Bảng Post HOC có ý nghĩa trực quan hơn cho nhận định trên
Thu nhập bình quân 1 tháng (Đơn vị: triệu
VND/tháng)
Tukey HSDa,b
Trình độ học
Subset for alpha = 0.05
Trang 11Tiến sĩ 3 71.67
Means for groups in homogeneous subsets are displayed
a Uses Harmonic Mean Sample Size = 5.460
b The group sizes are unequal The harmonic mean of the
group sizes is used Type I error levels are not guaranteed
5 Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không?
Bước 5: Ta kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục hay không.
Correlations
Tuổi
Giới tính
Trình
độ học vấn
Tình trạng hôn nhân
Có tập thể dục thường xuyên không? Tuổi
Pearson Correlation 1 092 456** 514** 201*
Trình độ học
vấn Pearson Correlation .456
Tình trạng hôn
nhân Pearson Correlation .514
Có tập thể dục
thường xuyên
không?
Pearson Correlation 201* 211* 205* 082 1
Trang 12** Correlation is significant at the 0.01 level (2-tailed).
* Correlation is significant at the 0.05 level (2-tailed)
Qua bảng Correlations, ta thấy được giá trị tuyệt đối của hệ số tương quan giữa cặp biến:
- Tuổi và Giới tính là 0.092 < 0.7
- Tuổi và Trình độ học vấn là 0.456** < 0.7
- Tuổi và Tình trạng hôn nhân là 0.514** < 0.7
- Tuổi và Có tập thể dục thường xuyên không (tần suất tập thể dục) là 0.201* < 0.7
- Giới tính và Trình độ học vấn là 0.150 < 0.7
- Giới tính và Tình trạng hôn nhân là 0.087 < 0.7
- Giới tính và Có tập thể dục thường xuyên không (tần suất tập thể dục) là 0.211* < 0.7
- Trình độ học vấn và Tình trạng hôn nhân là 0.137 < 0.7
- Trình độ học vấn và Có tập thể dục thường xuyên không (tần suất tập thể dục) là 0.205* < 0.7
- Tình trạng hôn nhân và Có tập thể dục thường xuyên không (tần suất tập thể dục) là 0.082 < 0.7
Như vậy tất cả các hệ số tương quan đều có giá trị tuyệt đối nhỏ hơn 0.7 nên không xảy ra đa cộng tuyến trong mô hình này
6 Phân tích tác động của các biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biến Thu nhập.
Bước 6: Ta sử dụng hồi quy tuyến tính bội (multiple linear regression) để phân tích tác động của các biến Tuổi, Giới tỉnh, Trình độ học vấn, Tình trạng hôn nhân, Tập thể dục lên biển Thu nhập.
ANOVA a
Model
Sum of
1
Trang 13a Dependent Variable: Thu nhập bình quân 1 tháng (Đơn vị: triệu VND/tháng)
b Predictors: (Constant), Có tập thể dục thường xuyên không? Tình trạng hôn nhân, Giới tính, Trình độ học vấn, Tuổi
Đánh giá ý nghĩa thống kê của mô hình qua bảng ANOVA
- Ta thấy: Sig là 0.000b< 0.05 => mô hình nghiên cứu này phù hợp, có ý nghĩa thống kê
Coefficients a
Model
Unstandardized Coefficients
Standardize d Coefficients
t Sig
B Std Error Beta
1
Có tập thể dục thường xuyên
a Dependent Variable: Thu nhập bình quân 1 tháng (Đơn vị: triệu VND/tháng)
Xem các biến tác động tích cực hay tiêu cực lên biến thu nhập bình quân :
* Biến Tuổi:
- Sig.= 0.000 < 0.05 => có ý nghĩa thống kê
- Hệ số của biến Tuổi có ý nghĩa thống kê và dấu của hệ số là (+) => Tuổi có tác động tích cực đến thu nhập bình quân, nếu thăng 1 tuổi thì thu nhập bình quân 1 tháng sẽ tăng 964 ngàn VNĐ, giữ nguyên các yếu tố khác không thay đổi
* Biến Giới tính:
- Sig.= 0.028 < 0.05 => có ý nghĩa thống kê
Trang 14- Hệ số của biến Giới tính có ý nghĩa thống kê và dấu của hệ số là (+) => Giới tính có tác động tích cực (tăng) đến thu nhập bình quân, thu nhập của nam cao hơn nữ là 3.780 triệu VND, giữ guyên các yếu tố khác không đổi
* Biến Trình độ học vấn:
- Sig.= 0.000 < 0.05 => có ý nghĩa thống kê
- Hệ số của biến Trình độ học vấn có ý nghĩa thống kê và dấu của hệ số là (+) => trình độ học vấn có tác động tích cực (làm tăng) đến thu nhập bình quân, nếu tăng trình độ học vấn lên 1 bậc thì thì thu nhập bình quân 1 tháng sẽ tăng 10.364 Triệu VNĐ, giữ nguyên các yếu tố khác không đổi
* Biến Tình trạng hôn nhân:
- Sig.= 0.597 > 0.05 => không có ý nghĩa thống kê => Tình trạng hôn nhân không có tác động đến thu nhập bình quân
* Biến Có tập thể dục thường xuyên không?
- Sig.= 0.617 > 0.05 => không có ý nghĩa thống kê => Việc có tập thể dục thường xuyên hay không cũng không có tác động đến thu nhập bình quân
7 Phân tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi và Thu nhập.
Bước 7: Ta tạo biến tương tác (interaction variable) giữa Tuổi và Tập thể dục Sau đó phân tích tác động điều tiết (moderating effect) của việc Tập thể dục lên mối quan hệ giữa Tuổi
và Thu nhập.
Coefficients a
Model
Unstandardized Coefficients
Standardized Coefficients
t Sig
B Std Error Beta
Có tập thể dục thường xuyên -20.473 8.865 -.796 -2.309 023