1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài tập nhóm Xử lý dữ liệu và viết báo cáo theo các yêu cầu

11 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

lOMoARcPSD|17343589 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH  BÀI NHĨM CUỐI KỲ MƠN: PHÂN TÍCH KINH DOANH ĐỀ TÀI: XỬ LÝ DỮ LIỆU VÀ VIẾT BÁO CÁO THEO CÁC YÊU CẦU Giảng Viên: Nguyễn Văn Dũng Mã lớp học phần: 22C4BUS50318001 Nhóm: Danh sách thành viên: Nguyễn Phương Trang - 87222020132 Nguyễn Thị Thu Thủy - 87222020150 TP Hồ Chí Minh, ngày 28 tháng 11 năm 2022 lOMoARcPSD|17343589 MỤC LỤC DANH SÁCH NHÓM Câu Thu thập xây dựng file liệu với SPSS Câu Lập bảng tần số Trình độ học vấn Yêu cầu có: (i) số quan sát ứng với trình độ (ii) tỷ lệ phần trăm cụ thể cho trình độ Phân tích mẫu nghiên cứu, trình độ học vấn chiếm tỷ lệ cao nhất? trình độ học vấn chiếm tỷ lệ thấp nhất? .3 Vẽ đồ thị hình bánh (pie chart) thể tỷ lệ phần trăm số quan sát phân theo Giới tính (nam, nữ) Yêu cầu có tỷ lệ phần trăm cụ thể cho giới tính đồ thị Phân tích mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao So sánh giá trị trung bình Thu nhập nhóm Giới tính, có khác biệt có ý nghĩa thống kê nhóm Giới tính Thu nhập hay không? So sánh giá trị trung bình Thu nhập Trình độ học vấn, có khác biệt có ý nghĩa thống kê Trình độ học vấn Thu nhập hay không? Kiểm tra có đa cộng tuyến (multicollinearity) biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng nhân, Tập thể dục hay không? 7 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng nhân, Tập thể dục lên biến Thu nhập 8 Tạo biến tương tác (interaction variable) Tuổi Tập thể dục Phân tích tác động điều tiết (moderating effect) việc Tập thể dục lên mối quan hệ Tuổi Thu nhập lOMoARcPSD|17343589 DANH SÁCH NHÓM STT HỌ VÀ TÊN MÃ SINH VIÊN NGUYỄN PHƯƠNG TRANG 87222020132 NGUYỄN THỊ THU THỦY 87222020150 lOMoARcPSD|17343589 Câu Thu thập xây dựng file liệu với SPSS * Thu thập liệu: thơng qua hình thức vấn online qua google form từ link sau: https://forms.gle/oFZS2MH8d4TCeHfj8 * Kết chiết xuất dạng file excel, sau làm liệu mã hóa vào file SPSS: lOMoARcPSD|17343589 Câu Lập bảng tần số Trình độ học vấn u cầu có: (i) số quan sát ứng với trình độ (ii) tỷ lệ phần trăm cụ thể cho trình độ Phân tích mẫu nghiên cứu, trình độ học vấn chiếm tỷ lệ cao nhất? trình độ học vấn chiếm tỷ lệ thấp nhất? Trình độ học vấn Cumulative Frequency Valid THPT Percent Valid Percent Percent 2.0 2.0 2.0 Đại học 45 45.0 45.0 47.0 Thạc sĩ 43 43.0 43.0 90.0 Tiến sĩ 10 10.0 10.0 100.0 100 100.0 100.0 Total Biểu đồ: Nhận xét: Phân tích cho thấy đa số người khảo sát có trình độ Đại học, trình độ đại học chiếm tỷ lệ cao 45% trình độ THPT chiếm tỷ lệ thấp 2% lOMoARcPSD|17343589 Vẽ đồ thị hình bánh (pie chart) thể tỷ lệ phần trăm số quan sát phân theo Giới tính (nam, nữ) Yêu cầu có tỷ lệ phần trăm cụ thể cho giới tính đồ thị Phân tích mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao Bảng thống kê số quan sát theo giới tính: Giới tính Valid Valid Nữ Nam Total Frequency Percent 43 43.0 57 57.0 100 100.0 Percent 43.0 57.0 100.0 Cumulative Percent 43.0 100.0 Biểu đồ: Nhận xét: Qua kết phân tích ta thấy nam chiếm tỷ lệ cao nữ (57% so với 43%) So sánh giá trị trung bình Thu nhập nhóm Giới tính, có khác biệt có ý nghĩa thống kê nhóm Giới tính Thu nhập hay khơng? Cặp giả thuyết: lOMoARcPSD|17343589 Ho: Thu nhập trung bình nam nữ H1: Thu nhập trung bình nam nữ khác Chọn mức ý nghĩa:  = 0,05 Phân tích đồng phương sai trước so sánh hai giá trị trung bình: kiểm định Levene’s cho kết sig = 0,545 > 0,05 (bảng dưới) nên khơng có khác nhua phương sai tổng thể nam nữ Sử dụng kiểm định T-test ứng với phương sai để so sánh hai trung bình Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Sig Std (2- Mean Error Interval of the Difference tailed Differ Differ Lowe F 368 Sig .545 t df - 98 Thu nhập Equal (triệu variances 1.1 đồng/tháng) assumed Equal 41 - 92 variances 1.1 548 not 48 ) ence ence r Upper 257 -.685 601 -1.877 506 254 -.685 597 -1.871 500 assumed Kiểm định T-test tương ứng với phương sai (bảng trên) có sig = 0,257 > 0,05 chưa đủ sở bác bỏ Ho, ta chấp nhận Ho Nên kết luận khơng có khác biệt có ý nghĩa thống trung bình tổng thể Nói cách khác, thu nhập trung bình nam nữ So sánh giá trị trung bình Thu nhập Trình độ học vấn, có khác biệt có ý nghĩa thống kê Trình độ học vấn Thu nhập hay khơng? Bài tốn phân tích phương sai nhân tố (ANOVA one way) trình độ học vấn có mức Cặp giả thuyết: Ho: Thu nhập trung bình nhóm có trình độ học vấn khác H1: Thu nhập trung bình khơng nhóm có trình độ học vấn khác Chọn mức ý nghĩa:  = 0,05 lOMoARcPSD|17343589 Kiểm tra dồng phương sai nhóm Test of Homogeneity of Variances Levene 96 Sig .395 1.051 96 374 Based on Median and 1.051 90.840 374 with adjusted df Based on trimmed 1.019 96 388 Thu nhập (triệu Based on Mean đồng/tháng) Based on Median Statistic 1.004 df1 df2 mean Kiểm định Levene cho p-value (sig) = 0,395 > 0,05 nên khơng có khác biệt thu nhập nhóm trình độ học vấn Kết phân tích ANOVA sử dụng Bảng ANOVA: ANOVA Thu nhập (triệu đồng/tháng) Sum of Between Groups Within Groups Total Squares 392.398 df 485.602 878.000 Mean Square 130.799 96 99 F 25.858 Sig .000 5.058 Phân tích phương sai cho thấy sig = 0,000 < 0,05 nên đủ sở bác bỏ Ho Vậy có khác biệt thu nhập nhóm có trình độ học vấn khác Nói cách khác, thu nhập trung bình khơng nhóm có trình độ học vấn khác Để biết khác nằm cặp nào, ta tiếp tục phân tích sâu ANOVA Có nhiều phương pháp phân tích sâu, nhóm sinh viên chọn kiểm định Turkey có độ tin cậy tốt so với kiểm định LSD kiểm định khác Multiple Comparisons Dependent Variable: Thu nhập (triệu đồng/tháng) 95% Confidence Mean (I) Trình độ (J) Trình độ học vấn THPT học vấn Đại học Difference (I-J) -3.956 Interval Lower Upper Std Error 1.625 Sig .078 Bound -8.21 Bound 29 lOMoARcPSD|17343589 Tukey Thạc sĩ -6.070* 1.627 002 -10.32 -1.82 HSD Tiến sĩ -10.100* 1.742 000 -14.65 -5.55 THPT 3.956 1.625 078 -.29 8.21 Thạc sĩ -2.114* 480 000 -3.37 -.86 Tiến sĩ -6.144 * 786 000 -8.20 -4.09 THPT 6.070* 1.627 002 1.82 10.32 Đại học 2.114* 480 000 86 3.37 Tiến sĩ -4.030 * 790 000 -6.09 -1.97 THPT 10.100* 1.742 000 5.55 14.65 6.144 * 786 000 4.09 8.20 Thạc sĩ 4.030* * The mean difference is significant at the 0.05 level .790 000 1.97 6.09 Đại học Thạc sĩ Tiến sĩ Đại học Ta thấy: so sánh theo cặp nhóm THPT nhóm Đại học có sig = 0,078 > 0,05 nên thu nhập trung bình hai nhóm khơng có khác biệt có ý nghĩa trung bình hai nhóm tổng thể Đối với cặp nhóm khác sig < 0,05 nên có khác biệt theo cặp tương ứng Kết luận: kết hợp với bảng thống kê mơ tả khác biệt trung bình mẫu ta + Thu nhập trung bình nhóm Tiến sĩ cao so với nhóm Thạc sĩ + Thu nhập trung bình nhóm Thạc sĩ cao so với nhóm Đại học THPT Kiểm tra có đa cộng tuyến (multicollinearity) biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng nhân, Tập thể dục hay khơng? * Bảng phân tích tương quan theo hạng Spearman biến Correlations Giới Spearman Tuổi Correlation 's rho Coefficient Sig (2-tailed) N Giới tính Correlation Coefficient Sig (2-tailed) N Trình độ Correlation học vấn Trình độ Tình trạng Hiện trạng Tuổi 1.000 tính -.156 122 479 550 193 100 -.156 100 1.000 100 -.068 100 -.026 100 -.020 122 499 794 843 100 -.072 100 -.068 100 1.000 100 -.368** 100 286** Coefficient học vấn hôn nhân tập thể dục -.072 060 -.131 lOMoARcPSD|17343589 Tình Sig (2-tailed) N 479 100 499 100 100 000 100 004 100 Correlation 060 -.026 -.368** 1.000 -.229* 550 100 794 100 000 100 100 022 100 -.131 -.020 286** -.229* 1.000 193 100 843 100 004 100 022 100 100 trạng hôn Coefficient Sig (2-tailed) nhân N Hiện Correlation trạng tập Coefficient thể dục Sig (2-tailed) N ** Correlation is significant at the 0.01 level (2-tailed) * Correlation is significant at the 0.05 level (2-tailed) Nhận xét: + Hệ số tương quan hạng biến: trình độ học vấn, trạng tập thể dục, tình trạng nhân có ý nghĩa lớn 0.7 + Vậy có tượng đa cộng tuyến biến độc lập ta hồi quy Thu nhập theo biến độc lập Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động biến Tuổi, Giới tính, Trình độ học vấn, Tình trạng nhân, Tập thể dục lên biến Thu nhập Coefficientsa Unstandardized Model (Constant) Tuổi Giới tính Trình độ học vấn Tình trạng nhân Hiện trạng tập thể Standardized Coefficients Coefficients B Std Error Beta 15.021 2.037 -.081 043 -.128 -.684 406 -.114 t 7.375 -1.881 -1.684 Sig .000 063 096 2.003 -1.644 1.344 6.315 -3.816 3.169 000 000 002 317 431 424 467 -.276 225 dục a Dependent Variable: Thu nhập (triệu đồng/tháng) Nhận xét: Nhìn vào gtri biên độc lập thành phần cuối cùng, thấy rằng: Hệ số biến Tuổi, Giới tính lớn 0.05, khơng có ý nghĩa thống kê, có dấu âm (-), điều cho thấy Tuổi, Giới tính khơng có tác động tích cực lên Thu nhập lOMoARcPSD|17343589 Hệ số biến Học vấn, Thể dục nhỏ 0.05, có ý nghĩa thống kê, có dấu dương (+), điều cho thấy Học vấn, Thể dục có tác động tích cực lên Thu nhập Hệ số biến Hơn nhân nhỏ 0.05, có ý nghĩa thống kê, có dấu dương (-), điều cho thấy Hơn nhân khơng có tác động tích cực lên Thu nhập Tạo biến tương tác (interaction variable) Tuổi Tập thể dục Phân tích tác động điều tiết (moderating effect) việc Tập thể dục lên mối quan hệ Tuổi Thu nhập Coefficientsa Unstandardized Standardized Model (Constant) Tuổi TUOI_THED Coefficients Coefficients B Std Error Beta 18.762 2.022 -.135 057 -.215 070 015 416 t 9.279 -2.382 4.611 Sig .000 019 000 UC a Dependent Variable: Thu nhập (triệu đồng/tháng) Nhận xét: Vì sig nhỏ 0.05 suy có ý nghĩa thống kê, có tác động điều tiết việc tập thể dục lên mối quan hệ tuổi thu nhập Kết cho thấy tác động tích cực việc tập thể dục lên thu nhập, thu nhập người thường xuyên tập thể dục tăng nhanh so với người không thường xuyên tập  TÀI LIỆU THAM KHẢO *HẾT*

Ngày đăng: 25/08/2023, 23:17

Xem thêm:

w