1. Trang chủ
  2. » Luận Văn - Báo Cáo

xử lý dữ liệu và viết báo cáo cho đề tài phân tích hành vi tập thể dục của người dân việt nam

12 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xu Ly Du Lieu Va Viet Bao Cao Cho De Tai Phan Tich Hanh Vi Tap The Duc Cua Nguoi Dan Viet Nam
Tác giả Nhom 1
Trường học Truong Dai Hoc Kinh Te Thanh Pho Ho Chi Minh
Chuyên ngành Phan tich Kinh Doanh va Du Bao
Thể loại Thuyet Trinh Nhom Cuoi Ki
Năm xuất bản 2023
Thành phố Thanh pho Ho Chi Minh
Định dạng
Số trang 12
Dung lượng 1,12 MB

Nội dung

Chúng ta sẽ sử dụng 2 biến : Thu nhập hằng tháng và Giới tính e Biến độc lập: Biến Giới tính có các giá trị là “1”Nam hoặc “2” Nữ e _ Biến phụ thuộc: Biến Thu nhập hằng tháng Sau khi ch

Trang 1

BO GIAO DUC VA DAO TAO

TRUONG DAI HOC KINH TE THANH PHO HO CHi MINH

UEH

UNIVERSITY

NHOM 1 - THUYET TRINH NHOM CUOI KI

PHAN TICH KINH DOANH VA DU BAO

XU LY DU LIEU VA VIET BAO CAO

CHO DE TAI PHAN TICH HANH VI TAP THE DUC

CUA NGUOI DAN VIET NAM

Danh sách thành viên nhóm

Thành phố Hồ Chí Minh —- Năm 2023

Trang 2

MUC LUC

NOL DUNG oo eeecescsssscsseesssesseessvsssvssecsssessvesssesevessvsssessevsssesssesevessesssessevsssesssesssetsnsssessensasessees 1

1.1 M6 ta dit OU cece .Aa sa KG (ccrccd< 1

2.1 Lap bang tan $6 vé Trinh d6 hoc Van ccecccecscceeseeeseseceseccerecesesevccereesverecereacenteereats 1

3.1 Vẽ đồ thi hinh chiéc banh (pie chart) thể hiện ty lệ phần trăm của số quan sát phân

theo GIới tính (nam, nữ) cv ST HT KT 11 Kà 2

4.1 So sánh gia tri trung bình về Thu nhập của 2 nhóm Gidi tinh, co sy khác biệt có ý

nghĩa thông kê nào giữa 2 nhóm Giới tính về Thu nhập hay không? . 3

5.1 So sánh giá trị trung bình về Thu nhập của các Trinh d6 học vấn, có sự khác biệt có

ý nghĩa thống kê nào giữa các Trình độ học vẫn về Thu nhập hay không? 4

6.1 Kiểm tra có đa cộng tuyến (multcollinearity) giữa các biển Tuổi, Giới tính, Trình

độ học van, Tình trạng hôn nhân, Tập thé dục hay không? .- ¿25+ +s5x 552 4

7.1 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của

các biến Tuôi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thê dục lên biến

n0 .ÁaÁa 6

§.1 Tạo biến tương tác (interaction variable) giữa Tuôi và Tập thể dục Phân tích tác

dong diéu tiét (moderating effect) của việc Tập thê dục lên mối quan hệ giữa Tuổi và

n0 .ÁaÁa 7

IV )80i1))009:70/8.4:7(93aẶ 10

Trang 3

NOI DUNG

1.1 Mô tả dữ liệu

* Thu thập và xây dựng file dữ liệu SPSS với các yêu cau sau:

Có các biến:

._ Họ và tên: chuỗi ký tự (strine) không dấu

._ Thu nhập: triệu vnđ“háng

Tuổi

Gidi tinh: nam (1), nữ (0)

Trinh độ học vấn: thpt (1), dai học (2), thạc si (3), tién si (4)

Tinh trạng hôn nhan: déc than (1), c6 gia dinh (2)

Tập thê dục: có tập thé dục thường xuyên (trên 20 phút mỗi ngày) (1), không tập

NO

oO

0

N

>

thê dục thường xuyên (đưới 20 phút mỗi ngày) (0)

- _ Số quan sát: 103 biến

Bang 1: Descriptive Statistics

Thu nhap thang

T

Gid1

Trình độ học

Tình trạng hôn nhân

Thói quen tập dục

2.1 Lập bảng Trình độ học

Yêu câu có: (ï) số quan sát ứng với từng trình độ và (ii) ty 16 phan trăm cụ thê cho từng trình

độ Phân tích trong mẫu nghiên cứu, trình độ học vấn nào chiếm tỷ lệ cao nhất? trình độ học

vấn nào chiếm tỷ lệ thấp nhất?

2.1.1 Kết quả chạy SPSS

Bang 2: Két qud chay SPSS trinh d6 hoc van

Trinh độ học vẫn

Valid Cumulative

Frequency Percent) Percent Percent

Valid | THPT 4 3.9 3.9 3.9

Dai hoc 91 88.3 88.3 92.2

1

Trang 4

Thạc sĩ

Ti

si

rinh dé hoc

2.1.2 Kết luận

- _ Trong tổng số 103 người tham gia trả lời phiếu khảo sát, có: 4 người có trình độ THPT

chiếm tỷ trọng 3.9%, 91 người có trinh độ Đại học chiếm 88.3%, 7 người có trinh độ

Thạc sĩ chiếm 6.8%, 1 người có trình độ Tiến sĩ chiếm 1%,

- _ Từ kết quả này có thê thấy, Trình độ Đại học chiếm tỷ lệ cao nhất (88.3%) và trình độ

Tiến sĩ chiếm tỷ lệ thấp nhất (1%)

3.1 Vẽ đồ thị hình chiếc bánh (pie chart) thể hiện ty lệ phần trăm của số quan sát phân

theo Giới tính (nam, nữ)

Yêu cầu có tỷ lệ phần trăm cụ thê cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên

cứu, nam hay nữ chiếm tỷ lệ cao hơn

Hình 1: Biểu đồ thể hiện phan tram gidi tinh

Pie Chart Percent of Giới tính

Giới

Ñ Nam

nữ

% Trong mẫu nghiên cứu của chúng tôi, có số quan sát phân theo giới tính như sau:

Trang 5

- _ Có tổng 103 mẫu khảo sát, trong đó:

© 56 người là Nam (chiếm 54,37%)

© 47 người là Nữ (chiếm 45,63%)

- _ Tỷ lệ người Nam khảo sát nhiều hơn so với Nữ là 9 người

4.1 So sánh giá trị trung bình về Thu nhập của 2 nhóm Giới tính, có sự khác biệt có ý

nghĩa thống kê nào giữa 2 nhóm Giới tính về Thu nhập hay không?

Đề phân tích về Thu nhập của 2 nhóm giới tính (Nam và Nữ) có sự khác biệt có ý nghĩa

thống kê nào hay không Chúng ta sẽ sử dụng 2 biến : Thu nhập hằng tháng và Giới tính

e Biến độc lập: Biến Giới tính có các giá trị là “1”(Nam) hoặc “2” (Nữ)

e _ Biến phụ thuộc: Biến Thu nhập hằng tháng

Sau khi chạy SPSS, nhóm chúng tôi đã cho thấy các kết quả sau:

Báng 3: Ké quá chạy SPSS Group Statistics

p

Giới tính

Bang 4: Két qua chay Independent Samples Test

Independent Samples Test

Levene's Tes

for Equality

of Variances t-test for Equality of Means

95% Confidence Interval of th

Sig (2- Mean Std Error Difference

F Sig t df tailed) Difference Difference Lower Upper

Thu Equal variance 92.226 1139 2.609 101 010 5814399.69¢ 2228547.85! 1393560.224 10235239 16

nhap assumed

hang Equal variance 2.496] 70.494 015| 5814399.69/ 2329938.654 1168056.261 10460743.13|

tháng not assumed

s* Kết luận:

- _ Phân tích kiếm định Levene: Kết quả kiểm định của 2 phương sai tong thể có giá trị

Sig= 0.139 > 0.05 nên phương sai của 2 tổng thê không khác nhau, chúng ta sẽ sử dụng

kết quả kiêm định t 6 dong Equal variances assumed dé xem tiép kết quả phân tích của

bài

- _ Phân tích Independent Samples T-test

Trang 6

e Két qua Sig (2-tailed) = 0.010 < 0.05 nên chúng ta kết luận có sự khác biệt có

ý nghĩa về trung bình của 2 tổng thể Nói cách khác, giữa hai nhóm giới tính

Nam và Nữ thì có bằng chứng cho thấy có sự khác nhau về trung bình của thu

nhập hăng tháng Trong đó thu nhập trung bình của Nam cao hơn thu nhập

trung bình của Nữ

e _ Theo kết quả khảo sát, thu nhập trung bình của Nam là 23,234,042 đồng và của

Nữ là 17,419, 642 đồng

e _ Thu nhập hằng tháng trung bình của Nam nhiều hơn là 5,814,399 đồng so với

Nữ

5.1 So sánh giá trị trung bình về Thu nhập của các Trình độ học vấn, có sự khác biệt có ý

nghĩa thống kê nào giữa các Trình độ học vấn về Thu nhập hay không?

Để so sánh giá trị trung bình của các nhóm, ta sử dụng ANOVA

Bang 5: Két qué chay Test of Homogeneity of Variances

Statistic df

u on

nhap on

hang on

thang on mean

=> Taco Sig 0.69>0.05, do do ta cé du điều kiện dé phan tich Anova

Bang 6: Két qud chay ANOVA

Mean Square

= Tai bang ANOVA, ta có Sig Anova 0.60>0.05, đo đó có thê kết luận không có sự khác

biệt thu nhập trưng bình có ý nghĩa giữa các nhóm có trình độ khác nhau

6.1 Kim tra có đa cộng tuyến ) giữa các biến Tuổi, Giới tính, Trình độ học vấn, Tình

trạng hôn nhân, Tập thể dục hay không?

Trang 7

Bang 7: Két qud chay Correlations

Correlations

Giới Trìinhđộ Tinh trang Thói quen

Tuổi tính họcvấn hôn nhân tập thể dục

Tuôi Pearson 1 -.001 086 390" 018

Correlation

Sig (2-tailed) 994 386 000 857

N 103 103 103 103 103

Giới tính Pearson -.001 1 -.037 109 239”

Correlation

Sig (2-tailed) 994 711 271 015

N 103 103 103 103 103

Trinh dé hoc van Pearson 086 -.037 1 -.013 -.059

Correlation

Sig (2-tailed) 386 860.711 898 555

N 103 103 103 103 103

Tình trạng hôn nhân Pearson 390” 109 -.013 1 335”

Correlation

Sig (2-tailed) 000.271 898 001

N 103 103 103 103 103

Thói quen tập thé due Pearson 018 239 -.059 335" 1

Correlation

Sig (2-tailed) 857.015 555 001

N 103 103 103 103 103

** Correlation is significant at the 0.01 level (2-tailed)

* Correlation is significant at the 0.05 level (2-tailed)

Từ bảng trên ta có thê thây:

- Cặp biến Tuổi và Tình trạng hôn nhân có giá trị sig tương quan là 0.000 < 0.05, hai biến

có tương quan với nhau, hệ số tương quan Pearson có giá trị là 0.39 < 0.7, không xáy ra

đa cộng tuyến giữa cặp biến này

-_ Cặp biến Giới tính và thói quen tập thé dục có giá trị sig tương quan là 0.015 < 0.05, hai

biến có tương quan với nhau, hệ số tương quan Pearson có giá trị là 0.239 < 0,7, không

xảy ra đa cộng tuyến giữa cặp biến này

Trang 8

- _ Cặp biến Tình trạng hôn nhân và thói quan tập thể dụng có giá tri sig tương quan là

0.001 < 0.05, hai biến có tương quan với nhau, hệ số tương quan Pearson có giá trị là

0.335 < 0.7, không xảy ra đa cộng tuyến giữa cặp biến này

- _ Các biến còn lại có sig > 0.05, hai biến không có tương quan, không có khá năng xảy ra

đa cộng tuyến giữa 2 biến này

7.1 Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của

các biến Tuôi, Giới tính, Trình độ học vấn, Tình trạng hôn nhân, Tập thế dục lên biến

Thu nhập

Bang 8: Két qud chay SPSS Model Summary

Model Summary

Model R R Square Adjusted R | Std Error of the

Square Estimate

1 5044 254 215 10258730.00

a Predictors: (Constant), Théi quen tap thé dục, Tuôi, Trình độ

hoc van, Gidi tinh, Tinh trạng hôn nhân

Bang 9: Két qud chay ANOVA

ANOVA?

Model Sum of Squares dt Mean Square F Sig

Regression 3473274378012542 5¢ 694654875602508 5d 6.601 000°

Residual 10208429505482600.0/ 97] 1052415412936535.01

Total 13681703883495142.0¢ 102

ƠI

=

a Dependent Variable: Thu nhap hang thang

b Predictors: (Constant), Théi quen tap thé duc, Tudi, Trinh dé hoc van, Gidi tinh, Tinh tra

hôn nhân

Trong bảng kết quá ANOVA, kết qua bién Sig là 0.000 cho thấy mô hình hôi quy là phù hợp

Bang 10: Két qua chay Coefficients?

Coefficients

1 |T

Giới tính

Trang 9

Trinh dé hoc van 3935975.499 2687380.924 129} 1.465 146

Tình trạng hôn nhân 1066402.73( 2744135.991 040 389 698

Thói quen tập thể

dục

=

Dependent Variable: Thu nhap hang thang

Trong bang két qua Coefficients:

Gia tri Sig (hay p-value) cua biến Tuổi là 0.000 < 0.01 cho thấy có tác động có ý nghĩa

thống kê mạnh mẽ đến biến phụ thuộc Thu nhập

Gia tri Siø (hay p-value) của biến Giới tính là 0.014 < 0.05 cho thấy có tác động có ý

nghĩa thống kê đến biến phụ thuộc Thu nhập

Gia tri Sig (hay p-value) của biến Trình độ học vấn là 0.146 > 0.05 cho thấy biến Trình

độ học vấn không có tác động đến biến Thụ nhập

Giá trị Sig (hay p-value) của biến Tình trạng hôn nhân là 0.698 > 0.05 cho thấy biến

Tình trạng hôn nhân không có tác động đến biến Thu nhập

Giá trị Sig (hay p-value) của biến Thói quen tập thé dục là 0.272 > 0.05 cho thấy biến

Thới quen tập thể dục không có tác động đến biến Thu nhập

Xét hệ số của các biến có tác động đến biến Thu nhập:

Hệ số của biến Tuổi có ý nghĩa thống kê và có có dấu đương Điều này cho thấy độ Tuôi

có tác động tích cực lên Thu nhập

Hệ số của biến Giới tính có ý nghĩa thống kê và có đấu âm Điều này cho thấy Giới tính

có tác động tiêu cực lên Thu nhập

8.1 Tạo biến tương tác (interaction variable) giữa Tuôi và Tập thế dục Phân tích tác động

điều tiết (moderating effect) của việc Tập thế dục lên mối quan hệ giữa Tuổi và Thu nhập

Tạo biến Tương tác giữa Tuổi và Tập thể dụng bằng cách sử dụng Transform >

2 Reon

Compute variable, sau dé ta tạo 1 biến tương tác bằng cách nhân 2 bién “Tudi” va “Tap

thê dục”, sau đó nhắn OK

Tiếp theo, để phân tích tác động điều tiết của việc Tập thể dục lên mối quan hệ giữa

Tuổi và Thu nhập, ta sử dụng Analyze, chọn Regression va chon myc Linear

Trong bang Linear Regression, ta sẽ chọn Thu nhập là biến phụ thuộc và để vào ô

Dependent, va để ba biến còn lại là Tuổi, Tập thé duc va bién Tương tac vira tao vao 6

Independent(s), sau dé chon OK

Ta sẽ được kết quả sau:

-2474916.96) 2240324.684 -.106} -1.105 272

Trang 10

Bang 11: Ket qud chay Variables Entered/Removed?

Variables Entered/Removed?

Variables Variables

Model Entered Removed | Method

1 Bến tương | Enter

tac, Tuổi,

Thói quen tập

thé duc?

a Dependent Variable: Thu nhap hang thang

b All requested variables entered

Bang 12: Két qua chay Model Summary

Model Summary

Adjusted R | Std Error of

Model R RSquarg Square the Estimate

1 434? 189 164| 10588322.6

7

a Predictors: (Constant), Bién tuong tac, Tuoi, Thoi quen

tap thé duc

Bang 13: Két qud chay ANOVA

ANOVA?

a Vị

b Predictors: (Constant), Biên tương tác, Tuôi, Thói quen tập thê dục

Báng 14: Kết qua chay Coefficients?

Coefficients?

Standardized

Unstandardized Coefficients Coefficients

Model B Std Error Beta t Sig

Trang 11

(Constant) -9579519.554 22314659.69¢ -.429 669

Tudi 1241613.20 789148.09 506 1.573 119

Thói quen tập thê đục 530688.774 13122651.81 023 040 968

Biển tương tác -147745.919 462115.754 -.207 -.320 750

a Dependent Variable: Thu nhap hang thang

Kết luận

Tw ban Model Summary, ta co:

e —R: Hệ số tương quan bội (R) đo lường mức độ và chiều hướng của mối quan hệ

tuyến tính giữa biến phụ thuộc (Thu nhập hằng tháng hoặc Thu nhập hàng tháng) và

các biến độc lập (Biến tương tác, Tuổi, Thói quen tập thể dục) Trong trường hợp

này, R là 0,434, cho thấy mối tương quan dương vừa phải giữa các biến

e R Square (R?2): Day la hé sé xác định, biểu thị tỷ lệ phương sai của biến phụ thuộc

(Thu nhập hàng tháng) được giải thích bởi các biến độc lập trong mô hình Ở đây,

R? là 0,189, có nghĩa là khoảng 18,9% phương sai trong Thu nhập hàng tháng được

giải thích bằng các biến độc lập trong mô hình

e Adjusted R Square: R? điều chỉnh độ phức tạp của mô hình Ở đây, R bình phương

đã điều chỉnh là 0,164

e Std Error of the Estimate: Day là ước tính độ lệch chuẩn của các lỗi trong mô

hình Trong trường hợp này, nó xắp xỉ 10.588.322,66

Kết hợp với bảng ANOVA, ta có thể kết luận rằng mô hình hồi quy có ý nghĩa thống kê

vì giá trị p liên quan đến thống kê F rat thấp (p < 0,001) Điều này cho thấy rằng các

biến độc lập, với tư cách là một nhóm, có tác động đáng kể đến việc giải thích sự khác

biệt trong thu nhập hàng tháng

Tuy nhiên, dựa vào bảng Coefñcients, ta có thể thấy tất cả các hệ số điều có giá tri Sig

lớn hơn 0.05, do đó có thể kết luận không có biến độc lập nào (Tuổi, Thói quen tập thé

dục, Biến tương tác) có tác động đáng kê về mặt thống kê đến Thu nhập hàng tháng

Các hệ số được tiêu chuẩn hóa gợi ý hướng và cường độ tương đối của các mối quan

hệ, nhưng giá trị p không có ý nghĩa chỉ ra rằng các mối quan hệ này không khác 0 một

cách có ý nghĩa Dó đó đề kiểm tra thêm về mối quan hệ này ta có thẻ thu thập thêm dữ

liệu bổ sung đề đưa ra kết luận có ý nghĩa về các mối quan hệ trong mô hình này

Phương trình đề xuất:

Thu nhập hằng tháng = -9579519.558 - 147745.919 * Biến tương tác + 1241613.201

* Tuổi + 53068§.775 * Thói quen tập thé duc + std error

Lưu ý rằng các hệ số trên không có ý nghĩa đo có hệ số p lớn hơn 0.05

Ngày đăng: 25/09/2024, 16:25

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w