Giới tính Nam: Dân tộc White có 41 người trong đó có 16 người mang giới tính nữ chiếm 30,9% trong tống số người tham gia khảo sát.. Giới tính Nữ: Dân tộc White có 41 người trong đó có 25
Trang 1ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
KHOA KINH DOANH QUỐC TẾ
ĐỀ TÀI
TIỂU LUẬN CUỐI KỲ: PHÂN TÍCH DỮ LIỆU
Họ và tên: Trịnh Thị Bảo Trâm
MSSV: 35221020006
Trang 2Câu 1: Lập bảng tần số về ethnicity (dân tộc) Yêu cầu có: (i) số quan sát ứng với từng trình
độ và (ii) tỷ lệ phần trăm cụ thể cho từng dân tộc Phân tích trong mẫu nghiên cứu, dân tộc nào chiếm tỷ lệ cao nhất? dân tộc nào chiếm tỷ lệ thấp nhất?
Ethnicity
Frequency Percent Valid Percent Cumulative
Percent
HISPANI C
18 22.2 22.2 76.5
Dựa vào bảng phân tích ta thấy:
White chiếm tỷ lệ cao nhất với 50.6% Tần suất xuất hiện là 41, nghĩa là có 41 người dân tộc White
Hispanic chiếm tỷ lệ cao thứ 2 với 22.2% Tần suất xuất hiện là 18, nghĩa là có 18 người thuộc dân tộc Hispanic
Black là dân tộc chiếm tỷ lệ thấp nhất với 3.7% Tần suất xuất hiện là 3, nghĩa là có 3 người thuộc nhóm dân tộc Black
theo gender (nam, nữ) Yêu cầu có tỷ lệ phần trăm cụ thể cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao hơn.
Trang 3Theo nghiên cứu tỷ lệ nam giới chiếm 41,98%, nữ giới chiếm 58,02% so với tổng giới tính cuả các quan sát Dựa trên tỷ lệ có thể thấy nữ giới chiếm tỷ lệ cao hơn nam giới là 16,04%
Câu 3: Lập bảng bảng chéo (cross-tabulation) giữa ethnicity và gender Yêu cầu có tỷ lệ phần trăm cụ thể cho từng ethnicity phân theo gender Phân tích kết quả này.
gender * ethnicity Crosstabulation
gen
der
% within ethnicity
39.0% 66.7% 27.8% 73.3% 0.0% 42.0%
% within ethnicity
61.0% 33.3% 72.2% 26.7% 100.0% 58.0%
% within ethnicity
100.0% 100.0% 100.0% 100.0% 100.0% 100.0%
Bảng phân tích theo khảo sát đã cho thấy tỉ lệ phần trăm giữa các giới trính trong số các dân tộc
có sự chênh lệch Trong đó có 81 người tham gia khảo sát, 34 người là nữ giới và 47 người là nam giói Cụ thể bảng phân tích đã cho thấy:
Trang 4Giới tính Nam: Dân tộc White có 41 người trong đó có 16 người mang giới tính nữ chiếm 30,9% trong tống số người tham gia khảo sát Dân tộc Black có 3 người tham gia khảo sát trong đó nam giới là 2 người chiếm 2.5% Dân tộc Hispanic có 18 người tham gia khảo sát trong đó nam giới
là 5 người chiếm 6.2%.Dân tộc Asian có 15 người tham gia khảo sát trong đó có 11 người mang giới tính nam chiếm 13.6%
Giới tính Nữ: Dân tộc White có 41 người trong đó có 25 người mang giới tính nam chiếm 19,8% trong tống số người tham gia khảo sát Dân tộc Black có 3 người tham gia khảo sát trong đó nữ giới là 1 người chiếm 1.2% Dân tộc Hispanic có 18 người tham gia khảo sát trong đó nữ giới là
13 người chiếm 16%.Dân tộc Asian có 15 người tham gia khảo sát trong đó có 4 người mang giới tính nữ chiếm 4.9% trong tổng số người tham gia khảo sát Ngoài ra ở giới tính nữ có 4 người ở dân tộc khác chiếm 4.9% trong tổng số người làm khảo sát
Như vậy tổng số giới tính nam làm khảo sát thấp hơn giưới tính nữ
Câu 4: Vẽ đồ thị scatter plot giữa 2 biến sympathy và zhelp Yêu cầu có fit line Thông qua
đồ thị, có thể nhận xét gì về mối quan hệ giữa sympathy và zhelp.
Trang 5Tương quan thuận giữa biến Sympathy và Zhepl Biến Sympathy càng cao thì biến Zhepl càng cao Cho thấy sự đồng cảm càng tăng cao thì mọi người đầu có xu hướng giúp đỡ người khác cao hơn
Câu 5: Lập bảng thống kê mô tả (descriptive statistics) của các biến zhelp, gender, ethnicity, sympathy, anger, efficacy Phân tích kết quả này.
Descriptive Statistics
N Minimum Maximum Mean Std Deviation
Valid N (listwise) 81
Zhelp: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là -2,95, đây cũng là
mức thấp nhất trong khảo sát giữa các biến và nhiều nhất là 3.01 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến zhelp là 0.3523 trong thang biến này nhiều nhất là 3.01 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.25276, cho thấy sự khác nhau trong câu trả lời khảo sát
Gender: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1, và nhiều nhất là
2 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này
là 1.58 trong thang biến này nhiều nhất là 2 Độ lệch chuẩn ở biến này ở mức dao động nhỏ 0.497, cho thấy sự giống nhau trong câu trả lời khảo sát là gần như nhau
Ethnicity: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1, và nhiều nhất
là 5 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này là 2.23 trong thang biến này nhiều nhất là 5 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.372, cho thấy sự khác nhau trong câu trả lời khảo sát
Sympathy: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1.8, và nhiều
nhất là 7 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này là 4.504 trong thang biến này nhiều nhất là 7 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.1439, cho thấy sự khác nhau trong câu trả lời khảo sát
Anger: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1, và nhiều nhất là
6.5 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến
Trang 6này là 2.079 trong thang biến này nhiều nhất là 6.5 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.3694, cho thấy sự khác nhau trong câu trả lời khảo sát
Gender: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 2.8, và nhiều nhất
là 6.5 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này là 4.474 trong thang biến này nhiều nhất là 6.5 Độ lệch chuẩn ở biến này ở mức dao động nhỏ 0.8637, cho thấy sự giống nhau trong câu trả lời khảo sát là gần như nhau
Câu 6: So sánh giá trị trung bình về zhelp của 2 nhóm gender, có sự khác biệt có ý nghĩa thống kê nào giữa 2 nhóm gender về zhelp hay không?
Kiểm định F có Sig 0.853 > 0.05 Cho thấy không có sự khác biệt giữa phương sai giữa hai nhóm zhelp và gender
Chúng ta sẽ sử dụng kết quả kiểm định t ở hàng Equal variances assumed Sig kiểm định t bằng 0.317 > 0.05, chấp nhận giả thuyết H0 Nghĩa là không có sự khác biệt trung bình giữa Zhelp và Gender Như vậy có thể thấy không có sự khác nhau giữa giới tính và mức độ giúp đỡ người khác
Group Statistics
gender N Mean Std Deviation Std Error
Mean
FEMAL E
47 4717 1.18335 17261
Trang 7Bảng Group Statistics cho chúng ta các thông số mô tả của từng nhóm giới tính Giá trị trung bình của hai nhóm nam/nữ bằng 0.1876 và 0.4717, không có sự chênh lệch nhiều
Câu 7: So sánh giá trị trung bình về zhelp của các ethnicity, có sự khác biệt có ý nghĩa thống kê nào giữa các ethnicity về zhelp hay không?
Test of Homogeneity of Variances
Levene Statistic df1 df2 Sig.
Based on Median and with adjusted df
Ở bảng Test of Homogeneity of Variances đã kiểm phương sai mong muốn giúp đỡ, lòng tốt của các nhóm người tại các nhóm dân tộc Kết quả này cho biết phương sai của sự giúp đỡ có sự khác biệt giữa các nhóm dân tộc hay không Nghĩa là phương sai của sự giúp đỡ của nhóm dân tộc này có khác phương sai của sự giúp đỡ của nhóm dân tộc kia hay không
Sig của thống kê Levene >0.05 nên ở độ tin cậy 95% giả thuyết H0: “Phương sai bằng nhau” được chấp nhận, và bác bỏ giả thuyết H1: “Phương sai khác nhau” Và do đó kết quả phân tích ANOVA có thể sử dụng
ANOVA
zhelp
Squares
Within Groups 124.897 76 1.643
Kết quả Anova với mức ý nghĩa Sig = 0.982 > 0.05 như vậy với các dữ liệu quan sát trên chưa
đủ điều kiện để chứng minh có sự khác biệt về sự giúp đỡ với các nhóm dân tộc
Để cụ thể hơn về sự khác biệt ta xem kết quả tại các bảng từ phân tích Post Hoc Test:
Trang 8Multiple Comparisons
Dependent Variable: zhelp
Tukey HSD
(I)
ethnicity
(J)
ethnicity
Mean Difference (I-J)
Std.
Error
Sig 95% Confidence Interval
Lower Bound Upper Bound
HISPANI
C
Với bảng Multiple Comparisons, chúng ta sẽ phân tích rõ hơn sự khác biệt giữa các nhóm với nhau Nếu giá trị Sig nào nhỏ hơn 0.05 thì chứng tỏ có sự khác biệt về giá trị trung bình của các nhóm đối tượng được so sánh
Cụ thể, trong bảng trên ta thấy giá trị Sig giữa các nhóm dân tộc đều > 0.5:
White – Black : 0.999 > 0.5
White – Hipanic : 0.997 > 0.5
White – Asian: 0.998 > 0.5
Black – Hipanic: 0.996 >0.5
Black – Asian: 0.996 >0.5
Asian- Hipanic : 1 > 0.5
Other – Hipanic: 0.999 > 0.5
Trang 9Other – White : 0.992 > 0.5
Other – Black : 0.989 >0.5
Other – Asian: 0.999 >0.5
Điều này chứng tỏ không có sự khác biệt về phương sai sự giúp đỡ giữa các nhóm dân tộc trong khảo sát
Kết luận: Giá trị trung bình giữa sự giúp đỡ với các nhóm dân tộc không có ý nghĩa
thống kê
Câu 8: Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến sympathy, anger, efficacy hay không?
tương quan là 0.284< 0.05 Ta sẽ nhìn vào hệ số tương quan Pearson (Pearson Correlation), giá trị này là -0.12 > 0.5 Như vậy cặp biến độc lập này có mối tương quan tuyến tính rất yếu Chúng ta nhận xét: Không xảy ra đa cộng tuyến giữa cặp biến này.
Tương tự như vậy với cặp biến độc lập Anger và Efficacy có giá trị Sig tương quan là 0.818 > 0.05 Ta sẽ nhìn vào hệ số tương quan Pearson (Pearson Correlation), giá trị này là -0.026 > 0.5 Như vậy cặp biến độc lập này có mối tương quan tuyến tính rất yếu Chúng ta nhận xét: Không xảy ra đa cộng tuyến giữa cặp biến này.
Đối với cặp biến độc lập Eficacy và Sympathy có giá trị Sig tương quan là 0.195 < 0.05 Ta sẽ nhìn vào hệ số tương quan Pearson (Pearson Correlation), giá trị này là 0.145 < 0.5 Như vậy cặp biến độc lập này có mối tương quan tuyến tính rất yếu Chúng ta nhận xét: Không xảy ra đa cộng tuyến giữa cặp biến này.
Kết luận : Không xảy ra đa cộng tuyến giữa các biến
Câu 9: Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của các biến sympathy, anger, efficacy lên biến zhelp.
Correlations
sympathy anger efficacy sympathy Pearson Correlation 1 -.120 145
anger Pearson Correlation -.120 1 -.026
efficacy Pearson Correlation 145 -.026 1
Sig (2-tailed) 195 818
Trang 10ANOVA a
Squares
Square
a Dependent Variable: zhelp
b Predictors: (Constant), anger, efficacy, sympathy
Bảng Anova trên cho ta kết quả kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi quy Giá trị Sig kiểm định F bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp
Coefficients a
Coefficients
Standardized Coefficients
t Sig Collinearity
Statistics
Error
ce
VIF
a Dependent Variable: zhelp
Trong bảng phân tích ở trên, bảng Coefficients cho chúng ta kết quả kiểm định t để đánh giá giả thuyết ý nghĩa hệ số hồi quy, chỉ số VIF đánh giá đa cộng tuyến và các hệ số hồi quy
Biến Sympathy có giá trị Sig kiểm định t bằng 0.000 < 0.05 , do đó biến này có ý nghĩa trong mô hình hồi quy, nói cách khác, biến này có sự tác động tích cực lên biến phụ thuộc Zhelp
Biến Efficacy có giá trị Sig kiểm định t bằng 0.002 < 0.05 , do đó biến này có ý nghĩa trong mô hình hồi quy, nói cách khác, biến này có sự tác động tích cực lên biến phụ thuộc Zhelp.
Biến Anger có giá trị Sig kiểm định t bằng 0.001 < 0.05 , do đó biến này có ý nghĩa trong mô hình hồi quy, nói cách khác, biến này có sự tác động tích cực lên biến phụ thuộc Zhelp.
Hệ số hồi quy các biến độc lập này đều mang dấu dương, như vậy các biến độc lập có tác động thuận chiều lên biến phụ thuộc Nói cách khác các biến độc lập đều có tác động tích cực lên biến phụ thuộc là biến Zhelp.
Trang 11Hệ số phóng đại phương sai (VIF) là một chỉ số đánh giá hiện tượng cộng tuyến trong mô
hình hồi quy VIF càng nhỏ, càng ít khả năng xảy ra đa cộng tuyến Dựa vào bảng phân tích trên ta thấy:
Hệ số VIF của biến Sympathy là 1.036
Hệ số VIF của biến Efficacy là 1.022
Hệ số của biến Anger là 1.015
Các hệ số của các biến độc lập này đều ở mức thấp, thậm chí nhỏ hơn 2, vì vậy các giả định không vi phạm đến đa cộng tuyến
Không xảy ra đa cộng tuyến
Câu 10: Mã hóa lại biến gender với (Female = 1, Male = 0) Tạo biến tương tác (interaction variable) giữa gender và sympathy Phân tích tác động điều tiết (moderating effect) của gender lên mối quan hệ giữa sympathy và zhelp.
Coefficients a
Model Unstandardized Coefficients Standardized
Coefficients
1 (Constant
)
-2.986 1.642 -1.819 073
Interactio n
-.086 220 -.196 -.390 697
a Dependent Variable: zhelp
Biến tương tác : Interaction = Gender * Sympathy