1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề Tàitiểu Luận Cuối Kỳ Phân Tích Dữ Liệu.pdf

11 18 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Đề Tài Tiểu Luận Cuối Kỳ: Phân Tích Dữ Liệu
Tác giả Trịnh Thị Bảo Trâm
Người hướng dẫn T.S Nguyễn Văn Dũng
Trường học Đại Học Kinh Tế Thành Phố Hồ Chí Minh
Chuyên ngành Kinh Doanh Quốc Tế
Thể loại tiểu luận
Định dạng
Số trang 11
Dung lượng 306,27 KB

Nội dung

Giới tính Nam: Dân tộc White có 41 người trong đó có 16 người mang giới tính nữ chiếm 30,9% trong tống số người tham gia khảo sát.. Giới tính Nữ: Dân tộc White có 41 người trong đó có 25

Trang 1

ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH

KHOA KINH DOANH QUỐC TẾ

ĐỀ TÀI

TIỂU LUẬN CUỐI KỲ: PHÂN TÍCH DỮ LIỆU

Họ và tên: Trịnh Thị Bảo Trâm

MSSV: 35221020006

Trang 2

Câu 1: Lập bảng tần số về ethnicity (dân tộc) Yêu cầu có: (i) số quan sát ứng với từng trình

độ và (ii) tỷ lệ phần trăm cụ thể cho từng dân tộc Phân tích trong mẫu nghiên cứu, dân tộc nào chiếm tỷ lệ cao nhất? dân tộc nào chiếm tỷ lệ thấp nhất?

Ethnicity

Frequency Percent Valid Percent Cumulative

Percent

HISPANI C

18 22.2 22.2 76.5

Dựa vào bảng phân tích ta thấy:

White chiếm tỷ lệ cao nhất với 50.6% Tần suất xuất hiện là 41, nghĩa là có 41 người dân tộc White

Hispanic chiếm tỷ lệ cao thứ 2 với 22.2% Tần suất xuất hiện là 18, nghĩa là có 18 người thuộc dân tộc Hispanic

Black là dân tộc chiếm tỷ lệ thấp nhất với 3.7% Tần suất xuất hiện là 3, nghĩa là có 3 người thuộc nhóm dân tộc Black

theo gender (nam, nữ) Yêu cầu có tỷ lệ phần trăm cụ thể cho từng giới tính trên đồ thị Phân tích trong mẫu nghiên cứu, nam hay nữ chiếm tỷ lệ cao hơn.

Trang 3

Theo nghiên cứu tỷ lệ nam giới chiếm 41,98%, nữ giới chiếm 58,02% so với tổng giới tính cuả các quan sát Dựa trên tỷ lệ có thể thấy nữ giới chiếm tỷ lệ cao hơn nam giới là 16,04%

Câu 3: Lập bảng bảng chéo (cross-tabulation) giữa ethnicity và gender Yêu cầu có tỷ lệ phần trăm cụ thể cho từng ethnicity phân theo gender Phân tích kết quả này.

gender * ethnicity Crosstabulation

gen

der

% within ethnicity

39.0% 66.7% 27.8% 73.3% 0.0% 42.0%

% within ethnicity

61.0% 33.3% 72.2% 26.7% 100.0% 58.0%

% within ethnicity

100.0% 100.0% 100.0% 100.0% 100.0% 100.0%

Bảng phân tích theo khảo sát đã cho thấy tỉ lệ phần trăm giữa các giới trính trong số các dân tộc

có sự chênh lệch Trong đó có 81 người tham gia khảo sát, 34 người là nữ giới và 47 người là nam giói Cụ thể bảng phân tích đã cho thấy:

Trang 4

Giới tính Nam: Dân tộc White có 41 người trong đó có 16 người mang giới tính nữ chiếm 30,9% trong tống số người tham gia khảo sát Dân tộc Black có 3 người tham gia khảo sát trong đó nam giới là 2 người chiếm 2.5% Dân tộc Hispanic có 18 người tham gia khảo sát trong đó nam giới

là 5 người chiếm 6.2%.Dân tộc Asian có 15 người tham gia khảo sát trong đó có 11 người mang giới tính nam chiếm 13.6%

Giới tính Nữ: Dân tộc White có 41 người trong đó có 25 người mang giới tính nam chiếm 19,8% trong tống số người tham gia khảo sát Dân tộc Black có 3 người tham gia khảo sát trong đó nữ giới là 1 người chiếm 1.2% Dân tộc Hispanic có 18 người tham gia khảo sát trong đó nữ giới là

13 người chiếm 16%.Dân tộc Asian có 15 người tham gia khảo sát trong đó có 4 người mang giới tính nữ chiếm 4.9% trong tổng số người tham gia khảo sát Ngoài ra ở giới tính nữ có 4 người ở dân tộc khác chiếm 4.9% trong tổng số người làm khảo sát

Như vậy tổng số giới tính nam làm khảo sát thấp hơn giưới tính nữ

Câu 4: Vẽ đồ thị scatter plot giữa 2 biến sympathy và zhelp Yêu cầu có fit line Thông qua

đồ thị, có thể nhận xét gì về mối quan hệ giữa sympathy và zhelp.

Trang 5

Tương quan thuận giữa biến Sympathy và Zhepl Biến Sympathy càng cao thì biến Zhepl càng cao Cho thấy sự đồng cảm càng tăng cao thì mọi người đầu có xu hướng giúp đỡ người khác cao hơn

Câu 5: Lập bảng thống kê mô tả (descriptive statistics) của các biến zhelp, gender, ethnicity, sympathy, anger, efficacy Phân tích kết quả này.

Descriptive Statistics

N Minimum Maximum Mean Std Deviation

Valid N (listwise) 81

Zhelp: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là -2,95, đây cũng là

mức thấp nhất trong khảo sát giữa các biến và nhiều nhất là 3.01 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến zhelp là 0.3523 trong thang biến này nhiều nhất là 3.01 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.25276, cho thấy sự khác nhau trong câu trả lời khảo sát

Gender: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1, và nhiều nhất là

2 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này

là 1.58 trong thang biến này nhiều nhất là 2 Độ lệch chuẩn ở biến này ở mức dao động nhỏ 0.497, cho thấy sự giống nhau trong câu trả lời khảo sát là gần như nhau

Ethnicity: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1, và nhiều nhất

là 5 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này là 2.23 trong thang biến này nhiều nhất là 5 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.372, cho thấy sự khác nhau trong câu trả lời khảo sát

Sympathy: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1.8, và nhiều

nhất là 7 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này là 4.504 trong thang biến này nhiều nhất là 7 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.1439, cho thấy sự khác nhau trong câu trả lời khảo sát

Anger: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 1, và nhiều nhất là

6.5 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến

Trang 6

này là 2.079 trong thang biến này nhiều nhất là 6.5 Độ lệch chuẩn ở biến này ở mức dao động tương đối cao 1.3694, cho thấy sự khác nhau trong câu trả lời khảo sát

Gender: Có tổng 81 người tham gia trả lời, số lượng người tham gia ít nhất là 2.8, và nhiều nhất

là 6.5 người Đa số người tham gia trả lời đều trên mức trung bình, vì giá trị trung bình của biến này là 4.474 trong thang biến này nhiều nhất là 6.5 Độ lệch chuẩn ở biến này ở mức dao động nhỏ 0.8637, cho thấy sự giống nhau trong câu trả lời khảo sát là gần như nhau

Câu 6: So sánh giá trị trung bình về zhelp của 2 nhóm gender, có sự khác biệt có ý nghĩa thống kê nào giữa 2 nhóm gender về zhelp hay không?

Kiểm định F có Sig 0.853 > 0.05 Cho thấy không có sự khác biệt giữa phương sai giữa hai nhóm zhelp và gender

Chúng ta sẽ sử dụng kết quả kiểm định t ở hàng Equal variances assumed Sig kiểm định t bằng 0.317 > 0.05, chấp nhận giả thuyết H0 Nghĩa là không có sự khác biệt trung bình giữa Zhelp và Gender Như vậy có thể thấy không có sự khác nhau giữa giới tính và mức độ giúp đỡ người khác

Group Statistics

gender N Mean Std Deviation Std Error

Mean

FEMAL E

47 4717 1.18335 17261

Trang 7

Bảng Group Statistics cho chúng ta các thông số mô tả của từng nhóm giới tính Giá trị trung bình của hai nhóm nam/nữ bằng 0.1876 và 0.4717, không có sự chênh lệch nhiều

Câu 7: So sánh giá trị trung bình về zhelp của các ethnicity, có sự khác biệt có ý nghĩa thống kê nào giữa các ethnicity về zhelp hay không?

Test of Homogeneity of Variances

Levene Statistic df1 df2 Sig.

Based on Median and with adjusted df

Ở bảng Test of Homogeneity of Variances đã kiểm phương sai mong muốn giúp đỡ, lòng tốt của các nhóm người tại các nhóm dân tộc Kết quả này cho biết phương sai của sự giúp đỡ có sự khác biệt giữa các nhóm dân tộc hay không Nghĩa là phương sai của sự giúp đỡ của nhóm dân tộc này có khác phương sai của sự giúp đỡ của nhóm dân tộc kia hay không

Sig của thống kê Levene >0.05 nên ở độ tin cậy 95% giả thuyết H0: “Phương sai bằng nhau” được chấp nhận, và bác bỏ giả thuyết H1: “Phương sai khác nhau” Và do đó kết quả phân tích ANOVA có thể sử dụng

ANOVA

zhelp

Squares

Within Groups 124.897 76 1.643

Kết quả Anova với mức ý nghĩa Sig = 0.982 > 0.05 như vậy với các dữ liệu quan sát trên chưa

đủ điều kiện để chứng minh có sự khác biệt về sự giúp đỡ với các nhóm dân tộc

Để cụ thể hơn về sự khác biệt ta xem kết quả tại các bảng từ phân tích Post Hoc Test:

Trang 8

Multiple Comparisons

Dependent Variable: zhelp

Tukey HSD

(I)

ethnicity

(J)

ethnicity

Mean Difference (I-J)

Std.

Error

Sig 95% Confidence Interval

Lower Bound Upper Bound

HISPANI

C

Với bảng Multiple Comparisons, chúng ta sẽ phân tích rõ hơn sự khác biệt giữa các nhóm với nhau Nếu giá trị Sig nào nhỏ hơn 0.05 thì chứng tỏ có sự khác biệt về giá trị trung bình của các nhóm đối tượng được so sánh

Cụ thể, trong bảng trên ta thấy giá trị Sig giữa các nhóm dân tộc đều > 0.5:

White – Black : 0.999 > 0.5

White – Hipanic : 0.997 > 0.5

White – Asian: 0.998 > 0.5

Black – Hipanic: 0.996 >0.5

Black – Asian: 0.996 >0.5

Asian- Hipanic : 1 > 0.5

Other – Hipanic: 0.999 > 0.5

Trang 9

Other – White : 0.992 > 0.5

Other – Black : 0.989 >0.5

Other – Asian: 0.999 >0.5

Điều này chứng tỏ không có sự khác biệt về phương sai sự giúp đỡ giữa các nhóm dân tộc trong khảo sát

Kết luận: Giá trị trung bình giữa sự giúp đỡ với các nhóm dân tộc không có ý nghĩa

thống kê

Câu 8: Kiểm tra có đa cộng tuyến (multicollinearity) giữa các biến sympathy, anger, efficacy hay không?

tương quan là 0.284< 0.05 Ta sẽ nhìn vào hệ số tương quan Pearson (Pearson Correlation), giá trị này là -0.12 > 0.5 Như vậy cặp biến độc lập này có mối tương quan tuyến tính rất yếu Chúng ta nhận xét: Không xảy ra đa cộng tuyến giữa cặp biến này.

Tương tự như vậy với cặp biến độc lập Anger và Efficacy có giá trị Sig tương quan là 0.818 > 0.05 Ta sẽ nhìn vào hệ số tương quan Pearson (Pearson Correlation), giá trị này là -0.026 > 0.5 Như vậy cặp biến độc lập này có mối tương quan tuyến tính rất yếu Chúng ta nhận xét: Không xảy ra đa cộng tuyến giữa cặp biến này.

Đối với cặp biến độc lập Eficacy và Sympathy có giá trị Sig tương quan là 0.195 < 0.05 Ta sẽ nhìn vào hệ số tương quan Pearson (Pearson Correlation), giá trị này là 0.145 < 0.5 Như vậy cặp biến độc lập này có mối tương quan tuyến tính rất yếu Chúng ta nhận xét: Không xảy ra đa cộng tuyến giữa cặp biến này.

 Kết luận : Không xảy ra đa cộng tuyến giữa các biến

Câu 9: Sử dụng hồi quy tuyến tính bội (multiple linear regression), phân tích tác động của các biến sympathy, anger, efficacy lên biến zhelp.

Correlations

sympathy anger efficacy sympathy Pearson Correlation 1 -.120 145

anger Pearson Correlation -.120 1 -.026

efficacy Pearson Correlation 145 -.026 1

Sig (2-tailed) 195 818

Trang 10

ANOVA a

Squares

Square

a Dependent Variable: zhelp

b Predictors: (Constant), anger, efficacy, sympathy

Bảng Anova trên cho ta kết quả kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi quy Giá trị Sig kiểm định F bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp

Coefficients a

Coefficients

Standardized Coefficients

t Sig Collinearity

Statistics

Error

ce

VIF

a Dependent Variable: zhelp

Trong bảng phân tích ở trên, bảng Coefficients cho chúng ta kết quả kiểm định t để đánh giá giả thuyết ý nghĩa hệ số hồi quy, chỉ số VIF đánh giá đa cộng tuyến và các hệ số hồi quy

Biến Sympathy có giá trị Sig kiểm định t bằng 0.000 < 0.05 , do đó biến này có ý nghĩa trong mô hình hồi quy, nói cách khác, biến này có sự tác động tích cực lên biến phụ thuộc Zhelp

Biến Efficacy có giá trị Sig kiểm định t bằng 0.002 < 0.05 , do đó biến này có ý nghĩa trong mô hình hồi quy, nói cách khác, biến này có sự tác động tích cực lên biến phụ thuộc Zhelp.

Biến Anger có giá trị Sig kiểm định t bằng 0.001 < 0.05 , do đó biến này có ý nghĩa trong mô hình hồi quy, nói cách khác, biến này có sự tác động tích cực lên biến phụ thuộc Zhelp.

Hệ số hồi quy các biến độc lập này đều mang dấu dương, như vậy các biến độc lập có tác động thuận chiều lên biến phụ thuộc Nói cách khác các biến độc lập đều có tác động tích cực lên biến phụ thuộc là biến Zhelp.

Trang 11

Hệ số phóng đại phương sai (VIF) là một chỉ số đánh giá hiện tượng cộng tuyến trong mô

hình hồi quy VIF càng nhỏ, càng ít khả năng xảy ra đa cộng tuyến Dựa vào bảng phân tích trên ta thấy:

Hệ số VIF của biến Sympathy là 1.036

Hệ số VIF của biến Efficacy là 1.022

Hệ số của biến Anger là 1.015

Các hệ số của các biến độc lập này đều ở mức thấp, thậm chí nhỏ hơn 2, vì vậy các giả định không vi phạm đến đa cộng tuyến

 Không xảy ra đa cộng tuyến

Câu 10: Mã hóa lại biến gender với (Female = 1, Male = 0) Tạo biến tương tác (interaction variable) giữa gender và sympathy Phân tích tác động điều tiết (moderating effect) của gender lên mối quan hệ giữa sympathy và zhelp.

Coefficients a

Model Unstandardized Coefficients Standardized

Coefficients

1 (Constant

)

-2.986 1.642 -1.819 073

Interactio n

-.086 220 -.196 -.390 697

a Dependent Variable: zhelp

Biến tương tác : Interaction = Gender * Sympathy

Ngày đăng: 02/03/2024, 22:04

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w