Bài tập phân tích dữ liệu
Trang 1Bài tập về xử lý dữ liệu
Giả sử chúng ta có một mô hình lý thuyết gồm 4 khái niệm lý thuyết có quan hệ với nhau: Văn hóa tổ chức (OC), hệ thống giá trị của quản trị gia (PV), thực tiển quản trị (MP), và kết quả hoạt động của công ty (P) Khái niệm văn hóa tổ chức được chia thành hai biến tiềm ẩn: OC1 và OC2 Trong đó OC1 được đo lường bằng 5 yếu tố thành phần (OC11, OC12, … , OC15); OC2 được đo lường bằng 6 yếu tố thành phần (OC21, OC22, … , OC26) Biến PV là khái niệm đơn biến được
đo lường bằng 9 yếu tố thành phần (PV1, PV2, …., PV9) Khái niệm MP được phân ra hai biến tiền ẩn: MP1 và MP2 MP1 được đo lường bằng 6 yếu tố thành phần (MP11, MP12, …., MP16) và MP2 được đo lường bằng 6 yếu tố thành phần (MP21, MP22, …., MP26) Riêng khái niệm P được đo lường bởi 6 yếu tố thành phần (P1, P2, …., P6)
Trong mô hình này, P là biến phụ thuộc và các biến OC1, OC2, PV, MP1, MP2 là biến độc lập Các biến phân loại bao gồm
• Loại hình doanh nghiệp: có bốn loại và được mã hóa từ 1 đến 4 (ký hiệu là OWN)
• Cấp bậc quản lý (POS) gồm hai bậc, trong đó quản lý cấp cao nhận giá trị là
1, quản lý cấp trung nhận giá trị là 2
• Độ tuổi quản trị gia (Age) chia thành 4 nhóm: 1, 2, 3, 4
• Kinh nghiệm quản lý (EXP) cũng được chia thành 4 bậc, từ bậc 1 đến bậc 4 Mổi bậc có khoảng cách là 5 năm
Yêu cầu:
1 Thực hiện phân tích khám phá (EFA)/phân tích nhân tố để tìm các biến mới/ hoặc giảm biến, cũng như tìm các yếu tố thành phần đo lướng biến này Sau
đó tính giá trị của các biến mới (là trung bình của các yếu tố thành phần)
2 Thực hiện kiểm tra độ tin cậy của đo lường bằng hệ số cronbach alpha
3 Thực hiện phân tích anova một chiều để tìm sự khác biệt của các biến tiềm
ẩn trong mô hình này với các tiêu thức phân loại: OWN, POS, Age, EXP.
4 Xây dựng hàm tương quan tuyến tính giữa P và các biến độc lập vừa khám phá thông qua phân tích nhân tố/EFA
5 Kiểm định các giả thuyết của hàm tương quan đa biến
BÀI LÀM
MÔ HÌNH NGHIÊN CỨU:
Trang 21 KIỂM ĐỊNH ĐỘ TIN CẬY CỦA THANG ĐO
1.1 Kết quả phân tích thang đo các thành phần OC
Bảng 1.1 Hệ số Cronbach Alpha thành phần OC1
Reliability Statistics
Cronbach's
Alpha
Cronbach's Alpha Based on Standardized Items N of Items
Corrected Total Correlation
Item-Squared Multiple Correlation
Cronbach's Alpha if Item Deleted
Trang 3Bảng 1.2 Hệ số Cronbach Alpha thành phần OC2
Reliability Statistics
Cronbach's
Alpha
Cronbach's Alpha Based on Standardized Items N of Items
Corrected Total Correlation
Item-Squared Multiple Correlation
Cronbach's Alpha if Item Deleted
1.2 Kết quả phân tích thang đo thành phần PV
Bảng 1.3 Hệ số Cronbach Alpha thành phần PV
Reliability Statistics
Trang 4Cronbach's
Alpha
Cronbach's Alpha Based on Standardized Items N of Items
Corrected Total Correlation
Item-Squared Multiple Correlation
Cronbach's Alpha if Item Deleted
1.3 Kết quả phân tích thang đo thành phần MP
Item-Total Statistics
Trang 5Scale Mean if
Item Deleted
Scale Variance if Item Deleted
Corrected Total Correlation
Item-Squared Multiple Correlation
Cronbach's Alpha if Item Deleted
Bảng 1.5 Hệ số Cronbach Alpha của thành phần MP2
Reliability Statistics
Cronbach's
Alpha
Cronbach's Alpha Based on Standardized Items N of Items
Corrected Total Correlation
Item-Squared Multiple Correlation
Cronbach's Alpha if Item Deleted
Trang 6Corrected Total Correlation
Item-Squared Multiple Correlation
Cronbach's Alpha if Item Deleted
Nhìn chung, hệ số Cronbach Alpha các thành phần đều lớn hơn 0.6 Chỉ thành phần OC2
có Cronbach Alpha < 0.6 nên bị loại và các biến: PV4, PV3, PV9, MP14 cũng bị loại khỏi thang
đo vì có hệ số tương quan biến tổng < 0.3
2 ĐÁNH GIÁ THANG ĐO BẰNG PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA
Sau khi kiểm tra mức độ tin cậy Cronbach Alpha, tất cả các biến đạt yêu cầu được đưa vào phân tích EFA, được sử dụng để đánh giá lại mức độ hội tụ theo các thành phần
2.1 Thang đo các thành phần OC1, PV, MP1, MP2
KMO and Bartlett's Test
Trang 7Kaiser-Meyer-Olkin Measure of Sampling Adequacy .904
Bartlett's Test of Sphericity Approx Chi-Square 5.922E3
Cumulative
% Total
% of Variance
Cumulative
% Total
% of Variance Cumulative %
1 6.352E0 27.618 27.618 6.352E0 27.618 27.618 3.813E0 16.577 16.577
2 2.032E0 8.836 36.454 2.032E0 8.836 36.454 3.208E0 13.949 30.526
3 1.431E0 6.223 42.677 1.431E0 6.223 42.677 2.609E0 11.346 41.871
4 1.141E0 4.963 47.640 1.141E0 4.963 47.640 1.327E0 5.768 47.640
Trang 8Total Variance Explained
Cumulative
% Total
% of Variance
Cumulative
% Total
% of Variance Cumulative %
1 6.352E0 27.618 27.618 6.352E0 27.618 27.618 3.813E0 16.577 16.577
2 2.032E0 8.836 36.454 2.032E0 8.836 36.454 3.208E0 13.949 30.526
3 1.431E0 6.223 42.677 1.431E0 6.223 42.677 2.609E0 11.346 41.871
4 1.141E0 4.963 47.640 1.141E0 4.963 47.640 1.327E0 5.768 47.640
Extraction Method: Principal Component Analysis.
Rotated Component Matrix a
Component
Trang 9Sau khi loại bỏ PV1 không đạt yêu cầu, tiến hàng phân tích EFA lần 2.
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .908
Trang 10Bartlett's Test of Sphericity Approx Chi-Square 5.688E3
< 0.5 nên ta loại ra khỏi thang đo
Dựa vào bảng Total Variance Explained tổng phương sai trích lúc này của 4 nhân tố có
Eigenvalues lớn hơn 1 là 50.416% lớn hơn 50% cho thấy phương sai trích đạt chuẩn Với tổng phương sai trích 50.416% cho biết 4 nhân tố này giải thích được 50.416% biến thiên của dữ liệu
Trang 11Sau khi loại bỏ biến không đạt yêu cầu (MP16) Ta phân tích EFA lần 3:
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .906
Bartlett's Test of Sphericity Approx Chi-Square 5.333E3
% of Variance
Cumulative
% Total
% of Variance
Cumulative
% Total
% of Variance
Trang 12Total Variance Explained
% of Variance
Cumulative
% Total
% of Variance
Cumulative
% Total
% of Variance
Trang 13Total Variance Explained
% of Variance
Cumulative
% Total
% of Variance
Cumulative
% Total
% of Variance
Trang 14Total Variance Explained
% of Variance
Cumulative
% Total
% of Variance
Cumulative
% Total
% of Variance
Dựa vào bảng Total Variance Explained tổng phương sai trích lúc này của 4 nhân tố có
Eigenvalues lớn hơn 1 là 51.397% lớn hơn 50% cho thấy phương sai trích đạt chuẩn Với tổng phương sai trích 51.397% cho biết 4 nhân tố này giải thích được 51.397% biến thiên của dữ liệu
Trang 15• Tóm lại sau khi phân tích EFA các thành phần OC1, PV, MP1, MP2 ta có được 4 nhóm:
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .847
Bartlett's Test of Sphericity Approx Chi-Square 1.959E3
Trang 16Kiểm định KMO và Bartlett’s trong phân tích EFA cho thấy chỉ số KMO (0.847 > 0.5) là khá cao và với mức ý nghĩa bằng 0 (sig = 000) cho thấy phân tích EFA rất thích hợp.
Tại mức giá trị Eigenvalues lớn hơn 1 và phương pháp rút trích Principal components và phép quay varimax, phân tích nhân tố trích được 1 nhân tố Hệ số tải của các biến khá cao đều lớn hơn 0.5 Với phương sai trích 55.022% lớn hơn 50% nên đạt yêu cầu, cho biết nhân tố này giải thích được 55.022% biến thiên của dữ liệu
3 TÍNH GIÁ TRỊ CỦA CÁC BIẾN MỚI
Từ bảng Statistic trên theo đánh giá của 953 mẫu phỏng vấn thì thành phần P có giá trị
trung bình 3,72; MP1 có giá trị trung bình 3,8; MP2 có giá trị trung bình 3,46; thành phần OC có giá trị trung bình 4,02; thành phần PV có giá trị trung bình 4.12
4 PHÂN TÍCH ANOVA MỘT CHIỀU ĐỂ TÌM SỰ KHÁC BIỆT CỦA CÁC BIẾN TIỀM ẨN TRONG MÔ HÌNH NÀY VỚI TIÊU THỨC PHÂN LOẠI: OWN, POS, Age, EXP
4.1 Khác biệt với tiêu thức phân loại OWN:
4.1.1 Sự khác biệt về OC giữa các nhóm theo tiêu thức phân loại OWN:
Test of Homogeneity of Variances
OC
Trang 17Levene Statistic df1 df2 Sig.
Sau khi kiểm định ANOVA ta thấy phương sai của sự đánh giá khác nhau về OC giữa các nhóm theo tiêu chí phân loại OWN Sig của thống kê Levene = 0.000 (<0.05) nên ở độ tin cậy 95% , phương sai của sự đánh giá OC giữa các nhóm là khác nhau Trong trường hợp phương sai khác nhau ta không thể sử dụng kết quả của bảng ANOVA để đưa ra kết luận kiểm định về giá trị trung bình vì bảng ANOVA chỉ dùng khi phương sai bằng nhau
Vì vậy trong trường hợp phương sai khác nhau này ta sử dụng thống kê Tamhane’s T2 trong kiểm định Post Hoc để đưa ra kết luận kiểm định trong sự bằng nhau của giá trị trung bình (có thể biết chi tiết giữa những cặp nào có sự khác biệt về giá trị trung bình)
95% Confidence Interval Lower Bound Upper Bound
Theo bảng kết quả trên khi so sánh sự đánh giá về OC giữa các nhóm theo tiêu chí OWN,
ta thấy tất cả các giá trị Sig > 0.05 nên có thể kết luận không có sự khác biệt giữa các nhóm.
4.1.2 Sự khác biệt về PV giữa các nhóm theo tiêu thức phân loại OWN
Trang 18Test of Homogeneity of Variances
Với độ tin cậy của kiểm định là 95% thì Sig = 0.589 > 0.05 Ta có thể kết luận rằng
không có sự khác biệt trong đánh giá về PV giữa các nhóm theo tiêu chí phân loại OWN.
4.1.3 Sự khác biệt về MP1 giữa các nhóm theo tiêu thức phân loại OWN:
Test of Homogeneity of Variances
sử dụng kết quả của bảng ANOVA để đưa ra kết luận kiểm định về giá trị trung bình
Sử dụng thống kê Tamhane’s T2 trong kiểm định Post Hoc để đưa ra kết luận kiểm định trong sự khác biệt giữa các nhóm
Post Hoc
Multiple Comparisons
MP1
Trang 1995% Confidence Interval Lower Bound Upper Bound
Theo bảng kết quả trên khi so sánh sự đánh giá về MP1 giữa các nhóm theo tiêu chí
OWN, ta thấy tất cả các giá trị Sig > 0.05 nên có thể kết luận không có sự khác biệt giữa các
nhóm
4.1.4 Sự khác biệt về MP2 giữa các nhóm theo tiêu thức phân loại OWN
Test of Homogeneity of Variances
để đưa ra kết luận kiểm định về giá trị trung bình
Trang 20Với độ tin cậy của kiểm định là 95% thì Sig = 0.000 < 0.05 Ta có thể kết luận rằng có
sự khác biệt trong đánh giá về MP2 giữa các nhóm theo tiêu chí phân loại OWN.
4.1.5 Sự khác biệt về P giữa các nhóm theo tiêu thức phân loại OWN
Test of Homogeneity of Variances
Với độ tin cậy của kiểm định là 95% thì Sig = 0.001 < 0.05 Ta có thể kết luận rằng có
sự khác biệt trong đánh giá về P giữa các nhóm theo tiêu chí phân loại OWN.
4.2 Sự khác biệt với tiêu thức phân loại POS
Test of Homogeneity of Variances
Ta sử dụng kiểm định Post Hoc để đưa ra kết luận, nhưng do POS chỉ có 2 nhóm nên không thể kiểm định Post Hoc
Warnings
Post hoc tests are not performed for OC because there are fewer than three groups.
Trang 21Với trường hợp này ta có thể kiểm định Independent-samples T-test để tìm hiểu sự khác biệt giữa hai nhóm này.
Independent Samples Test
Levene's Test for Equality of Variances t-test for Equality of Means
Sig tailed)
(2-Mean Difference
Std Error Difference
95% Confidence Interval of the Difference Lower Upper
Sig của thống kê Levene = 0.004 (<0.05) nên ở độ tin cậy 95% , phương sai của sự đánh
giá P giữa các nhóm là khác nhau, do đó ta sử dụng giá trị sig (2 tailed) ở phần Equal variances
not assumed = 0.000 < 0.05 Ta có thể kết luận có sự khác nhau trong đánh giá về OC giữa các
nhóm theo tiêu chí phân loại POS
Test of Homogeneity of Variances
Trang 22Với độ tin cậy của kiểm định là 95% thì Sig = 0.108 > 0.05 Ta có thể kết luận
rằng không có sự khác nhau trong đánh giá về PV giữa các nhóm theo tiêu chí phân loại POS.
Test of Homogeneity of Variances
Với độ tin cậy của kiểm định là 95% thì Sig = 0.310 > 0.05 Ta có thể kết luận rằng
không có sự khác nhau trong đánh giá về MP1 giữa các nhóm theo tiêu chí phân loại POS
Test of Homogeneity of Variances
Ta sử dụng kiểm định Post Hoc để đưa ra kết luận, nhưng do POS chỉ có 2 nhóm nên không thể kiểm định Post Hoc
Warnings
Post hoc tests are not performed for OC because there are fewer than three groups.
Với trường hợp này ta có thể kiểm định Independent-samples T-test để tìm hiểu sự khác
biệt giữa hai nhóm này
Trang 23Independent Samples Test
Levene's Test for Equality of Variances t-test for Equality of Means
Sig tailed)
(2-Mean Difference
Std Error Difference
95% Confidence Interval of the Difference Lower Upper MP2 Equal variances
assumed 4.452 .035 4.089 945 .000 .28199 .06897 .14664 .41733Equal variances
not assumed 4.543 3.006E2 .000 .28199 .06208 .15983 .40415
Sig của thống kê Levene = 0.035 (<0.05) nên ở độ tin cậy 95% , phương sai của sự đánh
giá P giữa các nhóm là khác nhau, do đó ta sử dụng giá trị sig (2 tailed) ở phần Equal variances
not assumed = 0.000 < 0.05 Ta có thể kết luận có sự khác nhau trong đánh giá về MP2 giữa
các nhóm theo tiêu chí phân loại POS
Test of Homogeneity of Variances
Với độ tin cậy của kiểm định là 95% thì Sig = 0.001 < 0.05 Ta có thể kết luận rằng có
sự khác nhau trong đánh giá về P giữa các nhóm theo tiêu chí phân loại POS
4.3 Sự khác biệt với tiêu thức phân loại AGE
Trang 244.3.1 Sự khác biệt về OC giữa các nhóm theo tiêu thức phân loại AGE
Test of Homogeneity of Variances
OC
Levene Statistic df1 df2 Sig.
a Groups with only one case are ignored in computing
the test of homogeneity of variance for OC.
Phương sai của sự đánh giá khác nhau về OC giữa các nhóm theo tiêu chí phân loại AGE Sig của thống kê Levene = 0.592 (>0.05) nên ở độ tin cậy 95% , phương sai của sự đánh giá OC giữa các nhóm là không khác nhau Do đó, ta có thể dùng kết quả bảng ANOVA để đưa ra kết luận kiểm định
Với độ tin cậy của kiểm định là 95% thì Sig = 0.057 > 0.05 Ta có thể kết luận rằng
không có sự khác nhau trong đánh giá về OC giữa các nhóm theo tiêu chí phân loại AGE.
Test of Homogeneity of Variances
PV
Levene Statistic df1 df2 Sig.
a Groups with only one case are ignored in computing
the test of homogeneity of variance for PV.
Phương sai của sự đánh giá khác nhau về PV giữa các nhóm theo tiêu chí phân loại AGE Sig của thống kê Levene = 0.679 (>0.05) nên ở độ tin cậy 95% , phương sai của sự đánh giá PV giữa các nhóm là không khác nhau Do đó, ta có thể dùng kết quả bảng ANOVA để đưa ra kết luận kiểm định
ANOVA
PV
Trang 25Sum of Squares df Mean Square F Sig.
Within Groups 426.752 942 453
Với độ tin cậy của kiểm định là 95% thì Sig = 0.595 > 0.05 Ta có thể kết luận
rằng không có sự khác nhau trong đánh giá về PV giữa các nhóm theo tiêu chí phân loại AGE.
Test of Homogeneity of Variances
MP1
Levene Statistic df1 df2 Sig.
a Groups with only one case are ignored in computing
the test of homogeneity of variance for MP1.
Phương sai của sự đánh giá khác nhau về MP1 giữa các nhóm theo tiêu chí phân loại AGE Sig của thống kê Levene = 0.152 (>0.05) nên ở độ tin cậy 95% , phương sai của sự đánh giá MP1 giữa các nhóm là không khác nhau Do đó, ta có thể dùng kết quả bảng ANOVA để đưa
Với độ tin cậy của kiểm định là 95% thì Sig = 0.024 < 0.05 Ta có thể kết luận rằng có
sự khác nhau trong đánh giá về PV giữa các nhóm theo tiêu chí phân loại AGE.
Test of Homogeneity of Variances
Trang 26Với độ tin cậy của kiểm định là 95% thì Sig = 0.085 > 0.05 Ta có thể kết luận rằng
không có sự khác nhau trong đánh giá về PV giữa các nhóm theo tiêu chí phân loại AGE.
Test of Homogeneity of Variances
Ta sử dụng kiểm định Post Hoc để đưa ra kết luận, nhưng do AGE có 1 nhóm ít hớn 2 cases
Asymp Sig .006
a Kruskal Wallis Test
b Grouping Variable: AGE