Phân tích tương quan Pearson là một trong các bước tác giả thực hiện trong bài nghiên cứu sử dụng phân tích định lượng SPSS. Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập và sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau.
Các tiêu chí đánh giá tương quan Pearson:
Tương quan Pearson r có giá trị dao động từ -1 đến 1 (lưu ý, hệ số r chỉ có ý nghĩa khi sig nhỏ hơn 0,05):
• Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về -1 là tương quan âm.
• Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.
• Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng.
• Nếu r = 0: không có mối tương quan tuyến tính. Lúc này sẽ có 2 tình huống xảy ra. Một, không có một mối liên hệ nào giữa 2 biến. Hai, giữa chúng có mối liên hệ phi tuyến.
Xem bảng 4.21 phụ lục 6 (phân tích tương quan Pearson), kết quả cho thấy tất cả các giá trị sig tương quan Pearson giữa các biến độc lập với biến phụ thuộc đều nhỏ hơn 0,05. Như vậy các biến độc lập đều có tương quan tuyến tính với biến phụ thuộc. Thêm nữa, các giá trị Pearson Correlation (r) đều >0 và tiến dần về 1 chứng tỏ các biến độc lập có mối quan hệ tương quan dương với biến phụ thuộc (SAT).
4.4.2 Phân tích hồi quy đa biến và kiểm định các giả thuyết
Phương trình hồi quy bội : Y = β 0 + β 1X1 + β 2X2 + … + βnXn + ε
Trong đó:
• Y: biến phụ thuộc
• X, X1, X2, Xn: biến độc lập • β 0: hằng số hồi quy • β 1, β 2, β n: hệ số hồi quy
• ε: phần dư Trong đó:
• Y: biến phụ thuộc, là biến chịu tác động của biến khác. • X, X1, X2, Xn: biến độc lập, là biến tác động lên biến khác.
• β 0: hằng số hồi quy, hay còn được gọi là hệ số chặn. Đây là chỉ số nói lên giá trị của Y sẽ là bao nhiêu nếu tất cả X cùng bằng 0. Nói cách khác, chỉ số này cho chúng ta biết giá trị của Y là bao nhiêu nếu không có các X. Khi biểu diễn trên đồ thị Oxy, β0 là điểm trên trục Oy mà đường hồi quy cắt qua.
• β1, β2, βn: hệ số hồi quy, hay còn được gọi là hệ số góc. Chỉ số này cho chúng ta biết về mức thay đổi của Y gây ra bởi X tương ứng. Nói cách khác, chỉ số này nói lên có bao nhiêu đơn vị Y sẽ thay đổi nếu X tăng hoặc giảm một đơn vị.
• e: sai số. Chỉ số này càng lớn càng khiến cho khả năng dự đoán của hồi quy trở nên kém chính xác hơn hoặc sai lệch nhiều hơn so với thực tế. Sai số trong hồi quy tổng thể hay phần dư trong hồi quy mẫu đại diện cho hai giá trị, một là các biến độc lập ngoài mô hình, hai là các sai số ngẫu nhiên.
Hệ số tương quan Pearson được tính toán để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng tuy nhiên không cho biết chính xác mức độ tác động của mỗi biến độc lập trên biến phụ thuộc, mức độ tác động mạnh yếu so sánh giữa các biến phụ thuộc với biến độc lập. Do đó tác giả tiến hành phân tích mô hình hồi quy đa biến để làm rõ hơn vấn đề này.
Kiểm định sự phù hợp mô hình:
Bảng 4.22: ANOVA ANOVAa
Model Sum of Squares df Mean Square F Sig. 1 Regression 68.087 8 8.511 89.960 .000b
Residual 29.328 310 .095
Total 97.415 318
a. Dependent Variable: SAT
b. Predictors: (Constant), AIR, INF, SAF, RES, SCH, POS, PRI, GRO
Giả thuyết:
H0: Tập hợp các biến độc lập không có mối liên hệ với biến phụ thuộc (βi = 0) H1: Tập hợp các biến độc lập có mối liên hệ với biến phụ thuộc (βi ≠ 0)
Kết quả phân tích ANOVA cho thấy giá trị kiểm định F = 89,960 có ý nghĩa thống kê vì Sig = 0,000 < 0,05. Do đó ta bác bỏ giả thuyết H0 nghĩa là các biến độc lập có liên hệ với biến phụ thuộc. Vì thế, mô hình hồi quy là phù hợp với dữ liệu nghiên cứu.
Mức độ giải thích của mô hình:
Bảng 4.23: Model Summary Model Summaryb
Std. Error of the
Model R R Square Adjusted R Square Estimate Durbin-Watson
1 .836a .699 .691 .30758 2.062
a. Predictors: (Constant), AIR, INF, SAF, RES, SCH, POS, PRI, GRO b. Dependent Variable: SAT
Nguồn: Kết quả xử lý SPSS
Ở kết quả phân tích Model Summary, R bình phương hiệu chỉnh là 0,691 = 69.1%. Như vậy các biến độc lập đưa vào chạy hồi quy ảnh hưởng tới 69,1% sự thay đổi của biến phụ thuộc (SAT), hay nói cách khác 69,1 % sự hài lòng dịch vụ vận chuyển hàng không nội địa trong giai đoạn Covid-19 do các biến độc lập (8 biến) (SAF, PRI,POS,INF,GRO,RES,SCH,AIR) giải thích, còn lại 30,9% là do các biến ngoài mô hình và sai số ngẫu nhiên.
Kiểm định hiện tượng đa cộng tuyến:
Bảng 4.24: Coefficients Coefficientsa
Standardized
Unstandardized Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) .109 .149 .732 .465 PRI .168 .024 .252 6.950 .000 .740 1.352 POS .171 .026 .235 6.609 .000 .766 1.306 SAF .224 .026 .295 8.452 .000 .796 1.256 INF .061 .026 .083 2.322 .021 .762 1.312 GRO .065 .029 .087 2.211 .028 .632 1.582 RES .091 .026 .134 3.472 .001 .648 1.543
SCH .149 .025 .206 5.849 .000 .783 1.278
AIR .099 .029 .126 3.372 .001 .693 1.443
a. Dependent Variable: SAT
Nguồn: Kết quả xử lý SPSS
Đa cộng tuyến là hiện tượng có sự tương quan phụ thuộc lẫn nhau giữa các biến độc lập. Khi xảy ra hiện tượng này sẽ dẫn đến các hệ số không ổn định khi thêm biến vào mô hình hồi quy.
Để phát hiện hiện tượng đa cộng tuyến, tác giả dựa vào hệ số phóng đại phương sai VIF. Theo kết quả bảng ở trên. ta thấy hệ số phóng đại phương sai VIF (Variance Inflation Factor - VIF) rất nhỏ (nhỏ hơn 10) cho thấy các biến độc lập này không có quan hệ chặt chẽ với nhau nên không có hiện tượng đa cộng tuyến xảy ra. Do đó mối quan hệ giữa các biến độc lập không ảnh hưởng đáng kể đến kết quả giải thích của mô hình hồi quy.
Vậy, với các kết quả kiểm định trên ta thấy mô hình hồi quy là phù hợp và có ý nghĩa thống kê. Ta có mô hình hồi quy với hệ số beta chưa chuẩn hóa như sau:
SAT = 0,168*PRI + 0,171 *POS + 0,224*SAF + 0,061*INF + 0,065*GRO + 0,91* RES + 0,149*SCH + 0,099*AIR + 0,109.
Để xem xét mức độ tác động hay thứ tự ảnh hưởng của các biến độc lập lên biến phụ thuộc. Dựa vào phương trình hồi quy chuẩn hóa, chúng ta sẽ biết được biến độc lập nào nào ảnh hưởng mạnh hay yếu đến biến phụ thuộc căn cứ vào hệ số hồi quy chuẩn hóa, hệ số càng lớn thì tầm quan trọng của biến độc lập đó đối với biến phụ thuộc càng lớn. Ta xét phương trình hồi quy với beta chuẩn hóa:
SAT = 0,252*PRI + 0,235 *POS + 0,295*SAF + 0,083*INF + 0,087*GRO + 0,134* RES + 0,206*SCH + 0,126*AIR.
Ta thấy: β3>β1> β2>β7>β8> β6> β5> β4 do đó các yếu tố tác động đến cảm nhận của khách hàng về chất lượng dịch vụ vận chuyển hành khách đường hàng không lần lượt theo thứ tự từ mạnh nhất là: Tính an toàn trong phòng chống dịch Covid > Giá và chính sách giá > Dịch vụ sau chuyến bay > Dịch vụ trên chuyến bay > Dịch vụ tại sân bay > Dịch vụ bán vé đặt chỗ > Lịch bay và độ tin cậy của lịch bay > Chất lượng tàu bay.
Kết quả kiểm định các giả thuyết từ phân tích tương quan và phân tích hồi quy cho thấy mối quan hệ giữa các biến độc lập với biến phụ thuộc đều có ý nghĩa ở độ tin cậy là 95%.
Bảng 4.25: Kiểm định các giả thuyết nghiên cứu
Giả thuyết Hệ số hồi quy Kết quả kiểm định
H1 Tính an toàn trong phòng chống dịch có tác động thuận chiều với sự
hài lòng của hành khách sử dụng 0,295 Chấp nhận
dịch vụ vận chuyển nội địa của Vietnamairlines trong thời kỳ
Covid-19.
H2 Giá và chính sách giá có tác động thuận chiều với sự hài lòng của
hành khách sử dụng dịch vụ vận 0,252 Chấp nhận
chuyển nội địa của Vietnam Airlines trong thời kỳ Covid-19. H3 Dịch vụ sau chuyến bay có tác động
thuận chiều với sự hài lòng của
hành khách sử dụng dịch vụ vận 0,235 Chấp nhận
chuyển nội địa của Vietnam Airlines trong thời kỳ Covid-19. H4 Lịch bay và độ tin cậy của lịch bay
có tác động thuận chiều với sự hài
lòng của hành khách sử dụng dịch 0,206 Chấp nhận
vụ vận chuyển nội địa của Vietnam Airlines trong thời kỳ Covid-19. H5 Chất lượng tàu bay có tác động
thuận chiều với sự hài lòng của 0,126 Chấp nhận
chuyển nội địa của Vietnam Airlines trong thời kỳ Covid-19. H6 Dịch vụ bán vé đặt chỗ có tác động
thuận chiều với sự hài lòng của
hành khách sử dụng dịch vụ vận 0,134 Chấp nhận
chuyển nội địa của Vietnam Airlines trong thời kỳ Covid-19. H7 Dịch vụ tại sân bay có tác động thuận chiều với sự hài lòng của
hành khách sử dụng dịch vụ vận 0,087 Chấp nhận
chuyển nội địa của Vietnamairlines trong thời kỳ Covid-19. H8 Dịch vụ trên chuyến bay có tác
động thuận chiều với sự hài lòng
của hành khách sử dụng dịch vụ vận 0,083 Chấp nhận
chuyển nội địa của Vietnam Airlines trong thời kỳ Covid-19.
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
4.5 Kiểm định các vi phạm
4.5.1 Kiểm định phân phối chuẩn phần dư
Phần dư được biết có thể không tuân theo phân phối chuẩn vì những lý do sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích… Để kiểm tra phân phối chuẩn phần dư, tác giả sử dụng biểu đồ P-P plot và biểu đồ Histogram của các phần dư đã chuẩn hóa.
Hình 4.1: Biển đồ histogram kiểm định phân phối chuẩn phần dư.
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Đối với biểu đồ Histogram, giá trị trung bình Mean gần bằng 0 và độ lệch chuẩn gần bằng 1 (0,987). Đường cong phân phối có dạng hình chuông tác giả khẳng định phân phối là xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm.
Hình 4.2: Biểu đồ: P-P Plot kiểm định phân phối chuẩn phần dư.
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Đối với biểu đổ P-P Plot, các điểm phân vị trong phân phối của phần dư tập trung thành 1 đường chéo, như vậy, giả định phân phối chuẩn của phần dư không bị vi phạm.
4.5.2 Kiểm tra giả định không có sự tương quan giữa các phần dư Bảng 4.26: Kiểm định giả định không tương quan
Model Summaryb
Std. Error of the
Model R R Square Adjusted R Square Estimate Durbin-Watson
1 .836a .699 .691 .30758 2.062
a. Predictors: (Constant), AIR, INF, SAF, RES, SCH, POS, PRI, GRO b. Dependent Variable: SAT
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Giả định này kiểm tra thông qua hệ số d (Durbin – Watson). Kiểm định Durbin Watson = 2,062 trong khoảng [1<D<3] nên không có hiện tượng tương quan của các phần dư.
4.6 Phân tích sự khác biệt theo đặc điểm nhân khẩu học
4.6.1 Sự khác biệt về sự hài lòng giữa nhóm giới tính nam và nữ
Sử dụng phương pháp chạy Independent T-Test:
Bảng 4.27: Phân tích In-sample Test Independent Samples Test
Levene's Test for Equality of
Variances t-test for Equality of Means
95% Confidence Interval of the Sig. (2- Mean Std. Error Difference
F Sig. t df tailed) Difference Difference Lower Upper
SAT Equal variances .029 .865 .119 317 .905 .00770 .06476 -.11972 .13513 assumed
Equal variances not assumed
.119 234.101 .905 .00770 .06472 -.11980 .13521
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Sig Levene’s Test bằng 0,865 >0,05. Ta sử dụng kết quả sig kiểm định t hàng Equal variances assumed. Sig kiểm định t bằng 0,905 > 0,05, như vậy không có sự khác biệt sự hài lòng giữa các đáp viên có giới tính khác nhau.
Descriptives
SAT
N Mean Std. Deviation Std. Error
95% Confidence Interval for Mean
Lower Bound Upper Bound Minimum Maximum
Nam 205 3.6524 .55483 .03875 3.5760 3.7288 1.25 5.00
Nữ 114 3.6447 .55344 .05183 3.5420 3.7474 2.00 4.75
Total 319 3.6497 .55348 .03099 3.5887 3.7107 1.25 5.00
Hình 4.3: Trung vị sự hài lòng của giới tính nam và nữ
Nguồn: Tổng hợp kết quả từ phần mềm SPSS.
Ta có thể thấy dựa vào kết quả thống kê mô tả kết quả sự hài lòng của Nam là 3,6524 trong khi đó sự hài lòng của nữ là 3,6447. Sai khác giữa hai giá trị trên là không lớn và không có nhiều sự khác biệt giữa các đáp viên có giới tính khác nhau.
4.6.2 Sự khác biệt về sự hài lòng về độ tuổi giữa các nhóm khác nhau
Bảng 4.29: Phân tích phương sai về độ tuổi giữa các nhóm khác nhau
Test of Homogeneity of Variances
Levene Statistic df1 df2 Sig.
SAT Based on Mean 1.508 4 314 .200
Based on Median 1.190 4 314 .315
Based on Median and with adjusted 1.190 4 300.890 .315
df
Based on trimmed mean 1.495 4 314 .203
Trình bày kết quả kiểm định sự bằng nhau của phương sau các nhóm. Với mức ý nghĩa Sig. = 0,200 > 0,05, cho thấy phương sai về sự hài lòng của hành khách đối với các nhóm tuổi khác nhau không có sự khác biệt.
Bảng 4.30: ANOVA ANOVA
SAT
Sum of Squares df Mean Square F Sig.
Between Groups 1.507 4 .377 1.233 .297
Within Groups 95.908 314 .305
Total 97.415 318
Nguồn: Tổng hợp kết quả từ phần mềm SPSS.
Trình bày kết quả phân tích phương sai. Mức ý nghĩa Sig. Kiểm định F = 0,297 > 0,05 cho thấy không có sự khác biệt về sự hài lòng của hành khách đối với các nhóm tuổi khác nhau.
Bảng 4.31: Phân tích đại lượng thống kê mô tả cho từng nhóm tuổi Descriptives
SAT
N Mean
95% Confidence Interval for Mean
Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
Dưới 24 50 3.7800 .51170 .07237 3.6346 3.9254 2.50 4.75 24-35 143 3.6626 .54487 .04556 3.5725 3.7527 2.25 5.00 36-50 93 3.5941 .56134 .05821 3.4785 3.7097 1.25 4.75 51-65 27 3.5370 .65671 .12638 3.2773 3.7968 2.00 4.50 Trên 65 6 3.6250 .37914 .15478 3.2271 4.0229 3.00 4.00 Total 319 3.6497 .55348 .03099 3.5887 3.7107 1.25 5.00 Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Hình 4.4: Trung vị sự hài lòng của các nhóm tuổi khác nhau
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Có thể thấy kết quả trong cột Mean biến thiên từ 3,53 – 3,78, cho thấy giữa các độ tuổi khác nhau không có sự khác biệt mấy về mức độ hài lòng đối với dịch vụ vận chuyển hành khách nội địa trong thời kỳ Covid-19.
4.6.3 Sự khác biệt về sự hài lòng giữa nhóm nghề nghiệp khác nhau
Bảng 4.32: Phân tích phương sai về nhóm nghề nghiệp Test of Homogeneity of Variances
Levene Statistic df1 df2 Sig.
SAT Based on Mean 1.908 4 314 .109
Based on Median 1.803 4 314 .128
Based on Median and with adjusted 1.803 4 303.561 .128
df
Based on trimmed mean 1.939 4 314 .104
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Trình bày kết quả kiểm định sự bằng nhau của phương sau các nhóm. Với mức ý nghĩa Sig. = 0,109 > 0,05, cho thấy phương sai về sự hài lòng của hành khách đối với các nhóm nghề nghiệp
khác nhau không có sự khác biệt.
Bảng 4.33: ANOVA ANOVA
SAT
Sum of Squares df Mean Square F Sig.
Between Groups 2.110 4 .527 1.738 .141
Within Groups 95.305 314 .304
Total 97.415 318
Nguồn: Tổng hợp kết quả từ phần mềm SPSS
Trình bày kết quả phân tích phương sai. Mức ý nghĩa Sig. Kiểm định F = 0,141 > 0,05 cho