2.4.1 Biến đại diện
Sau khi thực hiện xong phân tích nhân tố khám phá. Để tiến hành phân tích tương quan Peason và hồi quy, chúng ta cần tạo các biến đại diện từ kết quả xoay nhân tố. Tại giao diện SPSS, vào Transform → Compute Variable:
20
Target Variable: Nhập tên biến đại diện mới là ĐC.
Numeric Expression: Gõ hàm trung bình MEAN(ĐC1,ĐC2,ĐC3,ĐC4). Nghĩa là tạo biến đại diện ĐC là trung bình cộng của các biến quan sát ĐC1, ĐC2, ĐC3, ĐC4. Làm tương tự để tạo biến đại diện HA, TĐ, CT, QĐ
2.4.1 Tương quan Pearson 2.4.1.1 Mục đích: 2.4.1.1 Mục đích:
Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập và sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau.
2.4.1.2 Tiêu chí đánh giá
- Pearson Correlation là hệ số tương quan Pearson (r) có giá trị dao động trong khoảng liên tục từ -1 đến +1.
• r = 0: Hai biến không có tương quan tuyến tính.
21
• r < 0: Hệ số tương quan âm. • r > 0: Hệ số tương quan dương.
- Sig. (2-tailed) là giá trị sig của kiểm định t đánh giá hệ số tương quan Pearson có ý nghĩa thống kê hay không:
• Sig.<0.05 ta có thể kết luận được là hai biến có tương quan với nhau. Hệ số tương quan càng lớn tương quan càng chặt. Khi sig nhỏ hơn 0.05 thì chỗ hệ số tương quan Pearson chúng ta sẽ thấy ký hiệu * hoặc **. Ký hiệu ** cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 99% (tương ứng mức ý nghĩa 1% = 0.01). Ký hiệu * cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 95% (tương ứng mức ý nghĩa 5% = 0.05) • Sig.>0.05 thì hai biến không có tương quan với nhau.
2.4.1.3 Thao tác:
Giả thuyết H0: hệ số tương quan bằng 0.
Vào menu Analyze → Correlate → Bivariate
22
2.4.1.4 Kết quả kiểm định
Bảng 2.20: Kết quả tương quan được thể hiện trong bảng Correlations
Nguồn: Kết quả phân tích dữ liệu nghiên cứu chính thức bằng SPSS của nhóm
Kiểm định tương quan các biến đại diện:
- Biến phụ thuộc: P_QĐ: Quyết định địa điểm du lịch - Biến độc lập:
• CT: Yếu tố chiêu thị, ngoại cảnh • TĐ: Thái độ du lịch
• HA: Hình ảnh điểm đến • ĐC: Động cơ đi du lịch
Từ bảng trên, chúng ta có thể kết luận như sau:
- Quyết định địa điểm du lịch (P-QĐ) và Hình ảnh điểm đến (HA) có mối quan hệ tuyến tính (mức ý nghĩa 1%) có ý nghĩa thống kê (sig.=0.000<0.05). Hướng của mối quan hệ này là tích cực, các biến này có xu hướng tăng cùng nhau (r=.210>0) - Quyết định địa điểm du lịch (P-QĐ) và Thái độ du lịch (TĐ) có mối quan hệ tuyến tính (mức ý nghĩa 1%) có ý nghĩa thống kê (sig.=0.000<0.05). Hướng của mối quan hệ này là tích cực, các biến này có xu hướng tăng cùng nhau (r =.374>0)
P_QĐ HA TĐ ĐC CT Pearson Correlation 1 .210** .374** .460** .315** Sig. (2-tailed) 0.010 0.000 0.000 0.000 N 150 150 150 150 150 Pearson Correlation .210** 1 .297** .395** 0.062 Sig. (2-tailed) 0.010 0.000 0.000 0.450 N 150 150 150 150 150 Pearson Correlation .374** .297** 1 .337** .465** Sig. (2-tailed) 0.000 0.000 0.000 0.000 N 150 150 150 150 150 Pearson Correlation .460** .395** .337** 1 .214** Sig. (2-tailed) 0.000 0.000 0.000 0.009 N 150 150 150 150 150 Pearson Correlation .315** 0.062 .465** .214** 1 Sig. (2-tailed) 0.000 0.450 0.000 0.009 N 150 150 150 150 150 CT
**. Correlation is significant at the 0.01 level (2-tailed).
Correlations
P_QĐ
HA
TĐ
23
- Quyết định địa điểm du lịch (P-QĐ) và Động cơ đi du lịch (ĐC) có mối quan hệ tuyến tính (mức ý nghĩa 1%) có ý nghĩa thống kê (sig.=0.000<0.05). Hướng của mối quan hệ này là tích cực, các biến này có xu hướng tăng cùng nhau (r=.460>0) - Quyết định địa điểm du lịch (P-QĐ) và Yếu tố chiêu thị, ngoại cảnh (CT) có mối quan hệ tuyến tính (mức ý nghĩa 1%) có ý nghĩa thống kê (sig.=0.000<0.05). Hướng của mối quan hệ này là tích cực, các biến này có xu hướng tăng cùng nhau (r =.315>0)
Kết luận:
Biến phụ thuộc Quyết định địa điểm du lịch (P-QĐ) và các biến độc lập Hình ảnh điểm đến (HA), Thái độ du lịch (TĐ), Động cơ đi du lịch (ĐC), Yếu tố chiêu thị, ngoại cảnh (CT) có mối quan hệ tuyến tính có ý nghĩa thống kê. Các cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 99% (tương ứng mức ý nghĩa 1% = 0.01). Hướng của mối quan hệ này là tích cực, các biến này có xu hướng tăng cùng nhau.
2.4.2 Hồi quy tuyến tính
2.4.2.1 Mục đích:
Phân tích hồi quy tuyến tính là một phương pháp phân tích quan hệ giữa biến phụ thuộc Y với một hay nhiều biến độc lập X.
Cụ thể trong nghiên cứu này, ta sẽ phân tích quan hệ giữa biến phụ thuộc P-QĐ với các biến độc lập HA, TĐ, ĐC, CT.
2.4.2.2. Tiêu chí đánh giá
Trong bảng Model Summary, cần quan tâm 2 giá trị: Adjusted R Square và Durbin- Watson.
- Adjusted R Square hay còn gọi là R bình phương hiệu chỉnh phản ánh mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc.
- Hệ số Durbin – Watson, nếu các phần sai số không có tương quan chuỗi bậc nhất với nhau thì giá trị sẽ gần bằng 2 (từ 1 đến 3); nếu giá trị càng nhỏ, gần về 0 thì
24
các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là các phần sai số có tương quan nghịch.
- Ở bảng ANOVA, giá trị sig. của kiểm định F < 0.05 có ý nghĩa: mô hình hồi quy tuyến tính xây dựng được phù hợp với tổng thể.
- Ở bảng Coefficients, ta xét:
o Giá trị ở cột Sig. ≤ 0.05 thì biến đó sẽ có ý nghĩa trong mô hình, ngược lại thì biến đó sẽ bị loại bỏ khỏi mô hình.
o Hệ số hồi quy chuẩn hóa Beta, trong tất cả các hệ số hồi quy, biến độc lập nào có Beta lớn nhất thì biến đó ảnh hưởng nhiều nhất đến sự thay đổi của biến phụ thuộc.
o Giá trị VIF, VIF < 2 sẽ không có đa cộng tuyến, trường hợp hệ số này lớn hơn hoặc bằng 2, khả năng cao đang có sự đa cộng tuyến giữa các biến độc lập.
25
Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Indenpendents
Vào mục Statistics, tích chọn các mục như trong ảnh và click Continue
Vào mục Plots, tích chọn các mục như trong ảnh và click Continue → Chọn OK
2.4.2.3 Kết quả nghiên cứu
Bảng 2.21: Bảng Model Summary
R R2 R2 hiệu chỉnh Độ lệch chuẩn Durbin-Watson
0.533a 0.284 0.264 0.54578 1.867
Nguồn: Kết quả phân tích dữ liệu nghiên cứu chính thức bằng SPSS của nhóm
- R hiệu chỉnh = 0.264, nghĩa là 4 biến độc lập đưa vào ảnh hưởng 26.4% sự thay đổi của biến phụ thuộc, còn lại 73.6% là do các biến ngoài mô hình và sai số ngẫu nhiên.
- Trong bảng trên DW=1.867 nằm trong giới hạn cho phép [1;3] nên không xảy ra hiện tượng tương quan chuỗi và nhóm có thể sử dụng kết quả của mô hình hồi quy cho những phân tích tiếp theo.
26 Bảng 2.22: Bảng ANOVA Tổng bình phương Số bậc tự do Bình phương trung bình Giá trị kiểm định F Sig. Hồi quy 17.142 4 4.285 14.387 0.000 Phần dư 43.191 145 0.298 Tổng cộng 60.333 149
Nguồn: Kết quả phân tích dữ liệu nghiên cứu chính thức bằng SPSS của nhóm
Trong bảng ANOVA, cần quan tâm giá trị sig.
Giá trị sig của kiểm định F là 0.000 < 0.05. Như vậy, mô hình hồi quy tuyến tính xây dựng được phù hợp với tổng thể.
Bảng 2.23: Bảng Coefficients
Hệ số chưa chuẩn hóa Hệ số đã chuẩn hóa T Sig. Thống kê cộng gộp B Độ lệch chuẩn Beta Độ chấp nhận VIF Hằng số 1.012 0.456 2.221 0.028 HA 0.004 0.087 0.004 0.045 0.964 0.803 1.246 TĐ 0.183 0.087 0.178 2.106 0.037 0.689 1.450 ĐC 0.446 0.097 0.366 4.603 0.000 0.783 1.278 CT 0.140 0.073 0.154 1.921 0.057 0.769 1.300
Nguồn: Kết quả phân tích dữ liệu nghiên cứu chính thức bằng SPSS của nhóm
Trong bảng Coefficients, chú ý cột Hệ số hồi quy chuẩn hóa Beta, cột giá trị Sig, cột VIF.
- Beta: Biến độc lập nào có Beta lớn nhất thì biến đó ảnh hưởng nhiều nhất đến sự thay đổi của biến phụ thuộc. Xếp theo thứ tự ảnh hưởng: ĐC>TĐ>CT>HA - Giá trị Sig kiểm định t từng biến độc lập
• Sig. của các biến độc lập TĐ, ĐC nhỏ hơn 0.05 => các biến này có ý nghĩa trong mô hình, giải thích cho biến phụ thuộc, không bị loại bỏ.
• Sig. của biến độc lập HA, CT lớn hơn 0.05 => biến độc lập này cần được loại bỏ.
27
Hình 2.1: Biểu đồ tần số phần dư chuẩn hoá Histogram
Từ biểu đồ ta thấy được, một đường cong phân phối chuẩn được đặt chồng lên biểu đồ tần số. Đường cong này có dạng hình chuông, phù hợp với dạng đồ thị của phân phối chuẩn. Giá trị trung bình Mean gần bằng 0, độ lệch chuẩn là 0.976 gần bằng 1, như vậy có thể nói phân phối phần dư xấp xỉ chuẩn. Do đó, có thể kết luận rằng: Giả thiết phân phối chuẩn của phần dư không bị vi phạm.
Hình 2.2: Biểu đồ phần dư chuẩn hoá Normal P-P Plot
Các điểm phân vị trong phân phối của phần dư tập trung thành 1 đường chéo, như vậy, giả định phân phối chuẩn của phần dư không bị vi phạm.
28
Hình 2.3: Biểu đồ phân tán Scatter Plot
Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem, dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không.
Giá trị phần dư chuẩn hóa (Standardized Residual) ở trục hoành và giá trị dự đoán chuẩn hóa (Predicted Value) ở trục tung.
Phần dư chuẩn hóa phân bổ tập trung xung quanh đường tung độ 0, do vậy giả định quan hệ tuyến tính không bị vi phạm
Hình 2.4: Mô hình hồi quy đa biến sau khi phân tích
Quyết định chọn địa điểm du lịch
Hình ảnh điểm đến Thái độ du lịch Động cơ đi du lịch
Yếu tố chiêu thị, ngoại cảnh
29
2.5 KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH TÍNH (KIỂM ĐỊNH CHI-BÌNH PHƯƠNG) ĐỊNH CHI-BÌNH PHƯƠNG)
2.5.1 Mục đích:
Kiểm định Chi-bình phương được sử dụng khi chúng ta muốn đánh giá xem liệu có mối quan hệ giữa hai biến định tính hay biến phân loại (categorical variables) trong một tập dữ liệu hay không. Cụ thể trong kiểm định này, ta sẽ kiểm định mối liên hệ giữa các biến Độ tuổi và Thu nhập của các đáp viên.
2.5.2 Tiêu chí đánh giá
Bảng Chi-square Test: Đây là bảng quan trọng nhất. Nếu giá trị Asymptotic Significance (2-sided) hàng Pearson Chi-Square nhỏ hơn 0.05. Chúng ta bác bỏ giả thuyết Ho. Nếu giá trị Sig này lớn hơn 0.05, chúng ta chấp nhận giả thuyết Ho. Kết quả Sig từ Chi-Square Test chỉ nói lên được 2 biến có mối quan hệ hay không. Nếu 2 biến này có sự liên kết với nhau thì chúng ta sẽ cần đánh giá mức độ liên kết giữa 2 biến qua giá trị Value của kiểm định Phi và Cramer's V. Kiểm định Phi xem xét mối quan hệ giữa 2 biến mà mỗi biến chỉ có 2 giá trị, nếu một trong hai biến có từ 3 giá trị trở lên chúng ta sẽ dùng kết quả của Cramer's V.
2.5.3 Thực hiện kiểm định:
- Biến Độ tuổi được chia làm các mức giá trị: • Dưới 18
• Từ 18 – dưới 25 tuổi • Từ 25 – 35 tuổi
- Biến Thu nhập được chia làm các mức giá trị: • Dưới 3 triệu
• Từ 3 - dưới 7 triệu • Từ 7 - 12 triệu • Trên 12 triệu
30
Giả thuyết Ho: Giới tính và Thu nhập không có mối quan hệ với nhau (độc lập nhau)
2.5.4 Các thao tác:
Vào Analyze → Descriptives Statistics → Crosstabs
Đưa biến Độ tuổi vào ô Row(s) và biến Thu nhập vào ô Column(s)
Chọn Statistics, tích chọn vào Chi-square và Cramer’s V → Continue
Chọn Cells, trong mục Percentages tích chọn vào Rows, Columns→ Continue → OK
31
Bảng 2.24: Bảng Crosstabulation Độ tuổi * Thu nhập hàng tháng Crosstabulation
Thu nhập hàng tháng
Total Dưới 3
triệu 3 - 6 triệu 7 - 12 triệu 12 triệu Trên
Độ tuổi Dưới 18 Số lượng 21 11 0 0 32 % within Độ tuổi 65.6% 34.4% 0.0% 0.0% 100.0% % within Thu nhập hàng
tháng 36.8% 16.4% 0.0% 0.0% 21.3% 18 -
dưới 25
Số lượng 36 42 7 0 85
% within Độ tuổi 42.4% 49.4% 8.2% 0.0% 100.0% % within Thu nhập hàng
tháng 63.2% 62.7% 46.7% 0.0% 56.7% 25 - 35
Số lượng 0 14 8 11 33
% within Độ tuổi 0.0% 42.4% 24.2% 33.3% 100.0% % within Thu nhập hàng
tháng 0.0% 20.9% 53.3% 100.0% 22.0% Tổng
Số lượng 57 67 15 11 150
% within Độ tuổi 38.0% 44.7% 10.0% 7.3% 100.0% % within Thu nhập hàng
tháng 100.0% 100.0% 100.0% 100.0% 100.0%
Nguồn: Kết quả phân tích dữ liệu nghiên cứu chính thức bằng SPSS của nhóm
Bảng Crosstabulation cho chúng ta cái nhìn sơ bộ về mối quan hệ giữa hai biến này về mặt thống kê tần số.
Bảng 2.25: Bảng Chi-Square Tests Chi-Square Tests Asymptotic Significance (2- sided) Pearson Chi-Square 0.000 Tỷ lệ Likelihood 0.000
Nguồn: Kết quả phân tích dữ liệu nghiên cứu chính thức bằng SPSS của nhóm
Cụ thể trong bảng trên, Sig.=0.000<0.05 nên ta bác bỏ giả thuyết Ho, nghĩa là Độ tuổi và Thu nhập có mối quan hệ với nhau.
Bảng 2.26: Bảng Symmetric Measures Phương pháp đối xứng
Giá trị Giá trị Sig. gần đúng Nominal by
Nominal
Phi 0.682 0.000 Cramer's V 0.482 0.000 N of Valid Cases 150
32
Cụ thể trong bảng kết quả ở trên, chúng ta đọc chỉ số Value của Cramer' V, hệ số này là 0.482 = 48.2%, như vậy 2 biến này có sự tương quan khá cao.
Hình 2.5: Biểu đồ biểu diễn kết quả theo bảng Crosstablulation
Đồ thị cột biểu diễn tần số người trả lời (số đáp viên) của mỗi giá trị của biến này khi so với biến còn lại, đây là đồ thị biểu diễn kết quả bảng Crosstablulation.
2.6 KIỂM ĐỊNH SỰ KHÁC BIỆT TRUNG BÌNH GIỮA CÁC NHÓM
Trong nhiều trường hợp chúng cần so sánh giá trị trung bình về một chỉ tiêu nghiên cứu nào đó giữa 2 hay nhiều đối tượng. Chúng ta có 2 biến tham gia trong một phép kiểm định trung bình: 1 biến định lượng để tính trung bình và 1 biến định tính có nhiều nhóm giá trị để so sánh.
- Kiểm định One-Sample T-Test nhằm mục đích so sánh trung bình (mean) của tổng thể với một giá trị cụ thể nào đó.
- Independent Sample T-Test chúng ta sẽ áp dụng kiểm định sự khác biệt trung bình với trường hợp biến định tính có 2 giá trị.
- ANOVA giúp chúng ta giải quyết trở ngại của Independent Sample T-Test. Phương pháp này giúp chúng ta so sánh trị trung bình của 3 nhóm trở lên.
2.6.1 Kiểm định One-Sample T-Test 2.6.1.1 Mục đích kiểm định 2.6.1.1 Mục đích kiểm định
Kiểm định sự khác biệt trung bình giữa các nhóm là phép kiểm định giả thuyết về trung bình của tổng thể, được dùng trong trường hợp ta muốn kiểm định giả thuyết
21 36 0 11 42 14 0 7 8 0 0 11 0 10 20 30 40 50 Dưới 18 Từ 18 - dưới 25 Từ 25 - 35 Bar chart
33
về sự bằng nhau của 2 trung bình tổng thể dựa trên 2 mẫu độc lập rút từ 2 tổng thể này, hoặc được dùng trong trường hợp ta muốn phân tích mối liên hệ giữa giá trị trung bình của một tổng thể định lượng với một giá trị cụ thể xác định. Ví dụ có sự khác nhau về sự hài lòng công việc giữa các nhân viên có mức lương khác nhau tại công ty hay không; có sự khác nhau về ý định mua hàng đối với những khách hàng có độ tuổi khác nhau hay không...
2.6.1.2 Tiêu chí đánh giá
Nhìn vào bảng, giá trị Sig. < 0.05 thì ta bác bỏ giả thuyết H0, nếu Sig. ≥ 0.05 thì ta chấp nhận giả thuyết H0.
Giá trị mean là trung bình của mức độ đồng tình của các đáp viên.