Thông tin mẫu nghiên cứu được thu thập bằng kỹ thuật phỏng vấn trực tiếp khách hàng đã mua hàng miễn thuế ít nhất 2 lần trong thời gian 12 tháng cho đến thời điểm phỏng vấn.
Kết quả phỏng vấn thu thập sau khi đã được gạn lọc các phiếu trả lời thiếu nhiều thông tin hoặc phiếu khảo sát có cơ sở không đáng tin cậy, dữ liệu được nhập vào phần mềm SPSS 20.0 và được làm sạch hoàn toàn trước khi sử dụng dữ liệu chính thức để thống kê và phân tích.
30
3.4 PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU
Để thực hiện công việc thống kê và phân tích các dữ liệu thu thập được, phần mềm SPSS 20.0 đã được sử dụng để kiểm định độ tin cậy và độ giá trị của thang đo, các thống kê suy diễn, v.v…
3.4.1 Kiểm định độ tin cậy của thang đo
Thang đo sử dụng để đo lường các khái niệm trong nghiên cứu là các thang đo được xây dựng trong các bối cảnh nghiên cứu khác nhau trước đây. Vì vậy các thang đo này khi được áp dụng vào nghiên cứu cần được đánh giá về sự phù hợp của thang đo trong bối cảnh nghiên cứu hiện tại thông qua các kiểm định vềđộ tin cậy và độ giá trị của thang đo.
Hệ số Cronbach Alpha được dùng để đo lường độ tin cậy (tính nhất quán nội tại) của thang đo. Hệ số Cronbach Alpha có giá trị biến thiên trong khoảng [0,1]. Hệ số
Cronbach Alpha càng cao càng tốt vì thang đo sẽ có độ tin cậy cao. Tuy nhiên nếu
Cronbach Alpha quá lớn (> 0,95) cho thấy thang đo có nhiều biến không khác biệt nhau, điều này đồng nghĩa chúng cùng đo lường cùng một nội dung nào đó của khái niệm. Ngoài ra, các biến đo lường một khái niệm cũng cần có tương quan chặt chẽ với nhau. Biến đạt yêu cầu trong thang đo cần có hệ số tương quan biến tổng ≥ 0,3 và
≠1(Nunnally & Bernstein, 1994). Vì vậy, thang đo có độ tin cậy tốt khi hệ số α [0,7 - 0,8], α> 0,6 thì thang đo có thể chấp nhận được vềđộ tin cậy (Nunnally & Bernstein, 1994).
Tuy nhiên, theo Nunnally và ctg (1994), hệ số Cronbach alpha không cho biết biến nào nên loại bỏ và biến nào nên giữ lại. Bởi vậy, bên cạnh hệ số Cronbach alpha, người ta còn sử dụng hệ số tương quan biến tổng (item - total correlation) và những biến nào có tương quan biến tổng < 0,3 sẽ bị loại bỏ.
3.4.2 Kiểm định thang đo bằng phân tích nhân tố khám phá EFA
Phân tích nhân tố khám phá sẽ trả lời câu hỏi liệu các biến quan sát dùng để xem xét tác động của các yếu tố thành phần đến biến phụ thuộc có độ kết dính cao không và chúng có thể rút gọn lại thành một số yếu tố ít hơn để quan sát hay không. Các tham số thống kê trong phân tích EFA như sau:
- Kiểm định hệ số KMO – chỉ số so sánh độ lớn của hệ sốtương quan giữa hai biến quan sát với độ lớn của hệ số tương quan riêng phần của chúng (Norusis, 1994):
31
KMO → 1, KMO càng lớn càng tốt vì phần chung giữa các biến càng lớn. Để sử dụng EFA, KMO>0,50; KMO ≥ 0,90: rất tốt; KMO ≥ 0,80: tốt; KMO ≥ 0,70: được; KMO ≥ 0,60: tạm được; KMO ≥ 0,50: xấu và KMO < 0,50 là không thể chấp nhận.
- Kiểm định Barlett xem xét giả tuyết H0: Độtương quan giữa các biến quan sát bằng 0. Nếu kiểm định này có ý nghĩa thống kê (sig < 0.05) thì các biến có tương quan nhau trong tổng thể (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
- Các hệ số tải nhân tố (factor loading) nhỏhơn 0.4 trong EFA sẽ bị loại để đảm bảo sự hội tụ giữa các biến. Phương pháp trích hệ số sử dụng là Principal Components phép quay Varimax và điểm dừng khi trích các yếu tố có Eigenvalue lớn hơn 1, tổng phương sai trích bằng hoặc lớn hơn 50% (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Trong nghiên cứu này, tác giả sử dụng tiêu chuẩn sau để thực hiện phân tích nhân tố khám phá:
• KMO nằm trong khoảng 0,5 đến 1
• Kiểm định Barlett có ý nghĩa thống kê (sig <0,05)
• Giữ lại các biến có hệ số tải lớn hơn 0.5 và điểm dừng khi trích các yếu tố có Eigenvalue lớn hơn 1, tổng phương sai trích bằng hoặc lớn hơn 50%
3.4.3 Phân tích hồi quy tuyến tính
Trước khi phân tích kiểm định giả thuyết, hệ sốtương quan giữa các biến trung bình của các nhân tố nghiên cứu được xem xét.
Tiếp đến, phân tích hồi quy tuyến tính dựa trên phương pháp bình phương nhỏ nhất thông thường (Ordinal Least Squares – OLS) được sử dụng để kiểm định giả thuyết nghiên cứu. Trong phân tích hồi quy tuyến tính này, phương pháp khẳng định hay còn gọi là phương pháp đồng thời để kiểm định giả thuyết suy diễn từ lý thuyết. Phương pháp này tương ứng với phương pháp ENTER trong SPSS.
Đối với giả thuyết về mối quan hệ giữa các nhân tố độc lập và nhân tố phụ
thuộc thì sử dụng phương pháp phân tích hồi quy bội MLR (Multiple Linear
Regression) và hồi qui đơn SLR (Single Linear Regression). Dựa vào hệ số RP
2
Pđểđánh giá mức độ phù hợp của mô hình nghiên cứu.
32
Sau khi được xây dựng phương trình hồi quy sẽ tiếp tục được phân tích thông qua kiểm định F dùng để khẳng định khảnăng mở rộng mô hình này áp dụng cho tổng thểcũng như kiểm định t để bác bỏ giả thuyết các hệ số hồi quy của tổng thể bằng 0.
Đánh giá mức độtác động giữa các biến động lập đến biến phụ thuộc thông qua hệ số Beta.
Cuối cùng, nhằm đánh giá độ tin cậy của phương trình hồi quy được xây dựng là phù hợp, một loạt các dò tìm vi phạm của giảđịnh cần thiết trong hồi quy tuyến tính được thực hiện. Các giả định được kiểm định bao gồm giả định về liên hệ tuyến tính giữa các biến độc lập, hiện tượng đa cộng tuyến, phân phối chuẩn, sai số hồi quy có phương sai không đổi và tính độc lập của phần dư.
Quá trình phân tích hồi qui tuyến tính được thực hiện qua các bước:
- Bước 1: Kiểm tra tương quan giữa biến các biến độc lập với nhau và với biến phụ thuộc thông qua ma trận hệ sốtương quan. Theo đó, điều kiện để phân tích hồi qui là phải có tương quan giữa các biến độc lập với nhau và với biến phụ thuộc. Tuy nhiên, theo John và Benet - Martinez (2000), khi hệ số tương quan < 0,85 thì có khả năng đảm bảo giá trị phân biệt giữa các biến. Nghĩa là, nếu hệ sốtương quan > 0,85 thì cần xem xét vai trò của các biến độc lập, vì có thể xảy ra hiện tượng đa cộng tuyến (một biến độc lập này có được giải thích bằng một biến khác).
- Bước 2: Xây dựng và kiểm định mô hình hồi qui
Y R=RβR1RXR1R+βR2RXR2R+ βR3RXR3R+ βR4RXR4R+...+ βRkRXRk
Được thực hiện thông qua các thủ tục
+ Lựa chọn các biến đưa vào mô hình hồi qui (tác giả sử dụng phương pháp Enter - SPSS xử lý tất cả các biến đưa vào cùng một lượt).
+ Đánh giá độ phù hợp của mô hình bằng hệ sốxác định RP
2
P
(R Square). Tuy nhiên, RP
2
Pcó đặc điểm càng tăng khi đưa thêm các biến độc lập vào mô hình, mặc dù không phải mô hình càng có nhiều biến độc lập thì càng phù hợp với tập dữ liệu. Vì thế, RP
2
P
điều chỉnh (Adjusted R Square) có đặc điểm không phụ thuộc vào số lượng biến đưa thêm vào mô hình được sử dụng thay thế RP
2
P
để đánh giá mức độ phù hợp của mô hình hồi qui bội.
33
+ Kiểm định độ phù hợp của mô hình để lựa chọn mô hình tối ưu bằng cách sử dụng phương pháp phân tích ANOVA để kiểm định giả thuyết HR0R: (không có mối liên hệ tuyến tính giữa biến phụ thuộc với tập hợp các biến độc lập βR1R=βR2R=βR3R=βRKR= 0).
+ Nếu trị thống kê F có Sig rất nhỏ (< 0,05), thì giả thuyết HR0 Rbị bác bỏ, khi đó chúng ta kết luận tập hợp của các biến độc lập trong mô hình có thể giải thích cho sự biến thiên của biến phụ thuộc. Nghĩa là mô hình được xây dựng phù hợp với tập dữ liệu, vì thế có thể sử dụng được.
+ Xác định các hệ số của phương trình hồi qui, đó là các hệ số hồi qui riêng phần βRkR đo lường sự thay đổi trung bình của biến phụ thuộc khi biến độc lập XRkR thay đổi một đơn vị, trong khi các biến độc lập khác được giữnguyên. Tuy nhiên, độ lớn của βRkR phụ thuộc vào đơn vị đo lường của các biến độc lập, vì thế việc so sánh trực tiếp chúng với nhau là không có ý nghĩa. Do đó, để có thể so sánh các hệ số hồi qui với nhau, từ đó xác định tầm quan trọng (mức độ giải thích) của các biến độc lập cho biến phụ thuộc, người ta biểu diễn số đo của tất cả các biến độc lập bằng đơn vị đo lường độ lệnh chuẩn beta.
- Bước 3: Kiểm tra vi phạm các giả định hồi qui
Mô hình hồi qui được xem là phù hợp với tổng thể nghiên cứu khi không vi phạm các giả định. Vì thế, sau khi xây dựng được phương trình hồi qui, cần phải kiểm tra các vi phạm giảđịnh cần thiết sau đây:
- Có liên hệ tuyến tính gữa các biến độc lập với biến phụ thuộc - Phần dư của biến phụ thuộc có phân phối chuẩn
- Phương sai của sai sốkhông đổi
- Không có tương quan giữa các phần dư (tính độc lập của các sai số) - Không có tương quan giữa các biến độc lập (không có hiện tượng đa
cộng tuyến).
Trong đó:
+ Công cụ để kiểm tra giả định liên hệ tuyến tính là đồ thị phân tán phần dư chuẩn hóa (Scatter) biểu thị tương quan giữa giá trị phần dư chuẩn hóa (Standardized Residual) và giá trị dựđoán chuẩn hóa (Standardized Pridicted Value).
+ Công cụ để kiểm tra giả định phần dư có phân phối chuẩn là đồ thị tần số Histogram, hoặc đồ thị tần số P-P plot.
34
+ Công cụđể kiểm tra giảđịnh sai số của biến phụ thuộc có phương sai không đổi là đồ thị phân tán của phần dư và giá trị dựđoán hoặc kiểm định Spearman’s.
+ Công cụ được sử dụng để kiểm tra giả định không có tương quan giữa các phần dư là đại lượng thống kê (Durbin - Watson), hoặc đồ thị phân tán phần dư chuẩn hóa (Scatter).
+ Công cụ được sử dụng để phát hiện tồn tại hiện tượng đa cộng tuyến là độ chấp nhận của biến (Tolerance) hoặc hệ số phóng đại phương sai (Variance Inflation
Factor - VIF). Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2005, tr.217, 218), qui
tắc chung là VIF > 10 là dấu hiệu đa cộng tuyến; trong khi đó, theo Nguyễn Đình Thọ và Nguyễn Thị Mai Trang (2011, tr.497), khi VIF > 2 cần phải cẩn trọng hiện tượng đa cộng tuyến.
TÓM TẮT CHƯƠNG 3
Nội dung chương này tập trung trình bày chi tiết quy trình thực hiện đề tài nghiên cứu. Quá trình nghiên cứu được thực hiện qua 2 giai đoạn: nghiên cứu sơ bộ và nghiên cứu chính thức. Nghiên cứu sơ bộ được thực hiện bằng nghiên cứu định tính thông qua kỹ thuật thảo luận nhóm tập trung. Kết quả nghiên cứu sơ bộ sẽđược dùng điều chỉnh thang đo và bảng câu hỏi cho phù hợp với môi trường nghiên cứu và đối tượng nghiên cứu và được dùng để thu thập dữ liệu cho nghiên cứu chính thức. Nghiên cứu chính thức được thực hiện bằng nghiên cứu định lượng thông qua bảng câu hỏi của 300 khách hàng mua hàng miễn thuế tại thị trường sân bay quốc tế Tân Sơn Nhất
khu vực Thành phố Hồ Chí Minh. Chương này cũng trình bày các tiêu chí đánh giá
thang đo, các phương pháp phân tích sử dụng trong quá trình xử lý dữ liệu như: phân tích độ tin cậy Cronbach Alpha, phân tích nhân tố, phân tích tương quan, phân tích hồi quy bội, phương pháp kiểm định giả thuyết cũng như các phương pháp kiểm tra sự vi phạm giả thuyết của phương pháp hồi quy.
Chương 4 tiếp theo sẽ trình bày kết quả phân tích: mô tả mẫu, kiểm định độ tin cậy của thang đo, phân tích nhân tố, phân tích hồi quy và kiểm định giả thuyết.
35
CHƯƠNG 4: PHÂN TÍCH DỮ LIỆU VÀ KẾT QUẢ
NGHIÊN CỨU
4.1 173TTHÔNG TIN VỀ MẪU NGHIÊN CỨU
Bảng 4.1: Thông tin mẫu nghiên cứu
BIẾN THÔNG TIN MẪU TẦN SỐ TẦN SUẤT
Giới tính Nam 167 55,70 Nữ 133 44,30 Độ tuổi Từ 18 đến 35 tuổi 66 22,00 Từ 36 đến 55 tuổi 169 56,30 Trên 55 tuổi 65 21,70 Trình độ học vấn Dưới Cao đẳng 91 30,30 Cao đẳng – Đại học 191 63,70 Sau Đại học 18 6,00 Nghề nghiệp
Cán bộ, viên chức, giáo viên 30 10,00
Tiểu thương 114 38,00
Doanh nhân, nhân viên công ty 152 50,70
Ngành nghề khác 4 1,30 Thu nhập Dưới 15 triệu 27 9,00 Từ 15 đến dưới 20 triệu 91 30,30 Từ 20 đến dưới 25 triệu 104 34,70 Trên 25 triệu 78 26,00 Quốc tịch Việt Nam 108 36,00 Nước ngoài 192 64,00 Cộng 300 100
(Nguồn: Kết quả phân tích dữ liệu của tác giả)
Quá trình khảo sát khách hàng được thực hiện từ tháng 04/2015 đến hết tháng 05/2015. Với 350 bảng câu hỏi phát ra, sau khi loại bỏ những phiếu trả lời không đạt yêu cầu (phiếu trả lời thiếu nhiều thông tin, hoặc có trên một trả lời cho một câu hỏi,
36
hoặc có cơ sở để xác định không đáng tin cậy), số bảng hỏi còn lại và được đưa vào phân tích dữ liệu là 300. Cơ cấu mẫu nghiên cứu được được thực hiện tại Cửa hàng
miễn thuế SASCO, sân bay quốc tế Tân Sơn Nhất, Tp.HCM và các đặc điểm nhân
khẩu – xã hội học của khách hàng như trên bảng 4.1.
Kết quả kiểm tra đặc tính phân phối của mẫu thông qua các chỉ số Skewness và Kurtosis (phụ lục 5) cho thấy, hầu hết các chỉ số này của tập dữ liệu các biến quan sát đều được phân bố trong khoảng [-1; +1], một số ít nằm trong giới hạn [-2; +2], chứng tỏ, tập dữ liệu có phân phối xấp xỉ phân phối chuẩn. Vì thế, cho phép áp dụng các kỹ thuật định lượng sau đây để phân tích dữ liệu nghiên cứu
173T
4.2173T ĐÁNH GIÁ SƠ BỘ THANG ĐO
4.2.1 Đánh giá thang đo bằng hệ số tin cậy Cronbach Alpha
Kết quả kiểm định được trình bày ở bảng 4.2 cho thấy tất cả các thang đo đều có hệ sốCronbach alpha ≥ 0,7. Thành phần có hệ số Cronbach alpha thấp nhất là 0,787 (thang đo sự hài lòng). Đồng thời, các biến quan sát trong mỗi thang đo đều có hệ số tương quan biến - tổng hiệu chỉnh đều lớn hơn 0,3 (nhỏ nhất là 0,484). Kết quả này cho thấy tất cả các biến đo lường đều đạt yêu cầu, ta có thể sử dụng tất cả các biến này đưa vào phân tích nhân tố khám phá EFA trong bước tiếp theo.
Bảng 4.2: Kết quả kiểm định Cronbach Alpha của tất cảcác thang đo
Biến
quan sát
Trung bình
thang đo nếu loại biến
Phương sai thang đo nếu
loại biến
Hệ số tương quan biến tổng thấp nhất
Cronbach Alpha
nếu loại biến này Thành phần Chất lượng hàng hóa - Cronbach's Alpha = 0,788
CLHH1 20.56 10.388 0.588 0.744 CLHH2 20.567 11.129 0.468 0.773 CLHH3 20.607 10.246 0.588 0.744 CLHH4 20.503 10.98 0.503 0.765 CLHH5 20.55 10.389 0.601 0.741 CLHH6 20.613 11.087 0.484 0.769
Thành phần Chất lượng dịch vụ - Cronbach's Alpha = 0,869
CLDV1 20.32 9.811 0.605 0.856
37
Biến
quan sát
Trung bình
thang đo nếu loại biến
Phương sai thang đo nếu
loại biến
Hệ số tương quan biến tổng thấp nhất
Cronbach Alpha
nếu loại biến này
CLDV3 20.55 9.586 0.625 0.853
CLDV4 20.59 9.026 0.698 0.841
CLDV5 20.49 9.174 0.653 0.849
CLDV6 20.47 8.832 0.693 0.842
Thành phần Giá cả - Cronbach's Alpha = 0,806
GTTT1 11.82 3.562 0.652 0.746
GTTT2 11.48 3.307 0.592 0.774
GTTT3 11.68 3.322 0.67 0.734
GTTT4 11.87 3.451 0.584 0.775
Thành phần Giá trị cảm xúc - Cronbach's Alpha = 0,854
GTCX1 16.51 6.217 0.671 0.822