THU THẬP VÀ PHÂN TÍCH DỮ LIỆU

3.3.1. Thu thập dữ liệu

Việc thu thập dữ liệu được thực hiện thông qua việc phỏng vấn trực tiếp bằng bảng câu hỏi được in sẵn và thiết kế bảng câu hỏi trên Google Drive gởi đến khách hàng. Với đối tượng nghiên cứu là những người thường hay đến quán cà phê trong vòng 12 tháng trở lại đây.

Địa điểm nghiên cứu: Tp. HCM

Thời gian: Từ 01/06/2015 – 30/06/2015

Để đảm bảo độ tin cậy của dữ liệu khảo sát, nghiên cứu sẽ loại bỏ tất cả bảng trả lời khảo sát không đạt được yêu cầu sau: đáp viên không sinh sống tại Tp.HCM, đáp viên chưa từng đến quán cà phê, thiếu câu trả lời, chỉ lựa chọn một câu trả lời từ đầu đến cuối; sau đó tiến hành làm sạch dữ liệu, loại bỏ những bảng trả lời trùng lắp trước khi tiến hành phân tích dữ liệu.

3.3.2. Phân tích dữ liệu

Đề tài sử dụng hai phần mềm phân tích thống kê SPSS và AMOS để phân tích dữ liệu. Phần mềm SPSS 20.0 được sử dụng để đánh giá sơ bộ thang đo thông qua kểm định hệ số tin cậy Cronbach’s Alpha, phân tích nhân tố khám phá EFA và phân tích thống kê mô tả mẫu. Phần mềm AMOS 20.0 được sử dụng để phân tích nhân tố

khẳng định CFA, kiểm định mô hình và giả thuyết bằng phân tích cấu trúc tuyến tính SEM, ước lượng mô hình bằng bootstrap và phân tích đa nhóm. Dữ liệu sau khi thu thập sẽ sàng lọc những dữ liệu không phù hợp (đáp viên chưa từng đến quán cà phê hoặc không sinh sống và làm việc tại Tp.HCM sẽ loại ra).

Trình tự tiến hành phân tích dữ liệu được thực hiện như sau:

Bước 1 – Chuẩn bị thông tin: thu thập bảng trả lời, tiến hành làm sạch thông tin, mã hóa các thông tin cần thiết trong bảng trả lời, nhập liệu và phân tích dữ liệu bằng phần mềm SPSS 20.0

Bước 2 – Thống kê: tiến hành thống kê mô tả dữ liệu thu thập được.

Bước 3 – Đánh giá độ tin cậy: tiến hành đánh giá thang đo bằng phân tích Cronbach Alpha

Bước 4 – Phân tích nhân tố khám phá: phân tích thang đo bằng phân tích nhân tố khám phá EFA (Exploratory Factor Analysis)

Bước 5 – Kiểm định thang đo bằng phân tích nhân tố khẳng định CFA (Confirmatory Factor Analysis)

Bước 6 – Phân tích cấu trúc tuyến tính SEM (Structural Equation Modeling ) để kiểm định độ thích hợp của mô hình và ước lượng bằng Bootstrap.

Bước 7 – Phân tích cấu trúc đa nhóm giữa các nhóm giới tính (nam và nữ), độ tuổi chia làm hai nhóm nhỏ hơn hoặc bằng 30 tuổi và trên 30 tuổi, hai nhóm theo trình độ học vấn là dưới đại học và từ đại học trở lên, hai nhóm theo thu nhập là thấp và cao (nghiên cứu này gọi thu nhập nhỏ hơn hoặc bằng 10.000.000 VNĐ/ tháng là thấp và trên 10.000.000 VNĐ/ tháng là cao).

3.3.2.1. Đánh giá độ tin cậy của thang đo

Độ tin cậy của thang đo thường được đánh giá bằng phương pháp nhất quán nội tại qua hệ số Cronbach’s Alpha, hệ số Cronbach’s Alpha càng lớn thì độ tin cậy nhất quán nội tại càng cao. Sử dụng phương pháp hệ số tin cậy Cronbach’s Alpha trước khi phân tích nhân tố EFA để loại các biến không phù hợp vì các biến rác này có thể tạo ra

các nhân tố giả khi phân tích EFA (Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2009).

Về giá trị của Cronbach alpha, Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008, tập 2 24) cho rằng: “Nhiều nhà nghiên cứu đồng ý rằng giá trị này từ 0.8 trở lên đến gần 1 thì thang đo lường là tốt, từ 0.7 đến 0.8 là sử dụng được. Cũng có nhà nghiên cứu đề nghị rằng Cronbach alpha từ 0.6 trở lên là có thể sử dụng được trong trường hợp khái niệm thang đo lường là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu (Nunnally, 1978; Peterson, 1994; Slater, 1995). Trong nghiên cứu này, tác giả chọn thang đo có độ tin cậy Cronbach’s Alpha lớn hơn 0,6.

Trong mỗi thang đo, hệ số tương quan biến tổng thể hiện sự tương quan giữa một biến quan sát với tất cả các biến khác trong thang đo. Hệ số này càng cao thì sự tương quan của biến với các biến khác càng cao. Các biến có hệ số tương quan biến tổng < 0.3 bị coi là biến rác và loại khỏi thang đo.

3.3.2.2. Phân tích nhân tố khám phá EFA

Phân tích nhân tố được dùng để tóm tắt dữ liệu và rút gọn tập hợp các yếu tố quan sát thành những yếu tố chính dùng trong các phân tích, kiểm định tiếp theo (gọi là các nhân tố). Các nhân tố được rút gọn này sẽ có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến quan sát ban đầu. Phân tích nhân tố khám phá được dùng để kiểm định giá trị khái niệm của thang đo.

Khi phân tích nhân tố khám phá, các nhà nghiên cứu đều quan tâm đến một số tiêu chuẩn. (1) Tiêu chuẩn thứ nhất, hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Kiểm định Barlett xem các biến quan sát có tương quan với nhau trong tổng thể. Trị số của KMO lớn (giữa 0.50 và 1) có ý nghĩa là phân tích nhân tố là thích hợp; ngược lại, KMO nhỏ hơn 0.5 thì phân tích nhân tố có khả năng không thích hợp với các dữ liệu. Nếu kiểm định này có ý nghĩa thống kê (sig ≤ 0.05) thì các biến quan sát có tương quan với nhau trong tổng thể (Trọng & Ngọc, 2008). (2) Hệ số tải nhân tố là chỉ tiêu thứ hai để đảm bảo mức ý nghĩa thiết thực của EFA. Hệ số tải nhân tố phải lớn hơn hoặc bằng 0.5 để đảm bảo mức ý nghĩa thiết thực của EFA. Các mức giá trị của hệ số tải nhân tố: lớn hơn 0.3 là mức tối thiểu chấp nhận được; lớn hơn 0.4 là quan trọng; lớn hơn 0.5 là có ý nghĩa

thực tiễn. Tiêu chuẩn chọn mức giá trị hệ số tải nhân tố: cỡ mẫu ít nhất là 350 thì có thể chọn hệ số tải nhân tố lớn hơn 0.3; nếu cỡ mẫu khoảng 100 thì nên chọn hệ số tải nhân tố lớn hơn 0.55; nếu cỡ mẫu khoảng 50 thì hệ số tải nhân tố phải lớn hơn 0.75 (Hair, 2009). (3) Tiêu chí thứ ba là thang đo chấp nhận được khi tổng phương sai trích được bằng hoặc lớn hơn 50% (Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011). (4) Hệ số eigenvalue là chỉ tiêu thứ tư và phải có giá trị lớn hơn 1 (Gerbing và Anderson, 1988). (Eigenvalue đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố). (5) Tiêu chuẩn thứ năm là khác biệt hệ số tải nhân tố của một biến quan sát giữa các nhân tố ≥ 0.3 để đảm bảo giá trị phân biệt giữa các nhân tố (Jabnoun và Al- Tamimi, 2003).

Sau khi phân tích EFA, các thang đo được chấp nhận sẽ tiếp tục được kiểm định mô hình bằng CFA và SEM nên cần quan tâm đến cấu trúc của thang đo, các khái niệm sau khi rút ra có thể tương quan với nhau, và cũng rất quan tâm đến sự phân biệt rõ ràng giữa các nhân tố. Vì vậy nghiên cứu này sẽ sử dụng phương pháp trích Principal Axis Factoring với phép xoay Promax trong phân tích EFA khi phân tích định lượng chính thức. Theo Gerbing & Anderson (1988), Phương pháp trích Principal Axis Factoring với phép xoay Promax (Oblique) sẽ phản ánh cấu trúc dữ liệu chính xác hơn phương pháp trích Principal Components với phép xoay Varimax (Orthogonal). Đối với thang đo đa hướng, sử dụng phương pháp trích yếu tố là Principal Axis Factoring với phép quay Promax và điểm dừng khi trích các yếu tố EigenValue lớn hơn hoặc bằng 1. Phương pháp này được cho rằng sẽ phản ánh dữ liệu tốt hơn khi dùng phương pháp trích Principal Components với phép quay Varimax. Đối với thang đơn hướng thì sử dụng phương pháp trích yếu tố Principal Components.

Từ cơ sở lý thuyết trên, mô hình “Ảnh hưởng của yếu tố cá nhân đến quyết định lựa chọn quán cà phê của khách hàng” với 45 biến quan sát sử dụng phân tích nhân tố EFA theo các bước sau:

o Sử dụng phương pháp trích yếu tố Principal Axis Factoring với phép quay Promax. Điểm dừng khi trích các yếu tố có Eigen Values > 1.

o Xem xét trị số KMO.

51 tải nhân tố nhỏ hơn 0.5.

o Xem lại thông số Eigenvalues (đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố) có giá trị lớn hơn 1.

o Xem xét tổng phương sai trích (yêu cầu lớn hơn hoặc bằng 50%: cho biết các nhân tố được trích giải thích % sự biến thiên của các biến quan sát.

3.3.2.3. Kiểm định thang đo bằng phân tích nhân tố khẳng định CFA

Mô hình cấu trúc tuyến tính (SEM) bao gồm nhiều kỹ thuật thống kê khác nhau như phân tích đường dẫn (Path Analysis), phân tích nhân tố khẳng định (Confirmatory Factor Analysis), Mô hình nhân quả với các biến tiềm ẩn (Causal modeling with Latent variable, và cũng thường gọi là SEM), và thậm chí cả phân tích phương sai (Analysis of Variance), mô hình hồi quy tuyến tính bội (Multiple Linear Regression). Đề tài sẽ tập trung phân tích CFA và SEM. Trong kiểm định thang đo, phương pháp CFA trong phân tích cấu trúc tuyến tính SEM có nhiều ưu điểm hơn so với phương pháp truyền thống như phương pháp hệ số tương quan, phương pháp phân tích nhân tố khám phá EFA, phương pháp đa khái niệm – đa phương pháp MTMM (Bagozzi & Foxall, 1996; được dẫn bởi Thọ & Trang, 2011). Lý do là CFA cho phép chúng ta kiểm định cấu trúc lý thuyết của các thang đo lường như mối quan hệ giữa một khái niệm nghiên cứu với các khái niệm khác mà không bị chệch do sai số đo lường. Hơn nữa, chúng ta có thể kiểm định giá trị hội tụ và giá trị phân biệt của thang đo mà không cần dùng nhiều phương pháp như trong phương pháp truyền thống MTMM (Steenkamp & van Trijp, 1991; được dẫn bởi Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).

Các đánh giá khi phân tích CFA gồm:

(1) Đánh giá độ tin cậy của thang đo thông qua: (a) Hệ số tin cậy tổng

hợp (composite reliability) (Joreskog, 1971), (b) tổng phương sai trích (Fornell & Larcker, 1981) và (c) hệ số tin cậy Cronbach’s Alpha. Theo Hair (1998): “phương sai trích (Variance Extracted) của mỗi khái niệm nên vượt quá 0.5”; và phương sai trích cũng là một chỉ tiêu đo lường độ tin cậy. Nó phản ánh biến thiên chung của các biến quan sát được tính toán bởi biến tiềm ẩn. Schumacker & Lomax (2006) cho rằng trong CFA, một vấn đề quan trọng cần phải quan tâm

khác là độ tin cậy của tập hợp các biến quan sát đo lường một khái niệm (nhân tố); và như truyền thống, hệ số tin cậy Cronbach’s Alpha vẫn thường được sử dụng. Nó đo lường tính kiên định nội tại xuyên suốt tập hợp các biến quan sát của các câu trả lời (được dẫn bởi Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).

(2) Tính đơn hướng/ đơn nguyên (unidimensionality): Theo Steenkamp &

Van Trijp (1991), mức độ phù hợp của mô hình với dữ liệu thị trường cho chúng ta điều kiện cần và đủ để cho tập biến quan sát đạt được tính đơn hướng, trừ trường hợp các sai số của các biến quan sát có tương quan với nhau (được dẫn bởi Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).

(3) Giá trị hội tụ (Convergent validity) Gerbring & Anderson (1988) cho rằng thang đo đạt được giá trị hội tụ khi các trọng số chuẩn hoá của thang đo đều cao (>0.5); và có ý nghĩa thống kê (P <0.05) (được dẫn bởi Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).

(4) Giá trị phân biệt (Discriminant validity): Có thể kiểm định giá trị phân biệt của các khái niệm trong mô hình tới hạn (saturated model) mô hình mà các khái niệm nghiên cứu được tự do quan hệ với nhau). Có thể thực hiện kiểm định hệ số tương quan xét trên phạm vi tổng thế giữa các khái niệm có thực sự khác biệt so với 1 hay không. Nếu nó thực sự khác biệt thì các thang đo đạt được giá trị phân biệt.

(5) Giá trị liên hệ lý thuyết (Nomological validity)

Các vấn đề từ (1) đến (4) được đánh giá thông qua mô hình đo lường. Riêng giá trị liên hệ lý thuyết được đánh giá trong mô hình lý thuyết (Anderson & Gerbing, 1988). Khi các vấn đề trên thoả mãn thì mô hình đo lường là tốt. Tuy nhiên, rất hiếm mô hình đo lường nào đạt được tất cả các vấn đề trên. Ví dụ, mô hình đo lường vẫn có thể được sử dụng khi thang đo không đạt được tính đơn hướng… (dẫn theo Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).

Để đo lường mức độ phù hợp của mô hình với thông tin thị trường, các chỉ số thường sử dụng là Chi-square (CMIN); Chi-square điều chỉnh theo bậc tự do (CMIN/df); chỉ số thích hợp so sánh (CFI_ Comparative Fit Index). Chỉ số Tucker & Lewis (TLI_ Tucker & Lewis Index); Chỉ số RMSEA (Root Mean Square Error

Approximation). Mô hình được xem là thích hợp với dữ liệu thị trường khi kiểm định Chi-square có P-value > 0.05. Tuy nhiên Chi-square có nhược điểm là phụ thuộc vào kích thước mẫu. Nếu một mô hình nhận được các giá trị GFI, TLI, CFI ≥0.9 (Bentler & Bonett, 1980); CMIN/df ≤ 2, một số trường hợp CMIN/df có thể ≤ 3 (Carmines & McIver, 1981); RMSEA ≤ 0.08, RMSEA ≤ 0.05 được xem là rất tốt (Steiger, 1990); thì mô hình được xem là phù hợp với dữ liệu thị trường, hay tương thích với dữ liệu thị trường. Mô hình nghiên cứu sẽ được đánh giá dựa trên các chỉ tiêu giá trị GFI ≥0.9, TLI ≥0.9, CFI ≥0.9, CMIN/df ≤ 3, RMSEA ≤ 0.08 thì mô hình phù hợp (tương thích) với dữ liệu thị trường (được dẫn bởi Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).

3.3.2.4. Kiểm định mô hình bằng phân tích cấu trúc tuyến tính SEM

Trong kiểm định giả thuyết và mô hình nghiên cứu, mô hình cấu trúc tuyến tính SEM cho phép chúng ta kết hợp được các khái niệm tiềm ẩn với đo lường của chúng và có thể xem xét các đo lường độc lập hay kết hợp chung với mô hình lý thuyết cùng một lúc. Chính vì thế, phương pháp phân tích SEM được sử dụng rất phổ biến trong các ngành khoa học xã hội trong những năm gần đây và thường được gọi là phương pháp phân tích dữ liệu thế hệ thứ hai (Hulland et al, 1996; được dẫn bởi Nguyễn Đình Thọ & Nguyễn Thị Mai Trang, 2011).

Phương pháp phân tích cấu trúc tuyến tính được sử dụng để kiểm định mô hình nghiên cứu. Phương pháp ước lượng ML (Maximum Likelihood) được sử dụng để ước lượng các tham số trong các mô hình. Lý do là khi kiểm định phân phối của các biến quan sát thì phân phối này lệch một ít so với phân phối chuẩn đa biến, tuy nhiên hầu hết các kurtoses và skewnesses đều nằm trong khoảng [-1; +1] nên ML vẫn là phương pháp ước lượng thích hợp (Muthen & Kaplan, 1985). Phương pháp bootstrap sẽ được sử dụng để ước lượng lại các tham số mô hình để kiểm tra độ tin cậy của các ước lượng. Kết quả ước lượng ML sẽ được sử dụng để kiểm định lại các giả thuyết.

3.3.2.5. Kiểm định đa nhóm các yếu tố cá nhân

Phương pháp phân tích cấu trúc đa nhóm sử dụng trong nghiên cứu này bao gồm khả biến và bất biến từng phần (cục bộ). Trong phương pháp khả biến, các tham số ước lượng trong từng mô hình của các nhóm không bị ràng buộc. Trong phương pháp

bất biến từng phần, thành phần đo lường không bị ràng buộc nhưng các mối quan hệ giữa các khái niệm trong mô hình nghiên cứu được ràng buộc có giá trị như nhau cho tất cả các nhóm.

Phương pháp phân tích cấu trúc đa nhóm được sử dụng để so sánh mô hình nghiên cứu theo bốn biến phân nhóm: (1) nhóm giới tính, (2) độ tuổi, (3) trình độ học vấn, (4) thu nhập hàng tháng. Giới tính chia làm hai nhóm nam và nữ, độ tuổi chia làm hai nhóm nhỏ hơn hoặc bằng 30 tuổi và trên 30 tuổi, hai nhóm theo trình độ học vấn là dưới đại học và từ đại học trở lên, hai nhóm theo thu nhập là thấp và cao (nghiên cứu này gọi thu nhập nhỏ hơn hoặc bằng 10.000.000 VNĐ/ tháng là thấp và trên 10.000.000 VNĐ/ tháng là cao).

3.4. KẾT QUẢ NGHIÊN CỨU ĐỊNH LƯỢNG SƠ BỘ

Sau khi thu thập số liệu của 100 khách hàng, tiến hành phân tích đánh giá độ tin cậy thang đo. Để kiểm tra sự tin cậy của các nhân tố thông qua các câu hỏi, ta sử dụng Cronbach’s Alpha để đánh sự tin cậy tổng hợp của nhân tố. Tiêu chuẩn đánh giá của một thang đo tin cậy là hệ số Cronbach’s Alpha phải tối thiểu bằng 0.6 và hệ số

Thuyết mô hình Servqual và Servperf

KẾT QUẢ NGHIÊN CỨU ĐỊNH LƯỢNG SƠ BỘ