Việc xử lý dữ liệu bao gồm các công việc: kiểm tra độ chính xác của các dữ liệu, nhập dữ liệu vào máy tính, chuyển đổi dữ liệu…
Thống kê, mô tả
Số liệu thống kê mô tả đƣợc sử dụng để mô tả các đặc điểm cơ bản của dữ liệu, cung cấp bản tóm tắt đơn giản về mẫu và các phép đo. Với phân tích đồ hoạ đơn giản, thống kê mô tả là cơ sở của hầu hết các phân tích định lƣợng. Thống kê mô tả đƣợc sử dụng để mô tả dữ liệu: dữ liệu là gì và cho biết điều gì.
Thống kê mô tả đƣợc sử dụng để trình bày một mô tả định lƣợng theo mẫu. Thống kê mô tả giúp đơn giản hoá một lƣợng dữ liệu lớn một cách hợp lý. Mỗi thống kê mô tả giúp giảm dữ liệu một cách đáng kể bằng cách cung cấp một bản tóm tắt đơn giản.
Kiểm định độ tin cậy Cronbach’s Alpha
Hệ số Alpha của Cronbach là một đại lƣợng có thể đƣợc sử dụng trƣớc hết để đo lƣờng độ tin cậy của các yếu tố và để loại ra các biến quan sát không đảm bảo độ tin cậy trong thang đo. Điều kiện tiêu chuẩn chấp nhận các biến gồm có 2 điều kiện: Thứ nhất, những biến có hệ số tƣơng quan biến tổng phù hợp (Corrected Item – Total Correlation) > 0.3 trở lên. Thứ hai, các hệ số Cronbach’s Alpha của các biến phải từ 0.7 trở lên và >= Cronbach’s Alpha if Item Deleted. Thỏa mãn 2 điều kiện trên thì các biến phân tích đƣợc xem là chấp nhận và thích hợp đƣa vào phân tích những bƣớc tiếp theo (Nunnally và BernStein, 1994).
Theo Nguyễn Đình Thọ & Nguyễn Thị Mai Trang (2007), hệ số Cronbach’s Alpha đƣợc tính theo công thức sau:
∑ ) Trong đó:
: là hệ số Cronbach’s Alpha . : là số mục hỏi trong thang đo
: là phƣơng sai của mục hỏi thứ i : là phƣơng sai của tổng thang đo
Nhiều nghiên cứu cho rằng hệ số Alpha của từng thang đo từ 0.8 trở lên đến gần 1 thì thang đo lƣờng là tốt, từ 0.7 đến gần 0.8 là sử dụng đƣợc. Cũng có nhà nghiên cứu đề nghị rằng hệ số Alpha từ 0.6 trở lên là có thể sử dụng đƣợc trong trƣờng hợp khái niệm đang nghiên cứu là mới hoặc mới đối với ngƣời trả lời trong bối cảnh nghiên cứu (Nunnally & Bunstein, 1994 dẫn theo Nguyễn Đình Thọ, 2011). Tuy nhiên, đối với nghiên cứu này thì hệ số Alpha từ 0.6 trở lên là chấp nhận đƣợc. Kết quả của bƣớc phân tích này đƣợc sử dụng cho phân tích EFA tiếp theo.
Phƣơng pháp phân tích yếu tố (EFA)
Các thang đo đạt yêu cầu về độ tin cậy sẽ đƣợc sử dụng phân tích yếu tố để rút gọn một tập gồm nhiều biến quan sát thành một tập biến (gọi là yếu tố) ít hơn; các yếu tố đƣợc rút gọn này sẽ có ý nghĩa hơn nhƣng vẫn chứa đựng hầu hết nội dung thông tin của tập biến quan sát ban đầu (Hair, Anderson, Tatham và Black; 1998). Phƣơng pháp phân tích yếu tố EFA đƣợc dùng để kiểm định giá trị khái niệm của thang đo (Lê Ngọc Đức, 2008). Kiểm định Bartlett có ý nghĩa thống kê (sig<0.05), chứng tỏ các biến quan sát có tƣơng quan với nhau trong tổng thể Xem xét giá trị KMO: 0.5 ≤ KMO ≤ 1 thì phân tích yếu tố là thích hợp với dữ liệu; ngƣợc lại KMO ≤ 0.5 thì phân tích yếu tố có khả năng không thích hợp với các dữ liệu (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2007). Để phân tích EFA có giá trị thực tiễn: tiến hành loại các biến quan sát có hệ số tải yếu tố < 0.5. Xem lại thông số Eigenvalues (đại diện cho phần biến thiên đƣợc giải thích bởi mỗi yếu tố) có giá trị > 1 Xem xét giá trị tổng phƣơng sai trích (yêu cầu là ≥ 50%): cho biết các yếu tố đƣợc trích giải thích đƣợc % sự biến thiên của các biến quan sát.
Tiêu chuẩn đối với hệ số tải yếu tố là phải lớn hơn hoặc bằng 0.5 để đảm bảo mức ý nghĩa thiết thực của EFA. Các mức giá trị của hệ số tải yếu tố: lớn hơn 0.3 là đạt đƣợc mức tối thiểu; lớn hơn 0.4 là quan trọng; lớn hơn 0.5 là có ý nghĩa thực tiễn. Tiêu chuẩn chọn mức giá trị hệ số tải yếu tố: cỡ mẫu ít nhất là 350 thì có thể chọn hệ số tải yếu tố lớn hơn 0.3; nếu cỡ mẫu khoảng 100 đến 350 thì chọn hệ số tải yếu tố Nghiên cứu những yếu tố tác động đến sự hài lòng của khách hàng về chất lƣợng dịch vụ lớn hơn 0.5; nếu cỡ mẫu khoảng 50 đến 100 thì hệ số tải yếu tố phải lớn hơn 0.75 (Theo Hair & ctg (1998), Multivariate Data Analysis, Prentice-Hall International).
Phân tích yếu tố khẳng định CFA
Phân tích yếu tố khẳng định CFA là bƣớc phân tích tiếp theo của phân tích yếu tố khám phá EFA, bao gồm thiết kế để xác định, kiểm nghiệm và điều chỉnh các mô hình đo lƣờng một cách độc lập. Mục đích CFA là nhằm thiết lập các mô hình đo lƣờng phù hợp tốt đƣợc dùng để kiểm định mô hình cấu trúc. Xác định độ phù
hợp của mô hình dựa trên một số chỉ số đánh giá nhƣ Chi-square/df<2; AGFI, CFI từ 0.9 đến 1; RMSEA <0.08 đƣợc xem là mô hình phù hợp tốt với bộ dữ liệu khảo sát(Tác giả: Phạm Đức Kỳ – Nguồn: mba-15.com).
Mô hình phƣơng trình cấu trúc tuyến tính SEM
SEM là mô hình phƣơng trình cấu trúc tuyến tính nhằm tìm lời giải thích cho các mối quan hệ giữa nhiều biến số SEM xem xét cấu trúc của các mối quan hệ tƣơng hỗ đƣợc thể hiện trong các phƣơng trình tƣơng tự nhƣ các phƣơng trình hồi quy đa biến. Những phƣơng trình quan hệ này mô tả tất cả các mối quan hệ giữa các khái niệm (biến phụ thuộc và biến độc lập) có trong phân tích. Các khái niệm không quan sát đƣợc hoặc các yếu tố ẩn đƣợc mô tả bởi nhiều biến đo lƣờng. Mỗi kỹ thuật đa biến còn đƣợc phân loại theo phân tích sự phụ thuộc tƣơng hỗ và phân tích phụ thuộc. SEM đƣợc xem là sự kết hợp duy nhất của cả hai loại kỹ thuật này, bởi vì nền tảng của SEM nằm trong 2 kỹ thuật đa biến quen thuộc là phân tích yếu tố và hồi quy đa biến (Tác giả: Phạm Đức Kỳ – Nguồn: mba-15.com).
Phƣơng pháp phân tích phƣơng sai ANOVA
Phân tích phƣơng sai ANOVA là phƣơng pháp so sánh trị trung bình của 3 nhóm trở lên. Có 2 kỹ thuật phân tích phƣơng sai: ANOVA 1 yếu tố (một biến yếu tố để phân loại các quan sát thành các nhóm khác nhau) và ANOVA nhiều yếu tố (2 hay nhiều biến để phân loại). Ở phần thực hành cơ bản chỉ đề cập đến phân tích phƣơng sai 1 yếu tố (One-way ANOVA). Một số giả định đối với phân tích phƣơng sai một yếu tố: Các nhóm so sánh phải độc lập và đƣợc chọn một cách ngẫu nhiên.
Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để đƣợc xem nhƣ tiệm cận phân phối chuẩn. Phƣơng sai của các nhóm so sánh phải đồng nhất. Dựa vào mức ý nghĩa (Sigα) để kết luận: Nếu sigα <0.05: có sự khác biệt có ý nghĩa thống kê. Nếu sigα>= 0.05: chƣa có sự khác biệt có ý nghĩa thống kê. Dùng để kiểm định sự khác biệt của nhận thức thƣơng hiệu về đặc điểm nhân khẩu học của khách hàng.