CHƯƠNG 2: PHƯƠNG PHÁP NGHIÊN CỨU
2.6. CHUẨN BỊ DỮ LIỆU
2.6.1. Kiểm tra và hiệu chỉnh dữ liệu
Dữ liệu sau khi thu thập phải đƣợc kiểm tra lại để phát hiện các sai sót, sửa chữa các sai sót (nếu có) trước khi mã hóa và đưa và phân tích. Cần loại bỏ những bảng câu hỏi hoặc câu trả lời không thích hợp hoặc không rõ phương án trả lời… để đảm bảo độ tin cậy cho nghiên cứu.
Kiểm tra tính đầy đủ của các câu trả lời trong bảng câu hỏi. Mỗi câu hỏi trong bảng câu hỏi đều có một ý nghĩa, một giá trị nghiên cứu nhất định, do đó thiếu một câu trả lời nào đó sẽ làm mất đi giá trị của bảng câu hỏi đó.
Kiểm tra tính hợp lý và xác thực của các câu trả lời vì một câu trả lời đầy đủ chƣa hẳn là câu trả lời có giá trị, do đó quá trình kiểm tra để phát hiện và sửa chữa thường được thực hiện bằng cách suy luận từ các câu trả lời khác hoặc loại bỏ toàn bộ bảng câu hỏi.
Trong 159 bảng câu hỏi thu về từ việc gửi đi điều tra thì có 4 bảng câu hỏi không hợp lệ vì trống quá nhiều thông tin và 1 bảng câu hỏi có các thông tin trả lời nhiều hơn một lựa chọn nên chỉ còn lại 154 bảng câu hỏi hợp lệ
Kết quả có tất cả 237 bảng câu hỏi (83 + 154 = 237) đƣợc mã hóa để làm số liệu cho nghiên cứu.
2.6.2. Mã hóa và nhập dữ liệu
Mã hóa dữ liệu là quá trình chuyển dịch câu trả lời thực của người trả lời vào từng nhóm, từng mẫu đại diện với các giá trị đại diện tương ứng nhằm làm cho quá trình nhập liệu và phân tích dữ liệu dễ dàng và hiệu quả hơn.
Mục đích của việc mã hóa là tạo nhãn cho các câu trả lời, thường là bằng các con số. Mã hóa còn giúp giảm thiểu số lƣợng các câu trả lời bằng cách nhóm các câu trả lời và những nhóm có cùng ý nghĩa. Đối với câu hỏi đóng thì thường việc mã hóa được tiến hành ở giai đoạn thiết kế bảng câu hỏi.
Các thông tin của bảng câu hỏi đƣợc mã hóa và đƣợc nhập vào máy
tính bằng phần mềm SPSS 16.0.
2.6.3. Làm sạch dữ liệu
Mục đích của bước làm sạch dữ liệu là để phòng việc nhập dữ liệu bị sai sót. Bằng cách lập bảng tần số thống kê cho các biến giúp ta ra soát lại đƣợc các giá trị hoặc phát hiện các sai sót trong quá trình nhập dữ liệu.
Sử dụng bảng phân bổ tần suất ngoài việc đếm số lần xuất hiện của từng giá trị riêng biệt, nó còn giúp ta tìm các giá trị lỗi hoặc các giá trị mã hóa sai sót hoặc không mong đợi.
2.7. CÁC PHƯƠNG PHÁP PHÂN TÍCH DỮ LIỆU PHỤC VỤ CHO NGHIÊN CỨU
2.7.1. Phương pháp thống kê mô tả
Phương pháp thống kê mô tả nhằm tóm tắt, trình bày hay thống kê một số đặc điểm của mẫu nhƣ số lƣợng hay tỷ lệ nam/nữ, độ tuổi hay thu nhập…
nhằm có một cái nhìn khái quát về đặc điểm của mẫu.
2.7.2. Kiểm định độ tin cậy bằng hệ số Cronbach’s Alpha
Kiểm định độ tin cậy bằng hệ số Cronbach‟s Alpha đƣợc sử dụng để loại bỏ biến rác trước khi tiến hành phân tích nhân tố.
Phân tích độ tin cậy bằng hệ số Cronbach alpha để kiểm định mức độ chặt chẽ mà các thang đo tương quan với nhau. Cụ thể hơn, Cronbach‟s alpha dùng để đánh giá độ tin cậy của thang đo. Ý nghĩa của việc đánh giá Cronbach alpha là xem xét thang đo đó có cùng đo một khái niệm hay không hay nói cách khác, trong một thang đo có chỉ số Cronbach alpha cao chứng tỏ những người trả lời được hỏi sẽ hiểu cùng một khái niệm.
Phương pháp này cho phép người phân tích loại bỏ các biến không phù hợp và hạn chế các biến rác trong quá trình nghiên cứu và đánh giá độ tin cậy của thang đo. Những thang đo nào có hệ số có tương quan biến tổng (item – total correlation) nhỏ hơn 0,3 sẽ bị loại. Nếu Cronbach Alpha > hoặc = 0,6 là
thang đo có thể chấp nhận đƣợc về mặt tin cậy (Nunnally và Bernstein, 1994) 2.7.3. Phân tích nhân tố khám phá Exploratory Factor Analysis – EFA Phân tích nhân tố khám phá EFA dùng để rút gọn một tập hợp biến k quan sát thành một tập F (F < k) các nhân tố ý nghĩa hơn.
Sau khi phân tích EFA sẽ tiếp tục phân tích CFA và chạy mô hình cấu trúc tuyến tính SEM nên khi thực hiện phân tích EFA cần phải quan tâm đến các tiêu chuẩn sau:
Sử dụng phương pháp trích Principal Axis Factoring với phép xoay Promax, theo Gerbing & Anderson (1988) phương pháp này phản ánh cấu trúc dữ liệu chính xác hơn phương pháp Principal Components với phép xoay Varimax vì kết quả thu được có số lượng nhân tố là ít nhất, giải thích phương sai chung của tập hợp biến quan sát trong sự tác động qua lại giữa chúng.
Tiêu chuẩn về hệ số tải nhân tố Factor loading theo Hair & ctg (1988), hệ số tải nhân tố Factor loading là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA.
Factor loading > 0.3 đƣợc xem là đạt mức tối thiểu.
Factor loading > 0.4 đƣợc xem là quan trọng
Factor loading > 0.5 đƣợc xem là có ý nghĩa thực tiễn.
Trong phân tích nhân tố khám phá, trị số KMO (Kaiser – Meyer – Olkin) là chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số KMO phải có giá trị trong khoảng từ 0,5 đến 1 thì phân tích này mới thích hợp. Nếu trị số KMO < 0,5 thì phân tích nhân tố có khả năng không thích hợp với các dữ liệu.
Ngoài ra, phân tích nhân tố còn dựa vào Eigenvalue để xác định số lƣợng nhân tố. Đại lƣợng Eigenvalue đại diện cho lƣợng biến thiên đƣợc giải thích bởi nhân tố. Những nhân tố có Eigenvalue nhỏ hơn 1 sẽ không có tác dụng tóm tắt thông tin tốt hơn một biến gốc. Theo tiêu chuẩn Kaiser, chỉ
những nhân tố có Eigenvalue lớn hơn 1 thì mới đƣợc giữ lại trong mô hình và tiêu chuẩn phương sai trích (Variance explained criteria) là tổng phương sai trích phải lớn hơn 50%.
2.7.4. Phân tích nhân tố khẳng định Confirmatory Factor Analysis – CFA
Phân tích nhân tố khẳng định CFA dùng để kiểm định xem mô hình nghiên cứu có đạt yêu cầu hay không? Các thang đo có đạt đƣợc yêu cầu của một thang đo tốt hay không? CFA cho chúng ta kiểm định các biến quan sát đại diện cho các nhân tố tốt đến mức nào.
Khi phân tích nhân tố khẳng định CFA cần chú ý đến các vấn đề:
Để đo lường mức độ phù hợp của mô hình với thông tin thực tế, người ta sử dụng các thông số Chi-square (CMIN); Chi-square điều chỉnh theo bậc tự do (CMIN/df); chỉ số tích hợp so sánh CFI; chỉ số Tucker Lewis TLI; chỉ số RMSEA (Root Mean Square Error Approximation).
Mô hình đƣợc xem là thích hợp với dữ liệu thực tế khi kiểm định Chi- square có P_value > 0,05. Tuy nhiên Chi-square có nhƣợc điểm là phụ thuộc vào kích thước mẫu. Nếu một mô hình nhận được các giá trị GFI, TLI, CFI
≥0.9 (Bentler & Bonett, 1980); CMIN/df ≤ 2, một số trường hợp CMIN/df có thể ≤ 3 (Carmines & McIver, 1981); RMSEA ≤ 0.08, RMSEA ≤ 0.05 đƣợc xem là rất tốt (Steiger, 1990); thì mô hình đƣợc xem là phù hợp với dữ liệu thực tế, hay tương thích với dữ liệu thực tế. Thọ & Trang (2008) cho rằng nếu mô hình nhận đƣợc các giá trị TLI, CFI ≥0.9, CMIN/df ≤ 2, RMSEA ≤ 0.08 thì mô hình phù hợp với dữ liệu thực tế.
Khi thực hiện CFA, cần thực hiện các đánh giá nhƣ:
Đánh giá độ tin ậy ủ th ng đo, thông qu o Hệ số tin cậy tổng hợp (composite reliability) o Tổng phương sai trích được (variance extracted)
Theo Hair (1998, 612): phương sai trích (Variance Extracted) của mỗi khái niệm nên vượt quá 0.5; và phương sai trích cũng là một chỉ tiêu đo lường độ tin cậy. Nó phản ánh lượng biến thiên chung của các biến quan sát đƣợc tính toán bởi biến tiềm ẩn. Hoặc có thể đánh giá độ tin cậy thông qua hệ số Cronbach‟s alpha.
Tính đơn h ng/ đơn nguyên (uni imension lity)
Theo Steenkamp & Van Trijp (1991), mức độ phù hợp của mô hình với dữ liệu thực tế cho chúng ta điều kiện cần và đủ để cho tập biến quan sát đạt được tính đơn hướng, trừ trường hợp các sai số của các biến quan sát có tương quan với nhau.
Giá trị hội tụ (Convergent v li ity)
Gerbring & Anderson (1988) cho rằng thang đo đạt đƣợc giá trị hội tụ khi các trọng số chuẩn hoá của thang đo đều cao (>0.5) và có ý nghĩa thống kê (P <0.05)
Giá trị phân biệt (Dis rimin nt v li ity)
Có thể kiểm định giá trị phân biệt của các khái niệm trong mô hình tới hạn (saturated model) mô hình mà các khái niệm nghiên cứu đƣợc tự do quan hệ với nhau. Có thể thực hiện kiểm định hệ số tương quan xét trên phạm vi tổng thể giữa các khái niệm có thực sự khác biệt so với 1 hay không. Nếu nó thực sự khác biệt thì các thang đo đạt đƣợc giá trị phân biệt.
2.7.5. Kiểm định sự phù hợp của mô hình lí thuyết bằng mô hình SEM
Mô hình cấu trúc chỉ rõ mối quan hệ giữa các biến tiềm ẩn với nhau.
Các mối quan hệ này có thể mô tả những dự báo mang tính lý thuyết mà các nhà nghiên cứu quan tâm.
Mô hình SEM phối hợp đƣợc tất cả các kỹ thuật nhƣ hồi quy đa biến, phân tích nhân tố và phân tích mối quan hệ hỗ tương (giữa các phần tử trong
sơ đồ mạng) để cho phép chúng ta kiểm tra mối quan hệ phức hợp trong mô hình. Khác với những kỹ thuật thống kê khác chỉ cho phép ƣớc lƣợng mối quan hệ riêng phần của từng cặp nhân tố (phần tử) trong mô hình cổ điển (mô hình đo lường), SEM cho phép ước lượng đồng thời các phần tử trong tổng thể mô hình, ƣớc lƣợng mối quan hệ nhân quả giữa các khái niệm tiềm ẩn (Latent Constructs) qua các chỉ số kết hợp cả đo lường và cấu trúc của mô hình lý thuyết, đo các mối quan hệ ổn định (recursive) và không ổn định (non- recursive), đo các ảnh hưởng trực tiếp cũng như gián tiếp, kể cả sai số đo và tương quan phần dư. Với kỹ thuật phân tích nhân tố khẳng định (CFA) mô hình SEM cho phép linh động tìm kiếm mô hình phù hợp nhất trong các mô hình đề nghị.
2.7.6. Kiểm định Bootstrap
Các hệ số hồi quy trong mô hình nghiên cứu cuối cùng có đƣợc ƣớc lƣợng tốt không? Làm sao đánh giá đƣợc mức độ tin cậy của các ƣớc lƣợng trong mô hình nghiên cứu đó?
Để đánh giá độ tin cậy của các ước lượng, trong các phương pháp nghiên cứu định lượng bằng phương pháp lấy mẫu, thông thường chúng ta phải chia mẫu ra làm hai mẫu con. Cách khác là lặp lại nghiên cứu bằng một mẫu khác. Hai cách trên đây thường không thực tế vì phương pháp cấu trúc thường đòi hỏi mẫu lớn nên việc làm này tốn kém nhiều thời gian và chi phí (Anderson & Gerbing, 1988. Trong những trường hợp như vậy thì Bootstrap là phương pháp phù hợp để thay thế (Schumacker & Lomax, 2006). Bootstrap là phương pháp lấy mẫu lặp lại có thay thế, trong đó mẫu ban đầu đóng vai trò là đám đông.
2.7.7. Phân tích đa nhóm
Phương pháp phân tích cấu trúc đa nhóm để so sánh mô hình nghiên cứu theo các nhóm nào đó của một biến định tính. Đầu tiên ta sẽ chia làm 2
mô hình: Mô hình khả biến và mô hình bất biến. Trong mô hình khả biến, các tham số ƣớc lƣợng trong từng mô hình của các nhóm không bị ràng buộc.
Trong mô hình bất biến, thành phần đo lường không bị ràng buộc nhưng các mối quan hệ giữa các khái niệm trong mô hình nghiên cứu đƣợc ràng buộc có giá trị nhƣ nhau cho tất cả các nhóm.
Kiểm định Chi-square đƣợc sử dụng để so sánh giữa 2 mô hình. Nếu kiểm định Chi-square cho thấy giữa mô hình bất biến và mô hình khả biến không có sự khác biệt (P-value > 0.05) thì mô hình bất biến sẽ đƣợc chọn (có bậc tự do cao hơn). Ngƣợc lại, nếu sự khác biệt Chi-square là có ý nghĩa giữa hai mô hình (P-value<0.05) thì chọn mô hình khả biến (theo Thọ& Trang, 2008).
KẾT LUẬN CHƯƠNG 2
Chương 2 trình bày mô hình nghiên cứu, xây dựng bảng câu hỏi, cách thức thu thập và xử lý dữ liệu, mô tả mẫu và làm rõ các phương pháp phân tích, xử lý dữ liệu để phục vụ cho quá trình nghiên cứu.
CHƯƠNG 3