3.2.2.1. Kích cỡ mẫu
Kích cỡ mẫu tối thiểu phải lớn hơn hoặc bằng n= số biến quan sát * 10 và hồi quy n= số biến độc lập*5 +50 (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005) (được chọn theo phương pháp lấy mẫu thuận tiện, lấy mẫu phi xác xuất). Nghiên cứu chính thức được sử dụng để kiểm định lại mô hình đo lường cũng như mô hình lý thuyết và các giả thuyết trong mô hình.
Trong nghiên cứu này sử dụng phần mềm SPSS 20, phục vụ cho việc nhập dữ liệu, làm sạch dữ liệu, bảng biểu thống kê, kiểm định độ tin cậy Cronbach’s Alpha, Phân tích nhân tố khám phá EFA,..
Nghiên cứu định lượng được thực hiện bằng phương pháp phỏng vấn trực tiếp thông qua bảng câu hỏi chi tiết với kích cỡ mẫu được lựa chọn ở mức
(n=240>16*10= 160), được chọn theo phương pháp lấy mẫu thuận tiện (lấy mẫu phi xác xuất). Đối tượng khảo sát là các đơn vị sử dụng lao động trên địa bàn tỉnh Đồng Tháp. Thang đo được đánh giá độ tin cậy và giá trị bằng hai phương pháp đó là: hệ số tin cậy Cronbach’s Alpha và phân tích yếu tố khám phá EFA.
Trong nghiên cứu việc sử dụng Cronbach’s Alpha để kiểm tra độ tin cậy của thang đo trong tập dữ liệu theo từng nhóm yếu tố trong mô hình với mục đích tìm ra hệ số tương quan giữa các biến và hệ số tương quan giữa tổng và biến cho
một tập hợp các biến quan sát, chỉ giữ lại các biến có sự tương quan mạnh với tổng điểm, đồng thời loại các biến không bảo đảm độ tin cậy trong thang đo. Thang đo được chấp nhận khi có hệ số 0,6<= Cronbach’s Alpha <= 0,95 (Nunnally và Bernstein, 1994) và hệ số tương quan biến-tổng (Correctted Item- Total correlation) của biến đo lường >=0,3 (Nunnally và Bernstein, 1994).
Với giả thuyết đặt ra là trong phân tích EFA, rằng các biến quan sát trong tổng thể có mối tương quan với nhau phải thoả điều kiện trị số KMO (Kaiser- Meryer-Olkin) >=0,5 đây là trị số dung để chỉ sự thích hợp của phân tích nhân tố, nếu trị số này <0,5 thì phân tích nhân tố không thích hợp (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005). Ngoài ra ta dùng kiểm định Bartlett’s test of sphericity để kiểm định giả thuyết là các biến không có tương quan với nhau trong tổng thể, nói cách khác ma trân tương quan tổng thể là một ma trận đơn vị. Nếu giả thuyết này bị bác bỏ Sig<0,05 thì phân tích EFA là thích hợp (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005). Gía trị hội tụ, trọng số nhân tố >=0,4 sẽ được chấp nhận (Gerbing và Anderson, 1998) được trích trong (Nguyễn Đình Thọ và Nguyễn Thị Mai Trang, 2008, trang 25); Gía trị phân biệt, chênh lệch trọng số >0,3 (Nguyễn Đình Thọ, 2013, trang 420); Tổng phương sai trích (TVE), khi đánh giá EFA >=50% (Nguyễn Đình Thọ, 2013, trang 420) tổng này thể hiện các nhân số trích được bao nhiêu phần trăm của các biến đo lường. Trong nghiên cứu này, tác giả dung phương pháp trích Principal Components với phép xoay Varimax.
Đối với hồi quy, công thức kinh nghiệm để xác định kích thước mẫu tối thiểu là: n>= 50+8*p với p là số biến độc lập trong mô hình (Green, 1991) được trích trong (Nguyễn Đình Thọ, 2013, trang 521) ; đối với EFA, để sử dụng EFA chúng ta cần kích thước mẫu lớn. Vấn đề xác định kích thước mẫu bao nhiêu vẫn chưa có sự thống nhất. Trong EFA, kích thước mẫu thường xác định dựa vào (1) kích thước tối thiểu, (2) số biến được đưa vào phân tích. (Hair và cộng sự, 2006) được trích trong (Nguyễn Đình Thọ, 2013, trang 415) mẫu tối thiểu là 50 tốt nhất là 100 và tỷ lệ biến quan sát (Observations)/ biến đo lượng (Items) là 5/1 và tốt nhất là 10/1.
Dữ liệu nghiên cứu sau khi thu thập sẽ được xử lí trên phần mềm SPSS 20.0 theo trình tự sau:
Bước 1: Chuẩn bị dữ liệu: Thu thập Phiếu khảo sát đã được trả lời, làm sạch dữ liệu, mã hóa các dữ liệu cần thiết trong bảng câu hỏi bằng phần mềm SPSS.
Bước 2: Thống kê: Tiến hành thống kê mô tả dữ liệu thu thập được.
Bước 3: Phân tích độ tin cậy: Tiến hành đánh giá độ tin cậy thang đo bằng hệ số Cronbach’s Alpha.
Bước 4: Phân tích nhân tố khám phá EFA.
Bước 5: Phân tích hệ số Pearson để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng.
Bước 6: Phân tích hồi quy: Xác định mối liên hệ nhân quả giữa biến phụ thuộc và các biến độc lập.
Bước 7: Kiểm định mô hình và kiểm định giả thuyết. Phân tích thống kê mô tả
Tác giả sử dụng phép phân tích mô tả (descriptives) trong phần mềm SPSS 20.0 để phân tích các thuộc tính của mẫu nghiên cứu (các thông tin của đối tượng được khảo sát) gồm nhóm giới tính, nhóm tuổi.
Phân tích độ tin cậy (hệ số Cronbach’s Alpha)
Đo lường độ tin cậy thang đo bằng hệ số Cronbach’s Alpha là phép kiểm định phản ánh mức độ tương quan chặt chẽ giữa các biến quan sát trong cùng một nhân tố. Hệ số này cho biết trong các biến quan sát của một nhân tố, biến nào đã đóng góp tốt vào việc đo lường khái niệm của nhân tố, biến nào không.
(Cronbach 1951, trích bởi Nguyễn Đình Thọ 2013, trang 355) đưa ra chú ý rằng hệ số Cronbach’s Alpha chỉ đo lường độ tin cậy của thang đo có từ 03 biến quan sát trở lên, chứ không đo được độ tin cậy cho từng biến quan sát.
Thang đo có độ tin cậy tốt khi nó biến thiên trong khoảng [0,75-0,95]. Nếu hệ số Cronbach’s Alpha ≥ 0,6, thang đo đó có thể được chấp nhận về độ tin cậy (Nunnally & Bernsteri 1994, trích bởi Nguyễn Đình Thọ 2013, trang 365).
(Nguyễn Đình Thọ 2013, trang 364) cho rằng, về lý thuyết hệ số Cronbach’s Alpha càng cao càng tốt (thang đo càng có độ tin cậy cao). Tuy nhiên, hệ số Cronbach’s Alpha quá lớn (α > 0,95) cho thấy có nhiều biến trong thang đo không
có khác biệt gì nhau (nghĩa là chúng cùng đo lường một nội dung nào đó của khái niệm nghiên cứu). Đây là hiện tượng trùng lắp trong đo lường (redundancy). Do đó, khi kiểm tra từng biến đo lường, chúng ta cần sử dụng thêm hệ số tương quan biến tổng hiệu chỉnh (Corrected Item-Total Correlation). Hệ số này lấy tương quan của biến đo lường xem xét với tổng các biến còn lại của thang đo (không tính biến đang xem xét). Đây là tiêu chuẩn để đánh giá một biến đo lường có thực sự đóng góp giá trị vào nhân tố hay không. Nếu một biến đo lường có hệ số tương quan biến tổng hiệu chỉnh ≥ 0,3 thì biến đó đạt yêu cầu (Nunnally & Bernstein 1994).
Nhiều nhà nghiên cứu đồng ý rằng khi hệ số Cronbach’s Alpha từ 0,8 trở lên đến gần 1 thì thang đo lường tốt, từ 0,7 đến gần 0,8 là sử dụng được. Cũng có nhà nghiên cứu đề nghị rằng Cronbach’s Alpha từ 0,6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang đo lường là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu (Nunnally 1978; Peterson 1994; Slater 1995 trích bởi Hoàng Trọng và Chu Nguyễn Mộng Ngọc 2008, tập 2, trang 24).
Trong nghiên cứu này, tác giả sẽ loại bỏ những thang đo có hệ số Cronbach’s Alpha < 0,6 và loại những biến quan sát có hệ số tương quan biến tổng hiệu chỉnh <0,3 ra khỏi mô hình vì những biến quan sát này không có ý nghĩa đối với thang đo. Tuy nhiên, việc loại các biến không đạt yêu cầu còn phụ thuộc vào việc xem xét giá trị nội dung của khái niệm, chứ không chỉ đơn thuần nhìn vào con số thống kê (Nguyễn Đình Thọ 2013, trang 367).
Phân tích nhân tố khám phá EFA
Sau khi sử dụng phương pháp Cronbach’s Alpha để đánh giá độ tin cậy thang đo, tiếp theo thang đo phải được đánh giá hai giá trị quan trọng là giá trị hội tụ (convergent validity) và giá trị phân biệt (discriminant validity). Phương pháp phân tích nhân tố khám phá EFA được sử dụng để xác định và đánh giá hai giá trị này.
Với giá trị hội tụ, các biến quan sát có cùng tính chất hội tụ về cùng một nhân tố và trong ma trận xoay, các biến này sẽ nằm chung một cột. Với giá trị phân biệt, các biến quan sát hội tụ về nhân tố này và phải phân biệt với các biến quan sát ở nhân tố khác. Khi biểu diễn trong ma trận xoay, từng nhóm biến sẽ tách thành từng cột riêng biệt.
Phương pháp phân tích EFA dựa vào mối tương quan giữa các biến với nhau. EFA dùng để rút gọn một tập k biến quan sát thành một tập F (F < k) các nhân tố có ý nghĩa hơn. Cơ sở của việc rút gọn này dựa vào mối quan hệ tuyến tính của các nhân tố với các biến quan sát (Nguyễn Đình Thọ 2013, trang 378).
Để xác định sự phù hợp khi sử dụng phương pháp phân tích EFA, người ta thường tiến hành kiểm định các tiêu chí:
- Kiểm định Bartlett’s (Bartlett's Test of Sphericity): dùng để xem xét ma trận tương quan có phải là ma trận đơn vị I (indentify matrix) hay không. Kiểm định Bartlett’s có ý nghĩa thống kê khi Sig. < 0,05. Điều này chứng tỏ các biến quan sát tương quan nhau trong tổng thể (Nguyễn Đình Thọ 2013, trang 413).
- Kiểm định KMO (Kaiser-Meyer-Olkin Measure of Sampling Adequacy): là chỉ số dùng để so sánh độ lớn của hệ số tương quan giữa các biến đo lường với độ lớn của hệ số tương quan từng phần của chúng. Hệ số KMO càng lớn càng tốt vì phần chung giữa các biến càng lớn. Để sử dụng EFA, hệ số KMO phải lớn hơn 0,5. Kaiser (1974) đề nghị KMO ≥ 0,90: rất tốt; KMO ≥ 0,80: tốt; KMO ≥ 0,70: được; KMO ≥ 0,60: tạm được; KMO ≥ 0,50: xấu và KMO < 0,50: không thể chấp nhận được. Trong thực tế, với sự hỗ trợ của phần mềm xử lý thống kê SPSS, chúng ta có thể nhìn vào kết quả trọng số nhân tố và phương sai trích đạt yêu cầu thì vấn đề kiểm định Bartlett’s, KMO không còn ý nghĩa nữa vì chúng luôn luôn đạt yêu cầu (Nguyễn Đình Thọ 2013, trang 414).
- Tiêu chí Eigenvalues (đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố) là tiêu chí được sử dụng phổ biến trong xác định số lượng nhân tố trong phân tích EFA. Với tiêu chí này, số lượng nhân tố được xác định ở nhân tố (dừng ở nhân tố) có Eigenvalues tối thiểu bằng 1 (≥ 1) (Nguyễn Đình Thọ 2013, trang 410).
- Hệ số tải nhân tố (Factor Loading) còn gọi là trọng số nhân tố, λi >=0,5 là chấp nhận. Nếu λi < 0,5 chúng ta có thể xóa biến Xi vì nó thật sự không đo lường khái niệm ta cần đo. Tuy nhiên việc loại bỏ cần chú ý giá trị nội dung của biến đó đóng góp vào giá trị nội dung của khái niệm nó đo lường. Nếu mẫu lớn cũng có thể chấp nhận λi > 0,4. Khác biệt hệ số tải nhân tố của một biến quan sát giữa các nhân tố > 0,3 để tạo giá trị phân biệt (Nguyễn Đình Thọ 2013, trang 420).
- Tổng phương sai trích TVE (Total Variance Extraction) thể hiện các nhân tố trích được bao nhiêu phần trăm của các biến đo lường. Tổng này phải đạt từ 50% trở lên, nghĩa là phần chung lớn hơn phần riêng và sai số từ 60% trở lên là tốt. Khi hai điều kiện này được thỏa, có thể kết luận mô hình EFA phù hợp (Nguyễn Đình Thọ 2013, trang 420).
Trong phân tích EFA, có nhiều phép trích nhân tố (Grorsuch 1983, trích bởi Nguyễn Đình Thọ 2013, trang 408). Trong nghiên cứu này, tác giả sử dụng phương pháp trích nhân tố Principal Components và trong mô hình thành phần chính PCA sử dụng phép quay Varimax (phép quay vuông góc).
Phân tích tương quan, hồi quy
Các thang đo được đánh giá đạt yêu cầu được đưa vào phân tích tương quan, hồi quy để kiểm định các giả thuyết.
Hệ số tương quan Pearson (ký hiệu là r) là chỉ số để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa 2 biến định lượng. Giá trị r cho biết không có mối liên hệ tuyến tính, chưa hẳn 2 biến không có mối liên hệ và r cao đôi khi thực ra chẳng có quan hệ gì. Có tương quan chưa hẳn có quan hệ nhân quả. Hệ số tương quan là thước đo mang tính đối xứng (Hoàng Trọng và Chung Nguyễn Mộng Ngọc 2008, tập 1, trang 197). Trước hết, tác giả xem xét hệ số tương quan giữa sự gắn bó của nhân viên với các nhân tố ảnh hưởng đến sự gắn bó.
Phân tích hồi quy là nghiên cứu mối quan hệ phụ thuộc của biến phụ thuộc vào biến độc lập với ý tưởng ước lượng hoặc dự đoán giá trị trung bình tổng thể của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập (Hoàng Trọng và Chung Nguyễn Mộng Ngọc 2008, tập 1, trang 204).
Tác giả tiến hành phân tích hồi quy tuyến tính đa biến bằng phương pháp bình phương nhỏ nhất thông thường OLS (Ordinal Least Squares) nhằm kiểm định mối quan hệ giữa biến phụ thuộc:
Phương trình HQ tổng thể có dạng: Ŷi = β0 + β1X1i + β2X2i + … βkXki + εi
Trong đó:
- Ŷi: là giá trị dự báo. - Β0: là tung độ gốc.
- Βk: hệ số độ dốc của Ŷi theo biến Xk giữ nguyên các biến X1, X2, …Xk-1
không đổi.
- εi là thành phần ngẫu nhiên (yếu tố nhiễu)
Việc xây dựng và kiểm định mô hình hồi quy được thực hiện qua các bước: Bước 1: lựa chọn các biến đưa vào mô hình hồi quy, tác giả sử dụng phương pháp Enter, phần mềm SPSS xử lý tất cả các biến đưa vào cùng một lượt.
Bước 2: đánh giá độ phù hợp của mô hình bằng hệ số xác định R2 (R Square). Tuy nhiên, R2 có đặc điểm càng tăng khi đưa thêm các biến độc lập vào mô hình, mặc dù không phải mô hình càng có nhiều biến độc lập thì càng phù hợp với tập dữ liệu. Vì thế, R2 điều chỉnh (Adjusted R Square) có đặc điểm không phụ thuộc vào số lượng biến đưa thêm vào mô hình được sử dụng thay thế R2 để đánh giá mức độ phù hợp của mô hình hồi quy bội.
Bước 3: kiểm định độ phù hợp của mô hình để lựa chọn mô hình tối ưu bằng cách sử dụng phương pháp phân tích ANOVA để kiểm định giả thuyết H0: không có mối liên hệ tuyến tính giữa biến phụ thuộc với tập hợp các biến độc lập. Nếu trị thống kê F có Sig < 0,0 thì giả thuyết H0 bị bác bỏ, khi đó chúng ta kết luận tập hợp của các biến độc lập trong mô hình có thể giải thích cho sự biến thiên của biến phụ thuộc.
Bước 4: xác định các hệ số của phương trình hồi quy, đó là các hệ số hồi quy riêng phần βk đo lường sự thay đổi trung bình của biến phụ thuộc khi biến độc lập Xk thay đổi một đơn vị, trong khi các biến độc lập khác được giữ nguyên. Tuy nhiên, độ lớn của βk phụ thuộc vào đơn vị đo lường của các biến độc lập, vì thế việc so sánh trực tiếp chúng với nhau là không có ý nghĩa. Do đó, để so sánh các hệ số hồi quy với nhau, từ đó xác định tầm quan trọng (mức độ giải thích) của các biến độc lập cho biến phụ thuộc, người ta biểu diễn số đo của tất cả các biến độc lập bằng đơn vị đo lường độ lệnh chuẩn beta.
Bước 5: Kiểm tra vi phạm các giả định hồi quy
Mô hình hồi quy được xem là phù hợp với tổng thể nghiên cứu khi không vi phạm các giả định. Vì thế, sau khi xây dựng được phương trình hồi quy, cần phải dò tìm các vi phạm giả định cần thiết sau đây:
(Scatter) biểu thị tương quan giữa giá trị phần dư chuẩn hóa (Standardized Residual) và giá trị dự đoán chuẩn hóa (Standardized Pridicted Value).
- Phương sai của sai số không đổi: Vẽ đồ thị phần dư theo giá trị ước lượng ŷ từ mô hình hồi quy và quan sát xem có hiện tượng phương sai thay đổi không. Nếu các điểm phân tán trên đồ thị cho không thấy có mối liên hệ nào giữa phần dư và giá trị ŷ có thể kết luận hiện tượng phương sai thay đổi không xảy ra
- Phân phối chuẩn của phần dư: Công cụ để kiểm tra là đồ thị tần số Histogram hoặc đồ thị tần số P-P plot.
- Tính độc lập của các sai số (không có tương quan giữa các phần dư): Công cụ để kiểm tra là đại lượng thống kê d (Durbin - Watson) hoặc đồ thị phân tán phần dư chuẩn hóa.
- Không có mối tương quan giữa các biến độc lập (không có hiện tượng đa cộng tuyến): Công cụ để phát hiện tồn tại hiện tượng đa cộng tuyến là độ chấp nhận của biến (Tolerance) hoặc hệ số phóng đại phương sai (Variance inflation factor -