2.3.3.1. Làm sạch số liệu
Các bảng câu hỏi khảo sát sau khi thu thập cần thực hiện việc kiểm soát lỗi, chỉnh sửa trước khi nhập liệu vào phần mềm SPSS 16. Dữ liệu sau khi nhập cần kiểm tra các sai sót trong khi nhập liệu, kiểm tra chất lượng của việc phỏng vấn có sai sót hay hiểu nhầm không. Để làm sạch dữ liệu cần sử dụng bảng tần số, bảng phối hợp nhiều biến và kiểm tra ngay trên của sổ dữ liệu của phần mềm SPSS 16.
2.3.3.2. Đánh giá độ tin cậy của thang đo và độ giá trị của thang đo
a. Đánh giá hệ số Cronbach's alpha
Hệ số Cronbach alpha là hệ số đo lường độ tin cậy của thang đo tổng chứ không phải là hệ số tin cậy của từng thang đo (Nguyễn Đình Thọ, 2011). Hệ số α của Cronbach là một phép kiểm định thống kê về mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau. (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).
Nhiều nhà nghiên cứu đồng ý rằng khi Cronchbach alpha từ 0.8 trở lên đến gần 1 thì thang đo lường là tốt, từ 0.7 đến gần 0.8 là sử dụng được. Cũng có nhà nghiên cứu đề nghị rằng hệ số alpha từ 0.6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang nghiên cứu là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu (Nunnally, 1978; Peterson, 1997; Slater, 1995, dẫn theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc,, 2005).
Vì vậy, đối với nghiên cứu này thì hệ số Crobach alpha tử 0.6 trở lên là chấp nhận được.
b. Phân tích nhân tố khám phá EFA
Phương pháp phân tích phám khá EFA (Exploratory Factor Analysis) được sử dụng để đánh giá độ giá trị của thang đo (Nguyễn Đình Thọ, 2011). Các biến có hệ số tương quan tổng nhỏ hơn 0.3 được coi là biến rác và sẽ bị loại khỏi thang đo (theo Nunnally & Burntein (1994). Trong nghiên cứu này, phân tích EFA sử dụng phương pháp Principal Component Analysis với phép xoay Varimax và điểm dừng khi trích các yếu tố có Eigenvalue ≥ 1 được sử dụng. Trong quá trình phân tích EFA các item, thang đo không đạt yêu cầu sẽ bị loại. Tiêu chuẩn chọn là các item phải có hệ số tải nhân tố (factor loading) > 0.4, tổng phương sai trích ≥ 0.50, hệ số của phép thử KMO
(Kaiser-Meyer-Olkin of Sampling Adeqacy) > 0.05 (Hair và cộng sự, 2006).
c. Thống kê mô tả
Thống kê mô tả cho phép các nhà nghiên cứu trình bày các dữ liệu thu được dưới hình thức cơ cấu và tổng kết (Huysamen, 1990). Các thống kê mô tả sử dụng trong nghiên cứu này để phân tích, mô tả dữ liệu bao gồm các tần số, tỷ lệ, giá trị trung bình và độ lệch chuẩn.
Thang đo Likert 5 mức độ được sử dụng trong nghiên cứu này. Do đó, để thuận tiện cho việc nhận xét khi sử dụng giá trị trung bình (Mean) đánh giá mức độ thỏa mãn đối với từng yếu tố và sự thỏa mãn chung được quy ước:
- Mean = 3.00 – 3.24 mức trung bình - Mean = 3.25 – 3.49 mức trung bình khá - Mean = 3.50 – 3.74 mức khá cao
- Mean = 3.75 – 3.99 mức cao - Mean > 4.00 mức rất cao
d. Hệ số tương quan Pearson:
Hệ số tương quan Pearson (ký hiệu r) để lượng hoá mức độ chặt chẽ của mối liên hệ tuyến tính giữa 2 biến định lượng. Nhìn chung r được sử dụng để kiểm tra liên hệ giữa những biến định lượng. Hệ số tương quan có giá trị từ -1 đến 1. Hệ số tương quan bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau, ngược lại nếu hệ số bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối.
-1 ≤ r + ≤ 1
Diễn giải hệ số tương quan (r): (Fraenkel & Wallen, 2006): Từ + .75 đến + 1.0 có mối quan hệ rất chặt chẽ
Từ + .50 đến + .75 có mối quan hệ chặt chẽ vừa phải Từ + .25 đến + .50 có mối quan hệ yếu
Từ + .00 đến + .25 có mối quan hệ kém chặt chẽ
Trị tuyệt đối của r cho biết mức độ chặt chẽ của mối liên hệ tuyến tính. Giá trị tuyệt đối của r tiến gần đến 1 khi hai biến có mối tương quan tuyến tính chặt chẽ. (giá trị của r cho biết không có mối liên hệ tuyến tính giữa 2 biến chưa hẳn có nghĩa là 2 biến đó không có mối liên hệ). Do đó hệ số tương quan tuyến tính chỉ nên được sử dụng để biểu thị mức độ chặt chẽ của liên hệ tương quan tuyến tính. (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005).
Hệ số tương quan Pearson là loại đo lường tương quan được sử dụng nhiều nhất trong khoa học xã hội khi phân tích mối quan hệ giữa hai biến khoảng cách/tỷ lệ. Trong nghiên cứu này, hệ số tương quan Pearson được sử dụng để xác định các yếu tố ảnh hưởng quan trọng đến sự thỏa mãn của người lao động.
Hầu hết theo các nhà nghiên cứu, kích cỡ mẫu tối thiểu có thể chấp nhận được đối với một nghiên cứu tương quan không được dưới 30 (Fraenkel & Wallen, 2006). Trong nghiên cứu này, dữ liệu được thu thập từ 295 trường hợp vì vậy điều kiện ràng buộc về phân phối chuẩn của dữ liệu có thể bỏ qua khi thực hiện kiểm định ý nghĩa thống kê cho hệ số tương quan r.
Để kiểm định giả thuyết theo nghiên cứu về mối quan hệ giữa sự thỏa mãn chung và các yếu tố ảnh hưởng, đề tài sử dụng phép kiểm định t của Student (T-Test) kết hợp với đồ thị phân tán (Scatterplots) tìm ra ý nghĩa thống kê khi phản ánh mối quan hệ thật sự trong tổng thể nghiên cứu.
e. Phân tích phương sai ANOVA
Kỹ thuật phân tích phương sai một yếu tố (One-Way ANOVA) được áp dụng trong nghiên cứu này để tìm ra ý nghĩa thống kê của những khác biệt trung bình giữa biến phụ thuộc là sự hài lòng chung và các biến độc lập thuộc đặc tính từng cá nhân như: giới tính, tuổi tác, trình độ học vấn, thời gian công tác, vị trí công tác, đơn vị công tác và thu nhập của người lao động.
Trước khi tiến hành phân tích ANOVA, tiêu chuẩn Levene được tiến hành để kiểm tra giả thuyết bằng nhau của phương sai trong các nhóm với xác suất ý nghĩa Significance là 5%. Trong phép kiểm định này, nếu xác suất ý nghĩa lớn hơn 5% thì chấp nhận tính bằng nhau của các phương sai nhóm.
Tiêu chuẩn Fishier F trong phép phân tích phương sai ANOVA với mốc để so sánh các xác suất ý nghĩa Sig. là 5% được áp dụng. Trong phép kiểm định này, nếu xác suất ý nghĩa nhỏ hơn 5% thì ta có quyền bác bỏ giả thuyết.
f. Phân tích hồi quy tuyến tính
Đề tài sử dụng phương pháp hồi quy để dự đoán cường độ tác động của các yếu tố thỏa mãn công việc đến sự thỏa mãn chung của người lao động. Biến phụ thuộc là yếu tố “mức độ thỏa mãn công việc” và biến độc lập là các yếu tố thỏa mãn được rút ra từ quá trình phân tích EFA và kiểm định với mức ý nghĩa 5%. Mô hình dự đoán có thể là:
Yi = β0 + β1 X1i +β2 X2i +β3 X3i + … βk Xki + εi Trong đó:
Yi = biến phụ thuộc (mức độ thỏa mãn của người lao động)
Xk = các biến độc lập (các yếu tố tác động đến sự thỏa mãn của người lao động) β0 = hằng số
βk = các hệ số hồi quy (i > 0)
εi = thành phần ngẫu nhiên hay yếu tố nhiễu
Biến phụ thuộc là yếu tố sự thỏa mãn chung và biến độc lập là các yếu tố thỏa mãn được rút ra từ quá trình phân tích nhân tố EFA và có ý nghĩa trong phân tích tương quan Pearson. Kết quả của mô hình sẽ giúp ta xác định được mức độ ảnh hưởng
của các yếu tố tác động đến sự thỏa mãn trong công việc của người lao động. Phân tích hồi quy tuyến tính đa biến bằng phương pháp Enter, trong đó biến phụ thuộc là sự thỏa mãn công việc nói chung, biến độc lập là các biến được xác định sau khi phân tích nhân tố khám phá.
Trong phương pháp này, hệ số xác định R2 điều chỉnh được dùng để xác định độ
phù hợp của mô hình, kiểm định F dùng để khẳng định khả năng mở rộng mô hình này áp dụng cho tổng thể cũng như kiểm định t để bác bỏ giả thuyết các hệ số hồi quy của tổng thể bằng 0.
Cuối cùng, nhằm đảm bảo độ tin cậy của phương trình hồi quy được xây dựng cuối cùng là phù hợp, dò tìm sự vi phạm của giả định trong hồi quy tuyến tính cũng được thực hiện. Các giả định được kiểm định trong phần này gồm liên hệ tuyến tính (dùng biểu đồ phân tán Scatterplot), phương sai của phần dư không đổi, phân phối chuẩn của phần dư (dùng Histogram và P-P plot), tính độc lập của phần dư (dùng đại lượng thống kê Durbin-Watson), hiện tượng đa cộng tuyến (tính độ chấp nhận Tolerance và hệ số phóng đại VIF).