Hình 3.2 Quy trình thu thập mẫu 3.3.2 Cỡ mẫu
Về nguyên tắc cỡ mẫu càng lớn, số liệu phân tích, thống kê mô tả sẽ có chỉ số độ tin cậy càng cao. Tuy nhiên điều này cũng tuyến tính với chi phí và thời lượng. Một cỡ mẫu phù hợp được gợi ý trong nhiều giáo trình thống kê ứng dụng, mà phổ
Lựa chọn thang đo Thiết kế sơ bộ bảng câu hỏi
Phỏng vấn thử nghiệm
Thu hồi, chỉnh sửa bảng câu hỏi
Duyệt lại bảng câu hỏi
Phát hành chính thức - Duyệt tài liệu
- Tham khảo ý kiến chuyên gia - Kinh nghiệm bản thân
biến chúng ta sử dụng cỡ mẫu từ 4 đến 5 lần số biến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Tùy vào phương pháp ước lượng có những tiêu chuẩn cỡ mẫu tối thiểu khác nhau. Hair & ctg (1998) đề xuất từ 100 – 150. Hoelter (1983) yêu cầu kích thước mẫu tới hạn khoảng 200. Nghiên cứu này chọn cỡ mẫu bằng 5 lần số biến quan sát.
3.3.3 Phương pháp chọn mẫu
Có 2 phương pháp lấy mẫu xác suất và phi xác xuất trong quá trình khảo sát nghiên cứu, tùy vào mục đích, tầm quan trọng thời gian và kinh phí dành cho nghiên cứu mà có một cách tiếp cận phù hợp.
Trong nghiên cứu này thực hiện theo phương thức lấy mẫu phi xác xuất, là phương pháp chọn các phần tử tham gia vào mẫu không theo quy luật, ngẫu nhiên, cách lấy mẫu dễ tiếp cận, ít tốn kém thời gian và chi phí, phù hợp với tiến trình nghiên cứu.
3.3.4 Phương pháp thu thập dữ liệu
Mẫu được thu thập qua bảng câu hỏi, các biến quan sát được sử dụng thang đo Linkert, với 5 mức độ: (1) Hoàn toàn không không hài lòng, (2) Không hài lòng, (3) Không ý kiến, (4) Hài lòng, (5) Hoàn toàn hài lòng. Được phát hành và phản hồi trực tiếp. Để thu được nhiều mẫu khảo sát, bảng câu hỏi thiết kế với ngôn ngữ rõ ràng, câu hỏi ngắn gọn, súc tích, nêu được trọng tâm của vấn đề nghiên cứu.
Trong nghiên cứu này với 25 biến trực tiếp và 3 biến phụ thuộc, kích thước mẫu tương đương 140 phiếu khảo sát, để thu được kích thước mẫu theo yêu cầu, 220 phiếu đã được phát ra, kết quả thu được 160 phiếu hợp lệ (Phụ lục 2).
3.3.5 Cấu trúc bảng câu hỏi
Cấu trúc bảng câu hỏi (Phụ lục 1) được chia làm 3 phần:
Phần 1: Giới thiệu thông tin bản thân, tên đề tài nghiên cứu, cam kết bảo mật thông tin đáp viên và hướng dẫn lựa chọn đáp án theo thang đo 5 điểm của Linker.
yếu tố ảnh hưởng đến sự hài lòng trong công việc của nhân viên ngành xây dựng làm việc trong môi trường Nhà nước tại tỉnh Trà Vinh.
Phần 3: Các câu hỏi về thông tin nhân khẩu, như giới tính, độ tuổi, tình trạng hôn nhân, vị trí công việc...
3.4 Thang đo các yếu tố ảnh hưởng
Các nhân tố trong thang đo các yếu tố ảnh hưởng (Bảng 3.1) được xây dựng từ các giả thiết, các nghiên cứu trước đó. Qua nghiên cứu định tính đã được bổ sung, hiệu chỉnh phù hợp với mục tiêu nghiên cứu. Các nhóm nhân tố ảnh hưởng đến sự hài lòng của nhân viên ngành xây dựng làm việc trong môi trường Nhà nước tại tỉnh Trà Vinh được đề xuất: tính chất địa phương, cơ hội thăng tiến, lương và phụ cấp, môi trường làm việc, lãnh đạo, đồng nghiệp, đạo đức nghề nghiệp, và nhóm biến phụ thuộc là sự hài lòng.
Bảng 3.1 Thang đo các yếu tố ảnh hưởng
STT Thang đo yếu tố ảnh hưởng
Tính chất địa phương
1. Là người địa phương hoặc lân cận thuận tiện trong công việc và sinh hoạt
2. Tính chất địa phương tạo mối quan hệ rộng rãi, tương tác và lợi ích
3. Mong muốn cống hiến, phục vụ và kiến thiết quê hương
Cơ hội thăng tiến
4. Nhiều cơ hội và chính sách thăng tiến minh bạch
6. Được thăng tiến theo thời gian tham gia công tác 7. Được đào tạo, học tập và phát triển kỹ năng
Lương và phụ cấp
8. Lương và phụ cấp hợp lý với trách nhiệm và đóng góp 9. Có những khoản thu nhập ngoài lương
10. Là đối tượng được hưởng lợi ích từ những chính sách an sinh xã hội 11. Chế độ lương hưu trí, tạo sự an tâm lâu dài
Môi trường làm việc
12. Được trang bị đầy đủ phương tiện, an toàn, sạch sẽ và không độc hại 13. Ít áp lực và cạnh tranh
14. Môi trường quan hệ đa ngành, kiện toàn năng lực quản lý nhà nước 15. Môi trường cơ quan công quyền tạo nhiều ưu thế so với doanh nghiệp
tư nhân
Lãnh đạo
16. Cấp trên luôn lắng nghe, chia sẻ trách nhiệm và trân trọng đóng góp của bạn
18. Năng lực của ban lãnh đạo tạo sự an tâm trong công tác 19. Lãnh đạo luôn hỗ trợ và quan tâm đời sống nhân viên
Đồng nghiệp
20. Đồng nghiệp đáng tin cậy trong công việc 21. Luôn phối hợp và hỗ trợ nhau
22. Thân thiện và dễ chia sẻ
Đạo đức nghề nghiệp
23. Nhận thức rõ vai trò, trách nhiệm trong công việc
24. Tuân thủ chuẩn mực chuyên môn, trung thực và có nguyên tắc trong công việc
25. Đặt lợi ích xã hội lên trên lợi ích cá nhân
Hài lòng công việc
26. Hài lòng với công việc hiện tại
27. Là nơi làm việc khả dĩ nhất 28. Có kế hoạch gắn bó lâu dài
3.5.1 Làm sạch dữ liệu
Làm sạch dữ liệu: là một khâu quan trọng trước khi phân tích dữ liệu, làm hạn chế các sai sót trong bộ số liệu, giúp tiết kiệm thời gian và tránh sai sót. Trong bước phân tích này tiến hành loại bỏ những mẫu không phù hợp như: bỏ trống quá nhiều đáp áp, chọn nhiều đáp áp cho một biến quan sát, lỗi ngoài khoảng cho phép (câu hỏi mở)…
3.5.2 Thống kê mô tả dữ liệu
Thống kê mô tả được sử dụng để mô tả những đặc tính cơ bản của dữ liệu thu thập được như: độ tuổi, giới tính, vị trí công việc, thời gian tham gia công tác….
Dùng các công cụ thống kê như: tần suất, tỷ lệ phần trăm, giá trị Mean…
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), giá trị Mean phản ánh mức độ hài lòng, biến quan sát có giá trị Mean càng cao thì mức độ hài lòng càng cao (Bảng 3.2).
Bảng 3.2 Ý nghĩa giá trị Mean
Mean Ý nghĩa 1.00 – 1.80 Rất không đồng ý 1.81 – 2.60 Không đồng ý 2.61 – 3.40 Không ý kiến 3.41 – 4.20 Đồng ý 4.21 – 5.00 Rất đồng ý
3.5.3 Đánh giá độ tin cậy của thang đo
Hệ số Cronbach’s Alpha để kiểm định thống kê về mức độ tin cậy và tương quan trong giữa các biến quan sát trong thang đo, có giá trị từ 0.6 đến gần 1 thì mới
đảm bảo các biến trong cùng một nhân tố có tương quan với nhau (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Khi hệ số Cronbach’s Alpha có giá trị 0.8 – 1.0 thang đo được cho là tốt, ở mức 0.7 – 0.8 là sử dụng được.
Bảng 3.3 Ý nghĩa hệ số Cronbach’s Alpha
Cronbach’s Alpha Ý nghĩa thang đo
0.8 – 1. 0 Tốt
0.7 – 0.8 Sử dụng được
> 0.6 Đảm bảo các biến tương quan < 0.3 Biến rác loại bỏ
Trong nghiên cứu này các biến có hệ số Cronbach’s Alpha ở mức 0.6 được giữ lại và tiếp tục phân tích, và hệ số tương quan biến tổng lớn hơn 0.3. Các biến vi phạm một trong hai tiêu chí này được xem là biến rác và sẽ bị loại bỏ.
3.5.4 Phân tích nhân tố
Phân tích nhân tố là cách rút gọn và tóm tắt dữ liệu, các nhân tố được rút gọn đến một số lượng mà chúng ta có thể sử dụng được, và những nhân tố này vẫn chứa đựng được hầu hết nội dung thông tin của tập biến quan sát ban đầu. Nghiên cứu này sẽ phân tích thành phần chính PCA (Principal Components Analysis) và phép xoay nhân tố (Varimax). Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), ý nghĩa và các thông số thống kê quan trọng trong phân tích nhân tố bao gồm:
Bartlett’s test of sphericity: Kiểm định Bartlett để kiểm định các biến không có tương quan trong tổng thể. Điều kiện áp dụng là các biến phải có tương quan trong, nghĩa là mức ý nghĩa sig. < 0.05.
Chỉ số KMO (Kaiser- Meyer -Olkin): là trị số dùng để đánh giá sự phù hợp của của phân tích nhân tố, trị số KMO nằm giữa 0.5 và 1 thì việc phân tích nhân
tố cho dữ liệu là thích hợp.
Eigenvalues đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố. Có giá trị lớn hơn 1, Eigenvalues nhỏ hơn 1 không tốt hơn biến gốc.
Percentage of variance (phần trăm phương sai trích): giải thích % sự biến thiên của các biến quan sát, tổng phương sai trích yêu cầu là lớn hơn 50%.
Factor loadings (hệ số tải nhân tố): hệ số tải nhân tố lớn hơn hoặc bằng 0.5 để đảm bảo mức ý nghĩa thiết thực.
3.5.5 Phân tích tương quan và hồi quy đa biến 3.5.5.1 Phân tích tương quan 3.5.5.1 Phân tích tương quan
Phân tích tương quan để xem xét mối liên hệ tương quan giữa các biến độc lập (biến giải thích) và phụ thuộc (biến được giải thích) trong tập hợp. Hệ số tương quan cho phép dự đoán mức độ ảnh hưởng của biến giải thích lên mô hình.
Hệ số tương quan Pearson (r) có giá trị trong đoạn [-1;1]. Giá trị tuyệt đối r cao thể hiện mức độ phù hợp của dữ liệu, tương quan tuyến tính giữa 2 biến càng lớn và ngược lại. Tại giá trị r = 0 (hoặc lân cận 0) không có sự tương quan giữa 2 biến. Giá trị đại số r > 0, quan hệ giữa 2 biến là đồng biến, r < 0 quan hệ nghịch biến.
Nếu các biến độc lập có tương quan ‘chặt’ với nhau, phải lưu ý đến vấn đề đa cộng tuyến khi phân tích hồi quy.
3.5.5.2 Phân tích hồi quy đa biến
Phân tích hồi quy: là nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc) vào một hay nhiều biến khác (gọi là các biến độc lập), với ý tưởng ước lượng và/ hoặc dự đoán giá trị trung bình (tổng thể) của biến phụ thuộc trên cơ sở các giá trị biết trước (trong mẫu) của các biến độc lập (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2011)
Phương trình hồi quy tổng thể, với k biến độc lập:
Yi = β0 + β1X1i + β2X2i + β3X3i +…..+ βkXki
của Y, trên mỗi đơn vị Xk, không kể đến ảnh hưởng của các biến X còn lại.
Hệ số biến thiên R2: dùng để xác định phần biến thiên trong biến phụ thuộc được giải thích bởi mối liên hệ giữa biến phụ thuộc và tất cả biến độc lập trong mô hình. R2 = 0 mô hình hồi quy đã xây dựng không có tác dụng trong việc dự đoán hay mô tả biến phụ thuộc. Giá trị R2 có phổ giá trị từ 0 đến 1, giá trị càng tiến về 1 cho thấy mức độ phù hợp của mô hình, và ngược lại giá trị R2 dần về không cho thấy sự bất hợp lý của mô hình hồi quy. Một đặc tính khác của R2 là giá trị của nó tuyến tính với biến độc lập, điều này cho thấy R2 được nhìn nhận có xu hướng là một ước lượng lạc quan. Khi đó sử dụng hệ số R2 điều chỉnh (Adjusted R square) sẽ phản ánh sát hơn mức độ phù hợp của mô hình hồi quy. Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), R2 điều chỉnh không thổi phòng mức độ phù hợp của mô hình.
Kiểm định F: trong phân tích ANOVA để kiểm định về sự toàn diện của mô hình hồi quy, các hệ số sig. < 0.05 thì mới có ý nghĩa về mặt thống kê, nghĩa là độ tin cậy là trên 95%.
3.5.5.3 Dò tìm sự vi phạm các giả định cần thiết trong mô hình
Kiểm tra về giả định liên hệ tuyến tính:
Hình 3.3 Scatterplot ngẫu nhiên
(Regression Standardized Residual) và giá trị dự đoán chuẩn hóa trên trục hoành (Regression Standardized Predicted Value). Giả định không bị vi phạm nếu các điểm phân tán một cách ngẫu nhiên (Hình 3.3). Nếu chúng phân phối theo đường bậc 2, bậc 3 Cubic (Hình 3.4).... nhiều khả năng bộ dữ liệu không phù hợp với phân tích hồi quy.
Hình 3.4 Scatterplot ‘ước lượng’ bậc 3 Cubic
Kiểm tra về giả định phương sai của sai số không đổi
Kiểm định Spearman là phép toán kiểm định hiện tượng phương sai của sai số thay đổi trong mô hình hồi quy tuyến tính đơn giản. Phương pháp này được thực hiện bằng cách lấy giá trị tuyệt đối của phần dư chuẩn hóa (Absolute of Standardized Residuals, ABSRES) kiểm định với từng biến độc lập. Với giả thiết H0 là hệ số tương quan hạng tổng thể bằng 0. Nếu có cơ sở bác bỏ giả thiết H0 (sig. < 0.05), nghĩa là phương sai của sai số không đổi. Và ngược lại, sig. > 0.05, thì có thể kết luận phương sai của sai số thay đổi.
Kiểm tra về tính độc lập của sai số: Dùng hệ số Durbin Watson, giá trị của hệ số xấp xỉ bằng 2 là sử dụng được.
Xây dựng biểu đồ Histogram hoặc Q-Q lot, nếu các điểm bám dọc đường 450
thì không vi phạm giả định về phân phối chuẩn của phần dư.
Kiểm tra về giả định không có mối tương quan giữa các biến độc lập (đa cộng tuyến)
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2011), mô hình hồi quy tuyến tính bội yêu cầu các biến độc lập không có tương quan chặt với nhau. Nếu 2 hoặc lớn hơn 2 biến độc lập có tương quan chặt với nhau thì được cho là xảy ra hiện tượng đa cộng tuyến trong mô hình. Khi đó, các biến có tương quan chặt không cung cấp được thông tin và mức độ ảnh hưởng lên mô hình. Cách nhận dạng hiện tượng đa cộng tuyến trong mô hình:
Hệ số phóng đại phương sai VIF (Variance Inflation Factor), được tính bằng nghịch đảo của R, VIF không vượt quá 5, nhiều quan điểm phân tích cho rằng VIF nên chấp nhận ở mức không vượt quá 10.
Độ chấp nhận của biến (Tolertance) nếu nhỏ hơn 0.2.
3.5.6 Phân tích phương sai một nhân tố (One-Way ANOVA)
Phân tích ANOVA để xem xét mức độ ảnh hưởng của các yếu tố cá nhân lên mô hình, giúp giải thích được mô hình toàn diện hơn. Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2011), một số giả định cần đáp ứng khi phân tích ANOVA:
Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn.
Phương sai của các nhóm so sánh phải đồng nhất.
3.5.6.1 Kiểm định sự bằng nhau của phương sai (Test of Homogeneity of Variances) Variances)
Levene test với giả thiết H0 là ‘phương sai bằng nhau’, sig. < 0.05 bác bỏ H0 (dùng kiểm định phi tham số Kruskal-Walli), ngược lại sig. >= 0.05: chấp nhận H0, đủ điều kiện để phân tích tiếp ANOVA.
ANOVA test với giả thiết H0 ‘trung bình bằng nhau’, sig. < 0.05: bác bỏ H0, đủ điều kiện để khẳng định có sự khác biệt. Sig. >= 0.05: chấp nhận H0, chưa đủ điều kiện để khẳng định có sự khác biệt.
Khi có sự khác biệt thì có thể phân tích sâu hơn để tìm ra sự khác biệt như thế nào giữa các nhóm quan sát.
3.5.6.2 Kiểm định Independent Sample T-test
Independent Sample T-test để so sánh giá trị trung bình của nhóm nhân tố có 2 biến riêng biệt.
Levene test với giả thiết H0 là ‘phương sai bằng nhau’, sig. < 0.05: bác bỏ H0, sử dụng kết quả kiểm định t ở phần Equal variances not assumed.
Levene test, sig. >= 0.05: chấp nhận H0, sử dụng kết quả kiểm định t ở phần Equal variances assumed.
Trong kiểm định t, sig. < 0.05, có sự khác biệt có ý nghĩa về giá trị trung bình. Ngược lại sig. > 0.05, không có sự khác biệt có ý nghĩa về giá trị trung bình.
3.5.7 Mã hóa dữ liệu
Bảng 3.4 Mã hóa dữ liệu
STT Thang đo yếu tố ảnh hưởng Tên biến
mã hóa
Tính chất địa phương Tcdp
1. Là người địa phương hoặc lân cận thuận tiện trong công
việc và sinh hoạt Tcdp1
2. Tính chất địa phương tạo mối quan hệ rộng rãi, tương tác