a) Quá trình xử lý dữ liệu ban đầu
Loại các bảng trả lời không phù hợp
Thời gian thu thập dữ liệu bắt đầu từ 4/2017 đến 9/2017. Sau khi tập hợp, bước đầu tiên của xử lý thông tin thu thập được là loại bỏ bảng câu hỏi không phù hợp.
Tổng số bảng câu hỏi thu thập được là 255 bảng, trong đó nhận thấy bảng câu hỏi số 123, 73, 203 người trả lời có dấu hiệu trả lời thiếu thiện chí, các câu trả lời đều là hoàn toàn đồng ý. Trường hợp tương tự là 19, người trả lời một cách tiêu cực, các câu trả lời hầu hết là hoàn toàn không đồng ý. Trường hợp số 190 bị bỏ sót năm câu liên tục về đồng nghiệp. Như vậy sau khi xem xét, loại 05 bảng trả lời là 123, 72, 203, 19, 190; số bảng câu hỏi đưa vào nhập liệu là 250 bảng.
Làm sạch dữ liệu
Trong phần khai báo số năm kinh nghiệm, có một trường hợp khai kinh nghiệm 0,5 năm và một trường hợp khai 2,5 năm. Để cho thống nhất với các câu trả lời khác, trường hợp kinh nghiệm 0,5 năm sẽ sửa lại thành 1 năm và trường hợp khai 2,5 năm sửa thành 3 năm.
b) Một số phương pháp thống kê được sử dụng trong nghiên cứu Thống kê mô tả
Mẫu thu thập được sẽ được tiến hành thống kê phân loại theo các biến phân loại theo các tiêu chí phân loại doanh nghiệp như: Giới tính, độ tuổi, trình độ học vấn, số năm công tác và vị trí làm việc. Đồng thời tính điểm trung bình, giá trị lớn nhất, giá trị nhỏ nhất và độ lệch chuẩn của các câu trả lời trong bảng hỏi thu thập được.
Đánh giá độ tin cậy của thang đo
Sử dụng Cronbach’s Alpha để kiểm tra độ tin cậy của các tham số ước lượng trong tập dữ liệu theo từng nhóm yếu tố trong mô hình nghiên cứu đề xuất. Những biến nào không đảm bảo độ tin cậy sẽ bị loại khỏi tập dữ liệu.
- Mục đích của đánh giá độ tin cậy của thang đo là tìm hiểu xem các biến quan sát có cùng đo lường cho một khái niệm cần đo hay không. Để biến được biến nào đóng góp nhiều hay ít, ta dựa vào hệ số tương quan biến – tổng.
Tuy nhiên, hệ số tin cậy Cronbach’s Alpha chỉ cho biết các biến quan sát có liên kết với nhau hay không nhưng không cho biết biến quan sát nào cần giữ lại và biến quan sát nào cần bỏ đi. Khi đó, việc tính toán hệ số tương quan biến – tổng sẽ giúp loại ra những biến quan sát nào không đóng góp nhiều cho sự mô tả của các khái niệm cần đo (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).
* Các tiêu chí được sử dụng khi thực hiện đánh giá độ tin cậy của thang đo:
- Hệ số tương quan biến – tổng của các biến quan sát tối thiểu phải đạt 0,3. Những biến quan sát nào có hệ số tương quan biến – tổng nhỏ hơn 0,3 sẽ bị loại khỏi mô hình.
- Độ tin cậy Cronbach’s Alpha của thang đo phải từ 0,6 trở lên (Cronbach’s Alpha càng lớn thì độ nhất quán nội tại càng cao).
- Các mức giá trị của Cronbach’s Alpha: lớn hơn 0,8 là thang đo lường tốt; từ 0,7 đến 0,8 là sử dụng được; từ 0,6 trở lên là có thể sử dụng trong trường hợp khái niệm nghiên cứu là hoàn toàn mới hoặc là mới trong bối cảnh nghiên cứu (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).
Tóm lại, đối với nghiên cứu này, những biến có hệ số tương quan biến tổng nhỏ (dưới 0,4) sẽ được coi là biến rác và bị loại khỏi mô hình, đồng thời thang đo được chấp nhận khi hệ số tin cậy Cronbach’s Alpha đạt từ 0,7 trở lên.
Phân tích nhân tố khám phá EFA (Exploratory Factors Analysis)
Hệ số (Kaiser – Meyer – olkin) KMO là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số KMO lớn (giữa 0.5 và 1) có ý nghĩa làm phân tích nhân tố thích hợp, còn nếu như trị số này nhỏ hơn 0.5 thì phân tích nhân tố có khả năng không thích hợp với các dữ liệu ( Trọng và Ngọc, 2005). Kiểm định Bartlett có ý nghĩa thống kê (Sig. < 0.05): Đây là một đại lượng thống kê dùng để xem xét giả thuyết các biến không có tương quan trong tổng thể. Nếu kiểm định này có ý
nghĩa thống kê (Sig. < 0.05) thì các biến quan sát có mối tương quan với nhau trong tổng thể.
Các biến có hệ số truyền tải (Factor Loading) nhỏ hơn 0.5 bị loại, điểm dừng khi Evigenvalue (đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố) lớn hơn 1. Nếu 1 biến quan sát tải lên ở cả 2 nhân tố, chúng ta cần xem xét 2 trường hợp nhỏ. Trường hợp 1, biến quan sát tải lên ở cả 2 nhân tố, chúng ta cần lưu ý chênh lệch hệ số tải Factor Loading của biến quan sát giữa 2 nhóm nhân tố. Theo các nhà nghiên cứu, nếu chênh lệch hệ số tải nhỏ hơn 0.3, chúng ta cần loại bỏ biến quan sát đó. Tuy nhiên, chúng ta cũng cần xem xét đóng góp của biến vào giá trị nội dung của nhân tố trước khi quyết định loại bỏ hay giữ lại biến quan sát (Nguồn: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 420). Trường hợp 2, 2 hệ số tải chênh nhau từ 0.3 trở lên, khi đó biến quan sát sẽ được giữ lại và nó sẽ nằm ở nhóm nhân tố có hệ số tải cao hơn.
Phép trích Principal axis factoring với phép quay Promax sẽ được sử dụng trong phân tích nhân tố thang đo các thành phần độc lập. Dùng phương pháp trích nhân tố Principal axis factoring với phép quay Promax sẽ phản ánh cấu trúc dữ liệu chính xác hơn dùng phương pháp Principal component với phép quay Varimax (Gerbing & Anderson, 1988).
Bước đầu tiên cần kiểm tra xem bộ dữ liệu có thể dùng cho phân tích nhân tố hay không. Việc kiểm tra này thông qua việc tính hệ số KMO and Bartlett’s Test . Hệ số KMO = 0.772 (>0.5) và Sig <0.05 cho thấy các biến này có tương quan đến nhau và phù hợp cho việc đưa vào phân tích nhân tố.
Phân tích hồi quy đa biến
Sau quá trình thực hiện kiểm định thang đo: sử dụng hệ số tin cậy Cronbach’s Alpha và phân tích nhân tố khám phá EFA; tiến hành tính toán trọng số của nhân tố (giá trị của các nhân tố trích được trong phân tích nhân tố khám phá EFA) bằng cách tính trung bình cộng của các biến quan sát thuộc nhân tố tương ứng.
Các nhân tố được trích ra trong phân tích nhân tố được sử dụng cho phân tích hồi quy đa biến để kiểm định mô hình nghiên cứu và các giả thuyết kèm theo. Các kiểm
định giả thuyết thống kê đều sử dụng mức ý nghĩa 5%. Phân tích tương quan:
- Kiểm định mối tương quan tuyến tính giữa các biến trong mô hình (giữa biến phụ thuộc với các biến độc lập và giữa các biến độc lập với nhau). Đồ thị phân tán cũng cung cấp thông tin trực quan về mối quan hệ tuyến tính giữa hai biến. Sử dụng hệ số tương quan Pearson để lượng hóa mức độ chặt chẽ mối quan hệ tuyến tính giữa hai biến định lượng: giá trị tuyệt đối của hệ số Pearson càng gần đến 1 thì hai biến này có mối tương quan tuyến tính càng chặt chẽ (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).
- Trong mô hình nghiên cứu, kỳ vọng có mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc và các biến độc lập, đồng thời cũng xem xét mối tương quan giữa các
biến độc lập với nhau để nhận dạng hiện tượng đa cộng tuyến.
Để kiểm định mối quan hệ giữa các yếu tố ảnh hưởng đến sự hài lòng của khách hàng với dịch vụ tiền gửi tiết kiệm trong mô hình nghiên cứu, khóa luận sử dụng phương pháp tương quan với hệ số tương quan “Pearson correlation coefficient”, được ký hiệu bởi chữ “r”, giá trị của r trong khoảng -1 ≤ r ≤ 1
+ Nếu r>0 thể hiện mối quan hệ đồng biến, ngược lại r<0 thể hiện mối quan hệ nghịch biến. Giá trị r=0 chỉ ra rằng hai biến không có quan hệ tuyến tính. + |r| 1: quan hệ tuyến tính giữa hai biến càng chặt.
+ |r| 0: quan hệ tuyến tính giữa hai biến càng yếu.
Mức ý nghĩa “sig” của hệ số tương quan, cụ thể như sau: + sig< 5%: mối tương quan khá chặt chẽ.
+ sig<1%: mối tương quan rất chặt chẽ. Phân tích hồi quy đa biến:
- Sau khi kết luận hai biến có quan hệ tuyến tính với nhau thì có thể mô hình hóa mối quan hệ của hai biến này bằng hồi quy đa biến (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).
điều chỉnh được dùng để xác định độ phù hợp của mô hình. Kiểm định F dùng để khẳng định khả năng mở rộng mô hình này áp dụng cho tổng thể. Kiểm định t để bác bỏ giả thuyết các hệ số hồi quy của tổng thể đồng thời bằng 0.
- Phương trình hồi quy đa biến cho mô hình nghiên cứu đề xuất ban đầu (theomô hình lý thuyết):
Y = β0 + β1TNi + β2DTTTi +β3CTi +β4DDCVi + β5DKLVi + β6DNi +β7PLi + e Với:
Y: sự hài lòng của nhân viên kỹ thuật trong doanh nghiệp xây dựng tại TP.HCM TNi: sự hài lòng đối với thu nhập
DTTTi: sự hài lòng đối với đào tao thăng tiến. CTi: sự hài lòng đối với cấp trên.
DDCVi: sự hài lòng đối với đặc điểm công việc. DKLVi: sự hài lòng đối với điều kiện làm việc. DNi: sự hài lòng đối với đồng nghiệp.
PLi: sự hài lòng đối với phúc lợi công ty. e: sai số thực.
- Dò tìm sự vi phạm của giả định cần thiết trong hồi quy tuyến tính:
Liên hệ tuyến tính (dùng biểu đồ phân tán Scatterplot)
Giả định phương sai của phần dư không đổi (dùng hệ số tương quan hạng Spearman),
Giả định về phân phối chuẩn của phần dư (dùng biểu đồ Histogram và đồ thị Q-Q plot), giả định hiện tượng đa cộng tuyến của các biến độc lập (tính toán độ chấp nhận Tolerance và hệ số phóng đại VIF).
Kiểm tra giả định về hiện tượng đa cộng tuyến (tương quan giữa các biến độc lập) thông qua giá trị của độ chấp nhận (Tolerance) hoặc hệ số phóng đại phương sai VIF (Variance inflation factor): VIF >10 thì có thể nhận xét có hiện tượng đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
số β càng lớn thì có thể nhận xét rằng yếu tố đó có mức độ ảnh hưởng càng cao so với các yếu tố khác trong mô hình nghiên cứu.
Phân tích ANOVA
+ Để so sánh kết quả trung bình của các biến quan sát về giới tính, độ tuổi, kinh nghiệm, chức vụ, loại hình doanh nghiệp, nơi làm việc chính, công việc chính chúng ta sử dụng phép kiểm định trung bình 2 mẫu độc lập (Independent samples T- test). Trước khi kiểm định trung bình, ta sẽ thực hiện kiểm định sự bằng nhau của 2 phương sai tổng thể (Levene’s test) để xác định kết quả kiểm định nào sẽ được sử dụng. Dựa vào kết quả của Levene’s test, ta sẽ xem xét kiểm định t. Nếu giá trị Sig trong kiểm định Levene <0,05, nghĩa là có sự khác biệt giữa hai phương sai, ta sẽ sử dụng kết quả kiểm định ở phần Equal variances not assumed. Ngược lại nếu giá trị Sig trong kiểm định Levene ≥0,05, nghĩa là không có sự khác biệt giữa hai phương sai, ta sẽ sử dụng kết quả kiểm định ở phần Equal variances assumed. Trường hợp sig Levene Statistic nhỏ hơn 0.05, giả thuyết phương sai đồng nhất giữa các nhóm giá trị biến định tính đã bị vi phạm. Nghĩa là phương sai giữa các nhóm bộ phận làm việc là không bằng nhau. Chúng ta không thể sử dụng bảng ANOVA mà sẽ đi vào kiểm định Welch cho trường hợp vi phạm giả định phương sai đồng nhất (Andy Field,2009).
- Nếu sig kiểm định Welch ở bảng Robust Tests < 0.05, chúng ta kết luận: Có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những nhân viên làm việc ở các bộ phận khác nhau.
- Nếu sig kiểm định Welch ở bảng Robust Tests ≥ 0.05, chúng ta kết luận: Không có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng của những nhân viên làm việc ở các bộ phận khác nhau.
+ Sau khi đã chọn được, kết quả kiểm định t sẽ được sử dụng, ta lại so sánh giá trị sig. (sig. (2 tailed)). Nếu sig.(2 tailed) <0,05 ta kết luận có sự khác biệt có ý nghĩa về trung bình giữa các nhóm. Để kiểm tra sâu về sự khác biệt này ta sử dụng kiểm định “sau” (Post-Hoc test). Nếu sig.(2 tailed) ≥ 0,05 ta kết luận chưa thấy có sự khác biệt có ý nghĩa về trung bình giữa các nhóm.
Tóm tắt chương 3
Nghiên cứu được thực hiện bằng hai giai đoạn, nghiên cứu định tính và nghiên cứu định lượng. Nghiên cứu định tính bằng hình thức thảo luận tay đôi theo một nội dung được chuẩn bị trước dựa theo các thang đo có sẵn. Nội dung thảo luận sẽ được ghi nhận, tổng hợp làm cơ sở cho việc điều chỉnh và bổ sung các biến. Nghiên cứu định lượng với kỹ thuật thu thập dữ liệu là phỏng vấn thông qua bảng câu hỏi. Dữ liệu thu thập được xử lý bằng phần mềm SPSS 16.0. Sau khi mã hóa và làm sạch dữ liệu sẽ trải qua các phân tích chính thức như sau : đánh giá độ tin cậy và giá trị các thang đo, phân tích nhân tố sẽ được sử dụng để kiểm định sự hội tụ của các biến thành phần về khái niệm, kiểm định các giả thuyết mô hình cấu trúc và độ phù hợp tổng thể mô hình. Tiếp theo thực hiện phân tích ANOVA (Analysis Of Variance) giữa các nhóm đối tượng khác nhau.
CHƯƠNG 4