CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.4. NGHIÊN CỨU CHÍNH THỨC
Nghiên cứu chính thức được thực hiện bằng phương pháp nghiên cứu định lượng nhằm kiểm định lại các thang đo và các giả thuyết trong mô hình nghiên cứu thông qua bảng câu hỏi khảo sát.
3.4.1. Thiết kế bảng câu hỏi
Bảng câu hỏi khảo sát gồm ba phần:
Phần thông tin tổng quát: thu thập thông tin nguồn vốn sử dụng trong xây dựng, cấp công trình.
Phần thông tin về thiết kế: là những câu hỏi liên quan đến các yếu tố Thời gian thiết kế; Chi phí thiết kế; Phối hợp trong thiết kế; Quản lý thiết kế; Nhà thiết kế;
Chất lượng công tác thiết kế.
Phần thông tin khác: thu thập các thông tin liên quan đến: giới tính, tuổi, chức vụ, thời gian công tác, số lượng hồ sơ thực hiện.
3.4.2. Phương thức lấy mẫu
Nghiên cứu này chọn lấy mẫu theo phương pháp thuận tiện, dữ liệu thu thập được thông qua hình thức phát bảng câu hỏi trực tiếp. Tác giả trực tiếp đến các công ty thiết kế chuyên ngành xây dựng trong địa bàn tỉnh để trao đổi với các thành viên ban giám đốc, trưởng, phó phòng và các nhân viên về mục đích và nội dung cần khảo sát. Sau khi trao đổi các thông tin thì gửi các bản khảo sát cho các đối tượng tham gia trả lời và thu thập lại các bảng khảo sát.
3.4.3. Cỡ mẫu
Đối với phân tích nhân tố (EFA) cỡ mẫu tối thiểu N ≥ 5*x (x là tổng số biến quan sát) (Hair, Jr.J.F, Anderson, Tatham, & Black, 1998). Trong phân tích hồi quy đa biến, cỡ mẫu tối thiểu cần đạt được tính theo công thức N ≥ 50 + 8*m (m là số biến độc lập)
Trong nghiên cứu này, tác giả chọn kích thước mẫu ít nhất phải thỏa cả hai điều kiện của phương pháp phân tích nhân tố EFA và phương pháp phân tích hồi quy đa biến theo các tác giả trên, nghĩa là thỏa phương trình: N ≥ max (5*x ; 50+8*m).
3.4.4. Xử lý và phân tích dữ liệu
Sau khi thu thập, các bảng khảo sát được xem xét và loại đi những bảng không đạt yêu cầu. Sau đó, dữ liệu sẽ được mã hóa, nhập liệu, làm sạch và xử lý bằng phần mềm thống kê SPSS. Cụ thể như sau:
- Thống kê mô tả mẫu dữ liệu thu thập.
- Kiểm định độ tin cậy của thang đo các khái niệm nghiên cứu.
- Phân tích nhân tố khám phá để xem xét độ giá trị (độ giá trị hội tụ và phân biệt) của các thang đo khái niệm nghiên cứu và đồng thời cũng trích ra các yếu tố cho mô hình nghiên cứu và phân tích hồi quy tiếp theo.
- Kiểm tra sự tương quan giữa các biến.
- Phân tích hồi quy đa biến.
- Kiểm định giả thuyết nghiên cứu.
3.4.5. Đánh giá thang đo
Một thang đo được coi là có giá trị khi nó đo lường đúng cái cần đo, có nghĩa là phương pháp đo lường không có những sai lệch mang tính hệ thống và ngẫu nhiên.
Các điều kiện mà một thang đo cần phải đạt được là độ tin cậy và độ giá trị.
3.4.6. Độ tin cậy
Có các tiêu chí đánh gía độ tin cậy (tính nhất quán) và giá trị của thang đo:
Hệ số Cronbach’s alpha
Hệ số tương quan biến tổng (Item-to-Total correlation).
Nhiều tác giả nghiên cứu đồng ý rằng khi Cronbach’s alpha từ 0,8 trở lên đến gần 1 thì thang đo lường là tốt, từ 0,7 đến gần 0,8 là sử dụng được. Và theo các tác giả đề nghị rằng Cronbach’s alpha từ 0,6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang nghiên cứu là mới, hoặc người trả lời mới làm quen với dạng câu hỏi nghiên cứu (Trọng & Ngọc, 2008). Trong nghiên cứu này chọn Cronbach’s alpha > 0,6 để kiểm định thang đo các khái niệm nghiên cứu.
Tuy nhiên, việc đo lường hệ số Cronbach’s alpha chỉ cho biết độ tin cậy của thang đo hay nói một cách khác là có sự liên kết giữa các biến quan sát với nhau hay không trong cùng một khái niệm cần đo, nó không cho biết biến quan sát nào cần được bỏ đi hay giữ lại. Do đó, tính toán hệ số tương quan giữa các biến quan sát và biến tổng cũng là một tiêu chí nhằm đảm bảo độ giá trị của thang đo, nhằm giúp loại ra những mục hỏi không đóng nhiều cho việc mô tả khái niệm cần đo (Thọ, 2011). Để quyết định biến nào được giữ lại hay bỏ đi, mức tiêu chuẩn 0,3 được sử dụng trong nghiên cứu này.
3.4.7. Độ giá trị
Có nhiều tiêu chí đánh giá độ giá trị của một thang đo, trong nghiên cứu này đánh giá độ giá trị của thang đo qua một số tiêu chí nổi bậc: độ giá trị hội tụ, độ giá
trị phân biệt. Các tiêu chí đánh giá độ gía trị của thang đo dựa trên kết quả phân tích nhân tố khám phá (EFA).
Độ giá trị hội tụ: phân tích nhân tố phù hợp để đánh giá độ hội tụ của thang đo, khi hệ số tải nhân tố (factor loading) tải lên nhân tố chung (khái niệm nghiên cứu)
Độ phân biệt: khi phân tích EFA các biến quan sát đảm bảo được sự tách biệt giữa các nhân tố, khái niệm.
3.4.8. Phân tích nhân tố - EFA
Sau khi kiểm định độ tin cậy của thang đo, tiếp tục tiến hành phân tích nhân tố để nhằm kiểm định độ giá trị hội tụ, độ giá trị phân biệt của thang đo các khái niệm.
Thêm vào đó, chúng ta cũng trích ra các yếu tố để tiến hành phân tích hồi quy tiếp theo. Các tiêu chí đánh giá kết quả trong phân tích EFA:
Xem xét sự thích hợp của việc phân tích nhân tố: hệ số KMO (Kaiser-Meyer- Olkin) là một tiêu chí đánh giá sự thích hợp của dữ liệu với phân tích nhân tố. Phân tích nhân tố thích hợp khi 0,5 ≤ KMO ≤ 1 (Trọng & Ngọc, 2008).
Tiêu chuẩn để xác định số lượng các nhân tố được trích ra: có nhiều tiêu chuẩn để quyết định số lượng các nhân tố được trích ra như tiêu chuẩn của Latent root (Eigenvalue), tiêu chuẩn xác định từ trước (Priori), tiêu chuẩn % phương sai (Percantage of variance), tiêu chuẩn biểu đồ gốc (Scree test), … (Trọng & Ngọc, 2008). Trong nghiên cứu này sử dụng tiêu chuẩn Latent root (Eigenvalue > 1), đây là tiêu chuẩn sử dụng phổ biến trong xác định số lượng nhân tố trong phân tích EFA.
Xem xét giả thuyết Bartlert’s test of sphericity (H0) là các biến không có quan hệ (ma trận tổng thể là đơn vị), mỗi biến tương quan hoàn toàn với chính nó (r = 1) nhưng không có tương quan với biến khác (r =0). Khi Sig ≤0,05 thì bác bỏ giả thuyết H0, nghĩa là các biến có quan hệ nhau. Dữ liệu là phù hợp khi giả thuyết H0 này bị bác bỏ.
Hệ số tải nhân tố (factor loading): là một tiêu chí đảm bảo mức ý nghĩa thiết thực khá quan trọng trong phân tích EFA.
Trọng số nhân tố của biến Xi trên nhân tố mà nó là một biến đo lường sau khi quay phải cao và trọng số trên các nhân tố khác mà nó không đo lường phải thấp.
Đạt được điều kiện này, thang đo đạt được giá trị hội tụ. Với số mẫu khoảng 200, hệ số tải nhân tố được chấp nhận là lớn hơn 0,4 (Hair, Jr.J.F, Anderson, Tatham, &
Black, 1998). Trong thực tế nghiên cứu, hệ số tải > 0,5 là giá trị chấp nhận. Tuy nhiên, nếu hệ số tải của nó thấp nhưng giá trị nội dung của nó đóng vai trò quan trọng trong thang đo thì khi loại bỏ biến thì thang đo sẽ không đạt yêu cầu bắt buộc phải thiết kế lại thang đo.
Trong nghiên cứu này, một biến quan sát có hệ số tải nhân tố lớn hơn 0,5 (factor loading > 0,5) và không tải lên các nhân tố khác lớn hơn 0,3 thì biến quan sát đó không bị loại ra khỏi thang đo khái niệm nghiên cứu và được xem là đảm bảo giá trị hội tụ và độ phân biệt.
Phương sai trích được (variance explained criteria): tổng này thể hiện các nhân tố trích được bao nhiêu phần trăm các biến đo lường. Tổng phương sai trích được phải lớn hơn 50% (variance explained criteria > 50%).
Trong nghiên cứu này đối với các biến độc lập thì sử dụng phương pháp trích nhân tố principal Axis Factoring bởi vì theo (Hair, Jr.J.F, Anderson, Tatham, &
Black, 1998), phương pháp này phát hiện ra các thứ nguyên (thành phần) tiềm ẩn trong dữ liệu gốc (phát hiện cấu trúc), trong khi đó phương pháp trích Principal Components thì chỉ với mục đích giảm dữ liệu. Và chọn phép xoay Promax (kappa
= 4) bởi vì nó phản ánh chính xác cấu trúc dữ liệu tiềm ẩn hơn lời giải trực giao của phương pháp xoay Varimax. Còn đối với biến phụ thuộc thì sử dụng phương pháp trích nhân tố principal Axis Factoring và phép xoay Promax (kappa = 4).
3.4.9. Kiểm định mô hình và các giả thuyết
Sau khi các thang đo được kiểm định và thực hiện phân tích nhân tố trích ra được các nhân tố để sử dụng cho phân tích hồi quy đa biến. Trong nghiên cứu này, hồi quy đa biến và kiểm định giả thuyết với mức ý nghĩa 5%.
3.4.10. Phân tích tương quan
Trước khi phân tích hồi quy, cần kiểm tra sự tương quan giữa các biến trong mô hình hồi quy. Theo (Trọng & Ngọc, 2008)hệ số tương quan được dùng để lượng hóa mức độ chặt chẽ của mối quan hệ giữa 2 hay nhiều biến định lượng và định danh.
Giá trị tuyệt đối của r tiến gần đến 1 là khi hai biến có mối tương quan tuyến tính chặt chẽ. Tuy nhiên, mối tương quan tuyến tính chặt chẽ giữa các biến độc lập với biến phù thuộc thì rất được mong đợi, nhưng mối tương quan tuyến tính giữa các biến độc lập thì không được mong đợi (vì phân tích hồi quy đa biến sẽ có thể phát sinh hiện tượng đa công tuyến). Để đánh giá mức độ tương quan thì hai yếu tố được quan tâm trong kiểm định ma trận tương quan giữa các biến là:
- Hệ số tương quan r - Mức ý nghĩa (sig. < 0,05).
3.4.11. Phân tích hồi quy đa biến
- Hồi qui đa biến là một kỹ thuật thống kê được sử dụng để phân tích mối quan hệ giữa 1 biến độc lập và nhiều biến phụ thuộc. Khi sử dụng hồi qui đa biến, các tham số thông kê cần được quan tâm bao gồm:
- Hệ số Beta (Standardized Beta Coefficent): hệ số hồi qui chuẩn hóa cho phép so sánh một cách trực tiếp về mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc.
- Hệ số R2 hiệu chỉnh (Adjusted coefficient of determination): đo lường phần phương sai của biến phụ thuộc được giải thích bởi các biến độc lập có tính đến số lượng biến phụ thuộc và cỡ mẫu. Hệ số này càng cao, độ chính xác của mô hình càng lớn và khả năng dự báo của các biến độc lập càng chính xác.
- Kiểm định độ phù hợp của mô hình với tập dữ liệu: sử dụng trị thống kê F để kiểm định mức ý nghĩa thống kê của mô hình. Giả thuyết H0 là các hệ số Beta trong mô hình đều bằng 0. Nếu mức ý nghĩa của kiểm định nhỏ hơn 0.05, ta có thể an toàn khi bác bỏ giả thuyết H0 hay nói cách khác mô hình phù hợp với tập dữ liệu khảo sát.
- Kiểm định mức ý nghĩa của hệ số Beta: sử dụng trị thống kê t để kiểm tra mức ý nghĩa của hệ số Beta. Nếu mức ý nghĩa của kiểm định nhỏ hơn 0.05 (Sig. <
0,05), ta có thể kết luận hệ số Beta có ý nghĩa về mặt thống kê.
3.4.12. Kiểm định sự vi phạm các giả định của hồi quy tuyến tính
- Giả định liên hệ tuyến tính: đồ thị phân tán (scatter) giữa phần dư chuẩn hóa (standardized residual) và giá trị dự đoán chuẩn hóa (standardized predicted value) là một công cụ tốt giúp kiểm tra giả định về mối liên hệ tuyến tính. Nếu các chấm trên đồ thị phân tán một cách ngẫu nhiên không theo bất kỳ qui luật nào thì giả định tuyến tính không bị vi phạm.
- Giả định phương sai của sai số không đổi: đồ thị phân tán (scatter) giữa phần dư chuẩn hóa (standardized residual) và giá trị dự đoán chuẩn hóa (standardized predicted value) cũng là một công cụ giúp kiểm tra giả định phương sai của sai số không đổi. Nếu độ lớn của phần dư chuẩn hóa tăng hoặc giảm cùng với các giá trị dự đoán thì giả định phương sai của sai số không đổi đang bị vi phạm. Hiện tượng phương sai thay đổi gây ra nhiều hệ quả nghiêm trọng đối với phương pháp ước lượng OLS. Nó làm cho các hệ số hồi qui không chệch nhưng không hiệu quả.
- Giả định về phân phối chuẩn của phần dư: kiểm tra phân phối chuẩn của phần dư bằng cách vẽ đồ thị Histogram của phần dư chuẩn hóa. Nếu chúng ta thấy trên đồ thị đường cong chuẩn hoá có dạng hình chuông như phân phối chuẩn với giá trị Mean xấp xỉ 0 và giá trị độ lệch chuẩn xấp xỉ 1 thì xem như phần dư có phân phối gần chuẩn. Một cách khác để kiểm định phân phối chuẩn của phần dư là vẽ đồ thị Q-Q plot. Đồ thị này thể hiện những giá trị của các điểm phân vị của phân phối của biến phần dư theo các phân vị của phân phối chuẩn. Nếu trên đồ thị Q-Q plot
các điểm này không nằm quá xa đường thẳng của phân phối chuẩn thì có thể xem như phần dư có phân phối gần chuẩn.
- Giả định về tính độc lập của sai số: kiểm định đại lượng thống kê Durbin- Watson (đại lượng d) là kiểm định phổ biến cho tương quan chuỗi bậc nhất. Đại lượng d có giá trị biến thiên trong khoảng từ 0 đến 4. Nếu giá trị d gần bằng 2 hoặc nằm trong khoảng [dU, 4-dU] thì chấp nhận giả thiết không có tương quan chuỗi bậc nhất (giá trị dL và dU được tra trong Bảng thống kê Durbin-Watson với N là số quan sát của mẫu và k là số biến độc lập trong mô hình).
- Kiểm tra đa cộng tuyến: là hiện tượng các biến độc lập có tương quan chặt chẽ với nhau, khó tách rời ảnh hưởng của từng biến đến biến phụ thuộc, làm tăng độ lệch chuẩn của các hệ số hồi quy, làm giảm giá trị thống kê t của kiểm định ý nghĩa các hệ số hồi quy. Khi phân tích Collinearity Diagnotics, hệ số Tolerance càng gần 1 càng tốt, hệ số phóng đại phương sai VIF (variance inflation factor) càng gần 1 càng tốt và không quá 10 thì không có hiện tượng đa cộng tuyến.