B. MÔ HÌNH CHỌN NGÀNH
3.7. PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EFA)
3.7.1. Phân tích nhân tố cho nhóm biến độc lập
Từ kết quả phân tích độ tin cậy của thang đo ở phần trên, việc phân tích nhân tố trƣớc tiên đƣợc tiến hành dựa trên 17 biến quan sát của các biến độc lập ảnh hƣởng đến Quyết định chọn ngành (theo mô hình đề xuất ban đầu).
giá trị 1177.612 với mức ý nghĩa Sig = 0.000 < 0.05, cho thấy các biến quan sát thuộc cùng một nhân tố có tƣơng quan chặt chẽ với nhau. Đồng thời tổng phƣơng sai trích là 67.684% > 50% cho thấy 5 nhân tố này giải thích 67.684% sự biến thiên của tập dữ liệu và giá trị Eigenvalue = 1.126 >1 đủ tiêu chuẩn phân tích nhân tố (Phụ lục 9.1)
Bảng 3.11. Hệ số KMO và kiểm định Barlett’s nhóm biến độc lập
Chỉ số KMO .657
Kiểm định Barlett’s 1177.612
Df 136
Sig. .000
Bảng 3.12. Kết quả phân tích EFA nhóm biến độc lập
Rotated Component Matrixa
Component 1 2 3 4 5 ANHHUONG04 .841 ANHHUONG03 .822 ANHHUONG05 .808 ANHHUONG01 .733 ANHHUONG02 .655 ĐĐ_CN02 .875 ĐĐ_CN04 .820 ĐĐ_CN03 .812 ĐĐ_CN01 .783 SHD_NĐT02 .865 SHD_NĐT03 .843 SHD_NĐT01 .774 CHVLTL03 .844
88
Rotated Component Matrixa
Component 1 2 3 4 5 CHVLTL01 .836 CHVLTL02 .713 CHTT02 .854 CHTT01 .821
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 5 iterations.
Dựa vào bảng 3.12, ta thấy các biến quan sát đạt các điều kiệu sau: - Giá trị hội tụ: Các biến quan sát xếp thành nhóm với nhau với các hệ số tải nhân tố nằm cùng một cột trong cùng một thang đo nhƣ thang đo đã đề xuất ban đầu.
- Giá trị phân biệt: Dựa vào bảng 4.4 ta thấy không có biến quan sát nào xuất hiện thêm hệ số tải nhân tố lớn hơn 0.5 hai cột khác nhau nên các biến quan sát đạt giá trị phân biệt.
- Ngoài ra các biến quan sát khác đều chỉ xuất hiện một hệ số tải nhân tố và đều lớn hơn 0.5 chứng tỏ các biến quan sát có ý nghĩa thực tiễn và có thể dùng để đƣa vào xây dựng mô hình hồ quy nhằm kiểm định giả thuyết đặt ra ban đầu.
3.7.2. Phân tích nhân tố cho biến phụ thuộc
Hệ số KMO = 0,688 > 0,5 và kiểm định Barlett’s có giá trị 225.482 với mức ý nghĩa Sig = 0.000 < 0.05; qua đó kết quả chỉ ra rằng các biến quan sát trong tổng thể có mối tƣơng quan với nhau và phân tích nhân tố khám phá (EFA) thích hợp sử dụng trong nghiên cứu này.
Bảng 3.13. Hệ số KMO và kiểm định Barlett’s cho biến phụ thuộc
Chỉ số KMO .688
Kiểm định Barlett’s 225.482
df 3
Sig. .000
Kết quả phân tích nhân tố EFA của thang đo Quyết định chọn ngành với giá trị Eigenvalue là 2.278 > 1 và tổng phƣơng sai trích là 75.918% > 50% cho thấy nhân tố này giải thích 75.918% sự biến thiên của tập dữ liệu. Do đó các thang đo rút ra đƣợc chấp nhận (phụ lục 9.2)
Dựa vào bảng 3.12, ta thấy các biến quan sát đạt hai điều kiệu sau: - Giá trị hội tụ: Các biến quan sát xếp thành nhóm với nhau với các hệ số tải nhân tố nằm cùng một cột trong cùng một thang đo “Quyết định chọn ngành” nhƣ thang đo đã đề xuất ban đầu.
- Giá trị phân biệt: các biến quan sát đều chỉ xuất hiện một hệ số tải nhân tố nên đạt giá trị phân biệt.
- Ngoài ra các hệ số tải nhân tố đều lớn hơn 0.5 chứng tỏ các biến quan sát có ý nghĩa thực tiễn và có thể dùng để đƣa vào xây dựng mô hình hồi quy nhằm kiểm định giả thuyết đặt ra ban đầu.
Bảng 3.14. Kết quả EFA của biến phụ thuộc
Component Matrixa Component 1 QĐ_Ng03 .915 QĐ_Ng02 .856 QĐ_Ng01 .841 (Nguồn: Xử lý từ SPSS)
3.8. TƢƠNG QUAN VÀ HỒI QUY
90
từ giá trị trung bình (mean) của các biến quan sát:
DD_CN = mean (DD_CN01,DD_CN02,DD_CN03,DD_CN04) CHVLTL = mean (CHVLTL01,CHVLTL02,CHVLTL03) CHTT = mean (CHTT01,CHTT02)
HD_DT = mean (HD_DT01,HD_DT02,HD_DT03)
ANHHUONG = mean (ANHHUONG01, ANHHUONG02, ANHHUONG03, ANHHUONG04, ANHHUONG05)
Tƣơng tự, với biến phụ thuộc “Quyết định chọn ngành” cũng đƣợc hình thành từ giá trị trung bình của 3 biến quan sát nhƣ sau:
QD_Ng = mean (QD_Ng01,QD_Ng02,QD_Ng03)
3.8.1. Xem xét ma trận tƣơng quan giữa các biến trong mô hình
Trƣớc khi tiến hành phân tích hồi quy tuyến tính bội, mối tƣơng quan tuyến tính giữa các biến cần phải đƣợc xem xét.
Hệ số tƣơng quan Pearson nhằm để lƣợng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lƣợng.
Kiểm tra hệ số tƣơng quan r, cho kết quả ở bảng 3.15,với mức ý nghĩa 0.01 (độ tin cậy 99%) và 0.05 ( độ tin cậy 95%) tất cả các biến độc lập: CHTT, ĐĐ_CN, ANHHUONG, SHD_NĐT, CHVLTL đều có hệ số tƣơng quan dƣơng với biến Quyết định chọn ngành tại mức ý nghĩa sig < 0.05 do đó các biến này có mối tƣơng quan tích cực đến Quyết định chọn ngành nên có thể đƣa vào thực hiện hồi quy (phụ lục 10.1). Cụ thể:
- Hệ số tƣơng quan giữa biến DD_CN với Quyết định chọn ngành là r = 0,592, với mức ý nghĩa sig = 0.000 < 0.05 nên mối tƣơng quan này là tích cực (thuận) và có ý nghĩa về mặt thống kê.
- Hệ số tƣơng quan giữa biến CHVLTL với Quyết định chọn ngành là r = 0,548, với mức ý nghĩa sig = 0.000 < 0.05 nên mối tƣơng quan này là tích cực (thuận) và có ý nghĩa về mặt thống kê.
0,200, với mức ý nghĩa sig = 0.008 < 0.05 nên mối tƣơng quan này là tích cực (thuận) và có ý nghĩa về mặt thống kê.
- Hệ số tƣơng quan giữa biến HD_DT với Quyết định chọn ngành là r = 0,283, với mức ý nghĩa sig = 0.000 < 0.05 nên mối tƣơng quan này là tích cực (thuận) và có ý nghĩa về mặt thống kê.
- Hệ số tƣơng quan giữa biến ANHHUONG với Quyết định chọn ngành là r = 0,371, với mức ý nghĩa sig = 0.000 < 0.05 nên mối tƣơng quan này là tích cực (thuận) và có ý nghĩa về mặt thống kê.
Bảng 3.15. Kết quả phân tích tương quan Pearson
Correlations ANH HUONG ĐĐ_CN SHD_N ĐT CHVL TL CHTT QĐ_Ng ANHHUO NG Pearson Correlation 1 .021 .136 .176* .038 .371** Sig. (2-tailed) .781 .072 .019 .613 .000 N 176 176 176 176 176 176 ĐĐ_CN Pearson Correlation .021 1 -.037 .218** -.010 .592** Sig. (2-tailed) .781 .622 .004 .897 .000 N 176 176 176 176 176 176 SHD_NĐT Pearson Correlation .136 -.037 1 .223** .090 .283** Sig. (2-tailed) .072 .622 .003 .234 .000 N 176 176 176 176 176 176 CHVLTL Pearson Correlation .176* .218** .223** 1 .277** .548** Sig. (2-tailed) .019 .004 .003 .000 .000 N 176 176 176 176 176 176 CHTT Pearson Correlation .038 -.010 .090 .277** 1 .200** Sig. (2-tailed) .613 .897 .234 .000 .008 N 176 176 176 176 176 176 QĐ_Ng Pearson Correlation .371** .592** .283** .548** .200** 1 Sig. (2-tailed) .000 .000 .000 .000 .008 N 176 176 176 176 176 176
*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
92
3.8.2. Phân tích hồi quy
Tiến hành chạy hồi quy giữa biến phụ thuộc Quyết định chọn ngành với các biến độc lập CHTT, ĐĐ_CN, ANHHUONG, SHD_NĐT, CHVLTL ta có kết quả hồi quy nhƣ sau (phụ lục 10.2):
Bảng 3.16. Kết quả phân tích hệ số hồi quy.
Mô hình Hệ số chƣa chuẩn hóa Hệ số chuẩn hóa Giá trị t Mức ý nghĩa Sig. Thống kê đa cộng tuyến B Sai số chuẩn Beta Độ chấp nhận biến Hệ số phóng đại phƣơng sai VIF 1 (Constant) -.163 .319 -.511 .610 ANHHUONG .234 .039 .275 6.011 .000 .959 1.043 ĐĐ_CN .222 .020 .525 11.351 .000 .939 1.064 SHD_NĐT .166 .042 .186 4.007 .000 .933 1.072 CHVLTL .350 .055 .319 6.422 .000 .814 1.229 CHTT .064 .034 .090 1.917 .057 .918 1.090
a. Biến phụ thuộc: Quyết định chọn ngành
(Nguồn: Xử lý từ SPSS)
Kết quả xác định hệ số hồi quy đƣợc thể hiện trong bảng 3.16 cho thấy, các biến độc lập đƣợc đƣa vào mô hình có quan hệ tuyến tính với biến phụ thuộc, với Sig trong kiểm định t đều nhỏ hơn 0.05. Vậy mô hình hồi quy có ý nghĩa về mặt thống kê.
3.8.3. Kiểm định mô hình hồi quy
Kiểm định sự phù hợp của mô hình
Bảng 3.17. Kết quả phân tích ANOVA
Mô hình Tổng bình phƣơng df Trung bình bình phƣơng F Sig. 1 Hồi quy 21.776 5 4.355 65.581 .000b Phần dƣ 11.290 170 .066 Tổng 33.066 175
Ta kiểm định giả thuyết:
H0: Tập hợp các biến độc lập không có mối liên hệ với biến phụ thuộc (βi = 0)
H1: Tập hợp các biến độc lập có mối liên hệ với biến phụ thuộc (βi ≠ 0) Kết quả phân tích ANOVA thể hiện trong bảng 3.17 cho thấy giá trị kiểm định F = 65.581 có ý nghĩa thống kê vì Sig = 0.000 < 0.05. Do đó ta bác bỏ giả thuyết H0 nghĩa là các biến độc lập có liên hệ với biến phụ thuộc. Vì thế, mô hình hồi quy là phù hợp với dữ liệu nghiên cứu.
Hiện tƣợng đa cộng tuyến
Đa cộng tuyến là hiện tƣợng có sự tƣơng quan phụ thuộc lẫn nhau giữa các biến độc lập. Khi xảy ra hiện tƣợng này sẽ dẫn đến các hệ số không ổn định khi thêm biến vào mô hình hồi quy.
Để phát hiện hiện tƣợng đa cộng tuyến, tác giả dựa vào hệ số phóng đại phƣơng sai VIF. Theo kết quả ở bảng 3.17 ta thấy hệ số phóng đại phƣơng sai VIF (Variance Inflation Factor - VIF) rất nhỏ (nhỏ hơn 10) cho thấy các biến độc lập này không có quan hệ chặt chẽ với nhau nên không có hiện tƣợng đa cộng tuyến xảy ra. Do đó mối quan hệ giữa các biến độc lập không ảnh hƣởng đáng kể đến kết quả giải thích của mô hình hồi quy
94
Mức độ giải thích của mô hình
Bảng 3.18. Mức độ giải thích của mô hình
Mode R R bình phƣơng R bình phƣơng hiệu chỉnh Sai số chuẩn Durbin- Watson 1 .812a .659 .649 .25770 1.858
Từ bảng 3.18 ta có hệ số R bình phƣơng hiệu chỉnh bằng 0,649 nghĩa là mô hình hồi quy tuyến tính bội đã xây dựng phù hợp với tập dữ liệu là 64,9%. Nói cách khác 64,9% Quyết định chọn ngành có thể đƣợc giải thích bởi sự tác động của 5 nhân tố: CHTT, ĐĐ_CN, ANHHUONG, SHD_NĐT, CHVLTL.
Kiểm định phần dƣ của mô hình
Kiểm tra phần dƣ cho thấy phân phối phần dƣ xấp xỉ chuẩn với trung bình Mean = 0 và độ lệch chuẩn Std. Deviation = 0.986 (xấp xỉ bằng 1) do đó có thể kết luận rằng giả thiết phân phối chuẩn không bị vi phạm khi sử dụng phƣơng pháp hồi quy bội.
Bảng 3.19. Bảng thống kê giá trị phần dư
Nhỏ nhất Lớn nhất Trung Bình Độ lệch chuẩn N Predicted Value 3.5996 5.3069 4.6990 .35275 176 Residual -.60305 .63453 .00000 .25399 176 Std. Predicted Value -3.117 1.723 .000 1.000 176 Std. Residual -2.340 2.462 .000 .986 176
Biểu đồ 3.20. Đồ thị phân phối phần dư của mô hình hồi quy
Mặt khác, bằng hình ảnh trực quan ta thấy phần dƣ của mô hình có dạng đồ thị hình chuông úp xuống khá cân đối, nên có thể kết luận phần dƣ của mô hình có phân phối chuẩn.
96
Ngoài ra, theo biểu đồ P-P plots (Biểu đồ 3.22), các điểm quan sát không phân tán quá xa đƣờng thẳng kỳ vọng nên có thể kết luận giả thuyết về phân phối chuẩn của phần dƣ không bị vi phạm.
Kiểm định giả thuyết các sai số ngẫu nhiên của mô hình có phƣơng sai không đổi
Theo biểu đồ Scatterplot (Biểu đồ 3.23), các sai số hồi quy phân bố tƣơng đối đều ở cả hai phía của đƣờng trung bình (trung bình của các sai số bằng 0) và không theo một quy luật rõ ràng nào. Điều đó cho thấy giả thiết sai số của mô hình hồi quy không đổi là phù hợp.
Biểu đồ 3.22. Biểu đồ Scatterplot phần dư của mô hình hồi quy
Vậy, với các kết quả kiểm định trên ta thấy mô hình hồi quy là phù hợp và có ý nghĩa thống kê. Ta có mô hình hồi quy với hệ số beta chƣa chuẩn hóa là:
QD_Ng = -0.163 + 0.222 DD_CN + 0.350 CHVLTL + 0.064 CHTT + 0.166 SHD_DT + 0.234 ANHHUONG
Ý nghĩa của hệ số hồi quy chƣa chuẩn hóa:
- β1 = 0.222, tức là với điều kiện các yếu tố khác không đổi khi nhân tố DD_CN tăng/giảm 1 điểm thì Quyết định chọn ngành tăng/giảm 0.222 điểm (so với thang điểm 6)
- β2 = 0.350, tức là với điều kiện các yếu tố khác không đổi khi nhân tố CHVLTL tăng/giảm 1 điểm thì Quyết định chọn ngành tăng/giảm 0.350 điểm (so với thang điểm 6)
- β3 = 0.064, tức là với điều kiện các yếu tố khác không đổi khi nhân tố CHTT tăng/giảm 1 điểm thì Quyết định chọn ngành tăng/giảm 0.064 điểm (so với thang điểm 6)
- β 4 = 0.166 , tức là với điều kiện các yếu tố khác không đổi khi nhân tố HD_DT tăng/giảm 1 điểm thì Quyết định chọn ngành tăng/giảm 0.166 điểm (so với thang điểm 6)
- β 5 = 0.234, tức là với điều kiện các yếu tố khác không đổi khi nhân tố ANHHUONG tăng/giảm 1 điểm thì Quyết định chọn ngành tăng/giảm 0.234 điểm (so với thang điểm 6)
Tuy nhiên, phƣơng trình hồi quy chƣa chuẩn hóa mang ý nghĩa toán học hơn là ý nghĩa kinh tế vì nó chỉ phản ánh sự thay đổi của biến phụ thuộc khi từng biến độc lập thay đổi trong điều kiện các biến độc lập còn lại phải cố định.
Nhƣ vậy, để xem xét mức độ tác động hay thứ tự ảnh hƣởng của các biến độc lập lên biến phụ thuộc. Dựa vào phƣơng trình hồi quy chuẩn hóa, chúng ta sẽ biết đƣợc biến độc lập nào nào ảnh hƣởng mạnh hay yếu đến biến phụ thuộc căn cứ vào hệ số hồi quy chuẩn hóa, hệ số càng lớn thì tầm quan trọng của biến độc lập đó đối với biến phụ thuộc càng lớn. Ta xét phƣơng trình hồi quy với beta chuẩn hóa:
98
QD_Ng = 0.525 DD_CN + 0.319 CHVLTL + 0.090 CHTT + 0.186 HD_DT + 0.275 ANHHUONG
Ta thấy: β2>β4>β1>β3>β5 do đó các yếu tố tác động đến Quyết định chọn ngành lần lƣợt mạnh nhất là ĐĐ_CN > CHVLTL > ANHHUONG > SHD_NDT > CHTT
3.8.4. Kiểm định các giả thuyết của mô hình
Kết quả kiểm định các giả thuyết từ phân tích tƣơng quan và phân tích hồi quy cho thấy mối quan hệ giữa các biến độc lập với biến phụ thuộc đều có ý nghĩa ở độ tin cậy là 95% (Bảng 4.12).
Bảng 3.20. Kết quả kiểm định các giả thuyết
Giả thuyết Hệ số hồi quy Kết quả kiểm định H1 ANHHUONG tác động tích cực đến Quyết định chọn ngành .234 Chấp nhận H2 ĐĐ_CN tác động tích cực đến Quyết định chọn ngành .222 Chấp nhận H3 SHD_NĐT tác động tích cực đến Quyết định chọn ngành .166 Chấp nhận H4 CHVLTL tác động tích cực đến Quyết định chọn ngành .350 Chấp nhận H5 CHTT tác động tích cực đến Quyết định chọn ngành .064 Chấp nhận
3.8.5. Mô hình nghiên cứu chính thức
Hình 3.2. Mô hình nghiên cứu chọn ngành chính thức.