CHƯƠNG 4. MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU ĐÁNH GIÁ CÁC YẾU TỐ ẢNH HƯỞNG TỚI Ý ĐỊNH KHỞI NGHIỆP CỦA SINH VIÊN KHỐI NGÀNH KỸ THUẬT VIỆT NAM
4.4 Phương pháp phân tích dữ liệu
Nghiên cứu sử dụng cả nghiên cứu định tính và nghiên cứu định lượng cùng các dữ liệu thứ cấp, sơ cấp. Đối với từng nhóm dữ liệu khác nhau có những phương pháp xử lý đặc trưng phụ thuộc vào bản chất dữ liệu và mục đích nghiên cứu. Trong đó:
4.4.1 Phân tích dữ liệu thứ cấp bằng các phương pháp tổng hợp, so sánh, phân tích
Dữ liệu thứ cấp được thu thập thông qua các kênh thông tin chính thức từ Bộ GD&ĐT, báo cáo từ các trường Đại học, các nghiên cứu đã công bố. Những dữ liệu thứ cấp được xử lý bằng các phương pháp tổng hợp, so sánh, phân tích.
84
4.4.2 Phân tích dữ liệu sơ cấp bằng phương pháp định lượng
Hình 4.5: Phân tích dữ liệu sơ cấp bằng phương pháp định lượng
Dữ liệu định lượng sơ cấp được thu thập qua hai điều tra sơ bộ và chính thức được tiến hành làm sạch và phân tích với sự hỗ trợ của phần mềm SPSS và AMOS qua các bước phân tích như Hình 4.5.
• Mô tả mẫu nghiên cứu: Mẫu điều tra được phân loại theo các đặc trưng phân biệt bằng bảng tần suất với tỷ lệ phân theo những đặc trưng cho sẵn trong phiếu điều tra (giới tính, năm học, trường, ngành học, xuất thân gia đình, mức độ tham gia nghiên cứu khoa học, mức độ làm thêm, có tham gia các chương trình về đào tạo khởi nghiệp hay không).
• Đánh giá sơ bộ thang đo: Thang đo được đánh giá sơ bộ tính tin cậy thông qua bước nghiên cứu sơ bộ ban đầu với cỡ mẫu nhỏ (n=302).
Để đánh giá tính tin cậy của các thang đo nghiên cứu sinh sử dụng hệ số Cronbach’s Alpha và hệ số tương quan biến tổng [119] Theo quan điểm của nhà nghiên cứu Hair & cộng sự [119]
tiêu chuẩn đánh giá tính tin cậy là hệ số Cronbach’s Alpha chấp nhận ở mức lớn hơn 0.6. Theo nhà nghiên cứu Nguyễn Đình Thọ [28], hệ số Cronbach’s Alpha có giá trị biến thiên trong khoảng [0,1] trong đó Cronbach’s Alpha càng cao càng tốt vì nó phản ánh thang đo có độ tin cậy cao. Tuy nhiên hệ số Cronbach’s Alpha cũng không nên quá cao (cao hơn 0.95) vì điều này thể hiện nhiều biến trong thang đo không có khác biệt gì nhau, nghĩa là chúng cùng đo lường một nội dung nào đó của khái niệm. Mức điểm chấp nhận được thấp nhất của Cronbach’s Alpha là 0.6 [28]. Mặc dù, các nghiên cứu về ý định khởi nghiệp được thực hiện khá nhiều trên thế giới, tuy nhiên tại Việt Nam các nghiên cứu như vậy chưa nhiều và các khái niệm nghiên cứu chưa được kiểm chứng đối với các nghiên cứu tại Việt Nam. Do đó, có thể xem các khái niệm là mới trong môi trường nghiên cứu là Việt Nam. Bởi vậy, luận án tiêu chuẩn đánh giá tính tin cậy là hệ số Cronbach’s Alpha chấp nhận ở mức lớn hơn 0.6 [105a].
Bên cạnh hệ số Cronbach’s Alpha, luận án còn xem xét hệ số tương quan biến - tổng hiệu chỉnh kiểm tra các biến quan sát trong mỗi khái niệm nghiên cứu có tương quan chặt chẽ với nhau không. Hệ số này lấy tương quan của biến đo lường xem xét với tổng các biến còn lại của thang đo
85
(không tính biến đang xem xét). Nếu một biến đo lường có hệ số tương quan biến – tổng hiệu chỉnh ≥ 0.3 thì biến đó đạt yêu cầu [178] [28]. Như vậy, một thang được coi là đạt yêu cầu nếu có hệ số Cronbach’s Alpha ≥ 0,6 và các biến quan sát đạt yêu cầu để đo lường một khái niệm nào đó với hệ số tương quan biến - tổng hiệu chỉnh (Corrected item-total correlation) ≥ 0.3.
Sau khi xem xét hệ số Cronbach’s Alpha và hệ số tương quan biến - tổng hiệu chỉnh, phân tích khám phá nhân tố EFA được thực hiện nhằm đánh giá giá trị hội tụ và giá trị phân biệt của các thang đo. Phân tích khám phá nhân tố sẽ giúp cho việc rút gọn từ một tập hợp gồm nhiều biến quan sát thành những biến tiềm ẩn ít hơn mà vẫn giải thích được dữ liệu nghiên cứu [119] . Do là phân tích lần lượt cho từng nhân tố nên nghiên cứu sinh lựa chọn phương pháp rút trích thành phần chính với phép xoay varimax để thu được phương sai lớn nhất. Ở bước này, luận án chỉ xem xét các biến có hệ số tải nhân tố > 0.5; hệ số KMO của các nhân tố trong mô hình > 0.5 thể hiện việc phân tích nhân tố là thích hợp; kiểm định Bartlett có p-value < 0.05 thể hiện các biến quan sát có mối tương quan với nhau trong tổng thể và phương sai giải thích các nhân tố > 50% cho thấy phân tích nhân tố giải thích được hơn 50% [105a].
• Đánh giá chính thức thang đo
o Phân tích khẳng định nhân tố (CFA) để đánh giá tính tương thích giữa lý thuyết và dữ liệu thực tế, giá trị hội tụ, giá trị phân biệt: Các thang đo nhân tố sẽ được đánh giá chính thức về tính tương thích giữa lý thuyết và dữ liệu thực tế, giá trị hội tụ, giá trị phân biệt thông qua phân tích khẳng định nhân tố với mẫu nghiên cứu chính thức (n = 1789). Phân tích khẳng định nhân tố (CFA) là phương pháp phân tích sử dụng thông tin tiên nghiệm từ các nghiên cứu trước, các lý thuyết nền tảng để xây dựng thang đo hoặc từ nghiên cứu khám phá nhân tố nhằm kiểm chứng sự tồn tại của các khái niệm nghiên cứu, tính tương thích của mô hình lý thuyết với dữ liệu thực tế [119] [138].
Trong phân tích CFA có hai mô hình để đánh giá độ giá trị (validity) của từng nhân tố và cả mô hình đề xuất bao gồm: (1) mô hình đo lường và (2) mô hình tới hạn. Mô hình đo lường là mô hình đánh giá cho một nhân tố mà không xem xét quan hệ của nó với các nhân tố khác. Mô hình đo lường được sử dụng để đánh giá tính tương thích với dữ liệu thực tế và giá trị hội tụ của khái niệm nghiên cứu. Mô hình tới hạn là mô hình xem xét các quan hệ trong mô hình tổng thể với nhau mà không phải các quan hệ riêng lẻ để đánh giá tính thích hợp tổng thể với dữ liệu thực tế và giá trị phân biệt của từng khái niệm.
Đầu tiên các khái niệm nghiên cứu (nhân tố trong mô hình) được đánh giá lần lượt với nhau để kiểm định tính phù hợp với dữ liệu thực tế và giá trị phân biệt. Tiêu chuẩn để một mô hình phù hợp với dữ liệu thực tế là hệ số Chi-square/df <5 với các nghiên cứu có N>= 200, các hệ số CFI, TLI, IFI > 0.9 [119] [138] và hệ số RMSEA nhỏ hơn 0.08 [126]. Mặc dù vậy các chỉ số thích hợp mô hình không hoàn toàn thống nhất với nhau nên các nhà nghiên cứu đề nghị cách sử dụng đa chỉ số. Với mỗi nghiên cứu có từ 3 đến 4 chỉ số thích hợp là đủ bằng chứng cung cấp về tính phù hợp của mô hình mà không cần xem xét tất cả các chỉ báo khác nhau [105a]. Trong nghiên cứu này, các chỉ số được lựa chọn để đánh giá tính thích hợp mô hình bao gồm: CFI, TLI, IFI và RMSEA.
Các hệ số tải nhân tố của các biến quan sát lớn hơn 0.5 được xem là đạt giá trị hội tụ [119] [138].
Cuối cùng, mô hình tới hạn được sử dụng để đánh giá tính tương thích của mô hình tổng thể với dữ liệu thực tế và giá trị phân biệt giữa các khái niệm trong mô hình. Tiêu chuẩn đánh giá giá trị phân biệt giữa các khái niệm là kiểm định hệ số tương quan giữa các nhân tố khác đơn vị (1), trong nghiên cứu này nghiên cứu sinh sử dụng kiểm định bằng bootstrap với khoảng tin cậy 95%
86
các hệ số tương quan không chứa giá trị 1 các khái niệm nghiên cứu được xem là đạt giá trị phân biệt. Các hệ số tin cậy tổng hợp lớn hơn 0.7, phương sai trích lớn hơn 50% được xem là các chỉ báo về tính tin cậy và giá trị hội tụ của một thang đo.
o Phân tích bằng mô hình cấu trúc tuyến tính (SEM) để kiểm định các giả thuyết nghiên cứu:
Để kiểm định các giả thuyết nghiên cứu, nghiên cứu sinh sử dụng mô hình cấu trúc tuyến tính (SEM) với phương pháp phân tích đường dẫn (path analysis) thông qua các trọng số hồi quy và giá trị p-value để kiểm định. Phân tích khẳng định nhân tố là một dạng của phân tích mô hình cấu trúc, do đó tiêu chuẩn phù hợp của mô hình với dữ liệu thực tế được xem xét giống như phần đánh giá chính thức thang đo. Tiêu chuẩn kiểm định các giả thuyết nghiên cứu lấy theo thông lệ ở mức ý nghĩa 5%.
Luận án cũng xem xét hiện tượng lấn át trong phân tích mô hình cấu trúc khi hệ số Beta của biến độc lập đổi dấu ngược với dấu của hệ số tương quan và các biến độc lập có tương quan cao với nhau. Khi đó phải xem xét lại mối quan hệ giữa biến độc lập và biến phụ thuộc có thực sự là tác động trực tiếp hay tác động gián tiếp qua một biến khác (biến có tương quan cao) [157].
o Kiểm định bootstrap tính bền vững của mô hình:
Do tính chất của nghiên cứu chọn mẫu, các tham số thống kê được sử dụng để suy diễn cho tổng thể. Tuy nhiên các ước lượng mẫu thay đổi từ mẫu này sang mẫu khác. Để đánh giá sự tin cậy của các ước lượng, các nhà nghiên cứu có thể chia mẫu nghiên cứu thành hai mẫu con. Một mẫu dùng để ước lượng tham số, một mẫu dùng để so sánh với giá trị ước lượng được để đánh giá độ chệch (bias) của các ước lượng. Tuy nhiên cách làm này thường không khả thi do các phân tích nhân tố đều đòi hỏi mẫu lớn.
Trong trường hợp như vậy phương pháp thay thế thường được sử dụng là phương pháp Bootstrap. Boostrap là phương pháp lẫy mẫu có hoàn lại được phát triển bởi Efron năm 1979 [100]. Trong phương pháp bootstrap mẫu thu được đóng vai trò là tổng thể và các mẫu được lấy ra để ước lượng lấy theo quy tắc lấy mẫu có hoàn lại (sampling with replacement). Với cách lấy mẫu này nhà nghiên cứu có thể tái tạo nhiều cỡ mẫu nghiên cứu khác nhau để ước lượng các tham số thống kê và so sánh nó với ước lượng mẫu ban đầu.
Độ chệch của ước lượng bootstrap với mẫu càng nhỏ càng thể hiện tính tin cậy của ước lượng mẫu tính được. Các phần mềm thống kê hiện nay như SPSS, AMOS đều cho phép người sử dụng sử dụng phương pháp bootstrap để tạo ra nhiều cỡ mẫu khác nhau tùy ý để so sánh với ước lượng ban đầu một cách rất dễ dàng và thuận tiện. Trong luận án này nghiên cứu sinh sử dụng cỡ mẫu có hoàn lại theo phương pháp bootstrap là 2000 để đánh giá tính vững của mô hình ước lượng được. Giá trị tới hạn về độ chệch ước lượng không quá giá trị 2 được xem là mô hình vững và tin cậy.
oĐánh giá mức độ của các nhân tố trong mô hình và ý định khởi nghiệp của SV: Để đánh giá hiện trạng về từng nhân tố trong mô hình, nghiên cứu sinh sử dụng điểm đánh giá trung bình, độ lệch chuẩn và khoảng tin cậy 95% để đánh giá.
o Phân tích đa nhóm để đánh giá sự khác biệt giữa các nhóm:
Để đánh giá sự khác biệt về ảnh hưởng các tiền tố tới ý định khởi nghiệp của các nhóm sinh viên khác nhau, nghiên cứu sinh sử dụng phân tích đa nhóm. Phân tích đa nhóm ước lượng từ tham số thông kê cho từng nhóm được phân chia theo các dấu hiệu phân biệt. Để lựa chọn mô hình bất biến (mô hình không phân biệt) hay mô hình khả biến (mô hình phân biệt các nhóm), nghiên cứu sinh sử dụng kiểm định Chi-square với mức ý nghĩa 5%. Nếu p-value lớn hơn 0.05 lựa chon mô hình bất biến, nhỏ hơn 0.05 lựa chọn mô hình khả biến.
87
Để so sánh mức độ sẵn sàng về ý định khởi nghiệp của sinh viên theo các nhóm ngành, các trường đại học khách nhau hay giữa các nhóm sinh viên có/không tham gia khóa đào tạo khởi nghiệp, nghiên cứu sinh sử dụng phân tích bằng T-test và phân tích phương sai (ANOVA). Phân tích T-test để sử dụng so sánh cho hai nhóm và phân tích phương sai sử dụng cho trên hai nhóm, nếu có sự khác biệt kiểm định hậu định phân tích sâu ANOVA là Post-hoc Test ANOVA để xem xét sâu sự khác biệt về ý định khởi nghiệp của sinh viên ở các nhóm khác nhau.
4.4.3 Phân tích dữ liệu sơ cấp bằng phương pháp định tính
Ngoài phương pháp nghiên cứu định lượng, luận án còn sử dụng các phương pháp nghiên cứu định tính ở phần thiết kế mô hình, phát triển và hiệu chỉnh bảng câu hỏi sử dụng cho điều tra, phỏng vấn sâu sau khi có kết quả phân tích định lượng. Do đặc tính của các nghiên cứu định tính là các nghiên cứu có tính chất mô tả, khákêysm phá và giải thích các hiện tượng nên không sử dụng các phân tích có tính định lượng qua các tham số thống kê. Bởi vậy, các dữ liệu định tính được chia thành các nhóm dữ liệu theo mục đích sử dụng các quy trình phân tích khác nhau. Trong luận án này, nghiên cứu sinh chia dữ liệu định tính theo quá trình nghiên cứu và mục đích của từng giai đoạn nghiên cứu thành hai nhóm (1) dữ liệu phỏng vấn ban đầu để thiết lập mô hình và thang đo nhân tố; (2) dữ liệu phỏng vấn xây dựng phương án và giải thích sâu các kết quả nghiên cứu sau phân tích định lượng bằng phương pháp phỏng vấn sâu.
Đối với các phỏng vấn hiệu chỉnh bảng câu hỏi, bổ sung khía cạnh, các thảo luận thiết lập mô hình bằng thảo luận tay đôi và thảo luận nhóm chuyên gia: các dữ liệu được tiến hành phân tích theo chu trình phân tích định tính được đề xuất gồm các bước như sau:
Hình 4.6: Quy trình xử lý dữ liệu định tính thiết lập mô hình thang đo (Nguồn: Nghiên cứu sinh đề xuất)
Trong đó:
Bước 1: Sắp xếp dữ liệu. Tại bước này nghiên cứu sinh sẽ chuyển các file dữ liệu từ các định dạng khác nhau (ghi âm, ghi chép) từ các phỏng vấn thành các dữ liệu văn bản để tiến hành đánh dấu và mã hóa thành các chủ đề nhỏ và ghi chú các đặc điểm của từng phỏng vấn để tiện cho việc tra cứu và diễn giải dữ liệu.
Bước 2:Sàng lọc dữ liệu. Tại bước này nghiên cứu sinh đi sâu vào việc đọc toàn bộ dữ liệu đã thu được, xem xét bối cảnh và các ghi chú liên quan đến phỏng vấn để có cái nhìn khái quát về dữ liệu thu thập được. Các ý kiến, thảo luận được sắp xếp sẽ được sàng lọc thành những chủ đề nhỏ gắn kết với lý thuyết nền tàng của mô hình lý thuyết.
Bước 3: Mã hóa dữ liệu. Dữ liệu sau khi được sắp xếp và sàng lọc được tiến hành mã hóa.
Những chủ đề thảo luận, ý tưởng, ý kiến giống nhau sẽ được xem xét sắp xếp vào từng nhóm và Sắp xếp dữ liệu Sàng lọc dữ liệu
Diễn tả
Kết nối dữ liệu
Mã hóa dữ liệu
88
mã hóa giống nhau để tiện cho việc tra cứu và kết nối dữ liệu từ các nhóm phỏng vấn khác nhau.
Bước 4: Kết nối dữ liệu. Các đoạn dữ liệu mã hóa được xem xét và tiến hành kết nối các khái niệm, những khía cạnh với nhau dựa trên lý thuyết. Những khía cạnh được đánh giá về giá trị nội dung, các biểu đạt để sắp xếp đưa nó vào thành những khía cạnh đo lường cho từng nhân tố.
Bước 5:Diễn giải và bàn luận. Từ các kết nối dữ liệu nghiên cứu sinh cố gắng tiến hành diễn giải dữ liệu thu được phục vụ cho mục đích nghiên cứu. Các ý kiến sẽ được xem xét kết nối với lý thuyết, sự trùng lặp, cách điều chỉnh để diễn giải ý nghĩa của nghiên cứu.
Đối với nghiên cứu định tính sau nghiên cứu định lượng để giải thích rõ hơn về kết quả nghiên cứu và đề xuất một số phương án cho giải pháp nuôi dưỡng và phát triển ý định khởi nghiệp, nghiên cứu sinh sử dụng hình thức phỏng vấn tay đôi với các chuyên gia về khởi nghiệp, những sinh viên chưa tham gia khởi nghiệp và đã tham gia khởi nghiệp.