Yếu tố Ký hiệu Các biến quan sát Nguồn
Sự hài lòng của sinh viên
(SAT)
SAT1 Bạn sẽ giới thiệu người quen của mình theo học tại UEF
Kang và James (2004) SAT2 Quyết định theo học tại UEF là một lựa
chọn đúng đắn của bạn Lassar et al.
(2000) SAT3 Bạn hồn tồn hài lịng về chất lượng dịch
vụ đào tạo khi theo học tại UEF
3.3. Công cụ thu thập dữ liệu
Bảng câu hỏi tự trả lời được thiết kế bằng công cụ Google Drive đã được sử dụng để thu thập dữ liệu cần nghiên cứu trong đề tài này. Theo Ranjit Kumar (2005), việc sử dụng bảng câu hỏi để thu thập dữ liệu có những lợi ích sau:
- Tiết kiệm chi phí, thời gian và nguồn nhân lực.
- Đảm bảo được tính ẩn danh cao vì người nghiên cứu và đối tượng khảo sát không cần phải gặp mặt nhau.
Ngoài ra, cũng dễ thấy rằng với công cụ bảng câu hỏi nghiên cứu chúng ta có thể có được những thơng tin cần thiết từ số lượng lớn người trả lời một cách nhanh chóng và hiệu quả. Tuy nhiên, theo Bless et al. (2006), bảng câu hỏi tự trả lời có một số hạn chế như sau:
- Trình độ học vấn và sự hiểu biết của người trả lời đối với các thuật ngữ sử dụng trong bảng câu hỏi là không biết trước được.
- Tỉ lệ trả lời đối với các bảng câu hỏi là khá thấp.
Sau khi xem xét nhu cầu thu thập dữ liệu, những điểm mạnh và điểm yếu của công cụ Google Drive cũng như công cụ thu thập thông tin mà các nghiên cứu liên quan đã sử dụng, bảng câu hỏi đã được thiết kế bằng công cụ Google Drive được sử dụng để thu thập dữ liệu cần thiết.
3.4. Kích thước mẫu và phương pháp chọn mẫu nghiên cứu
Theo Nguyễn Văn Tuấn (2007), uớc lượng số lượng đối tượng cần thiết là một bước cực kỳ quan trọng trong việc thiết kế nghiên cứu đảm bảo có ý nghĩa khoa học. Vì nó quyết định thành cơng hay thất bại của nghiên cứu. Nếu số lượng đối tượng khơng đủ thì kết luận rút ra từ nghiên cứu khơng có độ chính xác cao, thậm chí khơng thể kết luận được gì. Ngược lại, nếu số lượng đối tượng quá nhiều hơn so với số mẫu cần thiết thì tài nguyên, tiền bạc và thời gian sẽ bị hao phí.
Theo các nhà nghiên cứu:
- Để tiến hành phân tích hồi qui một cách tốt nhất, theo Tabachnick và Fidell (2007), kích thước mẫu phải bảo đảm theo công thức: n ≥ 8m + 50 (n là cỡ mẫu, m là số biến độc lập trong mơ hình); trong khi đó, theo Harris RJ. Aprimer (1985), n ≥ 104 + m (với m là số lượng biến độc lập và phụ thuộc), hoặc n ≥ 50 + m, nếu m < 5. - Trường hợp sử dụng phương pháp phân tích nhân tố khám phá EFA (Exploratory Factor Analysis), Hair et al. (1998) cho rằng kích thước mẫu tối thiểu phải là 50, tốt hơn là 100 và tỉ lệ số biến quan sát/biến đo lường là 5/1, nghĩa là cứ mỗi biến đo lường cần tối thiểu 5 quan sát.
Nghiên cứu này sử dụng phương pháp phân tích nhân tố khám phá EFA, mơ hình nghiên cứu có số biến quan sát là 40 nên theo Hair et al. thì kích thước mẫu tối thiểu cần thiết cho nghiên cứu là 40*5=200.
Phương pháp chọn mẫu là phi ngẫu nhiên - chọn mẫu theo hạn ngạch. Kích thước mẫu cho mỗi đơn vị thành phần phụ thuộc vào số lượng sinh viên theo năm học, ngành học và bậc đào tạo. Với khoảng hơn 1100 sinh viên hệ chính quy (Cao đẳng và Đại học), để đạt được kích thước mẫu đề ra và đảm bảo cho kết quả nghiên cứu đại diện được cho tổng thể, 900 bảng câu hỏi gửi đi phỏng vấn, kết quả thu về được 333 mẫu hợp lệ. Như vậy, số lượng mẫu 333 là chấp nhận được đối với đề tài nghiên cứu này.
3.5. Phương pháp phân tích dữ liệu
Sau khi thu thập, tồn bộ dữ liệu khảo sát sẽ được tải về dưới dạng tập tin Excel và phần mềm xử lý số liệu thống kê SPSS 16.0 được sử dụng để xử lý và phân tích số liệu qua các phân tích sau: thống kê mô tả, đánh giá độ tin cậy của các thang đo, phân tích nhân tố khám phá và phân tích hồi qui. Cụ thể:
(1). Lập bảng tần số để mô tả mẫu thu thập theo các thuộc tính. (2). Đánh giá thang đo:
Việc đánh giá sơ bộ độ tin cậy và giá trị của thang đo được thực hiện bằng phương pháp hệ số tin cậy Cronbach Alpha và phân tích nhân tố khám phá EFA thông qua phần mềm xử lý SPSS 16.0 để sàng lọc, loại bỏ các biến quan sát không đáp ứng tiêu chuẩn (biến rác).
- Cronbach Alpha:
Cronbach Alpha là phép kiểm định thống kê về mức độ chặt chẽ (khả năng giải thích cho một khái niệm nghiên cứu) của tập hợp các biến quan sát (các câu hỏi) trong thang đo thơng qua hệ số Cronbach Apha. Theo Hồng Trọng và Chu Nguyễn Mộng Ngọc (2008), nhiều nhà nghiên cứu đồng ý rằng khi hệ số Cronbach Alpha có giá trị từ 0,8 trở lên đến gần 1,0 là thang đo tốt; từ 0,7 đến gần 0,8 là sử dụng được.
Cũng có nhiều nhà nghiên cứu (ví dụ: Nunally, 1978; Peterson, 1994; Slater, 1995) đề nghị hệ số Cronbach Alpha từ 0,6 trở lên là có thể sử dụng được trong trường hợp khái niệm đang nghiên cứu là mới hoặc mới đối với người trả lời trong bối cảnh nghiên cứu. Tuy nhiên, Cronbach Alpha không cho biết biến nào nên loại bỏ và biến nào nên giữ lại. Vì vậy, bên cạnh hệ số Cronbach Alpha, người ta còn sử dụng hệ số tương quan biến tổng (item – total correlation) và những biến nào có tương quan biến tổng < 0,3 sẽ bị loại bỏ (Nunnally and Burnstein, 1994 trích trong Nguyễn Đình Thọ, 2011). Với nghiên cứu này, tác giả sẽ giữ lại các thang đo có trị số Cronbach Alpha ≥ 0,6 và loại các biến quan sát có tương quan biến tổng < 0,3.
- Phân tích nhân tố khám phá EFA:
Phân tích nhân tố khám phá EFA là tên chung của một nhóm thủ tục được sử dụng phổ biến để đánh giá thang đo hay rút gọn một tập biến. Trong nghiên cứu này, phân tích nhân tố được ứng dụng để tóm tắt tập các biến quan sát vào một số nhân tố nhất định đo lường các khía cạnh khác nhau của các khái niệm nghiên cứu. Tiêu chuẩn áp dụng và chọn biến đối với phân tích nhân tố khám phá EFA bao gồm:
+ Hệ số KMO dùng để đánh giá sự thích hợp của EFA. Do đó, EFA được gọi là thích hợp khi: 0,5 ≤ KMO ≤ 1. Kaiser (1974) trích trong Nguyễn Đình Thọ (2011) đề nghị, KMO ≥ 0,9 thì rất tốt, KMO ≥ 0,8 thì tốt, KMO ≥ 0,7 thì được, KMO ≥ 0,6 thì tạm được, KMO ≥ 0,5 thì xấu và KMO < 0,5 thì khơng thể chấp nhận được. Đồng thời, kiểm định Bartlett xem xét giả thuyết H0 (các biến khơng có tương quan với nhau trong tổng thể), nếu kiểm định này có ý nghĩa thống kê (Sig. < 0,05), ta bác bỏ giả thuyết H0, nghĩa là các biến có tương quan với nhau trong tổng thể.
+ Tiêu chuẩn rút trích nhân tố gồm chỉ số Eigenvalue (đại diện cho lượng biến thiên được giải thích bởi các nhân tố) và chỉ số Cumulative (tổng phương sai trích cho biết phân tích nhân tố giải thích được bao nhiêu % và bao nhiêu % bị thất thoát). Theo Gerbing và Anderson (1988), các nhân tố có Eigenvalue <1 sẽ khơng
có tác dụng tóm tắt thơng tin tốt hơn biến gốc (biến tiềm ẩn trong các thang đo trước khi EFA). Vì thế, các nhân tố chỉ được rút trích tại Eigenvalue > 1 và được chấp nhận khi tổng phương sai trích ≥ 50%. Theo Nguyễn Khánh Duy (2009), nếu sau phân tích EFA là phân tích hồi qui thì có thể sử dụng phương pháp trích Pricipal components với phép xoay Varimax.
+ Tiêu chuẩn hệ số tải nhân tố (Factor loading) biểu thị tương quan đơn giữa các biến với các nhân tố, dùng để đánh giá mức ý nghĩa của EFA. Theo Hair et al. (1998), Factor loading > 0,3 được xem là đạt mức tối thiểu; Factor loading > 0,4 được xem là quan trọng; Factor loading > 0,5 được xem là có ý nghĩa thực tiễn. Đồng thời, Hair et al. cũng khuyên, nếu chọn Factor loading > 0,3 thì cỡ mẫu ít nhất phải là 350, nếu cỡ mẫu khoảng 100 thì nên chọn Factor loading > 0,55; nếu cỡ mẫu khoảng 50 thì Factor loading phải > 0,75. Ngoại lệ, có thể giữ lại biến có Factor loading < 0,3 nhưng biến đó phải có giá trị nội dung. Cũng có tác giả quan tâm đến tiêu chuẩn khác biệt hệ số tải nhân tố của một biến quan sát giữa các nhân tố ≥ 0,3 để đảm bảo giá trị phân biệt giữa các nhân tố (Nguyễn Đình Thọ, 2011).
Với nghiên cứu này, tác giả sử dụng phương pháp trích Principal components với phép xoay Varimax, rút trích các nhân tố có Eigenvalue >1, với Tổng phương sai trích ≥ 50%, 0,5 ≤ KMO ≤ 1 và Bartlett’s test (Sig.) < 0,05; loại bỏ các biến quan sát có trị số Factor loading ≤ 0,5 hay sự khác biệt hệ số tải nhân tố của một biến quan sát giữa các nhân tố < 0,3.
(3). Thống kê mô tả.
(4). Xây dựng mơ hình hồi qui tuyến tính:
Mơ hình hồi qui đa biến được sử dụng dùng để phân tích mối quan hệ giữa một biến phụ thuộc với nhiều biến độc lập. Ở nghiên cứu này, tác giả sẽ thực hiện: Xem xét sự tương quan giữa các biến, Kiểm định các giả định của mơ hình hồi qui và Phân tích hồi qui.
- Xem xét sự tương quan giữa các biến:
Sử dụng hệ số Pearson để xem xét các mối quan hệ tương quan tuyến tính giữa biến phụ thuộc với biến độc lập, cũng như giữa các biến độc lập với nhau. Nếu hệ số tương quan giữa biến phụ thuộc với các biến độc lập lớn, chứng tỏ giữa chúng có mối quan hệ với nhau và phân tích hồi qui tuyến tính có thể phù hợp. Mặt khác, nếu giữa các biến độc lập cũng có tương quan lớn với nhau thì đó cũng là dấu hiệu cho biết giữa chúng có thể xảy ra hiện tượng đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
- Kiểm định các giả định của mơ hình hồi qui:
Theo Hồng Trọng và Chu Nguyễn Mộng Ngọc (2008), sự chấp nhận và diễn dịch kết quả hồi qui không thể tách rời các giả định cần thiết và sự chẩn đoán về sự vi phạm các giả định. Nếu các giả định bị vi phạm, thì các kết quả ước lượng được khơng đáng tin cậy nữa. Vì thế, để đảm bảo sự diễn dịch từ kết quả hồi qui của mẫu cho tổng thể có giá trị, ta sẽ tiến hành kiểm định các giả định của hàm hồi qui, bao gồm: Liên hệ tuyến tính; Phương sai của sai số không đổi; Phân phối chuẩn của phần dư; Tính độc lập của sai số; Khơng có hiện tượng đa cộng tuyến.
+ Liên hệ tuyến tính: Phương pháp được sử dụng là biểu đồ phân tán Scatterplot với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự đốn chuẩn hóa trên trục hồnh. Nếu giả định liên hệ tuyến tính thỏa mãn, thì ta sẽ khơng nhận thấy có liên hệ gì giữa các giá trị dự đốn và phần dư, chúng sẽ phân tán rất ngẫu nhiên (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
+ Phương sai của sai số không đổi: Theo Hoàng Trọng và Chu Nguyễn Mộng
Ngọc (2008, trang 226), hiện tượng phương sai của sai số thay đổi có thể làm cho các ước lượng của hệ số hồi qui không chệch nhưng không hiệu quả (tức là không phải ước lượng phù hợp nhất), từ đó làm cho kiểm định các giả thuyết mất hiệu lực khiến chúng ta đánh giá nhầm về chất lượng của mơ hình hồi qui. Để thực hiện kiểm định này, tác giả sẽ sử dụng hệ số tương quan hạng Spearman của giá trị tuyệt đối phần dư và các biến độc lập.
+ Phân phối chuẩn của phần dư: Theo Hoàng Trọng và Chu Nguyễn Mộng
Ngọc (2008, trang 228), phần dư có thể khơng tn theo phân phối chuẩn vì những lý do: sử dụng mơ hình khơng đúng, phương sai khơng phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích. Vì vậy, ta sử dụng nhiều cách khảo sát khác nhau để đảm bảo tính xác đáng của kiểm định. Nghiên cứu này sẽ sử dụng cách xây dựng biểu đồ tần số Histogram và biểu đồ P-P plot để khảo sát phân phối của phần dư.
+ Tính độc lập của sai số: Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008, trang 232-233), nguyên nhân hiện tượng này có thể là do các biến có ảnh hưởng khơng được đưa hết vào mơ hình do giới hạn và mục tiêu nghiên cứu, chọn mối liên hệ tuyến tính mà lẽ ra là phi tuyến, sai số trong đo lường các biến …, các lý do này có thể dẫn đến vấn đề tương quan chuỗi trong sai số và tương quan chuỗi cũng gây ra những tác động sai lệch nghiêm trọng đến mơ hình hồi qui tuyến tính như hiện tượng phương sai thay đổi. Đại lượng thống kê Durbin-Watson có thể dùng để kiểm định tương quan này. Nếu Durbin-Watson nằm trong đoạn từ 1 đến 3 thì có thể chấp nhận hiện tượng tự tương quan khơng xảy ra.
+ Khơng có hiện tượng đa cộng tuyến: Theo Hoàng Trọng và Chu Nguyễn
Mộng Ngọc (2008, trang 235, 252), cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau. Vấn đề của hiện tượng này là chúng cung cấp cho mơ hình những thơng tin rất giống nhau và rất khó tách rời ảnh hưởng của từng biến một đến biến phụ thuộc; làm tăng độ lệch chuẩn của các hệ số hồi qui và làm giảm trị thống kê t của kiểm định mức ý nghĩa trong khi hệ số R square vẫn khá cao. Trong mơ hình hồi qui bội này, giả định giữa các biến độc lập của mơ hình khơng có hiện tượng đa cộng tuyến. Hiện tượng này được kiểm định thông qua hệ số phóng đại phương sai VIF (Variance inflation factor). Khi VIF vượt quá 10, đó là dấu hiệu của đa cộng tuyến. Tuy nhiên, theo Nguyễn Hùng Phong (2012), khơng có tiêu chuẩn chính xác nào của VIF nói lên độ lớn của VIF là bao nhiêu thì hiện tượng đa cộng tuyến xảy ra nhưng theo kinh nghiệm nếu VIF > 5 thì hiện tượng đa cộng
tượng đa cộng tuyến hoặc nếu có hiện tượng đa cộng tuyến xảy ra thì cũng khơng đáng kể.
- Phân tích hồi qui:
Nếu các giả định khơng bị vi phạm, mơ hình hồi qui tuyến tính bội được xây dựng. Phương trình hồi qui tuyến tính đa biến có dạng:
Y = B0 + B1*X1 + B2*X2 + B3*X3 + … + Bi*Xi trong đó: Y: mức độ thỏa mãn;
Xi: các yếu tố tác động đến sự thỏa mãn; B0: hằng số, Bi: các hệ số hồi qui (i > 0). Khi tiến hành phân tích hồi qui tuyến tính, ta xem xét:
+ Đánh giá độ phù hợp của mơ hình hồi qui tuyến tính bằng hệ số xác định R2 điều chỉnh: Hệ số xác định tỉ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập trong mơ hình hồi qui. Đó cũng là thơng số đo lường độ thích hợp của đường hồi qui theo qui tắc R2 càng gần 1 thì mơ hình xây dựng càng thích hợp, R2 càng gần 0 mơ hình càng kém phù hợp với tập dữ liệu mẫu. Tuy nhiên, R2 có khuynh hướng là một ước lượng lạc quan của thước đo sự phù hợp của mơ hình đối với dữ liệu trong trường hợp có hơn 1 biến giải thích trong mơ hình. Trong tình huống này R2 điều chỉnh (Adjusted R square) được sử dụng để phản ánh sát hơn mức độ phù hợp của mơ hình tuyến tính đa biến vì nó khơng phụ thuộc vào độ lệch phóng đại của R2 (Nguyễn Đình Thọ, 2011).
+ Kiểm định độ phù hợp của mơ hình: Kiểm định F trong phân tích phương
sai là một phép kiểm định giả thuyết về độ phù hợp của mơ hình tuyến tính tổng thể. Nếu giả thuyết H0 của kiểm định F bị bác bỏ thì có thể kết luận mơ hình hồi qui tuyến tính đa biến phù hợp với tập dữ liệu và có thể sử dụng được (Nguyễn Đình Thọ, 2011).