Nghiên cứ u đi ̣nh lượng nhằm vào mu ̣c đích thu thâ ̣p dữ liê ̣u để kiểm đi ̣nh các lý thuyết khoa ho ̣c được suy diễn từ lý thuyết đã có.
2.8.1 Chọn mẫu.
Mục đích của nghiên cứu là tìm hiểu những đă ̣c tính của đám đông cần nghiên cứ u, nghĩa là phải thu thâ ̣p dữ liê ̣u của đám đông. Tuy nhiên, vì nhiều lý do mà nhà
nghiên cứ u không thể thu thâ ̣p dữ liê ̣u của toàn bô ̣ đám đông mà phải cho ̣n mô ̣t nhóm nhỏ nào đó (cho ̣n mẫu) để nghiên cứu.
Việc xác đi ̣nh kích thước mẫu trong nghiên cứu khoa ho ̣c tùy thuô ̣c vào viê ̣c người nghiên cứu muốn sử du ̣ng phương pháp xử lý nào. Chẳng ha ̣n, nếu muốn vừa phân tích hồi quy và EFA, viê ̣c phân tích hồi quy đòi hỏi cần 150 mẫu tuy nhiên phân tích EFA la ̣i cần 300 mẫu, thì nên cho ̣n 300 mẫu vì nếu kích thước mẫu thỏa cho EFA
thì cũng sẽ thỏa mãn phân tích hồi quy. Kích thước mẫu trong EFA là 5:1 = tỷ lê ̣ quan sát: biến đo lường có nghĩa là mô ̣t biến đo lường cần tối thiểu 5 quan sát.
2.8.2 Thống kê mẫu.
- Mode là giá tri ̣ có tần số xuất hiê ̣n lớn nhất của mô ̣t tâ ̣p hợp các số đo.
- Phương sai đo lường mức đô ̣ phân tán của mô ̣t tâ ̣p số đo xung quanh trung bình của nó.
- Đô ̣ lê ̣ch chuẩn là căn bâ ̣c hai của phương sai.
- Khoảng biến thiên là khoảng cách giữa giá tri ̣ lớn nhất và giá tri ̣ nhỏ nhất của một tâ ̣p số đo.
2.8.3 Hệ số tương quan.
Hệ số tương quan r là mô ̣t chỉ số thống kê đo lường mối liên hê ̣ tương quan giữa hai biến. Hê ̣ số tương quan có giá tri ̣ từ -1 đến 1. Hê ̣ số tương quan bằng 0 (hay gần 0) có nghĩa hai biến không có liên hê ̣ gì với nhau. Nếu hê ̣ số bằng -1 hay 1có nghĩa là hai biến có quan hê ̣ tuyê ̣t đối. Nếu giá tri ̣ tương quan là âm (r < 0) có nghĩa là hai biến tỷ lê ̣ nghi ̣ch với nhau (mô ̣t biến tăng thì biến kia sẽ giảm). Nếu giá tri ̣ tương quan là dương (r > 0) có nghĩa là hai biến tỷ lê ̣ thuâ ̣n với nhau (mô ̣t biến tăng thì biến kia cũng tăng theo).
2.8.4 Đo lườ ng đô ̣ tin câ ̣y – Cronbach’s Alpha.
Cronbach (1951) đưa ra hê ̣ số tin câ ̣y cho thang đo song hành và tương đương. Hê ̣ số Cronbach’s Alpha chỉ đo lường đô ̣ tin câ ̣y của thang đo gồm ba biến trở lên chứ
không tính được đô ̣ tin câ ̣y cho từng biến quan sát.
Hệ số Cronbach’s Alpha có giá tri ̣ biến thiên khoảng 0.1. Về lý thuyết, Cronbach’s Alpha càng cao càng tốt. Tuy nhiên, về mă ̣t thực tiễn nếu hê ̣ số Cronbach’s Alpha >
0.95 sẽ xảy ra hiê ̣n tượng trùng lắp trong đo lường có nghĩa là những biến thiên trong thang đo cùng đo lường cho mô ̣t nô ̣i dung nào đó của khái niê ̣m nghiên cứu. Các biến đo lường dùng để đo lường cùng mô ̣t khái niê ̣m nghiên cứu nên chúng phải có tương quan chặt chẽ với nhau. Vì vâ ̣y, khi kiểm tra từng biến đo lường chúng ta sử du ̣ng hê ̣ số tương quan biến tổng (item-total correlation). SPSS sử du ̣ng hê ̣ số tương quan biến tổng hiệu chỉnh (corrected item-total correlation). Hê ̣ số này lấy tương quan của biến đo lường xem xét với tổng các biến còn la ̣i trong thang đo. Nếu mô ̣t biến đo lường có
hệ số tương quan biến tổng hiê ̣u chỉnh ≥ 0.30 thì biến đó đa ̣t yêu cầu. Do đó, mô ̣t
thang đó có đô ̣ tin câ ̣y tốt khi nó biến thiên trong khoảng 0.70 - 0.80. Nếu Cronbach’s Alpha ≥ 0.60 là thang đo có thể chấp nhâ ̣n được về mă ̣t đô ̣ tin câ ̣y.
2.8.5 Phân tích nhân tố khám phá EFA – Exploratory Factor Analysis.
EFA dù ng để rút go ̣n mô ̣t tâ ̣p tin k biến quan sát thành mô ̣t tâ ̣p tin F (F<k) các nhân tố có ý nghĩa hơn. Cơ sở của viê ̣c rút go ̣n này dựa vào mối quan hê ̣ tuyến tính giữa các nhân tố với các biến quan sát. Trước khi sử du ̣ng EFA, chúng ta cần phải xem xét mối quan hê ̣ giữa các biến đo lường này.
- Sử du ̣ng ma trâ ̣n hê ̣ số tương quan (correlation matrix) chúng ta có thể nhâ ̣n biết được mức đô ̣ quan hê ̣ giữa các biến. Nếu hê ̣ số tương quan < 0.30 không phù hợp để sử du ̣ng EFA.
- Tiêu chí eigenvalue là mô ̣t tiêu chí sử du ̣ng phổ biến trong xác đi ̣nh số lượng nhân tố trong phân tích EFA. Với tiêu chí này, số lượng nhân tố được xác đi ̣nh có eigenvalue tối thiểu bằng 1(≥1).
- Kiểm định KMO (Kaiser-Meyer-Olkin measure of sampling adequacy) là chỉ
số dùng để so sánh đô ̣ lớn của hê ̣ số tương quan giữa hai biến với đô ̣ lớn của hệ số tương quan riêng phần của chúng. Vì vâ ̣y, KMO càng lớn càng tốt vì
phần chung giữa các biến càng lớn. Để sử du ̣ng EFA, KMO phải lớn hơn 0.50.
Kaiser (1974) đề nghi ̣ KMO≥0.90: rất tốt, KMO≥0.80: tốt, KMO≥0.70: được, KMO≥0.60: tạm được, KMO≥0.50: xấu và KMO≤0.50: không thể chấp nhâ ̣n được.
- Theo Hair & ctg (1998,111), Multivariate Data Analysis, Prentice-Hall International, Inc, Factor loading là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA (ensuring practical significance).
Factor loading > 0.3 được xem là đạt được mức tối thiểu.
Factor loading > 0.4 được xem là quan trọng.
Factor loading > 0.5 được xem là có ý nghĩa thực tiễn.
- Hair & ctg (1998,111) cũng khuyên bạn đọc như sau:
Nếu chọn tiêu chuẩn factor loading ≥ 0.3 thì cỡ mẫu của bạn ít nhất phải là 350.
Nếu cỡ mẫu của bạn khoảng 100 thì nên chọn tiêu chuẩn factor loading
≥0.55.
Nếu cỡ mẫu của bạn khoảng 50 thì Factor loading phải ≥ 0.75 2.8.6 Hồi quy bội.
Mô hình hồi quy bô ̣i (Multiple Liner Regression) biểu diễn mối quan hê ̣ giữa hai hay nhiều biến đô ̣c lâ ̣p đi ̣nh lượng vào mô ̣t biến phu ̣ thuô ̣c đi ̣nh lượng.
- Kiểm định mức đô ̣ phù hợp của mô hình: Hê ̣ số 𝑅2 dù ng để đánh giá mức đô ̣ phù hợp của mô hình hồi quy bô ̣i. Kiểm đi ̣nh mức đô ̣ phù hợp của mô hình chính là kiểm đi ̣nh giả thuyết 𝐻0: 𝑅2 = 0 so vớ i giả thuyết thay thế 𝐻0: 𝑅2#0.
Phép kiểm đi ̣nh F được sử du ̣ng để kiểm đi ̣nh giả thuyết này. Ý nghĩa của phép kiểm định F là nếu biến thiên hồi quy lớn hơn nhiều so với biến thiên phần dư thì mô hình hồi quy càng phù hợp.
- Trong mô hình hồi quy bô ̣i, vì có nhiều biến đô ̣c lâ ̣p nên phải dùng hê ̣ số xác đi ̣nh điều chỉnh 𝑅2adj (adjusted coefficient of determination; điều chỉnh theo bậc tự do) để thay thế cho 𝑅2 khi so sánh các mô hình với nhau. Hê ̣ số điều chỉnh này giúp điều chỉnh mức đô ̣ phù hợp của mô hình: nghĩa là kiểm tra những mô hình có nhiều biến đô ̣c lâ ̣p nhưng thực sự trong đó có mô ̣t số biến không giú p bao nhiêu cho viê ̣c giải thích biến thiên của biến phu ̣ thuô ̣c Y.
2.8.7 Đa cộng tuyến.
Đa cô ̣ng tuyến là hiê ̣n tượng các biến đô ̣c lâ ̣p không có tương quan hoàn toàn với nhau trong mô hình hồi quy bô ̣i. Hê ̣ số phóng đa ̣i phương sai VIF (Variance Inflation Factor) là chỉ số thường được dùng để kiểm tra hiê ̣n tượng đa cô ̣ng tuyến. Nếu dung sai T củ a mô ̣t biến đô ̣c lâ ̣p nào càng lớn thì phần riêng của nó càng lớn nên hê ̣ số
phóng đa ̣i phương sai VIF càng nhỏ, lúc này khả năng đa cô ̣ng tuyến sẽ nhỏ và ngược lại. Thông thường, VIF >10 thì biến này hầu như không có giá tri ̣ giải thích biến thiên củ a Y trong mô hình hồi quy.