2. Các chức năng cơ bản của SPSS
2.5. Phân tích tương quan
Trước khi xem xét phân tích tương quan chúng ta cùng tìm hiểu qua về hai chỉ số rất quan trọng trong phân tích thống kê là Reliability (Độ tin cậy) và Validity (Độ chuẩn xác).
+ Reliability (Độ tin cậy) là độ ổn định của thang đo với các kết quả sai biệt không quá lớn trong một mẫu khảo sát đủ lớn. Khi thực hiện khảo sát với nhiều biến quan sát (biến độc lập) để đánh giá một biến tổng (biến phụ thuộc) thì độ ổn định trong các kết quả thu được giữa các biến quan sát là vô cùng quan trọng. Nó cho các nhà nghiên cứu biết được thang đo của họ có độ hiệu quả và độ tin cậy cao nếu không có sự sai khác lớn giữa các đáp án. Chỉ số này được đánh giá thông qua hệ số
Cronbach’s Alpha sẽ được trình bày kỹ hơn ở dưới.
+ Validity (Độ chuẩn xác) là độ hội tụ các kết quả khảo sát của các biến quan sát với biến tổng cần đánh giá. Nói cách khác chính là độ tương quan giữa các biến quan sát với biến tổng nhằm chỉ ra biến quan sát có thực sự đang đánh giá đúng biến tổng. Như vậy nếu các biến quan sát đều có mối tương quan với biến tổng thì thang đo có độ chuẩn xác cao. Ngược lại biến quan sát không có tương quan với biến tổng thì ta cần loại bỏ biến quan sát đó. Chỉ số này được đánh giá thông qua phân tích tương quan Pearson về độ tương quan giữa các biến quan sát với biến tổng.
+ VD: Một ví dụ đơn giản để thấy được sự khác nhau và tầm quan trọng của hai thông số này trong phân tích thống kê như sau: để đánh giá mức độ hiệu quả của phương pháp dạy học tích cực vào việc nâng cao kiến thức và kỹ năng cho học sinh, một nhà nghiên cứu đưa ra các câu hỏi cho các biến quan sát như sau: Học sinh có hài lòng về giáo viên giảng dạy? Thời gian học sinh tự học ở nhà? Học sinh thích môn học nào nhất? Giả sử kết quả khảo sát trong 3 lớp học đều cho kết quả gần tương tự nhau. Từ đó ta có thể nhận xét độ ổn định của thang đo này là rất lớn dẫn đến hệ số Cronbach’s Alpha cao. Tuy nhiên các biến quan sát này chưa thể đánh giá được biến tổng là mức độ hiện quả của phương pháp dạy học tích cực. Chính vì thế chỉ số tương quan giữa các biến quan sát với biến tổng trong phân tích tương quan Pearson
sẽ không cao. Do đó để đánh giá một thang đó là chính xác và tin cậy để có thể đánh giá đúng về biến tổng thì cả hai chỉ số Reliability và Validity đều phải đạt mốc.
Chính bởi tầm quan trọng của phân tích tương quan mà SPSS cũng cung cấp các công cụ phân tích tương quan trong Menu Analyze → Correlate, trong đó thường dùng nhất là:
* Bivariate: Phân tích tương quan Pearson (tương quan đơn).
Phân tích tương quan Pearson sẽ đánh giá độ tương quan giữa các biến quan sát và biến tổng, đồng thời cũng đánh giá tương quan giữa các biến quan sát với nhau. Tương quan Pearson r có giá trị từ -1 đến 1:[16]
- Nếu r càng tiến về -1, 1 thì tương quan tuyến tính càng mạnh mẽ, càng liên kết chặt chẽ với nhau. Tiến đến 1 là tương quan dương và ngược lại tiến đến -1 là tuong quan âm.
- Nếu r càng tiến về 0 thì tương quan tuyến tính giữa các biến càng yếu.
Tuy nhiên chỉ số r chỉ có nghĩa khi chỉ số sig < 0.05. Nếu sig > 0.05 chúng ta kết luận với mức ý nghĩa 5% thì hai biến không có tương quan với nhau. Chỉ số r < 0.2 biểu thị tương quan giữa các biến là rất yếu, tuy nhiên không vì thế mà có thể kết luận hai biến không có sự tương quan do vì sự tương quan thể hiện qua chỉ số sig. Ngược lại chỉ số r > 0.7 thì các biến quan sát có sự tương quan mạnh với biến tổng nên thang đo này là chuẩn xác.
Chọn thẻ Correlate → Bivariate → đưa biến tổng và các biến quan sát vào ô
Variables → OK.
VD: Kiểm định độ tương quan giữa biến tổng mức tiêu thụ xăng với các biến quan sát là công suất động cơ, khối lượng xe, số máy (cylinder) và dung tích động cơ với độ tin cậy 95%.
Thực hiện kiểm định: Đưa biến tổng và các biến quan sát vào ô Variables. Lưu ý, đưa biến tổng lên đầu tiên để dễ quan sát và nhận xét kết quả.
Kết quả:
Correlations
muc tieu thu xang (km/lit) cong suat dong co (HP) khoi luong xe (kg) so may (cylinder) dung tich dong co (lit) muc tieu thu
xang (km/lit) Pearson Correlation 1 -,788 ** -,858** -,681** -,777** Sig. (2- tailed) ,000 ,000 ,000 ,000 N 50 50 50 50 50 cong suat dong co (HP) Pearson Correlation -,788 ** 1 ,786** ,752** ,818** Sig. (2- tailed) ,000 ,000 ,000 ,000 N 50 50 50 50 50 khoi luong xe (kg) Pearson Correlation -,858 ** ,786** 1 ,802** ,901** Sig. (2- tailed) ,000 ,000 ,000 ,000 N 50 50 50 50 50 so may (cylinder) Pearson Correlation -,681 ** ,752** ,802** 1 ,941** Sig. (2- tailed) ,000 ,000 ,000 ,000 N 50 50 50 50 50 dung tich dong co (lit) Pearson Correlation -,777 ** ,818** ,901** ,941** 1 Sig. (2- tailed) ,000 ,000 ,000 ,000 N 50 50 50 50 50
**. Correlation is significant at the 0.01 level (2-tailed).
Bảng 9. Kết quả phân tích tương quan đơn Đánh giá kết quả:
Ở đây yếu tố cần chú ý đầu tiên là chỉ số sig của biến tổng với các biến quan sát. Ta thấy với tất cả biến quan sát chỉ số này đều nhỏ hơn 0.05 nên kết luận các biến quan sát đều có tương quan với biến tổng.
Sau đó quan sát giá trị Pearson Correlation, chỉ số này đều rơi vào khoảng (-0,6 → -0,9) như vậy có thể kết luận thang đo này là chuẩn xác.
Ngoài ra dựa vào bảng kết quả ta còn có thể đánh giá Validity (Độ chuẩn xác) giữa các biến quan sát với nhau theo cách nhận xét tương tự.