Trong giáo dục, khi cần tìm hiểu hoặc khẳng định mối liên hệ giữa hai (hay nhiều) biến số, người ta thường dùng một hệ số tương quan. Ví dụ muốn tìm mức độ liên hệ giữa hai biến số: kết quả học tập tại trường sư phạm và điểm thành tích trong công tác sau khi tốt nghiệp đi dạy. Giá trị tương quan tính được sẽ cho biết mức độ liên hệ giữa các biến số đó là bao nhiêu ? Có chặt chẽ hay không ?
Dưới đây chỉ giới thiệu hệ số tương quan Pearson, có lúc gọi là tương quan tuyến tính hay tương quan tích số mômăng. Đó là tương quan giữa hai tập giá trị của hai biến lấy tên là X và Y. Kí hiệu hệ số tương quan là Rxy hay R.
Công thức hệ số tương quan Pearson:
Như tên gọi, tương quan này do Karl Pearson lập ra. Công thức có thể biểu thị
dưới nhiều dạng, sau đây là dạng công thức thực hành giúp dễ tính toán. Gọi X, Y là một cặp điểm số của mỗi học sinh. Để tương quan có ý nghĩa, cần phải có N học sinh (N ít nhất phải lớn hơn 5). Các tổng được tính trên điểm số của nhóm N học sinh đó.
Cách tính: Bạn thực hiện cách tính qua một bài tập cụ thể.
Nhiệm vụ
Nhiệm vụ 6.1: Làm việc cá nhân (15 phút).
Bạn hãy xem cột X và Y của bảng 6.1. Đây là điểm số hai môn Toán và Tự
nhiên và Xã hội của mười học sinh. Để tính hệ số tương quan, bạn hãy chép lại các điểm số này vào tờ giấy trắng và cần tạo thêm ba cột nữa là X*Y, X2 và Y2. Bạn đừng xem các con sốđã có trong ba cột này mà lần lượt điền các trị số vào các ô theo cách X nhân với Y (cột X*Y) hay bình phương các giá trị của X (cột X2 ) hay của Y (cột Y2). Sau đó tính tổng các cột. Thay vào công thức trên, dùng máy tính bỏ túi và hoàn thành các phép tính để được kết quả. Đối chiếu kết quả tính được với trị số R ở cuối bảng. Bảng 6.1 Bảng 6.2 X Y X*Y X2 Y2 X Y X*Y X2 Y2 5 6 30 25 36 7 8 7 8 56 49 64 8 7 6 5 30 36 25 10 10 4 5 20 16 25 9 7 8 9 72 64 81 6 8 10 9 90 100 81 3 4 6 7 42 36 49 7 6 8 7 56 64 49 8 10 9 9 81 81 81 6 9 5 4 20 25 16 9 7 68 69 497 496 507
Nhiệm vụ
Nhiệm vụ 6.2: Làm việc cá nhân (20 phút).
Lặp lại các thao tác đã làm để tính hệ số tương quan điểm số hai bài thi X và Y (số liệu ghi trong bảng 6.2).
ý nghĩa của hệ số tương quan Pearson:
Giả sử bạn đã tính được tương quan Pearson giữa 12 cặp giá trị của hai biến số
X, Y là Rxy = 0.753. Hiểu con số này như thế nào ? Có thể nói gì về mức độ
tương quan giữa X và Y ?
Trước hết ta cần làm kiểm nghiệm ý nghĩa hệ số tương quan, xem thực sự có mối tương quan tuyến tính giữa X và Y hay không. Muốn vậy, đơn giản nhất là so sánh trị số Rxy tính được với trị số đọc trong bảng giá trị tới hạn của hệ số
tương quan tuyến tính (thường viết với kí hiệu Rα). Ta phải chọn một giá trị
xác suất ý nghĩa, thông thường là 5% (hay 1% nếu muốn chính xác hơn) khi ra quyết định.
Trị sốđọc trong bảng sẽứng với vị trí giao nhau của hàng có độ tự do df = N −
2 và cột xác suất ý nghĩa α = 0.05 (hay 0.01). Xin xem bảng đính kèm trong phần thông tin phản hồi hoạt động 6 của chủđề này.
Kết luận: Nếu Rxy > Rα ghi trong bảng, ta kết luận hai dãy số X, Y có tương quan.
Ngược lại, Rxy < Rα, hai dãy số X, Y không tương quan.
Để trả lời câu hỏi trên, ta tính N − 2 = 12 − 2 = 10, dò cột df cho đến 10, kéo ngang sang cột α = 0.05, đọc trị số tại vị trí này = 0.576. Trị số Rxy = 0.753 > 0.576, do đó có thể kết luận là hai biến X, Y có tương quan ý nghĩa.