1 J°, X = — y njXi = 58,
§1 PHÂN TÍCH TƯƠNG QUAN 1.1 Sự phụ thuộc tương quan
1.1. Sự phụ thuộc tương quan
Xét hai biến X và Y. Giữa X và Y có thể có một số mối liên hệ sau:
a/ X và Y là độc lập (xem mục 3.7 chương II)
b/ Y phụ thuộc hàm số vào X nếu ứng với mỗi giá trị của X có một quy luật xác định một và chỉ một giá trị của Y : Y=f(X).
Ví dụ: Gọi Y là số tiền thu được khi bán X đơn vị hàng hoá. Biết
mỗi đơn vị hàng hoá bán với giá a đổng. Ta có Y= aX đồng. Như vậy Y phụ thuộc hàm số vào X.
c/ Y phụ thuộc thống kề vào X nếu ứng với mỗi giá trị của X có cả
một dẫy phân phối các giá trị của Y.
d/ Y phụ thuộc tương quan vào X
Theo mục 6.3, §6 chương III ta đã biết hệ số tương quan giữa X và Y ký hiệu là pXY được định nghĩa bằng công thức
E([X-E(X)J[Y-E(Y)]|
PxY VVar(X).Var(Y)
Hai biến được gọi là tương quan với nhau nếu hệ số tương quan
khác không và được gọi là không tương quan nếu hệ số tương quan bằng khơng.
Sau đây ta nhắc lại một số tính chất của hệ số tương quan Pxy ■ + Pxy = Pyx • Vì vậy nếu khơng có sự nhầm lẫn, để đơn giản người ta viết p thay cho Pxy
+ |p|<l
+ |p| = 1 khi và chỉ khi giữa X và Y có sự phụ thuộc hàm số
tuyến tính: Y=ß| + ß2X Nếu ß2 > 0 thì p = 1
Nếu ß2 < 0 thì p = -1
+ Nếu X và Y độc lập thì p = 0
Người ta dùng p để đo mức độ phụ thuộc tương quan tuyến tính
giữa X và Y. Khi |p| = lthì giữa X và Y có sự phụ thuộc hàm số tuyến tính. Khi p = 0 thì giữa X và Y khơng có sự phụ thuộc tương quan.
|p| càng lớn thì sự phụ thuộc tuyến tính càng chặt.
Như trên ta đã biết: Nếu X và Y độc lập thì p = 0 nhưng điều ngược lại chưa chắc đã đúng. Tuy nhiên nếu p = 0 và ( X ,Y ) có phân phối chuẩn hai chiều thì X và Y độc lập (xem § 10 chương IV).
Để kết luận giữa X và Y có sự phụ thuộc tương quan hay khơng ta phải tính được Pxy- Nếu Pxy * 0 thì giữa X và Y có sự phụ thuộc
tương quan. Nhưng vì ta thương khơng biết được quy luật phân phối xác suất của X cũng như của Y nên ta khơng tính được Pxy- Vì vậy
người ta còn đưa ra những dấu hiệu để nhận biết giữa X và Y có sự phụ
thuộc tương quan như sau:
+ Với mỗi giá trị của X có cả một dãy phân phối các giá trị của Y
+ Khi giá trị X của X thay đổi thì kỳ vọng có điều kiện E(Y/X=x) cũng thay đổi theo.
Ví dụ-. Chúng ta biết rằng năng suất lúa Y phụ thuộc vào lượng
phân bón X, nhưng Y khơng phụ thuộc hàm số vào X. Vì năng suất lúa khơng chỉ phụ thuộc vào lượng phân bón mà cịn phụ thuộc vào nhiều
yếu tố ngẫu nhiên khác như lượng mưa, nhiệt độ, sâu bệnh....Với cùng
một lượng phân bón X trên những thửa ruộng khác nhau có năng suất
lúa khác nhau. Nhưng chắc chắn rằng năng suất lúa trung bình thay đổi theo lượng phân bón. Vậy năng suất lúa Y phụ thuộc tương quan vào
lượng phân bón X.
Qua ví dụ trên ta thấy rằng sự phụ thuộc tương quan lỏng lẻo hơn sự phụ thuộc hàm số.
Chú ý-. Y phụ thuộc thống kê vào X thì chưa chắc Y đã phụ thuộc
tương quan vào X vì: tuy ứng với mỗi giá trị của X có cả một dẫy phân phối các giá trị của Y nhưng kỳ vọng có điều kiện E(Y/X=x) chưa chắc
đã thay đổi theo X.