Hệ số tương quan

Một phần của tài liệu Giáo trình Thống kê thực hành ở Trường Đại học Sư Phạm Đại học Đà Nẵng (Trang 85 - 88)

Chương 4 Phân tích tương quan

4.1. Hệ số tương quan

4.1.1. Hệ số tương quan lý thuyết

Định nghĩa 4.1. Cho hai đại lượng ngẫu nhiên X và Y xác định trên cùng một khơng gian mẫu. Khi đó hệ số

ρ=ρ(X, Y) = E[(X−E(X))(Y −E(Y))]

p

V(X)pV(Y) được gọi là hệ số tương quan của X và Y.

Định lý 4.2. Cho hai đại lượng ngẫu nhiên X và Y. Ta ln có i) −1≤ρ≤1;

ii) Nếu X và Y độc lập thì ρ= 0;

iii) Nếu Y =aX +b (phụ thuộc tuyến tính) thì

ρ(X, Y) =

1 nếu a >0

−1 nếu a <0

Ý nghĩa của hệ số tương quan: hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa hai đại lượng ngẫu nhiên X và Y. Nếu |ρ(X, Y)| càng gần 1 thì mối quan hệ tuyến tính càng chặt; nếu |ρ(X, Y)| càng gần 0 thì mức độ phụ thuộc tuyến tính giữa X và Y càng yếu. Nếu ρ(X, Y) = 0 thì ta nói X và Y

khơng tương quan tuyến tính, cịn nếu|ρ(X, Y)|= 1 thì X và Y phụ thuộc tuyến tính.

Nếu X và Y độc lập thì chúng khơng tương quan nhưng điều ngược lại không đúng. Tuy nhiên nếu X và Y là hai đại lượng ngẫu nhiên có phân phối chuẩn thì tính khơng tương quan tuyến tính và độc lập tương đương nhau.

Để đánh giá mức độ tương quan giữa hai biến ta có thể sử dụng Bảng Hopkins [8] sau

Giá trị |ρ(X, Y)| Mức độ tương quan <0,1 Rất nhỏ 0,1−0,3 Nhỏ 0,3−0,5 Trung bình 0,5−0,7 Lớn 0,7−0,9 Rất lớn 0,9−1 Gần như tuyến tính

4.1.2. Ước lượng hệ số tương quan

1) Nếu {(x1;y1),(x2;y2), ...,(xn;yn)} là một mẫu số liệu của (X;Y) thì ước lượng của ρ là ˆ ρ=r(x, y) = Pn k=1(xk−x)(yk−y) pPn k=1(xk −x)2pPn k=1(yk −y)2.

2) Nếu mẫu số liệu cho dạng bảng số

X x1 x2 · · · xm Y y1 y2 · · · ym ni n1 n2 · · · nm

thì ước lượng của ρ là ˆ ρ=r(x, y) = Pm k=1nk(xk−x)(yk −y) pPm k=1nk(xk −x)2pPm k=1nk(yk−y)2. Tính ρˆ bằng máy tính Casio FX570ES

1) Khởi động nhập bảng phân phối tần số:

Shift→SETUP→ DOWN (phím hình trịn nằm giữa máy tính)→ 4(Stat)

tiếp theo chọn 1 (ON);

2)Mode→3 (Stat)→2 (A+BX)

Tiến hành nhập số liệu. Kết thúc nhập: bấm AC;

3) Shift→1 (Stat)→ 7→ 3 (r)→=

Ví dụ 4.3. Để nghiên cứu sự phụ thuộc giữa hai đại lượng ngẫu nhiên X và Y

người ta tiến hành 9 quan sát độc lập và thu được kết quả

X 1 1,5 2 2 2,5 2,5 3 3 3

Y 22.8 22,5 23 17,5 17,6 13 12,8 9,4 7 Ước lượng hệ số tương quan ρ(X, Y).

Áp dụng cơng thức ta tính được ρˆ=r(x, y) = 0,88. Vì ρˆ khá gần −1 nên X

Giáo trình thống kê thực hành

Ví dụ 4.4. Một nghiên cứu được tiến hành ở Mỹ để xác định mối quan hệ giữa chiều cao (X) và cỡ giày (Y) của họ. Nhà nghiên cứu đã thu thập được số liệu sau

X (inch) 66 63 67 71 62 65 72 68 60 66

Y 9 7 8.5 10 6 8.5 12 10.5 5.5 8

Hãy ước lượng hệ số tương quan giữa X và Y.

Áp dụng cơng thức ta tính được ρˆ=r(x, y) = 0,95. ρˆkhá gần 1 nên X và Y có mối tương quan tuyến tính thuận.

Ví dụ 4.5. Tính hệ số tương quan giữa 2 biến X, Y cho bởi 14 giá trị quan sát độc lập của X và Y như sau:

X 100 125 125 150 150 200 200 250 250 300 300 350 400

Y 0,75 -0,84 0,35 -0,03 -0,62 0,66 -0,47 0,5 1,35 -0,8 -2,24 1,39 -0,92

Áp dụng cơng thức ta tính được ρˆ= r(x, y) = 0,002. ρˆ khá gần 0 nên X và Y

Một phần của tài liệu Giáo trình Thống kê thực hành ở Trường Đại học Sư Phạm Đại học Đà Nẵng (Trang 85 - 88)