Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 11 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
11
Dung lượng
377 KB
Nội dung
Phân tích tương quan Dr Tuan V Nguyen Garvan Institute of Medical Research Sydney Ví dụ Cân nặng vịng eo Số liệu sau trích từ nghiên cứu qui (trên 3000độ người) Việt Nam mối liên hệ số nhân trắc Tuổimơvà nồng bệnh tiểu đường Trọng lượng vịng eo 15 đối tượng: 64.0 87.0 75.0 93.0 54.0 66.0 52.0 74.0 53.0 75.0 52.0 72.0 48.0 70.0 46.0 66.0 63.0 81.0 40.0 57.0 90.0 94.0 80 74.0 70 54.0 60 64.0 50 47.0 40 89.0 weight 66.0 90 cholesterol 18 Trọngđo lượngđược Vòng eo người sau 51.0 71.0 60 70 80 waist 90 Vài thông số Cân nặng Vịng eo Trung bình 57 kg 75.5 cm Phương sai (variance) 163.6 122.6 Độ lệch chuẩn 12.8 11.1 Chúng ta cần thông số để “nối kết” hai biến Thơng số “hiệp biến” (covariance) Hiệp biến thơng số giao chéo (tích số) hai biến sau điều chỉnh cho số trung bình n cov ( x, y ) = ( xi − x ) ( yi − y ) = 130.8 ∑ n − i =1 Hệ số tương quan Cân nặng Vịng eo Trung bình 57 kg 75.5 cm Phương sai (variance) 163.6 122.6 Độ lệch chuẩn 12.8 11.1 n cov ( x, y ) = ( xi − x ) ( yi − y ) = 130.8 ∑ n − i =1 r= Cov ( x, y ) sx × s y 130.8 r= = 0.92 12.8 × 11.1 Mối liên hệ tương quan hình học h y y h H x h2 = x2 + y2 x h2 = x2 + y2 – 2xycos(H) Tam giác vuông Tam giác thường Nếu hai biến x y đọc lập, hiệp biến = Nếu hai biến x y phụ thuộc, hiệp biến không quan thuận nghịch -15 Tương r = -0.9 15 -30 20 -25 y y 25 -20 30 r = 0.9 10 12 14 x 16 10 12 14 x 16 Ý nghĩa hệ số tương quan Hệ số tương quan Ý nghĩa ±0.01 đến ±0.1 Mối tương quan thấp, không đáng kể ±0.2 đến ±0.3 Mối tương quan thấp ±0.4 đến ±0.5 Mối tương quan trung bình ±0.6 đến ±0.7 Mối tương quan cao ±0.8 trở lên Mối tương quan cao Ước tính khoảng tin cậy 95% • • Khó ước tính trực tiếp, nên phải thơng qua phương pháp Fisher Hốn chuyển r sang z: • Tính sai số chuẩn z theo công thức sau (chú ý: n số cỡ mẫu) 1+ r z = log ÷ 1− r SEz = n−3 • • Tính khoảng tin cậy 95% z = z + 1.96 x Sez Hoán chuyển ngược lại cho r theo công thức: e −1 r = 2z e +1 2z Ví dụ ước tính khoảng tin cậy 95% • • Trong ví dụ 1, có n = 15 r = 0.92 Hoán chuyển r sang z: 1+ r + 0.92 z = log ÷ = 0.5log ÷ = 1.906 1− r − 0.92 • Tính sai số chuẩn z theo công thức sau (chú ý: n số cỡ mẫu) 1 SEz = = = 0.288 n−3 15 − • Tính khoảng tin cậy 95% z = 1.906 + 1.96 x 0.288 = 1.34 đến 2.47 • Hốn chuyển ngược lại cho r theo cơng thức: e z − e 2×1.34 − r = 2z = 2×1.34 = 0.87 e +1 e +1 e z − e 2×2.47 − r = 2z = 2×2.47 = 0.98 e +1 e +1 Kiểm định giả thuyết • Hệ số tương quan r ước số hệ số tương quan quần thể ρ • Chúng ta khơng biết giá trị ρ, biết dao động khoảng 0.87 0.98 với xác suất 95% • Giả thuyết đặt ρ = (khơng có mối liên hệ cân nặng vịng eo) • Kiểm định giả thuyết t: t = z / Sez Trong ví dụ: z = 1.906, SEz = 0.288 Kiểm định: t = 1.906 / 0.288 = 6.61 Chúng ta có chứng từ chối giả thuyết, kết luận có mối liên hệ cân nặng vòng eo Cẩn thận diễn dịch • “Correlation is not causation” – tương quan khơng có nghĩa ngun nhân – hệ • r (trọng lượng vịng eo) = 0.92 khơng có nghĩa trọng lượng nguyên nhân làm cho người ta có vịng eo rộng, hay vịng eo rộng nguyên nhân làm cho người ta cân nặng • r = 0.92, hệ số bội r2 = (0.92)2 = 0.846 Điều có nghĩa “vịng eo ‘giải thích’ khoảng 85% khác biệt cân nặng cá nhân” hay “khoảng 85% khác biệt cân nặng cá nhân giải thích qua vịng eo.”