TÌM HIỂU VỀ HỆ SỐ TƯƠNG QUAN TRONG MÔ HÌNH PHÂN TÍCH THỒNG KÊ

8 2.8K 20
TÌM HIỂU VỀ HỆ SỐ TƯƠNG QUAN TRONG MÔ HÌNH PHÂN TÍCH THỒNG KÊ

Đang tải... (xem toàn văn)

Thông tin tài liệu

Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quan giữa hai biến số, như giữa độ mặn (x) và độ PH (y). Hệ số tương quan có giá trị từ 1 đến 1. Bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau; ngược lại nếu hệ số bằng 1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối.

TÌM HIỂU VỀ HỆ SỐ TƯƠNG QUAN TRON G MÔ HÌNH PHÂN TÍCH THỒNG KÊ ĐẶNG VĂN ĐÀNG Hệ số tương quan (r) số thống kê đo lường mối liên hệ tương quan hai biến số, độ mặn (x) độ PH (y) Hệ số tương quan có giá trị từ -1 đến Bằng (hay gần 0) có nghĩa hai biến số liên hệ với nhau; ngược lại hệ số -1 hay có nghĩa hai biến số có mối liên hệ tuyệt đối Giới thiệu: Hệ số tương quan (r) số thống kê đo lường mối liên hệ tương quan hai biến số, độ mặn (x) độ PH (y)[3] - Hệ số tương quan không (r) có đơn vị, tính từ giá trị mã hóa phép biến đổi tuyến tính x y - Hệ số tương quan có giá trị từ -1 đến Bằng (hay gần 0) có nghĩa hai biến số liên hệ với nhau; ngược lại hệ số -1 hay có nghĩa hai biến số có mối liên hệ tuyệt đối - Nếu giá trị hệ số tương quan âm (r 0) có nghĩa x tăng cao y tăng, x tăng cao y giảm theo Có nhiều hệ số tương quan thống kê, sau hệ số tương quan thông dụng nhất: Page - Hệ số tương quan Pearson r - Hệ số tương quan Spearman ρ - Hệ số tương quan Kendall τ Các hệ số tương quan: 2.1 Hệ số tương quan Pearson Cho hai biến số x y từ n mẫu, hệ số tương quan Pearson ước tính công thức sau đây: Hoặc Trong  giá trị trung bình biến số x y Để ước tính hệ số tương quan độ tuổi dman dph, sử dụng hàm cor(x,y) sau: > cor(dman, dph) [1] 0.936726 Chúng ta kiểm định giả thiết hệ số tương quan (tức hai biến x y liên hệ) Phương pháp kiểm định thường dựa vào phép biến đổi Fisher mà R có sẵn hàm cor.test để tiến hành việc tính toán > cor.test(dman, dph) Pearson's product-moment correlation data: dman and dph t = 14.971, df = 19, p-value = 5.694e-12 Page alternative hypothesis: true correlation is not equal to 95 percent confidence interval: 0.9025175 0.9839818 sample estimates: cor 0.9601321 2.2 Hệ số tương quan Spearman Hệ số tương quan Pearson hợp lí biến số x y tuân theo luật phân phối chuẩn Nếu x y không tuân theo luật phân phối chuẩn, phải sử dụng hệ số tương quan khác tên Spearman, phương pháp phân tích phi tham số Hệ số ước tính cách biến đổi hai biến số x y thành thứ bậc (rank), xem độ tương quan hai dãy số bậc Do đó, hệ số có tên Spearman’s Rank correlation R ước tính hệ số tương quan Spearman hàm cor.test với thông số method=”spearman” sau: > cor.test(dman, dph, method="spearman") Spearman's rank correlation rho data: dman and dph S = 78.1582, p-value = 5.405e-11 alternative hypothesis: true rho is not equal to sample estimates: rho 0.9492479 2.3 Hệ số tương quan Kendall Hệ số tương quan Kendall (phương pháp phi tham số) ước tính cách tìm cặp số (x, y) song song với Một cặp (x, y) định nghĩa hiệu Page (độ khác biệt) trục hoành có dấu hiệu (dương hay âm) với hiệu trục tung Nếu hai biến số x y liên hệ với nhau, số cặp song song hay tương đương với số cặp không song song Có nhiều cặp phải kiểm định, phương pháp đòi hỏi thời gian xữ lý máy tính cao Tuy nhiên, liệu 5000 mẫu máy tính tính toán dễ dàng R dùng hàm cor.test với thông số method=”kendall” để ước tính hệ số tương quan Kendall: > cor.test(dman, dph, method="kendall") Kendall's rank correlation tau data: dman and dph z = 5.013, p-value = 5.358e-07 alternative hypothesis: true tau is not equal to sample estimates: tau 0.8803589 Mục tiêu phân tích hệ số tương quan: Ước tính hệ số tương quan: 3.1 3.2 Page - Covariance có đơn vị đo lường (X*Y) - Correlation coefficient(r) X Y hệ số đơn vị đo lường - r định nghĩa: Kiểm định giả thuyết r = 0: Giả thuyết vô hiệu: H0, r = HA, r ≠ Fisher ‘s z-transformation: r  z, z = Tính phương sai z: Dùng kiểm định t: SE(z) = t= ln⁡( 1+𝑟 1−𝑟 ) [4] √𝑛−3 𝑧 𝑆𝐸(𝑧) Thực nghiệm: Bảng theo dõi hộ dân sản xuất tôm sú theo năm thời điểm môi trường nước: liên quan đến nồng độ PH nồng độ mặn nước sau: X: nồng độ PH (thang đo lôgarít tính axít Ví dụ, dung dịch có pH=8,2 có độ hoạt động [H+] (nồng độ) 10−8.2 mol/L, hay khoảng 6,31 × 10−9 mol/L) Y: nồng độ mặn (tính phần nghìn – số gram muối 1kg nước) NĂM X Y NĂM X Y NĂM X Y 1994 5.5 2001 6.0 2008 5.8 1995 6.5 2002 6.3 2009 6.4 1996 6.4 2003 6.8 2010 6.9 1997 6.0 2004 6.6 2011 6.6 1998 6.5 2005 7.8 2012 6.3 1999 6.7 2006 6.4 2013 5.9 2000 7.5 2007 7.1 2014 6.4 Bảng 1: Nồng độ PH nồng độ mặn Câu hỏi đặt ra: o Có mối tương quan nồng độ PH nồng độ mặn môi trường nước hay không? o Nếu có mối tương quan có ý nghĩa thống kê hay không? Quá trình thực hiện: Page Bước 1: Xác định hệ số tương quan[2][3] Từ bảng số liệu ta tính trung bình mẫu sau: x = 136.4 / 21 = 6.45 y = 129 /21 = 6.14 = 848.4 – 21*6.45*6.14 = 10.514 = 891.78 - 21*(6.45)2 = 5.829 = 813 – 21*(6.14)2 = = 20.571 10.95 Suy ra: = 10.514 / 10.95 = 0.96 Như 0 attach(dat) > plot(dman~dph,pch=16) > abline(lm(dman~dph),col="red",lwd=2) Hình 1: Biểu đồ hồi quy tuyến tính độ PH so với độ mặn Page > cor.test(dman,dph) Kiểm tra r=0? Nếu r=0, giả thuyết vô hiệu đúng không tương quan biến số Nếu r#0, bát bỏ giả thuyết vô hiệu có tương quan biến số Pearson's product-moment correlation P-value

Ngày đăng: 21/09/2016, 16:25

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan