Hệ số tương quan là đại lượng đặc trưng đơn thuần về sự liên hệ giữa các đại lượng , . Hệ số tương quan được tính theo công thức:
=∑ ( − )( − ) (2.12)
Trong đó: , , , lần lượt là các giá trị trung bình và độ lệch bình phương trung bình của và :
=∑ , =∑ , = ∑ , = ∑
Hệ số tương quan đặc trưng không phải cho sự phụ thuộc bất kỳ mà chỉ cho sự phụ thuộc tuyến tính.
Hệ số tương quan luôn nằm trong khoảng giá trị: -1 ≤ ≤ 1
Mối liên hệ được xem là đáng tin cậy khi trị số của hệ số tương quan khá lớn ( ≥ 0.8).Trong trường hợp nghiên cứu sự phụ thuộc tuyến tính giữa các đại
27
lượng ngẫu nhiên trong hệ các đại lượng được quan trắc, người ta thường dùng ma trận tương quan. Ma trận tương quan là ma trận thể hiện sự liên hệ thống kê với nhau của các yếu tố quan trắc. Mỗi phần tử của ma trận gọi là hệ số tương quan giữa hai yếu tố quan trắc cùng hàng và cùng cột. Các hệ số tương quan có giá trị tuyệt đối lớn thể hiện sự liên hệ chặt chẽ về mặt thống kê, hệ số nhỏ thể hiện sự liên hệ yếu.
Bảng 2.2: Ma trận tương quan giữa các yếu tố nhiệt độ nước biển , nhiệt độ không khí , độ ẩm tuyệt đối , độ ẩm tương đối và khí áp của trạm Hòn
Dấu năm 1980 H 1.00 0.96 0.88 0.04 -0.75 1.00 0.93 0.12 -0.80 H 1.00 0.42 -0.87 1.00 -0.41 1.00
Từ ma trận tương quan của trạm Hòn Dấu, thấy rằng nhiệt độ nước biển liên hệ chặt chẽ nhất với nhiệt độ không khí, sau đó với độ ẩm tuyệt đối và cuối cùng là với khí áp, trong đó liên hệ giữa nhiệt độ nước và khí áp là liên hệ nghịch, thể hiện bởi hệ số tương quan dấu âm (-0.75). Giữa nhiệt độ nước biển với độ ẩm tương đối hầu như không có liên hệ, biểu hiện ở hệ số tương quan rất nhỏ (0.04). Nhiệt độ không khí và áp suất khí quyển liên hệ với nhau bằng mối phụ thuộc nghịch khá chặt chẽ [5].
28
CHƯƠNG 3 – CƠ SỞ DỮ LIỆU