Hệ số tương quan Pearson (Pearson correlation coefficient, kí hiệu r) đo lường mức độ tương quan tuyến tính giữa hai biến. Về nguyên tắc, tương quan Pearson sẽ tìm ra một đường thẳng phù hợp nhất với mối quan hệ tuyến tính của 2 biến. Hệ số tương quan Pearson giúp chúng ta thực hiện các thống kê cơ bản như ước lượng điểm (kiểm định mức ý nghĩa), giải thích (sự ảnh hưởng của biến độc lập đối với biến phụ thuộc), dự báo (thông qua mô hình hồi quy tuyến tính), ước lượng độ tin cậy và tính hợp lý (validity). Nó cũng có thể thiết lập và kiểm định các mô hình có chứa các các
biến có thể đo lường được và biến tiềm ẩn. Tuy nhiên hệ số này có ảnh hưởng lớn trong lĩnh vực thống kê nhưng cũng tồn tại một số hệ số khác được sử dụng tùy thuộc vào biến đo lường.
Hệ số tương quan Pearson (r) sẽ nhận giá trị từ +1 đến -1. Điều kiện để tương quan có ý nghĩa là giá trị sig. <0.05
r < 0 cho biết một sự tương quan nghịch giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm giảm giá trị của biến kia.
r=0 cho thấy không có sự tương quan.
r > 0 cho biết một sự tương quan thuận giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm tăng giá trị của biến kia.
Hệ số tương quan Pearson r, được định nghĩa như sau:
Cho hai biến số x và y từ n mẫu, hệ số tương quan Pearson được ước tính bằng công thức sau đây:
Ứng dụng của hệ số tương quan trong tài chính:
Sức mạnh của mối quan hệ dựa trên giá trị của hệ số tương quan. Ví dụ: Giá trị 0,2 cho thấy có mối tương quan đồng biến, nhưng nó không đáng kể và yếu. Các chuyên gia cho rằng tương quan có ý nghĩa khi ít nhất đạt giá trị 0,8. Tuy vậy, hệ số tương quan với giá trị tuyệt đối là 0,9 hoặc lớn hơn sẽ thể hiện mối quan hệ rất mạnh mẽ.