Trong mô hình hồi quy tuyến tính thể hiện mối quan hệ giữa một biến độc lập- tỷ suất sinh lời của danh mục M và biến phụ thuộc - tỷ suất sinh lời của biến phu thuộc- tỷ suất sinh lời của chứng khoán i theo công thức Ri,t = αi + βi RM, t+ε
thì công việc quan trọng của thủ tục thống kê xây dựng mô hình từ dữ liệu đều chứng minh tính phù hợp của mô hình. Bởi vì hầu như không có một đường thẳng nào có thể phù hợp hoàn toàn với tập dữ liệu, vẫn luôn có sự sai lệch giữa các giá trị dự báo được cho bởi đường thẳng và các giá trị thực tế (thể hiện qua phần
dư). Để biết mô hình hồi quy tuyến tính đã xây dựng trên dữ liệu mẫu phù hợp đến mức độ nào với dữ liệu thì phải dùng một thước đo về tính phù hợp của mô hình.
Một thước đo sự phù hợp của mô hình tuyến tính thường dùng là hệ số xác định R2 (coefficient of determination). Công thức tính R2 xuất phát từ ý tưởng: toàn bộ biến thiên quan sát được của biến phụ thuộc được chia thành 2 phần – phần biến thiên do hồi quy và phần biến thiên không do hồi quy (hay còn gọi là phần dư). Như vậy giá trị R2 làm thông số đo lường độ thích hợp của đường hồi quy theo nguyên tắc R2 càng gần 1 thì mô hình đã xây dựng càng thích hợp, R2
càng gần 0 thì mô hình càng kém phù hợp với tập dữ liệu mẫu.
Rõ ràng nếu tất cả các tỷ suất sinh lời chứng khoán i quan sát được đều nằm ngay trên đường hồi quy tuyến tính thì hệ số tương quan giữa giá trị thực tế và giá trị R2 =1 thể hiện mô hình hồi quy tuyến tính được xây dựng là phù hợp 100% với tập dữ liệu mẫu. Và đây là tình huống không tưởng vì mô hình có tốt nhất cũng không thể đạt được giá trị R2 này vì còn có những nhân tố tác động khác mà không thể nhận biết được hết, hay có nhận biết cũng khó có thể mô hình hoá được, và nếu mô hình hoá được cũng chưa chắc đã thu thập được dữ liệu về nó.