Phân tích hồi quy (regression analysis) là kỹ thuật thống kê dùng để ước lượng phương trình phù hợp nhất với các tập hợp kết quả quan sát của biến phụ thuộc và biến độc lập. Nó cho phép đạt được kết quả ước lượng tốt nhất về mối quan hệ chân thực
48
giữa các biến số. Từ phương trình ước lượng được này, người ta có thể dự báo về biến phụ thuộc (chưa biết) dựa vào giá trị cho trước của biến độc lập (đã biết). Cụ thể tác giả dùng Phương pháp bình phương nhỏ nhất (OLS) để ước lượng các tham số trong phương trình hồi quy. Ta có phương trình như sau:
𝑌̂𝑡=𝛽̂1+𝛽̂2𝑋𝑡 +𝒰̂𝑡
Trong đó 𝛽̂1, 𝛽̂2 là các ước lượng không chênh lệch của các hệ số hồi quy𝛽̂1 𝛽̂2và
𝒰̂𝑡 là ước lượng không chênh lệch của sai số 𝒰𝑡. Theo đó giá trị ước lượng không chênh lệch của E (𝑌𝑡/𝑋𝑡) kí hiệu là 𝑌̂𝑡 sẽ bằng 𝛽̂1 + 𝛽̂2 𝑋𝑡 và từ đó có thể suy ra:
𝑌𝑡 = 𝑌̂𝑡+ 𝒰̂𝑡 𝒰̂𝑡 = 𝑌𝑡 - 𝑌̂𝑡
Phương trình này cho biết phần dư 𝒰̂𝑡 là hiệu số của giá trị Y thực tế và giá trị Y ước lượng không chênh lệch vào thời điểm t.
Ta xét tổng bình phương của các phần dư (được gọi là RSS) sao cho chúng là nhỏ nhất. Điều này được diễn tả như sau:
∑𝑛𝑡=1𝒰̂𝑡2 = ∑𝑛𝑡=1(𝑌𝑡 −𝑌̂𝑡)2 = ∑𝑛𝑡=1(𝑌𝑡 −𝛽̂1− 𝛽̂2 𝑋𝑡)2
Theo kiến thức đã học, đây là phương trình bậc hai nên muốn tìm điểm cực trị ta phải xét đạo hàm theo 𝛽̂1, 𝛽̂2và cho chúng bằng không:
𝜕𝑅𝑆𝑆
𝜕𝛽̂2 = - 2 ∑( 𝑌𝑡 − 𝛽̂1− 𝛽̂2𝑋𝑡)= 0
𝜕𝑅𝑆𝑆
𝜕𝛽̂1 = - 2 ∑( 𝑌𝑡 − 𝛽̂1− 𝛽̂2𝑋𝑡)= 0
Hai hệ phương trình trên tạo ra hệ phương trình hai ẩn và có thể giải ra để tìm được hai nghiệm như sau:
𝛽̂2 = 𝑛 ∑ 𝑌𝑡𝑋𝑡−∑ 𝑋𝑡∑ 𝑌𝑡
𝑛 ∑ 𝑋𝑡2−(∑ 𝑋𝑡)2 ;
𝛽̂1= 𝑌̅ − 𝛽̂2𝑋̅