V. Phân tích ph−ơng sai và kiểm định giả thiết thống kê
1. Mô hình hồi quy vớ i2 biến độc lập 2 Mô hình hồi quy với k biến độc lập
Giả sử chúng ta có mô hình hồi quy:
Yi = β1X1i+ β2X2i + ... + βkXki + ui (3.17) Trong đó: i = 1, 2, ..., n; X1i = 1; j= 1, 2, ..., k
Nếu biểu diễn ph−ơng trình (3.17) d−ới dạng ma trận, ta có: Y = Xβ + u
Trong đó: Y là véc tơ cột chứa n số liệu quan sát; X là ma trận nxk chiều chứa k biến độc lập với n quan sát và u là vector cột phản ánh phần biến động mà mô hình không giải thích đ−ợc hay còn gọi là sai số.
Giá trị thật của u ta không biết, nh−ng ta có thể −ớc l−ợng u thông qua số liệu của tập hợp các mẫu quan sát. Đại l−ợng −ớc l−ợng của u là e. Nó chính là phần biến động của số quan sát Y và ph−ơng trình −ớc l−ợng của mô hình hay ph−ơng trình mẫu (−ớc l−ợng từ số liệu mẫu).
Y = Xβˆ + e hay e = Y - Xβˆ
Trong đó: βˆ là đại l−ợng −ớc tính của β; các ký hiệu không có chỉ số i hoặc j là biểu diễn vector.
Trình tự để −ớc l−ợng các tham số trong mô hình nh− sau: (1) Đặt các βˆ
1,...., βˆ
k là các −ớc l−ợng của β1,..., βk.
(2) Đặt ei là sai số −ớc l−ợng (phần d−) của ui, khi đó ta có: ei = Yi - βˆ 1X1i - ... - βˆ jXji - ... - βˆ kXki (3.18) (3) Để βˆ 1,..., βˆ k là các −ớc l−ợng không chệch của β1,..., βk, thì tổng bình ph−ơng các sai số −ớc l−ợng (∑iei2) phải là nhỏ nhất. Tức là đạo hàm riêng của nó theo βˆ
1,..., βˆ
(4) Lấy đạo hàm riêng theo βˆ
1,..., βˆ
k và cho các đạo hàm này bằng không, ta đ−ợc hệ ph−ơng trình với các biến βˆ
1,..., βˆ
k.
(5) Giải hệ ph−ơng trình trên ta đ−ợc các −ớc l−ợng βˆ
1,..., βˆ
k.
D−ới dạng ma trận, tổng bình ph−ơng các sai số (e) đ−ợc viết nh− sau: e'e = (Y - Xβˆ)'(Y - Xβˆ), Dấu (') đ−ợc hiểu là ma trận chuyển vị
= Y'Y - βˆ'X'Y - Y'Xβˆ + βˆ'X'Xβˆ
= Y'Y - 2βˆ'X'Y + βˆ'X'Xβˆ (3.19)
Điều kiện cần để cực tiểu hoá (e'e) là đạo hàm riêng của tổng bình ph−ơng sai số (công thức 3.19) theo βˆ phải bằng không.
∂(e'e)/∂βˆ = -2X'Y + 2X'Xβˆ = 0
⇒ X'Xβˆ = X'Y (3.20)
Các ph−ơng trình trong (3.20) đ−ợc gọi là hệ ph−ơng trình chuẩn. Theo giả thiết 5 thì các biến độc lập (X) trong mô hình không có đa cộng tuyến. Điều đó có nghĩa là tồn tại ma trận nghịch đảo của (X'X), nên từ ph−ơng trình (3.20) ta có thể tìm đ−ợc βˆ.
βˆ = (X'X)-1 (X'Y) (3.21)
(Nghiệm của ph−ơng trình (3.21) chính là −ớc l−ợng của β).
Tuy nhiên để kiểm định tổng bình ph−ơng sai số (e'e) là nhỏ nhất ta cần phải có điều kiện đủ là đạo hàm bậc hai của nó theo βˆ phải d−ơng.
∂2(e'e)/∂βˆ∂βˆ = 2X'X (3.22)
Giả sử c là một vector khác không và giử sử q = e'X'Xe. Do đó ta có thể viết: q = v'v = ∑iv2
i; trong đó: v = Xc. Ngoại trừ tr−ờng hợp các số hạng của v = 0, còn lại q d−ơng. Nếu nh− v = 0, điều đó có nghĩa là tổ hợp tuyến tính của X bằng 0. Nó sẽ mâu thuẫn với giả thiết X là ma trận bậc (n x k) đầy đủ.
III. Phân tích ph−ơng sai và kiểm định giả thiết thống kê