X- y A z+ 9 t=
8 Xem Tống Lan Anh, Một số tiêu chuẩn lựa chụn các biến giãi thích trong mơ hỉnh hồi quy tuyến tính kỳ yếu
hội nghị khoa hục khoa C ơ bản, 2007.
thích cho Y. Người ta cĩ thể tiến hành bằng cách hồi quy Y theo cả k biến ban
đầu đưa ra, sau đĩ bỏ đi những biến khơng cĩ tác dụng giải thích cho Y. Hoặc cĩ thể tiến hành ngược lại bằng cách bắt đầu hồi quy Y theo Ì biến giải thích cĩ hệ số tương quan cao nhất đối vọi Y và sau đĩ mỗi bưọc lại lựa chọn biến cĩ hệ số tương quan riêng cao nhất đối vọi Y. Việc chọn ra tập những biến giải thích nào đĩ thực sự cần thiết trong mơ hình là một việc rất khĩ, và nguyên tắc đẩu tiên và quan trọng vẫn phải dựa vào lý thuyết kinh tế. Các nhà kinh tế dường như khơng thể xác định một cách chính xác tất cả các biến giải thích cần xuất hiện trong mơ hình, nhưng họ cĩ ý tưởng về việc xác định được biển nào là rất quan trọng và
biến nào cịn bị nghi ngờ, và vì vậy người ta cần dùng đến thống kê để xác định vai trị của một số biến trong diện bị nghi ngờ.
Cĩ nhiều tiêu chuẩn để xét một biến hay một tập biến nào đĩ cĩ cần thiết
đưa thêm vào mơ hình khơng. Bài viết giọi thiệu một số tiêu chuẩn sau để xét: 1. Dựa trên R2
của Theil 2. Dựa trên Cp của Mallow 3. Dựa trên PC cùa Amemiya 4. Dựa trên Sp của Hocking a) Nội dung tiêu chuẩn
• Dựa trên R2
của Theil
Tiêu chuẩn của Theil dựa trên nguyên tắc cực tiểu hĩa ưọc lượng điểm của phương sai nhiễu ngẫu nhiên của mơ hình.
Xét mơ hình Ỵ = P0 + p,x„ +... + PkXy + u,
ơ, là nhiễu ngẫu nhiên và được giả sử là Var(Uị)=ơ2
.ƯỚc lượng khơng chệch của ơ2
là ở7
=——= . Khi tăng thêm số biến giải thích thì RSS
n - k - 1 Số bậc tự do
giảm nhưng số bậc tự đo cũng giảm xuống. Sẽ cĩ Ì điểm nào đĩ mà ờ2
thực sự bắt đầu tăng khi đưa thêm biến giải thích vào. Tiêu chuẩn Theil dựa trên nguyên tắc chọn các biến đưa vào sao cho ờ2
nhỏ nhất. Trong mơ hình hồi quy bội người ta xét đến hệ sổ R2 l-R2 =^±-(l-R2 ) (1) n - k - 1 60
o-< i * V / n , - (1-R2).TSS (l-R2ÌTSS RSS -2 , r TĨC -
Biên đơi từ (1), ta cĩ: — = -i = — — = ơ . Vì TSS và n-
n-Ì n - k - 1 n - k - 1
Ì là hằng số (khơng phụ thuộc vào số biến đưa vào m ơ hình) nên ở2
và Ì - R2
biến thiên cùng chiều. Như vậy tập các biển làm cho à2
nhỏ nhất cũng là tập các
biến làm cho R2
lớn nhất.
• Tiêu chuẩn dự báo Cp, PC và Sp
Tiêu chuẩn Sp, Cp, và PC chọn số biến trong m ơ hình nhằm đạt được mục đích
cực tiểu hĩa trung bình bình phương sai số dự báo.
Giứ sử phương trình đúng bao gồm k biến (k-1 biến giứi thích) và phương trình
chúng ta đang nghiên cứu bao gồm ki biến (ki-1 biến giứi thích), vấn đề là chọn
sổ biến k i như thế nào để cực tiểu hĩa trung bình bình phương sai số dự báo
EÍY, - Ỳf )2, ở đĩ Yf là giá trị tuơng lai của Y và Ỳf là giá trị dự báo của Y.
Amemiya giứ sử rằng các biến giứi thích dùng cho dự báo là ngẫu nhiên thì ơng
chi ra rằng: