slide thuyết trình đề tài: “Các cách phát hiện và khắc phục hiện tượng đa cộng tuyến”
Trang 3I Các cách phát hiện hiện tượng đa cộng tuyến
II Các biện pháp khắc phục hiện tượng đa cộng tuyến
I Phát hiện đa cộng tuyến
II Khắc phục
Trang 4Các cách phát hiện hiện tượng đa cộng tuyến
2 Tương quan cặp giữa các biến giải thích cao
3 Xét tương quan riêng
1 R2 cao nhưng tỉ số t thấp
5 Nhâ tử phóng đại phương sai
4 Hồi quy phụ
6 Độ đo theif
Trang 5Nội dung
1 Sử dụng thông tin tiên nghiệm
2 Thu thập thêm số liệu hoặc lấy thêm mẫu mới
3 Bỏ biến
4 Sử dụng sai phân cấp 1
5 Giảm tương quan trong hồi quy đa thức
6 Một số biện pháp khác
Trang 6Ví dụ minh họa
Bảng số liệu về tiêu dùng cho thực phẩm của 1 thị trấn Banshee, Illinois, Hoa Kỳ trong đó:
Y: Sản lượng tiêu thụ thịt lợn của thị trấn trong 1 tuần (kg)
X1: Mức chi tiêu trung bình cho thực phẩm của 1 hộ gia đình trong 1 tuần(USD)
X2: Giá thịt lợn(USD/kg)
X3: Giá thịt bò(USD/kg)
Trang 7Bảng số liệu thống kê
Trang 8Ước lượng bình phương nhỏ nhất
Ta có hàm hồi quy mẫu:
Y=492,3815+3.446478X1-74,99765X2+50,26541X3
t(n k/2 ) t0.02512 2.179
Trang 9Phát hiện đa cộng tuyến
Cách 1: Hệ số xác định bội R2 cao nhưng t thấp
Trang 10Phát hiện đa cộng tuyến
Cách 2: Hệ số tương quan cặp giữa các biến giải thích cao
Ta có:
X1 1.000000 0.729115 0.712735 X2 0.729115 1.000000 0.989064 X3 0.712735 0.989064 1.000000
r32 = 0.989064 > 0.8
Trang 11Phát hiện đa cộng tuyến
Cách 3: Hồi quy phụ
Ta hồi quy biến X1 theo biến X2,X3 được kết quả như sau:
Trang 12Phát hiện đa cộng tuyến
Ta có 0.05 ta đi kiểm định giả thiết
H0: X1 không có hiện tượng đa cộng tuyến với X2,X3
H1: X1 có hiện tượng đa cộng tuyến với X2,X3
Nhận xét:
Ta thấy giá trị p-value của thống kê F là 0.006907 < =0.05
=> bác bỏ giả thiết H0 chấp nhận giả thiết H1
Trang 13Phát hiện đa cộng tuyến
Tương tự ta có
Trang 14Phát hiện đa cộng tuyến
Tương tự ta có
Trang 15Phát hiện đa cộng tuyến
Trang 18Bước 1
Trang 19Bước 2
Trang 20* Bước 3 :
Từ kết quả hồi quy ở trên ta có:
* Bước 4:Ta tiến hành so sánh
Bước 3,4
Trang 21Lại có
Xem ra hiên tượng đa cộng tuyến không được khắc phục
Trang 22Tuy nhiên
KL:Với hàm hồi quy mới này thì ta đã khắc phục được hiện tượng
quy của chúng ta phải chăng đã giảm đi tính lí thuyết kinh tế vì như
ta đã biết thì thịt bò là 1 sản phẩm thay thế của thịt lợn nên sự thayđổi giá của thịt bò chắc chắn sẽ ảnh hưởng đến lượng tiêu thụ củathịt lợn
Trang 23Khắc phục: Lấy thêm số liệu
Cách 2 Lấy thêm số liệu mới
Ta lấy thêm số liệu:
Trang 24Hàm hồi quy mới thu được có cao nhưng tỉ số t lớn hơn nhiều.
Hàm hồi quy: Y=365.2300+3.348428*X1-62.19178*X2+55.76752*X3
KL: Như vậy thêm biến đã có hiệu quả trong việc khắc phục hiện
tượng đa cộng mà không làm thay đổi tính lí thuyết về kinh tế
trong bài toán này.
Trang 25Khắc phục: Sử dụng sai phân cấp 1
Cách 3 Sử dụng sai phân cấp 1
Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa biến Y và các biến
phụ thuộc X,Z theo mô hình sau:
dX1 = X 1t - X 1t-1
dX2= X 2t - X 2t-1
dX3= X 3t - X 3t-1
Vt = U t - U t-1
Trang 26Như vậy ta thấy phương pháp này không có hiệu quả giảm mức đa cộng tuyến trong trường hơp này.
Trang 27Kết luận
Kết Luận
Có nhiều cách phát hiện và khắc phục hiện tượng đa cộng tuyến khác nhau Mỗi phương pháp có những hạn chế nhất định và không phải là phù hợp trong mọi trường hợp Vì vậy, khi áp dụng một phương pháp nào ta cần cân nhắc kĩ lượng để mang lại kết quả tin cậy nhất
Trang 28LOGO