A. PHẦN MỞ ĐẦU Trong mô hình phân tích hồi quy bội, chúng ta giả thiết giữa các biến giải thích Xi của mô hình độc lập tuyến tính với nhau, tức là các hệ số hồi quy đối với một biến cụ thể là số đo tác động riêng phần của biến tương ứng. Khi tất cả các điểm khác trong mô hình được giữ cố định. Tuy nhiên khi giả thiết đó bị vi phạm tức là các biến giải thích có tương quan thì chúng ta không thể tách biệt sự ảnh hưởng riêng biệt của một biến nào đó. Hiện tượng trên được gọi là đa cộng tuyến. Vậy đa cộng tuyến là gì? Hậu quả của hiện tượng này như thế nào? Làm thế nào để phát hiện? Và biện pháp khắc phục nó. Để trả lời được những câu hỏi trên, sau đây Nhóm 1 sẽ tìm hiển và thảo luận về đề tài “Hiện tượng đa cộng tuyến”. Trong quá trình tìm hiểu không thể tránh được sai sót mong giáo viên giảng dạy, các bạn đóng góp ý kiến để bài thảo luận của nhóm được hoàn thiện hơn. B. PHẦN NỘI DUNG I. Lý Thuyết 1.1. Bản chất đa cộng tuyến Khái niệm: Khi xây dựng mô hình hồi quy bội, hợp lý tưởng là các biến Xi trong mô hình không có tương quan với nhau, mỗi biến Xi chứa một thông tin riêng về Y, thông tin không chứa bất kỳ biến Xi khác. Trong thực hành, khi điều này xảy ra ta không gặp hiện tượng đa cộng tuyến. Và trong những trường hợp còn lại, ta sẽ gặp hiện tượng đa cộng tuyến. Xét mô hình hồi quy tuyến tính cổ điển nhiều biến Y_(i )=β_1+β_2 X_2i+β_3 X_3i+⋯+β_k X_ki+U_i Hiện tượng đa cộng tuyến hoàn hảo (perfect multicollinearity) xảy ra giữa các biến giải thích X_2,X_(3,)…,X_k nếu tồn tại λ_2,λ_3,…,λ_k không đồng thời bằng 0 sao cho λ_2 X_2i+λ_3 X_3i+⋯+λ_k X_ki= 0 ∀i Hiện tượng đa cộng tuyến không hoàn hảo (imperfect multicollinearity) xảy ra giữa các biến giải thích X_2,X_(3,)…,X_k nếu tồn tại λ_2,λ_3,…,λ_k không đồng thời bằng 0 sao cho λ_2 X_2i+λ_3 X_3i+⋯+λ_k X_ki+V_(i )= 0, ∀i trong đó〖 V〗_(i ) là nhiễu ngẫu nhiên Trong thực tế thường xảy ra đa cộng tuyến không hoàn hảo, hiếm khi xảy ra đa cộng tuyến hoàn hảo. 1.2. Nguyên nhân đa cộng tuyến Do bản chất mối quan hệ giữa các biến độc lập Ví dụ như biến vốn, biến lao động trong các doanh nghiệp cùng ngành thường có quan hệ tuyến tính chặt. Mô hình có dạng đa thức Ví dụ: Biến X, X2 hay X3 thường có quan hệ tuyến tính chặt Mẫu không mang tính đại diện 1.3. Hậu quả đa cộng tuyến Trường hợp đa cộng tuyến hoàn hảo: các hệ số hồi quy mẫu là không xác định và các độ lệch tiêu chuẩn là vô hạn. Trong trường hợp đa cộng tuyến không hoàn hảo có thể xác định được các hệ số hồi quy mẫu nhưng dẫn đến các hậu quả sau: I.3.1. Phương sai và độ lệch tiêu chuẩn của các hệ số hồi quy mẫu sẽ rất lớn. Ta có công thức tính phương sai và hiệp phương sai của các ước lượng (β_2 ) ̂,(β_3 ) ̂ ta có: Var( (β_2 ) ̂)=σ2(∑x_2i2 (1r_232 ) (1) Var( (β_3 ) ̂)=σ2(∑x_3i2 (1r_232 ) (2) Và Cov((β_2 ) ̂,(β_3 ) ̂)=(r_23 σ2)((1r_(23 )2 ) √(∑x_2i2 ) ∑x_3i2 ) (3) Trong đó r_2i là hệ số tương quan giữa X_2, X_i Từ (1) và (2) ta thấy r_(23 )tăng dần đến 1 (nghĩa là cộng tuyến tăng ) thì phương sai của 2 ước lượng này tăng dần đến vô hạn. (3) chỉ ra rằng khi r_(23 )tăng dần đến 1 thì Cov((β_2 ) ̂,(β_3 ) ̂) tăng về giá trị tuyệt đối. I.3.2. Khoảng tin cậy của các hệ số hồi quy rộng hơn. Như ta đã biết trong chương trước khoảng tin cậy 95% cho (β_2 ) ̂ và (β_3 ) ̂ khi σ2 đã biết là: (β_2 ) ̂± 1,96 se((β_2 ) ̂)và (β_3 ) ̂± 1,96 se((β_3 ) ̂) Trong đó Se((β_2 ) ̂)=√(Var( (β_2 ) ̂)) =1√(1r_232 ) √(σ2(∑_(i=1)n▒x_2i2 )) Se((β_3 ) ̂)=√(Var( (β_3 ) ̂)) =1√(1r_232 ) √(σ2(∑_(i=1)n▒x_3i2 )) Cho nên ta có thể viết lại khoảng tin cậy 95% cho β_2 là: (β_2 ) ̂± 1,96 1√(1r_232 ) √(σ2(∑_(i=1)n▒x_2i2 )) (4) Và cho β_3 là (β_3 ) ̂± 1,96 1√(1r_232 ) √(σ2(∑_(i=1)n▒x_3i2 )) (5) (4) và (5) chứng tỏ r_(23 )càng gần tới 1 thì khoảng tin cậy cho các tham số càng rộng. Do đó trong trường hợp có đa cộng tuyến gần hoàn hảo thì số liệu của mẫu có thể thích hợp với các tập giả thiết khác nhau. Vì thế xác xuất chấp nhận giả thiết sai tăng lên. I.3.3. Tỷ số T mất ý nghĩa Như đã biết khi kiểm định giả thiết H_0:β_2=0, chúng ta sử dụng tỉ số t=(β_2 ) ̂ se(〖( β〗_2 ) ̂) và đem so sánh giá trị t đã được ước lượng với giá trị giới hạn t. Nhưng khi có đa cộng tuyến gần hoàn hảo thì sai số tiêu chuẩn ước lượng được sẽ rất cao vì vậy làm cho tỉ số t nhỏ đi. Kết quả là sẽ làm tăng khả năng chấp nhận giả thiết H_0 I.3.4. Hệ số xác định bội R2cao nhưng t nhỏ Để giải thích điều này. Ta xét mô hình hồi quy k biến như sau: Y_(i )=β_1+β_2 X_2i+β_3 X_3i+⋯+β_k X_ki+U_i Trong trường hợp có đa cộng tuyến gần hoàn hảo, như đã chỉ ra ở trên, ta có thể tìm được một hoặc một số hệ số góc riêng là không có ý nghĩa về mặt thống kê trên cơ sở kiểm định t. Nhưng trong khi đó R2 lại có thể rất cao, nên bằng kiểm định F, chúng ta có thể bác bỏ giả thiết H_0:β_2=β_3=....=β_k=0. Mâu thuẫn này cũng là tín hiệu của đa cộng tuyến. I.3.5. Dấu của các hệ số β ̂_j của biến X_j có thể ngược với kỳ vọng. Khi phương sai của β ̂_j quá lớn thì giá trị β ̂_j thu được từ một mẫu có thể quá khác biệt với giá trị β_j đến mức β ̂_j nhận giá trị âm trong khi β_j là số dương hoặc ngược lại. I.3.6. Một sự thay đổi dù nhỏ trong mẫu cũng có thể gây ra một sự thay đổi khá lớn trong kết quả ước lượng. 1.4. Phương pháp phát hiện đa cộng tuyến I.4.1. Hệ số xác định bội〖 R〗2 cao nhưng tỷ số T thấp Trong trường hợp R2 cao (thường R2 >0,8) mã tỷ số t thấp như trên đã chú ý đó chính là dấu hiệu của đa cộng tuyến. I.4.2. Hệ số tương quan cặp giữa các biến giải thích cao Nếu hệ tương quan giữa các biến giải thích cao (vượt 0,8) thì có khả năng có tồn tại đa cộng tuyến. Tuy nhiên tiêu chuẩn này thường không chính xác. Có những trường hợp tương quan cặp không sao nhưng vẫn có đa cộng tuyến. Đa cộng tuyến xảy ra mà không có sự báo trước của tương quan cặp nhưng dù sao nó cũng cung cấp cho ta những kiểm tra tiên nghiệm có ích. I.4.3. Xem xét các hệ số tương quan riêng Ví dụ trong mô hình hồi quy 4 biến nếu R2 rất cao nhưng r_12,342, r_13,242,r_14,232 tương đối thấp có thể đề nghị rằng các biến giải thích có thể có tương quan cao, tức là mô hình có hiện tượng đa cộng tuyến. I.4.4. Hồi quy phụ Hồi quy phụ là hồi quy một biến độc lập theo các biến còn lại. Nếu hồi quy biến độc lập X_j theo các biến độc lập còn lại thì hệ số xác định bội thu được kí hiệu R_j2. Kiểm định giả thiết: H_0: R_j2=0 + Nếu bác bỏ H_0 thì kết luận mô hình có hiện tượng đa cộng tuyến + Nếu chấp nhận H_0 thì kết luận mô hình không có hiện tượng đa cộng tuyến. I.4.5. Nhân tử phóng đại phương sai VIF (Variance Inflating Factor). Một thước đo khác của hiện tượng đa cộng tuyến là phân tử phóng đại phương sai gắn với biến X_j. Kí hiệu: VIF(X_j) được xác định: VIF(X_j) = 1(1R_j2 ) Trong đó 〖 R〗_j2 là hệ số xác định trong hồi quy phụ của X_j qua có biến giải thích khác. Nếu VIF > 10. Ta kết luận được mô hình có hiện tượng đa cộng tuyến. I.5. Cách khắc phục hiện tượng đa cộng tuyến I.5.1. Bỏ biến giải thích có khả năng là tổ hợp tuyến tính của các biến còn lại Khi có hiện tượng đa cộng tuyến nghiêm trọng thì cách “đơn giản nhất” là bỏ biến cộng tuyến ra khỏi phương trình. Khi phải sử dụng biện pháp này thì cách tiến hành như sau: + Giả sử Trong mô hình hồi quy của ta có Y là biến được giải thích còn X_2,X_3,X_(4 ) là các biến giải thích. Ta thấy rằng X_2 tương quan chặt chẽ với X_3. Khi đó nhiều thông tin về Y chứa ở X_2 thì cũng chứa ở X_3. Vậy nếu ta bỏ một trong hai biến X_2 hoặc X_3 khỏi mô hình hồi quy, ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi một số thông tin về Y. + Bằng phép so sánh〖 R〗2 và R ̅2 trong các phép hồi quy khác nhau mà có và không có một trong hai biến ta có thể quyết định nên bỏ biến nào trong hai biến X_2 và X_3 khỏi mô hình. Lưu ý một hạn chế của biện pháp này là trong các mô hình kinh tế có những trường hợp đòi hỏi nhất định phải có biến này hoặc biến khác ở trong mô hình. Trong những trường hợp như vậy việc loại bỏ một biến phải được cân nhắc cẩn thận giữa sai lệch khi bỏ một biến công tuyến với việc tăng phương sai của các ước lượng hệ số khi biến đó ở trong mô hình. I.5.2. Thu thập thêm số liệu hoặc lấy mẫu mới. Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các biến trong mẫu ban đầu mà cộng tuyến có thể không nghiêm trọng nữa. Điều này chỉ có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế. Đôi khi cần thu thập thêm số liệu, tăng cỡ mẫu có thể làm giảm tính nghiêm trọng của đa cộng tuyến. I.5.3. Sử dụng sai phân cấp một “Tương tự quan” mặc dù biện pháp này có thể giảm tương quan qua lại giữa các biến nhưng chúng có thể được sử dụng như một biện pháp cho vấn đề đa cộng tuyến. Ví dụ: chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa biến Y và các biến phụ thuộc X_2 và X_3 theo mô hình sau: Y_(t )=β_1+β_2 X_2t+β_3 X_3t+⋯+β_k X_kt+U_t (6) Trong đó t là thời gian phương trình trên đúng với t thì cũng đúng với t1 nghĩa là: Y_(t1 )=β_1+β_2 X_(2t1)+β_3 X_(3t1)+U_(t1) (7) Từ (6) và (7) ta được: Y_(t )Y_(t1 )= β_2 (X_2tX_(2t1) )+β_3 (X_3tX_(3t1) )+U_tU_(t1) Đặt Y_(t )Y_(t1 )=y_(t ); U_tU_(t1)= V_(t ) Ta được : y_(t )=β_2 X_2t+β_3 X_3t+V_t (8) Mô hình hồi quy dạng (8) thường làm giảm tính nghiêm trọng của đa cộng tuyến vì dù X_2 và X_3 có thể tương quan cao nhưng không có lý do tiên nghiệm nào chắc chắn rằng sai phân của chúng cũng tương quan cao. Tuy nhiên biến đổi sai phân bậc nhất sinh ra một vấn đề chẳng hạn như hạng sai số V_(t ) trong (8) có thể không thỏa mãn giả thiết của mô hình hồi quy tuyến tính cổ điển là các nhiễu không tương quan. Vậy thì biện pháp này có thể làm mô hình nghiên cứu càng trở nên không phù hợp hơn. II. Thực hành Dựa trên những cơ sở lý luận ta đã tìm hiểu, sau đây chúng ta cùng đi phân tích một tình huống kinh tế cụ thể để thấy được cách phát hiện và khắc phục hiện tượng đa cộng tuyến như thế nào? Nhu cầu về thịt gà ở Mỹ, 19601982 trong Gjuarati 3. Theo một cuộc điều tra thể hiện sự phụ thuộc của lượng thịt gà tiêu dùng theo đầu người của Mỹ, giá bán lẻ thực của thịt gà và giá bán lẻ thực của thịt lợn giai đoạn 1960
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI ĐỀ TÀI THẢO LUẬN MÔN: KINH TẾ LƯỢNG HIỆN TƯỢNG ĐA CỘNG TUYẾN Giảng viên hướng dẫn : Nguyễn Thị Hiên Nhóm thực : Nhóm Lớp học phần : 2223AMAT0411 Hà Nội tháng 10 năm 2022 BẢNG PHÂN CÔNG NHIỆM VỤ CÁC THÀNH VIÊN NHÓM A PHẦN MỞ ĐẦU Trong mơ hình phân tích hồi quy bội, giả thiết biến giải thích Xi mơ hình độc lập tuyến tính với nhau, tức hệ số hồi quy biến cụ thể số đo tác động riêng phần biến tương ứng Khi tất điểm khác mơ hình giữ cố định Tuy nhiên giả thiết bị vi phạm tức biến giải thích có tương quan khơng thể tách biệt ảnh hưởng riêng biệt biến Hiện tượng gọi đa cộng tuyến Vậy đa cộng tuyến gì? Hậu tượng nào? Làm để phát hiện? Và biện pháp khắc phục Để trả lời câu hỏi trên, sau Nhóm tìm hiển thảo luận đề tài “Hiện tượng đa cộng tuyến” Trong q trình tìm hiểu khơng thể tránh sai sót mong giáo viên giảng dạy, bạn đóng góp ý kiến để thảo luận nhóm hoàn thiện B PHẦN NỘI DUNG I Lý Thuyết 1.1 Bản chất đa cộng tuyến - Khái niệm: Khi xây dựng mơ hình hồi quy bội, hợp lý tưởng biến X i mơ hình khơng có tương quan với nhau, biến Xi chứa thông tin riêng Y, thông tin không chứa biến X i khác Trong thực hành, điều xảy ta không gặp tượng đa cộng tuyến Và trường hợp lại, ta gặp tượng đa cộng tuyến Xét mơ hình hồi quy tuyến tính cổ điển nhiều biến Hiện tượng đa cộng tuyến hoàn hảo (perfect multi-collinearity) xảy biến giải thích tồn khơng đồng thời cho = ∀i Hiện tượng đa cộng tuyến khơng hồn hảo (imperfect multi-collinearity) xảy biến giải thích tồn khơng đồng thời cho = 0, ∀i nhiễu ngẫu nhiên Trong thực tế thường xảy đa cộng tuyến khơng hồn hảo, xảy đa cộng tuyến hoàn hảo 1.2 Nguyên nhân đa cộng tuyến - Do chất mối quan hệ biến độc lập Ví dụ biến vốn, biến lao động doanh nghiệp ngành thường có quan hệ tuyến tính chặt - Mơ hình có dạng đa thức Ví dụ: Biến X, hay thường có quan hệ tuyến tính chặt - Mẫu khơng mang tính đại diện 1.3 Hậu đa cộng tuyến - Trường hợp đa cộng tuyến hoàn hảo: hệ số hồi quy mẫu không xác định độ lệch tiêu chuẩn vô hạn - Trong trường hợp đa cộng tuyến không hồn hảo xác định hệ số hồi quy mẫu dẫn đến hậu sau: I.3.1 Phương sai độ lệch tiêu chuẩn hệ số hồi quy mẫu lớn Ta có cơng thức tính phương sai hiệp phương sai ước lượng ta có: Var()= (1) Var()= (2) Và Cov()= (3) Trong hệ số tương quan , Từ (1) (2) ta thấy tăng dần đến (nghĩa cộng tuyến tăng ) phương sai ước lượng tăng dần đến vô hạn (3) tăng dần đến Cov( tăng giá trị tuyệt đối I.3.2 Khoảng tin cậy hệ số hồi quy rộng Như ta biết chương trước khoảng tin cậy 95% cho biết là: ± 1,96 se(và ± 1,96 se( Trong Se(= = Se(= = Cho nên ta viết lại khoảng tin cậy 95% cho là: ± 1,96 Và cho ± 1,96 (4) (5) (4) (5) chứng tỏ gần tới khoảng tin cậy cho tham số rộng Do trường hợp có đa cộng tuyến gần hồn hảo số liệu mẫu thích hợp với tập giả thiết khác Vì xác xuất chấp nhận giả thiết sai tăng lên I.3.3 Tỷ số T ý nghĩa Như biết kiểm định giả thiết , sử dụng tỉ số t=se đem so sánh giá trị t ước lượng với giá trị giới hạn t Nhưng có đa cộng tuyến gần hồn hảo sai số tiêu chuẩn ước lượng cao làm cho tỉ số t nhỏ Kết làm tăng khả chấp nhận giả thiết I.3.4 Hệ số xác định bội cao t nhỏ Để giải thích điều Ta xét mơ hình hồi quy k biến sau: Trong trường hợp có đa cộng tuyến gần hoàn hảo, trên, ta tìm hệ số góc riêng khơng có ý nghĩa mặt thống kê sở kiểm định t Nhưng lại cao, nên kiểm định F, bác bỏ giả thiết = ==0 Mâu thuẫn tín hiệu đa cộng tuyến I.3.5 Dấu hệ số biến ngược với kỳ vọng Khi phương sai lớn giá trị thu từ mẫu khác biệt với giá trị đến mức nhận giá trị âm số dương ngược lại I.3.6 Một thay đổi dù nhỏ mẫu gây thay đổi lớn kết ước lượng 1.4 Phương pháp phát đa cộng tuyến I.4.1 Hệ số xác định bộicao tỷ số T thấp Trong trường hợp cao (thường >0,8) mã tỷ số t thấp ý dấu hiệu đa cộng tuyến I.4.2 Hệ số tương quan cặp biến giải thích cao Nếu hệ tương quan biến giải thích cao (vượt 0,8) có khả có tồn đa cộng tuyến Tuy nhiên tiêu chuẩn thường khơng xác Có trường hợp tương quan cặp khơng có đa cộng tuyến Đa cộng tuyến xảy mà khơng có báo trước tương quan cặp dù cung cấp cho ta kiểm tra tiên nghiệm có ích I.4.3 Xem xét hệ số tương quan riêng Ví dụ mơ hình hồi quy biến cao nhưng, tương đối thấp đề nghị biến giải thích có tương quan cao, tức mơ hình có tượng đa cộng tuyến I.4.4 Hồi quy phụ Hồi quy phụ hồi quy biến độc lập theo biến lại Nếu hồi quy biến độc lập theo biến độc lập cịn lại hệ số xác định bội thu kí hiệu Kiểm định giả thiết: : =0 + Nếu bác bỏ kết luận mơ hình có tượng đa cộng tuyến + Nếu chấp nhận kết luận mơ hình khơng có tượng đa cộng tuyến I.4.5 Nhân tử phóng đại phương sai VIF (Variance Inflating Factor) Một thước đo khác tượng đa cộng tuyến phân tử phóng đại phương sai gắn với biến Kí hiệu: VIF( xác định: VIF(= Trong hệ số xác định hồi quy phụ qua có biến giải thích khác Nếu VIF > 10 Ta kết luận mơ hình có tượng đa cộng tuyến I.5 Cách khắc phục tượng đa cộng tuyến I.5.1 Bỏ biến giải thích có khả tổ hợp tuyến tính biến cịn lại Khi có tượng đa cộng tuyến nghiêm trọng cách “đơn giản nhất” bỏ biến cộng tuyến khỏi phương trình Khi phải sử dụng biện pháp cách tiến hành sau: + Giả sử Trong mơ hình hồi quy ta có Y biến giải thích cịn biến giải thích Ta thấy tương quan chặt chẽ với Khi nhiều thơng tin Y chứa chứa Vậy ta bỏ hai biến khỏi mơ hình hồi quy, ta giải vấn đề đa cộng tuyến số thông tin Y + Bằng phép so sánh phép hồi quy khác mà có khơng có hai biến ta định nên bỏ biến hai biến khỏi mơ hình Lưu ý hạn chế biện pháp mơ hình kinh tế có trường hợp địi hỏi định phải có biến biến khác mơ hình Trong trường hợp việc loại bỏ biến phải cân nhắc cẩn thận sai lệch bỏ biến công tuyến với việc tăng phương sai ước lượng hệ số biến mơ hình I.5.2 Thu thập thêm số liệu lấy mẫu Vì đa cộng tuyến đặc trưng mẫu nên có mẫu khác liên quan đến biến mẫu ban đầu mà cộng tuyến khơng nghiêm trọng Điều làm chi phí cho việc lấy mẫu khác chấp nhận thực tế Đôi cần thu thập thêm số liệu, tăng cỡ mẫu làm giảm tính nghiêm trọng đa cộng tuyến I.5.3 Sử dụng sai phân cấp “Tương tự quan” biện pháp giảm tương quan qua lại biến chúng sử dụng biện pháp cho vấn đề đa cộng tuyến Ví dụ: có số liệu chuỗi thời gian biểu thị liên hệ biến Y biến phụ thuộc theo mơ hình sau: (6) 10 II Thực hành Dựa sở lý luận ta tìm hiểu, sau phân tích tình kinh tế cụ thể để thấy cách phát khắc phục tượng đa cộng tuyến nào? Nhu cầu thịt gà Mỹ, 1960-1982 Gjuarati Theo điều tra thể phụ thuộc lượng thịt gà tiêu dùng theo đầu người Mỹ, giá bán lẻ thực thịt gà giá bán lẻ thực thịt lợn giai đoạn 1960-1982 Trong đó: Y = tiêu thụ thịt gà bình quân đầu người, cân Anh X2 = thu nhập khả dụng thực bình qn đầu người, đơla X3 = giá bán lẻ thực thịt gà tính cân Anh, xu X4 = giá bán lẻ thực thịt heo tính cân Anh, xu 12 Nguồn: Dữ liệu Y lấy rút từ Citibase liệu X X4 từ Bộ Nơng Nghiệp Mỹ 2.1 Số liệu mơ hình hồi quy 2.1.1 Lập mơ hình hồi quy Ta có mơ hình hàm hồi quy tuyến tính: Yi = β1+ β2X2i + β3X3i + β4X4i + Ui 2.1.2 Mơ hình ước lượng hàm hồi quy: Yi = β1+ β2X2i + β3X3i + β4X4i Từ bảng số liệu sử dụng phần mềm EVIEWS ta kết sau: 13 2.1.3 Từ kết ước lượng ta thu mơ hình hồi quy mẫu: Yi = 38,64720 + 0,010876X2 – 0,541084X3 + 0,174055X4 2.2 Phát đa cộng tuyến 2.2.1 cao tỉ số t thấp * Từ bảng kết quản eviews ta có: 14 Ta thấy hệ số xác định bội mơ hình gần 1, điều chứng tỏ mơ hình phù hợp Vậy nghi ngờ có tượng đa cộng tuyến xảy mơ hình 2.2.2 Tương quan cặp biến độc lập * Sử dụng phần mềm eviews ta có bảng sau: Từ bảng ta thấy hệ số tương quan cặp biến giải thích cao Hệ số tương quan biến X2 X3 0.931681 > 0.8 Hệ số tương quan biến X2 X4 0.957131 > 0.8 Hệ số tương quan biến X3 X4 0.970112 > 0.8 Có thể nghi ngờ có tượng đa cộng tuyến X2ảy mơ hình 2.2.3 Hồi quy phụ * Ta tiến hành hồi quy X2 theo X3, X4 Sử dụng phần mềm eviews ta có bảng sau: 15 Với, ta kiểm định giả thiết: Hay tương đương: Xây dựng tiêu chuẩn kiểm định: Nếuđúng Ta có miền bác bỏ Từ bảng eviews ta có với n=23, k=4, ta có Bác bỏ, chấp nhận Vậy với mức ý nghĩa 5% X2 có mối liên hệ tuyến tính với X3, X4 16 * Ta tiến hành hồi quy X3 theo X2, X4 Sử dụng phần mềm eviews ta có bảng sau: Với, ta kiểm định giả thiết: Hay tương đương: Xây dựng tiêu chuẩn kiểm định: Nếuđúng Ta có miền bác bỏ Từ bảng eviews ta có 17 với n=23, k=4, ta có Bác bỏ, chấp nhận Vậy với mứcý nghĩa 5% X3 có mối liên hệ tuyến tính với X2, X4 Tiến hành hồi quy X4 theo X2, X3 Sử dụng phần mềm eviews ta có bảng sau: Với, ta kiểm định giả thiết: Hay tương đương: Xây dựng tiêu chuẩn kiểm định: 18 Nếuđúng Ta có miền bác bỏ Từ bảng eviews ta có với n=23, k=4, ta có Bác bỏchấp nhận Vậy với mức ý nghĩa 5% X4 có mối liên hệ tuyến tính với X2, X3 Mơ hình có xảy tượng đa cộng tuyến 2.2.4 Nhân tử phóng đại phương sai Nhân tử phóng đại phương sai gắn với biến X2: Phân tử phóng đại phương sai gắn với biến X3: Phân tử phóng đại phương sai gắn với biến X4: 19 Theo lý thuyết VIF10 có tượng đa cộng tuyến biến độc lập mơ hình Vậy mơ hình có xảy tượng đa cộng tuyến 20 III Khắc phục tượng đa cộng tuyến 3.1 Khắc phục tượng đa cộng tuyến cách bỏ bớt biến độc lập * Nếu bỏ biến X: Dependent Variable: Y Method: Least Squares Date: 10/28/22 Time: 19:56 Sample: 23 Included observations: 23 Variable Coefficient Std Error t-Statistic Prob C 32.73963 4.817946 6.795351 0.0000 Z -0.508680 0.222790 -2.283224 0.0335 T 0.346730 0.070316 4.930988 0.0001 R-squared 0.867100 Mean dependent var 39.66957 Adjusted R-squared 0.853810 S.D dependent var 7.372950 S.E of regression 2.819032 Akaike info criterion 5.031772 Sum squared resid 158.9388 Schwarz criterion 5.179880 Log likelihood -54.86538 Hannan-Quinn criter 5.069021 F-statistic 65.24459 Durbin-Watson stat 0.833239 Prob(F-statistic) 0.000000 Mơ hình có hệ số xác định R2 = 0,8671 mơ hình cịn đa cộng tuyến (vì hệ số VIF >10: Variance Inflation Factors Date: 10/28/22 Time: 19:57 Sample: 23 Included observations: 23 Variable Coefficient Uncentered Centered Variance VIF VIF 21 C 23.21260 67.18179 NA Z 0.049636 347.9036 16.98269 T 0.004944 133.9269 16.98269 * Nếu bỏ biến Z: Dependent Variable: Y Method: Least Squares Date: 10/28/22 Time: 19:58 Sample: 23 Included observations: 23 Variable Coefficient Std Error t-Statistic Prob C 27.47740 2.031323 13.52685 0.0000 X 0.010510 0.002949 3.564085 0.0019 T 0.014533 0.051724 0.280972 0.7816 R-squared 0.897537 Mean dependent var 39.66957 Adjusted R-squared 0.887291 S.D dependent var 7.372950 S.E of regression 2.475263 Akaike info criterion 4.771678 Sum squared resid 122.5386 Schwarz criterion 4.919786 Log likelihood -51.87430 Hannan-Quinn criter 4.808927 F-statistic 87.59610 Durbin-Watson stat 0.355603 Prob(F-statistic) 0.000000 Mơ hình có hệ số xác định R2 = 0,8975 mơ hình cịn đa cộng tuyến (vì hệ số VIF >10): Variance Inflation Factors Date: 10/28/22 Time: 19:59 Sample: 23 Included observations: 23 Coefficient Uncentered Centered Variable Variance VIF VIF C 4.126272 15.48969 NA 22 X 8.70E-06 46.89072 11.91897 T 0.002675 93.99400 11.91897 * Nếu bỏ biến T: Dependent Variable: Y Method: Least Squares Date: 10/28/22 Time: 20:00 Sample: 23 Included observations: 23 Variable Coefficient Std Error t-Statistic Prob C 34.51561 3.855779 8.951655 0.0000 X 0.014884 0.002193 6.785304 0.0000 Z -0.213592 0.121905 -1.752115 0.0951 R-squared 0.910821 Mean dependent var 39.66957 Adjusted R-squared 0.901903 S.D dependent var 7.372950 S.E of regression 2.309239 Akaike info criterion 4.632821 Sum squared resid 106.6517 Schwarz criterion 4.780929 Log likelihood -50.27744 Hannan-Quinn criter 4.670070 F-statistic 102.1340 Durbin-Watson stat 0.432741 Prob(F-statistic) 0.000000 Mơ hình có hệ số xác định R2 = 0,9108 mơ hình có khả đa cộng tuyến (vì hệ số VIF < 10): Variance Inflation Factors Date: 10/28/22 Time: 20:00 Sample: 23 Included observations: 23 Coefficient Uncentered Centered Variable Variance VIF VIF C 14.86704 64.12307 NA X 4.81E-06 29.81055 7.577427 Z 0.014861 155.2295 7.577427 23 Vậy sử dụng phương pháp bỏ bớt biến ta nên bỏ biến T 3.2 Khắc phục tượng đa cộng tuyến phương pháp sai phân Dependent Variable: D(Y) Method: Least Squares Date: 10/28/22 Time: 20:03 Sample (adjusted): 23 Included observations: 22 after adjustments Variable Coefficient Std Error t-Statistic Prob D(X) 0.008322 0.002841 2.928930 0.0086 D(Z) -0.167510 0.100547 -1.665988 0.1121 D(T) 0.041542 0.044470 0.934159 0.3619 R-squared 0.018542 Mean dependent var 1.140909 Adjusted R-squared 0.125757 S.D dependent var 1.270043 S.E of regression 1.347537 Akaike info criterion 3.560558 Sum squared resid 34.50126 Schwarz criterion 3.709336 Log likelihood -36.16613 Hannan-Quinn criter 3.595605 Durbin-Watson stat 1.616756 Hệ số VIF giảm xuống so với mơ hình ban đầu: Variance Inflation Factors Date: 10/28/22 Time: 20:06 Sample: 23 Included observations: 22 Coefficient Uncentered Variable Variance VIF D(X) 8.07E-06 1.433360 D(Z) 0.010110 2.386657 D(T) 0.001978 2.993269 24 Tuy nhiên, sử dụng phương pháp hệ số xác định nhỏ; mơ hình khơng phù hơp Vậy ta sử dụng mơ hình bỏ bớt biến T: Dạng hàm hồi quy mẫu là: Y = 34,5156 + 0,0149X – 0,2136Z 25 C KẾT LUẬN Qua việc nghiên cứu đề tài trên, phần hiểu tượng đa cộng tuyến, hậu tượng gì, làm để phát hiện tượng biện pháp khắc phục Qua có thêm kiến thức mơn học kinh tế lượng áp dụng vào trình nghiên cứu học tập 26 ... Theo lý thuyết VIF10 có tượng đa cộng tuyến biến độc lập mơ hình Vậy mơ hình có xảy tượng đa cộng tuyến 20 III Khắc phục tượng đa cộng tuyến 3.1 Khắc phục tượng đa cộng tuyến cách bỏ bớt biến... biến Hiện tượng gọi đa cộng tuyến Vậy đa cộng tuyến gì? Hậu tượng nào? Làm để phát hiện? Và biện pháp khắc phục Để trả lời câu hỏi trên, sau Nhóm tìm hiển thảo luận đề tài ? ?Hiện tượng đa cộng tuyến? ??... hành, điều xảy ta không gặp tượng đa cộng tuyến Và trường hợp lại, ta gặp tượng đa cộng tuyến Xét mơ hình hồi quy tuyến tính cổ điển nhiều biến Hiện tượng đa cộng tuyến hoàn hảo (perfect multi-collinearity)