Rất mong nhậnđược những ý kiến đóng góp bổ ích của thầy và các bạn để bài thảo luận hoàn thiện hơn.Cuối cùng nhóm em xin chúc cô luôn luôn mạnh khỏe, đạt được nhiều thành côngtrong sự ng
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠIKHOA KINH TẾ - LUẬT
-BÀI THẢO LUẬN Kinh tế lượng
Đề tài: Hiện tượng đa cộng tuyến
Giáo viên hướng dẫn: Nguyễn Thị Hiên
Nhóm: 3
Lớp học phần: 2234AMAT0411
HÀ NỘI - 2022
Trang 2BẢNG PHÂN CÔNG NHIỆM VỤ
1
Trang 3MỤC LỤC
LỜI CẢM ƠN
Để hoàn thành bài thảo luận này, chúng em - những thành viên thuộc nhóm 3 lớp họcphần Kinh Tế Lượng xin tỏ lòng biết ơn sâu sắc đến cô Nguyễn Thị Hiên Cảm ơn cô đãtận tình truyền đạt những kiến thức chuyên môn và những kiến thức thực tế cho chúng
em Đó là nền tảng để chúng em hoàn thành bài thảo luận một cách tốt nhất và phát triểnbản thân trong tương lai
Dù cố gắng nhất có thể nhưng do trình độ hiểu biết và kinh nghiệm thực tế cònnhiều hạn chế nên bài thảo luận khó tránh khỏi những sai sót nhất định Rất mong nhậnđược những ý kiến đóng góp bổ ích của thầy và các bạn để bài thảo luận hoàn thiện hơn.Cuối cùng nhóm em xin chúc cô luôn luôn mạnh khỏe, đạt được nhiều thành côngtrong sự nghiệp trồng người cao quý, chúc các bạn luôn giữ vững lửa nhiệt huyết trongcon người mình, tận dụng sức trẻ, sức khỏe để gặt hái những thành tựu trong công việc vàcuộc sống
Nhóm 3 xin chân thành cảm ơn!
Hiện tượng trên được gọi là đa cộng tuyến Vậy phải làm thế nào để nhận biết vàkhắc phục hiện tượng này Qua kiến thức chúng em đã được tiếp thu từ bộ môn Kinh tế
CHƯƠNG 1 - LÝ LUẬN CƠ BẢN VỀ HIỆN TƯỢNG ĐA CỘNG TUYẾN
2
Trang 41.1 Khái quát chung về hiện tượng đa cộng tuyến
Khái niệm: Đa cộng tuyến( Multicollinearity): Là hiện tượng tạo nên từ mối quan hệ
tương quan mạnh giữa các biến độc lập với nhau trong mô hình hồi quy tuyến tính Hiệntượng này được thể hiện dưới dạng hàm số sau khi vi phạm giả thuyết của mô hình hồiquy tuyến tính cổ điển (Giả thuyết vi phạm: Các biến độc lập không có quan hệ tuyếntính với nhau)
Trong thống kê, đa cộng tuyến (cũng là tính cộng tuyến) là hiện tượng trong đómột biến dự báo trong mô hình hồi quy bội số có thể được dự đoán tuyến tính từ các biếnkhác với mức độ chính xác đáng kể Trong trường hợp này, các ước lượng hệ số của hồiquy bội có thể thay đổi thất thường để đáp ứng với những thay đổi nhỏ trong mô hìnhhoặc dữ liệu
Đa cộng tuyến không làm giảm sức mạnh dự đoán hoặc độ tin cậy của mô hình nói chung,
ít nhất là trong tập dữ liệu mẫu; nó chỉ ảnh hưởng đến các tính toán liên quan đến các yếu
tố dự đoán riêng lẻ Nghĩa là, một mô hình hồi quy đa biến với các yếu tố dự đoán cộngtuyến có thể cho biết toàn bộ nhóm các yếu tố dự báo dự đoán biến kết quả tốt như thếnào, nhưng nó có thể không đưa ra kết quả hợp lệ về bất kỳ dự đoán riêng lẻ nào hoặc vềnhững yếu tố dự đoán nào là dư thừa so với những người khác
1.2 Bản chất, nguyên nhân và hậu quả của hiện tượng đa cộng tuyến
1.2.1 Bản chất của hiện tượng đa cộng tuyến, đa cộng tuyến hoàn hảo và đa cộng tuyến không hoàn hảo
Trong trường hợp lý tưởng các biến trong môi trường hồi quy bội không cótương quan với nhau; mỗi một biến chứa một thông tin riêng về Y, thông tinkhông chứa trong bất kỳ biến khác Trong thực hành, khi điều này xảy ra takhông gặp hiện tượng đa cộng tuyến Ở trường hợp ngược lại, ta gặp hiệntượng đa cộng tuyến
Giả sừ hàm hồi quy Y có k biến giài thích , ,…,:
Đa cộng tuyến xảy ra khi một biến giải thích được biểu diễn dưới dạng tổhợp tuyến tính của các biến giải thích còn lại đối với mọi điểm của tập sốliệu Hay có thể nói A nếu tồn tại các không đồng nhất bằng không làm cho:
;
3
Trang 5Đa cộng tuyến hoàn hảo xảy ra khi một biến giải thích được biểu diễn dướidạng tổ hợp tuyến tính của các biến giải thích còn lại đối với mọi điểm củatập số liệu Hoặc có thể nói: Đa cộng tuyến hoàn hảo giữa các biến giảithích xảy ra nếu điều kiện sau được thỏa mãn:
(1.1.1)
Thuật ngữ đa cộng tuyến lần đầu tiên được Ragnar Frisch sử dụng vào năm
1934 với nội dung trên Tuy nhiên ngày nay, thuật ngữ này được sử dụngtheo nghĩa rộng hơn Nó bao gồm cả đa cộng tuyến hoàn hảo và trườnghợp trong đó các biến giải thích có tương quan với nhau theo nghĩa sau:
(1.1.2)
Để thấy được sự khác biệt giữa đa cộng tuyến hoàn hảo và chưa đượchoàn hảo, giả thiết, ví dụ, 2 0 Lúc đó (1.1) có thể viết lại như sau:
(1.1.3)cho thấy tương quan tuyến tính một cách chính xác với các biến khác nhưthế nào hoặc có thể tìm được từ một tổ hợp tuyến tính của các biến khácnhư thế nào Trong trường hợp này, hệ số tương quan giữa biến và tổ hợptuyến tính ở vế bên phải của phương trình (1.1.3) chắc chắn là một đơn vị Tương tự, nếu 2 0, công thức (1.1.2) có thể viết như sau:
(1.3) cho thấy không phải là một tổ hợp tuyến tính chính xác của các biến X khác
vì nó cũng còn được xác định bởi số hạng sai số ngẫu nhiên
527597129152
Trang 6Có thể thấy rõ ràng là là Vì vậy, có sự cộng tuyến hoàn hảo giữa vàbởi vì hệ số tương quan là 1 đơn vị Biến được tạo thành từ đơn giản bằngcách cộng thêm các số sau, những số này được lấy từ bảng số ngẫu nhiên: 2,
0, 7, 9, 2 Bây giờ, không còn có sự cộng tuyến hoàn hảo giữa biến và * Tuy nhiên, hai biến này tương quan chặt bởi vì tính toán cho thấy hệ sốtương quan giữa chúng là 0.9959
Nhân đây, lưu ý rằng đa cộng tuyến, như chúng ta đã định nghĩa, chỉ đềcập đến các quan hệ tuyến tính giữa các biến X Nó không bỏ qua các quan
hệ phi tuyến giữa các biến X Ví dụ, xem xét mô hình hồi qui sau:
(1.1.5)
Các biến (sảnlượng bình phương ra) và (sản lượng lập phương ra) rõ ràng có quan hệtheo hàm số với nhưng quan hệ này là phi tuyến Chính xác thì những môhình như (1.1.5) không vi phạm đến các giả định về phi đa cộng tuyến Tuynhiên, trong những ứng dụng cụ thể, hệ số tương quan được đo lường mộtcách qui ước sẽ cho thấy , và tương quan chặt, và tương quan này nhưchúng ta sẽ thấy, sẽ gây khó khăn cho việc ước lượng các thông số của môhình (1.1.5) chính cao xác hơn (nghĩa là với sai số chuẩn hoá hơn) Tại sao mô hình hồi qui tuyến tính cổ điển giả định rằng không có vấn đề đacộng tuyến giữa các biến X? Lý do là: Nếu đa cộng tuyến hoàn hảo theo(1.1.1), các hệ số hồi qui của các biến X là vô định và các sai số chuẩn làkhông xác định Nếu đa cộng tuyến chưa hoàn hảo, như trong (1.1.2), các hệ
số hồi qui, mặc dù là xác định nhưng lại có sai số chuẩn (liên quan đến bảnthân các hệ số) lớn, có nghĩa là không thể ước lượng các hệ số này với độ
5
Trang 7đa bt 1 ktl - đáp án
bt kinh tế lượngkinh tế
6
TL KINH TẾ LƯỢNG Chất lượng
27
Nhóm 2 - Các phương pháp pháp…
43
Lythuyet KTL - câu hỏi lý thuyết
1
Trang 8chính xác cao Các phát biểu này được chứng minh trong những phần sauđây
Như đã đề cập, trong trường hợp đa cộng tuyến hoàn hảo, các hệ số hồi qui vẫn
là không xác định và các sai số chuẩn của chúng là vô hạn Hiện tượng này cóthể được giải thích dưới dạng mô hình hồi qui ba biến Sử dụng dạng độ lệch,trong đó tất cả các biến có thể được diễn tả bằng độ lệch của chúng so vớitrung bình mẫu Trong đó:
32
Trang 9Giả sử: trong đó là hằng số khác không, thay điều kiện này vào (1.1.1.4)
ta được:
là biểu thức không xác định Tương tự như vậy ta cũng có thể chỉ ra khôngxác định
Vì sao chúng ta lại thu được kết quả như ở (1.1.1.6)? Lưu ý đến ý nghĩa của
có thể giải thích điều đó cho ta tốc độ thay đổi trung bình của khi thay đổi
1 đơn vị còn không đổi Nhưng khi thì điều đó có nghĩa là không thể táchảnh hưởng của và khỏi mẫu đã cho Trong kinh tế lượng thì điều này pháhủy toàn bộ ý định tách ảnh hưởng riêng của từng biến lên biến phụ thuộc.Thí dụ: thay điều kiện này vào (1.1.1.3) ta được:
Áp dụng công thức tính ước lượng của phương pháp bình phương nhỏnhất thông thường ta được:
Như vậy dù được ước lượng một cách duy nhất thì cũng không thể xácđịnh được và từ một phương trình 2 ẩn
Vì vậy, mặc dù chúng ta có thể ước lượng được , nhưng không có cáchnào để ước lượng riêng ; chính xác thì: cho chúng ta duy nhất mộtphương trình có hai ẩn số (lưu ý được cho trước) và có vô số nghiệmcho phương trình trên ứng với các giá trị cho trước của và
Ví dụ với các số hạng cụ thể, chẳng hạn và Ta có:
hoặc
Bây giờ chọn một giá trị tùy ý, chúng ta sẽ có lời giải cho Chọn mộtlời giải khác cho , chúng ta sẽ lại có một lời giải khác cho Dù có cố gắngthế nào đi nữa cũng không thể tìm cho một giá trị duy nhất
Như vậy trong trường hợp đa cộng tuyến hoàn hảo, chúng ta không thể
7
Trang 10nhận được lời giải duy nhất cho các hệ số hồi quy riêng, nhưng trong khi đó
ta lại có thể nhận được lời giải duy nhất cho tổ hợp tuyến tính của các hệ sốnày Chú ý rằng trong trường hợp đa cộng tuyến hoàn hảo thì phương sai vàcác sai số tiêu chuẩn của các ước lượng và là vô hạn
1.2.1.2
Đa cộng tuyến hoàn hảo chỉ là 1 trương hợp đặc biệt hiếm xảy ra Trong các
số liệu liên quan đến chuỗi thời gian, thường xảy ra đa cộng tuyến khônghoàn hảo
Xét mô hình (1.1.1.3) Bây giờ chúng ta giả thiết giữa và có cộng tuyếnkhông hoàn hảo theo nghĩa:
Trong trường hợp này theo phương pháp bình phương nhỏ nhất ta dễdàng thu được các ước lượng và
- Các dạng mô hình dễ xảy ra đa cộng tuyến:
Hồi quy dạng các biến độc lập được bình phương sẽ xảy ra đa cộng tuyến, đặc biệt khi phạm vi giá trị ban đầu của biến độc lập là nhỏ
Các biến độc lập vĩ mô được quan sát theo chuỗi thời gian
8
Trang 111.2.3 Hậu quả của đa cộng tuyến.
Ta xét trường hợp mô hình có hiện tượng đa cộng tuyến không hoàn hảo, tức là
hợp xảy ra như sau:
Trong đó là hệ số tương quan giữa
Từ 1.10 và 1.11 ta thấy tăng dần tới 1 (nghĩa là cộng tuyến tăng) thì phương sai của hai ước lượng này tăng dần tới vô hạn 1.12 chỉ ra rằng khi tăng dần tới 1 thì cov() tăng về giá trị tuyệt đối
1.2.3.2
Giả sử khi thực hành ta có khoảng tin cậy 95% cho khi đã biết là:
)Trong đó:
Do đó trong trường hợp có đa cộng tuyến gần hoàn hảo thì số liệu của mẫu có thể thích hợp với tập các giả thiết khác nhau Vì thế xác suất chấp nhận giả thiết sai tăng lên (tức là tăng sai lầm loại II)
1.2.3.3
9
Trang 12Như đã biết, khi kiểm định giả thiết : chúng ta đã sử dụng tỷ số và đem so sánh giá trị t đã được ước lượng với giá trị tới hạn t thong khi có đa cộn tuyến gần hoàn hảo thì sai
số tiêu chuẩn ước lượng được sẽ rất cao vì vậy làm cho chỉ số t nhỏ đi Kết quả là sẽ làm
1.2.3.4
Để giải thích điều này Ta hãy xét mô hình hồi quy k biến như sau:
Trong trường hợp có đa cộng tuyến gần hoàn hảo, như đã chỉ ra ở trên, ta có thể tìm được một hoặc một số hệ số góc riêng là không có ý nghĩa là không có ý nghĩa thống kê trên cơ sở kiểm định t nhưng trong khi đó lại có thể rất cao, nên bằng kiểm định F chúng ta có thể bác bỏ giả thiết: Mâu thuẫn này cũng là tín hiệu của
là một trong các biến giải thích, biến phụ thuộc là lượng cầu hàng hoá, nếu xảy ra hiện tượng đa cộng tuyến gần hoàn hảo thì ước lượng của hệ số của biến thu nhập có thể mang dấu âm – mâu thuẫn với điều ta mong đợi
1.2.3.7
1.3 Phát hiện đa cộng tuyến
Đa cộng tuyến đề cập đến điều kiện của các biến độc lập được giả thiết là phi ngẫunhiên nên nó là vấn đề liên quan đến tệp số liệu mẫu chứ không phải của tổng thể do đóchúng ta không kiểm định đa cộng tuyến
Chúng ta không kiểm định “tính đa cộng tuyến – mà nếu muốn chúng ta có thể dobậc của nó trong một mẫu bất kỳ” Không có một phương pháp thực sự hoàn thiện đểphát hiện đa cộng tuyến Do đó chúng ta chỉ có các dấu hiệu cho thấy có thể thấy có đacộng tuyến
Xét mô hình:
10
Trang 131.3.1 R cao nhưng tỉ số t thấp
Hiện tượng đa cộng tuyến xảy ra nếu:
Trong trường hợp có hệ số xác định bội Rcao Thường thì hệ số này thường lớnhơn 0,8 ( R> 0,8)
Trong trường hợp mà trong đó mọi hệ số hồi quy đều không có ý nghĩa (nghĩa là
có giá trị t thấp) hay tồn tại hoặc
Khi xuất hiện 2 điều kiện trên ta có thể kết luận có hiện tượng đa cộng tuyến xảy
ra Ngược lại, nếu không thỏa mãn 1 trong 2 điều kiện trên thì không xảy ra hiệntượng đa cộng tuyến
Trang 14Tồn tại giá trị
+ Thống kê t của hệ số ứng với biến Z: 1.547751 < 2.179
Tồn tại giá trị
Vậy mô hình trên có hiện tượng đa cộng tuyến xảy ra
1.3.2 Hồi quy phụ
Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến là hồi quy phụ.Hồi quy phụ là hồi quy mỗi một biến giải thích X theo các biến giải thích còn lại Nếuhồi quy biến độc lập theo các biến độc lập còn lại thì hệ số xác định bội thu được kíhiệu là R
Mối liên hệ giữa F và R:
F=
biến giải thích kể cả hệ số chặn trong mô hình R là hệ số xác định trong hồi quy củabiến X theo các biến X khác Nếu F tính được vượt điểm tới hạn F(k-2, n-k+1) ở mức ýnghĩa đã cho thì có nghĩa là X có liên hệ tuyến tính với các biến X khác Nếu F có ýnghĩa về mặt thống kê chúng ta vẫn phải quyến định liệu biến X nào sẽ bị loại khỏi môhình Một trở ngại của kỹ thuật hồi quy phụ là gánh nặng tính toán Nhưng ngày naynhiều chương trình máy tính đã có thể đảm đương được công việc tính toán này.Với cách phát hiện bằng phương pháp hồi quy phụ, ta kiểm định giả thuyết Nếubác bỏ thì kết luận mô hình có hiện tượng đa cộng tuyến xảy ra
Kiểm định cặp giả thuyết
+ Tiêu chuẩn kiểm định:
Nếu đúng thì FF(k-1, n-k)+ Miền bác bỏ với mức ý nghĩa cho trước
Ví dụ 1.3
12
Trang 15Ta có 0.05 ta đi kiểm định giả thiết
Nhận xét:
Từ mô hình trên, chúng ta nhận thấy rằng:
Mô hình hồi quy phụ phụ hợp
Vậy càng có cơ sở khẳng định mô hình trên có hiện tượng đa cộng tuyến
1.3.3 Nhân tử phóng đại phương sai (VIF – Variance Inflating Factor).
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương sai
biến như sau:
Trong đó là hệ số xác định trong hồi quy phụ của qua các biến giải thích khác.VIF>10 -> mô hình có đa cộng tuyến cao
Tiếp ví dụ 1.3: VIF(X) = 1/(1-=103,9392994 > 0,8
mô hình có hiện tượng đa cộng tuyến
trong hồi quy gốc của Y đối với các biến X và phương sai của ước lượng trong hồi quy
trong đó các biến độc lập không tương quan với nhau, và VIF so sánh tình huống thực
và tình huống lý tưởng Sự so sánh này không có ích nhiều và nó không cung cấp cho tabiết phải làm gì với tình huống đó Nó chỉ cho biết rằng tình hình là không lý tưởng
Đồ thị mối liên hệ của và VIF như chỉ ra ở hình sau:
13
Trang 16Nếu thì mô hình cos hiện tượng đa cộng tuyến
Lưu ý: Ta có thể dùng ma trận tương quan
Trang 17ρxz = 0.959547 > 0.8 Kết luận mô hình tồn tại hiện tượng đa cộng tuyến.
Theo Kennedy, nếu hệ số tương quan từ 0.8 trở lên thì đa cộng tuyến trở nêm nghiêm trọng
1.4 Biện pháp khắc phục
1.4.1 Sử dụng thông tin tiên nghiê Gm
Thí dụ : ta muốn ước lượng hàm sản xuất của 1 quá trình sản xuất nào đó có dạng :
vế (1.16) ta được :
Giả sử K và L có tương quan rất cao dĩ nhiên điều này sẽ dẫn đến phương sai của các
xử lý của chúng ta sẽ là thay β = 1 - vào (1.17) và thu được :
1.4.2 Thu thập thêm số liệu hoặc lấy thêm mẫu mới
15
Trang 18Vì đa cô “ng tuyến là đă “c trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các
trong thực tế
của đa cô “ng tuyến
1.4.3 Bỏ biến
như sau:
Giả sử trong mô hình hồi quy của ta có Y là biến được giải thích còn là các biến giải
quyết được vấn đề đa cô “ng tuyến nhưng sẽ mất đi 1 phần thông tin về Y
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có và không có 1 trong 2
Thí dụ đối với hồi quy của Y đối với tất cả các biến là 0.94; khi loại biến là 0.87 và
hình
1.4.4 Sử dụng phân sai cấp một
có thể được sử dụng như 1 giải pháp cho vấn đề đa cô “ng tuyến
Trong đó t là thời gian Phương trình trên đúng với t thì cũng đúng với t-1 nghĩa là:
16