Chương I. Lý luận cơ bản về hiện tượng đa cộng tuyến Khái niệm đa cộng tuyến và nguyên nhân Khái niệm Khi xây dựng mô hình hồi quy bội, trường hợp lý tưởng là các biến Xi trong mô hình không có tương quan với nhau; mỗi biến Xi thông tin riêng về Y, thông tin không chứa trong bất kì biến Xi khác. Trong thực hành, khi điều này xảy ra ta không gặp hiện tượng đa cộng tuyến. Ở các trường hợp ngược lại, ta gặp hiện tượng đa cộng tuyến hoàn hảo.Giả sử ta phải ước lượng hàm hồi quy Y gồm k biến giải thích X1, X2, X3,….., Xk Y1 = β1+ β2X2i+ β3X3i+ …..+βkXki + Ui Các biến X2, X3,..., Xk gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng tuyến toàn phần nếu tồn tại λ2,..., λkkhông đồng thời bằng 0 sao cho: λ2X2 + λ3X3 + ... + λkXk = 0 với mọi i Các biến X2, X3..., Xk gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại λ2,..., λk không đồng thời bằng 0 sao cho:λ2X2+ λ3X3+ ... + λkXk+ Vi= 0 (1.1)trong đó Vi là nhiễu ngẫu nhiên. Trong (1.1) giả sử ∃λi ≠ 0 khi đó ta biểu diễn: X2i = X3i λ3λ2 X4iλ4λ2 … λkλ2 Viλ2 (1.2) Từ (1.2) ta thấy, hiện tượng đa cộng tuyến xảy ra khi một biến là tổ hợp tuyến tính của các biến còn lại và một sai số ngẫu nhiên, hay nói cách khác là có một biến biểu diễn xấp xỉ tuyến tính qua các biến còn lại. Ước lượng khi có đa cộng tuyến Do phương pháp thu thập dữ liệu: Các giá trị của biến độc lập phụ thuộc lẫn nhau trong mẫu nhưng không phụ thuộc lẫn nhau trong tổng thể. Ví dụ: Người thu nhập cao có khuynh hướng có nhiều của cải hơn. Điều này có thể đúng với mẫu mà không đúng với tổng thể. Trong tổng thể sẽ có các quan sát về các các nhân có thu nhập cao nhưng không có nhiều của cải và ngược lại. Các dạng mô hình dễ xảy ra đa cộng tuyến: Hồi quy dạng các biến độc lập bình phương sẽ xảy ra đa cộng tuyến, đặc biệt khi phạm vi giá trị ban đầu của biến độc lập là nhỏ. Các biến độc lập vĩ mô được quan sát theo chuỗi thời gian. Ước lượng khi có hiện tượng đa cộng tuyến hoàn hảo Sau đây chúng ta sẽ chỉ ra rằng khi có đa cộng tuyến hoàn hảo thì các hệ số hồi quy là không xác định còn các sai số tiêu chuẩn là vô hạn. Để đơn giản về mặt trình bày chúng ta sẽ xét mô hình hồi quy 3 biến và chúng ta sẽ sử dụng dạng độ lệch trong đó: yi = Yi Y ̅ ; xi = Xi X ̅ (1.3) Y ̅= 1n ∑_(i=1)n▒Yi ;X ̅ = 1n ∑_(i=1)n▒Xi (1.4) thì mô hình hồi quy 3 biến có thể viết lại dưới dạng : yi =β ̂2x2i + β ̂3x3i + ei (1.5) Theo tính toán trong chương hồi quy bội ta thu được các ước lượng β ̂2 và β ̂3. β ̂2 cho ta tốc độ thay đổi trung bình của Y khi X2thay đổi 1 đơn vị còn X3 không đổi. Nhưng khi X3i = λX2ithì điều đó có nghĩa là không thể tách ảnh hưởng của X2 và X3 khỏi mẫu đã cho. Trong kinh tế lượng, điều này phá hủy toàn bộ ý định tách ảnh hưởng riêng của từng biến lên biến phụ thuộc Thí dụ: X3i = λX2i thay điều kiện này vào (1.5) ta được: Yi = β ̂2x2i + β ̂3 (λX2i) + ei =β ̂2+ λ.β ̂3X2i + ei = α ̂x2i + ei Trong đó:( α) ̂ = β ̂2 + λβ ̂3 Áp dụng công thức tính ước lượng của phương pháp bình phương nhỏ nhất thông thường ta được: Như vậy dù αđược ước lượng một cách duy nhất thì cũng không thể xác định được β ̂2 và β ̂3 từ một phương trình 2 ẩn. Như vậy, trong trường hợp đa cộng tuyến hoàn hảo, chúng ta không thể nhận được lời giải thích duy nhất cho các hệ số hồi quy riêng, nhưng trong khi đó ta lại có thể nhận được lời giải thích duy nhất cho tổ hợp tuyến tính của các hệ số này. Chú ý rằng trong trường hợp đa cộng tuyến hoàn hảo thì phương sai và các sai số tiêu chuần của các ước lượng β ̂2 và β ̂3 là vô hạn.
!" # Khi xây dựng MHHQ bội, trường hợp lý tưởng là các biến X i trong mô hình không có tương quan với nhau; mỗi biến X i chứa một thông tin riêng về Y, thông tin không chứa trong bất kì biến X i khác. Trong thực hành, khi điều này xảy ra ta không gặp hiện tượng đa cộng tuyến. Trong những trường hợp còn lại, ta gặp hiện tượng đa cộng tuyến. Giả sử ta phải ƯL hàm hồi quy Y gồm k biến giải thích X 1 , X 2 , X 3 ,… ,X k Y 1 = β 1 + β 2 X 2i + β 3 X 3i + U i , ),1( ni = - Các biến X 2 , X 3 , , X k gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng tuyến chính xác nếu tồn tại λ 2 , , λ k không đồng thời bằng không sao cho: λ 2 X 2 + λ 3 X 3 + + λ k X k = 0 Các biến X 2 , X 3 , , X k gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại λ 2 , , λ k không đồng thời bằng không sao cho: λ 2 X 2 + λ 3 X 3 + + λ k X k + V i = 0 (1.1) trong đó V i là sai số ngẫu nhiên. Trong (1.1) giả sử ∃ λ i ≠ 0 khi đó ta biểu diễn: Bài Thảo Luận KTL Nhóm 9 Page 1 X i = 32 2 2 3 i i i i V X X λ λ λ λ λ λ λ − − − − − - Từ (1.2) ta thấy hiện tượng đa cộng tuyến xảy ra khi một biến là tổ hợp tuyến tính của các biến còn lại và một sai số ngẫu nhiên, hay nói cách khác là có một biến biểu diễn xấp xỉ tuyến tính qua các biến còn lại. $#!" Do phương pháp thu thập dữ liệu: Các giá trị của các biến độc lập phụ thuộc lẫn nhau trong mẫu nhưng không phụ thuộc lẫn nhau trong tổng thể. %&'() %*'()* * %$&*'+*+,-)(.* * /0123 /-4 --435'62"7 +8'5 /$*1+ /%9:4;8< - Như đã biết, khi kiểm định giả thiết : chúng ta đã sử dụng tỷ số và đem so sánh giá trị t đã được ước lượng với giá trị tới hạn t. thong khi có đa cộn tuyến gần hoàn hảo thì sai số tiêu chuẩn ước lượng được sẽ rất Bài Thảo Luận KTL Nhóm 9 Page 2 cao vì vậy làm cho chỉ số t nhỏ đi. Kết quả là sẽ làm tăng khả năng chấp nhận giả thiết H 0 . //=5'6-78 44;!> 3?+@'!+8A;5BCD+*4;' /EF835'34;G2)H4 /I9! *55(. 64JC'5+*5'*KL83? E4MGA3 E*:4;8- Trong trường hợp R 2 cao (thường R 2 > 0,8) mà tỉ số t thấp thì đó chính là dấu hiệu của hiện tượng đa cộng tuyến . E$92K-BN* E%OPQ72+! Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và Glauber đã đề nghị sử dụng hệ số tương quan riêng. Trong hồi quy của Y đối với các biến X 2 , X 3 ,X 4 . Nếu ta nhận thấy răng r 2 234,1 cao trong khi đó r 2 34,12 ; r 2 24,13 ; r 2 23,14 tương đối thấp thì điều đó có thể gợi ý rằng các biến X 2 , X 3 và X 4 có tương quan cao và ít nhất một trong các biến này là thừa. Bài Thảo Luận KTL Nhóm 9 Page 3 Dù tương quan riêng rất có ích nhưng nó cũng không đảm bảo rằng sẽ cung cấp cho ta hướng dẫn chính xác trong việc phát hiện ra hiện tượng đa cộng tuyến. E/0G2-R Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến là hồi quy phụ. Hồi quy phụ là hồi quy mỗi một biến giải thích X i theo các biến giải thích còn lại. R 2 được tính từ hồi quy này ta ký hiện R 2 i Mối liên hệ giữa F i và R 2 i : F= )1/()1( )2/( 2 2 +−− − knR kR i i F i tuân theo phân phối F với k – 2 và n - k +1 bậc tự do. Trong đó n là , k là số biến giải thích kể cả hệ số chặn trong mô hình. R 2 i là hệ số xác định trong hồi quy của biến X i theo các biến X khác. Nếu F i tính được vượt điểm tới hạn F i (k-2, n-k+1) ở mức ý nghĩa đã cho thì có nghĩa là X i có liên hệ tuyến tính với các biến X khác. Nếu F i có ý nghĩa về mặt thống kê chúng ta vẫn phải quyến định liệu biến X i nào sẽ bị Bài Thảo Luận KTL Nhóm 9 Page 4 loại khỏi mô hình. Một trở ngại của kỹ thuật hồi quy phụ là gánh nặng tính toán. Nhưng ngày nay nhiều chương trình máy tính đã có thể đảm đương được công việc tính toán này. EE#"S-)A-4 Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương sai gắn với biến X , ký hiệu là VIF(X ). VIF(X ) được thiết lập trên cơ sở của hệ số xác định R trong hồi quy của biến X với các biến khác nhau như sau: VIF(X i ) = R1 1 2 i − (1.15) - Nhìn vào công thức (1.15) có thể giải thích VIF(X ) bằng tỷ số chung của phương sai thực của β trong hồi quy gốc của Y đối với các biến X và phương sai của ước lượng β trong hồi quy mà ở đó X trực giao với các biến khác. Ta coi tình huống lý tưởng là tình huống mà trong đó các biến độc lập không tương quan với nhau, và VIF so sánh tình huông thực và tình huống lý tưởng. Sự so sánh này không có ích nhiều và nó không cung cấp cho ta biết phải làm gì với tình huống đó. Khi R 2 i =1 thì VIF là vô hạn. IT--(U-R IVSLR.! Bài Thảo Luận KTL Nhóm 9 Page 5 I$91-4;'*K'8!W5 I%TD I/VSLR4-"8- IEX2+*G2Y ZZT 91-9M0 Theo một cuộc điều tra của CR;(! về tổng sản phẩm trong nước tính theo giá thực tế GDP, giá trị hàng xuất khẩu và tổng số vốn đầu tư trực tiếp nước ngoài thực hiện FDI của Việt Nam giai đoạn 1995- 2011 như sau: • GDP_Y (tỉ đồng/ năm) • Gía Trị Hàng Xuất Khẩu _ X (tỉ đồng/ năm) Bài Thảo Luận KTL Nhóm 9 Page 6 • FDI _ Z(tỉ đồng/năm) 1-.6 G2 Ta có mô hình hàm hồi quy tuyến tính thể hiện sự phụ thuộc của chi phí tiêu dùng vào thu nhập và tiền tích lũy: Bài Thảo Luận KTL Nhóm 9 Page 7 Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau: Bảng 1 Từ kết quả ước lượng ta thu được hàm hồi quy mẫu sau: ˆ Y i = 67826,02 +26,3046 – 26,1162 Ý nghĩa kinh tế: Bài Thảo Luận KTL Nhóm 9 Page 8 +, = 26.3046 có nghĩa: nếu vốn đầu tư trực tiếp nước ngoài vào Việt Nam không đổi, giá trị hàng xuất khẩu tăng 1 tỷ đồng thì tổng sản phẩm trong nước GDP tính theo giá thực tế tăng 26.3046 tỷ đồng. +, = –26,1162 nghĩa: nếu giá trị hàng xuất khẩu không đổi, vốn vốn đầu tư trực tiếp nước ngoài vào Việt Nam tăng 1 tỷ USD thì tổng sản phẩm trong nước GDP tính theo giá thực tế giảm 26.1162 tỷ đồng. $&*' Với mức ý nghĩa 5% hãy ước lượng khoảng tin cậy của XDTK : T = ~ với mức ý nghĩa ta có khoảng tin cậy của (< < ) Từ bảng 1 ta có: n=17 ; chọn mức Thay số ta có: 26.3046 - 2.145.34952<<26.3046 + 2.145.34952 18.81<<33.8 vậy với mức ý nghĩa ta có khoảng tin cậy của là: . (tỉ đồng/ năm ) Ý nghĩa kinh tế : Nếu giữ chỉ số FDI không đổi , khi giá trị hàng xuất khẩu tăng 1 tỷ đồng/ năm, thì GDP tăng trong khoảng 18.81 đến 33.8 tỷ đồng / năm. Bài Thảo Luận KTL Nhóm 9 Page 9 %5Y<[(H\+\O(. @5:4;XF(.] Với mức ý nghĩa ta cần kiểm định giả thuyết. H 0 : H 1 : XDTCKĐ: T = từ bảng ta có t tn =7.526 mà < =7.526 bác bỏ H 0 chấp nhận H 1 vậy thì giá trị hàng XK có ảnh hưởng tới GDP. /F^T_` Khi giá trị hàng hóa xuất khẩu (X) là 110000 (tỉ đồng/ năm), FDI (Z) là 12000 (tỉ đồng /năm), với độ tin cậy là 95%, hãy dự báo: 1. GDP trung bình trong năm 2014 2. Giá trị GDP trong năm 2014 /LM*XF+6+*a$b/ Với độ tin cậy 95% cần dự báo E(Y/X 0 ) Ước lượng điểm của E(Y/X 0 ) là: Bài Thảo Luận KTL Nhóm 9 Page 10 [...]... ta được khoảng tin cậy của E(Y/X0) là: Bài Thảo Luận KTL Nhóm 9 Page 11 Bài Thảo Luận KTL Nhóm 9 Page 12 Như vậy ta tìm được khoảng tin cậy cho GDP trung bình khi giá trị hàng xuất khẩu là X = 110000, FDI là Z= 26500 với độ tin cậy 95% là: (2481115 ;3005771) tỉ 4.2 dự báo GDP trong năm 2014: Với độ tin cậy 95%, cần dự báo Y0 Ước lượng điểm của Y0 là: Bài Thảo Luận KTL Nhóm 9 Page 13 Se =166822.5 Xây... báo Y0 Ước lượng điểm của Y0 là: Bài Thảo Luận KTL Nhóm 9 Page 13 Se =166822.5 Xây dựng thống kê: Với n=17, k=3, , ta tìm được Sao cho: Thay vào ta được khoảng tin cậy của Y0 là: Bài Thảo Luận KTL Nhóm 9 Page 14 Bài Thảo Luận KTL Nhóm 9 Page 15 Như vậy ta tìm được khoảng tin cậy cho GDP khi giá trị hàng xuất khẩu là X = 110000, FDI là Z= 26500 với độ tin cậy 95% là: (2481115 ;3005771) tỉ đồng 5 Phát... Có hiện tượng đa cộng tuyến Vậy từ đó ta có thể kết luận có hiện tượng đa cộng tuyến - Hệ số tương quan cặp giữa các biến giải thích cao: Bài Thảo Luận KTL Nhóm 9 Page 16 Bảng hệ số tương quan giữa X và Z: Bảng 2 X X Z 1 0.9476 9 Z 0.9476 9 1 Từ bảng 2 ta thấy hệ số tương quan giữa biến X và Z: Có hiện tượng đa cộng tuyến Vậy từ đó ta có thể kết luận có hiện tượng đa cộng tuyến - Xét hồi quy phụ: Xét... biến ta được bảng số liệu sau đây: y 22889 2 27203 6 31362 3 36101 7 Bài Thảo Luận KTL Nhóm 9 x 8155.4 11143 6 11592 3 11499 6 Page 18 z 2792 2938 2 3277 1 2372 4 39994 2 44164 6 48129 5 53576 2 61344 3 71530 7 91400 1 10615 65 12467 69 16160 47 18091 49 21578 28 27798 80 18752 39 19845 72 64521 3 45672 5 12567 8 23456 Bài Thảo Luận KTL Nhóm 9 11742 2528 1 3 15636 2398 5 7 2225 16218 6 17745 2884 6... hiện tượng đa cộng tuyến Vậy từ đó ta có thể kết luận không có hiện tượng đa cộng tuyến Bài Thảo Luận KTL Nhóm 9 Page 20 - Hệ số tương quan cặp giữa các biến giải thích cao: Bảng hệ số tương quan giữa X và Z: Bảng 2 X X 1 Z −0.035 01 Z −0.035 01 1 Từ bảng 2 ta thấy hệ số tương quan giữa biến X và Z: Không có hiện tượng đa cộng tuyến Vậy từ đó ta có thể kết luận không có hiện tượng đa cộng tuyến - Xét hồi... 21.43375 21.53178 21.44349 0.681535 Từ bảng số liệu 3, ta có p_value = 0.00000.05 chấp nhận H0, bác bỏ H1 Kết luận với mức ý nghĩa 5%, ta có thể kết luận không có hiện tượng đa cộng tuyến - Sử dụng nhân tử phóng đại phương sai (VIF): Từ bảng 3: Nhân tử phóng đại: Không có hiện tượng đa cộng tuyến Kết luận: không có hiện tượng đa cộng tuyến 6.2.Biện pháp khắc phục: Bỏ biến Dependent Variable: Y Method: Least... số liệu1, ta thấy: Hệ số xác định bội: R2= 0.967771 ( >0.8), nên R2 cao n− k tα 2 t= 21.22294 > =2.131 Suy ra ttn cao Không có hiện tượng đa cộng tuyến Vậy từ đó ta có thể kết luận không có hiện tượng đa cộng tuyến Bài Thảo Luận KTL Nhóm 9 Page 25 ... Squares Date: 11/05/14 Time: 09:46 Sample: 1995 2011 Included observations: 17 Variable Coefficient Std Error t-Statistic Prob C Z -3607.907 8.264403 4408.039 0.718706 -0.818484 11.49901 0.4259 0.0000 Bài Thảo Luận KTL Nhóm 9 Page 17 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.898117 0.891324 10330.66 1.60E+09 -180.1869 132.2271 0.000000... 60989.14 3.495214 30.48028 1.112100 7.525889 -0.856823 0.2848 0.0000 0.4060 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood 0.969376 0.965002 139845.2 2.74E+11 -223.8926 Bài Thảo Luận KTL Nhóm 9 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Page 22 938129.5 747521.3 26.69324 26.84028 26.70786 F-statistic Prob(F-statistic) 221.5821 . Y 0 Ước lượng điểm của Y 0 là: Bài Thảo Luận KTL Nhóm 9 Page 13 Se =166822.5 Xây dựng thống kê: Với n=17, k=3, , ta tìm được Sao cho: Thay vào ta được khoảng tin cậy của Y 0 là: Bài Thảo Luận. lượng ta thu được hàm hồi quy mẫu sau: ˆ Y i = 67826,02 +26,3046 – 26,1162 Ý nghĩa kinh tế: Bài Thảo Luận KTL Nhóm 9 Page 8 +, = 26.3046 có nghĩa: nếu vốn đầu tư trực tiếp nước ngoài vào. đồng/ năm ) Ý nghĩa kinh tế : Nếu giữ chỉ số FDI không đổi , khi giá trị hàng xuất khẩu tăng 1 tỷ đồng/ năm, thì GDP tăng trong khoảng 18.81 đến 33.8 tỷ đồng / năm. Bài Thảo Luận KTL Nhóm 9 Page