Khái niệmTrong mô hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau,các biến độc lập có mối quan hệ tuyến tính, nghĩa là các biến độc lập có tươngquan chặt, mạnh với nhau thì s
Trang 1BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
KHOA QUẢN TRỊ KINH DOANH
۷
TIỂU LUẬN NHÓM MÔN: KINH TẾ LƯỢNG
ĐỀ TÀI: CÁC VI PHẠM CỦA MÔ HÌNH HỒI QUY
THEO PHƯƠNG PHÁP OLS GVHD: HÀ TRỌNG QUANG NHÓM
Trang 2MỤC LỤC
MỤC LỤC 2
LỜI MỞ ĐẦU 3
I CƠ SỞ LÝ THUYẾT 4
1 Phương pháp OLS 4
2 Đa cộng tuyến 4
2.1 Khái niệm 4
2.2 Nguyên nhân của hiện tượng đa cộng tuyến 5
2.3 Hậu quả của hiện tượng đa cộng tuyến 6
2.4 Phát hiện đa cộng tuyến 7
2.5 Khắc phục đa cộng tuyến 7
3 Phương sai số thay đổi 8
3.1 Khái niệm 8
3.2 Nguyên nhân 8
3.3 Hậu quả của phương sai sai số thay đổi 9
3.4 Phát hiện PSSS 9
3.5 Các biện pháp khắc phục 12
4 Tự tương quan 13
4.1 Khái niệm 13
4.2 Nguyên nhân 13
4.3 Hậu quả 14
4.4 Phát hiện 14
4.5 Cách khắc phục 17
II ỨNG DỤNG 18
1 Đa cộng tuyến 18
2 Phương sai 22
3 Tự tương quan 24
KẾT LUẬN 26
Trang 3TÀI LIỆU THAM KHẢO 27
LỜI MỞ ĐẦU
Kinh tế lượng là môn chuyên ngành quan trọng trong kinh tế Bằngcách áp dụng các thông kê toán và các số liệu kinh tế, môn học giúp ta đolường và ước lượng các biến số trong kinh tế Nhằm mục đích kiểm nghiệm lýthuyết kinh tế, kinh tế lượng đã xây dựng nên các mô hình kinh tế và đưa racác phân tích cũng như dự đoán thông qua mô hình này Phương pháp thống
kê quan trọng nhất trong môn kinh tế lượng là phân tích hồi quy (regression
analysis) Thông qua phương pháp này, các nhà kinh tế mô phỏng lại các tình
hình kinh tế dưới dạng số liệu để dễ dàng phân tích khi không có cơ hội tiếnhành các thử nghiệm có kiểm soát
Mô hình hồi quy trong kinh tế lượng là công cụ giúp chúng ta hiểu rõ
về mối tương quan giữa biến phụ thuộc (Y) và biến độc lập (X), từ đó áp dụngvào thực tế để đưa ra các dự báo và giải pháp để khắc phục những khuyết tậtcủa nền kinh tế Tuy nhiên, trong nghiên cứu điều có thể xảy ra sai sót, khôngphải mô hình nghiên cứu nào cũng điều chính xác và đáng tin cậy, các sai sóttrong quá trình nghiên cứu mô hình hồi quy có thể dẫn đến các dự báo sailệch Vấn đề các dữ liệu quan sát chệch do thiếu biến và các vấn đề khác cũngthường xảy ra và cần được giải quyết, vì thế cần phải kiểm tra lại mô hình hồiquy
Nhóm chúng em đã chọn chương 6 làm đề tài nghiên cứu vì nhận thấytính cần thiết của việc kiểm định đối với mô hình hồi quy, kiểm định giúp cho
mô hình trở nên đáng tin cậy và có thể được sử dụng trong các công trìnhnghiên cứu của nền kinh tế Ở đây phương pháp kiểm tra được đề xuất làphương pháp OLS-phương pháp hồi quy bình phương nhỏ nhất và thông quachương 6 chúng ta sẽ được tìm hiểu ba vi phạm của mô hình nhằm để xem xét
Trang 4và đưa ra hướng khắc phục phù hợp: đa cộng tuyến, phương sai nhiễu thayđổi và tự tương quan.
I CƠ SỞ LÝ THUYẾT
1 Phương pháp OLS
Bình phương nhỏ nhất thông thường, (ordinary least squares –OLS)
là phương pháp được sử dụng rộng rãi nhất để ước lượng các tham số trongphương trình hồi quy Để tối thiểu hoá tổng bình phương của các khoảng cáchtheo phương thẳng đứng giữa số liệu thu thập được và đường (hay mặt) hồiquy
2 Đa cộng tuyến
2.1 Khái niệm
Trong mô hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau,các biến độc lập có mối quan hệ tuyến tính, nghĩa là các biến độc lập có tươngquan chặt, mạnh với nhau thì sẽ có hiện tượng đa cộng tuyến, đó là hiệntượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện đượcdưới dạng hàm số
Xét mô hình hồi qui k biến:
Too long to read on your phone? Save
to read later on your computer
Save to a Studylist
Trang 5Nếu các biến giải thích độc lập tuyến tính thì mô hình không có đacộng tuyến.
Ngược lại nếu các biến giải thích phụ thuộc tuyến tính thì mô hình đãcho có đa cộng tuyến
2.2 Nguyên nhân của hiện tượng đa cộng tuyến
Do biến độc lập được chọn có quan hệ nhân quả hay mối quan hệ tươngquan cao vì cùng phụ thuộc vào một điều kiện khác Ví dụ: biến Vốn và Laođộng tương quan khá chặt chẽ
Do kích cỡ mẫu quá bé
Trang 6Cách thu thập mẫu cục bộ, tạo thành một mẫu không có tính đại diệncao cho tổng thể
Chọn biến có độ biến thiên nhỏ, nghĩa là mức độ biến động giữa cácbiến X không cao
2.3 Hậu quả của hiện tượng đa cộng tuyến
- Hệ số tương quan giữa các biến độc lập có giá trị khá lớn
- Phương sai và hiệp phương sai lớn bất thường
- Gia tăng độ rộng khoảng tin cậy của các hệ số hồi quy
- Giá trị thống kê t trong kiểm định t có khuynh hướng nhỏ đi
- Hệ số xác định có thể rất cao
- Giá trị ước lượng của các và rất nhạy đối với việc tăng hoặc bớt một quansát hay loại bỏ biến có mức ý nghĩa thấp
Chú ý:
Trong thực tế đa cộng tuyến hoàn hảo gần như không bao giờ xảy ra vì
sự phụ thuộc hàm số giữa các biến độc lập chỉ tồn tại về mặt lý thuyết Do đótrong các mô hình hồi quy bội khi nói đến vấn đề đa cộng tuyến thì chúng tahiểu đó là hiện tượng đa cộng tuyến không hoàn hảo
Đối với mô hình hồi quy bội người ta không xem xét vấn đề có haykhông có đa cộng tuyến mà xem xét mức độ nghiêm trọng của đa cộng tuyến.Nói chung khi có đa cộng tuyến không hoàn hảo các ước lượng nhậnđược vẫn có tính chất không chệch nên vẫn có thể dùng để dự báo
Trang 72.4 Phát hiện đa cộng tuyến
Như chúng ta sẽ thấy trong các chương về tự tương quan và phương saithay đổi, không có một kiểm định duy nhất để phát hiện đa cộng tuyến Một
số chẩn đoán được thảo luận trong lý thuyết có thể được tóm tắt như sau:
Hệ số lớn nhưng giá trị kiểm định t thấp
Nếu tương quan cặp giữa các biến độc lập cao (lớn hơn 0,8) thì có thểxảy ra hiện tượng đa cộng tuyến
Sử dụng hồi qui phụ (Auxiliary regression)
Sử dụng hệ số phóng đại phương sai – VIF (Variance inflation factor)
Đối với hàm hồi qui có hai biến độc lập X1 và X2, VIF được địnhnghĩa như sau:
Trang 8 Bỏ bớt biến độc lập là nguyên nhân gây ra đa cộng tuyến
Thu thập thêm các quan sát mới
Kết hợp số liệu chéo và số liệu chuỗi thời gian
Chuyển dạng dữ liệu bằng cách sử dụng sai phân bậc một, chuẩn hóa sốliệu
3 Phương sai số thay đổi
3.1 Khái niệm
Là hiện tượng mà tại đó phần dư (residuals) hoặc các sai số (e) của môhình sau quá trình hồi quy không tuân theo phân phối ngẫu nhiên và phươngsai không bằng nhau
Hiện tượng phương sai sai số thay đổi thường hay xuất hiện trong dữliệu bảng (panel-data) và dữ liệu cắt ngang (cross-sectional data)
Xét mô hình :
Trong phương pháp OLS có giả thiết: , phương sai sai số không đổi(đồng đều) Hommoscedasticity
Nếu PSSS thay đổi (không đồng đều) Heteroscedasticity
Ví dụ: quan sát một tên lửa cất cánh và đo quãng đường nó đã đi mỗi
giây một lần Chẳng hạn, trong vài giây đầu tiên, các phép đo có thể chính xácđến từng centimet Tuy nhiên, 5 phút sau khi tên lửa lùi vào không gian, độchính xác của các phép đo có thể chỉ ở mức 100 m do khoảng cách tăng lên,biến dạng khí quyển và một loạt các yếu tố khác Dữ liệu thu thập sẽ thể hiệnphương sai thay đổi
3.2 Nguyên nhân
Nguyên nhân gây ra hiện tượng phương sai không đồng nhất rất đadạng do từ trong bản chất các yếu tố kinh tế xã hội Có nhiều nguyên nhânlàm phương sai của các sai số khác nhau, có thể kể đến một số nguyên nhânnhư sau:
Trang 9- Do sử dụng những dụng cụ hiện đại hơn trong thu thập số liệu, nhờ vậy
mà sai số đo lường cũng như sai số tính toán có xu hướng giảm xuống
- Do hành vi của con người trong các hoạt động ngày càng hoàn thiện ,các sai sót do đó cũng giảm theo
- Do điểm nằm ngoài (điểm vượt trội outlier), là một vài trường hợp bấtthường với giá trị của dữ liệu rất khác biệt , phương sai thay đổi lớn
- Xác định sai dạng mô hình có thể làm biến quan trọng bị bỏ sót cũnggóp phần làm phương sai thay đổi
3.3 Hậu quả của phương sai sai số thay đổi
Khi giả thiết phương sai sai số không thay đổi của mô hình hồi quy bịphá vỡ thì sẽ dẫn tới một số hậu quả như:
- Các tham số ước lượng vẫn còn là tuyến tính, không chệch nhưngkhông còn hiệu quả nữa
- Kiểm định t và F không còn chính xác nữa
- Việc kiểm định giả thuyết không còn đáng tin cậy Những kết quả dựbáo không còn là tối ưu
3.4 Phát hiện PSSS
Cũng như trường hợp đa cộng tuyến, câu hỏi quan trọng trên thực tế là:Làm sao ta biết được có phương sai thay đổi trong một tình huống cụ thể?Cũng như trong đa cộng tuyến, không có các quy tắc bất di bất dịch để pháthiện ra phương sai thay đổi mà chỉ có vài qui tắc kinh nghiệm
a) Phương pháp đồ thị phần dư
Giả định ban đầu là phương sai không thay đổi, tiến hành hồi quy đểxác định ước lượng phần dư Sau đó vẽ biểu đồ với những dữ liệu của ước
Trang 10lượng phần dư để xem phần dư này có thay đổi theo hệ thống khi giá trị củabiến độc lập hay giá trị của Y ước lượng tăng.
Chú ý: Với mô hình hồi quy bội, cần vẽ đồ thị phần dư theo từng biến
độc lập
b) Kiểm định Park
Kiểm định Park là một phương pháp kiểm định hiện tượng phương saicủa sai số thay đổi trong các mô hình hồi quy Như đã biết, đây là một phươngpháp kiểm định cho kết quả khá chính xác, tuy nhiên hạn chế của phươngpháp này chỉ áp dụng được đối với mô hình hồi quy đơn
Giả thiết: Mô hình hồi quy phụ
c) Kiểm định Glejeser
Tương tự kiểm định Park, tuy nhiên sau khi thu các phần dư từ mô hìnhhồi qui gốc, Glejser sử dụng các dạng hàm sau:
Giả thiết:
Trang 11+ , +
(phương sai bằng nhau)
d) Kiểm định tương quan Spearman
Tương quan Spearman là một công cụ thống kê phân tích mối tươngquan đơn điều dưỡng một biến độc lập và một biến phụ thuộc, dễ hiểu hơn làkhi biến độc lập (X) tăng thì biến phụ thuộc gì cũng tăng (giảm) theo haykhông Các biến được đánh giá bằng hệ số tương quan Spearman không cầnbắt buộc phải có mối quan hệ tuyến tính và phân phối chuẩn nên sẽ được ápdụng ở nhiều trường hợp
- Xét mô hình hồi qui sau:
Yi = + 0 1Xi + u i
- Các bước thực hiện kiểm định tương quan hạng như sau:
Trang 121 Ước lượng mô hình hồi qui trên dựa trên bộ mẫu cho trước, thu đượcphần dư i
2 Xếp hạng | | và X theo thứ tự tăng dần hay giảm dần, tính d = hạng | | -i i ihạng X , sau đó tính hệ số tương quan hạng Spearman i
Trang 13Khi biết : phương pháp bình phương tối thiểu có trọng số (WLS) hoặc phương pháp bình phương nhỏ nhất tổng quát (GLS)
Chưa biết : Xây dựng mô hình hồi quy dựa trên một số giả thiết Việc ước lượng mô hình hồi quy tuyến tính logarit có thể làm giảm phương sai thay đổi
Lưu ý:
Điều kiện để sử dụng phương pháp logarit hóa là giá trị của các biến phải dương Ta có thể dựa vào biểu đồ phần dư … theo (X) để khảo sát tính không đổi của phương sai Trong thực hành, có thể sử dụng phần mềm EVIEWS để kiểm định và khắc phục hiện tượng phương sai thay đổi Ví dụ như sử dụng phương pháp ARCH
4 Tự tương quan
4.1 Khái niệm
Tự tương quan là sự tương quan giữa các thành phần của chuỗi cácquan sát được sắp xếp theo thứ tự thời gian trong các số liệu chuỗi thời gianhoặc sắp xếp theo thứ tự không gian, đối với các số liệu theo không gian (sốliệu chéo)
Ví dụ: Một cổ phiếu có thể có tỷ suất sinh lợi tự tương quan dương
mạnh mẽ, cho thấy rằng nếu nó “tăng” vào ngày hôm nay, thì nhiều khả năng
nó cũng sẽ tăng vào ngày mai
4.2 Nguyên nhân
4.2.1 Nguyên nhân khách quan:
Quán tính của các biến kinh tế (inertia): thể hiện ở tính chu kỳ đối vớicác chuỗi thời gian như tổng sản phẩm, tỷ lệ thất nghiệp hay chỉ số giá
Trang 14Hiện tượng mạng nhện (cobweb phenomenon): một số hoạt động kinh
tế có phản ứng chậm với sự biến động của các yếu tố tác động, lý do là phảimất một khoảng thời gian để các biến động đó có hiệu lực Ví dụ: đầu vụtrồng vải năm nay người nông dân bị ảnh hưởng bởi giá mua vải năm ngoáicủa các công ty xuất khẩu, vì vậy hàm cung như sau:
Qst = β + β0 1Pt-1 + ut.
Các độ trễ (Lags): khi phân tích chuỗi thời gian, có thể xảy ra hiệntượng biến phụ thuộc ở thời kỳ t bị ảnh hưởng bởi chính biến phụ thuộc ở thờikỳ
Các ước lượng OLS không còn tính chất BLUE
Ước lượng phương sai của các tham số hồi quy bị thấp, kéo theo kiểmđịnh t và kiểm định F không còn chính xác
Giá trị ước lượng của R cao hơn so với giá trị thực.2
Phương sai và sai số của các giá trị dự báo cũng không còn chính xác
4.4 Phát hiện
a) Phương pháp đồ thị:
Trang 15Giả định về sự tự tương quan liên quan đến các giá trị u của tổng thể,ttuy nhiên, các giá trị này không thể quan sát được.
Ta quan sát e , hình ảnh của e có thể cung cấp những gợi ý về sự tựt ttương quan
Ta có thể chạy OLS cho mô hình gốc và thu thập e từ đó Vẽ đường et ttheo thời gian và quan sát
Hình 1: sơ đồ U (nhiễu của tổng thể) hoặc phần dư của theo thời gian i , t
Trong hình 1, hình (a) – nhiễu biến động theo thời gian có dạng hàmbậc 3; hình (d) - nhiễu biến động theo thời gian có dạng hàm bậc 2; hình (b)
và (c) - nhiễu biến động theo thời gian có dạng hàm tuyến tính tăng hoặcgiảm chỉ có hình (e) - nhiễu gần như không biến động theo thời gian Vậy
Trang 16Không có
t tự ương quan
Không
quyếết đ nhị
Không quyếết đ nhị
ngoại trừ trường hợp (e), các trường hợp còn lại đều có hiện tượng tự tươngquan
b) Kiểm định của Durbin – Watson
Bảng thống kê Durbin – Watson cho ta các giá trị tới hạn du, dl dựa vào
ba tham số: mức ý nghĩa số quan sát n, số biến giải thích k’
Kiểm định DW thực hiện như sau:
- Thiết lập cặp giả thiết: H ; H : 0: 1
- Ước lượng hồi quy bằng phương pháp bình phương bé nhấtthông thường OLS và thu được phần dư
Với là ước lượng của ρ:
Với α = 5%, kích thước mẫu = n và số biến giải thích là k’ = k-1
Trang 17Durbin – Watson đã xây dựng bảng các giá trị cận dưới d (Lower), cậnLtrên d (Upper) để làm căn cứ kết luận.U
Lưu ý: trong thực hành, nếu dựa vào kiểm định DW, giá trị này xấp xỉ2: không có tự tương quan; càng khác xa 2, khả năng có tự tương quan rấtcao
4.5 Cách khắc phục
Để khắc phụ hậu quả, các biện pháp sử dụng còn tùy thuộc vào bảnchất của nhiễu Ta phân biệt hai trường hợp:
- Khi đã biết (
- Trường hợp chưa biết hệ số tự tương quan (
Thực tế rất hiếm khi ta biết được giá trị của hệ số tương quan ( nênthông thường trong xử lý số liệu, ta phải ước lượng Sau đây là một sốphương pháp dùng để ước lượng:
a) Sử dụng phương trình sai phân tổng quát
Trang 19Ví dụ 2:
Xét ví dụ minh họa: Đa cộng tuyến trong việc giải thích về lợi nhuận
của cổ phiếu công nghệ Fidelity Select Technology Portfolio (FSPTX).Dưới đây là kết quả của phương trình hồi qui của lợi nhuận cổ phiếunày dựa trên chỉ số tăng trưởng và chỉ số giá trị của S&P 500
Giá trị t-statistic bằng 5.9286 của chỉ số tăng trưởng (lớn hơn 2) chothấy sự tăng trưởng có khác biệt đáng kể so với mức độ tiêu chuẩn (có giá trị
là 0) Mặt khác, t-statistic của chỉ số giá trị là −0.9012 không có ý nghĩa thốngkê
Kết quả này cho thấy lợi nhuận của FSPTX có mối liên quan với chỉ sốtăng trưởng và không liên quan chặt chẽ với chỉ số giá trị Tuy nhiên, hệ số(coefficient) của chỉ số tăng trưởng là 1.4697 thể hiện rằng lợi nhuận củaFSPTX có nhiều biến động hơn so với lợi nhuận của chỉ số tăng trưởng
Trang 20Lưu ý rằng hồi qui này giải thích phương sai của lợi nhuận FSPTX Cụthể, R của hồi qui này là 0,7996 Do đó, khoảng 80% phương sai của lợi2nhuận của FSPTX được giải thích bằng lợi nhuận chỉ số tăng trưởng và chỉ sốgiá trị S&P 500 Giả sử, chúng ta chạy mô hình hồi qui tuyến tính khác cóthêm chỉ số S&P 500 Dưới đây là kết quả của mô hình:
Lưu ý rằng R trong hồi qui này đã thay đổi không đáng kể so với2
R2 trong hồi qui trước đó (tăng từ 0,7996 lên 0,8084), nhưng sai số chuẩn củacác hệ số của các biến độc lập đã lớn hơn nhiều
Việc thêm chỉ số S&P 500 vào mô hình hồi qui không giải thích thêmbất kì phương sai của lợi nhuận của FSPTX so với trước đó, nhưng không có
hệ số nào có ý nghĩa thống kê Đây là trường hợp kinh điển của đa hiện tượng
đa cộng tuyến
Về cách khắc phục: