1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận môn kinh tế lượng đề tài các vi phạm của mô hình hồi quytheo phương pháp ols

27 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Khái niệmTrong mô hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau,các biến độc lập có mối quan hệ tuyến tính, nghĩa là các biến độc lập có tươngquan chặt, mạnh với nhau thì s

Trang 1

ĐỀ TÀI: CÁC VI PHẠM CỦA MÔ HÌNH HỒI QUYTHEO PHƯƠNG PHÁP OLS

GVHD: HÀ TRỌNG QUANGNHÓM

Trang 2

2.2 Nguyên nhân của hiện tượng đa cộng tuyến 5

2.3 Hậu quả của hiện tượng đa cộng tuyến 6

2.4 Phát hiện đa cộng tuyến 7

Trang 3

TÀI LIỆU THAM KHẢO 27

LỜI MỞ ĐẦU

Kinh tế lượng là môn chuyên ngành quan trọng trong kinh tế Bằngcách áp dụng các thông kê toán và các số liệu kinh tế, môn học giúp ta đolường và ước lượng các biến số trong kinh tế Nhằm mục đích kiểm nghiệm lýthuyết kinh tế, kinh tế lượng đã xây dựng nên các mô hình kinh tế và đưa racác phân tích cũng như dự đoán thông qua mô hình này Phương pháp thốngkê quan trọng nhất trong môn kinh tế lượng là phân tích hồi quy (regression

analysis) Thông qua phương pháp này, các nhà kinh tế mô phỏng lại các tình

hình kinh tế dưới dạng số liệu để dễ dàng phân tích khi không có cơ hội tiếnhành các thử nghiệm có kiểm soát

Mô hình hồi quy trong kinh tế lượng là công cụ giúp chúng ta hiểu rõvề mối tương quan giữa biến phụ thuộc (Y) và biến độc lập (X), từ đó áp dụngvào thực tế để đưa ra các dự báo và giải pháp để khắc phục những khuyết tậtcủa nền kinh tế Tuy nhiên, trong nghiên cứu điều có thể xảy ra sai sót, khôngphải mô hình nghiên cứu nào cũng điều chính xác và đáng tin cậy, các sai sóttrong quá trình nghiên cứu mô hình hồi quy có thể dẫn đến các dự báo sailệch Vấn đề các dữ liệu quan sát chệch do thiếu biến và các vấn đề khác cũngthường xảy ra và cần được giải quyết, vì thế cần phải kiểm tra lại mô hình hồiquy.

Nhóm chúng em đã chọn chương 6 làm đề tài nghiên cứu vì nhận thấytính cần thiết của việc kiểm định đối với mô hình hồi quy, kiểm định giúp chomô hình trở nên đáng tin cậy và có thể được sử dụng trong các công trìnhnghiên cứu của nền kinh tế Ở đây phương pháp kiểm tra được đề xuất làphương pháp OLS-phương pháp hồi quy bình phương nhỏ nhất và thông quachương 6 chúng ta sẽ được tìm hiểu ba vi phạm của mô hình nhằm để xem xét

Trang 4

và đưa ra hướng khắc phục phù hợp: đa cộng tuyến, phương sai nhiễu thayđổi và tự tương quan.

I CƠ SỞ LÝ THUYẾT 1 Phương pháp OLS

Bình phương nhỏ nhất thông thường, (ordinary least squares –OLS)

là phương pháp được sử dụng rộng rãi nhất để ước lượng các tham số trongphương trình hồi quy Để tối thiểu hoá tổng bình phương của các khoảng cáchtheo phương thẳng đứng giữa số liệu thu thập được và đường (hay mặt) hồiquy.

2 Đa cộng tuyến2.1 Khái niệm

Trong mô hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau,các biến độc lập có mối quan hệ tuyến tính, nghĩa là các biến độc lập có tươngquan chặt, mạnh với nhau thì sẽ có hiện tượng đa cộng tuyến, đó là hiệntượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện đượcdưới dạng hàm số

Xét mô hình hồi qui k biến:

Too long to read onyour phone? Save

to read later onyour computer

Save to a Studylist

Trang 5

Nếu các biến giải thích độc lập tuyến tính thì mô hình không có đacộng tuyến.

Ngược lại nếu các biến giải thích phụ thuộc tuyến tính thì mô hình đãcho có đa cộng tuyến.

2.2 Nguyên nhân của hiện tượng đa cộng tuyến

Do biến độc lập được chọn có quan hệ nhân quả hay mối quan hệ tươngquan cao vì cùng phụ thuộc vào một điều kiện khác Ví dụ: biến Vốn và Laođộng tương quan khá chặt chẽ

Do kích cỡ mẫu quá bé

Trang 6

Cách thu thập mẫu cục bộ, tạo thành một mẫu không có tính đại diệncao cho tổng thể

Chọn biến có độ biến thiên nhỏ, nghĩa là mức độ biến động giữa cácbiến X không cao.

2.3 Hậu quả của hiện tượng đa cộng tuyến

- Hệ số tương quan giữa các biến độc lập có giá trị khá lớn- Phương sai và hiệp phương sai lớn bất thường

- Gia tăng độ rộng khoảng tin cậy của các hệ số hồi quy- Giá trị thống kê t trong kiểm định t có khuynh hướng nhỏ đi- Hệ số xác định có thể rất cao

- Giá trị ước lượng của các và rất nhạy đối với việc tăng hoặc bớt một quansát hay loại bỏ biến có mức ý nghĩa thấp

Chú ý:

Trong thực tế đa cộng tuyến hoàn hảo gần như không bao giờ xảy ra vìsự phụ thuộc hàm số giữa các biến độc lập chỉ tồn tại về mặt lý thuyết Do đótrong các mô hình hồi quy bội khi nói đến vấn đề đa cộng tuyến thì chúng tahiểu đó là hiện tượng đa cộng tuyến không hoàn hảo

Đối với mô hình hồi quy bội người ta không xem xét vấn đề có haykhông có đa cộng tuyến mà xem xét mức độ nghiêm trọng của đa cộng tuyến.

Nói chung khi có đa cộng tuyến không hoàn hảo các ước lượng nhậnđược vẫn có tính chất không chệch nên vẫn có thể dùng để dự báo.

Trang 7

2.4 Phát hiện đa cộng tuyến

Như chúng ta sẽ thấy trong các chương về tự tương quan và phương saithay đổi, không có một kiểm định duy nhất để phát hiện đa cộng tuyến Mộtsố chẩn đoán được thảo luận trong lý thuyết có thể được tóm tắt như sau:

 Hệ số lớn nhưng giá trị kiểm định t thấp

 Nếu tương quan cặp giữa các biến độc lập cao (lớn hơn 0,8) thì có thểxảy ra hiện tượng đa cộng tuyến

 Sử dụng hồi qui phụ (Auxiliary regression)

 Sử dụng hệ số phóng đại phương sai – VIF (Variance inflation factor) Đối với hàm hồi qui có hai biến độc lập X1 và X2, VIF được định

nghĩa như sau:

Khi có đa cộng tuyến Khi = 1 thì VIF tiến đến vô hạn Nếu khôngtuyến giữa và thì VIF bằng 1.

Kinh nghiệm: nếu VIF của 1 biến vượt quá 10 thì biến này được coi làcó cộng tuyến cao

Trang 8

 Bỏ bớt biến độc lập là nguyên nhân gây ra đa cộng tuyến Thu thập thêm các quan sát mới

 Kết hợp số liệu chéo và số liệu chuỗi thời gian

 Chuyển dạng dữ liệu bằng cách sử dụng sai phân bậc một, chuẩn hóa sốliệu

3 Phương sai số thay đổi3.1 Khái niệm

Là hiện tượng mà tại đó phần dư (residuals) hoặc các sai số (e) của môhình sau quá trình hồi quy không tuân theo phân phối ngẫu nhiên và phươngsai không bằng nhau.

Hiện tượng phương sai sai số thay đổi thường hay xuất hiện trong dữliệu bảng (panel-data) và dữ liệu cắt ngang (cross-sectional data)

Xét mô hình :

Trong phương pháp OLS có giả thiết: , phương sai sai số không đổi(đồng đều) Hommoscedasticity

Nếu PSSS thay đổi (không đồng đều) Heteroscedasticity

Ví dụ: quan sát một tên lửa cất cánh và đo quãng đường nó đã đi mỗi

giây một lần Chẳng hạn, trong vài giây đầu tiên, các phép đo có thể chính xácđến từng centimet Tuy nhiên, 5 phút sau khi tên lửa lùi vào không gian, độchính xác của các phép đo có thể chỉ ở mức 100 m do khoảng cách tăng lên,biến dạng khí quyển và một loạt các yếu tố khác Dữ liệu thu thập sẽ thể hiệnphương sai thay đổi.

3.2 Nguyên nhân

Nguyên nhân gây ra hiện tượng phương sai không đồng nhất rất đadạng do từ trong bản chất các yếu tố kinh tế xã hội Có nhiều nguyên nhânlàm phương sai của các sai số khác nhau, có thể kể đến một số nguyên nhânnhư sau:

Trang 9

- Do sử dụng những dụng cụ hiện đại hơn trong thu thập số liệu, nhờ vậymà sai số đo lường cũng như sai số tính toán có xu hướng giảm xuống- Do hành vi của con người trong các hoạt động ngày càng hoàn thiện ,

các sai sót do đó cũng giảm theo

- Do điểm nằm ngoài (điểm vượt trội outlier), là một vài trường hợp bấtthường với giá trị của dữ liệu rất khác biệt , phương sai thay đổi lớn- Xác định sai dạng mô hình có thể làm biến quan trọng bị bỏ sót cũng

góp phần làm phương sai thay đổi

3.3 Hậu quả của phương sai sai số thay đổi

Khi giả thiết phương sai sai số không thay đổi của mô hình hồi quy bịphá vỡ thì sẽ dẫn tới một số hậu quả như:

- Các tham số ước lượng vẫn còn là tuyến tính, không chệch nhưngkhông còn hiệu quả nữa

- Kiểm định t và F không còn chính xác nữa

- Việc kiểm định giả thuyết không còn đáng tin cậy Những kết quả dựbáo không còn là tối ưu

3.4 Phát hiện PSSS

Cũng như trường hợp đa cộng tuyến, câu hỏi quan trọng trên thực tế là:Làm sao ta biết được có phương sai thay đổi trong một tình huống cụ thể?Cũng như trong đa cộng tuyến, không có các quy tắc bất di bất dịch để pháthiện ra phương sai thay đổi mà chỉ có vài qui tắc kinh nghiệm.

a) Phương pháp đồ thị phần dư

Giả định ban đầu là phương sai không thay đổi, tiến hành hồi quy đểxác định ước lượng phần dư Sau đó vẽ biểu đồ với những dữ liệu của ước

Trang 10

lượng phần dư để xem phần dư này có thay đổi theo hệ thống khi giá trị củabiến độc lập hay giá trị của Y ước lượng tăng.

Chú ý: Với mô hình hồi quy bội, cần vẽ đồ thị phần dư theo từng biến

độc lập

b) Kiểm định Park

Kiểm định Park là một phương pháp kiểm định hiện tượng phương saicủa sai số thay đổi trong các mô hình hồi quy Như đã biết, đây là một phươngpháp kiểm định cho kết quả khá chính xác, tuy nhiên hạn chế của phươngpháp này chỉ áp dụng được đối với mô hình hồi quy đơn

Giả thiết: Mô hình hồi quy phụ 

c) Kiểm định Glejeser

Tương tự kiểm định Park, tuy nhiên sau khi thu các phần dư từ mô hìnhhồi qui gốc, Glejser sử dụng các dạng hàm sau:

Giả thiết:

Trang 11

+ , +

 (phương sai bằng nhau)

d) Kiểm định tương quan Spearman

Tương quan Spearman là một công cụ thống kê phân tích mối tươngquan đơn điều dưỡng một biến độc lập và một biến phụ thuộc, dễ hiểu hơn làkhi biến độc lập (X) tăng thì biến phụ thuộc gì cũng tăng (giảm) theo haykhông Các biến được đánh giá bằng hệ số tương quan Spearman không cầnbắt buộc phải có mối quan hệ tuyến tính và phân phối chuẩn nên sẽ được ápdụng ở nhiều trường hợp.

- Xét mô hình hồi qui sau:Yi = + 0 1Xi + u i

- Các bước thực hiện kiểm định tương quan hạng như sau:

Trang 12

1 Ước lượng mô hình hồi qui trên dựa trên bộ mẫu cho trước, thu đượcphần dư i

2 Xếp hạng | | và X theo thứ tự tăng dần hay giảm dần, tính d = hạng | | -iiihạng X , sau đó tính hệ số tương quan hạng Spearman i

Trang 13

Khi biết : phương pháp bình phương tối thiểu có trọng số (WLS) hoặc phương pháp bình phương nhỏ nhất tổng quát (GLS)

Chưa biết : Xây dựng mô hình hồi quy dựa trên một số giả thiết Việc ước lượng mô hình hồi quy tuyến tính logarit có thể làm giảm phương sai thay đổi.

Lưu ý:

Điều kiện để sử dụng phương pháp logarit hóa là giá trị của các biến phải dương Ta có thể dựa vào biểu đồ phần dư … theo (X) để khảo sát tính không đổi của phương sai Trong thực hành, có thể sử dụng phần mềm EVIEWS để kiểm định và khắc phục hiện tượng phương sai thay đổi Ví dụ như sử dụng phương pháp ARCH.

4 Tự tương quan 4.1 Khái niệm

Tự tương quan là sự tương quan giữa các thành phần của chuỗi cácquan sát được sắp xếp theo thứ tự thời gian trong các số liệu chuỗi thời gianhoặc sắp xếp theo thứ tự không gian, đối với các số liệu theo không gian (sốliệu chéo).

Ví dụ: Một cổ phiếu có thể có tỷ suất sinh lợi tự tương quan dương

mạnh mẽ, cho thấy rằng nếu nó “tăng” vào ngày hôm nay, thì nhiều khả năngnó cũng sẽ tăng vào ngày mai

4.2 Nguyên nhân

4.2.1 Nguyên nhân khách quan:

Quán tính của các biến kinh tế (inertia): thể hiện ở tính chu kỳ đối vớicác chuỗi thời gian như tổng sản phẩm, tỷ lệ thất nghiệp hay chỉ số giá.

Trang 14

Hiện tượng mạng nhện (cobweb phenomenon): một số hoạt động kinhtế có phản ứng chậm với sự biến động của các yếu tố tác động, lý do là phảimất một khoảng thời gian để các biến động đó có hiệu lực Ví dụ: đầu vụtrồng vải năm nay người nông dân bị ảnh hưởng bởi giá mua vải năm ngoáicủa các công ty xuất khẩu, vì vậy hàm cung như sau:

Qst = β + β01Pt-1 + ut.

Các độ trễ (Lags): khi phân tích chuỗi thời gian, có thể xảy ra hiệntượng biến phụ thuộc ở thời kỳ t bị ảnh hưởng bởi chính biến phụ thuộc ở thờikỳ

(t-1).

Ct = β + β + β01It2Ct-1 + ut

4.2.2.Nguyên nhân chủ quan

Xử lý số liệu.Mô hình sai lệch:

- Thiếu biến quan trọng.- Dạng hàm sai.

4.3 Hậu quả

Các ước lượng OLS không còn tính chất BLUE.

Ước lượng phương sai của các tham số hồi quy bị thấp, kéo theo kiểmđịnh t và kiểm định F không còn chính xác.

Giá trị ước lượng của R cao hơn so với giá trị thực.2

Phương sai và sai số của các giá trị dự báo cũng không còn chính xác.

4.4 Phát hiện

a) Phương pháp đồ thị:

Trang 15

Giả định về sự tự tương quan liên quan đến các giá trị u của tổng thể,ttuy nhiên, các giá trị này không thể quan sát được.

Ta quan sát e , hình ảnh của e có thể cung cấp những gợi ý về sự tựtttương quan.

Ta có thể chạy OLS cho mô hình gốc và thu thập e từ đó Vẽ đường etttheo thời gian và quan sát.

Hình 1: sơ đồ U (nhiễu của tổng thể) hoặc phần dư của theo thời giani, t

Trong hình 1, hình (a) – nhiễu biến động theo thời gian có dạng hàmbậc 3; hình (d) - nhiễu biến động theo thời gian có dạng hàm bậc 2; hình (b)và (c) - nhiễu biến động theo thời gian có dạng hàm tuyến tính tăng hoặcgiảm chỉ có hình (e) - nhiễu gần như không biến động theo thời gian Vậy

Trang 16

0 dL dU 2 4 -dU 4 -dL 4

Có t tự ương quan dương

Có t ựtương quan âmKhông có

t tự ương quanKhông

quyếết đ nhị

Không quyếết đ nhị

ngoại trừ trường hợp (e), các trường hợp còn lại đều có hiện tượng tự tươngquan.

b) Kiểm định của Durbin – Watson

Bảng thống kê Durbin – Watson cho ta các giá trị tới hạn du, dl dựa vàoba tham số: mức ý nghĩa số quan sát n, số biến giải thích k’.

Kiểm định DW thực hiện như sau:- Thiết lập cặp giả thiết: H ; H : 0:1

- Ước lượng hồi quy bằng phương pháp bình phương bé nhấtthông thường OLS và thu được phần dư.

- Tính giá trị thống kê d

- Tính giá trị tới hạn d và d từ bảng thống kê Durbin – Wastonu1Xét mô hình hồi qui có tự tương quan bậc nhất: u =t ut-1+t (-1  1)

Thống kê d (Durbin-Watson):

Do et2 và et-12 chỉ khác nhau có một quan sát, khi n đủ lớn, ta có thểxem chúng bằng nhau.

Với là ước lượng của ρ:

Với α = 5%, kích thước mẫu = n và số biến giải thích là k’ = k-1.

Trang 17

Durbin – Watson đã xây dựng bảng các giá trị cận dưới d (Lower), cậnLtrên d (Upper) để làm căn cứ kết luận.U

Lưu ý: trong thực hành, nếu dựa vào kiểm định DW, giá trị này xấp xỉ2: không có tự tương quan; càng khác xa 2, khả năng có tự tương quan rấtcao.

4.5 Cách khắc phục

Để khắc phụ hậu quả, các biện pháp sử dụng còn tùy thuộc vào bảnchất của nhiễu Ta phân biệt hai trường hợp:

- Khi đã biết (

- Trường hợp chưa biết hệ số tự tương quan (

Thực tế rất hiếm khi ta biết được giá trị của hệ số tương quan ( nênthông thường trong xử lý số liệu, ta phải ước lượng Sau đây là một sốphương pháp dùng để ước lượng:

a) Sử dụng phương trình sai phân tổng quát

Trang 18

Đa cộng tuyến cũng được quan sát thấy trong nhiều bối cảnh khác Mộttrong những bối cảnh như vậy là sinh học của con người

Ví dụ, huyết áp của một cá nhân không tương đồng với tuổi tác, mà cònbao gồm cả cân nặng, căng thẳng và mạch.

Trang 19

Ví dụ 2:

Xét ví dụ minh họa: Đa cộng tuyến trong việc giải thích về lợi nhuận

của cổ phiếu công nghệ Fidelity Select Technology Portfolio (FSPTX).Dưới đây là kết quả của phương trình hồi qui của lợi nhuận cổ phiếunày dựa trên chỉ số tăng trưởng và chỉ số giá trị của S&P 500.

Giá trị t-statistic bằng 5.9286 của chỉ số tăng trưởng (lớn hơn 2) chothấy sự tăng trưởng có khác biệt đáng kể so với mức độ tiêu chuẩn (có giá trịlà 0) Mặt khác, t-statistic của chỉ số giá trị là −0.9012 không có ý nghĩa thốngkê.

Kết quả này cho thấy lợi nhuận của FSPTX có mối liên quan với chỉ sốtăng trưởng và không liên quan chặt chẽ với chỉ số giá trị Tuy nhiên, hệ số(coefficient) của chỉ số tăng trưởng là 1.4697 thể hiện rằng lợi nhuận củaFSPTX có nhiều biến động hơn so với lợi nhuận của chỉ số tăng trưởng.

Trang 20

Lưu ý rằng hồi qui này giải thích phương sai của lợi nhuận FSPTX Cụthể, R của hồi qui này là 0,7996 Do đó, khoảng 80% phương sai của lợi2nhuận của FSPTX được giải thích bằng lợi nhuận chỉ số tăng trưởng và chỉ sốgiá trị S&P 500 Giả sử, chúng ta chạy mô hình hồi qui tuyến tính khác cóthêm chỉ số S&P 500 Dưới đây là kết quả của mô hình:

Lưu ý rằng R trong hồi qui này đã thay đổi không đáng kể so với2R2 trong hồi qui trước đó (tăng từ 0,7996 lên 0,8084), nhưng sai số chuẩn củacác hệ số của các biến độc lập đã lớn hơn nhiều.

Việc thêm chỉ số S&P 500 vào mô hình hồi qui không giải thích thêmbất kì phương sai của lợi nhuận của FSPTX so với trước đó, nhưng không cóhệ số nào có ý nghĩa thống kê Đây là trường hợp kinh điển của đa hiện tượngđa cộng tuyến.

Về cách khắc phục:

Ngày đăng: 25/05/2024, 17:38

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w