Phát hiện và khắc phục hiện tượng tự tương quan ở 1 bộ số liệu cụ thể.
Trang 11 BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN
1.1 Định nghĩa
Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thànhphần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các sốliệu chuỗi thời gian) hoặc không gian (trong số liệu chéo).
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng khôngcó sự tương quan giữa các nhiễu Ui nghĩa là:
Cov(Ui , Uj ) = 0 (ij) (7.1)
Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắnvới một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn vớimột quan sát khác.
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễucủa các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov(Ui , Uj ) 0 (ij) (7.2)
1.2 Nguyên nhân của tự tương quan
1.2.1 Nguyên nhân khách quan
- Quán tính:
Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính.Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thấtnghiệp mang tính chu kỳ Chẳng hạn nếu chúng ta ở đầu của thời kỳ khôiphục kinh tế tổng sản phẩm có xu hướng đi lên Vì vậy trong hồi quy củachuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫnnhau.
- Hiện tượng mạng nhện:
Trang 2Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởngbởi giá mua lạc năm ngoái của các công ty xuất khẩu Cho nên cung về lạc cóbiểu hiện dưới dạng hàm:
Yt = 1 + 2Pt – 1 + Ut (7.3)
Giả sử ở cuối thời kỳ t giá lạc Pt < Pt – 1 , do đó trong thời kỳ t + 1 nhữngngười nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t Điều này sẽdẫn đến mô hình mạng nhện.
- Trễ:
Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập,chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vàothu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩalà:
Yt = 1 + 2Xt + 3Yt – 1 + Ut (7.4)Trong đó: Yt: Tiêu dùng ở thời kỳ t.
Xt: Thu nhập ở thời kỳ t.
Yt – 1: Tiêu dùng ở thời kỳ t – 1 Ut: Nhiễu.
1, 2, 3: Các hệ số.
Chúng ta có thể lý giải mô hình (7.4) như sau: Người tiêu dùng thườngkhông thay đổi thói quen tiêu dùng…, như vậy nếu ta bỏ qua số hạng trễtrong (7.4), số hạng sai số sẽ mang tính hệ thống do ảnh hưởng của tiêu dùngthời kỳ trước lên tiêu dùng thời kỳ hiện tại.
1.2.2 Nguyên nhân chủ quan
- Xử lý số liệu:
Trang 3Trong phân tích thực nghiệm, số liệu thô thường được xử lý Chẳng hạntrong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thườngđược suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo thángrồi chia cho 3 Việc lấy trung bình này làm trơn các số liệu và làm giảm sựdao động trong số liệu tháng Chính sự làm trơn này gây ra tự tương quan.
- Sai lệch do lập mô hình:
Đây là nguyên nhân thuộc về lập mô hình Có hai loại sai lầm có thể gâyra hiện tượng tự tương quan:
Một là: không đưa đủ các biến vào trong mô hình
Hai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan.
1.3 Ước lượng bình phương nhỏ nhất khi có tự tương quan
Lược đồ (7.7) gọi là lược đồ tự hồi quy bậc nhất Markov Chúng ta kýhiệu lược đồ đó là AR(1) Nếu Ut có dạng:
Ut = 1Ut – 1 + 2Ut – 2 + t
Trang 4Là lược đồ tự hồi quy bậc 2 và ký hiệu AR(2).
Bằng phương pháp bình phương nhỏ nhất ta tính được:
n
Nhưng phương sai của nó trong lược đồ AR(1), bây giờ là:
Nếu không có tự tương quan thì:
Ta thấy: cộng với một số hạng phụ thuộc vào ρ Nếu ρ = 0 thì:
Nếu tiếp tục dùng phương pháp OLS và điều chỉnh công thức phương saithông thường bằng việc sử dụng lược đồ AR(1) thì không còn là ướclượng không chệch tốt nhất nữa.
1.4 Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan
Giả sử chúng ta tiếp tục xét mô hình 2 biến và có quá trình AR(1) bằngphương pháp bình phương nhỏ nhất tổng quát đã xét từ ở chương trước ta thuđược:
Trang 5- Các kiểm định t và F nói chung không đáng tin cậy.- ˆ2( 2)ˆ2
n k
cho ước lượng chệch của 2
thực, và trong một số trườnghợp, nó dường như ước lượng thấp 2
- R2 có thể là độ đo không đáng tin cậy cho R2 thực.
- Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng cóthể không hiệu quả.
2,PHÁT HIỆN CÓ TỰ TƯƠNG QUAN
2.1 Phương pháp đồ thị
Trang 6Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổđiển gắn với các nhiễu Ut , nhưng không quan sát được, ta chỉ có thể quansát các phần dư et Mặc dù et không hoàn toàn giống như Ut nhưng quan sátcác phần dư et có thể gợi ý cho ta những nhận xét về Ut
Có nhiều cách khác nhau để xem xét các phần dư Chẳng hạn chúngta có thể đơn thuần vẽ đồ thị của et theo thời gian như hình dưới:
Nhìn vào đồ thị, ta thấy phần dư không biểu thị một kiểu mẫu nào khi thời gian tăng lên, nó phân bố một cách ngẫu nhiên xung quanh trung bình của chúng → Nó ủng hộ cho giả thiết không có sự tương quan trong mô hình hồi quy tuyến tính cổ điển.
Nếu đồ thị của phần dư như hình dưới: ta thấy có xu thế tuyến tính, tăng hoặcgiảm trong các nhiễu → Nó ủng hộ cho giả thiết có sự tương quan trong mô hình hồi quy tuyến tính cổ điển.
Trang 7Một cách khác là vẽ đồ thị của phần dư chuẩn hoá theo thời gian
2.2 Phương pháp kiểm định số lượng
2.2.1 Kiểm định các đoạn mạch
Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xácđịnh xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu cóphải là kết quả của một quá trình mang tính ngẫu nhiên hay không.
2.2.3 Kiểm định d.Durbin – Watson
Là kiểm định dựa vào giá trị tính toán, thống kê d được định nghĩa nhưsau:
d =
(7.10)
d 2(1 - ˆ ) (7.11)Trong đó:
n
122
Trang 8(1) (2) (3) (4) (5)
0 dl du 2 4-du 4-dl 4d (1): tồn tại tự tương quan thuận chiều
d (2): không xác định
d (3): không có tự tương quand (4): không xác định
d (5): tồn tại tự tương quan ngược chiều
Kiểm định Durbin – Watson chỉ nhận dạng được hiện tượng tương quan chuỗi bậc 1 Đôi khi Kiểm định Durbin – Watson không cho kết luận.
2.2.4 Kiểm định Breusch – Godfrey (BG)
Để đơn giản ta xét mô hình giản đơn: Yt = 12X tUt
Trong đó: Ut = 1Ut1 2Ut2 pUtp t, t thoả mãn các giả thiếtcủa OLS.
Giả thiết: H0 : 1 2 p 0
Kiểm định như sau:
Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS Từ đó thu
được các phần dư et.
Bước 2: Ước lượng mô hình sau đây bằng phương pháp OLS:et = 12Xt 1et12et2 petp vt
Từ kết quả ước lượng mô hình này thu được R2
(p).
Nếu (n - p)R2 > 2
quan một bậc nào đó Trong trường hợp ngược lại không tồn tại tự tươngquan.
2.2.5 Kiểm định Durbin h
Trang 9 (7.13)
Trong đó n là cỡ mẫu, Var(ˆ2) là phương sai của hệ số của biến trễ Yt-1.
ˆ là ước lượng của tương quan chuỗi bậc nhất từ phương trình:
n
Vậy để áp dụng thống kê h phải:
- Ước lượng mô hình Yt = 0 1Xt 2Yt1Vt bằng phương pháp bìnhphương bé nhất.
- Tính Var(ˆ2).- Tính ˆ1 d2
Trang 10- Tính h theo công thức h )21
- Quy tắc quyết đinh: Vì h N(0,1) nên P(-1,96 h 1,96) = 0,95.
2.2.6 Phương pháp khác: Kiểm định Correlogram( trong tập bài giảng
kinh tế lượng – biên soạn: ThS Hoàng Thị Hồng Vân).
Một phương pháp khác giúp nhận dạng AR là kiểm định Q Để thựchiện kiểm định này chúng ta cần xem xét một khái niệm “tự tương quan”(AutoCorrellation – AC)
Giả thuyết kiểm định:
Trị số thống kê kiểm định (Box-Lung):
3 BIỆNPHÁP KHẮC PHỤC TỰ TƯƠNG QUAN
3.1 Khi cấu trúc của tự tương quan là đã biết
Vì các nhiễu Ut không quan sát được nên tính chất của tương quanchuỗi thường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thựctiễn Trong thực hành, người ta thường giả sử rằng Ut theo mô hình tự hồiquy bậc nhất nghĩa là:
Trang 11U 1 (7.15)
Trong đó 1 và t thoả mãn các giả thiết của phương pháp bìnhphương nhỏ nhất thông thường nghĩa là: Trung bình bằng 0, phương saikhông đổi và không tự tương quan Giả sử (7.15) là đúng thì vấn đề tươngquan chuỗi có thể được giải quyết thoả đáng nếu hệ số tự tương quan là đãbiết Để làm sáng tỏ vấn đề đó ta quay lại mô hình hai biến:
Y 12 (7.16)Nếu (7.16) đúng với t thì cũng đúng với t – 1 nên:
(7.19)Đặt * 1(1)
Y 1*
tt
Thì phương trình (7.19) có thể viết lại dưới dạng:
Y*1*2* * (7.20)
Vì t thoả mãn các giả thiết của phương pháp bình phương nhỏ nhấtthông thường đối với các biến Y* và X* và các ước lượng tìm được có tất cảcác tính chất tối ưu nghĩa là ước lượng tuyến tính không chệch tốt nhất.
Phương trình hồi quy (7.19) được gọi là phương trình sai phân tổng quát.
3.2 Khi chưa biết
3.2.1 Phương pháp sai phân cấp 1
Trang 12Như ta đã biết 11 nghĩa là nằm giữa (-1,0) hoặc (0,1) cho nênngười ta có thể bắt đầu từ các giá trị ở các đầu mút của các khoảng đó Nghĩalà ta có thể giả thiết rằng:
0 tức là không có tương quan chuỗi
1 nghĩa là có tương quan dương hoặc âm hoàn toàn.
Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng khôngcó tự tương quan rồi sau đó tiến hành kiểm định Durbin – Watson hay cáckiểm định khác để xem giả thiết này có đúng hay không Tuy nhiên nếu
thì phương trình sai phân tổng quát (7.17) quy về phương trình saiphân cấp 1:
Giả sử mô hình ban đầu là:
Y 2()
Trang 13Hay 2 2 1 22
Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trongkinh tế lượng ứng dụng vì nó dễ thực hiện.
3.2.2 Ước lượng dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã thiết lập được các công thức:
Hoặc ˆ 1 d2 (7.26)
Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của
từ thống kê d Từ (7.24) chỉ ra rằng giả thiết sai phân cấp 1 với 1 chỉđúng khi d =0 hoặc xấp xỉ bằng không Cũng vậy khi d = 2 thì ˆ 0 và khi d= 4 thì ˆ 1 Do đó thống kê d cung cấp cho ta một phương pháp sẵn có đểthu được ước lượng của
Nhưng lưu ý rằng quan hệ (7.26) chỉ là quan hệ xấp xỉ và có thể khôngđúng với các mẫu nhỏ.
Khi đã được ước lượng thì có thể biến đổi tập số liệu như đã chỉ ra ở(7.20) và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thôngthường Khi ta sử dụng một ước lượng thay cho giá trị đúng, thì các hệ số ướclượng thu được từ phương pháp bình phương nhỏ nhất có thuộc tính tối ưuthông thường chỉ tiệm cận có nghĩa là có thuộc tính đó trong các mẫu lớn Vìvậy trong các mẫu nhỏ ta phải cẩn thận trong khi giải thích các kết quả ướclượng.
3.2.3 Thủ tục lặp Cochrane – Orcutt để ước lượng
Trang 14Phương pháp này sử dụng các phần dư et đã được ước lượng để thu đượcthông tin về chưa biết.
Ta xét phương pháp này thông qua mô hình hai biến sau:
Y 12 (7.27)Giả sử Ut được sinh ra từ lược đồ AR(1) cụ thể là
U 1 (7.28)Các bước tiến hành như sau:
Bước 1: Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhất
thông thường và thu được các phần dư et.
Bước 2: Sử dụng các phần dư đã ước lượng để ước lượng hồi quy:
*ˆ t ;(1ˆ);
Ta ước lượng hồi quy (7.30)
***2*1*
Y (7.30)
lượng tốt nhât của hay không, ta thế giá trị ˆ* ˆ1(1)
và *2
thu được từ(7.30) vào hồi quy gốc ban đầu (7.27) và thu được các phần dư mới chẳnghạn e**
etYt *Xt
ˆ (7.31)Các phần dư có thể tính dễ dàng.
Ước lượng phương trình hồi quy tương tự với (7.29) et* ˆˆet*1 Wt (7.32)
Trang 15ˆˆ là ước lượng vòng 2 của
Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của khácnhau một lượng rất nhỏ chẳng hạn bé hơn 0,01 hoặc 0,005.
3.2.4 Thủ tục Cochrane – Orcutt hai bước
Đây là một kiểu rút gọn quá trình lặp Trong bước 1 ta ước lượng từbước lặp đầu tiên nghĩa là từ phép hồi quy (7.27) và trong bước 2 ta sử dụngước lượng của để ước lượng phương trình sai phân tổng quát.
3.2.5 Phương pháp Durbin – Watson 2 bước để ước lượng
Để minh hoạ phương pháp này chúng ta viết lại phương trình sai phântổng quát dưới dạng sau:
Y 1(1)22 1 1 (7.33)Durbin đã đề xuất thủ tục 2 bước để ước lượng :
và Yt-1 và coi giá trị ước lượng được của hệ số hồi quy của Yt-1 (=ˆ) là ướclượng của Mặc dù là ước lượng chệch nhưng ta có ước lượng vững của
3.2.6 Các phương pháp khác ước lượng
Ngoài các phương pháp để ước lượng đã trình bày ở trên còn có mộtsố phương pháp khác nữa Chẳng hạn ta có thể dùng phương pháp hợp lý cựcđại để ước lượng trực tiếp các tham số của (7.33) mà không cần dùng đến
Trang 16một số thủ tục lặp đã thảo luận Nhưng phương pháp ước lượng hợp lý cựcđại liên quan đến thủ tục ước lượng phi tuyến (đối với các tham số) và thủ tụctiềm kiếm của Hildreth – Lu nhưng thủ tục này tốn nhiều thời gian và khônghiệu quả so với phương pháp ước lượng hợp lý cực đại nên ngày nay khôngđược dùng nhiều.
Trang 17Ta lựa chọn dạng mô hình hồi quy như sau: Y = β1 + β2X+ β3Z
Chạy eview hồi quy Y theo X và Z ta thu được bảng sau: .
Hồi quy 1.
Trang 18Ta có mô hình hồi quy
Ŷi = 15277421 - 0.01366Xi + 0.00748Zi
2,Phát hiện tự tương quan
Từ bảng eview ta có D=1.2491Với k=3 k’=2, n=30 ta cóTa có DL=1.281 Du=1.567
Ta có 0<d<DL nên có hiện tượng tự tương quan bậc nhất
Kiểm định BG
Trang 19Nhìn vào phần trên của bảng kết quả ta có: Pvalue =0.0492
Với = 0,05 > 0.0492 → ta bác bỏ giả thiết cho rằng không có tự tương quan ở bậc 1, hay nói cách khác, ta kết luận tồn tại hiện tượng tự tương quan bậc 1
Khắc phục tư tương quan
Ta có d=1.2491 nên p^= 1-d/2=0.37545Ta có phương trình sai phân tổng quátY1t=Yt – Yt-1*0.37545
X1t= Xt- Xt-1*037545Z1t= Zt- Zt-1 *037545
Ta đc bảng số liệu mới như sau
Trang 20y1tx1tz1t9535639 640073.4 121520.2
9534573 762575.6 327516.69537186 762575.6 180061.99563073 729575.6 266473.49509836 822965.4 254448.2
Trang 21chạy eview ta đcTa có d=2.22554K=3 K’=2, n=29
Trang 22Nhìn vào phần trên của bảng kết quả ta có: Pvalue =0.5264
Với = 0,05 < 0.5264 → ta chấp nhận giả thiết cho rằng không có tự tương quan ở bậc 1, hay nói cách khác, ta kết luận không tồn tại hiện tượng tự tương quan bậc 1