Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo).Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu Ui nghĩa là:Cov(Ui , Uj ) = 0 (i j) (7.1)Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác.Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:Cov(Ui , Uj ) 0 (i j) (7.2)
Trang 1BÀI THẢO LUẬN MÔN: KINH TẾ LƯỢNG
ĐỀ TÀI : Phát hiện và khắc phục hiện tượng tự tương quan.
MỤC LỤC
I Lý thuyết
1 BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN 3
1.1.Định nghĩa 3
1.2.Nguyên nhân của sự tương quan 3
1.2.1 Nguyên nhân khách quan 3
1.2.2 Nguyên nhân chủ quan 4
1.3.Ước lượng bình phương nhỏ nhất khi có sự tương quan 5
1.4.Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan 6
1.5.Hậu quả 7
2 PHÁT HIỆN CÓ TỰ TƯƠNG QUAN 8
2.1 Phương pháp đồ thị
2.2 Phương pháp kiểm định số lượng
2.2.1 Kiểm định các đoạn mạch
2.2.2 Kiểm định về tính độc lập của các phần dư
2.2.3 Kiểm định d.Dubin – Watson
Trang 22.2.4 Kiểm định Breusch – Godfrey (BG)
2.2.5 Kiểm định Durbin h
2.2.6 Phương pháp khác: Kiểm định Correlogram
3 BIỆN PHÁP KHẮC PHỤC
3.1 Khi cấu trúc của tự tương quan là đã biết
3.2 Khi chưa biết
II THỰC HÀNH
1 Thu thập số liệu
2 Phát hiện tự tương quan
3 Khắc phục tự tương quan
1 BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN
1.1 Định nghĩa
Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo)
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không
có sự tương quan giữa các nhiễu Ui nghĩa là:
Cov(Ui , Uj ) = 0 (ij) (7.1) Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov(Ui , Uj ) 0 (ij) (7.2)
Trang 31.2 Nguyên nhân của tự tương quan
1.2.1 Nguyên nhân khách quan
- Quán tính:
Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính.Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thấtnghiệp mang tính chu kỳ Chẳng hạn nếu chúng ta ở đầu của thời kỳ khôiphục kinh tế tổng sản phẩm có xu hướng đi lên Vì vậy trong hồi quy củachuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫnnhau
- Hiện tượng mạng nhện:
Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởngbởi giá mua lạc năm ngoái của các công ty xuất khẩu Cho nên cung về lạc cóbiểu hiện dưới dạng hàm:
Y t = 1 + 2P t – 1 + U t (7.3)
Giả sử ở cuối thời kỳ t giá lạc Pt < Pt – 1 , do đó trong thời kỳ t + 1 nhữngngười nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t Điều này sẽdẫn đến mô hình mạng nhện
- Trễ:
Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập,chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vàothu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩalà:
Y t = 1 + 2X t + 3Y t – 1 + U t (7.4)Trong đó: Yt: Tiêu dùng ở thời kỳ t
Xt: Thu nhập ở thời kỳ t
Trang 41.2.2 Nguyên nhân chủ quan
- Xử lý số liệu:
Trong phân tích thực nghiệm, số liệu thô thường được xử lý Chẳng hạntrong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thườngđược suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo thángrồi chia cho 3 Việc lấy trung bình này làm trơn các số liệu và làm giảm sựdao động trong số liệu tháng Chính sự làm trơn này gây ra tự tương quan
- Sai lệch do lập mô hình:
Đây là nguyên nhân thuộc về lập mô hình Có hai loại sai lầm có thể gây
ra hiện tượng tự tương quan:
Một là: không đưa đủ các biến vào trong mô hình
Hai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan
1.3 Ước lượng bình phương nhỏ nhất khi có tự tương quan
Ta xét mô hình:
Y t = 1 + 2X t + U t (7.5)Trong đó: t ký hiệu quan sát ở thời điểm t (giả thiết ta đang nghiên cứu
số liệu dạng chuỗi thời gian)
Trang 5Với giả thiết tổng quát cov(Ut, Ut + s) 0 (s 0) Ta có thể giả thiếtnhiễu sản sinh ra theo cách sau:
) 0 ( 0 ) , cov(
0 ) (
Là lược đồ tự hồi quy bậc 2 và ký hiệu AR(2)
Bằng phương pháp bình phương nhỏ nhất ta tính được:
n i i i
x
y x
1 2
1 2
ˆ
Nhưng phương sai của nó trong lược đồ AR(1), bây giờ là:
Nếu không có tự tương quan thì:
Trang 6Ta thấy: cộng với một số hạng phụ thuộc vào ρ Nếu ρ = 0 thì:
Nếu tiếp tục dùng phương pháp OLS và điều chỉnh công thức phương saithông thường bằng việc sử dụng lược đồ AR(1) thì không còn là ướclượng không chệch tốt nhất nữa
1.4 Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan
Giả sử chúng ta tiếp tục xét mô hình 2 biến và có quá trình AR(1) bằngphương pháp bình phương nhỏ nhất tổng quát đã xét từ ở chương trước ta thuđược:
C x
x
y y x x
n t
t t
n t
t t t t G
2
1 2
) (
) )(
Trong đó C là hiệu số điều chỉnh có thể bỏ qua trong thực tế
Và phương sai của nó được cho bởi công thức:
2 1
Trang 7- Phương sai ước lượng được của các ước lượng bình phương nhỏ nhấtthông thường là chệch và thông thường là thấp hơn giá trị thực của phươngsai, do đó giá trị của thống kê T được phóng đại lên nhiều lần.
- Các kiểm định t và F nói chung không đáng tin cậy
- R2 có thể là độ đo không đáng tin cậy cho R2 thực
- Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng cóthể không hiệu quả
2,PHÁT HIỆN CÓ TỰ TƯƠNG QUAN
2.1 Phương pháp đồ thị
Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổđiển gắn với các nhiễu Ut , nhưng không quan sát được, ta chỉ có thể quansát các phần dư et Mặc dù et không hoàn toàn giống như Ut nhưng quan sátcác phần dư et có thể gợi ý cho ta những nhận xét về Ut
Có nhiều cách khác nhau để xem xét các phần dư Chẳng hạn chúng
ta có thể đơn thuần vẽ đồ thị của et theo thời gian như hình dưới:
Nhìn vào đồ thị, ta thấy phần dư không biểu thị một kiểu mẫu nào khi thời gian tăng lên, nó phân bố một cách ngẫu nhiên xung quanh trung bình của
Trang 8chúng → Nó ủng hộ cho giả thiết không có sự tương quan trong mô hình hồi quy tuyến tính cổ điển.
Nếu đồ thị của phần dư như hình dưới: ta thấy có xu thế tuyến tính, tăng hoặcgiảm trong các nhiễu → Nó ủng hộ cho giả thiết có sự tương quan trong mô hình hồi quy tuyến tính cổ điển
Một cách khác là vẽ đồ thị của phần dư chuẩn hoá theo thời gian
2.2 Phương pháp kiểm định số lượng
2.2.1 Kiểm định các đoạn mạch
Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xácđịnh xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu cóphải là kết quả của một quá trình mang tính ngẫu nhiên hay không
2.2.2 Kiểm định 2 về tính độc lập của các phần dư
Để kiểm định 2 về tính độc lập của các phần dư ta sử dụng bảng liêntiếp Bảng liên tiếp mà chúng ta sử dụng ở đây gồm một số dòng và một sốcột, cụ thể là bảng liên tiếp 2 dòng và 2 cột
2.2.3 Kiểm định d.Durbin – Watson
Là kiểm định dựa vào giá trị tính toán, thống kê d được định nghĩa nhưsau:
Trang 9n t
t t
e
e e
1 2 2
2
1 ) (
(7.10)
d 2(1 - ˆ ) (7.11)Trong đó:
n t t t
e
e e
1 2 2
1
Vì -1 1 nên 0 d 4
Nếu = -1 thì d =4: tự tương quan ngược chiều
Nếu = 0 thì d = 2: không có tự tương quan
Nếu = 1 thì d = 0: tồn tại tự tương quan thuận chiều
d (5): tồn tại tự tương quan ngược chiều
Kiểm định Durbin – Watson chỉ nhận dạng được hiện tượng tương quan chuỗi bậc 1 Đôi khi Kiểm định Durbin – Watson không cho kết luận
2.2.4 Kiểm định Breusch – Godfrey (BG)
Để đơn giản ta xét mô hình giản đơn: Y t = 1 2X t U t
Trong đó: U t = 1U t1 2U t2 p U tp t, t thoả mãn các giả thiếtcủa OLS
Trang 10Giả thiết: H 0 : 1 2 p 0
Kiểm định như sau:
Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS Từ đó thu
được các phần dư et
Bước 2: Ước lượng mô hình sau đây bằng phương pháp OLS:
e t = 1 2X t 1e t1 2e t2 p e tp v t
Từ kết quả ước lượng mô hình này thu được R2
(p).
Nếu (n - p)R2 > 2
quan một bậc nào đó Trong trường hợp ngược lại không tồn tại tự tươngquan
1 nVar 2
n
(7.13)Trong đó n là cỡ mẫu, Var( ˆ 2) là phương sai của hệ số của biến trễ Yt-1
ˆ là ước lượng của tương quan chuỗi bậc nhất từ phương trình:
n t t t
e
e e
1 2 2
1
ˆ
Khi n lớn, Durbin đã chỉ ra rằng nếu = 0 thì thống kê h tuân theophân phối chuẩn hoá – N(0,1)
Trang 11Trong thực hành không cần tính ˆ vì ˆ có thể tính được xấp xỉ bằngcông thức:
2 1
) ˆ (
1 nVar 2
n
Vậy để áp dụng thống kê h phải:
- Ước lượng mô hình Y t = 0 1X t 2Y t1V t bằng phương pháp bìnhphương bé nhất
- Tính Var( ˆ 2)
- Tính ˆ 1 d2
- Tính h theo công thức h )
2 1 ( d
) ˆ (
1 nVar 2
n
- Quy tắc quyết đinh: Vì h N(0,1) nên P(-1,96 h 1,96) = 0,95
kinh tế lượng – biên soạn: ThS Hoàng Thị Hồng Vân)
Một phương pháp khác giúp nhận dạng AR là kiểm định Q Để thựchiện kiểm định này chúng ta cần xem xét một khái niệm “tự tương quan”(AutoCorrellation – AC)
Giả thuyết kiểm định:
Trang 12Trị số thống kê kiểm định (Box-Lung):
3.1 Khi cấu trúc của tự tương quan là đã biết
Vì các nhiễu U t không quan sát được nên tính chất của tương quanchuỗi thường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thựctiễn Trong thực hành, người ta thường giả sử rằng U t theo mô hình tự hồiquy bậc nhất nghĩa là:
t t
t U
U 1 (7.15)Trong đó 1 và t thoả mãn các giả thiết của phương pháp bìnhphương nhỏ nhất thông thường nghĩa là: Trung bình bằng 0, phương saikhông đổi và không tự tương quan Giả sử (7.15) là đúng thì vấn đề tươngquan chuỗi có thể được giải quyết thoả đáng nếu hệ số tự tương quan là đãbiết Để làm sáng tỏ vấn đề đó ta quay lại mô hình hai biến:
t t
t X U
Y 1 2 (7.16)Nếu (7.16) đúng với t thì cũng đúng với t – 1 nên:
1 1 2 1
2 1
Trang 13Từ (7.16) cho (7.18) ta được:
t t t
t t t
t t
t
X X
U U X
X Y
) 1 (
) (
) (
) 1 (
1 2
1
1 1
2 1
1
(7.19)Đặt * 1( 1 )
Y* 1* 2* * (7.20)
Vì t thoả mãn các giả thiết của phương pháp bình phương nhỏ nhấtthông thường đối với các biến Y* và X* và các ước lượng tìm được có tất cảcác tính chất tối ưu nghĩa là ước lượng tuyến tính không chệch tốt nhất
Phương trình hồi quy (7.19) được gọi là phương trình sai phân tổng quát
3.2 Khi chưa biết
3.2.1 Phương pháp sai phân cấp 1
Như ta đã biết 1 1 nghĩa là nằm giữa (-1,0) hoặc (0,1) cho nênngười ta có thể bắt đầu từ các giá trị ở các đầu mút của các khoảng đó Nghĩa
là ta có thể giả thiết rằng:
0 tức là không có tương quan chuỗi
1 nghĩa là có tương quan dương hoặc âm hoàn toàn
Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng không
có tự tương quan rồi sau đó tiến hành kiểm định Durbin – Watson hay cáckiểm định khác để xem giả thiết này có đúng hay không Tuy nhiên nếu
t t
t t
t Y X X U U X X
Hay Y t 2X t t (7.21)
Trang 14Trong đó là toán tử sai cấp 1 Để ước lượng hồi quy (7.21) thì cầnphải lập các sai phân cấp 1 của biến phụ thuộc và biến giải thích và sử dụngchúng làm những đầu vào trong phân tích hồi quy.
Giả sử mô hình ban đầu là:
t t
t X t U
Y 1 2 3 (7.22)
Trong đó t là biến xu thế còn U t theo sơ đồ tự hồi quy bậc nhất
Thực hiện phép biến đổi sai phân cấp 1 đối với (7.22) ta đi đến
t t
Y 1 2 1 2( 1)
Hay 2 2 1 2
2 1
Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trongkinh tế lượng ứng dụng vì nó dễ thực hiện
3.2.2 Ước lượng dựa trên thống kê d – Durbin – Watson
Trong phần kiểm định d chúng ta đã thiết lập được các công thức:
) 1 (
2
Hoặc ˆ 1 d2 (7.26)
Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của
từ thống kê d Từ (7.24) chỉ ra rằng giả thiết sai phân cấp 1 với 1 chỉđúng khi d =0 hoặc xấp xỉ bằng không Cũng vậy khi d = 2 thì ˆ 0 và khi d
Trang 15= 4 thì ˆ 1 Do đó thống kê d cung cấp cho ta một phương pháp sẵn có đểthu được ước lượng của
Nhưng lưu ý rằng quan hệ (7.26) chỉ là quan hệ xấp xỉ và có thể khôngđúng với các mẫu nhỏ
Khi đã được ước lượng thì có thể biến đổi tập số liệu như đã chỉ ra ở(7.20) và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thôngthường Khi ta sử dụng một ước lượng thay cho giá trị đúng, thì các hệ số ướclượng thu được từ phương pháp bình phương nhỏ nhất có thuộc tính tối ưuthông thường chỉ tiệm cận có nghĩa là có thuộc tính đó trong các mẫu lớn Vìvậy trong các mẫu nhỏ ta phải cẩn thận trong khi giải thích các kết quả ướclượng
3.2.3 Thủ tục lặp Cochrane – Orcutt để ước lượng
Phương pháp này sử dụng các phần dư et đã được ước lượng để thu đượcthông tin về chưa biết
Ta xét phương pháp này thông qua mô hình hai biến sau:
t t
t X U
Y 1 2 (7.27)Giả sử Ut được sinh ra từ lược đồ AR(1) cụ thể là
t t
t U
U 1 (7.28)Các bước tiến hành như sau:
Bước 1: Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhất
thông thường và thu được các phần dư et
Bước 2: Sử dụng các phần dư đã ước lượng để ước lượng hồi quy:
e t ˆe t1 v t (7.29)
tổng quát (7.29) cụ thể là phương trình:
Trang 16Y t ˆY t1 1( 1 ) 2(X t ˆX t1) (U t ˆU t1)
* 2 1
* 1 1
* ˆ t ; ( 1 ˆ );
t Yt Y Y
Ta ước lượng hồi quy (7.30)
* * *
2
* 1
*
t t
t X e
Y (7.30)
lượng tốt nhât của hay không, ta thế giá trị ˆ* ˆ1( 1 )
và *
2 ˆ
thu được từ(7.30) vào hồi quy gốc ban đầu (7.27) và thu được các phần dư mới chẳnghạn e**
e t Yt *X t
2
* 1
ˆ (7.31)Các phần dư có thể tính dễ dàng
Ước lượng phương trình hồi quy tương tự với (7.29)
e t* ˆˆe t*1 Wt (7.32)
ˆˆ là ước lượng vòng 2 của
Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của khácnhau một lượng rất nhỏ chẳng hạn bé hơn 0,01 hoặc 0,005
3.2.4 Thủ tục Cochrane – Orcutt hai bước
Đây là một kiểu rút gọn quá trình lặp Trong bước 1 ta ước lượng từbước lặp đầu tiên nghĩa là từ phép hồi quy (7.27) và trong bước 2 ta sử dụngước lượng của để ước lượng phương trình sai phân tổng quát
3.2.5 Phương pháp Durbin – Watson 2 bước để ước lượng
Để minh hoạ phương pháp này chúng ta viết lại phương trình sai phântổng quát dưới dạng sau:
t t t
t
Y 1 ( 1 ) 2 2 1 1 (7.33)Durbin đã đề xuất thủ tục 2 bước để ước lượng :
Trang 17Bước 1: Coi (7.33) như là một mô hình hồi quy bội, hồi quy Yt theo Xt, Xt-1
và Yt-1 và coi giá trị ước lượng được của hệ số hồi quy của Yt-1 (= ˆ) là ướclượng của Mặc dù là ước lượng chệch nhưng ta có ước lượng vững của
Như vậy theo phương pháp này thì bước 1 là ước lượng còn bước 2 là
để thu được các ước lượng tham số
3.2.6 Các phương pháp khác ước lượng
Ngoài các phương pháp để ước lượng đã trình bày ở trên còn có một
số phương pháp khác nữa Chẳng hạn ta có thể dùng phương pháp hợp lý cựcđại để ước lượng trực tiếp các tham số của (7.33) mà không cần dùng đếnmột số thủ tục lặp đã thảo luận Nhưng phương pháp ước lượng hợp lý cựcđại liên quan đến thủ tục ước lượng phi tuyến (đối với các tham số) và thủ tụctiềm kiếm của Hildreth – Lu nhưng thủ tục này tốn nhiều thời gian và khônghiệu quả so với phương pháp ước lượng hợp lý cực đại nên ngày nay khôngđược dùng nhiều
II Phần thực hành nhóm
1, thu thập và giải thích số liệu
Trang 19 Y: Biến phụ thuộc - tỷ xuất gia tăng dân số (%)
X: Biến giải thích - tỷ xuất xuất cư (%)
Z: Biến giải thích - tỷ xuất nhập cư
Ta lựa chọn dạng mô hình hồi quynhư sau:
Y = β1 + β2X+ β3Z
Bước 1 : tạo một file mới trong eviews