A. LỜI MỞ ĐẦU B. LÝ THUYẾT I. Bản chất hiện tượng tự tương quan 1.1. Định nghĩa 1.2. Nguyên nhân của tự tương quan. 1.3. Hậu quả. II.Phát hiện có tự tương quan 2.1. Phương pháp đồ thị 2.2. Phương pháp kiểm định số lượng III. Khắc phục tự tương quan 3.1. Khi cấu trúc tự tương quan đã biết 3.2. Khi chưa biết ρ C. Thực hành trên phần mềm Eview I. Ước lượng mô hình II. Các phương pháp phát hiện tự tương quan 2.1. Phương pháp đồ thị 2.2. Phương pháp kiểm định III. Khắc phục hiện tượng tự tương quan 3.1. Khắc phục tự tương quan dựa trên thống kê d 3.2. Phương pháp Cochrane – Orcutt 3.3. Phương pháp Durbin – Watson 2 bước D.KẾT LUẬN
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC THƯƠNG MẠI
Trang 2STT Họ và Tên Mã sinh viên Đánh giá Chữ kí1
2
Trang 33
Trang 46
7
8
9
10
MỤC LỤC
A LỜI MỞ ĐẦU
B LÝ THUYẾT
I Bản chất hiện tượng tự tương quan
1.1 Định nghĩa
1.2 Nguyên nhân của tự tương quan
1.3 Hậu quả
II.Phát hiện có tự tương quan
2.1 Phương pháp đồ thị
Trang 52.2 Phương pháp kiểm định số lượng
III Khắc phục tự tương quan
3.1 Khi cấu trúc tự tương quan đã biết
3.2 Khi chưa biết ρ
C Thực hành trên phần mềm Eview
I Ước lượng mô hình
II Các phương pháp phát hiện tự tương quan
2.1 Phương pháp đồ thị
2.2 Pương pháp kiểm định
III Khắc phục hiện tượng tự tương quan
3.1 Khắc phục tự tương quan dựa trên thống kê d
3.2 Phương pháp Cochrane – Orcutt
3.3 Phương pháp Durbin – Watson 2 bước
D.KẾT LUẬN
A Lời mở đầu
Hiện tượng tự tương quan là hiện tượng mà không nhà nghiên cứu nào muốn xảy
ra trong quá trình nghiên cứu Tuy nhiên trong thực tế, hiện tượng này vẫn xảy ra khiến cho các phương pháp ước lượng cho kết quả sai lệch Bài thảo luận này sẽ giúp các bạn làm rõ, hiểu thêm về hiện tượng tương quan và cách khắc phục nó
B Lí thuyết
I Hiện tượng tự tương quan –Nguyên nhân và hậu quả
Trang 61.1 Định nghĩa
Tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo)
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có
sự tương quan giữa các nhiễu Ui
𝑐ov(U i , U j) = 0 ∀𝑖≠𝑗
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau Có nghĩa là hiện tượng tự tương quan sảy ra khi:
𝑐ov(U i , U j) =E (Ui.Uj) ≠0∀𝑖≠𝑗
1.2Nguyên nhân của tự tương quan.
- Quán tính – Tính chất phổ biến của các đại lượng kinh tế quan sát theo thời gian: trong hời quy của chuỗi thời gian, các quan sát kế tiếp có nhiều khả năng phụ thuộc lẫn nhau
- Hiện tượng mạng nhện
- Tính chất “ trễ ” của các đại lượng kinh tế
Trang 7- Phương pháp (kỹ thuật) thu thập và xử lý số liệu: việc xử lý số liệu thườngxảy ra sai sồ hệ thống trong các nhiễu ngẫu nhiên và gây ra tự tương quan.
- Sai lầm khi lập mô hình: Không đưa đủ các biến vào trong mô hình, dạng hàm sai gây ra hiện tượng tự tương quan
- Thống kê T và F không còn có ý nghĩa về mặt thống kê nên việc kiểm địnhcác giả thiết thống kê không còn đáng tin cậy nữa
- Các dự báo dựa trên các ước lượng bình phương nhỏ nhất không còn đáng tin cậy nữa
II Ước lượng bình phương nhỏ nhất khi có tự tương quan
Ta xét mô hình:
Y t = β1 + β2 X
t + U t (1.1)Trong đó: t ký hiệu quan sát ở thời điểm t (giả thiết ta đang nghiên cứu số liệu dạng chuỗi thời gian)
Với giả thiết tổng quát cov(Ut, Ut + s) ¿ 0 (s ¿ 0) Ta có thể giả thiết nhiễu sản sinh ra theo cách sau:
U t = ρ U t – 1 + εt (-1 < ρ < 1) (1.2)
Trong đó: ρ gọi là hệ số tự tương quan, εt là nhiễu ngẫu nhiên thoả mãn
các giả thiết thông thường của phương pháp bình phương nhỏ nhất:
Trang 8Là lược đồ tự hồi quy bậc 2 và ký hiệu AR (2).
Bằng phương pháp bình phương nhỏ nhất ta tính được:
Nhưng phương sai của nó rong lược đồ AR(1), bây giờ là:
Nếu không có tự tương quan thì:
Nếu ρ = 0 thì:
Trang 9Nếu tiếp tục dùng phương pháp OLS và điều chỉnh công thức phương sai thông thường bằng việc sử dụng lược đồ AR(1) thì không còn là ước lượng khôngc hệch tốt nhất nữa.
III Ước lượng tuyến tính không chệch tốt nhất khi có tự tương quan
Giả sử chúng ta xét mô hình 2 biến và có quá trình AR(1) bằng phương pháp bình phương nhỏ nhất tổng quát ta thu được :
IV Phát hiện tự tương quan
4.1 Phương pháp đồ thị:
Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổ điển gắn với các nhiễu tổng thể Ut không quan sát được Cái mà chúng ta có thể quan sát được là phần dư e t thu được từ phương pháp bình phương nhỏ nhất thông thường
Trang 10Mặc dù e t không hoàn toàn giống Ut nhưng quán sát các phần dư et có thể gợi cho ta những nhận xét về U t.
Có nhiều cách khác nhau để xem xét phần dư , chẳng hạn chúng ta có thể đơn thuần vẽ đồ thị e t như hình sau:
Nhìn vào đồ thị ta thấy phần dư không biểu thị một kiểu mẫu nào khi thời gian tăng lên Nó phân bố một cách ngẫu nhiên ít nhiều xung quanh trung bình của chúng nó ủng hộ cho giả thiêt không có sự tương quan trong mồ hình hồi quy tuyến tính cổ điển
Một cách khác là vẽ đồ thị các phần dư chuẩn hóa theo thời gian
Trang 11Các bước vẽ đồ thị:
- Bước 1: Ước lượng mô hình gốc thu được các phần dư et và et-1
- Bước 2: Vẽ đồ thị et hoặc et-1 theo thời gian hoặc và nhận xét
4.2 Phương pháp kiểm định số lượng:
4.1.1 Kiểm định các đoạn mạch:
Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xác định xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu có phải là kếtquả của một quá trình mang tính ngẫu nhiên hay không
Một đoạn mạch là một dãy các phần tử giống nhau mà ở sát trước và sát sau
là các phần tử khác chúng hoặc không có phần tử nào Chiều dài của một đoạn mạch là số phần tử của nó
Để xác định có bao nhiêu đoạn mạch là có thể chấp nhận được quá trình ngẫu nhiên, ta dùng một quy luật phân phối xác suất, quy luật này đưa đến tiêu chuẩn kiểm định cho ở dưới đây:
Ta đặt:
n: Tổng số quan sát( n=n1+n2 )
n1 : Số kí hiệu dương (số phần dư dương)
n2 : Sộ kí hiệu âm ( số phần dư âm)
N : Số mạch
Giả thiết kiểm định:
H0: Các kết cục kế tiếp nhau ( các phần dư là độc lập)
H1: Các phần dư không độc lập
Với giả thiết rằng n1 ≥ 10 và n1 ≥10, số đoạn mạch N có phân phối tiệm cận
chuẩn với trung bình E(N) và phương sai σ n2 được cho như sau:
Trang 12E(N) =
2 n1n2
n1+n2+1
σ2N=2 n1n2(2 n1n2−n1−n2) (n1+n2)²(n1+n2−1)
Độ lệch tiêu chuẩn:
√σ2N=√2n1n2(2n1n2−n1−n2)
(n1−n2)² (n1−n2−1)
4.2.2 Kiểm định χ 2 về tính độc lập của các phần dư
Để kiểm định χ ² về tính độc lập của các phần dư ta sử dụng bảng tiếp liên.Bảng tiếp liên mà chúng ta sử dụng ở đây gồm một số dòng và một số cột, cụthể là bảng tiếp liên 2 dòng 2 cột Các dòng ứng với các phần dư dương và âm tại
t còn các cột ứng với các phần dư dương và âm tại t-1 Trong mỗi ô ta tính Aij và (Bij) trong đó:
Trang 13Ô cuối cùng của bảng ghi kích thước mẫu n Bảng tiếp liên 2 dòng 2 cột có dạng:
Số phần dư dương tại t
Sốphầndưâmtại t
A12(E12)A22(E22)
H1: Hàng và cột không độc lập với nhau
Tiêu chuẩn kiểm định χ ² cho tập hợp các giả thiết này là
Nếu giả thiết HO đúng tức là các phần dư có phân bổ độc lập thì thống kê
χ ² đã nói ở trên sẽ có phân bố χ ², với bậc số tự do là df= (2-1)(2-1) = 1
Trang 14Quy tắc ra quyết định là nếu giá trị của thống kê χ ² đã tính được vượt quágiá trị χ ² tới hạn với 1 bậc tự do ở một mức ý nghĩa cho trước (chẳng hạn α=5•) thì ta có thể bác bỏ giả thiết Ho về tính độc lập của các phần dư, ngược lại
TínhEij: kếtquảkỳvọngcủa ô (ij)
Nếugiảthiết HO là đúngthìcáchàngvàcộtđộclậpvớinhauvà khi đó
n Thay thế các giá trị này vào các
Pi và Pj để tính kì vọng của ô(ij) ta được:
Eij=
Rj.Cj n 4.2.3Kiểm định d của Durbin – Watson:
Phương pháp kiểm định có ý nghĩa nhất để phát hiện ra tự tương quan là kiểm địnhd của Durbin-Watson
Trang 15Thống kê d của Durbin-Watson được định nghĩa như sau :
là tỷ số giữa tổng bình phương sai lệch của các phần dư kế tiếp nhau với RSS.Lưu ý trên tử số của thống kê d số quan sát là n-1 vì một quan sát bị mất đi khi lấy
ký hiệu các quan sát kế tiếp:
Người ta đã chứng minh khi n đủ lớn thì:
d ≈ 2(1- ρ ^ ) (23)
Trong đó:
là một ước lượng của hệ số tương quan ρ Vì -1≤ ρ ≤ 1 nên taĐây là các biến cho d, bất cứ giá trị nào của d ước lượng được phải nằm tronggiới hạn này
Từ phương trình (23) ta thấy rằng: ρ ^ = 0 → d ≈ 2, tức là nếu không tồn tại
e t2
Trang 16tương quan chuỗi thì d được kỳ vọng là 2 Do đó theo quy tắc ngón tay cái nếu d
gần bằng 2 thì có thể giả định rằng không có tự tương quan bậc nhất Nếu ρ ^ = +
1 nghĩa là có tương quan dương hoàn hảo trong phần dư thì d ≈ 0 Do đó d càng gần
0 thì càng chứng tỏ có sự tương quan thuận chiều
Nếu d = - 1 thì có sự tương quan ngược chiều hoàn hảo giữa các phần tử dư
kế tiếp nhau và khi đó d ≈ 4 Vì vậy d càng gần 4 thì càng chứng tỏ có sự tương quan chuỗi ngược chiều Nếu các giả thiết của kiểm định d thoả mãn thì có thể trình bày quy tắc ra quyết định như sau:
Trang 17Chấp nhận giả thiết không có tương quan chuỗi bậc nhất dương hoặc âm
nghĩa là có tương quan ngược chiều ( âm)
quan dương hoặc âm
Bảng 2 Kiểm định d - Durbin-Watson Quy tắc ra quyết định
0 dL dU24 – dU4 – dL4
Ước lượng hồi quy bằng phương pháp OLS thông thường và thu được phần dư et
Trang 18 Tính giá trị của thống kê d theo công thức
Với cỡ mẫu đã cho n và số biến giải thích, tìm các giá trị tới hạn dU và dL được cho trong bảng giá trị d (phụ lục)
Theo các quy tắc ra quyết định đã cho trong bảng :
Nếu giá trị của d thuộc miền không có quyết định, tức ta không thể kết luận
có tự tương quan hay không Khi đó ta kết kuận như thế nào? Để giải quyết vấn đề này đã có một số cải biên kiểm định d Dưới đây là quy tắc kiểm định cải biên thường được áp dụng để kiểm tự tương quan bậc nhất
1.H0: ρ ^ = 0; H1: ρˆ > 0 Nếu d < dL thì bác bỏ H0 và chấp nhận H1 (với
mức ýnghĩa α), nghĩa là có tự tương quan dương
2.H0: ρ ^ = 0; H1: ρˆ < 0 Nếu (4-d) < dL thì bác bỏ giả thiết H0, nghĩa là có
tựtương quan âm
3.H0: ρ ^ = 0; H1: ρˆ ≠ 0 Nếu d < dU hoặc (4-d) < dU thì bác bỏ giả thiết H0
chấp nhận H1 (với mức ý nghĩa 2α), tức là có tự tương quan (dương hoặc âm)
4.2.4 Kiểm định Breusch – Godfrey (BG)
Để đơn giản ta xét mô hình giản đơn: Yt = β1+ β2Xt+ Ut
Trong đó: Ut = ρ1Ut−1+ ρ2Ut−2+ +ρpUt− p+ εt , εt thoả mãn các giả
thiết của OLS
Giả thiết: H0 : ρ1= ρ2= =ρp=0
Kiểm định như sau:
Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS Từ đó thu được các phần dư et
Bước 2: Ước lượng mô hình sau đây bằng phương pháp OLS:
Trang 19et = β1+ β2Xt+ ρ1et−1+ ρ2et−2+ +ρpet− p+ vt
Từ kết quả ước lượng mô hình này thu được R2
Bước 3: Với n đủ lớn, (n - p)R2 có phân bố xấp xỉ χ2 (p).
Nếu (n - p)R2> χ α2 (p) thì H0 bị bác bỏ, nghĩa là ít nhất tồn tại tự tương quan một bậc nào đó Trong trường hợp ngược lại không tồn tại tự tương quan
Trang 20- Quy tắc quyết định: vì h ≈ N(0,1) nên P(-1,96 ≤ h ≤ 1,96) = 0,95
V.Khắc phục hiện tượng tự tương quan
Khi mô hình có hiện tượng tự tương quan thì các suy diễn thống kê là không đáng tin cậy.Do đó nếu từ các phương pháp nêu trên,chúng ta phát hiện ra
mô hình có tự tương quan thì sẽ cần các biện pháp khắc phục
5.1 Khi cấu trúc của tự tương quan là đã biết
Vì các nhiễuU t không quan sát được nên tính chất của tương quan chuỗi thường là vấn đề suy đoán hoặc là do những đòi hỏi cấp bách của thực tiễn Trongthực hành, người ta thường giả sử U t theo mô hình hồi quy bậc nhất:
U t = ρ U t −1 + ε t (*) Trong đó: hệ số tự tương quan, |ρ|<1
Trang 21ε t: sai số ngẫu nhiên(nhiễu trắng)thỏa mãn các giả định của OLS :
Phương trình (*) gọi là phương trình sai phân tổng quát
Vì ε t thỏa mãn các giả định của phương pháp OLS nên các ước lượng tìm được là BLUE hay không bị ảnh hưởng bởi tự tương quan
5.2 Khi ρ đã biết
5.2.1 Phương pháp sai phân cấp 1
Như ta đã biết -1≤ ρ≤1 nên:
-Nếu ρ =0 tức là không có tương quan chuỗi
Trang 22-Nếu ρ=1 thì mô hình (1) có tự tương quan dương hoàn hảo,khi đó mô hình (*) trở thành mô hình sai phân cấp 1:
Trang 23Lưu ý:để biết phương pháp Cochrane-Orcutt đã khắc phục được hiện tượng
tự tương quan hay chưa,ta phải thực hiện kiểm định BG để kiểm tra lại
Trang 245.3.4 Thủ tục Cochrane-Orcutt hai bước
-Bước 1:ước lượngρ từ bước lặp dầu tiên nghĩa là phép hồi quy mô hình 3 biến
-Bước 2: sử dụng ước lượng của ρ để ước lượng phương trình sai phân tổng quát
5.3.5 Phương pháp Durbin-Watson 2 bước để ước lượng:
Phương trình sai phân tổng quát:
Nghiên cứu tình hình phát triển sản xuất trong khu vực công nghiệp của Việt Nam từ năm 1980 đến 2000 Ta có bảng số liệu sau:
Trang 262000 1994.200 50.10000 58.90000Trong đó:
Y: Tổng sảnlượng (triệutấn)
X: Tổng lực lượng laođộng (nghìnngười)
Z: Tổngvốnđầutư (tỷđồng)
1 Ước lượng mô hình hồi quy trên ượng mô hình hồi quy trên c l ng mô hình h i quy trên ồi quy trên
1.1T o m t file trong eview và nh p s li u ạo một file trong eview và nhập số liệu ột file trong eview và nhập số liệu ập số liệu ố liệu ệu
T menu chính, ch n File/ New/ Workfile.ừ menu chính, chọn File/ New/ Workfile ọn File/ New/ Workfile
Sẽ xu t hi n b ng Workfile Create:ất hiện bảng Workfile Create: ện bảng Workfile Create: ảng Workfile Create:
Trang 27Trong Frequency ch n Annual Nh p th i đi m b t đ u( Start date): 1980 ọn File/ New/ Workfile ập thời điểm bắt đầu( Start date): 1980 ời điểm bắt đầu( Start date): 1980 ểm bắt đầu( Start date): 1980 ắt đầu( Start date): 1980 ầu( Start date): 1980
và th i đi m k t thúc( End date): 2000ời điểm bắt đầu( Start date): 1980 ểm bắt đầu( Start date): 1980 ết thúc( End date): 2000 OK T c a s chính Eviews, ch n ừ menu chính, chọn File/ New/ Workfile ửa sổ chính Eviews, chọn ổ chính Eviews, chọn ọn File/ New/ Workfile.Quick/Empty Group
Nh n mũi tên lên c a bàn phím đ nh p tên các bi n X, Y, Z vào hàng th ất hiện bảng Workfile Create: ủa bàn phím để nhập tên các biến X, Y, Z vào hàng thứ ểm bắt đầu( Start date): 1980 ập thời điểm bắt đầu( Start date): 1980 ết thúc( End date): 2000 ứ
nh tất hiện bảng Workfile Create: nh p s li u tập thời điểm bắt đầu( Start date): 1980 ố liệu tương ứng cho từng biến ện bảng Workfile Create: ương ứng cho từng biếnng ng cho t ng bi nứ ừ menu chính, chọn File/ New/ Workfile ết thúc( End date): 2000 đóng c a s Group l iửa sổ chính Eviews, chọn ổ chính Eviews, chọn ại Yes
Trang 281.2 Ước lượng mô hình hồi quy trên ượng mô hình hồi quy trên c l ng mô hình h i quy trên: ồi quy trên
T c a s chính c a Eviews, ch n Quick/Estimate Equation , T i c a s ừ menu chính, chọn File/ New/ Workfile ửa sổ chính Eviews, chọn ổ chính Eviews, chọn ủa bàn phím để nhập tên các biến X, Y, Z vào hàng thứ ọn File/ New/ Workfile ại ửa sổ chính Eviews, chọn ổ chính Eviews, chọn Equation Estimation nh p vào Y C X Z r i OK ập thời điểm bắt đầu( Start date): 1980 ồi OK
Trang 29Ta được bảng kết quả của phương pháp ước lượng bình phương nhỏ nhất c b ng k t qu c a phảng Workfile Create: ết thúc( End date): 2000 ảng Workfile Create: ủa bàn phím để nhập tên các biến X, Y, Z vào hàng thứ ương ứng cho từng biếnng pháp ước lượng bình phương nhỏ nhất ược bảng kết quả của phương pháp ước lượng bình phương nhỏ nhất c l ng bình phương ứng cho từng biếnng nh nh t ỏ nhất ất hiện bảng Workfile Create:sau:
Trang 302 Phát hi n hi n t ệu ệu ượng mô hình hồi quy trên ng t t ự tương quan: ương quan: ng quan:
2.1Ph ương quan: ng pháp đ th : ồi quy trên ị:
T c a s Equation, ch n View/ Actual, Fitted, Residual/ Actual, Fitted, ừ menu chính, chọn File/ New/ Workfile ửa sổ chính Eviews, chọn ổ chính Eviews, chọn ọn File/ New/ Workfile.Residual Table
Trang 31Ta được bảng kết quả của phương pháp ước lượng bình phương nhỏ nhất c: Residual= ei và đ th ph n d :ồi OK ị phần dư: ầu( Start date): 1980 ư
Trang 32T c a s Equation, ch n Proc/Make Residual Seriesừ menu chính, chọn File/ New/ Workfile ửa sổ chính Eviews, chọn ổ chính Eviews, chọn ọn File/ New/ Workfile.
C a s Make Residuals hi n ra, nh p tên cho ph n d là “E”:ửa sổ chính Eviews, chọn ổ chính Eviews, chọn ện bảng Workfile Create: ập thời điểm bắt đầu( Start date): 1980 ầu( Start date): 1980 ư