khắc phục hiện tượng tự tương quan
Đề tài: Khắc phục hiện tượng tự tương quan. Phụ lục Phần 1 Bản chất hiện tượng tự tương quan ……………………………………………………… 1.1 Định nghĩa ……………………………………………………………………………………. 1.2 Nguyên nhân của tự tương quan………………………………………………………………. - Nguyên nhân khách quan………………………………………………………………………… - Nguyên nhân chủ quan…………………………………………………………………………… 1.3 Hậu quả……………………………………………………………………………………… . Phần 2: Phát hiện có tự tương quan……………………………………………………………… 2.1 Phương pháp đồ thị ……………………………………………………………………………. 2.2 Phương pháp kiểm định số lượng …………………………………………………………… . 2.2.1 Kiểm định đoạn mạch ………………………………………………………………………. 2.2.2 Kiểm định χ2 về tính độc lập của các phần dư ………………………………. 2.2.3 Kiểm định d …………………………………………………………………………………. 2.2.4 Kiểm định BG ………………………………………………………………………………. 2.2.5 Kiểm định Durbin h …………………………………………………………………………. Phần 3: Biện pháp khắc phục …………………………………………………………………… 3.1 Khi cấu trúc tự tương quan đã biết ……………………………………………………………. 3.2 Khi tự tương quan chưa biết ………………………………………………………………… . 3.2.1 Phương pháp sai phân cấp một ……………………………………………………………… 3.2.2 Ước lương ρ dựa trên thống kê d-Durbin-Watson …………………………………………. 3.2.3 Thủ tục lặp Cochrance-Orcutt để ước lượng ρ …………………………………………… 3.2.4 Thủ tục Cochrance-Orcutt 2 bước ………………………………………………………… 3.2.5 Phương pháp Durbin-Watson 2 bước để ước lượng ρ ………………………………………. 3.2.6 Các phương pháp khác để ước lượng ρ …………………………………………………… . Phần 4: Bài tập thực hành trên eveiw …………………………………………………………… 1. Ước lượng mô hình hồi quy trên ……………………………………………………………… . 2. Phát hiện hiện tượng tự tương quan ……………………………………………………………. 3. Khắc phục hiện tượng tự tương quan ………………………………………………………… . LỜI MỞ ĐẦU Một trong các giả thuyết của mô hình hồi quy tuyến tính cổ điển là không có sự tương quan hay tương quan chuỗi các nhiễu trong hàm hồi quy tổng thể. Nhưng trong thực tế liệu hiện tượng đó có xảy ra hay không? Nguyên nhân của hiện tượng đó là gì? Nếu có hiện tượng tự tương quan thì liệu có còn áp dụng được phương pháp bình phương bé nhất nữa hay không? Làm thế nào đẻ biết hiện tượng tự tương quan có xảy ra hay không? Làm thế nào để biết rằng hiện tượng tự quan xảy ra? Cách khắc phục như thế nào? . Đó là một loạt các câu hỏi mà chúng tôi sẽ giải đáp trong bài thảo luận này. Phần 1. Bản chất hiện tượng tự tương quan. 1.1 Định nghĩa Thuật ngữ tự tương quan có thể được định nghĩa như là quan hệ tương quan giữa các thành phần của chuỗi của các quan sát được sắp xếp theo thời gian (như trong dữ liệu chuỗi thời gian) hoặc không gian (như trong dữ liệu chéo). Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thuyết rằng không có sự tương quan giữa các nhiễu U i nghĩa là: Cov(U i , U j ) = 0 (i ≠ j) Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là: Cov(U i , U j ) ≠ 0 (i ≠ j) 1.2 Nguyên nhân của tự tương quan Tại sao có tự tương quan, liệu điều đó có xảy ra trong thực tế hay không? Có thể trình bày tóm tắt các nguyên nhân của tự tương quan là như sau: 1.2.1 Nguyên nhân khách quan • Quán tính: Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính. Chúng ta đều biết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất nghiệp mang tính chu kỳ. chẳng hạn chúng ta ở đầu của thời kỳ khôi phục kinh tế, tổng sản phẩm có xu hướng đi lên. Trong quá trình biến động này, giá trị của chuỗi ở mỗi thời điểm sau lại cao hơn giá trị của nó ở thời điểm trước. Vì vậy trong hồi quy của chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau. • Hiện tượng mạng nhện: Người ta thấy rằng việc cung nhiều mặt hàng nông sản biểu hiện tượng “mạng nhện”, trong đó cung về các hàng hóa phản ứng lại với giá có trễ một khoảng thời gian, bởi vì các quyết định cung phải mất một thời gian để thực hiện, người ta gọi đó là thời kỳ thai nghén. Chẳng hạn vào đầu vụ trồng lạc năm nay, người nông dân bị ảnh hưởng bởi giá mua lạc năm ngoái của các công ty xuất khẩu. Cho nên cung về lạc có biểu diễn dưới dạng hàm: Y t = β 1 + β 2 P t-1 + U t Giả sử ở cuối thời kỳ t giá lạc P t < P t-1 , do đó trong thời kỳ t+1 những người nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t. rõ ràng trong trường hợp đó, ta không mong đợi các nhiễu U i là ngẫu nhiên, có lẽ nông dân sẽ giảm sản xuất ở năm t+1… Điều này sẽ dẫn đến mô hình mạng nhện. • Trễ: Trong phân tích hồi quy chuỗi thời gian, chúng ta có thể có gặp hiện tượng biến phụ thuộc ở thời kỳ t phụ thuộc vào chính biến đó ở thời kỳ t-1 và các biến khác. Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào thu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩa là: Y t = β 1 + β 2 X i + β 3 Y t-1 + U t (1.2) Trong đó: Y t : tiêu dùng ở thời kỳ t. X t : thu nhập ở thời kỳ t. Y t-1 : tiêu dùng ở thời kỳ t-1. U t : nhiễu. β 1 , β2, β3: các hệ số. Chúng ta có thể lý giải mô hình (1.2) như sau: người tiêu dùng thường không thay đổi thói quen tiêu dùng…, như vậy nếu ta bỏ qua hạng trễ trong (1.2), số hạng sai số sẽ mang tính hệ thống do ảnh hưởng củ tiêu dùng thời kỳ trước lên tiêu dùng thời kỳ hiện tại. 1.2.2 Nguyên nhân chủ quan. - Xử lý số liệu: Trong phân tích thực nghiệm, số liệu thô thường được xử lý. Chẳng hạn trong mô hình hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo tháng rồi chia cho 3, việc lấy trung bình này làm trơn các số liệu và giảm sự dao động trong số liệu tháng. Chính sự làm trơn này gây ra tự tương quan. - Sai lệch do lập mô hình: Đây là nguyên nhân thuộc về lập mô hình. Có hai loại sai lầm có thể gây ra hiện tượng tự tương quan: + Một là: không đưa đủ các biến vào trong mô hình. + Hai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan. 1.3 Hậu quả - Ước lượng bình phương nhỏ nhất thông thường không phải là ước lượng tuyến tính không chệch tốt nhất nữa. - Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông thường là chệch và thông thường là thấp hơn giá trị thực của phương sai, do đó giá trị thống kê T được phóng đại lên nhiều lần. - Các kiểm định t và F nói chung không đáng tin cậy. - ̂ σ 2 = (n−k) ̂ σ σ 2 cho ước lượng chệch của ϭ 2 thực, và trong một số trường hợp, nó dường như ước lượng thấp ϭ 2 . - R 2 có thể là độ đo không đáng tin cậy cho R 2 thực. - Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không hiệu quả. Phần 2: Phát hiện có tự tương quan 2.1 Phương pháp đồ thị Giả thiết không có tự tương quan trong mô hình cổ điển gắn với các nhiễu tổng thể U t không quan sát được. Cái mà chúng ta có thể quan sát được là các phần dư e t thu được từ phương pháp bình phương nhỏ nhất thông thường Dù e t không hoàn toàn gống U t nhưng sự xem xét trực quan thường gợi cho ta manh mối nào đó về tự tương quan trong U. Trên thực tế xem xét trực quan về e t hoặc e 2 t có thể cho thông tin hữu ích về tính tự tương quan và tính không đồng phương sai, sự không phù hợp của mô hình. Một cách khác là vễ đề thị các phần dư chuẩn hóa theo thời gian. Lưu ý rằng, theo giả thuyết của mô hình hồi quy tuyến tính cổ điển, U t có phân phối chuẩn với trung bình bằng 0 và độ lệch tiêu chuẩn là σ . Do đó nếu đem chia U t cho σ ta sẽ được U t σ ~ N(0,1). Vì vậy việc chia e t cho ̂ σ t ta được các phần dư đã được chuẩn hóa. Trong các mẫu lớn et ̂ σ t phân phối xấp xỉ chuẩn với trung bình bằng không và phương sai bằng 1. Việc xem xétđò thị cho ta ý tưởng về các nhiễu U t có phải là ngẫu nhiên hay không 2.2 Phương pháp kiểm định số lượng 2.2.1 Kiểm định đoạn mạch Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xác định xem có thể coi một dãy các ký hiệu, các khoản mục, hoặc các số liệu có phải là kết quả của một quá trình mang tính ngẫu nhiên hay không. Một đoạn mạch là một dãy các phần tử giống nhau mà ở sat trước và sát sau là các phần tử khác chúng hoặc không có phần tử nào. Chiều dài của một đoạn mạch là số phần tử của nó. Để xác định có bao nhiêu đoạn mạch là có thể chấp nhận được quá trình là ngẫu nhiên,ta dùng một quy luật phân phối xác suất, quy luật này đưa đến tiêu chuẩn kiểm định sau. Ta đặt n: tổng số quan sát (n=n 1 +n 2 ) n 1 : số ký hiệu dương n 2 : số ký hiệu âm N: số đoạn mạch Giả thuyết kiểm định H 0 : các kết cục kế tiếp nhau(các phần dư là độc lập) H 1 : các phần dư không độc lập Với giả thiết rằng n 1 ≥10 và n 2 ≥10, số đoạn mạch N có phân phối tiệm cận chuẩn với trung bình E(N) và phương sai σ 2 n được cho như sau: E(N)= 2n1n 2 n1+n2 +1 σ 2 N = 2 n1n 2(2 n1n2−n 1−n 2) (n 1+n2) 2 (n1+n2−1) Độ lệch tiêu chuẩn √ σ 2 N = √ 2 n1 n 2(2n 1 n2−n 1−n 2) (n 1+n 2) 2 (n 1+n 2−1) Nếu giả thiết vè tính ngẫu nhiên có thể chấp nhận được chúng ta sẽ kỳ vọng một số đoạn mạch N thu được nằm trong khoảng (E(N)± 1,96 σ N ) với mức tin cậy 95%. Chú ý: khi n 1 , n 2 nhỏ hơn 10, cso bảng chuyên dụng cho các giá trị tới hạn đối với số đoạn mạch mà ta kỳ vọng trong một dãy ngẫu nhiên n quan sát. 2.2.2 Kiểm định χ 2 về tính độc lập của các phần dư. 2.2.2 Kiểm định khi bình phương về tính độc lập của các phần dư Để kiểm định χ 2 về tính độc lập của các phần dư ta sử dụng bảng liên tiếp. Bảng liên tiếp mà chúng ta sử dụng ở đây gồm một số dòng và một số cột, cụ thể là bảng liên tiếp hai dòng và hai cột. 2.2.3 Kiểm định d.Durbin – Watson Thống kê d được định nghĩa: d = ¿ ¿ ∑ t=2 n ¿ e t – e t-1 ) 2 / ∑ t =1 n e t 2 d ≈ 2(1- ̂ ρ ) Trong đó: ̂ ρ = ∑ t=2 n e t e t-1 / ∑ t =1 n e t 2 Vì -1 ≤ ρ ≤ 1 nên 0 ≤ d ≤ 4 Nếu ρ = -1 thì d=4: tự tương quan ngược chiều. Nếu ρ = 0 thì d =2: không có tự tương quan. Nếu ρ = 1 thì d = 0: tồn tại tự tương quan thuận chiều. (1) (2) (3) (4) (5) 0 d 1 d u 2 4 –d u 4 –d 1 4 d thuộc (1): tồn tại tự tương quan thuận chiều d thuộc (2): không xác định d thuộc (3): không có tự tương quan. d thuộc (4): không xác định d thuộc (5): tồn tại tự tương quan ngược chiều. Chú ý : Các giá trị d L , d U được tính sẵn phụ thuộc mức ý nghĩa α, kích thước mẫu n và số biến giải thích k’ có trong mô hình (k’ = k – 1). 2.2.4 Kiểm định BG. Để đơn giản ta xét mô hình: Y t = β 1 + β 2 X t + U t Trong đó: U t = ρ 1 U t-1 + ρ 2 U t-2 + …+ ρ p U 1-p + ε t thỏa mãn các giả thiết của OLS. Giả thiết: H 0 : ρ 1 = ρ 2 = … = ρ p = 0 Kiểm định như sau: Bước 1 : Ước lượng mô hình ban đầu bằng phương pháp OLS. Từ đó thu được các phần dư e t . Bước 2 : Ước lượng mô hình sau đây bằng phương pháp OLS: e t = β 1 + β 2 X t + ρ 1 e t-1 + ρ 2 e t-2 +…+ρ p e 1-p + v t Từ kết quả ước lượng mô hình này thu được R 2 Bước 3 : Với n đủ lớn, (n-p)R 2 có phân bố xấp xỉ χ 2 (p) nếu (n-p)R 2 > χ α 2 (p) thì H 0 bị bác bỏ, nghĩa là ít nhất tồn tại tự tương quan một bậc nào đó. Trong trường hợp ngược lại không tồn tại tự tương quan. 2.2.5 Kiểm định Durbin h Ta xét mô hình: Y t = α 0 + α 1 X t + α 2 X t-1 + u t Thống kê kiểm định này được gọi là thống kê h và được tính theo công thức sau: H = ∝2 ̂ ¿ ¿ 1−nVar ¿ n ¿ ̂ ρ √ ¿ Trong đó n là cỡ mẫu, Var( ̂ ∝ 2 ) là phương sai của hệ số của biến trễ Y t-1 . ̂ ρ là ước lượng của tương quan chuỗi bậc nhất ρ từ phương trình: ̂ ρ = ∑ t=2 n e t e t-1 / ∑ t =1 n e t 2 Khi n đủ lớn, Durbin đã chỉ ra rằng nếu ρ = 0 thì thống kê h tuân theo phân phối chuẩn hóa – N(0,1). Trong thực hành không cần tính ̂ ρ vì ̂ ρ có thể tính xấp xỉ bằng công thức: ̂ ρ ≈ 1- d 2 Trong đó d là thống kê d – thông thường. Thay biểu thức ̂ ρ vào ta được công thức cho thống kê h như sau: h ≈ (1 - d 2 ) ̂ ∝ 1−nVar ¿ n/¿ ¿ √ ¿ 2 ))) Vậy để áp dụng thống kê h phải: - Ước lượng mô hình Y t = α 0 + α 1 X t + α 2 Y t-1 + V t bằng phương pháp bình phương bé nhất. - Tính Var( ̂ ∝ 2 ). - Tính ̂ ρ = 1 - d 2 . - Tính h theo công thức: h ≈ (1 - d 2 ) ̂ ∝ 1−nVar ¿ n/¿ √ ¿ 2 )) - Quy tắc quyết định: vì h ≈ N(0,1) nên P(-1,96 ≤ h ≤ 1,96) = 0,95 Phần 3: Biện pháp khắc phục 3.1 Khi cấu trúc tự tương quan đã biết Do các nhiễu U t là không thể quan sát được, bản chất của tương quan chuỗi thường thường là vấn đề của sự suy đoán hay các yêu cầu cấp thiết của thực tế. Trên thực tế, người ta thường giả định rằng U t tuân theo sơ đồ tự hồi qui bậc 1, cụ thể là: U t = ρ U t-1 + ε t Trong đó ∣ ρ ∣ <1 và ε t thỏa mãn các giả thiết của OLS về giá trị kỳ vọng = 0, phương sai không đổi, và không tự tương quan. Giả sử công thức trên là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thỏa đáng nếu hệ số tương quan ρ là đã biết. Để làm sáng tỏ vấn đề đó ta quay lại mô hình hai biến: Y t = β 1 + β 2 X t + U t (*) Nếu (*) đúng với t cũng đúng với t-1 nên: Y t-1 = β 1 + β 2 X t-1 + U t-1 (a) Nhân 2 vế với ρ ta được ρ Y t-1 = ρ β 1 + ρ β 2 X t-1 + ρ U t (**) Trừ (*) cho (**) ta được Y t - ρ Y t-1 = β 1 (1- ρ ) + β 2 (X t - ρ X t-1 ) + (U t - ρ U t- ) (***) = β 1 (1- ρ ) + β 2 (X t - ρ X t-1 ) + ε t Đặt β * 1 = β 1 (1- ρ ) ; β * 2 = β 2 Y * t = Y t - ρ Y t-1 ; X * t = X t - ρ X t-1 Thì phương trình (***) có thể viết lại dưới dạng Y * t = β * 1 + β * 2 X * t + ε t (****) Vì các ε t thỏa mãn các giả thiêt của phương pháp bình phương nhỏ nhát đới với các biến Y * và X* và các ước lượng tìm được có tất cả các tính chất tối ưu nghĩa là ước lượng tuyến tính không chệch lớn nhất. 3.2 Khi tự tương quan chưa biết 3.2.1 Phương pháp sai phân cấp một