LỜI MỞ ĐẦU 2 CHƯƠNG 1: CƠ SỞ LÍ THUYẾT 3 1.1 Bản chất của hiện tượng tự tương quan 3 1.2. Nguyên nhân của hiện tượng tự tương quan 3 1.2.1. Nguyên nhân khách quan 3 1.2.2. Nguyên nhân chủ quan 4 1.3. Hậu quả của hiện tượng tự tương quan 6 1.4. Các cách phát hiện hiện tượng tự tương quan 7 1.4.1. Kiểm định d.Durbin – Watson 7 1.4.2. Kiểm định Breush – Godfrey (BG) 8 1.5. Một số cách khắc phục tự tương quan 9 1.5.1. Phương pháp ước lượng ρ dựa trên thống kê d – Durbin - Watson 9 1.5.2. Phương pháp Durbin – Watson 2 bước để ước lượng ρ 10 CHƯƠNG 2: BÀI TẬP VẬN DỤNG PHÁT HIỆN VÀ KHẮC PHỤC HIỆN TƯỢNG TỰ TƯƠNG QUAN. 11 2.1. Phát hiện tự tương quan. 13 2.1.1. Phát hiện tự tương quan bằng kiểm định d – Durbin –Watson. 13 2.1.2. Phát hiện tự tương quan bằng kiểm định Breusch-Godfrey (B-G). 14 2.1.2.1. Kiểm định tự tương quan bậc 1. 14 2.1.2.2. Kiểm định tự tương quan bậc 2. 16 2.2. Khắc phục hiện tượng tự tương quan 17 2.2.1. Dựa trên thống kê d – Durbin Watson 17 Dùng kiểm định d để thấy kết quả khắc phục hiện tượng tự tương quan. 19 Dùng kiểm định B-G để thấy kết quả khắc phục hiện tượng tự tương quan. 20 2.2.2. Phương pháp Durbin – Watson 2 bước để ước lượng ρ 22 2.2.2.1. Khắc phục 22 2.2.2.2. Kiểm định mô hình mới. 25
MỤC LỤC LỜI MỞ ĐẦU Một trong các giả thiết của mô hình hồi quy tuyến tính cổ điển là không có tự tương quan hay tương quan chuỗi các nhiễu U i trong hàm hồi quy tổng thể. Nhưng trong thực tế liệu có hiện tượng tự tương quan xảy ra hay không? Nguyên nhân của hiện tượng đó là gì? Nếu coa hiện tượng tương quan thì liệu có còn áp dụng được phương pháp bình phương nhỏ nhất nưa hay không? Làm thế nào để biết hiện tượng tự tương quan có xảy ra? Cách khắc phục như thế nào? Đó là một loạt các câu hỏi mà chúng ta cần giải quyết trong đề tài này. Với bài tập vận dụng thực tế, nhóm 12 đã thực hiện đề tài phát hiện và khắc phục hiện tượng tự tương quan trong bộ số liệu cụ thể về tổng sản phẩm quốc nội GDP, đầu tư trực tiếp nước ngoài FDI, xuất khẩu EX và chi tiêu của Chính phủ G. CHƯƠNG 1: CƠ SỞ LÍ THUYẾT 1.1 Bản chất của hiện tượng tự tương quan Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các só liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo). Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu U i , nghĩa là: Cov (U i ,U j ) = 0 ( i ≠j ) Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát khác. Tuy nhiên trong thực tế có thể xáy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là: Cov( U i , U j ) ≠ 0 ( i≠j) 1.2. Nguyên nhân của hiện tượng tự tương quan 1.2.1. Nguyên nhân khách quan a. Quán tính Nét nổi bật của hầu hết các chuỗi thời gian trong kinh tế là quán tính. Chúng ta đều bết các chuỗi thời gian như tổng sản phẩm, chỉ số giá, thất nghiệp mang tính chu kì. Chẳng hạn nếu chúng ta ở đầu của thời kì khôi phục kinh tế, tổng sản phẩm có xu hướng đi lên.Trong quá trình biến động này, giá trị của chuỗi ở mỗi thời điểm sau lại cao hơn giá trị của nó ở thời điểm trước. Vì vậy trong hồi quy của chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau. b. Hiện tượng mạng nhện Người ta thấy rằng việc cung nhiều mặt hàng nông sản biểu hiện hiện tượng “mạng nhện”, trong đó cung về các hàng hóa phản ứng lại với giá có trễ một khoảng thời gian, bởi vì các quyết định cung phải mất một thời gian để thực hiện, người ta gọi đó là thời kì thai nghén. Chẳng hạn vào đầu vụ trồng lạc năm nay người nông dân bị ảnh hưởng bởi giá mua lạc năm ngoái của các công ty xuất khẩu. Cho nên cung về lạc có biểu diễn dưới dạng hàm: Giả sử ở cuối thời kì t giá lạc , do đó trong thời kì t+1 những người nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kì t. Rõ ràng trong trường hợp đó, ta không mong đợi các nhiễu U i là ngẫu nhiên, có lẽ nông dân sẽ giảm sản xuất ở năm t+1… Điều này sẽ dẫn đến mô hình mạng nhện. c. Trễ Trong phân tích hồi quy chuỗi thời gian, chúng ta có thể có gặp hiện tượng biến phụ thuộc ở thời kì t phụ thuộc vào chính biến đó ở thời kì t-1 và các biến khác. Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy rằng tiêu dùng ở thời kì hiện tại chẳng những phụ thuộc vào thu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kì trước đó, nghĩa là: Trong đó : : tiêu dùng ở thời kì t : thu nhập ở thời kì t : tiêu dùng ở thời kì t-1 : nhiễu :các hệ số Chúng ta có thể lí giải mô hình như sau: Người tiêu dùng thường không thay đổi thói quen tiêu dùng…, như vậy nếu ta bỏ qua số hạng trễ trong mô hình,số hạng sai số sẽ mạng tính hệ thống do ảnh hưởng của tiêu dùng thời kì trước lên tiêu dùng thời kì hiện tại. 1.2.2. Nguyên nhân chủ quan Đó là nguyên nhân thuộc về việc xử lí số liệu và định ra mô hình: a. Xử lí số liệu Trong phân tích thực nghiệm, số liệu thô thường được xử lí. Chẳng hạn trong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ số liệu tháng bằng cách cộng đơn giản 3 quan sát theo tháng rồi chia cho 3. Việc lấy trung bình này làm trơn các số liệu và làm giảm sự dao động trong số liệu tháng. Do vậy đồ thị số liệu quý trơn tru hơn nhiều so với số liệu tháng. Chính sự làm tròn này có thể dẫn tới sai số hệ thống trong các nhiễu ngẫu nhiên và gây ra tự tương quan. Một kiểu xử lí khác là phép nội suy và ngoại suy số liệu.Chẳng hạn tổng điều tra dân số được tiến hành 10 năm 1 lần, lần cuối cùng vào năm 1997. Nếu cần số liệu cho 1 năm, nằm giữa 2 cuộc điều tra, cách phổ biến là nội suy, kĩ thuật này có thể gây ra sai số hệ thống mà không có số liệu gốc. b. Sai lệch khi lệch mô hình: Đây là nguyên nhân thuộc về lập mô hình.Có 2 loại sai lầm có thể gây ra hiện tượng tự tương quan. Một là: Không đưa đủ các biến vào trong mô hình. Việc không đưa đủ các biến vào trong mô hình có thể sẽ gây ra hiện tượng tự tương quan. Thí dụ, ta có mô hình về cầu thịt bò như sau: Trong đó: Y t là cầu về thịt bò X 2 là giá thịt bò X 3 là thu nhập của người tiêu dùng X 1 là giá thịt lợn t là thời gian U t là nhiễu. Nhưng vì lí do nào đó chúng ta đưa ra mô hình chỉ có 2 biến độc lập X 2 và X 3 : Vậy nếu (1) là mô hình đúng thì tiến hành phép hồi quy(2) cũng tương đương như là cho Nhưng vì việc tăng giá thịt lợn có ảnh hưởng đến tiêu dùng thịt bò nên thành phần nhiễu v sẽ có sai số hệ thống và tạo nên sự tương quan. Hai là, dạng hàm sai. Dạng hàm sai có thể gây ra hiện tượng tự tương quan. Thí dụ: giả sử mô hình đúng của quan hệ chi phí biên và sản lượng là: Trong đó: MC là chi phí biên Q là sản lượng sản phẩm β 1 , β 2 ,β 3 là các hệ số. Nhưng ta lại ước lượng hàm hồi quy dưới dạng Chúng ta hãy xem thử đường cong chi phí biên ứng với mô hình đúng( đường dấu chấm) và đường thẳng chi phí ở hình sau: MC[Q]