Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian trong các số liệu chuỗi thời gian hoặc không gian trong
Trang 11
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
KHOA HTTT KINH TẾ VÀ TMĐT
BÀI THẢO LUẬN
MÔN: KINH TẾ LƯỢNG
ĐỀ TÀI: HIỆN TƯỢNG TỰ TƯƠNG QUAN
Trang 22
BẢNG PHÂN CÔNG NHIỆM VỤ
giảng viên
1 Đậu Thị Bích
2 Bùi Bảo Khanh
Trang 33
6 Nguyễn Thị Hồng
7 Bùi Ngọc Linh Nội dung I.1.2
8 Hồ Ngọc Hà Linh Nội dung II.2.3
9 Nguyễn Mai Linh II.1.1+ ExcelNội dung
Trang 42.2 Kiểm định BG (Breush – Godfrey) 5
3.Khắc phục hiện tượng tự tương quan 5
II.HIỆN TƯỢNG TỰ TƯƠNG QUAN TRONG THỰC TẾ VÀ CÁCH KHẮC PHỤC 5
1.Phát hiện sự tồn tại tự tương quan trong ví dụ 6
1.1 Phương pháp đồ thị (Trên Eviews) 6
1.2 Phương pháp “Kiểm định d” 6
1.3 Phương pháp kiểm định BG 6
1.4 Phương pháp kiểm định “Corelogram” (sử dụng eviews) 6
2.Khắc phục hiện tượng tự tương quan trong ví dụ 6
KẾT LUẬN 7
TÀI LIỆU THAM KHẢO 8
Trang 55
MỞ ĐẦU
Trang 6Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo)
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không có sự tương quan giữa các nhiễu U nghĩa là: i
Cov (U , Uj) = 0 ( ii ≠ j)
Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với một quan sát khác
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov (U , Uij) ≠ 0 ( i ≠ j) 1.I.1.2 Nguyên nhân
a Nguyên nhân khách quan
Quán tính: Nét nổi bật của hầu hết các chuỗi thời gian ừong kinh tế là quán tính Chúng ta đều biết các chuỗi thời gian như: tổng sản phẩm, chỉ số giá, thất nghiệp… mang tính chu kỳ Chẳng hạn, ở giai đoạn đầu của thời kỳ khôi phục kinh tế, tổng sản phẩm có xu hướng đi lên, do đó giá trị của chuỗi ở thời điểm sau thường cao hơn ở thời điểm trước và khi hồi qui chuỗi thời gian, các quan sát kế tiếp có nhiều khả năng phụ thuộc nhau
Hiện tượng mạng nhện: Người ta thấy rằng việc cung nhiều mặt hàng nông sản biểu hiện hiện tượng “ mạng nhện”, ứong đó lượng cung phản ứng lại với giá có trễ một khoảng thời gian, vì các quyết định cung cần phải mất một khoảng thời gian để thực hiện, người ta gọi đó là thời kỳ hình thành
Các độ trễ: Trong phân tích chuỗi thời gian, chúng ta có thể gặp hiện tượng biến phụ thuộc ở thời kỳ t phụ thuộc vào chính biến đó ở thời kỳ t 1 và các biến khác -Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập, chúng ta thấy
Trang 77 rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào thu nhập mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩa là:
𝑦1= ∝ + 𝛽1 1𝑥1+ 𝛽2𝑦𝑡−1+ 𝑢𝑡 (1)
Trong đó: 𝑦𝑡 Tiêu dùng ở thời kì t;𝑥𝑡 : Thu nhập ở thời kì t; : Sai số ngẫu 𝑢𝑡 nhiên;𝑦𝑡−1: tiêu dùng thời kì t-1; ∝ , 𝛽1 1,𝛽2: là các hệ số
Chúng ta có thể lí giải mô hình (1) như sau: Người tiêu dùng thường không thay đổi thói quen tiêu dùng , như vậy nếu chúng ta bỏ qua số hạng trễ trong mô hình thì sai số sẽ mang tính hệ thống do ảnh hưởng của tiêu dùng ở thời kì trước lên tiêu dùng ở thời kì hiện tại
b Nguyên nhân chủ quan
Xử lí số liệu: Trong phân tích thực nghiệm, số liệu thô thường được xử lý Chẳng hạn ưong hồi qui chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ các số liệu tháng bằng cách cộng 3 quan sát rồi chia cho 3 Việc lấy trung bình này làm trơn các số liệu và làm giảm sự giao động ưong số liệu tháng Chính sự làm ươn này có thể dẫn đến sai số có hệ thống ưong các sai số ngẫu nhiên và gây ra sự tương quan Một cách xử lý khác là phép nội suy và ngoại suy số liệu Chẳng hạn, tổng điều ưa dân số tiến hành 10 năm 1 lần, lần cuối cùng vào năm 1997, nếu cần số liệu cho một năm nằm ưong khoảng thời gian giữa hai cuộc điều ưa, cách phổ biến là nội suy Kỹ thuật này có thể gây ra sai số hệ thống mà điều đó có thể không thấy ưong số liệu gốc
Sai lệch do lập mô hình: Đây là nguyên nhân thuộc về việc lập mô hình Có hai loại sai lầm có thể gây ra hiện tượng tự tương quan:
Một là: không đưa đủ các biến vào mô hình Việc không đưa đủ các biến vào mô hình có thể gây ra hiện tượng tự tương quan
Ví dụ: Xét mô hình:
𝑦𝑡=∝1+ 𝛽1𝑥1𝑡+ 𝛽2𝑥2𝑡+ 𝛽3𝑥3𝑡+ 𝑢𝑡 (2) Trong đó: y là cầu về thịt bò; 𝑥1là giá thịt bò; 𝑥2là thu nhập của người tiêu dùng; 𝑥3 là giá thịt heo; t là thời gian; 𝑢1là sai số ngẫu nhiên
Nhưng vì lí do nào đó chúng ta đưa ra mô hình chỉ có 2 biến độc lập là 𝑥1 và 𝑥 2
𝑦𝑡=∝1+ 𝛽1𝑥1𝑡+ 𝛽2𝑥2𝑡+ 𝑣𝑡 (3)
Trang 88 Vậy nếu (2) là mô hình đúng khi ta tiến hành hồi quy (3) cũng tương đương là cho 𝑣𝑡= 𝛽3𝑥3𝑡+ 𝑢𝑡 Nhưng vì việc tăng giá thịt heo có ảnh hưởng đến cầu thịt bò nên thành phần sai số ngẫu nhiên 𝑣𝑡sẽ có sai số hệ thống và tạo nên sự tương quan.
Hai là: dạng hàm sai Dạng hàm sai có thể gây ra hiện tượng tự tương quan Ví dụ: Giả sử mô hình đúng của chi phí biên và sản lượng là:
(𝑀𝐶)𝑖=∝ + 𝛽1 1𝑄𝑖+ 𝛽2𝑄𝑖 2+ 𝑢𝑖 (4) Trong đó: MC là chi phí biên; Q là sản lượng sản phẩm
Nhưng ta lại ước lượng mô hình hồi quy có dạng: (𝑀𝐶)𝑖=∝1+ 𝛽1𝑄1+ 𝑣𝑖 (5) Đồ thị hàm (4) và (5) được biểu diễn ở hình (4.2)
Hình 4.2
Nhìn vào hình vẽ ta thấy các điểm nằm trên đoạn AB của đường hồi quy (5) cho ước lượng quá cao chi phí biên đúng, còn các điểm nằm ngoài đoạn này cho ước lượng thấp hơn Khi đó các số hạng sai số ngẫu nhiên 𝑣𝑖 được xác định như sau:
𝑣 = 𝛽𝑖 2𝑄𝑖 2+ 𝑢𝑖
Và do đó nó bị ảnh hưởng có tính hệ thống của sản lượng đối với chi phí biên Vậy Vị có tự tương quan do sử dụng dạng hàm không chính xác
1.I.1.3 Hậu quả
- Ước lượng bình phương nhỏ nhất thông thường không phải là ước lượng tuyến tính không chệch tốt nhất nữa
- Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất thông thường là chệch và thông thường là thấp hơn giá trị thực của phương sai, do đó giá trị của thống kê T được phóng đại lên nhiều lần
Trang 99 - Các kiểm định t và F nói chung không đáng tin cậy
- 𝜎2=(𝑛−𝑘 𝜎)2
𝜎2 cho ước lượng chệch của 𝜎2, và trong một số trường hợp, nó dường như ước lượng thấp 𝜎2
- R2có thể là độ đo không đáng tin cậy cho R2 thực
- Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không hiệu quả
2 Phát hiện sự tồn tại tự tương quan
1.I.2.1 Kiểm định d
Kiểm định d.Durbin Watson là phương pháp kiểm định có ý nghĩa nhất để phát - hiện ra tương quan chuỗi
Thống kê d.Durbin Watson được định nghĩa như sau:-
Vậy thống kê là tỉ số của tổng bình phương các hiệu số của các phần dư kế tiếp d nhau với RSS (tổng bình phương các phần dư)
Việc đưa ra một phân bố xác suất hoặc phân phối mẫu chính xác cho thống kê d là rất khó vì nó phụ thuộc theo những cách phức tạp vào các giá trị của X có trong mẫu Tuy nhiên Durbin và Watson đã thành công trong việc đưa ra được cận dưới 𝑑𝐿 và cận trên sao cho nếu tính toán được từ (*) nằm ngoài các giá trị tới hạn này thì d có thể quyết định đối với việc có tương quan chuỗi thuận hay ngược chiều
Trong đó 𝜌∧là hệ số tự tương quan bậc nhất của mẫu, đó là ước lượng của 𝜌 Do −1 ≤ 𝜌 ≤ 1 nên ta có giới hạn của d: 0 ≤ 𝑑 ≤ 4
Trang 1010 Nếu các giả thiết của kiểm định thỏa mãn thì có thể trình bày quy tắc ra quyết d định như sau:
Giả thiết không Quyết định Nếu
Không có tự tương quan dương Bác bỏ 0 < d < 𝑑𝐿
Không có tự tương quan dương Không quyết định 𝑑𝐿≤ 𝑑 ≤ 𝑑𝑈
Không có tự tương quan âm Bác bỏ 4 − 𝑑 < 𝑑 < 4𝐿
Không có tự tương quan âm Không quyết định 4 − 𝑑 ≤ 𝑑 ≤ 4 − 𝑑𝑈 𝐿
Không có tự tương quan
dương hoặc âm Không bác bỏ 𝑑 < 𝑑 < 4 − 𝑑𝑈𝑈
1.I.2.2 Kiểm định BG (Breush – Godfrey) Ta xét mô hình giản đơn:
𝑌𝑡= 𝛽1+ 𝛽2𝑋𝑡+ 𝑈𝑡 trong đó:
𝑈𝑡= 𝜌1𝑈𝑡−1+ 𝜌2𝑈𝑡−2+ ⋯ + 𝜌𝑝𝑈𝑡−𝑝+ 𝜀𝑡 (𝜀 thỏa mãn các giả thiết của 𝑡 OLS)
Giả thiết 𝐻0: 𝜌1= 𝜌2= ⋯ = 𝜌𝑝= 0, có nghĩa là không tồn tại tự tương quan ở bất kỳ bậc nào Giả thiết này có thể được kiểm định bằng thủ tục BG như sau:
Bước 1: Ước lượng mô hình ban đầu bằng phương pháp bình phương nhỏ nhất (OLS) Từ đó thu được các phần dư 𝑒𝑖
Bước 2: Cũng bằng phương pháp OLS, ước lượng mô hình sau:
Trang 1111 Nếu 𝜒𝑡𝑛 ∈ 𝑊𝛼 thì 𝐻0 bị bác bỏ, nghĩa là ít nhất tồn tại tự tương quan ở một bậc nào đó Trong trường hợp ngược lại thì không tồn tại tự tương quan
3 Khắc phục hiện tượng tự tương quan
1.I.3.1 Khi cấu trúc của tự tương quan là đã biết
Vì các nhiễu U không quan sát được nên tính chất của tương quan chuỗi thường i
là vấn đề suy đoán là do những đòi hỏi cấp bách của thực tiễn
Trong thực hành, người ta thường giả sử rằng U theo mô hình tự hồi quy bậc i
nhất nghĩa là:
Ut = 𝜌 Ut-1 + 𝜀 t (1)
Trong đó |𝜌 | < 1 và 𝜀𝑡thỏa mãn các giả thiết của phương trình bình phương nhỏ nhất thông thường nghĩa là: Trung bình bằng 0, phương sai không đổi và không tự tương quan Giả sử (1) là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thỏa đáng nếu hệ số tự tương quan là đã biết Để làm sáng tỏ vấn đề đó ta quay lại 𝜌 mô hình hai biến:
Vì 𝜀𝑡 thỏa mãn các giả thiết của phương pháp bình phương nhỏ nhất thông thường đối với các biến 𝑌∗ và 𝑋∗và các ước lượng tìm được có tất cả các tính chất tối ưu nghĩa là ước lượng tuyến tính không chệch tốt nhất
Phương trình hồi quy (5) được gọi là phương trình sai phân tổng quát
Trang 1212 1.I.3.2 Khi 𝜌 chưa biết
3.2.1 Phương pháp sai phân cấp 1
Như ta đã biết −1 ≤ 𝜌 ≤ 1 nghĩa là nằm giữa ( 1,0) hoặc (0,1) cho nên người 𝜌 -ta có thể bắt đầu từ các giá trị ở các đầu mút của các khoảng đó Nghĩa là -ta có giả thiết tằng:
𝜌 = 0 tức là không có tương quan chuỗi
𝜌 ≠ ±1 nghĩa là có tương quan dương hoặc âm hoàn toàn
Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng không có tự tương quan rồi sau đó tiến hành kiểm định Durbin – Watson hay các kiểm định khác để xem giả thiết này có đúng hay không Tuy nhiên nếu 𝜌 = ±1 thì phương trình sai phân tổng quát (3) quy về phương trình sai phân cấp 1:
𝑌𝑡− 𝑌𝑡−1= 𝛽2(𝑋𝑡− 𝑋𝑡−1) + (𝑈𝑡− 𝑈𝑡−1) = 𝛽2(𝑋𝑡− 𝑋𝑡−1) + 𝜀𝑡
Hay ∆𝑌𝑡= 𝛽2∆𝑋𝑡+ 𝜀𝑡 (7)
Trong đó ∆ là toán tử sai cấp 1 Để ước lượng hồi quy (7) thì cần phải lập các sai phân cấp 1 của biến phụ thuộc và biến giải thích và sử dụng chúng làm những đầu vào trong phân tích hồi quy
Giả sử mô hình ban đầu là:
𝑌𝑡= 𝛽1+ 𝛽2𝑋𝑡+ 𝛽3𝑡 + 𝑈𝑡 (8)
Trong đó t là biến xu thế còn 𝑈𝑡 theo sơ đồ tự hồi quy bậc nhất Thực hiện phép biến đổi sai phân cấp 1 đối với (8) ta đi đến
Mô hình này được gọi là mô hình hồi quy trung bình trượt (2 thời kỳ) vì chúng ta hồi quy giá trị của một trung bình trượt đối với một trung bình trượt khác
Phép biến đổi sai phân cấp 1 đã giới thiệu trước đây rất phổ biến trong kinh tế lượng ứng dụng vì nó dễ thực hiện
Trang 1313 a Ước lượng dựa trên thống kê d –𝜌 Durbin Watson –
Trong phần kiểm định d chúng ta đã thiết lập được các công thức: (11)
Hoặc (12)
Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của từ 𝜌 thống kê d Từ (10) chỉ ra rằng giả thiết sai phân cấp 1 với 𝜌 ≠ ±1 chỉ đúng khi d =0 hoặc xấp xỉ bằng không Do đó thống kê d cung cấp cho ta một phương án sẵn có để thu được ước lượng của 𝜌
Khi 𝜌 đã được ước lượng thì có thể biến đổi tập số liệu như đã chỉ ra ở (6) và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thông thường Khi ta sử dụng một ước lượng thay cho các giá trị đúng, thì các hệ số ước lượng thu được từ phương pháp bình phương nhỏ nhất có thuộc tính tối ưu thông thường chỉ tiệm cận có nghĩa là có thuộc tính đó trong các mẫu lớn Vì vậy trong các mẫu nhỏ ta phải cẩn trọng trong khi giải thích các kết quả ước lượng
3.2.3 Thủ tục lặp Cochrane – Orcutt để ước lượng 𝜌
Phương pháp này sử dụng các phần dư e đã được ước lượng để thu được thông t
tin về chưa biết 𝜌
Ta xem xét phương pháp này thông qua mô hình hai biến sau: 𝑌𝑡 = 𝛽𝑡+ 𝛽2𝑋𝑡+ 𝑈𝑡 (13) Các bước tiến hành như sau:
Bước 1: Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhất thông thường và thu được các phần dư et
Bước 2: Sử dụng các phần dư đã ước lượng để ước lượng hồi quy:
Trang 1414 𝑌𝑡 = 𝛽1+ 𝛽2𝑋𝑡+ 𝑒𝑡 (15)
Bước 4: Vì chúng ta chưa biết trước rằng thu được từ (14) có phải là ước lượng tốt nhất của hay không, ta thế giá trị 𝜌 và thu được từ (15) vào hồi quy gốc ban đầu (13) và thu được các phần dư mới chẳng hạn 𝑒∗∗
(16) Các phần dư có thể tính dễ dàng
Ước lượng phương trình hồi quy tương tự với (14) (17) là ước lượng vòng 2 của 𝜌
Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của 𝜌 khác nhau một lượng rất nhỏ chẳng hạn bé hơn 0,01 hoặc 0,005
3.2.4 Thủ tục Cochrane – Orcutt hai bước
Đây là một kiểu rút gọn quá trình lặp Trong bước 1 ta ước lượng từ bước 𝜌 lăp đầu tiên nghĩa là từ phép hồi quy (13) và trong bước 2 ta sử dụng ước lượng của 𝜌 để ước lượng phương trình sai phân tổng quát
3.2.5 Phương pháp Durbin – Watson 2 bước để ước lượng 𝜌
Để minh họa phương pháp này chúng ta viết lại phương trình sai phân tổng quát dưới dạng sau:
𝑌𝑡= 𝛽1(1 − 𝜌) + 𝛽2𝑋𝑡− 𝜌𝛽2𝑋𝑡−1+ 𝑝𝑌𝑡−1+ 𝜀𝑡 (18) Durbin đã đề xuất thủ tục 2 bước để ước lượng 𝜌
Bước 1: Coi (18) như là một mô hình hồi quy bội, hồi quy 𝑌𝑡 theo 𝑋𝑡, 𝑋𝑡−1 và 𝑌𝑡−1 và coi giá trị ước lượng được của hệ số hồi quy của 𝑌𝑡−1 (= ) là ước lượng của 𝜌
lượng hồi quy bằng phương pháp bình phương nhỏ nhất thông thường trên các biến đã biến đổi đó như là ở (6)
Như vậy theo phương pháp này thì bước 1 là ước lượng còn bước 2 là để thu 𝜌 được ước lượng tham số
3.2.6 Các phương pháp khác để ước lượng 𝜌
Ngoài các phương pháp để ước lượng đã trình bày ở trên còn có một số 𝜌
Trang 1515 phương pháp khác nữa Chẳng hạn ta có thể dùng phương pháp hợp lý cực đại để ước lượng trực tiếp các tham số của (18) mà không cần dùng đến một số thủ tục lặp đã thảo luận Nhưng phương pháp hợp lý cực đại liên quan đến thủ tục ước lượng phi tuyến (đối với các tham số) và thủ tục tiềm kiếm của Hildreth – Lu nhưng thủ tục này tốn nhiều thời gian và không hiệu quả so với phương pháp ước lượng hợp lý cực đại nên ngày nay không được dùng nhiều
II HIỆN TƯỢNG TỰ TƯƠNG QUAN TRONG THỰC TẾ VÀ CÁCH KHẮC PHỤC
Ví dụ: Theo dõi lượt khách du lịch quốc tế đến Việt Nam và tổng thu từ du khách giai đoạn 2009 – 2020 thu được số liệu như sau:
Trang 1616 X: Số lượt khách du lịch quốc tế đến Việt Nam (Đơn vị: nghìn lượt)
Y: Tổng thu từ khách du lịch (Đơn vị: nghìn tỷ đồng) 1 Phát hiện sự tồn tại tự tương quan trong ví dụ
B1: Trên màn hình khởi động, chọn Create a new Eviews workfile.
B2: Xuất hiện Workfile Create Nhập thời điểm bắt đầu (Start date) là 2009 và thời điểm kết thúc (End date) là 2020 -> OK.
B3: Màn hình xuất hiện như dưới đây.
Trang 1717
B4: Trên menu chính, chọn File/Import/Import from file -> Chọn file Excel nhóm đã tạo -> Open.
Cửa sổ Excel Read – Step 1 of 4 xuất hiện.
Trang 18-18
Trang 19-19
-1.II.1.1 Phương pháp đồ thị (Trên EViews)
Từ cửa sổ Equation chọn View/Actual, Fitted, Residual/Actual, Fitted, Residual Table
Trang 2020
Ta thu được: Residual = ei và đồ thị phần dư
Nhìn vào đồ thị phần dư, ta thấy: Có xu thế tuyến tính, tăng hoặc giảm trong các nhiễu Điều này ủng hộ cho giả thiết có sự tương quan trong mô hình hồi quy tuyến tính cổ điển.
Lưu lại và vẽ đồ thị phần dư của mô hình theo các bước sau: B1: Từ cửa sổ Proc, chọn Make Residual Series.