2.1. Tự hồi quy vector (Vector Autoregressions - VAR)
Christopher A Sims (1968)15 là người đầu tiên đưa ra mơ hình tự hồi quy vector (VAR). Ơng cho rằng khó xác định rõ tương quan giữa chính sách và phát triển kinh tế: chính sách tác động đến tăng trưởng hay tăng trưởng tác động đến chính sách, chính sách đưa ra dựa vào “kỳ vọng ở tương lai” là chủ yếu. Vì thế, nghiên cứu để hoạch định các chính sách vĩ mơ cần có nền tảng dữ liệu q khứ, vì q khứ, hiện tại tác động đến tương lai. Sims tập trung phân tích những yếu tố giá như: giá dầu, giá vốn (chi phí vốn – lãi suất), giá gạo (giá lương thực, thực phẩm) để đo lường và dự đoán các tác động của chúng đến các yếu tố vĩ mô như: lạm phát, tăng trưởng kinh tế,… Thực hiện qua ba bước:
Bước 1: Phân tích dự báo dựa vào mơ hình VAR – mơ hình tự hồi quy vector. Phần này sử dụng dữ liệu theo chuỗi thời gian trong quá khứ.
Bước 2: Tách các “cú sốc cơ bản” ra. Đây là điều kiện tiên quyết để nghiên cứu tác động của việc thay đổi các biến đến sự thay đổi của các biến “độc lập”.
Bước 3: Phân tích phản ứng xung lực (impulse – response). Phần này chủ yếu minh hoạt tác động của các cú sốc cơ bản đối với các biến vĩ mơ. Phân tích xung lực giúp hiểu rõ hơn về kinh tế vĩ mô và những ảnh hướng lớn tới việc thực thi các chính sách tiền tệ. Mơ hình VAR là một cơng cụ khơng thể thiếu của các NHTW, Bộ Tài chính trong q trình phân tích ảnh hưởng của các cú sốc đến nền kinh tế cũng như ảnh hưởng của các chính sách với nhau.
Từ những năm 1990 đến nay, các nhà nghiên cứu kinh tế, các cơ quan hoạch định chính sách kinh tế của các nước đã sử dụng mơ hình tự hồi quy vector (VAR) để phân tích cơ chế truyền dẫn của chính sách tiền tệ ở các nước. Sau này mơ hình VAR cịn biến thể thành SVAR (mơ hình tự hiệu chỉnh vector) hay VECM. Tuy
15
nhiên, mơ hình VAR vẫn thường được sử dụng trong phân tích cơ chế truyền dẫn tiền tệ.
Mơ hình tự hồi quy Vector thường được sử dụng trong hệ thống dự báo chuỗi thời gian có tương quan với nhau và phân tích tính động ngẫu nhiên trong hệ thống các biến. Mơ hình VAR là một mơ tả tập hợp gồm k các biến nội sinh (endogenous variables) như là hàm tuyến tính của các biến trong q khứ. Mơ hình VAR bậc p có dạng:
Yt = A1Yt-1 + A2Yt-2 ... + ApYt-p + BXt + t (2.1) Trong đó:
▪ Yt là k vector biến nội sinh.
▪ Yi,t là biến thứ i quan sát tại thời điểm t. ▪ Yt-m là quan sát của vectơ Y tại độ trễ m.
▪ Xt là d vectơ biến ngoại sinh (exogenous variables). Các ma trận Ai và B là ma trận hệ số được mô phỏng, Ai là ma trận k x k và B là vector hằng số.
▪ t là vector sai số và có những đặc tính sau: + E(t) = 0, trung bình của sai số bằng 0.
+ E(t’t) = , ma trận hiệp phương sai của sai số (covariance matrix of error terms) và đây là ma trận xác định phương.
+ E(t’t-k) = 0, với k khác 0, khơng có tương quan giữa các độ trễ theo thời gian.
2.2. Chuỗi dữ liệu dừng (Stationary) 2.2.1. Khái niệm
Dữ liệu của bất kỳ chuỗi thời gian nào đều có thể được coi là được tạo ra từ một quá trình ngẫu nhiên và một tập hợp dữ liệu cụ thể, có thể được coi là một kết quả (cá biệt) của q trình ngẫu nhiên đó. Hay nói cách khác, có thể xem q trình ngẫu nhiên và tổng thể là kết quả là một mẫu được tổng thể đó. Một tính chất của quá trình ngẫu nhiên được các nhà phân tích về chuỗi thời gian đặc biệt quan tâm và xem xét kỹ lưỡng là tính dừng: Một q trình ngẫu nhiên Yt được coi là dừng nếu
kỳ vọng, phương sai và hiệp phương sai tại cùng một độ trễ của nó khơng thay đổi theo thời gian. Cụ thể, Yt được gọi là dừng nếu:
▪ Trung bình E(Yt)=µ với mọi t (1) ▪ Phương sai Var(Yt)=E(Yt-µ)2=σ2 với mọi t (2) ▪ Hiệp phương sai Cov(Yt, Yt+k) = E(Yt-µ)E(Yt+k-µ) = k với mọi t (3) Điều kiện thứ (3) có nghĩa là hiệp phương sai giữa Yt và Yt+k chỉ phụ thuộc vào độ trễ thời gian (k) giữa hai thời đọan này chứ không phụ thuộc vào thời điểm t.
Chuỗi thời gian phải dừng: ▪Thứ nhất, Gujarati (2003)16
cho rằng nếu một chuỗi thời gian khơng dừng, chúng ta chỉ có thể nghiên cứu hành vi của nó trong thời gian đang được xem xét. Một mẫu dữ liệu thời gian sẽ mang một tình tiết nhất định và chỉ thể hiện những hành vi cụ thể trong khoảng thời gian đó. Kết quả là, chúng ta khơng thể khái qt hóa cho các giai đoạn khác nghĩa là khơng thể lấy đặc điểm của chuỗi thời gian giai đoạn này làm đặc điểm của một chuỗi thời gian giai đoạn khác. Đối với mục đích dự báo, các chuỗi thời gian khơng dừng như vậy có thể sẽ khơng có giá trị thực tiễn. Vì như chúng ta đã biết, trong dự báo chuỗi thời gian, chúng ta ngầm định xu hướng vận động của dữ liệu trong quá khứ và hiện tại được duy trì cho các giai đoạn trong tương lai. Thế nhưng, nếu bản thân dữ liệu ln thay đổi thì chúng ta khơng thể dự báo được điều gì cho tương lai. Hơn nữa, đối với phân tích hồi quy, nếu chuỗi thời gian khơng dừng thì tất cả các kết quả điển hình của một phân tích hồi quy tuyến tính cổ điển sẽ khơng có giá trị cho việc dự báo, và thường được gọi là hiện tượng “hồi quy giả mạo”. Do vậy, điều kiện cơ bản nhất cho việc dự báo một chuỗi thời gian là nó phải có tính dừng.
▪Thứ hai, khi biết dữ liệu dừng hay không, chúng ta sẽ giới hạn được số mơ hình dự báo phù hợp nhất cho dữ liệu.
2.2.2. Chuỗi dừng sai phân
16
Nếu chuỗi thời gian là một chuỗi không dừng nhưng sai phân bậc 1 của nó là chuỗi dừng thì ta ký hiệu là I(1): Xt = Xt – Xt-1. Tương tự, một chuỗi dừng ở sai phân bậc 2 được ký hiệu là I(2): 2Xt = Xt – Xt-2. Nếu bản thân chuỗi thời gian là chuỗi dừng thì cũng có thể gọi là chuỗi dừng sai phân bậc 0, ký hiệu I(0). Một cách tổng quát, một chuỗi dừng ở sai phân bậc k được ký hiệu là I(k): k
Xt = Xt – Xt-k
2.2.3. Phương pháp kiểm định chuỗi dừng
Có hai phương pháp thường được sử dụng để kiểm định chuỗi dừng là sử dụng giản đồ tự tương quan (dựa vào thống kê t và thống kê Q) và kiểm định nghiệm đơn vị (dựa vào thống kê t của Dickey-Fuller).
2.2.4. Giản đồ tự tương quan
Khi một biến được đo lường theo thời gian, thì các quan sát ở các giai đoạn thời gian khác nhau thường tương quan với nhau. Sự tương quan này thường được đo bằng hệ số tự tương quan. Tự tương quan là sự tự tương quan giữa một biến trễ một hoặc k giai đoạn với chính bản thân biến đó. Chúng ta sẽ thảo luận các hệ số tự tương quan cho các độ trễ khác nhau của một chuỗi thời gian nhất định được sử dụng như thế nào để nhận biết các dạng dữ liệu khác nhau.
Hệ số tự tương quan tổng thể có độ trễ bậc k (ký hiệu là k) được xác định theo
công thức sau đây:
(2.2) Nếu chia các tử và mẫu của phương trình trên cho n, thì hệ số tự tương quan trên có thể được viết lại như sau:
(3.2) Phương trình (1) và (2) được gọi là hàm tự tương quan, ký hiệu là ACF.
Do thực tế ta chỉ làm việc với dữ liệu mẫu, nên ta chỉ có thể ước lượng hệ số tương quan mẫu (ký hiệu rk) theo công thức sau đây:
(4.2) Trong đó, là giá trị trung bình mẫu của chuỗi Yt; k là độ trễ; n là số quan sát của mẫu.
Kiểm định hệ số tương quan là cơ sở quan trọng nhất để giúp người phân tích dữ liệu và dự báo biết một chuỗi thời gian đang xem xét thuộc dạng dữ liệu nào: ngẫu nhiên, dừng, có yếu tố xu thế (khơng dừng), hoặc có yếu tố mùa vụ.
Có hai phương pháp kiểm định xem hệ số tương quan có ý nghĩa thơng kê hay không: Thống kê t và thống kê Q.
▪ Thống kê t
Gọi k là hệ số tự tương quan tổng thể (rk là ước lượng khơng chệch của k), ta có các giả thiết sau đây:
H0: k = 0 H1: k # 0
Nếu một chuỗi thời gian ngẫu nhiên thì các hệ số tự tương quan là một biến ngẫu nhiên có phân phối chuẩn với trung bình là 0 và phương sai là 1/N. Như vậy, với sai số chuẩn của hệ số tự tương quan se(rk) là /N, ta có thể xây dựng khoảng tin cậy cho k hoặc tìm được giá trị thống kê t tính tốn ở một mức ý nghĩa xác định. Nếu k nằm ngồi khoảng tin cậy đó hoặc giá trị t tính tốn lớn hơn giá trị t quan sát ta bác bỏ giả thiết H0.
Việc bác bỏ hay không bác bỏ một giả thiết H0 phụ thuộc vào cỡ mẫu và mức ý nghĩa được chọn.
▪ Thống kê Q
Hai cột cuối trong biểu đồ tự tương quan là thống kê Q của Ljung-Box và giá trị xác suất tương ứng. Thống kê Q kiểm định giả thiết đồng thời là tất cả các hệ số k cho tới một độ trễ đồng thời bằng không. Giá trị thống kê Q tính tốn theo cơng thức sau đây:
Với cỡ mẫu lớn, Q có phân phối theo Chi bình phương với bậc tự do bằng số độ trễ. Nếu giá trị thống kê Q tính tốn lớn hơn giá trị thống kê Q quan sát ở một mức ý nghĩa xác định, ta bác bỏ giả thiết H0.
Nếu hệ số tự tương quan đầu tiên khác không nhưng các hệ số tự tương quan tiếp theo bằng khơng một cách có ý nghĩa thống kê, thì đó là một chuỗi dừng. Nếu một số hệ số tự tương quan khác khơng một cách có ý nghĩa thống kê thì đó là một chuỗi khơng dừng.
2.2.5. Kiểm định nghiệm đơn vị
Kiểm định nghiệm đơn vị là một kiểm định được sử dụng khá phổ biến để kiểm định một chuỗi thời gian là dừng hay không dừng. Khi thực hiện nghiên cứu khoa học với dữ liệu chuỗi thời gian, chúng ta nên áp dụng kiểm định nghiệm đơn vị (thay vì giản đồ tự tương quan), vì loại kiểm định này có tính học thuật và chun nghiệp cao hơn. Giả sử ta có phương trình tự hồi quy như sau:
Yt = Yt-1 + µt (-1 ≤ ≤ 1) (6.2) Giả thiết H0: = 1 (Yt là chuỗi không dừng)
H1: < 1 (Yt là chuỗi dừng)
Phương trình (6.2) tương đương với phương trình sau: Yt – Yt-1 = Yt-1 – Yt-1 + µt
= ( - 1)Yt-1 +µt
Yt = Yt-1 + µt (7.2)
Như vậy các giả thiết ở trên có thể được viết lại như sau: Giả thiết H0: = 0 (Yt là chuỗi không dừng)
H1: < 0 (Yt là chuỗi dừng)
Dickey và Fuller cho rằng giá trị t ước lượng của hệ số Yt-1 sẽ theo phân phối xác suất (tau statistic, = giá trị ước lượng/sai số của hệ số ). Kiểm định thống kê còn được gọi là kiểm định Dickey – Fuller (DF).
Kiểm định DF được ước lượng với 3 hình thức:
▪ Khi Yt là một bước ngẫu nhiên khơng có hằng số:
Yt = Yt-1 +µt (DF1) ▪ Khi Yt là một bước ngẫu nhiên có hằng số:
Yt = 1 + Yt-1 +µt (DF2)
▪ Khi Yt là một bước ngẫu nhiên với hằng số xoay quanh một đường xu thế ngẫu nhiên:
Yt = 1 + 2TIME + Yt-1 +µt (DF3)
Để kiểm định H0 ta so sánh giá trị thống kê tính tốn với giá trị thống kê tra bảng DF (các phần mềm kinh tế lượng đều cung cấp giá trị thống kê ). Nếu giá trị tuyệt đối của thống kê lớn hơn giá trị tra bảng, ta bác bỏ giả thiết H0, nghĩa là Yt
là một chuỗi dừng. Ngược lại, nếu giá trị tuyệt đối của thống kê nhỏ hơn giá trị tra bảng, ta không bác bỏ giả thiết H0, nghĩa là Yt là một chuỗi khơng dừng.
▪ Do đó thể có hiện tương tương quan chuỗi giữa các µt do thiếu biến, nên người ta thường sự dụng kiểm định DF mở rộng là ADF (Augmented Dickey – Fuller Test). Kiểm định này được thực hiện bằng cách đưa thêm vào phương trình (DF3) các biến trễ của sai phân biến phụ thuộc Yt:
Yt = 1 + 2TIME + Yt-1 + iYt-i + t (DF4)
2.3. Các tiêu chí lựa chọn độ trễ tối ưu
Một số tiêu chí thường được sử dụng để đánh giá mức độ phù hợp của một mơ hình hồi quy như AIC, FPE, SBC và HQC (có sẵn trong kết quả hồi quy trên
Eviews). Khi tăng biến số giải thích trong một mơ hình hồi quy bội sẽ làm giảm RSS, và vì thế R2 sẽ tăng. Tuy nhiên, cái giá của việc tăng R2 là giảm số bậc tự do trong mơ hình. Một phương pháp khác – ngoài R2, cho phép số biến giải thích thay đổi khi đánh giá mức độ phù hợp là sử dụng các tiêu chí khác cho việc so sánh giữa các mơ hình, chẳng hạn như Akaike Information Criterion (AIC) của Akaike (1974):
=> Ln(AIC)=
Tiêu chí Schwarz Bayesian Criterion (SBC) của Schwarz (1978): SBC=
=> Ln(SBC)=
Tiêu chí Finite Prediction Error (FPE) của Akaike (1970): FBE=
Và tiêu chí Hannan and Quin Criterion (HQC) của Quin (1979): HQC=
Asteriou (2007) cho rằng nên chọn mơ hình với các tiêu chí trên sao cho chúng có giá trị nhỏ nhất. Thường các tiêu chí này có thể cho các kết quả trái ngược nhau, dẫn đến có thể có các kết luận khác nhau. Tuy nhiên, nguyên tắc chung là nên chọn mơ hình nào có nhiều tiêu chí có giá trị nhỏ hơn so với các mơ hình khác. Tiêu chí AIC là tiêu chí được sử dụng phổ biến nhất trong phân tích chuỗi thời gian.
2.4. Kiểm định quan hệ nhân quả Granger
Để kiểm định liệu có tồn tại mối quan hệ nhân quả Granger giữa hai chuỗi thời gian Y và X trên Eviews, ta xây dựng hai phương trình sau:
Yt = 0 + 1Yt-1 + … + 1Yt-1 +1Xt-1 + … + 1Xt-1 + t (8.2) Xt = 0 + 1Xt-1 + … + 1Xt-1 +1Yt-1 + … + 1Yt-1 + t (9.2)
Để xem các biến trễ của X có giải thích cho Y (X tác động nhân quả Granger lên Y) và các biến trễ của Y có giải thích cho X (Y tác động nhân quả Granger lên X) hay không ta kiểm định giả thiết sau đây cho mỗi phương trình:
H0: 1 = 2 = … = 1 = 0 (10.2)
Để kiểm định giả thuyết đồng thời này, ta sử dụng thống kê F của kiểm định Wald và cách quyết định như sau: Nếu giá trị thống kê F tính tốn lớn hơn giá trị thống kê F phê phán ở một mức ý nghĩa xác định ta bác bỏ giả thuyết H0 và ngược lại. Có bốn khả năng như sau:
▪ Nhân quả Granger một chiều từ X sang Y nếu các biến trễ của X có tác động lên Y, nhưng các biến trễ của Y không tác động lên X.
▪ Nhân quả Granger một chiều từ Y sang X nếu các biến trễ của Y có tác động lên X, nhưng các biến trễ của X khơng có tác động lên Y.
▪ Nhân quả Granger hai chiều giữa X và Y nếu các biến trễ của X có tác động lên Y và các biến trễ của Y có tác động lên X.
▪ Khơng có quan hệ nhân quả Granger giữa X và Y nếu các biến trễ của X khơng có tác động lên Y và các biến trễ của Y không tác động lên X.