PHỤ LỤC 1: MƠ HÌNH NGHIÊN CỨU
1.1 Mơ hình VAR (Vector tự hồi quy VAR - Vector Autoregressions)
Mơ hình VAR thơng thường được sử dụng trong hệ thống dự báo chuỗi thời gian có tương quan với nhau và phân tích tính động đối với nhiễu ngẫu nhiên trong hệ thống các biến. Mơ hình VAR là một mơ tả tập hợp gồm k các biến nội sinh (endogenous variables) như là hàm tuyến tính của các biến trong quá khứ. Mơ hình VAR bậc p có dạng:
Yt = A1Yt-1 + A2Yt-2 + … + ApYt-p + BXt + εt (1) Với Yt là k vector biến nội sinh, trong đó
Yi,t là biến thứ i quan sát tại thời điểm t. Yt-m là quan sát của vector Y tại độ trễ m.
Xt là d vector biến ngoại sinh (exogenous variables). εt là vector sai số và có những đặc tính sau:
+ E(εt )=0, trung bình của sai số bằng 0.
+ E(εt, ε’t)=Ω, ma trận hiệp phương sai của sai số (covariance matrix of error terms) và đây là ma trận xác định dương.
+ E(εt, ε’t-k)=0, với k khác 0, khơng có tương quan giữa các độ trễ theo thời gian.
Các ma trận Ai và B là các ma trận hệ số được mô phỏng, Ai là ma trận kxk và B là vector hằng số.
1.2 Chuỗi dữ liệu dừng – Stationary
1.2.1 Khái niệm
Một khái niệm quan trọng trong các quy trình phân tích chuỗi thời gian là tính dừng. Một chuỗi dừng là chuỗi có giá trị trung bình, phương sai và hiệp phương sai không thay đổi theo thời gian. Điều này ngụ ý rằng các giá trị này giống nhau tại bất kỳ thời điểm t. Các đặc điểm của chuỗi dừng bao gồm:
quanh giá trị trung bình trong dài hạn. Hay E(Yt) là hằng số tại tất cả thời điểm t; E(Yt)=μ với μ là trung bình tổng thể.
+ Chuỗi có giá trị phương sai xác định không thay đổi theo thời gian.
Hay Var(Yt) là hằng số tại tất cả thời điểm t; Var(Yt)=E(Yt-μ)2=ζ2, và ζ là độ lệch chuẩn của tổng thể.
+ Hiệp phương sai Cov(Yt,Yt+k) là hằng số tại các thời điểm t và phụ thuộc khoảng cách giữa hai giai đoạn, với k khác 0.
Cov(Yt,Yt+k) = E(Yt - μ)E(Yt+k – μ) = γk
Trong đó: γk là hiệp phương sai ở độ trễ k, là hiệp phương sai giữa các giá trị Yt và Yt+k (hoặc Yt-k); nghĩa là, giữa hai giá trị Y cách nhau k thời đoạn.
Chuỗi thời gian dừng quan trọng, có hai lý do:
Thứ nhất, Gujarati (2003) cho rằng nếu một chuỗi thời gian không dừng,
chúng ta chỉ có thể nghiên cứu hành vi của nó trong thời gian đang được xem xét. Mỗi một mẫu dữ liệu thời gian sẽ mang một tình tiết nhất định và chỉ thể hiện những hành vi cụ thể trong khoảng thời gian đó. Kết quả là, chúng ta không thể khái quát hóa cho các giai đoạn khác nghĩa là không thể lấy đặc điểm của chuỗi thời gian giai đoạn này làm đặc điểm của một chuỗi thời gian giai đoạn khác. Đối với mục đích dự báo, các chuỗi thời gian khơng dừng như vậy có thể sẽ khơng có giá trị thực tiễn. Vì như chúng ta đã biết, trong dự báo chuỗi thời gian, chúng ta ngầm định xu hướng vận động của dữ liệu trong quá khứ và hiện tại được duy trì cho các giai đoạn trong tương lai. Thế nhưng, nếu bản thân dữ liệu ln thay đổi thì chúng ta khơng thể dự báo được điều gì cho tương lai. Hơn nữa, đối với phân tích hồi quy, nếu chuỗi thời gian không dừng thì tất cả các kết quả điển hình của một phân tích hồi quy tuyến tính cổ điển sẽ khơng có giá trị cho việc dự báo, và thường được gọi là hiện tượng “hồi quy giả mạo”. Do vậy, điều kiện cơ bản nhất cho việc dự báo một chuỗi thời gian là nó phải có tính dừng.
Thứ hai, khi biết dữ liệu dừng hay không, chúng ta sẽ giới hạn được số mơ
1.2.2 Chuỗi dừng sai phân
Nếu chuỗi thời gian là một chuỗi không dừng nhưng sai phân bậc 1 của nó là chuỗi dừng thì ta ký hiệu là I(1): ΔXt =Xt –Xt-1. Tương tự, một chuỗi dừng ở sai phân bậc 2 được ký hiệu là I(2): Δ2Xt = Xt – Xt-2 . Nếu bản thân chuỗi thời gian là chuỗi dừng thì cũng có thể gọi là chuỗi dừng sai phân bậc 0, ký hiệu I(0). Một cách tổng quát, một chuỗi dừng ở sai phân bậc k được ký hiệu là I(k):
ΔkXt =Xt –Xt-k.
1.2.3 Phương pháp kiểm định chuỗi dừng
Có hai phương pháp thường được sử dụng để kiểm định chuỗi dừng là sử dụng giản đồ tự tương quan (dựa vào thống kê t và thống kê Q) và kiểm định nghiệm đơn vị (dựa vào thống kê t của Dickey-Fuller)
1.2.3.1 Giản đồ tự tương quan
Khi một biến được đo lường theo thời gian, thì các quan sát ở các giai đoạn thời gian khác nhau thường tương quan với nhau. Sự tương quan này thường được đo bằng hệ số tự tương quan. Tự tương quan là sự tương quan giữa một biến trễ một hoặc k giai đoạn với chính bản thân biến đó. Chúng ta sẽ thảo luận các hệ số tự tương quan cho các độ trễ khác nhau của một chuỗi thời gian nhất định được sử dụng như thế nào để nhận biết các dạng dữ liệu khác nhau
Hệ số tự tương quan tổng thể có độ trễ bậc k (ký hiệu là ρk) được xác định theo công thức sau:
ρk = (2)
Nếu chia các từ và mẫu của phương trình trên cho n thì hệ số tự tương quan trên có thể được viết lại như sau:
(3)
Do thực tế ta chỉ làm việc với dữ liệu mẫu, nên ta chỉ có thể ước lượng hệ số tương quan mẫu (ký hiệu rk) theo công thức sau:
rk = (4)
Trong đó: là giá trị trung bình mẫu của chuỗi Yt k là độ trễ
n là số quan sát của mẫu
Kiểm định hệ số tương quan là cơ sở để giúp người phân tích dữ liệu biết được chuỗi thời gian đang xem xét là thuộc dạng dữ liệu nào: ngẫu nhiên, dừng, có yếu tố xu thế hoặc có yếu tố mùa vụ.
Có hai phương pháp kiểm định hệ số tự tương quan có ý nghĩa thống kê hay khơng, đó là thống kê t và thống kê Q
Thống kê t:
Gọi ρk là hệ số tự tương quan tổng thể (rk là ước lượng khơng chệch của ρk), ta có các giả thiết sau:
H0: ρk = 0 H1: ρk ≠ 0
Nếu một chuỗi thời gian ngẫu nhiên thì các hệ số tự tương quan là một biến ngẫu nhiên có phân phối chuẩn với trung bình là 0 và phương sai là 1/N. như vậy với sai số chuẩn của hệ số tự tương quan se(rk) là , ta có thể xây dựng cho khoảng tin cậy cho ρk hoặc tìm được giá trị thống kê t tính toán ở một mức ý nghĩa xác định. Nếu ρk nằm ngồi khoảng tin cậy đó hoặc giá trị t tính tốn lớn hơn giá trị t quan sát ta bác bỏ giả thiết H0. Việc bác bỏ hay không bác bỏ một giả thiết H0 phụ thuộc vào cỡ mẫu và mức ý nghĩa được chọn.
Thống kê Q:
xác suất tương ứng. Thống kê Q kiểm định giả thiết đồng thời là tất cả các hệ số ρk cho tới một độ trễ đồng thời bằng không. Giá trị thống kê Q tính tốn theo công thức sau đây:
Với cỡ mẫu lớn, Q có phân phối theo Chi bình phương với bậc tự do bằng số độ trễ. Nếu giá trị thống kê Q tính tốn lớn hơn giá trị thống kê Q quan sát ở một mức ý nghĩa xác định, ta bác bỏ giả thiết H0.
Nếu hệ số tự tương quan đầu tiên khác không nhưng các hệ số tự tương quan tiếp theo bằng không một cách có ý nghĩa thống kê, thì đó là một chuỗi dừng. Nếu một số hệ số tự tương quan khác khơng một cách có ý nghĩa thống kê thì đó là một chuỗi khơng dừng.
1.2.3.2 Kiểm định nghiệm đơn vị
Kiểm định nghiệm đơn vị là một kiểm định được sử dụng khá phổ biến để kiểm định một chuỗi thời gian là dừng hay không dừng. Khi thực hiện nghiên cứu khoa học với dữ liệu chuỗi thời gian, chúng ta nên áp dụng kiểm định nghiệm đơn vị (thay vì giản đồ tự tương quan), vì loại kiểm định này có tính học thuật và chuyên nghiệp cao hơn. Giả sử ta có phương trình tự hồi quy như sau:
Yt = ρYt-1 + ut (-1 ≤ ρ ≤ 1) (6)
Giả thiết H0: ρ =1 (Yt là chuỗi không dừng) H1: ρ < 1 (Yt là chuỗi dừng)
Phương trình (1) tương đượng với phương trình sau: Yt – Yt-1 = ρYt-1 – Yt-1 + ut
= (ρ-1)Yt-1 + ut
ΔYt = δYt-1 + ut (7)
Như vậy các giả thiết trên được viết lại như sau: Giả thiết H0: δ=0 (Yt là chuỗi không dừng)
Dickey và Fuller cho rằng giá trị t ước lượng của hệ số Yt-1 sẽ theo phân phối xác suất η (tau statistic, η = giá trị δ ước lượng/sai số của hệ số δ). Kiểm định thống kê η còn được gọi là kiểm định Dickey – Fuller (DF).
Kiểm định DF được ước lượng với 3 hình thức:
+ Khi Yt là một bước ngẫu nhiên khơng có hằng số:
ΔYt = δYt-1 + ut (DF1)
+ Khi Yt là một bước ngẫu nhiên có hằng số:
ΔYt = β1 + δYt-1 + ut (DF2)
+ Khi Yt là một bước ngẫu nhiên với hằng số xoay quanh một đường xu thế ngẫu nhiên:
ΔYt = β1 + β2t + δYt-1 + ut (DF3)
Để kiểm định H0 ta so sánh giá trị thống kê η tính tốn với giá trị thống kê η tra bảng DF (các phần mềm kinh tế lượng đều cung cấp giá trị thống kê η). Nếu giá trị tuyệt đối của thống kê η lớn hơn giá trị η tra bảng, ta bác bỏ giả thiết H0, nghĩa là Yt là một chuỗi dừng. Ngược lại, nếu giá trị tuyệt đối của thống kê η nhỏ hơn giá trị η tra bảng, ta không bác bỏ giả thuyết H0, nghĩa là Yt là một chuỗi không dừng.
Do có thể có hiện tượng tương quan chuỗi giữa các ut do thiếu biến, nên người ta thường sử dụng kiểm định DF mở rộng là ADF (Augmented Dickey – Fuller Test). Kiểm định này được thực hiện bằng cách đưa thêm vào phương trình (DF3) các biến trễ của sai phân biến phụ thuộc ∆Yt.
1.3 Các tiêu chí lựa chọn độ trễ tối ƣu
Một số tiêu chí thường được sử dụng để đánh giá mức độ phù hợp của một mơ hình hồi quy như AIC, FPE, SBC, và HQC (có sẵn trong kết quả hồi quy trên Eviews)
và vì thế R2 sẽ tăng. Tuy nhiên, cái giá của việc tăng R2 là giảm số bậc tự do trong mơ hình. Một phương pháp khác ngồi R2 cho phép các biến giải thích thay đổi khi đánh giá mức độ phù hợp là sử dụng các tiêu chí khác cho việc so sánh giữa các mơ hình, chẳng hạn như Akaike Information Criterion (AIC) của Akaike (1974); Tiêu chí Schwarz Bayesian Criterion (SBC) của Schwarz (1978); Tiêu chí Finite Prediction Error (FPE) của Akaike (1970); Và tiêu chí Hannan and Quin Criterion (HQC) của Quin (1979):
Asteriou (2007) cho rằng chúng ta nên chọn mơ hình với các tiêu chí trên sao cho chúng có giá trị nhỏ nhất. Nói chung, thường thì các tiêu chí này có thể cho các kết quả trái ngược nhau, dẫn đến có thể có các kết luận khác nhau. Tuy nhiên, nguyên tắc chung là nên chọn mơ hình nào có nhiều tiêu chí có giá trị nhỏ hơn so với các mơ hình khác. Tiêu chí AIC là tiêu chí được sử dụng phổ biến nhất trong phân tích chuỗi thời gian
1.4 Kiểm định quan hệ nhân quả Granger
Để kiểm định liệu có tồn tại mối quan hệ nhân quả Grangergiữa hai chuỗi thời gian Y và X trên Eviews, ta xây dựng hai phương trình sau:
Yt = α0 + α1Yt-1 + … + αkYt-k + β1Xt-1 + … + βkXt-k + εt (8) Xt = α0 + α1Xt-1 + … + αkXt-k + β1Yt-1 + … + βkYt-k + εt (9)
Để xem các biến trễ của X có giải thích cho Y (X tác động nhân quả Granger lên Y) và các biến trễ của Y có giải thích cho X (Y tác động nhân quả Granger lên X) hay không ta kiểm định giả thiết sau đây cho mỗi phương trình:
H0: β1 = β2 = … = βk = 0
Để kiểm định giả thiết đồng thời này, ta sử dụng thống kê F của kiểm định Wald và cách quyết định như sau: Nếu giá trị thống kê F tính tốn lớn hơn giá trị thống kê F phê phán ở một mức ý nghĩa xác định, ta bác bỏ giả thiết H0 và ngược lại. Có 4 khả năng xảy ra:
Nhân quả Granger một chiều từ X sang Y nếu các biến trễ của X có tác động lên Y, nhưng các biến trễ của Y khơng có tác động lên X
động lên X, nhưng các biến trễ của X khơng có tác động lên Y
Nhân quả Granger hai chiều giữa X và Y nếu các biến trễ của X có tác động lên Y và các biến trễ của Y có tác động lên X
Khơng có quan hệ nhân quả Granger giữa X và Y nếu các biến trễ của X khơng có tác động lên Y và các biến trễ của Y khơng có tác động lên X