Các mô hình kinh tế lượng chủ yếu dựa trên một động thái rõ nét của các đối tượng có liên quan đến hệ thống kinh tế. Tuy nhiên một họ các mô hình thay thế khác được sử dụng rộng rãi, đặc biệt trong dự báo ngắn hạn, được gọi là các mô hình chuỗi thời gian. Chủ yếu, các mô hình này nối kết một biến phụ thuộc với các
giá trị của nó trong quá khứ và với các sai số ngẫu nhiên mà có thể có tương quan theo chuỗi. Một các tổng quát, các mô hình chuỗi thời gian không dựa trên bất kỳ một động thái kinh tế rõ nét nào.
Cách đây 30 năm, các mô hình chuỗi thời gian được sử dụng phổ biến nhất trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập kỷ gần đây, các phương pháp chuỗi thời gian đã được sử dụng rất rộng rãi trong kinh tế học đặc biệt là trong dự báo ngắn hạn, trong đó các mô hình chuỗi thời gian đã chứng tỏ là thích hợp hơn so với các mô hình kinh tế lượng.
Một phương pháp rất phổ biến trong việc lập mô hình chuỗi thời gian là phương pháp trung bình trượt kết hợp tự hồi quy (autoregressive integrated
moving average - ARIMA), thường được gọi là phương pháp luận Box-Jenkins.
Trọng tâm của các phương pháp dự báo mới này không phải là xây dựng các mô hình đơn phương trình hay phương trình đồng thời mà là phân tích các tính chất xác
suất hay ngẫu nhiên của bản thân các chuỗi thời gian kinh tế theo triết lý “hãy để dữ
liệu tự nói”.
Không giống như các mô hình hồi quy trong đó Yt được giải thích bởi k biến
làm hồi quy X1, X2, X3, ..., Xk, trong các mô hình chuỗi thời gian kiểu Box-Jenkins, Yt có thể được giải thích bởi các giá trị trong quá khứ hay giá trị trễ của bản thân
9
biến Y và các sai số ngẫu nhiên. Vì lý do này, các mô hình ARIMA đôi khi được gọi là mô hình lý thuyết a bởi vì các mô hình này không thể suy ra được từ bất cứ lý thuyết kinh tế nào - và các lý thuyết kinh tế thường là cơ sở cho các mô hình phương trình đồng thời.
Sau đây là một hình theo phương pháp luận Box-Jenkins trong quá trình dự báo từ mô hình chuỗi thời gian:
a) Mô hình tự hồi quy (AR):
Mô hình chuỗi thời gian tự hồi quy hoàn toàn có cấu trúc như sau:
t
* p t p
* 2 t 2
* 1 t 1
*
t Y Y ... Y u
Y = − + − + + − + hay (Yt −)=1(Yt−1−)+2(Yt−2 −)++p(Yt−p −)+ut
Trong đó Yt* là quan sát thứ t đối với biến phụ thuộc sau khi trừ đi giá trị
trung bình (μ) của chính nó, và ut là thành phần sai số có trung bình bằng 0 và phương sai không đổi, và không tương quan với us nếu t ≠ s (khái niệm này gọi là nhiễu trắng – white noise). Thành phần hằng số được bỏ qua vì Yt được biểu diễn dạng độ thiên lệch khỏi giá trị trung bình. Nói cách khác, Yt được mô hình hóa chỉ với quá khứ của nó và không với các biến độc lập khác. Đây là các mô hình tự hồi qui, AR và mô hình trong phương trình trên được gọi là mô hình AR (p), với p là bậc tự hồi quy.
- Nếu ta lập mô hình Yt như sau: (Yt - μ) = α1(Yt-1 - μ) + ut
với μ là giá trị trung bình của Y và ut là một số hạng sai số ngẫu nhiên không
tương quan (có giá trị trung bình bằng 0 và phương sai không đổi σ2) thì ta nói rằng Yt tuân theo quá trình ngẫu nhiên tự hồi quy bậc nhất hay AR(1). Ở đây, giá trị Y
trong thời đoạn t phụ thuộc vào giá trị của nó trong thời đoạn trước và vào một yếu tố ngẫu nhiên; các giá trị của Y được biểu diễn dưới dạng độ lệch khỏi giá trị trung bình của nó. Nói một cách khác, mô hình này cho biết giá trị dự báo của Y trong thời đoạn t chỉ đơn giản là tỷ lệ (α1) của giá trị của nó trong thời đoạn (t - 1) cộng
(1.14)
10
với yếu tố nhiễu ngẫu nhiên trong thời gian t; một lần nữa, các giá trị của Y được biểu diễn xung quanh giá trị trung bình của nó.
- Nhưng nếu xem xét mô hình sau:
(Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + ut
thì ta có thể nói rằng Yt tuân theo quá trình tự hồi quy bậc hai hay AR(2).
Tức là, giá trị của Y trong thời đoạn t phụ thuộc vào giá trị của nó trong hai thời đoạn trước đó, với các giá trị của Y được biểu diễn xung quanh giá trị trung bình μ.
Nói chung, ta có thể viết mô hình sau:
(Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + … + αp(Yt-p - μ) + ut
Trong trường hợp này, Yt là quá trình tự hồi quy bậc p hay AR(p).
b) Mô hình trung bình trượt (MA)
Quá trình AR vừa đề cập trên không phải là cơ chế duy nhất có thể tạo ra chuỗi dữ liệu Y.
- Giả sử ta lập mô hình Y như sau:Yt =+ut +1ut−1
với μ là hằng số và ut là số hạng sai số nhiễu ngẫu nhiên thuần túy. Ở đây, Y trong thời gian t bằng một hằng số cộng với trung bình trượt của sai số hiện tại và
quá khứ. Vậy trong trường hợp này, ta nói rằng Y tuân theo quá trình trung bình trượt bậc nhất hay MA(1).
- Nhưng nếu Y tuân theo biểu thức:
q t q 1
t 1 t
t u u u
Y =+ + − ++ −
thì đó là một quá trình trung bình trượt bậc hai hay MA(2).
- Tổng quát hơn, ta có mô hình cho quá trình trung bình trượt bậc q hay
MA(q):Yt =+ut +1ut−1 ++qut−q.
c) Các mô hình ARIMA
(1.15)
(1.16)
(1.17)
11
Phối hợp giữa các mô hình tự hồi quy (AR) và trung bình trượt (MA) ta tạo ra được mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát:
q t q 1
t 1 t p t p 2
t 2 1 t 1
t Y Y Y u u u
Y =+ − + − ++ − + + − ++ −
• Sai phân hoá
Hầu hết các chuỗi dữ liệu trong kinh tế luôn có tính không dừng bởi vì chúng tăng trưởng dần theo thời gian. Chẳng hạn, nếu Yt có xu hướng theo thời gian dạng tuyến tính hay lũy thừa thì nó sẽ không dừng. Việc ước lượng của quá trình
ARMA đòi hỏi Yt phải là một chuỗi dừng. Hầu hết các chuỗi thời gian không dừng đều có thể được chuyển thành dạng dừng thông qua quá trình sai phân hóa.
Giả sử, xét một xu hướng tuyến tính có dạng Yt = α + βt. Sai phân bậc nhất của Yt được định nghĩa là: ΔYt = Yt –Yt-1.
Ta thấy: ΔYt = α + βt – α – β(t–1) = β là hằng số và do đó nó có tính dừng.
Do đó, xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai phân một lần. Nếu một chuỗi tăng trưởng theo lũy thừa với mức tăng không đổi, ln(Yt) sẽ có xu hướng tuyến tính và có thể lấy sai phân.
Dễ dàng chứng minh được là xu hướng bậc 2 có thể được loại bỏ bằng cách lấy sai phân 2 lần. Sai phân bậc hai (ký hiệu là Δ2Y) được định nghĩa là sai phân bậc nhất của sai phân bậc nhất. Do đó:
2 t 1 t t
2 t 1 t 1
t t
2Y=(Y −Y− )−(Y− −Y− )=Y −2Y− +Y−
Một dạng khác mà trong đó tính không dừng thường xuất hiện đó là tính mùa. Tính không dừng trong các chuỗi theo tháng và theo quý thường có thể được
loại bỏ bằng cách lấy sai phân thích hợp: Δ4 = Yt – Yt-4 đối với dữ liệu theo quý và Δ12 = Yt – Yt-12 đối với dữ liệu theo tháng.
• Mô hình ARIMA
Đa số dữ liệu kinh tế theo chuỗi thời gian không có tính dừng mà có tính kết.
Để nhận được dữ liệu có tính dừng, chúng ta phải sử dụng sai phân của dữ liệu.
(1.18)
12
+ Các bậc sai phân
- Sai phân bậc 0 là I(0): chính là dữ liệu gốc Yt. - Sai phân bậc 1 là I(1): wt = Yt – Yt-1.
- Sai phân bậc 2 là I(2): w2t = wt – wt-1
- Sai phân bậc d ký hiệu I(d).
Mô hình ARMA(p,q) áp dụng cho I(d) được gọi là mô hình ARIMA(p,d,q).
• Mô hình SARIMA
Trong mô hình ARIMA nếu chúng ta tính toán sai phân bậc nhất với độ trễ lớn hơn 1 để khử tính mùa vụ như sau wt = Yt – Yt-s, với s là số kỳ giữa các mùa thì mô hình lúc này được gọi là SARIMA hay ARIMA có tính mùa vụ.
1.1.2. Phương pháp chuyên gia