Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 55 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
55
Dung lượng
1,06 MB
Nội dung
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
KHOA TOÁN
======
LƢƠNG THỊ THOA
MÔ HÌNH ARIMA VÀ ỨNG DỤNG
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Toán ứng dụng
HÀ NỘI - 2015
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
KHOA TOÁN
======
LƢƠNG THỊ THOA
MÔ HÌNH ARIMA VÀ ỨNG DỤNG
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Toán ứng dụng
Ngƣời hƣớng dẫn khoa học
TS. TRẦN TRỌNG NGUYÊN
HÀ NỘI - 2015
LỜI CẢM ƠN
Trong quá trình nghiên cứu khóa luận"Mô hình ARIMA và ứng
dụng" với sự cố gắng của bản thân và sự giúp đỡ nhiệt tình của các thầy cô
trong tổ Toán ứng dụng, các bạn sinh viên khoa Toán em đã hoàn thành
khóa luận này.
Em xin chân thành cảm ơn sự giúp đỡ quý báu của các thầy cô trong
tổ Toán ứng dụng, trƣờng đại học sƣ phạm Hà Nội 2 và các bạn sinh viên
đã tạo điều kiện cho em trong suốt thời gian làm khóa luận.
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hƣớng dẫn, Tiến
sĩ Trần Trọng Nguyên, ngƣời đã hƣớng dẫn em tận tình và đóng góp ý
kiến quý báu cho em trong quá trình thực hiện và hoàn thành khóa luận
này.
Hà Nội, ngày 2 tháng 5 năm 2015
Sinh viên
Lƣơng Thị Thoa
LỜI CAM ĐOAN
Khóa luận này là kết quả của bản thân em trong quá trình học tập và
nghiên cứu. Bên cạnh đó em đƣợc sự quan tâm của các thầy cô trong khoa
Toán. Đặc biệt là sự hƣớng dẫn của thầy: Trần Trọng Nguyên.
Trong khi nghiên cứu hoàn thành khóa luận này em có tham khảo một
số tài liệu đã ghi trong phần tài liệu tham khảo.
Em xin cam đoan kết quả của khóa luận này không có sự trùng lặp với
kết quả của tác giả khác.
Hà Nội, ngày 2 tháng 5 năm 2015
Sinh viên
Lƣơng Thị Thoa
MỤC LỤC
LỜI MỞ ĐẦU .............................................................................................. 1
1. Lí do chọn đề tài ....................................................................................... 1
2. Mục đích nghiên cứu ................................................................................ 1
3. Đối tƣợng và phạm vi nghiên cứu ............................................................ 2
4. Phƣơng pháp và công cụ nghiên cứu ........................................................ 2
5. Khái quát về nội dung và phạm vi nghiên cứu ......................................... 2
CHƢƠNG 1. KIẾN THỨC CHUẨN BỊ ...................................................... 3
1.1. Biến ngẫu nhiên và quy luật phân phối xác suất ................................... 3
1.1.1. Biến ngẫu nhiên một chiều .................................................................. 3
1.1.1.1. Định nghĩa biến ngẫu nhiên ...................................................... 3
1.1.1.2. Hàm phân phối xác suất ............................................................ 3
1.1.2. Biến ngẫu nhiên hai chiều ................................................................... 3
1.1.2.1. Định nghĩa ................................................................................. 3
1.1.2.2. Hàm phân phối xác suất ............................................................ 3
1.1.2.3. Sự độc lập của hai biến ngẫu nhiên ........................................... 4
1.1.3. Biến ngẫu nhiên nhiều chiều ............................................................... 4
1.1.3.1. Định nghĩa ................................................................................. 4
1.1.3.2. Hàm phân phối xác suất ........................................................... 4
1.1.3.3. Tính độc lập của nhiều biến ngẫu nhiên .................................... 5
1.1.4. Một số đặc trƣng của biến ngẫu nhiên. ................................................ 5
1.1.4.1. Kỳ vọng .................................................................................... 5
1.1.4.2. Phƣơng sai ................................................................................. 6
1.1.4.3. Hiệp phƣơng sai ....................................................................... 6
1.1.4.4. Hệ số tƣơng quan ...................................................................... 6
1.1.5. Một số quy luật phân phối ................................................................... 7
1.1.5.1. Quy luật phân phối chuẩn.......................................................... 7
1.1.5.2. Quy luật Khi bình phƣơng........................................................ 7
1.2. Phân tích hồi quy ................................................................................... 8
1.2.1. Mô hình hồi quy tuyến tính hai biến ................................................... 8
1.2.2. Hàm hồi quy tổng thể .......................................................................... 9
1.2.3. Hàm hồi quy mẫu ................................................................................ 9
1.2.4. Phƣơng pháp ƣớc lƣợng OLS ............................................................ 10
1.3. Giới thiệu về chuỗi thời gian và toán tử trễ ......................................... 11
1.3.1. Chuỗi thời gian .................................................................................. 11
1.3.2. Toán tử trễ ......................................................................................... 12
1.4. Quá trình ngẫu nhiên dừng và không dừng ......................................... 12
1.5. Hàm tự tƣơng quan và hàm tự tƣơng quan riêng................................. 14
1.5.1. Hàm tự tƣơng quan ............................................................................ 14
1.5.2. Hàm tự tƣơng quan riêng ................................................................... 14
1.6. Nhiễu trắng và bƣớc ngẫu nhiên .......................................................... 15
1.6.1. Nhiễu trắng ........................................................................................ 15
1.6.2. Bƣớc ngẫu nhiên ................................................................................ 15
CHƢƠNG 2. MÔ HÌNH ARIMA VÀ ỨNG DỤNG ................................ 17
2.1. Mô hình ARIMA ................................................................................. 17
2.1.1. Quá trình trung bình trƣợt (MA) ....................................................... 17
2.1.2. Quá trình tự hồi quy (AR – Autoregressive Process) ........................ 17
2.1.3. Quá trình trung bình trƣợt tự hồi quy ARMA ................................... 18
2.1.4. Quá trình trung bình trƣợt, tích hợp tự hồi quy ARIMA ................... 19
2.1.5. Dự báo ............................................................................................... 19
2.1.5.1. Dự báo quá trình AR(p) .......................................................... 19
2.1.5.2. Dự báo quá trình MA (q)......................................................... 20
2.1.5.3. Dự báo quá trình ARMA(p,q) ................................................. 21
2.1.5.4. Dự báo quá trình ARIMA(p,d,q) ............................................. 21
2.1.6. Kiểm định nghiệm đơn vị .................................................................. 22
2.1.7. Phƣơng pháp Box – Jenkins. ............................................................. 24
2.1.7.1. Định dạng mô hình – xác định tham số p, d, q ........................ 24
2.1.7.2. Ƣớc lƣợng mô hình ................................................................. 30
2.1.7.3. Kiểm định tính thích hợp của mô hình .................................... 32
2.1.7.4. Dự báo và sai số dự báo .......................................................... 35
2.2. Ứng dụng mô hình ARIMA dự báo chỉ số VNINDEX. ...................... 39
2.2.1. Xây dựng mô hình ARIMA cho chuỗi VNINDEX ........................... 39
2.2.2. Ƣớc lƣợng các tham số của mô hình ................................................. 42
2.2.3. Kiểm tra sự phù hợp của mô hình ..................................................... 43
2.2.4. Dự báo giá ......................................................................................... 44
KẾT LUẬN ................................................................................................ 47
DANH MỤC TÀI LIỆU THAM KHẢO ................................................... 48
LỜI MỞ ĐẦU
1. Lí do chọn đề tài
Chuỗi thời gian đang đƣợc sử dụng nhƣ một công cụ hữu hiệu để phân
tích và dự báo trong kinh tế xã hội cũng nhƣ trong nghiên cứu khoa học.
Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều nghiên
cứu đã đề xuất các công cụ để phân tích và dự báo chuỗi thời gian. Trong
những năm trƣớc, công cụ để phân tích chuỗi thời gian là sử dụng các công
cụ thống kê nhƣ hồi quy, phân tích Furie và một vài công cụ khác.Nhƣng
hiệu quả nhất là mô hình ARIMA của Box-Jenkins. Từ các công trình ban
đầu về chuỗi thời gian, hiện nay mô hình này đang đƣợc dùng rất nhiều để
phân tích và dự báo trong các lĩnh vực: kinh tế,tài chính, chứng khoán, giáo
dục, thời tiết, dân số,...
Nghiên cứu phân tích và dự báo chuỗi thời gian luôn là một bài toán
gây đƣợc sự chú ý của các nhà toán học, kinh tế, xã hội học,… Các quan
sát trong thực tế thƣờng đƣợc thu thập dƣới dạng chuỗi số liệu. Từ những
số liệu này, ngƣời ta có thể rút ra đƣợc những quy luật của một quá trình
đƣợc mô tả thông qua chuỗi số liệu.
Xuất phát từ thực tế ứng dụng lớn của mô hình ARIMA, em chọn đề
tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa
luận của mình.
2. Mục đích nghiên cứu
- Nghiên cứu một số khái niệm và tính chất cơ bản về chuỗi thời gian;
các quá trình trung bình trƣợt (MA),quá trình tự hồi quy (AR), quá trình
trung bình trƣợt tự hồi quy (ARMA)và quá trình trung bình trƣợt, tích hợp
tự hồi quy (ARIMA).
-Ứng dụng mô hình ARIMA dự báo chuỗi chỉ số VNINDEX với sự
hỗ trợ của phần mềm Eviews.
1
3. Đối tƣợng và phạm vi nghiên cứu
- Đối tƣợng nghiên cứu: Mô hình ARIMA
- Phạm vi nghiên cứu: Mô hình ARIMA, phƣơng pháp Box – Jenkins,
ứng dụng trong dự báo chỉ số VNINDEX
4.Phƣơng pháp và công cụ nghiên cứu
- Phƣơng pháp so sánh, phân tích, tổng hợp kiến thức.
- Phƣơng pháp phân tích thực nghiệm với dữ liệu thực tế.
- Sử dụng phần mềm Excel, Eviews.
5.Khái quát về nội dung và phạm vi nghiên cứu
Nội dung của khóa luận này bao gồm 2 chƣơng:
- Chƣơng 1. Kiến thức chuẩn bị: Chƣơng này trình bày một số khái
niệm và kiến thức cơ bản sẽ đƣợc sử dụng trong chƣơng sau.
- Chƣơng 2.Mô hình ARIMA và ứng dụng: Chƣơng này trình bày các
lớp mô hình ARIMA và thử nghiệm ứng dụng các mô hình này để dự báo
chỉ số VNINDEX.
2
CHƢƠNG 1. KIẾN THỨC CHUẨN BỊ
1.1. Biến ngẫu nhiên và quy luật phân phối xác suất
1.1.1. Biến ngẫu nhiên một chiều
1.1.1.1. Định nghĩa biến ngẫu nhiên
Định nghĩa 1.1: Cho (, F, P) là một không gian xác suất. Nếu X là
một ánh xạ đo đƣợc từ vào thì X đƣợc gọi là một biến ngẫu nhiên
(hoặc một đại lƣợng ngẫu nhiên).
Nói cách khác: X là một hàm số thực, hữu hạn, xác định trên sao
cho với mỗi x thì : X x F.
1.1.1.2. Hàm phân phối xác suất
Định nghĩa 1.2. Hàm phân phối xác suất của biến ngẫu nhiên X đƣợc
ký hiệu và xác định nhƣ sau: FX ( x) P : X () x, x .
Nhƣ vậy hàm phân bố xác suất là sự thu hẹp của độ đo xác suất P lên
lớp các khoảng , x của đƣờng thẳng thực . Để cho gọn ta sẽ ký hiệu
F ( x) P( X x), x .
1.1.2. Biến ngẫu nhiên hai chiều
1.1.2.1. Định nghĩa
Định nghĩa 1.3. Cho không gian xác suất (, F, P) và hai biến ngẫu
nhiên X và Y xác định trên nó. Khi đó hệ V (X,Y) đƣợc gọi là một biến
ngẫu nhiên 2-chiều, tức là V là một ánh xạ từ vào 2 sao cho với mỗi
thì V ( ) X ( ),Y ( ) .
1.1.2.2. Hàm phân phối xác suất
Định nghĩa 1.4. (Hàm phân phối đồng thời) Hàm phân phối xác suất
đồng thời của một biến ngẫu nhiên 2-chiều V ( X ,Y ) đƣợc định nghĩa
nhƣ sau:
3
F ( x, y) P X x Y y ,
( x, y ) .
Định nghĩa 1.5. (Các hàm phân phối biên) Nếu F(x,y) là hàm phân
phối xác suất đồng thời của biến ngẫu nhiên 2-chiều V ( X ,Y ) thì các
hàm:
F ( x, ) P( X x) F1 ( x);
F ( y, ) P(Y y ) F2 ( y )
là các hàm phân phối của các biến ngẫu nhiên thành phần tƣơng ứng X và
Y. Các hàm này gọi là các hàm phân phối biên của V .
1.1.2.3. Sự độc lập của hai biến ngẫu nhiên
Định nghĩa 1.6. Hai biến ngẫu nhiên X và Y đƣợc gọi là độc lập với
nhau nếu:
F ( x, y) F1 ( x) F2 ( y) x, y .
1.1.3. Biến ngẫu nhiên nhiều chiều
1.1.3.1. Định nghĩa
Định nghĩa 1.7. Cho X1, X 2 ,...,Xn là các biến ngẫu nhiên 1-chiều
đƣợc xác định trên không gian xác suất (, F, P). Nhờ các biến ngẫu nhiên
này, với mỗi , ta có thể làm phép tƣơng ứng với một điểm
X ( ) X1 (), X 2 (),...,X n () của không gian Ơ-cơ-lít n-chiều.
Ánh xạ n lập bởi các biến ngẫu nhiên X1, X 2 ,...,Xn đƣợc gọi là
một biến ngẫu nhiên n-chiều hoặc một véc-tơ ngẫu nhiên n-chiều.
1.1.3.2. Hàm phân phối xác suất
Định nghĩa 1.8. (Hàm phân phối xác suất đồng thời) Hàm phân phối
xác suất đồng thời của biến ngẫu nhiên n-chiều đƣợc định nghĩa nhƣ sau:
F( x1 , x2 ,...,x n ) P X 1 x1 X 2 x2 ... X n xn víi ( X i ),
i (1, n)
4
Định nghĩa 1.9. (Các hàm phân phối biên)
Hàm phân phối biên của một biến
Hàm phân phối xác suất của biến X i là
Fi ( xi ) P X1 X 2 ... X i ... X n
lim F ( x1 , x2 ,..., xn ) với i j
x j
Hàm phân phối biên của một số biến
Hàm phân phối biên của các biến X i và X j và X k
Fijk ( xi , x j , xk ) lim F ( x1, x2 ,..., xn )
xr
r i , j ,k
1.1.3.3. Tính độc lập của nhiều biến ngẫu nhiên
Định nghĩa 1.10. Các biến ngẫu nhiên X1, X 2 ,...,Xn đƣợc gọi là độc
lập nếu tại mọi điểm x1, x2 ,..., xn của n ta đều có:
F ( x1, x2 ,..., xn ) F1 ( x1 ) F2 ( x2 )...Fn ( xn ) .
1.1.4.Một số đặc trƣng của biến ngẫu nhiên.
1.1.4.1.Kỳ vọng
Định nghĩa 1.11. (Kỳ vọng toán của biến ngẫu nhiên một chiều) Trên
không gian xác suất (, F, P) cho biến ngẫu nhiên X có hàm phân phối xác
suất F(x). Kỳ vọng toán của X là một số ký hiệu là E(X) và đƣợc định
nghĩa nhƣ sau:
E ( X ) xdF ( x) với giả thiết là x dF ( x) tồn tại.
Định nghĩa 1.12. (Kỳ vọng toán của hàm hai biến ngẫu nhiên) Nếu
R ( X ,Y) trong đó X và Y là hai biến ngẫu nhiên thì:
E ( R) E X ,Y xi , y j Pij
i
j
khi X và Y là hai biến ngẫu nhiên rời rạc và
5
E ( R) E X ,Y
( x, y) f ( x, y)dxdy
khi X và Y là hai biến ngẫu nhiên liên tục với hàm mật độ xác suất đồng
thời là f ( x, y)
1.1.4.2. Phương sai
Định nghĩa 1.13. Phƣơng sai của biến ngẫu nhiên X đƣợc ký hiệu là
V(X) (hoặc var(X)- viết tắt từ tiếng Anh: variance) và đƣợc định nghĩa nhƣ
sau:
xi E ( X )2 P( xi )
với X rời rạc
i
2
2
var( X ) 2 ( X ) E X E X
x E ( X )2 f ( x)d ( x) với X liên tục
1.1.4.3.Hiệp phương sai
Định nghĩa 1.14. Hiệp phƣơng sai của hai biến ngẫu nhiên X và Y
đƣợc ký hiệu là cov(X,Y) và đƣợc định nghĩa nhƣ sau:
cov( X , Y ) K ( X ,Y ) E X E X Y E (Y ) 1,1
xi E ( X ) y j E (Y ) Pij
i j
x E ( X ) y E (Y ) f ( x, y)dxdy
1.1.4.4. Hệ số tương quan
Hệ số tƣơng quan cho thông tin về mức độ chặt chẽ của mối quan hệ
tuyến tính giữa hai biến, đƣợc định nghĩa nhƣ sau:
( X ,Y )
Có thể chỉ ra rằng 0 ( X ,Y ) 1.
6
cov( X , Y )
x y
1.1.5. Một số quy luật phân phối
1.1.5.1. Quy luật phân phối chuẩn
Một biến ngẫu nhiên X đƣợc gọi là tuân theo quy luật chuẩn với kỳ
vọng , phƣơng sai 2 , ký hiệu là: X N ( , 2 ) nếu nó là biến ngẫu
nhiên liên tục với hàm mật độ sau đây:
1
( x )2
f ( x)
exp(
) với mọi x.
2 2
2
Quy luật chuẩn hóa N(0,1): Một trƣờng hợp đặc biệt và hữu dụng
trong tính toán của họ các phân phối chuẩn là phân phối chuẩn hóa
N(0,1)(là phân phối chuẩn với kì vọng bằng 0 và phƣơng sai bằng 1). Biến
ngẫu nhiên tuân theo quy luật chuẩn hóa thƣờng đƣợc kí hiệu là U, hàm
phân phối của quy luật chuẩn hóa thƣờng đƣợc kí hiệu bởi ( x) , hàm mật
độ bởi ( x)
1.1.5.2. Quy luật Khi bình phương
Quy luật Khi bình phƣơng (với k bậc tự do) ký hiệu là k2 có quan hệ
trực tiếp với quy luật chuẩn và đƣợc xác định nhƣ sau:
X U12 U 22 U k2 .
trong đó U1,U2,...,Uk là các biến ngẫu nhiên độc lập với nhau và cùng tuân
theo quy luật chuẩn hóa, khi đó X tuân theo quy luật Khi bình phƣơng với
k bậc tự do.
Nếu X k2 thì E(X) =k, var(X) = 2k.
Có thể thấy rằng biến ngẫu nhiên tuân theo quy luật Khi bình phƣơng
chỉ nhận giá trị không âm và hàm mật độ của nó là không đối xứng.
7
1.2. Phân tích hồi quy
1.2.1. Mô hình hồi quy tuyến tính hai biến
Giả sử X và Y là hai biến của một tổng thể nào đó, mô hình hồi quy
tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X
có dạng nhƣ sau:
Y 1 2 X u
(1.1)
Nhƣ vậy, mô hình hồi quy tuyến tính hai biến bao gồm các thành phần
sau:
Các biến số: mô hình hồi quy gồm hai loại biến số:
- Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó,
thƣờng đƣợc kí hiệu là Y và nằm ở vế trái của phƣơng trình. Biến phụ
thuộc còn đƣợc gọi là biến được giải thích (explained variable) hay biến
phản ứng.
- Biến độc lập: là biến số đƣợc cho là có tác động đến biến phụ thuộc,
thƣờng đƣợc kí hiệu là X và nằm ở vế bên phải của phƣơng trình. Biến độc
lập còn đƣợc gọi là biến giải thích (explanatory variable) hay biến điều
khiển (control variable).
Sai số ngẫu nhiên:
Sai số ngẫu nhiên,thƣờng đƣợc ký hiệu là u, là yếu tố đại diện cho các
yếu tố có tác động đến biến Y, ngoài X. Trong mô hình (1.1) chúng ta
không có quan sát về nó, vì thế đôi khi u còn đƣợc gọi là sai số ngẫu nhiên
không quan sát đƣợc. Do đó, để hàm hồi quy có ý nghĩa cần đƣa ra giả thiết
cho thành phần này. Giả thiết đƣợc đƣa ra là: tại mỗi giá trị của X thì kỳ
vọng của u bằng 0: E u x 0.
Các hệ số hồi quy, bao gồm 1 và 2 , thể hiện mối quan hệ giữa X
và Y khi các yếu tố bao trùm trong u là không đổi.
8
1.2.2. Hàm hồi quy tổng thể
Với giả thiết E u x 0, ta có thể biểu diễn lại mô hình hồi quy (1.1)
dƣới dạng sau:
E (Y X ) 1 2 X
(1.2)
trong đó E (Y X ) là kỳ vọng của biến Y khi biết giá trị của biến X, hay còn
gọi là kỳ vọng của Y với điều kiện X.
Phƣơng trình (1.2) biểu diễn kỳ vọng của Y với điều kiện X nhƣ một
hàm của biến X và do X và Y thể hiện cho tổng thể nên phƣơng trình (1.2)
còn đƣợc gọi là hàm hồi quy tổng thể (PRF – population regression
function). Khi đó các hệ số hồi quy 1 và 2 còn đƣợc gọi là các tham số
của tổng thể, có ý nghĩa nhƣ sau:
Các hệ số hồi quy:
- 1 đƣợc gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến
phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0.
- 2 đƣợc gọi là hệ số góc, thể hiện quan hệ giữa biến độc lập và giá trị
trung bình của biến phụ thuộc: khi biến độc lập X tăng (giảm) một đơn vị
thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) 2 đơn vị. Hệ số có
thể nhận giá trịdƣơng, âm hoặc bằng 0.
1.2.3. Hàm hồi quy mẫu
Giả sử có mẫu ngẫu nhiên kích thƣớc n bao gồm các quan sát của biến
X và biến Y: (Yi, Xi), i=1,2,...,n. Từ mẫu ngẫu nhiên này chúng ta xây dựng
các ƣớc lƣợng cho các hệ số hồi quy tổng thể 1 và 2 , ký hiệu là
1 và 2 tƣơng ứng. Khi đó biểu diễn dƣới đây gọi là hàm hồi quy mẫu
cho hàm hồi quy tổng thể (1.1):
X.
Y
1
2
9
(1.3)
Hay có thể viết chi tiết cho từng quan sát nhƣ sau:
X , i 1,2,..., n.
Y i
1
2 i
(1.3)’
Ký hiệu mũ trên đầu ngụ ý rằng đây là giá trị ƣớc lƣợng từ mẫu chứ
không phải giá trị của tổng thể. Cụ thể hơn:
,
đƣợc gọi là hệ số hồi quy mẫu hay hệ số ƣớc lƣợng, là ƣớc
-
1
2
lƣợng của các hệ số tổng thể 1 , 2 tƣơng ứng.
- Y i đƣợc tính nhƣ trong (1.3)’ là giá trị ƣớc lƣợng cho giá trị Y khi
X=Xi.
1.2.4.Phƣơng pháp ƣớc lƣợng OLS
Phƣơng pháp ƣớc lƣợng OLS lần đầu tiên đƣợc giới thiệu bởi Gauss
vào những năm cuối thế kỷ 18 (Haper (1974-1976)) và đƣợc sử dụng rộng
rãi trong nhiều lĩnh vực. Tuy trong phân tích kinh tế lƣợng nói chung và
phân tích hồi quy nói riêng, ngƣời ta đã phát triển thêm các phƣơng pháp
ƣớc lƣợng mới, nhƣng OLS vẫn là một phƣơng pháp thông dụng do các ƣu
việt của nó. Ngoài ra, ƣớc lƣợng thu đƣợc từ OLS thƣờng đƣợc chon làm
cơ sở khi đánh giá chất lƣợng của ƣớc lƣợng thu đƣợc từ các phƣơng pháp
khác.
Để tìm hiểu phƣơng pháp OLS, ta xét mô hình hồi quy tổng thể:
Y 1 2 X u và ta cần ƣớc lƣợng các hệ số 1 , 2 .
Giả sử có mẫu ngẫu nhiên có kích thƣớc n {(Yi, Xi), i=1,2,...,n} thu
đƣợc từ tổng thể, khi đó tại mỗi quan sát ta có:
Yi 1 2 X i u i .
(1.4)
,
là các ƣớc lƣợng cần tìm của , với thông tin từ
Ký hiệu
1
2
1
2
mẫu trên, khi đó ta có thể viết thành hàm hồi quy mẫu nhƣ sau:
X.
Y i
1
2 i
10
(1.5)
Gọi sai lệch giữa các giá trị thực tế Yi và giá trị ƣớc lƣợng tƣơng ứng
từ hàm hồi quy mẫu Y i là phần dƣ (residuals), ký hiệu bởi ei:
ei Yi Y i
(1.6)
,
sao cho sai lệch tổng hợp
Chúng ta muốn xác định các giá trị
1
2
giữa các giá trị thực tế Yi và các giá trị ƣớc lƣợng tƣơng ứng từ hàm hồi
quy mẫu (1.4) là nhỏ nhất có thể đƣợc. Sai lệch này có thể đƣợc định nghĩa
bởi:
(1) Tổng các phần dƣ
n
e
i 1
i
(2) Tổng các giá trị tuyệt đối của phần dƣ
n
e
i 1
(3) Tổng bình phƣơng các phần dƣ
i
n
e
i 1
2
i
Trong phạm vi khóa luận này chúng ta sẽ sử dụng phần mềm Eviews
để hỗ trợ cho việc xác định các ƣớc lƣợng OLS.
1.3.Giới thiệu về chuỗi thời gian và toán tử trễ
1.3.1. Chuỗi thời gian
Chuỗi thời gian là dãy các quan sát về một biến số nào đó theo thời
gian. Thƣờng việc thu thập số liệu bắt đầu ở một thời điểm nhất định,
chẳng hạn t=1 và kết thúc ở một thời điểm khác t=n: (Y1,Y2 ,,Yn )
Có thể tìm đƣợc các quan sát (Y2 ,Y1,Y0 ) hoặc các quan sát sau thứ
tự n (Yn1,Yn2 ,)
- Mẫu quan sát đƣợc có thể đƣợc coi nhƣ một đoạn hữu hạn của một
chuỗi vô hạn Yt (, Y1 , Y
0 , Y1 , Y2 ,, Yn , Yn 1 , Yn 2 )
Mẫu quan sát
Chẳng hạn:
11
Yt = Pt là giá một loại /cổ phiếu ở thời điểm t;
Yt = t biến xu thế
Yt = c các thành phần của chuỗi là một hằng số
-Toán tử nhân: Yt X t
-Toán tử cộng: Yt X t Wt
1.3.2. Toán tử trễ
Giả sử có chuỗi {Xt } bây giờ ta tạo ra chuỗi mới Yt , Yt X t 1.
Ký hiệu Yt LX t X t 1 . L đƣợc gọi là toán tử trễ.
L( LX t ) L( X t 1 ) X t 2 .
Áp dụng hai lần toán tử trễ ký hiệu là L2 , L2 X t X t 2
Tổng quát, k là một số nguyên bất kỳ, Lk X t X t k
L( X t ) ( LX t ) X t 1 ;
L( X t Wt ) X t 1 Wt 1;
Yt (a bL) LX t aLX t bL2 X t aXt 1 bX t 2
(1 1L)(1 2 L) X t (1 1L 2 L 12 L2 ) X t
(1 (1 2 ) L 12 L2 ) X t
X t (1 2 ) X t 1 12 X t 2
Một biểu diễn khác (aL+bL2) đƣợc xem nhƣ là đa thức đối với toán tử
L. Về mặt đại số, nó tƣơng tự nhƣ đa thức (az+bz2), z là một vô hƣớng.
Nếu nhƣ: {Xt } {c} thì:
LX t X t 1 c; ( L L2 )c ( )c.
1.4.Quá trình ngẫu nhiên dừng và không dừng
Xét họ các biến ngẫu nhiên Y1, Y2,… trong đó các chỉ số là các thời
điểm kế tiếp nhau. Nói chung mỗi biến có một quy luật phân bố xác suất
riêng. Họ Y1, Y2,… đƣợc gọi là quá trình ngẫu nhiên. Giả sử rằng đối với
12
mỗi thời điểm, biến số tƣơng ứng nhận một giá trị cụ thể. Khi đó ta có một
chuỗi thời gian. Mặc dù chuỗi thời gian chỉ là một phép thử của một quá
trình ngẫu nhiên, nhƣng chúng ta cũng gọi chuỗi thời gian là một quá trình
ngẫu nhiên, ký hiệu là {Yt với t = 1, 2,…}
E(Yt), Var(Yt) là kỳ vọng và phƣơng sai của Yt, có thể Cov(Yi, Yj) ≠
0. Nói chung đối với mỗi Yt thì kỳ vọng, phƣơng sai và hiệp phƣơng sai là
không giống nhau.
Chuỗi Yt đƣợc gọi là dừng nếu kì vọng, phƣơng sai, hiệp phƣơng sai
không đổi theo thời gian (Engle và Granger, 1987), nghĩa là:
E (Yt ) , t
(1.7)
Var(Yt ) E (Yt )2 2 , t
(1.8)
k Cov(Yt ,Yt k ) E[(Yt )(Yt k )] , ∀t
(1.9)
Chuỗi Yt đƣợc gọi là chuỗi không dừng nếu nó vi phạm bất kì điều
kiện nào nói ở trên.
k
k
chính là hệ số tƣơng quan Yt và Yt-k.
0
Các k là một hàm phụ thuộc vào độ dài của trễ, hàm này đƣợc gọi là
hàm tự tƣơng quan AFC,
ACF (k ) k
Cov(Yt ,Yt k )
Var(Yt )
Điều kiện thứ ba trong định nghĩa chuỗi dừng có nghĩa là hiệp phƣơng
sai, do đó hệ số tƣơng quan giữa Yt và Yt+k chỉ phụ thuộc vào độ dài (k) về
thời gian giữa t và t+k, không phụ thuộc vào thời điểm t. Chẳng hạn:
Cov(Yt, Yt5 ) không đổi thì Cov(Y7 , Y12 ) Cov(Y15 , Y20 ) Cov(Y30 , Y35 )
Cov(Yt , Yt6 ) không đổi. Nhƣng Cov(Yt , Yt 5 ) có thể khác với
Cov(Yt , Yt 6 )
13
1.5. Hàm tự tƣơng quan và hàm tự tƣơng quan riêng
1.5.1. Hàm tự tƣơng quan
Ở mục 1.4 đã nhắc đến hàm tự tƣơng quan, sau đây sẽ trình bày khái
niệm một cách đầy đủ hơn.
“Tự tƣơng quan” đƣợc hiểu nhƣ là sự tƣơng quan giữa các thành phần
của dãy số thời gian hoặc không gian.
Trong mô hình hồi quy tuyến tính cổ điển, ta giả định rằng không có
tƣơng quan giữa các sai số ngẫu nhiên uinghĩa là:
Cov(ui , u j ) 0 (i j )
Nói một cách khác, mô hình cổ điển giả định rằng sai số ứng với quan
sát nào đó không bị ảnh hƣởng bởi sai số ứng với quan sát khác.
Tuy nhiên trong thực tế có thể xảy ra hiện tƣợng mà sai số của các
quan sát lại phụ thuộc nhau, nghĩa là:
Cov(ui , u j ) 0 (i j )
khi đó xảy ra hiện tƣợng tự tƣơng quan.
Hàm tự tƣơng quan (ACF) với độ trễ k, kí hiệu bằng k , đƣợc xác
định nhƣ sau:
ACF (k ) k
Cov(Yt , Yt k )
Var(Yt )
1.5.2. Hàm tự tƣơng quan riêng
Hàm tự tƣơng quan riêng (PACF) ký hiệu là ρkk. Trong khi ACF ρk,
k = 1,2,..., là hệ số tƣơng quan không điều kiện giữa Yt và Y
t-k,
nó không
tính đến ảnh hƣởng của các quan hệ trung gian Yt-1, Yt-2, ...,Yt-k-1 thì ρkk là
hệ số tƣơng quan có điều kiện.
kk Corr(Yt ,Yt k | Yt 1,Yt 2 ,,Yt k 1 ), k=1,2,
14
1.6.Nhiễu trắng và bƣớc ngẫu nhiên
1.6.1. Nhiễu trắng
Quá trình 𝑢𝑡
∞
𝑡= −∞
đƣợc gọi là nhiễu trắng nếu thành phần của chuỗi
có kì vọng bằng 0, phƣơng sai không đổi và không tự tƣơng quan, tức là:
E (ut ) 0, t
(1.10)
Var(ut ) 2, t
(1.11)
Cov(u t , ut s ) 0, s 0, t
(1.12)
Đôi khi điều kiện (1.12) đƣợc thay thế bằng điều kiện mạnh hơn:
ut, uτ độc lập với nhau, với t ≠ τ.
(1.13)
Quá trình thỏa mãn (1.10), (1.11) và (1.13) đƣợc gọi là nhiễu trắng
độc lập. Nếu các điều kiện (1.10), (1.11) và (1.13) đƣợc thỏa mãn và
ut ~ N(0, σ2 ) thì quá trình ngẫu nhiên đƣợc gọi là nhiễu trắng Gauss.
Chú ý rằng từ (1.13) suy ra (1.12), điều ngƣợc lại sẽ không đúng.
Nhiễu trắng là một chuỗi dừng.
1.6.2.Bƣớc ngẫu nhiên
NếuYt Yt 1 ut , trong đó ut là nhiễu trắng, thì Yt đƣợc gọi là bƣớc
ngẫu nhiên
E (Yt ) E(Yt 1) E(ut ) E(Yt 1)
Điều này có nghĩa là kỳ vọng của Yt không đổi.
Ta hãy xem phƣơng sai của Yt:
Y1 Y0 u1
Y2 Y1 u2 Y0 u1 u2
…………………………
Yt Y0 u1 u2 ut
15
(1.14)
Do Y0 là hằng số, các ut không tƣơng quan với nhau, có phƣơng sai
không đổi 𝜎 2 , nên:
Var(Yt ) t2 ,
(1.15)
Điều trên chứng tỏ Yt là chuỗi không dừng.
YY
Yt 1Yt 1 Yt 1ut
t t 1
Cov(Yt ,Yt 1 ) Cov(Yt 1,Yt 1 ) 0 (t 1) 2
Cov(Yt ,Yt k ) (t k ) 2
AFC (k ) k (t k ) / t với mọi k
(1.16)
Sai phân bậc nhất của Yt: Yt Yt Yt 1 ut . Trong trƣờng hợp này
Yt là chuỗi dừng. Dùng toán tử trễ L, ta có Yt (1 L)Yt
Nếu đƣa thêm vào mô hình bƣớc ngẫu nhiên một hằng số, thì Yt đƣợc
gọi là bƣớc ngẫu nhiên có bụi (random walk with drift).
Yt Yt 1 ut
Yt ut hay (1 L)Yt ut
E (Yt ) Y0 t ; Var(Yt ) t 2
(1.17)
16
CHƢƠNG 2. MÔ HÌNH ARIMAVÀ ỨNG DỤNG
2.1. Mô hình ARIMA
2.1.1. Quá trình trung bình trƣợt (MA)
Yt là quá trình trung bình trƣợt bậc q, nếu Yt có dạng:
Yt ut 1ut 1 qut q , t=1, 2, …,n
(2.1)
trong đó: utlà nhiễu trắng.
Hay (Yt ) (1 1L q Lq )ut
Hiểnnhiên: E (Yt )
Cov(Yt ,Yt k ) E (( ut 1ut 1 qut q )( ut k
1ut k 1 qut k q ))
E (k ut2k 1k 1ut2k 1 2k 2ut2k 2 qqk ut2q )
(k 1k 1 2k 2 qqk ) 2
2 qk
ii k , nÕu k q
k Cov(Yt , Yt k )
i 0
0,
nÕu k > q
(2.2)
0 1
Với bất kỳ các giá trị của (θ1 , θ2 , … , θq ) thì các MA(q) đều là các quá
trình dừng. Điều kiện (1.12) đƣợc thỏa mãn.
Quá trình MA(q) là khả nghịch khi 1 i 1 , hay tất cả các nghiệm
của phƣơng trình đặc trƣng:
1 1z 2 z 2 q z q 0
đều nằm trong vòng tròn đơn vị. Khi đó tồn tại toán tử:
( L) (1 1L q Lq )1 để ut ( L)(Yt ).
2.1.2. Quá trình tự hồi quy (AR – Autoregressive Process)
Quá trình tự hồi quy bậc p có dạng:
17
Yt 0 1Yt 1 2Yt 2 pYt p ut
(2.3)
Ký hiệu: ( L) 1 1L 2 L2 p Lp
Ta có: ( L)Yt 0 ut
(2.4)
Điều kiện để quá trình AR(p) hội tụ là 1 i 1, i = 1, 2, …p.
Phƣơng trình đặc trƣng đối với AR(p): 1 1z 2 z 2 p z p 0 ,
có thể viết lại: (1 1z)(1 2 z)(1 p z) 0.
Với phƣơng trình trên điều kiện dừng tƣơng đƣơng với điều kiện tất cả
các nghiệm𝛼𝑖 , i = 1,2,…,p đều nằm trong vòng tròn đơn vị.
E (Yt ) 0 (1 1 2 p )
AFC (k ) k E((Yt )(Yt k ))
Yt 1 (Yt 1 ) 2 (Yt 2 ) p (Yt p ) ut
Nhân hai vế (Yt – μ) với (Yt-k – μ), sau đó lấy kì vọng ta đƣợc phƣơng
trình Yule-Walker:
1 t 1 2 t 2 p t p ,
k
k=1,2,...
2
1 t 1 2 t 2 p t p , k=0
k 1k 1 2 k 2 p k p , k = 1,2,...
(2.5)
(2.6)
2.1.3. Quá trình trung bình trƣợt tự hồi quy ARMA
Cơ chế sản sinh ra Y không chỉ là AR hoặc MA mà có thể kết hợp cả
hai yếu tố này. Khi kết hợp cả hai yếu tố, mô hình đƣợc gọi là mô hình
trung bình trƣợt tích hợp tự hồi quy ARMA. Yt là quá trình ARMA(1,1)
nếu Y có thể biểu diễn dƣới dạng:
Yt 1Yt 1 0ut 1ut 1
trong đó: ut là nhiễu trắng.
Tổng quát, Yt là quá trình ARMA(p,q) nếu Y có biểu diễn dƣới dạng:
Yt 1Yt 1 ... pYt p 0ut 1ut 1 qut q
18
(2.7)
2.1.4.Quá trình trung bình trƣợt, tích hợp tự hồi quy ARIMA
Một chuỗi thời gian có thể dừng hoặc không dừng. Chuỗi không dừng
đƣợc gọi là tích hợp bậc 1, đƣợc kí hiệu là I(1), nếu sai phân bậc nhất là
chuỗi dừng. Chuỗi đƣợc gọi là tích hợp bậc d, nếu sai phân bậc d là chuỗi
dừng, ký hiệu là I(d). Nếu d = 0 thì chuỗi xuất phát là chuỗi dừng.
Nếu chuỗi Yt tích hợp bậc d, áp dụng mô hình ARMA(p,q) cho chuỗi
sai phân bậc d thì có quá trình ARIMA(p,d,q). Trong ARIMA(p,d,q), d là
số lần lấy sai phân chuỗi Yt để đƣợc một chuỗi dừng, p là bậc tự hồi quy, q
là bậc trung bình trƣợt, p và q là bậc tƣơng ứng của chuỗi dừng.
AR(p) là trƣờng hợp đặc biệt của ARIMA(p,d,q) với d = 0, q = 0. MA(q)
là trƣờng hợp đặc biệt của ARIMA(p,d,q) với d = 0 và p =0.
ARIMA(2,1,2) – nghĩa là chuỗi Yt có sai phân bậc 1 là chuỗi dừng, chuỗi
sai phân dừng này có thể biễu diễn dƣới dạng ARMA(2,2):
Yt 1Yt 1 2Yt 2 0ut 1ut 1 2ut 2
trong đó ut là nhiễu trắng.
Nhƣ vậy nếu biết các tham số p, q, d khi đó ta có thể mô hình hóa
đƣợc chuỗi. Vấn đề đặt ra là xác định p, q, d và các tham số 𝜃, .
2.1.5. Dự báo
2.1.5.1. Dự báo quá trình AR(p)
Yt là quá trình tự hồi quy bậc p, Yt có dạng:
Yt 0 1Yt 1 2Yt 2 pYt p ut
Đặt
1
1
F 0
0
2 3 p 1 p
0
1 0 0 0 khi đó:
0 0 1 0
0 0 0
19
Y t s f11( s 1) (Yt 1 ) f12( s 1) (Yt 2 ) f1(ps 1) (Yt p ) ut s
1ut s 1 2ut s 2 s 1ut 1 ,
(2.8)
fik(j) là phần tử (i,k) của Fj,
j đƣợc cho bởi phần tử (1,1) của Fj: j f11( j ) .
Khi dự báo, các số hạng chứa ut+j đƣợc bỏ qua.
Sai số dự báo là:
Yt s Y t s 1ut s1 2ut s2 ... s1ut 1
Cách đơn giản nhất của dự báo là sử dụng phƣơng pháp đệ quy:
Y t 1 1 (Yt ) 2 (Yt 1 ) p (Yt p1 ),
Y t 2 1 (Y t 1 ) 2 (Yt 1 ) p (Yt p2 ),
Y t s 1 (Y t s1 ) 2 (Y t s2 ) p (Y t s p ),
Y k Yk với k n .
2.1.5.2. Dự báo quá trình MA (q)
Yt là quá trình trung bình trƣợt bậc q, Yt có dạng:
Yt ut 1ut 1 qut q , t=1,2,n
Hay (Yt ) ut 1ut 1 qut q , t=1,2,n
(Yt ) (1 1L q Lq )ut
(2.9)
1 1L q Lq
1
Khi đó: Y t s
(Y ).
s
L
1 1L q Lq t
1 1L q Lq
Xét
Ls
s s 1L s 2 L2 q Lq s neáu s=1,2,...,q
neáu s=q+1,q+2,...
0
Y t s ( s s1L s2 L2 q Lqs )u t
20
(2.10)
(2.11)
ut (Yt ) 1ut 1 2ut 2 qut q .
(2.12)
Dự báo dài hơn q thời kì đơn giản chỉ là trung bình không điều kiện
dàng buộc.
2.1.5.3. Dự báo quá trình ARMA(p,q)
Ta xem xétquá trình dừng và khả nghịch ARMA(p,q):
(1 1L 2 L2 p Lp )(Yt ) (1 1L 2 L2 q Lq )ut
(2.13)
Ta có:
Y t 1 1 (Yt ) 2 (Yt 2 ) p (Yt p1 ) 1u1 2u2
qut q1
ut Yt Yt
(2.14)
Giá trị dự báo thời kì s sẽ là:
(Y t s )
1 (Y t s 1 ) 2 (Y t s 2 ) p (Y t s p )
+ sut s 1ut 1 qut s q ,
s 1,2,, q
s q 1, q 2,
1 (Y t s 1 ) 2 (Y t s 2 ) p (Y t s p ),
(2.15)
Y k Yk với k t
2.1.5.4. Dự báo quá trình ARIMA(p,d,q)
Yt là chuỗi tích hợp bậc d, tức là sai phân bậc d của Yt là quá trình
dừng, đặt Yt d (Yt ) ,p là bậc tự hồi quy của Yt và q là bậc trung bình
trƣợt, khi đó chúng ta có mô hình ARIMA(p,d,q).
(1 1L 2 L2 p Lp )(Yt ) (1 1L 2 L2 q Lq )ut
(2.16)
(2.16) chính là mô hình ARMA(p,q) đối với chuỗi Yt (Barlett, 1946). Khi
dự báo, ngƣời ta dự báo cho chuỗi Yt sau đó dự báo cho chuỗi Yt.
21
2.1.6. Kiểm định nghiệm đơn vị
Kiểm định nghiệm đơn vị là kiểm định quan trọng khi phân tích tính
dừng của chuỗi thời gian. Bằng cách dùng kiểm định nghiệmđơn vị có thể
kết luận chuỗi có tuân theo bƣớc ngẫu nhiên hay không dừng. Việc tìm ra
kiểm nghiệm đơn vị là một trong các phát hiện quan trọng của kinh tế học
hiện đại những năm 80 của thế kỷ 20. Với đề tài này em xin trình bày kiểm
nghiệm Dickey-Fuller
Kiểm nghiệm Dickey-Fuller
Dickey-Fuller (1979) đã nghiên cứu quá trình AR(1):
Yt Yt 1 ut
(2.17)
trong đó Y0 là giá trị xác định hữu hạn, u t IID .Nếu nhƣ = 1, khi đó Yt
là một bƣớc ngẫu nhiên. Yt là một chuỗi không dừng. Do đó để kiểm định
tính dừng của Yt ta sẽ kiểm định giả thuyết:
H 0 : 1; H1 : 1
(2.18)
Ta biến đổi Yt Yt Yt 1 ( 1)Yt 1 ut .
Yt Yt 1 ut .
Bây giờ giả thuyết (1.11) tƣơng đƣơng với
H 0 : 0; H1 : 0.
(2.19)
Nếu H0 đƣợc chấp nhận thì: Yt Yt Yt 1 ut . Khi đó Yt là chuỗi
dừng vì ut là IID.
Để tìm ra chuỗi Yt là dừng hay không dừng thì hoặc là sẽ ƣớc lƣợng
(2.17) và kiểm định giả thuyết 0 ; hoặc là ƣớc lƣợng (1.12) và kiểm
định giả thuyết 0 . Trong cả hai mô hình này đều không dùng đƣợc tiêu
chuẩn T (Student – test) ngay trong trƣờng hợp mẫu lớn vì Yt có thể là
chuỗi không dừng. Dickey-Fuller (DF) đã đƣa ra tiêu chuẩn để kiểm định
sau đây dựa trên phân phối giới hạn.
22
H0 : 1 (Chuỗi là không dừng)
H1 : 1 (Chuỗi dừng)
Ta ƣớc lƣợng mô hình (2.17), ( 1) Se( ) có phân phối DF.
Nếu nhƣ: ( 1) Se( ) thì bác bỏ H0. Trong trƣờng hợp
này chuỗi là chuỗi dừng.
Tiêu chuẩn DF đƣợc áp dụng cho các mô hình sau đây:
Yt Yt 1 ut
(2.20)
Yt 1 Yt 1 ut
(2.21)
Yt 1 2t Yt 1 ut
(2.22)
Đối với các mô hình trên, giảthuyết cần kiểm định là: H 0 : 0;
H1 : 0 (Chuỗi không dừng – hay nghiệm đơn vị)
Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới
hạn của thống kê ( )n n có thể tìm đƣợc với giả thiết u t IID và
ngay cả trƣờng hợp ut là quá trình tự hồi quy.
Giả sử rằng Yt cho bởi (2.17) và (2.19); ut là quá trình dừng, tự hồi
quy bậc q:
ut 1ut 1 2ut 2 qut q t ,
(2.23)
t IID
(2.22) sẽ có dạng:
Yt 1 2t Yt 1 1ut 1 2ut 2 qut q t ,
(2.24)
ut Yt Yt 1 thay vào (2.24) đƣợc:
Yt 1 2t Yt 1 1 (Yt 1 Yt 2 ) 2 (Yt 2 Yt 3 ) q (Yt q Yt q1 ) t ,
q
Yt 1 2t Yt 1 i Yt 1 t
(2.25)
i 1
23
Tiêu chuẩn DF áp dụng cho (2.25) đƣợc gọi là tiêu chuẩn ADF
(Augumented Dickey – Fuller).
2.1.7.Phƣơng pháp Box – Jenkins.
Mô hình ARIMA đƣợc sử dụng khá phổ biến trong dự báo ngắn hạn.
Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số
cần dự báo. Do sử dụng chỉ những thông tin trong quá khứ nên mô hình
thích hợp với dự báo ngắn hạn. ARIMA không thích hợp để dự báo chính
sách. Mô hình ARIMA đôi khi đƣợc coi là mô hình phi lý thuyết vì nó
không dựa trên một lý thuyết kinh tế nào.
Có hai phƣơng pháp cơ bản để đánh giá sự phù hợp của mô hình
ARIMA để mô tả một chuỗi thời gian cho trƣớc: phƣơng pháp Box-jenkins
và phƣơng pháp lựa chọn tổ hợp các tham số (p,q).
Box và Jenkins (1974) đã đƣa ra một tập hợp các bƣớc, các thủ tục
ƣớc lƣợng mô hình ARIMA cho một chuỗi thời gian. Phƣơng pháp này đã
trở nên phổ biến trong nhiều lĩnh vực: kinh tế, y thuật, kĩ thuật,… và đƣợc
gọi là phƣơng pháp Box-Jenkins.
Phƣơng pháp Box-Jenkins gồm có 3 bƣớc: định dạng mô hình; ƣớc
lƣợng các tham số và kiểm định. Ba bƣớc trên đƣợc lặp lại cho đến khi nào
đƣợc một mô hình tốt.
2.1.7.1. Định dạng mô hình – xác định tham số p, d, q
Định dạng mô hình tức là phải tìm ra các tham số p,d và q. Công việc
này rất khó khăn cả về lý thuyết và thực hành.
Để tìm đƣợc d phải dùng kiểm định JB, kiểm định nghiệm đơn vị DF
hoặc ADF. Nếu chuỗi ban đầu không dừng, khi đó ta tính sai phân cấp I.
Tiếp tục kiểm định tính dừng. Từ chuỗi dừng nhận đƣợc, ta phải tìm các
giá trị p và q, hay nói cách khác đi phải định dạng mô hình ARMA cho
24
chuỗi dừng. Có rất nhiều phƣơng pháp để tìm đƣợc p và q. Không có
phƣơng pháp nào là tối ƣu tuyệt đối.
a) Lược đồ tương quan và tự tương quan
Dùng lƣợc đồ tƣơng quan và tự tƣơng quan riêng là phƣơng pháp hiệu
quả để xác định p và q. Lƣợc đồ vẽ ACF và PACF theo độ dài của trễ.
Đồng thời cũng vẽ đƣờng phân giải chỉ khoảng tin cậy 95% cho giá trị
bằng 0 của hệ sô tự tƣơng quan ( Bartlett, 1946) và hệ số tự tƣơng quan
riêng (± 1,96/ n). Dựa trên các lƣợc đồ này ta biết đƣợc các hệ số tƣơng
quan và các hệ số tự tƣơng quan riêng khác không với mức ý nghĩa 5%. Từ
đó có thể đƣa ra các đoán nhận chuỗi dừng, các giá trị p, q của các quá
trình AR(p) và MA(q).
Do kk đo mức độ kết hợp giữa Yt và Yt-k sau khi đã loại bỏ ảnh hƣởng
của Yt 1,,Yt k 1 do đó nếu pp 0 và kk 0 với k > p và i , i = 1, 2, …,
giảm theo hàm mũ hoặc theo hình sin thì ta có quá trình AR(p).
Nếu các ii , i = 1, 2, …, giảm dần theo hàm mũ hoặc hàm sin, q 0,
k 0 với k > q thì có quá trình MA(q), …
25
Bảng 1: Bậc p, q của ARIMA
ARIMA
(p,d,0)
AFC
PAFC
Giảm dạng mũ hoặc giảm kk 0 với k > p
hình sin
(0,d,q)
k 0 với k > q
Giảm dạng mũ hoặc giảm
hình sin
(1,d,1)
1 0
11 0
Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc
(1,d,2)
hình sin
hình sin
1, 2 0
11 0
Sau đó giảm dạngmũ hoặc Sau đó giảm dạng mũ hoặc
(2,d,1)
hình sin
hình sin
1 0
11, 22 0
Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc
(2,d,2)
hình sin
hình sin
1, 2 0
11, 22 0
Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc
hình sin
hình sin
Nhƣ vậy phƣơng pháp này Box-Jenkins tính toán các hệ số tƣơng
quan mẫu SACF và hệ số tƣơng quan riêng mẫu SPACF, so sánh với các
giá trị lý thuyết ACF và PACF. Nếu có sự phù hợp giữa chúng với nhau thì
các tham số của mô hình sẽ đƣợc ƣớc lƣợng. Ƣu điểm chủ yếu của phƣơng
pháp này là áp dụng một cách hệ thống các bƣớc trong quá trình xây dựng
mô hình. Nhƣợc điểm của phƣơng pháp này là trong quá trình xem xét một
26
cách trực giác SACF và SPACF để xác định p và q. Kết quả sẽ mang tính
chủ quan.
b)Tiêu chuẩn Akaike, Schwarz
Phƣơng pháp Box-Jenkinslà phƣơng pháp phổ biến nhất. Bên cạnh đó
ngƣời ta còn dùng một số phƣơng pháp khác, kết hợp nhiều phƣơng pháp
khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã đƣợc xác
định.
Một ý tƣởng là ngƣời ta có thể đánh đổi một hoặc nhiều độ trễ của
AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt
thông tin đối với số tham số đƣợc cực tiểu vẫn đảm bảo sự phù hợp của mô
hình. Tiêu chuẩn hiển nhiên để so sánh các mô hình là phƣơng sai của phần
dƣ.
Kí hiệu phần dƣ của mô hình ARMA(p,q) là et ( p, q) . Ƣớc lƣợng
phƣơng sai của phần dƣ tƣơng ứng:
p ,q
1 n
et ( p, q )
n t 1
(2.26)
Nếu dựa vào phƣơng sai phần dƣ để xem xét thì hiển nhiên mô hình
có nhiều tham số hơn càng phù hợp vì mỗi một tham số đƣa thêm sẽ làm
cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát. Tuy nhiên
nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo
ngoài mẫu sẽ kém đi. Chẳng hạn, có thể đƣa vào số tham số bằng số quan
sát, khi đó. Các phần dƣ sẽ bằng không, ƣớc lƣợng của phƣơng sai bằng
không. Nhƣng mô hình nhƣ vậy sẽ không phù hợp vì mô hình hóa là việc
mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác. Mô
hình có quá nhiều tham số sẽ không phù hợp với thực tế. Trƣờng hợp khác,
nếu mô hình có quá ít tham số, hiển nhiên sẽ là không phù hợp.
27
Vì những điều nói trên nên tiêu chuẩn chỉ dựa trên phƣơng sai có
những khiếm khuyết nhất định. Ngƣời ta sẽ đƣa ra một số tiêu chuẩn khác
để khắc phục tình trạng quá nhiều tham số. Ở đây sẽ đƣa ra tiêu chuẩn
thông tin Akaike, Schwarz và tiêu chuẩn Akaike hiệu chỉnh.
Akaike (1974) đề xuất tiêu chuẩn AIC (4):
2
AIC ( p, q) ln( ( p, q)) 2( p q) n .
AIC ( p1, q1 ) min AIC ( p, q), p P, q Q.
(2.27)
Khi đó p1 và q1 là các giá trị thích hợp của p và q.
Số hạng đầu tiên trong AIC(p,q) đo độ phù hợp dựa vào phƣơng sai
của sai số ƣớc lƣợng đƣợc. Số hạng thứ hai là mức phạt đối với mô hình
với số hệ số lớn. Đƣa thêm số hạng thứ hai nhằm khắc phục tình trạng quá
nhiều tham số. Tuy nhiên tiêu chuẩn này có thể đƣa ra số tham số nhiều
hơn một so với tham số cực tiểu và nó phụ thuộc vào số liệu có phân bố
chuẩn hay không. Bằng phƣơng pháp mô phỏng Monte Carlo, Ngƣời ta đã
chỉ ra rằng tiêu chuẩn AIC có xu hƣớng dẫn đến quá nhiều tham số.
Schwarz (1978) đƣa ra một tiêu chuẩn BIC (Bayesian Information
Criterion):
2
BIC ( p, q) ln( ( p, q)) ( p q)ln(n) n
(2.28)
Lƣợng phát trong (2.28) lớn hơn nên tiêu chuẩn Schwarz có xu hƣớng
dẫn đến lựa chọn mô hình có tham số nhỏ hơn AIC.
Tiêu chuẩn AIC hiệu chỉnh AICC (Correctet Akaike Infomation
Criterion):
2
AICC ( p, q) ln( ( p, q)) 2( p q 1) (n p q 2)
(2.29)
AICC hiệu chỉnh là ƣớc lƣợng chệch của AIC. AICC đƣợc dùng cho
mẫu nhỏ. Khi kích thƣớc mẫu lớn thì hai tiêu chuẩn này là nhƣ nhau.
28
Trong hai tiêu chuẩn trên các tập P và Q đều chƣa biết. Hannan (1980)
chỉ ra rằng nếu p0 và q0 là các giá trị đúng thì p1 p0 ; q1 q0
Trên cơ sở hai tiêu chuẩn này Jefferys (1961), Poskitt và Tremayne
(1987) đƣa ra ý tƣởng về xây dựng một lớp mô hình. Cơ sở của quan niệm
này là mặc dù p1 và q1 đã đƣợc xác định, nhƣng chƣa chắc đã là các giá trị
thực của mô hình và cần phải xem xét thêm bằng các tiêu chuẩn khác đối
với các giá trị lân cận của p1 và q1. Các tác giả trên đƣa ra:
1
R exp( n{BIC ( p1, q1 ) BIC ( p, q)})
2
(2.30)
Tremayne đề nghị rằng nếu R < 10 thì không đủ chứng cớ để loại bỏ
mô hình đã chọn bằng thủ tục Akaike và thủ tục Schwarz. Nếu với những
cặp (p,q) mà 1 R 10 thì các cặp này cần phải đƣợc xem xét nhƣ
(p1,q1). Nhƣ vậy có thể có một lớp các mô hình ARMA(p,q) mà
1 R 10 cần phải cân nhắc thêm bằng các tiêu chuẩn khác.
Nếu gọi k là số tham số của mô hình, ta có k AIC k AICC kBIC . BIC là
ƣớc lƣợng vững. Nó sẽ cho xác định đƣợc khá chính xác các tham số của
mô hình. Kết quả nhận đƣợc theo tiêu chuẩn này sẽ thỏa mãn AIC, AICC.
Trên thực tế thƣờng ta chỉ có mẫu có kích thƣớc giói hạn, nên tính vững
của ƣớc lƣợng ít có ý nghĩa.
c)Kiểm nghiệm nhân tử Lagrange (LM)
Kiểm định LM đƣợc sử dụng để kiểm định tự tƣơng quan, kiểm định
giả thuyết về nhiều điều kiện ràng buộc đối với các hệ số hồi quy, mục này
sẽ sử dụng kiểm định LM để kiểm định mô hình ARMA.
Giả thiết: H0: Dạng của mô hình ARMA(p,q). Giả thiết đối có hai
dạng sau đây:
HA: Dạng của mô hình ARMA(p+r,q)
HB: Dạng của mô hình ARMA(p,q+s)
29
Để kiểm định các cặp giả thiết trên, trƣớc hết phải ƣớc lƣợng mô hình
ARMA(p,q) đối với chuỗi dừng Y*t( Y*t – là chuỗi Yt nếu Ytlà chuỗi dừng.
Nếu Yt không phải là chuỗi dừng thì Y*t sẽ là chuỗi sai phân tƣơng ứng).
Từ kết quả thu đƣợc ta có các phần dƣ et.
H0: Dạng của mô hình ARMA(p,q)
HB: Dạng của mô hình ARMA (p+r,q).
Để kiểm định giả thiết này phải ƣớc lƣợng mô hình ARMA(p+r,q),
tức là:
et 0ut 1ut 1 qut q 1Yt 1 2Yt 2 ... pYt p 1Yt p1
2Yt p2 pYt pr t
(2.31)
Từ kết quả ƣớc lƣợng thu đƣợc R2, nếu (n p r ) R2 2 (r ) thì H0 bị
bác bỏ.
H0 : Dạng của mô hình ARMA(p,q)
HA : Dạng của mô hình ARMA(p,q+s)
et 0ut 1ut 1 qut q q1ut q1 t qsut qs 1Yt 1
2Yt 2 pYt p t
(2.32)
Từ kết quả ƣớc lƣợng thu đƣợc R 2 2 (s) thì H0 bị bác bỏ.
Ngoài tiêu chuẩn χ2 ở trên còn có thể dùng tiêu chuẩn F để kiểm định
dựa trên mô hình hồi quy có điều kiện ràng buộc.
2.1.7.2. Ước lượng mô hình
Sau khi định dạng mô hình, ra biết đƣợc d-bậc của sai phân đối với
chuỗi xuất phát để thu đƣợc một chuỗi dừng. Đối với chuỗi dừng này ta
cũng đã biết các giá trị của p và q.
Vấn đề tiếp theo là ƣớc lƣợng các tham số và của mô hình
ARMA(p,q). Có một số phƣơng pháp để ƣớc lƣợng.
30
(a) Phƣơng pháp sử dụng các ƣớc lƣợng Yule-Walker trong các
phƣơng trình YW. Dựa vào các SPACF và hệ phƣơng trình YW để tìm ra
ƣớc lƣợng của quá trình AR. Đối với mô hình ARMA phƣơng trình YW
cũng đƣợc sử dụng để ƣớc lƣợng các hệ số của AR. Các hệ số của quá trình
MA đƣợc ƣớc lƣợng bằng cách khác.
(b) Phƣơng pháp OLS: Phƣơng pháp này ƣớc lƣợng các tham số bằng
cực tiểu hóa tổng bình phƣơng các phần dƣ. Nếu chỉ có AR thì OLS dẫn
đến các ƣớc lƣợng tuyến tính. Nếu có cả MA thì OLS dẫn đến ƣớc lƣợng
phi tuyến và phải dùng các phƣơng pháp số.
Sử dụng các phƣơng trình YW hay phƣơng pháp OLS thƣờng chỉ để
tính các giá trị ban đầu của các tham số dùng trong phƣơng pháp ƣớc lƣợng
hợp lí cực đại.
(c)
Phƣơng
pháp
ƣớc
lƣợng
hợp
lý
cực
đại
MLE
(Svetlozar,Stefan,Frank, Sergio, Teo Jasi, 2007): Phƣơng pháp này cực đại
hóa logarit hàm hợp lý gắn với mô hình đã định dạng. Để sử dụng đƣợc
phƣơng pháp này phải có giả thiết về phân bố của yếu tố ngẫu nhiên.
Thông thƣờng giả thiết: ut N (0, 2 )
Sau đây sẽ trình bày phƣơng pháp MLE. Xét trƣờng hợp biến ngẫu
nhiên ut có phân phối IID và hàm mật độ xác suất có dạng N (0, 2 ) .
Yt 0 1Yt 1 2Yt 2 pYt p ut 1ut 1 qut q ;
ut N (0, 2 );
ut Yt 0 1Yt 1 2Yt 2 pYt p 1ut 1 qut q ;
f (ut ) (2 )1 2 exp(ut2 2).
(2.33)
Ký hiệu T là kích thƣớc của mẫu sau khi bỏ đi các quan sát không có
do các yếu tố trễ của AR và MA; et là các phần dƣ, khi đó logarit cơ số e
của hàm hợp lý có dạng:
31
T
T
1 T 2
2
ln L( , , Yt ) ln(2 ) ln( ) 2 et
2
2
2 t 1
( 0 , 1, 2 ,, p , 1, 2 ,, q )
2
(2.34)
et Yt 0 1Yt 1 2Yt 2 pYt p 1et 1 qet q
Quá trình ƣớc lƣợng sẽ đƣợc thực hiện theo phƣơng pháp lặp, quá
trình sẽ kết thúc khi chênh lệch ƣớc lƣợng các hệ số giữa hai bƣớc kế tiếp
nhau không đáng kể.
2.1.7.3. Kiểm định tính thích hợp của mô hình
Giả thiết cơ bản trong mô hình ARIMA là yếu tố ngẫu nhiên ut-phần
không giải thích đƣợc của Yt với các thông tin đã biết trong quá khứ Yt-1 ,
Yt-2 và ut-1, ut-2 ,…-không có giải thích (đầy đủ hay từng phần) hoặc dự báo
từ các thông tin trong quá khứ. Về mặt toán học có nghĩa là ut là nhiễu
trắng. Do đó cần phải kiểm định giả thiết “ut là nhiễu trắng”, tức là:
2 , s=t
E (ut ) 0, E (us , ut )
0 , s t
Vẽ lƣợc đồ tƣơng quan SACF và SPACF cho phần dƣ. Nếu SACF và
SPACF không có thành phần có ý nghĩa thống kê thì ut tƣơng tự với nhiễu
trắng. Khi đó mô hình là chấp nhận đƣợc. Trƣờng hợp ngƣợc lại - có phần
tử có ý nghĩa thống kê - thì phần dƣ có chứa những thông tin mà mô hình
chƣa tách ra khỏi số liệu đƣợc, hay trong phần dƣ còn thông tin.
Có một số kiểm định khác dựa vào hệ số tƣơng quan của các phần dƣ.
Kiểm định đƣợc ƣa thích là kiểm định Khi bình phƣơng dựa trên thống kê
Q của Box-Pierce-BP (1970).
H 0 : ,1 ,2 ,k 0 ; H1 : có ít nhất ,i 0
2
Q n ,i ;
k
(2.35)
i 1
32
,i là hệ số tự tƣơng quan mẫ bậc i của phần dƣ;n là kích thƣớc mẫu.
k đƣợc chọn đủ lớn sao cho ảnh hƣởng của hệ số tự tƣơng quan bậc
cao có thể đƣợc bỏ qua, các hệ số này đƣợc giả thiết là dần tới không. Trên
thực tế có thể tính Q với một vài giá trị của k. Nếu ut là nhiễu trắng thì Q có
phân bố tiệm cận 2 với bậc tự do (k-q-p). Tính toán giá trị Q, so sánh với
giá trị tới hạn. Nếu giá trị của Q lớn hơn giá trị tới hạn thì bác bỏ giả thuyết
H0 về phần dƣ không tƣơng quan.
Q chỉ có phân bố tiệm cận Khi bình phƣơng, cho nên trong trƣờng hợp
mẫu nhỏ, phân bố của Q có thể hoàn toàn khác Khi bình phƣơng. Trong
trƣờng hợp mẫu nhỏ, thống kê Ljung-Box (1978) phù hợp hơn:
2
Q n(n 2) (n i) ,i
k
(2.36)
i 1
Q* có phân bố Khi bình phƣơng, k bậc tự do.
Tuy nhiên nếu kích thƣớc mẫu là quá nhỏ, tiêu chuẩn LB có mức tin
cậy thấp, có thể không phát hiện ra sai lầm định dạng của mô hình.
Hai tiêu chuẩn trên chỉ kiểm định không có tự tƣơng quan của các
phần dƣ mà không phải kiểm định sự độc lập. Granger và Anderson đã đƣa
ra một số thí dụ trong đó các phần dƣ không tƣơng quan trong khi bình
phƣơng phần dƣ lại tƣơng quan có ý nghĩa thống kê.
McLeod và Li đã kiểm định giả thuyết:
H 0 : 22 ,1 22 ,2 22 ,k 0,
2
Q n(n 2) (n i ) 2 ,i .
k
2
(2.37)
i 1
2
Trong đó 2 ,k là hệ số tự tƣơng quan mẫu bậc k của bình phƣơng
phần dƣ.
33
Một tiêu chuẩn khác dựa vào hệ số tƣơng quan riêng của bình phƣơng
phần dƣ:
2
Q M n(n 2) (n i) 2 ,i ,
k
(2.38)
i 1
2
2
.i
là bình phƣơng hệ số tƣơng quan riêng bậc i của phần dƣ. QM có phân
bố tiệm cận Khi bình phƣơng với (k-p-q) bậc tự do. Các kết quả mô phỏng
của Monti (1994) chỉ ra rằng QM phù hợp trong trƣờng hợp mẫu nhỏ.
Kiểm định tính phân bố chuẩn (Jarque, Bera, 1980)
Phƣơng pháp MLE đƣợc sử dụng với giả thiết ut có phân bố IID, trong
các phần trên ta giả thiết rằng ut có phân bố chuẩn hóa. Bây giờ ta phải
kiểm định giả thiết này. Ngƣời ta sử dụng kiểm định Jarque-Bera (JB). Do
phân bố chuẩn là đối xứng hình chuông, nên momen cấp ba phải bằng
không và momen cấp bốn 4 3 2 , 2 Var(ut ) .
Độ đo của mô mem cấp ba hay hệ số bất đối xứng S(Skewness) của
các phần dƣ đƣợc tính:
1 n et3
S 3
n t 1
(2.39)
Ƣớc lƣợng Momen cấp bốn hay hệ số nhọn K:
1 n et4
( 4 1),
n
t 1 3
trong đó: n là kích thƣớc mẫu, - ƣớc lƣợng của .
K
(2.40)
Với giả thiết ut phân bố chuẩn, khi đó S và K có phân bố tiệm cận
chuẩn, trung bình bằng không và phƣơng sai bằng 6/n và 8/(3n) tƣơng ứng
với Jarque-Bera kiểm định giả thiết:
H0: ut có phân bố chuẩn hay
3
4
0
và
3 0.
3
4
34
2
n n et3
Thống kê mẫu 1 3 có phân bố tiệm cận 2 (1)
6 t 1
2
n n et4
2 4 3 có phân bố tiệm cận 2 (1) .
24 t 1
2
1 n et3 2 1 n et4
1 2 n 3 4 3
6 t 1 24 t 1
(2.41)
có phân bố tiệm cận 2 (2) .
Nếu với một mẫu cụ thể, 2 (2) thì H0 bị bác bỏ.
2.1.7.4. Dự báo và sai số dự báo
Giả sử số liệu quan sát đến thời kỳ n(t) đƣợc thu thập dƣới dạng tập
hợp thông tin It {Y : t} . Cần dự báo giá trị trong tƣơng lai ở thời kỳ
h(t+h), Yt+h.
Giả sử đã ƣớc lƣợng đƣợc đƣờng hồi quy mẫu Y t (giả thiết Yt là dừng,
tức là ta đã có ARMA(p,q). Giá trị trong tƣơng lai Yt+h tính tại thời điểm t,
dựa vào đƣờng Y t ký hiệu là Y t (h) .
Có ba giá trị cần phải tính toán (Schwarz, 1978):
-Giá trị Y t (h)
-Sai số dự báo
-Phƣơng sai của sai số dự báo.
Et (Yt h ) E (Yt h It ) E (Yt h Yt 1,Yt 2 ,)
(2.42)
Ƣớc lƣợng của Yt+h là Y t (h) . Y t (h) cần phải có sai số dự báo bình
phƣơng trung bình (MSE) đạt cực tiểu:
MSE (Y t (h)) E[(Yt h Y t (h)]2
E[(Yt h Et (Yt h ) Et (Yt h ) Y t (h) 2 ]
Khai triển biểu thức trên dễ dàng nhận thấy
35
(2.43)
E[(Yt h Et (Yt h ))( Et (Yt h ) Y t (h)2 )]=0
do Yt h Et (Yt h ) chỉ phụ thuộc vào ut 1, ut 2 ,, ut h , Et (Yt h Y (h)) chỉ
phụ thuộc vào Yt ,Yt-1,
Khi đó MSE (Y t (h)) E (Yt h Et (Yt h ))2 E ( Et (Yt h ) Y t (h)) 2
MSE ( Et (Yt h ) E ( Et (Yt h ) Y t (h))2
Nếu Y t (h) Et (Yt h ) thì MSE (Y t (h)) đạt cực tiểu. Et (Yt h ) là ƣớc
lƣợng tốt nhất theo nghĩa có sai số bình phƣơng trung bình cực tiểu.
Dự báo tuyến tính tốt nhất:
Bây giờ ta sẽ tìm dự báo tuyến tính với Yt,Yt-1,.., và ut, ut-1,... đã biết.
Giả sử rằng Yt là chuỗi dừng và khả nghịch, ta có:
Yt h iut hi
(2.44)
i 0
trong đó { i } là chuỗi các hằng số thỏa mãn
i 0
i
.
Dự báo Y t (h) là tuyến tính và chỉ sử dụng các thông tin Yt,Yt-1,...
hoặc các ut, ut-1,... ta có Y t (h) jut j . Ta ƣớc lƣợng các trọng số i
j 0
sao cho cự tiểu MSE (Y t (h)) :
MSE (Y t (h)) E[(Yt h Y t (h)) 2 ]
E[( iu t hi j u t j ]2
i 0
j 0
E[( iu t hi ( j h j )u t j ) 2 ]
h 1
i 0
j 0
i 2 2 ( j h j ) 2
h 1
i 0
j 0
36
(2.45)
MSE (Y t (h)) đạt cực tiểu với j j h .
Dự báo với sai số bình phƣơng trung bình cực tiểu của Yt+h là:
Et (Yt h ) Y t (h),
Y t (h) h jut j jut h j
j 0
(2.46)
j h
Sai số dự báo ở bƣớc h là: et (h) Yt h Et ((Y t ))
i 0
j h
iut hi j ut h j
h 1
iut hi
(2.47)
i 0
Var(et (h)) i2 2 MSE (Y t (h))
h 1
(2.48)
i 0
Có bốn chú ý:
h
0 Var (Yt ) , tức là phƣơng sai dự báo ở bƣớc
- Var(et (h))
h sẽ dần đến phƣơng sai không điều kiện của Yt khi h .
- Các i ,i và i đƣợc tính đệ quy nên Y t (h) (2.46) đƣợc sử dụng cho
dự báo nếu tất cả các ut-i , i=0, i=1,... Trừ khi mô hình chỉ có MA, ut-i ,
i=0,1,...q là đủ để ƣớc lƣợng.
- Đối với t =1,2,... tìm ut từ:
p
q
i 1
i 1
ut Yt iYt i iut j
t=1,2,...,n
Các giá trị ban đầu là Y0 ,Y-1,…,Y-p và ε0 ,ε-1,… Đối với mô hình dừng
j
và khả nghịch, thì j
0 . Do đó trong (2.47) có thể bỏ qua j đối với
j đủ lớn.
37
- Thay cho tổng vô hạn (2.47) có thể sử dụng phép đệ quy ARMA cho
p
q
dự báo: Y t (h) i Y t (h i ) j et (h j ) , h=1,2,...
i 0
j 0
trong đó: Y t (h-i)=Yt+h-i , i h ;
et h j j h
e t (h-j) =
0 j=0,1,...,h-1
Dự báo khoảng:
Y t (h) nói ở trên là dự báo điểm cho Yt+h. Cần phải tìm khoảng tin cậy
cho giá trị dự báo. Trƣớc hết giả thiết rằng mô hình ƣớc lƣợng vẫn đúng
trong tƣơng lai.
Do dự báo Y t (h) là tốt hợp tuyến tính của các nhiễu ut, phân bố của
Y t (h) và sai số dự báo et(h) đƣợc xác định bởi phân bố của ut. Giả thiết
rằng:
ut ( IID) N (0, 2 )
(2.49)
h 1
Ta có et (h) N (0, i2 2 ) . Tuy nhiên et(h), h=1,2,... không độc lập.
i 1
Phân bố của sai số đƣợc chuẩn hóa là:
h 1
et (h)
2
N (0,1); (h) 2j .
( h)
j 0
Khoảng tin cậy đối xứng (1 ) cho
Hay
(2.50)
et (h)
e ( h)
là: u1 2 t
u
( h)
(h) 1 2
Yt h Y t (h)
u1 2
u1 2
( h)
Y t (h)u1 2 Yt h Y t (h)u1 2
38
(2.51)
Khoảng trên đƣợc gọi là khoảng dự báo (1 )100% bƣớc h. Độ dài
của khoảng sai số dự báo tăng khi h tăng vì (h) tăng theo h.
2.2. Ứng dụng mô hình ARIMA dự báo chỉ số VNINDEX.
Tại thị trƣờng Việt Nam chỉsố VNINDEX phản ánh rủi ro hệ thống vì
vậy việc dự báo sự tăng giảm của chỉ số VNINDEX cũng đồng thời giúp
các nhà đầu tƣ nhận biết chiều hƣớng biến động giá của các cổ phiếu trên
thị trƣờng này.
2.2.1. Xây dựng mô hình ARIMA cho chuỗi VNINDEX
Nguồn số liệu đƣợc lấy từ trang web cophieu68.vn. Một trang web tin cậy
chuyên cung cấp số liệu về thị trƣờng chứng khoán Việt Nam.
Dữ liệu dc lấy là giá đóng của của mỗi phiên giao dịch VNINDEX từ
ngày 02/01/2013 đến ngày 20/04/1015 bao gồm 567 số liệu.
Trong Eviews vẽ đồ thị của chuỗi VNINDEX bằng lệnh: View ->
Graph -> Line and simbol:
Hình 1: Đồ thị chuỗi VNINDEX
Chuỗi VNINDEX có các giá trị tuyệt đối lớn và rất biến động
39
Tiến hành kiểm nghiệm đơn vị cho chuỗi VNINDEX: Trong Eviews
từ chuỗi VNINDEX chọn View -> Unit root test trong mục test stype
chọn kiểu kiểm nghiệm ADF ta có kết quả cho bởi hình 2:
Hình 2: Kiểm định ADF cho chuỗi VNINDEX
Theo kiểm định ADF ta thấy qs 2,409436 tại cả 3 mức ý
nghĩa ∝= 1%, 5%, 10%. Vậy chuỗi VNINDEX chƣa dừng.
Để khắc phục tính dừng ta lấy sai phân bậc nhất bằng cách gõ: genr
dVNINDEX = d(VNINDEX) và tiến hành kiểm định ADF nhƣ với chuỗi
gốc , kết quả thể hiện trong hình 3:
Hình 3: Kiểm định ADF cho chuỗi DVNINDEX
Theo kiểm định ADF ta thấy qs 23.00151 tại cả 3 mức ý
nghĩa ∝= 1%, 5%, 10%. Vậy chuỗi DVNINDEX là chuỗi dừng.
40
Tiếp đó thực hiện tính toán các hệ số tự tƣơng quan và tự tƣơng quan
riêng của chuỗi sai phân và quan sát các biểu đồ tự tƣơng quan, tự tƣơng
quan riêng. Thực hiện trong Eviews nhƣ sau: View -> correlogram và
chọn 30 thời kỳ trễ. Ta đƣợc nhƣ hình 4:
Hình 4: Đồ thị của hàm ACF và PACF của chuỗi DVNINDEX
Theo đồ thị ở hình 4, tại độ trễ k=3 AC và PAC đạt cực đại sau đó
giảm mạnh xuống và đồ thị có xu hƣớng nằm gọn trong hai đƣờng giới
hạn. Do đó p và q có thể nhận các giá trị là 3. Mô hình ARIMA có thể có là
ARIMA (3,1,3)
41
2.2.2. Ƣớc lƣợng các tham số của mô hình
Trong phần mềm Eviews các bƣớc thực hiện ƣớc lƣợng tham số của
mô hình ARIMA nhƣ sau:
=>Trên thanh menu chọnQuick -> Estimate Equation.
=>Nhập các thông số cần ƣớc lƣợng vào mục Equation Speccification.
Hình 5: Các thông số cho mô hình ARIMA(3,1,3)
=>Chọn phƣơng pháp bình phƣơng tối thiểu ta thu đƣợc kết quả ƣớc lƣợng
nhƣ sau:
42
Hình 6: Kết quả ƣớc lƣợng các thông số của mô hình.
Từ kết quả này cho ta một số thông tin nhƣ sau:
=> Mô hình ARMA(3,3) có dạng nhƣ sau:
VNINDEX t 0,766126VNINDEX t 3 0,820957ut 3
=>Thống kê Durbin-Watson DW=1,939138 ≈ 2 cho thấy sai số của
ƣớc lƣợng là không tƣơng quan.
2.2.3. Kiểm tra sự phù hợp của mô hình
Ta tiến hành kiểm tra sự phù hợp của mô hình thông qua việc kiểm
định tính ngẫu nhiên của sai số ƣớc lƣợng đƣợc. Để làm việc này trên phần
mềm Eviews ta thực hiện lần lƣợt các bƣớc sau:
=>Từ màn hình kết quả ƣớc lƣợng, chọn View ->Residual test ->
Correlogram -> Q-Statistics.
=>Phân tích biểu đồ tự tƣơng quan và tự tƣơng quan riêng của sai số
ƣớc lƣợng đƣợc. Kết quả cho thấytất cả các hệ số tự tƣơng quan mẫu đều
43
nằm trong hai đƣờng giới hạn. Điều này chúng tỏ sai số của ƣớc lƣợng là
hoàn toàn ngẫu nhiên. Do vậy mô hình này là phù hợp.
Hình 7: Biểu đồ ACF và PACF cho sai số ƣớc lƣợng.
2.2.4. Dự báo giá
Mở rộng bộ dữ liệu: Proc -> Structure/Resize Current Page Chọn
Dated – regular frequency: Start date: 1; End date: 572 Trong mô hình
ƣớclƣợng chọn: Forecast -> Forecast name: vnindef ; S.E (optional): se.
Ta có biểu đồ sau:
44
Hình 8: Biểu đồ dự báo
Kết quả dự báo:
Hình 9: Kết quả dự báo
Giá trị thực tế là:
45
Hình 10: Kết quả thực tế
Từ kết quả dự báo và kết quả thực tế ta có bảng so sánh sau:
Ngày
Giá trị thực tế
Giá trị dự báo
Sai số(%)
21/04/2015
562.2
564.9867
0.4957
22/04/2015
562.5
564.9765
0.4403
23/04/2015
561.2
564.5403
0.5952
24/04/2015
565.8
564.5505
0.2208
27/04/2015
562.4
564.5583
0.2069
Giá trị dự báo gần đúng với giá trị thực tế, mô hình là phù hợp.
46
KẾT LUẬN
Mô hình ARIMA có rất nhiều ứng dụng trong thực tế, đặc biệt là
trong vấn đề dự báo. Dự báo đƣợc một số chỉ tiêu kinh tế vĩ mô, chỉ số thị
trƣờng, giá cả tạo cơ sở cho các nhà hoạch định chính sách đƣa ra chính
sách, định hƣớng phát triển, chiến lƣợc phát triển công ty. Mô hình
ARIMA tỏ ra dự báo trong ngắn hạn khá hiệu quả. Nó thƣờng đƣợc sử
dụng dự báo chỉ số giá tiêu dùng theo tháng, giá của một số mặt hàng xuất
khẩu: giá cà phê, sản lƣợng xuất khẩu của một số mặt hàng xuất khẩu. Bên
cạnh những ƣu điểm của mô hình thì nó cũng có nhƣợc điểm nhất định
nhƣ: khi chuỗi thời gian phi tuyến thì mô hình ARIMA không dự báo đƣợc.
Trong bài luận văn này, em đã đã làm đƣợc những việc nhƣ sau: trình
bày lý thuyết các lớp mô hình ARIMA,lý thuyết về phƣơng pháp phân tích
chuỗi thời gian Box-Jenkins; ứng dụng của mô hình ARIMA dựa trên
phƣơng pháp Box-Jenkins, cùng với sự hỗ trợ của phần mềm Eviews để dự
báo chỉ số VNINDEX.
Với lƣợng kiến thức còn hạn chế và khoảng thời gian có hạn những
vấn đề em trình bày trên đây mới chỉ là những kiến thức cũng nhƣ những
kết quả dự báo bƣớc đầu. Rõ ràng rằng các kết quả dự báo đã trình bày vẫn
chƣa đƣa ra đƣợc những kết quả thực sự đáng tin cậy để phục vụ,áp dụng
thực tiễn. Trong tƣơng lai, em sẽ tiếp tục nghiên cứu bài toán dự báo bằng
phƣơng pháp chuỗi thời gian để có thể tìm ra phƣơng pháp dự báo tốt hơn
và có thể áp dụng đƣợc.
47
DANH MỤC TÀI LIỆU THAM KHẢO
Sách giáo trình:
[1]Phạm Thế Anh (2013), Kinh tế lƣợng ứng dụng phân tích
chuỗi thời gian, Nxb Lao động.
[2]Nguyễn Quang Dong (2014), Giáo trình Kinh tế lƣợng, Nxb
Đại học Kinh tế quốc dân.
[3] Nguyễn Minh Dũng(2014), Dự báo giá chứng khoán bằng
phƣơng pháp chuỗi thời gian, luận văn Thạc sĩ Toán học, Trƣờng Đại
học Khoa học tự nhiên.
[4]Trần Trọng Nguyên (2013), Giáo trình lý thuyết xác suất, Nxb
Đại học Kinh tế quốc dân.
Trang web:
[5]www.cophieu68.vn.
48
[...]... DF áp dụng cho (2.25) đƣợc gọi là tiêu chuẩn ADF (Augumented Dickey – Fuller) 2.1.7.Phƣơng pháp Box – Jenkins Mô hình ARIMA đƣợc sử dụng khá phổ biến trong dự báo ngắn hạn Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn ARIMA không thích hợp để dự báo chính sách Mô hình ARIMA. .. kinh tế, y thuật, kĩ thuật,… và đƣợc gọi là phƣơng pháp Box-Jenkins Phƣơng pháp Box-Jenkins gồm có 3 bƣớc: định dạng mô hình; ƣớc lƣợng các tham số và kiểm định Ba bƣớc trên đƣợc lặp lại cho đến khi nào đƣợc một mô hình tốt 2.1.7.1 Định dạng mô hình – xác định tham số p, d, q Định dạng mô hình tức là phải tìm ra các tham số p,d và q Công việc này rất khó khăn cả về lý thuyết và thực hành Để tìm đƣợc d... Mô hình ARIMA đôi khi đƣợc coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào Có hai phƣơng pháp cơ bản để đánh giá sự phù hợp của mô hình ARIMA để mô tả một chuỗi thời gian cho trƣớc: phƣơng pháp Box-jenkins và phƣơng pháp lựa chọn tổ hợp các tham số (p,q) Box và Jenkins (1974) đã đƣa ra một tập hợp các bƣớc, các thủ tục ƣớc lƣợng mô hình ARIMA cho một chuỗi thời gian Phƣơng... tích hợp bậc d, áp dụng mô hình ARMA(p,q) cho chuỗi sai phân bậc d thì có quá trình ARIMA( p,d,q) Trong ARIMA( p,d,q), d là số lần lấy sai phân chuỗi Yt để đƣợc một chuỗi dừng, p là bậc tự hồi quy, q là bậc trung bình trƣợt, p và q là bậc tƣơng ứng của chuỗi dừng AR(p) là trƣờng hợp đặc biệt của ARIMA( p,d,q) với d = 0, q = 0 MA(q) là trƣờng hợp đặc biệt của ARIMA( p,d,q) với d = 0 và p =0 ARIMA( 2,1,2) – nghĩa... là không đối xứng 7 1.2 Phân tích hồi quy 1.2.1 Mô hình hồi quy tuyến tính hai biến Giả sử X và Y là hai biến của một tổng thể nào đó, mô hình hồi quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X có dạng nhƣ sau: Y 1 2 X u (1.1) Nhƣ vậy, mô hình hồi quy tuyến tính hai biến bao gồm các thành phần sau: Các biến số: mô hình hồi quy gồm hai loại biến số: - Biến phụ thuộc:... khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã đƣợc xác định Một ý tƣởng là ngƣời ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số đƣợc cực tiểu vẫn đảm bảo sự phù hợp của mô hình Tiêu chuẩn hiển nhiên để so sánh các mô hình là phƣơng sai của phần dƣ Kí hiệu phần dƣ của mô hình ARMA(p,q) là et (... số, thì Yt đƣợc gọi là bƣớc ngẫu nhiên có bụi (random walk with drift) Yt Yt 1 ut Yt ut hay (1 L)Yt ut E (Yt ) Y0 t ; Var(Yt ) t 2 (1.17) 16 CHƢƠNG 2 MÔ HÌNH ARIMAVÀ ỨNG DỤNG 2.1 Mô hình ARIMA 2.1.1 Quá trình trung bình trƣợt (MA) Yt là quá trình trung bình trƣợt bậc q, nếu Yt có dạng: Yt ut 1ut 1 qut q , t=1, 2, …,n (2.1) trong đó: utlà nhiễu trắng... đƣợc áp dụng cho các mô hình sau đây: Yt Yt 1 ut (2.20) Yt 1 Yt 1 ut (2.21) Yt 1 2t Yt 1 ut (2.22) Đối với các mô hình trên, giảthuyết cần kiểm định là: H 0 : 0; H1 : 0 (Chuỗi không dừng – hay nghiệm đơn vị) Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới hạn của thống kê ( )n n có thể tìm đƣợc với giả thiết u t IID và ngay... của phần dƣ tƣơng ứng: p ,q 1 n et ( p, q ) n t 1 (2.26) Nếu dựa vào phƣơng sai phần dƣ để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đƣa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi Chẳng hạn, có thể đƣa vào số tham số bằng... tham số bằng số quan sát, khi đó Các phần dƣ sẽ bằng không, ƣớc lƣợng của phƣơng sai bằng không Nhƣng mô hình nhƣ vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác Mô hình có quá nhiều tham số sẽ không phù hợp với thực tế Trƣờng hợp khác, nếu mô hình có quá ít tham số, hiển nhiên sẽ là không phù hợp 27 Vì những điều nói trên nên tiêu chuẩn chỉ ... ta rút đƣợc quy luật trình đƣợc mô tả thông qua chuỗi số liệu Xuất phát từ thực tế ứng dụng lớn mô hình ARIMA, em chọn đề tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa luận Mục... khái niệm kiến thức đƣợc sử dụng chƣơng sau - Chƣơng 2 .Mô hình ARIMA ứng dụng: Chƣơng trình bày lớp mô hình ARIMA thử nghiệm ứng dụng mô hình để dự báo số VNINDEX CHƢƠNG KIẾN THỨC CHUẨN BỊ 1.1... dạng mô hình – xác định tham số p, d, q 24 2.1.7.2 Ƣớc lƣợng mô hình 30 2.1.7.3 Kiểm định tính thích hợp mô hình 32 2.1.7.4 Dự báo sai số dự báo 35 2.2 Ứng dụng mô hình ARIMA