2.6. Ngoại suy dựa vào mơ hình ARIMA (AutoRegressive Integrated Moving
2.6.5. Mơ hình ARIMA
- Mơ hình ARMA(p,q): là mơ hình hỗn hợp của AR và MA. Hàm tuyến tính sẽ bao gồm những quan sát dừng quá khứ và những sai số dự báo quá khứ và hiện tại:
( ) 0 1 ( 1) 2 ( 2) ... p ( ) ( ) y t = a + a y t - + a y t - + + a y t - p + e t ( ) ( ) ( ) 1 1 2 2 ... q be t - + b e t - + + b e t - q (2.36) Trong đĩ: ( )
y t : quan sát dừng hiện tại
( )
y t - p , và e t( - q): quan sát dừng và sai số dự báo quá khứ. 0, ,1 2,...
a a a , , ,...b b1 2 : các hệ số phân tích hồi quy
Ví dụ: ARMA(1,2) là mơ hình hỗn hợp của AR(1) và MA(2)
Đối với mơ hình hỗn hợp thì dạng( ) ( )p q, = 1,1 là phổ biến. Tuy nhiên, giá trị p và q đƣợc xem là những độ trễ cho ACF và PACF quan trọng sau
cùng. Cả hai điều kiện bình quân di động và điều kiện dừng phải đƣợc thỏa mãn trong mơ hình hỗn hợp ARMA.
- Mơ hình ARIMA(p,d,q): Do mơ hình Box-Jenkins chỉ mơ tả chuỗi dừng hoặc những chuỗi đã sai phân hĩa, nên mơ hình ARIMA(p,d,q) thể hiện những chuỗi dữ liệu khơng dừng, đã đƣợc sai phân (ở đây, d chỉ mức độ sai phân).
Khi chuỗi thời gian dừng đƣợc lựa chọn (hàm tự tƣơng quan ACF giảm đột ngột hoặc giảm đều nhanh), chúng ta cĩ thể chỉ ra một mơ hình dự định bằng cách nghiên cứu xu hƣớng của hàm tự tƣơng quan ACF và hàm tự tƣơng quan từng phần PACF. Theo lý thuyết, nếu hàm tự tƣơng quan ACF giảm đột biến và hàm tự tƣơng quan từng phần PACF giảm mạnh thì chúng ta cĩ mơ hình tự tƣợng quan. Nếu hàm tự tƣơng quan ACF và hàm tự tƣơng quan từng phần PACF đều giảm đột ngột thì chúng ta cĩ mơ hình hỗn hợp.
Về mặt lý thuyết, khơng cĩ trƣờng hợp hàm tự tƣơng quan ACF và hàm tự tƣơng quan từng phần cùng giảm đột ngột. Trong thực tế, hàm tự tƣơng quan ACF và hàm tự tƣơng quan từng phần PACF giảm đột biến khá nhanh. Trong trƣờng hợp này, chúng ta nên phân biệt hàm nào giảm đột biến nhanh hơn, hàm cịn lại đƣợc xem là giảm đều. Do đơi lúc sẽ cĩ trƣờng hợp giảm đột biến đồng thời khi quan sát biểu đồ hàm tự tƣơng quan ACF và hàm tự tƣơng quan từng phần PACF, biện pháp khắc phục là tìm vài dạng hàm dự định khác nhau cho chuỗi thời gian dừng. Sau đĩ, kiểm tra độ chính xác mơ hình tốt nhất.
Mơ hình ARIMA (1, 1, 1):
( ) ( 1) 0 1( ( 1) ( 2) ( ) 1 ( 1))
y t - y t - = a + a y t - + y t - + e t + be t -
Hoặc z t( )= a0 + a z t1 ( - 1)+ e t( )+ be t1 ( - 1)
Với z t( )= y t( )+ y t( - 1) ở sai phân đầu tiên: d = 1. Tương tự ARIMA(1,2,1):
( ) 0 1 ( 1) ( ) 1 ( 1)
h t = a + a z t - + e t + be t -
Với h t( )= z t( )+ z t( - 1)ở sai phân thứ hai: d = 2. Theo [7], trong thực hành d lớn hơn 2 rất ít đƣợc sử dụng
2.6.6. Các bước phát triển mơ hình ARIMA.
George Box và Gwilym Jenkins (1976) đã nghiên cứu mơ hình ARIMA (Autoregressive Integrated Moving Average - Tự hồi qui tích hợp Trung bình trƣợt), và tên của họ thƣờng đƣợc dùng để gọi tên các quá trình ARIMA tổng quát, áp dụng vào việc phân tích và dự báo các chuỗi thời gian. Theo [3, 7], phƣơng pháp Box – Jenkins bao gồm các bƣớc chung:
• Xác định mơ hình • Ƣớc lƣợng tham số • Kiểm định độ chính xác • Dự báo.
• Xác định mơ hình: Mơ hình ARIMA chỉ đƣợc áp dụng đối với chuỗi dừng. Mơ hình cĩ thể trình bày theo dạng AR, MA hay ARMA. Phƣơng pháp xác định mơ hình thƣờng đƣợc thực hiện qua nghiên cứu chiều hƣớng biến đổi của hàm tự tƣơng quan ACF hay hàm tự tƣơng quan từng phần PACF.
Chuỗi ARIMA khơng dừng: cần phải đƣợc chuyển đồi thành chuỗi dừng trƣớc khi tính ƣớc lƣợng tham số bình phƣơng tối thiểu. Việc chuyển đổi này đƣợc thực hiện bằng cách tính sai phân giữa các giá trị quan sát dựa vào giả định các phần khác nhau của các chuỗi thời gian đều đƣợc xem xét tƣơng tự, ngoại trừ các khác biệt ở giá trị trung bình. Nếu việc chuyển đổi này khơng thành cơng, sẽ áp dụng tiếp các kiểu chuyển đổi khác (chuyển đồi logarithm chẳng hạn).
• Ƣớc lƣợng tham số: tính những ƣớc lƣợng khởi đầu cho các tham số 0, ,..., a1 p
a a b1,....bq của mơ hình dự định. Sau đĩ xây dựng những ƣớc lƣợng
sau cùng bằng một q trình lặp.
• Kiểm định độ chính xác: Sau khi các tham số của mơ hình tổng quát đã xây dựng, ta kiểm tra mức độ chính xác và phù hợp của mơ hình với dữ liệu. Chúng ta kiểm định phần dƣ (Yt - Y t) và cĩ ý nghĩa cũng nhƣ mối quan hệ các tham số. Nếu bất cứ kiểm định nào khơng thỏa mãn, mơ hình sẽ nhận dạng lại các bƣớc trên đƣợc thực hiện lại.
• Dự báo: Khi mơ hình thích hợp với dữ liệu đã tìm đƣợc, ta sẽ thực hiện dự báo tại thời điểm tiếp theo t. Do đĩ, mơ hình ARMA(p,q):
( 1) 0 1 ( ) .. p ( 1) ( 1) 1 ( ) .. q ( 1)
y t + = a + a y t + + a y t - p+ + e t + + be t + + b e t - q+
2.7. Các bƣớc tiến hành ngoại suy
Bước 1: Lựa chọn, thu thập và xử lý số liệu
Việc lựa chọn, thu thập và xử lý số liệu dựa trên một số nguyên tắc cơ bản sau:
- Cần cấu trúc vấn đề để sử dụng tối đa kiến thức của ngƣời dự báo - Làm sạch số liệu để giảm thiểu sai số đo lƣờng
- Điều chỉnh các chuỗi số liệu đứt quãng
Bước 2: Lựa chọn phương pháp
Trong nhiều trƣờng hợp, số liệu cĩ chu kỳ dƣới 1 năm (nhƣ ngày, tuần, tháng, quý) địi hỏi phải điều chỉnh thời vụ. Đây là điều cần thiết nhằm giảm thiểu sai số trong dự báo theo chuỗi số liệu. Các yếu tố thời vụ thƣờng đƣợc ƣớc lƣợng bằng 1 trong 2 cách sau:
- Phƣơng trình hồi quy (trong đĩ các tháng đƣợc biểu diễn bằng biến giả). - Mối tƣơng quan giữa giữa từng tháng và trung bình trƣợt tƣơng ứng của nĩ (thƣờng đƣợc gọi là phƣơng pháp tỷ lệ so với trung bình trƣợt).
Khĩ cĩ thể nĩi cách nào chính xác hơn trong 2 cách đĩ. Do vậy, việc lựa chọn cách nào để ƣớc lƣợng điều chỉnh thời vụ tuỳ theo bạn cảm thấy cách nào thuận tiện hơn hoặc chi phí thấp hơn. Thƣờng thì nhà nghiên cứu kiểm nghiệm các nhân tố thời vụ trƣớc và sau đĩ chỉ sử dụng nếu chúng cĩ ý nghĩa về thống kê. Phép kiểm nghiệm địi hỏi số liệu ít nhất 3 năm, song thực tế thƣờng từ 5 năm trở lên.
Bước 3: Tiến hành ngoại suy
Sau khi đã thu thập đƣợc số liệu cần thiết và đã xử lý số liệu, cần quyết định là sẽ ngoại suy số liệu nhƣ thế nào. Cách làm chuẩn là tách số liệu ra thành mức, xu thế và chu kỳ.
Ƣớc lƣợng mức. Tổ hợp các ƣớc lƣợng về mức.
Ngoại suy xu thế. Nên sử dụng cách biểu diễn xu thế đơn giản. Trong chuỗi số liệu, cần coi trọng các số liệu gần đây hơn các số liệu ban đầu khi sai số đo lƣờng nhỏ, tầm dự báo ngắn và chuỗi ổn định. Cần dùng phạm vi kiến thức của mình để xác định trƣớc các điều chỉnh sẽ đƣợc thực hiện đối với phép ngoại suy. Cần sử dụng các phép thống kê để hỗ trợ lựa chọn phƣơng pháp ngoại suy và thƣờng xuyên cập nhật các ƣớc lƣợng về thơng số
Ƣớc lƣợng chu kỳ. Sử dụng chu kỳ khi thấy cĩ bằng chứng thời điểm và biên độ tƣơng lai cĩ độ chính xác cao
Bước 4: Đánh giá tính bất định
Đánh giá tính bất định dựa trên các nguyên tắc cơ bản sau:
- Sử dụng các ƣớc lƣợng thực chứng rút ra từ các phép kiểm nghiệm từ trong mẫu
- Đối với các số liệu theo thang tỷ lệ, ƣớc lƣợng khoảng thời gian dự báo bằng các cách sử dụng dạng loga của giá trị thực và giá trị dự báo.
Chƣơng 3
ÁP DỤNG KỸ THUẬT NGOẠI SUY VÀO BÀI TỐN DỰ BÁO 3.1. Mơ hình ARIMA cho dự báo tài chính, chứng khốn
3.1.1. Dữ liệu tài chính
Dữ liệu chúng ta sử dụng là dữ liệu chuỗi thời gian. Đặc điểm chính để phân biệt giữa dữ liệu cĩ phải là thời gian thực hay khơng đĩ chính là sự tồn tại của cột thời gian đƣợc đính kèm trong đối tƣợng quan sát. Nĩi cách khác, dữ liệu thời gian thực là một chuỗi các giá trị quan sát của biến Y :
{1, 2, 3,..., t 1, ,t t 1,..., n}
Y = y y y y - y y + y với ytlà giá trị của biến Y tại thời điểm t.
Mục đích chính của việc phân tích chuỗi thời gian thực là thu đƣợc một mơ hình dựa trên các giá trị trong quá khứ của biến quan sát
1, 2, 3,..., t 1, t
y y y y - y cho phép ta dự đốn đƣợc giá trị của biến Y trong tƣơng
lai, tức là cĩ thể dự đốn đƣợc các giá trị yt+1,yt+2,...,yn.
Trong bài tốn của chúng ta, dữ liệu chứng khốn đƣợc biết tới nhƣ một chuỗi thời gian đa dạng bởi cĩ nhiều thuộc tính cùng đƣợc ghi tại một thời điểm nào đĩ. Với dữ liệu đang xét, các thuộc tính đĩ là: Ngày Thay đổi, Mở cửa, Cao nhất, Thấp nhất, Đĩng cửa, Trung bình, Đĩng cửa ĐC, Khối lƣợng.
3.1.2. Mơ hình ARIMA cho bài tốn dự báo tài chính
Dựa vào trình tự cơ bản của phƣơng pháp luận cùng cấu trúc và hoạt động của mơ hình ARIMA trong chƣơng 2. Để áp dụng mơ hình ARIMA vào bài tốn dự báo giá cổ phiếu, ta xây dựng mơ hình dự báo.
Mơ hình gồm 3 q trình chính:
Xác định mơ hình: Với đầu vào là tập dữ liệu chuỗi thời gian trong tài chính giúp cho việc xác định ban đầu các thành phần trong mơ hình p, d, q, S.
• Ƣớc lƣợng, kiểm tra: Mơ hình ARIMA là phƣơng pháp lặp, sau khi xác định các thành phần, mơ hình sẽ ƣớc lƣợng các tham số, sau đĩ thì kiểm
tra độ chính xác của mơ hình: Nếu hợp lý, tiếp bƣớc sau, nếu khơng hợp lý, quay trở lại bƣớc xác định
• Dự báo: Sau khi đã xác định các tham số, mơ hình sẽ đƣa ra dự báo cho ngày tiếp theo.
3.1.3. Thiết kế mơ hình ARIMA cho dữ liệu
Việc thiết kế thành cơng mơ hình ARIMA phụ thuộc vào sự hiểu biết rõ ràng về vấn đề, về mơ hình, cĩ thể dựa vào kinh nghiệm của các chuyên gia dự báo…
Trong quá trình tìm hiểu, khĩa luận sẽ đƣa ra các bƣớc để xây dựng một mơ hình nhƣ sau:
1. Chọn tham biến 2. Chuẩn bị dữ liệu
• Xác định tính dừng của chuỗi dữ liệu • Xác định yếu tố mùa vụ
• Xác định yếu tố xu thế
3. Xác định các thành phần p, q trong mơ hình ARMA
4. Ƣớc lƣợng các tham số và chẩn đốn mơ hình phù hợp nhất 5. Dự báo ngắn hạn
3.1.3.1 Chọn tham biến
Hƣớng tiếp cận phổ biến trong dữ liệu tài chính là tập trung xây dựng mơ hình dự báo giá cổ phiếu đĩng cửa sau khi kết thúc mỗi phiên giao dịch (Đĩng cửa ĐC).
3.1.3.2 Chuẩn bị dữ liệu
• Xác định tính dừng của chuỗi dữ liệu: Dựa vào đồ thị của chuỗi và đồ thị của hàm tự tƣơng quan.
• Nếu đồ thị của chuỗi Y = f t( ) một cách trực quan nếu chuỗi đƣợc coi là dừng khi đồ thị của chuỗi cho trung bình hoặc phƣơng sai khơng đổi theo thời gian (chuỗi dao động quanh giá trị trung bình của chuỗi)
• Dựa vào đồ thị của hàm tự tƣơng quan ACF nếu đồ thị cho ta một chuỗi giảm mạnh và tắt dần về 0 sau q độ trễ.và tắt dần về 0 sau q độ trễ.
• Xác định yếu tố mùa vụ cho chuỗi dữ liệu: Dựa vào đồ thị của chuỗi dữ liệu Y = f t( ).
• Xác định yếu tố xu thế cho chuỗi dữ liệu.
3.1.3.3 Xác định thành phần p, q trong mơ hình ARMA
Sau khi loại bỏ các thành phần: Xu thế, mùa vụ, tính dừng thì dữ liệu trở thành dạng thuần cĩ thể áp dụng mơ hình ARMA cho quá trình dự báo. Việc xác định 2 thành phần p và q.
• Chọn mơ hình AR(p) nếu đồ thì PACF cĩ giá trị cao tại độ trễ 1, 2, …, p và giảm nhiều sau p và dạng hàm ACF giảm dần
• Chọn mơ hình MA(q) nếu đồ thị ACF cĩ giá trị cao tại độ trễ 1, 2, …, q và giảm nhiều sau q và dạng hàm PACF giảm dần.
3.1.3.4. Ước lượng các thơng số của mơ hình và kiểm định mơ hình phù hợp nhất
Cĩ nhiều phƣơng pháp khác nhau để ƣớc lƣợng. Ở đây, khĩa luận tập trung vào: Khi đã chọn đƣợc mơ hình, các hệ số của mơ hình sẽ đƣợc ƣớc lƣợng theo phƣơng pháp tối thiểu tổng bình phƣơng các sai số. Kiểm định các hệ số ,a bcủa mơ hình bằng thống kê t. Ƣớc lƣợng sai số bình phƣơng trung bình của phần dƣ S2: ( ) 2 2 2 1 1 n n t t t t t e Y Y S n r n r - - - = = - - å å
Trong đĩ: et = Yt - Y t = phần dƣ tại thời điểm t n = số phần dƣ
r = tổng số hệ số ƣớc lƣợng
Tuy nhiên: cơng thức chỉ đƣa ra để tham khảo...Hiện nay phƣơng pháp ƣớc lƣợng cĩ hầu hết trong các phần mềm thống kê: ET, MICRO TSP và SHAZAM, Eviews...
Nếu phần dƣ là nhiễu trắng thì cĩ thể dừng và dùng mơ hình đĩ để dự báo.
3.1.3.5 . Kiểm tra mơ hình phù hợp nhất
Dựa vào các kiểm định nhƣ
• BIC nhỏ (Schwarz criterion đƣợc xác định bởi: n.Log(SEE) + k.Log(n) • SEE nhỏ [11] 1/ 2 2 SEE= 2 i e n é ù ê ú ê - ú ê ú ë û å • R2 lớn: R-squared = (TSS-RSS)/TSS [11] ( )2 T SS= å Yi - Y , ( )2 ( )2 RSS=å ei =å Yi - Yi 3.1.3.6. Dự báo ngắn hạn mơ hình
Dựa vào mơ hình đƣợc chọn là tốt nhất, với dữ liệu quá khứ tới thời điểm t, ta sử dụng để dự báo cho thời điểm kế tiếp t + . 1
3.2. Áp dụng
Ứng dụng mơ hình ARIMA vào bài tốn dự báo chứng khốn của của
Cơng ty Cơng ty Cổ phần Sữa Việt Nam (VNM: HOSE)
Sử dụng Phần mềm EVIEWS để dự đốn (Ứng dụng của mơ hình ARIMA cho bài tốn dự đốn chuỗi thời gian).
3.2.1. Mơi trường thực nghiệm
Mơi trƣờng thực nghiệm Eview chạy trên hệ điều hành Window XP
3.2.2. Dữ liệu
Chọn loại dữ liệu dự báo: Dữ liệu đƣợc lấy từ
http: //www.stockbiz.vn/Stocks/VNM/HistoricalQuotes.aspx
Trong đĩ ta chọn Cổ phiếu cĩ mã VNM để dự đốn, và sử dụng riêng Giá đĩng cửa.
Bảng 3.1: Dữ liệu đầu vào
MaCK Ngày
tháng
Giá đĩng
cửa MaCK Ngày tháng
Giá đĩng cửa VNM 05/05/2014 110,69 VNM 12/08/2014 112,5 VNM 06/05/2014 107,45 VNM 13/08/2014 114 VNM 07/05/2014 108,26 VNM 14/08/2014 116 VNM 08/05/2014 100,99 VNM 15/08/2014 116 VNM 09/05/2014 105,03 VNM 18/08/2014 115 VNM 12/05/2014 100,18 VNM 19/08/2014 114 VNM 13/05/2014 99,36 VNM 20/08/2014 112 VNM 14/05/2014 101,82 VNM 21/08/2014 113 VNM 15/05/2014 98,54 VNM 22/08/2014 113 VNM …….. VNM 25/08/2014 112
Dữ liệu cho quá trình dự báo đƣợc bắt đầu từ ngày 05/05/2014 đến ngày 25/08/2014. Ở đây ta chỉ tập trung vào Giá đĩng cửa, và quá trình dự báo sẽ giúp ta xác định đƣợc Giá đĩng cửa của ngày kế tiếp ngay sau đĩ.
3.2.3. Kiểm tra tính dừng của chuỗi chứng khốn VNM
Dựa vào biểu đồ của biến giá đĩng cửa của chổi chứng khốn.
96 100 104 108 112 116 120 2014M05 2014M06 2014M07 2014M08 GIADONGCUA 3.2.4. Nhận dạng mơ hình
Xác định các tham số p, d, q trong mơ hình ARIMA
Hình 3.2: Xác định d = 0,1,2 ?
Ta cĩ thể xác định các tham số p, d, q trong mơ hình ARIMA dựa vào biểu đồ tƣơng quan.
Hình 3.3: Biểu đồ của SAC và SPAC của chuỗi giadongcua
Nhìn vào hình, ta thấy biểu đồ hàm tự tƣơng quan ACF giảm dần một cách từ từ về 0. Chuỗi chƣa dừng, ta phải tính sai phân lần 1.
Kiểm tra đồ thị Correlogram của chuỗi sai phân bậc 1.
Hình 3.4: Biểu đồ của SPAC và SAC ứng với d=1