1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Ứng dụng mô hình xích markov và chuỗi thời gian mờ trong dự báo tt

26 198 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 1,31 MB

Nội dung

Do đó, việc sử dụng một phân phối ổn định cho đối tượng dự đoán là không phù hợp với bài toán dự báo chuỗi thời gian.. Chính vì lý do trên, để xây dựng mô hình dự báo chuỗi thời gian cần

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

-

ĐÀO XUÂN KỲ

ỨNG DỤNG MÔ HÌNH XÍCH MARKOV

VÀ CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO

Chuyên ngành: Cơ sở Toán học cho Tin học

Mã số: 62.46.01.10

TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC

Hà Nội, 2017

Trang 2

Danh mục các công trình của tác giả

higher order markov model and fuzzy time series for stock market

forecasting, Hội thảo lần thứ 19: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Hà Nội, pages 1–6, 2016

Mô hình markov-chuỗi thời gian mờ trong dự báo chứng khoán, Hội thảo lần thứ 18: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, TP HCM, pages 119–124, 2015

[3] Dao Xuan Ky, Luc Tri Tuyen, A markov-fuzzy combination model

for stock market forecasting, International Journal of Applied athematics and Statistics TM, 55(3):109–121, 2016

[4] Dao Xuan Ky, Luc Tri Tuyen, A Higher order Markov model for

time series forecasting, International Journal of Applied athematics and StatisticsTM, vol 57(3), 2018

[5] Lục Trí Tuyên, Nguyễn Văn Hùng, Thạch Thị Ninh, Phạm Quốc

Vương, Nguyễn Minh Đức, Đào Xuân Kỳ, A normal-hidden markov

model model in forecasting stock index, Journal of Computer Science and Cybernetics, 28(3):206–216, 2012

Trang 3

MỞ ĐẦU

Bài toán dự báo chuỗi thời gian với đối tượng dự báo là biến ngẫu nhiên X thay đổi theo thời gian nhằm đạt được độ chính xác dự báo cao luôn là thách thức đối với các nhà khoa học không chỉ trong nước mà còn đối với các nhà khoa học trên thế giới Bởi lẽ, giá trị của biến ngẫu nhiên này tại thời điểm t sinh ra một cách ngẫu nhiên và việc tìm một phân phối xác xuất phù hợp cho nó không phải lúc nào cũng dễ dàng Muốn làm được điều này dữ liệu lịch sử cần được thu thập và phân tích, từ đó tìm ra phân phối ướm khít với nó Tuy nhiên, một phân phối tìm được có thể phù hợp với dữ liệu ở một giai đoạn này, nhưng có thể sai lệch lớn

so với giai đoạn khác Do đó, việc sử dụng một phân phối ổn định cho đối tượng dự đoán là không phù hợp với bài toán dự báo chuỗi thời gian

Chính vì lý do trên, để xây dựng mô hình dự báo chuỗi thời gian cần thiết phải có sự liên

hệ, cập nhật dữ liệu tương lai với dữ liệu lịch sử, xây dựng mô hình phụ thuộc giữa giá trị dữ liệu có được tại thời điểm t với giá trị tại các thời điểm trước đó t 1,t 2 Nếu xây dựng quan hệ X t 1X t12X t2pX t p    t 1 t1 q t q cho ta mô hình hồi quy tuyến tính ARIMA[15] Mô hình này đã được áp dụng rộng rãi bởi cơ sở lý thuyết dễ hiểu và dễ thực hành, hơn nữa mô hình này đã được tích hợp vào hầu hết các phần mềm thống kê hiện nay như Eviews, SPSS, Matlab, R,… Tuy nhiên, nhiều chuỗi thời gian thực tế cho thấy nó không biến đổi tuyến tính Do đó mô hình tuyến tính như ARIMA không phù hợp R Parrelli

đã chỉ ra trong [28], các chuỗi thời gian về độ dao động của chỉ số kinh tế hay tài chính thường

có quan hệ phi tuyến Mô hình phổ biến cho dự báo chuỗi thời gian phi tuyến phải kể đến mô hình GARCH [25,28] Hạn chế của mô hình GARCH lại nằm ở việc phải giả sử dữ liệu dao động tuân theo một phân phối cố định (thường là phân phối chuẩn) trong khi dữ liệu thực tế cho thấy phân phối thống kê lại là phân phối nặng đuôi [39] (trong khi phân phối chuẩn có độ lệch cân đối) Một lựa chọn khác cho dự báo chuỗi thời gian được phát triển gần đây hơn là

mô hình mạng thần kinh nhân tạo (ANN) Các mô hình ANN không dựa trên phân phối tất định cho dữ liệu mà nó hoạt động tương tự bộ não con người, cố gắng tìm ra quy luật và đường đi của dữ liệu đào tạo, kiểm tra thực nghiệm và tổng quát hóa kết quả Với cách hoạt động của nó, các mô hình ANN thường sử dụng cho mục đích phân lớp dữ liệu [23] Gần đây hơn, lý thuyết mới về học máy thống kê đang được nhiều nhà khoa học chú ý là phương pháp vector học máy (SVM) cho bài toán phân lớp và dự báo [36,11,31] SVM được áp dụng rộng rãi hơn trong nhiều lĩnh vực như xấp xỉ hàm, ước lượng hồi quy và dự báo [11,31] Tuy nhiên, hạn chế lớn nhất của SVM là khi tập đào tạo lớn, nó đòi hỏi lượng tính toán khổng lồ cũng như độ phức tạp của bài toán hồi quy tuyến tính trong đó

Để khắc phục các hạn chế và phát huy các điểm mạnh của các phương pháp đã có, mộ

xu thế nghiên cứu đang trở nên thịnh hành gần đây là hương tiếp cận kết hợp (CA), nghĩa là kết hợp một số phương pháp không giống nhau để tăng độ chính xác của dự báo Rất nhiều nghiên cứu đã được thực hiện và theo hướng này và rất nhiều các mô hình kết hợp mới đã được công bố [43,5,6] Một số phương pháp trong đó sử dụng xích Markov (MC) cũng như

mô hình Markov ẩn (HMM) Refiul Hassan [19] đã phát triển một mô hình hợp nhất bằng cách kết hợp một HMM với một ANN và GA, để tạo ra các dự báo trong một ngày-trước của giá cổ phiếu Mô hình này đã cố gắng để xác định các mẫu dữ liệu tương tự từ các dữ liệu lịch

sử Sau đó ANN và GA đã được sử dụng để nội suy các giá trị lân cận của mô hình dữ liệu được xác định Yang [41] đã kết hợp mô hình HMM với kỹ thuật phân cụm đồng bộ nhằm tăng độ chính xác cho mô hình dự báo Mô hình Markov với trọng số đã được Peng [27] áp dụng trong dự báo và phân tích tỷ lệ truyền nhiễm bệnh ở tỉnh Giang Tô, Trung Quốc Các mô hình kết hợp này đã mang lại những kết quả có ý nghĩa trong thực tiễn cũng nhưng tăng đáng

kể độ chính xác trong dự báo so với các mô hình truyền thống [27,41,19] Các mô hình trên

Trang 4

tuy đã có những cải thiện đáng kể về độ chính xác trong dự báo nhưng vẫn gặp khó khăn đối với những dữ liệu mờ (có những phân tử mà không biết chắc)

Để đối phó với những dữ liệu mờ, một hướng nghiên cứu mới trong dự báo chuỗi thời gian được mở ra gần đây là sử dụng mô hình chuỗi thời gian mờ (FTS) Kết quả đầu tiên cần được kể đến trong việc áp dụng lý thuyết này là Song and Chissom [34] Những nghiên cứu tập trung theo hướng cải thiện các mô hình chuỗi thời gian mờ và tìm cách áp dụng vào bài toán dự báo Jilani et al and Nan et al.kết hợp mô hình Heuristic với chuỗi thời gian mờ để nâng cao độ chính xác của mô hình [24] Chen và Hwang mở rộng thêm các chuỗi thời gian

mờ vào mô hình Binary [14] và sau đó Hwang and Yu phát triển thành mô hình N bậc để dự báo chỉ số chứng khoán [21] Trong một bài báo gần đây [35], BaiQing Sun et al đã mở rộng

mô hình mờ cho thời gian mờ đa cấp để dự báo giá tương lai của thị trường chứng khoán Qisen Cai et al [10] đã kết hợp mô hình dự báo chuỗi thời gian mờ với tối ưu hóa đàn kiến và

tự động hồi quy để có được một kết quả tốt hơn Ở Việt Nam, mô hình chuỗi thời gian mờ gần đây cũng đã được áp dụng trong một số lĩnh vực cụ thể Có thể kể đến nghiên cứu của Nguyễn Duy Hiếu và cộng sự [2] trong phân tích ngữ nghĩa Ngoài ra, các công trình của tác giả Nguyễn Công Điều [3,4] đã kết hợp mô hình chuỗi thời gian mờ với một số kỹ thuật điều chỉnh tham số trong thuật toán hay những đặc trưng riêng của dữ liệu để làm tăng độ chính xác của dự báo Nghiên cứu của tác giả Nguyễn Cát Hồ [1] đã ứng dụng đại số gia tử vào dự báo chuỗi thời gian mờ cho thấy độ chính xác dự báo cao hơn một số mô hình hiện có

Cho đến nay, mặc dù đã có nhiều mô hình mới được xây dựng theo hướng kết hợp các

mô hình sẵn có nhằm cải thiện độ chính xác của dự báo nhưng mặc dù mô hình rất phức tạp trong khi độ chính xác dự báo cải thiện không đáng kể Do đó một số hướng có thể thực hiện nhằm đơn giản hóa mô hình và đảm bảo hoặc tăng độ chính xác dự báo có thể được phát triển

Mục tiêu của luận án tập trung nghiên cứu hai vấn đề chính Thứ nhất là mô hình hóa

chuỗi thời gian bởi những trạng thái mà trong đó mỗi trạng thái là một phân phối xác xuất tất định (phân phối chuẩn) Dựa vào kết quả thực nghiệm để đánh giá sự phù hợp của mô hình

Thứ hai, kết hợp xích Markov và chuỗi thời gian mờ thành mô hình mới nhằm cải thiện độ

chính xác của dự báo Hơn nữa, mở rộng mô hình với xích Markov bậc cao nhằm tương thích với những dữ liệu có tính chất thời vụ

Luận án gồm 3 chương Chương I trình bày nghiên cứu tổng quan xích Markov và mô hình Marko ẩn cũng như chuỗi thời gian mờ Chương II trình bày mô hình hóa chuỗi thời gian

thành những trạng thái trong đó: (1) mỗi trạng thái là một phân phối chuẩn với trung bình i, phương sai 2

i

 , i 1, 2, ,m với m là số trạng thái; (2) các trạng thái theo thời gian tuân theo một xích Markov Sau đó, mô hình được thực nghiệm trên dữ liệu chỉ số VN-Index để đánh giá hiệu quả dự báo của mô hình Cuối chương luận văn phân tích những hạn chế và sự không phù hợp của mô hình dự báo với phân phối xác suất tất định làm động cơ cho mô hình kết hợp đề

xuất ở Chương 3 Chương 3 trình bày mô hình kết hợp xích Markov và chuỗi thời gian mờ

trong dự báo chuỗi thời gian Chương này cũng trình bày mô hình mở rộng cho xích Markov bậc cao với hai khái niệm xích Markov bậc cao cổ điển (CMC) và xích Markov bậc cao cải tiến (IMC) Mô hình sau đó lập trình trên ngôn ngữ R và thực nghiệm với các tập dữ liệu tương ứng chính xác với tập dữ liệu của các mô hình so sánh

Trang 5

Chương 1 BÀI TOÁN ĐỀ XUẤT VÀ KIẾN THỨC TỔNG QUAN

1.1 Xích Markov

1.1.1 Các định nghĩa

Ta xét một hệ thống kinh tế hoặc một hệ thống vật chất Svới mtrạng thái có thể, ký hiệu bởi tậpI : I 1, 2, ,m hệ thống Stiến hóa ngẫu nhiên trong thời gian rời rạc (t0,1, 2, , , n ),

và đặt C nlà biến ngẫu nhiên tương ứng với trạng thái của hệ thống Sở thời điểm n(CnI)

Định nghĩa 1.1.1 Dãy biến ngẫu nhiên ( C n n,  ) là một xích Markov nếu và chỉ nếu với tất cả

(với điều kiện xác suất này có nghĩa)

Định nghĩa 1.1.2 Một xích Markov được gọi là thuần nhất nếu chỉ nếu xác suất trong (1.1.1) không phụ thuộc vào n và không thuần nhất trong các trường hợp còn lại

Hiện tại, ta chỉ xét trường hợp thuần nhất mà với nó ta viết:

1.1.2 Phân loại trạng thái xích Markov

Lấy iIvà đặt d i( )là ước chung lớn nhất của tập các số nguyên n sao cho ( )

0

n ii

 

Định nghĩa 1.2.4 Nếu d i( ) 1 , trạng thái i được gọi là tuần hoàn chu kỳ d i( ) Nếu d i( ) 1, thì trạng thái i không tuần hoàn

Dễ thấy, nếu ii 0thì i là không tuần hoàn Tuy nhiên, điều ngượi lại chưa chắc đúng

Định nghĩa 1.2.5 Một xích Markov mà tất cả các trạng thái của nó không tuần hoàn được gọi là xích Markov không tuần hoàn

Định nghĩa 1.2.6 Một trạng thái i được gọi là vươn tới trạng thái j (viết là i j ) nếu tồn tại số nguyên dương n sao cho ij n 0

i jC nghĩa là i không vươn tới được j

Định nghĩa 1.2.7 Trạng thái i và j được gọi là liên thông nếu i j và j i , hoặc nếu ij. Ta viết i j

Định nghĩa 1.2.8 Trạng thái i được gọi là cốt yếu nếu nó liên thông với mọi trạng thái mà nó vươn tới; trường hợp ngược lại gọi là không cốt yếu

Quan hệ xác định một quan hệ tương đương trên không gian trạng thái I dẫn tới một sự chia lớp trên I. Lớp tương đương chứa i được ký hiệu bởi Cl i( )

Định nghĩa 1.2.9 Xích Markov được gọi là không khai triển được nếu chỉ tồn tại duy nhất một

lớp tương đương trên nó

Định nghĩa 1.2.10 Tập con E của không gian trạng thái I được gọi là đóng nếu:

Trang 6

1.1.3 Ước lượng ma trận Markov

Xét xích Markov (C t),t1, 2, và giả sử quan sát được n các trạng thái xảy rac c1, 2, ,c n

Ký hiệu c nc c1, 2, ,c n sinh bởi các biến ngẫu nhiên n

C thì hàm hợp lý của ma trận xác xuất chuyển được cho bởi

ˆˆ

ij ij

n n

đúng với mọi j 1 nên

1

ij m

ij j

n n

Trang 7

( 1) ( )( t | t , t ) ( t| t),

Từ bây giờ, m phân phối p x i( ) được gọi là các phân phối trạng thái phụ thuộc của mô hình

1.2.2 Likelihood và ước lượng cực đại likelihood

Đối với các quan sát rời rạc X t, định nghĩa u t i Pr Cti với i 1, 2, , ,T ta có

m

i i i

Trang 8

Từ đây, ta dễ dàng tính được L Tbằng thuật toán hồi quy Để tìm bộ tham số thỏa mãn L Tlớn nhất,

ta có thể thực hiện theo hai phương pháp:

Uớc lượng trực tiếp cực trị hàm L T(MLE): Trước tiên, từ phương trình (1.2.5) ta cần tính toán

logarit của L T một cách hiệu quả nhằm thuận lợi trong việc tìm cực đại dựa vào các xác suất lũy tiến α t Với t0,1, , ,T định nghĩa vector  tt /w t ,

Theo phương trình (1.2.4), các xác suất FWP đã được định nghĩa bởi

1.2.3 Phân phối dự báo

Đối với các quan sát có giá trị rời rặc, phân phối dự báo ( ) ( )

Pr X  x Xx thực chất

là một tỷ lệ của L T dựa vào xác suất điều kiện:

( ) ( ) ( ) ( )

Trang 9

1.2.4 Thuật toán Viterbi

Mục tiêu của thuật toán Viterbi là đi tìm dãy trạng thái tốt nhất i i1, , ,2 i T tương ứng với dãy quan sát x x1, 2, ,x T mà làm cực đại hàm L T

T

α Γ i

Lưu ý rằng, khi h  ,  h

n Γ tiến tới phân phối dừng của xích Markov

f là hàm thuộc của tập mờ Af A :U [0;1], f u A( )i là độ thuộc của u i vào tập A

Định nghĩa 1.3.2 [34]: Cho Y t t( )(  0,1, 2, ) là tập nền, là một tập con của 1

F t và F t( ), và "o" là toán tử thành phần Max–Min

Định nghĩa 1.3.4 [34]: Cho R t t( , 1) là mô hình bậc một của F t( ) Nếu mọi

, ( , 1) ( 1, 2)

t R t t R tt, thì F t( ) được gọi là chuỗi thời gian mờ dừng Trái lại F t( ) được gọi là chuỗi thời gian mờ không dừng.

Trang 10

Chương 2 MÔ HÌNH MARKOV ẨN TRONG DỰ BÁO CHUỖI

THỜI GIAN

Theo Chương 1, mô hình HMM bao gồm hai thành phần cơ bản: chuỗi X t t, 1, ,T các quan sát và C ti t, 1, , ,T i{1, 2, , }m thành phần trộn

Bây giờ, để dễ minh họa cho mô hình HMM trong dự báo chuỗi thời gian, xét chuỗi thời gian time.b.to.t ở trên và ký hiệu là X t t, 1, ,T Bài toán thực tế đối với nhà đầu tư là dự đoán giá trị của X t trong tương lai để biết sau bao lâu chỉ số chứng khoán sẽ từ đáy lên đỉnh Từ quan sát thực tế thấy rằng chỉ số chứng khoán khi đạt một đỉnh mới sẽ không thể ở giá trị đó (hoặc dao động nhẹ xung quanh giá trị đó) mãi mãi mà sẽ đi xuống sau một thời gian nào đó, tương tự đối với dao động từ đáy lên đỉnh Vậy có thể quy định Xmax là thời gian lâu nhất mà giá trị cổ phiếu từ đáy lên đỉnh Khi đó, 0 X tXmax(xem Hình 2.2.1) Nhà đầu tư muốn quy định các trạng thái xảy

ra với X t, chẳng hạn "chờ nhanh", "chờ khá nhanh", "chờ lâu", "chờ rất lâu" nhưng không biết phải định nghĩa như thế nào Để giải quyết bài toán này, ta coi mỗi trạng thái trên là một phân phối Poisson với trung bình (cũng là phương sai) i,i1, 2,3, 4và được "ẩn" trong chuỗi X t Nếu giả thiết thêm các trạng thái này tuân theo một xích Markov, ta có mô hình Markov ẩn cho bài toán dự báo chuỗi thời gian

Hình 2.1 1 Định nghĩa chuỗi thời gian cần dự báo

2.1.1 Mô hình HMM với phân phối Poisson

Để áp dụng mô hình HMM cho dự báo chuỗi thời gian, luận án minh họa cả 2 phương pháp ước lượng tham số đã trình bày trong mục 1.3.2 Chương 1 Đối với ước lượng MLE, luận án thực hiện lập trình trên R cho mô hình HMM với trạng thái là các phân phối Poisson Phân phối Poisson có tham số 0 vừa là trung bình vừa là phương sai.Việc thực hiện ước lượng tham số theo phương pháp MLE theo thuật toán sau:

Thuận toán 2.1 Maximum hàm hợp lý

Đầu vào: x,m, lambda0,gamma0

Đầu ra: m, lambda0, gamma0, BIC, AIC, mllk

1: procedure POIS HMM MLE (x,m, lambda0,gamma0, )

7: AIC < −2 ∗ (mllk+np) {Tính tiêu chuẩn AIC}

8: n < −sum(!is.na(x)) {Tính số quan sát}

Trang 11

9: BIC < −2 ∗mllk+np ∗ log(n) {Tính tiêu chuẩn BIC}

10: return (lambda, gamma, mllk, AIC, BIC)

2.1.2 Mô hình HMM với phân phối chuẫn

Trong mô hình với phân phối chuẩn, các tham số của xích Markov vẫn là gamanhưng tham số của phân phối trộn gồm trung bình mu và phương sai sigmatrong khi m vẫn là số trạng thái của mô hình còn delta là phân phối dừng của xích Markov

Hàm tính các FWP va BWP được thực hiện bởi hàm norm.HMM.lalphabeta (logarit của FWP va BWP) Trong đó, lalpha, lbeta lần lượt la logarit của FWP va BWP

Thuận toán 2.3 Tính các xác suất lũy tiến và lùi của LT

Đầu vào: x,m,mu, sigma,gamma,delta

Đầu ra: lalpha, lb = lbeta

1: procedure NORM.HMM.LALPHABETA(x,m,mu, sigma,gamma,delta )

2: if (is.null(delta)) then delta←solve(t(diag(m)−gamma+1), rep(1,m)) { Trong trường

hợp không định trước được phân phối ban đầu của xích Markov} 3: Tính các xác suất FWP theo (1.2.6) cho lalpha 4: Tính các xác suất cho BWP theo (1.2.7) cho lbeta 5: return list(la = lalpha, lb = lbeta) Đến đây, theo thuật toán EM trong mục 1.3.2 của Chương 1 ta có thể thực hiện ngay ước lượng tham số bởi hàm norm.HMM.EM Thuận toán 2.4 Thuật toán EM cho Normal-HMM Đầu vào: x,m,mu(), sigma(),gamma(),delta(),maxiter, tol Đầu ra: mu, sigma, gamma, delta, mllk, AIC, BIC 1: procedure NORM.HMM.EM(x,m,mu, sigma,gamma,delta,maxiter, tol ) 2: mu.next ←mu(); sigma ←sigma();delta ←delta() {Gán tham số cho giá trị ban đầu} 3: for iter in 1 : maxiter do 4: f b←norm.HMM.lalphabeta(x,m,mu, sigma,gamma,delta= delta) {Tính FWP và BWP} 5: llk ← gia 1trị hàm hợp lý 6: for j in 1:m do 7: for k in 1:m do 8: Tính gamma[ j,k]

9: Tính mu[j]

10: Tính sigma [ j]

11: Tính delta

12: crit ← sum(abs(mu[j] – mu()[j])) + sum(abs(gamma[jk] – gamma()[jk])) + sum(abs(delta[j] –delta()[j]))+sum(abs(sigma[j]sigma()[j])) {Tiêu chuẫn hội tụ} 13: if crit < tol then 14: AIC← -2 ∗ (llk−np) {Tiêu chuẩn AIC} 15: BIC← -2 ∗ llk+np ∗ log(n) {Tiêu chuẩn BIC}

17: else {Nếu chưa hội tụ}

mu0←mu; sigma0←sigma; gamma0←gamma; delta0←delta {Gán lại tham số ban đầu mới}

Trang 12

18: Không hội tụ sau, “maxiter”, vòng lặp

2.2.1 Ước lượng tham số

Bảng 2.2.1 Ước lượng tham số của mô hình Poisson-HMM cho time.b.to.t với các trạng thái m=2,3,4,5

2

11,46267 40,90969

0,6914086 0,3085914

0,3587816 0,5121152 0,1291032

0,3189824 0,3159413 0,2301279 0,1349484

0,31513881 0,28158191 0,22224329 0,10376304 0,07727294

Bảng 2.2.2 Trung bình và phương sai mô hình so với mẫu

M Trung bình Phương sai

2.2.2 Lựa chọn mô hình

Giả sử quan sát x1, ,x Tđược sinh ra bởi mô hình "thật" f nào đó không biết và ta ướm mô hình bởi hai họ xấp xỉ khác nhau {g1G1}và {g2G2} Mục đích của chọn mô hình là xác định

mô hình mà tốt nhất theo nghĩa nào đó

Bây giờ, áp dụng hai tiêu chuẩn AIC và BIC đối với mô hình Poisson-HMM cho dữ liệu time.b.to.t, kết quả được liệt kê trong Bảng 2.3.3

Trang 13

Bảng 2.2.3 Tiêu chuẩn AIC và BIC

2.2.3 Phân phối dự báo

Như đã đề cập ở trên, dữ liệu đào tạo đối với mô hình HMM được lấy từ 03/01/2006 đến 19/06/2013 Ta sẽ lấy dữ liệu tiếp theo từ 14/06/2013 đến 22/08/2013 để so sánh với kết quả dự báo của mô hình Hình 2.1.2 mô tả diễn biến của chỉ số đóng của VN-Index trong khoảng thời gian này Ta thấy rằng, số phiên dao dịch để chỉ số VN-Index từ đáy (26/06/2013) lên đỉnh (19/08/2013) là 35 ngày Như vậy, giá trị này ứng với trạng thái 3 của mô hình (phân phối Poisson với trung bình 27.711948) Ta sẽ chờ xem kết quả dự báo của mô hình ra sao

Hình 2.2.1 Diễn biến chỉ số Vn-Index từ 14/06/2013 đến 22/08/2013 và thời gian chờ từ đáy lên đỉnh

Bây giờ, ta cần tìm công thức xác định phân phối dự báo ( ) ( )

h T T

h T T

Các phân phối này được tóm tắt trong Bảng 2.3.4

Bảng 2.2.4 Thông tin phân phối dự báo và khoảng dự báo

Ngày đăng: 24/04/2018, 22:49

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w