Mởđầu
Chươngnàyluậnántrìnhbàycáckiếnthứctổngquanphụcvụnghiêncứucủanghiên cứu sinh cũng như những kết quả trực tiếp được sử dụng cho nghiên cứu.Những tính chất của khái niệm mà không sử dụng cho nghiên cứu sẽ không được đềcậpđếnluậnánnày.Cụthể,cácnộidungtổngquanchínhcủachươngnhưsau:
Thứ nhất, luận án trình bày các hướng nghiên cứu dự báo chuỗi thời gian gầnđâynhấtvàphântíchnhữnghạnchếcủanó.Từđóđưarađềxuấtpháttriểnmôhìnhcủanghiênc ứusinh.
Thứ hai, luận án trình bày các khái niệm về xích Markov, xích Markov thuầnnhấtvàdừngcũngnhưphươngphápướclượngmatrậnxácsuấtchuyển.
Thứ ba, luận án trình bày mô hình Markov ẩn (HMM) và các vấn đề về ướclượngthamsốcũngnhưdựbáo.
Cuốicùng,luậnánđưaramộtsốkếtquảcủacácnghiêncứuđượccôngbốgầnđây của các mô hình dự báo theo hướng kết hợp các mô hình dự báo sẵn có Các kếtquảnàysẽđượcnghiêncứusinhsosánhvớikếtquảcủanghiêncứu.
Toànbộluậnánnghiêncứuvềvấnđềdựbáochuỗithờigianbằngcácmôhìnhkhácnhauhoặc cácmôhìnhxâymớibằngphươngphápkếthợpmôhình.Dođó,kháiniệmvềchuỗithờigiantrướctiênc óthểđượcphátbiểunhưsau: Địnhnghĩa1.1.1 C h u ỗ ithờigianlàmộtchuỗicóthứtựcủamộtbiếnngẫunhiêntại cácthờiđiểmđượcchiathànhnhữngkhoảngthờigianbằngnhau X 1 ,X 2 ,
X 1 ,X 2 , ,X t Các X t ,t 1, ,T cóthểlàmộtbiếnngẫunhiêncũngcó thểlàcácbiếnngẫunhiênkhácnhau.Cácgiátrịquansátđượcdobiếnngẫunhiên X t sinhratạithờiđiểm tthường kýhiệulà x t Đôikhiđểthuậnlợitrongcáchviếtvàbiến đổi,nhiềusáchvẫngiữkýhiệu X t màvẫnhiểulàgiátrịquansát.
Cácnghiêncứuliênquanvàhướngpháttriểncủaluậnán
Như đã đề cập trong phần mở đầu, các phương pháp dự báo chuỗi thời giantruyền thống như ARIMA hay GARCH ít nhiều bộc lộ những hạn chế Do đó, cáchướngtiếpcậnmớiđãđượcpháttriểnmạnhmẽ.Mộtlựachọnkhácchodựbáochuỗithờigianđ ượcpháttriểngầnđâyhơnlàmôhìnhmạngthầnkinhnhântạo(ANN).CácmôhìnhANNkhôn gdựatrênphânphốitấtđịnhchodữliệumànóhoạtđộngtươngtựbộnãoconngười,cốgắngtìmraqu yluậtvàđườngđicủadữliệuhuấnluyện,kiểmtrathựcnghiệmvàtổngquáthóakếtquả.Hơnnữa,bả nchấtcủaANNlàthựchiệnthôngquacácràngbuộc,vìvậynócầnrấtnhiềudữliệuhuấnluyệnđểdự báochínhxácvàhiệuquảhơn.Vớicáchhoạtđộngcủanó,cácmôhìnhANNthườngsửdụnghiệuquả hơnchomụcđíchphânlớpdữliệu[41].Gầnđâyhơn,lýthuyếtmớivềhọcmáythốngkêđangđượ cnhiềunhàkhoahọcchúýlàphươngphápvectorhọcmáyhỗtrợ(SVM)cho bài toán phân lớp và dự báo[62,
14, 56] Phương pháp SVM cố gắng đi tìm quytắcquyếtđịnhcótínhkháiquátcaothôngquamộtsốcáctậpconcủatậphuấnluyện,đượcgọilàcá cvectorhỗtrợ.Theođó,mộtánhxạphituyếnđượcthựchiệntừkhônggian đầu vào lên không gian có số chiều lớn hơn Sau đó, một siêu phẳng tối ưu sẽđượcdùngđểphânlớpcácvectorhỗtrợđượcthựchiệntrướckhiánhxạngượctrởlạikhônggianbanđầ u.Đểlàmđượcđiềunày,phươngphápSVMdẫnđếngiảibàitoánhồiquytuyếntính.Dođó,ban đầuphươngphápSVMđượcsửdụngtrongcácbàitoánphân lớp Về sau, SVM được áp dụng rộng rãi hơn trong nhiều lĩnh vực như xấp xỉhàm,ướclượnghồiquyvàdựbáo[14,56].Tuynhiên,hạnchếlớnnhấtcủaSVMlàkhitậphuấnl uyệnlớn,nóđòihỏilượngtínhtoánkhổnglồcũngnhưđộphứctạpcủabàitoánhồiquytuyếntínhtron gđó. Đểkhắcphụccáchạnchếvàpháthuycácđiểmmạnhcủacácphươngphápđãcó,mộxuthếng hiêncứuđangtrởnênthịnhhànhgầnđâylàphươngtiếpcậnkếthợp(CA), nghĩa là kết hợp một số phương pháp không giống nhau để tăng độ chính xáccủa dự báo Rất nhiều nghiên cứu đã được thực hiện và theo hướng này và rất nhiềucácmôhìnhkếthợpmớiđãđượccôngbố[71,2,3].Mộtsốphươngpháptrongđósửdụngxíc hMarkov(MC)cũngnhưmôhìnhMarkovẩn(HMM).RefiulHassan[33]đã pháttriểnmộtmôhìnhhợpnhấtbằngcáchkếthợpmộtHMMvớilogicmờđểtạoracácdựbáotron gmộtngày-trướccủagiácổphiếu.Cụthểnhưsau
Dữliệuđầuvàolàvector x i x i,open ,x i,high ,x i,low ,x i,close t ư ơ n g ứngvớicác giátrịcổphiếumởcửa,caonhất,thấpnhấtvàđóngcủacủangàythứi.
(gọilàlog-likelihood)chialàm7khoảng bằngnhaugọilàcácnhómlog-likelihood.Cácnhómnàyđóngvaitròlàcác tậpmờ củadữliệu Hàmthành viên
M(x) chomỗiphần tửtrongcáctập mờnàylàphân phối chuẩntựsinhratrongmôhìnhHMMvớiphânphốichuẩn.
Luậtmờđượctínhnhưsau:Nếu x ope n cómức M ope n vớithamsốp 1, x high có mức M high vớit h a m s ố p 2, t h ì g i á t r ị đ ó n g c ử a d ự đoán predict close p 1 x open p 2 x high p 3 x low p 4 x close trongđ ó c á c t h a m s ố p iđược ướclượngbằngphươngphápbìnhphươngtốithiểutừtậphuấn luyệntươngứngvớicácnhómlog-likelihood(trạngthái).
Tương tự mô hình này, mô hình Markov với trọng số (các tham số tuyến tínhchomỗitrạngthái)đãđượcPeng[52]ápdụngtrongdựbáovàphântíchtỷlệtruyềnnhiễm bệnh ở tỉnh Giang Tô, Trung Quốc Yang[69]đã kết hợp mô hình HMM đểphâncụmdữliệuthờigian.C á c môhìnhkếthợpnàyđãmanglạinhữngkếtquảcóýnghĩa trong thực tiễn cũng nhưng tăng đáng kể độ chính xác trong dự báo so với cácmôhìnhtruyềnthống.Tuynhiên,xuấthiệnnhữngtồntạitrongvànghivấntrongmôhìnhcầnđược giảiquyếtnhư:
1 ViệcphânlớpdữliệusửdụngHMMcholog-likelihoodcóthựcsựhiệuquảhơn so với việc thực hiện đơn giản hơn bằng cách chia trực tiếp chuỗi tăng trưởngthànhcáckhoảng.
2 Mốiquanhệtuyếntínhgiữagiáđóngcửahômsausovớivectorgồmgiámởcửa,caonhất,th ấpnhất,đóngcửahômtrướccóthựcsựtồntạihaychỉđơngiảnlà i i i i nhữngbiếnngẫunhiênđộclậptheothờigian.Nếuchúngđộclập,chỉcẩnchuỗiđóngcửacóthểdựbá ođượcchínhnó.
Luận án sẽ thực hiện áp dụng mô hình HMM với những phân phối cụ thể chodữliệucógiátrịlàsốtựnhiên(phânphốiPoisson)vàdữliệuthực(phânphốichuẩn)cho dự báo chuỗi thời gian chỉ số chứng khoán trong Chương 2 để kiểm tra độ chínhxácdựbáosovớicácmôhìnhcổđiểnnhưARIMAhayANN.
Cácdữliệuchuỗithờigiantàichínhnóichungđềulàcácdữliệumờ.Nghĩalàranh giới giữa các mức độ tăng trưởng không rõ ràng phụ thuộc vào cảm quan củangườiđánhgiá.Dovậy,việcphânlớpdữliệuđểphântíchdựbáocầnđượcmờhóa.Đểđốiphó vớinhữngdữliệumờ,mộthướngnghiêncứumớitrongdựbáochuỗithờigian được mở ra gần đây là sử dụng mô hình chuỗi thời gian mờ (FTS) Kết quả đầutiên cần được kể đến trong việc áp dụng lý thuyết này là Song and Chissom[60].Nhữngnghiêncứutậptrungtheohướngcảithiệncácmôhìnhchuỗithờigianmờvà tìm cách áp dụng vào bài toán dự báo Jilani et al and Nan et al.kết hợp mô hìnhHeuristicvớichuỗithờigianmờđểnângcaođộchínhxáccủamôhình[46].ChenvàHwang mở rộng thêm các chuỗi thời gian mờ vào mô hình Binary[17]và sau đóHwangandYupháttriểnthànhmôhình Nbậc đểdựbáochỉsốchứngkhoán[37].
Trong một bài báo gần đây[61], BaiQing Sun et al đã mở rộng mô hình mờcho chuỗi thời gian mờ đa biến để dự báo giá tương lai của thị trường chứng khoán.Môhìnhchuỗithờigianmờcủatácgiảthựchiêntrên3chuỗigồm:chỉsốCSI300(300m ãchứngkhoánTrungQuốc);giámua(spotprice)vàkhốilượnggiaodịch.Cácchuỗi tăngtrưởngtươngứngcủa3chuỗinàylầnlượtđượcmờhóatheo6tập (A 1 , ,A 6 ),4 tậ p (B 1 ,B 2 , B 3 , B 4 ) và3tập (C 1 ,C 2 ,C 3 ).Mụctiêucủadựbáolàcác A i Luậtmờđược pháthiệntừA i ,B i ,C i A j ,A j ,A j ,trongđói j 0cónghĩalàkhuyết A i , B i hoặc
Như vậy, mô hình của Sun cần phải sử dụng đến những chuỗi phụ để dự báochuỗimụctiêunhưngchưachỉrađượctươngquangiữacácchuỗitheothờigian.Thựctế,tổ nggiátrịdaodịchtăngnhưngchỉsốchứngkhoáncókhităngcũngcókhigiảm.Vìvậymốiquanhệ mờtìmđượcgiữachúngtrongtậphuấnluyệnkhônghẳnsẽphảnánhtrongtươnglai.
Hơnnữa,cáchtínhgiátrịdựbáotheotrungbìnhcủatầnsốxuấthiệnnhưtrong(1.2.1) tương đương với kỳ vọng của một phân phối xác xuất Điều này tương tự vớicáchdựbáotrongmộtxíchMarkovnhưngthuậttoántìmkiếmvàliệtkêphứctạphơn.Dođó, môhìnhcóthểđơngiảnhóabằngcáchkếthợpchuỗithờigianmờ(nhằmphânnhóm dữ liệu) với một xích Markov (tương đương với tìm quan hệ mờ một cách tựđộng).Mộtkhimôhìnhthaythếđượctínhtoántrêncũngdữliệu,rõràngcáctínhtoánsẽđơngi ảnhơntrongkhicóthểvẫnđảmbảođượcđộchínhxácdựbáo.Môhìnhnhưvậyluậnánsẽxâydựngtro ngChương3.
Tìmcácquanhệmờbậccaochochuỗithờigianmờ{F(t)} tươngứng dạng F(tk)F(t) nhằmdựbáocácgiátrị yˆ t,k tươngứngcủachuỗităng trưởng.
Giátrịdựbáocuốicùngđượctínhbởi predicted t 1 yˆ t,1 2 yˆ t,2 trongđócáctrọngsốtuyếntính i đượcướclượngtốiưubằngcáchkết hợpmôhìnhtựhồiquyvàthuậttoántốiưuhóađànkiếnđểtìmbộthamsốtốtnhấtđốivớid ữliệuhuấnluyện.
CũngnhưnghiêncứucủaSun,nghiêncứucủaCaichothấyviệcsửdụngquanhệmờbậccao kếthợpvớihồiquytuyếntínhtươngứngvớimộtxíchMarkovbậccaocảitiếnmàthuậttoánướclượngth amsốcủanótựđộngvàđơngiảnhơnnhiều.Chínhvìvậy,môhìnhdạngnàycóthểđềxuấtthaythếbởi môhìnhMarkovbậccaocảitiếnmàluậnánsẽthựchiệnvàsosánhtrongChương3. ỞViệtNam,môhìnhchuỗithờigianmờgầnđâycũngđãđượcápdụngtrongmộtsốlĩnhvự ccụthểnhưngtronglĩnhvựcdựbáochuỗithờigianvẫncònkháít.Cóthể kể đến nghiên cứu của Nguyễn Duy
Hiếu và cộng sự[B2]trong phân tích ngữnghĩa.Ngoàira,cáccôngtrìnhcủatácgiảNguyễnCôngĐiều[B3,B4]đãkếthợpmôhình chuỗi thời gian mờ với một số kỹ thuật điều chỉnh tham số trong thuật toán haynhững đặc trưng riêng của dữ liệu để làm tăng độ chính xác của dự báo. Nghiên cứucủatácgiảNguyễnCátHồ[B1]đãứngdụngđạisốgiatửvàodựbáochuỗithờigianmờchothấyđ ộchínhxácdựbáocảithiệnhơnmộtsốmôhìnhhiệncó.
NghiêncứucủaNguyễnCôngĐiềuchỉdừnglạiởđiềuchỉnhthuậttoántốiưuhóathamsốt ừdữliệuhuấnluyệnnhằmtăngđộchínhxáccủamôhìnhchuỗithờigianmờcổđiểnthựchiệntrên chỉ1bộdữliệu.Dođó,tínhưuviệtsovớicácmôhìnhkháctrongdựbáochuỗithờigianbấtkỳchưađ ượckiểmchứng.Đốivớihươngtiếpcậnđạisốgiatử(ĐSGT)vàodựbáochuỗithờigianl àmộthướngđikhôngphổbiếnbởi ĐSGTphântíchcấutrúcngữnghĩachonhữngbiếnngônngữ.Trongnghiêncứucủacáctácgiảtr ong[B1]chỉthựchiệnmôhìnhtrên1dữliệusốlượngtiếpnhậnsinhviêncủatrườngđạihọcMỹ,mộtd ữliệumàcótínhổnđịnhcao.Trongkhiđó,độchínhxáccủamôhìnhdựbáochochuỗithờigian bấtkỳ,đặcbiệtlàchuỗithờigiantàichínhvẫnlàmộtcâuhỏibởicácchuỗithờigiannàymangtínhngẫu nhiêncaohơnnhiều.Chínhvì lẽ đó, luận án sẽ không đi theo hướng này để phát triển mô hình dự báo cho chuỗithờigiannóichung.
Từcácphântíchtrên,luậnánsẽchỉraưuđiểmvàhạnchếcủamôhìnhHMMtrongdựbáoc huỗithờigiantrongChương2đồngthờitậptrungxâydựngmôhìnhdựbáochuỗithờigiandựat rênmôhìnhkếthợpxíchMarkovvàchuỗithờigianmờnhằmđơngiảnhóanhữngmôhìnhman gtínhtươngđươngđãđềcậptrướcđótrongChương
XíchMarkov
Tronglýthuyếtxácsuấtvàcáclĩnhvựcliênquan,quátrìnhMarkov(đặttheotêncủanhàt oánhọcngườiNgaAndreyMarkov)làmộtquátrìnhngẫunhiênthỏamãnmộttínhchấtđặcbiệt, gọilàtínhchấtMarkov[29]
(còngọilàtínhmấttrínhớ).Tínhchấtnàygiúpdựbáođượctươnglaichỉdựavàotrạngtháihiệntại.Đ iềunàycũngcónghĩa trạng thái tương lai và quá khứ là độc lập nhau Tuy nhiên về sau, quá trìnhMarkov được mở rộng thành Markov bậc cao[20], trong đó tương lai phụ thuộc vàohiệntạivàmộtquãngthờigiannàođótrongquákhứ.
Xích Markov là quá trình Markov đặc biệt mà trong đó hoặc có trạng thái rờirạchoặcthờigianrờirạc.QuátrìnhMarkovđượcnhàtoánhọcMarkovbắtđầunghiêncứutừ khoảngđầuthếkỷ20mặcdùcónhiềunghiêncứuhàngtrămnămtrướcđóvềquá trình này nhưng dưới dạng các biến ngẫu nhiên phụ thuộc Hai ví dụ quan trọngnhấtcủaquátrìnhMarkovlàquátrìnhWiener(haychuyểnđộngBrownian)vàquá trìnhPoisson[45].Haiquátrìnhnàyđượccoilàquantrọngnhấtvàlàtrungtâmcủalýthuyếtquátr ìnhngẫunhiên.
Xích Markov có rất nhiều ứng dụng với vai trò là các mô hình xác suất trongcácquátrìnhthựctế[40,31,42].ThuậttoánđượcbiếtđếnlàPageRankđượcthựchiệnkh ởinguồnchocôngcụtìmkiếmcủaGoogleđượcdựatrênxíchMarkov[48]. Đốivớicácdữliệuthốngkêtrongthựctế,cácmôhìnhthườngsửdụngcácbiếnrời rạc thậm chí rời rạc hóa cho thực nghiệm Đối với mỗi trạng thái kinh tế, nó xuấthiệnmộtlầntrongdữliệuhuấnluyệnvàkhôngchuyểnsangtrangtháikhác(trạngtháihấpthụ )khôngcónghĩatrongtươnglaitrạngtháiđómãiduytrìởđó.Vìvậy,luậnánchỉnghiêncứuápdụngm ôhìnhđốivớixíchMarkovcảthờigianrờirạcvàtrạngtháirờirạc,thuầnnhấtvàchínhquy.
Ta xét một hệ thống kinh tế hoặc một hệ thống vật chất S với m trạng thái cóthể,kýhiệubởitậpI:
I1,2, ,m hệthống S t i ế nhóangẫunhiêntrongthờigianrờirạc(t0,1,2, ,n, ),vàđặtbiếnn gẫunhiêntươngứngvớitrạngtháicủahệthống S ởthờiđiểm n(C n I).
C n là Địnhnghĩa1.3.1 Dãybiếnngẫunhiên( C n ,n )làmộtxíchMarkovnếuvàchỉnếu vớitấtcả c 0 ,c 1 , ,c n I :
(1.3.1) Địnhnghĩa1.3.2 MộtxíchMarkovđượcgọilàthuầnnhấtnếuchỉnếuxácsuấttrong(1.3.1)kh ôngphụthuộcvào n vàkhôngthuầnnhấttrongcáctrườnghợpcònlại.
MộtmatrậnΓthỏamãn2điềukiệnnàyđượcgọilàmộtmatrậnMarkovhay matrậnchuyển. Đốivớimọimatrậnchuyển,tacóthểliênkếtvớimộtđồthịchuyểnvớicácđỉnhlàcáct rạngthái Tồntạimộtcunggiữađỉnh i v à j nếu và chỉnếu ij 0. ĐểđịnhnghĩađầyđủsựtiếntriểncủamộtxíchMarkov,cầnthiếtphảicốđịnhmộtphânphố ibanđầuchotrạngthái C 0 ,chẳnghạn,mộtvéctơ: p(p 1 ,p 2 , ,p m ), saocho: p i 0,iI,
Vớimọi i ,p i đượchiểulàxácsuấtđầutiêncủasựbắtđầucótrạngthái i : p i Pr(C 0 i). VấnđềởchươngnàytachỉdừnglạiởviệcxemxétxíchMarkovthuầnnhấtmàđượcđặctr ưngbởicặp(p,Γ).
Nếu C n i h.c.c(hầuchắcchắn),đónghĩalàhệthốngbắtđầuvớixácsuất bằng1từtrạngtháii,thìvéctơ psẽ là: p j ij
, Tathấyquanhệ(1.3.2)tươngđươngvới Γ (2) Γ 2 Sửdụngquynạp,dễdàngchứngminhđượcrằng,nếuviết Γ (n)
Chúýrằngquanhệ(1.3.3)làmđơngiảnhóamatrậnchuyểntrong n b ư ớ c thìbằnglũythừa n lần matrận Γ n0:
0 ji ji hoặc Γ (0) I, thìquanhệ(1.3.4)đúngvớimọi n0.Nếu: γ(n) 1 (n), 2 (n), , m (n) , thìquanhệ(1.3.4)cóthểđượctínhquakýhiệumatrận: γ (n) pΓ n Địnhnghĩa1.3.3 MộtmatrậnMarkovΓ đượcgọilàchínhquynếutồntạimộtsốnguyên dương k sao chotất cả cácphần tửcủa ma trận Γ (k) là thựcsự dương.
Từquanhệ(1.3.3),Γ là chínhquynếuvàchỉnếutồntạimộtsốnguyênsaochotấtc ảcácphầntửcủamatrậnlũythừabậc kcủa Γlàdươngthựcsự.
Hình1.3.2.V ídụmatrậnMarkovkhôngchínhquy ĐồthịchuyểntrongtrườnghợpnàyđượcmôtảtrongHình(1.3.2).Cũngnhư vậyđốivớimatrận:
Lấy iIvà đặtd(i)làướcchunglớnnhấtcủatậpcácsốnguyên nsao cho
(n) 0. Địnhnghĩa1.3.4 N ế u d(i)1,trạngtháiiđ ư ợ c gọilàtuầnhoànchukỳ d(i).Nếu d(i)1,t h ì trạngtháiik h ô n g tuầnhoàn.
ii 0thì ilàkhôngtuầnhoàn.Tuynhiên,điềungượclạichưa
Chúý1.3.1.NếuΓlàchínhquythìtấtcảcáctrạngtháiđềukhôngtuầnhoàn. Địnhnghĩa1.3.5 M ộ txíchMarkovmàtấtcảcáctrạngtháicủanókhôngtuầnhoànđượcgọilàxíc hMarkovkhôngtuầnhoàn.
Từđây,tachỉnghiêncứuloạixíchMarkovnày. Địnhnghĩa1.3.6 M ộ ttrạngtháiiđ ư ợ c gọilàvươntớitrạngthái j ( v i ế t là i j )nếutồntạisốnguyêndương n s a o cho iC j nghĩa làik h ô n g vươntới được j
n 0. Địnhnghĩa1.3.7 Trạngtháiivà j đượcgọilàliênthôngnếu i j và j i ,hoặcnếu ij Taviết i Định nghĩa 1.3.8 Trạng tháiiđược gọi là cốt yếu nếu nó liên thông với mọi trạngtháimànóvươntới;trườnghợpngượclạigọilàkhôngcốtyếu.
Quanhệ xácđịnhmộtquanhệtươngđươngtrênkhônggiantrạngtháiIdẫntớimộtsựchialớptrên I L ớ p t ư ơn gđươngchứai đ ư ợ ckýhiệu bởiC l(i). Địnhnghĩa1.3.9 X í c hMarkovđượcgọilàkhôngkhaitriểnđượcnếuchỉtồntạiduynhấtmộtlớptư ơngđươngtrênnó. j i i i
Dễ thấy, nếuΓlà chính quy, xích Markov vừa là không khai triển được, vừakhông tuần hoàn Xích Markov vừa không khai triển được (tức là chỉ có 1 lớp tươngđương),vừakhôngtuầnhoànđ ư ợ c gọilàxíchMarkovergodic.
Dễ dàng chỉ ra rằng, nếu trạng tháiilà cốty ế u ( k h ô n g c ố t y ế u ) t h ì t ấ t c ả c á c phầntửcủalớpC(i)cũngcốtyếu(khôngcốt yếu)(xemChung(1960))[21].
Cóthểchỉrarằngmọilớpcốtyếulàđóngnhỏnhất.XemChung(1960)[21]. Địnhnghĩa1.3.11 Trạngthái iI củaxíchMarkov (C t ) đượcgọilàhồiquynếutồn trạitrạngtháijIvà n saochochuyểntiếp
Mệnhđề 1 3 1 ( Đ ị n h l ýk h a i t riể n)[ 2 1 ]:K hô ng giantrạng t há iIcủamọixíc h Markovđềucóthểphânchiathành r(r
(1) Nếumộtlớpkhôngcốtyếugiảmtớitậpđơn{i},thìcó2khảnăng: a) Tồntạimộtsốnguyêndương N saocho:
0p N 1. b) Số N tronga)khôngtồntại.Trongtrườnghợpnày,trạngtháiiđượcgọilà trạngtháikhôngtrởlại.
(2) Nếutậpđơn{i}lậpthànhmộtlớpcốt yếu,thì p ii 1 vàtrạngtháiiđượcgọilàtrạngtháihấpdẫn.
CácmôhìnhsửdụngxíchMarkovởChương2vàChương3đượcgiảsửrằngcáctrạngtháil àchuyểntiếp,cónghĩalànókhôngdừnglạiởtrạngtháinàonhằmđảmbảovớiquyluậttiếntriểncủach uỗithờigiantrongthựctế.Trongthựctế, mộttrạngthái kinh tế bất kỳ không thể duy trì mãi mãi ở trạng thái đó. Trong trường hợp ướclượng ma trận xác suất chuyển từ tập huấn luyện có thể tồn tại một trạng thái khôngchuyểntiếpđếnbấtkỳtrạngtháikhác(dotậphuấnluyệnlàhữuhạn),tacầnhiệuchỉnh n k n n xác xuất chuyển cho trạng thái đó bằng cách cố định cho nó một phân phối xác suấtnhấtđịnhhoặcgiảmsốlượngtậphuấnluyệnđếnkhinókhôngbịhấpthụnữa.
PhầnnàyluậnántrìnhbàyphươngphápướclượngthamsốcủaxíchMarkovđãđượcbiếtđ ếnrộngrãitronglĩnhvựcthốngkê.Trêncơsởđó,phươngphápướclượngsẽđượcnhúngvàotrongmô hìnhkếthợpmàluậnánđềxuất.
XétxíchMarkov( C t ),t 1,2, vàgiảsửquansátđược ncác trạngtháixảyra c,c, , c Kýhiệuc n c,c, , c sinhbởicábiếnngẫunhiênC n thìhàmhợplýcủa
Pr(C1c1) Pr Ct ct|Ct1ct1 t2
Pr(C 1 c 1 ) c t1 c t t2 Địnhnghĩasốlầnchuyển n ij s ốlầnmàtrạngtháii c h u y ể ntiếptheosaulà trạngthái jtrong dãy C n ,khiđóhàmhợplý(likelihood)códạng
(p)logL(p)logPr(C 1 c 1 ) n ij l og ij i,j
i 1. iI (1.3.11) Đẳngthức lim (n) n ij j (1.3.12) đượcgọilàđẳngthứcergodic,dogiátrịcủagiớihạntrong(1.3.12)độclậpvớitrạngtháibanđầui.
Từkếtquả(1.3.12)và(1.3.4),tathấyrằngvớimọiphânphốibanđầu π: lim(n)lim (n) , n i n j jj i vìvậy:
j i , j lim( n). n ĐiềunàychỉrarằngdángđiệutiệmcậncủaxíchMarkovđượcchobởisựtồn tại(hoặckhôngtồntại)củagiớihạncủamatrận Γ n
Mộtkếtquảchuẩn mựcvềdángđiệutiệmcậncủa Γ n đượcđưara ởmệnhđề tiếptheo Chứng minh của nó xem ở Chung (1960)[21], Parzen (1962) [50]hoặcFeller(1957)[28].
Trong[21]đãchỉrarằng,đốivớimộtxíchMarkovhữuhạntrạngtháivớimatrận xác chuyển chính quy luôn tồn tại duy nhất phân phối dừng duy nhất không phụthuộc vào phân phối ban đầu Đối với thực tiễn, nếu một quá trình kinh tế biến đổiquanh một số trạng thái theo một xích Markov chính quy, thì phân phối xác suất tạimộtthờiđiểmbấtkỳlàổnđịnh.Điềunàycóýnghĩaquantrọngtrongdựbáocũngnhư t t t1 quảnlýrủirotrongtàichínhcũngnhưtrongbảohiểm.Luậnáncũngchothấyđiềunàyởkếtquảd ựbáotiếntớiphânphốiổnđịnhtrongChương2.
Môhình Markovẩn
MôhìnhMarkovẩn(HMM)làmộtmôhìnhdùngđểđặctảmộtchuỗithờigiantrong đó giả sử các giá trị của chuỗi thời gian được sinh bởi mbiến ngẫu nhiên khác nhaumàcácbiếnngẫunhiênnàyphụthuộctheomộtxíchMarkov.Dođó,mộtmô hìnhHMMbaogồmhaithànhphầncơbản:chuỗi X t ,t 1, ,T gồmcácquansátnhìn thấyvà C t i,t1, ,T,i{1,2, ,m}l àcácthànhphầnsinhratừcácquansátđó.Thựcchất,môhình HMMlàmộttrườnghợpđặcbiệtcủamôhìnhtrộnphụthuộc[24]vàcác C tl à cácthànhphầntrộn.
Nhưvậy,thànhphầnthứnhấtlàquátrìnhthamsố{C t :t 1,2, }khôngquansátđược(ẩn)th ỏamãntínhchấtMarkov,thànhphầnthứhailàquátrìnhtrạngtháiphụ thuộc(phânbốphụthuộcvàomỗitrạngthái){X t ,t 1,2, } saocho,khi C t xácđịnh thìphânphốicủa X t chỉphụthuộcvàotrạngtháihiệntại C t màkhôngphụthuộcvào trạngtháihoặcquansát trướcđó.NếuxíchMarkovcó m t r ạ n g thái,tanói X t hìnhHMM m t r ạ n g thái. làmô
Bâygiờtagiớithiệumộtsốkýhiệusửdụngtrongnghiêncứu.Trongtrườnghợpquan sátrờirạc,tađịnhnghĩa pi x Pr Xt x|Ct i Đốivớitrườnghợpliêntục, p i (x ) làhàmmậtđộxácsuấtcủa X t nếuxíchMarkov nhận trạng tháii t ạ ithời điểm t t
Takýhiệumatrậnxácsuấtchuyểncủa mộtxíchMarkovthuầnnhấtlàΓ v ớ i các thànhphầncủa nólà ij đượcxácđịnhbởi
Từbâygiờ, m phân phốicủa môhình. p i (x ) đượcgọilàcácphânphốitrạngtháiphụthuộc
1.4.2 Likelihoodvàướclượngcựcđạilikelihood tacó Đốivớicácquansátrờirạc X t ,địnhnghĩa u i t Pr Ct i vớ i i1,2, ,T, m
u(t)P(x)1. làmatrậnđườngchéovớiphầntửthứit r ê nđườngchéolà p i (x ).Mặt khác,theotínhchấtcủaxíchMarkovthuầnnhất, u(t)u(1)Γ t1 vớiu(1) làphânphối trạngtháibanđầucủaxíchMarkov,thườngđượckýhiệuchungvớiphânphốidừnglà δ Vàdovậy,tacó
Tl à h à m h ợ p l ý ( l i k e l i h o o d ) c ủ a m ô h ì n h v ớ iT q u a n s á t x,x, ,x thìL Pr(X (T) x (T) ).Xuấtpháttừcôngthứcxácsuấtđồngthời
L T ΓP(x 1 ) ΓP(x 2 ) ΓP(x T ) 1. Đểcóthểtínhtoándễdànglikelihoodbằngthuậttoánđồngthờigiảmthiểusốphéptoánmàmá ytínhcầnthựchiện,tađịnhnghĩavector α tvới t1, ,Tbởi t
L T (MLE): Trướctiên,từphươngtrình(1.4.4)tacần tínhtoánlogaritcủa L T mộtcáchhiệuquảnhằmthuậnlợitrongviệctìmcựcđạidựa vàocácxácsuấtlũytiến α t Với t 0,1, ,T, địnhnghĩavector trongđów t t (i) t 1 ,và i
L T w T (w t /w t1 ).Từ(1.3.5)thấyrằng t1 wtwt1 Bt1 ,
. dẫnđến logLT log wt/ wt1 log t1Bt1 t1 t1
i 0 thìđổibiếnthành i log i Saukhiướclượngđược ˆ i thìphépbiếnđổi ngượcˆexpˆchotaướclượngcủathamsốbanđầu. i i
ViệcthamsốlạicácthamsốcủamatrậnchuyểnΓphứctạphơnbởiΓcó m 2 thamsố nhưngchỉcóm(m1)t h a msốtựdovàtổngtheomỗidòng thỏamãnràngbuộc
Vídụ,với m3tacóthểthamsốlạimatrậnΓnhưsau.Xétmộtmatrậncó m(m1) thamsố(ẩn)códạng
(1.4.6) và ( ij ). k1 Đếnđây,tatìmcựctiểucủahàm logL
Việc tìm cực tiểu của hàm với các biến tự do trong R dễ dàng thực hiện nhờhàm n l m
Tuynhiên,phươngphápnàyđòihỏikhốilượngtínhtoánlớn,nhấtlàkhiphảithựchiệnvới nhiềucácthamsốbanđầukhácnhauđểtránhtrườnghợpcónhiềucựctrị. t t t 1 t t t tt
Welch[7]ápdụngchoxíchMarkovthuầnnhất(khôngnhấtthiếtlàMarkovdừng).Thuậttoán sửdụng cácxácsuấtlũytiến(FWP)vàxácsuấtlũylùi(BWP)đểtính L T(tính từ2phía). ƯuđiểmlớnnhấtcủathuậttoánnàylàtậndụngđượccáctínhchấtcủaFWPvàBWPđểtínhtoáncác phânbốdựbáohaychỉradãytrạngtháicókhảnăngcaonhấtvềsau.
Mệnhđề1.4.2.[73]:Vớit1,2, ,T1vàj1,2, ,m,thì vớiđiềukiện
t (i)Pr Xt1xt1;Xt2xt2, ,XTxT| Cti ,
Mệnhđề1.4.3.[73]:Vớit1,2, ,T1và j1,2, ,m,thì dẫntới
1 ,c 2 , , c T làmộtxíchMarkovvàcáctrạngthái c i làcủa x t tươngứng(lưuýởđây c i ,x i làcác
C i ,X i) Đểthuậntiệntrongtínhtoán,địnhnghĩacác u j (t)1nếu c t j ,(t 1,2, ,T) và jk 1n ế u c t 1 j vàc _tk t2,3, ,T Cácbiếnngẫunhiênnàythaythếcho cáctrườnghợpxảyracủac t đốivớicácxácsuất c ,p c v à cc t t t1t
Vớicáckýhiệunày,log-likelihoodđầy đủ(CLL)củamôhìnhHMMkểcảdữliệukhôngđầyđủđượcchobởi
(T) (T) m mm T log Pr( x ,c ) u j (1)log j jk (t) log jk j1 j1k1 t2 mT
=thànhphần1+thànhphần2+thànhphần3Thuậtt oánEMchomôhìnhHMMthứtựnhưsau.
j,Ck|x (T) ) (j) p( x)(k)/L. jk t1 t t1 jkk t t T trongđó t và t tươngứnglàcáctoFWPvàBWPnhưở(1.4.7)và(1.4.8).
BướcM:Saukhithaythếxong jk (t) vàu j (t)bởi uˆ j (t )vàˆ jk (t),tìm cựcđạihàmCLL,phươngtrình(1.4.9),tươngứngvới3bộthamsố: j j j t j
Phânbốbanđầu, matrậnxácsuấtchuyểnΓv àcácthamsốcủaphân bốxácsuấttrạngthái. Đạo hàm hàm (CLL) và cho bằng 0 theo từng tham số tương tự trong
3 Với thànhphần3:Thànhphầnnàycó thểdễxửlýhoặckhótùythuộcvớiphânphốiđượcchọn.ĐốivớimôhìnhHMM cótrạngtháilàphânphối chuẩnvớihàmmậtđộcódạng p( x)(2 2 ) 1/2 exp
1.4.3 Phânphốidựbáo t1 t1 Đối với các quan sát có giá trị rời rặc, phân phối dự báo
MụctiêucủathuậttoánViterbilàđitìmdãytrạngtháitốtnhất i 1 ,i 2 , ,i T tương ứngvớidãyquansát Đặt x 1 ,x 2 , , x T màlàmcựcđạihàm L T
tj max i ( t 1,i ij ) p j (x t ) Dãytrạngtháitốtnhất i 1 ,i 2 , , i T dođóđượcxácđịnhbằnghồiquytừ i T argmax Ti i1, ,m và,vớitT1,T2, ,1,t h ì từ i t argmax( ti i,i )
Chuỗithờigianmờ
Giả sử U là không gian nền không gian nền này xác định một tập hợp các đốitượngcầnnghiêncứu.NếuA l àmộttậpconrõcủa Uthì tacóthểxácđịnhchínhxácmộthàmđặctrưn g:
NhưngvớimộttậpmờBt r o n gkhônggiannền Ut h ì phầntửxkhôngxácđịnh chínhxácđược.Khiđótacóđịnhnghĩa:
A : U [0,1], Ađ ư ợ c gọilàhàmthuộc (Membershipfunction).Cònvớibấtkỳmộtphầntử unào củaA t h ìhàmgọilàđộthu ộccủa uvào tậpmờA
GiảsửY(t)làchuỗithờigian(t0,1,2, ), U làtậpnềnchứacáckhoảnggiá trịcủachuỗithờigiantừnhỏnhấtđếnlớnnhất.XácđịnhhàmthuộctậpmờA, còntậpAtrênkhônggiannền Uđược viếtnhưsau:
(1.5.3) f Al à hàmthuộccủatậpmờA v à f A : U [0;1], f A (u i ) làđộthuộccủa u i vàotậpA. Địnhnghĩa1.5.2.[60]:Cho
Y(t)(t0,1,2, ) làtậpnền,l à mộttậpconcủa R 1 Giả sử f i (t )(i0,1,2, ) đượcxácđịnhtrênY t ,v à F(t) chứacáctập f 1 (t),f 2 (t), , khi đóF (t)đ ư ợ c gọilàchuỗithờigianmờxácđịnhtrên tập Y t . Địnhnghĩa1.5.3.
F(t1)F(t), mối quan hệ này có thể được diễn đạt như sau
F(t)F(t1)oR(t,t1),trongđóF(t)F(t1)oR(t,t1)đượcgọilàmôhìnhbậcmột củ a F(t),R(t,t1)làmốiquanhệmờgiữa F(t 1) vàF(t),v à "o "l à t o á n t ử t h à n h phầnMax–Min. Địnhn g h ĩ a 1 5 4
Trongphầnnày,sửdụngkháiniệmvàphươngphápdựbáocủachuỗithờigianmờđượcSong et.al.vàChissomđưarađểxâydựngthuậttoándựbáochochuỗithờigian.
Cònđốivớibấtkỳmộtphầntử unào củaAthìhàm A (u ) đượcgọilàđộthuộccủa uvào tậpmờA.TậpmờAtrênkhônggiannền Uđược viếtnhưsau:
Bước5:Chọnthamsốthứ csau: w1 thíchhợpvàtính R w (t,t1)vàdựbáotheocông
R w (t,t1)F T (t2)F(t1)F T (t2) F T (tw)F(tw1), vớiTlàtoántửchuyểnvị,dấu""l àtoántửtíchCartesiancòn w được gọilà"mô hìnhcơsở"môtảsốlượngthờigiantrướcthờiđiểm t
Các bước thực hiện của mô hình Huarng cũng triển khai theo các bước trên.Điều khác biệt là sử dụng một hàm h để xác định mối quan hệ logic mờ dưới đây làmôtảcácbướcthựchiệncủamôhìnhHeuristicchuỗithờigianmờ.
Bước1:Xácđịnhtậpnền.Tậpnền Uđược xácđịnhnhưsau:lấygiátrịlớn nhấ t f max vànhỏnhất f min củachuỗithờigian U[f max , f min ].Đôikhicóthểmởrộng khoảngnàythêmmộtgiátrịnàođóđểdễtínhtoán.Chiađoạn Uthành mk h o ả n g conbằngnhau u 1 ,u 2 , , u n
Bước2:Xácđịnhtậpmờ A ivà mờhoágiátrị.Mỗitập A i gánchomộtbiến ngônngữvàxácđịnhtrêncácđoạnđãxácđịnhthểbiểu diễnnhưsau: u 1 ,u 2 , , u n KhiđócáctậpmờAc ó
Bước 3:Thiết lập mối quan hệ mờ và nhóm các mối quan hệ mờ Như địnhnghĩa ở trên, đối với chuỗi thời gian mờ ta có thể xác định được mối quan hệ mờ tạimỗithờiđiểm tv à quađótaxácđịnhđượcnhómcácmốiquanhệmờ.
Bước5:Dựbáo.TừcácnhómquanhệlogicmờHeuristic.Cácgiátrịchủyếulấy từ điểm giữa hay trung bình các điểm giữa các khoảng cách trong nhóm quan hệmờheuristic.
Kếtluận
Chương này luận án trình bày những kiến thức cơ sở được sử dụng cho cácchươngsau,baogồm:
CáckháiniệmxíchMarkov,phânloạixíchMarkovvàướclượngthamsố của xích Markov Đặc biệt, xích Markov chính quy được sử dụngtrongChương3.
Mô hình Markov ẩn được trình bày chi tiết cùng các thuật toán ướclượng thamsố Đây là cơ sở cho mô hình Markov ẩn cho phân phốiPoissonvàphânphốichuẩn(Normaldistribution)đượcthựchiệntrongChươn g2.
XíchMarkovbậccaovàphươngphápướclượngthamsốđượctrìnhbàytrongMục 3.2 Lý thuyết về chuỗi thời gian mờ và một số thuật toántrongdựbáochuỗithờigiansửdụngchuỗithờigianmờđượctrìnhbày trongMục1.5.ĐâylàkiếnthứccơsởchomôhinhkếthợpxíchMarkovvà chuỗi thời gian mờ trong dự báo được luận án phát triển trongChương3.
Chương 2 MÔ HÌNH MARKOV ẨN TRONG DỰ BÁO CHUỖI
Mởđầu
MôhìnhMarkovẩn(HMMs)làmộtcôngcụđượcsửdụngrộngrãiđểphântíchvàdựbáo chuỗithờigian.CácyếutốtoánhọcđằngsaumôhìnhHMMbắtđầuđược phát triển bởi L E Baum và các công sự[5-9] Mô hình HMMs đã được sửdụngthànhcôngchonhiềuloạichuỗithờigianbaogồmphântíchchuỗiDNA[18],nhậndạ nggiọngnói[67],phântíchECG[22].Tronglĩnhvựctàichính,HassanandNath,2005[36]đãsử dụngmôhìnhHMMđểsinhradựbáotừngngàycủagiácổphiếutheocáchđặcbiệt.Tacóthểđềcập đếnnghiêncứugầnđâyhơncủaRafiulHassan[35]với sự kết hợp mô hình HMM và chuỗi thời gianmờ cho dự báo cổphiếu Ngoài các mô hình dự báo giá cổ phiếu, mô hình
HMM còn được sử dụngtrongcácvấnđềkháccủatàichínhnhưmôhìnhlợisuất(returns)củacổphiếu,môhìnhsựbiếnđộng củatỉlệtăngtrưởngcủaGDPthựctế,mốiquanhệgiữasảnsuấtcôngnghiệpvàthịtrườngchứngkhoán, nhưđượctrìnhbàytrong[10]. Ở Việt Nam, các nghiên cứu sâu về thị trường tài chính nói chung cũng nhưviệcứngdụngmôhìnhHMMtrongdựbáonóiriêngcònrấthạnchế.Cácphântíchchủ yếu vào các mô hình hồi quy tuyến tính hay các mô hình dựa trên phân phốichuẩnnhưNeural- Fuzzy,ARMA, màcóthểkểđếnnhưtrong[23].Điềuhạnchếlà,sựphụthuộctuyếntínhh aytínhchuẩncủaphânphốiđốivớicácsốliệutrongtàichínhđãđượcnhiềucôngtrìnhnghiê ncứutrênthếgiớichỉralàbấthợplý[66]. Đểminhhọarằng,chuỗithờigianchỉsốchứngkhoánthườngkhôngthểướmkhítvớimộ tphânphốixácsuấtnhấtđịnhluậnántiếnhànhthửnghiệmtrêndữliệu chỉ số VN-Index được thu thập từ 03/01/2006 đến 19/06/2013 và thống kê nhữngthờiđiểmchínhmàcổphiếulênđỉnhvàxuốngđáy.Sauđó,tậpdữliệutrựctiếpsửdụngtron gnghiêncứunàylàsốphiêngiaodịchmỗilầncổphiếutừđáylênđỉnhvàđượcgóitrongtậpti me.b.to.t(bottomtotop).Đâylàdữliệumàrấtcóýnghĩathựctế đối với những nhà đầu tư chứng khoán.
Minh họa này sẽ chỉ ra rằng rất khó đểướmmộtdữliệukiểunhưvậyvớimộtphânphốixácsuấtổnđịnh.Chodùướmnóvới phân phối trộn của nhiều phân phối, vấn đề tương quan giữa các thành phầntrộntheothờigianvẫntồntại.Dođó,phânbốxácsuấtcủađốitượngdựđoánthayđổi theo thời gian.
Từ đó đặt ra yêu cầu áp dụng mô hình dự báo chuỗi thời gianphùhợpmàmôtảđượcđặcđiểmphụthuộcnày.
Cụ thể cho lập luận trên, hình2.1.1 mô tả dao động của chỉ số VN- Indextrongthờigiannóitrên.Tacóthểthấyrấtrõnhữngthờiđiểmmàcổphiếuđạtđỉnhhaychạmđáy Hình2.1.2biểudiễndữliệucủatime.b.to.t.
Vì dữ liệu là các số tự nhiên nên trong xác suất, phân phối Poisson là lựachọnphùhợpđểkiểmtraxemdữliệucóthểướmkhítvớiphânphốinàykhôngvàởbộthamsốnà o.Hình2.1.3chotakếtquảướmphânphốiPoissonvàophânphối thốngkêcủadữliệu.Thựctếchothấy,vớiphươngmẫu s 2 307,083 lớnhơnnhiều sovớitrungbìnhmẫu x20,45238đủthấyrằngmôhìnhmộtphânphốiPoisson, phânphốimàphươngsaivàtrungbìnhmẫubằngnhau,làkhôngphùhợp.Cũngtừhình2.1.3tathấyrằn gkhócóthểtìmmộtphânphốixácsuấtcổđiểnnàoướmkhítphânphốithốngkêcủanókhôngchỉp hânphốiPoisson.Dođó,tanghĩđếnviệcướmdữliệubởinhiềuphânphối(nhiềutrạngthái),nghĩa làcácquansátsinhracóthểtừvàiphânphốikhácnhau,độclậpvớinhau.Môhìnhnhưvậyđượcgọilà môhìnhtrộnđộclập[43,73].Môhìnhtrộnđộclậpđượcgiảthiếtrằng,mộtquansátX đượcs i n h r a t ừ 1 t r o n g m phânp h ố i ( t r ạ n g t h á i ) đ ộ c l ậ p v ớ i n h a u p 1 (x),p 2 (x), ,p m (x)với các xác suất tươngứnglà 1 , 2 , , m Dễ dàng chỉ ra rằnghàmmậtđộhoặcxácsuấtcủaX đượcchobởi m p(x) i p i (x). i1
Hình2.1.3.Phânphốimẫu(histogram)củatime.b.to.tđượcướmbởiphânphốiPoisson
Nhưvậy,đốivớimôhìnhphânphốitrộnPoisson,tacầnướclượng2mtham sốgồm
1 , 2 , , m cáctrungbìnhcủacácphânphốithànhphầnvà 1 , 2 , , m các xácsuấttrộnvớiràngbuộc i 0và i 1 với i 1,2, ,m i
Mô hình trộn[43]ngày nay được sử dụng rất rộng rãi và hiệu quả đối vớinhiềuphânphốithốngkêcủacácbiếnngẫunhiêntrongthựctế.Trong[47],tácgiảđã sử dụng mô hình trộn để nghiên cứu các trạng thái hoạt động của một số độngvậthoangdãnhưnghỉngơi,sănmồi,dichuyểndựatrênsựdichuyểncủacáccáthểđược gắn thiết bị GPS Mô hình trộn cũng được sử dụng để phân loại chẳng hạnnhưphânloạibệnhthiếumáu[44],trongphânloạivănbản[32].Trongkinhtế,môhình trộn với phân phối chuẩn đã được sử dụng để mô hình sự biến động ngẫunhiên trong hiệu ứng "nụ cười" (smile effects)[1].
Một nghiên cứu tương tự vớimụcđíchmôhìnhsựbiếnđộng(volatility)củagiácổphiếutừđócảitiếncôngthứcBlack-ScholestrongđịnhgiáquyềnchọnđượcđềxuấtbởiDamianoBrigovàFabioMercurio[12]bằngc áchsửdụngphânphốilog-normal.
Bằngphươngphápcựcđạilikelihoodcủadữliệutime.b.to.tápdụngchomô hìnhvớim2,3,4,5trạngtháiứngvới m phânphốiPoissonđộclập,kếtquảước lượngthamsốcủamôhìnhtrộnđượcchoởBảng2.1.1
Bảng2.1.1.Ướclượng thamsốcủacácmôhìnhtrộnđộclậpchotime.b.to.t model i i i −logL Variance m=2 1 0,7048 11,621 217,9645 206,6592
Rõràngtathấyrằng,càngnhiềutrạngtháithìlogL(log-likelihood)càng nhỏ, tức likelihood càng lớn Điều này dẫn đến việc có thể nghĩ ràng càng nhiềutrạng thái càng tốt Tuy nhiên, việc đó sẽ dẫn đến việc gặp phải vấn đề về over- fitting,tứcmấttínhkháiquátcủamôhình.Dođó,việcchọnmôhìnhnàotrongcácmôhìnhởtrênsẽ đượcthựchiệnquacáctiêuc h u ẩ n chọnmôhìnhmàtasẽđềcậpởmôhìnhMarkovẩnHMM. Hình2.1.4minhhọahistogramcủadữliệutime.b.to.tđượcướmbởiphânphốitrộntươngứ ngvớicác môhìnhtrongBảng2.1.1.Tacó thểthấymôhìnhvới m 4h o ặ c m 5tốthơn.
Tuynhiên,môhìnhtrộnđộclậpthườngđượcsửdụngchocácphânphốicótínhổnđịnh,nókh ôngthểhiệnsựphụthuộctheothờigiangiữacácquansát.Hàmtự tương quan (ACF) của mẫu time.b.to.t được mô tả trong Hình 2.1.5 chỉ ra rằngcácquansáttrongchuỗicósựphụthuộc.
Hình2.1.5.Hệsốtựtươngquancủamẫudữliệuvới15Lag Đếnđây,tacầnđitìmmộtphươngphápchophépsựphụthuộctrongchuỗithờigiannhằmn ớilỏngsựđộclậpcủacácphânphốitrongthànhphầntrộn.Nếuta giả sử các tham số của các trạng thái trong mô hình trộn tuân theo một xíchMarkov Kết quả là ta có một mô hình được gọi là Hidden Markov (HMM). Vậy,môhìnhHMMlàmôhìnhtiềmnăngchoviệcphântíchchuỗithờigianđảmbảosựphụthu ộctheothờigiancủacáctrạngthái.Từđócóthểchonhữngkếtquảdựbáochínhxáchơncácmôhình dựbáochuỗithờigiancổđiển.
MụctiếptheoluậnántrìnhbàyápdụngmôhìnhHMMtrongdựbáochuỗithời gian bất kỳ.Kết quả thực nghiệm trên một vài dữ liệu tài chính cho thấy độchínhxácdựbáođượccảithiệnsovớicácmôhìnhcổđiểnnhưARIMAhayANN.
MôhìnhMarkovẩntrongdựbáochuỗithờigian
TheoChương1,môhìnhMarkovẩn(HiddenMarkovModel)cóthểcoilàmột mô hình đặc biệt của mô hình trộn phụ thuộc Các thành phần trộn trong môhìnhtrộnbâygiờphụthuộctheomộtxíchMarkov.Dođó,mộtmôhìnhHMMbao gồm hai thành phần cơ bản: chuỗi
Bâygiờ,đểdễminhhọachomôhìnhHMMtrongdựbáochuỗithờigian, xétchuỗithờigiantime.b.to.tởtrênvàkýhiệulà
X t ,t1, ,T Bàitoánthựctếđối vớinhàđầutưlàdựđoángiátrịcủa X t trongtươnglaiđểbiếtsaubaolâuchỉsố chứngkhoánsẽtừđáylênđỉnh.Từquansátthựctếthấyrằngchỉsốchứngkhoánkhiđạtmộtđỉnh mớisẽkhôngthểởgiátrịđó(hoặcdaođộngnhẹxungquanhgiátrịđó)mãimãimàsẽđixuốngsaumộ tthờigiannàođó,tươngtựđốivớidaođộng từđáylênđỉnh.Vậycóthểquyđịnh X max làthờigianlâunhấtmàgiátrịcổphiếu từ đáy lên đỉnh Khi đó,cáctrạngtháixảyravới
"chờrấtlâu"nhưngkhôngbiếtphảiđịnhnghĩanhưthếnào.Đểgiảiquyếtbàitoánnày,tacoimỗit rạngtháitrênlàmộtphânphốiPoissonvớitrungbình(cũnglà phươngsai) i ,i 1,2,3,4vàđược"ẩn"trongchuỗi X t Nếugiảthiếtthêmcáctrạng tháinàytuântheomộtxíchMarkov,tacómôhìnhMarkovẩnchobàitoándựbáochuỗithờigian.
Hình2.2.1.Địnhnghĩachuỗithờigiancầndựbáo ĐểápdụngmôhìnhHMMchodựbáochuỗithờigian,luậnánminhhọacảhaip hươngphápướclượngthamsốđãtrìnhbàytrongmục 1.4.2củaChương1.
2.2.1 Môhình HMMvớiphânphốiPoisson ĐốivớiướclượngMLE,luậnánthựchiệnchomôhìnhHMMvớitrạng tháilàcácphânphốiPoisson.PhânphốiPoissoncóthamsố0vừalàtrungbình đồngthờilàphươngsai.TrongmôhìnhHMM gồm m t r ạ n g tháiứngvới m phân phốiPoisson, vậycó m t h a msố
Bảnchấtcủaphươngphápướclượngcựcđạihàmhợplýlàtìmcựcđạicủamộthàmnhiềubi ếnphituyếnbằngphươngphápxấpxỉtronggiảitích.Dođó,cácthamsốcầnphảiloạibỏcácràngbuộ cđểtrởthànhcácthamsốtựdo(gọilàpw). ĐốivớicácphânphốiPoisson,do i 0 nênthamsốcủamôhình(gọilàpn)được chuyểnsangthamsốtựnhiênbởi i exp i
Việcđổithamsố i j sangthamsốtựnhiênphứctạp hơn,đãđượctrìnhbàytrong (1.4.6).Sauđó,hàmhợplý L T củamôhìnhđượctínhtheothuậttoántrong(1.4.5).
Dãy tăng trưởng của tập huấn luyện
Tính hàm hợp lý theo tham số tự nhiên Ước lượng tahm số trong gồm: sử dụng MLE
Tham số ma trận chuyển của xích Markov Tham số phân phối của trạng thái
Dãy tăng trưởng của tập huấn luyện Đổi tham số ước lượng sang tham số làm việc Đổi tham số của HMM sang tham số tự nhiện
Cụthể,luậnánthựchiệnphươngphápướclượngMLEchoHMMvớiphân phốiPoisson.CácbướctínhlàmhợplýL T vàướclượngthamsốcủaL T đượctính bởiT h u ậ t toán2.1vàThuậttoán2.2.Trongquátrìnhướclượngthamsốmôhình,thuậttoánchop héptínhluôntiêuchuẩnBICvàAICcholựachọnmôhìnhvề sau.TrongThuậttoán2.1,cácgiátrịđầuvàop a r v e c t,x,ml ầ nlượtlàvectortham số,vectorquansátthốngkêvàsốtrạngtháicủamôhìnhHMM,trongkhigiátrịđầuramllkl à
Trongthuậttoánướclượngcựcđạihàmhợplý,cácthamsốx,mvẫnđược ký hiệu như trong thuật toán tính hợp hợp lý, cònlambda0,gamma0lần lượt làtham số của phân phối Poisson và ma trận xác suất chuyển ban đầu Các tham sốđầuracólambdav à g amm a l àcácthamsốướclượngtốiưucủaphânphốiPoissonvà ma trận xác suất chuyển Ngoài ra thuật toán tính thêm hai tiêu chuẩn BIC vàAICchoviệclựachọntốiưusốtrạngtháim
Thuậntoán2.1Tínhhàmhợplý Đầuvào: parvect,x,m Đầura: mllk
2: if m=1then phốiPoisson} mllk log Poisson (x,expparvect) {Lấygiátrịcủaphân
4: pn←HMM.pw2pn(m,parvect) {Đổithamsốtự dosangthamsốmôhình}
//tínhmllk theo theo thuật toán mổ tả trong (1.4.5)5: lscale←0
8: foo←foo*gamma*Poisson(x,expparvect)
Thuậntoán2.2Maximumhàmhợplý Đầuvào: x ,m,lambda0,gamma0 Đầura: m ,lambda0,gamma0,BIC,AIC, mllk
2: parvect0←HMM.pn2pw(m,lambda0,gamma0) {Đổi tham số mô hìnhsangthamsốtựdo}
3: mod←nlm(HMM.mllk,parvect0,x=x,m=m)
4: pn←HMM.pw2pn(m,mod$estimate){ Đ ổ i thamsốtựdosangthamsốmô hìnhpn}
5: mllk←mod$minimum {Lấygiátrịcựcđạigán chomllk}
6: np←length(parvect0) {đếm số tham số mô hình}7: AIC