Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	53
Dung lượng	642,5 KB

Nội dung

Bộ giáo dục và đào tạo Trờng đại học vinh -------------------- Nguyễn bá phong ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trờng chứng khoán việt nam chuyên ngành lý thuyết xác suất và thống kê toán học m số : ã 60 46 15 luận văn thạc sỹ toán học Ngời hớng dẫn khoa học TS. Nguyễn Trung Hòa Vinh - 2005 Lời cảm ơn Đề tài nghiên cứu đợc hoàn thành nhờ sự hớng dẫn, định hớng, động viên và giúp đỡ tận tình của thầy giáo TS. Nguyễn Trung Hòa. Em xin phép đợc gửi lời cảm ơn chân thành và sâu sắc đến Thầy. Em cũng muốn cảm ơn các thầy cô giáo trong Chuyên ngành Xác suất thống kê, Khoa Sau Đại học đã chỉ bảo, góp ý. Cảm ơn các bạn học viên trong lớp đã giúp đỡ, khích lệ. Cuối cùng, em xin gửi lời cảm ơn tới những ngời thân trong gia đình đã động viên, khuyến khích và là động cơ thúc đẩy để em có thể hoàn thành để tài nghiên cứu. Kính chúc các thầy cô giáo và các bạn dồi dào sức khoẻ, hạnh phúc và thành đạt. Vì đề tài nghiên cứu về một lĩnh vực mới, nên cần phát triển nhiều hơn nữa. Rất mong tiếp tục nhận đợc sự giúp đỡ, góp ý của các thầy cô giáo và các bạn. Xin chân thành cảm ơn !. Vinh, Tháng 1 năm 2005 Nguyễn Bá Phong Mục lục Mở đầu 1 Chơng I. Chuỗi thời gian và dự báo chuỗi thời gian 5 1.1. Chuỗi thời gian 5 1.2. Quá trình dừng 7 1.3. Các thủ tục tìm tơng quan và tự tơng quan riêng mẫu 8 1.4. Dãy ồn trắng 10 1.5. Toán tử lùi-Toán tử sai phân 10 1.6. Mô hình hóa và dự báo chuỗi thời gian 11 1.7. Quá trình ARIMA 13 1.8. Kết luận chơng I 15 Chơng II. Mạng neural nhân tạo 16 2.1. Mạng neural sinh học 16 2.2. Lịch sử phát triển của mạng neural nhân tạo 17 2.3. Các ứng dụng của mạng neural nhân tạo 19 2.4. Mô hình neuron 21 2.5. Kiến trúc mạng neural nhân tạo 24 2.6. Huấn luyện mạng neural nhân tạo 28 2.7. Thuật toán lan truyền ngợc (BackPropagation) 29 2.8. Ưu điểm của mạng neural nhân tạo so với mô hình ARIMA 34 2.9. Kết luận chơng II 35 Chơng III. Lợc đồ dự báo chuỗi thời gian bằng mạng neural nhân tạo 36 3.1. Một số vấn đề cần xem xét khi sử dụng mạng neural nhân tạo 36 3.2. Lợc đồ dự báo chuỗi thời gian với mạng neural 37 3.3. Kết luận chơng III 42 Chơng IV. ứng dụng dự báo giá cổ phiếu trong thị trờng chứng khoán Việt Nam 43 4.1. Khái quát về thị trờng chứng khoán 43 4.2. Cổ phiếu và giá cổ phiếu 46 4.3. Giới thiệu phần mềm dự báo giá cổ phiếu 50 Kết luận 54 Tài liệu tham khảo 55 Chơng I. chuỗi thời gian và dự báo chuỗi thời gian Chuỗi thời gian là một tập hợp các số thực (các quan sát về cùng một hiện t- ợng) đợc sắp xếp theo thứ tự thời gian. Nếu thời gian là một đoạn T=[a;b] của tập hợp các số thực R thì chuỗi thời gian đợc gọi là liên tục, chẳng hạn nh các tín hiệu tơng tự (analog signal), nếu thời gian là một tập hợp rời rạc T Z thì chuỗi thời gian đợc gọi là rời rạc, chẳng hạn nh một tín hiệu tơng tự đã đợc lấy mẫu hoặc một dãy các số liệu kinh tế nh giá của một loại cổ phiếu theo từng ngày trong thị trờng chứng khoán. Khái niệm chuỗi thời gian có quan hệ trực tiếp đến khái niệm quá trình ngẫu nhiên. Theo Velxen (trong [1]), quá trình ngẫu nhiên X(t) là các biến ngẫu nhiên phụ thuộc tham số t thuộc T (trong đó T là tập con của tập số thực R, hoặc Z, đợc giải thích nh là thời gian). Đó là hiện tợng mang tính thống kê phát triển theo thời gian, tuân theo những quy luật của lý thuyết xác suất và chính là thể hiện của một dãy đại lợng ngẫu nhiên thực nào đó. Đề tài nhằm mục đích nghiên cứu về chuỗi thời gian giá cổ phiếu nên chỉ đề cập đến các chuỗi thời gian rời rạc, cho nên chúng tôi sử dụng định nghĩa sau: 1.1. Chuỗi thời gian Giả sử T là tập hợp các số nguyên thuộc khoảng (a;b) R, {X t , t T} là một dãy các đại lợng ngẫu nhiên đợc sắp xếp theo thứ tự trên T. Chuỗi thời gian là một dãy {x t | t T}(hữu hạn hoặc vô hạn) các giá trị của X t . Để phân biệt ta sẽ sử dụng thuật ngữ quá trình X t để chỉ một dãy các đại lợng ngẫu nhiên và một thể hiện của nó là chuỗi thời gian x t . Tuy nhiên ta sẽ chỉ sử dụng cùng một ký hiệu x t cho cả X t (gọi là quá trình x t )và x t (gọi là chuỗi thời gian x t ). Nh vậy, có thể hiểu rằng, một chuỗi thời gian là một dãy rời rạc các thể hiện của một quá trình, đợc chỉ sổ hóa bởi các số nguyên liên tiếp trong những khoảng thời gian cách đều nhau. Hay nói cách khác, chuỗi thời gian là một dãy các số cụ thể. Nếu tập hợp các thời điểm quan sát là t o , t o +h, . t o +N.h thì chuỗi thời gian đ- ợc ký hiệu là: x 0 , x 1 , . , x N và N+1 đợc gọi là độ dài của chuỗi. Nếu T=Z thì chuỗi thời gian là dãy vô hạn về cả hai phía. Còn nếu T=N thì chuỗi thời gian chính là dãy x 0 , x 1 , . , x N , . Vì đại lợng ngẫu nhiên là ánh xạ đo đợc từ không gian xác suất (, A, P) vào không gian đo đợc (R,B) nên quá trình {X t } là hàm của cặp (t, ) đo đợc theo với mỗi t T. Giả sử đại lợng ngẫu nhiên X có hàm mật độ phân phối f(x), khi đó kỳ vọng của X đợc định nghĩa bởi E(X) := dxxxf )( nếu tích phân ở vế phải hội tụ. Phơng sai của X là X 2 := E(X-EX) 2 và hiệp phơng sai của X và Y là cov(X,Y) := E(X-EX)(Y-EY) nếu chúng tồn tại. Nếu cov(X,Y)=0 thì xác đại lợng ngẫu nhiên X, Y đợc gọi là không tơng quan. Bởi vì các đại lợng ngẫu nhiên khép kín đối với phép cộng và khép kín đối với phép nhân với một vô hớng nên chúng tạo thành một không gian vectơ trong đó tập hợp các đại lợng ngẫu nhiên bình phơng khả tích lập thành một không gian con. Ta sẽ ký hiệu không gian vectơ các đại lợng ngẫu nhiên bình phơng khả tích là L 2 (, A, P). Với chuỗi thời gian {x t | t=0,1, .} ta sẽ gọi -đại số cảm sinh bởi chuỗi thời gian x t là -đại số bé nhất chứa tất cả các biến cố dạng {x t A}, t Z, A B (A là tập Borel) và ký hiệu là A x . Nó là tập hợp tất cả các biến cố mà nhờ các thông tin về chuỗi thời gian x t ta có thể nhận biết đợc sự xuất hiện của chúng. Tơng ứng với nó ta có không gian xác suất (, A x , P) và ký hiệu M là bao đóng tuyến tính của tập hợp các x t (M=span{x t }), nó chính là không gian con của không gian các đại lợng ngẫu nhiên bình phơng khả tích L 2 (, A x , P) sinh bởi các {x t }. Các không gian vừa nêu trên là các không gian Ơclit[1] đủ với tích vô hớng đợc định nghĩa bởi <x,y> := E(xy) 1.2. Quá trình dừng Quá trình X t đợc gọi là dừng (theo nghĩa hẹp) nếu phân phối của các đại lợng X t1 , X t2 , ., X tn trùng với phân phối của X t1+s , X t2+s , ., X tn+s đối với tập hữu hạn bất kỳ các số nguyên t 1 , t 2 , ., t n và số nguyên s bất kỳ. Định nghĩa này tơng đơng với việc đòi hỏi rằng các yếu tố xác suất của chuỗi {X t } và của chuỗi {X t+s } là nh nhau với mọi s. Nếu các biến ngẫu nhiên X t tồn tại mômen cấp 1 thì từ định nghĩa tính dừng ta suy ra E(X t )=E(X t+s ), s,t Z và có thể viết đơn giản là m:=E(X t ). Trong trờng hợp m=0 thì X t đợc gọi là quá trình quy tâm. Nếu các biến ngẫu nhiên X t tồn tại mômen cấp 2 thì từ định nghĩa tính dừng ta có phân phối của (X 1 ,X 2 ) bằng phân phối của (X t1+t ,X t2+t ) nên cov(X 1 ,X 2 ) = cov(X t1+t ,X t2+t ). Hơn nữa, nếu t=-t 2 thì cov(X 1 ,X 2 ) = cov(X t1-t2 ,X 0 ) vì vậy hiệp phơng sai của X t1 , X t2 chỉ phụ thuộc vào hiệu của hai thời điểm. Do đó có thể viết gọn hơn nh sau t := cov(X t ,X 0 ) = cov(X t1-t2 ,X 0 ), đặc biệt phơng sai của quá trình dừng là x 2 = 0 Với quá trình dừng có hiệp phơng sai giữa X t và X t+i là i ta sẽ gọi ma trận có dạng: := 021 201 110 nn n n là ma trận tự hiệp phơng sai cấp n của quá trình X t , còn R:= 2 1 x sẽ đợc gọi là ma trận tự tơng quan cấp n của quá trình và k := 2 0 x kk = đợc gọi là tự tơng quan cấp k của quá trình, nó chính là tơng quan giữa X t và X t+k . Với chuỗi thời gian dừng gồm N quan sát {x t | t=0,1, .,N} có kỳ vọng m, tự t- ơng quan mẫu cấp k của chuỗi đợc ớc lợng bởi : r k = ( )( ) ( ) ( ) = = + N i i kN i kii mxkN mxmxN 1 2 1 Ước lợng trên là ớc lợng không chệch của tự tơng quan cấp k với phơng sai mẫu của k đợc ớc lợng bởi rk 2 = + = 1 1 2 21 1 k i i r N Các ớc lợng trên sẽ đợc sử dụng để nhận dạng mô hình chuỗi thời gian. Không những thế, việc xác định tơng quan mẫu và tự tơng quan riêng mẫu đóng vai trò quan trọng trong bớc xác định mẫu đầu vào cho mạng neural sẽ đợc trình bày ở chơng III. Chính vì thế, tham khảo từ [1], chúng tôi đã xây dựng chơng trình tính hệ số tơng quan mẫu và tự tơng quan riêng mẫu bằng ngôn ngữ Pascal và đa vào phần mềm dự báo giá cổ phiếu. 1.3. Các thủ tục tìm tơng quan mẫu và tự tơng quan riêng mẫu Các khai báo kiểu dữ liệu Type vtr=array[-40 500] of real; signal = record g:vtr; tb:real; t,d,p,q,b,n:integer; end; ar40=array[0 40] of real; Var r : ar40; saiso:real; Procedure Tim_tqm(x:signal; var r : ar40); Var xtb:real i,t:integer; Begin xtb:=0.0; for i:=(1+x.b) to x.n do xtb:=xtb+x.g[i]; xtb:=xtb/(x.n-x.b); saiso:=0.0; for i:=(1+x.b) to x.n do saiso:=saiso+sqr(x.g[i]-xtb); for t:=0 to 40 do Begin r[t]:=0.0 for i:=(x.b+t+1) to x.n do r[t]:=r[t]+(x.g[i]-xtb)*(x.g[i-t]-xtb); r[t]:=r[t]/saiso; End; End; (*=============*) Procedure Tim_Ttqrm(r:ar40; Var a:ar40); Var t1,t2:real; a1,a2:ar40; p,i:integer; Begin a[1]:=r[1]; a1[1]:=r[1]; for p:=1 to 39 do Begin t1:=0; t2:=0; for i:=1 to p do Begin t1=t1+r[i]*a1[p-i+1]; t2:=t2+r[i]*a1[i]; End; a2[p+1]:=(r[p+1]-t1)/(1-t2); for i:=1 to p do a2[i]:=a1[i]-a2[p+1]*a1[p-i+1]; for i:=1 to p+1 do a1[i]:=a2[i]; a[p+1]:=a2[p+1]; End; End; 1.4. Dãy ồn trắng Dãy các đại lợng ngẫu nhiên t không tơng quan, có phân phối chuẩn với kỳ vọng 0 và phơng sai 2 hữu hạn đợc gọi là dãy ồn trắng. Với giả thiết t là dãy ồn trắng, ta có: E( t )=0 k = E( t t-k ) = E( t t+k )= = 00 0 2 k k Đó đó, hàm tự tơng quan k của dãy ồn trắng có dạng đơn giản k = = 00 01 k k 1.5. Toán tử lùi, toán tử sai phân Toán tử B đợc gọi là toán tử lùi nếu Bx t = x t-1 . Toán tử đợc gọi là toán tử sai phân nếu x t = x t - x t-1 = (1-B)x t . Nh vậy ta có: B m x t = x t-m và =1-B. Toán tử lùi và toán tử sai phân đợc sử dụng rất nhiều trong mô hình ARIMA, và cũng đợc sử dụng nhiều trong mô hình mạng neural nhân tạo, đặc biệt là trong thuật toán Lan truyền ngợc (Back-propagation)[4] là thuật toán phổ biến và làm thay đổi bộ mặt của mạng neural trong ứng dụng ngày nay. Nếu mỗi giá trị của chuỗi thời gian đợc xác định một cách chính xác nhờ một hàm giải tích nào đó theo biến thời gian, chẳng hạn x t = cos(2f(t)) thì chuỗi thời gian đợc gọi là tất định, nếu mỗi giá trị của chuỗi thời gian chỉ đợc mô tả nhờ phân phối xác suất của nó thì chuỗi thời gian đợc gọi là ngẫu nhiên. Khi chuỗi thời gian là ngẫu nhiên ta cần phải tìm các thể hiện khác của chuỗi thời gian. Các thể hiện đó chính là các mô hình ngẫu nhiên. 1.6. Mô hình hóa và dự báo chuỗi thời gian Từ những chuỗi thời gian các quan sát, thông qua phân tích ta có thể nhận đ- ợc những thông tin tốt hơn về hệ thống cảm sinh ra nó, từ đó có thể dự báo những giá trị tại những thời điểm trong tơng lai. Một trong những phơng pháp phân tích chuỗi thời gian là mô hình hóa. Mô hình toán học tổng quát của chuỗi thời gian là: x t = f t +u t trong đó x t đợc xem nh tổng của 2 chuỗi: f t là thành phần đợc xác định một cách đầy đủ, và còn đợc gọi là thành phần hệ thống, thành phần tất định, còn u t hầu nh chỉ biết đợc quy luật xác suất của nó. Trong lý thuyết xử lý tín hiệu, f t đợc gọi là tín hiệu còn u t đợc gọi là tiếng ồn. Nói chung khi cho một chuỗi thời gian các quan sát x t thì f t và u t là không thể quan sát đợc, chúng chỉ là các đại lợng mang tính lý thuyết. Với quan niệm đó, f t thờng đợc giả thiết là kỳ vọng của x t còn u t th- ờng đợc giả thiết là có kỳ vọng 0 và có phơng sai hữu hạn. Nói chung, f t bao gồm hai thành phần f t = d t +s t trong đó d t đợc gọi là khuynh phát triển của chuỗi thời gian x t , còn s t đợc gọi là thành phần mang tính mùa, có chu kỳ h: s t = s t+h (với h là một số nguyên dơng cố định nào đó). Nếu khuynh hớng phát triển là một hằng số (d t =m) thì phơng pháp thờng dùng để dừng hóa chuỗi thời gian x t là phép lấy sai phân mùa x ~ t = x t+h - x t để chuyển việc quan sát chuỗi x t về việc quan sát chuỗi dừng x ~ t . Đặc biệt nếu { x ~ t } là chuỗi dừng thì f t =m là một hằng số. . với mạng neural 37 3.3. Kết luận chơng III 42 Chơng IV. ứng dụng dự báo giá cổ phiếu trong thị trờng chứng khoán Việt Nam 43 4.1. Khái quát về thị trờng chứng. -Dự báo: Sử dụng các giá trị đầu vào để dự báo một số giá trị đầu ra, chẳng hạn nh: dự báo thị trờng chứng khoán, dự báo thị trờng trao đổi ngaọi tệ, dự

Ngày đăng: 22/12/2013, 14:25

Nguồn tham khảo

Tài liệu tham khảo

Loại

Chi tiết

[1] Nguyễn Trung Hòa (1997), Một số thuật toán mô phỏng và phân tích chuỗi thời gian, Luận văn Tiến sĩ Toán Lý, ĐH Bách khoa Hà Nội

Sách, tạp chí

Tiêu đề:	Một số thuật toán mô phỏng và phân tích chuỗi thời gian
Tác giả:	Nguyễn Trung Hòa
Năm:	1997

[2] Nguyễn Hồ Quỳnh (2001), Chuỗi thời gian: phân tích và nhận dạng, Khoa Toán ứng dụng-ĐH Bách khoa Hà NộiTiÕng Anh

Sách, tạp chí

Tiêu đề:	Chuỗi thời gian: phân tích và nhận dạng
Tác giả:	Nguyễn Hồ Quỳnh
Năm:	2001

[3] Feng Lin, Xing Huo Yu, Shirley Gregor, Richard Irons (1995), Times Series Forecasting with Neural Network, Complexity International – Volume 02, Queensland University Australia

Sách, tạp chí

Tiêu đề:	Times Series Forecasting with Neural Network
Tác giả:	Feng Lin, Xing Huo Yu, Shirley Gregor, Richard Irons
Năm:	1995

[4] Martin T. Hagan, Howard B. Demuth, Mark Beale (1996), Neural Network Design, PWS Publishing Company

Sách, tạp chí

Tiêu đề:	Neural Network Design
Tác giả:	Martin T. Hagan, Howard B. Demuth, Mark Beale
Năm:	1996

[5] Minglei Duan, B.S. (2002), Time Series Predictability, A thesis submitted for The Degree of Master of Science, Marquette University

Sách, tạp chí

Tiêu đề:	Time Series Predictability
Tác giả:	Minglei Duan, B.S
Năm:	2002

[6] Peter J. Brokerwell and Richar A. Davis (1991), Time Series: Theory and methods, Spinger-Verlag

Sách, tạp chí

Tiêu đề:	Time Series: Theory and methods
Tác giả:	Peter J. Brokerwell and Richar A. Davis
Năm:	1991

[7] Richard Povinelli (1999), Time Series Data Mining: Indentifying Temporal Patterns for Characterization and Prediction of Time Series Events, A Thesis submitted for The Degree of Doctor of Philosophy, Marquette University

Sách, tạp chí

Tiêu đề:	Time Series Data Mining: Indentifying Temporal Patterns for Characterization and Prediction of Time Series Events
Tác giả:	Richard Povinelli
Năm:	1999

[8] Steven Gonzalez (2000), Neural Networks for Macroeconomic Forecasting: A Complementary Approach to Linear Regression Models, Working Paper in Departerment of Finance, Canada

Sách, tạp chí