Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

53 477 4
Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bộ giáo dục và đào tạo Trờng đại học vinh -------------------- Nguyễn bá phong ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trờng chứng khoán việt nam chuyên ngành lý thuyết xác suất và thống kê toán học m số : ã 60 46 15 luận văn thạc sỹ toán học Ngời hớng dẫn khoa học TS. Nguyễn Trung Hòa Vinh - 2005 Lời cảm ơn Đề tài nghiên cứu đợc hoàn thành nhờ sự hớng dẫn, định hớng, động viên và giúp đỡ tận tình của thầy giáo TS. Nguyễn Trung Hòa. Em xin phép đợc gửi lời cảm ơn chân thành và sâu sắc đến Thầy. Em cũng muốn cảm ơn các thầy giáo trong Chuyên ngành Xác suất thống kê, Khoa Sau Đại học đã chỉ bảo, góp ý. Cảm ơn các bạn học viên trong lớp đã giúp đỡ, khích lệ. Cuối cùng, em xin gửi lời cảm ơn tới những ngời thân trong gia đình đã động viên, khuyến khích và là động thúc đẩy để em thể hoàn thành để tài nghiên cứu. Kính chúc các thầy giáo và các bạn dồi dào sức khoẻ, hạnh phúc và thành đạt. Vì đề tài nghiên cứu về một lĩnh vực mới, nên cần phát triển nhiều hơn nữa. Rất mong tiếp tục nhận đợc sự giúp đỡ, góp ý của các thầy giáo và các bạn. Xin chân thành cảm ơn !. Vinh, Tháng 1 năm 2005 Nguyễn Bá Phong Mục lục Mở đầu 1 Chơng I. Chuỗi thời giandự báo chuỗi thời gian 5 1.1. Chuỗi thời gian 5 1.2. Quá trình dừng 7 1.3. Các thủ tục tìm tơng quan và tự tơng quan riêng mẫu 8 1.4. Dãy ồn trắng 10 1.5. Toán tử lùi-Toán tử sai phân 10 1.6. Mô hình hóa và dự báo chuỗi thời gian 11 1.7. Quá trình ARIMA 13 1.8. Kết luận chơng I 15 Chơng II. Mạng neural nhân tạo 16 2.1. Mạng neural sinh học 16 2.2. Lịch sử phát triển của mạng neural nhân tạo 17 2.3. Các ứng dụng của mạng neural nhân tạo 19 2.4. Mô hình neuron 21 2.5. Kiến trúc mạng neural nhân tạo 24 2.6. Huấn luyện mạng neural nhân tạo 28 2.7. Thuật toán lan truyền ngợc (BackPropagation) 29 2.8. Ưu điểm của mạng neural nhân tạo so với mô hình ARIMA 34 2.9. Kết luận chơng II 35 Chơng III. Lợc đồ dự báo chuỗi thời gian bằng mạng neural nhân tạo 36 3.1. Một số vấn đề cần xem xét khi sử dụng mạng neural nhân tạo 36 3.2. Lợc đồ dự báo chuỗi thời gian với mạng neural 37 3.3. Kết luận chơng III 42 Chơng IV. ứng dụng dự báo giá cổ phiếu trong thị trờng chứng khoán Việt Nam 43 4.1. Khái quát về thị trờng chứng khoán 43 4.2. Cổ phiếugiá cổ phiếu 46 4.3. Giới thiệu phần mềm dự báo giá cổ phiếu 50 Kết luận 54 Tài liệu tham khảo 55 Chơng I. chuỗi thời giandự báo chuỗi thời gian Chuỗi thời gian là một tập hợp các số thực (các quan sát về cùng một hiện t- ợng) đợc sắp xếp theo thứ tự thời gian. Nếu thời gian là một đoạn T=[a;b] của tập hợp các số thực R thì chuỗi thời gian đợc gọi là liên tục, chẳng hạn nh các tín hiệu tơng tự (analog signal), nếu thời gian là một tập hợp rời rạc T Z thì chuỗi thời gian đợc gọi là rời rạc, chẳng hạn nh một tín hiệu tơng tự đã đợc lấy mẫu hoặc một dãy các số liệu kinh tế nh giá của một loại cổ phiếu theo từng ngày trong thị trờng chứng khoán. Khái niệm chuỗi thời gian quan hệ trực tiếp đến khái niệm quá trình ngẫu nhiên. Theo Velxen (trong [1]), quá trình ngẫu nhiên X(t) là các biến ngẫu nhiên phụ thuộc tham số t thuộc T (trong đó T là tập con của tập số thực R, hoặc Z, đợc giải thích nh là thời gian). Đó là hiện tợng mang tính thống kê phát triển theo thời gian, tuân theo những quy luật của lý thuyết xác suất và chính là thể hiện của một dãy đại lợng ngẫu nhiên thực nào đó. Đề tài nhằm mục đích nghiên cứu về chuỗi thời gian giá cổ phiếu nên chỉ đề cập đến các chuỗi thời gian rời rạc, cho nên chúng tôi sử dụng định nghĩa sau: 1.1. Chuỗi thời gian Giả sử T là tập hợp các số nguyên thuộc khoảng (a;b) R, {X t , t T} là một dãy các đại lợng ngẫu nhiên đợc sắp xếp theo thứ tự trên T. Chuỗi thời gian là một dãy {x t | t T}(hữu hạn hoặc vô hạn) các giá trị của X t . Để phân biệt ta sẽ sử dụng thuật ngữ quá trình X t để chỉ một dãy các đại lợng ngẫu nhiên và một thể hiện của nó là chuỗi thời gian x t . Tuy nhiên ta sẽ chỉ sử dụng cùng một ký hiệu x t cho cả X t (gọi là quá trình x t )và x t (gọi là chuỗi thời gian x t ). Nh vậy, thể hiểu rằng, một chuỗi thời gian là một dãy rời rạc các thể hiện của một quá trình, đợc chỉ sổ hóa bởi các số nguyên liên tiếp trong những khoảng thời gian cách đều nhau. Hay nói cách khác, chuỗi thời gian là một dãy các số cụ thể. Nếu tập hợp các thời điểm quan sát là t o , t o +h, . t o +N.h thì chuỗi thời gian đ- ợc ký hiệu là: x 0 , x 1 , . , x N và N+1 đợc gọi là độ dài của chuỗi. Nếu T=Z thì chuỗi thời gian là dãy vô hạn về cả hai phía. Còn nếu T=N thì chuỗi thời gian chính là dãy x 0 , x 1 , . , x N , . Vì đại lợng ngẫu nhiên là ánh xạ đo đợc từ không gian xác suất (, A, P) vào không gian đo đợc (R,B) nên quá trình {X t } là hàm của cặp (t, ) đo đợc theo với mỗi t T. Giả sử đại lợng ngẫu nhiên X hàm mật độ phân phối f(x), khi đó kỳ vọng của X đợc định nghĩa bởi E(X) := dxxxf )( nếu tích phân ở vế phải hội tụ. Phơng sai của X là X 2 := E(X-EX) 2 và hiệp phơng sai của X và Y là cov(X,Y) := E(X-EX)(Y-EY) nếu chúng tồn tại. Nếu cov(X,Y)=0 thì xác đại lợng ngẫu nhiên X, Y đợc gọi là không tơng quan. Bởi vì các đại lợng ngẫu nhiên khép kín đối với phép cộng và khép kín đối với phép nhân với một vô hớng nên chúng tạo thành một không gian vectơ trong đó tập hợp các đại lợng ngẫu nhiên bình phơng khả tích lập thành một không gian con. Ta sẽ ký hiệu không gian vectơ các đại lợng ngẫu nhiên bình phơng khả tích là L 2 (, A, P). Với chuỗi thời gian {x t | t=0,1, .} ta sẽ gọi -đại số cảm sinh bởi chuỗi thời gian x t là -đại số bé nhất chứa tất cả các biến cố dạng {x t A}, t Z, A B (A là tập Borel) và ký hiệu là A x . Nó là tập hợp tất cả các biến cố mà nhờ các thông tin về chuỗi thời gian x t ta thể nhận biết đợc sự xuất hiện của chúng. Tơng ứng với nó ta không gian xác suất (, A x , P) và ký hiệu M là bao đóng tuyến tính của tập hợp các x t (M=span{x t }), nó chính là không gian con của không gian các đại lợng ngẫu nhiên bình phơng khả tích L 2 (, A x , P) sinh bởi các {x t }. Các không gian vừa nêu trên là các không gian Ơclit[1] đủ với tích vô hớng đợc định nghĩa bởi <x,y> := E(xy) 1.2. Quá trình dừng Quá trình X t đợc gọi là dừng (theo nghĩa hẹp) nếu phân phối của các đại lợng X t1 , X t2 , ., X tn trùng với phân phối của X t1+s , X t2+s , ., X tn+s đối với tập hữu hạn bất kỳ các số nguyên t 1 , t 2 , ., t n và số nguyên s bất kỳ. Định nghĩa này tơng đơng với việc đòi hỏi rằng các yếu tố xác suất của chuỗi {X t } và của chuỗi {X t+s } là nh nhau với mọi s. Nếu các biến ngẫu nhiên X t tồn tại mômen cấp 1 thì từ định nghĩa tính dừng ta suy ra E(X t )=E(X t+s ), s,t Z và thể viết đơn giản là m:=E(X t ). Trong trờng hợp m=0 thì X t đợc gọi là quá trình quy tâm. Nếu các biến ngẫu nhiên X t tồn tại mômen cấp 2 thì từ định nghĩa tính dừng ta phân phối của (X 1 ,X 2 ) bằng phân phối của (X t1+t ,X t2+t ) nên cov(X 1 ,X 2 ) = cov(X t1+t ,X t2+t ). Hơn nữa, nếu t=-t 2 thì cov(X 1 ,X 2 ) = cov(X t1-t2 ,X 0 ) vì vậy hiệp phơng sai của X t1 , X t2 chỉ phụ thuộc vào hiệu của hai thời điểm. Do đó thể viết gọn hơn nh sau t := cov(X t ,X 0 ) = cov(X t1-t2 ,X 0 ), đặc biệt phơng sai của quá trình dừng x 2 = 0 Với quá trình dừng hiệp phơng sai giữa X t và X t+i là i ta sẽ gọi ma trận dạng: := 021 201 110 nn n n là ma trận tự hiệp phơng sai cấp n của quá trình X t , còn R:= 2 1 x sẽ đợc gọi là ma trận tự tơng quan cấp n của quá trình và k := 2 0 x kk = đợc gọi là tự tơng quan cấp k của quá trình, nó chính là tơng quan giữa X t và X t+k . Với chuỗi thời gian dừng gồm N quan sát {x t | t=0,1, .,N} kỳ vọng m, tự t- ơng quan mẫu cấp k của chuỗi đợc ớc lợng bởi : r k = ( )( ) ( ) ( ) = = + N i i kN i kii mxkN mxmxN 1 2 1 Ước lợng trên là ớc lợng không chệch của tự tơng quan cấp k với phơng sai mẫu của k đợc ớc lợng bởi rk 2 = + = 1 1 2 21 1 k i i r N Các ớc lợng trên sẽ đợc sử dụng để nhận dạng mô hình chuỗi thời gian. Không những thế, việc xác định tơng quan mẫu và tự tơng quan riêng mẫu đóng vai trò quan trọng trong bớc xác định mẫu đầu vào cho mạng neural sẽ đợc trình bày ở chơng III. Chính vì thế, tham khảo từ [1], chúng tôi đã xây dựng chơng trình tính hệ số tơng quan mẫu và tự tơng quan riêng mẫu bằng ngôn ngữ Pascal và đa vào phần mềm dự báo giá cổ phiếu. 1.3. Các thủ tục tìm tơng quan mẫu và tự tơng quan riêng mẫu Các khai báo kiểu dữ liệu Type vtr=array[-40 500] of real; signal = record g:vtr; tb:real; t,d,p,q,b,n:integer; end; ar40=array[0 40] of real; Var r : ar40; saiso:real; Procedure Tim_tqm(x:signal; var r : ar40); Var xtb:real i,t:integer; Begin xtb:=0.0; for i:=(1+x.b) to x.n do xtb:=xtb+x.g[i]; xtb:=xtb/(x.n-x.b); saiso:=0.0; for i:=(1+x.b) to x.n do saiso:=saiso+sqr(x.g[i]-xtb); for t:=0 to 40 do Begin r[t]:=0.0 for i:=(x.b+t+1) to x.n do r[t]:=r[t]+(x.g[i]-xtb)*(x.g[i-t]-xtb); r[t]:=r[t]/saiso; End; End; (*=============*) Procedure Tim_Ttqrm(r:ar40; Var a:ar40); Var t1,t2:real; a1,a2:ar40; p,i:integer; Begin a[1]:=r[1]; a1[1]:=r[1]; for p:=1 to 39 do Begin t1:=0; t2:=0; for i:=1 to p do Begin t1=t1+r[i]*a1[p-i+1]; t2:=t2+r[i]*a1[i]; End; a2[p+1]:=(r[p+1]-t1)/(1-t2); for i:=1 to p do a2[i]:=a1[i]-a2[p+1]*a1[p-i+1]; for i:=1 to p+1 do a1[i]:=a2[i]; a[p+1]:=a2[p+1]; End; End; 1.4. Dãy ồn trắng Dãy các đại lợng ngẫu nhiên t không tơng quan, phân phối chuẩn với kỳ vọng 0 và phơng sai 2 hữu hạn đợc gọi là dãy ồn trắng. Với giả thiết t là dãy ồn trắng, ta có: E( t )=0 k = E( t t-k ) = E( t t+k )= = 00 0 2 k k Đó đó, hàm tự tơng quan k của dãy ồn trắng dạng đơn giản k = = 00 01 k k 1.5. Toán tử lùi, toán tử sai phân Toán tử B đợc gọi là toán tử lùi nếu Bx t = x t-1 . Toán tử đợc gọi là toán tử sai phân nếu x t = x t - x t-1 = (1-B)x t . Nh vậy ta có: B m x t = x t-m và =1-B. Toán tử lùi và toán tử sai phân đợc sử dụng rất nhiều trong mô hình ARIMA, và cũng đợc sử dụng nhiều trong mô hình mạng neural nhân tạo, đặc biệt là trong thuật toán Lan truyền ngợc (Back-propagation)[4] là thuật toán phổ biến và làm thay đổi bộ mặt của mạng neural trong ứng dụng ngày nay. Nếu mỗi giá trị của chuỗi thời gian đợc xác định một cách chính xác nhờ một hàm giải tích nào đó theo biến thời gian, chẳng hạn x t = cos(2f(t)) thì chuỗi thời gian đợc gọi là tất định, nếu mỗi giá trị của chuỗi thời gian chỉ đợc mô tả nhờ phân phối xác suất của nó thì chuỗi thời gian đợc gọi là ngẫu nhiên. Khi chuỗi thời gian là ngẫu nhiên ta cần phải tìm các thể hiện khác của chuỗi thời gian. Các thể hiện đó chính là các mô hình ngẫu nhiên. 1.6. Mô hình hóa và dự báo chuỗi thời gian Từ những chuỗi thời gian các quan sát, thông qua phân tích ta thể nhận đ- ợc những thông tin tốt hơn về hệ thống cảm sinh ra nó, từ đó thể dự báo những giá trị tại những thời điểm trong tơng lai. Một trong những phơng pháp phân tích chuỗi thời gian là mô hình hóa. Mô hình toán học tổng quát của chuỗi thời gian là: x t = f t +u t trong đó x t đợc xem nh tổng của 2 chuỗi: f t là thành phần đợc xác định một cách đầy đủ, và còn đợc gọi là thành phần hệ thống, thành phần tất định, còn u t hầu nh chỉ biết đợc quy luật xác suất của nó. Trong lý thuyết xử lý tín hiệu, f t đợc gọi là tín hiệu còn u t đợc gọi là tiếng ồn. Nói chung khi cho một chuỗi thời gian các quan sát x t thì f t và u t là không thể quan sát đợc, chúng chỉ là các đại lợng mang tính lý thuyết. Với quan niệm đó, f t thờng đợc giả thiết là kỳ vọng của x t còn u t th- ờng đợc giả thiết là kỳ vọng 0 và phơng sai hữu hạn. Nói chung, f t bao gồm hai thành phần f t = d t +s t trong đó d t đợc gọi là khuynh phát triển của chuỗi thời gian x t , còn s t đợc gọi là thành phần mang tính mùa, chu kỳ h: s t = s t+h (với h là một số nguyên dơng cố định nào đó). Nếu khuynh hớng phát triển là một hằng số (d t =m) thì phơng pháp thờng dùng để dừng hóa chuỗi thời gian x t là phép lấy sai phân mùa x ~ t = x t+h - x t để chuyển việc quan sát chuỗi x t về việc quan sát chuỗi dừng x ~ t . Đặc biệt nếu { x ~ t } là chuỗi dừng thì f t =m là một hằng số. . với mạng neural 37 3.3. Kết luận chơng III 42 Chơng IV. ứng dụng dự báo giá cổ phiếu trong thị trờng chứng khoán Việt Nam 43 4.1. Khái quát về thị trờng chứng. -Dự báo: Sử dụng các giá trị đầu vào để dự báo một số giá trị đầu ra, chẳng hạn nh: dự báo thị trờng chứng khoán, dự báo thị trờng trao đổi ngaọi tệ, dự

Ngày đăng: 22/12/2013, 14:25

Hình ảnh liên quan

Hình 2.1. Bốn phần của một tế bào neuron điển hình - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 2.1..

Bốn phần của một tế bào neuron điển hình Xem tại trang 15 của tài liệu.
2.4.Mô hình neurron - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

2.4..

Mô hình neurron Xem tại trang 19 của tài liệu.
Hình 2.2. Neuron một đầu vào Đầu ra của mạng neuron đợc tính bởi công thức - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 2.2..

Neuron một đầu vào Đầu ra của mạng neuron đợc tính bởi công thức Xem tại trang 20 của tài liệu.
Hình 2.4.Neuron nhiều đầu vào Nếu neuron có bias là b, thì tổng trọng lợng của neuron là: - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 2.4..

Neuron nhiều đầu vào Nếu neuron có bias là b, thì tổng trọng lợng của neuron là: Xem tại trang 21 của tài liệu.
Nh hình trên chỉ mới có một neuron vớ iR đầu vào đã có khá nhiều chi tiết. Khi vẽ mạng neural với nhiều lớp, mỗi lớp có nhiều neuron thì hình vẽ sẽ trở nên  rất phức tạp, cho nên chúng tôi sử dụng hình vẽ rút gọn nh  hình dới đây cho  neuron nhiều đầu vào - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

h.

hình trên chỉ mới có một neuron vớ iR đầu vào đã có khá nhiều chi tiết. Khi vẽ mạng neural với nhiều lớp, mỗi lớp có nhiều neuron thì hình vẽ sẽ trở nên rất phức tạp, cho nên chúng tôi sử dụng hình vẽ rút gọn nh hình dới đây cho neuron nhiều đầu vào Xem tại trang 21 của tài liệu.
Hình 2.5.Neuron R đầu vào, hình vẽ dạng ma trận - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 2.5..

Neuron R đầu vào, hình vẽ dạng ma trận Xem tại trang 22 của tài liệu.
Mạng một tầng gồm có S neuron đợc chỉ ra trong hình dới. Cần chú ý rằng, mỗi neuron đều nhận đủ R đầu vào của mạng - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

ng.

một tầng gồm có S neuron đợc chỉ ra trong hình dới. Cần chú ý rằng, mỗi neuron đều nhận đủ R đầu vào của mạng Xem tại trang 22 của tài liệu.
Hình 2.7.Một tầng mạng gồm S neuron biểu diễn dạng ma trận rút gọn - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 2.7..

Một tầng mạng gồm S neuron biểu diễn dạng ma trận rút gọn Xem tại trang 23 của tài liệu.
Hình 2.8.Mạng neural 3 tầng - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 2.8..

Mạng neural 3 tầng Xem tại trang 24 của tài liệu.
Hình 2.9. Mạng neural 3 tầng, dạng ma trận rút gọn - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 2.9..

Mạng neural 3 tầng, dạng ma trận rút gọn Xem tại trang 25 của tài liệu.
không có quá trình phản hồi. Hình dới minh hoạ cho một mạng neural hồi quy với thời gian rời rạc[4]. - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

kh.

ông có quá trình phản hồi. Hình dới minh hoạ cho một mạng neural hồi quy với thời gian rời rạc[4] Xem tại trang 26 của tài liệu.
Để trình bày về thuật toán lan truyền ngợc, chúng tôi sử dụng mô hình mạng nhiều tầng rút gọn dạng ma trận để minh hoạ. - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

tr.

ình bày về thuật toán lan truyền ngợc, chúng tôi sử dụng mô hình mạng nhiều tầng rút gọn dạng ma trận để minh hoạ Xem tại trang 27 của tài liệu.
Hình 3.2. Kết quả dự báo mạng neural cho trờng hợp dự báo ngắn hạn - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 3.2..

Kết quả dự báo mạng neural cho trờng hợp dự báo ngắn hạn Xem tại trang 39 của tài liệu.
Hình 3.3. Kết quả dự báo mạng neural cho trờng hợp dự báo dài hạn - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 3.3..

Kết quả dự báo mạng neural cho trờng hợp dự báo dài hạn Xem tại trang 39 của tài liệu.
Phần mềm đợc xây dựng với giao diện khá đơn giản. Hình vẽ dới đây cho thấy giao diện chính của phần mềm. - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

h.

ần mềm đợc xây dựng với giao diện khá đơn giản. Hình vẽ dới đây cho thấy giao diện chính của phần mềm Xem tại trang 48 của tài liệu.
Hình 4.2. Hiển thị dữ liệu giá cổ phiếu ở dạng biểu bảng - Ứng dụng mạng neural dự báo chuỗi thời gian giá cổ phiếu trong thị trường chứng khoán việt nam

Hình 4.2..

Hiển thị dữ liệu giá cổ phiếu ở dạng biểu bảng Xem tại trang 50 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan