.D li u nghiên cu

Một phần của tài liệu So sánh hai mô hình dự báo tỷ suất sinh lời chứng khoán. Mô hình hồi quy truyền thống và mô hình Artificial Neural Network (Trang 32 - 76)

1. MƠ HÌNH HI QUY TRU YN TH NG

1.3 .D li u nghiên cu

1.3.1. iăt ng và ph m vi nghiên c u

 S d ng đ i t ng nghiên c u lƠ các cơng ty đư niêm y t trên sàn HoSE vì các lý do sau:

Nh ng cơng ty niêm y t trên HoSE h u nh lƠ cơng ty cĩ quy mơ v n l n (Theo đi u ki n niêm y t c a Ngh đ nh s 58/2012/CP - N , đ đ c niêm y t trên hai sƠn, doanh nghi p c n ph i đáp ng quy mơ v v n (xét theo v n đi u l ) c ng nh th i

gian liên t c ho t đ ng hi u qu c a doanh nghi p niêm y t đ c gia t ng. C th ,

doanh nghi p mu n niêm y t trên HoSE ph i cĩ v n đi u l t i thi u 120 t đ ng (hi n lƠ 80 t đ ng), trên HNX t i thi u 30 t đ ng (hi n lƠ 10 t đ ng).

Bên c nh đĩ, nh ng cơng ty nƠy đ u cĩ tính minh b ch thơng tin cao

 Các c phi u đ c l a ch n theo các tiêu chu n sau:

Lo i b các c phi u các cơng ty tài chính, qu đ u t vì lu n v n nƠy c n dùng y u t

th giá trên th giá

Lo i b c phi u các cơng ty b c m niêm y t, chuy n sàn, sát nh p hay h y niêm y t vì d li u khơng liên t c

- 23 ậ

Lo i b c phi u các cơng ty cĩ th i gian giao d ch d i 1 n m vì cĩ tính đ n bi n

đ ng giá c a c phi u n m v a qua

Lo i b c phi u các cơng ty cĩ giá tr s sách âm

 Kho ng th i gian thu th p d li u v giá ch ng khốn t 1/2009 đ n 12/2011 vì các lý do sau:

L y s li u g n th i đi m hi n t i nh t đ thu n l i cho vi c d báo

L y s li u 3 n m đ cĩ m u đ l n. T n m 2006 v tr c, s l ng các cơng ty niêm y t trên HoSE khơng nhi u và cĩ quy mơ nh . Cịn giai đo n t n m 2007, 2008: th tr ng ch ng khốn r t sơi đ ng trái ng c v i giai đo n t 2009 đ n nay.

D a trên nh ng tiêu chu n trên, lu n v n s nghiên c u 87 c phi u. Do đĩ m u đ c l a ch n đ đ a vƠo mơ hình nghiên c u là 261 m u và c u trúc d li u là d ng b ng cân b ng

1.3.2. Ph ngăphápăx lý s li u

 Giá ch ng khốn

Giá ch ng khốn đ c thu th p trong kho n : 1/1/2009-31/12/2011 t c s d li u c a : www.cophieu68.comvƠ lƠ giá đĩng c a.

 T su t sinh l i ch ng khốn

Trong th c t r t khĩ đ xác đ nh su t sinh l i c a m t tài s n vƠ khĩ h n n a là su t sinh l i c a th tr ng do khơng cĩ s li u chi tr c t c theo t ng th i đi m. Do v y

đ tính tốn su t sinh l i nƠy, ng i ta th ng d a vào giá ch ng khốn theo đnh k quan sát. T giá ch ng khốn, tác gi ti n hƠnh tính TSSL n m theo cơng th c.

á ck á ck

TSSL

á ck

gi năm t - gi năm (t -1)

gi t

 Quy mơ v n hĩa th tr ng ME

- 24 ậ  u t trên tƠi s n I/A

c tính lƠ đ u t k tr c trên t ng tài s n đ u k tr c

 Giá s sách, giá th tr ng, ROA

D a trên báo cáo tài chính c a các cơng ty, h u h t các báo cáo đ u đư đ c sốt xét và ki m tốn

 Giá tr beta

D a trên giá c a t ng ch ng khốn theo tháng và ch s Vn-Index đ xác đnh ch s beta cho t ng ch ng khốn t n m 2009-2011

2. MƠ HÌNH M NG TH N KINH NHÂN T O

2.1.ăPh ngăphápănghiênăc u

Trên c s các bài nghiên c u th c nghi m, tác gi rút ra quy trình th c nghi m g m 5

b c cho vi c xây d ng mơ hình m ng th n kinh nh sau: B c 1: L a ch n các bi n s và thu th p d li u

B c 2: Ti n x lý d li u

B c 3: Xây d ng và l a ch n các thơng s cho mơ hình

B c 4: Ti n hành th c hi n cho mơ hình

B c 5: Th c hi n d báo và phân tích k t qu

2.1.1. L a ch n các bi n s và thu th p d li u

D a trên ý ngh a kinh t c a các bi n nh đư trình bƠy m c d li u, tác gi s d ng 5 bi n kinh t làm d li u trong m u đ xây d ng mơ hình m ng th n kinh nhân t o d báo t su t sinh l i ch ng khốn.

- 25 ậ

2.1.2. Ti n x lý d li u

Cĩ khá nhi u tranh cãi xung quanh v n đ x lý d li u tr c khi xây d ng mơ hình m ng th n kinh, đ c bi t là v n đ phân ph i chu n c a d li u. Cĩ th tĩm t t các

quan đi m nh sau:

Quan đi m

Khơng c n x lý d li u C n ph i x lý d li u Khơng quan tr ng vi c ti n x lý d li u hay khơng Ruey-Shiang Guh (2002) Irina Klevecka và Janis

Lelis (2008)

Guoqiang Zhang(1998) Wei Huang (2004) B ng 3.3: T ng h p các quan đi m ti n x lý d li u

 Quan đi m khơng c n x lý d li u

Theo Ruey-Shiang Guh (2002), cho r ng m ng th n kinh v n ho t đ ng t t cho dù d li u cĩ phân ph i khơng chu n.

 Quan đi m cho r ng c n ph i x lý d li u

Irina Klevecka và Janis Lelis (2008), cho r ng n u d li u cĩ phân ph i khơng chu n thì:

- Các c l ng trung bình vƠ đ bi n thiên s b mĩp méo. Do đĩ s khơng tính

đ c kho ng tin c y hay kho ng d báo c a mơ hình.

- D li u khơng cĩ phân ph i chu n thì ph n d c ng khĩ cĩ th cĩ d ng phân ph i chu n

Nhìn chung, các nhà nghiên c u đ u ng h quan đi m nên ti n x lý d li u tr c khi

đ a vƠo mơ hình.

- 26 ậ

Wei Huang et al (2004) cho r ng vi c chu n hĩa d li u là khơng b t bu c nh ng cĩ vƠi tr ng h p c ng c n ph i chu n hĩa d li u n u nh m ng th n kinh s d ng các hàm truy n là hàm xichma (d li u đ u ra n m trong kho ng (0;1)), hàm Hyperbol (d li u đ u ra n m trong kho ng (-1;1)). Guoqiang Zhang, B.eddy Patuwo & Michael Y.Hu (1998) khơng tìm th y s khác nhau đáng k khi s d ng d li u thơ và d li u chu n hĩa d a trên k t qu th c nghi m v i t giá h i đối. Guoqiang Zhang gi i thi u m t s cơng th c chu n hĩa d li u ph bi n nh sau:

Chuy n hĩa đ n gi n: 0 max n x x x 

Chuy n hĩa d li u trong kho ng (a;b): 0 min max min ( ) ( ) n x x x a b x a x x      Chuy n hĩa th ng kê: 0

n x x x S   Trong đĩ :

xn: d li u đư chu n hĩa x0: d li u thơ ban đ u

xmin, xmax: giá tr nh nh t, giá tr l n nh t c a chu i d li u chu n hĩa x: giá tr trung bình c a chu i d li u chu n hĩa

S: đ l ch chu n c a chu i d li u chu n hĩa

Tuy nhiên tác gi s d ng ph n m m NeuroSolution 5.0 nên vi c chu n hĩa d li u

đ c th c hi n m c đ nh c a ph n m m. Do đĩ tác gi khơng c n ph i chu n hĩa d li u tr c mà ch c n s d ng d li u thơ đ xây d ng mơ hình.

2.1.3. L a ch n các thơng s cho mơ hình

Tính tốn s l ng l p n

G. Cybenko (1989), Pierre Baldi & Hornik(1989) và nhi u nhà nghiên c u khác cho r ng vi c s d ng m t l p n cho m c đích d báo v i đ chính xác cao. Guoqiang

- 27 ậ

Zhang (1998) cho r ng m ng th n kinh 2 l p n s hi u qu h n m ng th n kinh 1 l p n. Vì n u s d ng 1 l p n s c n nhi u n -ron n. Mohd Zukime HJ Mat Junor (2004) cho r ng n u mơ hình ch cĩ ít bi n đ u vào và m t bi n đ u ra thì cĩ th xây d ng mơ hình v i m t l p n. Greg Tkacz (2001) th c hi n d báo t c đ t ng tr ng GDP th c theo quý c a Canada. Các bi n đ c s d ng là: biên đ lãi su t c a M và Canada; lãi su t trái phi u doanh nghi p, t c đ t ng cung ti n M1 và M2, t c đ gia

t ng ch s TSE 300 t quý 1/1968 đ n quý 2/1999. Tác gi đư s d ng mơ hình tuy n tính và mơ hình m ng th n kinh truy n th ng v i 1 l p n. Nhĩm Curak Marijana (2009) s d ng các bi n: cung ti n M2 và v n hĩa th tr ng ch ng khốn đ d báo t c đ t ng tr ng kinh t c a 27 n c thƠnh viên Liên minh Chơu Ểu trong giai đo n 1991-2007, đ ng th i so sánh d báo c a 2 mơ hình: mơ hình h i quy tuy n tính và mơ hình m ng th n kinh truy n th ng v i 1 l p n.

Bài lu n v n s d ng 5 bi n đ u vào là BM, ME, ROA, IA , BETA và 1 bi n đ u ra

TSSL. Do đĩ tác gi s s d ng mơ hình m ng th n kinh nhân t o 1 l p n. Tính tốn s l ng n -ron n

Kinh nghi m l a ch n s n -ron n đ c đ xu t b i Bailey và Thompson (1990) t các nghiên c u th c nghi m nh sau:

- M ng th n kinh 3 l p, n n -ron l p đ u vƠo, m n -ron l p đ u ra. Do đĩ l p n s cĩ n m. n -ron

- M ng th n kinh 3 l p: s l ng n -ron n b ng 75% s n -ron đ u vào - S l ng n -ron n t i u b ng ½ ->3 l n s n -ron đ u vào

Tkacz (2001) và Nhĩm Curak Marijana (2009) đư s d ng mơ hình mơ hình m ng th n kinh truy n th ng v i 3 đ n v n

Lu n v n s l a ch n s l ng n ron b ng cách s d ng cùng m t hàm bi n đ i cho l p n và l p ra, dùng ph ng pháp th vƠ sai thay đ i s n ron n. Tr ng h p nào cĩ MSE nh nh t s ch n s l ng n ron n t ng ng.

- 28 ậ

Do các bi n s kinh t th ng cĩ d ng phi tuy n nên hàm truy n tuy n tính ít khi s d ng, th ng áp d ng các hàm truy n phi tuy n. Trong ph n m m NeuroSolution phiên b n 5.0 cĩ s n khá nhi u hàm truy n tuy n tính nh SoftMax Axon, Bias Axon, Axon, Liner Axon và các hàm truy n phi tuy n nh TanhAxon, Sigmoid Axon, LinerTanh Axon, LinerSigmoid Axon. Tkacz (2001) s d ng hàm truy n xích ma. Nhĩm Curak Marijana(2009) s d ng hàm Tanh làm hàm truy n.

Tác gi s s d ng 4 hàm truy n trong lu n v n: TanhAxon, SigmoidAxon,

LinearTanhAxon, LinearSigmidAxon làm hàm truy n cho n -ron l p n vƠ đ u ra

theo ph ng pháp th và sai.

Xác đ nh t l h c vƠ đ ng l ng

T l h c quá cao hay quá th p đ u gơy khĩ kh n cho vi c t i thi u hĩa tồn c c. N u t l h c quá cao s t o ra nh ng dao đ ng l n khĩ đ t đ n đi m t i u. Cịn n u t l h c quá th p s gây ra tình tr ng t i thi u hĩa c c b

ng l ng: n đnh quá trình h i t theo m t h ng xác đ nh. N u đ ng l ng quá nh s khơng gây ra nhi u tác đ ng.

McClelland (1988) cho r ng t l h c lƠ 0.7 vƠ đ ng l ng là 0.9 là t t nh t. Mohd

Zukime HJ Mat Junoh (2004) thì đ ngh t l h c cho l p n cu i nên b ng 2 l n l p

đ u ra. Cịn Pengyi Shi (2006) đ ngh t l h c lƠ 0.6 vƠ đ ng l ng là 0.9 Lu n v n s ch n t l h c t 0.6- 0.9 vƠ đ ng l ng là0.6-0.9

- 29 ậ

S l ng l p n S l ngăn -ron n Hàm truy n T l h căvƠăđ ngăl ng

G. Cybenko (1989) Pierre Baldi & Hornik (1989) Mohd Zukime HJ Mat Junor (2004) Greg Tkacz (2001) 1 Bailey và Thompson (1990) -ạn.m - 75% s n -ron vào - ½ ->3 l n s n - ron vào

Tkacz (2001) xích ma. McClelland (1988) -TLH:0.7 - L:0.9 Guoqiang Zhang (1998) 2 Tkacz (2001) và Curak Marijana (2009) 3 Nhĩm Curak Marijana(2009)

Tanh Mohd Zukime

HJ Mat Junoh (2004) TLH l p n cu i =2 l n l p ra. Pengyi Shi (2006) -TLH:0.6 - L:0.9

- 30 ậ

Thơng qua vi c thu th p các thơng s , tác gi đư xơy d ng các thơng s cho mơ hình

nh sau:

Thơng s cho mơ hình L a ch n c a tác gi

Ti n x lý d li u Chu n hĩa d li u th c hi n m c đ nh c a ph n m m (NeuroSolution 5.0)

S l ng l p n 1 l p n (5 bi n đ u vào và 1 bi n đ u ra )

S l ng n -ron n

S d ng cùng m t hàm bi n đ i cho l p n và l p ra, dùng

ph ng pháp th vƠ sai thay đ i s n ron n. TH nào cĩ MSE nh nh t s ch n.

Hàm truy n

S d ng : TanhAxon, SigmoidAxon, LinearTanhAxon, LinearSigmidAxon làm hàm truy n cho n -ron l p n vƠ đ u

ra theo ph ng pháp th và sai

T l h c vƠ đ ng l ng T l h c t 0.6- 0.9 vƠ đ ng l ng là 0.6-0.9 B ng 3.5: Các thơng s đ c tác gi l a ch n

2.1.4. Ti n hành th c hi n cho mơ hình

xây d ng mơ hình m ng th n kinh t t nh t ph i d a trên vi c ch n l a các thơng s thích h p và c n đ c th c hi n trên ph ng pháp th vƠ sai. Do đĩ v i cùng m t b d li u đ u vào, cùng m t c u trúc c a mơ hình nh ng ph i hu n luy n hƠng tr m l n

đ đ c mơ hình c l ng t t nh t. Mơ hình t t nh t là mơ hình cĩ MSE c a d li u phê duy t và d li u ki m tra th p nh t

2.1.5. D báo và phân tích k t qu

đánh giá k t qu d báo trong mơ hình th n kinh, tác gi s d ng các tiêu chu n

th ng dùng là sai s tuy t đ i trung bình (MAE) hay sai s ph n tr m tuy t đ i (MAPE), sai s bình ph ng trung bình (MSE), c n b c hai c a sai s bình ph ng

- 31 ậ

Trong m ng th n kinh, cĩ 3 tiêu chu n ng ng hu n luy n ph bi n lƠ: v t quá s vịng l p, đ t t i ng ng MSE, giá tr đ u ra cĩ th ch p nh n đ c ho c s d ng d li u phê duy t

2.2. Mơ hình nghiên c u

m ng n ron d báo t t, c n ch n các thơng s cho m ng. Thơng s thích h p

th ng ph thu c vào d li u, m t s thơng s cĩ th t t cho d li u nƠy nh ng l i kém khi s d ng d li u khác.

 Tìm s n ron l p n h p lý nh t

Trong Axon n ch a t 1-3 n r n (PE), s PE nƠy đ c tính theo quy t c ắkim t tháp” ậs l ng PE trong l p n s b ng ½ t ng s đ u vƠo vƠ đ u ra c a mơ hình.

Tuy nhiên đ cĩ mơ hình t t nh t, lu n v n s s d ng hàm bi n đ i TanhAxon cho l p n và l p ra, thay đ i s n ron n.

Tr ng h p Hàm bi năđ i l p n và

l p ra S l ngăn ăronă n MSE

1 TanhAxon 1 0.1209

2 TanhAxon 2 0.0716

3 TanhAxon 3 0.0603

B ng 3.6: K t qu l a ch n s n ron l p n

D a vào b ng k t qu trên cho th y v i tr ng h p 3 s cho MSE nh nh t. Ch n s no- r n n là 3

Một phần của tài liệu So sánh hai mô hình dự báo tỷ suất sinh lời chứng khoán. Mô hình hồi quy truyền thống và mô hình Artificial Neural Network (Trang 32 - 76)

Tải bản đầy đủ (PDF)

(76 trang)