Mơ hình mạng ANN phi tuyến khi khảo sát các biến tài chính

Một phần của tài liệu Thạc sỹ mô hình dự báo thị trường chứng khoán việt nam tiensy (Trang 92 - 106)

3 Trong khoa học về ứng dụng ANN, một tập hợp gồm toàn bộ các mẫu dữ liệu được gọi bằng thuật ngữ Epoch Mỗi mẫu trong bộ dữ liệu được gọi bằng tên Exemplar.

2.3.3. Mơ hình mạng ANN phi tuyến khi khảo sát các biến tài chính

Sau khi xác định các biến số đầu vào cho mơ hình, thuật tốn để huấn luyện mạng và số quan sát cần thiết của các tập huấn luyện, xác nhận và kiểm định lại, ta tiến hành xây dựng các mạng ANN với cấu trúc khác nhau.

Trước hết sẽ là các mạng ANN đa lớp truyền thẳng, với một lớp ẩn duy nhất. Số neuron trong lớp ẩn sẽ lần lượt là 3, 4, 5, 6. Các mơ hình này sẽ được ký hiệu lần lượt là MLN 931; MLN 941; MLN 951; MLN 961.

Việc lựa chọn số neuron cho lớp ẩn, như đã trình bày trong các phần trước, vốn dĩ khơng có một công thức xác định. JingTao Yao (2000) đưa ra nguyên tắc rằng với

mơ hình mạng truyền thẳng một lớp ẩn duy nhất, số lượng neuron phù hợp có thể là N/2, N/2 +1, N/2 – 1, N/2 +2, N/2 – 2,… với N là số lượng neuron đầu vào. Trong khi đó, Shih (1994) cho rằng mơ hình mạng ANN thơng thường nên có dạng một kim tự tháp. Theo đó, lớp đầu tiên sẽ có số lượng neuron lớn nhất tương ứng với các biến đầu vào và các lớp tiếp theo sau sẽ có số neuron ít hơn. Cũng như các thơng số khác của mơ hình mạng, việc xác định ra cấu trúc phù hợp cho hệ thống mạng ANN là kết quả của quá trình thử nghiệm.

Sử dụng phần mềm Neural Solution để tiến hành huấn luyện với các cấu trúc mạng, trên bộ dữ liệu đã được xác định. Tập trọng số tốt nhất từ quá trình huấn luyện sẽ được sử dụng để dự báo ngoài mẫu và so sánh kết quả với giá trị VNI thực tế. Kết quả của các cấu trúc trên lần lượt được trình bày trong hình 2.8, 2.9 và bảng 2.9.

MLN 931 MLN 941

Hình 2.8: VNI dự báo và thực tế từ cấu trúc MLN 931 và MLN 941

Desired Output and Actual Network Output

Output 0.15 0.1 0.05 0 -0.05 1 2 3 4 5 6 7 8 9 10 11 VNI VNI Output -0.1 -0.15 -0.2 -0.25 Exemplar

Bảng 2.9: Kết quả kiểm định ngoài mẫu của cấu trúc mạng MLN 931, MLN 9 41, MLN 951, MLN 961 Chỉ tiêu MLN 931 MLN 941 MLN 951 MLN 961 MSE 0,001610352 0,001660062 0,000475635 0,000612894 NMSE 0,49855836 0,513948445 0,14725479 0,189749452 MAE 0,026933572 0,031146098 0,019459597 0,018091013 Min Abs Error 0,004009056 0,002301037 0,001936935 0,00079665 Max Abs Error 0,116049083 0,082784924 0,036457951 0,053151548 r 0,837726021 0,943107444 0,982771487 0,97801643 Mặc dù cấu trúc mạng ANN tuyến tính ban đầu đã cho ra kết quả dự báo VNI khá tốt, nhưng độ chính xác của dự báo đã được cải thiện đáng kể khi sử dụng cấu trúc mạng ANN phi tuyến. Điều này được thể hiện qua kết quả kiểm định ngoài mẫu của các cấu trúc mạng ANN được trình bày ở phần trên. Trước hết, xét chỉ tiêu tương quan của chuỗi giá trị dự báo từ mơ hình với chuỗi giá trị VNI thực tế, mối tương quan này đã tăng từ mức 83% lên đến mức 94% (của cấu trúc MLN 941) và khoảng 98% (của MLN 951 và MLN 961). Điều này thể hiện tính ưu thế vượt trội của cấu trúc mạng phi tuyến so với cấu trúc mạng tuyến tính. Bên cạnh đó, sự hồn thiện hơn của cấu trúc phi tuyến còn được thể hiện qua sự sụt giảm của chỉ tiêu MSE từ mức 0,0014 của mạng ANN tuyến tính xuống cịn mức 0,00061 của mạng ANN truyền thẳng MLN 961, giảm gần 56%. Đây là một sự cải thiện đáng kể, cho thấy hiệu quả dự báo của mạng ANN phi tuyến so với mạng ANN tuyến tính cũng như mơ hình hồi quy tuyến tính truyền thống.

Bên cạnh cấu trúc mạng ANN truyền thẳng đa lớn thì một dạng cấu trúc mạng ANN khác cũng được sử dụng khá phổ biến. Đó chính là mạng GRNN. Từ các thử nghiệm trên cho thấy mạng ANN truyền thẳng với 1 lớp ẩn duy nhất và 5 hoặc 6 neuron ẩn sẽ cho kết quả dự báo tương đối cao nhất. Do vậy, trong phần này sẽ chỉ tiến hành xây dựng và huấn luyện hệ thống mạng GRNN với một lớp ẩn với lần lượt 5 và 6 neuron ẩn, được ký hiệu lần lượt là GNN 951 và GNN 961. Kết quả dự báo ngoài mẫu đối với hai cấu trúc này sau khi được huấn luyện lần lượt là:

GNN 951 GNN 961

Hình 2.10: VNI dự báo và thực tế của tập kiểm tra lại từ cấu trúc mạng GNN 9 51 và GNN 961

Bảng 2.10: Kết quả kiểm định ngoài mẫu của GNN 951 và GNN 961

Chỉ tiêu GNN 951 GNN 961

MSE 0,00132333 0,00064198

NMSE 0,409697593 0,198754471

MAE 0,030073692 0,0218326

Min Abs Error 0,003887405 0,00406406

Max Abs Error 0,078272817 0,043841459

r 0,910328807 0,95020783

Đối với trường hợp của mạng GRNN, kết quả dự báo của cấu trúc mạng này trên tập kiểm định lại cũng cho thấy sự hoàn thiện hơn của cấu trúc phi tuyến so với cấu trúc tuyến tính. Đặc biệt là cấu trúc GNN 961, chỉ tiêu MSE của mạng này đạt mức 0,00064, thấp hơn khoảng 50% so với trường hợp của mạng ANN tuyến tính ban đầu, trong khi đó mức độ tương quan tuyến tính giữa giá trị dự báo với giá trị thực tế lên đến 95%, cao hơn trường hợp mạng ANN tuyến tính là 87%.

Tóm lại, qua các kết quả trên, ta có thể kết luận rằng, các biến số tài chính thật sự có

khả năng dự báo đối với tỷ suất sinh lợi của chỉ số VNI. Bên cạnh đó, mặc dù mơ hình hồi quy tuyến tính truyền thống cho kết quả dự báo tương đối khả quan với biến giải thích PB lên đến 44,7%, song mơ hình mạng ANN lại cho kết quả tốt hơn, cụ thể với cấu trúc mạng ANN tuyến tính lại cho tương quan giá trị dự báo với giá trị thực

tế cao hơn nhiều, lên đến 87%. Tuy nhiên, hiệu quả dự báo của mơ hình hồn tồn có thể được nâng cao thơng qua việc sử hệ thống mạng ANN phi tuyến thay vì phương pháp tuyến tính truyền thống.

Qua hai nhóm biến được khảo sát là nhóm biến kinh tế vĩ mơ và nhóm biến tài chính của các doanh nghiệp niêm yết đã phần nào trả lời được mục tiêu nghiên cứu. Tuy nhiên, phần tiếp theo, luận án tiếp tục khảo sát thêm một số nhóm biến khác để phân tích sự thay đổi VNI. Mục đích của q trình này khơng nằm ngồi mục tiêu của luận án là tiếp tục tìm kiếm nhóm biến thích hợp để dự báo VNI và xác định mơ hình mạng ANN có khả năng dự báo tốt hơn mơ hình hồi quy tuyến tính khơng.

2.4. Phân tích và dự báo giá chứng khốn trên TTCK VN dưới tác động củasự biến động các TTCK thế giới sự biến động các TTCK thế giới

Dự báo trên TTCK từ trước đến nay đã thu hút sự quan tâm của rất nhiều nhà nghiên cứu. Xuất phát từ những góc độ khác nhau, những nghiên cứu này đã có những đóng góp đáng kể. Các nghiên cứu của Bhattacharyya và Banerjee (2004), Eun và Shim (1989), Taylor và Tonks (1989), Yang và cộng sự (2003) đã khẳng định sự tồn tại mối tương quan giữa các TTCK trên thế giới. Bên cạnh đó, những nghiên cứu của Becker (1990), Eun và Shim (1989), Wu và Su (1989) cũng chỉ ra rằng TTCK Mỹ có sự tác động mạnh đến hầu hết các thị trường khác. Điều này gợi ý những nghiên cứu sâu hơn nhằm mục đích vận dụng mối tương quan giữa các thị trường trong việc dự báo chỉ số chứng khoán.

Tuy nhiên, nghiên cứu của Granger (1991) đã cho thấy rằng phần lớn mối tương quan giữa các biến kinh tế vĩ mơ, biến tài chính là phi tuyến. Do đó, để việc ứng dụng các mơ hình phi tuyến trong q trình dự báo được kỳ vọng sẽ mang đến kết quả khả quan hơn, một trong những mơ hình phi tuyến được nhắc đến nhiều trong các nghiên cứu học thuật thời gian gần đây chính là mơ hình mạng ANN. Các tác giả đã cho thấy rằng, trong nhiều trường hợp, mơ hình phi tuyến ANN sẽ có thể cho kết quả dự báo vượt trội so với mơ hình tuyến tính truyền thống.

Điển hình là nghiên cứu của Yochanan Shachmurvoe và Dorota Witkowsha (2000). Theo đó, các ơng đã sử dụng chuỗi dữ liệu theo ngày của các chỉ số thị trường Canada, Pháp, Ðức, Nhật, Anh và Mỹ để tiến hành dự báo bằng các mơ hình ANN đa lớp. Kết quả so sánh với mơ hình tuyến tính truyền thống sử dụng phương pháp bình phương nhỏ nhất (OLS) cho thấy mạng ANN phi tuyến ANN cho kết quả dự báo tốt hơn.

Xuất phát từ những ý tưởng trên, phần nghiên cứu này của luận án tiến hành xây dựng hệ thống ANN để dự báo cho chỉ số VNI của TTCK VN bằng cách sử dụng các chỉ số thị trường khác bao gồm chỉ số Dow (Mỹ), FTSE (Anh), N225 (Nhật) và SSEC (Shanghai – Trung Quốc).

Chuỗi dữ liệu theo tuần của các chỉ số thị trường được thu thập từ trang điện tử Bloomberg trong khoảng thời gian từ tháng 1/2005 đến tháng 9/2010. Sau đó được tiến hành xử lý chuyển đổi thành chuỗi tỷ suất sinh lợi. Các chuỗi số liệu được sử dụng làm nhập liệu đầu vào cho mơ hình đều là các chuỗi có tính dừng. Về điều kiện chuỗi dừng đối với dữ liệu đầu vào trong mơ hình ANN, các nghiên cứu vẫn chưa thống nhất rằng liệu đây có thật sự là điều kiện bắt buộc hay không. Theo cách lý luận thông thường, chuỗi dữ liệu dừng sẽ cho khả năng khái quát hóa cao hơn, đồng nghĩa với khả năng dự báo ngồi mẫu chính xác hơn so với trường hợp chuỗi dữ liệu không dừng. Nguyên nhân là do trong trường hợp này, chuỗi dữ liệu chỉ phản ánh được những đặc điểm trong giai đoạn khảo sát nên dẫn đến mơ hình được xây dựng thiếu khả năng nắm bắt được đặc điểm thật sự của các biến số này. Tuy nhiên, một số các nghiên cứu khác lại bỏ qua vấn đề này.

Sau khi thu thập được các dữ liệu cần thiết, phần tiếp theo sẽ đi vào xây dựng mơ hình và so sánh kết quả dự báo của hệ thống phi tuyến ANN và mơ hình tuyến tính. Trước hết, mơ hình tuyến tính mạng ANN sử dụng hàm truyền tuyến tính và khơng có lớp ẩn sẽ được xây dựng và sử dụng làm mơ hình chuẩn (benchmark) để so sánh với các mơ hình phi tuyến khác. Về bản chất, mơ hình tuyến tính này cũng chính là dạng đơn giản nhất của mơ hình ANN (Steven Gonzalez, 2000) với một lớp neuron đầu vào, một lớn neuron đầu ra và khơng có lớp ẩn. Tiến hành kiểm định ngồi mẫu để có kết quả như sau:

Desired Output and Actual Network Output

Output 0.15 0.1 0.05 0 VNI VNI Output 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 -0.05 -0.1 -0.15 Exemplar

Hình 2.11: Chuỗi tỷ suất sinh lợi VNI dự báo ngoài mẫu từ mạng ANN tuyến tính và VNI thực tế

Bảng 2.11: Kết quả kiểm định ngồi mẫu mạng ANN tuyến tính Performance VNI

MSE 0,001634655

NMSE 1,066221205

MAE 0,027926973

Min Abs Error 0,001120195 Max Abs Error 0,133273543

r 0,0781873

Qua bảng kết quả kiểm định ngồi mẫu và hình 2.11, ta thấy rằng, mơ hình tuyến tính thật sự đã khơng thể “nắm bắt” được mối tương quan giữa VNI với các chỉ số thị trường khác. Tuy chỉ tiêu MSE khá nhỏ, ở mức 0,001634 và chỉ tiêu MAE cũng chỉ ở mức 0,0279, nhưng chỉ tiêu r lại đạt mức 0,078.

Để lý giải cho kết quả này có thể có nhiều nguyên nhân. Trước hết, có thể là do việc lựa chọn biến đầu vào. Do thực tế TTCK VN vẫn còn rất non trẻ, sự hội nhập với thị trường tài chính khu vực và thế giới chưa cao, các nhà đầu tư trên thị trường cịn thiếu tính chun nghiệp, mặc dù trong thời gian qua đã có nhiều tiến triển, vẫn cịn những khoảng cách nhất định nên mức độ tác động của các thị trường khác đối với thị trường VN là rất thấp. Một trong số các nguyên nhân này cịn có phần khơng nhỏ của chính nội tại nền kinh tế VN, nói cách khác TTCK VN thời gian qua chịu nhiều tác động từ chính nội tại của nền kinh tế chứ ít chịu tác động từ sự thay đổi của TTCK của những nền kinh tế trên thế giới.

Tuy nhiên, dưới góc độ kỹ thuật, kết quả dự báo trên có thể là do mơ hình được sử dụng, trong trường hợp này là cấu trúc mạng ANN tuyến tính, phải chăng là chưa phù hợp. Thực tế có thể là mối tương quan giữa chỉ số VNI của TTCK VN với các chỉ số thị trường khác là phi tuyến. Để làm rõ điều này, luận án tiếp tục tiến hành xây dựng cấu trúc mạng ANN và so sánh kết quả kiểm định ngoài mẫu với cấu trúc trên.

Trước khi đi vào xây dựng mạng ANN, bộ dữ liệu thu thập cần thiết phải được chia thành 3 phần là tập dữ liệu để huấn luyện mạng, tập dữ liệu để xác nhận lại và cuối cùng là tập dữ liệu dùng để thực hiện kiểm định ngoài mẫu. Hầu hết các nghiên cứu về ANN đều thống nhất rằng tỷ lệ giữa 3 tập dữ liệu là không cố định mà thay đổi tùy thuộc vào đặc điểm riêng của mỗi cấu trúc mạng và dữ liệu thu thập được. Tuy nhiên, tỷ lệ phân chia giữa các tập này cần thiết phải cân nhắc đến sự đánh đổi giữa số dữ liệu cần thiết để tiến hành huấn luyện mạng nhằm tìm ra các trọng số của mơ

hình, vốn địi hỏi một lượng quan sát tương đối lớn, với việc đánh giá khả năng khái quát của mạng được thể hiện trong kết quả kiểm định ngoài mẫu đối với mạng đó. Qua các thử nghiệm khác nhau, bài nghiên cứu sử dụng tỷ lệ phân chia giữa ba tập hợp này lần lượt là 70%, 15%, 15%, thay vì tỷ lệ 70%, 20% và 10% như đề xuất trong nghiên cứu của JingTao Yao (2000).

Vấn đề tiếp theo là xác định thuật toán cần được sử dụng khi tiến hành huấn luyện mạng. Đây là cách thức mà các trọng số sẽ được điều chỉnh sao cho giá trị MSE đạt được cuối cùng là nhỏ nhất. Trong hầu hết các nghiên cứu về ANN thì thuật tốn được sử dụng phổ biến nhất là thuật toán LevenbergMarquardt kết hợp với “lan truyền ngược” mà lý thuyết về mơ hình mạng đề cập. Và đây cũng là thuật toán được lựa chọn cho bài nghiên cứu. Trong những năm gần đây, một số nghiên cứu về mơ hình ANN đã tiến hành áp dụng thuật tốn di truyền để huấn luyện mạng (Hassan, Nath và Kirley; 2007) và kết quả cho thấy thuật tốn trên hứa hẹn sẽ góp phần nâng cao hiệu quả dự báo của mơ hình ANN. Trong phạm vi của phần trình bày này, thuật toán di truyền vẫn chưa được áp dụng nhưng kỳ vọng rằng đây sẽ là chủ đề cho các nghiên cứu tiếp theo về mơ hình ANN sau này.

Về cấu trúc của hệ thống mạng, sau nhiều thử nghiệm khác nhau, luận án lựa chọn xây dựng bốn cấu trúc lần lượt là:

· MLF 441: Cấu trúc mạng truyền thẳng đa lớp chỉ 1 lớp ẩn với 4 neuron · MLF 4321: Cấu trúc mạng truyền thẳng đa lớp với 2 lớp ẩn có số neuron lần

lượt là 3 và 2 neuron

· MLF 4431: Cấu trúc mạng truyền thẳng đa lớp với 2 lớp ẩn có số neuron lần lượt là 4 và 3 neuron

· GNN 431: Cấu trúc mạng truyền thẳng được khái quát hóa với 1 lớp ẩn duy nhất có 3 neuron

Việc lựa chọn cấu trúc hệ thống mạng thật chất là quá trình “thử và sai” để đi đến kết luận về cấu trúc mạng phù hợp nhất với dữ liệu và biến số đang khảo sát. Trong trường hợp này, cấu trúc mạng truyền thẳng đa lớp được lựa chọn là vì đây là loại mơ hình được sử dụng phổ biến trong hầu hết các nghiên cứu về mạng ANN. Bên cạnh đó, cấu trúc mạng GRNN, dựa trên nền tảng mơ hình mạng perceptron đa lớp có kết hợp thêm mối liên kết trực tiếp giữa biến đầu vào và biến đầu ra, cũng là dạng mơ hình được nhiều nhà nghiên cứu lựa chọn.

Sau khi đã hồn tất việc lựa chọn các thơng số cơ bản cho mơ hình, tiếp đến là tiến hành q trình huấn luyện mạng. Kiểm định ngồi mẫu đối với các tập trọng số đạt được của mỗi cấu trúc, ta có các kết quả sau:

MLF 441 MLF 4321

Hình 2.12: Chuỗi tỷ suất sinh lợi VNI dự báo ngoài mẫu từ mạng MLF 441 và

Một phần của tài liệu Thạc sỹ mô hình dự báo thị trường chứng khoán việt nam tiensy (Trang 92 - 106)

Tải bản đầy đủ (PDF)

(180 trang)