CHỨNG KHOÁN VIỆT NAM
2.2. Sử dụng mạng thần kinh nhân tạo được khái quát hóa và mạng truyền
2.2.1. Dự báo giá chứng khoán bằng cấu tru ́ c mạng thần kinh nhân tạo được
Với bộ cơ sở dữ liệu đƣợc thu thập và xử lý nhƣ trên, phần tiếp theo sẽ đi vào quá trình xây dựng cấu trúc mạng ANN cụ thể khác. Trong nghiên cứu của Reza G.
Ahagar và Mahmood Yahyazadehfar (2010), các tác giả đã sử dụng cấu trúc mạng thần kinh nhân tạo đƣợc khái quát hóa (GRNN - Generalized Regression Neural Network) để dự báo giá chứng khoán. Cấu trúc này có phần khác so với cấu trúc mạng truyền thẳng đa lớp mà trong chương 1 luận án đã trình bày, GRNN vốn được sử dụng phổ biến trong các nghiên cứu về mạng thần kinh ở chổ các neuron của mỗi lớp trong hệ thống không chỉ kết nối với neuron của lớp ngay trước và sau nó mà còn đƣợc kết nối với các neuron của những lớp ẩn khác.
Về cấu trúc của mô hình mạng thì bài nghiên cứu trên chỉ xây dựng cấu trúc mạng một lớp ẩn duy nhất với 14 neuron và sử dụng thuật toán Levenberg-Marquardt (LM) để tiến hành điều chỉnh các trọng số trong quá trình huấn luyện nhằm đạt đến mục tiêu tối thiểu hóa MSE giữa giá trị dự báo của mô hình với giá trị thực tế. Thuật toán này là một trong những công cụ đƣợc sử dụng nhiều nhất đối với các bài toán tối ƣu hóa phi tuyến. Đây được xem là sự kết hợp giữa phương pháp Gauss-Newton với phương pháp Gradient thông thường (Manolis, 2005).
Luận án ký hiệu cho mô hình trên là GNN-14PE. Vấn đề tiếp theo trước khi đi vào huấn luyện cho cấu trúc mạng ANN này là cần phải phân chia bộ dữ liệu thành ba phần: tập hợp các quan sát dùng để huấn luyện hệ thống ANN, tập hợp các quan sát để xác nhận và cuối cùng là tập hợp các quan sát sử dụng để kiểm tra lại (kiểm định ngoài mẫu). Phần nghiên cứu này sẽ sử dụng tỷ lệ của ba tập hợp này lần lƣợt là 70%, 20% và 10%. Thực tế là không có nguyên tắc chung nào cho sự phân chia này và tỷ lệ trên là gợi ý trong nghiên cứu của Jing Tao (2000). Tuy nhiên, với số lƣợng mẫu quan sát quá ít sẽ là một cảnh báo cho giá trị mô hình dự báo. Kết quả của quá trình huấn luyện ANN theo cấu trúc mạng GNN-14PE đƣợc cho ở bảng 2.4:
Bảng 2.4: Kết quả huấn luyện hệ thống mạng GNN-14PE
Network Training Cross Validation Minimum MSE 7,79431E-31 0,142506795 Final MSE 7,79431E-31 0,439504113
Tiếp đến luận án tiến hành kiểm định ngoài mẫu đối với mô hình dự báo trên sau khi trải qua quá trình huấn luyện. Hình 2.3 và bảng 2.5 thể hiện kết quả dự báo ngoài mẫu trong bộ dữ liệu kiểm tra.
Desired Output and Actual Network Output
-0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
1 2 3 4 5 6 7 8 9 10
Exemplar
Output VNI
VNI Output
Hình 2.3: VNI dự báo từ mô hình GNN-14PE so với VNI thực tế
Bảng 2.5: Kết quả kiểm định ngoài mẫu của mô hình GNN-14PE Performance VNI
MSE 0,028785546
NMSE 14,62732889
MAE 0,121311251
Min Abs Error 0,010482329 Max Abs Error 0,42990126
R -0,271785126
Với những kết quả trên, ta thấy rằng, cấu trúc mạng GRNN với cấu trúc một lớp ẩn và 14 neuron ẩn đã cho kết quả rất tốt trong quá trình huấn luyện khi giá trị MSE cuối cùng đạt đến 7,7943E-31, một giá trị lý tưởng cho sự chênh lệch giữa giá trị dự báo và thực tế. Tuy nhiên, khi tiến hành kiểm định ngoài mẫu đối với mô hình trên, kết quả cho thấy sự hạn chế lớn của mô hình trong việc dự báo giá trị VNI. Đặc biệt là chỉ số tương quan - r, đặc trưng cho mối tương quan tuyến tính giữa chuỗi giá trị VNI dự báo và thực tế là giá trị âm. Qua đó, có thể kết luận rằng, mô hình trên đã rơi vào tình trạng “quá khít” trong khi huấn luyện, nhƣng lại thiếu khả năng khái quát hóa để phản ánh đầy đủ mối tương quan phi tuyến giữa các biến số.
Một vấn đề khác là số biến đƣa vào mô hình cũng đƣợc xem xét tính trễ nhƣ trên đã đề cập. Phần tiếp theo sau, luận án sẽ không khảo sát các biến đƣợc làm trễ, chỉ khảo sát 7 biến nhƣ đã đề cập trong bảng 2.1. Tuy nhiên, số lƣợng PE trong lớp ẩn cũng giảm đi nhiều.
Hình 2.4: Mô tả mạng GRNN với 4 neuron trong lớp ẩn GNN-4PE
Để khắc phục tình trạng “quá khít” trong cấu trúc mạng GNN-14PE, luận án đã tiến hành điều chỉnh cấu trúc mạng, vẫn giữ nguyên các yếu tố khác nhƣng số lƣợng neuron ẩn sẽ lần lƣợt là 4 và 5, ký hiệu cho hai cấu trúc mạng này là GNN-4PE (minh họa trong hình 2.4 cho mạng GRNN) và GNN-5PE, kết quả kiểm định ngoài mẫu đối với 2 cấu trúc mạng trên lần lƣợt là:
Bảng 2.6: Kết quả kiểm định ngoài mẫu của cấu trúc GNN-4PE và GNN-5PE
Performance GNN-4PE GNN-5PE
MSE 0,03126959 0,024987342
NMSE 15,88959147 12,69727722
MAE 0,136603321 0,096066336
Min Abs Error 0,018306627 0,000908091
Max Abs Error 0,404865279 0,432749842
r 0,391779615 0,189219915
LR
USD
IP
TB
M2 CPI
CR
PE1
PE2
PE3
PE4
VNI
Hình 2.5: Giá trị VNI dự báo từ GNN-4PE và GNN-5PE với giá trị VNI thực tế
So sánh kết quả của cấu trúc GNN-14PE với GNN-4PE và GNN-5PE rõ ràng là đã có sự gia tăng trong hiệu quả dự báo, chủ yếu được thể hiện qua chỉ tiêu tương quan tuyến tính giữa VNI thực tế và giá trị VNI dự báo của cấu trúc mạng, lần lƣợt ở mức 39,17% và 18,92%. Tuy nhiên, nếu so với mô hình ANN đƣợc trình bày trong phần 2.1 thì hiệu quả của cấu trúc mạng GNN-4PE cho dự báo tốt hơn. Tuy nhiên, mức độ giải thích của mạng vẫn chƣa cao chỉ mới đa ̣t 39,17%. Chính vì vậy, luận án tiếp tục thay đổi cấu trúc mạng ANN khác để phân tích và dự báo sự tác động của các biến kinh tế vĩ mô đến VNI.
2.2.2. Dự báo giá chứng khoán dựa trên phân tích tác động của các biến kinh tế
vĩ mô theo cấu trúc mạng truyền thẳng
Trong phần này luận án tiến hành thử nghiệm với cấu trúc mạng thần kinh khác để kiểm tra tính hiệu quả của mô hình dự báo. Bên cạnh mạng thần kinh đƣợc khái quát hóa nhƣ trên thì cấu trúc mạng đƣợc sử dụng phổ biến nhất vẫn là mạng ANN truyền thẳng với một lớp ẩn. Lần lƣợt tiến hành huấn luyện mạng với cùng một cấu trúc dữ liệu nhƣ trên nhƣng thay đổi số neuron của lớp ẩn. Mạng ANN truyền thẳng, một lớp ẩn với số neuron ẩn lần lƣợt là 2, 3, 4, 5 đƣợc ký hiệu: MFF-2PE, MFF-3PE, MFF- 4PE, MFF-5PE.
GNN-4PE GNN-5PE
Bảng 2.7: Kết quả dự báo ngoài mẫu theo cấu trúc mạng ANN truyền thẳng MFF-2PE, MFF-3PE, MFF-4PE, MFF-5PE
Mô hình MFF-2PE MFF-3PE MFF-4PE MFF-5PE
MSE 0,009396214 0,003751625 0,005980783 0,00241921
MAE 0,065259439 0,042116996 0,057105411 0,038226213
r 0,316865644 0,370211421 0,433968335 0,653517847
Qua những kết quả trên, cấu trúc mạng truyền thẳng một lớp ẩn có khả năng dự báo VNI tương đối tốt hơn so với cấu trúc mạng GRNN trên TTCK VN, đặc biệt là nếu xét đến chỉ báo tương quan tuyến tính giữa giá trị VNI dự báo với VNI thực tế đạt đến mức 65,35% trong trường hợp cấu trúc MFF-5PE, chỉ tiêu MSE = 0,0024 và MAE = 0,038 ở mức rất thấp.
Kết luận: Trong cấu trúc mạng ANN truyền thẳng một lớp ẩn với 5PE đã cho ra giá trị dự báo VNI tốt nhất, và tốt hơn cả cấu trúc mạng GRNN. Đồng thời, cấu trúc mạng ANN đƣợc thiết lập nhƣ mục 2.1 đã cho ra kết quả dự báo không tốt bằng cấu trúc mạng truyền thẳng một lớp ẩn với 5PE. Nói cách khác, cấu trúc mạng truyền thẳng sẽ thích hợp cho quá trình dự báo VNI. Tuy nhiên, vấn đề thứ tiếp theo là liệu rằng mô hình mạng ANN dự báo tốt hơn so với mô hình hồi quy tuyến tính? Phần tiếp theo, luận án sẽ đi vào chứng minh điều này.
2.2.3. So sánh khả năng dự báo giá chứng khoán của mô hình mạng thần kinh nhân ta ̣o với mô hình hồi quy tuyến tính
Sử dụng mô hình mạng ANN không có lớp ẩn và hàm truyền tuyến tính Trong phần này luận án sẽ tiến hành xây dựng mô hình tuyến tính (thể hiện mối quan hệ giữa các biến) để có cơ sở so sánh giữa hai loại mô hình với nhau. Về bản chất, mô hình tuyến tính là một trường hợp đặc biệt của mô hình mạng ANN khi hệ thống mạng này không tồn tại lớp ẩn nào. Hàm truyền là một hàm tuyến tính thể hiện mối quan hệ giữa các biến đầu vào với biến đầu ra. Với các dữ liệu đầu vào đã sử dụng ở bảng 2.2, luận án tiến hành xây dựng mô hình tuyến tính bằng cách sử dụng hàm truyền là hàm tuyến tính và không có lớp ẩn trong mô hình của mạng ANN. Mô hình chỉ có một biến đầu ra là VNI và các biến đầu vào đƣợc đề cập ở bảng 2.2. Kết quả của quá trình huấn luyện mô hình ANN này đƣợc thể hiện trong hình 2.6 và bảng 2.8.
Desired Output and Actual Network Output
-0.4 -0.2 0 0.2 0.4 0.6 0.8
1 2 3 4 5 6 7 8 9 10
Exemplar
Output VNI
VNI Output
Hình 2.6: VNI thực tế và dự báo của cấu trú c ma ̣ng ANN tuyến tính
Bảng 2.8: Kết quả kiểm định ngoài mẫu của cấu trúc ma ̣ng ANN tuyến tính
Performance VNI
MSE 0,056213737
NMSE 28,56491985
MAE 0,142268143
Min Abs Error 0,00979236
Max Abs Error 0,672613418
r -0,026795475
Tổng hợp kết quả của các mô hình cho phép chúng ta đi đến kết luận rằng, khi sử dụng các biến kinh tế vĩ mô để phân tích và dự báo giá chứng khoán trên TTCK VN, cụ thể là chỉ số VNI, thì mô hình phi tuyến thật sự tỏ ra hiệu quả hơn so với mô hình tuyến tính. Trước hết, so về chỉ tiêu MSE, giá trị của mô hình tuyến tính là 0,056, cao hơn hẳn so với trường hợp các mô hình mạng ANN phi tuyến khi chỉ tiêu này nằm trong khoảng từ 0,02 đến 0,09. Đặc biệt là nếu so với cấu trúc mạng MFF-5PE, thì chỉ tiêu MSE của mô hình tuyến tính đã cao hơn gấp đôi. Điều này đã cho thấy tập hợp các giá trị sai số trong dự báo và thực tế của mô hình tuyến tính lớn hơn nhiều so với mô hình mạng ANN nhất là mạng MFF-5PE.
Sự vượt trội của mô hình phi tuyến còn thể hiện rõ hơn khi ta xem xét chỉ tiêu tương quan giữa VNI thực tế và dự báo của mỗi mô hình. Chỉ tiêu này là -2,6% đối với mô hình tuyến tính, điều này có nghĩa là giá trị VNI được dự báo của mô hình dường như đi ngƣợc lại với giá trị VNI thực tế. Trong khi đó, chỉ tiêu này đạt đến mức 65,35% ở trường hợp MFF-5PE. Tuy chưa thật sự là cao nhưng cũng đã đủ để chứng tỏ tính hạn chế trong phân tích và dự báo của các mô hình tuyến tính.
Nếu nhƣ mạng MFF-5PE cho ra kết quả dự báo ngoài mẫu tốt nhất, giá trị dự báo của mạng và kết quả thực tế cho ra mối tương quan dương và tương quan khá cao, lên đến 65,35% trong khi đó giá trị tương quan này trong mô hình tuyến tính là giá trị âm. Nói cách khác, khi sử dụng mô hình tuyến tính để dự báo giá chứng khoán trên TTCK VN sẽ không thể giải thích sự biến động này khi dựa trên những dữ liệu kinh tế vĩ mô. Giá trị tương quan dự báo ngoài mẫu của mô hình tuyến tính đã cho thấy kết quả của chiều hướng dự báo và giá trị thực tế dịch chuyển ngược nhau. Như vậy phải chăng các biến kinh tế vĩ mô không thể tác động lên giá chứng khoán trên TTCK VN nếu dựa trên mô hình hồi quy tuyến tính?. Có thể nói rằng, nếu thay đổi mô hình thì mức độ biến động giá chứng khoán trên TTCK VN sẽ đƣợc giải thích bằng các biến kinh tế vĩ mô.
Sử dụng mô hình hồi quy tuyến tính truyền thống
Một phần của phụ lục 3 “Xây dựng mô hình hồi quy tuyến tính truyền thống để phân tích và dự báo VN-Index” đã cho ra kết quả của việc sử dụng phương pháp hồi quy tuyến tính trong việc dự báo VNI nhƣ sau:
- Thứ nhất: Nếu tuân thủ yêu cầu giả định của phương pháp hồi quy tuyến tính truyền thống thì các biến đƣa vào mô hình phải tuân theo quy luật phân phối chuẩn, các biến kinh tế vĩ mô khảo sát ở bảng 2.1 đƣợc đƣa vào mô hình không đạt đƣợc điều kiện này. Bảng 3 của phụ lục 3 đã minh chứng kết quả này. Tuy nhiên, kết quả này có thể chấp nhận đƣợc khi chúng ta giả định những quan sát được trong tương lai sẽ đủ để các biến số này tuân theo quy luật phân phối chuẩn. Phương pháp thống kê chấp nhận giả định này để xây dựng mô hình.
- Thứ hai: Trong phần xây dựng mô hình hồi quy tuyến tính truyền thống và kiểm định của phụ lục 3 đã cho ra kết quả:
1. Khi sử dụng hồi quy đơn biến để giải thích cho sự thay đổi trong VNI thì không có mô hình hồi quy đơn biến nào có ý nghĩa thống kê. Nói cách khác, không một biến kinh tế vĩ mô nào đƣa vào mô hình có thể giải thích cho sự thay đổi của VNI trong thời gian qua. Tuy nhiên, nếu chúng ta điều chỉnh dữ liệu mang tính độ trễ một kỳ thì biến cung tiền – M2 lại có thể giải thích cho sự thay đổi của VNI. Kết quả giải thích của biến M2 rất thấp, chỉ là 2,83%.
2. Khi sử dụng hồi quy đa biến thì mô hình không có ý nghĩa thống kê, nói cách khác, các hệ số hồi quy các nhân tố bằng không, không thể xây
dựng đƣợc mô hình hồi quy tuyến tính đa nhân tố từ các biến kinh tế vĩ mô để giải thích cho sự thay đổi của VNI. Tuy nhiên, ngay cả khi sử dụng các biến có độ trễ, phụ lục 3 cũng đã cho ra kết quả không thể xây dựng mô hình hồi quy tuyến tính dựa trên bộ dữ liệu các biến kinh tế vĩ mô đã điều chỉnh độ trễ.
Tóm lại, kết quả nghiên cứu này đã góp phần chứng minh đƣợc ƣu thế vƣợt trội của mô hình mạng ANN phi tuyến trong việc phân tích và dự báo giá chứng khoán trên TTCK VN so với mô hình tuyến tính truyền thống trong trường hợp sử dụng các biến số kinh tế vĩ mô làm nhập lƣợng đầu vào. Tuy nhiên, kết quả từ các mô hình mạng ANN còn có một số hạn chế trong mức độ dự báo. Điều này một phần là do số lƣợng quan sát được sử dụng để huấn luyện quá ít, trong tương lai, theo thời gian thì số lƣợng quan sát sẽ nhiều và quá trình huấn luyện mạng ANN tốt lên và khả năng dự báo càng chuẩn xác. Hoặc tính chất của các biến chƣa đủ để giải thích sự biến động của giá chứng khoán; hoặc thậm chí do sự thiếu vắng thông tin trên TTCK; hoặc tác động của yếu tố tâm lý, hành vi của nhà đầu tư tham gia trên thị trường chi phối đến các quyết định đầu tƣ của các nhà đầu tƣ trên TTCK VN thời gian qua?... Phần tiếp theo của luận án sẽ khảo sát các nhóm biến khác đƣợc đƣa vào mô hình mạng ANN và so sánh chúng với mô hình hồi quy tuyến tính.