Khi một nhà kinh tế xây dựng một mô hình hồi quy tuyến tính cho mục tiêu dự báo, một công việc quan trọng là xác định các biến số giải thích và số lƣợng các độ trễ nhằm giúp mô hình có tính chính xác nhất. Điều này nói chung sẽ làm mất nhiều thời
gian thực nghiệm với các đặc điểm kỹ thuật khác nhau. Một khi nhà nghiên cứu phát hiện một kỹ thuật nào mà tối thiểu hóa sai số dự báo, có nghĩa một phần quan trọng của công việc đƣợc hoàn tất và nhà nghiên cứu sau đó có thể tập trung vào nổ lực kiểm tra chẩn đoán (diagnostic tests).
Khi xây dựng một mô hình mạng ANN cũng vậy, nhiệm vụ tổng quát (overall task) là lâu nhất. Các mô hình mạng ANN sẽ không chỉ lựa chọn một bộ dữ liệu mà còn phải xác định các cấu trúc mô hình (network architecture) đem lại dự báo chính xác nhất. Sự thay đổi trong cấu trúc mạng ANN có thể thay đổi hoàn toàn các dự báo đƣợc tạo ra từ mô hình mạng ANN, thậm chí khi không có sự thay đổi nào trong các yếu tố đầu vào, đầu ra và kích thước mẫu (phần 1.3 của luận án đã trình bày một số cấu trúc mạng ANN thông dụng nhất và được sử dụng trong chương 2 của luận án).
Để tìm ra cấu trúc mạng ANN tốt nhất, các nhà nghiên cứu phải thực hiện phương pháp thử và sai. Quá trình này đƣợc tóm tắt trong hình 1.7.
Giống nhƣ bất kỳ kỹ thuật ƣớc lƣợng phi tuyến nào, không bao giờ chắc chắn rằng tối thiểu hóa toàn cục (global minumum) có thể đạt đƣợc. Trong thực tế, điều này hàm ý rằng các kết quả của quy trình ƣớc lƣợng là nhạy cảm với các giá trị ban đầu của các trọng số. Do đó, đối với một tập hợp các yếu tố đầu vào sẵn có và một cấu trúc mô hình, quy trình ƣớc lƣợng đƣợc mô tả ở trên phải lặp lại hàng trăm hoặc thậm chí hàng nghìn lần sử dụng các giá trị ban đầu (starting value) khác nhau cho các trọng số. Các trọng số đƣợc ƣớc lƣợng đem đến MSE thấp nhất trong dữ liệu xác nhận tính hiệu quả sẽ đƣợc xem nhƣ là kết quả tốt nhất có thể đối với một cấu trúc mạng ANN cụ thể và đối với một tập hợp các yếu tố đầu vào cụ thể đƣợc sử dụng trong mô hình.
Để đánh giá thành quả của các cấu trúc mạng ANN khác nhau, nhà nghiên cứu phải chỉnh sửa cấu trúc của mô hình mạng ANN bằng cách thay đổi số lƣợng các lớp ẩn hoặc bằng cách bổ sung hoặc loại bỏ các liên kết nhất định. Toàn bộ thủ tục dừng đúng lúc phải có đƣợc bởi hàng trăm lần trong cấu trúc mới, bằng cách thay đổi các giá trị ban đầu, với hy vọng tìm ra các tối thiểu hóa toàn cục. Sau đó dƣ̣a trên h ai thước đo MSE và R-Square để lựa cho ̣n cấu trúc ma ̣ng thích hợp . Cấu trúc nào có MSE thấp nhất và R -Square lớn hơn sẽ đƣợc sử dụng2. Điều này sẽ tạo ra một mô hình mạng ANN có sai số dự báo thấp nhất cho một tập hợp dữ liệu cụ thể và khả năng sƣ̉ du ̣ng mô hình n ày để dự báo ngoài mẫu cho kết quả dự báo sát với kết quả đầu ra mong muốn. Mỗi lần nhà nghiên cứu muốn có một thí nghiệm với các tập hợp yếu tố đầu vào khác, bằng cách cộng thêm và loại bỏ một biến số, mô hình mạng ANN phải đƣợc ƣớc lƣợng lại theo các cấu trúc khác nhau, mỗi một cấu trúc yêu cầu
2 Nói cách khác, nhà nghiên cứu có thể có đƣợc một vài mô hình và tạo ra một dự báo bằng cách lấy trung bình các dự báo của các mô hình.
hàng trăm hoặc hàng nghìn lần các giá trị ban đầu. Vì thế, các nhà nghiên cứu phải thực hiện ba mức độ tối thiểu hóa:
Đối với một cấu trúc mô hình nhất định, tìm ra các giá trị ban đầu mà tối thiếu hóa MSE trong tập hợp dữ liệu huấn luyện và xác nhận tính hiệu quả và R- Square lớn nhất trong tâ ̣p hợp dƣ̃ liê ̣u kiểm tra ngoài mẫu;
Tìm ra cấu trúc có MSE thấp nhất và R-Square lớn nhất;
Tìm ra bộ dữ liệu đầu vào đƣa đến một mô hình mạng ANN chính xác nhất.
Hình 1.7: Thiết kế một mô hình ANN
Thêm vào/ bỏ bớt biến Tập hợp các biến giải thích
Lựa chọn cấu trúc
1 lớp ẩn 2 lớp ẩn …… N lớp ẩn
Ƣớc lƣợng với hàng trăm các giá trị ban đầu
Ƣớc lƣợng với hàng trăm các giá trị ban đầu
Ƣớc lƣợng với hàng trăm các giá trị ban đầu
……
Xác định mạng tốt nhất cho cấu
trúc này
Xác định mạng tốt nhất cho cấu trúc này
Xác định mạng tốt nhất cho cấu trúc này
……
Xác định mạng tốt nhất của tất cả cấu trúc
Khi thiết kế một mô hình hồi quy tuyến tính, chỉ giai đoạn cuối cùng của việc tối thiểu hóa cần phải đƣợc thực hiện, nghĩa là, việc lựa chọn biến giải thích thích hợp nhất. Do đó, việc thiết kế một mô hình mạng ANN làm tiêu tốn nhiều thời gian so với thiết kế một mô hình tuyến tính. Thật may mắn, quá trình này có thể đƣợc rút ngắn với một chương trình nhỏ. Trong phần 3, luận án xử lý dữ liệu cho mô hình mạng ANN bằng phần mềm có bản quyền của Neural Solution phiên bản 5.0.
Tóm lại: Mô hình ANN sẽ tự đƣa ra các trọng số kết nối các neuron để từ đó trả ra những kết quả đầu ra. Các kết quả này sẽ đƣợc đem so sánh với kết quả đầu ra thực tế trong quá khứ để so sánh sai số. Sau đó, sai số này sẽ đƣợc ANN ghi nhận (học tập) và phản hồi ngược trở lại nhằm thay đổi các trọng số theo hướng tối thiểu hóa các sai số này. Chính vì sự so sánh liên tục giữa kết quả trả ra từ ANN và kết quả thu thập trên thực tế mà dạng huấn luyện ANN kiểu này gọi là huấn luyện có giám sát (bằng kết quả thực tế). Ngƣợc lại, tồn tại một dạng thức huấn luyện phức tạp hơn đối với ANN, trong đó nhà nghiên cứu xây dựng các thuật toán và quy tắc suy nghĩ độc lập nhằm cho ANN khả năng không cần có sự tồn tại của các kết quả thực tế vẫn trả ra kết quả tối ƣu. Dạng thức này gọi là huấn luyện không giám sát. ANN theo kiểu này đƣợc coi là một dạng Feedforward ANN với các quy tắc huấn luyện có giám sát.
Thuật ngữ Feedforward đề cập đến hướng đi của dòng dữ liệu theo chiều từ lớp đầu vào đến lớp đầu ra.
Trong phần nghiên cứu củ a luận án tập trung sử dụng ANN theo kiểu Backpropagation – BP, là hệ thống ANN đa lớp (lớp đầu vào, lớp ẩn và lớp đầu ra) phổ biến nhất, ƣớc tính đƣợc sử dụng trong 80% ứng dụng. ANN theo kiểu BP rất thông dụng trong dự báo chuỗi thời gian của lĩnh vực tài chính. Nhà nghiên cứu Hormik et al. chỉ ra rằng, hệ thống ANN theo kiểu BP chuẩn sử dụng hàm chuyển đổi có thể giả lập bất kỳ quan hệ nào trong kinh tế với độ tin cậy chấp nhận đƣợc, nếu có đủ số lƣợng các neuron ẩn đƣợc sử dụng. Nhà nghiên cứu Hecht-Nielsen cũng cho rằng, hệ thống ANN theo kiểu BP với 3 lớp ẩn có thể giả lập hiệu quả gần nhƣ mọi quan hệ tuyến tính lẫn phi tuyến nào trong kinh tế. Bên cạnh ANN theo kiểu BP, các kiểu ANN khác ít phổ biến hơn trong dự báo chuỗi thời gian có thể kể ra bao gồm hệ thống định kỳ (recurrent networks), hệ thống xác suất (probablistic networks) và hệ thống bóng mờ (fuzzy neural networks).
Phần tiếp theo luận án sẽ trình bày quá trình thiết kế và ứng dụng ANN trong dự báo giá chứng khoán trên TTCK VN. Việc thiết kế mô ̣t cấu trúc ma ̣ng ANN bao gồm 8 bước được dựa trên các phác thảo bởi năm nhà nghiên cứu Deboeck, Masters, Blum và Nelson và Illingworth (bảng 1.1). Các bước thiết kế mô hình thường không phải độc lập với nhau, người thiết kế được yêu cầu phải thường xuyên quay trở lại kiểm
tra các bước đã thực hiện trước đó khi làm các tác vụ như lựa chọn các biến đầu vào, cũng nhƣ trong việc huấn luyện ANN.
Bảng 1.1: Tám bước khi thiết kế mô hình phân tích và dự báo ANN Bước 1: Lựa chọn biến số
Bước 2: Thu thập dữ liệu Bước 3: Xử lý dữ liệu
Bước 4: Thiết lập dữ liệu dùng để huấn luyện, thử nghiệm, và kiểm tra ANN.
Bước 5: Xây dựng cấu trúc ANN Số lƣợng các lớp ẩn Số lƣợng các neuron ẩn Số lƣợng các neuron đầu ra Lựa chọn hàm truyền Bước 6: Các tiêu chuẩn đánh giá
Bước 7: Huấn luyện ANN
Số vòng lặp trong 1 lần huấn luyện
Lựa chọn các hệ số Learning rate và Momentum Bước 8: Ứng dụng ANN vào thực tiễn
Chương 2