Thiết kế một mô hình mạng thần kinh nhân tạo

Một phần của tài liệu Thạc sỹ mô hình dự báo thị trường chứng khoán việt nam tiensy (Trang 65 - 70)

QUAN ĐIỂM VÀ BẰNG CHỨNG THỰC NGHIỆM VIỆC ỨNG DỤNG MƠ HÌNH MẠNG THẦN KINH NHÂN TẠO TRONG

1.6. Thiết kế một mô hình mạng thần kinh nhân tạo

Khi một nhà kinh tế xây dựng một mơ hình hồi quy tuyến tính cho mục tiêu dự báo, một cơng việc quan trọng là xác định các biến số giải thích và số lượng các độ trễ nhằm giúp mơ hình có tính chính xác nhất. Điều này nói chung sẽ làm mất nhiều thời gian thực nghiệm với các đặc điểm kỹ thuật khác nhau. Một khi nhà nghiên cứu phát hiện một kỹ thuật nào mà tối thiểu hóa sai số dự báo, có nghĩa một phần quan trọng của cơng việc được hồn tất và nhà nghiên cứu sau đó có thể tập trung vào nổ lực kiểm tra chẩn đoán (diagnostic tests).

Khi xây dựng một mơ hình mạng ANN cũng vậy, nhiệm vụ tổng quát (overall task) là lâu nhất. Các mô hình mạng ANN sẽ khơng chỉ lựa chọn một bộ dữ liệu mà còn phải xác định các cấu trúc mơ hình (network architecture) đem lại dự báo chính xác nhất. Sự thay đổi trong cấu trúc mạng ANN có thể thay đổi hoàn toàn các dự báo được tạo ra từ mơ hình mạng ANN, thậm chí khi khơng có sự thay đổi nào trong các yếu tố đầu vào, đầu ra và kích thước mẫu (phần 1.3 của luận án đã trình bày một số cấu trúc mạng ANN thông dụng nhất và được sử dụng trong chương 2 của luận án). Để tìm ra cấu trúc mạng ANN tốt nhất, các nhà nghiên cứu phải thực hiện phương pháp thử và sai. Q trình này được tóm tắt trong hình 1.7.

Giống như bất kỳ kỹ thuật ước lượng phi tuyến nào, không bao giờ chắc chắn rằng tối thiểu hóa tồn cục (global minumum) có thể đạt được. Trong thực tế, điều này hàm ý rằng các kết quả của quy trình ước lượng là nhạy cảm với các giá trị ban đầu của các trọng số. Do đó, đối với một tập hợp các yếu tố đầu vào sẵn có và một cấu trúc mơ hình, quy trình ước lượng được mơ tả ở trên phải lặp lại hàng trăm hoặc thậm chí hàng nghìn lần sử dụng các giá trị ban đầu (starting value) khác nhau cho các trọng số. Các trọng số được ước lượng đem đến MSE thấp nhất trong dữ liệu xác nhận tính hiệu quả sẽ được xem như là kết quả tốt nhất có thể đối với một cấu trúc mạng ANN cụ thể và đối với một tập hợp các yếu tố đầu vào cụ thể được sử dụng trong mơ hình.

Để đánh giá thành quả của các cấu trúc mạng ANN khác nhau, nhà nghiên cứu phải chỉnh sửa cấu trúc của mơ hình mạng ANN bằng cách thay đổi số lượng các lớp ẩn hoặc bằng cách bổ sung hoặc loại bỏ các liên kết nhất định. Toàn bộ thủ tục dừng đúng lúc phải có được bởi hàng trăm lần trong cấu trúc mới, bằng cách thay đổi các giá trị ban đầu, với hy vọng tìm ra các tối thiểu hóa tồn cục. Sau đó dựa trên hai

thước đo MSE và RSquare để lựa chọn cấu trúc mạng thích hợp. Cấu trúc nào có MSE thấp nhất và RSquare lớn hơn sẽ được sử dụng2. Điều này sẽ tạo ra một mơ hình mạng ANN có sai số dự báo thấp nhất cho một tập hợp dữ liệu cụ thể và khả năng sử dụng mơ hình này để dự báo ngoài mẫu cho kết quả dự báo sát với kết quả đầu ra mong muốn. Mỗi lần nhà nghiên cứu muốn có một thí nghiệm với các tập hợp yếu tố đầu vào khác, bằng cách cộng thêm và loại bỏ một biến số, mơ hình mạng ANN phải được ước lượng lại theo các cấu trúc khác nhau, mỗi một cấu trúc yêu cầu hàng trăm hoặc hàng nghìn lần các giá trị ban đầu. Vì thế, các nhà nghiên cứu phải thực hiện ba mức độ tối thiểu hóa:

· Đối với một cấu trúc mơ hình nhất định, tìm ra các giá trị ban đầu mà tối thiếu hóa MSE trong tập hợp dữ liệu huấn luyện và xác nhận tính hiệu quả và R Square lớn nhất trong tập hợp dữ liệu kiểm tra ngồi mẫu;

· Tìm ra cấu trúc có MSE thấp nhất và RSquare lớn nhất;

· Tìm ra bộ dữ liệu đầu vào đưa đến một mơ hình mạng ANN chính xác nhất.

Tập hợp các biến giải thích

Lựa chọn cấu trúc

1 lớp ẩn 2 lớp ẩn …… N lớp ẩn

Ước lượng với Ước lượng với …… Ước lượng với Thêm hàng trăm các hàng trăm các hàng trăm các vào/ bỏ

bớt biến giá trị ban đầu giá trị ban đầu giá trị ban đầu

Xác định mạng Xác định mạng …… Xác định mạng tốt nhất cho cấu tốt nhất cho tốt nhất cho

trúc này cấu trúc này cấu trúc này

Hình 1.7: Thiết kế một mơ hình ANN

Khi thiết kế một mơ hình hồi quy tuyến tính, chỉ giai đoạn cuối cùng của việc tối thiểu hóa cần phải được thực hiện, nghĩa là, việc lựa chọn biến giải thích thích hợp nhất. Do đó, việc thiết kế một mơ hình mạng ANN làm tiêu tốn nhiều thời gian so với thiết kế một mơ hình tuyến tính. Thật may mắn, q trình này có thể được rút ngắn với một chương trình nhỏ. Trong phần 3, luận án xử lý dữ liệu cho mơ hình mạng ANN bằng phần mềm có bản quyền của Neural Solution phiên bản 5.0.

Tóm lại: Mơ hình ANN sẽ tự đưa ra các trọng số kết nối các neuron để từ đó trả ra

những kết quả đầu ra. Các kết quả này sẽ được đem so sánh với kết quả đầu ra thực tế trong quá khứ để so sánh sai số. Sau đó, sai số này sẽ được ANN ghi nhận (học tập) và phản hồi ngược trở lại nhằm thay đổi các trọng số theo hướng tối thiểu hóa các sai số này. Chính vì sự so sánh liên tục giữa kết quả trả ra từ ANN và kết quả thu thập trên thực tế mà dạng huấn luyện ANN kiểu này gọi là huấn luyện có giám sát (bằng kết quả thực tế). Ngược lại, tồn tại một dạng thức huấn luyện phức tạp hơn đối với ANN, trong đó nhà nghiên cứu xây dựng các thuật tốn và quy tắc suy nghĩ độc lập nhằm cho ANN khả năng khơng cần có sự tồn tại của các kết quả thực tế vẫn trả ra kết quả tối ưu. Dạng thức này gọi là huấn luyện không giám sát. ANN theo kiểu này được coi là một dạng Feedforward ANN với các quy tắc huấn luyện có giám sát. Thuật ngữ Feedforward đề cập đến hướng đi của dòng dữ liệu theo chiều từ lớp đầu vào đến lớp đầu ra.

Trong phần nghiên cứu của luận án tập trung sử dụng ANN theo kiểu Backpropagation – BP, là hệ thống ANN đa lớp (lớp đầu vào, lớp ẩn và lớp đầu ra) phổ biến nhất, ước tính được sử dụng trong 80% ứng dụng. ANN theo kiểu BP rất thông dụng trong dự báo chuỗi thời gian của lĩnh vực tài chính. Nhà nghiên cứu Hormik et al. chỉ ra rằng, hệ thống ANN theo kiểu BP chuẩn sử dụng hàm chuyển đổi có thể giả lập bất kỳ quan hệ nào trong kinh tế với độ tin cậy chấp nhận được, nếu có đủ số lượng các neuron ẩn được sử dụng. Nhà nghiên cứu HechtNielsen cũng cho rằng, hệ thống ANN theo kiểu BP với 3 lớp ẩn có thể giả lập hiệu quả gần như mọi quan hệ tuyến tính lẫn phi tuyến nào trong kinh tế. Bên cạnh ANN theo kiểu BP,

các kiểu ANN khác ít phổ biến hơn trong dự báo chuỗi thời gian có thể kể ra bao gồm hệ thống định kỳ (recurrent networks), hệ thống xác suất (probablistic networks) và hệ thống bóng mờ (fuzzy neural networks).

Phần tiếp theo luận án sẽ trình bày quá trình thiết kế và ứng dụng ANN trong dự báo giá chứng khoán trên TTCK VN. Việc thiết kế một cấu trúc mạng ANN bao gồm 8 bước được dựa trên các phác thảo bởi năm nhà nghiên cứu Deboeck, Masters, Blum và Nelson và Illingworth (bảng 1.1). Các bước thiết kế mơ hình thường khơng phải độc lập với nhau, người thiết kế được yêu cầu phải thường xuyên quay trở lại kiểm tra các bước đã thực hiện trước đó khi làm các tác vụ như lựa chọn các biến đầu vào, cũng như trong việc huấn luyện ANN.

Bảng 1.1: Tám bước khi thiết kế mơ hình phân tích và dự báo ANN

Bước 1: Lựa chọn biến số Bước 2: Thu thập dữ liệu Bước 3: Xử lý dữ liệu

Bước 4: Thiết lập dữ liệu dùng để huấn luyện, thử nghiệm, và kiểm tra ANN.

Bước 5: Xây dựng cấu trúc ANN Số lượng các lớp ẩn Số lượng các neuron ẩn Số lượng các neuron đầu ra Lựa chọn hàm truyền Bước 6: Các tiêu chuẩn đánh giá Bước 7: Huấn luyện ANN

Số vòng lặp trong 1 lần huấn luyện

Lựa chọn các hệ số Learning rate và Momentum Bước 8: Ứng dụng ANN vào thực tiễn

Chương 2

Một phần của tài liệu Thạc sỹ mô hình dự báo thị trường chứng khoán việt nam tiensy (Trang 65 - 70)

Tải bản đầy đủ (PDF)

(180 trang)