3 Trong khoa học về ứng dụng ANN, một tập hợp gồm toàn bộ các mẫu dữ liệu được gọi bằng thuật ngữ Epoch Mỗi mẫu trong bộ dữ liệu được gọi bằng tên Exemplar.
2.3.1. Mơ hình mạng ANN tuyến tính
Về bản chất, mơ hình tuyến tính cũng chính là mơ hình mạng ANN đơn giản nhất. Nó là hệ thống mạng ANN khơng có lớp ẩn trung gian. Hàm truyền được sử dụng là hàm tuyến tính thể hiện cho mối quan hệ giữa các biến.
Trước khi đi vào xây dựng mơ hình, với tập hợp dữ liệu thu thập được, chia dữ liệu thành 3 tập nhỏ bao gồm: tập dữ liệu được dùng để huấn luyện, tập dữ liệu dùng để xác nhận và tập dữ liệu để kiểm tra lại. Có nhiều phương pháp khác nhau có thể được sử dụng để lựa chọn các phần tử cho ba tập hợp này: tiến hành lựa chọn ngẫu nhiên hoặc lựa chọn tuần tự (Iebeling và Milton, 1996). Tuy nhiên, trong phần này luận án sẽ lựa chọn theo phương án thứ hai. Và tỷ lệ của ba tập hợp này sẽ lần lượt là 60%, 15% và 25%. Đây là tỷ lệ được lựa chọn sau q trình thử nghiệm với các mơ hình có tỷ lệ phân chia ba tập hợp này khác nhau. Quá trình lựa chọn số lượng quan sát cho mỗi tập hợp cần thiết phải cân nhắc sự đánh đổi giữa khả năng khái qt hóa của mơ hình với số lượng quan sát đủ để tiến hành quá trình huấn luyện nhằm xác định
các trọng số phù hợp. Thực tế các nghiên cứu đều cho rằng khơng có một câu trả lời chung cho tất cả mọi trường hợp. Chỉ có thực tế quá trình “thử và sai” để rút ra một tỷ lệ “phù hợp” cho mỗi tập dữ liệu khác nhau.
Sau khi xác định được ba tập dữ liệu cần thiết, q trình chạy mơ hình ANN khơng có lớp ẩn và sử dụng hàm truyền là hàm tuyến tính có kết quả MSE là khá thấp chỉ là 0,0014, tương quan giữa kết quả dự báo và giá trị thực tế lên đến 87%. Hình 2.7 thể hiện kết quả dự báo và giá trị thực tế của VNI từ mơ hình này.
Desired Output and Actual Network Output
Output 0 .1 0.05 0 1 2 3 4 5 6 7 8 9 10 11 VNI -0.05 VNI Output -0 .1 -0.15 -0 .2 Exemplar
Hình 2.7: VNI dự báo và thực tế từ cấu trúc ANN tuyến tính của tập kiểm tra lại
Như vậy khả năng dự báo của các tỷ số tài chính đối với sự thay đổi của chỉ số VNI là rất lớn. Bên cạnh đó, với kết quả kiểm định ngồi mẫu: giá trị MSE giữa tỷ suất sinh lợi thực tế với tỷ suất sinh lợi dự báo từ mơ hình ở mức rất thấp: 0,00143, một tiêu chuẩn khác MAE là 0,0348. Và quan trọng là chỉ tiêu tương quan giữa giá trị dự báo và giá trị thực tế đạt đến mức khoảng 87%. Đây là mức tương quan khá cao. Kết quả này một mặt cho thấy khả năng dự báo của các tỷ số tài chính đối với tỷ suất sinh lợi của VNI. Mặt khác, nó cho thấy các thơng số được xác lập ban đầu cho mơ hình là phù hợp. Các thơng số đó bao gồm tỷ lệ số quan sát cho các tập huấn luyện, kiểm tra và thuật toán được sử dụng để xác định tập trọng số “tốt nhất” của mơ hình – trong trường hợp này là thuật toán LevenbergMarquardt. Đây là phương pháp để tiến hành điều chỉnh các trọng số trong quá trình huấn luyện nhằm đạt đến mục tiêu tối thiểu hóa giá trị MSE. Thuật tốn này là một trong những cơng cụ được sử dụng nhiều nhất đối với các bài tốn tối ưu hóa phi tuyến. Đây được xem là sự kết hợp giữa phương pháp GaussNewton với Gradient thông thường (Manolis, 2005).