QUAN ĐIỂM VÀ BẰNG CHỨNG THỰC NGHIỆM VIỆC ỨNG DỤNG MƠ HÌNH MẠNG THẦN KINH NHÂN TẠO TRONG
1.3. Một số mơ hình mạng thần kinh nhân tạo điển hình 1 Mơ hình mạng truyền thẳng (Feedforward Networks)
1.3.1. Mơ hình mạng truyền thẳng (Feedforward Networks)
Hình 1.4 minh họa cho cấu trúc của một ANN gồm một lớp ẩn với 2 neuron, 3 biến đầu vào {xi}, i = 1, 2, 3 và 1 biến đầu ra y.
Biến đầu vào x Các neuron lớp Biến đầu ra y ẩn n x1 n1 x2 y n2 x3 Hình 1.4: Mơ hình mạng truyền thẳng
Nguồn: Neural Networks in Finance gaining predictive edge in the market của Paul D. Mc Nelis
Từ hình trên ta có thể thấy được quá trính xử lý diễn ra đồng thời. Bên cạnh quy trình xử lý tuần tự như trong các hệ thống tuyến tính điển hình (thể hiện ở chỗ các biến đầu vào được sử dụng để dự báo các biến đầu ra bằng cách xác định trọng số cho mỗi neuron đầu vào), hai neuron ở lớp ẩn sẽ xử lý các biến đầu vào một cách đồng thời để từ đó có thể nâng cao hiệu quả dự báo. Các “khớp thần kinh” (synapse) sẽ nối giữa các biến đầu vào (còn gọi là neuron đầu vào – input neuron) với neuron của lớp ẩn, hoặc giữa neuron lớp ẩn với các biến đầu ra (neuron đầu ra – output neuron). Hầu hết vấn đề mà chúng ta cần xử lý trong q trình xây dựng ANN khơng liên quan nhiều đến vô số các neuron của quá trình song song này. Vì vậy, ta sẽ không đi sâu vào vấn đề này.
Mạng truyền thẳng với một lớp ẩn duy nhất là loại mơ hình ANN cơ bản, được sử dụng phổ biến nhất trong ứng dụng kinh tế, tài chính. Nhìn chung, mạng lưới này sẽ mô phỏng cách thức mà não người xử lý những dữ liệu kích thích được tiếp nhận ở neuron đầu vào và cho ra kết quả phản ứng ở neuron đầu ra. Tương tự sự phát triển của não, ngày càng có nhiều neuron sẽ được kết nối với nhau bởi các khớp thần kinh.
Kết quả là nhiều lớp ẩn hơn sẽ được hình thành, tín hiệu từ những neuron khác nhau sẽ hoạt động đồng thời và được kết nối bởi các khớp thần kinh để cho ra những phản ứng có nhiều sắc thái hơn.
Điều hiển nhiên là, với những dữ liệu kích thích đầu vào đơn giản, chẳng hạn như kinh nghiệm về nhiệt độ q nóng hoặc q lạnh, thì khơng cần phải được xử lý bởi q nhiều neuron ở nhiều lớp ẩn trước khi cho ra kết quả phản ứng lại. Tuy nhiên, khi dữ liệu kích thích đầu vào trở nên phức tạp hoặc đa dạng hơn, nhiều neuron hơn
ởcác lớp ẩn sẽ được kích hoạt và các phản ứng hoặc những quyết định được đưa ra sẽ là kết quả của q trình cân nhắc khi kết hợp các tín hiệu từ nhiều neuron của nhiều lớp ẩn khác nhau.
Loại ANN này được ứng dụng rộng rãi trong lĩnh vực “thần kinh – ngơn ngữ học” dùng để nhận dạng mẫu hình. Tuy nhiên, trong lĩnh vực kinh tế tài chính, sự kết hợp của các biến đầu vào với một loạt các neuron ở các lớp ẩn mang một ý nghĩa khác. Trong lĩnh vực này, các biến số ngầm như kỳ vọng… đóng một vai trị quan trọng trên thị trường nói riêng và nền kinh tế nói chung. Keynes đề cập đến chúng dưới góc độ là “hành vi bầy đàn” của nhà đầu tư tại các thời điểm “bùng – vỡ” của nền kinh tế mà ta thường bảo đó là lúc thị trường đang lạc quan hoặc bi quan. Tuy chúng ta có thể có được dữ liệu khảo sát về kỳ vọng của mọi người, nhưng các dữ liệu này thường có độ trễ. Hơn nữa, những gì được thể hiện trên các bảng khảo sát chưa chắc đã thật sự phản ánh được kỳ vọng của người trả lời.
Trong bối cảnh đó, sự tồn tại của các lớp ẩn với những quá trình xử lý một cách đan xen nhau đối với các dữ liệu quan sát đầu vào trở nên vơ cùng có ý nghĩa. Những giá trị trễ (lagged value) và giá trị hiện tại của lãi suất, tỷ giá, thay đổi trong GDP cùng với các loại thông tin khác sẽ tác động đến nền kinh tế bằng cách tác động đến những kỳ vọng chủ quan của người tham gia trên thị trường. Những kỳ vọng này lại chịu tác động của kinh nghiệm, trình độ, văn hóa… của riêng mỗi người. Tất cả những neuron này tác động qua lại với nhau hình thành nên kỳ vọng hoặc dự báo để rồi từ đó dẫn dắt hành động hoặc quyết định của mọi người trên thị trường. Cụ thể là mọi người sẽ có động thái tăng hoặc giảm giá, bán hoặc mua, hành động một cách lạc quan hoặc bi quan. Về cơ bản là những dự báo mà được hình thành từ quá trình tác động qua lại song song của các neuron thần kinh sẽ quyết định hành động của mỗi người trên thị trường.
Việc sử dụng mơ hình ANN để mơ phỏng q trình ra quyết định được dựa trên “nguyên lý về sự tách biệt các chức năng” mà Rustichini, Dickhaut, Ghirardato, Smith và Pardo (2002) đã định nghĩa rằng: “không phải tất cả chức năng của não bộ được thực hiện bởi toàn bộ não bộ” [Rustichini (2002), tr 3]. Một nguyên lý thứ hai
được gọi là “nguyên lý về sự hợp tác các chức năng” cho rằng: “mỗi khu vực của não được kích hoạt cho các chức năng khác nhau nhưng cũng có những khu vực giao nhau được sử dụng cho những chức năng khác nhau” [Rustichini (2002) tr 3].
Dựa trên dữ liệu thực nghiệm và mô phỏng não bộ, Rustichini, Dickhaut, Ghirardato, Smith và Pardo (2002) đã chứng minh rằng các chủ thể ra quyết định dựa trên việc đánh giá, ước lượng đặc biệt là trong trường hợp phải phản ứng lại trong một thời gian ngắn. Bên cạnh đó, các ơng cũng đã tranh luận cho sự tồn tại của việc chun mơn hóa trong q trình xử lý các số liệu gần đúng” [Rustichini (2002) tr 16].
Suy rộng ra, dưới góc độ của thống kê thì mơ hình ước lượng ANN là một “cỗ máy sàng lọc”. Trong trường hợp đơn biến, với biến đầu vào duy nhất là x, một hàm ước lượng bậc m, , dựa trên một chuỗi các không gian ước lượng không lồng vào nhau:
Beresteanu (2003) đã chỉ ra rằng mỗi một sự mở rộng hữu hạn, ; …; sẽ có thể sử dụng những tập hợp hàm khác nhau [Beresteanu (2003) tr 9]. Trong phần phụ lục “các dạng hàm phổ biến trong ANN” sẽ đề cập chi tiết các dạng hàm này.