Tổng quan FFNN

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình kết hợp arima và mạng nơron cho bài toán dự báo (Trang 29 - 31)

7. Bố cục luận văn

2.3. Tổng quan FFNN

Một mạng truyền thẳng là một mạng lƣới thần kinh nhân tạo trong đó các kết nối giữa các nút làm không tạo chu kỳ. Nhƣ vậy, nó khác với hậu duệ của nó: mạng lƣới thần kinh tái phát. Mạng thần kinh feedforward là loại mạng thần kinh nhân tạo đầu tiên và đơn giản nhất đƣợc phát minh. Trong mạng này, thông tin chỉ di chuyển theo một hƣớng, chuyển tiếp, từ các nút đầu vào, thông qua các nút ẩn (nếu có) và đến các nút đầu ra. Không có chu kỳ hoặc vòng lặp trong mạng.

Trong những năm gần đây, nhiều nghiên cứu đã áp dụng các mô hình mạng nơron nhân tạo trong dự báo chuỗi thời gian và đạt đƣợc một số kết quả nhất định. Bogdan Oancea đã cài đặt mô hình mạng nơron với hai kiến trúc mạng là FFNN (Feedforward Neural Network) và RNN (Recurrent Neural Network) cho việc dự báo chuỗi thời gian. Tác giả chạy thực nghiệm trên tập dữ liệu tỷ giá hối đoái giữa đồng EUR/RON và USD/RON. Đầu tiên, tác giả chuẩn hóa dữ liệu bằng công thức logarit tự nhiên để nâng cao độ chính xác dự báo. Sau đó, mô hình FFNN đƣợc xây dựng với 20 nơron ở lớp đầu vào (input layer), 40 nơron ở lớp ẩn (hidden layer) và 1 nơron ở lớp đầu ra (output layer) là giá trị dự báo cho thời gian tiếp theo t +1. Tác giả chia tập dữ liệu với 80% cho huấn luyện (training) và 20% cho thử nghiệm (testing). Kế tiếp, mạng RNN đƣợc cài đặt với 20 nơron ở lớp đầu vào, 10 nơron trong lớp ẩn hồi quy và 1 nơron ở lớp đầu ra. Sau khi thực nghiệm, tác giả khẳng định mô hình RNN cho kết quả dự báo tốt hơn FFNN trên tập dữ liệu tỷ giá hối đoái.

Hình 2.4. Mạng nơron truyền thẳng nhiều lớp FFNN

M. Raeesi sử dụng mạng nơron FFNN để dự báo dữ liệu giao thông ở thành phố Monroe, bang Louisiana, Hoa Kỳ. Nghiên cứu này đề xuất một mạng nơron sử dụng dữ liệu giao thông của ngày hôm nay, ngày hôm qua, tuần trƣớc, hai tuần trƣớc, ba tuần trƣớc và một tháng trƣớc để làm đầu vào cho dự báo lƣu lƣợng giao thông của ngày mai. Kết quả thực nghiệm cho thấy mô hình mạng nơron đã xây dựng có thể đƣợc sử dụng cho dự báo giao thông tại thành phố Monroe. Tuy nhiên, một vài trƣờng hợp có kết quả dự báo với sai số lớn do những yếu tố bất thƣờng tác động nhƣ tai nạn, thời tiết xấu,… Kumar Abhishek cũng sử dụng mạng nơron FFNN với giải thuật lan truyền ngƣợc (back-propagation) trong dự báo chứng khoán trên tập dữ liệu của tập đoàn Microsoft từ 1/1/2011 đến 31/12/2011 gồm 2 lớp đơn giản trong mạng (10 nơron lớp đầu vào, 1 nơron lớp đầu ra), độ chính xác dự báo lên đến 99%.

giá trị ở những điểm thời gian trƣớc điểm thời gian dự báo. Mối liên hệ giữa giá trị đầu ra (yt) và các giá trị đầu vào (yt-1, yt-2, …, yt-p) đƣợc mô hình bởi phƣơng trình :

yt = + ( + ) + (2-7)

trong đó, (j=0, 1, 2, …, q) và (i=0, 1, 2, …, p, j=1, 2, …, q) là các tham số của mô hình, p là số nơron lớp đầu vào và q là số nơron lớp ẩn, là sai số. Hàm kích hoạt đƣợc sử dụng trong các nơron lớp ẩn nhƣ hàm sigmoid:

g(x)= (2-8)

Do đó, mô hình mạng nơron FFNN trong dự báo chuỗi thời gian là một mô hình phi tuyến mô tả mối quan hệ giữa các giá trị trong quá khứ (yt-1, yt- 2, …, yt-p) và giá trị tƣơng lai (yt):

yt = f(yt-1, yt-2, …, yt-p, w) + (2-9)

với w là một vector chứa tất cả các tham số của mô hình FFNN, f là một hàm số đƣợc xác định bởi cấu trúc mạng và các tham số.

Việc chọn số nơron đầu vào p và số nơron của lớp ẩn q phụ thuộc vào tập dữ liệu huấn luyện. Mỗi tập dữ liệu chuỗi thời gian khi huấn luyện với mô hình mạng nơron sẽ có p, q khác nhau. Chọn p, q để tìm đƣợc mô hình dự báo chuỗi thời gian tốt nhất phải qua thực nghiệm và so sánh giữa các mô hình.

Nhƣ vậy việc đầu tiên là cần xác định các biến đầu vào và các biến đầu ra cho mô hình, số lƣợng biến đầu vào đƣợc xác định dựa trên thực nghiệm để tìm ra giá trị phù hợp. Việc kế tiếp là xác định số lớp ẩn vầ số nơron trong từng lớp ẩn và chạy huấn luyện dữ liệu trên 1 lớp ẩn chạy lần lƣợt đến node thứ 5, cuối cùng ta đƣợc những kết quả thử nghiệm. Qua chƣơng 3 ta sẽ thấy rõ hơn về điều đó.

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình kết hợp arima và mạng nơron cho bài toán dự báo (Trang 29 - 31)

Tải bản đầy đủ (PDF)

(81 trang)