CHƯƠNG III : KẾT QUẢ ĐÁNH GIÁ VÀ THỰC NGIỆM
3.1. Thực nghiệm
3.1.1. Chuẩn bị dữ liệu
Chương trình thực nghiệm sử dụng 5 bộ dữ liệu chuỗi thời gian được lấy từ địa chỉ https://datamarket.com/data/list/?q=provider:tsdl gồm:
- Passenger: số lượng hành khách của hãng hàng không quốc tế từ tháng 1/1949 đến tháng 12/1960.
- Temperature: nhiệt độ trung bình theo tháng ở Nottingham Castle từ 1920 đến 1939.
- Dow-Jones: chỉ số công nghiệp Dow-Jones từ 8/1968 đến 8/1981.
- Quebec: số lượng sinh hàng ngày ở Quebec từ 1/1/1977 đến 31/12/1978. - Abraham12: nhu cầu xăng dầu hàng tháng ở Ontario từ 1960 đến 1975.
Hình 3.17: Dữ liệu chuỗi thời gian.
3.1.2. Chuẩn hóa dữ liệu
Các chuỗi này được chuẩn hóa sử dụng kỹ thuật Min-Max để chuyển đổi các chuỗi thời gian về dạng số nằm trong khoảng [0,1]. Công thức như sau:
𝑁𝑖 = 𝑇𝑖 − 𝑚𝑖𝑛(𝑇)
𝑚𝑎𝑥(𝑇) − 𝑚𝑖𝑛(𝑇)
Trong đó:
Ti: giá trị chuỗi thời gian ở thời điểm thứ i.
Ni: giá trị chuỗi thời gian đã được chuẩn hóa ở thời điểm thứ i. max(T): giá trị lớn nhất trong chuỗi thời gian.
min(T): giá trị nhỏ nhất trong chuỗi thời gian.
Các file dữ liệu sau khi được chuẩn hóa được lưu dưới dạng file excel .csv: 3.1.3. Thông số cài đặt cho bài toán.
Bài toán được thiết lập với: - Kích thước quần thể N=50.
- Số thế hệ GEN=100.
- Tỉ lệ lai ghép pc=1/lengthchrom=1/16=0.06.
- Mỗi cá thể trong quần thể có 16 gen quy định số đầu vào, số nút ẩn, hệ số học LR (Learning factor) và seed cho mạng. Trong đó mỗi gen là một số thực nằm trong khoảng (0-9).
- Thuật toán dừng khi đã được 100 thế hệ.
3.2. Kết quả và đánh giá
3.2.1. Kết quả
Hình 3.3: Kết quả được lưu vào hai file khi chương trình kết thúc.
“File 1” lưu toàn bộ kết quả qua từng thế hệ sau khi kết thúc chương
trình.
Hình 3.4: File “File 1” chứa dữ liệu đã chuẩn hóa.
Hình 3.5: File “best_sofar_File1” chứa giá trị Fitness đã được chọn lọc.
Tất cả sẽ được lưu tại 1 thư mục: C:\Users\NghiaTran\Desktop\ BanDemoCT\ KQ\Có Shuffle.
Hình 3.6: Thư mục chứa kết quả đánh giá.
3.2.2. Đánh giá
Để đánh giá khả năng dự báo của mô hình trong 5 bộ dữ liệu chuỗi thời gian trên em lựa chọn thước đo MSE. Công thức như sau:
𝑀𝑆𝐸 = 1
ℎ ∑ 𝑒𝑡
2 𝑇+ℎ
Trong đó:
- et=yt-Ft trong đó yt là giá trị mong muốn và Ft là giá trị thực tế tính toán được.
- T là các giá trị đã biết.
- h là các giá trị chưa biết (cần dự báo).
Giá trị MSE càng nhỏ thì khả năng dự báo của mô hình càng tốt.
Đánh giá việc sử dụng Shuffle trong GA và DE:
Bảng 3.1: Bảng so sánh kết quả dự báo giữa GA và DE.
Chuỗi thời gian GA DE Passenger 0,29 × 10-2 0,27 × 10-2
Abraham12 0,16 × 10-2 0,40 × 10-2 Dow-jone 0,15 × 10-1 0,30 × 10-2
Quebec 0,13 × 10-1 0,99 × 10-2
Temperature 0,42 × 10-2 0,24 × 10-2
Kết quả cho thấy việc dùng phương pháp Shuffle trong giải thuật tiến hóa vi phân (DE) đem lại kết quả tốt hơn rất nhiều so với MSE trong GA. Kết quả dự báo của mô hình được so sánh với các phương pháp ADANN, UCM, Forecast Pro.
Được thể hiện trong bảng tổng hợp sau:
Bảng 3.2: Bảng so sánh kết quả dự báo giữa DE với các phương pháp khác.
Chuỗi thời gian DE ADANN UCM Forecast Pro Passenger 0,27 × 10-2 0,41×10-3 0,28×10-3 0,75×10-3 Abraham12 0,40 × 10-2 0,22×10-2 0,38×10-2 0,29×10-2 Dow-jone 0,30 × 10-2 0,12×10-1 0,12×10-1 0,12×10-1 Quebec 0,99 × 10-2 0,19×10-1 0,19×10-1 0,13×10-1 Temperature 0,24 × 10-2 0,29×10-2 0,24×10-2 0,25×10-2
Từ kết quả so sánh với các phương khác đã được đánh giá trước đây ta thấy việc dùng phương pháp shuffle trong giải thuật tiến hóa vi phân để dự báo chuỗi thời gian đem lại kết quả tốt hơn rất nhiều những phương pháp khác khi đánh giá về dự báo chuỗi thời gian.
KẾT LUẬN CHUNG
Qua quá trình thực hiện khóa luận tốt nghiệp “Ảnh hưởng của phương pháp
Shuffle đối với giải thuật tiến hóa vi phân ứng dụng trong dự báo chuỗi thời gian”
cùng với sự hướng dẫn của Cô giáo Vũ Thị Thu Minh, em đã đánh giá và đưa ra kết quả thành công cho quá trình dự báo chuỗi thời gian. Em cũng đã nắm bắt được các cơ sở lý thuyết, cài đặt các công cụ liên quan đến việc lập trình, hiểu được các yếu tố cơ bản về nội dung nghiên cứu một phương pháp mới đánh giá về dự báo chuỗi thời gian.
Khóa luận đã đạt được kết quả sau đây:
Xây dựng chương trình kiểm thử đánh giá kết quả dự báo.
Đánh giá và đưa ra kết quả ảnh hưởng của phương pháp Shuffle đối với giải thuật tiến hóa vi phân trong quá trình dự báo chuỗi thời gian.
So sánh việc sử dụng shuffle trong DE với những phương pháp đã đánh giá trước đây đem lại kết quả tốt hơn rất nhiều trong quá trình dự báo chuỗi thời gian.
Mặc dù em đã có nhiều cố gắng nhằm hoàn thành tốt nhất bản khóa luận của mình, song để nắm vững lý thuyết về mạng Neural, đòi hỏi sinh viên phải có một trình độ nhất định nào đó về kiến thức toán học. Như vậy về lý thuyết em trình bày chưa được sâu.
Trong tương lai đề tài sẽ có hướng mở để nghiên cứu nội dung từ một mục tiêu thành hai mục tiêu. Cuối cùng, một lần nữa, em xin chân thành cảm ơn các thầy, cô thuộc khoa Kỹ Thuật – Công Nghệ, trường Đại học Hùng Vương đã truyền đạt những kiến thức, nhờ đó em đã hoàn thành được khóa luận tốt nghiệp của mình.
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Thị Kim Loan (2009), Mô hình chuỗi thời gian mờ trong dự báo
chuỗi thời gian, Luận văn Thạc sĩ Công nghệ thông tin, Trường Đại học Thái Nguyên, Thái Nguyên.
[2]. Bùi Duy Quảng (2010), Tìm hiểu mạng neural và ứng dụng, Luận văn Thạc sĩCông nghệ thông tin, Trường Đại học Dân Lập Hải Phòng, Hải Phòng. [3]. Đinh Mạnh Tường (2002), Trí tuệ nhân tạo, Nxb Khoa học – kỹ thuật Hà Nội.
[4]. https://datamarket.com/data/list/?q=provider:tsdl, Xem 22/02/2017. [5]. Juan Peralta Donate, German Gutierrez Sanchez, Araceli Sanchis De Miguel (2012), ”Time series forecasting. A comparative study between an
evolving artificial neural networks system and statistical methods”.
[6]. Juan Peralta Donate, Xiaodong Li , Germa ´n Gutie ´rrez Sa ´nchez , Araceli Sanchis de Miguel (2011), “Time series forecasting by evolving artificial
neural networks with genetic algorithms, differential evolution and estimation of distribution algorithm”.
[7]. Peter J. Brockwell, Richard A. Davis (2001), “Introduction to Time
Series and Forecasting”, Springer.
[8]. Juan Peralta, Xiaodong Li, German Gutierrez, and A. Sanchis (2010). “Time series forecasting by evolving artificial neural networks using genetic
algorithms and differential evolution”, IJCNN.
[9]. S. Makridakis, S. Wheelwright, and R. Hyndman (2008), “Forecasting
Methods and Applications”, 3rd Edition, John Wiley & Sons, USA.
[10]. F. Gruau, Genetic Synthesis of Boolean Neural Networks with a Cell Rewriting Developmental Process(1992),“Proceedings of COGANN-92 International Workshop on Combinations of Genetic Algorithms and Neural Networks”, pp. 55–74, IEEE Computer Society Press.
[11]. S. Bengio, F. Fessant, and D. Collobert (1995), A connectionist system for medium term horizon time series prediction, “Workshop Application Neural
Networks to Telecoms”, pp. 308–315.
[12]. Imran Maqsood, Æ Muhammad, Muhammad Riaz Khan, Ajith Abraham, I. Maqsood, M. R. Khan, and A. Abraham (2007), An Ensemble of Neural Networks For Weather Forecasting, “Neural Computing &