Dự báo chuỗi thời gian bằng mô hình lai ghép feedforward neural nextork và k nearest neighbors

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHĨA LUẬN TỐT NGHIỆP NGÀNH CÔNG NGHỆ THÔNG TIN DỰ BÁO CHUỖI THỜI GIAN BẰNG MƠ HÌNH LAI GHÉP FEEDFORWARD NEURAL NETWORK VÀ K-NEAREST NEIGHBORS GVHD: TS NGUYỄN THÀNH SƠN SVTH: LÝ QUỐC DŨNG BÙI THỊ NGÂN TUYỀN SKL010856 Tp Hồ Chí Minh, tháng 7/2023 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH KHOA CƠNG NGHỆ THƠNG TIN BỘ MÔN KỸ THUẬT DỮ LIỆU LÝ QUỐC DŨNG - 19133015 BÙI THỊ NGÂN TUYỀN - 19133066 Đề Tài: DỰ BÁO CHUỖI THỜI GIAN BẰNG MƠ HÌNH LAI GHÉP FEEDFORWARD NEURAL NETWORK VÀ K-NEAREST NEIGHBORS LUẬN VĂN TỐT NGHIỆP GIÁO VIÊN HƯỚNG DẪN TS NGUYỄN THÀNH SƠN KHÓA 2019 – 2023 TP Hồ Chí Minh, tháng 07 năm 2023 ĐH SƯ PHẠM KỸ THUẬT TP.HCM KHOA CÔNG NGHỆ THÔNG TIN ****** CỘNG HÒA XHCN VIỆT NAM Độc lập – Tự – Hạnh phúc ****** PHIẾU NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN Họ tên Sinh viên 1: Lý Quốc Dũng MSSV 1: 19133015 Họ tên Sinh viên 2: Bùi Thị Ngân Tuyền MSSV 2: 19133066 Chuyên ngành: Kỹ thuật liệu Tên đề tài: Dự báo chuỗi thời gian mơ hình lai ghép FFNN KNN Họ tên giảng viên hướng dẫn: TS Nguyễn Thành Sơn NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: Ưu điểm: Khuyết điểm: Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: TP Hồ Chí Minh, tháng 07 năm 2023 Giảng viên hướng dẫn (Ký & ghi rõ họ tên) ĐH SƯ PHẠM KỸ THUẬT TP.HCM KHOA CƠNG NGHỆ THƠNG TIN ****** CỘNG HỊA XHCN VIỆT NAM Độc lập – Tự – Hạnh phúc ****** PHIẾU NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN Họ tên Sinh viên 1: Lý Quốc Dũng MSSV 1: 19133015 Họ tên Sinh viên 2: Bùi Thị Ngân Tuyền MSSV 2: 19133066 Chuyên ngành: Kỹ thuật liệu Tên đề tài: Dự báo chuỗi thời gian mơ hình lai ghép FFNN KNN Họ tên giảng viên phản biện: ThS Lê Thị Minh Châu NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: Ưu điểm: Khuyết điểm: Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: TP Hồ Chí Minh, tháng 07 năm 2023 Giảng viên phản biện (Ký & ghi rõ họ tên) LỜI CẢM ƠN Lời nhóm xin phép gửi lời cảm ơn sâu sắc đến với Khoa Công Nghệ Thông Tin – Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh tạo điều kiện cho nhóm chúng em học tập, phát triển tảng kiến thức thực đề tài Bên cạnh nhóm chúng em xin gửi đến thầy Nguyễn Thành Sơn lời cảm ơn chân thành nhất, nhóm chúng em biết ơn thầy nhận lời hướng dẫn giúp đỡ nhóm chúng em suốt q trình thực luận văn tốt nghiệp Trong trình thực thầy tận tâm bảo, cho nhóm lời khuyên hữu ích từ lúc bắt đầu kết thúc đề tài Với kinh nghiệm chuyên môn cao với kinh nghiệm thực tế thầy cô Khoa Công Nghệ Thông Tin đặc biệt thầy Nguyễn Thành Sơn giúp chúng em tiếp thu thêm kiến thức mới, kinh nghiệm chuyên ngành để thực luận văn tốt nghiệp cho cơng việc sau Chúng em thật biết ơn mà thầy bảo, hành trang, động lực cho chúng em bước môi trường Tuy nhiên với khả mình, chúng em khó có thể tiếp thu hết nguồn kiến thức vô tận, với khả chun mơn cịn hạn chế nên khó tránh khỏi xảy thiếu sót trình thực đồ án Chúng em hi vọng nhận thơng cảm góp ý q thầy cơ, nhờ góp ý chúng em có thể học kinh nghiệm quý báu để hoàn thành nâng cấp luận văn tốt Sau tất cả, chúng em xin gửi lời cảm ơn sâu sắc đến với thầy Nguyễn Thành Sơn quý thầy, cô Khoa Công Nghệ Thông Tin – Trường Đại Học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh tất điều thầy cô gửi gắm dạy chúng em Nhóm xin kính chúc thầy ln có sức khỏe thật tốt ln thành công sống Trường ĐH Sư Phạm Kỹ Thuật TP.HCM Khoa: Công nghệ thông tin ĐỀ CƯƠNG LUẬN VĂN TỐT NGHIỆP Họ tên sinh viên thực 1: Lý Quốc Dũng Mã số sinh viên: 19133015 Họ tên sinh viên thực 2: Bùi Thị Ngân Tuyền Mã số sinh viên: 19133066 Thời gian làm luận văn: Từ ngày 01/02/2023 đến ngày 13/05/2023 Chuyên ngành: Kỹ thuật liệu Tên đề tài: Dự báo chuỗi thời gian mơ hình lai ghép FFNN KNN Giáo viên hướng dẫn: TS Nguyễn Thành Sơn Nhiệm vụ luận văn: Lý thuyết: ● Nghiên cứu tối ưu mô hình KNN cho tốn dự báo chuỗi thời gian ● Nghiên cứu tối ưu hóa mơ hình FFNN cho toán dự báo chuỗi thời gian ● Nghiên cứu cải tiến kết hợp hai mơ hình lai ghép FFNN KNN cho toán dự báo chuỗi thời gian Thực hành: ● Sử dụng python để phục vụ cho đề tài dự báo chuỗi thời gian mơ hình lai ghép FFNN KNN ● Tiền xử lý liệu: o MinMaxScaler: lớp dùng để chuẩn hóa liệu khoảng giá trị cụ thể o Thay giá trị Nan, Null, Empty, Outlier ● Sử dụng thư viện cho mơ hình KNN: o sklearn.neighbors.KNeighborsRegressor: thư viện KNN sklearn o dtw.dtw: thư viện Dynamic Time Warping (DTW) python dùng để tính khoảng cách hai chuỗi thời gian DTW sử dụng rộng rãi phân tích chuỗi thời gian tốn liên quan đến phát hiện, phân loại, tìm kiếm so khớp chuỗi thời gian ● Sử dụng thư viện cho mơ hình FFNN: o keras.models.Sequential keras.layers.Dense: sử dụng để tạo mơ hình mạng nơ-ron o keras.callbacks.EarlyStopping: lớp sử dụng để dừng huấn luyện mơ hình khác biệt giá trị mát tập huấn luyện tập xác thực không cải thiện sau số lần lặp o sklearn.model_selection.GridSearchCV: lớp sử dụng để tìm kiếm lưới tham số tốt cho mơ hình o keras.wrappers.scikit_learn.KerasRegressor: lớp sử dụng để tạo mơ hình mạng nơ-ron sử dụng cho huấn luyện mạng nơ-ron dựa Scikit-Learn KẾ HOẠCH THỰC HIỆN STT Thời gian Công việc 01/02/202308/02/2023 Nghiên cứu tìm hiểu mơ hình k-nearest neighbors, Feed Forward Neural Network, Viết đề cương đề tài 08/02/202315/02/2023 Thiết kế mơ hình k-nearest neighbors tiến hành dự đốn tìm tham số 15/02/202322/02/2023 Thiết kế Feed Forward Neural Network tiến hành dự đoán tìm tham số tốt 22/02/202308/03/2023 Tìm hiểu, nghiên cứu xây dựng mơ hình lai ghép hai mơ hình k-nearest neighbors, Feed Forward Neural Network 8/02/202320/03/2023 Tìm hiểu, nghiên cứu xây dựng mơ hình lai ghép song song hai mơ hình k-nearest neighbors, Feed Forward Neural Network 20/03/202315/04/2023 Thực nhiều tập liệu khác 16/04/202306/05/2023 Điều chỉnh đánh giá kết mơ hình lai ghép 06/05/202313/05/2023 Hoàn thành luận văn Ghi Ngày 13 tháng 05 năm 2023 Người viết đề cương Lý Quốc Dũng Ý kiến giáo viên hướng dẫn Bùi Thị Ngân Tuyền (ký ghi rõ họ tên) MỤC LỤC LỜI CẢM ƠN ĐỀ CƯƠNG LUẬN VĂN TỐT NGHIỆP KẾ HOẠCH THỰC HIỆN MỤC LỤC .9 DANH SÁCH HÌNH .13 DANH SÁCH BẢNG 16 DANH SÁCH TỪ VIẾT TẮT .17 PHẦN MỞ ĐẦU 18 TÍNH CẤP THIẾT CỦA ĐỀ TÀI .18 MỤC TIÊU ĐỀ TÀI 18 PHƯƠNG PHÁP THỰC HIỆN 18 PHẠM VI THỰC HIỆN 18 PHẦN NỘI DUNG 19 CHƯƠNG 1: PHẦN NỘI DUNG TỔNG QUAN CHUỖI THỜI GIAN VÀ DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN 19 1.1 CHUỖI THỜI GIAN .19 1.1.1 Khái niệm .19 1.1.2 Đặc điểm chuỗi thời gian 20 1.2 ĐỘ ĐO TRONG BÀI TOÁN DỰ BÁO CHUỖI THỜI GIAN 23 1.2.1 Đọ đo Euclidean 23 1.2.2 Độ đo Dynamic Time Warping .24 1.2.3 Tầm quan trọng dự báo chuỗi thời gian .25 1.3 BÀI TOÁN DỰ BÁO CHUỖI THỜI GIAN 26 1.3.1 Tiền xử lý liệu 26 1.3.2 Xây dựng mơ hình 27 1.3.3 Đánh giá mơ hình 27 1.3.4 Dự đoán 29 1.3.5 Đánh giá kết 29 1.4 NGHIÊN CỨU THỰC HIỆN TRAINING VÀ TESTING CHO MƠ HÌNH 30 1.4.1 Q trình training 30 1.4.2 Quá trình testing 30 1.5 PHÂN BIỆT OVERFITTING VÀ UNDERFITTING 30 1.5.1 Overfitting 30 1.5.2 Underfitting 31 1.5.3 Cách khắc phục Overfitting Underfitting 32 1.6 CÁC MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN 32 1.6.1 Phương pháp học sâu .33 1.6.2 Phương pháp tuyến tính 35 1.6.3 Phương pháp phi tuyến tính 38 CHƯƠNG 2: ỨNG DỤNG MƠ HÌNH KNN VÀ FFNN VÀO BÀI TỐN DỰ BÁO CHUỖI THỜI GIAN .40 2.1 FEED FORWARD NEURAL NETWORK (FFNN) 40 2.1.1 Định nghĩa 40 2.1.2 Nguyên lý hoạt động 41 2.2 K-NEAREST NEIGHBORS (KNN) .42 2.2.1 Mơ hình KNN 42 2.2.2 Hoạt động .43 2.2.3 Ứng dụng mơ hình KNN .44 10 Hình 5.7 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi số neural lớp ẩn tập MDLY Hình 5.8 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi số neural lớp ẩn tập GDDY Từ Bảng 5.7 tìm lỗi dự báo tập tập liệu nhỏ số neural lớp ẩn tập liệu AVAL, AGLE, MDLY GDDY 14, 13, 17, 12 neural củng cố nhận định thông qua Hình 5.5, Hình 5.6 , Hình 5.7, Hình 5.8 thể xu hướng lỗi tập liệu AVAL, AGLE, MDLY GDDY đạt giá trị nhỏ số lượng neural lớp ẩn 14, 13, 17, 12 neural 5.5.1.4 Thực nghiệm tìm số lượng lớp ẩn tốt mơ hình FFNN: Trong thực nghiệm này, tập liệu mẫu chọn chiều dài chuỗi mẫu 7, tham số (batch size, epoch, trọng số, số neural lớp ẩn) tìm trình thực nghiệm (thực nghiệm 5.5.1.3) chọn tham số tốt nhất, với tham 75 số đầu vào tốt tìm nhờ trình thực nghiệm(thực nghiệm 5.5.1.3) với số lượng lớp ẩn thay đổi liên tục tăng dần từ để tìm số lượng lớp ẩn tốt cách đánh giá độ lỗi (MSE) xem xét xu hướng độ lỗi Bảng 5.10 trình bày số lượng lớp ẩn với tham số đầu vào tốt thực nghiệm tập liệu AVAL, AGLE, MDLY GDDY, thực nghiệm tập liệu đạt độ lỗi nhỏ số lượng lớp ẩn Bảng 5.8 Mô tả Số lượng lớp ẩn với tham số tốt Hidden Layer AVAL AGLE MDLY GDDY Neural Hidden 14.0 13.0 17.0 12.0 Batch Time Epochs Size Train 8.0 200.0 29.054 8.0 200.0 25.36 8.0 300.0 58.732 8.0 300.0 43.009 Với Bảng 5.8 tìm số lượng lớp ẩn tốt khiến cho tập liệu đạt độ lỗi nhỏ nhất, để củng cố nhận định này, thực nghiệm tiếp tục xem xét tổng để đánh giá xu hướng lỗi tập lieju AVAL, AGLE, MDLY, GDDY hình 5.9, 5.10, 5.11, 5.12 Hình 5.9 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi số lượng lớp ẩn tập AVAL 76 Hình 5.10 Biểu đồ mơ tả xu hướng lỗi dự báo thay đổi số lượng lớp ẩn tập AGLE Hình 5.11 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi số lượng lớp ẩn tập MDLY Hình 5.12 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi số lượng lớp ẩn tập GDDY 77 Từ Bảng 5.8 tìm số lượng lớp ẩn tập AVAL, AGLE, MDLY, GDDY đạt giá trị MSE nhỏ số lượng lớp ẩn củng cố lại nhận định qua Hình 5.9, 5.10, 5.11, 5.12 thể xu hướng lỗi giá trị lỗi dự báo tập liệu AVAL, AGLE, MDLY, GDDY đạt nhỏ số lượng lớp ẩn 5.5.2 Mơ hình KNN 5.5.2.1 Thực nghiệm tìm K tốt nhất: Trong thực nghiệm này, tập liệu mẫu chọn chiều dài chuỗi mẫu thực nghiệm đánh giá dựa độ đo DTW (Dynamic time warping) độ đo eculidean, số K thay đổi liên tục tăng dần từ để tìm giá trị k tốt cách đánh giá độ lỗi (MSE), so sánh độ đo xem xét xu hướng độ lỗi Bảng 5.15 trình bày giá trị k tốt tập liệu AVAL, AGLE, MDLY, GDDY đạt giá trị lỗi MSE nhỏ theo độ đo Bảng 5.9 Trình bày giá trị k tốt theo độ đo AVAL AGLE MDLY GDDY Độ Đo Euclidean DTW Euclidean DTW Euclidean DTW Euclidean DTW K 11 14 11 13 MSE 0.0002474 0.0002473 0.001547 0.001559 0.000433 0.000379 0.001706 0.001978 Time 6.545 96.883 5.592 76.132 13.944 185.468 10.7999 156.18 Với Bảng 5.9 tìm giá trị K tốt khiến cho tập liệu đạt độ lỗi nhất, để củng cố lại nhận định thực nghiệm tiếp tục xem xét tổng quát để đánh giá xu hướng lỗi tập liệu Hình 5.13, 5.14, 5.15, 5.16 Tại hình 5.13 tập liệu AVAL dựa độ đo Euclidean DTW thể xu hướng lỗi MSE theo k tăng dần từ đạt giá trị MSE nhỏ vị trí k 11 độ đo Euclidean k 14 độ đo DTW 78 Hình 5.13 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi K tập liệu AVAL Tại hình 5.14 tập liệu AGLE dựa độ đo Euclidean DTW thể xu hướng lỗi MSE theo k tăng dần từ đạt giá trị MSE nhỏ vị trí k độ đo Euclidean k 11 độ đo DTW 79 Hình 5.14 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi K tập liệu AGLE Tại hình 5.15 tập liệu MDLY dựa độ đo Euclidean DTW thể xu hướng lỗi MSE theo k tăng dần từ đạt giá trị MSE nhỏ vị trí k độ đo Euclidean k độ đo DTW 80 Hình 5.15 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi K tập liệu MDLY Tại hình 5.16 tập liệu GDDY dựa độ đo Euclidean DTW thể xu hướng lỗi MSE theo k tăng dần từ đạt giá trị MSE nhỏ vị trí k độ đo Euclidean k 13 độ đo DTW 81 Hình 5.16 Biểu đồ mô tả xu hướng lỗi dự báo thay đổi K tập liệu GDDY Từ Bảng 5.9 chứng tỏ lỗi dự báo liệu AGLE, GDDY có giá trị MSE nhỏ với k 5, dựa độ đo Euclidean, tập liệu AVAL, MDLY có giá trị MSE nhỏ với k 14, dựa độ đo DTW củng cố nhận định thơng qua hình 5.13, 5.14, 5.15, 5.16 thể tập liệu vị trí k đạt MSE nhỏ bảng 5.9 k đạt MSE nhỏ dựa xu hướng lỗi 82 5.5.3 So sánh mơ hình Trong thực nghiệm tổng hợp lại kết trường hợp thực nghiệm để xem xét đánh giá việc dự đốn mơ hình lai ghép có tốt so với việc dự đốn mơ hình đơn, bảng 5.10, 5.11, 5.12, 5.13 trình bày tiêu chí đánh giá mơ hình dựa tham số đầu vào tốt tập liệu AVAL, AGLE, MDLY, GDDY Tại bảng 5.10, dựa tiêu chí đánh giá tập liệu AVAL mơ hình KNN độ đo DTW có thời gian thực thi lâu so với độ đo Euclidean độ đo DTW mang đến kết dự đoán tốt so với độ đo Euclidean Tại thực nghiệm mơ hình lai ghép song song mơ hình lai ghép cộng sử dụng độ đo DTW với tham số đầu vào tốt tìm thực nghiệm mơ hình KNN mơ hình FFNN, kết thực nghiệm hai mơ hình lai ghép cho thấy mơ hình lai ghép song song cho kết tốt so với mơ hình lai ghép Tổng qt thực nghiệm mơ hình tập liệu AVAL, ta thấy mơ hình lai ghép song song cho kết tốt nhất, với tổng thời gian thực 76.21 giây Bảng 5.10 Trình bày kết thực nghiệm thực tập liệu AVAL KNN Euclidean DTW FFNN Song song Tuần tự MSE RMSE MAE 0.000248 0.000247 0.000184 0.00000000000 001 0.01573 0.01572 0.0136 0.000000 0.0121 0.0122 0.0105 0.0000000 0.000387 0.0197 0.0171 Time (s) Train Test 0.0348 6.55 0.0351 96.9 0.0301 29.05 0.35 0.000000 49.0 26.91 44.2 0.0495 11.85 MAPE Tại Bảng 5.11, dựa tiêu chí đánh giá tập liệu AGLE mơ hình KNN độ đo Euclidean mang đến kết dự đoán tốt với thời gian thực thi ngắn so với độ đo DTW Tại thực nghiệm mô hình lai ghép song song mơ hình lai ghép cộng sử dụng độ đo Euclidean với tham số đầu vào tốt tìm thực nghiệm mơ hình KNN mơ hình FFNN, kết thực nghiệm hai mơ hình lai ghép cho thấy mơ hình lai ghép song song cho kết tốt so với mơ hình lai ghép Tổng qt thực nghiệm mơ hình tập liệu AGLE, 83 ta thấy mơ hình lai ghép song song cho kết tốt nhất, với tổng thời gian thực 29.87 giây Bảng 5.11 Trình bày kết thực nghiệm thực tập liệu AGLE Euclidean DTW FFNN KNN Song song Tuần tự MSE RMSE MAE MAPE 0.00155 0.00156 0.001 0.0000000000 003 0.005 0.00155 0.03948 0.03153 0.000000 0.067738 0.0291 0.0289 0.02293 0.0000000 0.04933 0.0733 0.0736 0.0643 0.00000 02 0.13396 Time (s) Train Test 5.6 76.1 25.4 0.1 25.77 3.99 8.995 3.95 Tại bảng 5.12, dựa tiêu chí đánh giá tập liệu MDLY mơ hình KNN độ đo DTW có thời gian thực thi lâu so với độ đo Euclidean độ đo DTW mang đến kết dự đoán tốt so với độ đo Euclidean Tại thực nghiệm mơ hình lai ghép song song mơ hình lai ghép cộng sử dụng độ đo DTW với tham số đầu vào tốt tìm thực nghiệm mơ hình KNN mơ hình FFNN, kết thực nghiệm hai mơ hình lai ghép cho thấy mơ hình lai ghép song song cho kết tốt so với mơ hình lai ghép Tổng qt thực nghiệm mơ hình tập liệu MDLY, ta thấy mơ hình lai ghép song song cho kết tốt nhất, với tổng thời gian thực 196.21 giây Bảng 5.12 Trình bày kết thực nghiệm thực tập liệu MDLY Euclidean MSE RMSE MAE 0.00043 0.0208 0.0113 0.00038 0.0195 0.01098 0.000054 0.0073 0.00464 KNN DTW FFNN Song song Tuần tự 0.000000000 0.000000 0000003 02 0.00115 0.0339 MAPE 211337564 7460.3 186494019 9063.8 423807078 551.8 Time (s) Train Test 13.9 185.5 58.7 0.2 0.000000 008 64435.8 58.2 137.82 0.0155 364674463 4375.8 16.2 147.93 Tại Bảng 5.13, dựa tiêu chí đánh giá tập liệu GDDY mơ hình KNN độ đo Euclidean mang đến kết dự đoán tốt với thời gian thực thi ngắn so với độ đo DTW Tại thực nghiệm mơ hình lai ghép song song mơ hình lai ghép cộng sử dụng độ đo Euclidean với tham số đầu vào 84 tốt tìm thực nghiệm mơ hình KNN mơ hình FFNN, kết thực nghiệm hai mơ hình lai ghép cho thấy mơ hình lai ghép song song cho kết tốt so với mơ hình lai ghép Tổng qt thực nghiệm mơ hình tập liệu GDDY, ta thấy mơ hình lai ghép song song cho kết tốt nhất, với tổng thời gian thực 11.691 giây Bảng 5.13 Trình bày kết thực nghiệm thực tập liệu GDDY KNN Euclidean DTW FFNN Song song Tuần tự MSE RMSE 0.0017 0.00198 0.0009 0.000000000 0009 0.0039 0.0017 0.0445 0.0296 0.000000 0.063 MAE MAPE 0.0262 0.0389 0.026 0.03994 0.018 0.0264 0.00000011 0.00000 015 0.0365 0.056 Time (s) Train Test 10.8 156.19 43.01 0.125 5.265 6.275 10.81 7.998 Tại Bảng 5.10, 5.11, 5.12, 5.13 chứng tỏ mơ hình KNN tùy vào tập liệu có độ đo phù hợp khác để tính độ tương đồng chuỗi, độ đo DTW ln có thời gian cao so với độ đo Euclidean độ đo DTW thực tính khoảng cách từ điểm chuỗi mẫu đến tất điểm chuỗi xét để tìm khoảng cách nhỏ So sánh hai mơ hình FFNN KNN mơ hình FFNN thể khả dự báo xác so với mơ hình KNN, mơ hình FFNN có q trình train, giúp mơ hình ln ln tự cập nhật trọng số với tham số đầu vào tốt để cho kết dự đoán xác nhất, cịn mơ hình KNN q trình thực thi xét độ tương đồng chuỗi mẫu với chuỗi khứ lấy ngày sau chuỗi tương đồng, có chiều dài tương ứng với chiều dài chuỗi dự đốn tính trung bình cộng ngày sau chuỗi tương đồng So sánh mơ hình lai ghép với mơ hình đơn, mơ hình lai ghép song song tập liệu thể khả vượt trội q trình dự đốn, mơ hình song song cải thiện khả dự báo so với mơ hình đơn, cịn mơ hình lại khơng cải thiện khả dự báo so với hai mơ hình đơn 85 PHẦN KẾT LUẬN Đề tài mang lại nhiều kiến thức quan trọng giúp nhóm tiếp thu nhiều kiến thức lĩnh vực dự đoán chuỗi thời gian có thể áp dụng rộng rãi kiến thức với mơ hình, tốn khác • Hiểu rõ cách xây dựng mơ hình FFNN, KNN, mơ hình lai ghép song song FFNN KNN, mơ hình lai ghép FFNN KNN • Học phương pháp tìm trọng số tốt để áp dụng vào mơ hình • Học hỏi cách debug để tìm lỗi giải lỗi xảy trình phát triển đề tài Sau trình tìm hiểu kiến thức liên quan đến đề tài, tiếp thu nhận xét giáo viên hướng dẫn nhóm xây dựng được: ● Các mơ hình dự đốn chuỗi thời gian FFNN, KNN, lai ghép song song FFNN với KNN, lai ghép FFNN với KNN cho độ xác cao ● Giao diện cho người dùng truyền tham số, thực train, test cho kết so sánh dự đoán thực tế Nhờ hướng dẫn tận tình thầy Nguyễn Thành Sơn nhóm học nhiều kiến thức áp dụng vào đề tài này, nhằm mang lại hiệu sau: • Đề tài sử dụng nhiều mơ hình khác để tìm phương pháp thích hợp hiệu việc dự báo chuỗi thời gian • Đề tài sử dụng nhiều độ đo, nhiều tham số đầu vào giúp thống kê tìm trọng số tối ưu • Đề tài sử dụng nhiều tiêu chí đánh giá khác nhau: thời gian thực thi, độ xác mơ hình (MAE, MSE, RMSE, MAPE) Khó khăn: Trong q trình thực đề tài, thời gian kinh nghiệm nhóm cịn hạn chế nên gặp khơng khó khăn việc triển khai đề tài • Cấu hình máy cịn yếu nên chưa đánh giá mơ hình tập liệu có kích thước lớn với hình dạng chuỗi khác 86 • Thời gian cịn hạn chế nên chưa đánh giá ảnh hưởng kích thước cửa sổ đầu vào, kích thước cửa sổ dự đốn mơ hình • Thời gian cịn hạn chế nên chưa hồn thiện app với tính filter, hiệu ứng, để tăng trải nghiệm người dùng Hướng phát triển: Do khó khăn khách quan thời gian, kinh nghiệm nhóm q trình thực đề tài này, nhóm đề hướng phát triển cho đề tài sau: ● Thực nghiệm nhiều liệu với kích thước liệu lớn hình dạng chuỗi thời gian khác để có độ tin cậy cao mơ hình lai ghép ● Đánh giá ảnh hưởng kích thước cửa sổ mẫu kích thước cửa sổ dự đốn mơ hình ● Cải thiện app với chức phát triển tiện ích (thống kê có filter, hiệu ứng, …) để tăng trải nghiệm hiệu suất cho người dùng 87 DANH SÁCH TÀI LIỆU THAM KHẢO [1] Oleh Onyshchak (April 2020), Stock market dataset, Kaggle.com [2] P G Zhang, Time series forecasting using a hybrid ARIMA and neural network model, Neurocomputing 50 (2003) 159–175 [3] Nguyen Thanh Son (2018), ‘Hybridising neural network and pattern matching under dynamic time series prediction’, Int.J.Business Intelligence and Data Mining, Vol.17, No.1, 2020.Pp54-75 (Scopus Journal, RG Journal Impact: 0.67) [4] Jason Brownlee (2020), Introduction to Time Series Forecasting with Python, All Rights Reserved [5] Roya Asadi and Sameem Abdul Kareem (2014), Review of Feed Forward Neural Network classification preprocessung techniques, Department of Artificial Intelligence, Faculty of Computer Science and Information Technology, University of Malaya,50603, Malaysia [6] Jason Brownlee on December 5, 2016 Time Series Forecasting as Supervised Learning in Time Series [7] Michael Steinbach and Pang-Ning Tan (2009), The top Ten Algorithmsin Data Mining, Chapter 8: kNN: k-Nearest Neighbors., by taylor & Francis Froup, LLC [8] Ivan Svetunkov 2023 Forecasting and Analytics with ADAM Arne Niklas Jansson [9] KE-LIN DU and M N S SWAMY (April 28, 2013), Neural networks and Statistical Learning, Chapter 11: Recurrent Neural Network, Enjoyor Labs, Enjoyor Inc., China, Concordia University, Canada [10] Ralf C Staudemeyer, Erics Rothstein Morris, Understanding LSTM, A tutorial into Long ShortTerm Memory, Recurrent Neural Networks, Echamlkaden University, Singapore University, September 23, 2019 [11] Nguyễn Thành Sơn (6/2014- 10/2015) Dự báo liệu chuỗi thời gian có tính xu hướng mùa sử dụng giải thuật k lân cận gần nhất, Cơng trình nghiên cứu khoa học cấp trường, Trường Đại học Sư Phạm Kỹ Thuật Hồ Chí Minh [12] Damodar Gujarati Chapter 13 (2011), Econometrics by example, Bloomsbury [13] RomainTavenard (Sakoe & Chiba, 1978), An introduction to Dynamic Time Warping, [14] Vaibhav Verbhan (October 2020), Supervised Learning with Python: Concepts and Practical Implementation Using Python, Apress [15] Fabio Manganiello (February 2021), Computer Vision with Maker Tech: Detecting People With a Raspberry Pi, a Themal Camera, and Meaching Learning, Apress [16] Xue Ying (2019),An Overview of Overfitting and its Solutions ,Journal of Physics: Conference Series 88 S K L 0