Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 131 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
131
Dung lượng
4,01 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH ĐỒ ÁN TỐT NGHIỆP NGÀNH CƠNG NGHỆ THƠNG TIN TÌM HIỂU MƠ HÌNH HỒI QUY VÀ ỨNG DỤNG TRONG DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN GVHD: NGUYỄN THÀNH SƠN SVTH: NGUYỄN XUÂN NGUYÊN MSSV: 16110539 SVTH: TRẦN THỊ NHỰT MSSV: 16110410 SKL007092 Tp Hồ Chí Minh, năm 2020 an TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN Nguyễn Xuân Nguyên - 16110539 Trần Thị Nhựt - 16110410 Đề Tài: TÌM HIỂU MƠ HÌNH HỒI QUY VÀ ỨNG DỤNG TRONG DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN KHÓA LUẬN TỐT NGHIỆP KỸ SƯ CNTT GIÁO VIÊN HƯỚNG DẪN TS NGUYỄN THÀNH SƠN KHÓA 2016 - 2020 an ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập – Tự – Hạnh phúc ******* ******* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ tên sinh viên 1: Nguyễn Xuân Nguyên MSSV 1: 16110539 Họ tên sinh viên 2: Trần Thị Nhựt MSSV 2: 16110410 Ngành: Công nghệ thông tin Tên đề tài: Tìm hiểu mơ hình hồi quy ứng dụng dự báo liệu chuỗi thời gian Họ tên Giáo viên hướng dẫn: TS Nguyễn Thành Sơn NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Ưu điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Khuyết điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: Tp Hồ Chí Minh, ngày tháng năm 2020 Giáo viên hướng dẫn (Ký an ghi rõ họ tên) ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT Độc lập – Tự – Hạnh phúc ******* ******* PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ tên sinh viên 1: Nguyễn Xuân Nguyên MSSV 1: 16110539 Họ tên sinh viên 2: Trần Thị Nhựt MSSV 2: 16110410 Ngành: Công nghệ thông tin Tên đề tài: Tìm hiểu mơ hình hồi quy ứng dụng dự báo liệu chuỗi thời gian Họ tên Giáo viên phản biện: NHẬN XÉT Về nội dung đề tài khối lượng thực hiện: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Ưu điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Khuyết điểm: ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: Tp Hồ Chí Minh, ngày tháng Giáo viên phản biện (Ký an ghi rõ họ tên) năm 2020 LỜI CẢM ƠN Trong suốt trình học tập, nghiên cứu đề tài “Tìm hiểu mơ hình hồi quy ứng dụng dự báo liệu chuỗi thời gian”, chúng em nhận giúp đỡ, bảo nhiệt tình thầy, cô giáo Khoa Công nghệ thông tin - Trường Đại học Sư Phạm Kỹ Thuật thành phố Hồ Chí Minh Với tình cảm chân thành, chúng em xin bày tỏ lòng biết ơn đối thầy giáo, cô giáo tham gia quản lý, giảng dạy giúp đỡ chúng em suốt trình học tập, nghiên cứu Chúng em xin bày tỏ biết ơn đặc biệt đến TS Nguyễn Thành Sơn - người trực tiếp hướng dẫn, giúp đỡ chúng em hoàn thành tốt luận văn Trong trình học tập khóa luận chun ngành Hệ thống thơng tin, chúng em nhận quan tâm, giúp đỡ, hướng dẫn tận tình, tâm huyết thầy Thầy giúp đỡ em tích lũy thêm nhiều kiến thức để có nhìn hồn thiện cho đề tài Do chưa có nhiều kinh nghiệm làm để tài hạn chế kiến thức, luận văn chắn khơng tránh khỏi thiếu sót Rất mong nhận nhận xét, ý kiến đóng góp, phê bình từ phía Thầy(cơ) để khóa luận chúng em hoàn thiện Chúng em xin chân thành cảm ơn an ĐỀ CƯƠNG LUẬN VĂN TỐT NGHIỆP Họ Tên SV thực 1: Nguyễn Xuân Nguyên Mã số SV: 16110539 Họ Tên SV thực 2: Trần Thị Nhựt Mã số SV: 16110410 Thời gian làm luận văn: từ: 30/03/2020 Đến: 30/07/2020 Chuyên ngành: Hệ thống thơng tin Tên luận văn: Tìm hiểu mơ hình hồi quy ứng dụng dự báo liệu chuỗi thời gian GV hướng dẫn: TS Nguyễn Thành Sơn Nhiệm Vụ Của Luận Văn: Hiểu tầm quan trọng Machine Learning Tìm hiểu mơ hình hồi quy Tìm hiểu mơ hình ANN Tìm hiểu mơ hình kết hợp hồi quy ANN Cài đặt mơ hình Thực nghiệp so sánh mơ hình nhiều tập liệu Đề cương luận văn: Phần 1: MỞ ĐẦU 1.1 Tính cấp thiết đề tài 1.2 Mục đích đề tài 1.3 Cách tiếp cận phương pháp nghiên cứu 1.4 Kết đạt Phần 2: NỘI DUNG Chương 1: Tổng quan ứng dụng 1.1 Machine learning gì? 1.2 Forecasting gì? 1.3 Machine learing ứng dụng vào việc gì? 1.4 Các bước để tiến hành dự báo 1.5 Dữ liệu phương pháp dùng dự báo an Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES 2.1 Các mơ típ xuất 2.2 Các cách thể liệu dạng time series Chương 3: CÁC CƠNG CỤ SỬ DỤNG CHO VIỆC DỰ ĐỐN 3.1 Các phương pháp dự đoán đơn giản 3.2 Chuyển đổi điều chỉnh (Transformation and adjustment) 3.3 Biến đổi (Transformation) Chương 4: MƠ HÌNH HỒI QUY 4.1 Hồi quy đơn 4.2 Hồi quy bội 4.3 Mơ hình hồi quy theo thời gian Chương 5: MƠ HÌNH MẠNG NEURON NHÂN TẠO (ANN) 5.1 Lịch sử phát triển neuron nhân tạo 5.2 Neuron sinh vật 5.3 Mạng neuron nhân tạo Chương 6: MƠ HÌNH KẾT HỢP HỒI QUY VÀ MẠNG NEURON NHÂN TẠO 6.1 Giới thiệu mơ hình 6.2 Tính sai số tồn phương trung bình (MSE) trọng số ( ) CHƯƠNG 7: ĐÁNH GIÁ BẰNG THỰC NGHIỆM 7.1 Môi trường thực nghiệm 7.2 Các tập liệu dùng thực nghiệm 7.3 Các trường hợp thực nghiệm 7.4 Kết thực nghiệm Phần 3: KẾT LUẬN 3.1 Kết đạt an 3.2 Đóng góp đề tài 3.3 Hạn chế 3.4 Hướng phát triển an MỤC LỤC Phần 1: MỞ ĐẦU 1.1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 1.2 MỤC ĐÍCH CỦA ĐỀ TÀI 1.3 CÁCH TIẾP CẬN VÀ PHƯƠNG PHÁP NGHIÊN CỨU 1.3.1 Đối tượng nghiên cứu 1.3.2 Phạm vi nghiên cứu 1.4 KẾT QUẢ ĐẠT ĐƯỢC Phần 2: NỘI DUNG .3 Chương 1: TỔNG QUAN VÀ ỨNG DỤNG 1.1 MACHINE LEARNING LÀ GÌ? .3 1.2 FORECASTING LÀ GÌ? 1.3 MACHINE LEARING ĐƯỢC ỨNG DỤNG VÀO NHỮNG VIỆC GÌ? 1.4 CÁC BƯỚC CƠ BẢN ĐỂ TIẾN HÀNH TRONG MỘT DỰ BÁO 1.5 DỮ LIỆU VÀ PHƯƠNG PHÁP DÙNG TRONG DỰ BÁO Chương 2: CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES .6 2.1 CÁC MƠ TÍP CĨ THỂ XUẤT HIỆN 2.2 CÁC CÁCH THỂ HIỆN DỮ LIỆU DƯỚI DẠNG TIME SERIES Chương 3: CÁC CÔNG CỤ SỬ DỤNG CHO VIỆC DỰ ĐOÁN 10 3.1 CÁC PHƯƠNG PHÁP DỰ ĐOÁN ĐƠN GIẢN 10 3.2 CHUYỂN ĐỔI VÀ ĐIỀU CHỈNH (Transformation and Adjustment) 12 an 3.3 BIẾN ĐỔI (Transformation) 13 Chương 4: MƠ HÌNH HỒI QUY 16 4.1 HỒI QUY ĐƠN 16 4.2 HỒI QUY BỘI 35 4.3 MÔ HÌNH HỒI QUY THEO THỜI GIAN 51 Chương 5: MƠ HÌNH MẠNG NEURON NHÂN TẠO (ANN) .64 5.1 LỊCH SỬ PHÁT TRIỂN CỦA NEURON NHÂN TẠO .64 5.2 NEURON SINH VẬT 65 5.3 MẠNG NEURON NHÂN TẠO 66 Chương 6: MƠ HÌNH KẾT HỢP HỒI QUY VÀ MẠNG NEURON NHÂN TẠO 89 6.1 GIỚI THIỆU MƠ HÌNH 89 6.2 TÍNH SAI SỐ TỒN PHƯƠNG TRUNG BÌNH (MSE) trọng số ( ) 90 CHƯƠNG 7: ĐÁNH GIÁ BẰNG THỰC NGHIỆM 91 7.1 MÔI TRƯỜNG THỰC NGHIỆM 91 7.2 CÁC TẬP DỮ LIỆU DÙNG TRONG THỰC NGHIỆM .91 7.3 CÁC TRƯỜNG HỢP THỰC NGHIỆM 100 7.4 KẾT QUẢ THỰC NGHIỆM 101 Phần 3: KẾT LUẬN 112 3.1 KẾT QUẢ ĐẠT ĐƯỢC 112 3.2 ĐÓNG GÓP CỦA ĐỀ TÀI 112 3.3 HẠN CHẾ 112 3.4 HƯỚNG PHÁT TRIỂN 112 DANH MỤC TÀI LIỆU THAM KHẢO 113 KẾ HOẠCH THỰC HIỆN LUẬN VĂN 114 an Epoch=30 8.41 s 2.67 3.31 9.88 Epoch=40 12.33 s 2.89 3.53 10.53 Epoch=50 11.48 s 2.58 3.28 9.79 Epoch=60 13.68 s 2.76 3.36 10.02 Epoch=70 17.05 s 3.34 4.18 12.47 Epoch=80 18.96 s 2.94 3.61 10.77 Epoch=90 18.76 s 2.45 3.15 9.4 Epoch=100 21.81 s 2.13 2.74 8.18 Qua kết bảng 18 ta thấy giá trị epoch lớn thời gian thực thi lớn sai số MAE nhỏ Ta chọn epoch =100 để chạy thực nghiệm mơ hình kết hợp Chạy thực nghiệm mơ hình kết hợp với k=6 epoch =100 Bảng 19 Giá trị sai số tập liệu Air Quality cho mơ hình thực nghiệm MAE RMSE Regression ANN Hybrid Regression 3.52 2.13 2.57 4.38 CV(RMSE) ANN Hybrid Regression ANN Hybrid 2.74 8.18 3.2 13.07 9.54 Bảng 20 Thời gian thực thi tập liệu Air Quality cho mơ hình thực nghiệm Mơ hình Thời gian thực thi Regression ANN Hybrid 1.83 s 21.81 s 21.95 s Nhận xét: Qua kết từ việc chạy thực nghiệm tập liệu cho mơ hình tệp liệu Air quality data set chạy cho kết tốt mơ hình mạng neuron nhân tạo Nhưng lại tiêu tốn thời gian nhiều gấp 12 lần so với mơ hình hồi quy Mơ hình kết hợp cho 103 an giá trị gần giống mơ hình mạng neuron nhân tạo, điều cho thấy mơ hình mạng neuron nhân tạo chiếm ưu mơ hình hồi quy mơ hình kết hợp 7.4.2 Thực nghiệm với tập liệu Jena_climate_2009_2016 Input bao gồm cột: Date Time(DD/MM/YYYY HH:MM:SS ), p (mbar), Tpot (K), Tdew (degC), rh (%), VPmax (mbar), VPact (mbar), VPdef (mbar), sh (g/kg), H2OC (mmol/mol), rho (g/m**3), wv (m/s), max wv (m/s),wd (deg) Output bao gồm cột: T (degC) Bảng 21 kết chạy thực nghiệm tập liệu Jena_climate_2009_2016 sử dụng mơ hình ANN với số neuron lớp ẩn từ k=1, 2, … , 10, epoch=10 Bảng 21 Giá trị thực nghiệm tệp liệu Jena_climate_2009_2016 mơ hình ANN với k thay đổi Thời gian thực MAE RMSE CV(RMSE) thi k=1 175.71 s 0.25 1.62 0.14 k=2 273.85 s 0.35 1.4 0.12 k=3 267.89 s 1.73 95.98 8.49 k=4 292.32 s 0.5 29.75 2.63 k=5 290.55 s 0.15 2.48 0.22 k=6 292.62 s 1.25 75.51 6.68 k=7 291.71 s 0.33 0.84 0.07 k=8 286.48 s 0.85 3.38 0.3 k=9 284.58 s 0.69 31.02 2.74 k=10 299.01 s 0.85 21.49 1.9 104 an Theo kết chạy thực nghiệm với mơ hình ANN, ta thấy với k=5 giá trị MAE=0.15 thời gian thực thi 290.55 kết tốt giá trị k =1, 2, ,10 Bảng 22 kết chạy thực nghiệm tập liệu Air quality sử dụng mơ hình ANN với số neuron lớp ẩn k=5, epoch=10, 20, …, 100 Bảng 22 Giá trị chạy thực nghiệm tệp liệu Jena_climate_2009_2016 mô hình ANN với epoch thay đổi Thời gian thực MAE RMSE CV(RMSE) thi Epoch=10 290.55 s 0.15 2.48 0.22 Epoch=20 231.07 s 0.41 20.63 1.83 Epoch=30 399.02 s 1.23 66.12 5.85 Epoch=40 459.02 s 0.2 11.29 Epoch=50 531.09 s 0.46 24.26 2.15 Epoch=60 567.89 s 1.28 80.04 7.08 Epoch=70 664.11 s 0.78 43.94 3.89 Epoch=80 1162.89 s 0.33 16.89 1.5 Epoch=90 1657.24 s 0.47 30.6 2.71 Epoch=100 1013.89s 1.71 104.09 9.21 Qua kết bảng 22 ta thấy giá trị epoch lớn thời gian thực thi lớn sai số MAE thay đổi liên tục Tuy nhiên với epoch =10 giá trị MAE=0.15 nhỏ Nên ta chọn epoch =10 để chạy thực nghiệm mơ hình kết hợp Chạy thực nghiệm mơ hình kết hợp với k=5, epoch = 10 105 an Bảng 23 Giá trị sai số tập liệu Jena_climate_2009_2016 mơ hình thực nghiệm MAE RMSE Regression ANN Hybrid Regression 0.01 0.15 0.01 0.06 CV(RMSE) ANN Hybrid Regression ANN Hybrid 2.48 0.22 0.01 0.01 Bảng 24 Thời gian thực thi tập liệu Jena_climate_2009_2016 mơ hình thực nghiệm Mơ hình Regression ANN Hybrid Thời gian thực thi 9.16 s 290.55 s 292.23 s Nhận xét: Qua kết từ việc chạy thực nghiệm tập liệu cho mơ hình tệp liệu Jena_climate_2009_2016 chạy cho kết tốt mô hình hồi quy Với thời gian thực thi ngắn nhiều so với mơ hình mạng neuron nhân tạo có 9.16 giây Và sai số MAE=0.01 giá trị sai số thấp Mơ hình mạng neuron nhân tạo cho sai số cao hai mơ hình cịn lại thời gian thực lớn Mơ hình kết hợp cho kết sai số giống với mô hình hồi quy, điều cho thấy mơ hình kết hợp mơ hình hồi quy chiếm ưu 7.4.3 Thực nghiệm với tập liệu Appliances energy prediction (Dự đoán lượng gia dụng) Input bao gồm cột: Date, Appliances, Lights, T1, RH_1, T2, RH_2, T3, RH_3, T4, RH_4, T5, RH_5, T6, RH_6, T7, RH_7, T8, RH_8, T9, RH_9, Press_mm_hg, RH_out, Windspeed, Visibility, Tdewpoint, rv1, rv2 Output bao gồm cột: T_out Bảng 23 kết chạy thực nghiệm tập liệu Appliances energy prediction sử dụng mơ hình ANN với số neuron lớp ẩn từ k=1, 2, … , 10, epoch=10 106 an Bảng 25 Giá trị thực nghiệm tệp liệu Appliances energy prediction mơ hình ANN với k thay đổi Thời gian thực MAE RMSE CV(RMSE) thi k=1 7.06 s 9.53 10.68 0.78 k=2 6.86 s 9.4 10.56 0.77 k=3 6.78 s 0.77 1.01 0.07 k=4 7s 0.79 1.23 0.09 k=5 7.3 s 1.62 0.15 k=6 6.39 s 1.44 1.73 0.13 k=7 6.45 s 0.81 1.16 0.08 k=8 7.87 s 0.78 1.03 0.08 k=9 6.62 s 1.11 1.41 0.1 k=10 6.65 s 0.76 1.08 0.08 Theo kết chạy thực nghiệm với mơ hình ANN, ta thấy với k=10 giá trị MAE=0.76 thời gian thực thi 6.65 kết tốt giá trị k =1, 2, ,10 Bảng 26 kết chạy thực nghiệm tập liệu Appliances energy prediction sử dụng mơ hình ANN với số neuron lớp ẩn k=10, epoch=10, 20, … , 100 Bảng 26 Giá trị thực nghiệm tệp liệu Appliances energy prediction mô hình ANN với epoch thay đổi Thời gian thực MAE RMSE CV(RMSE) 0.76 1.08 0.08 thi Epoch=10 6.65 s 107 an Epoch=20 27.73 s 0.75 1.28 0.09 Epoch=30 35.25 s 0.71 1.25 0.09 Epoch=40 43.35 s 0.68 1.26 0.09 Epoch=50 34.22 s 0.79 1.35 0.1 Epoch=60 72.62 s 0.75 1.16 0.08 Epoch=70 46.3 s 0.7 1.23 0.09 Epoch=80 87.12 s 0.78 1.19 0.09 Epoch=90 83.93 s 0.85 1.16 0.09 Epoch=100 79.03 s 0.86 1.35 0.1 Qua kết bảng 26 ta thấy giá trị epoch lớn thời gian thực thi lớn nhiên với epoch=40 giá trị sai số MAE=0.68 nhỏ Ta chọn epoch =40 để chạy thực nghiệm mơ hình kết hợp Chạy thực nghiệm mơ hình kết hợp với k=10, epoch=40 Bảng 27 Giá trị sai số tập liệu Appliances energy prediction mơ hình thực nghiệm MAE RMSE Regression ANN Hybrid Regression 0.59 0.68 0.63 1.05 CV(RMSE) ANN Hybrid Regression ANN Hybrid 1.26 0.09 0.94 0.08 0.07 Bảng 28 Thời gian thực thi tập liệu Appliances energy prediction mơ hình thực nghiệm Mơ hình Regression ANN Hybrid Thời gian thực thi 0.79 s 43.35 s 45.09 s 108 an Nhận xét: Qua thực nghiệm chạy ba mơ hình, ta thấy tệp liệu Appliances energy prediction cho kết tốt mơ hình hồi quy Với sai số MAE=0.59 thời gian thực thi 0.79 Mơ hình kết hợp cho kết giống với mơ hình hồi quy, điều có nghĩa mơ hình hồi quy chiếm ưu so với mơ hình neuron nhân tạo mơ hình kết hợp 7.4.4 Thực nghiệm với tập liệu Occupancy Detection Data Set (Bộ liệu phát chiếm dụng) Input bao gồm cột: Date, Temperature, Humidity, Light, CO2, HumidityRatio Output bao gồm cột: Occupancy Bảng 26 kết chạy thực nghiệm tập liệu Occupancy Detection sử dụng mơ hình ANN với số neuron lớp ẩn từ k=1, 2, … , 10, epoch=10 Bảng 29 Giá trị thực nghiệm tệp liệu Occupancy Detection Data Set mơ hình ANN với k thay đổi Thời gian thực MAE RMSE CV(RMSE) thi k=1 3.78 s 0.27 0.52 1.92 k=2 4.16 s 0.31 0.58 2.12 k=3 4.3 s 0.31 0.56 2.06 k=4 4.65 s 0.04 0.09 0.33 k=5 3.75 s 0.25 0.3 1.1 k=6 3.68 s 0.18 0.57 2.1 k=7 3.63 s 0.12 0.17 0.64 k=8 3.82 s 0.16 0.24 0.88 k=9 4.14 s 0.47 0.61 2.24 109 an k=10 3.6 s 0.4 0.54 Theo kết chạy thực nghiệm với mô hình ANN, ta thấy với k=4 giá trị MAE=0.04 thời gian thực thi 3.24 kết tốt giá trị k =1, 2, , 10 Bảng 30 kết chạy thực nghiệm tập liệu Air quality sử dụng mơ hình ANN với số neuron lớp ẩn k=4, epoch=10, 20, … , 100 Bảng 30 Giá trị thực nghiệm tệp liệu Occupancy Detection Data Set mơ hình ANN với epoch thay đổi Thời gian thực MAE RMSE CV(RMSE) thi Epoch=10 4.65 s 0.04 0.09 0.33 Epoch=20 13.98 s 0.58 0.7 2.57 Epoch=30 13.46 s 0.07 0.17 0.64 Epoch=40 23.71 s 0.22 0.48 1.76 Epoch=50 29.67 s 0.13 0.14 0.51 Epoch=60 16.09 s 0.22 0.26 0.96 Epoch=70 18.77 s 0.08 0.12 0.44 Epoch=80 21.23 s 0.3 0.52 1.9 Epoch=90 27.96 s 0.33 0.66 2.41 Epoch=100 27.07 s 0.27 0.52 1.92 Qua kết bảng 30 ta thấy giá trị epoch lớn thời gian thực thi lớn sai số thay đổi Tuy nhiên với giá trị epoch = 10 cho kết MAE=0.4 nhỏ Ta chọn epoch =10 để chạy thực nghiệm mơ hình kết hợp Chạy thực nghiệm mơ hình kết hợp với k=4, epoch=10 110 an Bảng 31 Giá trị sai số tập liệu Occupancy Detection mơ hình thực nghiệm MAE RMSE Regression ANN Hybrid Regression 0.14 0.04 0.14 0.21 CV(RMSE) ANN Hybrid Regression ANN Hybrid 0.09 0.33 0.21 0.77 0.77 Bảng 32 Thời gian thực thi tập liệu Occupancy Detection mô hình thực nghiệm Mơ hình Regression ANN Hybrid Thời gian thực thi 1.18 s 4.65 s 7.99 s Nhận xét: Qua kết thực nghiệm ta thấy tập liệu Occupancy Detection Data Set cho kết xác mơ hình neuron nhân tạo với sai số MAE=0.04 thời gian thực thi 4.65 So thời gian chậm so với mơ hình hồi quy Mơ hình kết hợp cho kết giống với mơ hình hồi quy, cho thấy mơ hình hồi quy chiếm ưu mơ hình kết hợp 111 an Phần 3: KẾT LUẬN 3.1 KẾT QUẢ ĐẠT ĐƯỢC - Hiểu tầm quan trọng Machine Learning - Hiểu mơ hình hồi quy đơn, hồi quy bội, mạng neuron nhân tạo - Hiểu phép lai mô hình kết hợp hồi quy mạng neuron nhân tạo - Hiểu mơ hình hồi quy chuỗi thời gian - Tìm hiểu tốn áp dụng demo mơ hình 3.2 ĐĨNG GĨP CỦA ĐỀ TÀI Đóng góp vào dự báo vấn đề thời tiết, giá vật tư, sản lượng vật phẩm, nhu cầu sử dụng hàng hóa Mang tính chất thực tế cao, nhiên mức độ xác tương đối nhỏ cịn sai số nhiều So sánh mức độ xác mơ hình cho tập liệu khác Từ biết mơ hình phù hợp với tập liệu 3.3 HẠN CHẾ - Tài liệu tiếng anh nhiều từ ngữ chuyên ngành khó hiểu sâu vào nội dung đề tài - Hạn chế ngôn ngữ, cách đọc hiểu nên chưa thể hiểu sâu - Tập liệu dataset nhiều, có nhiều tập khó xử lí liệu 3.4 HƯỚNG PHÁT TRIỂN Tiếp tục nghiên cứu sâu vào đề tài, nghiên cứu phương pháp cao Nâng cao mơ hình dự đốn Cải thiện App demo dự báo hiệu quả, cải thiện sai số 112 an DANH MỤC TÀI LIỆU THAM KHẢO [1] R J H a G Athanasopoulos, Forecasting: Principles and Practice, Monash University, Autralia [2] T P C Huy, Bài giảng môn học kinh tế lượng, 2013 [3] N C Dũng, Kinh tế lượng với R, 2017 [4] T N V H V X N Nguyễn Thị Thanh Huyền, Phân tích dự báo kinh tế, Thái Nguyên, 2009 [5] C H T Biên dịch: Thục Đoan, Các phương pháp định lượng, 2011 [6] D T Trang, Ứng dụng mạng neuron nhân tạo dự báo số học sinh tuyển vào trung tâm GDNN-GDTX quận Đống Đa, 2017 [7] R J Schallkoff, Artificial Neural Networks, The McGraw – Hill Companies, 1997 [8] S.H., Artificial Neural Networks (ANNs) for flood forecasting at Dongola Sation, Alexandria Engineering Journal, 2014 [9] Jaime, V.R., Felipe, C., Pablo, V., Artificial Neural Networks applied to flow prediction:, Procedia Engineering 162, 2016 113 an an Tìm hiểu mơ hình ANN ẩn 114 04/05/2020 Sửa lại chức năng, thêm vào chọn 20/04/2020 số neuron input, output, số lớp 20/04/2020 13/04/2020 13/04/2020 NGÀY BC Viết demo mơ hình ANN 30/03/2020 NGÀY GIAO Tìm tập liệu để đánh giá Ví dụ mơ hình ANN CƠNG VIỆC STT Giáo viên hướng dẫn: TS Nguyễn Thành Sơn ĐÁNH GIÁ CỦA GV Tên luận văn: Tìm hiểu mơ hình hồi quy ứng dụng dự báo liệu chuỗi thời gian đến 30/07/2020 MSSV 2: 16110410 Họ tên sinh viên 2: Trần Thị Nhựt Thời gian: từ 30/03/2020 MSSV 1: 16110539 Họ tên sinh viên 1: Nguyễn Xuân Nguyên KẾ HOẠCH THỰC HIỆN LUẬN VĂN output, số lớp ẩn Thiếu chọn số neuron input, GÓP Ý CỦA GV an hình qua tập liệu Đánh giá nghiệm mô 15/06/2020 mơ hình kết hợp hồi quy, mạng neuron nhân tạo Tính cách sai số mơ hình 01/06/2020 ẩn số neuron input, output, số lớp Sửa lại chức năng, thêm vào chọn 25/05/2020 hồi quy mạng neuron nhân tạo Viết demo cho mơ hình kết hợp 11/05/2020 mạng neuron nhân tạo Tìm hiểu mơ hình kết hợp hồi quy 04/05/2020 115 06/07/2020 15/06/2020 01/06/2020 25/05/2020 11/05/2020 trang đánh giá mơ hình khác Lấy thông số qua Chỉnh lại giao diện gọng gàng thực nghiệm trường hợp thực nghiệm, kết dùng thực nghiệm, thực nghiệm, tập liệu Bao gồm mục: Mơi trường Tính thời gian thực thi Tách mơ hình riêng biệt output, số lớp ẩn Thiếu chọn số neuron input, an 17/07/2020 116 30/07/2020 Thêm phần nhiệm vụ luận văn luận, sửa lỗi tả Chỉnh theo yêu cầu khóa CV(RMSE ) chữ Giải thích sử dụng tiêu chí đánh giá MAE, MSE, RMSE, 17/07/2020 chỉnh lỗi tả, canh lề, size Chỉnh sửa word hoành chỉnh, 06/07/2020 10 Làm powerpoint an ... (ANN), tìm hiểu kết hợp mơ hình hồi quy ANN, tìm hiểu chuỗi thời gian, dự báo, ứng dụng vào dự báo chuỗi thời gian 1.2 MỤC ĐÍCH CỦA ĐỀ TÀI Nghiên cứu áp dụng mơ hình hồi quy, mơ hình ANN mơ hình. .. - Tìm hiểu mơ hình ANN - Tìm hiểu mơ hình kết hợp hồi quy ANN - Chuỗi thời gian - Dự báo an - Áp dụng hồi quy tuyến tính, mơ hình ANN, mơ hình kết hợp hồi quy ANN vào dự báo 1.3.2 Xây dựng ứng. .. Luận Văn: Hiểu tầm quan trọng Machine Learning Tìm hiểu mơ hình hồi quy Tìm hiểu mơ hình ANN Tìm hiểu mơ hình kết hợp hồi quy ANN Cài đặt mơ hình Thực nghiệp so sánh mơ hình nhiều tập liệu Đề cương