(Luận văn thạc sĩ hcmute) dự báo trên chuỗi thời gian dựa trên so trùng mẫu sử dụng nhiều độ đo

64 3 0
(Luận văn thạc sĩ hcmute) dự báo trên chuỗi thời gian dựa trên so trùng mẫu sử dụng nhiều độ đo

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ TRẦN TRỌNG BÌNH DỰ BÁO TRÊN CHUỖI THỜI GIAN DỰA TRÊN SO TRÙNG MẪU SỬ DỤNG NHIỀU ĐỘ ĐO NGÀNH: KHOA HỌC MÁY TÍNH - 60480101 SKC006721 Tp Hồ Chí Minh, tháng 05/2020 Luan van BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ TRẦN TRỌNG BÌNH DỰ BÁO TRÊN CHUỖI THỜI GIAN DỰA TRÊN SO TRÙNG MẪU SỬ DỤNG NHIỀU ĐỘ ĐO NGÀNH: KHOA HỌC MÁY TÍNH - 60480101 Tp Hồ Chí Minh, tháng 5/2020 Luan van BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ TRẦN TRỌNG BÌNH DỰ BÁO TRÊN CHUỖI THỜI GIAN DỰA TRÊN SO TRÙNG MẪU SỬ DỤNG NHIỀU ĐỘ ĐO NGÀNH: KHOA HỌC MÁY TÍNH – 60480101 Hướng dẫn khoa học: TS NGUYỄN THÀNH SƠN Tp Hồ Chí Minh, tháng 5/2020 II Luan van III Luan van IV Luan van V Luan van VI Luan van VII Luan van VIII Luan van IX Luan van 3.3.2 Trường hợp sử dụng 03 độ đo 𝑛 𝑀𝑆𝐸 = ∑(𝑌𝑖 − 𝑌𝑑ự 𝑏á𝑜,𝑗 )2 𝑖=1 𝑌𝑑ự 𝑏á𝑜 = 𝑎1 𝑌1(𝑖) + 𝑎2 𝑌2(𝑖) + 𝑎3 𝑌3(𝑖) ∀ ∑𝑚 𝑗=1 𝑎𝑗 = 𝑛 𝑀𝑆𝐸 = ∑(𝑌𝑖 − 𝑎1 𝑌1(𝑖) − 𝑎2 𝑌2(𝑖) − 𝑎3 𝑌3(𝑖) )2 𝑖=1 Do a1 + a2 + a3 = nên a1 = - a2 - a3 ta có: 𝑛 𝑀𝑆𝐸 = ∑[𝑌𝑖 − (1 − 𝑎2 − 𝑎3 )𝑌1(𝑖) − 𝑎2 𝑌2(𝑖) − 𝑎3 𝑌3(𝑖) ] 𝑖=1 𝑛 𝑀𝑆𝐸 = ∑[𝑌𝑖 − 𝑌1(𝑖) + 𝑌1(𝑖) 𝑎2 + 𝑌1(𝑖) 𝑎3 − 𝑎2 𝑌2(𝑖) − 𝑎3 𝑌3(𝑖) ] 𝑖=1 𝑛 𝑀𝑆𝐸 = ∑[𝑌𝑖 − 𝑌1(𝑖) + 𝑌1(𝑖) 𝑎2 − 𝑎2 𝑌2(𝑖) + 𝑌1(𝑖) 𝑎3 − 𝑎3 𝑌3(𝑖) ] 𝑖=1 𝑛 𝑀𝑆𝐸 = ∑[𝑌𝑖 − 𝑌1(𝑖) − (𝑌2(𝑖) − 𝑌1(𝑖) )𝑎2 − (𝑌3(𝑖) − 𝑌1(𝑖) )𝑎3 ] 𝑖=1 𝑛 𝑀𝑆𝐸 = ∑[𝑌𝑖 − 𝑌1(𝑖) ] 𝑖=1 𝑛 2 + 𝑎2 ∑[(𝑌2(𝑖) − 𝑌1(𝑖) )] 𝑖=1 𝑛 𝑛 2 + 𝑎3 ∑[ (𝑌3(𝑖) − 𝑌1(𝑖) )] − 2𝑎2 ∑(𝑌𝑖 − 𝑌1(𝑖) )(𝑌2(𝑖) − 𝑌1(𝑖) ) 𝑖=1 𝑛 𝑖=1 𝑛 + 2𝑎2 𝑎3 ∑(𝑌2(𝑖) − 𝑌1(𝑖) )(𝑌3(𝑖) − 𝑌1(𝑖) ) − 2𝑎3 ∑[(𝑌𝑖 − 𝑌1(𝑖) )(𝑌3(𝑖) 𝑖=1 𝑖=1 − 𝑌1(𝑖) )] Đặt 𝑎2 = 𝑥, 𝑎3 = 𝑦, 𝑛 𝐴 = ∑[(𝑌2(𝑖) − 𝑌1(𝑖) )] 𝑖=1 Trang 32 Luan van 𝑛 𝐵 = ∑[ (𝑌3(𝑖) − 𝑌1(𝑖) )] 𝑖=1 𝑛 𝐶 = ∑(𝑌𝑖 − 𝑌1(𝑖) )(𝑌2(𝑖) − 𝑌1(𝑖) ) 𝑖=1 𝑛 𝐷 = ∑(𝑌2(𝑖) − 𝑌1(𝑖) )(𝑌3(𝑖) − 𝑌1(𝑖) ) 𝑖=1 𝑛 𝐸 = ∑(𝑌𝑖 − 𝑌1(𝑖) )(𝑌3(𝑖) − 𝑌1(𝑖) ) 𝑖=1 MSE(x, y) = Ax + By − 2Cx − 2Dy + 2Exy ≤ x, y ≤ { (*) Đặt  = {(x, y) ∈ R , ≤ x, y ≤ } Phương trình * hàm tối ưu có điều kiện ta sử dụng tối ưu hóa để ước lượng tham số Hoặc sử dụng phương pháp Gradient Descent, sau: 2Ax − 2C + 2Ey 2A + 2E x 2C ∇f(x, y) = [ ] [ y] − [ ] ]=[ 2By − 2D + 2Ex 2E + 2B 2D x0 Chọn X0 = [y ] ∈  Ta tìm Xk+1 = Pc [Xk − λ∇f(Xk )], < λ < ‖𝑀‖, ‖𝑀‖ = λ𝑚𝑎𝑥 Điều kiện dừng, ‖Xk − Xk+1 ‖ < ε Pc (𝑋) = max(𝑙𝑏, min(𝑋, 𝑢𝑏) 𝑣ớ𝑖 𝑙𝑏 = [ ] , 𝑢𝑏 = [ ], Với Pc (𝑋) phép chiếu X tập xác định  Khi Xk+1 đạt điều kiện dừng với ε xác định trước, xk+1 ta có Xk+1 = [y ] k+1 𝑎2 = xk+1 𝑎 = yk+1 { 𝑎1 = − xk+1 − yk+1 Trang 33 Luan van CHƯƠNG VI: THỰC NGHIỆM Trong chương chúng tơi trình bày cách thức thực nghiệm đánh giá kết thực nghiệm để so sánh tính hiệu phương pháp dự báo chuỗi thời gian sử dụng nhiều độ đo so với phương pháp dự báo thông thường liệu khác Dữ liệu thực nghiệm Thực nghiệm thực nhiều liệu thuộc lĩnh vực khác Các liệu lấy từ nhiều nguồn khác Internet Bảng 4.1 mơ tả tóm tắt liệu dùng thực nghiệm Bảng 4.1 Mô tả tập liệu dùng thực nghiệm Tập liệu Mô tả Nguồn Nhiệt độ thấp ngày TP Melbourne, Úc từ 1981-1990 Monthly rain, Lượng mưa trung bình coppermine, theo tháng từ 1/1933mm 12/1976 Gold prices Giá vàng trung bình ngày từ 2/1/2009 đến 31/12/2012 Natural gaz Lượng khí ga trung bình tuần từ ngày 31/12/1993 đến 27/7/2012 Milk Sản lượng sữa trung bình Production tháng từ 1/1962 đến 12/1975 daily-mintemperatures https://www.kaggle.com/paulbrabban/dailyminimum-temperatures-in-melbourne https://www.qlik.com/us/products/qlik-datamarket?q=provider:tsdl http://www.forexpros.com/commodities/ goldhistorical-data http://tonto.eia.gov/dnav/ng/hist/nw_epg0_sao _r88_bcfw.htm https://datamarket.com/data/set/22ox/monthlymilk-production-pounds-per-cow-jan-62-dec75#!ds=22ox&display=line Môi trường thực nghiệm Các thực nghiệm thực máy tính có cấu sau: CPU Core i5, Ram 8GB, hệ điều hành Window 10 64bits Ngôn ngữ lập trình sử dụng Python kết hợp với Pycharm IDE Tiêu chuẩn đánh giá Luận văn đánh giá độ xác mơ hình dự báo dựa tiêu chuẩn lỡi trung bình tuyệt đối (MAE) Sai số trung bình gốc (RMSE) MAE RMSE tính theo cơng thức sau n MAE   Yobs,i  Ymod el ,i n i1 Trang 34 Luan van 4.1  n RMSE  i 1 (Yobs,i  Ymod el ,i ) 4.2 n Trong đó Yobs,i giá trị quan sát thời điểm i Ymodel,i giá trị dự báo mơ hình thời điểm ,n chiều dài chuỗi dự báo Việc dùng hai độ đo lỗi thể góc nhìn khác đánh giá hai mơ hình dự báo Đánh giá thực nghiệm Để đánh giá độ xác mơ hình dự báo, Luận văn chọn thực dự báo theo phương pháp ‘one step ahead’ Mỗi tập liệu chia thành phần: phần training dùng cho việc tìm kiếm tương tự phần test dùng cho việc đánh giá độ xác dự báo Tỷ lệ phần training phần test tùy thuộc vào tập liệu Luận văn thực nghiệm dự báo toàn tập test sau đó tính độ xác trung bình Để đánh giá ảnh hưởng k k-NN đến độ xác dự báo, luận văn thực nghiệm đánh giá độ xác dự báo với giá trị k khác Bảng 4.2 mô tả kết thực nghiệm tập liệu daily-min-temperatures với k thay đổi từ đến Trong tập liệu này, giá trị nhiệt độ từ đến 1799 dùng để tìm kiếm lân cận gần nhất, giá trị từ 1800 đến 2000 dùng để đánh giá độ mơ hình dự báo Chiều dài ch̃i tìm kiếm chọn 30 Trong bảng 4.2 kết độ xác trung bình mơ hình dự báo tính tồn kết độ xác dự báo tập test Kết thực nghiệm cho thấy k có ảnh hưởng đến kết dự báo với giá trị k dùng thực nghiệm mơ hình đề xuất cho kết dự báo tốt mơ hình tương tự dùng độ đo Các kết thực nghiệm thực với k tốt chọn mỗi tập liệu Bảng 4.3 kết thực nghiệm lỗi dự báo trung bình theo tháng tháng cuối tập liệu daily-min-temperatures với k = Phần lại tập liệu dùng để tìm kiếm tương tự Chiều dài ch̃i tìm kiếm chọn 30 Kết thực nghiệm cho thấy phương pháp đề xuất cho kết tốt so với phương pháp lại Trang 35 Luan van Bảng 4.2 kết độ xác trung bình mơ hình dự báo tập liệu daily-min-temperatures k Euclid 0.09556 0.08428 0.07854 0.07816 0.07674 0.07811 0.07835 0.07818 DTW 0.09292 0.08838 0.08871 0.08637 0.08358 0.08347 0.08116 0.07956 MAE LCS 0.12944 0.12944 0.11036 0.10338 0.10099 0.09855 0.09767 0.09743 Kết hợp độ đo 0.04837 0.04631 0.04629 0.04615 0.04415 0.,04514 0.04508 0.04472 Bảng 4.3 Kết lỡi dự báo trung bình theo tháng, thực nghiệm tập liệu dailymin-temperatures với k = Tháng thứ T Bình Tháng thứ T Bình Euclid 0.05962 0.06914 0.09253 0.10431 0.04564 0.07425 DTW 0.05685 0.08142 0.08995 0.11979 0.06077 0.08176 Euclid 0.07426 0.08734 0.10554 0.13061 0.05615 0.09078 DTW 0.07400 0.09521 0.10515 0.14047 0.07982 0.09893 MAE LCS Kết hợp độ đo 0.08817 0.01857 0.11859 0.03910 0.09862 0.06158 0.10158 0.05765 0.09603 0.04363 0.10060 0.04411 RMSE LCS Kết hợp độ đo 0.11137 0.03280 0.15159 0.06894 0.12131 0.07951 0.13260 0.09853 0.11210 0.05468 0.12579 0.06689 Bảng 4.4 mô tả kết thực nghiệm lỡi dự báo trung bình theo năm tập liệu Monthly rain năm cuối từ 1968 đến 1976, với k = 7, chiều dài chuỗi tìm kiếm chọn 30 Phần cịn lại tập liệu dùng để tìm kiếm tương tự Kết thực nghiệm cho thấy dù có vài trường hợp kết lỗi dự báo phương pháp đề xuất lớn phương pháp dùng độ đo, kết dự báo trung bình tồn năm dự báo phương pháp đề xuất nhỏ phương pháp dùng riêng lẻ độ đo Trang 36 Luan van Bảng 4.4 Kết thực nghiệm lỗi dự báo tập liệu Monthly Rain Năm thứ T bình Năm thứ T bình Euclid 0.11322 0.08117 0.09931 0.12342 0.09974 0.10557 0.15231 0.09007 0.03229 0.09968 DTW 0.11584 0.07996 0.09596 0.12957 0.09910 0.09504 0.15017 0.08566 0.03520 0.09850 Euclid 0.129779 0.084119 0.142912 0.159489 0.112176 0.125884 0.243696 0.100377 0.040988 0.126602 DTW 0.132010 0.083993 0.137710 0.161705 0.110708 0.119257 0.239887 0.096827 0.044089 0.125132 MAE LCS 0.12091 0.09238 0.09035 0.13305 0.11550 0.10897 0.15620 0.10296 0.03632 0.10629 RMSE LCS 0.133624 0.096715 0.134758 0.165223 0.121307 0.121986 0.240511 0.111059 0.045189 0.130041 Kết hợp độ đo 0.10732 0.07868 0.08887 0.12177 0.09594 0.10111 0.14881 0.08671 0.02672 0.09510 Kết hợp độ đo 0.123858 0.082235 0.134700 0.157459 0.106405 0.118381 0.237933 0.097537 0.038231 0.121860 Bảng 4.5 Kết thực nghiệm lỗi dự báo tập liệu Gold prices Tháng thứ T bình Tháng thứ T bình Euclid 0.052892 0.053783 0.041052 0.072640 0.051856 0.054114 DTW 0.048404 0.048484 0.039093 0.070987 0.053485 0.117875 Euclid 0.066467 0.057459 0.045122 0.080024 0.059930 0.061801 DTW 0.060615 0.051562 0.042632 0.077968 0.058316 0.058219 MAE LCS 0.191157 0.234850 0.186163 0.399908 0.264967 0.189829 RMSE LCS 0.200318 0.244517 0.210625 0.409106 0.286285 0.270170 Kết hợp độ đo 0.001630 0.000000 0.001144 0.072011 0.051122 0.013474 Kết hợp độ đo 0.003942 0.000000 0.003893 0.079988 0.059849 0.029534 Bảng 4.5 kết thực nghiệm lỡi dự báo trung bình theo tháng tháng cuối tập liệu Gold prices với k = 7, chiều dài ch̃i tìm kiếm chọn Trang 37 Luan van 30 Phần lại tập liệu dùng để tìm kiếm tương tự Kết thực nghiệm cho thấy kết dự báo trung bình tháng tồn năm dự báo phương pháp đề xuất nhỏ phương pháp dùng riêng lẻ độ đo Bảng 4.6 kết thực nghiệm lỗi dự báo trung bình theo tháng 36 tháng cuối tập liệu Natural gaz với k = 5, chiều dài ch̃i tìm kiếm chọn 24 Phần lại tập liệu dùng để tìm kiếm tương tự Kết thực nghiệm cho thấy dù có vài trường hợp kết lỡi dự báo phương pháp đề xuất lớn phương pháp dùng độ đo, kết dự báo trung bình tồn 36 tháng dự báo phương pháp đề xuất nhỏ phương pháp dùng riêng lẻ độ đo Bảng 4.6 Kết thực nghiệm lỗi dự báo tập liệu Natural gaz Tháng thứ T bình Tháng thứ T bình Euclid 0.25822 0.26917 0.22482 0.29413 0.23438 0.40054 0.28021 DTW 0.26171 0.27714 0.23318 0.29546 0.22416 0.38277 0.27907 Euclid 0.306324 0.319195 0.244436 0.332916 0.253009 0.365892 0.303629 DTW 0.292544 0.310895 0.250823 0.330544 0.245131 0.348499 0.296406 MAE LCS 0.40194 0.26301 0.28173 0.32105 0.17201 0.51893 0.32645 RMSE LCS 0.461622 0.334331 0.338145 0.379369 0.216477 0.499039 0.371497 Kết hợp độ đo 0.19572 0.23615 0.11021 0.27554 0.06978 0.40054 0.21466 Kết hợp độ đo 0.285171 0.303038 0.185217 0.322500 0.100550 0.365623 0.260350 Bảng 4.7 kết thực nghiệm lỗi dự báo 17 tháng cuối tập liệu Milk production với k = 5, chiều dài ch̃i tìm kiếm chọn 12 Phần lại tập liệu dùng để tìm kiếm tương tự Kết thực nghiệm cho thấy dù có trường hợp kết lỡi dự báo phương pháp đề xuất lớn phương pháp dùng độ đo, kết dự báo trung bình toàn 17 tháng dự báo phương pháp đề xuất nhỏ phương pháp dùng riêng lẻ độ đo Trang 38 Luan van Bảng 4.7 Kết thực nghiệm lỗi dự báo tập liệu Milk production Tháng thứ 10 11 12 13 14 15 16 17 T bình Tháng thứ 10 11 12 13 14 15 16 17 T bình Euclid 0.339984 0.231891 0.121034 0.011699 0.000000 0.079447 0.017268 0.075481 0.048878 0.214864 0.241787 0.398758 0.341907 0.244231 0.141747 0.012861 0.002324 0.148480 DTW 0.319111 0.236619 0.129968 0.001162 0.000361 0.068990 0.054407 0.112981 0.048878 0.237861 0.241787 0.398758 0.341907 0.248598 0.149679 0.021675 0.011098 0.154343 Euclid 0.339984 0.231891 0.121034 0.011699 0.000000 0.079447 0.017268 0.075481 0.048878 0.214864 0.241787 0.398758 0.341907 0.244231 0.141747 0.012861 0.002324 0.148480 DTW 0.319111 0.236619 0.129968 0.001162 0.000361 0.068990 0.054407 0.112981 0.048878 0.237861 0.241787 0.398758 0.341907 0.248598 0.149679 0.021675 0.011098 0.154343 MAE LCS 0.498397 0.395032 0.240064 0.123558 0.127885 0.045072 0.146795 0.209295 0.062500 0.329327 0.386979 0.695272 0.559135 0.410737 0.312179 0.187179 0.110857 0.284721 RMSE LCS 0.498397 0.395032 0.240064 0.123558 0.127885 0.045072 0.146795 0.209295 0.062500 0.329327 0.386979 0.695272 0.559135 0.410737 0.312179 0.187179 0.110857 0.284721 Kết hợp độ đo 0.339984 0.231891 0.121034 0.000000 0.000000 0.045072 0.017268 0.075481 0.048878 0.214864 0.241787 0.398758 0.341907 0.244231 0.141747 0.012861 0.002324 0.145770 Kết hợp độ đo 0.339984 0.231891 0.121034 0.000000 0.000000 0.045072 0.017268 0.075481 0.048878 0.214864 0.241787 0.398758 0.341907 0.244231 0.141747 0.012861 0.002324 0.145770 Ngoài việc so sánh phương pháp dựa độ xác, luận văn đánh giá phương pháp dựa thời gian thực thi trung bình chúng Để tính thời gian thực thi trung bình đề tài thực thuật báo dự báo toàn tập liệu test, Trang 39 Luan van sau đó tính thời gian thực thi trung bình cho dự báo Bảng 4.8 kết thực nghiệm so sánh thời gian thực thi trung bình phương pháp dự báo ba tập liệu daily-min-temperatures, natural gas, monthly-rain, milk-production gold-price Kết thực nghiệm cho thấy thời gian thực thi phương pháp đề xuất luận văn thời gian thực thi lâu phương pháp dự báo sử dụng độ đo cộng thêm thời gian cần để tổng hợp kết dự báo từ phương pháp dùng độ đo Tuy nhiên, thời gian cần để tổng hợp kết dự báo từ phương pháp dùng độ đo thường nhỏ độ phức tạp tính tốn O(l) Bảng 4.8 Thời gian thực thi trung bình thuật toán thực nghiệm tập liệu khác Độ phức tạp thời gian trung bình (ms) Chiều dài ch̃i tìm kiếm Euclid DTW LCS Kết hợp độ đo Tập liệu: daily-min-temperatures 30 0.590789 1.58118 0.982161 1.58118 60 0.545844 1.651559 1.770095 1.800252 90 0.966887 3.157465 4.717307 4.720856 0.238994 0.66602 0.255172 0.668524 12 0.302042 0.793179 0.351485 0.804032 24 0.376927 0.883158 0.485334 0.889059 0.116642 0.372422 0.136077 0.374711 12 0.116828 0.370985 0.147256 0.373817 24 0.125137 0.477664 0.206855 0.479407 0.024992 0.393873 0.134302 0.393873 12 0.024992 0.393873 0.134302 0.393873 30 0.203617 0.602661 0.327691 0.604502 60 0.248728 0.782127 0.783909 0.821265 90 0.266855 1.169899 1.520539 1.577361 Tập liệu: NaturalGas Tập liệu: monthly-rain Tập liệu: milk-production Tập liệu: gold-price Nhận xét chung kết thực nghiệm: Từ kết thực nghiệm tập liệu thực thuộc lĩnh vực khác ta thấy sử dụng mơ hình dự báo dựa vào so trùng mẫu dùng nhiều độ đo cho kết Trang 40 Luan van dự báo tốt so với trường hợp dùng độ đo Có điều mỡi độ đo có ưu nhược điểm riêng nên sử dụng nhiều độ đo mỡi độ đo có thể hỡ trợ khắc phục nhược điểm độ đo khác Trang 41 Luan van CHƯƠNG V: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Chương trình bày đóng góp nghiên cứu luận văn này, số hạn chế hướng phát triển tương lai 3.4 Đóng góp của luận văn Qua thời gian nghiên cứu, Luận văn đáp ứng mục tiêu đề ban đầu, cụ thể là: - Hiểu chuỗi thời gian tính chất - Hiểu độ đo tương tự sử dụng dự báo chuỗi thời gian - Hiểu cách áp dụng giải thuật K-NN dự báo chuỗi thời gian - Đề xuất mơ hình dự báo dựa so trùng mẫu sử dụng nhiều độ đo cách ước lượng giá trị tham số dựa lý thuyết toán học - Thực nghiệm đánh giá kết 3.5 Hạn chế của luận văn Do hạn chế thời gian, Luận văn chưa thực đánh giá thực nghiệm dựa tiêu chí khác nhau, chưa tối ưu hóa thuật tốn tìm kiếm tương tự xây dựng giao diện thân thiện với người sử dụng Hầu hết giải thuật khai phá liệu ch̃i thời gian thường địi hỏi phải xác định giá trị số thông số đầu vào việc xác định thông số thường không dễ dàng người dùng Việc xác định thông số đầu vào thường đòi hỏi người dùng trình thử sửa sai thực nghiệm tốn thời gian Giải thuật đề xuất luận văn không tránh khỏi hạn chế nêu Đó việc dự báo liệu chuỗi thời gian giải thuật K-NN người dùng phải xác định tham số k phù hợp 3.6 Hướng phát triển Từ nghiên cứu kết đạt luận văn này, dự định hướng nghiên cứu sau: - Đánh giá thực nghiệm phương pháp đề xuất dựa tiêu chí khác CV(RMSE), thời gian thực thi, lượng nhớ cần sử dụng Trang 42 Luan van - Nghiên cứu tối ưu hóa thuật tốn tìm kiếm tương tự - Nghiên cứu đề xuất phương pháp xác định k cách tự động - Cải tiến giao diện chương trình để thân thiện với người dùng Trang 43 Luan van TÀI LIỆU THAM KHẢO [1] Agrawal, R., Faloutsos, C and Swami, A., Efficient Similarity Search in Sequence Databases, Chicago: In Proc of the Fourth International Conference on Foundations of Data Organization and Algorithms, 1993 [2] Berndt, D J., Clifford, J., Using Dynamic Time Warping to Find Patterns in Time Series, Seattle, Washington: In KDD-94: AAAI Workshop on Knowledge Discovery in Database, 1994 [3] D T Anh, "Tổng quan tìm kiếm tương tự liệu chuỗi thời gian," Tạp chí Phát triển KH&CN, tập 14, số K2 – 2011, p 71 – 79, 2011 [4] N T Son, "Pattern matching-based prediction using affine combination of two measures: two are better than one," Int J Business Intelligence and Data Mining, Vol 12, No 3, 2017, p 236 – 256, 2017 [5] E Keogh, "Mining Shape and Time Series Databases with Symbolic Representations," in Tutorial of the 13rd ACM International Conference on Knowledge Discovery and Data mining (KDD 2007), 2007 [6] K E., ",A Tutorial Finding Repeated Structure in Time Series Data," In 2015 SIAM International Conference on DATA MINING, SDM2015, Vancouver, Canada., 2015 [7] H Sakoe, S chiba, , "Dynamic programming algorithm optimization for spoken word recognition," in IEEE Trans Acoustics, Speech, and Signal Proc, 1978 [8] F Itakura, "Minimum prediction residual principle applied to speech recognition," in IEEE Trans Acoustics, Speech, and Signal Proc, 1975 [9] E Keogh, C A Ratanamahatana,, "Exact indexing of dynamic time warping”," Journal of Knowledge and Information Systems, vol 7, no 3, p 358 – 386, 2005 [10] Potolea, Hasna, Rodica, "The Longest Common Subsequence Distance usin ga Complexity Factor," In Proceedings of the 8th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management, vol Volume 1, pp pages 336-343, 2016 [11] T Gorecki, "Using derivatives in a longest common subsequence dissimilarity measure for time series classification," Pattern Recognition Letters, vol 45, p 99– 105, 2014 Trang 44 Luan van [12] S J Wilson, "Biểu diễn liệu khai phá liệu chuỗi thời gian: Phương pháp tiếp cận miền thời gian," Thống kê hội nhập, Số – 2017, p 35 – 41, 2017 [13] E Keogh, K Chakrabarti, M Pazzani, S Mehrotra, "Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases," in Conference on Knowledge and Information Systems, 2000 [14] J Lin, E Keogh, S Leonardi, B Chiu,, "A symbolic Representation of Time Series with Implications for Streaming Algorithms," in the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, San Diego, CA, 2003 [15] P Schäfer, "Scalable time series similarity search for data analytics," 2015 [16] L Wang, N Simões, S Ochoa, J P Leitão, R Pina, C Onof, A Sá Marques, Č Maksimović, R Carvalho, L David , "An enhanced blend of SVM and Cascade methods for short-term rainfall forecasting," 12nd International Conference on Urban Drainage, Porto Alegre/Brazil, 10-16 September 2011, pp 1-8, 2011 [17] Giuseppe Ateniese, Giovanni Felici, Luigi V Mancini, Angelo Spognardi, Antonio Villani, and Domenico Vitali, "Hacking Smart Machines with Smarter Ones: How to Extract Meaningful Data from Machine Learning Classifiers," International Journal of Security and Networks, 2013 [18] A Mueen, E Keogh , Q Zhu , S Cash, "Exact Discovery of Time Series Motifs," in Proc of SIAM Int on Data Mining, pp pp 473-484, 2009 Trang 45 Luan van S K L 0 Luan van

Ngày đăng: 27/12/2023, 03:56

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan