Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 43 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
43
Dung lượng
677,34 KB
Nội dung
ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Dự báo tài nguyên mạng Wifi Marketing NGUYỄN THỊ THÙY LINH linh.NTT211355M@sis.hust.edu.vn Chuyên ngành Toán Tin Giảng viên hướng dẫn: TS Thiều Quang Tùng Chữ ký GVHD Trường: Trung học sở Cầu Giấy HÀ NỘI, 08/2022 Mục lục LỜI CẢM ƠN ĐẶT VẤN ĐỀ 1.1 Quảng cáo trực tuyến 1.2 Mơ hình Wifi Marketing 1.3 Bài toán dự báo tài nguyên mạng Wifi Marketing 1.3.1 Phát biểu toán dự báo tài nguyên mạng Wifi Marketing 1.3.2 Ý nghĩa toán dự báo tài nguyên mạng Wifi Marketing 1 LÝ THUYẾT PHƯƠNG PHÁP 2.1 Phương pháp tiền xử lý liệu 2.1.1 Xử lý điểm liệu khuyết thiếu 2.1.2 Xử lý liệu ngoại lai 2.2 Phân rã chuỗi liệu dùng Loess 2.3 Mơ hình tự hồi quy Autoregressive 2.4 Mạng nhớ dài ngắn hạn 2.4.1 Mạng nơ ron (Neural netwwork) 2.4.2 Mạng nơ ron hồi quy (Recurrent neural networks) 2.4.3 Mạng nhớ dài ngắn hạn (Long-short term memory) 2.5 Xây dựng mơ hình kết hợp AR-LSTM 2.5.1 Mơ tả tốn 2.5.2 Mơ hình đề xuất 2.6 Tiêu chí đánh giá kết 7 10 12 14 14 15 19 20 20 20 22 KẾT QUẢ DỰ BÁO VÀ 3.1 Mô tả trình 3.2 Thu thập liệu 3.3 Thực nghiệm 3.3.1 Xử lý liệu 24 24 24 25 25 ĐÁNH GIÁ MƠ HÌNH GVHD: TS Thiều Quang Tùng 3.4 LUẬN VĂN THẠC SĨ 3.3.2 Phân rã chuỗi liệu dự báo thành phần 3.3.3 Dự báo ngày lễ ngày có kiện lớn Đánh giá kết TÀI LIỆU THAM KHẢO Học viên: Nguyễn Thị Thùy Linh 27 30 32 36 Danh mục hình vẽ 1.1 1.2 1.3 Thống kê số lượng người dùng Internet Việt Nam Sự tăng trưởng số lượng người dùng Internet Việt Nam Quá trình kết nối vào điểm Wifi Marketing 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 Ví dụ phát điểm bất thường sử dụng SR [3] Ví dụ phương pháp phân tách STL.[4] Nơ ron thần kinh Mơ hình mạng nơ ron đơn giản Phân loại mạng RNN Cấu trúc cell mạng RNN Cấu trúc cell LSTM Cấu trúc mơ hình đề xuất 10 12 14 15 16 17 19 21 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 Trực quan hóa liệu Dữ liệu sau xử lý ngày lễ lớn Phát điểm bất thường sử dụng SR Chuỗi liệu sau làm Kết phân rã liệu sử dụng STL Kết dự báo thành phần Trend Kết dự báo thành phần Seasonal Kết dự báo thành phần Residual Kết dự báo tổng thành phần Hệ số tương quan ngày 29/11/2019 Kết dự báo cuối Kết so sánh mơ hình 25 26 26 27 27 28 29 30 30 32 32 33 Danh sách bảng 3.1 3.2 Thơng số mơ hình LSTM Kết sai số 29 33 LỜI CẢM ƠN Lời cám ơn em xin gửi đến thầy cô Viện Tốn ứng dụng Tin học nói riêng thầy Trường Đại học Bách Khoa Hà Nội nói chung tận tâm giảng dạy truyền đạt kiến thức, kinh nghiệm quý báu cho em Đặc biệt, em xin cám ơn thầy Thiều Quang Tùng tin tưởng giao phó đề tài "Dự báo tài nguyên mạng Wifi Marketing" Đây đề tài có tính ứng dụng thực tế cao nhiều nhà quản lý quan tâm Ngoài ra, em xin cảm ơn thầy Tạ Anh Sơn giúp đỡ em nhiều trình thực đề tài Trong trình thực hiện, luận văn khơng tránh khỏi sai sót, em mong góp ý thầy bạn để luận văn hồn thiện hơn! TĨM TẮT NỘI DUNG LUẬN VĂN Trong luận văn này, em xin phép trình bày q trình xây dựng mơ hình dự báo số lượng lượt truy cập mạng Wifi Trong luận vặn, em sử dụng mơ hình lai AR-LSTM, so sánh kết mơ hình cụ thể ARIMA, LSTM, Prophet AR-LSTM Bên cạnh đó, luận văn sử dụng số phương pháp để phân rã liệu, giúp cho kết dự báo xác Luận văn gồm phần với nội dung cụ thể chương sau: Đặt vấn đề: Chương trình bày số kiến thức xung quanh lĩnh vực Wifi Marketing, phát biểu toán phân bổ tài nguyên mạng Wifi Marketing Lý thuyết phương pháp: Chương trình bày chi tiết số phương pháp dự báo chuỗi thời gian: AR, LSTM Bên cạnh số phương pháp giúp phát điểm liệu bất thường Spectual Residual, Nhận xét lựa chọn mô hình phù hợp với chuỗi liệu thực tế sử dụng để thử nghiệm Quá trình dự báo đánh giá kết quả: Chương trình bày chi tiết mơ hình bước q trình dự báo dựa mơ hình lựa chọn So sánh kết dự báo với mơ hình khác Kết luận văn trình bày hội nghị: "The International Conference on Intelligent Systems and Networks - ICISN 2021" với tên báo khoa học "Solving Resource Forecasting in Wifi Networks by Hybrid AR-LSTM model" Học viên thực Một số ký hiệu chữ viết tắt Ký hiệu Tiếng Anh Tiếng Việt AR Autoregressive Tự hồi quy LSTM Long-short term memory Bộ nhớ dài ngắn hạn ARIMA STL Autoregressive integrated moving average Seasonal-Trend decomposition using LOESS Tự hồi quy kết hợp trung bình trượt Phân rã Loess RNN Recurrent Neural Network Mạng nơ ron hồi quy SR Spectral Residual Phổ dư Wifi Wireless Fidelity Sử dụng sóng vơ tuyến truyền tín hiệu qua kết nối không dây Chương ĐẶT VẤN ĐỀ 1.1 Quảng cáo trực tuyến Quảng cáo trực tuyến xuất lần đầu vào năm 1994 trang web du lịch HotWire bán quảng cáo biểu ngữ cho số nhà quảng cáo [1] Quảng cáo trực tuyến loại hình quảng cáo thể Internet, hình thức tiếp thị quảng cáo sử dụng Internet để truyền tải thông điệp tiếp thị quảng cáo đến người tiêu dùng Quảng cáo trực tuyến đóng vai trị quan trọng tổng thể ngành quảng cáo dễ dàng đo lường độ hiệu quảng cáo thông qua số lượt nhấp hiển thị người tiêu dùng Với bùng nổ công nghệ nay, hội tiếp cận với Internet nhiều người ngày dễ dàng Quảng cáo trực tuyến ngày phát triển với tốc độ nhanh Năm 2016, doanh thu quảng cáo trực tuyến Mỹ vượt qua doanh thu quảng cáo qua truyền hình, đạt tổng doanh thu 72.5 tỷ đô-la Năm 2017, tổng doanh thu quảng cáo trực tuyến đạt 83 tỷ đô-la, tăng trưởng lên đến 14% [2] Có nhiều loại hình thức quảng cáo trực tuyến Có thể kể đến loại sau: • Quảng cáo hiển thị • Quảng cáo đan xen • Quảng cáo thơng qua máy tìm kiếm • Quảng cáo thơng qua mạng xã hội • Quảng cáo qua email GVHD: TS Thiều Quang Tùng LUẬN VĂN THẠC SĨ Với hỗ trợ Internet thiết bị, quảng cáo trực tuyến hiển thị đa dạng loại nội dung văn bản, hình ảnh, video, chí quảng cáo tương tác (ví dụ quảng cáo game) Một nhiều ưu điểm quảng cáo trực tuyến cách tính tốn chi phí quảng cáo Có nhiều hình thức toán khác nhau, dựa vào tương tác người tiêu dùng với quảng cáo, số cách thức phổ biến như: • CPC (cost per click - giá lần click) • CPM (cost per mille - giá cho nghìn lượt hiển thị) • CPE (cost per engagement - giá lượt tương tác) • CPV (cost per view - giá cho lần xem) • CPI (cost per install - giá cho lần cài đặt) 1.2 Mơ hình Wifi Marketing Nghiên cứu Strategy Analytics thực vào tháng 4/2014 cho thấy, mạng Wifi phủ sóng khắp tồn giới: Mỹ có tới 61,1% người dùng, Anh có 73,3% người dùng, Hàn Quốc 80,1%, Nhật Bản 68,4% người dùng Wifi Trong đó, 70% người dùng thiết bị di động, laptop, smartphone kết nối điểm phát Wifi cơng cộng thời gian sử dụng trung bình khoảng giờ1 Hầu hết, người dùng thích sử dụng Wifi mạng phủ sóng phổ biến, miễn phí ổn định hạ tầng mạng viễn thơng di động (3G/4G) Hình 1.1: Thống kê số lượng người dùng Internet Việt Nam.2 Học viên: Nguyễn Thị Thùy Linh 2 LUẬN VĂN THẠC SĨ GVHD: TS Thiều Quang Tùng Theo thống kê We Are Social Hootsuite3 kỹ thuật số (digital) Việt Nam tháng 2, tính đến tháng năm 2022 Việt Nam có 72,1 triệu người sử dụng dịch vụ Internet Phân tích Kepios người dùng Internet Việt Nam tăng 3,4 triệu (+4,9 %) từ năm 2021 đến 2022.Về góc độ, số liệu người dùng tiết lộ 26,46 triệu người Việt Nam không sử dụng Internet vào đầu năm 2022, có nghĩa 26,8% dân số ngoại tuyến vào đầu năm Tuy nhiên, vấn đề liên quan đến COVID-19 tiếp tục ảnh hưởng đến nghiên cứu việc áp dụng internet, số liệu người dùng internet thực tế cao số công bố đề xuất.Điều cho thấy tiềm phương thức quảng cáo kết hợp di động, Wifi mạng xã hội lớn, tảng để Wifi Marketing đời phát triển Hình 1.2: Sự tăng trưởng số lượng người dùng Internet Việt Nam.4 Mơ hình Wifi Marketing mơ hình quảng cáo thơng qua việc truy cập người dùng vào điểm Wifi công cộng Khi người dùng yêu cầu truy cập Wifi, họ phải đáp ứng yêu cầu từ nhà cung cấp để kết nối Internet miễn phí Một nghiên cứu từ Yankee Group cho thấy 96% người tiêu dùng thích cửa hàng cung cấp Wifi miễn phí 78% người tiêu dùng truy cập Wifi cung cấp cửa hàng Do vậy, hội lớn cho nhà quảng cáo Quảng cáo Wifi Marketing thường loại quảng cáo yêu cầu người dùng phải tương tác như: • Nhấn vào đường liên kết website nhà tài trợ https://www.strategyanalytics.com/ https://datareportal.com/reports/digital-2022-vietnam https://wearesocial.com/ https://datareportal.com/reports/digital-2022-vietnam Chương Học viên: Nguyễn Thị Thùy Linh GVHD: TS Thiều Quang Tùng LUẬN VĂN THẠC SĨ Phân rã liệu dự báo thành phần • Đến bước này, ta có liệu làm Chuỗi liệu phân tách thành ba thành phần cách sử dụng phương pháp STL Ba thành phần tách là: Season, Trend Remainder • Đối với thành phần Season, sử dụng mơ hình tự hồi quy AR để dự báo cho 30 điểm liệu • Tương tự, thành phần Trend, sử dụng mơ hình tự hồi quy AR để dự báo cho 30 điểm liệu • Đối với thành phần Remainder, sử dụng chuỗi liệu Remainder để huấn luyện mơ hình LSTM sau dự báo 30 điểm liệu • Sau sử dụng mơ hình AR mơ hình LSTM để dự báo cho 30 điểm liệu tiếp theo, cộng thành phần dự báo vào với nhau, kết nhận chuỗi dự báo cho 30 ngày Nếu 30 ngày tương lai có ngày lễ lớn đợt kiện lớn cần tiến tới bước xử lý ngày lễ tương lai sau Xử lý điểm liệu ngày lễ, tết Lượt truy cập ngày lễ dự báo cách độc lập, dựa vào tương quan ngày lễ xảy khứ ngày liền trước ngày lễ lịch sử 2.6 Tiêu chí đánh giá kết Các nghiên cứu ln có tiêu chí đánh giá kết kèm theo, tác giả thực so sánh với mơ hình dự báo khác thông số sai số tuyệt đối phần trăm trung bình (MAPE), sai số tuyệt đối (MAE) sai số tồn phương trung bình (MSE) Trong đó, toán dự báo ngắn hạn số MAPE chấp nhận khoảng 10 % n X |Yi − Yˆi | M AP E = ∗ 100% n Yi (2.16) i=1 M AE = M SE = Học viên: Nguyễn Thị Thùy Linh n X |Yi − Yˆi | n i=1 n X n (Yi − Yˆi )2 (2.17) (2.18) i=1 22 22 LUẬN VĂN THẠC SĨ GVHD: TS Thiều Quang Tùng Tuy nhiên, tiêu chí trên, giá trị thực x = kết khơng cịn xác, tơi đề xuất sử dụng thêm hai tiêu chí sai số phần trăm tuyệt đối trung bình đối xứng [9] (Symmetric Mean Absolute Percentage Error hay sMAPE) chuẩn hóa bậc hai sai số tồn phương trung bình (normalize Root Mean Square Error): s(Y, Yˆ ) = |Y − Yˆ | (|Y | + |Yˆ |)2 √ nRM SE = M SE Y (2.19) (2.20) Trong đó, Yi , Yˆi Y giá trị thật, giá trị dự báo giá trị trung bình chuỗi liệu Chương 23 Học viên: Nguyễn Thị Thùy Linh Chương KẾT QUẢ DỰ BÁO VÀ ĐÁNH GIÁ MƠ HÌNH Trong chương này, luận văn trình bày thực nghiệm quy trình đề xuất chương Sau dựa vào thực nghiệm, luận văn đánh giá kết quả, nhận xét, so sánh với số phương pháp phổ biến khác đưa định hướng 3.1 Mơ tả q trình Luận văn tiến hành chạy thực nghiệm để đưa dự báo số lượt người truy cập cho điểm truy cập Wifi 30 ngày tới Sau so sánh kết so với số phương pháp phổ biến khác, cho thấy tính đắn mơ hình 3.2 Thu thập liệu Dữ liệu thực nghiệm lượt truy cập thực tế điểm truy cập Wifi nằm chuỗi trung tâm thương mại VINCOM Dữ liệu điểm truy cập lưu vào file csv Lượt truy cập địa điểm thu thập theo chu kỳ ngày Mỗi file csv có liệu lịch sử từ 01/01/2016 - 31/12/2019 Tổng cộng liệu có khoảng 1095 điểm liệu 24 LUẬN VĂN THẠC SĨ GVHD: TS Thiều Quang Tùng Hình 3.1: Trực quan hóa liệu Hình 3.1 trực quan hóa file liệu Đồ thị chia thành phần, phần tương ứng với liệu năm (từ 2016 đến hết năm 2019) 3.3 Thực nghiệm Thực nghiệm bên mơ tả lại q trình dự báo số lượng truy cập vào điểm WiFi marketing Khoảng thời gian dự báo để minh họa từ ngày 03-11-2019 đến ngày 03-12-2019 3.3.1 Xử lý liệu Đầu vào liệu có danh sách ngày lễ ví dụ ngày lễ Tết Âm Lịch, Tết dương lịch, Nghỉ lễ Quốc Khánh, nghỉ lễ Độc Lập, nghỉ lễ ngày Quốc Tế lao động ngày có kiện lớn địa điểm cụ thể ví dụ như: kiện âm nhạc lớn, ngày Thứ Sáu Đen Tiến hành loại bỏ ngày lễ khỏi chuỗi liệu thời gian cách thay đổi giá trị ngày thành giá trị trung bình ngày cách trước sau ngày bất thường bảy ngày, tương đương tuần Chương 25 Học viên: Nguyễn Thị Thùy Linh GVHD: TS Thiều Quang Tùng LUẬN VĂN THẠC SĨ Hình 3.2: Dữ liệu sau xử lý ngày lễ lớn Sau ngày lễ kiện lớn loại bỏ, chuỗi liệu số điểm liệu bất thường Sử dụng phương pháp phát điểm bất thường chuỗi liệu thuật toán Spectral Residual Các ngày có giá trị xem bất thường đánh dấu chấm đỏ hình 3.3 Hình 3.3: Phát điểm bất thường sử dụng SR Tiến hành xử lý điểm bất thường cách thay đổi giá trị lượt truy cập ngày giá trị trung bình ngày cách trước sau Học viên: Nguyễn Thị Thùy Linh 26 26 LUẬN VĂN THẠC SĨ GVHD: TS Thiều Quang Tùng ngày bất thường bảy ngày, tương đương tuần Kết nhận hình 3.4 Hình 3.4: Chuỗi liệu sau làm 3.3.2 Phân rã chuỗi liệu dự báo thành phần Chuỗi liệu sau xử lý giá trị lượt truy cập ngày lễ ngày có lượt truy cập bất thường phân rã thành thành phần Trend, Seasonal , Residual Bước phân rã chuỗi thời gian sử dụng phương pháp STL trình bày chương Kết sau phân rã thể qua hình 3.5 Hình 3.5: Kết phân rã liệu sử dụng STL Chương 27 Học viên: Nguyễn Thị Thùy Linh GVHD: TS Thiều Quang Tùng LUẬN VĂN THẠC SĨ Từ hình 3.5 rút số nhận xét chuỗi thành phần: • Chuỗi Trend thể tính xu hướng liệu nên có dạng tương đồng với dạng liệu gốc Bên cạnh đó, thành phần dao động khoảng 20000-40000 lượt truy cập, chiếm khoảng 50% Vì vậy, kết dự báo thành phần đóng vai trị then chốt định lớn tới độ xác mơ hình • Chuỗi Seasonal mơ tả tính chất mùa liệu nên có dạng dao động hình sin rõ ràng, điều có lợi lớn dự báo • Chuỗi Residual thành phần tạo nên bất thường, biến động mạnh khó khăn cho việc dự báo • Hai chuỗi Seasonal Residual có tỷ trọng nhỏ, đặc biệt chuỗi Resid, kết dự báo chuỗi ảnh hưởng tới kết cuối Thành phần Trend Seasonal dự báo sử dụng mơ hình tự hồi quy trình bày chương Trong đó, tham số p chuỗi Trend lựa chọn chuỗi Seasonal chọn với kết phân tích hàm tự tương quan Kết dự báo trình bày hình 3.6 hình 3.7 Hình 3.6: Kết dự báo thành phần Trend Học viên: Nguyễn Thị Thùy Linh 28 28 LUẬN VĂN THẠC SĨ GVHD: TS Thiều Quang Tùng Hình 3.7: Kết dự báo thành phần Seasonal Trong đó, thành phần Seasonal có dạng dao động rõ ràng nên mặt hình ảnh tốt thành phần Trend, nhiên mặt sai số, hai thành phần thể tốt số MAPE dao động khoảng 4-6% Thành phần cuối Residual thành phần khó dự báo nên luận văn có sử dụng mơ hình LSTM với lớp có thơng số bảng 3.1 Bảng 3.1: Thơng số mơ hình LSTM Lớp Thơng số LSTM 128 LSTM 64 Drop out 0.2 Dense 30 Hàm kích hoạt Tanh Kỷ nguyên 100 Kết dự báo thể hình (3.8) Chương 29 Học viên: Nguyễn Thị Thùy Linh GVHD: TS Thiều Quang Tùng LUẬN VĂN THẠC SĨ Hình 3.8: Kết dự báo thành phần Residual Cuối cùng, kết cộng gộp với hình 3.9 Hình 3.9: Kết dự báo tổng thành phần Có thể thấy rõ vị trí cao mơ hình chưa thể dự báo xác, cần có thêm cơng đoạn xử lý điểm bất thường loại bỏ phần 3.3.3 Dự báo ngày lễ ngày có kiện lớn Đối với ngày lễ ngày có kiện lớn Tôi sử dụng tương quan ngày lễ lịch sử so với ngày gần ngày lễ Trong đoạn dự báo minh họa trên, từ ngày 03-11-2019 đến ngày 03-12-2019 có kiện lớn trung tâm thương mại nói chung, có chuỗi VINCOM Sự kiện lớn ngày Thứ Sáu Đen (Black Friday), vào ngày 29-11-2019 Thứ sáu Đen, Thứ Sáu Đen tên gọi khơng thức cho ngày thứ sáu sau Lễ Tạ Ơn (ngày Lễ Tạ Ơn rơi vào ngày Thứ Năm lần thứ tháng 11 Hoa Kỳ, Thứ Sáu đen rơi vào khoảng ngày 23-29 tháng 11) Học viên: Nguyễn Thị Thùy Linh 30 30 LUẬN VĂN THẠC SĨ GVHD: TS Thiều Quang Tùng coi ngày mở hàng cho mùa mua sắm Giáng sinh Mỹ kể từ năm 1952 Sự kiện Thứ Sáu Đen ảnh hưởng đến lượt truy cập vào hệ thống WiFi marketing địa điểm trung tâm thương mại Vincom, cụ thể số lượng lượt truy cập tăng lên nhiều so với ngày thường khác Để dự báo số lượng lượt truy cập ngày lễ này, cần phân tích tương quan ngày lễ ngày thường trước Tính hệ số tương quan Tương quan tính lượt truy cập ngày lễ ngày thường trước cách sử dụng lượt truy cập ngày lễ trung bình lượt truy cập n ngày trước ngày lễ Nói cách khác, hệ số tương quan ngày lễ ngày thường tính cách sau: • Tính hệ số số lượt truy cập ngày lễ giá trị trung bình n ngày thường trước ngày thực dự báo Khoảng cách ngày thực dự báo đến ngày lễ m ngày Mỗi năm, với ngày lễ tính hệ số • Tính trung bình hệ số năm, kết hệ số tương quan ngày lễ cần dự báo Sau có hệ số tương quan này, số lượt truy cập dự báo cho ngày lễ tính cách nhân hệ số α với giá trị trung bình lượt truy cập n ngày trước ngày thực dự báo Áp dụng phương pháp đoạn dự báo từ ngày 03-11-2019 đến ngày 03- 12-2019 Trong đoạn thời gian có ngày Black Friday 29/11/2019 ngày lễ biết trước, ta tính tương quan ngày Black Friday năm trước (Hình 4-10) kết α = 2,4 Khi có hệ số này, dễ dàng tính lượt truy cập ngày 29/11/2019 Chương 31 Học viên: Nguyễn Thị Thùy Linh GVHD: TS Thiều Quang Tùng LUẬN VĂN THẠC SĨ Hình 3.10: Hệ số tương quan ngày 29/11/2019 Sau tính lượt truy cập ngày 29/11/2019, thay giá trị vào chuỗi dự báo hình 3.11 kết dự báo cuối quy trình Hình 3.11: Kết dự báo cuối 3.4 Đánh giá kết Kết quy trình đề xuất so sánh với số phương pháp phổ biến ARIMA, Prophet, LSTM đơn, đó: • Prophet phương pháp dự báo chuỗi thời gian Facebook giới thiệu Quy trình dựa mơ hình cộng xu hướng phi tuyến tính phù hợp với thời vụ hàng năm, hàng tuần hàng ngày, cộng Học viên: Nguyễn Thị Thùy Linh 32 32 LUẬN VĂN THẠC SĨ GVHD: TS Thiều Quang Tùng với hiệu ứng ngày lễ Nó hoạt động tốt với chuỗi thời gian có hiệu ứng theo mùa số mùa liệu lịch sử • ARIMA (Autoregressive Integrated Moving Average – Tự hồi quy tích hợp Trung bình trượt) phương pháp dự báo liệu chuỗi thời gian phổ biến George Box Gwilym Jenkins nghiên cứu công bố năm 1976 Với tham số sử dụng (1,0,7) Sử dụng tham số đánh giá sMAPE n-RMSE để so sánh phương pháp Các giá trị sai số tính trung bình cho 20 địa điểm liệu Bảng 3.2 sau so sánh kết dự báo tháng cuối năm 2019 Ngoài ra, mặt hình ảnh so sánh thơng qua hình 3.12: Hình 3.12: Kết so sánh mơ hình Bảng 3.2: Kết sai số Chỉ số LSTM sMAPE n-RMSE ARIMA Prophet AR-LSTM 10.59% 9.54% 10.87% 4.11% 14.32% 12.42% 13.55% 7.67% Kết sử dụng tham số đánh giá sMAPE nRMSE cho thấy quy trình mà luận văn đề xuất tốt ba phương pháp lại Tuy nhiên, kết so sánh dự báo tháng cuối năm 2019, nên kết luận quy trình mà luận văn đề xuất tốt hoàn toàn so với phương pháp chưa Chương 33 Học viên: Nguyễn Thị Thùy Linh GVHD: TS Thiều Quang Tùng LUẬN VĂN THẠC SĨ xác Tuy vậy, bước đầu cho thấy quy trình dùng kết hợp AR LSTM xử lý riêng ngày lễ cho kết khả quan Học viên: Nguyễn Thị Thùy Linh 34 34 Kết Luận Luận văn trình bày quy trình nhằm dự báo tài nguyên mạng Wifi Marketing, cụ thể số lượt truy cập người dùng tương lai mô hình kết hợp mơ hình tự hồi quy mạng LSTM Kết đạt đóng góp luận văn: • Giới thiệu quảng cáo trực tuyến mơ hình Wifi Marketing Nêu lên vai trị, ý nghĩa việc dự báo tài nguyên mạng Wifi Marketing • Trình bày hướng tiếp cận giải tốn dự báo quy trình kết hợp AR LSTM • Thực nghiệm liệu gồm nhiều điểm Wifi Marketing trung tâm thương mại lớn So sánh kết đạt với prophet, ARIMA hay LSTM Tuy nhiên, hạn chế mặt thời gian kiến thức nên luận văn số hạn chế sau: • Chưa đánh giá kết chạy dự báo toàn độ dài chuỗi liệu • Chưa tối ưu thời gian chạy mơ hình Một số đề xuất cải tiến nâng cấp tương lai gần: • Xây dựng quy trình phù hợp loại địa điểm cụ thể • Dự báo tốt ngày lễ ngày bất thường • Kết hợp liệu thời tiết tỉnh thành Việt Nam để cải thiện kết dự báo • Áp dụng mơ hình nhiều lĩnh vực khác 35 Tài liệu tham khảo [1] David S Evans, The Economics of the Online Advertising Industry, Review of Network Economics, Vol.7, Issue 3, 2008 [2] eMarketer Report, US Ad Spending: eMarketer’s Updated Estimates and Forecast for 2017, 2017 [3] Hansheng Ren, Bixiong Xu, Yujing Wang, Chao Yi, Congrui Huang, Xiaoyu Kou, Tony Xing, Mao Yang, Jie Tong, Qi Zhang, Time-Series Anomaly Detection Service at Microsoft, the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2019 [4] Robert B Cleveland, Willam S Cleveland, Jean E McRae, and Irma Terpenning, STL: A Seasonal-Trend Decomposition Procedure Based on Loess, Journal of Official Statistics, Vol.6, No 1, 1990, pp 3-73 [5] Luis M de Alfonso, Quantitative Methods Level II 2020, DBF Finance, 2020 [6] Sepp Hochreiter, Jurgen Schmidhuber, Long Short-term memory, Neural Computation, Vol.9 , 1997, pp 1735-1780 [7] Jason Brownlee, Introduction to Time Series Forecasting with Python, 2020 [8] Peter Zhang Zhang, g.p: Time series forecasting using a hybird arima and neural network model, Neurocomputing 50, 159-175, 2003 [9] Vladik Kreinovich, Hung T Nguyen, Rujira Ouncharoen, How to Estimate Forecasting Quality: A SystemMotivated Derivation of Symmetric Mean Absolute Percentage Error (SMAPE) and Other Similar Characteristics, Technical Report: UTEP-CS-14-53, 2014 36