DỰ BÁO NHU CẦU DU KHÁCH ĐẾN THỪA THIÊN HUẾ DỰA TRÊN MẠNG NƠ-RON NHÂN TẠO

17 0 0
DỰ BÁO NHU CẦU DU KHÁCH ĐẾN THỪA THIÊN HUẾ DỰA TRÊN MẠNG NƠ-RON NHÂN TẠO

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tạp chí Khoa học Đại học Huế: Kinh tế Phát triển; pISSN: 2588–1205; eISSN: 2615–9716 Tập 130, Số 5A, 2021, Tr 17–33; DOI: 10.26459/hueunijed.v130i5A.6152 DỰ BÁO NHU CẦU DU KHÁCH ĐẾN THỪA THIÊN HUẾ DỰA TRÊN MẠNG NƠ-RON NHÂN TẠO Võ Viết Minh Nhật1, *, Lê Văn Hòa2, Nguyễn Thị Thúy Vân2, Hoàng Thị Huế2 Cơ quan Đại học Huế, Điện Biên Phủ, Huế, Việt Nam Trường Du lịch, Đại học Huế, 22 Lâm Hoằng, Huế, Việt Nam * Tác giả liên hệ: Võ Viết Minh Nhật (Ngày nhận bài: 11-1-2021; Ngày chấp nhận đăng: 19-2-2021) Tóm tắt Dự báo xác nhu cầu du khách đến điểm đến đóng vai trị quan trọng việc tư vấn cho nhà sách để lập kế hoạch đưa chiến lược liên quan đến đầu tư sở vật chất, nâng cấp hạ tầng phát triển dịch vụ Có nhiều cách tiếp cận khác dự báo nhu cầu du khách, dự báo dựa liệu chuỗi thời gian thu hút nhiều quan tâm tính chất khơng có cấu trúc loại liệu đặc biệt Mạng nơ-ron nhân tạo đánh giá phương pháp dự báo đặc biệt phù hợp với loại liệu khơng có cấu trúc Bài báo nghiên cứu việc sử dụng mạng nơ-ron nhân tạo, bao gồm: MLP, RBF ELN, để dự báo liệu chuỗi thời gian du khách đến Thừa Thiên Huế Các phân tích so sánh dựa mơ mạng RBF cho kết dự báo tốt với MSE, RMSE, MAE MAPE thấp Kết không tương đồng với nghiên cứu trước mà khẳng định thêm tính chuyển đổi khơng gian từ phi tuyến thành tuyến tính lớp ẩn làm cho RBF trở nên mạnh mẽ loại liệu khơng có cấu trúc Từ khóa: Dự báo nhu cầu du lịch, liệu chuỗi thời gian, mạng nơ-ron nhân tạo, liệu du khách đến Thừa Thiên Huế Forecasting tourism demand for Thua Thien Hue based on artificial neural networks Vo Viet Minh Nhat1, *, Le Van Hoa2, Nguyen Thi Thuy Van2, Hoang Thi Hue2 Hue University, Dien Bien Phu St., Hue, Vietnam School of Hospitality and Tourism, Hue University, 22 Lam Hoang St., Hue, Vietnam * Correspondence to Vo Viet Minh Nhat (Received: January 11, 2021; Accepted: February 19, 2021) Abstract Accurate tourism demand forecasting for a destination plays a vital role in advising policymakers to plan and devise strategies related to investments in facilities, infrastructure improvements and services development There are many different approaches in tourism demand forecasting, in which the one based Võ Viết Minh Nhật CS Tập 130, Số 5A, 2021 on time-series data has attracted the most attention due to the unstructured nature of the particular data type Neural networks have been evaluated as a predictive method specifically suited to this type of unstructured data This paper examines the usage of neural networks, including MLP, RBF and ELN, to forecast tourism demand using time-series data in Thua Thien Hue The analysis and comparison based on simulation show that the RBF network gives the best forecast result with the lowest MSE, RMSE, MAE and MAPE This result is not only consistent with previous studies but also further confirms that the spatial conversion from nonlinear to linear of the hidden layer makes RBF powerful for the non-structural data Keywords: Tourism demand forecasting, time-series data, artificial neural networks, tourist arrivals to Thua Thien Hue Đặt vấn đề Với tác động trình tồn cầu hóa đời sống người ngày nâng cao, du lịch ngày phát triển nhanh chóng Đối với nhiều vùng miền hay quốc gia, du lịch đóng vai trị quan trọng có đóng góp đáng kể cho tăng trưởng GDP (Gross domestic product) hay GRDP (Gross regional domestic product) địa phương Du lịch khơng thúc đẩy kinh doanh, thương mại đầu tư vốn mà tạo nhiều việc làm khuyến khích tinh thần kinh doanh cho nhiều tầng lớp lao động Mỗi tỉnh, thành phố, vùng miền hay quốc gia muốn biết liệu du khách đến địa phương để có kế hoạch xây dựng, lựa chọn chiến lược đầu tư phát triển sản phẩm, dịch vụ phù hợp Do đó, dự báo tin cậy đóng vai trị quan trọng quy hoạch du lịch điểm đến Dự báo (forecasting) trình tổ chức thơng tin q khứ tượng để dự đoán tương lai Trong lĩnh vực du lịch, dự báo nhu cầu du lịch (tourism demand forecasting) thực dựa liệu lịch sử nhu cầu du lịch thể hình thức chuỗi thời gian (time series) Nhu cầu du lịch đo lường nhiều hình thức khác số lượng du khách đến/ (tourist arrivals/ departures), mức chi tiêu/ khoản thu du lịch (tourism expenditures/ receipts), mức xuất khẩu/ nhập du lịch (travel exports/ imports), thời gian lưu trú du khách (tourist length of stay), số đêm nghỉ chỗ lưu trú du khách (nights spent at tourist accommodation) v.v [1] Do đó, mơ hình dự báo chuỗi thời gian cố gắng xác định xu hướng, độ dốc chu kỳ (tức thực phép đo khoảng thời gian liên tiếp) liệu chuỗi thời gian Không giống phương pháp dựa việc quan sát mẫu ngẫu nhiên, mơ hình dự báo chuỗi thời gian dựa giá trị liên tiếp đại diện cho phép đo liên tiếp thực khoảng thời gian cách (hàng tháng, hàng quý hàng năm) Khi mẫu thiết lập, mơ hình chuỗi thời gian tạo dự đoán giá trị tương lai cho chuỗi thời gian tới Sử dụng mạng nơ-ron nhân tạo (Artificial Neural Networks - ANN) để dự báo liệu chuỗi 18 jos.hueuni.edu.vn Tập 130, Số 5A, 2021 thời gian thu hút nhiều quan tâm hai thập kỷ qua Một đặc điểm khiến dự báo dựa ANN ngày áp dụng rộng rãi ANN đóng vai trị phương pháp xấp xỉ hàm phổ quát có khả ánh xạ hàm tuyến tính phi tuyến điều kiện định Trái ngược với mơ hình chuỗi thời gian tuyến tính tính linh hoạt nó, ANN thiếu quy trình hệ thống tiêu chuẩn để xây dựng mơ hình Việc mơ hình hóa ANN chủ yếu dựa kinh nghiệm vấn đề giải Do đó, việc có ANN tin cậy thường liên quan đến việc lựa chọn số lượng lớn tham số thực nghiệm, yêu cầu xác nhận chéo (cross-validation) phụ thuộc vào liệu Trong 10 năm trở lại đây, có nhiều nghiên cứu liên quan đến việc ứng dụng mơ hình ANN dự báo nhu cầu du lịch dựa liệu chuỗi thời gian Đa số nghiên cứu xem xét trường hợp liệu cụ thể, dự báo nhu cầu du lịch đến vùng miền [1, 5, 8, 9] hay quốc gia [6, 10–13, 15, 17], dự báo nhu cầu qua đêm sở lưu trú [12, 14], v.v Cũng khẳng định mơ hình ANN tốt cho trường hợp [15] Trong báo này, chúng tơi nghiên cứu mơ hình mạng nơ-ron cho việc dự báo nhu cầu du lịch đến điểm đến Thừa Thiên Huế, nhằm đề xuất hướng tiếp cận việc dự báo địa phương Cũng đa số nghiên cứu khác, ba mơ hình ANN, gồm mạng perceptron đa lớp (Multi-layer Perceptron - MLP), hàm xuyên tâm sở (Radial Basis Function RBF) mạng hồi quy Elman (Elman Network - ELN), xây dựng, mơ hình hố thử nghiệm với liệu du khách đến Thừa Thiên Huế giai đoạn từ 01/2017 đến 12/2019 Đóng góp báo bao gồm: – Mơ hình hố tốn dự báo dựa liệu chuỗi thời gian mà từ mơ hình mạng nơ-ron khác sử dụng để thực dự báo; – Xây dựng ba mơ hình mạng nơ-ron gồm MLP, RBF ELN để phục vụ cho việc dự báo; – Xây dựng kịch mơ thử nghiệm khác nhau, kiểu véc-tơ đầu vào khác thử nghiệm, số nơ-ron lớp ẩn phân tích khảo sát Từ loại mạng nơ-ron phù hợp cho dự báo liệu chuỗi thời gian cấu trúc Nội dung báo bao gồm mục Mục tóm lược đánh giá nghiên cứu liên quan 10 năm trở lại đây, tập trung vào mơ hình ứng dụng mạng nơron dự báo nhu cầu du lịch Trên sở phân tích, Mục mô tả chi tiết bước xây dựng mạng nơ-ron cho toán dự báo nhu cầu du lịch dựa chuỗi thời gian, bao gồm: phân tích, chuẩn hóa chuẩn bị liệu cho việc huấn luyện xây dựng ba mơ hình mạng nơ-ron MLP, RBF ELN cho dự báo nhu cầu du khách đến Thừa Thiên Huế Các phân tích độ xác dự báo mạng nơ-ron mô tả Mục Cuối cùng, kết luận trình bày Mục 19 Võ Viết Minh Nhật CS Tập 130, Số 5A, 2021 Các nghiên cứu liên quan Đã có nhiều nghiên cứu liên quan đến việc xây dựng mơ hình ứng dụng ANN vào dự báo nhu cầu du lịch Các mơ hình ANN đề xuất mơ hình mạng nơ-ron đơn (như MLP, RBF, ELN, v.v.) mơ hình kết hợp, chẳng hạn kết hợp giải thuật di truyền với mạng nơ-ron việc xác định số nơ-ron ẩn tối ưu [2] hay kết hợp Box-Jenkins với mạng nơron việc tính tổng kết dự báo thành phần có trọng số [3] Trong báo quan tâm đến việc đánh giá mơ hình ANNs đơn ứng dụng vào dự báo nhu cầu du lịch Sau tóm lược đánh giá ứng dụng ANN dự báo nhu cầu du lịch từ năm 2011 đến Trong nghiên cứu mình, Fernandes cs [5] phân tích khả cạnh tranh điểm đến du lịch dựa dự báo nhu cầu du khách đến với sử dụng phương pháp mạng perceptron đa lớp (MLP) Nghiên cứu tập trung vào liệu lượng khách qua đêm hàng tháng khách sạn hai khu vực miền Bắc miền Trung Bồ Đào Nha Kết thực nghiệm mơ hình ANN cho độ xác dự báo cao Từ tác giả khuyến cáo phương pháp ANN nên sử dụng cho liệu chuỗi thời gian có hành vi phi tuyến Nghiên cứu Lin, Chen Lee [6] cố gắng xây dựng mơ hình dự báo lượng du khách đến Đài Loan cách sử dụng phương pháp trung bình trượt kết hợp tự hồi quy (autoregressive integrated moving average – ARIMA), ANN hồi quy đa biến tự thích nghi (multivariate adaptive regression splines – MARS) Để đánh giá tính phù hợp mơ hình đề xuất, tập liệu du khách đến Đài Loan hàng tháng sử dụng Kết phân tích cho thấy ARIMA vượt trội so với ANN MARS dựa sai số trung bình bình phương gốc (root mean square error – RMSE), sai số trung bình tuyệt đối (mean absolute error – MAD) sai số phần trăm tuyệt đối trung bình (mean absolute percent error - MAPE) dự báo nhu cầu du lịch Trong nghiên cứu Teixeira Fernandes [7], mạng nơ-ron truyền thẳng (feedforward neural network – FFNN), mạng nơ-ron truyền phân cấp (cascade forward neural network – CFNN) mạng nơ-ron hồi quy (recurrent neural network – RNN) triển khai so sánh Đầu vào mơ hình ANN liệu 12 tháng trước hai đầu vào khác sử dụng cho năm tháng Ba mơ hình mạng cho giá trị MAPE từ 4% đến 6%, kiến trúc FFNN hoạt động tốt tập liệu xác thực (validation) tập liệu kiểm tra (test) với sai số 4,2% Claveria, Monte Torra [8] so sánh hiệu ANN khác dự báo nhu cầu du lịch Các tác giả kiểm tra độ xác dự báo ba loại kiến trúc ANN khác gồm MLP, RBF ELN Thực nghiệm lặp lại với cấu trúc liên kết có số đầu vào khác loại mạng Dữ liệu thực nghiệm lượng du khách đến Catalonia, Tây Ban Nha từ quốc gia khác khoảng thời gian từ năm 2001 đến 2012 Kết thực nghiệm 20 jos.hueuni.edu.vn Tập 130, Số 5A, 2021 cho thấy RBF MLP hoạt động tốt mạng ELN, RBF cung cấp dự báo tốt Kết thực nghiệm cho thấy số đầu vào lớn kết dự báo cải thiện Điều cho thấy tầm quan trọng việc tăng kích thước dự báo dài hạn Trong nghiên cứu mình, Cogurcu Kukrer [1] cố gắng xác định phương pháp dự báo mang lại hiệu suất tốt so sánh độ xác dự báo MLP, RBF mạng nơ-ron hồi quy tổng quát (generalized regression neural network – GRNN) để ước tính nhu cầu du lịch tàu biển hàng tháng đến Izmir, Thổ Nhĩ Kỳ Nghiên cứu sử dụng tổng số lượt du khách tàu biển nước làm thước đo nhu cầu du lịch tàu biển nước lượng du khách tàu biển hàng tháng đến cảng du lịch Izmir giai đoạn từ tháng 1/2005 đến 12/2013 Kết thực nghiệm cho thấy RBF vượt trội MLP GRNN độ xác dự báo dự báo nhu cầu du lịch tàu biển nội địa hàng tháng đến Izmir năm 2014 Nghiên cứu Teixeira Fernandes [9] khảo sát số kiến trúc khác MLP với 4, 6, nút ẩn dự báo nhu cầu du lịch đến Cape Verde Dữ liệu chuỗi thời gian sử dụng đặc biệt khó dự báo đặc tính khơng theo mùa vụ Với số đầu vào 12 tháng liên tiếp kiến trúc với số nút ẩn khác thử nghiệm, hiệu suất dự báo lần thử nghiệm cải thiện với giá trị MRE = 7,3% hệ số tương quan Pearson r = 0,92 Melda Akın [10] xem xét mơ hình ARIMA theo mùa vụ (Seasonal ARIMA - SARIMA), hồi quy véc-tơ hỗ trợ (Support Vector Regression - SVR) MLP tối ưu hóa thơng số chúng việc dự báo nhu cầu du khách quốc tế đến Thổ Nhĩ Kỳ Tác giả đề xuất cách tiếp cận lựa chọn mơ hình dự báo chuỗi thời gian dựa việc so sánh độ xác dự báo để chọn cách tiếp cận thích hợp Từ đó, mơ hình định xây dựng để xác định quy tắc lựa chọn mơ hình dự báo Constantino, Fernandes Teixeira [12] sử dụng mơ hình mạng nơ-ron nhân tạo để mơ hình hóa dự báo nhu cầu du lịch cho Mozambique giai đoạn từ 1/2004 đến 12/2013 Nhu cầu du lịch nghiên cứu số lượng khách lưu trú qua đêm khách sạn Một tập biến độc lập thử nghiệm đầu vào mơ hình, gồm: Chỉ số giá tiêu dùng (Consumer Price Index – CPI), tổng sản phẩm quốc nội (Gross Domestic Product – GDP) tỷ giá hối đoái (Exchange Rates – ER), thị trường du lịch du khách đến từ Nam Phi, Hoa Kỳ, Bồ Đào Nha Anh Một mơ hình tốt tìm thấy với MAPE đạt 6,5% hệ số tương quan Pearson đạt 0,696 Trong nghiên cứu Cankurt Subasi [13], hồi quy đa lớp (Multi-layer Regression – MLR), MLP SVR sử dụng để thực dự báo nhu cầu du lịch đến Thổ Nhĩ Kỳ Khác với nghiên cứu M Akin [10], nghiên cứu đề xuất mơ hình hồi quy đa lớp MLR với liệu lượng du khách đến Thổ Nhĩ Kỳ hàng tháng (từ 1/1996 đến 12/2013) Hiệu suất dự báo so sánh dựa sai số tuyệt đối tương đối (RAE) sai số trung bình bình phương gốc 21 Võ Viết Minh Nhật CS Tập 130, Số 5A, 2021 (RRSE) cho thấy SVR có hiệu suất tốt nhất, với RAE = 12,34% RRSE = 14,02% Trong nghiên cứu mình, Koutras, Panagopoulos Nikas [14] khảo sát đánh giá mơ hình dự báo tuyến tính phi tuyến dựa ANN nhu cầu du lịch ngành lưu trú Để dự báo hiệu quả, phương pháp MLP, SVR hồi quy tuyến tính (Linear Regression, LR) sử dụng với hai tập liệu thực nghiệm khác Ưu điểm mơ hình đề xuất độ xác dự báo chi phí dự báo thấp Với liệu lưu trú du lịch xem xét gồm công suất sử dụng số lượng khách lưu trú qua đêm khách sạn vùng phía Tây Hy Lạp, độ xác tương đối MLP SVR so sánh với mô hình LR Hiệu suất tương đối MLP SVR so sánh với Thực nghiệm kết hợp SVR RBF cho kết dự báo tốt mơ hình khác với sai số dự đốn nhỏ ổn định Mục đích Mavrommati Karakitsiou [15] nghiên cứu khả ứng dụng hiệu suất hai mơ hình học máy gồm mạng nơ-ron máy véc-tơ hỗ trợ việc dự báo nhu cầu du lịch Hy Lạp du khách từ nước không thuộc châu Âu nước châu Âu không sử dụng đồng Euro Dữ liệu chuỗi thời gian thu thập hàng năm từ năm 1990 đến 2015 sử dụng Kết thực nghiệm cho thấy phương pháp học máy khơng có khác biệt đáng kể hiệu suất Khơng có phương pháp tốt cho tất liệu Gregorić Baldigara [17] thiết kế mạng nơ-ron nhân tạo nhằm dự báo số lượng du khách Đức đến Croatia xem xét tính chất mùa liệu thực nghiệm Sự diện yếu tố thời vụ có tác động định nhu cầu du lịch phân tích Nghiên cứu dựa phân tích thời vụ phương pháp tiếp cận ANN sử dụng để xây dựng mơ hình mơ tả hành vi dịng du khách Đức đến Croatia Các kiến trúc mạng nơ-ron khác huấn luyện thử nghiệm; độ xác dự báo hiệu suất mơ hình phân tích Đánh giá hiệu suất mơ hình độ xác dự báo kiểm tra cách sử dụng sai số phần trăm tuyệt đối trung bình (MAPE) Kết thực nghiệm phân tích cho thấy giá trị MAPE đạt 1,601% cho biết độ xác dự báo mơ hình cao Tóm lại, nghiên cứu nêu cố gắng mơ hình hố tốn dự báo nhu cầu du lịch dựa liệu chuỗi thời gian xây dựng mơ hình mạng nơ-ron khác để thử nghiệm, đánh giá khả dự báo chúng Không có mơ hình ANN tốt tất loại liệu Tùy thuộc vào trường hợp cụ thể mà nghiên cứu mơ hình mạng nơ-ron phù hợp Tuy nhiên, có tỷ lệ lớn nghiên cứu cho mơ hình mạng MLP RBF khả dự báo xác cao so với mơ hình khác Khá nhiều nghiên cứu tập trung vào loại mạng MLP, RBF ELN để đánh giá hiệu chúng dự báo du lịch trường hợp du khách đến địa phương khác Do viết này, tiếp tục khảo sát hiệu dự báo ba mơ hình mạng nơ-ron MLP, RBF 22 jos.hueuni.edu.vn Tập 130, Số 5A, 2021 ELN việc dự báo nhu cầu du khách đến với Thừa Thiên Huế Mơ hình hóa mạng nơ-ron nhân tạo cho dự báo nhu cầu du lịch 3.1 Dữ liệu nhu cầu du lịch sử dụng Dữ liệu nhu cầu du lịch sử dụng báo lượng du khách đến Thừa Thiên Huế vòng năm (từ tháng 1/2017 đến 12/2019) trích xuất từ trang thông tin Sở Du lịch Thừa Thiên Huế [18] Thực tế, liệu du lịch điểm đến trước năm 2017 (từ năm 1998) thống kê, chủ yếu theo năm nên không đảm bảo cho việc dự báo theo tháng xem xét báo Dựa thể Hình 1, liệu du khách đến Thừa Thiên Huế tính thời vụ rõ ràng, nên khơng cần phân tích yếu tố thời vụ liệu Để cài đặt đánh giá khả dự báo, liệu chia thành hai phần: liệu huấn luyện liệu kiểm tra Tập liệu huấn luyện dùng giai đoạn huấn luyện mạng nơ-ron gồm 24 mẫu tương đương với số liệu du khách đến Thừa Thiên Huế vòng năm từ tháng 1/2017 đến tháng 12/2018 Tập liệu kiểm tra dùng giai đoạn kiểm tra để đánh giá độ xác mạng nơ-ron sau huấn luyện, bao gồm 12 mẫu tương đương với 12 tháng lại tập liệu từ tháng 1/2019 đến tháng 12/2019 3.2 Chuẩn hóa liệu Mạng nơ-ron thường phát huy hiệu suất với liệu chuẩn hóa Việc sử dụng liệu gốc để huấn luyện mạng nơ-ron làm chậm hội tụ Do đó, liệu cần phải chuẩn hóa bắt đầu mơ hình hóa để cải thiện độ xác, tốc độ hội tụ hiệu bước huấn luyện mạng Trong số phương pháp chuẩn hóa liệu, phương pháp sử dụng phổ biến chia tỷ lệ, thực để có phạm vi cụ thể, chẳng hạn phạm vi và 1, cho toàn tập liệu Ở đây, liệu chia tỷ lệ thành phạm vi từ đến trước giai đoạn huấn luyện Mục đích tất liệu du khách chuyển đổi thành Hình Phân bố liệu du khách đến Thừa Thiên Huế từ tháng 1/2019 đến tháng 12/2019 23 Võ Viết Minh Nhật CS Tập 130, Số 5A, 2021 giá trị từ đến thông qua việc chia khác biệt giá trị thực tế giá trị nhỏ cho khác biệt giá trị lớn nhỏ Phương trình cho phạm vi tỷ lệ [0, 1] cho Công thức (1): xi, = xi − x xmax − xmin (1) đó, xi giá trị thực tế, xmin giá trị nhỏ nhất, xmax giá trị lớn tập liệu; x’i giá trị chuẩn hóa 3.3 Chuẩn bị liệu cho huấn luyện Mạng nơ-ron sử dụng để dự báo xu hướng tương lai chuỗi thời gian từ giá trị xt–p+1 ,xt-p+2, …, xt đến thời điểm (thời điểm t) Điều có nghĩa giá trị ước tính thu x thời điểm t + d, từ p bước thời gian trở lại từ thời điểm t tính Cơng thức (2) xt +d = f ( X t ) = f ( xt − p+1 , xt − p+2 , , xt ) (2) Xt véc-tơ p giá trị x bị làm trễ Thông thường d đặt 1, nên hàm ƒ dự báo giá trị x Tiếp theo, ma trận liệu khác tạo cho liệu huấn luyện liệu kiểm tra sở số bước thời gian làm trễ (p) tương ứng với số đầu vào mạng nơ-ron số lượng dự báo (d) tương ứng với số đầu mạng nơ-ron Hình minh họa cho trường hợp với mạng nơ-ron với đầu vào đầu Hình cho thấy cấu trúc ma trận liệu với p = giá trị vào tương ứng với mốc thời gian (tháng) dự báo giá trị mốc thời gian tiếp (d = 1) 3.4 Tạo tập liệu huấn luyện kiểm tra Trong phương pháp dự báo dựa ANN, liệu thường chia thành ba bộ: liệu huấn luyện (training), liệu xác nhận (validation) liệu kiểm tra (test), để có mạng có khả khái quát hoạt động tốt với trường hợp 24 jos.hueuni.edu.vn Tập 130, Số 5A, 2021 Mẫu liệu Giá trị vào Kết x1 x2 x3 x4 x5 x2 x3 x4 x5 x6 x3 x4 x5 x6 x7 n xn xn+1 xn+2 xn+3 xn+4 Hình Cấu trúc ma trận liệu tương ứng với mạng nơ-ron có đầu vào đầu Trong giai đoạn huấn luyện mạng, trọng số sửa đổi lặp lặp lại sở giá trị vào tập huấn luyện, nhằm giảm thiểu lỗi (sự khác biệt) kết thực tế so với mục tiêu mong muốn Tuy nhiên, nhiều thông số trọng số liên quan đến vấn đề xem xét số lượng liệu huấn luyện dẫn đến tượng phù hợp (overfitting) Hiện tượng xảy mơ hình q phù hợp với đặc trưng khơng liên quan có liệu đào tạo, thay phù hợp với (hay hàm) tương quan giá trị vào kết ra, làm khả khái quát hóa cho trường hợp Để tránh vấn đề phù hợp, liệu xác nhận sử dụng để kiểm soát trình huấn luyện Trong trình huấn luyện, mạng nơ-ron sửa đổi trọng số sở liệu huấn luyện lỗi mạng thực với liệu xác nhận Do đó, xác định chắn trọng số tối ưu sở kiến trúc hoạt động tốt với liệu xác thực Giá trị tham số khác đóng phần việc học mạng xác định thơng qua liệu xác nhận Cuối cùng, hiệu cuối hệ thống xây dựng đo lường cách hồn tồn khách quan, lỗi thu từ liệu xác nhận không sử dụng làm sở đo lường mức độ đó, liệu tham gia vào trình huấn luyện Tập hợp liệu độc lập thứ ba phải sử dụng, liệu kiểm tra, cung cấp ước tính sai số khả khái qt hóa Khơng có quy tắc xác kích thước tối ưu việc phân chia ba tập liệu, đa số nghiên cứu đồng ý tập huấn luyện phải lớn Trong nghiên cứu này, liệu nhỏ nên liệu tách thành hai bộ: liệu huấn luyện liệu kiểm tra Dữ liệu từ tháng 1/2017 đến tháng 12/2018 sử dụng làm tập huấn luyện (66,67%) liệu từ 1/2019 đến 12/2019 sử dụng làm tập kiểm tra (33,33%) 3.5 Xây dựng mạng nơ-ron cho việc dự báo Mạng nơ-ron nhân tạo hệ thống phân tán song song bao gồm nhiều đơn vị xử lý đơn 25 Võ Viết Minh Nhật CS Tập 130, Số 5A, 2021 giản, gọi nơ-ron Các đơn vị xử lý có khả tính tốn hàm tốn học, mà hầu hết trường hợp phi tuyến Các nơ-ron kết nối với kết nối chiều xếp thành nhiều lớp để tạo thành mạng nơ-ron nhân tạo [19] Mạng nơ-ron nhân tạo có khả học thơng qua việc áp dụng phương pháp huấn luyện Dựa kết học được, mạng nơ-ron nhân tạo có khả khái qt hóa thơng qua việc đề xuất giải pháp cho trường hợp chưa có đáp án hữu Mạng nơ-ron sử dụng rộng rãi nhiều lĩnh vực khoa học, tính tốn kỹ thuật, y học nhiều lĩnh vực khác [19] Trong báo này, ba mơ hình mạng nơ-ron nhân tạo xem xét: mạng perceptron đa lớp, mạng xuyên tâm sở mạng hồi quy Elman Mạng perceptron đa lớp Mạng perceptron đa lớp (MLP) gồm tập nơ-ron nhân tạo xếp thành nhiều lớp, mà tín hiệu từ đầu vào truyền qua mạng qua lớp Như Hình 3(a), mạng MLP lớp với kết nối chiều từ lớp vào đến lớp ẩn từ lớp ẩn đến lớp ra; khơng có kết nối nơ-ron lớp MLP coi kiến trúc linh hoạt khả ứng dụng sử dụng tính tốn gần nhiều toán khác nhận dạng mẫu, điều khiển tự động, dự báo liệu chuỗi thời gian, tối ưu hóa v.v [19] Q trình huấn luyện mạng nơ-ron bao gồm việc điều chỉnh liên tục trọng số liên kết nơ-ron để tìm tập trọng số cho ánh xạ tốt kiện mong muốn Phương pháp huấn luyện biết đến nhiều MLP tối thiểu hóa gradient, véctơ gradient tối thiểu hóa cách sử dụng thuật toán lan truyền ngược (backpropagation) [19] Cụ thể, tín hiệu lỗi nơ-ron j lần lặp t thực Công thức (3): e j (t ) = d j (t ) − y j (t ) (3) ej(t) lỗi, dj(t) mục tiêu mong muốn (target) yj(t) kết thời mạng Sau đó, quy tắc cập nhật trọng số liên kết nơ-ron thực Công thức (4): wijm (t + 1) = wijm (t ) −  wijm (t ) (4) trọng số liên kết vào i nơ-ron j lớp m lần lặp t,  tốc độ huấn luyện ∂E(t) đạo hàm riêng sai số 26 E (t ) wijm (t ) jos.hueuni.edu.vn Lớp vào Lớp ẩn Tập 130, Số 5A, 2021 Lớp vào Lớp x1 x1 x2 x2 y x3 Lớp ẩn (a) Mạng Perceptron lớp (MLP) Lớp ẩn Lớp x1 x2 y x3 y x4 Lớp ngữ cảnh x4 x4 Lớp vào Lớp (b) Mạng xuyên tâm sở (RBF) (c) Mạng hồi quy Elman (ELM) Hình Kiến trúc mạng MLP, RBF ELN Thuật toán huấn luyện bao gồm hai giai đoạn Ban đầu, liệu vào truyền qua mạng để thu kết thời yj(t) Giá trị sau so sánh với mục tiêu mong muốn dj(t) để tính tốn lỗi ej(t) Trong bước thứ hai, lỗi truyền ngược lại từ lớp đến lớp vào (lan truyền ngược) để phục vụ cho việc điều chỉnh trọng số lớp Bằng cách này, tất trọng số liên kết điều chỉnh theo quy tắc sửa lỗi giả định, để kết mạng lần lặp sau gần với mục tiêu mong muốn [19] Mạng RBF Không giống MLP, mạng sở xuyên tâm (Radial Basis Function–RBF) có hai lớp: lớp ẩn lớp Như mơ tả Hình 3(b), kiến trúc mạng RBF tương tự với mạng MLP lớp, với khác biệt chức nơ-ron lớp ẩn Các hàm kích hoạt lớp ẩn dựa tính chất xuyên tâm [19], nơ-ron ẩn xác định tâm liệu vào tương tự (phân bố gần khơng gian vào) Một hàm kích hoạt sử dụng nhiều cho nơ-ron lớp ẩn hàm Gaussian Công thức (5):  ( x) = e ( x −c ) 2 (5) x giá thị mẫu vào, c tâm Gaussian σ2 phương sai (bán kính) Việc huấn luyện RBFs thực hai giai đoạn Đầu tiên, trọng số lớp ẩn tính tốn cách xác định tâm dựa phân bố tập liệu vào Các liệu có phân bố “gần nhau” xem thuộc cụm mà tâm cụm tính tốn dựa hàm sở xuyên tâm Công thức (5) Tiếp đó, trọng số lớp điều chỉnh theo cách huấn luyện có giám sát tương tự mạng MLP [19] 27 Võ Viết Minh Nhật CS Tập 130, Số 5A, 2021 Mạng ELN Mạng Elman (ELN) kiến trúc đệ quy dựa mạng MLP J.L Elman đề xuất [20] Mạng ELN chia lớp vào thành hai phần: phần bao gồm đầu vào thông thường mạng phần thứ hai, có tên gọi đơn vị ngữ cảnh, bao gồm đầu lớp ẩn đưa trở lại thành đầu vào (đệ quy), mô tả Hình 3(c) Vì đơn vị ngữ cảnh mạng ELN xem đầu vào, nên chúng có trọng số liên kết điều chỉnh thuật toán lan truyền ngược theo thời gian Trong đa số cài đặt, phiên lan truyền ngược cắt lát theo thời gian tạo thành khoảng trễ Quá trình huấn luyện mạng Elman tương tự với mạng MLP việc điều chỉnh trọng số dừng “sự biến thiên trọng số” mạng trở nên ổn định [19] 3.6 Phương thức đánh giá kết dự báo Có nhiều phương thức đánh giá độ xác mơ hình dự báo Cũng đa số nghiên cứu phân tích Mục 2, bốn phương thức dự báo sau thường sử dụng: Sai số bình phương trung bình (mean squared error - MSE): Nó đo độ lệch bình phương trung bình giá trị dự báo MSE nhấn mạnh tổng sai số dự báo thực tế bị ảnh hưởng nhiều sai số lớn riêng lẻ, không cung cấp ý tưởng hướng lỗi tổng thể [21] MSE xác định Công thức (6) p MSE =  ( yt − yˆ t ) p t =1 (6) Sai số tuyệt đối trung bình (mean absolute error - MAE): Nó đo độ lệch tuyệt đối trung bình giá trị dự báo so với giá trị ban đầu MAE cho thấy mức độ lỗi tổng thể xảy dự báo, không cung cấp ý tưởng hướng lỗi [21] Phương trình phương thức Công thức (7) p MAE =  yt − yˆ t p t =1 (7) Sai số phần trăm tuyệt đối trung bình (mean absolute percentage error - MAPE): Phương thức không phụ thuộc vào quy mô đo lường nên trở thành lựa chọn phổ biến toán dự báo, đặc biệt dựa mạng nơ-ron [21] Nó định nghĩa Công thức (8): 28 jos.hueuni.edu.vn Tập 130, Số 5A, 2021 MAPE = p yt − yˆ t  100  p t =1 yt (8) Căn bậc hai phương sai bình phương trung bình (root mean square error - RMSE): Nó định nghĩa độ lệch chuẩn sai số giá trị mục tiêu giá trị dự đoán [21] RMSE đơn giản bậc hai MSE tính Công thức (9) RMSE = p ( yt − yˆ t )2  p t =1 (9) Mô phân tích kết Chúng tơi sử dụng Matlab phiên 2010b để tiến hành mô mơ hình mạng nơ- ron MLP, RBF ELN, với liệu lượng du khách hàng tháng đến Thừa Thiên Huế (từ tháng 1/2017 đến tháng 12/2019) Dữ liệu trích xuất từ trang thơng tin điện tử Sở du lịch Thừa Thiên Huế [18] Các cài đặt thực máy tính PC với cấu hình 2.4 GHz Intel Core CPU, 2G RAM Điều kiện hội tụ trình huấn luyện kết hợp dựa bình phương trung bình MSE ngưỡng số vòng lặp tối đa Trong cài đặt này, MSE ngưỡng số vòng lặp tối đa thiết lập 0,005 10.000 vòng lặp Thực tế, khó thiết lập xác ngưỡng mà hầu hết dựa kinh nghiệm, với nhiều lần chạy thử khác để xác định giá trị ngưỡng phù hợp Chúng chọn ngưỡng MSE nhỏ nhằm kiểm tra độ xác dự báo mạng nơ-ron, khống chế số vòng lặp điều kiện dừng để phịng trường hợp mạng khơng thể hội tụ với giá trị ngưỡng MSE Hơn nữa, liệu huấn luyện có kích thước nhỏ chuẩn hóa khoảng [0, 1], nên thiết lập giá trị ngưỡng nhỏ MSE ngưỡng vòng huấn luyện cần thiết Có kiến trúc mạng nơ-ron thử nghiệm cho loại mạng MLP, RBF ELN gồm (6:3:1) (12:6:1), tức kiến trúc có (hoặc 12) đầu vào, (hoặc 6) nơ-ron ẩn nơ-ron Như có hai loại ma trận liệu huấn luyện khác xây dựng, mơ tả Hình Thực tế kiến trúc mạng khác thử nghiệm, liệu nhu cầu du lịch việc chọn số điểm lấy giá trị đầu vào hay 12 tháng liên tục hợp lý tính mùa vụ nhu cầu du lịch tồn tại, liệu du khách đến Thừa Thiên Huế rõ ràng (Hình 1) 29 Võ Viết Minh Nhật CS Mẫu liệu Tập 130, Số 5A, 2021 Giá trị vào Kết Mẫu liệu Giá trị vào Kết x1 x2 x6 x7 x1 x2 x12 x13 x2 x3 x7 x8 x2 x3 x13 x14 x3 x4 x8 x9 x3 x4 x14 x15 n xn xn+1 xn+6 xn+7 n xn xn+1 xn+11 xn+12 Hình Ma trận liệu cho kiến trúc mạng nơ-ron (6:3:1) (12:6:1) Hình So sánh kết dự báo MLP, ELN RBF với giá trị thực tế (Target) kiến trúc (6:3:1) (12:6:1) Kết dự báo lượng du khách liệu kiểm tra mạng nơ-ron MLP, RBF ELN Hình 5(a) Hình 5(b), tương ứng với kiến trúc mạng nơ-ron khác (6:3:1) (12:3:1) Rõ ràng, kết dự báo mạng RBF tiệm cận gần với lượng du khách đến thực tế (Target), hai kiến trúc (6:3:1) (12:6:1), kiến trúc (12:6:1) cho kết dự báo sát với giá trị thực tế Điều thể giá trị MSE, RMSE, MAE MAPE cho thấy RBF đạt giá trị tương ứng thấp nhất, đặc biệt với kiến trúc (12:6:1), Bảng 30 jos.hueuni.edu.vn Tập 130, Số 5A, 2021 Bảng So sánh lỗi dự báo MLP, ELN RBF kiến trúc (6:3:1) (12:6:1) MLP ELN RBF (6:3:1) (12:6:1) (6:3:1) (12:6:1) (6:3:1) MSE 2,65E+09 4,72E+08 4,50E+09 1,84E+09 1,28E+09 2,40E+08 RMSE 51.444,96 21.724,35 67.103,98 42.850,08 35.753,80 15.483,36 MAE 41.797,55 14.737,44 56.329,20 35.878,55 27.997,36 11.110,80 10,88 3,82 13,93 9,31 7,40 2,81 MAPE (12:6:1) Kết dự báo phù hợp với kết nghiên cứu trước [1, 8] mạng RBF thường cho giá trị dự báo xác nhất, đặc biệt liệu chuỗi thời gian phi tuyến khơng có tính mùa vụ rõ ràng Thực tế, phân tích [19], vai trị nơ-ron ẩn mạng RBF thực chuyển liệu từ không gian phi tuyến ban đầu khơng gian tuyến tính mà phân tách tuyến tính liệu Đây tính đặc biệt mạng RBF giúp cho giải tốn phi tuyến tính cách hiệu dự báo liệu chuỗi thời gian Đối với mạng ELN, kết dự báo cấu trúc liên kết phản hồi mạng Elman nắm bắt đặc điểm cụ thể liệu chuỗi thời gian Kiến trúc (12:6:1) cho kết dự báo tốt kiến trúc (6:3:1) cho thấy dự báo dựa chuỗi thời gian phụ thuộc vào việc xác định kích thước điểm lấy thơng tin để tìm quy luật liệu Mặc dù liệu du khách đến Thừa Thiên Huế khơng thể tính mùa vụ rõ ràng, nhiên xu hướng tăng, giảm du khách thường tuân theo quy luật hàng năm hàng quý hay nửa năm Việc tăng số điểm nhận liệu theo năm rõ ràng giúp cho kiến trúc (12:6:1) học quy luật biến thiên chuỗi thời gian nhu cầu du khách tốt cho kết dự báo gần sát với giá trị thực tế Do vậy, việc tăng kích thước liệu huấn luyện làm tăng độ xác mơ hình dự báo Kết luận Bài báo thành cơng việc mơ hình hố xây dựng mạng nơ-ron việc dự báo nhu cầu du khách đến Thừa Thiên Huế Với liệu có dạng chuỗi thời gian, ba mơ hình mạng nơ-ron MLP, ELN RBF phân tích triển khai Việc chuẩn hóa chuẩn bị liệu mơ tả chi tiết; hai kiến trúc mạng nơ-ron (6:3:1) (12:6:1) xem xét Kết cài đặt phân tích mạng RBF có khả dự báo xác nhất, thể mức độ lỗi thấp MSE, RMSE, MAE MAPE Thực tế, có nhiều nghiên cứu ứng dụng mạng nơ-ron dự báo nhu cầu du lịch, loại mạng nơ-ron phát huy hiệu liệu cụ thể khơng có mạng nơ-ron hiệu trường hợp 31 Võ Viết Minh Nhật CS Tập 130, Số 5A, 2021 Mặc dù liệu sử dụng báo có kích thước nhỏ giá trị MAPE thu bé, 10% [22], cho thấy độ xác cao mạng nơ-ron dự báo liệu chuỗi thời gian Tài liệu tham khảo M Cuhadar, I Cogurcu, and C Kukrer (2014), Modelling and Forecasting Cruise Tourism Demand to Izmir by Different Artificial Neural Network Architectures, International Journal of Business and Social Research, 4(3), 12–28, doi: 10.18533/ijbsr.v4i3.431 H.-C Huang and C.- I Hou (2017), Tourism Demand Forecasting Model Using Neural Network, Int J Comput Sci Inf Technol., 9(2), 19–29, doi: 10.5121/ijcsit.2017.9202 M E Nor, A I M Nurul, and M S Rusiman (2018), A Hybrid Approach on Tourism Demand Forecasting, J Phys Conf Ser., 995(1), doi: 10.1088/1742-6596/995/1/012034 Y Yu, Y Wang, S Gao, and Z Tang (2017), Statistical Modeling and Prediction for Tourism Economy Using Dendritic Neural Network, Comput Intell Neurosci., 1–9, doi: 10.1155/2017/7436948 P O Fernandes, J P Teixeira, J M Ferreira, and S G Azevedo (2011), Forecasting Tourism Demand with Artificial Neural Networks, Tour Manag Stud., 2009–2011 C J Lin, H F Chen, and T S Lee (2011), Forecasting Tourism Demand Using Time Series, Artificial Neural Networks and Multivariate Adaptive Regression Splines:Evidence from Taiwan, Int J Bus Adm., 2(2), doi: 10.5430/ijba.v2n2p14 J P Teixeira and P O Fernandes (2014), Forecasting of a Non-Seasonal Tourism Time Series with ANN, in 1st International Work-Conference on Time Series (ITISE), 1–11 O Claveria, E Monte, and S Torra (2013), Tourism Demand Forecasting with Different Neural Networks Models, SSRN Electron J., doi: 10.2139/ssrn.2507362 J P Teixeira and P O Fernandes, (2014), Forecasting of a Non-Seasonal Tourism Time Series with ANN, in International work-conference on Time Series – ETISE 2014, 1–11 10 M Akin, A novel approach to model selection in tourism demand modeling (2015), Tour Manag., 48, 64–72, doi: 10.1016/j.tourman.2014.11.004 11 O Claveria, E Monte, and S Torra (2015), Tourism Demand Forecasting with Neural Network Models: Different Ways of Treating Information, Int J Tour Res., 17(5), 492–500, doi: 10.1002/jtr.2016 12 H A Constantino, P O Fernandes, and J P Teixeira (2016), Tourism demand modelling and forecasting with artificial neural network models: The Mozambique case study, Tékhne, 14(2), 113–124, doi: 10.1016/j.tekhne.2016.04.006 32 jos.hueuni.edu.vn Tập 130, Số 5A, 2021 13 S Cankurt and A Subasi (2016), Tourism demand modelling and forecasting using data mining techniques in multivariate time series: a case study in Turkey, Turkish J Electr Eng Comput Sci., 24, 3388–3404, doi: 10.3906/elk-1311-134 14 A Koutras, A Panagopoulos, and I A Nikas (2017), Forecasting Tourism Demand Using Linear and Nonlinear Prediction Models, Acad Tur Innov Journa, 9(1), 85–98 15 A Mavrommati and A Karakitsiou (2018), Machine learning methods in tourism demand forecasting: some evidence from Greece, MIBES Trans., 11(1), 92–105 16 E S Silva, H Hassani, S Heravi, and X Huang (2019), Forecasting tourism demand with denoised neural networks, Ann Tour Res., 74, no October 2018, 134–154, doi: 10.1016/j.annals.2018.11.006 17 M Gregorić and T Baldigara (2020), Artificial neural networks in modelling seasonal tourism demand – case study of Croatia, Zb Veleučilišta u Rijeci, 8(1), 19–39, doi: 10.31784/zvr.8.1.2 18 https://sdl.thuathienhue.gov.vn/ (accessed at 14:00 March 20, 2020) 19 A Shrestha and A Mahmood (2019), Review of Deep Learning Algorithms and Architectures, in IEEE Access, 7, pp 53040-53065, doi: 10.1109/ACCESS.2019.2912200 20 Elman (1990), J.L Finding structure in time, Cogn Sci., 14, 179–211 21 C Hamzacebi (2008), Improving artificial neural networks’ performance in seasonal time series forecasting, Information Sciences, 178, 4550–4559 22 R.K Klimberg, G.P Sillup, K.J Boyle and V Tavva (2010), Forecasting performance measures – what are their practical meaning?, Advances in Business and Management Forecasting, 7, 137–147, Emerald Group Publishing Limited, Bingley 33

Ngày đăng: 01/12/2022, 11:09

Hình ảnh liên quan

3 Mơ hình hóa mạng nơ-ron nhân tạo cho dự báo nhu cầu du lịch 3.1 Dữ liệu nhu cầu du lịch được sử dụng  - DỰ BÁO NHU CẦU DU KHÁCH ĐẾN THỪA THIÊN HUẾ DỰA TRÊN MẠNG NƠ-RON NHÂN TẠO

3.

Mơ hình hóa mạng nơ-ron nhân tạo cho dự báo nhu cầu du lịch 3.1 Dữ liệu nhu cầu du lịch được sử dụng Xem tại trang 7 của tài liệu.
Hình 2. Cấu trúc ma trận dữ liệu tương ứng với mạng nơ-ron có 4 đầu vào và 1 đầu ra - DỰ BÁO NHU CẦU DU KHÁCH ĐẾN THỪA THIÊN HUẾ DỰA TRÊN MẠNG NƠ-RON NHÂN TẠO

Hình 2..

Cấu trúc ma trận dữ liệu tương ứng với mạng nơ-ron có 4 đầu vào và 1 đầu ra Xem tại trang 9 của tài liệu.
Hình 3. Kiến trúc các mạng MLP, RBF và ELN - DỰ BÁO NHU CẦU DU KHÁCH ĐẾN THỪA THIÊN HUẾ DỰA TRÊN MẠNG NƠ-RON NHÂN TẠO

Hình 3..

Kiến trúc các mạng MLP, RBF và ELN Xem tại trang 11 của tài liệu.
Bảng 1. So sánh lỗi dự báo của MLP, ELN và RBF trong 2 kiến trúc (6:3:1) và (12:6:1) - DỰ BÁO NHU CẦU DU KHÁCH ĐẾN THỪA THIÊN HUẾ DỰA TRÊN MẠNG NƠ-RON NHÂN TẠO

Bảng 1..

So sánh lỗi dự báo của MLP, ELN và RBF trong 2 kiến trúc (6:3:1) và (12:6:1) Xem tại trang 15 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan