ỨNG DỤNG MÔ HÌNH CHUỖI THỜI GIAN SARIMA VÀ MẠNG THẦN KINH NHÂN TẠO ANN DỰ BÁO LƯỢNG KHÁCH QUỐC TẾ ĐẾN VIỆT NAM

13 4 0
ỨNG DỤNG MÔ HÌNH CHUỖI THỜI GIAN SARIMA VÀ MẠNG THẦN KINH NHÂN TẠO ANN DỰ BÁO LƯỢNG KHÁCH QUỐC TẾ ĐẾN VIỆT NAM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ỨNG DỤNG MƠ HÌNH CHUỖI THỜI GIAN SARIMA VÀ MẠNG THẦN KINH NHÂN TẠO ANN DỰ BÁO LƯỢNG KHÁCH QUỐC TẾ ĐẾN VIỆT NAM SV: Lê Huy Hiệp Lớp, Lâm Văn Hạnh Trường Đại học Bà Rịa – Vũng Tàu GVHD: ThS Nghiêm Phúc Hiếu TÓM TẮT Du lịch Việt Nam trở thành ngành kinh tế mũi nhọn đất nước, xem “Ngành công nghiệp khơng khói” đóng góp khoản thu lớn vào ngân sách nhà nước Tuy nhiên, tiềm phát triển du lịch to lớn chưa thể khai thác tận dụng hết Khi cách mạng công nghiệp 4.0 tới, việc dự báo lượng khách quốc tế đến nước ta thực có ý nghĩa nhà quản lý, nhà đầu tư để có kế hoạch phát triển bền vững Nghiên cứu sử dụng phương pháp luận Box-Jenkins để xây dựng mô hình ARIMA theo mùa (hay cịn gọi SARIMA) mơ hình mạng thần kinh nhân tạo cho dự báo lượng khách quốc tế đến Việt Nam dựa số liệu công bố hàng tháng Tổng cục Du lịch Việt Nam với 101 quan sát Kết cho thấy mơ hình SARIMA (12,1,1) (1,1,3)12 ANN-12-29-1 phù hợp cho dự báo Khi so sánh dự báo mẫu hai mơ hình với mơ hình ANN có kết tốt Từ khóa: dự báo, khách quốc tế, SARIMA, ANN, công nghiệp 4.0 1.Giới thiệu Việt Nam với lợi đặc biệt vị trí địa lý kinh tế trị, Việt Nam có nhiều thuận lợi để phát triển du lịch Nằm trung tâm Đông Nam Á, lãnh thổ Việt Nam vừa gắn liền với lục địa vừa thông đại dương nên Việt Nam hiển nhiên có nhiều cảnh đẹp hùng vỹ, có vị trí giao lưu quốc tế thuận lợi đường biển, đường sông, đường sắt, đường hàng không Đây tiền đề quan trọng việc mở rộng phát triển du lịch quốc tế Đặc biệt hơn, Việt Nam có hệ thống di sản giới phong phú, đa dạng Theo thống kê năm 2016, nước có 26 di sản giới UNESCO công nhận thuộc lĩnh vực Di sản thiên nhiên, di sản văn hóa vật thể, di sản văn hóa phi vật thể, di sản địa chất tồn cầu, di sản tư liệu, di sản hỗn hợp Trong có di sản thiên nhiên giới; 12 di sản văn hóa giới; 11 di sản văn hóa phi vật thể giới Nhận thức tầm quan trọng Du lịch, để phát triển Du lịch phù hợp với yêu cầu xu thời đại nên Công tác quản bá đẩy mạnh Thời gian gần công tác quảng bá du lịch trọng Hình ảnh du lịch ngày nâng cao thị trường giới Bạn bè giới dần hiểu rõ Việt Nam thông qua hoạt động giao lưu, hợp tác quốc tế Các website, tổ chức bầu chọn Việt Nam điểm đến hấp dẫn du khách Với định hướng du lịch trở thành ngành kinh tế mũi nhọn Nhận thức tầm quan trọng nên công tác xúc tiến trọng làm chất lượng việc xúc tiến nâng cao đáng kể Gần Việt Nam Hollywood chọn làm phim trường cho phim Kong - Đảo đầu lâuđây hội để hình ảnh Việt Nam quảng bá rộng rãi thị trường giới Thêm vào đó, cách mạng cơng nghiệp 4.0 có tác động tích cực tới phát triển du lịch quốc gia Các hình thức tốn tuyến nhanh chóng, hiệu giúp cho việc đáp ứng nhu cầu đối tượng nơi giới, khơng bị ảnh hưởng rào cản địa lí tạo thuận lợi tối đa cho du khách Q trình ứng dụng cơng nghệ giúp giảm chi phí nhân lực, giảm chi phí bán hàng từ giá thành dịch vụ giảm đồng thời nâng cao chất lượng sản phẩm du lịch Công nghệ 4.0 giúp đưa thơng tin, hình ảnh nhanh chóng đến du khách vùng giới Các địa điểm tham quan đẹp hấp dẫn dễ dàng lan tỏa nhanh chóng cơng đồng giới thơng qua công nghệ đại Với điều kiện thuận lợi ngành du lịch Việt Nam phá dẫn đầu Mục tiêu đến năm 2030, du lịch Việt Nam thực trở thành ngành kinh tế mũi nhọn Việt Nam nước có ngành du lịch phát triển hàng đầu khu vực Đông Nam Á Olympic Kinh tế lượng ứng dụng năm 2018 196 Để đạt mục tiêu đó, cơng tác dự báo lượng khách quốc tế đến điều cần thiết giúp quốc gia chủ động chuẩn bị nguồn lực sở hạ tầng, công nghệ, nhân lực, tài chính… bối cảnh phải có tầm nhìn xa trông rộng, áp dụng công nghệ đại vào công tác dự báo, quốc gia có khả tận dụng điều kiện thuận lợi để giúp ngành du lịch cất cánh” Trên phương diện nghiên cứu mơ hình chuỗi thời gian SARIMA mạng thần kinh nhân tạo ANN nguyên lý hoạt động chúng để từ ứng dụng vào lĩnh vực dự báo nội dung chưa quan tâm nhiều, tác giả tiến hành thực nghiên cứu dựa sở khoa học kết mang lại góp phần giúp ngành du lịch nước nhà bền vững 2.Tổng quan nghiên cứu Dự báo khách du lịch trình thách thức chịu ảnh hưởng đáng kể tính xu hướng, nhân tố mùa vụ, kiện không lường trước thảm họa thiên nhiên chiến tranh Trong tổng quan nghiên cứu tác giả đưa hai hướng nghiên cứu tác giả trước bao gồm hướng tiếp cận chuỗi thời gian nhằm ứng dụng mơ hình SARIMA hướng tiếp cận mạng thần kinh nhân tạo ANN 2.1 Hướng tiếp cận chuỗi thời gian Theo hướng chuỗi thời gian, mơ hình ARIMA giản đơn SARIMA (ARIMA theo mùa) sử dụng cách thường xuyên Tuy nhiên, hầu hết nghiên cứu gần đểu cho mơ hình SARIMA phổ biến mơ hình ARIMA giản đơn yếu tố mùa vụ liệu khách du lịch nhân tố chủ yếu xem xét nhà quản lý ngành du lịch Lý khác liên quan tới quan tâm dành cho hướng nghiên cứu chi phí thu thập liệu mà ước lượng mơ hình thấp, cần liệu khứ biến số (Kodituwakku, Wijesundara, & Hettiarachchi, 2015) Trong năm qua, có nhiều nghiên cứu tiến hành để dự báo lượng khách quốc tế sử dụng mơ hình SARIMA dựa theo phương pháp chuẩn Box-Jenkins Kim Moosa (2005) sử dụng mơ hình dự báo hồi quy tuyến tính, mơ hình Structural Harvey mơ hình SARIMA để dự báo lượng khách du lịch nhận thấy phương pháp tốt phương pháp gián tiếp so với phương pháp trực tiếp dự báo lượng khách quốc tế tới Úc hàng tháng Phương pháp trực tiếp không kiểm định yếu tố chuỗi thời gian phương pháp gián tiếp kiểm định Cho (2003) sử dụng mơ hình SARIMA ANN để dự báo lượng khách từ khu vực tới Hồng Kông sử dụng liệu thời gian từ tháng 01/1999 tới tháng 12/2000 Chaitip cộng (2008) áp dụng SARIMA, ARIMA, mơ hình Holt-Winters, mạng thần kinh, VAR, GMM, ARCH-GARCH-M, ARCH-GARCH, TARCH, PARCH EGARCH nhằm dự báo lương khách du lịch tới Thái Lan Mơ hình SARIMA đưa kết tốt Tương tự vậy, Suhartono (2011) thực phương pháp với liệu khách theo đường hàng không tới Bali Một lần mơ hình SARIMA mơ hình tốt dùng để dự báo Kodituwakku cộng (2015) sử dụng mơ hình để dự báo lượng khách du lịch quốc tế tới Sri Lanka giai đoạn từ tháng 1/2010 tới tháng 8/2014 Mơ hình mùa Holt - Winters xem mơ hình tốt dùng dự báo so với SARIMA, mạng thần kinh Nghiên cứu không kiểm định yếu tố mùa vụ mơ hình SARIMA Khơng dự báo lượng khách du lịch mà SARIMA kỹ thuật dự báo phù hợp vận dụng lĩnh vực khác sử dụng liệu chuỗi thời gian Savas (2013) sử dụng mơ hình SARIMA Kalman để dự báo lạm phát hàng tháng Luxembourg, Mexico, Bồ Đào Nha Thụy Sỹ Reininger Fingerlos (2007) sử dụng liệu chuỗi GDP thực thời gian từ quý 1/1980 tới q 4/2006 tìm mơ hình phù hợp với mục đích giai thích đặc điểm mùa vụ chuỗi thời gian Kết cho thấy mơ hình SARIMA xem tốt nghiên cứu 2.2 Hướng tiếp cận ANN Trong năm gần đây, nghiên cứu mạng thần kinh nhân tạo ANN mang lại nhiều quan tâm lĩnh vực sinh học, tâm lý học, y học, kinh tế, tốn học máy tính Lý cho quan tâm ANN kỹ thuật ước lượng tồn diện sử dụng cho mô Olympic Kinh tế lượng ứng dụng năm 2018 197 hình tuyến tính phi tuyến (Cybenko, 1989; Funahashi, 1989; Hornik, Stinchcombe & White, 1989; Wasserman, 1989) Vì tính linh động trình ước lượng, ANN phương pháp mạnh mẽ thực nhiệm vụ liên quan đến phân loại mẫu, hồi quy dự báo biến liên tục (Kaastra & Boyd, 1996) Trong thập kỷ trước, mạng thần kinh chiếm ưu so với phương pháp khác – có mơ hình chuỗi thời gian ARIMA giải vấn đề liệu phi tuyến bất thường (Hansen cộng sự, 1999) Phương pháp ANN giới thiệu lần đầu dự báo lượng cầu khách du lịch cuối năm 1990 Bằng chứng thực nghiệm cho ANN thực có kết dự báo lượng khách tốt so với so với mơ hình chuỗi thời gian đa biến Ví dụ như, Pattie Snyder (1996) ứng dụng mơ hình mạng thần kinh lan truyền ngược (BNP) với lớp ẩn để dự báo theo tháng lượng khách nghỉ qua đêm công viên quốc gia Mỹ Dự báo họ xác so với mơ hình chuỗi thời gian truyền thống với mẫu nghiên cứu lớn Law Au (1999) giới thiệu mạng thần kinh truyền thẳng với nơ-ron đầu vào nơ-ron đầu để dự báo lượng khách tới Hồng Kơng Tác giả cho có yếu tố tác động tới lượng khách du lịch Kết cho thấy, mơ hình mạng thần kinh có kết tốt so với mơ hình đa biến khác Law (2000) thử nghiệm mơ hình mơ hình BNP để dự báo lượng khách quốc tế Đài Loan tới Hồng Kông Mơ hình mạng thần kinh đề nghị có biến độc lập tương ứng với số nơ-ron đầu vào có nơ-ron đầu Law sử dụng hàm phi tuyến để tách liệu ngẫu nhiên thành tập liệu để huấn luyện kiểm tra Khả dự báo mơ hình xác bền vững Burger cộng (2001) phát triển cách tiếp cận để dự báo lượng khách du lịch từ Mỹ tới Durban Nam Phi giai đoạn 1992-1998 Tác giả cho phương pháp ANN mô hình giải thích tốt so với mơ hình lại Cũng tương tự vậy, Cho (2003) kết luận mơ hình ANN thể tốt so với mơ hình san số mũ ARIMA việc mơ hình hóa dự báo lượng cầu khách du lịch Hồng Kông Kon Turner (2005) kết luận mơ hình ANN thể tốt mơ hình chuỗi thời gian cấu trúc, naïve Holt-Winterstrong trình dự khách lượng khách du lịch nước ngồi tới Singapore Cơ sở lý luận phương pháp nghiên cứu 3.1 Mẫu nghiên cứu Nhằm xây dựng mơ hình dự báo lượng khách quốc tế đến Việt Nam hàng tháng cho mục tiêu dự báo mang tính ngắn hạn, tác giả sử dụng liệu lượng khách quốc tế hàng tháng tới Việt Nam đăng tải công khai website http://vietnamtourism.gov.vn Tổng cục Du lịch Việt Nam từ tháng 10/2009 tới tháng 2/2018 gồm 101 quan sát Trước thời gian lượng khách quốc tế có biến động mạnh liên quan tới bất ổn tình hình tài giới (khủng hoảng kinh tế) nên tác giả khơng sử dụng giai đoạn Ngồi ra, để tập trung cho mục đích du lịch, tác giả sử dụng số liệu lượng khách quốc tế đến Việt Nam theo mục đích du lịch bỏ tờ khai nhập cảnh vào Việt Nam nên từ tháng 01/2015 báo cáo khách quốc tế đến Việt Nam hàng tháng khơng có số liệu lượng khách phân theo mục đích Trong nghiên cứu này, tác giả sử dụng liệu lượng khách quốc tế đến Việt Nam suốt giai đoạn nghiên cứu Trong đó, 92 quan sát (hay cịn gọi liệu mẫu) từ tháng 10/2009 tới tháng 5/2017 dùng để xây dựng hàm dự báo quan sát lại - từ tháng 6/2017 tới tháng 2/2018 dùng để kiểm tra tính xác dự báo Đặc biệt mơ hình ANN, 92 quan sát tiếp tục chia thành 64 quan sát để huấn luyện 28 quan sát để kiểm tra (tỷ lệ 70%:30%) Dữ liệu thu thập từ nguồn công bố thông tin nên đảm bảo nguyên tắc quán suốt trình phân tích Olympic Kinh tế lượng ứng dụng năm 2018 198 1,600,000 1,400,000 1,200,000 1,000,000 800,000 600,000 400,000 200,000 2009m10 2010m02 2010m06 2010m10 2011m02 2011m06 2011m10 2012m02 2012m06 2012m10 2013m02 2013m06 2013m10 2014m02 2014m06 2014m10 2015m02 2015m06 2015m10 2016m02 2016m06 2016m10 2017m02 2017m6 2017m10 2018m02 - Nguồn: Tổng cục Du lịch Việt Nam Hình Lượng khách quốc tế đến Việt Nam từ tháng 10/2009 đến tháng 02/2018 3.2 Mơ hình SARIMA Hai tác giả George Box Gwilym Jenkins (1976) nghiên cứu mơ hình tự hồi qui tích hợp trung bình trượt (Autoregressive Integrated Moving Average), viết tắt ARIMA Tên họ (Box-Jenkins) dùng để gọi cho trình ARIMA tổng quát áp dụng vào phân tích dự báo chuỗi thời gian Mơ hình tích hợp trung bình trượt tự hồi quy (mơ hình ARIMA) tích hợp từ q trình: Tự hồi quy (AR) số liệu kinh tế - xã hội, trung bình trượt (MA) phần sai số số liệu (hay phần nhiễu ngẫu nhiên) q trình tích hợp hay Sai phân (I) nhằm biến đổi chuỗi không dừng thành chuỗi dừng trước thực thao tác phân tích dự báo khác Bản chất mơ hình ARIMA dự báo giá trị tương lai biến số (biểu thị theo chuỗi thời gian) dựa giá trị khứ sai số ngẫu nhiên Tuy nhiên, mô hình ARIMA thích hợp cho việc phân tích, dự báo liệu chuỗi thời gian khơng có yếu tố mùa vụ Để có dự báo xác tiêu kinh tế - xã hội, người ta sâu tìm hiểu, nghiên cứu đề xuất số phương pháp dự báo liệu chuỗi thời gian có yếu tố mùa vụ Trong đó, mơ hình phát triển tiếp từ mơ hình ARIMA xem thích hợp cả, mơ X11ARIMA, X12ARIMA SARIMA Mơ hình SARIMA đời muộn hơn, vào nửa cuối thập niên 1990 Nó phát triển từ mơ hình ARIMA giải yếu tố mùa vụ đồng thời cho trình: tự hồi quy, tích hợp trung bình trượt Vì thế, SARIMA phức tạp X11ARIMA X12ARIMA - mơ hình phát triển từ ARIMA q trình trung bình trượt Mơ hình SARIMA phát triển tiếp từ mơ hình ARIMA phù hợp với liệu chuỗi thời gian mùa vụ quý năm; ngày tuần; 11, 12 tháng năm… Nếu chuỗi liệu quan sát có tính mùa vụ, mơ hình ARIMA tổng quát lúc SARIMA(p,d,q)(P,D,Q)L (với P Q bậc thành phần mùa AR MA, D bậc sai phân có tính mùa, L số thời đoạn vòng chu kỳ) Bài viết ứng dụng mơ hình SARIMA phân tích dự báo lượng khách quốc tế đến Việt Nam, thực theo bước sau đây: Bước - Nhận dạng mơ hình: Xác định giá trị (D, d, p, P, q, Q) Trong đó, trước hết cần xác định bậc sai phân theo mùa vụ D, sai phân thường d thực biến đổi chuỗi thành chuỗi dừng Thành phần d mơ hình nhận dạng thơng qua kiểm định tính dừng chuỗi thời gian Nếu chuỗi thời gian dừng bậc khơng ta có I(d=0), sai phân bậc chuỗi dừng ta có I(d=1), sai phân bậc chuỗi dừng ta có I(d=2) Phương pháp kiểm định tính dừng thường áp dụng kiểm định Augmented Dickey-Fuller (ADF) Perron-Phillips (PP) Sau đó, kiểm tra biểu đồ hàm tự tương quan (Autocorrelation Function - ACF), hàm tự Olympic Kinh tế lượng ứng dụng năm 2018 199 tương quan riêng phần (Partial Autocorrelation Function - PACF) trễ mùa vụ trễ thường để xác định bậc tự hồi quy p tự hồi quy mùa vụ P, bậc trung bình trượt q trung bình trượt mùa vụ Q Nếu biểu đồ hàm tự tương quan có q giá trị khác giá trị biểu đồ tương quan riêng phần giảm từ từ ta tiên đốn có MA(q) Nếu biểu đồ hàm tự tương quan riêng phần có p giá trị khác giá trị biểu đồ tương quan đớn giảm từ từ ta tiên đốn có AR(p) Nếu biểu đồ hàm tự tương biểu đồ hàm tự tương riêng phần khơng có cắt ngắn hai trường hợp trên, ta có q trình ARMA thơng số tùy thuộc vào dạng cụ thể cấc biểu đồ tương quan Bước – Ước lượng mơ hình: Ước lượng tham số, sử dụng phương pháp ước lượng bình phương nhỏ (OLS-Ordinary Least Square) để ước lượng giá trị tham số Người ta thường sử dụng phân mềm SPSS, Minitab, Eviews để ước tính tham số mơ hình Bước – Kiểm định: Kiểm định tính hợp lý mơ hình SARIMA lựa chọn, bao gồm kiểm định tham số kiểm định phần dư Nếu kiểm định mô hình lựa chọn khơng thỏa mãn quay lại từ giai đoạn nhận dạng để lựa chọn mơ hình khác hợp lý Chuỗi giá trị thặng dư nhiễu trắng Nếu khơng phải nhiễu trắng ta kết luận mơ hình khơng hồn chỉnh ta phải thêm vào mơ hình bậc bổ sung cần thiết Bước - Dự báo: Dựa mơ hình lựa chọn thực dự báo giá trị tương lai liệu chuỗi mùa vụ, đưa khoảng tin cậy dự báo Giá trị tương lai dự báo cho thời điểm mùa vụ Khi có liệu quan sát mới, nên đưa điểm quan sát vào mơ hình để làm ngắn thời đoạn dự báo Nếu đặc điểm, hành vi chuỗi bị thay đổi liệu mới, phải ước lượng lại tham số mơ hình, xây dựng mơ hình 3.3 Mơ hình ANN 3.3.1 Giới thiệu Mạng thần kinh nhân tạo ANN mô xử lý thông tin, nghiên cứu từ hệ thống thần kinh sinh vật, giống não để xử lý thơng tin Nó bao gồm số lượng lớn mối gắn kết cấp cao để xử lý yếu tố làm việc mối liên hệ giải vấn đề rõ ràng ANN giới thiệu vào năm 1943 nhà thần kinh học Warren McCulloch nhà logic học Walter Pits Những năm gần đây, mô ANN xuất phát triển nhiều, nghiên cứu ứng dụng thực ngành điện, điện tử, kỹ thuật chế tạo, y học, quân sự, kinh tế nghiên cứu ứng dụng lĩnh vực quản lý dự án xây dựng Tại Việt Nam, việc nghiên cứu ứng dụng ANN vào quản lý bắt đầu vài năm gần nhanh chóng thu hút quan tâm cần phát triển Trong lĩnh vực kinh tế, thừa nhận ứng dụng từ nhiều năm trước cịn phức tạp Nhiều nhà kinh tế tiến hành hàng loạt nghiên cứu tập trung vào việc ứng dụng mạng thần kinh nhân tạo việc xác định mối quan hệ dự báo nhân tố, biến số kinh tế, chẳng hạn tốc độ tăng trưởng Tổng sản phẩm quốc nội, lạm phát, tỷ giá hối đoái, giá chứng khoán, … nhiều nước đạt nhiều kết khả quan Mạng thần kinh nhân tạo hệ thống xử lý thông tin theo cách thức xử lý thông tin nơ-ron sinh học, bao gồm nhiều nơ-ron nhân tạo hoạt động song song Một nhóm nơ-ron xếp cho tất chúng nhận tín hiệu đầu vào thời điểm, sau xử lý cho tín hiệu đầu lúc, gọi lớp mạng (Layer) Mạng thần kinh nhân tạo đơn giản có hai lớp: lớp đầu vào (Input layer) nhận tín hiệu đầu vào lớp đầu (Output layer) cho tín hiệu đầu mạng Lớp đầu vào thực chất nơ-ron thực, nơ-ron hoạt động đơn giản nhằm giới thiệu tín hiệu, thông tin vào (giá trị biến đầu vào) Chúng ta kết hợp nhiều lớp mạng tạo thành mạng đa lớp, lớp nằm lớp đầu vào lớp đầu gọi lớp ẩn (Hidden layers) Olympic Kinh tế lượng ứng dụng năm 2018 200 Nguồn: Xử lý tác giả Hình Cấu trúc mạng thần kinh nhân tạo 3.3.2 Quá trình huấn luyện mạng Quá trình học Mạng thần kinh Mạng thần kinh huấn luyện cách đưa cặp tín hiệu đầu vào tín hiệu đầu vào mạng Các cặp số liệu liên tục đưa vào mạng mạng nhanh chóng học mối quan hệ đầu vào đầu ra, trình gọi trình mạng huấn luyện Sau đó, ta đưa tín hiệu vào mạng, mạng xử lý dựa mối quan hệ biến vào biến học tín hiệu tương ứng Quá trình huấn luyện thực chất việc điều chỉnh trọng số kết nối mạng Trong trình huấn luyện, trọng số điều chỉnh đến đạt giá trị cho với tín hiệu đầu vào mạng cho tín hiệu đầu gần với giá trị đầu mục tiêu nhất; nói cách khác, sai số giá trị đầu mạng giá trị đầu mục tiêu nhỏ Hàm truyền Hàm truyền hay cịn gọi hàm kích hoạt thành phần khơng thể thiếu mơ hình mạng thần kinh Hàm truyền giúp cho thông tin truyền từ nơ-ron đến nơ-ron khác, kết hàm truyền thông tin đầu lớp ẩn lớp đầu Phần mềm cho mơ hình ANN có sẵn loại hàm truyền, dạng hàm truyền tuyến tính, dạng hàm phi tuyến để xây dựng mơ hình phân hóa thành dạng cụ thể hàm HyperTanh, Tanh, TanhAxon, LinearTanh, LinearSigmoid, Arctan, Arcotan, sin, cos… Thuật toán lan truyền ngược Thuật toán lan truyền ngược (BackPropagation) thuật toán điều chỉnh trọng số sử dụng phổ biến Thuật ngữ truyền ngược đề cập đến chiều truyền sai số Phương pháp lan truyền ngược sử dụng tập hợp giá trị đầu vào đầu để tìm mạng nơ-ron thần kinh mong muốn Một tập hợp đầu vào đưa vào hệ thống giả định trước để tính giá trị đầu ra, sau giá trị đầu so sánh với giá trị giá trị thực Nếu khác biệt nào, khơng cần thực trình kiểm tra nào, ngược lại trọng số thay đổi trình lan truyền ngược mạng thần kinh để giảm khác biệt 3.4 Phần mềm sử dụng 3.4.1 Eviews EViews (Econometric Views) phiên 6.0 phần mềm chuyên kinh tế lượng, nghiên cứu với liệu chuỗi thời gian, liệu chéo, liệu mảng…Với khả linh hoạt thao thác, quản lý liệu dễ dàng, kết hiển thị nhanh dễ dàng hiểu giúp Eviews trở thành phần mềm thống kê phân tích báo nhà nghiên cứu sử dụng phổ biến Phần mềm sử dụng dùng dể phân tích hồi quy mơ hình SARIMA nghiên cứu 3.4.2 SPICE-MLP Olympic Kinh tế lượng ứng dụng năm 2018 201 Spice-MLP phiên 2.2 phần mềm mạng nơ ron lớp, với nhiều đầu vào nhiều đầu Spice-MLP viết với mục đích hướng dẫn sinh viên nghiên cứu sinh học tập sử dụng mạng nơ ron để mơ hình hóa nhiều loại liệu khác Hiện Spice-MLP nhiều bạn giới sử dụng Spice-MLP có giao diện với tiếng Việt, tiếng Anh tiếng Nhật SpiceMLP viết tác giả làm việc Soft Intelligence Laboratory, Ritsumeikan University, Japan, 2003-2007 thường xuyên cập nhật theo yêu cầu người sử dụng Kết nghiên cứu 4.1 Phương pháp chuỗi thời gian SARIMA 4.1.1 Nhận dạng mơ hình Chuỗi số liệu lượng khách quốc tế đến Việt Nam sử dụng mơ hình SARIMA theo phương pháp Box-Jenkins giả định chuỗi dừng, để dự báo lượng khách quốc tế mơ hình cần phải xem xét chuỗi liệu nghiên cứu có dừng hay chưa Trước tiên, dựa vào việc quan sát đồ thị chuỗi số liệu, sau tiến hành kiểm tra tính dừng thơng qua hai kiểm định phổ biến: Augmented Dickey-Fuller (ADF) Perron-Phillips (PP) gọi kiểm định nghiệm đơn vị (unit root test) Hình cho thấy, chuỗi liệu nghiên cứu chưa dừng, ta cần lấy sai phân bậc chuỗi liệu tiến hành hai kiểm định ADF PP theo kết Bảng Bảng 1: Kết kiểm định ADF PP Kiểm định Giá trị t Xác suất ADF - 12.0821 0.0001 PP - 12.1572 0.0001 Các giá trị tới han mức ý nghĩa thống kê 1%, 5%, 10% tương ứng là: -3.505, -2.894, -2.584 Nguồn: Xử lý số liệu tác giả Kết hai kiểm định ADF PP cho phép ta bác bỏ giả thuyết H0 tính dừng liệu mức ý nghĩa 1% tức liệu sau lấy sai phân bậc dừng Tại ta xác định d=1 Tiếp đó, để xác định giá trị p, q mơ hình SARIMA, ta cần dựa vào biểu đồ hàm tự tương quan ACF tự tương quan phần PACF Trong biểu đồ PACF Hình 3, hệ số tương quan riêng phần khác khơng có ý nghĩa độ trễ 1, 12 sau tắt dần Nguồn: Xử lý số liệu tác giả Hình Biểu đồ ACF VÀ PACF Olympic Kinh tế lượng ứng dụng năm 2018 202 Còn biểu đồ ACF, ta có hệ số tương quan khác khơng có ý nghĩa độ trễ 1, sau tắt dần Như vậy, biểu đồ ta nên chọn p (1, 5, 12) q (1) cho thành phần khơng có tính mùa Ngồi ra, Hình cho thấy có đỉnh nhọn độ trễ 12, 24 36 ACF sau tắt hết 0, gợi ý thành phần MA có tính mùa cần xem xét mơ hình Trên PACF tồn đỉnh nhọn độ trễ 12 sau tắt hết 0, thành phần AR có tính mùa phải cần bao gồm Và điều có nghĩa nên chọn P = 1, Q = L = 12 cho thành phần có tính mùa Sai phân theo mùa D = giống với sai phân thường Tóm lại, dạng mơ hình SARIMA nhận diện bao gồm SARIMA (1,1,1) (1,1,3) 12, SARIMA (5,1,1) (1,1,3)12, SARIMA (12,1,1) (1,1,3)12 4.1.2 Ước lượng mơ hình Các mơ hình nhận diện so sánh tính phù hợp dựa thông số kiểm định sau hồi quy bao gồm: R điều chỉnh, công cụ thông tin Akaike (AIC), công cụ Schwarz (SC) để lựa chọn mô hình phù hợp Thơng số R điều chỉnh phải lớn, AIC SC phải nhỏ tốt, mơ hình phù hợp Từ Bảng ta thấy, mơ hình SARIMA (12,1,1) (1,1,3) 12 mơ hình thỏa mãn nhiều tiêu chuẩn sử dụng có thơng số R lớn nhất, thơng số AIC SC nhỏ mơ hình vận dụng vào việc dự báo Bảng 2: Các mơ hình SARIMA (p,d,q) (P,D,Q)L thử nghiệm Mơ hình SARIMA (1,1,1) (1,1,3)12 SARIMA (5,1,1) (1,1,3)12 SARIMA (12,1,1) (1,1,3)12 R2 điều chỉnh 0.717 0.718 0.814 AIC 24.283 24.319 23.798 SC 24.494 24.537 24.029 Nguồn: Xử lý số liệu tác giả Kết ước lượng Bảng cho thấy, có hệ số có ý nghĩa mức 1% Cũng Bảng 3, SAR (thể điều kiện chạy mơ hình mang tính thời vụ) thêm vào mơ hình ACF khoảng thời gian mùa vụ (12 tháng) dương SMA (thể điều kiện chạy mơ hình mang tính thời vụ) thêm vào ACF khoảng thời gian mùa vụ (12 tháng) âm Mơ hình sau kiểm tra mức độ phù hợp với chuỗi liệu nghiên cứu cách phân tích phần dư Bảng 3: Kết ước lượng mơ hình SARIMA (12,1,1) (1,1,3)12 Biến C AR (12) SAR (12) MA (1) SMA (12) SMA (24) SMA (36) Hệ số -81221.500 -0.372 1.052 -0.480 -0.336 -0.308 0.905 Sai số chuẩn 105270 0.124 0.059 0.124 0.055 0.000 0.058 Thống kê t -0.771 -3.006 17.762 -3.878 -6.110 -232529.8 15.662 Xác suất 0.443 0.004 0.000 0.000 0.000 0.000 0.000 Nguồn: Xử lý số liệu tác giả 4.1.3 Kiểm định phần dư Biểu đồ ACF phần dư Hình cho thấy, khơng có vượt đường biên cho thấy sai số nhiễu trắng Ngoài ra, kết kiểm định Breusch-Godfrey mức ý nghĩa 1% cho thấy không tồn tượng tự tương quan bậc Olympic Kinh tế lượng ứng dụng năm 2018 203 Nguồn: Xử lý số liệu tác giả Hình Biểu đồ ACF VÀ PACF phần dư Kết kiểm tra mơ hình SARIMA (12,1,1) (1,1,3)12 kiểm định Breusch – Godfrey thích hợp sử dụng để dự báo (Bảng 4) Bảng 4: Kết kiểm định Breusch-Godfrey Kiểm định Breusch-Godfrey Giá trị t 2.168 Xác suất 0.373 Nguồn: Xử lý số liệu tác giả 4.2 Phương pháp mạng thần kinh nhân tạo ANN 4.2.1 Chuẩn hóa liệu Chuẩn hóa liệu đến việc phân tích chuyển đổi biến đầu vào đầu để tối thiểu độ nhiễu, loại bỏ tính xu hướng Có nhiều cách để xử lý liệu, sử dụng phổ biến lấy sai phân bậc lấy logarit tự nhiên Theo Lê Đạt Chí (2010), liệu thơ lấy logarit tự nhiên đầu vào đầu Phép biến đổi logarit tự nhiên hữu ích liệu mà xuất đồng thời giá trị lớn, bé Tác giả định sử dụng phép biến đổi logarit tự nhiên liệu khách quốc tế (đơn vị tính: triệu người) nghiên cứu nhằm đạt hiệu cao 4.2.2 Phân chia liệu Trong giai đoạn huấn luyện ANN, nghiên cứu chia chuỗi liệu lượng khách quốc tế đến Việt Nam thu thập thành ba tập liệu gọi là: Tập hợp liệu huấn luyện, kiểm tra dự báo Quá trình phân chia thực cách ngẫu nhiên Tập hợp liệu huấn luyện tập hợp có số lượng mẫu lớn số tập hợp vừa nêu, sử dụng 70% số quan sát để huấn luyện mạng ANN tổng số 92 quan sát dùng để huấn luyện kiểm tra Tập hợp liệu kiểm tra, nghiên cứu sử dụng số lượng 30% số quan sát ngẫu nhiên tổng số 92 quan sát dùng để huấn luyện kiểm tra, trình dùng để ước lượng khả khái qt hóa phân tích mà ANN học tập sau trải qua bước huấn luyện trước Tập hợp liệu đánh giá kết dự báo Bước cuối trình huấn luyện kiểm tra hiệu hoạt động ANN trải qua tập hợp huấn luyện kiểm tra xác minh hiệu dự báo ANN tập hợp liệu mà ANN chưa nhìn thấy trước Tập hợp liệu gồm quan sát từ tháng 6/2017 tới tháng 2/2018 4.2.3 Thiết kế mạng nơ-ron Olympic Kinh tế lượng ứng dụng năm 2018 204 Sự phức tạp mơ hình mạng thần kinh nhân tạo xây dựng mơ hình khơng phải chọn liệu cho mơ hình mà cịn phải lựa chọn cấu trúc mạng phù hợp Bên cạnh số kinh nghiệm rút từ thực nghiệm nhà nghiên cứu việc xây dựng mơ hình mạng thần kinh tốt với thơng số lựa chọn thích hợp cần thực dựa phương pháp thử sai Tác giả lựa chọn thủ tục đưa dần biến vào để xây dựng mô hình, số lượng cấu trúc cần thực thử sai lớn nên cấu trúc tác giả thực huấn luyện lần, sau chọn 10 cấu trúc có MSE liệu kiểm tra nhỏ để thực thêm 10 lần cho cấu trúc Cuối cùng, tác giả tìm mơ hình Mạng thần kinh với MSE liệu kiểm tra nhỏ Số nơ-ron đầu vào Số nơ-ron đầu vào mơ hình số biến độc lập mơ hình tuyến tính truyến thống Dựa theo nghiên cứu Lin công (2011), số nơ-ron lớp đầu vào 12 tương ứng với lượng khách du lịch có độ trễ 12 tháng trước so với tháng dự báo Điều gần tương tự tính mùa mơ hình SARIMA phân tích trước Số lớp ẩn Việc sử dụng nhiều lớp ẩn khiến cho việc huấn luyện trở nên chậm lớn Một số nghiên cứu phần lớn toán cụ thể, cần sử dụng lớp ẩn cho mạng đủ Tăng số lượng lớp ẩn làm gia tăng thời gian tính tốn gặp phải vấn đề khít q mức, điều dẫn tới dự báo mẫu hiệu Với số lượng quan sát không nhiều nên phạm vi nghiên cứu này, tác giả sử dụng lớp ẩn, lớp đầu vào lớp đầu Hàm truyền Trong phạm vi phần mềm SPICE-MLP, tác giả sử dụng hai hàm truyền phi tuyến phổ biến kinh tế hàm HyperTanh Sigmoid, chọn hàm truyền có MSE nhỏ để tiến hành dự báo Hàm kích hoạt mạng MLP chia thành hai loại hàm kích hoạt đầu vào lớp ẩn hàm kích hoạt đầu lớp ẩn Kết thực chạy mơ hình cho thấy hàm kích hoạt đầu vào lớp ẩn nên hàm HyperTanh hàm kích hoạt đầu lớp ẩn nên hàm HyperTanh có MSE nhỏ Bảng 5: Kết so sánh hàm kích hoạt Hàm kích hoạt đầu vào lớp ẩn HyperTanh HyperTanh Sigmoid Sigmoid Hàm kích hoạt đầu lớp ẩn HyperTanh Sigmoid Sigmoid HyperTanh MSE nhỏ 0.01018 0.19265 0.19336 0.01332 Nguồn: Xử lý số liệu tác giả 4.2.3.4 Số nơ-ron lớp ẩn Quá trình xây dựng lớp ẩn cho mạng ANN trình thử sai Ta thay đổi số lớp ẩn số nơ-ron lớp ẩn Để tìm mơ hình ANN tốt nhất, tác giả lựa chọn mơ hình sau để đưa vào phân tích: Bảng 6: Kết so sánh mơ hình với số nơ-ron lớp ẩn Số biến vào Số Nơ-ron lớp ẩn Số biến Ký hiệu 12 12 12 12 12 12 12 12 25 26 27 28 29 30 31 32 12-25-1 12-26-1 12-27-1 12-28-1 12-29-1 12-30-1 12-31-1 12-32-1 1 1 1 1 Olympic Kinh tế lượng ứng dụng năm 2018 MSE tập liệu kiểm tra 0.01040 0.01031 0.01029 0.01045 0.01018 0.01036 0.01033 0.01025 205 Nguồn: Xử lý số liệu tác giả Để tìm mơ hình tối ưu với số nơ-ron lớp ẩn cần phải huấn luyện nhiều lần mơ hình – số lần lặp mặc định 100.000 lần theo Lin cộng (2011) Mỗi 10.000 lần lặp, tác giả kiểm tra lại MSE tập liệu kiểm tra để kiểm tra MSE thấp hay chưa Kết cuối nghiên cứu mơ hình ANN-12-29-1 tối ưu với 29 nơ ron lớp ẩn Các thông số sử dụng để huấn luyện Mạng thần kinh thể bảng 7: Bảng 7: Thông số huấn luyện Tên thông số Mạng thần kinh sử dụng Phần mềm sử dụng Phương pháp chuẩn hóa liệu Số lượng nơ-ron đầu vào Số lượng nơ-ron lớp ẩn Số lượng nơ-ron đầu Hàm kích hoạt đầu vào lớp ẩn Hàm kích hoạt đầu lớp ẩn MSE yêu cầu Số lần lặp Các lựa chọn Mạng thần kinh truyền thẳng đa lớp MLP (Multi Layer Perceptron) Spice-MLP Logarit tự nhiên 12 29 Tanh Hyperbolic Tanh Hyperbolic 0.01 100.000 Nguồn: Xử lý số liệu tác giả 4.3 So sánh kết dự báo hai phương pháp Sử dụng tiêu so sánh hiệu dự báo MSE, RMSE, MAE hệ số MAD trình tổng quan nghiên cứu để thực so sánh hoạt động dự báo hai mơ hình: Mơ hình chuỗi thời gian SARIMA mơ hình mạng thần kinh nhân tạo (ANN) có kết theo bảng 8: Bảng 8: Kết dự báo hai phương pháp Thời gian Lượng Lượng Chênh khách thực khách dự lệch tế báo SARIMA lượng khách 06/2017 949,362 889,549 -6.30% 07/2017 1,036,880 1,005,056 -3.07% 08/2017 1,229,163 1,076,734 -12.40% 09/2017 975,952 1,037,479 6.30% 10/2017 1,024,899 1,007,445 -1.70% 11/2017 1,172,568 1,099,246 -6.25% 12/2017 1,276,353 1,163,207 -8.86% 01/2018 1,430,242 1,353,802 -5.34% 02/2018 1,431,845 1,563,050 9.16% RMSE 90154.89 MAE 0.0839 MAPE 0.066004 MAD 79684.44 Lượng khách dự báo ANN 923,584 1,011,563 1,188,292 1,044,403 1,014,770 1,169,029 1,206,737 1,387,074 1,501,122 46291.01 0.0417 0.033441 39571.78 Chênh lệch lượng khách -2.72% -2.44% -3.33% 7.01% -0.99% -0.30% -5.45% -3.02% 4.84% Nguồn: Xử lý số liệu tác giả Từ bảng trên, ta thấy số đánh giá hiệu mơ hình dự báo MSE, RMSE, MAE MAD mơ hình khác hệ số mơ hình ANN nhỏ (khoảng gần lần) so với mơ hình SARIMA Có thể nói khả tổng qt hóa mơ hình mạng thần kinh nhân tạo ANN tốt so với mơ hình chuỗi thời gian SARIMA; hay nói cách khác, mơ hình mạng thần kinh nhân tạo ANN xây dựng nghiên cứu cho kết dự báo lượng khách quốc tế đến Việt Nam từ tháng 6/2017 tới tháng 2/2018 tốt mơ hình SARIMA Kết phù hợp với nghiên cứu trước tác giả Pattie Snyder (1996) dự Olympic Kinh tế lượng ứng dụng năm 2018 206 báo theo tháng lượng khách nghỉ qua đêm công viên quốc gia Mỹ, Law Au (1999) dự báo lượng khách khu vực tới Hồng Kông, Law (2000) dự báo lượng khách quốc tế Đài Loan tới Hồng Kông, Burger cộng (2001 dự báo lượng khách du lịch từ Mỹ tới Durban Nam Phi, Cho (2003) dự báo lượng cầu khách du lịch Hồng Kông, Kon Turner (2005) dự báo lượng khách du lịch nước tới Singapore 2,000,000 1,500,000 1,000,000 500,000 - Lượng khách thực tế Lượng khách dự báo SARIMA Lượng khách dự báo ANN Hình Đồ thị dự báo lượng khách quốc tế đến Việt Nam từ tháng 6/2017 tới tháng 2/2018 Kết luận Nghiên cứu sử dụng phương pháp Box-Jenkins (1976) mạng thần kinh nhân tạo ANN để lập mơ hình dự báo lượng khách quốc tế đến Việt Nam Mơ hình SARIMA mơ hình chuỗi thời gian tn theo q trình tự hồi quy tích hợp với trung bình trượt với độ trễ thời gian 12 hay SARIMA (12,1,1) (1,1,3)12 Mơ hình ANN-12-29-1 lựa chọn có 12 nơ-ron đầu vào, 29 nơ-ron lớp ẩn nơ-ron đầu thông số khác So sánh kết với dự báo hai mơ hình theo tiêu chuẩn báo MSE, RMSE, MAE MAD kết cho thấy mơ hình ANN dự báo tốt so với SARIMA Điều phù hợp với nhiều kết các tác Burger cộng (2001), Cho (2003) … Nghiên cứu cịn có số hạn chế sau: Thứ nhất, độ dài liệu ngắn có 101 tháng dẫn tới số quan sát đưa vào mơ hình cịn hạn chế, nên q trình dự báo lượng khách ngồi mẫu tương lai dựa hai mơ hình nghiên cứu thời gian ngắn, dự báo thời gian dài dẫn tới sai số lớn Dữ liệu có nhiều quan sát áp dụng lớp ẩn dự báo xác Thứ hai, biến độc lập hay nơ-ron lớp đầu vào xét tới liệu khứ khách quốc tế mà thiếu biến kiểm soát có tác động GDP, lạm phát, tỷ giá hối đoái, kiện bất thường… dẫn tới mức độ giải thích mơ hình cịn chưa cao Thứ ba, phần mềm sử dụng dự báo ANN SPICE-MLP nhiều hạn chế phần mềm dùng cho học tập nghiên cứu đơn giản, thiếu số tính năng, chưa mang tính chuyên nghiệp thương mại cao Neuro Solutions Hướng nghiên cứu tương lai tác giả cố gắng hồn thiện mơ hình ANN cách sử dụng phần mềm chuyên nghiệp, có độ tin cậy cao dùng để áp dụng dự báo không lĩnh vực du lịch mà lĩnh vực khác quan tâm tài chính, y tế, giáo dục… Ngoài ra, thời gian tới tác giả nâng cao nghiên cứu cách so sánh thêm nhiều mơ hình tuyến tính lẫn phi tuyến khác, mở rộng mẫu nghiên cứu với quốc gia khu vực giới TÀI LIỆU THAM KHẢO [1] Box, G.E.P., and G.M Jenkins (1976), Time Series Analysis: Forecasting and Control, Revised Edition, Holden Day, San Francisco [2] Burger, C., Dohnal, M., Kathrada, M., & Law, R (2001), A practitionerrs guide to time-series methods for tourism deman forecasting: A case study of Durban, South Africa, Tourism Management, 22, 403–409 Olympic Kinh tế lượng ứng dụng năm 2018 207 [3] Chaitip, P., Chaiboonsri and R Mukhjang (2008), Time Series Models for Forecasting International Visitor Arrivals to Thailand, International Conference on Applied Economics, 2008, pp 159-163 [4] Cho, V (2003), A comparison of three different apporaches to tourist arrival forecasting, Tourism Management, 24(3), 323-330 [5] Cybenko, G (1989), Approximation by superpositions of a sigmoidal function Mathematical Control, Signal and Systems, 2, 303–314 [6] Kodituwakku, W., Wijesundara, W., & Hettiarachchi, C (2015), Modelling and Forecasting Tourism Demand for Sri Lanka, Colombo: University of Colombo School of Computing [7] Funahashi, K (1989), On the approximate realization of continuous mappings by neural networks, Neural Networks, 2, 183–192 [8] Hansen, J V., McDonald, J B., & Nelson, R D (1999), Time series prediction with geneticalgorithm designed neural networks: An empirical comparison with modern statistical models, Computational Intelligence, 15(3), 171–184 [9] Hornik, K., Stinchcombe, M., & White, H (1989), Multilayer feedforward networks are universal approximators, Neural Networks, 2(5), 359–366 Olympic Kinh tế lượng ứng dụng năm 2018 208

Ngày đăng: 14/02/2022, 18:42