Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 23 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
23
Dung lượng
399 KB
Nội dung
CHƯƠNG 1: TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU Hiện có số nghiên cứu dự báo lượng khách du lịch quốc tế đến Việt Nam nhiều phương pháp khác Nhóm nghiên cứu xin trích dẫn số nghiên cứu tiêu biểu Tác giả Mai Phương với luận văn nghiên cứu Các phương pháp thống kê nghiên cứu lượng khách du lịch phương pháp thống kê nghiên cứu lượng khách du lịch tiêu biểu sau: Phương pháp số tương đối số tuyệt đối, Dãy số thời gian, Hồi quy tương quan Trong bật phương pháp dãy số thời gian, từ số liệu thực tế qua việc sử dụng dãy số thời gian, tác giả tiến hành tính tốn tiêu, phân tích, tìm quy luật, kết luận số lượng khách du lịch dự đoán cho tương lai Trong nghiên cứu này, tác giả số phương pháp dự đoán thống kê ngắn hạn thường dùng du lịch là: Dự đoán dựa vào lượng tăng (giảm) tuyệt đối trung bình: Điều kiện áp dụng : Áp dụng trường hợp dãy số có lượng tăng (giảm) tuyệt đối liên hồn xấp Mơ hình có dạng : Trong đó:- h: Thời hạn dự đốn (tầm xa dự đoán) - : Mức độ dùng làm gốc ngoại suy - : mức độ cuối dãy số, mức độ bình qn vài thời kỳ cuối dãy số - ̅̅ :Là lượng tăng (giảm) tuyệt đối bình quân : Là giá trị dự đoán điểm thứ n+h Do yêu cầu tài liệu đơn giản nên phương pháp phù hợp với việc nghiên cứu lượng khách du lịch, nhiên hạn chế mức độ xác chưa cao phụ thuộc vào mức độ đầu cuối, bỏ qua biến động tượng thời gian nghiên cứu Dự đoán dựa vào hàm xu biến động thời vụ: Mơ hình dự đốn : Trong đó: = : Mức độ dự đốn thời gian thứ I thuộc năm j i: Tháng, quý; i=1, j: Năm: j=1, : Là mức độ dự đoán năm j : Là số thời vụ thời gian thứ i Trong ngành du lịch nay, phương pháp sử dụng tương đối phổ biến phán ảnh xác biến động tổng số lượng khách quốc tế đén Việt Nam qua năm Tuy nhiên phương pháp địi hỏi phải có số liệu tháng, q Tác giả Phạm Quang Hưng có viết Một số phương pháp dự báo du lịch tập trung đề cập đến hai phương pháp dự báo đơn giản ứng dụng nhiều phương pháp ngoại suy khơng đổi phương pháp ngoại suy bình qn giản đơn, số nhu cầu lượng khách du lịch quốc tế dự kiến đón làm đối tượng xác định cần dự báo Phương pháp ngoại suy không đổi: Điều kiện áp dụng: Thường áp dụng bối cảnh tình hình tăng trưởng du lịch tương đối ổn định, bị tác động yếu tố độc lập (tác động bên ngoài) Các bước tiến hành: -Bước 1: Thu thập liệu lượng khách du lịch quốc tế đón giai đoạn hành khứ -Bước 2: Tính tỷ lệ % tăng giảm lượng khách qua năm tỷ lệ chênh lệch -Bước 3: Sử dụng tỷ lệ % thay đổi so với giai đoạn hành làm sở dự báo cho giai đoạn kỳ năm tới Cơng thức dự báo: Phương trình a: Ft = At - Phương trình b: Ft = At – × (At – 1/At – 2) Trong đó: F = Giá trị cần dự báo; A = giá trị thực tế đạt được; t = Mốc thời gian cần dự báo Phương pháp ngoại suy bình quân giản đơn Điều kiện áp dụng: Khi muốn dự báo chắn với số tương đối an toàn bao hàm cà yếu tố khập khiễng, thất thường tăng trường, yếu tố không mong đợi Các bước tiến hành: Bước 1: Thu thập liệu nhu cầu du lịch cần dự báo (Lượng khách du lịch quốc tế đón được) đạt giai đoạn hành q khứ Bước 2: Tính bình qn tỷ lệ % tăng giảm qua năm Bước 3: Sử dụng tỷ lệ % thay đổi so với giai đoạn hành làm sở dự báo cho số nhu cầu du lịch giai đoạn kỳ năm tới Cơng thức dự báo: Phương trình: Ft = (At-1 + At-2 + At-3)/n Trong đó: F = Giá trị cần dự báo; A = Giá trị thực tế đạt được; t= Mốc thời gian cần dự báo; n = Khoảng chuỗi thời gian khứ Từ tổng quan tình hình nghiên cứu liên quan đến đề tài nghiên cứu cho thấy rằng, công tác dự báo vô cần thiết quan trọng Trên thực tế có nhiều phương pháp phổ biến để thực dự báo, nhiên tùy thuộc vào thực tế tình hình thực tế, mục tiêu dự báo khả sử dụng nguồn số liệu mà cá nhân, tổ chức định lựa chọn phương pháp riêng, phù hợp với khả điều kiện cho phép Qua trình tìm hiểu tiếp cận nhiều nguồn số liệu, nhóm nghiên cứu tập trung lựa chọn phương pháp san mũ Winters ARIMA để làm phương pháp dự báo cho lượng khách quốc tế đến Việt Nam khoảng thời gian tháng 11 năm 2019 đến tháng 12 năm 2020 CHƯƠNG 2: KHẢO SÁT DỮ LIỆU 2.1 Những đặc tính chuỗi số liệu Số liệu mà nhóm tác giả sử dụng lượng khách du lịch quốc tế đến Việt Nam từ tháng năm 2012 đến tháng 10 năm 2019, gồm 94 quan sát Số liệu nhóm tổng hợp từ nguồn CSDL Thống kê Du lịch Tổng cục Du lịch Việt Nam, thuộc Bộ Văn hóa, Thể thao Du lịch Website http://thongke.tourism.vn/ Mở cửa sổ Series: Visitor vào View/ Descriptive Statistics & Tests/ Stats Table Ta bảng mô tả số thống kê quan trọng sau: Số quan sát (Observations): 94 Giá trị trung bình (Mean): 881892.4 Số trung vị (Median): 771968.5 Giá trị lớn (Maximum: 1618337 Giá trị nhỏ (Minimum): 417429.0 Độ lệch chuẩn (Std Dev.): 323506.6 Trên cửa sổ Series: Visitor vào View/ Graph/ Line and symbol, ta có biểu đồ mơ tả số liệu: Bảng 2.1: Biểu đồ thể lượng du khách quốc tế đến Việt Nam từ tháng 1/2012 đến tháng 10/2019 Đơn vị: lượt người VISITOR 1,800,000 1,600,000 1,400,000 1,200,000 1,000,000 800,000 600,000 400,000 2012 2013 2014 2015 2016 2017 2018 2019 Nguồn: Tổng cục Du lịch Biểu đồ cho thấy, khoảng thời gian từ tháng 1/2012 đến hết tháng 10/2019, lượng khách du lịch đến Việt Nam có xu hướng tăng lên đáng kể Chuỗi tăng tốc dần lên theo thời gian, nên ta chọn mơ hình nhân Trên cửa sổ Series: Visitor vào View/ Graph/ Seasonal Graph, ta có biểu đồ mơ tả tính mùa vụ số liệu: Bảng 2.2: Biểu đồ mơ tả tính mùa vụ chuỗi visitor Đơn vị: lượt người VISITOR by Season 1,800,000 1,600,000 1,400,000 1,200,000 1,000,000 800,000 600,000 400,000 Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Means by Season Nguồn: Tổng cục Du lịch Các vạch đỏ (vạch nằm ngang) hình giá trị trung bình mùa Từ sơ đồ trên, ta thấy vạch đỏ chênh lệch không nhiều chứng tỏ yếu tố mùa vụ chuỗi giá trị sử dụng khơng rõ ràng 2.2 Kiểm định tính mùa vụ Kruscal Wallis Tạo biến cma lệnh: genr cma=(0.5*visitor(-6)+ visitor(-5)+ visitor(-4)+ visitor(-3)+visitor(-2)+visitor(-1)+visitor+visitor(1)+visitor(2)+visitor(3)+ visitor(4)+ visitor(5)+ 0.5*visitor(6))/12 Tạo biến sim lệnh: genr sim=visitor/cma Số liệu dạng tháng nên tạo biến tháng lệnh: genr month=@month Kích đúp chuột vào biến sim -> View -> Descriptive Statistics & Tests -> Equility Tests by Classification -> Series/Group for classify: month -> Test equality of: Median -> OK Bảng 2.3: Kiểm định tính mùa vụ Kruscal Wallis Method df Value Probability Med Chi-square 11 43.23810 0.0000 Adj Med Chi-square 11 29.09524 0.0022 Kruskal-Wallis 11 61.24285 0.0000 Kruskal-Wallis (tie-adj.) 11 61.24285 0.0000 van der Waerden 11 59.26708 0.0000 Nguồn: Eview Cặp giả thiết: H0 : khơng có tính mùa vụ (các sim nhau) H1 : có tính mùa vụ (các sim khác nhau) p-value = 0.0000 < 0.05 -> bác bỏ H0 -> chuỗi có tính mùa vụ Ta tiến hành tách yếu tố mùa vụ cho chuỗi gốc sau: Trên cửa sổ Series: Visitor chọn Proc/Seasonal Adjustment/Moving Average Methods Vì cường độ mùa vụ tăng dần theo thời gian nên nhóm hiệu chỉnh yếu tố mùa vụ chuỗi theo mơ hình nhân, cửa sổ Seasonal Adjustment, mục Adjustment methods chọn Ratio to moving average-Multiplicative Factor điềm sfm -> OK Chuỗi tách yếu tố mùa vụ visitorsa, số mùa vụ sfm Ta có kết số mùa vụ sau: 11 Bảng 2.4: Scaling Factors sau hiệu chỉnh yếu tố mùa vụ cho chuỗi Date: 12/04/19 Time: 16:31 Sample: 2012M01 2019M10 Included observations: 94 Ratio to Moving Average Original Series: VISITOR Adjusted Series: VISITORSA Scaling Factors: 1.123225 1.158754 1.029705 1.056145 0.938264 0.872251 0.937145 1.021002 0.906391 10 0.912796 11 1.039129 12 1.049413 Nguồn: Eview 2.3 Kiểm định tính dừng chuỗi phân tích giản đồ tự tương quan ACF giản đồ tự tương quan riêng phần PACF Ta có cặp giả thuyết: H0:Chuỗi sau hiệu chỉnh mùa vụ không dừng H1:Chuỗi sau hiệu chỉnh mùa vụ dừng Trên cửa sổ Series: Visitorsa vào View/ Unit Root Test, phần Test for unit root in chọn Level, ta có bảng kết sau: 12 Bảng 2.5: Kiểm định tính dừng chuỗi sau hiệu chỉnh mùa vụ Unit Root Test Null Hypothesis: VISITORSA has a unit root Exogenous: Constant Lag Length: (Automatic - based on SIC, maxlag=11) t-Statistic Prob.* Augmented Dickey-Fuller test statistic 2.002222 0.9999 Test critical values: 1% level -3.503049 5% level -2.893230 10% level -2.583740 Nguồn: Eview Từ bảng kết quả, ta thấy: P-value = 0.9999 > α = 0.05 → Khơng có sở bác bỏ H0 → Chuỗi visitorsa không dừng Ta thử lấy sai phân bậc chuỗi visitorsa Trên cửa sổ Series: Visitorsa vào lại View/ Unit Root Tests, phần Test for unit root in chọn 1st difference, ta được: Bảng 2.6: Kiểm định tính dừng sai phân bậc chuỗi sau hiệu chỉnh mùa vụ Unit Root Test Null Hypothesis: D(VISITORSA) has a unit root Exogenous: Constant Lag Length: (Automatic - based on SIC, maxlag=11) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -11.41728 0.0001 Test critical values: 1% level -3.503049 5% level -2.893230 10% level -2.583740 Nguồn: Eview 13 Từ bảng kết quả, ta thấy: P-value = 0.0001 < α = 0.05 → Có thể bác bỏ H0 →Chuỗi Visitorsa dừng sai phân bậc Để xác định giá trị p, q cho mơ hình ARIMA, ta phải dựa vào giản đồ tự tương quan ACF tự tương quan riêng phần PACF Trên cửa sổ Series: Visitorsa vào View/ Correlogram Trên cửa sổ Correlogram Specification, chọn Correlogram of 1st difference độ trễ phần Lags to include 36 Ta có giản đồ tự tương quan tương quan riêng phần sau: 14 Bảng 2.7: Giản đồ tự tương quan tự tương quan riêng phần sai phân bậc chuỗi visitorsa Nguồn: Eview Ta thấy, khơng có độ trễ vượt khỏi đường biên Vậy, ta thử lấy sai phân bậc chuỗi sau: Trên cửa sổ Series: Visitorsa vào lại View/ Unit Root Tests, phần Test for unit root in chọn 2nd difference, ta được: 15 Bảng 2.8: Kiểm định tính dừng cho sai phân bậc chuỗi sau hiệu chỉnh mùa vụ Unit Root Test Null Hypothesis: D(VISITORSA,2) has a unit root Exogenous: Constant Lag Length: (Automatic - based on SIC, maxlag=11) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -9.947685 0.0000 Test critical values: 1% level -3.505595 5% level -2.894332 10% level -2.584325 Nguồn: Eview Từ bảng kết quả, ta thấy: P-value = 0.0000 < α = 0.05 → Có thể bác bỏ H0 →Chuỗi Visitorsa dừng sai phân bậc Trên cửa sổ Series: Visitorsa vào View/ Correlogram Trên cửa sổ Correlogram Specification, chọn Correlogram of 2nd difference độ trễ phần Lags to include 36 Ta có giản đồ tự tương quan tương quan riêng phần sau: 16 Bảng 2.9: Giản đồ tự tương quan tự tương quan riêng phần sai phân bậc chuỗi visitorsa Nguồn: Eview Từ giản đồ ACF PACF trên, ta chọn độ trễ cho AR 1,2,3,6 MA 17 CHƯƠNG 3: LỰA CHỌN PHƯƠNG PHÁP DỰ BÁO Nhóm tác giả định lựa chọn phương pháp san mũ Winters (chuỗi có tính xu mùa vụ), ARIMA (chuỗi dừng sai phân bậc 2, có tính mùa vụ) để dự báo cho chuỗi 3.1 San mũ Winters Xét thấy chuỗi visitor có tính xu mùa vụ, nhóm chọn phương pháp san mũ Winters để tiến hành báo chuỗi Kích đúp chuột trái vào chuỗi visitor -> Proc -> Exponential Smoothing -> Simple Exponential Smoothing -> Smoothing Method: Holts-Winters – Multiplicative -> Smoothed series: visitorwm -> OK Ta bảng kết sau: Bảng 3.1: Bảng kết san mũ Winters Parameters: Alpha 0.7800 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 2.67E+11 Root Mean Squared Error 53297.97 End of Period Levels: Mean 1778629 Trend 10309.56 Seasonals: 2018M11 1.020312 2018M12 1.029115 2019M01 1.148441 2019M02 1.186161 2019M03 1.038712 2019M04 1.073662 2019M05 0.921972 2019M06 0.850721 2019M07 0.928087 2019M08 1.009870 2019M09 0.894196 2019M10 0.898751 Tính MAPE MRSE mơ hình theo công thức: 18 MAPE: genr mape = @mean(@abs(visitor-visitorwm)/visitor) MAPE= 0.047684= 4.7% MRSE: genr mrse = @sqrt (@mean(visitor-visitorwm)^2) MRSE= 3756.634 Các giá trị dự báo tính Excel theo công thức: visitorf=(Mean+h*Trend)*Seasonals (với h số kỳ sau giá trị san cuối cùng) 3.2 ARIMA 3.2.1 Các bước dự báo Xác định p, q giản đồ tự tương quan ACF giản đồ tự tương quan PACF: Kích đúp chuột trái vào chuỗi sau hiệu chỉnh yếu tố mùa vụ visitorsa -> vào View -> Correlogram, hộp thoại Correlogram Specification xuất Ở khung Correlogram of, chọn 2nd difference, ô Lags to include để mặc định độ trễ 36 Ta thu kết sau: Ở giản đồ PACF, độ trễ có vạch vượt đường biên 1, 2, 3, -> p=1, 2, 3, Ở giản đồ ACF, độ trễ có vạch vượt ngồi đường biên -> q=1 Ta ước lượng mơ hình với AR(1, 2, 3, 6) MA(1) Chạy lệnh: ls d(visitorsa,2) c ar(1)ar(2)ar(3)ar(6)ma(1) kết quả: 19 Bảng 3.2: Bảng kết ước lượng để chọn bậc p, q tối ưu Variable Coefficient Std Error t-Statistic Prob C 351.6397 222.4514 1.580748 0.1179 AR(1) -0.229459 0.116149 -1.975557 0.0517 AR(2) -0.070108 0.136358 -0.514147 0.6086 AR(3) -0.113110 0.131320 -0.861328 0.3916 AR(6) -0.034837 0.119609 -0.291252 0.7716 MA(1) -0.972348 0.021734 -44.73811 0.0000 Nguồn: Eview Loại AR(1), AR(2), AR(3), AR(6) hệ số khơng có ý nghĩa thống kê Ước lượng với MA(1) Chạy lệnh: ls d(visitorsa,2) c ma(1) kết quả: Bảng 3.3: Bảng kết hồi quy mơ hình MA(1) Variable Coefficient Std Error t-Statistic Prob C 468.6368 MA(1) -0.987412 219.5264 2.134763 0.0355 0.015813 -62.44226 0.0000 R-squared 0.588190 Mean dependent var 248.7000 Adjusted R-squared 0.583614 S.D dependent var 84158.71 S.E of regression 54305.92 Akaike info criterion 24.66415 Sum squared resid 2.65E+11 Schwarz criterion 24.71898 Log likelihood -1132.551 Hannan-Quinn criter 24.68628 F-statistic 128.5471 Durbin-Watson stat 2.440068 Prob(F-statistic) 0.000000 Inverted MA Roots 99 Nguồn: Eview Kết hồi quy cho thấy hệ số ước lượng có ý nghĩa thống kê mức ý nghĩa 5% 20 Từ bảng kết ước lượng chọn Forecast -> OK Ta kết dự báo cho chuỗi visitorsa mẫu sau: Bảng 3.4: Két dự báo cho chuỗi visitorsa mơ hình MA(1) 5,000,000 Forecast: VISITORSAF Actual: VISITORSA Forecast sample: 2012M01 2019M10 Adjusted sample: 2012M03 2019M10 Included observations: 92 Root Mean Squared Error 347368.4 Mean Absolute Error 270856.5 Mean Abs Percent Error 26.89489 Theil Inequality Coefficient 0.157260 Bias Proportion 0.551339 Variance Proportion 0.376506 Covariance Proportion 0.072155 4,000,000 3,000,000 2,000,000 1,000,000 -1,000,000 2012 2013 2014 2015 VISITORSAF 2016 2017 2018 2019 ± S.E Nguồn: Eview MAPE = 26.89% MRSE = 347368.4 3.2.2 Kiểm định phân phối chuẩn Cặp giả thuyết: H0: Biến có phân phối chuẩn H1: Biến khơng có phân phối chuẩn Từ cửa số ước lượng chọn View -> Residual Diagnostics -> Histogram Normality Test Ta kết quả: 21 Bảng 3.5: Kiểm định phân phối chuẩn cho mơ hình MA(1) 14 Series: Residuals Sample 2012M03 2019M10 Observations 92 12 10 Mean Median Maximum Minimum Std Dev Skewness Kurtosis Jarque-Bera Probability -3795.027 -1411.331 208429.5 -153957.2 53871.74 0.310684 5.024853 17.19682 0.000184 -150000 -100000 -50000 50000 100000 150000 200000 Nguồn: Eview Probability = 0.000184 < 5% -> bác bỏ H0 -> biến khơng có phân phối chuẩn 3.2.3 Kiểm định tự tương quan Cặp giả thuyết: H0: Mơ hình khơng có tự tương quan H1: Mơ hình có tự tương quan Từ cửa số ước lượng chọn View -> Residual Diagnostics -> Serial Correlation LM Test Lags to include: -> OK Prob Chi-Square(2) = 0.1161 > 5% -> khơng có sở bác bỏ H0 -> Mơ hình khơng có tự tương quan 3.2.4 Kiểm định phương sai sai số thay đổi Cặp giả thuyết: H0: Mơ hình khơng có phương sai sai số thay đổi H1: Mơ hình có phương sai sai số thay đổi Từ cửa số ước lượng chọn View -> Residual Diagnostics -> Heteroskedasticity Test -> ARCH -> OK 22 Prob Chi-Square(1) = 0.9122 > 5% -> bác bỏ H0 -> Mô hình có phương sai sai số thay đổi 3.3 Lựa chọn mơ hình tốt Lựa chọn mơ hình dựa sai số dự báo hai mô hình Ta có bảng so sánh sai số dự báo mơ hình san mũ Winters mơ hình MA(1) sau: Bảng 3.6: Bảng so sánh sai số dự báo mơ hình san mũ Winters mơ hình MA(1) Mơ hình Winters MAPE 4.7% MRSE 3756.634 Mơ hình MA(1) 26.89% 347368.4 Nhóm xét thấy sai số mơ hình Winters nhỏ nên lựa chọn mơ hình Winters để dự báo chuỗi 23 CHƯƠNG 4: KẾT QUẢ DỰ BÁO Sau dự báo mẫu chọn mơ hình san mũ Winters, nhóm tiến hành dự báo ngồi mẫu cho chuỗi Đổi range mẫu: kích đúp chuột vào range: end date: 2020M12 Kích đúp chuột trái vào chuỗi visitor -> Proc -> Exponential Smoothing -> Simple Exponential Smoothing -> Smoothing Method: Holts-Winters – Multiplicative -> Smoothed series: visitorwm -> OK Ta bảng kết bảng 3.1 Các giá trị dự báo cho chuỗi visitor tính Excel theo cơng thức: visitorf=(Mean+h*Trend)*Seasonals Trong h số kỳ sau giá trị cuối chuỗi visitor (2019M10) Cuối nhóm thu giá trị dự báo cho chuỗi visitor từ tháng 11/2019 đến tháng 12/2020 sau: 24 Bảng 4.1: Bảng kết giá trị dự báo cho chuỗi visitor từ tháng 11/2019 đến tháng 12/2020 Đơn vị: lượt người h Month 2019M11 Mean Trend 1778629 10309.56 Seasonals visitorf 1.020312 1825275 2019M12 1.029115 1851633 2020M01 1.148441 2078170 2020M02 1.186161 2158656 2020M03 1.038712 1901027 2020M04 1.073662 1976060 2020M05 0.921972 1706382 2020M06 0.850721 1583282 2020M07 0.928087 1736836 10 2020M08 1.00987 1900297 11 2020M09 0.894196 1691849 12 2020M10 0.898751 1709733 13 2020M11 1.020312 1951503 14 2020M12 1.029115 1978950 25 KẾT LUẬN Chuỗi số liệu lượng du khách quốc tế đến Việt Nam khoảng thời gian từ tháng 1/2012 đến tháng 10/2019 chuỗi có tính mùa vụ, xu tăng, thân chuỗi khơng dừng sai phân bậc có dừng nên nhóm chọn phương pháp san mũ Winters phương pháp ARIMA để dự báo cho chuỗi Khi so sánh hai mơ hình mơ hình san mũ Winters cho sai số dự báo thấp nên mơ hình phù hợp với chuỗi số liệu Cụ thể sai số MAPE mơ hình Winter 4,7% (