Bước 1. Thu thập và tổ chức dữ liệu
Dưới đây là bảng số liệu số lượng khách đên du lịch tại đảo Tuần Châu:
Thời gian Số lượng khách du lịch ( triệu lượt người ) 2007 4,013 2008 4,291 2009 5,134 2010 6,045 2011 5,361 2012 6,213 2013 6,452 2014 6,653 2015 7,397 2016 7,673
Bảng 3.1. Bảng số liệu khách du lịch đến đảo Tuần Châu năm 2007-2016.
Bước 2. Lựa chọn phương pháp
Dựa vào bảng số liệu đầu vào, hệ thống sẽ tiến hành phân tích và thể hiện dữ liệu ở dạng biểu đồ để thế hiện tính xu hướng của dữ liệu.
Hình 3.2. Biểu đồ xu hướng phát triển của dữ liệu.
Dựa vào hình 3.2 ta có thể thấy xu hướng biến động của số lượng khách du lịch là tăng và tương đối ổn định. Do đó với bộ dữ liệu này ta áp dụng phương pháp hồi quy tuyến tính (mô hình hồi quy theo thời gian).
Bước 3. Áp dụng phương pháp dự báo
Hình 3.3. Bảng tóm tắt SUMMARY OUTPUT. Regression Statistics: Các thông số của mô hình hồi quy
Multiple R: Hệ số tương quan bội (0<=R<=1). Cho thấy mức độ chặt chẽ của mối liên hệ tương quan bội. Ở bộ dữ liệu ày R= 0.97.
R Square: Hệ số xác định. Trong 100% sự biến động của biến phụ thuộc Y thì có bao nhiêu % sự biến động là do các biến độc lập X ảnh hưởng, còn lại là do sai số ngẫu nhiên. Ở bộ dữ liệu thì hệ số xác định bằng 93%, tức là yếu tố thời gian ( năm ) ảnh hưởng 93% đến sự biến động của số lượng khách du lịch. Còn lại là các yếu tố khác.
Adjusted R: Hệ số xác định mẫu điều chỉnh. Là hệ số xác định có tính đến độ
lớn hay nhỏ của bậc tự do df.
Standard Error: Sai số chuẩn của Y do hồi quy, sai số chuẩn ở đây bằng 0,333712.
Observation: Số quan sát hay dung lượng mẫu.
Hình 3.4. Bảng phân tích phương sai ANOVA ( Analysis of variance ) Regression: Do hồi quy
Total: Tổng cộng
Df (Degree of freedom): Số bậc tự do
SS (Sum of Square): Tổng bình phương của mức động (sai lệch) giữa các giá trị quan sát của Y (ký hiệu là Yi) và giá trị bình quân của chúng
MS (Mean of Square): Phương sai hay số bình quân của tổng bình phương sai
lệch kể trên
TSS ( Total Sum of Square): Tổng bình phương của tất cả các mức sai lệch
giữa các giá trị quan sát Yi và giá trị bình quân của chúng
F-stat: Tiêu chuẩn F dùng làm căn cứ để kiểm định độ tin cậy về mặt khoa học (thống kê) của toàn bộ phương trình hồi quy
Significance F: F lý thuyết
Hình 3.5. Bảng phân tích hồi quy. Coefficients: Cột giá trị của các hệ số hàm hồi quy:
- Intercept: Hệ số tự do b. Hệ số này cho thấy xuất phát điểm của đường hồi quy. Ở bộ dữ liệu này b = - 784,7132182
- X Variable 1 là các hệ số góc của các biến tương ứng x, ở bộ số liệu này thì a = 0,393054545.
- Standard Error: (se) độ lệch chuẩn của mẫu theo biến xi
- t-stat: Tiêu chuẩn t dùng làm căn cứ để kiểm định độ tin cậy về mặt khoa học (thống
kê) của độ co giãn ai (i = 1,2,3…,n) tức là của mối liên hệ giữa X và Y.
- P-value: Xác suất để t > t-stat, dùng kiểm định độ tin tin cậy về mặt khoa học (thống
khoảng ước lượng cho các tham số với độ tin cậy 95% và độ tin cậy 98%. Dựa vào bảng kết quả trên ta có phương trình hồi quy:
Y = 0,393054545*x +(- 784,7132182)
Như vậy, khi x = 2017 thì ta có giá trị dự báo của y là: Y = 0,393054545*2017 - 784,7132182
= 8.0778
Tức là năm 2017 số lượt khách đến thăm quan đảo Tuần Châu là 8.0778 triệu lượt người, với sai số chuẩn là 0.333712498744326.
Bước 4. Biểu đồ thể xu thế gia tăng của năm 2016.
Hệ thống hỗ trợ chức năng xuất biểu đồ, từ đây ta có thể dễ dàng thấy được xu hướng tăng trưởng của các năm đã qua và cả của năm tới là năm
Hình 3.6 . Biểu đồ xu hướng tăng trưởng lượng khách du lịch qua các năm ( 2007 – 2017)
Qua biểu đồ ta thấy được số lượng khách đến với đảo Tuần Châu tăng dần đều, với tốc độ khá ổn định. Dự báo năm 2017 cũng phát triển ổn định như những năm trước đó.