CHƯƠNG II: MỘT SỐ PHƯƠNG PHÁP THỐNG KÊ PHÂN TÍCH VÀ DỰ ĐOÁN KẾT QUẢ HOẠT ĐỘNG DU LỊCH
II. MỘT SỐ PHƯƠNG PHÁP PHÂN TÍCH THỐNG KÊ NGHIÊN CỨU KẾT QUẢ HOẠT ĐỘNG DU LỊCH
2. Phương pháp hồi quy tương quan
2.1. Khái niệm, nhiệm vụ và ý nghĩa của phương pháp hồi quy tương quan trong nghiên cứu kết quả hoạt động du lịch
Hiện tượng kinh tế xã hội luôn tồn tại trong mối liên hệ phổ biến, đa dạng, nhiều vẻ và rất phức tạp. Sự biến động của hiện tượng luôn chịu tác động của nhiều yếu tố liên quan, trong đó có những yếu tố tác động chủ yếu, có những yếu tố chỉ ảnh hưởng chút ít. Trong mối liên hệ đó chúng ta thường quan tâm đến mối liên hệ nhân quả. Hồi quy tương quan là một trong những phương pháp được sử dụng phổ biến nhất khi nghiên cứu mối liên hệ này.
Hiện tượng du lịch cũng vậy, sự biến động của kết quả hoạt động du lịch do nhiều yếu tố tác động bao gồm: yếu tố tự nhiên, yếu tố xã hội, yếu tố chính trị, yếu tố đầu vào, yếu tố tâm lý,…Trong đó có những yếu tố chúng ta có thể lượng hoá được và ngược lại có nhiều yếu tố khó có thể lượng hoá như yếu tố tâm lý, yếu tố chính trị xã hội,…Mối liên hệ này thực chất là mối liên hệ tương quan. Vì vậy khi nghiên cứu mối liên hệ tương quan giữa kết quả hoạt động du lịch với các tiêu thức nguyên nhân bằng phương pháp hồi quy tương quan người ta căn cứ vào mức độ tác động của từng nhân tố tác động, nhân tố này phải có vai trò ảnh hưởng lớn đến kết quả hoạt động du lịch. Thực chất nghiên cứu mối quan hệ tương quan là ta nghiên cứu mối liên hệ hoàn toàn chặt chẽ và có ý nghĩa, còn các yếu tố có tác động ít đến biến động của kết quả hoạt động du lịch thì thường rất ít khi được chọn làm biến nguyên nhân.
Có thể biểu hiện mối liên hệ này theo hàm y = f(x). Trong đó y là tiêu thức kết quả, phản ánh kết quả hoạt động du lịch có thể là số lượng khách du lịch, số ngày khách du lịch, doanh thu du lịch, lợi nhuận, giá trị sản xuất, giá trị tăng thêm, thu nhập xã hội từ du lịch…Và x là tiêu thức nguyên nhân, biểu hiện của các nhân tố tác động đến sự biến động của kết quả hoạt động du lịch, x có thể là mức tăng trưởng nền kinh tế (GDPKTQD) hoặc vốn đầu tư nước ngoài vào ngành du lịch, thu nhập của khách, chi phí quảng cáo, giá theo tour,…Các yếu tố này tác động đến kết quả hoạt động du lịch theo từng mức độ tác động của yếu tố đó.
Khi vận dụng phương pháp hồi quy tương quan để phân tích mối liên hệ tương quan trong thống kê nghiên cứu kết quả hoạt động du lịch cần phải thực hiện hai nhiệm vụ sau:
Thứ nhất, phải xác định được mô hình hồi quy phản ánh mối liên hệ giữa tiêu thức kết quả và tiêu thức nguyên nhân qua số liệu thực tế thu thập được.
Tuỳ theo mục đích và phạm vi nghiên cứu cụ thể mà biến phụ thuộc có thể là một hoặc nhiều biến như: GDP, thu nhập của khách, vốn đầu tư, chi phí quảng cáo, giá theo tour,…Song trong thực tế, kết quả hoạt động du lịch được xét đến đầu tiên là số lượng khách du lịch vì đây là chỉ tiêu rất quan trọng đối với sự phát triển ngành, là tiêu chí đầu tiên phản ánh kết quả và hiệu quả hoạt động kinh doanh du lịch.
Mô hình hồi quy được xác định là hồi quy đơn hoặc hồi quy bội tuỳ theo số lượng của các biến độc lập. Hồi quy đơn là hồi quy giữa 1 tiêu thức kết quả và 1 tiêu thức nguyên nhân. Hồi quy bội là hồi quy giữa 1 tiêu thức kết quả với nhiều tiêu thức nguyên nhân. Việc xác định này được dựa trên cơ sở đồ thị phân phối và kết hợp với các tính toán khác của thống kê.
Thứ hai, từ mô hình hồi quy, phải xác định được mức độ chặt chẽ của mối liên hệ, xem mô hình có đủ tin cậy hay không, mối liên hệ có ý nghĩa thực tế hay không.
Như vậy phương pháp hồi quy tương quan là phương pháp được vận dụng để nghiên cứu các yếu tố tác động đến kết quả hoạt động du lịch và có ý nghĩa là:
- Hồi quy tương quan được sử dụng phổ biến nhằm xây dựng các mô hình kinh tế nói chung cũng như nhiều mô hình hồi quy giữa kết quả du lịch với các yếu tố gây ra sự biến động của kết quả đó. Từ đó xác định được chính xác mức độ biến động của từng yếu tố.
- Dùng phương pháp hồi quy tương quan cho phép ta dự đoán được sự biến động của kết quả hoạt động du lịch trong tương lai.
- Phương pháp này có thể dùng trong một số phương pháp thống kê khác như: phương pháp dãy số thời gian, phương pháp chỉ số,…
2.2. Đặc điểm vận dụng phương pháp hồi quy tương quan nghiên cứu kết quả hoạt động du lịch.
Mối liên hệ phụ thuộc giữa kết quả hoạt động du lịch và các nhân tố nguyên nhân gây ra sự biến động của kết quả đó được biểu hiện bằng các mô
hình khác nhau. Mô hình hồi quy có thể là đường thẳng, parabol, hàm bậc 3, hàm mũ,…tuỳ theo đặc điểm thay đổi của từng kết quả theo các yếu tố tác động.
Trong bài viết này, tác giả chỉ đề cập chủ yếu đặc điểm vận dụng phương pháp hồi quy tuyến tính bội, đây là dạng hàm tổng quát phổ biến nhất.
Khi vận dụng phương pháp hồi quy tương quan ở dạng tuyến tính bội trong nghiên cứu kết quả hoạt động du lịch thường tiến hành theo 3 bước sau đây:
* Bước 1: Lựa chọn các biến cần phân tích.
- Xác định biến kết quả cần phân tích: trong mỗi mô hình hồi quy chỉ có 1 biến kết quả vì vậy tuỳ theo mục đích nghiên cứu mà lựa chọn biến kết quả cần phân tích cho phù hợp. Những biến này có thể là: tổng số lượng khách, số khách quốc tế, thu nhập xã hội từ du lịch,..
- Xác định biến nguyên nhân cần phân tích: Biến nguyên nhân là các yếu tố xung quanh bao gồm các yếu tố như: yếu tố tự nhiên, yếu tố chính trị xã hội hoặc các yếu tố là chi phí đầu vào của ngành du lịch…Khi lựa chọn các biến phải có căn cứ khoa học nghĩa là cần phải đặt sự biến động của kết quả hoạt động du lịch trong mối liên hệ với các yếu tố xung quanh. Trên cơ sở biết được mức độ tác động của yếu tố nào nhiều nhất và có tính khả thi nhất. Tránh sự lựa chọn các yếu tố không có tác động hoặc ít ảnh hưởng đến sự biến động kết quả hoạt động du lịch.
*Bước 2: Xây dựng mô hình hồi quy tuyến tính bội
Sau khi xác định các biến cần phân tích, chúng ta tiến hành xây dựng mô hình hồi quy phản ánh mối quan hệ tương quan giữa 1 biến kết quả với một hoặc nhiều biến nguyên nhân gây ra sự biến động của kết quả đó.
Phương trình hồi quy tuyến tính bội có dạng:
Y = b0 + b1x1+b2x2+…+bkxk.
Trong đó b0,b1, b2,…bk là các ước lượng của β0, β1, β2, …βk hay đó là các hệ số hồi quy của tổng thể mẫu.
b0 phản ánh giá trị của y khi X1 = X2= …=Xk = 0.
b1, b2…bk phản ánh sự thay đổi của y khi biến độc lập tương ứng thay đổi.
- Hệ số xác định (R2)
Hệ số xác định phản ánh sự biến động của biến Y được giải thích bởi các biến X là bao nhiêu %
- Hệ số tương quan (R): phản ánh mức độ chặt chẽ của mô hình + -1≤ R≤1
+ R=0: mối liên hệ hoàn toàn không có ý nghĩa + R=1: mối liên hệ hoàn toàn chặt chẽ, thuận chiều + R=-1: mối liên hệ hoàn toàn chặt chẽ, ngược chiều
Mô hình hồi quy được chấp nhân dựa trên cơ sở các kiểm định chất lượng mô hình thông qua:
- Kiểm định sự phù hợp của mô hình hồi quy Ta kiểm định giả thiết: H0: βi = 0 (i = 1,k) H1: βi ≠ 0
Nếu mức ý nghĩa tương ứng với βi: αi < 0,05 thì βi tồn tại có ý nghĩa và ngược lại
*Bước 3: Khắc phục hiện tượng đa cộng tuyến
Trong mô hình tuyến tính bội, có nhiều trường hợp giữa các biến nguyên nhân cũng có mối liên hệ tương quan với nhau thậm chí có khi còn xẩy ra hiện tượng đa cộng tuyến hoàn toàn, nghĩa là 1 biến nguyên nhân có thể biểu hiện tổ hợp tuyến tính của các bién khác, tức là: λ1X1 + λ2X2 +…+λkXk = 0
Trong đó λi (i=1, k) là các hệ số và chúng không đồng thời khác 0. trong thực tế, hiện tượng này thường xảy ra. Đa cộng tuyến làm cho việc ước lượng các tham số của mô hình hồi quy không chính xác. Để nhận biết hiện tượng đa cộng tuyến ta có thể tiến hành hồi quy giữa 1 biến nguyên nhân nào dó với các biến còn lại. Nếu mô hình mới này có ý nghĩa thì chắc chắn có hiện tượng đa cộng tuyến. Vì vậy trong thực tế người ta phải khắc phục hiện tượng này bằng một số phương pháp sau:
- Tăng số mẫu nghiên cứu
- Bỏ bớt biến nguyên nhân: Bằng phương pháp xây dựng các mô hình trong chương trình phần mềm thống kê máy (SPSS) cho phép thực hiện các bước sau:
+ Phương pháp enter: cho tất cả các biến vào
+Phương pháp forward selection: cho dần từng biến Xi vào + Phương pháp backword elimination: loại dần từng biến ra.
+ Phương pháp stepwise selection: là bước kết hợp của 2 phương pháp forward và phương pháp backword (chọn dần từng bước)