Phân tích tương quan và hồi quy tuyến tính

Một phần của tài liệu Một số nhân tố ảnh hưởng đến mức độ chi tiêu cho các loại hải sản của du khách tại thị xã cửa lò tỉnh nghệ an (Trang 66 - 74)

3.5.1.1. Kiểm định hệ số tương quan

Dữ liệu dùng trong phân tích hồi quy tương quan được người nghiên cứu lựa chọn là dữ liệu chuẩn hóa (được xuất ra từ phần mềm SPSS sau quá trình phân tích nhân tố khám phá). Để xác định mối quan hệ nhân quả giữa các biến trong mô hình, bước đầu tiên ta cần phân tích tương quan giữa các biến xem thử có mối liên hệ tuyến tính giữa biến độc lập và biến phụ thuộc hay không. Kết quả của phần phân tích này dù không xác định được mối quan hệ nhân quả giữa biến phụ thuộc và biến độc lập nhưng nó đóng vai trò làm cơ sở cho phân tích hồi qui. Các biến biến phụ thuộc và biến độc lập có tương quan cao với nhau báo hiệu sự tồn tại của mối quan hệ tiềm ẩn giữa hai biến. Đồng thời, việc phân tích tương quan còn làm cơ sở để dò tìm sự vi phạm giả định của phân tích hồi qui tuyến tính: các biến độc lập có tương quan cao với nhau hay hiện tượng đa cộng tuyến.

Bảng 3.23. Ma trận hệ số tương quan giữa biến độc lập và biến phụ thuộc Mức chi tiêu Sự thuận tiện và tính đa dạng Khẩu vị Chất lượng vệ sinh an toàn thực phẩm Giá trị dinh dưỡng

Danh tiếng của sản phẩm hải sản địa phương

Giá cả Mức chi tiêu 1 .240* .384* .421** .183** .210** .212**

Ta thấy rằng, các hệ số tương quan giữa biến độc lập và biến phụ thuộc đều có ý nghĩa (sig<0.05), do vậy các biến độc lập đưa vào phân tích hồi quy là phù hợp. Như vậy, giữa các thang đo đo lường mức chi tiêu của du khách trong mô hình nghiên cứu không có mối tương quan tuyến tính với nhau. Vì thế, sẽ không xuất hiện đa cộng tuyến trong phân tích hồi quy.

Bên cạnh đó, kết quả phân tích cũng cho thấy mức tương quan tuyến tính giữa từng thang đó trên với thang đo mức chi tiêu của du khách, trong đó mối quan hệ

tương quan cao nhất là giữa thang đo Chất lượng vệ sinh an toàn thực phẩm với Mức

chi tiêu của du khách với r = 0.421.

3.5.1.2. Phân tích hồi quy và kiểm định giả thuyết a. Phân tích hồi quy

Phân tích hồi quy tuyến tính sẽ giúp chúng ta biết được cường độ ảnh hưởng của các biến độc lập lên biến phụ thuộc. Để tiến hành phân tích hồi quy tuyến tính bội, các biến đưa vào mô hình theo phương pháp Enter. Tiêu chuẩn kiểm định là tiêu chuẩn được xây dựng vào phương pháp kiểm định giá trị thống kê F và xác định xác suất tương ứng của giá trị thống kê F, kiểm định mức độ phù hợp giữa mẫu và tổng thể thông qua hệ số xác định R2. Công cụ chẩn đoán giúp phát hiện sự tồn tại của cộng tuyến trong dữ liệu được đánh giá mức độ cộng tuyến làm thoái hóa tham số ước lượng là: Hệ số phóng đại phương sai (Variance inflation factor - VIF). Quy tắc khi VIF vượt quá 10, đó là dấu hiệu của đa cộng tuyến (Trọng & Ngọc, 2005, 218).

Các nhân tố mới hình thành gồm có: 6 biến độc lập (Sự thuận tiện và tính đa dạng, Khẩu vị, Chất lượng vệ sinh an toàn thực phẩm, Giá trị dinh dưỡng, Danh tiếng của sản phẩm hải sản địa phương, Giá cả) và 1 biến phụ thuộc (Mức chi tiêu) được đưa vào phân tích hồi quy.

Dựa vào cơ sở lý thuyết và kết quả phân tích ở trên, ta sẽ đưa tất cả các biến độc lập trong mô hình hồi quy đã điều chỉnh bằng phương pháp đưa vào cùng một lúc Enter để chọn lọc dựa trên tiêu chí chọn những biến có mức ý nghĩa < 0.05.

Kết quả phân tích hồi quy tuyến tính cho các biến số được thể hiện thông qua các bảng sau:

Bảng 3.24: Hệ số R-Square từ kết quả phân tích hồi quy

Model Summaryb

Model R R Square Adjusted

R Square Std. Error of the Estimate Durbin- Watson 1 .830(a) .689 .668 .62975337 2.310

a. Predictors: (Constant), Suthuantienvatinhdadang, Khauvi, Antoanthucpham, Giatridinhduong, Danhtieng, Giaca

b. Dependent Variable: Muc chi tieu

F = 26.612; Sig = 0.000

So sánh hai giá trị R Square và Adjusted R Square có thể thấy Adjusted R Square nhỏ hơn, dùng nó để đánh giá độ phù hợp của mô hình sẽ an toàn hơn vì nó không thổi phồng mức độ phù hợp của mô hình. Vậy, nghiên cứu sẽ sử dụng R2 hiệu chỉnh để đánh giá mức độ phù hợp của mô hình nghiên cứu. Độ phù hợp của mô hình được kiểm định bằng trị thống kê F được tính từ R2 của mô hình tương ứng với mức ý nghĩa sig., với giá trị sig. càng nhỏ thì càng an toàn khi bác bỏ giả thuyết Ho là hệ số trước các biến độc lập đều bằng nhau và bằng 0 (trừ hằng số). Mô hình hồi quy tuyến tính bội đưa ra là phù hợp với dữ liệu và có thể sử dụng được.

Hệ số hồi quy chuẩn hóa của phương trình có thể thấy các giá trị Beta đều khác 0, để xác định được mức độ quan trọng của các yếu tố tham dự vào mức chi tiêu cho các loại hải sản của du khách, có thể chọn lọc thành 2 nhóm như sau:

Những giá trị Beta khác 0 có ý nghĩa thống kê (kiểm định 2 phía, p < 0.05), kết

quả có 6 yếu tố được ghi nhận lần lượt theo hệ số hồi quy chuẩn hóa (β) theo bảng 3.25.

Bảng 3.25: Hệ số hồi quy chuẩn hóa của phương trình

Hệ số chưa chuẩn hóa Hệ số chuẩn hóa Mô hình B Sai số chuẩn Beta t Sig. Tolera nce VIF (Constant) 1.571E-17 0.062 0.000 1.00

Sự thuận tiện và tính đa dạng 0.240 0.063 0.240 3.809 0.00 1.000 1.000

Khẩu vị 0.384 0.063 0.384 6.095 0.00 1.000 1.000

Chất lượng vệ sinh an toàn thực phẩm

0.421 0.063 0.421 6.682 0.00 1.000 1.000

Giá trị dinh dưỡng 0.183 0.063 0.183 2.904 0.00 1.000 1.000

Danh tiếng của sản phẩm hải sản địa phương

0.210 0.063 0.210 3.333 0.00 1.000 1.000

Biến đôc

lập

Những giá trị Beta khác 0 không có ý nghĩa thống kê (kiểm định 2 phía, p >

0.05): Không có yếu tố nào.

Như vậy, kết quả cho thấy tất cả các biến độc lập đều có tác động có ý nghĩa lên biến phụ thuộc (sig<0.05). Và các nhân tố đưa vào phân tích hồi quy đều được giữ lại trong mô hình.

Hệ số xác định hiệu chỉnh Adjusted R-Square là 0.668, nghĩa là mô hình hồi quy tuyến tính đã xây dựng phù hợp với tập dữ liệu đến 66.8%, điều này cho thấy mối quan hệ giữa biến phụ thuộc và các biến độc lập là khá chặt chẽ, cả 6 biến trên góp phần giải thích 66.8% sự khác biệt của mức độ chi tiêu cho hải sản của du khách được quan sát tại thị xã Cửa Lò. Như vậy, mức độ phù hợp của mô hình tương đối cao. Tuy nhiên sự phù hợp này chỉ đúng với dữ liệu mẫu. Để kiểm định xem có thể suy diễn mô hình cho tổng thể thực hay không ta phải kiểm định độ phù hợp của mô hình.

Kiểm định F sử dụng trong bảng phân tích phương sai vẫn là một phép giả thuyết về độ phù hợp của mô hình hồi quy tuyến tính tổng thể. Kết quả phân tích cho thấy, kiểm định F có giá trị là 26.612 với Sig. = 000(a) chứng tỏ mô hình hồi quy tuyến tính bội là phù hợp với tập dữ liệu và có thể sử dụng được để suy rộng ra cho tổng thể.

Kết quả thống kê còn cho thấy, các hệ số hồi quy chuẩn hóa của phương trình hồi quy đều khác 0 và Sig.<0.05, chứng tỏ 6 thành phần đều tham dự vào mức độ chi tiêu cho hải sản của du khách. So sánh giá trị (độ lớn) của hệ số chuẩn hóa cho thấy: tác động theo thứ tự từ mạnh đến yếu của các thành phần: Chất lượng vệ sinh an toàn thực phẩm, Khẩu vị, Sự thuận tiện và tính đa dạng, Giá cả, Danh tiếng của sản phẩm hải sản địa phương, Giá trị dinh dưỡng.

b. Dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính

Mô hình hồi quy tuyến tính bằng phương pháp Enter được thực hiện với một số giả định và mô hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy, để đảm bảo cho độ tin cậy của mô hình, đề tài còn phải thực hiện một loạt các dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính.

Giả định liên hệ tuyến tính và phương sai không đổi: nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn thì không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên. Nếu giả định tuyến tính được thỏa mãn (đúng) thì phần dư phải phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0 của đồ thị phân tán của phần dư chuẩn hóa

(Standardized Residual) và giá trị dự đoán chuẩn hóa (Standardized Predicted Value). Và nếu phương sai không đổi thì các phần dư phải phân tán ngẫu nhiên quanh trục 0 (tức quanh giá trị trung bình của phần dư) trong một phạm vi không đổi (Hoàng & Chu – tập 1, 2008).

Đầu tiên là giả định liên hệ tuyến tính. Phương pháp được sử dụng là biểu đồ

Scatterplot với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự đoán chuẩn hóa trên trục hoành. Nhìn vào biểu đồ ta thấy phần dư không thay đổi theo một trật tự nào đối với giá trị dự đoán. Vậy giả thuyết về liên hệ tuyến tính không bị vi phạm.

Giả định tiếp theo cần xem xét là phương sai của phần dư không đổi. Để thực

hiện kiểm định này, chúng ta sẽ tính hệ số tương quan hạng Spearman của giá trị tuyệt đối phần dư và các biến độc lập. Giá trị sig. của các hệ số tương quan với độ tin cậy 95% cho thấy không đủ cơ sở để bác bỏ giả thuyết H0 là giá trị tuyệt đối của phần dư độc lập với các biến độc lập. Như vậy, giả định về phương sai của sai số không đổi không bị vi phạm.

Để dò tìm sự vi phạm giả định phân phối chuẩn của phần dư ta sẽ dùng hai

công cụ vẽ của phần mềm SPSS là biểu đồ Histogram và đồ thị P-P plot. Nhìn vào biểu đồ Histogram (Hình 3.3) ta thấy phần dư có phân phối chuẩn với giá trị trung bình gần bằng 0 và độ lệch chuẩn của nó gần bằng 1 (= 0.97). Nhìn vào đồ thị P-P plot (Hình 3.2) biểu diễn các điểm quan sát thực tế tập trung khá sát đường chéo những giá trị kỳ vọng, có nghĩa là dữ liệu phần dư có phân phối chuẩn. Dựa vào đồ thị phân tán của phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa cho thấy các giá trị dự đoán chuẩn hóa và phần dư phân tán chuẩn hóa phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0. Như vậy, giả định liên hệ tuyến tính và phương sai không thay đổi thỏa mãn.

Hình 3.3. Biểu đồ Histogram

Dựa vào biểu đồ tần số của các phần dư cho thấy phần dư phân phối xấp xỉ chuẩn (trung bình Mean = -8.76E-17 và độ lệch chuẩn Std. Dev. = 0,989, tức gần bằng 1). Do đó, có thể kết luận rằng giả thuyết phân phối chuẩn không bị vi phạm (Hoàng & Chu – tập 1, 2008).

Cuối cùng, ta sẽ xem xét sự vi phạm đa cộng tuyến của mô hình. Ở phần phân tích hệ số tương quan ở trên, ta đã thấy rằng giữa biến phụ thuộc có quan hệ tương quan khá rõ với các biến độc lập nhưng ta cũng thấy được giữa các biến độc lập cũng có tương quan với nhau. Điều này sẽ tạo ra khả năng đa cộng tuyến của mô hình. Vì

vậy, ta phải dò tìm hiện tượng đa cộng tuyến bằng cách tính độ chấp nhận của biến

(Tolerance) và hệ số phóng đại phương sai (Variance inflation factor - VIF).

VIF<2: Hiện tượng đa cộng tuyến giữa các biến độc lập ảnh hưởng không đáng kể đến mô hình.

2≤VIF≤: Hiện tượng đa cộng tuyến giữa các biến độc lập ảnh hưởng đáng kể đến mô hình

VIF>10: Dấu hiệu của đa cộng tuyến

Ta thấy, tất cả các giá trị VIF đều nhỏ hơn 2: Hiện tượng đa cộng tuyến giữa các biến độc lập ảnh hưởng không đáng kể đến mô hình.

Mô hình cũng đáp ứng điều kiện về phần dư, phần dư có phân phối xấp xỉ chuẩn (trung bình Mean = -8.76E-17, độ lệch chuẩn Std.Dev = .989).

Đại lượng thống kê Durbin-Watson (d) = 2.310 nên các phần dư trong mẫu không có tương quan với nhau.

Như vậy mô hình hồi quy tuyến tính được xây dựng theo phương trình ở trên là không vi phạm các giả định cần thiết trong hồi quy tuyến tính. Để đánh giá độ phù hợp của mô hình ta sẽ dùng các công cụ như tính hệ số xác định hiệu chỉnh Adjusted R Square, kiểm định F và kiểm định t.

Trước tiên, kết quả R2 hiệu chỉnh cho thấy 66,8% sự biến thiên của Mức độ chi tiêu cho hải sản được giải thích bởi 6 nhân tố độc lập: Chất lượng vệ sinh an toàn thực phẩm, Khẩu vị, Sự thuận tiện và tính đa dạng, Giá cả, Danh tiếng của sản phẩm hải sản địa phương, Giá trị dinh dưỡng.

Ở trên sau khi đánh giá giá trị R square ta biết được mô hình hồi quy tuyến tính đã xây dựng là phù hợp với mẫu. Tuy nhiên để có thể suy diễn mô hình này thành mô

hình của tổng thể ta cần phải tiến hành kiểm định F thông qua phân tích phương sai.

Cuối cùng, để đảm bảo các biến độc lập đều thực sự có ảnh hưởng đến biến phụ thuộc, ta tiến hành kiểm định t. Với giả thuyết H0 là hệ số hồi quy của các biến độc lập βk = 0

và với độ tin cậy 95% kết quả ta đều có thể bác bỏ giả thuyết H0 đối với βk . Điều này

có nghĩa là tất cả các nhân tố trong phương trình đều có ảnh hưởng đến mức độ chi tiêu cho hải sản của du khách.

Từ kết quả trên, phương trình thể hiện mức độ chi tiêu cho hải sản của du khách khi du lịch tại thị xã Cửa Lò dự đoán theo tất cả các biến độc lập là:

Mức chi tiêu cho hải sản = 0.421*Chất lượng vệ sinh an toàn thực phẩm + 0.384*Khẩu vị + 0.240*Sự thuận tiện và tính đa dạng + 0.212*Giá cả + 0.210*Danh tiếng của sản phẩm hảii sản địa phương + 0.183*Giá trị dinh dưỡng Kết quả kiểm định giả thuyết thống kê:

Dựa trên kết quả phân tích hồi quy sẽ giải thích, kiểm định các giả thuyết đã đưa ra. Yếu tố “Chất lượng vệ sinh an toàn thực phẩm” là một yếu tố có ảnh hưởng lớn nhất đến mức độ chi tiêu cho hải sản của du khách khi du lịch tại thị xã Cửa Lò (có hệ số hồi quy lớn nhất). Dấu dương của hệ số beta có ý nghĩa là mối quan hệ giữa yếu tố “Chất lượng vệ sinh an toàn thực phẩm” với “Mức chi tiêu cho hải sản” là mối quan hệ cùng chiều. Nghĩa là khi du khách cảm nhận rằng hải sản mà họ tiêu dùng trong chuyến du lịch Cửa Lò không chứa chất độc hại, không chứa mầm bệnh, không gây dị ứng, ít tạp chất… thì mức độ chi tiêu cho hải sản càng tăng. Kết quả hồi quy có hệ số beta đã chuẩn hóa là 0.421 nghĩa là khi tăng yếu tố chất lượng vệ sinh an toàn thực phẩm lên 1 đơn vị độ lệch chuẩn thì mức độ chi tiêu chung tăng thêm 0.421 đơn vị lệch chuẩn, Vậy giả thuyết H3 được chấp nhận.

Sau yếu tố “Chất lượng vệ sinh an toàn thực phẩm” yếu tố thứ hai có ảnh hưởng lớn đến mức chi tiêu cho hải sản của du khách khi du lịch tại thị xã Cửa Lò là “Khẩu vị”. Kết quả hồi quy cho thấy hệ số beta đã chuẩn hóa là 0.384 dấu dương của hệ số beta có ý nghĩa là mối quan hệ giữa yếu tố “Khẩu vị” và “Mức chi tiêu cho hải sản” là mối quan hệ cùng chiều. Điều này có nghĩa là khi du khách cảm nhận rằng hải sản có mùi vị hấp dẫn, có vị ngon đặc biệt, ngon miệng và hấp dẫn thì mức độ chi tiêu cho hải sản càng tăng. Vậy giả thuyết H2 được chấp nhận.

Yếu tố thứ ba có ảnh hưởng lớn đến mức độ chi tiêu cho hải sản của du khách khi du lịch tại thị xã Cửa Lò là “Sự thuận tiện và tính đa dạng”. Kết quả hồi quy cho thấy

Một phần của tài liệu Một số nhân tố ảnh hưởng đến mức độ chi tiêu cho các loại hải sản của du khách tại thị xã cửa lò tỉnh nghệ an (Trang 66 - 74)