Phân tích hồi quy tuyến tính sẽ giúp chúng ta biết được cường độ ảnh hưởng của các biến độc lập lên biến phụ thuộc. Để tiến hành phân tích hồi quy tuyến tính bội, các biến được đưa vào mô hình theo phương pháp Enter. Tiêu chuẩn kiểm định là tiêu chuẩn được xây dựng dựa vào phương pháp kiểm định giá trị thống kê F và xác định xác suất tương ứng của giá trị thống kê, kiểm định mức độ phù hợp giữa mẫu và tổng thể thông qua hệ số xác định R2. Công cụ chuẩn đoán giúp phát hiện sự tồn tại của cộng tuyến trong dữ liệu được đánh giá mức độ cộng tuyến làm thoái hóa tham số ước lượng là: Hệ số phóng đại phương sai (Variance inflation factor –VIF). Quy tắc là khi VIF vượt quá 10, đó là dấu hiệu đa cộng tuyến (Trọng & Ngọc, 2005).
Mô hình lý thuyết cuối cùng có 7 khái niệm nghiên cứu, trong đó Sự lựa chọn
là một khái niệm phụ thuộc, 6 khái niệm còn lại là những khái niệm độc lập và được
giả thuyết là có quan hệ đồng biến với Sự lựa chọn của khách hàng được đưa vào
phân tích hồi qui.
Phương pháp kiểm định được sử dụng là hàm hồi quy tuyến tính bội với phương pháp đưa vào một lượt (Enter).
Để đánh giá mức độ phù hợp của mô hình, hệ số xác định R2 và R2 hiệu chỉnh (Adjusted R square) được xem xét. Vì R2 sẽ tăng lên khi đưa thêm biến độc lập vào mô hình nên dùng R2 hiệu chỉnh sẽ an toàn hơn khi đánh giá độ phù hợp của mô hình. R2 hiệu chỉnh càng lớn thể hiện độ phù hợp của mô hình càng cao. Kết quả nhận được
cho thấy mức ý nghĩa sig rất nhỏ 0.00 và hệ số xác định R 2 = 0,395 và hiệu chỉnh = 0.382 chứng minh mức độ phù hợp của mô hình tương đối cao (xem bảng 3.12).
Bảng 3.12 : Hệ số xác định độ phù hợp của mô hình
Model R R Square Adjusted R
Square Std. Error of the Estimate Durbin- Watson 1 .628a .395 .382 .41961 1.635
* Kiểm định sự phù hợp của mô hình
Bảng 3.13. ANOVAb
Model Sum of
Squares Df Mean Square F Sig.
1 Regression Residual Total 33.623 51.590 85.213 6 293 299 5.604 .176 31.827 .000a
Ta thấy gí trị F = 31.827với mức ý nghĩa quan sát được là Sig = 0.000 < 0.05, nghĩa là ta có thể bác bỏ giả thuyết H0 cho rằng mô hình không phù hợp, mô hình hồi quy tuyến tính bội xây dựng được phù hợp với tổng thể.
Bảng 3.14 : Kết quả phân tích hồi quy với biến phụ thuộc Sự lựa chọn Coefficientsa Unstandardized Coefficients Standardized Coefficients Collinearity Statistics Model B Std.
Error Beta T Sig. Tolerance VIF
Hằng số .624 .303 2.061 .040 An toàn .187 .063 .177 2.950 .003 .571 1.752 Thương hiệu -.102 .069 -.077 -1.481 .140 .765 1.308 Giá cả -.012 .057 -.012 -.219 .827 .670 1.492 Thuận tiện .287 .069 .229 4.184 .000 .689 1.452 Chiêu thị .069 .045 .085 1.534 .126 .672 1.489 Chất lượng .404 .067 .367 6.019 .000 .556 1.797
Phân tích kết quả hồi quy mô hình với ( SLC) là biến phụ thuộc, và 6 biến độc lập là (AT), Thương hiệu (TH), giá cả (GC), thuận tiện (TT), chiêu thị (CT), chất lượng (CL). Kết quả cho thấy hệ số phóng đại phương sai VIF (Variance inflation factor – VIF) rất khỏ (nhỏ hơn 10) cho thấy các biến độc lập này không có quan hệ chặt chẽ với nhau nên không có hiện tượng đa cộng tuyến (Bảng 3.14).
Hệ số sig của các biến An toàn (0.03<0.05); Thuận tiện (0.00<0.05); Chất lượng (00.0<0.05) thỏa mãn ý nghĩa kiệm định. Còn lại ba biến Thương hiệu, giá cả, thuận tiện, chiêu thị bị loại khỏi mô hình vì sig >0.05 ( Xem bảng 3.14).
Vì vậy ta có mô hình các yếu tố ảnh hưởng đến Sự lựa chọn sữa tươi của khách hàng với 3 biến độc là An toàn (AT), Thuận tiện (TT), Chất lượng(CL). Kết quả mô hình như sau:
SLC= 0.177AT + 0.229TT + 0,367 CL
Từ kết quả phân tích hồi quy chúng ta thấy thứ tự mức độ quan trọng của các
thành phần tác động lên Sự lựa chọn của khách hàng như sau: (1) Chất lượng
(=0.367), kế tiếp (2) yếu tố sự thuận tiện (=0.229) và (3) an toàn (= 0.177).
Ngoài ra, kết quả trên cũng cho thấy mối quan hệ tuyến tính của các yếu tố ảnh hưởng đến quyết định mua hàng đều có ý nghĩa thống kế (Sig. <0.05).Từ đó có thể kết luận rằng mô hình phù hợp với dữ liệu thị trường. Như vậy, các giả thuyết H1, H3, H6 đều được chấp nhận
- H1 : Yếu tố an toàn ảnh hưởng đến Sự lựa chọn sữa tươi
- H3: Yếu tố thuận tiện có tác động đến Sự lựa chọn sữa tươi của khách hàng. - H6: Yếu tố chất lượng có tác động đến Sự lựa chọn sữa tươi của khách hàng.
* Dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính.
Mô hình hồi quy tuyến tính bằng phương pháp Enter được thực hiện với một số giả định và mô hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy, để đảm bảo cho độ tin cậy của mô hình, đề tài còn phải thực hiện một loạt các dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính.
Giả định liên hệ tuyến tính và phương sai không đổi: Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn thì không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên. Nếu giả định tuyến tính được thỏa mãn (đúng) thì phần dư phải phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0 của đồ thị phân tán của phần dư chuẩn hóa (Standardized Residual) và giá trị dự đoán chuẩn hóa (Standardized Predicted Value). Và nếu phương sai không đổi thì các phần dư phải phân tán ngẫu nhiên quanh trục 0 (tức quanh giá trị trung bình của phần dư) trong một phạm vi không đổi (Hoàng & Chu – tập 1, 2008).
Đầu tiên là giả định liên hệ tuyến tính. Phương pháp được sử dụng là biểu đồ
trên trục hoành. Nhìn vào biểu đồ ta thấy phần dư không thay đổi theo một trật tự nào đối với giá trị dự đoán. Vậy giả thuyết về liên hệ tuyến tính không bị vi phạm.
Giả định tiếp theo cần xem xét là phương sai của phần dư không đổi. Để thực
hiện kiểm định này, chúng ta sẽ tính hệ số tương quan hạng Spearman của giá trị tuyệt đối phần dư và các biến độc lập. Giá trị sig. của các hệ số tương quan với độ tin cậy 95% cho thấy không đủ cơ sở để bác bỏ giả thuyết H0 là giá trị tuyệt đối của phần dư độc lập với các biến độc lập. Như vậy, giả định về phương sai của sai số không đổi không bị vi phạm.
Để dò tìm sự vi phạm giả định phân phối chuẩn của phần dư ta sẽ dùng hai công
cụ vẽ của phần mềm SPSS là biểu đồ Histogram và đồ thị P-P plot. Nhìn vào biểu đồ Histogram (Hình 3.8) ta thấy phần dư có phân phối chuẩn với giá trị trung bình gần bằng 0 và độ lệch chuẩn của nó gần bằng 1 (= 0.99).
Nhìn vào đồ thị P-P plot (Hình 3.9) biểu diễn các điểm quan sát thực tế tập trung khá sát đường chéo những giá trị kỳ vọng, có nghĩa là dữ liệu phần dư có phân phối chuẩn. Dựa vào đồ thị phân tán của phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa cho thấy các giá trị dự đoán chuẩn hóa và phần dư phân tán chuẩn hóa phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0. Như vậy, giả định liên hệ tuyến tính và phương sai không thay đổi thỏa mãn.
Hình 3.9: Đồ thị P-P Plot
Dựa vào biểu đồ tần số của các phần dư cho thấy phần dư phân phối xấp xỉ chuẩn (trung bình Mean = -3.47E-17 và độ lệch chuẩn Std. Dev. = 0,99, tức gần bằng 1). Do đó, có thể kết luận rằng giả thuyết phân phối chuẩn không bị vi phạm (Hoàng & Chu – tập 1, 2008).
Giả định tiếp theo về tính độc lập của phần dư cũng cần được kiểm định. Ta
dùng đại lượng thống kê Durbin-Watson (d) để kiểm định.
Đại lượng d này có giá trị từ 0 đến 4. Trong thực tế, khi tiến hành kiểm định Durbin- Watson người ta thường áp dụng quy tắc kiểm định đơn giản như sau: nếu 1<d < 3 thì kết luận mô hình không có tương quan; nếu 0 < d <1 thì kết luận mô hình có sự tương quan dương; nếu 3 < d < 4 thì kết luận mô hình có sự tương quan âm. Từ kết quả ở bảng 3.9 ta có 1 < d = 1.635 < 3 như vậy ta có thể kết luận các phần dư là độc lập với nhau và tính độc lập của phần dư đã được bảo đảm. Vậy không có tương quan chuỗi bậc nhất giữa các phần dư, giả định về tính độc lập của các sai số được đảm bảo (Hoàng & Chu – tập 1, 2008).
Tóm lại: các giả thuyết đưa ra dựa trên mô hình nghiên cứu điều chỉnh sau phân tích EFA đều chấp nhận được với mức ý nghĩa thống kê 5% và khẳng định được các yếu tố có mối liên hệ với Sự lựa chọn sữa tươi của khách hàng.