Vậy ta bác bỏ giả thuyết H 0 – tức các biến quan sát có sự tương quan với nhau và dữ liệu dùng để phân tích nhân tố là phù hợp.. - Giữa các biến độc lập có hệ số tương quan = 0, nghĩa
Trang 1NGÀNH KINH DOANH THƯƠNG MẠI
Chủ đề:
Phân tích hồi quy và kiểm định các giả thuyết của
hàm tương quan
Giảng viên hướng dẫn: TS Nguyễn Hùng Phong Nhóm trình bày: Nhóm 2
Bùi Thị Kim Yến Nguyễn Thị Như Ý Nguyễn Đan Thanh Huỳnh Thị Phương Trinh Tan Sophat
TP.HCM, 05/2016
Trang 2PHÂN TÍCH HỒI QUY VÀ KIỂM ĐỊNH GIẢ THUYẾT CỦA
HÀM TƯƠNG QUAN
A DỮ LIỆU
- Bộ dữ liệu HBAT: 200
- Công cụ phân tích SPSS: 16.0
- Yêu cầu:
Chạy Hồi quy biến X19 với 4 biến độc lập tìm được từ phân tích EFA, kiểm định các giả thuyết
Đặt biến giả Dummy (X1: Customer Type) Chạy hồi quy với biến giả
Viết phương trình hồi quy Y(X19) = F(F1, F2, F3, F4, D1, D2)
Giải thích các kết quả
B PHẦN TRÌNH BÀY
1 Chạy Hồi quy biến X19 với 4 biến độc lập tìm được từ phân tích EFA, kiểm định các giả thuyết
Chạy EFA để tìm ra bốn biến độc lập mới
Sau khi chạy phân tích nhân tố khám phá EFA ta có những kết quả sau:
Bảng KMO:
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .672
Bartlett's Test of Sphericity Approx Chi-Square 1.072E3
Đặt giả thuyết:
H0: Không có sự tương quan giữa các biến quan sát (Độ tương quan giữa các biến quan sát bằng 0)
Trang 3H1: Có sự tương quan giữa các biến quan sát
Kết luận:
- KMO = 0.672 >0.5
Vậy phân tích nhân tố là thích hợp
- Bartlett’s Test có Sig < 0.05
Vậy ta bác bỏ giả thuyết H 0 – tức các biến quan sát có sự tương quan với nhau và dữ liệu dùng để phân tích nhân tố là phù hợp
Bảng TOTAL VARIANCE EXPLAINED
Total Variance Explained
Comp
onent
Initial Eigenvalues
Extraction Sums of Squared
Loadings Rotation Sums of Squared Loadings
Total
% of Variance
Cumulative
% Total
% of Variance
Cumulative
% Total
% of Variance
Cumulative
%
1 3.358 33.580 33.580 3.358 33.580 33.580 2.590 25.901 25.901
2 1.855 18.552 52.132 1.855 18.552 52.132 2.306 23.060 48.961
3 1.632 16.316 68.448 1.632 16.316 68.448 1.857 18.568 67.529
4 1.056 10.560 79.009 1.056 10.560 79.009 1.148 11.480 79.009
5 855 8.553 87.562
6 514 5.142 92.704
7 284 2.839 95.543
8 188 1.878 97.421
9 149 1.489 98.909
10 109 1.091 100.000
Extraction Method: Principal Component
Analysis
Kết luận: Dựa vào giá trị Eigenvalues để quyết định giữ lại bao nhiêu yếu tố Ta có:
- EigenValues: 4 nhân tố đầu tiên có giá trị Eigenvalues Total >1 Các nhân tố còn lại có giá trị Eigenvalues <1 sẽ bị loại ra khỏi mô hình
Trang 4 Ta dừng lại ở nhân tố thứ 4, và có 4 nhân tố được rút ra
- Tổng phương sai trích của 4 nhân tố rút ra là 79.009% cho biết 4 nhân tố rút ra sẽ giải thích được 79% biến thiên của các biến quan sát
Bảng ROTATED COMPONENT MATRIX:
Ma trận các nhân tố đã được xoay: các nhân tố được xoay để nó có ý nghĩa hơn Các
nhân tố trong bảng này phải có giá trị Factor loading > 0.3, chúng ta căn cứ vào đó để xác
định việc lựa chọn biến nào cho nhân tố nào là phù hợp
Sau khi căn cứ vào giá trị Factor loading và các điều kiện lựa chọn biến, nhóm 2 tiến hành phương pháp loại từng biến để tìm ra 4 biến độc lập mới
Phương pháp loại theo thứ tự: X11, X17, X13
Kết quả cuối cùng cho biết:
Rotated Component Matrix a
Component
X9 - Complaint Resolution 931
X18 - Delivery Speed 930
X16 - Order & Billing 877
Extraction Method: Principal Component Analysis
Rotation Method: Varimax with Kaiser Normalization
a Rotation converged in 5 iterations
Trang 5Dựa vào bảng trên và ý nghĩa của các biến, nhóm đặt tên mới cho 4 nhân tố được rút
ra như sau:
TÊN NHÓM BIẾN QUAN SÁT MÔ TẢ
Service F1
X16 Order & Billing
Promotion F2
After-Sales Service F3 X8 Techinical support
X14 Warranty & Claims
Product F4 X15 New Products
Trang 6 Phân tích hồi quy
Với 4 nhân tố (F1, F2, F3, F4) được rút ra như trên, nhóm thực hiện chạy hồi quy với biến X19 Kết quả cho ra như sau:
Bảng CORRELATION:
Correlations
X19 - Satisfaction F1 - Service
F2 - Promotion
F3 - After-sales Service F4 - Product
Pearson Correlation X19 - Satisfaction 1.000 539 362 198 417
F2 - Promotion .362 .000 1.000 .000 .000
F3 - After-sales
Sig (1-tailed) X19 - Satisfaction 000 000 002 000
F3 - After-sales
F3 - After-sales Service
Trang 7- Dựa bảng Correlation ta thấy, các biến F1, F2, F4 đều có mối tương quan thuận với biến X19, hệ số tương quan của chúng với biến X19 > 0.3, trong đó F1 có mối tương quan với X19 là cao nhất (0.539)
F3 có hệ số tương quan khá thấp với biến X19 (0.198) nhưng xem xét trong tổng thể, giá trị Sig của nó < 0.05 – có ý nghĩa thống kê nên ta vẫn giữ lại trong mô hình hồi quy
- Giữa các biến độc lập có hệ số tương quan = 0, nghĩa là chúng không tương quan nhau
- Sig của các biến đều có giá trị nhỏ hơn 0.05
Kết luận: Các biến độc lập này đều có ý nghĩa và có thể được đưa vào mô hình hồi quy
để giải thích cho biến X19
Bảng MODEL SUMMARY
Model Summary b
Model R R Square Adjusted R Square
Std Error of the Estimate Durbin-Watson
a Predictors: (Constant), F4 - Product, F3 - After-sales Service, F2 - Promotion, F1 - Service
b Dependent Variable: X19 - Satisfaction
Kết quả:
Tham số R bình phương hiệu chỉnh (Adjusted R Square) cho biết mức độ (%) sự biến thiên của biến phụ thuộc được giải thích bởi sự biến thiên đồng thời của các biến độc lập
Có thể nói 62.8% biến thiên của X19 có thể giải thích bởi sự biến thiên đồng
thời của tất cả các biến độc lập F1, F2, F3, F4
- Giá trị Durbin-Watson = 2.094 >2
Nghĩa là không có sự tự tương quan giữa các biến độc lập
Trang 8 Bảng ANOVA
Bảng này để kiểm định độ phù hợp của mô hình
Đặt giả thuyết H 0 : β1= β2 = β3 = β4 = 0
ANOVA b
a Predictors: (Constant), F4 - Product, F3 - After-sales Service, F2 - Promotion, F1 - Service
b Dependent Variable: X19 - Satisfaction
Kết luận
Giá trị của Sig của bảng ANOVA dùng để đánh giá sự phù hợp (tồn tại) của mô hình Giá trị Sig phải <0.05 thì mô hình mới tồn tại
Sig = 0.000 <0.05: bác bỏ giả thuyết H0 – các biến hiện có trong mô hình có
thể giải thích được cho biến X19 – tức mô hình ta xây dựng phù hợp với tập dữ liệu
Trang 9 Bảng COEFFICIENT
Bảng này để xem xét ý nghĩa của các hệ số hồi quy riêng phần trong mô hình
Coefficients a
Model
Unstandardized Coefficients
Standardized Coefficients
t Sig
Collinearity Statistics
F1 - Service .669 .054 .539 12.467 .000 1.000 1.000
F2 - Promotion .449 .054 .362 8.362 .000 1.000 1.000
F3 - After-sales
Service .246 .054 .198 4.573 .000 1.000 1.000
F4 - Product 518 054 417 9.645 000 1.000 1.000
a Dependent Variable: X19 - Satisfaction
- Hệ số hồi quy riêng phần B: B k đo lường sự thay đổi trong giá trị trung bình Y
khi X k thay đổi 1 đơn vị với điều kiện các biến độc lập còn lại không thay đổi Trong hồi quy tuyến tính, để đánh giá đóng góp thực sự của 1 biến đối với sự thay đổi trong Y thì bằng cách nào đó ta phải kiểm soát được ảnh hưởng của các biến khác
Ý nghĩa:
B1 = 0.669: khi F1 tăng thêm 1 đơn vị (F2, F3, F4 không đổi) sẽ làm cho X19 tăng
thêm 0.669 đơn vị
B2 = 0.449: khi F2 tăng thêm 1 đơn vị (F1, F3, F4 không đổi) sẽ làm cho X19 tăng
thêm 0.449 đơn vị
B3 = 0.246: khi F3 tăng thêm 1 đơn vị (F1, F2, F4 không đổi) sẽ làm cho X19 tăng
thêm 0.246 đơn vị
B4 = 0.518: khi F4 tăng thêm 1 đơn vị (F1, F2, F3 không đổi) sẽ làm cho X19 tăng
thêm 0.518 đơn vị
- Giá trị Sig trong bảng Coefficients cho biết các tham số hồi qui có ý nghĩa hay không (với độ tin cậy 95% thì Sig<5% có ý nghĩa).
Trang 10 Giá trị Sig của tất cả các tham số đều bằng 0.000 < 0.05 Vậy các tham số này (hệ số hồi quy) đều có ý nghĩa Tức là các biến này có quan hệ hồi quy tuyến tính với nhau
- Hệ số Beta: vì độ lớn của các hệ số phụ thuộc vào đơn vị đo lường của các biến
nên chỉ khi nào tất cả các biến độc lập đều có cùng đơn vị đo lường thì các hệ số của chúng mới có thể so sánh trực tiếp với nhau Môt cách để có thể làm cho các hệ số hồi quy so sánh được với nhau là tính trọng số beta, đó là hệ số hồi quy của biến độc lập khi tất cả các dữ liệu trên các biến được biểu diễn bằng đơn vị đo lường độ lệch chuẩn
- Phương trình hồi quy tương ứng:
X19 = 6.952 + 0.669 F1 + 0.449 F2 + 0.246 F3 + 0.518 F4
- Giải thích mô hình: Phương trình hồi quy bội cho thấy sự hài lòng về dịch vụ,
chiêu thị, dịch vụ sau bán hàng và sản phẩm có tác động tỷ lệ thuận với sự hài lòng chung Trong đó sự hài lòng về dịch vụ có tác động mạnh nhất đến sự hài lòng của khách hàng
- Kiểm tra giả định về hiện tượng đa cộng tuyến (tương quan giữa các biến độc
lập) thông qua giá trị của độ chấp nhận (Tolerance) hoặc hệ số phóng đại phương sai VIF
(Variance inflation factor): VIF > 10 thì có thể nhận xét có hiện tượng đa cộng tuyến
Tuy nhiên theo một số nhà nghiên cứu, VIF>5 là đã xảy ra hiện tượng đa cộng tuyến.
VIF đều bằng 1 <5 => không có hiện tượng đa cộng tuyến xảy ra
2 Đặt biến giả Dummy (X1: Customer Type) Chạy hồi quy với biến giả
Viết phương trình hồi quy Y(X19) = F(F1, F2, F3, F4, D1, D2)
2.1 Xây dựng biến giả
Bởi vì biến X1 (Customer Type) là một biến định tính, không có biểu hiện bằng con
số, vì vậy chúng ta phải đặt biến giả để có thể định lượng chúng
Biến giả (Dummies) là các biến mà giá trị của chúng chỉ nhận một thuộc tính nào đó Cho nên, nếu biến giả nhận một thuộc tính nào đó, chúng ta gán giá trị cho biến giả là 1
Trang 11và nhận giá trị là 0 nếu ngược lại Nói như vậy có nghĩa là, các biến giả đưa vào phân tích hồi quy chỉ nhận một trong hai giá trị là 1 hoặc 0
- Xác định số biến giả đưa vào mô hình:
Số biến giả đưa vào mô hình bằng số biểu hiện của biến thuộc tính trừ đi 1 Giả sử biến thuộc tính muốn đưa vào mô hình có k biểu hiện, số biến giả đưa vào mô hình sẽ là (k – 1) biến
Với bài tập này, biến “Customer Type” có 3 biểu hiện là “Less than 1 year”, “1
to 5 years” và “Over 5 years” Vậy số biến đưa vào mô hình sẽ là 3 – 1 = 2 biến giả
- Gán giá trị cho biến giả:
Biến X1 có 3 giá trị:
1 = “Less than 1 year”
2 = “1 to 5 years”
3 = “Over 5 years”
Nhóm lựa chọn:
D1 = 1 nếu khách hàng thuộc nhóm “1 to 5 years”
D1 = 0 nếu khách hàng thuộc các nhóm còn lại
D2 = 1 nếu khách hàng thuộc nhóm “Over 5 years”
D2 = 0 nếu khách hàng thuộc các nhóm còn lại
Ta có bảng giá trị các biến giả như sau:
Nhóm khách hàng D1 D2
Less than 1 year 0 0
Như vậy, phạm trù “Less than 1 year” được gọi là phạm trù cơ sở Mọi so sánh về sự thỏa mãn của khách hàng giữa các nhóm căn cứ vào kết quả hồi quy là so sánh với nhóm khách hàng “Less than 1 year”
Trang 122.2 Chạy hồi quy biến X19 với F1, F2, F3, F4 và 2 biến giả D1, D2 vừa xây dựng
Bảng CORRELATION:
Correlations
X19 - Satisfaction
F1 - Service
F2 - Promotion
F3 - After-sales Service
F4 - Product
Dummy
1
Dummy
2
Pearson
Correlation
X19 - Satisfaction 1.000 539 362 198 417 189 522
F1 - Service 539 1.000 000 000 000 353 273
F2 - Promotion 362 000 1.000 000 000 114 -.041
F3 - After-sales Service .198 .000 .000 1.000 .000 -.004 .148
F4 - Product 417 000 000 000 1.000 -.213 542
Dummy 1 189 353 114 -.004 -.213 1.000 -.492
Dummy 2 522 273 -.041 148 542 -.492 1.000
Sig (1-tailed) X19 - Satisfaction 000 000 002 000 004 000
F1 - Service 000 500 500 500 000 000
F2 - Promotion 000 500 500 500 054 283
F3 - After-sales Service .002 .500 .500 .500 .479 .018
F4 - Product 000 500 500 500 001 000
Dummy 1 004 000 054 479 001 000
Dummy 2 000 000 283 018 000 000
N X19 - Satisfaction 200 200 200 200 200 200 200
F1 - Service 200 200 200 200 200 200 200
F2 - Promotion 200 200 200 200 200 200 200
F3 - After-sales
F4 - Product 200 200 200 200 200 200 200
Trang 13Dựa bảng Correlation ta thấy, các biến F1, F2, F3, F4 đều có mối tương quan thuận với biến X19, hệ số tương quan của chúng với X19 tương tự như trong mô hình hồi quy chỉ có 4 biến (F1,F2,F3,F4)
- F3 vẫn có hệ số tương quan khá thấp với biến X19 (0.198) nhưng xem xét trong tổng thể, giá trị Sig của nó < 0.05 – có ý nghĩa thống kê nên ta vẫn giữ lại trong mô hình
- Biến giả D1 có hệ số tương quan thấp với X19, nhưng nó vẫn đảm bảo ý nghĩa thống kế (Sig < 0.05) nên vẫn được giữ lại trong mô hình hồi quy
- Giữa các biến F1, F2, F3, F4 vẫn có hệ số tương quan = 0, nghĩa là chúng không tương quan nhau Nhưng khi mô hình được đưa thêm biến định tính vào (đã được gán biến giả D1, D2) thì sự tương quan giữa F1, F2, F2, F4 với D1, D2 bắt đầu xuất hiện Những tương quan như vậy có thể ảnh hưởng đến kết quả phân tích hồi quy, ví dụ gây ra hiện tượng đa cộng tuyến
- Sig của các biến đều có giá trị nhỏ hơn 0.05
Kết luận: Các biến này có thể được đưa vào mô hình hồi quy để giải thích cho biến X19
Bảng MODEL SUMMARY
Model Summary b
Model R R Square Adjusted R Square
Std Error of the Estimate Durbin-Watson
a Predictors: (Constant), Dummy 2, F2 - Promotion, F3 - After-sales Service, F1 - Service, F4 - Product,
Dummy 1
b Dependent Variable: X19 - Satisfaction
- Giá trị R2 hiệu chỉnh = 0.706
Có thể nói 70% biến thiên của X19 có thể giải thích bởi sự biến thiên đồng
thời của tất cả các biến độc lập F1, F2, F3, F4, D1, D2
- Giá trị Durbin-Watson = 2.053 >2
Nghĩa là mô hình không có sự tự tương quan
Trang 14 Bảng ANOVA
ANOVA b
a Predictors: (Constant), Dummy 2, F2 - Promotion, F3 - After-sales Service, F1 - Service, F4 - Product,
Dummy 1
b Dependent Variable: X19 - Satisfaction
Kết quả: Sig = 0.000 <0.05: bác bỏ giả thuyết H0 – các biến hiện có trong mô hình có thể
giải thích được cho biến X19 – tức mô hình ta xây dựng phù hợp với tập dữ liệu
Bảng COEFFICIENT
Coefficients a
Model
Unstandardized Coefficients
Standardized Coefficients
t Sig
Collinearity Statistics
B Std Error Beta Tolerance VIF
F1 - Service .364 .064 .293 5.659 .000 .551 1.816
F2 - Promotion .426 .048 .343 8.855 .000 .983 1.018
F3 - After-sales
Service .160 .049 .129 3.251 .001 .941 1.062
F4 - Product .286 .060 .230 4.775 .000 .636 1.572
Dummy 1 .876 .151 .330 5.802 .000 .457 2.189
Dummy 2 1.242 .172 .475 7.213 .000 .341 2.936
a Dependent Variable: X19 - Satisfaction
Trang 15- Hệ số hồi quy riêng B: B k đo lường sự thay đổi trong giá trị trung bình Y khi X k
thay đổi 1 đơn vị với điều kiện các biến độc lập còn lại không thay đổi Trong hồi quy tuyến tính được thêm vào 2 biến giả D1 và D2, sự thay đổi của F1, F2, F3, F4 có khả năng tác động đến sự thay đổi giá trị trung bình của X19 đã giảm xuống Trong khi đó sự thay đổi của D1, D2 có tác động rất lớn đến sự thay đổi trong giá trị trung bình của X19
Ý nghĩa:
B1 = 0.364: khi F1 tăng thêm 1 đơn vị (F2, F3, F4, D1, D2 không đổi) sẽ làm cho
X19 tăng thêm 0.364 đơn vị
B2 = 0.426: khi F2 tăng thêm 1 đơn vị (F1, F3, F4, D1, D2 không đổi) sẽ làm cho
X19 tăng thêm 0.426 đơn vị
B3 = 0.16: khi F3 tăng thêm 1 đơn vị (F1, F2, F4, D1, D2 không đổi) sẽ làm cho
X19 tăng thêm 0.16 đơn vị
B4 = 0.286: khi F4 tăng thêm 1 đơn vị (F1, F2, F3, D1, D2 không đổi) sẽ làm cho
X19 tăng thêm 0.286 đơn vị
B(D1) = 0.876: khi F4 tăng thêm 1 đơn vị (F1, F2, F3, F4, D2 không đổi) sẽ làm
cho X19 tăng thêm 0.876 đơn vị
B(D2) = 1.242: khi F4 tăng thêm 1 đơn vị (F1, F2, F3, F4, D1 không đổi) sẽ làm
cho X19 tăng thêm 1,242 đơn vị
Kết luận: Customer Type – loại khách hàng có tác động rất lớn đến sự thỏa mãn (X19)
của khách hàng Cụ thể những khách hàng đã có sự gắn kết với công ty trên năm 5 thì sự thỏa mãn của họ cao hơn so với các nhóm còn lại Và như vậy, việc thực hiện các kế hoạch nhằm tăng sự trung thành và gắn kết của khách hàng sẽ là chiến lược hiệu quả làm
tăng sự hài lòng của khách hàng với sản phẩm và công ty
- Giá trị Sig của tất cả các tham số đều bằng 0.000 < 0.05 Vậy các tham số này (hệ
số hồi quy) đều có ý nghĩa Tức là các biến này có quan hệ hồi quy tuyến tính với nhau
Phương trình hồi quy tương ứng:
X19 = 6.249 + 0.364 F1 + 0.426 F2 + 0.160 F3 + 0.286 F4 + 0.876 D1 + 1.242 D2