1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận phân tích đa biến phân tích hồi quy và kiểm định các giả thuyết của hàm tương quan

16 823 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 16
Dung lượng 885,36 KB

Nội dung

 Vậy ta bác bỏ giả thuyết H 0 – tức các biến quan sát có sự tương quan với nhau và dữ liệu dùng để phân tích nhân tố là phù hợp.. - Giữa các biến độc lập có hệ số tương quan = 0, nghĩa

Trang 1

NGÀNH KINH DOANH THƯƠNG MẠI

Chủ đề:

Phân tích hồi quy và kiểm định các giả thuyết của

hàm tương quan

Giảng viên hướng dẫn: TS Nguyễn Hùng Phong Nhóm trình bày: Nhóm 2

Bùi Thị Kim Yến Nguyễn Thị Như Ý Nguyễn Đan Thanh Huỳnh Thị Phương Trinh Tan Sophat

TP.HCM, 05/2016

Trang 2

PHÂN TÍCH HỒI QUY VÀ KIỂM ĐỊNH GIẢ THUYẾT CỦA

HÀM TƯƠNG QUAN

A DỮ LIỆU

- Bộ dữ liệu HBAT: 200

- Công cụ phân tích SPSS: 16.0

- Yêu cầu:

 Chạy Hồi quy biến X19 với 4 biến độc lập tìm được từ phân tích EFA, kiểm định các giả thuyết

 Đặt biến giả Dummy (X1: Customer Type) Chạy hồi quy với biến giả

Viết phương trình hồi quy Y(X19) = F(F1, F2, F3, F4, D1, D2)

 Giải thích các kết quả

B PHẦN TRÌNH BÀY

1 Chạy Hồi quy biến X19 với 4 biến độc lập tìm được từ phân tích EFA, kiểm định các giả thuyết

 Chạy EFA để tìm ra bốn biến độc lập mới

Sau khi chạy phân tích nhân tố khám phá EFA ta có những kết quả sau:

Bảng KMO:

KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy .672

Bartlett's Test of Sphericity Approx Chi-Square 1.072E3

Đặt giả thuyết:

H0: Không có sự tương quan giữa các biến quan sát (Độ tương quan giữa các biến quan sát bằng 0)

Trang 3

H1: Có sự tương quan giữa các biến quan sát

Kết luận:

- KMO = 0.672 >0.5

 Vậy phân tích nhân tố là thích hợp

- Bartlett’s Test có Sig < 0.05

 Vậy ta bác bỏ giả thuyết H 0 – tức các biến quan sát có sự tương quan với nhau và dữ liệu dùng để phân tích nhân tố là phù hợp

Bảng TOTAL VARIANCE EXPLAINED

Total Variance Explained

Comp

onent

Initial Eigenvalues

Extraction Sums of Squared

Loadings Rotation Sums of Squared Loadings

Total

% of Variance

Cumulative

% Total

% of Variance

Cumulative

% Total

% of Variance

Cumulative

%

1 3.358 33.580 33.580 3.358 33.580 33.580 2.590 25.901 25.901

2 1.855 18.552 52.132 1.855 18.552 52.132 2.306 23.060 48.961

3 1.632 16.316 68.448 1.632 16.316 68.448 1.857 18.568 67.529

4 1.056 10.560 79.009 1.056 10.560 79.009 1.148 11.480 79.009

5 855 8.553 87.562

6 514 5.142 92.704

7 284 2.839 95.543

8 188 1.878 97.421

9 149 1.489 98.909

10 109 1.091 100.000

Extraction Method: Principal Component

Analysis

Kết luận: Dựa vào giá trị Eigenvalues để quyết định giữ lại bao nhiêu yếu tố Ta có:

- EigenValues: 4 nhân tố đầu tiên có giá trị Eigenvalues Total >1 Các nhân tố còn lại có giá trị Eigenvalues <1 sẽ bị loại ra khỏi mô hình

Trang 4

 Ta dừng lại ở nhân tố thứ 4, và có 4 nhân tố được rút ra

- Tổng phương sai trích của 4 nhân tố rút ra là 79.009% cho biết 4 nhân tố rút ra sẽ giải thích được 79% biến thiên của các biến quan sát

Bảng ROTATED COMPONENT MATRIX:

Ma trận các nhân tố đã được xoay: các nhân tố được xoay để nó có ý nghĩa hơn Các

nhân tố trong bảng này phải có giá trị Factor loading > 0.3, chúng ta căn cứ vào đó để xác

định việc lựa chọn biến nào cho nhân tố nào là phù hợp

Sau khi căn cứ vào giá trị Factor loading và các điều kiện lựa chọn biến, nhóm 2 tiến hành phương pháp loại từng biến để tìm ra 4 biến độc lập mới

Phương pháp loại theo thứ tự: X11, X17, X13

Kết quả cuối cùng cho biết:

Rotated Component Matrix a

Component

X9 - Complaint Resolution 931

X18 - Delivery Speed 930

X16 - Order & Billing 877

Extraction Method: Principal Component Analysis

Rotation Method: Varimax with Kaiser Normalization

a Rotation converged in 5 iterations

Trang 5

Dựa vào bảng trên và ý nghĩa của các biến, nhóm đặt tên mới cho 4 nhân tố được rút

ra như sau:

TÊN NHÓM BIẾN QUAN SÁT MÔ TẢ

Service F1

X16 Order & Billing

Promotion F2

After-Sales Service F3 X8 Techinical support

X14 Warranty & Claims

Product F4 X15 New Products

Trang 6

 Phân tích hồi quy

Với 4 nhân tố (F1, F2, F3, F4) được rút ra như trên, nhóm thực hiện chạy hồi quy với biến X19 Kết quả cho ra như sau:

Bảng CORRELATION:

Correlations

X19 - Satisfaction F1 - Service

F2 - Promotion

F3 - After-sales Service F4 - Product

Pearson Correlation X19 - Satisfaction 1.000 539 362 198 417

F2 - Promotion .362 .000 1.000 .000 .000

F3 - After-sales

Sig (1-tailed) X19 - Satisfaction 000 000 002 000

F3 - After-sales

F3 - After-sales Service

Trang 7

- Dựa bảng Correlation ta thấy, các biến F1, F2, F4 đều có mối tương quan thuận với biến X19, hệ số tương quan của chúng với biến X19 > 0.3, trong đó F1 có mối tương quan với X19 là cao nhất (0.539)

F3 có hệ số tương quan khá thấp với biến X19 (0.198) nhưng xem xét trong tổng thể, giá trị Sig của nó < 0.05 – có ý nghĩa thống kê nên ta vẫn giữ lại trong mô hình hồi quy

- Giữa các biến độc lập có hệ số tương quan = 0, nghĩa là chúng không tương quan nhau

- Sig của các biến đều có giá trị nhỏ hơn 0.05

Kết luận: Các biến độc lập này đều có ý nghĩa và có thể được đưa vào mô hình hồi quy

để giải thích cho biến X19

Bảng MODEL SUMMARY

Model Summary b

Model R R Square Adjusted R Square

Std Error of the Estimate Durbin-Watson

a Predictors: (Constant), F4 - Product, F3 - After-sales Service, F2 - Promotion, F1 - Service

b Dependent Variable: X19 - Satisfaction

Kết quả:

Tham số R bình phương hiệu chỉnh (Adjusted R Square) cho biết mức độ (%) sự biến thiên của biến phụ thuộc được giải thích bởi sự biến thiên đồng thời của các biến độc lập

 Có thể nói 62.8% biến thiên của X19 có thể giải thích bởi sự biến thiên đồng

thời của tất cả các biến độc lập F1, F2, F3, F4

- Giá trị Durbin-Watson = 2.094 >2

 Nghĩa là không có sự tự tương quan giữa các biến độc lập

Trang 8

Bảng ANOVA

Bảng này để kiểm định độ phù hợp của mô hình

Đặt giả thuyết H 0 : β1= β2 = β3 = β4 = 0

ANOVA b

a Predictors: (Constant), F4 - Product, F3 - After-sales Service, F2 - Promotion, F1 - Service

b Dependent Variable: X19 - Satisfaction

Kết luận

Giá trị của Sig của bảng ANOVA dùng để đánh giá sự phù hợp (tồn tại) của mô hình Giá trị Sig phải <0.05 thì mô hình mới tồn tại

 Sig = 0.000 <0.05: bác bỏ giả thuyết H0 – các biến hiện có trong mô hình có

thể giải thích được cho biến X19 – tức mô hình ta xây dựng phù hợp với tập dữ liệu

Trang 9

Bảng COEFFICIENT

Bảng này để xem xét ý nghĩa của các hệ số hồi quy riêng phần trong mô hình

Coefficients a

Model

Unstandardized Coefficients

Standardized Coefficients

t Sig

Collinearity Statistics

F1 - Service .669 .054 .539 12.467 .000 1.000 1.000

F2 - Promotion .449 .054 .362 8.362 .000 1.000 1.000

F3 - After-sales

Service .246 .054 .198 4.573 .000 1.000 1.000

F4 - Product 518 054 417 9.645 000 1.000 1.000

a Dependent Variable: X19 - Satisfaction

- Hệ số hồi quy riêng phần B: B k đo lường sự thay đổi trong giá trị trung bình Y

khi X k thay đổi 1 đơn vị với điều kiện các biến độc lập còn lại không thay đổi Trong hồi quy tuyến tính, để đánh giá đóng góp thực sự của 1 biến đối với sự thay đổi trong Y thì bằng cách nào đó ta phải kiểm soát được ảnh hưởng của các biến khác

Ý nghĩa:

 B1 = 0.669: khi F1 tăng thêm 1 đơn vị (F2, F3, F4 không đổi) sẽ làm cho X19 tăng

thêm 0.669 đơn vị

 B2 = 0.449: khi F2 tăng thêm 1 đơn vị (F1, F3, F4 không đổi) sẽ làm cho X19 tăng

thêm 0.449 đơn vị

 B3 = 0.246: khi F3 tăng thêm 1 đơn vị (F1, F2, F4 không đổi) sẽ làm cho X19 tăng

thêm 0.246 đơn vị

 B4 = 0.518: khi F4 tăng thêm 1 đơn vị (F1, F2, F3 không đổi) sẽ làm cho X19 tăng

thêm 0.518 đơn vị

- Giá trị Sig trong bảng Coefficients cho biết các tham số hồi qui có ý nghĩa hay không (với độ tin cậy 95% thì Sig<5% có ý nghĩa).

Trang 10

 Giá trị Sig của tất cả các tham số đều bằng 0.000 < 0.05 Vậy các tham số này (hệ số hồi quy) đều có ý nghĩa Tức là các biến này có quan hệ hồi quy tuyến tính với nhau

- Hệ số Beta: vì độ lớn của các hệ số phụ thuộc vào đơn vị đo lường của các biến

nên chỉ khi nào tất cả các biến độc lập đều có cùng đơn vị đo lường thì các hệ số của chúng mới có thể so sánh trực tiếp với nhau Môt cách để có thể làm cho các hệ số hồi quy so sánh được với nhau là tính trọng số beta, đó là hệ số hồi quy của biến độc lập khi tất cả các dữ liệu trên các biến được biểu diễn bằng đơn vị đo lường độ lệch chuẩn

- Phương trình hồi quy tương ứng:

X19 = 6.952 + 0.669 F1 + 0.449 F2 + 0.246 F3 + 0.518 F4

- Giải thích mô hình: Phương trình hồi quy bội cho thấy sự hài lòng về dịch vụ,

chiêu thị, dịch vụ sau bán hàng và sản phẩm có tác động tỷ lệ thuận với sự hài lòng chung Trong đó sự hài lòng về dịch vụ có tác động mạnh nhất đến sự hài lòng của khách hàng

- Kiểm tra giả định về hiện tượng đa cộng tuyến (tương quan giữa các biến độc

lập) thông qua giá trị của độ chấp nhận (Tolerance) hoặc hệ số phóng đại phương sai VIF

(Variance inflation factor): VIF > 10 thì có thể nhận xét có hiện tượng đa cộng tuyến

Tuy nhiên theo một số nhà nghiên cứu, VIF>5 là đã xảy ra hiện tượng đa cộng tuyến.

 VIF đều bằng 1 <5 => không có hiện tượng đa cộng tuyến xảy ra

2 Đặt biến giả Dummy (X1: Customer Type) Chạy hồi quy với biến giả

Viết phương trình hồi quy Y(X19) = F(F1, F2, F3, F4, D1, D2)

2.1 Xây dựng biến giả

Bởi vì biến X1 (Customer Type) là một biến định tính, không có biểu hiện bằng con

số, vì vậy chúng ta phải đặt biến giả để có thể định lượng chúng

Biến giả (Dummies) là các biến mà giá trị của chúng chỉ nhận một thuộc tính nào đó Cho nên, nếu biến giả nhận một thuộc tính nào đó, chúng ta gán giá trị cho biến giả là 1

Trang 11

và nhận giá trị là 0 nếu ngược lại Nói như vậy có nghĩa là, các biến giả đưa vào phân tích hồi quy chỉ nhận một trong hai giá trị là 1 hoặc 0

- Xác định số biến giả đưa vào mô hình:

Số biến giả đưa vào mô hình bằng số biểu hiện của biến thuộc tính trừ đi 1 Giả sử biến thuộc tính muốn đưa vào mô hình có k biểu hiện, số biến giả đưa vào mô hình sẽ là (k – 1) biến

Với bài tập này, biến “Customer Type” có 3 biểu hiện là “Less than 1 year”, “1

to 5 years” và “Over 5 years” Vậy số biến đưa vào mô hình sẽ là 3 – 1 = 2 biến giả

- Gán giá trị cho biến giả:

Biến X1 có 3 giá trị:

1 = “Less than 1 year”

2 = “1 to 5 years”

3 = “Over 5 years”

Nhóm lựa chọn:

 D1 = 1 nếu khách hàng thuộc nhóm “1 to 5 years”

 D1 = 0 nếu khách hàng thuộc các nhóm còn lại

 D2 = 1 nếu khách hàng thuộc nhóm “Over 5 years”

 D2 = 0 nếu khách hàng thuộc các nhóm còn lại

Ta có bảng giá trị các biến giả như sau:

Nhóm khách hàng D1 D2

Less than 1 year 0 0

Như vậy, phạm trù “Less than 1 year” được gọi là phạm trù cơ sở Mọi so sánh về sự thỏa mãn của khách hàng giữa các nhóm căn cứ vào kết quả hồi quy là so sánh với nhóm khách hàng “Less than 1 year”

Trang 12

2.2 Chạy hồi quy biến X19 với F1, F2, F3, F4 và 2 biến giả D1, D2 vừa xây dựng

Bảng CORRELATION:

Correlations

X19 - Satisfaction

F1 - Service

F2 - Promotion

F3 - After-sales Service

F4 - Product

Dummy

1

Dummy

2

Pearson

Correlation

X19 - Satisfaction 1.000 539 362 198 417 189 522

F1 - Service 539 1.000 000 000 000 353 273

F2 - Promotion 362 000 1.000 000 000 114 -.041

F3 - After-sales Service .198 .000 .000 1.000 .000 -.004 .148

F4 - Product 417 000 000 000 1.000 -.213 542

Dummy 1 189 353 114 -.004 -.213 1.000 -.492

Dummy 2 522 273 -.041 148 542 -.492 1.000

Sig (1-tailed) X19 - Satisfaction 000 000 002 000 004 000

F1 - Service 000 500 500 500 000 000

F2 - Promotion 000 500 500 500 054 283

F3 - After-sales Service .002 .500 .500 .500 .479 .018

F4 - Product 000 500 500 500 001 000

Dummy 1 004 000 054 479 001 000

Dummy 2 000 000 283 018 000 000

N X19 - Satisfaction 200 200 200 200 200 200 200

F1 - Service 200 200 200 200 200 200 200

F2 - Promotion 200 200 200 200 200 200 200

F3 - After-sales

F4 - Product 200 200 200 200 200 200 200

Trang 13

Dựa bảng Correlation ta thấy, các biến F1, F2, F3, F4 đều có mối tương quan thuận với biến X19, hệ số tương quan của chúng với X19 tương tự như trong mô hình hồi quy chỉ có 4 biến (F1,F2,F3,F4)

- F3 vẫn có hệ số tương quan khá thấp với biến X19 (0.198) nhưng xem xét trong tổng thể, giá trị Sig của nó < 0.05 – có ý nghĩa thống kê nên ta vẫn giữ lại trong mô hình

- Biến giả D1 có hệ số tương quan thấp với X19, nhưng nó vẫn đảm bảo ý nghĩa thống kế (Sig < 0.05) nên vẫn được giữ lại trong mô hình hồi quy

- Giữa các biến F1, F2, F3, F4 vẫn có hệ số tương quan = 0, nghĩa là chúng không tương quan nhau Nhưng khi mô hình được đưa thêm biến định tính vào (đã được gán biến giả D1, D2) thì sự tương quan giữa F1, F2, F2, F4 với D1, D2 bắt đầu xuất hiện Những tương quan như vậy có thể ảnh hưởng đến kết quả phân tích hồi quy, ví dụ gây ra hiện tượng đa cộng tuyến

- Sig của các biến đều có giá trị nhỏ hơn 0.05

Kết luận: Các biến này có thể được đưa vào mô hình hồi quy để giải thích cho biến X19

Bảng MODEL SUMMARY

Model Summary b

Model R R Square Adjusted R Square

Std Error of the Estimate Durbin-Watson

a Predictors: (Constant), Dummy 2, F2 - Promotion, F3 - After-sales Service, F1 - Service, F4 - Product,

Dummy 1

b Dependent Variable: X19 - Satisfaction

- Giá trị R2 hiệu chỉnh = 0.706

 Có thể nói 70% biến thiên của X19 có thể giải thích bởi sự biến thiên đồng

thời của tất cả các biến độc lập F1, F2, F3, F4, D1, D2

- Giá trị Durbin-Watson = 2.053 >2

 Nghĩa là mô hình không có sự tự tương quan

Trang 14

Bảng ANOVA

ANOVA b

a Predictors: (Constant), Dummy 2, F2 - Promotion, F3 - After-sales Service, F1 - Service, F4 - Product,

Dummy 1

b Dependent Variable: X19 - Satisfaction

Kết quả: Sig = 0.000 <0.05: bác bỏ giả thuyết H0 – các biến hiện có trong mô hình có thể

giải thích được cho biến X19 – tức mô hình ta xây dựng phù hợp với tập dữ liệu

Bảng COEFFICIENT

Coefficients a

Model

Unstandardized Coefficients

Standardized Coefficients

t Sig

Collinearity Statistics

B Std Error Beta Tolerance VIF

F1 - Service .364 .064 .293 5.659 .000 .551 1.816

F2 - Promotion .426 .048 .343 8.855 .000 .983 1.018

F3 - After-sales

Service .160 .049 .129 3.251 .001 .941 1.062

F4 - Product .286 .060 .230 4.775 .000 .636 1.572

Dummy 1 .876 .151 .330 5.802 .000 .457 2.189

Dummy 2 1.242 .172 .475 7.213 .000 .341 2.936

a Dependent Variable: X19 - Satisfaction

Trang 15

- Hệ số hồi quy riêng B: B k đo lường sự thay đổi trong giá trị trung bình Y khi X k

thay đổi 1 đơn vị với điều kiện các biến độc lập còn lại không thay đổi Trong hồi quy tuyến tính được thêm vào 2 biến giả D1 và D2, sự thay đổi của F1, F2, F3, F4 có khả năng tác động đến sự thay đổi giá trị trung bình của X19 đã giảm xuống Trong khi đó sự thay đổi của D1, D2 có tác động rất lớn đến sự thay đổi trong giá trị trung bình của X19

Ý nghĩa:

 B1 = 0.364: khi F1 tăng thêm 1 đơn vị (F2, F3, F4, D1, D2 không đổi) sẽ làm cho

X19 tăng thêm 0.364 đơn vị

 B2 = 0.426: khi F2 tăng thêm 1 đơn vị (F1, F3, F4, D1, D2 không đổi) sẽ làm cho

X19 tăng thêm 0.426 đơn vị

 B3 = 0.16: khi F3 tăng thêm 1 đơn vị (F1, F2, F4, D1, D2 không đổi) sẽ làm cho

X19 tăng thêm 0.16 đơn vị

 B4 = 0.286: khi F4 tăng thêm 1 đơn vị (F1, F2, F3, D1, D2 không đổi) sẽ làm cho

X19 tăng thêm 0.286 đơn vị

 B(D1) = 0.876: khi F4 tăng thêm 1 đơn vị (F1, F2, F3, F4, D2 không đổi) sẽ làm

cho X19 tăng thêm 0.876 đơn vị

 B(D2) = 1.242: khi F4 tăng thêm 1 đơn vị (F1, F2, F3, F4, D1 không đổi) sẽ làm

cho X19 tăng thêm 1,242 đơn vị

Kết luận: Customer Type – loại khách hàng có tác động rất lớn đến sự thỏa mãn (X19)

của khách hàng Cụ thể những khách hàng đã có sự gắn kết với công ty trên năm 5 thì sự thỏa mãn của họ cao hơn so với các nhóm còn lại Và như vậy, việc thực hiện các kế hoạch nhằm tăng sự trung thành và gắn kết của khách hàng sẽ là chiến lược hiệu quả làm

tăng sự hài lòng của khách hàng với sản phẩm và công ty

- Giá trị Sig của tất cả các tham số đều bằng 0.000 < 0.05 Vậy các tham số này (hệ

số hồi quy) đều có ý nghĩa Tức là các biến này có quan hệ hồi quy tuyến tính với nhau

Phương trình hồi quy tương ứng:

X19 = 6.249 + 0.364 F1 + 0.426 F2 + 0.160 F3 + 0.286 F4 + 0.876 D1 + 1.242 D2

Ngày đăng: 06/06/2016, 14:01

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w