Phân tích phương sa

Một phần của tài liệu Các yếu tố ảnh hưởng đến quyết định chọn trà sữa phúc long của người tiêu dùng gen z tại thành phố hồ chí minh (Trang 43 - 47)

Phân tích phương sai một yếu tố (còn gọi là Oneway Anova) dùng để kiểm định giả thuyết trung bình bằng nhau của các nhóm mẫu với khả năng phạm sai lầm chỉ là 5%. Một số giả định khi phân tích ANOVA:

 Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn.

 Phương sai của các nhóm so sánh phải đồng nhất. Lưu ý: nếu giả định tổng thể có phân phối chuẩn với phương sai bằng nhau không đáp ứng được thì bạn có thể dùng kiểm định phi tham số Kruskal - Wallis sẽ để thay thế cho ANOVA.

ANOVA test:

 Ho: “Trung bình bằng nhau”

 Sig. > 0.05: bác bỏ H là chưa đủ điều kiện để khẳng định có sự khác biệt,...o  Sig. <= 0.05: chấp nhận H là đủ điều kiện để khẳng định có sự khác biệt,… o Khi có sự khác biệt thì có thể phân tích sâu hơn để tìm ra sự khác biệt như thế nào giữa các nhóm quan sát.

6.1.2.4 Hồi quy tuyến tính

Điều kiện để phân tích hồi quy đa biến là phải có tương quan giữa biến độc lập với nhau và biến phụ thuộc. Tuy nhiên, khi hệ số tương quan < 0.85 thì có khả năng đảm bảo giá trị phân biệt giữa các biến. Nghĩa là, nếu có hệ số tương quan > 0.85 thì cần xem xét vai trò của các biến độc lập vì có thể xảy ra hiện tượng đa cộng tuyến (một biến độc lập này có được giải thích bằng một biến khác (John, O. P. & Benet-Martinez, V., 2000).

Đánh giá độ phù hợp (mức độ giải thích) của mô hình bằng hệ số xác định R (R2 Square). Tuy nhiên, R có đặc điểm càng tăng khi đưa thêm các biến độc lập vào mô2 hình mặc dù không phải mô hình càng có nhiều biến độc lập thì phù hợp với tập dữ liệu. Vì thế R điều chỉnh (Adjusted R Square) có đặc điểm không phụ thuộc vào số2 lượng biến đưa thêm vào mô hình được sử dụng thay thế R để đánh giá mức độ phù2 hợp của mô hình hồi quy bội.

Để phân tích mối quan hệ của nhiều biến độc lập với một biến phụ thuộc, ta sử dụng hồi quy đa biến.

Khi sử dụng hồi quy đa biến, các tham số cần được chú ý:

 Hệ số R hiệu chỉnh (Adjustted coefficient of determination): Dùng để đo lường2 phần phương sai của biến phụ thuộc, được giải thích bởi các biến độc lập có tính đến số lượng biến phụ thuộc và cỡ mẫu.

 Kiểm định độ phù hợp của mô hình: Sử dụng thống kê F (Fishter) để kiểm định mức ý nghĩa thống kê của mô hình. Đặt giả thuyết H cho là các hệ số β trong mô hìnho đều bằng 0. Nếu mức kiểm định nhỏ hơn 0.05 thì ta có thể bác bỏ giả thuyết H , nghĩao là mô hình phù hợp với dữ liệu đang khảo sát.

 Hệ số hồi quy chuẩn hóa: Hệ số β (Standardized eta Conficent) giúp cho việc so sánh một cách trực tiếp về mức độ tác động của các biến độc lập lên biến phụ thuộc.

 Kiểm định mức ý nghĩa của hệ số β: Sử dụng thống kê T để kiểm định mức ý nghĩa của hệ số β. Nếu mức ý nghĩa của kiểm định nhỏ hơn 0.05 thì ta có thể kết luận rằng hệ số β có ý nghĩa về mặt thống kê.

 Kiểm định đa cộng tuyến: Một mô hình hồi quy tuyến tính có phù hợp với tập dữ liệu hay không có ý nghĩa là mô hình đó có hay không có hiện tượng đa cộng tuyến. Hiện tượng đa cộng tuyến là hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và có quan hệ gần như tuyến tính, nghĩa là nó sẽ cung cấp cho chương trình những thông tin trùng lặp về sự ảnh hưởng của biến độc lập đến biến phụ thuộc. Có hai phương pháp để đo lường đa cộng tuyến như sau:

Tính độ chấp nhận của biến (Tolerance): Độ chấp nhận của biến càng nhỏ thì dấu hiệu có đa cộng tuyến càng sâu.

Hệ số phóng đại phương sai (VIF): là công cụ được sử dụng để phát hiện tồn tại hiện tượng đa cộng tuyến - độ chấp nhận của biến (Tolerance). Khi hệ số phóng đại phương sai (Variance inflation factor- VIF) lớn hơn hoặc bằng 10 nghĩa là có hiện tượng đa cộng tuyến (Hoang, T & Chu, N. M. N, 2005).

Kiểm định giả định hồi quy của mô hình: Giúp xác định giả thuyết phân phối chuẩn có bị vi phạm hay không. Nếu giá trị trung bình Mean = 0 và giá trị Std.dev xấp xỉ bằng 1 thì mô hình không bị vi phạm phân phối chuẩn. Đồng thời xem xét đồ thị phân tán phần dư để xác định có nhân tố tiềm ẩn ảnh hưởng đến biến phụ thuộc hay không.

Kiểm tra hiện tượng tự tương quan:

Tương quan là hiện tượng các sai số ngẫu nhiên có mối liên hệ tương quan nhau, khi đó có thể xảy ra hiện tượng tương quan. Hậu quả của tự tương quan các phân dư:

 Các ước lượng OSL (Ordinary Least Square) vẫn là các ước lượng tuyến tính không chênh lệch nhưng không hiệu quả (vì phương sai không nhỏ nhất).

 Phương sai của các ước lượng là các ước lượng lệch vì vậy kiểm định T và F không còn hiệu quả.

 Các dự báo về biến phụ thuộc không chính xác.

Kiểm tra hiện tượng tự tương quan bằng kiểm định d của Durbin Watson. Nếu trị số Durbin Watson nằm trong khoảng (1;3) thì ta có thể kết luận không xảy ra hiện tượng tự tương quan và có thể sử dụng kết quả của mô hình hồi quy.

Kiểm tra phân phối chuẩn của phần dư:

Tính phân phối chuẩn của phần dư là một trong những điều kiện quan trọng để các giá trị mức ý nghĩa (p - value) trong các kiểm định thống kê như T - Test, F - Test có ý nghĩa. Nếu phần dư không có phân phối chuẩn, có khả năng là mô hình đã thiếu đi mất một biến độc lập quan trọng để giải thích cho biến phụ thuộc hoặc có một biến độc lập sai dạng chức năng. Với mẫu số 400, việc phân phối chuẩn của phần dư sẽ được kiểm tra bằng cách vẽ đồ thị P - P phần dư chưa chuẩn hóa thu được từ mô hình hồi quy.

Một trong những giả định quan trọng khi thực hiện hồi quy tuyến tính đó là phương sai của biến phụ thuộc có các mức thay đổi bằng nhau tức là phương sai không đổi với mỗi giá trị của các biến độc lập. Hậu quả của việc phương sai thay đổi tương tự như hậu quả của sự tương quan. Kiểm định phương sai thay đổi bằng phương pháp Breusch pangan nghĩa là thực hiện hồi quy từ phân dư thu từ mô hình hồi quy chính với các biến độc lập của mô hình hồi quy chính.

Một phần của tài liệu Các yếu tố ảnh hưởng đến quyết định chọn trà sữa phúc long của người tiêu dùng gen z tại thành phố hồ chí minh (Trang 43 - 47)

Tải bản đầy đủ (PDF)

(47 trang)