Dò tìm các vi phạm giả định cần thiết trong hồi qui tuyến tính:

Một phần của tài liệu Các yếu tố ảnh hưởng đến quyết định chọn mua sữa chua ăn probi vinamilk của người tiêu dùng tại tp hồ chí minh (Trang 71 - 74)

8- Thang đo về quyết định lựa chọn Sữa chua Ăn Probi của Vinamilk

4.3.5 Dò tìm các vi phạm giả định cần thiết trong hồi qui tuyến tính:

Phân tích hồi quy không phải chỉ là việc mô tả các dữ liệu quan sát được, mà từ các dữ liệu quan sát này chúng ta phải suy rộng cho mối quan hệ giữa các biến trong tổng thể, nghĩa là chúng ta phải suy rộng cho tổng thể các người tiêu dùng tại TP. HCM chứ không phải chỉ giới hạn ở 291 người được khảo sát. Để việc diễn dịch kết quả hồi quy này được chấp nhận thì nghiên cứu không được vi phạm các giảđịnh cần thiết sau:

4.3.5.1 Giả định liên hệ tuyến tính:

Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), người ta hay vẽ biểu đồ phân tán giữa các phần dư và giá trị dự đoán của mô hình hồi quy tuyến tính cho ra, hai biến này đã được chuẩn hóa với phần dư trên trục tung và giá trị dự đoán trên trục hoành. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn thì ta sẽ không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên.

Kết quả từ đồ thị Scatterplot (phụ lục 6, trang 107) cho thấy phần dư phân tán ngẫu nhiên trong một vùng xung quanh đườngđi qua tung độ 0 chứ không tạo thành một hình dạng nào, do đó giả định tuyến tính được thỏa mãn.

59

4.3.5.2 Giả định phương sai của sai số không đổi:

Hiện tượng phương sai thay đổi gây ra khá nhiều hậu quả tai hại đối với mô hình ước lượng bằng phương pháp bình phương nhỏ nhất. Nó làm cho các ước lượng của các hệ số hồi quy không chệch nhưng không hiệu quả, ước lượng của các phương sai bị chệch làm kiểm định các giả thuyết mất hiệu lực khiến ta đánh giá nhầm về chất lượng của mô hình hồi quy tuyến tính.

Để kiểm định phương sai thay đổi, tác giảdùng đồ thị Scatter plot với giá trị phần dư chuẩn hóa (standardized residual) trên trục tung và giá trị dự đoán chuẩn hóa (standardized predicted value) trên trục hoành. Trên đồ thị (phụ lục 6, trang 107) ta thấy sựthay đổi của phần dư phân tán ngẫu nhiên xung quanh trục 0 (tức là xung quanh giá trị trung bình của phần dư) trong một phạm vi không đổi (từ -2 đến +2). Điều này có nghĩa là phương sai của sai sốkhông đổi.

4.3.5.3 Giả định phân phối chuẩn của phần dư:

Để khảo sát tính phân phối chuẩn của phần dư, cách đơn giản nhất là xây dựng biểu đồ tần số của các phần dư. Có thể dùng biểu đồ tần số Histogram hoặc biểu đồ tần số Q- Q plot để khảo sát phân phối chuẩn của phần dư.

Dựa vào đồ thị tần số Histogram (phụ lục 6, trang 107) có thể nói phân phối của phần dư là xấp xỉ chuẩn (Trung bình Mean = 5.56E-16 và độ lệch chuẩn = 0.988 ~ 1).

Đồ thị P-P plot (phụ lục 6, trang 108) cho thấy các chấm phân tán sát với đường chéo, phân phối phần dư có thểxem như chuẩn.

Do đó có thể kết luận rằng giả thuyết phân phối chuẩn của phần dư không bị vi phạm.

4.3.5.4 Giả định tính độc lập của sai số:

Tính độc lập của sai số ở đây có nghĩa rằng giữa các phần dư không có mối tương quan với nhau. Đại lượng thống kê Durbin-Watson (d) dùng để kiểm địnhtương quan của các sai số kề nhau (tương quan chuỗi bậc nhất).

60

Bảng 4.18: Quy tắc ra quyết định.

(Nguồn: Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, trang 233).

0 dRLR dRUR 2 4-dRUR 4-dRLR 4

Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), đại lượng d có giá trị biến thiên trong khoảng từ 0 đến 4. Giá trị d gần bằng 2 nếu các phần dư không có tương quan chuỗi bậc nhất với nhau. Giá trị d < 2 nghĩa là các phần dư gần nhau có tương quan thuận. Giá trị d > 2 và gần bằng 4 có nghĩa là các phần dư có tương quan nghịch. Khi thực hiện kiểm định Durbin-Watson, nếu kết quả giá trị d nằm trong khoảng: 1<d<3 thì mô hình không có tự tương quan (Hoàng Trọng & ctg, 2008). Kết quả kiểm định của mô hình bằng kiểm định Durbin-Watson có giá trị D = 1.032 trên Bảng 4-8 cho thấy chưa đủ cơ sở bác bỏ giả thuyết Ho: hệ số tương quan tổng thể của các phần dư = 0.

Kết luận: chấp nhận giả thuyết Ho, các phần dư không có mối tương quan với nhau. 4.3.5.5 Giả định không có mối tương quan giữa các biến độc lập:

Có một tình huống vi phạm giả định xảy ra riêng với hồi quy tuyến tính bội đó là hiện tượng cộng tuyến. Cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008) và dò tìm vi phạm giả định này được gọi là đo lường đa cộng tuyến.

Công cụ giúp ta phát hiện sự tồn tại của cộng tuyến trong dữ liệu là: Độ chấp nhận của biến (Tolerance) và hệ số phóng đại phương sai (Variance Inflation Factor - VIF). Nếu hệ số Tolerance của một biến nhỏ thì nó gần như là một kết hợp tuyến tính của các biến độc lập khác và hệ số VIF > 2thì đó là dấu hiệu của đa cộng tuyến.

Kết quả bảng 4-10 cho thấy hệ số Tolerance cao và VIF < 2 nên không xảy ra hiện tượng đa cộng tuyến, do đó không có tương quan chặt chẽ giữa các biến độc lập.

Bác bỏ giả thuyết Ho, nghĩa là có tương quan ngược chiều (âm) Bác bỏ giả thuyết Ho, nghĩa là có tương quan thuận chiều (dương) Miền không có kết luận Chấp nhận giả thuyết Ho, nghĩa là không có tương quan chuỗi bậc nhất Miền không có kết luận

61 Kết luận: Kết luận:

Nghiên cứu không vi phạm các giả định về hồi quy tuyến tính, do vậy kết quả nghiên cứu có thể suy rộng ra cho toàn bộ người tiêu dùng tại TP. HCM chứ không hạn chế ở 291 người như trong nghiên cứu này.

Một phần của tài liệu Các yếu tố ảnh hưởng đến quyết định chọn mua sữa chua ăn probi vinamilk của người tiêu dùng tại tp hồ chí minh (Trang 71 - 74)

Tải bản đầy đủ (PDF)

(121 trang)