CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ MƠ HÌNH NGHIÊN CỨU
2.7 LÝ THUYẾT PHƯƠNG PHÁP PHÂN TÍCH
2.7.2 Lý thuyết phân tích hồi qui tuyến tính bội
Mơ hình hồi qui tuyến tính bội mở rộng mơ hình hồi qui hai biến bằng cách thêm vào một số biến độc lập để giải thích tốt hơn cho biến phụ thuộc. Mơ hình có dạng như sau:
...
Ký hiệu: βk là các hệ số hồi quy riêng phần (Partial regression coefficients)
pi
X là giá trị của biến độc lập thứ p tại quan sát thứ i.
i
e là một biến độc lập ngẫu nhiên có phân phối chuẩn với trung bình là 0 và phương sai không đổi σ2.
Các điều kiện thực hiện hồi quy tuyến tính bội:
¾ Biến phụ thuộc có phân phối chuẩn đối với bất kỳ kết hợp nào của các biến độc lập trong mơ hình và phương sai bằng nhau;
¾ Khơng có biến độc lập nào có thể được biểu thị dưới dạng tổ hợp tuyến tính với những biến độc lập (biến giải thích) cịn lại. Nếu tồn tại một quan hệ tuyến tính như vậy, khi đó xảy ra hiện tượng cộng tuyến
Các bước tiến hành phân tích hồi quy tuyến tính bội:
Bước 1: Xem xét các mối tương quan tuyến tính giữa tất cả các biến
Dựa trên ma trận tương quan để tìm hiểu sự tương quan giữa các biến độc lập và phụ thuộc
Bước 2: Đánh giá độ phù hợp của mơ hình hồi quy tuyến tính
Ta có thể sử dụng hệ số xác định R2 và R2 hiệu chỉnh để đánh giá độ phù hợp của mơ hình. Chấp nhận giá trị R2 ≥ 0,5, nghĩa là mơ hình hồi qui tuyến tính đã xây dựng phù hợp với tập dữ liệu đến mức ≥ 50%.
Bước 3: Kiểm định độ phù hợp của mơ hình hồi qui ở mức ý nghĩa 5%
Giả thuyết Ho: β1=β2 =β3 =β4 =0
Phát biểu Ho: Tất cả các hệ số hồi qui của các biến độc lập đều bằng không (ngoại trừ hằng số)
Trị thống kê F có mức ý nghĩa p ≤ 0,05, có thể bác bỏ giả thuyết Ho một cách an toàn, nghĩa là các hệ số hồi quy khác khơng, mơ hình hồi qui tuyến tính bội
phù hợp với tập dữ liệu và có thể sử dụng được (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, 240) [4, TV].
Bước 4: Ý nghĩa của hệ số hồi qui riêng phần
Trong phương trình hồi quy tuyến tính bội, các hệ số hồi qui của từng biến độc lập được gọi là hệ số hồi quy riêng phần, với ý nghĩa sau: βkđo lường sự thay đổi trong giá trị trung bình Y khi Xk thay đổi một đơn vị, giữ các biến độc lập cịn lại khơng đổi (Hồng Trọng và Chu Nguyễn Mộng Ngọc, 2008, 240) [4, TV].
Bước 5: Xác định tầm quan trọng của các biến trong mơ hình
Một là, việc đánh giá tầm quan trọng của từng biến độc lập đối với biến phụ thuộc Hài lòng khi mỗi biến được sử dụng riêng biệt để dự đốn mức độ hài lịng dựa vào hệ số tương quan giữa biến phụ thuộc với các biến độc lập. Trị tuyệt đối của hệ số tương quan càng lớn thì liên hệ tuyến tính càng mạnh.
Hai là, khi tất cả các biến độc lập cùng tương quan với nhau thì ảnh hưởng của mỗi biến đến biến phụ thuộc rất khó đánh giá. Ảnh hưởng đó bây giờ còn phụ thuộc vào các biến độc lập khác trong phương trình chứ khơng thể tách riêng, tức là khó có thể đạt được điều kiện giữ các biến khác không đổi khi đọc ý nghĩa của hệ số hồi qui riêng phần của từng biến độc lập. Để xác định tầm quan trọng của các biến khi chúng được sử dụng cùng với những biến khác trong mơ hình, ta dùng hệ số tương quan từng phần và tương quan riêng (Part and partial correlations).
Hệ số tương quan từng phần (Part correlation coefficient) chính là tương quan giữa Y và Xk khi ảnh hưởng tuyến tính của các biến độc lập khác đối với biến độc lập Xk bị loại bỏ. (1) Nếu tất cả các biến độc lập khơng có tương quan với nhau thì mức độ thay đổi của R2 khi một biến độc lập được đưa thêm vào phương trình đơn giản chỉ là bình phương của hệ số tương quan giữa biến độc lập này và biến phụ thuộc. (2) Nếu mức độ thay đổi của R2 khi đưa vào biến độc lập này mà lớn hơn mức độ thay đổi của R2 khi đưa vào biến độc lập khác thì
biến độc lập trước có vai trị quan trọng hơn (Hồng Trọng & Chu Nguyễn Mộng Ngọc, 2008, 242, 243) [4, TV].
Hệ số tương quan riêng (Partial correlation coefficient) được giải thích như là tương quan giữa biến độc lập thứ k và biến phụ thuộc Y khi ảnh hưởng tuyến tính của các biến độc lập khác đối với cả Y và Xk bị loại bỏ (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008, 244) [4, TV].
Kiểm định Ho: 2 ( ) 0
pop
change
R =
Trị số thống kê FCh có mức ý nghĩa ≤ 0,05, có cơ sở bác bỏ giả thuyết Ho, nghĩa là, giá trị thực của 2
change
R trong tổng thể ( 2 ( )
pop
change
R ) cũng khác 0 (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008, 245) [4, TV]
Bước 6: Kiểm tra các vi phạm về giả định
Trong phân tích hồi quy, phần dư (ei) được cho là biến ngẫu nhiên, độc lập (khơng có mối tương quan), có phân phối chuẩn với trung bình bằng 0 và phương sai không đổi σ2 nếu như thật sự mơ hình hồi qui tuyến tính phù hợp với các dữ liệu quan sát (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008, 212) [4, TV]. Giả định về phân phối của phần dư rất quan trọng nên các kiểm tra vi phạm giả định hồi quy chủ yếu xoay quanh phần dư.
Giả định phương sai của sai số không đổi: Hiện tượng “Phương sai thay đổi” (“Heteroskedasticity”) làm cho các ước lượng của các hệ số hồi quy bằng phương pháp OLS không chệch nhưng không hiệu quả (tức là không phải là ước lượng phù hợp nhất), ước lượng của các phương sai bị chệch làm kiểm định các giả thuyết mất hiệu lực, dẫn đến đánh giá nhầm về chất lượng của mơ hình hồi quy tuyến tính (Hồng Trọng & Chu Nguyễn Mộng Ngọc, 2008, 226) [4, TV].
Để kiểm định giả định này, có thể vận dụng kiểm định tương quan hạng Spearman với giả thuyết sau:
H1: Hệ số tương quan hạng tổng thể giữa phần dư và biến độc lập khác không (phương sai của sai số thay đổi)
Nếu giá trị Sig. của kiểm định nhỏ hơn mức ý nghĩa, nghĩa là bác bỏ giả thuyết Ho, chấp nhận giả thuyết H1, tương quan hạng tổng thể khác không (phương sai của sai số thay đổi). Như vậy, giả định về phương sai của sai số không đổi bị vi phạm
Nếu giá trị Sig. của kiểm định lớn hơn mức ý nghĩa, chấp nhận giả thuyết Ho, bác bỏ giả thuyết H1, ta có thể kết luận phương sai của sai số khơng thay đổi (Hồng Trọng & Chu Nguyễn Mộng Ngọc, 2008, 227) [4, TV].
Hiện tượng đa cộng tuyến (Collinearity Diagnostics): có thể dựa vào một số cơng cụ
như độ chấp nhận của biến (Tolerance) hay hệ số phóng đại phương sai (Variance inflation factor – VIF). Nếu độ chấp nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến độc lập khá, đó là dấu hiệu của đa cộng tuyến. Cịn hệ số phóng đại phương sai thực tế là nghịch đảo của độ chấp nhận. Khi độ chấp nhận nhỏ thì VIF lớn, quy tắc là khi VIF vượt quá 10, đó là dấu hiệu của đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, 251, 252) [4, TV].