Mô hình hồi quy đa biến có dạng sau:
Yi = βo + β1X1i + β2X2i + β3X3i + … + βpXpi + ei
Trong đó:
Xpi: Biểu hiện giá trị của biến độc lập thứ p tại quan sát thứ i. βk : Là hệ số hồi quy riêng phần (Partial Regression Coefficients)
ei : Là một biến độc lập ngẫu nhiên có phân phối chuẩn với trung bình là 0 và phương sai không đổi σ2.
Các ưu điểm của hồi quy đa biến
Hồi quy bội cho ta đường hồi quy chính xác hơn so với hồi quy đơn khi ta chọn được các biến nguyên nhân chính xác.
Giúp ta hiểu rõ hơn về vấn đề đang nhiên cứu, do mọi vấn đề hay hiện tượng trong tự nhiên hay trong kinh tế, xã hội đều có nhiều nguyên nhân gây ra chứ không phải chỉ một nguyên nhân ảnh hưởng duy nhất.
Sai số e là nhỏ so với hồi quy đơn, khi các biến được chọn phù hợp. Nhược điểm
Có quy trình khảo sát và thu thập dữ liệu khó.
Có hiện tượng đa cộng tuyến xảy ra khi nghiên cứu các biến nguyên nhân. Điều này xảy ra khi các biến nguyên nhân ảnh hưởng lẫn nhau.
Xây dựng mô hình
Bước đầu tiên khi xây dựng mô hình thì ta phải đi xem xét các mối tương quan tuyến tính giữa các biến bằng cách xây dựng ma trận tương quan giữa các biến. Từ đó, ta có thể đánh giá sự tương quan của các biến nguyên nhân với nhau hay sự tác động đến biến kết quả.
Để đánh giá độ phù hợp của mô hình hồi quy tuyến tính đa biến, ta cũng quan sát hệ số R2, khi ta đưa vào mô hình càng nhiều biến nguyên nhân thì hệ số R2 càng tăng. Nhưng thực tế cho thấy, khi số biến nguyên nhân tăng thì không hẳn mô hình càng phù hợp. Do đó, đối với mô hình hồi quy tuyến tính đa biến, người ta xét độ phù hợp của mô hình thông qua giá trị Rsquare adjust (R2 điều chỉnh). Giá trị R2 điều chỉnh này không nhất thiết tăng cao gần một khi ta thêm vào mô hình nhiều biến hơn vì nó không phụ thuộc vào độ lệch phóng đại của R2. R2 điều chỉnh được tính như sau:
R2
adjust=R2-p(1-R2)/(N-p-1)
Trong đó P là biến số độc lập trong phương trình (trong mô hình hồi quy đơn biến thì p=1).
Việc phân tích từ đầu đến giờ cũng thật sự chưa thuyết phục lắm, do đó để tạo sự tin tưởng hoàn toàn vào kết quả của hàm, ta lần lượt đi kiểm định, dò tìm thử có giả thuyết nào bị vi phạm trong mẫu không. Các bước được tiến hành như dưới đây.
Kiểm định độ phù hợp của mô hình
Cũng giống như phần hồi quy đơn biến thì ta phải đi kiểm định độ phù hợp của tổng thể, kiểm định F được sử dụng. Ý tưởng của kiểm định này là xem xét tất cả các biến nguyên nhân có liên hệ với biến kết quả hay không, thông qua kiểm định giả thuyết H0: β1=β2= …= βk=0, và khi giả thuyết H0 bị bác bỏ thì ta kết luận độ phù hợp trong mô hình giải thích được biến khảo sát.
Xét hệ số beta riêng phần cho mô hình
Đây là kiểm định t với giả thuyết H0: β1=β2= …= βk=0.
Hệ số này nói lên sự tác động riêng của một biến nguyên nhân nào đó vào biến kết quả khi các biến nguyên nhân còn lại không có sự thay đổi, hệ số này còn được kiểm định thông qua mức ý nghĩa Sig. (Significance Level) khi mức ý nghĩa càng nhỏ thì ta đánh giá biến nguyên nhân đó có tác động đến mô hình (giả thuyết H0 bị bác bỏ), ngược lại, khi giá trị của mức ý nghĩa lớn hơn 0.20 chẳng hạn thì không có sự tác động lớn của biến nguyên nhân đó đến mô hình (không thể bác bỏ giả thuyết H0).