Khi biến phụ thuộc có liên hệ chặt chẽ với biến độc lập thì mô hình hồi quy tuyến tính có thể được xây dựng nh m mục đích mô tả mối liên hệ tương quan tuyến tính giữa một biến phụ thuộc và nhiều biến độc lập (mô hình hồi quy bội).
Đối với phân tích này, Nguyễn Đình Thọ (2012) đã đề cập đến những giả định như sau:
Giả định 1: Biến phụ thuộc và biến độc lập có quan hệ tuyến tính. Sử dụng đồ thị phân tán để xem xét mối liên hệ giữa một biến độc lập và biến phụ thuộc (thậm chí là gợi ý loại đồ thị hàm số thích hợp để mô tả mối liên hệ). Các dữ liệu quan sát sẽ không n m trên cùng một đường thẳng mà phân phối tập trung xung quanh đường thẳng đi qua gốc 0 của đồ thị (đường thẳng này được vẽ thông qua phương pháp bình phương nhỏ nhất-Least squares).
Giả định 2: Biến phụ thuộc là biến định lượng.
Giả định 3: Các quan sát của biến phụ thuộc phải đảm bảo tính độc lập. Nghĩa là các quan sát không bị ảnh hưởng bởi những quan sát còn lại.
Giả định 4: Các giá trị của biến độc lập phải cố định. Giả định 5: Biến độc lập được đo lường không có sai số.
Giả định 6: Sai số của phần dư ɛi có phân phối chuẩn. Sai số này có thể không chuẩn vì nhiều lý do như sử dụng sai mô hình phương sai không phải là h ng số, số lượng phần dư không đủ để phân tích …Vì vậy cách đơn giản nhất là xây dựng biểu đồ tần số của phần dư để kiểm tra giả định này. Nếu trung bình Mean b ng 0 và độ lệch chuẩn Std.Dev xấp xỉ b ng 1 thì có hể kết luận phân phối chuẩn.
Giả định 7: Phương sai của phần dư không thay đổi, nói cách khác hiện tượng phương sai sai số thay đổi không xảy ra. Giả định này được kiểm định thông qua tương quan Spearman, với giả thuyết được đưa ra là H0: hệ số tương quan hạng của
tổng thể = 0. Nếu giả thuyết H0 bị bác bỏ thì c nghĩa là sẽ xảy ra hiện tượng phương sai thay đổi.
Giả định 8: Không có hiện tượng tự tương quan giữa phần dư. Giả định này được kiểm tra thông qua hệ số Durbin-Watson với giả thuyết được đặt ra là H0: hệ số tương quan tổng thể giữa phần dư = 0. Nếu như kết quả bác bỏ giả thuyết này có nghĩa là hiện tượng tự tương quan đang xuất hiện trong mô hình.
Giả định 9: Không có mối quan hệ tương quan giữa các biến độc lập nghĩa là không có hiện tượng đa cộng tuyến. Kiểm tra thông qua hệ số ph ng đại phương sai VIF, nếu như VIF vượt quá 2 thì hiện tượng đa cộng tuyến xuất hiện trong mô hình.
Cụ thể khi tiến hành chạy mô hình hồi quy tuyến tính bội, Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008) cho r ng nên thực hiện theo các bước sau:
Thứ nhất, xem xét mối quan hệ giữa các biến độc lập và biến phụ thuộc trong mô hình hồi quy thông qua ma trận tương quan của các biến trong mô hình (correlation matrix). Dựa vào hệ số Pearson Correlation để xác định mối quan hệ, cụ thể như sau: hệ số nhỏ hơn 0 2 nghĩa là không c sự tương quan. Trong khoảng từ 0 2 đến 0,4 là mức tương quan yếu, từ 0 4 đến 0,6 là mức tương quan trung bình. Nếu hệ số Pearson trong khoảng từ 0 6 đến 0,8 thì mức tương quan mạnh. Còn lại, từ 0 8 đến 1 là mối tương quan rất mạnh. Cũng lưu ý thêm là không c sự tương quan chặt chẽ nào được phép xảy ra giữa các biến độc lập với nhau điều này gây ảnh hưởng tới kết quả phân tích hồi quy.
Thứ hai, sự phù hợp của mô hình được kiểm định thông qua kiểm định F trong kết quả phân tích phương sai.
Thứ ba, tiến hành kiểm định ý nghĩa của các hệ số hồi quy b ng giá trị sig.
Thứ tư, kiểm tra lại mô hình có vi phạm những giả thuyết khi hồi quy tuyến tính bội hay không, với bất kì vi phạm nào mô hình đều phải được điều chỉnh.
Thứ năm đánh giá lại mức độ phù hợp của mô hình, liệu mô hình giải thích được bao nhiêu phần trăm của biến phụ thuộc khi có sự thay đổi của các biến độc lập.
Cuối cùng, hiệu chỉnh mô hình lý thuyết và viết mô hình hồi quy tuyến tính bội cụ thể cho nghiên cứu.