5. QUY TRÌNH PHÂN TÍCH HỒI QUY TRONG EXCEL
5.2 Phân tích hồi quy bội trong Excel
5.2.1 Ước lượng các tham số của mô hình hồi quy bội
Trong Excel có hàm LINEST để ước lượng các tham số của mô hình hồi qui bội tương tự như chức năng của hàm slope và hàm intercept. Cú pháp của hàm linest như sau:
=linest(known_y’s, [known_x’s],[const],[stat]) (CSE)
Trong đó:
Known_y’s: vùng địa chỉ chứa biến phụ thuộc y
Known_x’s: vùng địa chỉ chứa các biến độc lập x1, .., xk.
Const: hằng số để chọn mô hình hồi quy. Nếu const = 1 (TRUE- mặc định) thì b0 có mặt trong mô hình hồi quy. Nếu const = 0 (FALSE) thì bỏ qua b0 (b0 =0).
Stat: tùy chọn để hiển thị các tham số thống kê. Nếu stat =1 (TRUE, mặc đinh) thì tính toán các tham số thống kê. Nếu stat = 0 (FALSE) thì không tính các tham số
này.
Kết quả trả về là một ma trận có số cột tùy thuộc vào số biến độc lập của mô hình hồi qui. Hình 4.12 minh họa ma trận kết quả của linest với const =1 và stat = 1.
Hình 4. 13 Kết quả trả về từ hàm linest
Trong đó:
mn , mn-1,.., m1, b: các hệ số bk, bk-1, ..,b1, b0 của mô hình hồi qui sen, sen-1,.., se1, seb: Sai số chuẩn của các hệ số tương ứng. r2: Hệ số tương quan bội R2
sey: Sai số của hàm hồi quy. F: giá trị kiểm định F
df: bậc tự do của hồi qui. df = n-k nếu const = 0. df = n-k-1 nếu const =1. ssreg: Tổng bình phương sai lệch do hồi qui (Sum of Square Regression)
ssresid: Tổng bình phương các sai lệch do ngẫu nhiên (Sum of Square Residual)
Ví dụ: 4.5.
Có thống kê về số lượng ô tô bán được (y), giá xăng (x1), sự tăng dân số (x2), và số lượng
đường giao thông được xây dựng trong 15 năm. Giả thiết có quan hệ tuyến tính giữa y và xj. Hãy ước lượng các hệ số của hàm hồi quy.
năm
Số xe bán được
(nghìn
chiếc) giá xăng ($/galon)
sự tăng dân số (tr người) Số con đường mới 1 159 1.62 55 12 2 160 1.667 56 13 3 163 1.69 58 14 4 166 1.7 60 15 5 167 1.72 63 17 6 167 1.73 65 18 7 168 1.736 66 18 8 167 1.74 66.7 18 9 167.9 1.75 66.9 19 10 168.9 1.755 67.4 19 11 169 1.756 67.9 19 12 169 1.77 68 20 13 170 1.767 68.5 18 14 171 1.756 68.8 17 15 172 1.77 68.9 18
Hình 4. 14 Kết quả ước lượng tham số của hồi qui bội bằng hàm linest
5.2.2 Sử dụng trình regression để phân tích hồi qui bội.
Qui trình sử dụng trình regression để phân tích hồi qui bội trong Excel giống như qui trình phân tích hồi qui đơn. Hình 4.14 hiển thị kết quả hồi qui và các tham số thống kê để phân tích phương sai, kiểm định giả thuyết đối với số liệu trong ví dụ 4.5.
Như có thể thấy trong kết quả hồi qui phản ánh trong hình 4.14, significance F = 2.7E-07 < a
=0.05 nên mô hình hồi qui chấp nhận được. Giá trị P-value của b0 và b3 > a nên các hệ số này không có ý nghĩa khi mở rộng hàm hồi quy. Kết quả hàm hồi qui là y = 57.41 x1 + 0.53 x2