Hàm số hồi quy có dạng như sau Để tính hàm hồi quy trong excel, trước tiên ta mở file andy.xls SALES là doanh số hàng tháng tại một thành phố X, tính theo $1000.. Bạn có thể tính toán vớ
Trang 1Thực Hành 4: Hồi Quy Đa Biến
I Big Andy’s burger barn
Trong bài này, chúng ta sẽ xem xét trường hợp của Big Andy’s Burger Barn Ta có SALES là biến phụ thuộc, là hàm số tuyến tính của PRICE và ADVERT, hai biến độc lập Giả sử, theo suy luận kinh tế của bạn, bạn cho rằng doanh số của Andy sẽ phụ thuộc vào giá cả bánh burger và số tiền công ty chi cho quảng cáo Hàm số hồi quy có dạng như sau
Để tính hàm hồi quy trong excel, trước tiên ta mở file andy.xls
SALES là doanh số hàng tháng tại một thành phố X, tính theo $1000 PRICE là giá của một bánh burger ADVERT là chi phí quảng cáo, tính theo $1000 Ta có thể tính hàm đa biến này theo những bước như ta đã làm với hàm hồi quy đơn giản Ta chọn Tools/Data Analysis/Regression và điền các thông tin cần thiết vào hộp thoại
Trang 2Excel sẽ cho ta kết quả như sau:
II Dự đoán
Dùng phương trình trên, ta có thể dự đoán giá trị của SALES tương ứng với những giá trị khác nhau của PRICE và ADVERT
Trang 3Bạn có thể tính toán với nhiều giá trị bằng excel như sau
và bạn sẽ có kết quả như sau
III Ước lượng phương sai:
Để ước lượng phương sai của sai số, ta có công thức sau:
Các thông số trong công thức này được tính toán và hiển thị tự động bởi Excel
Trang 4Để có độ lệch chuẩn, ta lấy căn bậc 2 của phương sai
và thông số này cũng được tính và hiển thị tự động bởi Excel khi ta chạy hàm Regression:
Ta đã có phương sai ước lượng của số dư Ta có thể tiến hành tính ma trận cộng phương sai cho các hệ số hồi quy (b1,b2,b3)
Trang 5Không may là ma trận cộng phương sai này không được hiển thị trong kết quả của Excel, nhưng ta có thể tính toán chúng từ công thức
Trong hiển thị của excel, ta thấy có độ lệch chuẩn của beta Ta chỉ cần bình phương đại lượng này là có phương sai var(bk)
Chúng ta chỉ cần tính toán cộng phương sai của các beta Công thức tính toán như sau
Trong đó:
Ta có thể tính đại lượng trên bằng excel như sau Trước hết, bạn có thể copy phần dữ liệu của chúng ta qua một worksheet mới để tiện thao tác Sau đó, ta phải tính trung bình của x
Trang 6Sau đó, ta lập ra hai cột mới có tên là Price-meanp, advert-meana
Sau khi tính toán hết các giá trị trong cột D và cột E, ta có thể tính tổng bình phương của Price-meanp và advert-meana bằng một hàm có sẵn của Excel
Và r23 có thể tính được bằng hàm Correl(x2,x3) trong excel và kết quả là 0.0264 Ngoài ra, ta còn biết s2 = MSE = 23.8742
Thay vào phương trình tính cộng phương sai, ta có
Trang 7IV Khoảng tin cậy
Excel tính và hiển thị tự động khoảng tin cậy cho beta Để có được thông tin này, khi
ta thực hiện chức năng Regression, ta cần tick vào ô “Confidence level” trong hộp thoại Ta có thể tuỳ chọn mức độ tin cậy, mặc định là 95%
Trong hình, ta có thể tính cả hai mức tin cậy ( đương nhiên là excel không tính 2 mức tin cậy một lúc, ta cần phải chạy tiện ích Regression 2 lần và copy kết quả)
Khoảng 90% của b3 cho ta biết rằng với $1000 tăng thêm trong chi phí quảng cáo, doanh thu sẽ tăng trong khoảng $724 tới $3001
V Kiểm định giả thuyết
Ta tiến hành kiểm định giả thuyết β2 = 0
- Nêu giả thuyết Ho: b2 = 0
- Nêu giả thuyết H1: b2 ≠ 0
- Nêu phân phối của giá trị kiểm định: t ~ t72
Trang 8- Tính giá trị t:
- nêu giá trị quyết định: a = 0.05 => t0.025 = 1.99
- quy tắc bác bỏ Ho : |t| ≥ tc=1.99
- kết luận: t =- 7.215 < -tc=-1.99 => ta bác bỏ H0 và kết luận giá cả có ảnh hưởng nghịch biến lên doanh thu
-Ta có thể dùng kết quả của tiện ích Regression để kiểm định giả thuyết trên:
Đôi khi, ta có thể muốn kiểm định giả thuyết một phía như H0: b3≤ 1 doanh thu tăng từ việc tăng quảng cáo không đủ để bù vào việc tăng chi phí quảng cáo, so với H1: b3 >1 , doanh thu tăng từ tăng quảng cáo đủ để bù chi phí quảng cáo
- Nêu giả thuyết:
- Nêu phân phối của giá trị kiểm định: t ~ t72
- Tính giá trị t:
- nêu giá trị quyết định: a = 0.05 => t0.05 = 1.66
- quy tắc bác bỏ Ho : t ≥ tc=1.66
- Kết luận: vì t = 1.22 < tc = 1.66, ta không thể bác bỏ H0, nghĩa là doanh thu tăng thêm từ việc tăng quảng cáo không đủ để bù vào chi phí quảng cáo Kết luận này có lẽ sẽ có tác động đến chính sách quảng cáo của công ty
Ta có thể tính giá trị ra quyết định bằng excel như sau
Trang 9VI Kiểm định mức độ phù hợp của mô hình:
Thông tin giúp ta kiểm định sự phù hợp của mô hình nằm chủ yếu trong bảng ANOVA Giá trị R2 và bảng ANOVA được hiển thị giống như trong trường hợp hồi quy đơn giản
R2 cho ta biết bao nhiêu phần trăm của sự dao động của yi được giải thích bởi mô hình
Ta có mối quan hệ :
và R2 sẽ được tính bằng công thức:
Khi thực hiện tiện ích Regression, giá trị R2 và bảng ANOVA được tính toán và hiển thị tự động
Trang 10Giá trị R2 = 0.4483 nghĩa là 44.83% của tổng dao động của yi (so với trung bình) được giải thích bằng mô hình Tuy nhiên, dùng R2 trong hồi quy đa biến có thể đưa đến kết luận sai vì khi ta thêm nhiều biến độc lập vào mô hình, R2 sẽ tiệm can 100% dù cho không có lý do kinh tế nào cho việc thêm những biến độc lập trên
Để sửa chữa lỗi này, ta có thể bổ sung một ít vào công thức của R2 và ta sẽ có một số
đo mới gọi là “ Adjusted R2” :
Giá trị Adjusted R2 cũng được tính và hiển thị tự động trong excel Tuy nhiên, một điều lưu ý rằng ta không nên sử dụng Adjusted R2 để lựa chọn việc thêm hay bớt biến độc lập trong mô hình Theo lý lẽ thông thường thì ta sẽ thêm biến độc lập nào làm tăng R2 vì nó có tham gia giải thích yi Nhưng ta biết là Adjusted R2 là công thức biến đổi từ R2 và nó không còn có ý nghĩa như R2 Hơn nữa, còn có nhiều phương pháp khác để lựa chọn mô hình, nên ta chỉ nên coi R2 và Adjusted R2 như là thông tin tham khảo trong việc lựa chọn mô hình mà không nên coi là tiêu chí chính