Sử dụng phần mềm Eviews
Trang 11 Giới thiệu:
Sử dụng phần mềm Eviews tiến hành ước lượng, phân tích về hàm hồi quy cho
mô hình chứa dữ liệu chéo là giá bán nhà tại quận Cam, bang California
(SALEPRIC) với các biến độc lập đó là SQFT (diện tích nhà), GARAGE (số chỗ
đậu xe hơi trong garage), CITY (vị trí căn nhà), AGE (tuổi thọ căn nhà) Có hàm hồi mẫu có dạng như sau:
SALEPRIC = B1 + B2*SQFT + B3*GARAGE +B4*CITY + B5*AGE
2 Nội dung:
2.1 Bảng số liệu thống kê:
Với:
• SALEPRIC: giá bán nhà tại quận Cam,bang California (nghìn USD).
• SQFT: diện tích nhà tính bằng feet vuông.
• GARAGE: số chỗ đậu xe hơi trong garage.
• CITY: = 1 đối với nhà ở Coto de Caza, = 0 nếu ở Dove Canyon.
• AGE: tuổi thọ căn nhà tinh theo năm.
Trang 72.2 Nội dung đề tài:
2.2.1 Phần 1: Thực hiện trên Excel
Ta dùng Regression trên Data Analysis để ước lượng hàm hồi quy mẫu có dạng :
SALEPRIC = B1 + B2*SQFT + B3*GARAGE +B4*CITY + B5*AGE
Ta được bảng sau:
Ta được các kết quả sau:
Giá trị hệ số chặn B1(Intercept): -752.9955638
Giá trị hệ số hồi quy riêng B2 (biến SQFT): 0.2205653
Giá trị hệ số hồi quy riêng B3 (biến GARAGE): 135.4504308
Giá trị hệ số hồi quy riêng B4 (biến CITY): 87.24891989
Giá trị hệ số hồi quy riêng B5 (biến AGE): 6.214611589
Suy ra phương trình hồi quy như sau:
SALEPRIC = -752.9955638 + 0.2205653SQFT + 135.4504308GARAGE +
87.24891989CITY + 6.214611589AGE
Trang 82.2.2 Phần 2: Thực hiện trên Eviews.
2.2.2.1 Bảng các tham số thống kê của các biến độc lập:
2.2.2.2 Đồ thị các biến độc lập:
Trang 92.2.2.3 Ma trận Correlation Matrix gồm cả biến phụ thuộc và tất cả các biền độc lập:
2.2.2.4 Ước lượng phương trình hồi quy dưới dạng:
SALEPRIC = B1 + B2*SQFT + B3*GARAGE +B4*CITY + B5*AGE
Chạy hồi quy sử dụng phương pháp bình phương nhỏ nhất (Least Squarees) với biến phụ thuộc là SALEPRIC và ba biến giải thích là diện tích (SQFT); chổ đậu xe hơi (GARAGE); thành phố (CITY); tuổi thọ căn nhà (AGE) và hằng số c Số lượng biến quan sát là 224 ta được các kết quả sau:
Trang 10• Hệ số hồi quy thu được (Coefficient):
Vậy phương trình hồi quy có dạng:
SALEPRIC = -752.9956 + 0.220565SQFT + 135.4504GARAGE + 87.24892CITY +
6.214612AGE 2.2.2.5 Kiểm định Wald cho 4 biến SQFT, GARAGE, CITY, AGE:
• Kiểm định wald cho 2 biến SQFT và GARAGE:
Từ kết quả ở bảng trên ta thấy giá trị p-value (xác suất Prob) = 0.0000 < α = 0.05 cho nên hai biến kiểm định ở trên là SQFT và GARAGE không phải là 2 biến thừa
Trang 11• Kiểm định wald cho 2 biến CITY và AGE:
Từ kết quả ở bảng trên ta thấy giá trị p-value(xác suất Prob) = 0.0000 < α = 0.05 cho nên hai biến CITY và AGE kiểm định ở trên không phải là biến thừa
Trang 122.2.2.6 Kiểm định White:
Trang 13Từ kết quả ở bảng trên ta thấy:
Obs*R-squared = nR2 = 165.7949 > x0.052 (5) 22.3620324948 =
Vậy có thể kết luận phương sai thay đổi
2.2.2.7 Kiểm định BG cho các biến độc lập:
Trang 14Theo bảng kết quả trên thì (n-p)R2 = 1.844992 có xác suất (p-value) là 0.174367 lớn hơn mức ý nghĩa α = 0.05 nên chấp nhận giả thiết H0 tức là không có sự tương quan bậc nhất
Trang 19Theo bảng trên ta có kết quả:
Khoảng dự báo giá trị trung bình là: [1810.899 ; 2031.671]
Khoảng dự báo giá trị cá biệt là: [1646.802 ; 2195.768]
2.2.2.9 Đồ thị biểu diễn khoảng dự báo giá trị trung bình của giá nhà:
- Đồ thị biểu diễn khoảng dự báo giá trị cá biệt của giá nhà:
Trang 203 Kết luận:
Sau khi kiểm định mô hình về giá bán nhà ở quận Cam,bang California Ta thấy các chỉ tiêu giải thích hoàn toàn độc lập với nhau và có khả năng giải thich đối với giá nhà, qua đó có thể kết luận rằng mô hình trên hoàn toàn có thể sử dụng để dự báo về giá nhà hiện tại cũng như trong tương lai Trong đó, ta nên quan tâm đặc biệt đến chỉ tiêu giải thích về diện tích nhà khi thu thập số liệu vì nó có ý nghĩa lớn đến kết quả dự báo sau này