phân tích mô hình và dự báo giá bán nhà tại quận Cam bang California với biến phụ thuộc là SALEPRIC và 4 biến độc lập SQFT, GARAGE, CITY, AGE.
Trang 1LỜI CẢM ƠN
Em xin gửi lời cảm ơn chân thành tới:
- Ban Giám Hiệu và các thầy cô đang công tác tại trường Đại học CôngNghiệp Thành phố Hồ Chí Minh đã tạo điều kiện về thời gian, cơ sở vật chất giúpchúng em có được thuận lợi trong suốt quá trình học tập tại trường.
- Th.S Đinh Kiệm đã tận tình hướng dẫn chỉ bảo để chúng em hoàn thànhđúng và đủ nội dung của bài tiểu luận qua đó chúng em có thể học tốt môn Kinh tếlượng và dự báo, một trong những điều kiện để trở thành một nhà kinh tế tài giỏi trongtương lai.
TP Hồ Chí Minh, ngày 20 tháng 11 năm 2011
Trang 2NHẬN XÉT CỦA GIẢNG VIÊN
Trang 3LỜI MỞ ĐẦU
Kinh tế lượng là một môn khoa học ra đời trong những năm 30 của thế kỷ 20 Sự ra đời của kinh tế lượng liên quan đến việc phát triển rộng rãi những phép toán và thống kê trong các lĩnh vực đa ngành như: sinh vật học, tâm lý học, xã hội học, đặc biệt việc toán học hóa đã có chú trọng nhiều đến lĩnh vực kinh tế.
Kinh tế lượng là tập hợp các công cụ nhằm mục đích dự báo các biến số kinh tế Và Eviews là một công cụ có ưu điểm chính là có thể cho chúng ta kết quả nhanh chóng khi tiến hành ước lượng, phân tích và hàm hồi quy cho các mô hình kinh tế.
Do đó khi thực hiện đề tài tiểu luân số 17 liên quan tới phân tích mô hình và dự báo giá bán nhà tại quận Cam bang California với biến phụ thuộc là SALEPRIC và 4 biến độc lập SQFT, GARAGE, CITY, AGE, em đã sử dụng phần mềm Eviews 6 cho đề tài tiểu luận này Qua các bước đặt ra các giả thiết liên quan, thiết lập mô hình, ước lượng tham số của mô hình, phân tích kết quả mô hình xem có phù hợp hay không và đi tới quyết định có sử dụng nó vào trong dự báo.
Trang 4ĐỀ TL SỐ 17
Phần I : trên Excel
Sử dụng dữ liệu Data BT 11 trên Excel, dùng Regression trên Data Analysis để ước
lượng hàm hồi quy mẫu có dạng sau :
SALEPRIC = B1 + B2*SQFT + B3*GARAGE +B4*CITY + B5*AGE SALEPRIC : giá bán nhà tại quận Cam,bang California (nghìn USD) SQFT : diện tích nhà tính bằng feet vuông
GARAGE : số chỗ đậu xe hơi trong garage
CITY : = 1 đối với nhà ở Coto de Caza, = 0 nếu ở Dove Canyon AGE : tuổi thọ căn nhà tinh theo năm
b/ Hãy kiểm định Wald ( biến thừa ) cho 4 biến độc lập nêu trên
c/ Từ mô hinh câu a phần II hãy kiểm định White và BG cho mô hình này
d/ Hãy dự báo giá trị trung bình và giá trị cá biệt của giá bán nhà theo mô hình sau:
SALEPRIC = C1 + C2*SQFT + C3*GARAGE +C4*CITY + C5*AGE
Trang 5BẢNG SỐ LIỆU
Số liệu được cho như sau:
SALEPRIC: Giá bán tính bằng nghìn USDSQFT:Diện tích nhà tính bằng feet vuôngGARAGE: Số chỗ đậu xe hơi
CITY: =1 nếu nhà ở city Côt de Caza, = 0 nếu ở Dove CanyonAGE: Tuổi thọ của nhà tính bằng năm
Trang 11Dựa vào bảng trên ta có :
B1 = -752.9956 ; B2 = 0.220565B3 = 135.4504 ; B4 = 87.24892B5 = 6.214612
Vậy hàm hồi quy mẫu là:
SALEPRIC = -752.9956+ 0.220565*SQFT + 135.4504*GARAGE +87.24892*CITY + 6.214612*AGE
Ý nghĩa của hàm hồi quy:
Trang 12- Trong điều kiện các yếu tố khác không đổi, khi diện tích căn nhà tăng lên 1 feet vuông thì giá bán nhà tại quận Cam bang California tăng lên 0,220565 nghìn USD.
- Trong điều kiện các yếu tố khác không đổi nếu số chỗ đậu xe tăng lên 1 thì giá bán nhà tại quận Cam bang California tăng lên 135,45 nghìn USD.
- Trong điều kiện các yếu tố khác không đổi nếu nhà ở Coto de Caza thì giá bán nhà tại quận Cam bang California tăng lên 87,25 nghìn USD.
- Trong điều kiện các yếu tố khác không đổi nếu độ tuổi của căn nhà tăng lên 1 thìgiá bán của căn nhà tăng lên 6, 215 nghìn USD.
Trang 13Mean : Giá trị trung bình.Median : Trung vị.
Maximum : Giá trị lớn nhất.Minimum : Giá trị nhỏ nhất.
Std.Dev (Standard Deviation) : Độ lệch chuẩn.Skenewness : Độ bất cân xứng.
Độ lệch chuẩn của biến GARAGE = 0.519634, CITY = 0.500400 và AGE = 3.254414 thì tương đối nhỏ cho thấy độ phân tán của các biến xung quanh giá trị trung bình thấp.Dựa vào giá trị Min, Max là thấy rằng các biến này trong các quan sát có mức độ tương đồng.
Đồ thị các biến độc lập:
Trang 14Ma trận Correlation Matrix gồm cả biến phụ thuộc và tất cả biến độc lập
Nhận xét:
Quan sát ta thấy biến độc lập SQFT giải thích rất tốt cho biến SALEPRIC, 91.93% Biến độc lập GARAGE giải thích tương đối tốt cho biến SALEPRIC, 65.36%.Biến
Trang 15độc lập CITY giải thích tương đói tốt cho biến SALEPRIC,50.33% Biến AGE giải thích không tốt lắm cho biến SALEPRIC, 8.999%.
Mức tương quan giữa biến SQFT và các biến GARAGE và CITY tương đối khá lớn lần lượt là 58.18% và 42.75%.
Ước lượng phương trình hồi quy:
Mô hình hồi quy là:
SALEPRIC = -752.9956 + 0.220565 * SQFT + 135.4504 * GARAGE + 87.24892 * CITY + 6.214612 * AGE
Trang 16b) Kiểm định Wald (biến thừa) cho 4 biến độc lập:
Nhận xét:
Dựa vào bảng kết quả trên, ta thấy giá trị p-value = 0.0000 < 0.05 (mức ý nghĩa α=5%) nên ta bác bỏ giả thiết Nghĩa là cả 4 biến độc lập SQFT, GARAGE, CITY, AGE đều đồng thời ảnh hưởng đến biến phụ thuộc SALEPRIC, điều đó có nghĩa hàm hồi quy mẫu phù hợp.
Kiểm định Wald (biến thừa) cho biến độc lập: SQFT
Trang 17Nhận xét:
Từ bảng kết quả trên, ta thấy P-value = 0.0000 < 0.05 (mức ý nghĩa α = 5%) nên ta bácbỏ giả thiết => Biến SQFT thực sự là một biến cần thiết cho mô hình.
Trang 18Kiểm định Wald (biến thừa) cho biến độc lập: GARAGE
Nhận xét:
Từ bảng kết quả trên cho thấy: giá trị P-value = 0.0000 < 0.05 (mức ý nghĩa α = 5%) nên ta bác bỏ giả thiết.
Biến GARAGE thực sự là một biến cần thiết cho mô hình.
Kiểm định Wald (biến thừa) cho biến độc lập: CITY
Trang 19Nhận xét:
Từ bảng kết quả trên cho thấy: giá trị P-value = 0.0000 < 0.05 (mức ý nghĩa α = 5%) nên ta bác bỏ giả thiết.
Biến CITY thực sự là một biến cần thiết cho mô hình.
Kiểm định Wald (biến thừa) cho biến độc lập: AGE
Trang 20Nhận xét:
Từ bảng kết quả trên cho thấy: giá trị P-value = 0.0270 < 0.05 (mức ý nghĩa α = 5%) nên ta bác bỏ giả thiết.
Biến AGE thực sự là một biến cần thiết cho mô hình.
Qua việc thực hiên kiểm định Wald cho 4 biến rồi lần lượt cho từng biến, ta nhận thấycả 4 biến SQFT, GARAGE, CITY, AGE đều cần thiết cho mô hình, không thừa và không gây ảnh hưởng không tốt cho mô hình.
c) Kiểm định White
Trang 21Từ bảng kết quả trên ta thấy:
Kiểm định BG
Trang 22Từ bảng ước lượng ta chọn View / Residual Tests/ Serial Correlation LM Test Và trong cửa sổ Lag Speciffication, ở mục Lags to includeta chọn p=1 (p là bậc tương quan hay còn gọi là độ trễ trong tương quan) Chọn OK ta có bảng kết quả sau đây.
Theo bảng kết quả trên (n-p)R2 = 1.844992 có xác suất (p-value) là 0.1744 lớn
hơn mức ý nghĩa α = 0.05, nên ta chấp nhận giả thiết Ho, tức là không có tự tương quan bậc nhất.
Dự báo giá trị trung bình và giá trị cá biệt của giá bán nhà theo mô hìnhSALEPRIC = C1 + C2*SQFT + C3*GARAGE +C4*CITY + C5*AGE
Trang 23B1: Ta ước lượng mô hình hồi quy
B2: Tạo thêm biến quan sát thứ (n+1) điền các giá trị của các biến độc lập
Trang 24B3: Ta lần lượt đặt tên biến dự báo cho biến phụ thuộc (SALEPRIC) là Salepricf, cho
biến sai số dự báo (sai số dự báo SE(Yo)) là Se_1dubao, và với SE (Yo^) là Se_2dubao,tiếp đến tính trị số tra bảng tα/2(n-k) được đặt tên là Tinv.
Cụ thể trên cửa sổ Equation có chứa phương trình hồi quy, chọn Forecast
Trang 25Để tính giá trị tα/2(n-k) với n-k=224-5=219, α/2= 2.5%.Ta vào dòng trắng dùng để thao tác lệnh trên Workfile chính, gõ Scalar Tinv=@qtdist(0.975,219)
B4: Thiết lập các cận trên (Upper) và cận dưới (Lower) cho các khoảng dự báo trung
Từ bảng giá trị các biến trên đây cho ta biết :
Giá trị của khoảng dự báo giá trị trung bình của giá bán nhà tại quận Cam California tương ứng với diện tích nhà SQFT = 7400 feet vuông, số chỗ đậu xe hơi GARAGE =
4, nhà ở Dove Canyon CITY =0, tuổi thọ AGE = 10 năm là: [ 1410.144; 1556.127 ]Và khoảng dự báo cá biệt tương ứng là: [ 1221.441; 1744.830 ]
B5: Vẽ đồ thị
Trang 26Đồ thị biểu diễn khoảng dự báo giá trị trung bình
Nhận xét:
Trang 27Đồ thị biểu diễn khá trực quan, ta có thể nhìn thấy các giá trị trung bình rất gần với giá trị thực của nó => dự báo rất đáng tin cầy.
Đồ thị giá trị trung bình này có khoảng cách giữa cận trên và cận dưới khá ngắn nên việc dự báo chính xác sẽ tốt hơn trong ngắn hạn nhưng sẽ gặp khó khăn trong dài hạn.
Dự báo giá trị cá biệt
Đồ thị biểu diễn khoảng dự báo giá trị cá biệt
Trang 28Nhận xét: Đồ thị giá trị cá biệt này có khoảng cách giữa cận trên và cận dưới xa hơn
so với trong dự báo trung bình nhưng việc dự báo sẽ tốt hơn trong dài hạn.
KẾT LUẬN CHUNG
Các kiểm định và dự báo cho ta thấy các biến SQFT, GARAGE, CITY, AGE là nhữngbiến thật sự cần thiết và có tác động, ảnh hưởng đến SALEPRIC (giá bán nhà tại quận Cam bang California).
Đây là một mô hình tương đối bền vững và hợp lý Ta có thể dựa vào kết quả khảo sát và dự báo để đưa vào dự án thực tế.