Sử dụng phương pháp OLS để ước lượng phương trình hồi quy tuyến tính của các biến độc lập đến biến phụ thuộc giá nhà...42.2.1.. Xuất phát từ thực tế khách quan,và nhu cầu cấp thiết đó, n
Trang 1BỘ GIÁO DỤC ĐÀO TẠOTRƯỜNG ĐẠI HỌC THĂNG LONG
Trang 2MỤC LỤC
PHẦN 1 GIỚI THIỆU CHUNG 1
1.1 Lý do nghiên cứu 1
1.2 Giới thiệu đề tài nghiên cứu 1
1.2.1 Đối tượng nghiên cứu 1
1.2.2 Ý nghĩa đề tài 2
1.3 Qui trình thực hiện, công cụ hỗ trợ 2
1.3.1.Qui trình thực hiện 2
1.3.2 Công cụ hỗ trợ 2
PHẦN 2 XÂY DỰNG MÔ HÌNH KINH TẾ LƯỢNG 3
2.1 Lập bảng thống kê mô tả 3
2.1.1 Lập bảng thống kê mô tả cho các biến GiaNha, DienTich, SoPhongNgu, SoPhongTam, SoTang, TuoiNha và nêu ý nghĩa các giá trị trong bảng 3
2.2 Sử dụng phương pháp OLS để ước lượng phương trình hồi quy tuyến tính của các biến độc lập đến biến phụ thuộc giá nhà 4
2.2.1 Viết mô hình hồi quy tổng thể 4
2.2.2 Viết phương trình hồi quy mẫu 5
2.2.3 Giải thích ý nghĩa các hệ số hồi quy trong phương trình mẫu 5
2.2.4 Các biến độc lập trong mô hình giải thích được bao nhiêu % sự thay đổi của biến phụ thuộc giá nhà 6
2.2.5 Kiểm định mức độ phù hợp của mô hình hồi quy 6
2.2.6 Kiểm định ý nghĩa thống kê cho từng biến độc lập trong mô hình 6
2.2.7 Khoảng tin cậy cho các hệ số hồi quy trong mô hình và nêu ý nghĩa 9
2.3 Các bài toán kiểm định 10
2.3.1 Các bài toán kiểm định từng hệ số hồi quy 10
2.3.2 Các bài toán kiểm định nhiều hệ số hồi quy cùng một lúc 11
2.4 Các bài toán dự báo 12
2.4.1 Bài toán điểm dự báo 12
2.4.2 Tìm khoảng thay đổi của biến phụ thuộc khi các biến độc lập thay đổi 12
2.5 Các bài toán về khuyết tật của mô hình hồi quy 13
Trang 32.5.1 Kiểm định hiện tượng thiếu biến trong mô hình 13
2.5.2 Xét hiện tượng đa cộng tuyến trong mô hình 14
2.5.3 Xét hiện tượng phương sai sai số thay đổi trong mô hình 15
2.6 Xây dựng mô hình hồi quy log-lin 16
2.6.1 Viết phương trình hồi quy mẫu cho mô hình (2) và nêu ý nghĩa các hệ số hồi quy trong mô hình mới 17
2.7 Lựa chọn mô hình phù hợp nhất để hồi quy các biến độc lập tác động đến biến phụ thuộc GiaNha 21
2.7.1 Sử dụng chỉ tiêu Adj R-squared để xem mô hình nào phù hợp nhất trong 2 mô hình (1), (2) 21
2.7.2 Sử dụng chỉ tiêu AIC để xem mô hình nào phù hợp nhất trong hai mô hình (1), (2) 22
PHẦN 3 KẾT LUẬN 23
3.1 Tóm tắt lại nội dung bài nghiên cứu 23
3.2 Kiến nghị 23
Trang 4PHẦN 1 GIỚI THIỆU CHUNG
1.1 Lý do nghiên cứu
Ở Việt Nam hiện nay thị trường bất động sản là một trong các thị trường có diễnbiến phức tạp, ảnh hưởng lớn đến sự phát triển của cả nền kinh tế Việc xác định giánhà đất đối với các nghiên cứu kinh tế lượng luôn là một trong những đề tài nghiêncứu được quan tâm nhất của các nhà kinh tế, nhà đầu tư Nắm rõ tình hình giá cả củanhà đất là một lợi thế đối với các nhà kinh doanh bất động sản cũng như những người
có nhu cầu mua nhà ở hay buôn bán có lời Chính vì thế việc nghiên cứu những yếu tốảnh hưởng tới giá nhà là vô cùng quan trọng trong thực tế Để nghiên cứu giá nhà tathường thu thập số liệu về những yếu tố ảnh hưởng đến ngôi nhà đó Xuất phát từ thực
tế khách quan,và nhu cầu cấp thiết đó, nhóm chúng em tiến hành xây dựng các môhình hồi quy để tìm ra sự phụ thuộc của giá nhà bởi các yếu tố liên quan
Do đó “Phân tích các yếu tố ảnh hưởng đến giá nhà ở Hà Nội” là đề tài mànhóm chúng em muốn tìm hiểu trong quá trình học tập môn phương pháp phân tíchđịnh lượng trong kinh tế Do khả năng có hạn nên nhóm không có đủ thời gian đi thuthập được hết số liệu về giá nhà và các yếu tố liên quan, vì vậy nhóm chỉ thu thập được
9 biến là giá nhà, diện tích, số lượng phòng tắm, phòng ngủ, số tầng, tuổi nhà, giấy tờliên quan đến nhà ở, vị trí giao thông và trật tự an ninh để thực hiện các ước lượng vàkiểm định đến giá nhà Trong quá trình làm bài chúng em đã tiến hành hồi quy cácbiến diện tích nhà, số lượng phòng ngủ, số lượng phòng tắm, số tầng, tuổi nhà để phântích, đánh giá sự ảnh hưởng của một số yếu tố đến giá nhà
1.2 Giới thiệu đề tài nghiên cứu
1.2.1 Đối tượng nghiên cứu
Đối tượng là một số căn nhà ở địa bàn Hà Nội và được tổng hợp
lại trong file “GiaNhaOHaNoi.xlsx”
1.2.2 Ý nghĩa đề tài
Với việc giả định các bài toán dựa trên số liệu trong file
“GiaNhaOHaNoi.xlsx” từ đó tìm ra các kết quả trong các bài toán
thống kê, ước lượng và kiểm định mà nhóm chúng em đã có thể
nhận biết được sự ảnh hưởng của các yếu tố đến giá trị của một ngôi
nhà Từ đó giúp nhóm chúng em đã tìm hiểu được một số yếu tố tác
động đến giá nhà và có thể đưa ra lời khuyên cho các nhà đầu tư dựa
theo những đánh giá của bài tập nhóm
Trang 51.3 Qui trình thực hiện, công cụ hỗ trợ
1.3.1 Qui trình thực hiện
Bước 1: Chọn đề tài
Bước 2: Xác định tham số
Bước 3: Xây dựng mô hình hồi quy
Bước 4: Phân tích, thống kê, ước lượng, kiểm định mô hình vàkhắc phục các lỗi trong mô hình
Trang 6PHẦN 2 XÂY DỰNG MÔ HÌNH KINH TẾ LƯỢNG
Sử dụng dữ liệu trong file “GiaNhaOHaNoi.xlsx” để đánh giá sự ảnhhưởng của các biến độc lập đến biến phục thuộc là giá nhà và có 880 quan sát về giá
và nhiều đặc điểm khác của các ngôi nhà dựa trên các biến cụ thể như sau:
Giá nhà (GiaNha: đơn vị tính là triệu đồng/m )2
Diện tích nhà (DienTich: đơn vị tính là m ) 2
Số lượng phòng ngủ (SoPhongNgu: đơn vị tính là phòng)
Số lượng phòng tắm (SoPhongTam: đơn vị tính là phòng)
Số tầng của căn nhà (SoTang: đơn vị tính là tầng)
Tuổi nhà (TuoiNha: đơn vị tính là năm)
Giấy tờ của nhà ở (GiayTo), với GiayTo = 1 là nhà có đầy đủ giấy tờ hợp pháp và hợp
lệ về quyền sử dụng đất, GiayTo = 0 là nhà chưa có đầy đủ giấy tờ hợp pháp và hợp lệ
Trang 7Giá nhà trung bình là 149.5483 triệu đồng/m , độ lệch chuẩn của giá nhà là 68.74778triệu đồng/ m , giá nhà nhỏ nhất là 34 triệu đồng/m và giá nhà lớn nhất là 446.5 triệu2 2
Tuổi nhà (số năm đã ở tính từ lúc xây dựng và hoàn thiện xong) trung bình của các cănnhà là 12.91136 năm, độ lệch chuẩn của tuổi nhà là 8.455403 năm, căn nhà có tuổi nhàthấp nhất là 2 năm và căn nhà có tuổi nhà lớn nhất là 40 năm
2.2 Ước lượng phương trình hồi quy tuyến tính của các biến độc lập đến biếnphụ thuộc giá nhà
2.2.1 Viết mô hình hồi quy mẫu:
= B1 + B2 * DienTich + B3 * SoPhongNgu + B4 * SoPhongTam + B5 * SoTang+ B6 * TuoiNha + B7 * GiayTo + B8 * ViTri + B9 * AnNinh + U
2.2.2 Viết phương trình hồi quy mẫu:
Sử dụng hàm: regress GiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNhaGiayTo ViTri AnNinh
Kết quả:
Trang 8Hàm hồi quy mẫu là:
= 14.19915 + 0.1136012 DienTich + 5.037552 SoPhongNgu + 28.32838 SoPhongTam + 17.00438 SoTang 0.6303424 TuoiNha + 8.888709 GiayTo 25.09583 ViTri + 5.769944 AnNinh
2.2.3 Giải thích ý nghĩa các hệ số hồi quy trong phương trình:
= 14.19915, với điều kiện các yếu tố khác không đổi, khi tất cả các biến độc lập trong
mô hình đều = 0 thì giá nhà trung bình giảm 14.19915 triệu đồng/m 2
= 0.1136012, với điều kiện các yếu tố khác không đổi, khi diện tích nhà tăng 1 m2 thìgiá nhà trung bình tăng 0.113601 triệu đồng/m 2
= 5.03755, với điều kiện các yếu tố khác không đổi, khi số phòng ngủ trong một ngôinhà tăng lên 1 phòng thì giá nhà trung bình tăng 5.03755 triệu đồng/m 2
= 28.32838, với điều kiện các yếu tố khác không đổi, khi số phòng tắm trong mộtngôi nhà tăng lên 1 phòng thì giá nhà trung bình tăng 28.32838 triệu đồng/m 2
= 17.00438, với điều kiện các yếu tố khác không đổi, khi số tầng trong một ngôi nhàtăng lên 1 tầng thì giá nhà trung bình tăng 17.00438 triệu đồng/m 2
= 0.6303424, với điều kiện các yếu tố khác không đổi, khi tuổi nhà tăng lên 1 nămthì giá nhà trung bình giảm 0.6303424 triệu đồng/m 2
= 8.888709, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của cáccăn nhà có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng đất sẽ nhiều hơn giánhà trung bình của các căn nhà chưa có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sửdụng đất là 8.888709 triệu đồng/m 2
Trang 9= 25.09583, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của cáccăn nhà có vị trí giao thông đi lại không thuận tiện (hay tắc đường) thấp hơn giá nhàtrung bình của các căn nhà có vị trí giao thông đi lại thuận tiện (ít tắc đường) là25.09583 triệu đồng/m 2
= 5.769944, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của cáccăn nhà có trật tự an toàn, không xảy ra mất trộm nhiều hơn giá nhà trung bình của cáccăn nhà có trật tự không an toàn, có thể xảy ra mất trộm là 5.769944 triệu đồng/m 2
2.2.4 Các biến độc lập trong mô hình giải thích được bao nhiêu % sự thay đổi củabiến phụ thuộc giá nhà
Ta có: Adj R-squared = 0.9176
Ý nghĩa: R bình phương hiệu thể hiện các biến độc lập trong mô hình đang giải thíchđược khoảng 91.76% sự biến thiên của biến phụ thuộc GiaNha trong mô hình 2.2.5 Kiểm định sự phù hợp của mô hình
Mô hình hồi quy trên có phù hợp tại mức ý nghĩa α = 5%?
Source SS df MS Number of obs = 880
reg GiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh
Ta thấy: Các biến DienTich, SoPhongNgu, SoPhongTam, SoTang, TuoiNha, GiayTo,ViTri đều có p-value < α = 5% trừ biến AnNinh > α => Các biến không đồng thời =0Kết luận: Chấp nhận H1, bác bỏ H0 và mô hình phù hợp tại mức ý nghĩa 5%
Trang 102.2.6 Khoảng tin cậy cho các hệ số hồi quy trong mô hình và nêu ý nghĩa
Ước lượng khoảng tin cậy 95% cho các hệ số hồi quy trong mô hình và nêu ýnghĩa?
Ý nghĩa:
Khoảng tin cậy 95% cho 1 là [-29.64082, 1.242533], với điều kiện các yếu tố kháckhông đổi, khi tất cả các biến độc lập trong mô hình đều = 0 thì giá nhà trung bìnhthuộc khoảng [-29.64082, 1.242533] triệu đồng/m 2
Khoảng tin cậy 95% cho 2 là [0.0905574, 0.1366449] , với điều kiện các yếu tố kháckhông đổi, khi diện tích nhà tăng 1 m thì giá nhà trung bình tăng ít nhất là 0.09055742
triệu đồng/m và tăng nhiều nhất là 0.1366449 triệu đồng/m2 2
Khoảng tin cậy 95% cho 3 là [2.680996, 7.394107], với điều kiện các yếu tố kháckhông đổi, khi số phòng ngủ trong một ngôi nhà tăng lên 1 phòng thì giá nhà trungbình tăng ít nhất là 2.680996 triệu đồng/m và tăng nhiều nhất là 7.394107 triệu2
đồng/m2
Khoảng tin cậy 95% cho 4 là [24.39889, 32.25786], với điều kiện các yếu tố kháckhông đổi, khi số phòng tắm trong một ngôi nhà tăng lên 1 phòng thì giá nhà trungbình tăng ít nhất là 24.39889 triệu đồng/m và tăng nhiều nhất là 32.25786 triệu2
đồng/m2
Khoảng tin cậy 95% cho 5 là [12.98291, 21.02585], với điều kiện các yếu tố kháckhông đổi, khi số tầng trong một ngôi nhà tăng lên 1 tầng thì giá nhà trung bình tăng ítnhất 12.98291 triệu đồng/m và tăng nhiều nhất là 21.02585 triệu đồng/m2 2
Khoảng tin cậy 95% cho 6 là [-1.097405, -0.1632796], với điều kiện các yếu tố kháckhông đổi, khi tuổi nhà tăng lên 1 năm thì giá nhà trung bình giảm nhiều nhất là1.097405 triệu đồng/m và giảm ít nhất là 0.1632796 triệu đồng/m2 2
Trang 11Khoảng tin cậy 95% cho 7 là [2.422651, 15.35477] với điều kiện các yếu tố kháckhông đổi thì giá nhà trung bình của các căn nhà có đầy đủ giấy tờ hợp pháp và hợp lệ
về quyền sử dụng đất sẽ nhiều hơn giá nhà trung bình của các căn nhà chưa có đầy đủgiấy tờ hợp pháp và hợp lệ về quyền sử dụng đất ít nhất là 2.422651 triệu đồng/m và2
nhiều nhất là 15.35477 triệu đồng/m2
Khoảng tin cậy 95% cho 8 là [-31.27169, -18.91996], với điều kiện các yếu tố kháckhông đổi thì giá nhà trung bình của các căn nhà có vị trí giao thông đi lại không thuậntiện (hay tắc đường) thấp hơn giá nhà trung bình của các căn nhà có vị trí giao thông đilại thuận tiện (ít tắc đường) ít nhất là 18.91996 triệu đồng/m và nhiều nhất là2
31.27169 triệu đồng/m2
Khoảng tin cậy 95% cho 9 là [-0.37986, 11.91975], với điều kiện các yếu tố kháckhông đổi thì giá nhà trung bình của các căn nhà có trật tự an toàn, không xảy ra mấttrộm sẽ có một khoảng chênh lệch so với giá nhà trung bình của các căn nhà có trật tựkhông an toàn, có thể xảy ra mất trộm là [-0.37986, 11.91975] triệu đồng/m 2
2.3 Các bài toán kiểm định
2.3.1 Các bài toán kiểm định hệ số hồi quy
Bài toán 1: Kiểm định ý kiến với điều kiện các yếu tố khác không đổi, khi tuổi nhàtăng 1 năm thì các căn nhà giảm 0.7 triệu đồng/m Tại α = 5%?2
Giả thuyết:
H0: 6 = -0.7
H1: 6 ≠ -0.7
Các bước thực hiện:
scalar tstat=(_b[ TuoiNha ]+0.7)/_se[ TuoiNha ]
di “t-statistic for H0: beta6=-0.7 is ”tstat
di “t tới hạn = ” invttail(e(df_r),0.025)
di “-t tới hạn = ”invttail(e(df_r),0.975)
Kết quả:
Trang 12Kết luận: Tại α = 5%, đủ bằng chứng thống kê để cho rằng khi tuổi nhà tăng 1 năm thìcác căn nhà giảm 0.7 triệu đồng/m2
Bài toán 2 : Kiểm định tại α = 5%, khi diện tích nhà tăng lên 100 m và đồng thời tăng2
số tầng trong ngôi nhà đó lên 1 tầng thì giá trị ngôi nhà tăng lên nhiều hơn 20 triệuđồng/m 2
100 m và đồng thời tăng số tầng trong ngôi nhà đó lên 1 tầng thì giá trị ngôi nhà tăng2
lên nhiều hơn 20 triệu đồng/m2
2.4 Bài toán dự báo
Dự báo giá trị của một căn nhà khi nó có diện tích là 80m , có 6 phòng ngủ, 3 phòng tắm,2
4 tầng, đã được đưa vào sử dụng 10 năm kể từ khi xây dựng xong (tuổi nhà = 10 năm),
có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng đất, vị trí giao thông đi lạikhông thuận tiện (hay tắc đường) và trật tự, an toàn, không xảy ra mất trộm
Các bước thực hiện:
scalar dubaoGiaNha=_b[_cons] + _b[DienTich] * 80 +_b[SoPhongNgu] * 6+_b[SoPhongTam] * 3 + _b[SoTang] * 4 +_b[Tuoi Nha] * 10 +_b[GiayTo] * 1+_b[ViTri] * 1 +_b[AnNinh] * 1
scalar list dubaoGiaNha
Kết quả:
Trang 13Kết luận: khi một căn nhà có diện tích là 80m , có 6 phòng ngủ, 3 phòng tắm, 4 tầng,
đã được đưa vào sử dụng 10 năm kể từ khi xây dựng xong (tuổi nhà = 10 năm), có đầy
đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng đất, vị trí giao thông đi lại khôngthuận tiện (hay tắc đường) và trật tự, an toàn, không xảy ra mất trộm thì giá trị của cănnhà đó là 161.37631 triệu đồng/m2
2.5 Các bài toán về khuyết tật của mô hình hồi quy
2.5.1 Kiểm định hiện tượng thiếu biến trong mô hình
Kiểm định mô hình trên có hiện tượng thiếu biến không tại tại α = 5%?H0: mô hình trên có hiện tượng thiếu biến
H1: mô hình trên không có hiện tượng thiếu biến
P-value= (Prob > F) = 0.0000 < α = 0.05 => Chấp nhận H0, bác bỏ H1.Kết luận: tại α = 5% thì mô hình có hiện tượng thiếu biến Do thời gian còn hạnchế nên trong quá trình thu thập số liệu nhóm đã bỏ sót nhiều yếu tố quan trọng kháctác động đến giá nhà ví dụ như hướng nhà, địa hình, vật liệu xây dựng…) Để khắcphục hiện tượng thiếu biến ở mô hình trên thì cần thu thập them các số liệu liên quanđến nhà ở
2.5.2 Kiểm định hiện tượng thừa biến
Kiểm định mô hình trên có hiện tượng thiếu biến không tại tại α = 5%?Các bước thực hiện:
Hồi quy: regress GiaNha DienTich SoPhongNgu SoPhongTam SoTangTuoiNha GiayTo ViTri AnNinh
Trang 14Nhận thấy các biến TuoiNha GiayTo AnNinh có p-value > α
Trang 15Ta thấy độ lệch chuẩn của các biến giảm đi sau khi bỏ biến AnNinh so với độ lệchchuẩn ban đầu
2.5.3 Xét hiện tượng đa cộng tuyến trong mô hình
Sau khi hồi quy, sử sụng lệnh: vif
reg GiaNha DienTich SoTang TuoiNha GiayTo ViTri AnNinh
Trang 16Source SS df MS Number of obs = 880
reg GiaNha DienTich SoTang TuoiNha GiayTo ViTri AnNinh
Tuy nhiên khi bỏ đi 2 biến SoPhongNgu và SoPhongTam để khắc phục hiệntượng đa cộng tuyến trong mô hình sẽ làm cho 2 biến khác là GiayTo và Anh Ninhkhông có ý nghĩa thống kê trong mô hình (hai biến GiayTo và Anh Ninh này sẽ bị thừa
ra vì có p giá trị = (P > |t|) > α = 0.05) tức là nếu khắc phục được đa cộng tuyến trong
mô hình cũ thì sẽ xảy ra hiện tượng thừa biến trong mô hình mới
2.5.4 Xét hiện tượng phương sai sai số thay đổi trong mô hình
H0: mô hình không có hiện tượng phương sai sai số thay đổi
H1: mô hình có hiện tượng phương sai sai số thay đổi
Kiểm định theo Breusch – Pagan, sử dụng câu lệnh: estat hettest
Kết quả:
Prob > chi2 = 0.0000
chi2(1) = 1079.98
Variables: fitted values of GiaNha
Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
hettest