h) Mô tả biến KC
Khoảng cách xa nhất từ BĐS đến Chợ Bến Thành là 8.9 km và gần nhất là 4,8 km. Khoảng cách trung bình là 7,74 km và biến KC có phân phối chuẩn do các BĐS được khảo sát chỉ tập trung ở địa bàn Quận 11.
4.2.2 Ma trận hệ số tương quan
Một cách trực quan, tác giả sẽ xem xét mối quan hệ giữa biến LnPrice với các biến độc lập, qua các biểu đồ cho thấy rằng có mối quan hệ tuyến tính giữa biến phụ thuộc với các biến độc lập (xem biểu đồ 4.2.2)
Biểu đồ 4.2.2 Biểu đồ ma trận hệ số tương quan giữa các biến
Cụ thể hơn, chúng ta tiến hành phân tích hệ số tương quan giữa biến LnPrice và với các biến độc lập.
Trong bảng kết quả ma trận hệ số tương quan các biến độc lập đều có tương quan với biến phụ thuộc nên ta có thể đưa chúng vào mơ hình hồi quy tuyến tính (xem phụ lục 4.2.2) và có thể kết luận rằng giữa biến LnPrice và các biến độc lập có tương quan tuyến tính với nhau. Giữa biến DAT với biến NHA, giữa biến VT với biến LG có mối quan hệ tuyến tính có ý nghĩa (tuy nhiên tương quan khơng lớn <0.8), do đó cần chú ý khi phân tích hồi quy có thể xảy ra hiện tượng đa cộng tuyến.
4.3 Phân tích kết quả hồi quy 4.3.1 Kết quả hồi quy 4.3.1 Kết quả hồi quy
Từ kết quả hồi quy (xem phụ lục 4.3.1) cho thấy trong 6 biến giải thích của mơ hình thì có 5 biến có ý nghĩa với hệ số Sig. của các biến này đều nhỏ hơn 0.05. Điều này cho thấy giá nhà ở trên địa bàn quận 11, TP. Hồ Chí Minh chịu ảnh hưởng bởi các nhân tố cụ thể như sau: vị trí BĐS; diện tích đất; diện tích nhà; chiều ngang mặt đường, hẻm phía trước BĐS; khoảng cách từ BĐS đến trung tâm thành phố (Chợ Bến Thành). Riêng biến ST khơng có ý nghĩa do hệ số Sig. = 0.123 lớn hơn 0.05, chứng tỏ yếu tố số tầng của BĐS khơng có ảnh hưởng đến giá nhà ở trên địa bàn quận 11, TP. Hồ Chí Minh.
Hệ số VIF của các biến đều nhỏ hơn 10, do đó có thể nói rằng khơng có dấu hiệu của hiện tượng đa cộng tuyến.
4.3.2 Kiểm định hệ số Durbin-Watson
Bảng 4.3.2 Bảng kiểm định hệ số Durbin – Watson
Model Summaryb
Model R R Square Adjusted R Square
Std. Error of the
Estimate Durbin-Watson
1 .935a .874 .869 .24777 1.778
a. Predictors: (Constant), KC, DAT, ST, LG, NHA, VT b. Dependent Variable: LnPrice
Hệ số Durbin-Watson = 1.778 nằm trong khoảng từ 1.4 - 2.5. Theo quy tắc kinh nghiệm, điều này cho thấy rằng khơng có hiện tượng tương quan xảy ra.
4.3.3 Kiểm định giả định khơng có quan sát dị biệt
Để kiểm tra trong mơ hình quan sát có quan sát dị biệt hay khơng, tác giả sử dụng phân tích phần dư thơng qua khoảng cách Mahalanobis và khoảng cách Cook, mẫu quan sát có tính dị biệt khi giá trị Cook tối đa lớn hơn 1, và giá trị Mahalanobis lớn hơn chi bình phương với bậc tự do 6, mức ý nghĩa 5% (độ tin cậy 95%) = 12.59, ngoài ra hệ số LV phải lớn hơn 6 (là số biến độc lập)*2/147 = 0.08, Tuy nhiên, đối với những mẫu nhỏ thì cần lưu ý khi sử dụng hệ số này. Do đó, tác giả sẽ loại những quan sát có Mahal > 12.59 và Cook > 1 ra khỏi mơ hình hồi quy.
Dựa vào bảng kết quả kiểm định giả định khơng có quan sát dị biệt (xem phụ lục 4.3.3) cho thấy mơ hình khảo sát có các quan sát dị biệt, do đó tác giả thực hiện loại bỏ các quan sát có tính dị biệt ra khỏi mơ hình và thống kê lại số lượng các quan sát, kết quả là từ 147 quan sát ban đầu loại đi 14 quan sát có tính dị biệt cịn lại 133 quan sát, các quan sát được thống kê mô tả ở phụ lục 4.3.4.
Theo sơ đồ quy trình phân tích, tác giả thực hiện kiểm định sự tương quan giữa các biến độc lập và biến phụ thuộc, từ Bảng kết quả kiểm định sự tương quan giữa các biến độc lập và biến phụ thuộc của 133 quan sát (phụ lục 4.3.5) cho thấy trong ma trận hệ số tương quan các biến độc lập đều có tương quan với biến phụ thuộc nên có thể đưa các biến này vào mơ hình hồi quy tuyến tính và chúng ta kết luận rằng giữa biến LnPrice và các biến độc lập có tương quan tuyến tính với nhau.
Bước tiếp theo tác giả tiếp tục thực hiện hồi quy mơ hình sau khi loại bỏ các quan sát có tính dị biệt để tiếp tục phân tích. Qua bảng kết quả hồi quy 6 biến sau khi loại bỏ các biến dị biệt (phụ lục 4.3.6) cho thấy biến ST có hệ số Sig. = 0.541 > 0.05, do đó biến ST cũng khơng có ý nghĩa trong mơ hình sau khi đã loại bỏ 14 biến có tính dị biệt. Điều này có thể là do nhu cầu về mua nhà ở có số tầng lớn hơn 3 thấp vì khi chủ sở hữu có nhu cầu xây dựng lại hoặc cần sửa chữa sẽ gặp một số khó khăn nhất định. Bên cạnh đó, do đặc thù riêng về công dụng của nhà, số tầng xây dựng của những căn nhà phố dùng để ở thường chỉ có từ 1-3 tầng, cịn nhà có nhiều tầng trở lên thì thường tập trung sử dụng vào mục đích kinh doanh như là văn phòng cho thuê, cho thuê nhà trọ, khách sạn, trung tâm mua sắm, và các mục đích khác. Từ đó, có thể kết luận trong bài nghiên này, số tầng của BĐS khơng có tác động đến giá BĐS trên địa bàn quận 11, TP. Hồ Chí Minh.
Bên cạnh đó, biến NHA có Sig. = 0.091 > 0.05, do đó biến NHA cũng khơng có ý nghĩa. Tuy nhiên, về mặt lý thuyết và tham khảo các mơ hình nghiên cứu trước, cho thấy rằng việc bỏ yếu tố diện tích nhà ra khỏi mơ hình là khơng phù hợp. Qua phân tích mơ tả ban đầu, cho thấy rằng biến NHA khơng có phân phối chuẩn, vì vậy tác giả thực hiện chuẩn hóa biến NHA bằng cách lấy logarit của biến biến NHA
(LnNha) để thu hẹp khoảng biến thiên và tiến hành hồi quy với các biến cịn lại trong mơ hình trên.
Mơ tả kết quả sau khi biến đổi biến NHA thành biến LnNha như sau:
Bảng 4.3.3 Bảng mô tả biến LnNha
Statistics LnNha N Valid 133 Missing 0 Mean 4.5077 Median 4.5951 Mode 5.09 Skewness -.157 Std. Error of Skewness .210 Kurtosis -.530 Std. Error of Kurtosis .417 Sum 599.53
Biểu đồ 4.3.3 Biểu đồ mô tả biến LnNha
Sau đó tác giả thực hiện kiểm tra sự tương quan, từ bảng kết quả ma trận hệ số tương quan giữa các biến VT, DAT, LG, KC, LnNha và biến phụ thuộc LnPrice (xem phụ lục 4.3.7) cho rằng có sự tự tương quan giữa biến phụ thuộc và các biến độc lập.
Tiếp theo, tác giả thực hiện chạy mơ hình hồi quy với biến phụ thuộc Ln(Price) và 5 biến độc lập: DAT, VT, KC, LC, LnNha. Thông qua bảng kết quả hồi quy (xem phụ lục 4.3.8), cho thấy hệ số R2 điều chỉnh của mô hình đạt 0.859 chứng tỏ 5 biến trong mơ hình có thể giải thích được 85,9% biến thiên của giá nhà ở trên địa bàn quận 11, TP. Hồ Chí Minh.
Thực hiện kiểm định ANOVA (xem phụ lục 4.3.8), kết quả giá trị F của mơ hình đạt 161,612 với Sig. = 0.000, chứng tỏ giả thuyết H0bị bác bỏ và tồn tại mối quan hệ tuyến tính giữa biến LnPrice với ít nhất một trong các biến VT, DAT, LnNha,
Từ bảng kết quả hồi quy với biến phụ thuộc Ln(Price) và 5 biến độc lập: DAT, VT, KC, LC, LnNha (xem phụ lục 4.3.8) cho thấy cả 5 biến độc lập đều có ý nghĩa do hệ số Sig. đều nhỏ hơn 0.05 và hệ số Beta (β) của các biến này đều có dấu đúng với kỳ vọng dấu ban đầu. Do đó, đề tài sẽ tập trung phân tích và tiếp tục kiểm định các giả định trong mơ hình hồi quy sau:
LnPRICE = 21,552 + 0,212*VT + 0,012*DAT + 0,081*LnNha + 0.025*LG - 0.122*KC (2)
Từ bảng kết quả hồi quy (phụ lục 4.3.8), hệ số β chuẩn hóa (Standardized Coefficients Beta) cho thấy được tầm quan trọng của từng biến trong mơ hình hồi quy hay mức độ tác động của từng biến độc lập đến biến phụ thuộc LnPrice. Hệ số Beta chuẩn hóa của biến DAT đạt giá trị cao nhất (0.475) nên diện tích đất của BĐS là yếu tố tác động mạnh nhất đến giá nhà ở trên địa bàn quận 11, TP. HCM. Tiếp theo là biến LG đạt giá trị 0.394, tức là Chiều ngang mặt đường, hẻm phía trước là yếu tố tác mạnh cũng khơng kém yếu tố diện tích đất. Biến VT đạt giá trị 0.17 cho thấy vị trí của BĐS cũng tác động đến giá nhà ở. Biến tiếp theo là biến KC đạt 0.114, chứng tỏ Khoảng cách từ BĐS đến Chợ Bến Thành tác động đến giá nhà ở và cuối cùng là biến LnNha, yếu tố Diện tích nhà (0.086).
4.4 Kiểm định các giả định trong mơ hình hồi quy
Sau khi kiểm tra các biến độc lập và biến phụ thuộc về sự tương quan, loại bỏ các quan sát có tính dị biệt, loại bỏ các biến khơng có ý nghĩa trong mơ hình. Tác giả chọn mơ hình phù hợp là mơ hình hồi quy (2) là để phân tích và tiến hành kiểm định các giả định trong mơ hình hồi quy.
LnPRICE = 21,552 + 0,212*VT + 0,012*DAT + 0,081*LnNha + 0.025*LG - 0.122*KC (2)
4.4.1 Giả định về phân phối chuẩn của phần dư
Phần dư có thể khơng tn theo phân phối chuẩn, để kiểm định giả định này, tác giả sử dụng Biểu đồ tần số Histogram để khảo sát phân phối của phần dư. Về mặt số học có thể nói rằng phân phối của phần dư xấp xỉ chuẩn (trung bình Mean=0 và độ
lệch chuẩn Std.Dev=0.981) và Biểu đồ 4.4.1 cho thấy phần dư có phân phối chuẩn. Do đó, có thể kết luận rằng giả thiết phần dư có phân phối chuẩn khơng bị vi phạm.
Biểu đồ 4.4.1 Biểu đồ kiểm định phân phối chuẩn của phần dư
4.4.2 Giả định về tính độc lập của sai số (kiểm định khơng có tương quan giữa các phần dư) các phần dư)
Giả định về tính độc lập của sai số, tức là giữa các phần dư khơng có mối quan hệ tương quan. Một lý do dẫn đến hiện tượng này là các biến có ảnh hưởng khơng được đưa hết vào mơ hình là do giới hạn về mục tiêu nghiên cứu của đề tài, hoặc chọn dạng mơ hình sai, sai số trong đo lường các biến. Khi mơ hình có hiện tượng này, sẽ dẫn đến vấn đề tương quan chuỗi trong sai số và tương quan chuỗi gây ra những tác động sai lệch nghiêm trọng đến mơ hình hồi quy tuyến tính như hiện tượng phương sai thay đổi. Đại lượng thống kế Durbin-Watson dùng để kiểm định tương quan của các sai số kề nhau. Hệ số Durbin-Watson thường nằm ở trong khoảng 1.4 – 2.5 là phù hợp.
Bảng 4.4.2 Bảng kết quả kiểm định tính độc lập của sai số
Model Summaryb Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .930a .864 .859 .23409 1.455
a. Predictors: (Constant), LnNha, KC, LG, DAT, VT b. Dependent Variable: LnPrice
4.4.3 Giả định khơng có tương quan giữa các biến độc lập (kiểm định đa cộng tuyến) cộng tuyến)
Cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau. Vấn đề của hiện tượng đa cộng tuyến là chúng cung cấp cho mơ hình những thơng tin rất giống nhau, khó tách rời ảnh hưởng của từng biến độc lập đến biến phụ thuộc, làm tăng độ lệch chuẩn của các hệ số hồi quy. Trong kiểm định này, yêu cầu các hệ số VIF của các biến độc lập phải nhỏ hơn 10 thì mơ hình kiểm định khơng có hiện tượng đa cộng tuyến xảy ra.
Qua bảng kiểm định ở phụ lục 4.3.8, Hệ số VIF của các biến đều nhỏ hơn 10, do đó có thể kết luận rằng khơng có dấu hiệu của hiện tượng đa cộng tuyến.
4.4.4 Giả định liên hệ tuyến tính
Tiến hành vẽ đồ thị phân tán giữa các phần dư và giá trị dự đốn xem mơ hình có liên hệ tuyến tính. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì sẽ khơng nhận thấy có liên hệ giữa các giá trị dự đoán và phần dư. Nếu giả định liên hệ tuyến tính được thỏa mãn thì phần dư phải phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0.
4.4.5 Giả định phương sai của sai số không đổi
Hiện tượng phương sai thay đổi gây ra khá nhiều hậu quả đối với mơ hình ước lượng bằng phương pháp OLS. Nó làm cho ước lượng của các hệ số hồi quy không chệch nhưng không hiệu quả.
Do phần mềm SPSS không hỗ trợ kiểm định Goldfeld-Quandt, ta có thể sử dụng biểu đồ P-P plot để khảo sát phương sai đồng nhất và phân phối chuẩn của phần dư. Biểu đồ P-P plot thể hiện những giá trị của các điểm phân vị của phân phối chuẩn. Những giá trị kỳ vọng này tạo thành một đường chéo, các điểm quan sát thực tế sẽ tập trung sát đường chéo nếu dữ liệu có phân phối chuẩn và phương sai phần dư là đồng nhất.
Dựa vào biểu đồ P-P plot cho thấy giả định phương sai của sai số không đổi không bị vi phạm.
4.5 Kiểm định tìm nhân tố quan trọng nhất
Theo hệ số Beta chuẩn hóa thì biến DAT và biến LG là 2 biến có ảnh hưởng nhiều nhất đến biến phụ thuộc LnPrice.
Để tìm biến có ảnh hưởng nhất đến biến phụ thuộc LnPrice trong mơ hình hồi quy, tác giả xét đến sự tương quan của biến DAT và biến LG với biến LnPrice để xác định tầm quan trọng của biến DAT và biến LG khi được sử dụng riêng biệt để dự đoán giá nhà ở. Khi nhìn vào hệ số tương quan, kết quả cho thấy biến DAT (r = 0.778) tác động đến biến LnPice nhiều hơn là biến LG (r = 0.754), tức là diện tích đất có ảnh hưởng tới giá nhà ở hơn là chiều ngang mặt đường, hẻm phía trước của BĐS. Do đó, có thể kết luận rằng biến DAT quan trọng hơn biến LG khi dự đoán giá nhà ở trên địa bàn quận 11, TP HCM.
Ngoài ra, ta cũng cần xem xét đến ảnh hưởng của các biến DAT và LG đến biến LnPrice trong mối quan hệ phụ thuộc với các biến khác trong mơ hình thơng qua tương quan từng phần và tương quan riêng.
Bảng 4.5 Bảng kết quả kiểm định tìm nhân tố quan trọng nhất
Model
Correlations
Zero-order Partial Part
1 (Constant) VT .755 .254 .097 DAT .778 .683 .344 LG .754 .536 .234 KC -.211 -.287 -.111 LnNha .523 .177 .066
Nhìn vào hệ số tương quan từng phần và tương quan riêng, kết quả cho thấy biến DAT quan trọng hơn biến LG và biến DAT là biến quan trọng nhất trong mơ hình định giá này.
4.6 Phân tích ý nghĩa của hệ số hồi quy
Sau khi thực hiện loại bỏ biến ST, thay đổi biến NHA thành LnNha để giảm sự biến thiên và thực hiện các kiểm định, đề tài xác định được mơ hình hồi quy như sau:
Ý nghĩa của các hệ số hồi quy như sau:
Vị trí BĐS với điều kiện các các yếu tố khác khơng đổi, nếu BĐS có vị trí mặt tiền
đường thì giá BĐS đó sẽ cao hơn BĐS có vị trí trong hẻm là 21,2%. Vì BĐS ở vị trí mặt tiền đường thì thuận lợi về nhiều mặt như giao thông, tự kinh doanh hoặc cho thuê mặt bằng và các yếu tố khác. Với cùng diện tích và kiến trúc như nhau, nhưng BĐS có vị trí ở mặt tiền đường thì giá sẽ cao hơn.
Diện tích đất với điều kiện các các yếu tố khác không đổi, giá BĐS sẽ tăng 1,2%
nếu diện diện tích đất tăng thêm 1m2. Theo kết quả hồi quy và phân tích trên thì diện tích đất là yếu tố quan trọng nhất đối với giá BĐS. Tại trung tâm thành phố, nhu cầu về đất có diện tích lớn sẽ nhiều hơn, cơ hội cho các giao dịch sẽ thuận lợi hơn.