2.Đối tượng, phạm vi khảo sát: Đối tượng được thực hiện khảo sát là người dân đang sống và làm việc tại 19 quận và 5 huyện thuộc thành phố Hồ Chí Minh.. Sau khi các nhóm hoàn thành phần
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG CƠ SỞ II – TPHCM.
NGÀNH TÀI CHÍNH NGÂN HÀNG - CHUYÊN NGÀNH TÀI CHÍNH QUỐC TẾ
KINH TẾ LƯỢNG
ĐỀ TÀI:
CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN THU NHẬP CỦA NGƯỜI DÂN
TP.HCM, Ngày 05/12/2011
Trang 2MỤC LỤC
CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN THU NHẬP CỦA
NGƯỜI DÂN TP.HỒ CHÍ MINH.
I.GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU:
1.Giới thiệu:
Thu nhập của người dân ở mọi nơi đều là vấn đề thu hút sự quan tâm của đông đảonhững người nghiên cứu, cho dù đó là quốc gia giàu mạnh hay nghèo đói cho đến nhữngđịa phương nhỏ bé Bởi vì, nó chính là chỉ tiêu quan trọng có ý nghĩa kinh tế để đánh giámức sống, sự phát triển của mỗi khu vực địa lý cũng như khía cạnh nào đó là nguyênnhân của nhiều vấn đề xã hội khác
Thành phố Hồ Chí Minh – hòn ngọc Viễn Đông giữ vai trò đầu tàu kinh tế của cảViệt Nam, do đó vấn đề thu nhập của người dân tại thành phố Hồ Chí Minh có ý nghĩa rấtquan trọng và cần thiết Nó ảnh hưởng đến bộ mặt của toàn bộ nền kinh tế cả nước Đó là
lý do tại sao nhóm 3 chọn đề tài nghiên cứu “ Các yếu tố ảnh hưởng đến thu nhập củangười dân thành phố Hồ Chí Minh”
2.Đối tượng, phạm vi khảo sát:
Đối tượng được thực hiện khảo sát là người dân đang sống và làm việc tại 19 quận và
5 huyện thuộc thành phố Hồ Chí Minh Tuy nhiên, do tính chất phức tạp và phạm vi quárộng lớn, nhóm 3 (gồm 5 bạn lớp K49B và 5 bạn lớp K49C) không thể khảo sát trên toàn
bộ địa bàn thành phố Hồ Chí Minh Đây là lúc phát huy tinh thần đoàn kết và tương thântương trợ giữa các nhóm Mỗi nhóm đã khảo sát 1 quận hoặc 1 huyện thuộc thành phố
Hồ Chí Minh Dưới sự hướng dẫn của cô Tuấn Anh, nhóm 3 đã tiến hành khảo sát về thunhập của người dân tại huyện Cần Giờ Sau khi các nhóm hoàn thành phần khảo sát củanhóm mình, cô Tuấn Anh đã tổng hợp và chọn lọc để có được một bảng số liệu tổng hợp
về thu nhập của người dân thành phố Hồ Chí Minh tương đối hoàn hảo và chính xác
Do giới hạn về mặt thời gian và những khó khăn về phương tiện đi lại và di chuyển, nhóm 3 không thể khảo sát tường tận đến từng hang cùng ngõ hẹp của huyện Cần Giờ mànhóm đã tập trung lực lượng để tiến hành khảo sát những khu dân cư điển hình của huyện
Trang 3Cần Giờ Mặc dù gặp không ít khó khăn nhưng nhóm đã có tinh thần và thái độ làm việc hết sức nghiêm túc trong quá trình khảo sát.
3.Ý nghĩa đề tài:
Là những sinh viên đang sống và học tập tại thành phố Hồ Chí Minh, vấn đề thu nhậpcủa người dân thành phố không những là mối quan tâm của nhiều người mà còn là mối
Trang 4Từ bài nghiên cứu, nhóm chúng tôi cũng đưa ra một số hướng khắc phục và một sốgiải pháp mà nhóm chúng tôi cho là có thể góp phần nâng cao thu nhập của người dânthành phố Hồ Chí Minh để có thể rút ngắn khoảng cách giàu nghèo và tạo điều kiện chomọi người dân đều có một cuộc sống đầy đủ, ấm no và hạnh phúc.
4.Quy trình thực hiện, công cụ hỗ trợ:
•Các bước thực hiện
•Công cụ hỗ trợ:
Để tiến hành xây dựng mô hình, nhóm đã đi điều tra bằng phiếu khảo sát Sau quátrình khảo sát của nhóm và các nhóm bạn đã thu được 727 mẫu quan sát hợp lệ
Trang 5 Phiếu hợp lệ là phiếu điền đầy đủ thông tin và trả lời đầy đủ tất cả câu hỏi trong phiếu khảo sát.
Phiếu không hợp lệ là phiếu bỏ trống, điền thiếu thông tin hay thêm thông tin không cần thiết và không liên quan vào, không trả lời hết các câu hỏi.
Căn cứ vào số liệu thu thập từ các phiếu hợp lệ,nhóm đã tiến hành hồi quy, kiểm định (đa cộngtuyến, tự tương quan, phương sai thay đổi) vàkhắc phục
Để hoàn thành bài nghiên cứu, nhóm đã sửdụng các kiến thức được học trên lớp và các phầnmềm hỗ trợ như: chủ yếu là phần mềm eview 5.0,các phần mềm của Microsoft như: word,excel, paint,…
Để thực hiện mô hình “Các yếu tố ảnh hưởngtới thu nhập của người dân thành phố Hồ ChíMinh”, nhóm 3 tiến hành khảo sát các yếu tố sau:
Trang 6• Số tuổi:bao nhiêu tuổi
• Sử dụng ngoại ngữ: thành thạo hay không thành thạo
• Bằng cấp: thạc sỹ, tiến sỹ, đại học, cao đẳng, trung cấp, THPT,THCS, tiểu học,…
• Giới tính: nam hay nữ
• Vị trí công việc: lãnh đạo, nhân viên,…
• Chuyên môn: y tế, giáo dục, khoa học, nông nghiệp,…
• Sức khỏe: tốt hay không tốt
II.XÂY DỰNG MÔ HÌNH HỒI QUY
1.Mô hình hồi quy tổng quát.
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D2 + C(5)*D3 + C(6)*D4 + C(7)*D5 +C(8)*D6 + C(9)*D7 + C(10)*D8 + C(11)*D9 + C(12)*D10 + C(13)*D11 +C(14)*D12 + C(15)*D13 + C(16)*D14 + C(17)*D15
2.Ý nghĩa các biến trong mô hình.
Thu nhập sẽ khác nhau cho những lĩnh vực chuyên môn khác nhau
D2 Giáo gục
đào tạo
Lĩnh vựckhác
Trang 7Côngnghệthông tin
Lĩnh vựckhác
D4
Kiếntrúc/Xâydựng
Lĩnh vựckhác
D5 Luật Lĩnh vực
khácD6 Nghệ
thuật
Lĩnh vựckhácD7
Nông/lâm/Ngưnghiệp
Lĩnh vựckhác
D8 Kinh
doanh
Lĩnh vựckhácD9 Quân đội Lĩnh vực
khác
D10 Mức độ thông
thạo ngoại ngữ
Thànhthạo
Khôngthànhthạo
+
Mức độ thông thạo ngoại ngữ càng lớn thì thu nhập càng cao
D11 Vị trí công việc Lãnh đạo Khác +
Chức vụ càng cao thì thu nhập càng lớn
D12
Bằng cấp
Thạc sĩ,tiến sĩ,đại học,cao đẳng
Khác
+
Bằng cấp là một yếu tố quan trọng phản ánh mức thu nhập của một ngườiD13 THPT vs
THCS KhácD14 Giới tính Nam Nữ +
Thu nhập ở người nam và nữ luôn có
sự chênh lệchD15 Sức khỏe Tốt Không tốt + Sức khỏe tốt góp
Trang 8phần cải thiện thu nhập
III.MÔ HÌNH HỒI QUY – KIỂM ĐỊNH VÀ SỬA CHỮA MÔ HÌNH.
A.MÔ HÌNH HỒI QUY
1.Mô hình hồi quy gốc:
1.1 Phương trình hồi quy gốc:
Substituted Coefficients:
=====================
Y = -4271.544 + 123.5550*X1 + 4024.775*D1 + 279.8236*D2 + 1265.943*D3 +2196.124*D4 + 6599.651*D5 + 3621.184*D6 – 697.8300*D7 + 1522.957*D8 –2733.346*D9 + 4845.598*D10 + 5682.831*D11 + 4219.735*D12 + 3280.677*D13 +17.26477*D14 + 708.1200*D15
Trang 9D1 4024.775 1404.453 2.865725 0.0043
D2 279.8236 1319.545 0.212061 0.8321D3 1265.943 1550.551 0.816447 0.4145D4 2196.124 1390.187 1.579732 0.1146
D6 3621.184 3446.540 1.050672 0.2938D7 -697.8300 1811.023 -0.385324 0.7001D8 1522.957 792.3376 1.922106 0.0550D9 -2733.346 2318.408 -1.178976 0.2388
squared 0.210778 S.D dependent var 9335.781S.E of regression 8293.738 Akaike info criterion 20.90750Sum squared resid 4.88E+10 Schwarz criterion 21.01480Log likelihood -7582.874 Hannan-Quinn criter 20.94890F-statistic 13.11832 Durbin-Watson stat 1.609121Prob(F-statistic) 0.000000
1.3 Nhận xét:
+ Kiểm định các biến bị bỏ sót – Kiểm định Ramsey
Ramsey RESET Test:
F-statistic 14.48788 Prob F(2,708) 0.0000
Log likelihood
ratio 29.16063 Prob Chi-Square(2) 0.0000
Trang 11S.E of regression 8140.533 Akaike info criterion 20.87289
Sum squared resid 4.69E+10 Schwarz criterion 20.99282
Log likelihood -7568.294 Hannan-Quinn criter 20.91917
F-statistic 13.71353 Durbin-Watson stat 1.583935
Prob(F-statistic) 0.000000
Dễ thấy P_value <0,05 nên có biến bị bỏ sót
Nhận thấy các biến X1, D1, D5, D10, D11, D12, D13 có P_value < 0.05 nên có ýnghĩa thống kê Các biến còn lại có P_value > 0.05 nên không có ý nghĩa thống kê
+Kiểm định các biến bị loại bỏ (biến thừa) ta sử dụng kiểm định Wald
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std Err
Trang 12C(17) 708.1200 1115.706
Restrictions are linear in coefficients
P-value > 0.05 do đó chấp nhận Ho, các biến trên đều là biến thừa.
Vậy loại bỏ các biến D2, D3, D4, D6, D7, D8, D9, D14, D15 ra khỏi mô hình.
Như vậy, các yếu tố lĩnh vực chuyên môn (Giáo dục đào tạo, Công nghệ thông tin,Kiến trúc/Xây dựng, Luật, Nghệ thuật, Nông/Lâm/Ngư nghiệp, Kinh doanh, Quân đội),giới tính và sức khỏe đều không ảnh hưởng đến thu nhập của người dân Thành phố HồChí Minh
2 Mô hình sau khi loại bỏ các biến không cần thiết:
2.1 Phương trình hồi quy:
Substituted Coefficients:
=====================
Y = -2673.387 + 112.4161*X1 + 3171.415*D1 + 5602.597*D5 + 4963.202*D10 +5972.162*D11 + 4459.695*D12 + 3334.765*D13
Trang 13R-squared 0.209874 S.D dependent var 9335.781
S.E of regression 8298.484 Akaike info criterion 20.89648
Sum squared resid 4.95E+10 Schwarz criterion 20.94697
Log likelihood -7587.869 Hannan-Quinn criter 20.91596
F-statistic 28.54872 Durbin-Watson stat 1.594778
Prob(F-statistic) 0.000000
Ta thấy R2=21.749% nhỏ hơn R2 lúc đầu Tuy nhiên các biến vẫn có ý nghĩa với môhình do P_value < 0.05, ngoại trừ P_value của D5 = 0.0773>0.05 nên ta sẽ kiểm định thửD5 có phải là biến thừa không?
*Kiểm định biến D5 bằng Wald:
Trang 14Normalized Restriction (= 0) Value Std Err.
C(4) 5602.597 3167.038
Restrictions are linear in coefficients
Dễ thấy P_value > 0.05 vậy D5 là biến thừa trong mô hình.
3.Mô hình sau khi loại bỏ biến thừa:
3.1 Phương trình hồi quy:
=====================
Y = -2703.616 + 113.1395*X1 + 3078.102*D1 + 5021.531*D10 + 5962.938*D11 +4542.664*D12 + 3337.625*D13
Trang 15D11 5962.938 728.9891 8.179735 0.0000D12 4542.664 1397.941 3.249540 0.0012D13 3337.625 1394.471 2.393470 0.0169R-squared 0.214087 Mean dependent var 8192.597Adjusted R-squared 0.207537 S.D dependent var 9335.781S.E of regression 8310.747 Akaike info criterion 20.89807Sum squared resid 4.97E+10 Schwarz criterion 20.94225Log likelihood -7589.448 Hannan-Quinn criter 20.91512F-statistic 32.68858 Durbin-Watson stat 1.599475Prob(F-statistic) 0.000000
Tất cả các biến đều có P_value < 0.05 vậy tất cả các biến đều có ý nghĩa với mô hình.
3.3 Nhận xét:
thành thạo, không làm lãnh đạo, bằng cấp dưới THCS thì có thu nhập trung bình là-2703.616 nghìn đồng/tháng Số liệu này không có ý nghĩa kinh tế
chiều với thu nhập Khi số tuổi của người dân tăng lên 1 tuổi, các yếu tố khác không đổithì thu nhập trung bình tăng 113.1395 nghìn đồng/tháng
tác động cùng chiều với thu nhập Khi lĩnh vực chuyên môn là ngành Y, các yếu tố kháckhông đổi thì thu nhập trung bình tăng 3078.102 nghìn đồng/tháng
thu nhập Trung bình một người có ngoại ngữ thành thạo có thu nhập nhiều hơn mộtngười ngoại ngữ không thành thạo, các yếu tố khác không đổi, là 5021.531 nghìnđồng/tháng
cùng chiều với thu nhập Trong điều kiện các yếu tố khác không đổi, một người làm lãnhđạo có thu nhập nhiều hơn một người không làm lãnh đạo trung bình là 5962.938 nghìnđồng/tháng
- Thạc sĩ, tiến sĩ, đại học, cao đẳng (D12): C6=4542.664>0, tác động cùng chiều với thu
nhập Trong điều kiện các yếu tố khác không đổi, trung bình một người tốt nghiệp tiến sĩ,
Trang 16thạc sĩ, đại học, cao đẳng có thu nhập nhiều hơn một người chưa tốt nghiệp THCS là4542.664 nghìn đồng/tháng.
các yếu tố khác không đổi, trung bình một người tốt nghiệp THPT hoặc THCS có thunhập nhiều hơn một người chưa tốt nghiệp THCS là 3337.625 nghìn đồng/tháng
B.KIỂM ĐỊNH VÀ KHẮC PHỤC
1.Kiểm định đa cộng tuyến
1.1 Kiểm định đa cộng tuyến
Lập ma trận hệ số tương quan:
X1 D1 D10 D12 D13X1 1.000000 0.068272 -0.131910 -0.227085 0.103652D1 0.068272 1.000000 0.044623 0.183848 -0.169152D10 -0.131910 0.044623 1.000000 0.364085 -0.314173D12 -0.227085 0.183848 0.364085 1.000000 -0.875559
D13 0.103652 -0.169152 -0.314173 -0.875559 1.000000
Vì |r D12D13| = 0.875559 > 0.8 nên cặp biến độc lập D12 và D13 bị đa cộng tuyến.
1.2.Khắc phục đa cộng tuyến.
Kiểm định sự cần thiết của các biến bị đa cộng tuyến với mô hình:
Trang 17D10 5020.628 763.9776 6.571696 0.0000D11 5961.429 731.3755 8.150982 0.0000D12 1658.582 711.0249 2.332664 0.0199R-squared 0.207833 Mean dependent var 8192.597Adjusted R-
squared 0.202340 S.D dependent var 9335.781S.E of regression 8337.956 Akaike info criterion 20.90324Sum squared resid 5.01E+10 Schwarz criterion 20.94112Log likelihood -7592.329 Hannan-Quinn criter 20.91786F-statistic 37.83243 Durbin-Watson stat 1.572545Prob(F-statistic) 0.000000
Trang 18D13 -568.2864 711.6168 -0.798585 0.4248
R-squared 0.202560 Mean dependent var 8192.597Adjusted R-squared 0.197030 S.D dependent var 9335.781S.E of regression 8365.661 Akaike info criterion 20.90988Sum squared resid 5.05E+10 Schwarz criterion 20.94775Log likelihood -7594.740 Hannan-Quinn criter 20.92449F-statistic 36.62875 Durbin-Watson stat 1.570505Prob(F-statistic) 0.000000
2.Kiểm định tự tương quan.
2.1 Phát hiện tự tương quan.
Trang 19D10 5020.628 763.9776 6.571696 0.0000D11 5961.429 731.3755 8.150982 0.0000D12 1658.582 711.0249 2.332664 0.0199
R-squared 0.207833 Mean dependent var 8192.597Adjusted R-squared 0.202340 S.D dependent var 9335.781S.E of regression 8337.956 Akaike info criterion 20.90324Sum squared resid 5.01E+10 Schwarz criterion 20.94112Log likelihood -7592.329 Hannan-Quinn criter 20.91786F-statistic 37.83243 Durbin-Watson stat 1.572545
Prob(F-statistic) 0.000000
Vì số quan sát quá lớn nên ta không thể tra bảng Ta có:
Hệ số tự tương quan = 1-d/2 = 1- 1.572545/2 = 0.2137 > 0 Vậy có sự tương quan dương
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 34.58900 Prob F(1,720) 0.0000
Obs*R-squared 33.32437 Prob Chi-Square(1) 0.0000
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/02/11 Time: 06:05
Sample: 1 727
Included observations: 727
Presample missing value lagged residuals set to zero
Variable Coefficient Std Error t-Statistic Prob
C -9.210992 1245.857 -0.007393 0.9941
Trang 20X1 -1.535167 31.22057 -0.049172 0.9608D1 191.8293 1259.603 0.152293 0.8790D10 -192.9495 747.5009 -0.258126 0.7964D11 12.28604 714.9154 0.017185 0.9863D12 157.6574 695.5366 0.226670 0.8207RESID(-1) 0.214504 0.036472 5.881242 0.0000R-squared 0.045838 Mean dependent var -1.84E-13Adjusted R-squared 0.037887 S.D dependent var 8309.194S.E of regression 8150.270 Akaike info criterion 20.85907Sum squared resid 4.78E+10 Schwarz criterion 20.90326Log likelihood -7575.273 Hannan-Quinn criter 20.87612F-statistic 5.764834 Durbin-Watson stat 2.009860Prob(F-statistic) 0.000007
Vì p_value < 0.05 nên có sự tự tương quan trong mô hình
2.2 Khắc phục tự tương quan.
Bước 1: Sử dụng phần dư ei để hồi quy dạng hàm:
Đặt e=resid, nhập hàm e c e(-1) ta được:
Dependent Variable: E
Method: Least Squares
Date: 12/02/11 Time: 10:16
Sample (adjusted): 2 727
Included observations: 726 after adjustments
Variable Coefficient Std Error t-Statistic Prob
C -1.739389 301.6724 -0.005766 0.9954E(-1) 0.213705 0.036307 5.886096 0.0000R-squared 0.045668 Mean dependent var -1.276226Adjusted R-squared 0.044350 S.D dependent var 8314.851S.E of regression 8128.378 Akaike info criterion 20.84686
Trang 21Sum squared resid 4.78E+10 Schwarz criterion 20.85950Log likelihood -7565.411 Hannan-Quinn criter 20.85174F-statistic 34.64612 Durbin-Watson stat 2.009098Prob(F-statistic) 0.000000
r0=0.214
Bước 2:Viết phương trình hồi quy mới dạng sai phân.
Dependent Variable: Y-R0*Y(-1)
Method: Least Squares
Date: 12/02/11 Time: 10:21
Sample (adjusted): 2 727
Included observations: 726 after adjustments
Variable Coefficient Std Error t-Statistic Prob
C 384.9373 986.3577 0.390261 0.6965X1-R0*X1(-1) 104.4478 31.08531 3.360036 0.0008D1-R0*D1(-1) 3119.659 1246.617 2.502499 0.0126D10-R0*D10(-1) 4662.383 755.7497 6.169217 0.0000D11-R0*D11(-1) 6084.928 716.1482 8.496744 0.0000D12-R0*D12(-1) 1692.438 689.5437 2.454431 0.0143R-squared 0.212743 Mean dependent var 6440.477Adjusted R-squared 0.207276 S.D dependent var 9152.643S.E of regression 8149.058 Akaike info criterion 20.85742Sum squared resid 4.78E+10 Schwarz criterion 20.89534Log likelihood -7565.244 Hannan-Quinn criter 20.87205F-statistic 38.91368 Durbin-Watson stat 2.006000
Prob(F-statistic) 0.000000