Để hiểu rõ hơn, nhóm chúng em xin được xây dựng bài Báo cáo kinh tế lượng phân tích những số liệu thống kê nằm trong bộ số liệu số 30 về tiền lương và bộ số liệu số 78 về chi tiêu hộ gia
Trang 1BÁO CÁO KINH TẾ LƯỢNG
NHÓM 3- THỰC HIỆN NGHIÊN CỨU BỘ DỮ LIỆU SỐ 30 - 78
Trang 2MỤC LỤC
Lời mở đầu 4
Bộ số 30 5
I Mô hình lý thuyết: 5
1 Vấn đề nghiên cứu và mô hình lý thuyết: 5
2 Mục đích và lý do lựa chọn các biến: 7
3 Mối quan hệ từng biến độc lập với biến phụ thuộc: 7
II Chạy mô hình: 11
Mô hình hồi quy: 11
III Kiểm định mô hình: 13
1 Ý nghĩa của hệ số hồi quy 13
2 Kiểm định toàn bộ hệ số hồi quy 14
3 Kiểm định đa ràng buộc tuyến tính: 14
4 Kiểm tra các khuyết tật của mô hình : 16
a Kiểm định đa cộng tuyến: 16
b Kiểm định phương sai sai số thay đổi: 17
c Kiểm định phân phối chuẩn của sai số: 19
d Kiểm định tự tương quan: 21
IV Sửa lỗi mô hình: 22
KẾT LUẬN 23
BỘ SỐ 78 24
I Mô hình lý thuyết: 24
1 Vấn đề nghiên cứu và mô hình lý thuyết: 24
2 Mối quan hệ từng biến độc lập với biến phụ thuộc 26
II Chạy mô hình: 29
Mô hình hồi quy: 29
III Kiểm định mô hình: 31
1 Ý nghĩa của hệ số hồi quy: 31
2 Kiểm định toàn bộ hệ số hồi quy 32
3 Kiểm định đa ràng buộc tuyến tính: 32
4 Kiểm tra các khuyết tật của mô hình : 33
a Kiểm định đa cộng tuyến: 33
b Kiểm định phân phối chuẩn của sai số: 35
Trang 3c Kiểm định phương sai sai số thay đổi: 36
d Kiểm định tự tương quan: 37
IV Sửa lỗi mô hình: 38
KẾT LUẬN 39
Trang 4Lời mở đầu
Trong bối cảnh xã hội đang ngày càng phát triển, kinh tế lượng đã và đang là một môn khoa học
có nhiều ứng dụng trong thực tế, đặc biệt là các vấn đề liên quan đến kinh tế Kinh tế lượng cung cấp những công cụ đắc lực giúp các nhà kinh tế học có thể phân tích các số liệu thống kê được thu thập từ đóđưa ra các dự báo về các hiện tượng kinh tế
Xét trên phạm vi các trường đại học thuộc khối ngành kinh tế, bộ môn kinh tế lượng đang trở thành một trong số những bộ môn quan trọng cung cấp những kiến thức về lý thuyết và thực hành giúp cho sinh viên có thể học tập và nghiên cứu những chuyên ngành hẹp của mình Là những sinh viên khối ngành kinh tế, chúng em ý thức rõ được sự cần thiết trong việc học tập và nghiên cứu môn kinh tế lượng
Để hiểu rõ hơn, nhóm chúng em xin được xây dựng bài Báo cáo kinh tế lượng phân tích những số liệu thống kê nằm trong bộ số liệu số 30 về tiền lương và bộ số liệu số 78 về chi tiêu hộ gia đình nhằm đưa ra những phân tích và những dự báo của các yếu tố ảnh hưởng đến hai vấn đề kinh tế này
Chúng em xin chân thành cảm ơn cô Đinh Thị Thanh Bình đã giúp đỡ chúng em thực hiện bài báocáo này Do kiến thức còn nhiều hạn chế nên bài báo cáo còn nhiều sai sót, chúng em mong nhận được sựgóp ý và phê bình của cô để bài báo cáo của nhóm chúng em hoàn thiện hơn
Trang 5Bộ số 30
1 Vấn đề nghiên cứu và mô hình lý thuyết:
Trong bối cảnh nền kinh tế đang trong giai đoạn phục hồi, chúng ta đang có nhiều hơn những cơ hội tìm được việc làm.Đi cùng với đó, mức lương là một vấn đề đang được những người có mong muốn tìm được việc làm quan tâm tới.Có rất nhiều yếu tố sẽ tác động đến mức lương cũng mỗi người Trong bộ số liệu số 30, nhóm đã chọn ra những biến sau để nghiên cứu bao gồm:
des lwage lswage exper highgrad college grad polytech
storage display value
variable name type format label variable label
-
-lwage float %9.0g log(wage)
lswage float %9.0g log(swage)
exper byte %8.0g years on current job
highgrad byte %8.0g =1 if high school graduate
college byte %8.0g =1 if college graduate
grad byte %8.0g =1 if some graduate school
polytech byte %8.0g =1 if a polytech
Các biến sẽ được mô tả chi tiết trong bảng sau:
Trang 6Tên biến Ý nghĩa Dấu kì
vọng Diễn giải
Biến phụ
thuộc(Y)
lwage Logarit cơ số e của mức
lương hiện tạiCác biến độc
lập (Xi)
lswage Logarit cơ số e của mức
Mức lương khởi đầu caodẫn đến mức lương hiện tạicao
exper Số năm kinh nghiệm trong
Càng nhiều năm kinhnghiệm lương càng caohighgrad Tốt nghiệp trung học phổ
thông (biến giả =1 nếu chỉtốt nghiệp phổ thông,=0 vớicác trường hợp còn lại)
+
Tốt nghiệp trung học sẽ cómức lương cao hơn nhữngngười chưa tốt nghiệp trunghọc
college Tốt nghiệp đại học (biến giả
=1 nếu tốt nghiệp đạihọc,=0 với các trường hợpcòn lại)
+
Tốt nghiệp đại học sẽ có mức lương cao hơn những người chưa tốt nghiệp trung học
grad Tốt nghiệp cao học (biến
giả, =1 nếu tốt nghiệp caohọc, =0 với các trường hợpcòn lại)
+
Tốt nghiệp cao học sẽ cómức lương cao hơn nhữngngười chưa tốt nghiệp trunghọc
polytech Tốt nghiệp cao đẳng (biến + Tốt nghiệp cao đẳng sẽ có
Trang 7giả, =1 nếu tốt nghiệp cao đẳng,=0 với các trường hợp còn lại)
mức lương cao hơn những người chưa tốt nghiệp trung học
summarize lwage lswage exper highgrad college grad polytech
Variable | Obs Mean Std Dev Min Max
-+ -lwage | 403 10.36319 .4018362 9.674074 11.54974 lswage | 403 9.678186 .3551116 9.185022 11.0021 exper | 403 13.51365 1.751101 6 17
highgrad | 403 .4119107 .4927909 0 1
college | 403 .1191067 .3243167 0 1
-+ -grad | 403 .1191067 .3243167 0 1
polytech | 403 .2704715 .4447555 0 1
Trang 8Mục đích của việc lựa chọn mô hình này nhằm tìm hiểu sự tác động của mức lương khởi đầu, số năm
kinh nghiệm đối với mức lương hiện tại cùng với việc tìm hiểu sự khác nhau trong mức lương của những người đã tốt nghiệp cấp 3 và cao hơn với những người chưa tốt nghiệp cấp 3
Vì trong thực tế, mối quan hệ giữa các hiện tượng kinh tế hầu hết là mối quan hệ phi tuyến Do đó, nhóm
đã lựa chọn sử dụng hàm log thay cho việc sử dụng hàm tuyến tính để kết quả phân tích có thể chính xác
Trang 9years on current job
Mối quan hệ giữa lwage và exper
Trang 12II Chạy mô hình:
Mô hình hồi quy:
Hàm hồi quy Tổng thể:
lwage=β0+β1lswage + β2exper+ β3highgrad+β4college+ β5grad +β6polytech+u i
Hàm hồi quy Mẫu
^
lwage=^ βo+ ^ β 1lswage+^ β 2 exper+ ^ β 3 highgrad+ ^ β 4 college+ ^ β 5 grad + ^ β 6 polytech
reg lwage lswage exper highgrad college grad polytech
Source | SS df MS Number of obs = 403
Trang 13-Ta được hàm hồi quy mẫu SRF:
^
lwage=1,9895+0,833 lswage+0,015 exper+0,453 highgrad+0,245 college+0,247 grad +0,128 polytech
- Phân tích kết quả hồi quy:
Ý nghĩa các hệ số hồi quy:
β1= 0.8330333>0, chứng tỏ khi các yếu tố khác không đổi khi lương khởi điểm swagetăng 1% thì lương hiện tại wage sẽ tăng 0.8330333%
β2 = 0.0147612>0, chứng tỏ khi các yếu tố khác không đổi số năm kinh nghiệm tăng lên 1năm thì lương hiện tại wage sẽ tăng 0.015%
β3 = 0.453>0 nhưng p-value = 0.167> 0.05 chứng tỏ biến highgrad không ảnh hưởng đến
sự thay đổi của biến wage
β4 = 0,245>0, khi các yếu tố khác không đổi người có trình độ đại học sẽ có tốc độ tănglương cao hơn người chưa tốt nghiệp trung học 0,245%
β 5=¿0,247>0, khi các yếu tố khác không đổi người có trình độ cao học sẽ có tốc độ tănglương cao hơn người chưa tốt nghiệp trung học 0,247%
β6= khi các yếu tố khác không đổi người có trình độ cao đẳng sẽ có tốc đọ tăng lương caohơn người chưa tốt nghiệp trung học 0,128%
β0=¿1,9895, các yếu tố khác không đưa vào mô hình nếu tăng thêm 1 đơn vị của giá trịtrung bình các yếu tố đó thì lương sẽ tăng thêm 0,0199%
Độ phù hợp của hàm hồi quy:
R2(R-squared)=0,8252 chỉ ra rằng 82,52% sự biến động của lwage là do các biến độc lập gây ra
Trang 14III Kiểm định mô hình:
1 Ý nghĩa của hệ số hồi quy
Trang 152 Kiểm định toàn bộ hệ số hồi quy
Giả thuyết: Ho: R
Trang 16hiện 1 trong các phạm trù của biến thể hiển trình độ học vấn Ta tiến hành chạy mô hình bị ràng buộc với
q= 4 biến độc lập highgrad, grad, college, polytech bị loại khỏi mô hình trên, tức là chỉ chạy lênh hồi quy với biến độc lập lswage, exper
reg lwage lswage exper
Source | SS df MS Number of obs = 403
Trang 17-Xét 2 mô hình:
(UR): Y = β0+β1*lswage+β2*exper+β3*highgrad+β4*grad+β5*college+ β6*polytech
(R): Y = β0 +β1*lswage+ β2*exper
Giả thuyết: {Ho: β 3=β 4=β 5=β 6=0 H 1 :có ít nhất 1 βj≠ 0
Từ 2 bảng hồi quy trên ta có:
(UR) gồm 6 tham số, cóR-squared=0.8252;, n-k-1 = 403-6-1=396 bậc tự do
Không nên loại các phạm trù thể hiện trình độ học vấn ra ngoài mô hình.
4 Kiểm tra các khuyết tật của mô hình :
a Kiểm định đa cộng tuyến:
Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch, hiệu quả nhất) Tuynhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu, dẫn tới mô hình không đạt đượcđầy đủ các tính chất trên Một trong những vấn đề ảnh hưởng đến mô hình mà ta gọi là vi phạm các giảđịnh, đó là Đa cộng tuyến
Bây giờ chúng ta sẽ khảo sát mô hình có bị đa cộng tuyến hay không
Trang 18Sử dụng Stata để tính hệ số tương quan giữa các biến:
corr lswage exper highgrad college grad polytech
Trang 19Như vậy cả 2 cách kiểm định đều cho cùng một kết luận: mô hình không có đa cộng tuyến.
b Kiểm định phương sai sai số thay đổi:
Một vấn đề khác mà mô hình cũng có thể gặp phải, đó là phương sai của sai số thay đổi.Điều này khôngảnh hưởng đến tính không chệch, nhưng làm cho mô hình kém hiệu quả hơn
Bây giờ ta cùng kiểm định xem có xảy ra hiện tượng phương sai sai số thay đổi trong mô hình không
Cặp giả thiết: {H0: Ph ươngsai sai s ố không đổi
H1: Phương sai sai s ố thay đổi
Trang 20imtest,white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
Trang 21c Kiểm định phân phối chuẩn của sai số:
Trong các giả định của mô hình hồi quy tuyến tính, có một giả định quan trọng đó là ui ~ U(0;σ2) Tuynhiên trên thực tế có nhiều nhân tố ảnh hưởng tới phân phối của ui, làm cho nó không còn phân phốichuẩn nữa.Phân phối không chuẩn khiến cho các kiểm định và suy diễn thống kê không còn đáng tin cậynữa
Bây giờ ta cùng kiểm định xem mô hình có gặp phải vấn đề phân phối không chuẩn (đối với u và cả biếnphụ thuộc) hay không
kernel = epanechnikov, bandwidth = 0.0435
Kernel density estimate
Trang 22kết luận mô hình đang mắc phải vấn đề phân phối không chuẩn.
Cách 2:Kiểm định Skewness-Kurtosis:
Cặp giả thiết: { H0: phần d ư có phân ph ối chuẩn
H1: phần d ư không có phân ph ối chuẩn
Như vậy 2 kiểm định đều cho thấy có dấu hiệu phần dư phân phối không chuẩn trong mô hình.
d Kiểm định tự tương quan:
Do dữ liệu trong mô hình là dữ liệu chéo nên không xảy ra tự tương quan Chúng ta có thể bỏ qua bướckiểm định này
e Kiểm định định dạng mô hình:
Sử dụng lệnh ovtest trong stata:
ovtest
Ramsey RESET test using powers of the fitted values of lwage
Ho: model has no omitted variables
Trang 23F(3, 393) = 2.62
Prob > F = 0.0507
Định dạng hàm đúng
IV Sửa lỗi mô hình:
Vì biến highgrad không có ảnh hưởng đến lương hiện tại nhưng lại là một phạm trù của biến giả nên ta sửa bằng cách gộp biến highgrad và highdrop thành biến high có ý nghĩa là trình độ học vấn dưới trình độđại học
Chạy lại mô hình ta được:
gen high= highgrad+ highdrop
reg lwage lswage exper college grad polytech
Source | SS df MS Number of obs = 403
-+ - F( 5, 397) = 372.59
Model | 53.5089948 5 10.701799 Prob > F = 0.0000
Trang 24mô hình như giới tính, tình trạng hôn nhân… cần được xem xét để có báo cáo với kết quả chính xác hơn nữa.
Trang 25BỘ SỐ 78
1 Vấn đề nghiên cứu và mô hình lý thuyết:
Trong thực tế, việc chi tiêu trong hộ gia đình chịu sự chi phối tác động của nhiều yếu tố trong đó có
thể kể đến như mức thu nhập, số thành viên trong gia đình, tuổi của chủ hộ,… Trong phạm vi nghiên cứu
của mô hình này, nhà nghiên cứu đã xem xét và thu thập số liệu của 7 biến số Tuy nhiên, trong quá trình nghiên cứu, nhóm đã loại bỏ biến save (tiết kiệm) không đưa vào mô hình và chỉ đưa các biến sau đây
Mô tả ý nghĩa các biến :
des cons inc size educ age black
storage display value
variable name type format label variable label
-cons int %9.0g annual -consumption, $
inc int %9.0g annual income, $
size byte %9.0g family size
educ byte %9.0g years educ, household head
age byte %9.0g age of household head
black byte %9.0g =1 if household head is black
Các biến sẽ được mô tả chi tiết trong bảng sau:
Trang 26Tên biến Ý nghĩa Dấu kì
- Tuổi càng cao thì chi
tiêu sẽ ít đi educ Trình độ học vấn của
-Người có trình độ học vấn cao sẽ chi tiêu ít hơn
black Màu da của chủ hộ
(biến giả, bằng 1 nếu chủ hộ da màu, bằng 0 nếu chủ hộ không phải
da màu)
-Người da màu có xu hướng chi tiêu ít hơn
Trang 272 Mối quan hệ từng biến độc lập với biến phụ thuộc:
Trang 28years educ, household head
Mối quan hệ giữa cons và age
Trang 29=1 if household head is black
Mối quan hệ giữa age và cons
Mối quan hệ giữa black và cons
Trang 30II Chạy mô hình:
Mô hình hồi quy:
Hàm hồi quy Tổng thể:
cons=βo+ β 1 inc+ β 2¿3 educ+ β 4 age+ β 5¿+ui
Hàm hồi quy Mẫu
^
cons= ^ βo+ ^ β 1 inc+ ^ β 2¿β 3 educ +^ β 4 age +^ β 5¿
reg cons inc size educ age black
Source | SS df MS Number of obs = 100
Trang 31-Ta được hàm hồi quy mẫu SRF:
^
cons=1605.416+0.890545*inc–67.66119*size–151.8235*educ–0.2857217*age– 518.3934*black
- Phân tích kết quả hồi quy:
Ý nghĩa các hệ số hồi quy:
β1= 0.890545 > 0, khi thu nhập tăng $1 thì mức chi tiêu hằng năm của 1 gia đình sẽ tăng
β 5=−518,3934< 0 :khi chủ hộ là người da đen thì chi tiêu mỗi năm của hộ gia đình đó sẽ
thấp hơn $518.3934 so với các trường hợp màu da khác
β0=1605,416: ảnh hưởng của các yếu tố không được đưa vào mô hình đến chi tiêu hàngnăm của các hộ gia đình
Độ phù hợp của hàm hồi quy:
R2(R-squared) = 0.6985 cho thấy các biến độc lập inc, size, educ, age, black giải thích được 69,85% biến động của biến phụ thuộc cons.
Trang 32III Kiểm định mô hình:
1 Ý nghĩa của hệ số hồi quy:
Trang 332 Kiểm định toàn bộ hệ số hồi quy
Giả thuyết: Ho: R2=0
3 Kiểm định đa ràng buộc tuyến tính:
Ta tiến hành chạy mô hình bị ràng buộc với q= 4 biến độc lập size, educ, age, black bị loại khỏi mô hình trên, tức là chỉ chạy lênh hồi quy với biến độc lập inc.
reg cons inc
Source | SS df MS Number of obs = 100
-+ - F( 1, 98) = 219.89
Model | 2.2480e+09 1 2.2480e+09 Prob > F = 0.0000
Residual | 1.0019e+09 98 10223460.8 R-squared = 0.6917
-+ - Adj R-squared = 0.6886
Trang 34cons | Coef Std Err t P>|t| [95% Conf Interval]
Giả thuyết: {Ho: β 2=β 3=β 4=β 5=0 H 1: c ó í tnhấ t 1 βj ≠0
Từ 2 bảng hồi quy trên ta có:
(UR) gồm 5 tham số, có SSR = 979841351; R2 = 0.6985, n-k-1 = 100-5-1=94 bậc tự do
Trang 354 Kiểm tra các khuyết tật của mô hình :
a Kiểm định đa cộng tuyến:
Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch, hiệu quả nhất) Tuynhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu, dẫn tới mô hình không đạt đượcđầy đủ các tính chất trên Một trong những vấn đề ảnh hưởng đến mô hình mà ta gọi là vi phạm các giảđịnh, đó là Đa cộng tuyến
Bây giờ chúng ta cùng khảo sát xem, mô hình có bị đa cộng tuyến hay không
Cách 1:Tương quan cao giữa các biến:
Nếu các biến có tương quan cao với nhau (r > 0.8) thì có thể xảy ra đa cộng tuyến
Sử dụng Stata để tính hệ số tương quan giữa các biến:
corr inc size educ age black