LỜI MỞ ĐẦUNhư chúng ta đã biết, nếu như kinh tế vi mô và vĩ mô mô tả sự vận động của nền kinh tế, thì kinh tế lượng cung cấp các phân tích về mặt lượng mối quan hệ giữa các hiện tượng ki
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
Trang 2MỤC LỤC
LỜI MỞ ĐẦU
A BẢNG SỐ LIỆU SỐ 24
I MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
2. Mô tả chi tiết các biến trong mô hình:
II MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH:
1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
B BẢNG SỐ LIỆU SỐ 58
I MÔ TẢ THỐNG KÊ SỐ LIỆU:
1. Tổng quan:
2. Mô tả chi tiết các biến trong mô hình:
II MÔ HÌNH HỒI QUI VÀ PHÂN TÍCH HỒI QUI:
1. Phân tích mối quan hệ tương quan giữa các biến:
2. Chạy mô hình hồi qui và phân tích kết quả:
3. Một số kiểm định F:
III KIỂM ĐỊNH VÀ SỬA CHỮA CÁC KHUYẾT TẬT CỦA MÔ HÌNH
1. Vấn đề đa cộng tuyến:
2. Vấn đề về phương sai sai số thay đổi:
TÀI LIỆU THAM KHẢO
Trang 3LỜI MỞ ĐẦU
Như chúng ta đã biết, nếu như kinh tế vi mô và vĩ mô mô tả sự vận động của nền kinh tế, thì kinh tế lượng cung cấp các phân tích về mặt lượng mối quan hệ giữa các hiện tượng kinh tế, cùng với sự tác động qua lại giữa chúng, trên cơ sở các số liệu thu thập từ thực tế, nhằm củng cố thêm các giả thiết, từ đó đưa ra các quyết định đúng đắn hơn Đặc biệt, trong thời đại công nghệ phát triển mạnh mẽ như hiện nay, sự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế trong quá trình hoạch định chính sách vĩ mô, việc dự báo và dự đoán phải có độ tin cậy cao,… kinh tế lượng ngày càng đóng một vai trò quan trọng, và bản thân nó cũng không ngừng được hoàn thiện và phát triển.
Sau quá trình học tập và nghiên cứu, dưới sự chỉ dẫn tận tình của cô Đinh Thị Thanh Bình, nhóm chúng em đã tiếp nhận được lượng kiến thức mà môn học truyền tải, tự đó có thể hoàn thành báo cáo về bảng số liệu 24 và 58 Chúng em rất mong nhận được những ý kiến nhận xét của cô và các bạn để bài làm có thể hoàn thiện hơn!
Trang 4A BẢNG SỐ LIỆU SỐ 24
Bất kì một quốc gia nào trên thế giới muốn giữ vững trật tự, kỉ cương của xã hội cũng đều đặt
ra hệ thống luật pháp của riêng mình; và bất cứ ai vi phạm hệ thống ấy cũng đều bị bắt và xử lý theo pháp luật.
Vậy số lần phạm tội trộm cắp tài sản bị bắt giữ, thu nhập hợp pháp tính trong năm, thời gian kết án trung bình trong năm,… có ảnh hưởng như thế nào đến số lần bị bắt giữ trong năm? Để hiểu
rõ hơn, sâu sắc hơn về vấn đề trên, nhóm chúng em đã sử dụng bộ số liệu 24; bộ số liệu này dựa trên những nghiên cứu trong năm 1986 - một mốc thời gian cụ thể.
Trang 5I MÔ TẢ THỐNG KÊ SỐ LIỆU:
1 Tổng quan:
Sau quá trình thảo luận nhóm cũng như xem xét ý nghĩa của từng biến trong file bảng số liệu
24, nhóm chúng em đã quyết định chọn mô hình hồi quy gồm các biến như sau:
● Biến phụ thuộc: narr86
● Biến độc lập: (bao gồm 5 biến)
Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc và các
biến độc lập bằng lệnh miêu tả biến des:
des narr86 nparr86 ptime86 avgsen black inc86
storage display value
variable name type format label variable label
-
-narr86 byte %9.0g # times arrested, 1986
nparr86 byte %9.0g # property crme arr., 1986ptime86 byte %9.0g mos in prison during 1986avgsen float %9.0g avg sentence length, mos.black byte %9.0g =1 if black
inc86 float %9.0g legal income, 1986, $100s
Trang 6Dựa vào kết quả trên, ta có bảng tổng hợp sau:
Tên biến Định dạng hiển thị Đơn vị tính Ý nghĩa biến
narr86 %9.0g - Số lần bị bắt trong năm 1986
nparr86 %9.0g - Số lần phạm tội trộm cắp tài sản bị bắt
giữ trong năm 1986
inc86 %9.0g trăm đô Thu nhập hợp pháp tính trong năm
1986
Black %9.0g - = 1 nếu là người da đen
=0 nếu là không là người da đen
avgsen %9.0g tháng Thời gian kết án trung bình
ptime86 %9.0g tháng Số tháng ngồi tùtrong năm 1986
Sau đó sử dụng lệnh Sum để tiếp tục mô tả các biến trên:
sum narr86 nparr86 avgsen ptime86 inc86 black
Variable | Obs Mean Std Dev Min Max
Trang 7black | 2725 .1611009 .3676915 0 1
Kết quả của lệnh Sum cho ta biết số quan sát (Obs), giá trị trung bình (Mean), độ lệch chuẩn
(Std Dev.), giá trị lớn nhất (Max), giá trị nhỏ nhất (Min) của các biến.
Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Biến Số quan
sát
Giá trị trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất
2 Mô tả chi tiết các biến trong mô hình:
Để mô tả chi tiết các biến đã chọn, dùng lệnh tab:
a) Số lần bị bắt giữ trong năm 1986.
Trang 8− Ý nghĩa của Cum: có 97.25% trong tổng số 2725 số quan sát mà Số lần bị bắt giữ trong năm
Trang 9− Số lần phạm tội trộm cắp tài sản bị bắt giữ nằm trong khoảng từ 0 đến 8 Trong đó mức 0 có tần suất đáng kể nhất là 2469 chiếm 90,61% , theo sau đó là sự giảm xuống đáng kể ở các mức tiếp theo Với số lần phạm tội trộm cắp tài sản bị bắt giữ là 8 chiếm ít nhất, chỉ có 0,07%.
− Ý nghĩa của Cum: có 99.63% trong tổng số 2725 số quan sát mà số lần phạm tội trộm cắp tài sản
bị bắt giữ trong năm 1986 ≤ 3
c) Thời gian kết án trung bình.
Trang 10− Ý nghĩa của Cum: có 96.26% trong tổng số 2725 số quan sát mà thời gian kết án trung bình ≤
Trang 12− Ý nghĩa của Cum: có 28.44% trong tổng số 2725 số quan sát mà thu nhập hợp pháp tính trong
Biến black = 1 nếu là người da đen, xuất hiện 439 lần chiếm 16,11%.
Biến black =0 nếu là không phải người da đen, xuất hiện 2286 lần chiếm 83,89%
Trang 13Nhìn chung, số lượng người da đen chiếm tỉ lệ thấp hơn so với người da màu khác trong mối quan hệ với số lần bị bắt giữ trong năm 1986.
❖ Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):
Chọn biến phụ thuộc Y là narr86, các biến độc lập X1, X2, X3, X4, X5 lần lượt là nparr86,
avgsen, ptime86, inc86, black.
Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y và các biến
X như sau:
Narr86 = + * nparr86 + * avgsen + * ptime86 + * inc86 + * black +
Hàm hồi qui mẫu SRF là:
+ * nparr86 + * avgsen + * ptime86 + * inc86 + * black
1 Phân tích mối quan hệ tương quan giữa các biến:
Thực hiện lệnh corr có bảng tương quan giữa biến phụ thuộc narr86 và các biến độc lập như
- Hệ số tương quan giữa narr86 và nparr86là 0.6608
- Hệ số tương quan giữa narr86và avgsen là 0.0293
- Hệ số tương quan giữa narr86 và ptime86 là -0.0299
Trang 14- Hệ số tương quan giữa narr86 và inc86là -0.1900
- Hệ số tương quan giữa narr86 và black là 0.1493
Như vậy, ta có thể thấy trong các nhân tố được nghiên cứu, biến nparr86 có mối tương quan mạnh nhất đến narr86, hay nói cách khác số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm
1986 có ảnh hưởng khá lớn đến số lần bị bắt trong năm 1986 Hệ số tương quan mang dấu dương cũng thể hiện mối quan hệ cùng chiều giữa các biến, như nếu số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986 tăng thì số lần bị bắt giữ trong năm 1986 cũng tăng
Ngược lại, biến avgsen ít ảnh hưởng nhất đến narr86, hay mối tương quan giữa thời gian
kết án trung bình và số lần bị bắt giữ trong năm 1986 không mạnh như các yếu tố khác Hệ số tương quan giữa 2 biến mang dấu dương, chứng tỏ chúng có quan hệ cùng chiều, nếu thời gian kết án trung bình tăng thì số lần bị bắt giữ trong năm 1986 tăng nhưng không đáng kể.
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán sẽ không xảy ra hiện tượng đa cộng tuyến.
2 Chạy mô hình hồi qui và phân tích kết quả:
* Sử dụng lệnh hồi qui reg ta có kết quả như sau:
reg narr86 nparr86 avgsen ptime86 inc86 black
Source | SS df MS Number of obs = 2725 -+ - F( 5, 2719) = 452.37 Model | 912.915316 5 182.583063 Prob > F = 0.0000 Residual | 1097.43184 2719 403615977 R-squared = 0.4541 -+ - Adj R-squared = 0.4531 Total | 2010.34716 2724 738012906 Root MSE = 63531
narr86 | Coef Std Err t P>|t| [95% Conf Interval] -+ - nparr86 | 1.138975 .0255741 44.54 0.000 1.088828 1.189121 avgsen | .0074017 .0035952 2.06 0.040 0003521 .0144513 ptime86 | -.02286 .0064938 -3.52 0.000 -.0355933 -.0101267 inc86 | -.0012251 .0001887 -6.49 0.000 -.0015952 -.000855 black | .1654735 .0338007 4.90 0.000 0991958 .2317511 _cons | .3063096 .0181962 16.83 0.000 2706299 .3419893 -
Trang 15Phương trình hồi qui mẫu của mô hình là:
narr86 = 0.3063096 + 1.138975* nparr86 + 0.0074017 * avgsen-0.02286* ptime86 -
− Hệ số xác định điều chỉnh = 0.4531
Trang 16− Ý nghĩa các hệ số hồi quy trong mô hình:
Với điều kiện các yếu tố khác không đổi thì :
▪ = 0.3063096 có nghĩa khi giá trị các biến độc lập = 0 thì số lần bị bắt trong năm 1986 là 0.3063096 lần.
▪ = 1.138975 có nghĩa số lần phạm tội trộm cắp tài sản bị bắt giữ trong năm 1986 tăng lên 1 đơn vị thì tổng số lần bị bắt giữ tăng lên 1.138975 lần.
▪ = 0.0074017 có nghĩa nếu thời gian kết án trung bình tăng lên 1 tháng thì số lần bị bắt giữ tăng 0.0074017 lần.
▪ = -0.02286 có nghĩa là nếu số tháng ngồi tù trong năm 1986 tăng lên 1 tháng thì số lần bị bắt giữ giảm đi 0.02286 lần.
▪ = -0.0012251có nghĩa nếu thu nhập hợp pháp tính trong năm 1986 tăng lên 100$ thì số lần bị bắt giữ giảm đi 0.0012251 lần.
▪ = 0.1654735 có nghĩa nếu là người da đen thì số lần bị bắt giữ cao hơn so với da màu khác 0.1654735 lần.
3 Một số kiểm định F:
a) Kiểm định sự phù hợp của mô hình:
- Mục đích: xem xét trường hợp các tham số của biến độc lập đồng thời bằng 0 có thể xảy ra hay không.
- Có cặp giả thuyết thống kê:
Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ Ho, chấp nhận H1 tức là hàm hồi quy mẫu phù hợp.
Trang 17Như vậy, Prob > F = 0.0000, nhỏ hơn mức ý nghĩa , vì thế bác bỏ Ho.
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0 mô hình hồi qui phù hợp.
b) Kiểm định giả thuyết về hệ số hồi qui:
- Mục đích: kiểm định ảnh hưởng của từng biến độc lập lên giá trị trung bình của biến phụ
thuộc narr86.
- Có cặp giả thuyết thống kê:
Nếu giá trị Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ Ho, chấp nhận H1, tức là biến độc lập
đó có ý nghĩa thống kê đối với narr86.
- Theo bảng chạy hồi qui, ta thấy:
+ Biến nparr86 có giá trị p-value < 0.05, bác bỏ Ho, tức là biến nparr86 có ý nghĩa thống kê đối với narr86.
+ Biến avgsen có giá trị p-value < 0.05, bác bỏ Ho, tức là biến avgsen có ý ngĩa thống kê đối với narr86.
+ Biến ptime86 có giá trị p-value < 0.05, bác bỏ Ho, tức là biến ptime86 có ý nghĩa thống kê đối với narr86.
+ Biến inc86 có giá trị p-value < 0.05, bác bỏ Ho, tức là biến inc86 có ý nghĩa thống kê đối vớinarr86.
+ Biến black có giá trị p-value < 0.05, bác bỏ Ho, tức là biến black có ý nghĩa thống kê đối với narr86.
Trang 18→ Các biến nparr86, avgsen, ptime86, inc86, black đều có ảnh hưởng đến narr86.
1 Vấn đề đa cộng tuyến:
a) Bản chất:
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc lập X i
trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau
b) Nguyên nhân:
Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
● Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng tuyến hoàn hảo ít khi xảy ra.
● Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau.
● Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số liệu điều tra không ngẫu nhiên.
Các dạng mô hình dễ xảy ra đa cộng tuyến:
- Hồi quy dạng các biến độc lập được bình phương sẽ xảy ra đa cộng tuyến, đặc biệt khi phạm
vi giá trị ban đầu của biến độc lập là nhỏ.
- Các biến độc lập vĩ mô được quan sát theo chuỗi thời gian.
c) Cách phát hiện đa công tuyến:
➢ Cách 1: Dùng lệnh corr [indep] để kiểm định đa cộng tuyến Nếu giữa 2 biến có giá trị corr
> 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
corr nparr86 avgsen ptime86 inc86 black
Trang 19black | 0.1011 0.1194 0.0737 -0.1470 1.0000
Từ bảng số liệu trên, ta thấy giá trị corr của các biến rất nhỏ so với 0.8 nên mô hình không
tồn tại đa cộng tuyến.
➢ Cách 2: Dùng lệnh vif Nếu Mean VIF > 10 thì mô hình có hiện tượng đa cộng tuyến.
Sử dụng phần mềm stata và lệnh vif, ta thu được kết quả như sau:
Từ bảng kết quả trên, ta thấy Mean VIF < 10 => Mô hình không tồn tại vấn đề đa cộng tuyến.
Kết luận:Từ các cách kiểm định khác nhau trên, ta thấy không tồn tại vấn đề đa cộng tuyến trong
Trang 20− Do định dạng không đúng dạng hàm của mô hình Có thể do bỏ sót biến thích hợp hoặc giải tích của hàm là sai.
− Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các quan sát ngoại lai Quan sát ngoại lai là các quan sát khác biệt rất nhiều ( quá nhỏ hoặc quá lớn) với các quan sát khác trong mẫu Việc đưa vào hay loại bỏ các quan sát này ảnh hưởng rất lớn đến phân tích hồi quy.
− Do kỹ thuật thu thập, bảo quản và xử lý số liệu được cải tiến nên sai số có xu hướng giảm.
− Do con người học được hành vi trong quá khứ Chẳng hạn, lỗi của người đánh máy càng ít nếu thời gian thực hành càng tăng…
c) Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
➢ Cách 1: Xem xét đồ thị của phần dư:
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dự đoán Y i (biểu diễn sự tương quan giữa e và Y i ).
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:
Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các giá trị trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trung bình bằng 0 (đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khá lớn Vì thế, ta có thể
dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.
Trang 21White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity
-Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2 = 0.0000 < 0.05
=> Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).
➢ Cách 3: Dùng kiểm định Breusch – Pagan:
Cặp giả thuyết:
Sử dụng phần mềm stata và lệnh hettest, ta thu được kết quả như sau:
hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of narr86
chi2(1) = 315.85
Trang 22Prob > chi2 = 0.0000
Từ kết quả thu được, ta thấy Prob > chi2 = 0.0000 < 0.05 => Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%).
Kết luận:Vì kết quả của các kiểm định trên thống nhất nên có thể kết luận được rằng có xảy ra
hiện tượng phương sai sai số thay đổi trong mô hình.
d) Cách khắc phục hiện tượng phương sai sai số thay đổi
Để khắc phục hiện tượng phương sai sai số thay đổi, chúng ta dùng lệnh robust, thu được kết
quả:
reg narr86 nparr86 avgsen ptime86 inc86 black, robust
Linear regression Number of obs = 2725 F( 5, 2719) = 148.18 Prob > F = 0.0000 R-squared = 0.4541 Root MSE = 63531
| Robust
narr86 | Coef Std Err t P>|t| [95% Conf Interval] -+ - nparr86 | 1.138975 .0478223 23.82 0.000 1.045203 1.232747 avgsen | .0074017 .0045754 1.62 0.106 -.00157 .0163733 ptime86 | -.02286 .0040695 -5.62 0.000 -.0308396 -.0148804 inc86 | -.0012251 .0001533 -7.99 0.000 -.0015257 -.0009244 black | .1654735 .0445903 3.71 0.000 0780391 .2529078 _cons | .3063096 .0187887 16.30 0.000 2694681 .3431511 -
Với cách này, mô hình đã khắc phục được hiện tượng phương sai sai số thay đổi trong mô hình.