MỤC LỤC LỜI MỞ ĐẦU 3 NỘI DUNG 4 I. MÔ TẢ SỐ LIỆU 4 1. Mô tả tổng quan 4 2. Mô tả chi tiết các biến trong mô hình 6 II. PHÂN TÍCH HỒI QUY 12 1. Phương trình hồi quy tuyến tính 12 2. Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến 12 2.1. Lập bảng tương quan 12 2.2. Phân tích mối quan hệ tương quan giữa các biến 13 3. Chạy mô hình hồi quy và phân tích kết quả 13 3.1. Chạy mô hình hồi quy 13 3.2. Phân tích kết quả sau khi chạy mô hình 14 4. Kiểm định giả thuyết về hệ số hồi quy 15 5. Một số kiểm định F 18 5.1. Kiểm định sự phù hợp của mô hình 18 5.2. Kiểm định đa ràng buộc tuyến tính 18 6. Kiểm tra khuyết tật của mô hình 19 6.1. Đa cộng tuyến 19 6.2. Phương sai sai số thay đổi 21 7. Sửa lỗi mô hình 23 KẾT LUẬN 25 LỜI MỞ ĐẦU Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh tế. Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu thập được từ đó có thể đưa ra các dự báo về các hiện tượng kinh tế. Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đo lường sắc bén để đo các quan hệ kinh tế. Là những sinh viên đang theo học khối ngành kinh tế, chúng em nhận thấy được sự cần thiết của việc học tập và tìm hiểu về Kinh tế lượng trong việc phân tích logic và nghiên cứu vấn đề. Để hiểu sâu hơn về việc đưa Kinh tế lượng vào trong thực tế cuộc sống và áp dụng Kinh tế lượng sao cho đúng và hiệu quả, nhóm em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự hướng dẫn của TS. Đinh Thị Thanh Bình. Trong bài báo cáo, nhóm đã em sử dụng công cụ phân tích kinh tế lượng là phần mềm stata để phân tích, nghiên cứu dựa trên số liệu của file dữ liệu: 13_CRIME2.DTA: Phân tích sự ảnh hưởng của một số yếu tố đến tổng số vụ phạm tội.” Chúng em xin chân thành cảm ơn giảng viên hướng dẫn – TS. Đinh Thị Thanh Bình đã giúp đỡ chúng em thực hiện bài báo cáo này. Trong quá trình làm bài báo cáo, dù đã rất cố gắng nhưng chắc chắn chúng em không thể tránh khỏi những sai sót, kính mong được cô góp ý để nhóm chúng em có thể hoàn thiện hơn bản báo cáo này.
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
KHOA KINH TẾ QUỐC TẾ
=====000=====
BÁO CÁO KINH TẾ LƯỢNG
NHÓM 13: THỰC HIỆN NGHIÊN CỨU BỘ SỐ LIỆU 13_CRIME2
Giảng viên hướng dẫn: TS Đinh Thị Thanh Bình Nhóm sinh viên thực hiện:
2 Nguyễn Thị Thanh Hoa - 1311110252 - 25%
3 Nguyễn Việt Hoa (Nhóm trưởng) - 1311110253 - 30%
HÀ NỘI – THÁNG 12 NĂM 2014
Trang 22
Trang 3Kinh tế lượng (Econometrics) là môn khoa học xã hội trong đó các công cụ của lythuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích các vấn đề kinh
tế Kinh tế lượng sử dụng các công cụ phương pháp của thống kê toán để tìm ra bản chấtcủa các số liệu thống kê, đưa ra kết luận về các số liệu thống kê thu thập được từ đó cóthể đưa ra các dự báo về các hiện tượng kinh tế
Từ khi ra đời đến nay, kinh tế lượng đã đem lại cho các nhà kinh tế một công cụ đolường sắc bén để đo các quan hệ kinh tế Là những sinh viên đang theo học khối ngànhkinh tế, chúng em nhận thấy được sự cần thiết của việc học tập và tìm hiểu về Kinh tếlượng trong việc phân tích logic và nghiên cứu vấn đề Để hiểu sâu hơn về việc đưa Kinh
tế lượng vào trong thực tế cuộc sống và áp dụng Kinh tế lượng sao cho đúng và hiệu quả,
nhóm em xin xây dựng bài BÁO CÁO THỰC HÀNH KINH TẾ LƯỢNG dưới sự
hướng dẫn của TS Đinh Thị Thanh Bình Trong bài báo cáo, nhóm đã em sử dụng côngcụ phân tích kinh tế lượng là phần mềm stata để phân tích, nghiên cứu dựa trên số liệu của
file dữ liệu: 13_CRIME2.DTA: "Phân tích sự ảnh hưởng của một số yếu tố đến tổng
số vụ phạm tội.”
Chúng em xin chân thành cảm ơn giảng viên hướng dẫn – TS Đinh Thị ThanhBình đã giúp đỡ chúng em thực hiện bài báo cáo này Trong quá trình làm bài báo cáo, dùđã rất cố gắng nhưng chắc chắn chúng em không thể tránh khỏi những sai sót, kính mongđược cô góp y để nhóm chúng em có thể hoàn thiện hơn bản báo cáo này
Trang 4NỘI DUNG
I. MÔ TẢ SỐ LIỆU
1 Mô tả tổng quan
Trong bối cảnh xã hội ngày càng phát triển với tốc độ đô thị hóa cao cũng như việc
đất nước mạnh dạn mở cửa để tiếp thu với các nền văn hóa khác nhau thì tình trạng vi
phạm pháp luật ngày càng trở thành một vấn đề đáng lo ngại Có rất nhiều yếu tố tác động
đến tổng số vụ phạm tội Sau khi xem xét y nghĩa của từng biến trong file số liệu
13_CRIME2.DTA, nhóm em đã quyết định chọn mô hình hồi quy gồm các biến sau:
Biến phụ thuộc: Y: crimes
Biến độc lập: gồm 5 biến: X1: south
X2: area
X3: popden
X4: lawexpc
X5: polpc
Mô tả dữ liệu bẳng lệnh des, ta thu được kết quả như sau:
polpc float %9.0g police per 1000 people
lawexpc float %9.0g law enforce expend pc, $
popden float %9.0g people per sq mile
area float %9.0g land area, square miles
south byte %9.0g =1 if city in south
crimes float %9.0g total number index crimes
variable name type format label variable label
storage display value
des crimes south area popden lawexpc polpc
Ta có bảng sau:
crimes Vụ án Tổng số vụ phạm tội
south - = 1 nếu người phạm tội sống ở phía nam
= 0 nếu người phạm tội sống ở những vùng khácarea dặm vuông Diện tích vùng đất khảo sát
popden người/dặm vuông Mật độ dân số trên 1 dặm vuông
lawexpc $ Chi phí thực thi pháp luật bình quân đầu người
polpc Cảnh sát Số lượng cảnh sát trên 1000 người dân
4
Trang 5Tiếp tục sử dụng lệnh sum để mô tả dữ liệu Lệnh sum cho biết số lượng quan sát
(Obs), giá trị trung bình (mean), độ lệch chuẩn (std dev.) cũng như giá trị lớn nhất (max)
và nhỏ nhất (min) của các biến
polpc 92 2.251738 .6315045 1.283939 4.619234 lawexpc 92 958.643 313.88 377.54 2262.44 popden 92 4984.489 3172.98 703.7964 16550.28 area 92 122.7304 125.5295 13 604 south 92 326087 .4713482 0 1 crimes 92 39663.53 29692.1 4124 164452 Variable Obs Mean Std Dev Min Max sum crimes south area popden lawexpc polpc
Dựa theo kết quả trên, ta có bảng tổng hợp sau:
Tên biến Số quan
sát
Giá trị trung bình
Độ lệch chuẩn
Giá trị nhỏ nhất
Giá trị lớn nhất
Trang 6Sử dụng lệnh tab cho phép miêu tả các biến với các thông tin tần suất (Freq.), phần
trăm (Percent), phần trăm tích lũy cộng phần trăm từ trên xuống (Cum.)
Trang 7− Biến giả south nhận giá trị = 0 nếu người phạm tội không sống ở phía nam, xuất
hiện 62 lần chiếm 67.39%
− Nhìn chung, số lượng người phạm tội sống ở phía nam chiếm tỉ lệ thấp hơn so vớisố lượng người phạm tội sống ở những vùng khác trong mối quan hệ với tổng sốvụ phạm tội
c) Diện tích đất (area)
Trang 9− Diện tích vùng đất khảo sát dao động từ 13 dặm vuông đến 604 dặm vuông Mỗigiá trị đều xuất hiện 2 lần với tỉ lệ như nhau là 2.17%.
− Có 63.04% trong tổng số 92 số quan sát mà diện tích đất ≤ 100.5 dặm vuông
d) Mật độ dân số trên 1 dặm vuông (popden)
Trang 10e) Chi phí thực thi pháp luật bình quân đầu người (lawexpc)
Trang 11f) Số lượng cảnh sát trên 1000 người (popden)
Trang 12II. PHÂN TÍCH HỒI QUY
1. Phương trình hồi quy tuyến tính
Chọn biến phụ thuộc Y là crimes, các biến độc lập X1, X2, X3, X4, X5, X6 lần lượt là unem, pcinc, area, popden, lawexpc, polpc.
Ta có:
− Hàm hồi quy tổng thể:
(PRF): crimes = β0 + β1south + β2area + β3popden + β4lawexpc + β5polpc + ui
− Hàm hồi quy mẫu:
(SRF): = + south + area + popden + lawexpc + polpc
Trong đó: ui là yếu tố ngẫu nhiên (nhiễu).
2. Lập bảng tương quan và phân tích mối quan hệ tương quan giữa các biến
2.1. Lập bảng tương quan
Trước khi chạy mô hình hồi quy, chúng ta xem xét mức độ tương quan giữa các biến
bằng cách sử dụng lệnh corr crimes south area popden lawexpc polpc Ta thu được
bảng tương quan giữa các biến như sau:
polpc 0.3304 -0.0586 -0.2109 0.4798 0.3965 1.0000 lawexpc 0.2322 -0.2294 -0.2358 0.3654 1.0000
12
Trang 13Mối quan hệ tương quan giữa các biến độc lập với nhau cũng không cao, hệ số
tương quan cao nhất cũng chỉ là 0.4798 giữa biến popden và polpc Do không có hệ số
tương quan nào có độ lớn vượt quá 0.8 nên có thể dự đoán mô hình không xảy ra hiệntượng đa cộng tuyến khi hồi quy
2.2. Phân tích mối quan hệ tương quan giữa các biến
Từ bảng tương quan trên ta thấy:
- Hệ số tương quan giữa biến crimes và south là 0.0600
- Hệ số tương quan giữa biến crimes và area là 0.4801
- Hệ số tương quan giữa biến crimes và popden là 0.0477
- Hệ số tương quan giữa biến crimes và lawexpc 0.2322
- Hệ số tương quan giữa biến crimes và polpc là 0.3304
Như vậy, trong các nhân tố được nghiên cứu, biến area có mối tương quan mạnh nhất đến crimes, hay diện tích đất có ảnh hưởng khá lớn đến tổng số vụ phạm tội Hệ số
tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến,như nếu diện tích đất tăng thì tổng số vụ phạm tội cũng tăng
Ngược lại, biến popden ít ảnh hưởng nhất đến crimes, hay mối tương quan giữa mật
độ dân số trên 1 dặm vuông và tổng số vụ phạm tội không mạnh như các nhân tố khác Hệsố tương quan giữa 2 biến mang dấu dương thể hiện mối quan hệ cùng chiều giữa 2 biến,nếu mật độ dân số trên 1 dặm vuông tăng thì tổng số vụ phạm tội cũng tăng nhưng tăngkhông đáng kể
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán rằng môhình không xảy ra hiện tượng đa cộng tuyến
3. Chạy mô hình hồi quy và phân tích kết quả
3.1. Chạy mô hình hồi quy
Để chạy mô hình hồi quy, ta thực hiện lệnh reg như sau:
Trang 14_cons -42015.36 10856.3 -3.87 0.000 -63596.97 -20433.75 polpc 13507.01 4307.702 3.14 0.002 4943.584 22070.44 lawexpc 19.75433 8.203154 2.41 0.018 3.447003 36.06166 popden 2.192713 .9861742 2.22 0.029 232264 4.153163 area 168.0235 21.76537 7.72 0.000 124.7554 211.2916 south 2380.125 5128.681 0.46 0.644 -7815.356 12575.61 crimes Coef Std Err t P>|t| [95% Conf Interval]
Total 8.0227e+10 91 881620871 Root MSE = 21643 Adj R-squared = 0.4687 Residual 4.0284e+10 86 468419090 R-squared = 0.4979 Model 3.9943e+10 5 7.9887e+09 Prob > F = 0.0000 F( 5, 86) = 17.05 Source SS df MS Number of obs = 92 reg crimes south area popden lawexpc polpc
Từ đó ta có bảng số liệu sau:
Tên biến Hệ số hồi quy Thống kê t P-value Khoảng tin cậy
Hệ số tự do -42015.36 -3.87 0.000 [-63596.97 ; -20433.75]
Từ bảng trên ta có phương trình hàm hồi quy mẫu SRF:
= -42015.36 + 2380.125south + 168.0235area + 2.192popden + 19.754lawexpc +
13507.01polpc
3.2. Phân tích kết quả sau khi chạy mô hình
− Số quan sát Obs = 92
− Tổng bình phương sai số được giải thích SSE = 3.9943e+10
− Tổng bình phương các phần dư SSR = 4.0284e+10
− Tổng bình phương sai số tổng cộng SST = 8.0227e+10
− Bậc tự do của phần được giải thích Dfm = 5
− Bậc tự do của phần dư Dfr =86
− Hệ số xác định R2 = 0.4979 có nghĩa là các biến X trong mô hình giải thích được53.31% sự dao động của biến Y Hay các biến vùng miền, diện tích đất, mật độ dân số
14
Trang 15trên 1 dặm vuông, chi phí thực thi pháp luật bình quân đầu người và số cảnh sát trên
1000 người giải thích được 49.79% sự dao động của biến tổng số tội phạm
− Hệ số xác định điều chỉnh = 0.4687
− Ý nghĩa của các hệ số hồi quy trong mô hình:
β1 = 2380.125>0 nghĩa là tổng số vụ phạm tội xảy ra ở phía nam cao hơn tổng sốvụ phạm tội xảy ra không ở phía nam là 2380.125 vụ án trong điều kiện các yếu tốkhác không đổi
β2 = 168.0235>0 nghĩa là diện tích đất tăng 1 dặm vuông thì tổng số vụ phạm tộităng 168.0235 vụ án trong điều kiện các yếu tố khác không đổi
3 = 2.192713>0 nghĩa là mật độ dân số tăng 1 người/dặm vuông thì tổng số vụphạm tội tăng 2.192713 vụ án trong điều kiện các yếu tố khác không đổi
β4 = 19.75433>0 nghĩa là chi phí thực thi pháp luật tăng 1$ thì tổng số vụ phạm tộităng 19.75433 vụ án trong điều kiện các yếu tố khác không đổi
β5 = 13507.01>0 nghĩa là cứ tăng thêm 1 cảnh sát trên 1000 người dân thì tổng sốvụ phạm tội tăng 13507.01 vụ án trong điều kiện các yếu tố khác không đổi (điềunày có thể hiểu là: khi tăng số lượng cảnh sát điều tra thì chứng tỏ có nhiều vụ ánxảy ra hơn nên biến độc lập số lượng cảnh sát trên 1000 người tỷ lệ thuận với biếnphụ thuộc tổng số vụ phạm tội là phù hợp với thực tế)
β0 = -42015.36<0 nghĩa là khi giá trị của các biến độc lập bằng 0 thì tổng số vụphạm tội là -42015.36vụ án trong điều kiện các yếu tố khác không đổi
4. Kiểm định giả thuyết về hệ số hồi quy
Cặp giả thuyết thống kê:
Sử dụng giá trị tới hạn:
Ta có:
Do mô hình mắc lỗi phương sai sai số thay đổi (sẽ chứng minh ở phần cuối) nên phải
sửa lỗi mô hình bằng lệnh reg, robust trước khi kiểm định giả thuyết thống kê.
Trang 16_cons -42015.36 14229.47 -2.95 0.004 -70302.62 -13728.11 polpc 13507.01 4638.13 2.91 0.005 4286.716 22727.31 lawexpc 19.75433 8.280635 2.39 0.019 3.292975 36.21569 popden 2.192713 .814641 2.69 0.009 5732607 3.812166 area 168.0235 37.32388 4.50 0.000 93.82607 242.2209 south 2380.125 4999.456 0.48 0.635 -7558.464 12318.71 crimes Coef Std Err t P>|t| [95% Conf Interval] Robust
Root MSE = 21643 R-squared = 0.4979 Prob > F = 0.0000 F( 5, 86) = 6.67 Linear regression Number of obs = 92 reg crimes south area popden lawexpc polpc, robust
Từ bảng trên ta thấy biến south có p-value = 0.635 > 0.05 còn các biến độc lập khác đều có p-value > 0.05 nên chỉ có biến south không có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
a) south:
Có: ⇒ chưa có cơ sở để bác bỏ H0 với mức y nghĩa 5%
Biến south không có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:
Vùng miền không có ảnh hưởng mang y nghĩa thống kê đến tổng số tội phạm
b) area:
Có ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%
Biến area có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:
− Diện tích đất có ảnh hưởng mang y nghĩa thống kê đến tổng số vụ phạm tội
− Diện tích đất càng tăng thì tổng số vụ phạm tội cũng tăng
− Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy diện tích đất tăng 1dặm vuông thì tổng số vụ phạm tội tăng 168.0235 vụ án với điều kiện các yếu tốkhác không đổi
16
Trang 17c) popden:
Có: ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%
Biến popden có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:
− Mật độ dân số trên 1 dặm vuông có ảnh hưởng mang y nghĩa thống kê đến tổng sốtội phạm
− Mật độ dân số trên 1 dặm vuông tăng thì tổng số tội phạm cũng tăng
− Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1người/dặm vuông thì tổng số vụ phạm tội tăng 2.192713 vụ án với điều kiện cácyếu tố khác không đổi
d) lawexpc
Có: ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%
biến lawexpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:
− Chi phí thực thi pháp luật bình quân đầu người có ảnh hưởng mang y nghĩa thống
kê đến tổng số vụ phạm tội
− Chi phí thực thi pháp luật bình quân đầu người tăng thì tổng số vụ phạm tội cũngtăng
− Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy chi phí thực thi phápluật bình quân đầu người tăng 1$ thì tổng số vụ phạm tội tăng 19.75433 vụ án vớiđiều kiện các yếu tố khác không đổi
e) polpc
Có: ⇒ Bác bỏ H0, chấp nhận H1 với mức y nghĩa 5%
Biến polpc có ảnh hưởng mang y nghĩa thống kê đến biến crimes.
Kết luận:
− Số cảnh sát trên 1000 người dân có ảnh hưởng mang y nghĩa thống kê đến tổng sốtội phạm
− Số cảnh sát trên 1000 người dân tăng thì tổng số tội phạm cũng tăng
− Kết quả chạy mô hình hồi quy dựa trên 1 mẫu cụ thể cho thấy cứ tăng thêm 1 cảnhsát trên 1000 người dân thì tổng số vụ phạm tội tăng 13507.01 vụ án với điều kiệncác yếu tố khác không đổi
Vậy trong các biến độc lập, với mức ý nghĩa 5%, chỉ có biến south không có ảnh hưởng mang ý nghĩa thống kê đến biến crimes.