des crime enroll priv police lenroll lpolice storage display value variable name type format label variable label --- ---crime int %9.0g total campus ---crimes enroll float %9.0g total
Trang 1Tên thành viên nhóm:
Nguyễn Hoàng Mai: 1214160072 (20%) Nguyễn Thị Nga: 1211160079 (20%) Vũ Nhật Minh: 1214160075 (20%) Vũ Hồng Minh: 1211160074 (20%)
BÁO CÁO KINH TẾ LƯỢNG
Trang 2Bảng thành tích đóng góp:
Họ và Tên Mã số sinh viên Phần trăm đóng góp
Trang 3Lời mở đầu
Trong cuộc sống hiện đại ngày nay, ngành kinh tế là một trong những ngành học có ynghĩa quyết định đến sự phát triển của xã hội nói chung và sự tăng trưởng của các quốc gianói riêng Nhắc đến ngành học kinh tế, không thể không nhắc đến môn học Kinh tế lượng Cóthể nói, kinh tế lượng chính là môn học không thể bỏ qua nhất trong tất cả các môn học củachương trình đào tạo nhân lực phục vụ cho ngành kinh tế Đặc thù của môn học này chính làsự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế, kiểm định sự phù hợp và độ tincậy của các giả thuyết trong quá trình hoạch định chính sách vĩ mô cũng như ra các quyếtđịnh tác nghiệp, việc dự báo và dự đoán có độ tin cậy cao… Tất cả những đặc thù quan trọngđó đã làm cho kinh tế lượng ngày càng phát triển, ngày càng gần gũi hơn với các bạn sinhviên ngành kinh tế chính bởi yếu tố cần thiết và thực tế của nó Nghiên cứu môn học này, cácbạn sinh viên sẽ có những cái nhìn toàn diện, thu thập được những kiến thức cơ bản và cụ thểvề việc phân tích những số liệu về các nhân tố ảnh hưởng đến vấn đề nào đó, từ đó vạch ranhững định hướng đúng đắn, xác thực hơn, để hoặc là tiếp tục phát triển vấn đề, hoặc là cónhững phương pháp cần thiết để giải quyết vấn đề theo hướng phù hợp với thực tiễn và tínhchất của nó
Sau một thời gian được học tập những kiến thức cơ bản về môn Kinh tế lượng dưới sựchỉ dẫn tận tình của cô giáo Đinh Thị Thanh Bình, nhóm chúng em đã phần nào tiếp nhậnđược lượng kiến thức mà môn học muốn truyền tải, từ đó áp dụng vào để thực hiện phân tíchvà hoàn thành bản báo cáo cuối kỳ gồm hai bảng số liệu 15 và 39 này Chúng em đã rất cốgắng và dành nhiều công sức cho bản báo cáo này, tuy nhiên, do kiến thức của bản thân vẫncòn non nớt và chưa thực sự có nhiều kinh nghiệm, nên chắc chắn chúng em vẫn còn gặpnhiều sai sót trong quá trình phân tích Chúng em rất mong nhận được y kiến đóng góp của côvà các bạn
Chúng em xin chân thành cảm ơn!
Trang 4Mục lục Trang
A Bảng số liệu số 15
Trang 5A. BẢNG SỐ LIỆU SỐ 15
(CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN TỔNG SỐ LƯỢNG VỤ ÁN XẢY RA
TRONG KÝ TÚC XÁ)
Tên bảng số liệu: Campus.
Sau khi nhóm chúng em bàn bạc và suy luận chủ quan về sự ảnh hưởng của các biến,chúng em đã đi đến kết luận về nội dung của bảng số liệu này, đó là nghiên cứu về: sự ảnhhưởng của các nhân tố đến tổng số lượng vụ án xảy ra ở ky túc xá
Cuộc sống ngày cảng phát triển, và đi cùng với sự phát triển chung của nhân loại, thìdường như càng ngày con người càng sống cách xa nhau hơn, những vụ án xảy ra ngày cảngnhiều hơn trên thế giới Không chỉ ngày càng tăng thêm nhanh về số lượng, mà những hành vigây tội còn được diễn ra với phạm vi đa dạng và khó xác định vị trí hơn Thậm chí, một trongnhững địa điểm mà tội phạm dùng đề gây án lại chính là những khu ky túc xá của các trườnghọc Như chúng ta đã biết, trường học cần phải là nơi có sự an toàn tuyệt đối với môi trường
vô hại hoàn toàn, thì mới có thể bảo vệ cho thế hệ tương lai một cách tốt nhất và đào tạo ralớp trí thức phục vụ cho sự phát triển của đất nước Vậy nên, việc nghiên cứu về các nhân tốảnh hưởng đển tổng số lượng vụ án xảy ra ở ky túc xá là một điều hết sức quan trọng, để từ đótìm ra biện pháp khắc phục, giải quyết vấn đề theo hướng tích cực, và góp phần vạch raphương pháp làm giảm tổng số vụ án xảy ra ở ky túc xá
Xét trong phạm vi một trường học, có rất nhiều yếu tố đề một vụ án có thể xảy ra.Những yếu tố đó có thể là tổng số sinh viên trong ky túc xá, việc ky túc xá là của trường cônghay trường tư và tổng số cảnh sát được thuê để điều tra vụ án ky túc xá… Để tìm hiểu rõ hơnvề vấn đề này, chúng ta cần phải nhìn dưới góc nhìn của Kinh tế lượng, phân tích và kiểmđịnh các giả thuyết nhất định Chúng em xin phân tích bảng số liệu số 15, để chúng em nóiriêng và các bạn sinh viên nói chung có cách hiểu tổng quan hơn về vấn đề này
Trang 6I Mô tả thống kê số liệu:
1. Tổng quan:
Sau quá trình phân tích chủ quan về số liệu, đọc và hiểu y nghĩa các biến được chotrong bảng số liệu số 15, chúng em đã quyết định chạy mô hình hồi quy gồm các biến nhưsau:
- Biến phụ thuộc: crime
- Biến độc lập (bao gồm có 5 biến):
I.1. Sử dụng lệnh des để mô tả chung cho các biến:
Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc
và các biến độc lập bằng lệnh des với cấu trúc câu lệnh là:
“des crime enroll priv police lenroll lpolice”
Sau khi chạy câu lệnh trong Stata chúng ta thu được kết quả sau:
des crime enroll priv police lenroll lpolice
storage display value
variable name type format label variable label
-
-crime int %9.0g total campus -crimes enroll float %9.0g total enrollment
priv byte %9.0g =1 if private college police byte %9.0g employed officers
lenroll float %9.0g log(enroll)
lpolice float %9.0g log(police)
.
Dựa vào kết quả thu được ta có bảng tổng hợp như sau:
Tên biến Định dạng hiển thị Đơn vị tính Ý nghĩa biến
Trang 7Crime %9.0g Vụ án Tổng số vụ án xảy ra trong ky túc xá
của trường, tính theo đơn vị số vụ án
Enroll %9.0g Sinh viên Tổng số sinh viên trong ky túc xá theoghi chép của Nhà trường
-= 0 nếu trường đó không phải là
trường Tư
= 1 nếu trường đó là trường Tư
Police %9.0g Cảnh sát Tổng số cảnh sát được thuê để điều travụ án ky túc xá của trường.
Lenroll %9.0g - Logarit tự nhiên của giá trị tổng số
sinh viên ở trong ky túc xá của trường
Lpolice %9.0g
-Logarit tự nhiên của giá trị tổng sốcảnh sát được thuê để điều tra vụ án
ky túc xá của trường
I.2. Sử dụng lệnh sum để tiếp tục mô tả các biến:
Tiếp tục sử dụng lện sum để mô tả số liệu Lệnh sum cho biết số lượng quan sát
(Obs) Giá trị trung bình (Mean), độ lệch chuẩn (Std dev) cũng như giá trị lớn nhất (Max) và giá trị nhỏ nhất( Min ) của các biến.
Cấu trúc câu lệnh như sau:
“sum enroll priv police crime lcrime lenroll lpolice”
Sau khi chạy câu lệnh này trong Stata ta thu được kết quả:
sum crime enroll priv police lenroll lpolice
Variable | Obs Mean Std Dev Min Max
Trang 8Độ lệch chuẩn
460.783912298.990.330962415.630580.83177190.8056453
2. Mô tả chi tiết các biến trong mô hình:
Để mô tả chi tiết từng biến một trong mô hình ta sửa dụng lệnh tab
2.1 Crime:
• Cấu trúc lệnh: “tab crime”
Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
Trang 9Cấu trúc lệnh: “tab enroll”
Ta thu được kết qủa sau đây:
Trang 10Cấu trúc lệnh: “tab priv”
Ta thu được kết quả sau:
Trang 11Total | 97 100.00
Có tổng số 12 ky túc xá được quan sát là ky túc xá trường tư chiếm 12.37%
Có tổng số 85 ky túc xá được quan sát là ky túc xá không phải của trường tư, chiếm87.63%
2.4. Police:
Cấu trúc lệnh: “tab police”
Ta thu được kết quả như sau:
Trang 12Cấu trúc lệnh: “tab lenroll”
Ta thu được kết quả như sau:
Trang 13Cấu trúc lệnh: “tab lpolice”
Ta thu được kết quả như sau:
Trang 14II Mô hình hồi quy và phân tích hồi quy
Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):
Chọn biến phụ thuộc Y là crime, các biến độc lập X1, X2, X3, X4, X5, lần lượt là enroll.
priv, police, lenroll, lpolice.
Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y vàcác biến X như sau:
Crime = β 0 + β 1 * enroll + β 2 * priv + β 3 * police + β 4 * lenroll + β 5 * lpolice + u i
Hàm hồi quy mẫu SRF là:
= + * enroll + * priv + * police + * lenroll + * lpolice
1. Phân tích mối quan hệ tương quan giữa các biến:
Trước khi phân tích bất kỳ một bảng số liệu kinh tế lượng nào, chúng ta đều cần phảiphân tích mối quan hệ tương quan giữa các biến, để xác định hệ số tương quan giữa chúng, vàquan trọng hơn, là để xem xét xem các biến trong mô hình có xảy ra hiện tượng đa cộng tuyếnhay không (Nếu R2 >= 0.8 thì xảy ra hiện tượng đa cộng tuyến)
Ta sử dụng lệnh Corr trong Stata với cấu trúc lệnh như sau:
“corr crime enroll priv police lenroll lpolice”
Được kết quả là bảng số liệu tương quan như sau:
corr crime enroll priv police lenroll lpolice
Trang 15| crime enroll priv police lenroll lpolice -+ - crime | 1.0000
Từ bảng trên ta có thể thấy được hệ số tương quan của các biến như sau:
- Hệ số tương quan giữa crime và enroll là: 0.8360
- Hệ số tương quan giữa crime và priv là: - 0.2226
- Hệ số tương quan giữa crime và police là: 0.7233
- Hệ số tương quan giữa crime và lenroll là: 0.7195
- Hệ số tương quan giữa crime và lpolice là: 0.6537
Sau khi rút ra được các hệ số tương quan như trên, nhìn vào ta có thể nhận xét, trong
tất cả các nhân tố được nghiên cứu, thì biến enroll có mối tương quan mạnh nhất đến biến
crime (hệ số tương quan của biến này cao nhất, là 0.8360), hay nói cách khác, tổng số vụ sinh
viên trong ky túc xá của trường có mối ảnh hưởng mạnh nhất đến tổng số lượng vụ án xảy ra
trong ky túc xá của Nhà trường Hệ số tương quan của biến enroll này mang dấu dương, cũng chứng tỏ được mối quan hệ cùng chiều giữa biến enroll với biến crime, thể hiện nếu như tổng
số sinh viên trong ky túc xác của trường tăng, thì cũng sẽ dẫn tới tổng số lượng vụ án xảy ra
trong ky túc xá của trường cũng tăng theo Ngược lại, biến priv có mối tương quan ít nhất đến biến crime (hệ số tương quan của biến này nhỏ nhất là - 0.2226), hay nói cách khác, yếu tố
“trường Dân lập” có ảnh hưởng ít nhất đến tổng số vụ án xảy ra trong ky túc xá nhà trường
Hệ số tương quan giữa biến priv và biến crime mang dấu âm chứng tỏ chúng có quan hệ
ngược chiều (nghịch) với nhau Nếu trường được nghiên cứu là trường Dân lập thì tổng số vụán xảy ra trong ky túc xá Nhà trường sẽ thấp hơn so với trường không phải là trường Dân lập
Dấu của hệ số tương quan cũng tương tự với các nhân tố khác, nếu mang dấu âm làngược chiều, còn mang dấu dương là thuận chiều Các biến có quan hệ thuận chiều ở đây là:
enroll, police, lcrime, lpolice Biến có quan hệ ngược chiều ở bảng số liệu này chỉ gồm 1
biến: priv
Trang 16Ngoài ra, sau khi đọc các số liệu của bảng hệ số tương quan chúng ta cũng nhận thấyrằng, mối quan hệ tương quan giữa các biến độc lập hầu hết không vượt quá giá trị 0.8 Tuy
nhiên, có hai biến độc lập có hệ số tương quan rất cao, đó là lpolice và police (hệ số tương quan của hai biến này là 0.9005>0.8) và lenroll với enroll (hệ số tương quan của hai biến này
là 0.9099>0.8) Do vậy ta dự đoán mô hình có xảy ra hiện tượng đa cộng tuyến
2. Chạy mô hình hồi quy và phân tích kết quả:
• Bước đầu tiên ta sử dụng lệnh reg để chạy mô hình hồi quy với cấu trúc câu lệnh là: “reg
crime enroll priv police lenroll lpolice”, thu được kết quả là bảng:
reg crime enroll priv police lenroll lpolice
Source | SS df MS Number of obs = 97 -+ - F( 5, 91) = 52.60 Model | 15143382 5 3028676.39 Prob > F = 0.0000 Residual | 5239508.09 91 57577.012 R-squared = 0.7429 -+ - Adj R-squared = 0.7288 Total | 20382890 96 212321.771 Root MSE = 239.95
crime | Coef Std Err t P>|t| [95% Conf Interval] -+ - enroll | .0315662 .0053609 5.89 0.000 0209175 042215 priv | 38.41752 80.93085 0.47 0.636 -122.3417 199.1767 police | 9.733369 3.946817 2.47 0.016 1.893502 17.57324 lenroll | -106.5999 76.66161 -1.39 0.168 -258.8788 45.67894 lpolice | -48.7223 76.75522 -0.63 0.527 -201.1871 103.7425 _cons | 815.5561 619.467 1.32 0.191 -414.9391 2046.051Sau khi chạy Stata được toàn bộ dữ liệu như trình bày ở trên, chúng ta tiến hành đọcvà phân tích số liệu Trước hết, chúng ta thành lập được một bảng số liệu như sau:
-Tên biến Hệ số hồi quy Hệ số t P-value Khoảng tin cậy Hệ số tự do 815.5561 1.32 0.191 [-414.9391; 2046.051]
Enroll 0.0315662 5.89 0.000 [0.0209175; 0.042215]
Trang 17Priv 38.41752 0.47 0.636 [-122.3417; 199.1767]
Police 9.733369 2.47 0.016 [1.893502; 17.57324]
Lenroll -106.5999 -1.39 0.168 [-258.8788; 45.67894]
Lpolice -48.7223 -0.63 0.527 [-201.1871; 103.7425]
• Phương trình hồi quy mẫu của mô hình là:
Crime = 815.5561+ 0.0315662 * enroll + 9.733369 * police 106.5999 * lenroll
-48.7223 * lpolice + u i.
• Phân tích kết quả hồi quy:
- Số quan sát Obs = 97
- Tổng bình phương sai số tổng cộng SST = 20382890
- Tổng bình phương sai số được giải thích SSE = 15143382
- Tổng bình phương các phần dư SSR = 5239508.09
- Bậc tự do của phần được giải thích Dfm= 5
- Bậc tự do của phần dư Dfr = 91
Hệ số xác định R2(R-squared) = 0.7429 thể hiện mức độ phù hợp của hàm hồi quymẫu là tương đối lớn Bên cạnh đó, giá trị 0.7429 còn thể hiện tỷ lệ phần trăm biến động tổngsố vụ án xảy ra trong ky túc xá nhà trường được giải thích bởi các biến độc lập gồm: “Tổng sốsinh viên trong ky túc xá Nhà trường”, “có phải Trường tư hay không”, “tổng số cảnh sátđược thuê để điều tra vụ án”, “logarit tự nhiên giá trị của tổng số sinh viên trong trường”,
“logarit tự nhiên giá trị của tổng số cảnh sát được thuê” là 74,29%
Hệ số xác định điều chỉnh = 0.7288 Hệ số này có y nghĩa: trong trường hợp nếu tađưa thêm biến vào mô hình, hệ số xác định điều chỉnh mà tăng thì việc đưa biến ấy có ynghĩa, và ngược lại
Ý nghĩa các hệ số hồi quy trong mô hình:
= 815.5561 có y nghĩa là: khi giá trị của các biến độc lập bằng 0 trong điều kiện các yếu tốkhác không đổi thì tổng số vụ án xảy ra trong ky túc xá là 815.5561
= 0.0315662 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu tăng thêm mộtsinh viên trong ky túc xá thì tổng số vụ án trung bình xảy ra trong ky túc xá tăng thêm0.0315662 vụ
= 38.41752 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu trường được nghiêncứu là trường tư thì tổng số vụ án trung bình xảy ra trong ky túc xá tăng thêm 38.41752 vụ
Trang 18 = 9.733369 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu tăng thêm một cảnhsát được thuê để điều tra vụ án thì tổng số vụ án trung bình xảy ra trong ky túc xá tăng thêm là9.733369 (điều này có thể hiểu là: khi tăng lượng cảnh sát điều tra, thì có nhiều vụ án đượcphá hơn, dẫn đến tìm ra nhiều vụ án xảy ra hơn (vì vụ án chỉ được tính khi được điều tra củaCảnh sát) nên biến độc lập cảnh sát tỷ lệ thuận với biến phụ thuộc là phù hợp với thực tế).
= -106.5999 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu lượng sinh viêntrong ky túc xá tăng thêm 1% thì tổng số vụ án trung bình xảy ra trong ky túc xá giảm đi là1.065999 vụ
= -48.7223 có y nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu lượng cảnh sát đượcthuê để điều tra các vụ án trong ky túc xá tăng thêm 1% thì tổng số vụ án trung bình xảy ratrong ky túc xá giảm đi là 0.487223 vụ
- Tuy nhiên, ta chỉ biết chắc chắn biến độc lập có thực sự ảnh hưởng đến biến phụ thuộc với ynghĩa hệ số hồi quy như ta đã phân tích ở trên hay không sau khi kiểm định hệ số hồi quy cho
mô hình
3. Một số kiểm định F:
3.1. Kiểm định giả thuyết về hệ số hồi quy:
- Mục đích: kiểm định ảnh hưởng của từng biến độc lập lên giá trị trung bình của biến phụ
thuộc crime.
Có cặp giả thuyết thống kê:
với i = Nếu giá trị P-value nhỏ hơn mức y nghĩa thì bác bỏ Ho, chấp nhận H1, tức là biến độc
lập đó có y nghĩa thống kê đối với crime.
- Theo bảng chạy hồi qui ở mục 2, ta thấy:
o Biến enroll: P-value = 0.000 < 0.05, loại bỏ H0 vậy nên biến enroll có y nghĩa thống kê đối với crime.
o Biến priv: P-value = 0.636 > 0.05, chấp nhận H0 vậy nên biến priv không có y nghĩa thống kê đối với crime.
o Biến police: P-value = 0.016 < 0.05, bác bỏ H0 vậy nên biến police có y nghĩa thống kê đối với crime.
o Biến lenroll: P-value = 0.168 > 0.05, chấp nhận H0 vậy nên biến lenroll không có y nghĩa thống kê đối với crime.
o Biến lpolice: P-value = 0.527 > 0.05, chấp nhận H0 vậy nên biến lpolice không có y nghĩa thống kê đối với biến crime.
→ Các biến priv, lenroll, lpolice không thực sự ảnh hưởng đến crime.
Trang 193.2. Kiểm định sự phù hợp của mô hình:
- Mục đích: xem xét trường hợp các tham số của biến độc lập đồng thời bằng 0 có thể
xảy ra hay không
Có cặp giả thuyết thống kê:
Nếu giá trị Prob > F nhỏ hơn với mức y nghĩa thì bác bỏ Ho, chấp nhận H1 tức là hàmhồi quy mẫu phù hợp
Cấu trúc câu lệnh như sau: “test enroll priv police lenroll lpolice”
Ta thu được kết quả sau sau khi chạy lệnh trong Stata:
test enroll priv police lenroll lpolice
Như vậy, Prob > F = 0.0000 nhỏ hơn = 0.05, vì thế bác bỏ Ho
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0, mô hình hồi quy phùhợp
3.3. Kiểm định đa ràng buộc tuyến tính:
• Giả sử 2 yếu tố là enroll và priv đều cùng không ảnh hưởng tới crime:
Cặp giả thuyết cần kiểm định:
Sử dụng lệnh test trong stata để kiểm định, cấu trúc lệnh: “test enroll priv”:
Ta thu được kết quả sau:
test enroll priv
( 1) enroll = 0
( 2) priv = 0
F( 2, 91) = 17.68
Prob > F = 0.0000
Trang 20Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 2 yếu tố enroll và priv ảnh hưởng đến biến phụ thuộc
crime.
• Giả sử 3 yếu tố là enroll, priv và police đều cùng không ảnh hưởng tới crime:
Cặp giả thuyết cần kiểm định:
Sử dụng lệnh test trong Stata để kiểm định, cấu trúc câu lệnh như sau:
“test enroll priv police”
Ta thu được kết quả sau:
test enroll priv police
Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố enroll, priv và police ảnh hưởng đến biến phụ
thuộc crime.
• Giả sử 3 yếu tố là police, lenroll và lpolice đều cùng không ảnh hưởng tới biến crime:
Cặp giả thuyết cần kiểm định:
Sử dụng lệnh test trong stata để kiểm định với cấu trúc lệnh như sau:
“test police lenroll lpolice”
Ta thu được kết quả như sau:
test police lenroll lpolice
Trang 21Vì giá trị P-value = 0.0027 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố police, lenroll và lpolice ảnh hưởng đến biến phụ thuộc crime.
III Kiếm định và sửa chữa một số khuyết tật của mô hình
1 Vấn đề đa cộng tuyến:
1.1. Bản chất:
Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch,hiệu quả nhất) Tuy nhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu,dẫn tới mô hình không đạt được đầy đủ các tính chất trên Một trong những vấn đề ảnh hưởngđến mô hình mà ta gọi là vi phạm các giả định, đó là đa cộng tuyến
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc
lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau
1.2. Nguyên nhân:
Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
o Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng tuyếnhoàn hảo ít khi xảy ra
o Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các biến độclập đã có sẵn mối quan hệ cộng tuyến với nhau
o Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số liệu điều trakhông ngẫu nhiên
1.3. Cách phát hiện đa công tuyến:
Dùng lệnh corr [indep] để kiểm định đa cộng tuyến Nếu giữa 2 biến có giá trị
corr > 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
corr crime enroll priv police lenroll lpolice (obs=97)
| crime enroll priv police lenroll lpolice -+ - crime | 1.0000
enroll | 0.8360 1.0000 priv | -0.2226 -0.3038 1.0000 police | 0.7233 0.7151 -0.2838 1.0000 lenroll | 0.7195 0.9099 -0.3588 0.6485 1.0000
Trang 22lpolice | 0.6537 0.6940 -0.3568 0.9005 0.6924 1.0000
Từ bảng số liệu trên, ta thấy:
• corr (enroll, lenroll) = 0.9099 > 0.8
• corr (police, lpolice)= 0.9005 > 0.8
→ Do đó có xảy ra vấn đề đa cộng tuyến
• Tăng kích cỡ mẫu:
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng cácbiến trong mẫu ban đầu mà cộng tuyến có thể không nghiêm trọng nữa Điều này thực hiệnđược khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế Đối với nghiêncứu này, cần phải điều tra thêm những khu ky túc xá khác để làm cho hiện tượng đa cộngtuyến giảm xuống có thể giảm tính nghiêm trọng của đa cộng tuyến
2 Vấn đề về phương sai sai số thay đổi:
2.1. Bản chất:
Một vấn đề khác mà mô hình cũng có thể gặp phải, đó là phương sai của sai số thayđổi Hậu quả của phương sai sai số thay đổi là các ước lượng bình phương nhỏ nhất vẫn làkhông chệch nhưng không còn hiệu quả nữa, cùng với đó ước lượng của các phương sai sẽ bịchệch, như vậy làm mất hiệu lực của kiểm định Điều này làm cho mô hình kém hiệu quả hơn
Trang 23Phương sai của mỗi một ngẫu nhiên Ui, trong điều kiện giá trị đã cho của biến giải
thích Xi là không đổi, nghĩa là:
= = ; i = 1,2,3…n
Khi giả thiết đó bị vi phạm thì mô hình mắc lỗi phương sai sai số thay đổi Tên gọi của
lỗi này là Heteroskedasticity.
2.2. Nguyên nhân:
Có 5 nguyên nhân gây ra hiện tượng phương sai sai số thay đổi:
o Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian đượcđiều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế theo thời gianđược điều tra qua các giai đoạn có mức biến động khác nhau thì phương sai sai số có thểkhông đồng đều
o Do định dạng không đúng dạng hàm của mô hình
o Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện cácquan sát ngoại lai
o Do kỹ thuật thu thập, bảo quản và xử ly số liệu đượccải tiếnnên sai số có xu hướng giảm
o Học được các sai lầm trong quá khứ, nhờ thế cải tiến trong hiện tại
2.3. Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
Cách 1: Xem xét đồ thị của phần dư:
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dựđoán Yi (biểu diễn sự tương quan giữa e và Yi)
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:
Trang 24Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy cácgiá trị trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trungbình bằng 0 (đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khálớn Vì thế, ta có thể dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.
Cách 2: Dùng kiểm định White:
Cặp giả thuyết:
Nếu giá trị Prob > chi2 và <0.05, chúng ta bác bỏ giả thiết H0 và chấp nhận giả thiết
H1, có nghĩa là mô hình có hiện tượng phương sai sai số thay đổi
Sử dụng phần mềm stata, ta thu được bảng kết quả như sau:
imtest, white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity