❖ Kiếm định phương sai sai số không đổi của phần dư.. Câu 3: Ước lượng mô hình hồi quy đơn psoda theo prpblck Từ kết quả trên ta thu được mô hình hồi quy mẫu: psoda= 1.0378 + 0.0650prpb
Trang 1BÀI TẬP KINH TẾ LƯỢNG
(Nhóm 6)
I ĐÁNH GIÁ THÀNH VIÊN
STT
Tiêu chí Tên
thành viên
MSSV
Tham gia cuộc họp thường xuyên, đúng giờ
Hoàn thành công việc được giao đúng hạn
Có thái độ hợp tác, phối hợp với nhóm
TỔNG
1 Nguyễn Thị Kim Cúc
Trang 2II BÀI LÀM
Câu 1:Phân tích thống kê mô tả các biến có trong dữ liệu DISCRIM:
Kết quả thu được về giá của soda tại 410 nhà hàng thức ăn nhanh, cùng với đặc điểm của dân số ở New Jersey và Pennsylvania (Hoa Kỳ):
- Giá soda tại các nhà hàng thức ăn nhanh ở New Jersey và Pennsylvania (Hoa Kỳ) cao nhất là 1.49 và thấp nhất là 0.73 Giá soda trung bình của 410 nhà hàng thức ăn nhanh
là 1.0449, độ lệch chuẩn là 0.0888
- Tỉ lệ da màu ở New Jersey và Pennsylvania (Hoa Kỳ) cao nhất là 0.9817 và thấp nhất
là 0 Tỉ lệ da màu trung bình là 0.1150, độ lệch chuẩn là 0.1839
- Tỷ lệ nghèo ở New Jersey và Pennsylvania (Hoa Kỳ) cao nhất là 0.4185 và thấp nhất
là 0.0043 Tỷ lệ nghèo trung bình là 0.0718, độ lệch chuẩn là 0.0679
- Thu nhập trung bình của hộ gia đình ở New Jersey và Pennsylvania (Hoa Kỳ) cao nhất là 136 529 và thấp nhất là 15 919 Bình quân mỗi hộ gia đình ở đây có thu nhập trung bình là 46 999.4, độ lệch chuẩn là 13 215.33
❖ Hiệp phương sai (Covariance):
Trang 3Từ kết quả trên ta có:
- Phương sai của các hệ số hồi quy nằm trên đường chéo chính:
var(psoda)= 0.0079 var(prpplck)= 0.0337 var(prppov)= 0.0046 var(income)= 1.74E+0.8
- Các thành phần còn lại là hiệp phương sai của những hệ số có trong mô hình
❖ Hệ số tương quan:
Từ kết quả trên ta có:
- r12= 0.1345 => cho biết mối quan hệ tuyến tính giữa giá psoda và prpblck yếu và đồng biến
- r13= 0.0260 => cho biết mối quan hệ tuyến tính giữa psoda và prppov rất yếu và đồng biến
- r14= 0.1350 => cho biết mối quan hệ tuyến tính giữa psoda và income yếu và đồng biến
- r23= 0.6795 => cho biết mối quan hệ tuyến tính giữa prpblck và prppov mạnh và đồng biến
- r24= -0.4346 => cho biết mối quan hệ tuyến tính giữa prpblck và income trung bình và nghịch biến
- r34= -0.7258 => cho biết mối quan hệ tuyến tính giữa prppov và income mạnh và nghịch biến
Trang 4Câu 2: Xét mô hình: psoda = β0 + β1prpblck + β2income + u (1)
a Ước lượng mô hình và thông báo kết quả hồi quy
Từ kết quả trên ta thu được mô hình hồi quy mẫu sau:
psaoda = 0,9563 + 0,1150prpblck + 1,60E-06income
b) Ý nghĩa thống kê và ý nghĩa kinh tế của các tham số trong mô hình (1):
Gọi: β0 là hệ số chặn của mô hình (1): β0 =0,9563
β1 là hệ số độ dốc ứng với biến prpblck của mô hình (1): β1 =0,1150
β2 là hệ số độ dốc ứng với biến income của mô hình (1): β2 =1,60E-07
❖ Kiểm định giả thuyết thống kê (Dùng thống kê t):
- Kiểm định β0
H0: β0=0
H1: β0≠0
Ta có: p-value=0 < α= 0.01, 0.05, 0.1 => Bác bỏ H0 => β0 có ý nghĩa thống kê
- Kiểm định β1
H0: β1=0 H1: β1≠0
Ta có: p-value=0 < α=0.01, 0.05, 0.1
=> Bác bỏ H0 => β1 có ý nghĩa thống kê
- Kiểm định β2
H0: β2=0 H1: β2≠0
Trang 5Ta có: p-value=0 < α=0.01, 0.05, 0.1
=> Bác bỏ H0 => β2 có ý nghĩa thống kê
❖ Ý nghĩa kinh tế:
- β0(hat)>0 có ý nghĩa kinh tế vì prpblck=0 và income=0 thì psoda>0
- β1(hat)=0,1150 có ý nghĩa kinh tế vì Khi tăng thêm prpblck 1 đơn vị thì trung bình psoda tăng lên 0.1150 đơn vị (các hệ số khác không đổi)
- β2(hat)=1,60E-07 có ý nghĩa kinh tế vì Khi income tăng thêm 1 đơn vị thì trung bình psoda tăng lên 1,60E-07 đơn vị( Các hệ số khác không đổi)
c Xây dựng khoảng tin cậy 99%, 95% và 90% của các tham số độ dốc
- Khoảng tin cậy của prplck
+ Khoảng tin cậy 99%: 0.05 < Prpblck(hat) < 0.18
+ Khoảng tin cậy 95%: 0.06 < Prpblck(hat) < 0.17
+ Khoảng tin cậy 90%: 0.07 < prpblck(hat) < 0.16
- Khoảng tin cậy của income
+ Khoảng tin cậy 99%: 6.66E-07 < income(hat) < 2.54E-06
+ Khoảng tin cậy 95%: 8.91E-06 < income(hat) < 2.31E-06
+ Khoảng tin cậy 90%: 1.01E-06 < income(hat) < 2.20E-06
d Đánh giá sự phù hợp của mô hình ? Kiểm định giả thiết về phân phối chuẩn và phương sai sai số không đổi của phần dư ?
❖ Đánh giá mức độ phù hợp của mô hình: Kiểm định F
H0: R2=0
H1: R2≠0
p-value=0 < α = 0.01, 0.05, 0.1
Trang 6=> Bác bỏ H0
Kết luận: Mô hình hồi quy phù hợp
Ta có R2 = 0.0642 cho biết tỷ lệ nghèo (prpblck) và thu nhập trung bình của hộ gia đình(income) trong mô hình trên chỉ giải thích được 6.42% sự thay đổi của giá soda
❖ Kiểm định giả thuyết về phân phối chuẩn
H0: phần dư có phân phối chuẩn
H1: phần dư không phân phối chuẩn
p-value=0 < α = 0.01, 0.05, 0.1 => bác bỏ H0
Kết luận: Phần dư không có phân phối chuẩn
❖ Kiếm định phương sai sai số không đổi của phần dư (Kiểm định White)
Trang 7
H0: phương sai sai số không đổi H1: phương sai sai số đổi F-stat=0.54 với p-value=0.75 > α = 0.01, 0.05, 0.1
LM-stat=2.72 với p-value= 0.74 > α = 0.01, 0.05, 0.1
=> Không đủ bằng chứng bác bỏ H0
Kết luận: Phương sai sai số không đổi
Trang 8Câu 3: Ước lượng mô hình hồi quy đơn psoda theo prpblck
Từ kết quả trên ta thu được mô hình hồi quy mẫu:
psoda= 1.0378 + 0.0650prpblck
• Ước lượng mô hình hồi quy đơn psoda theo prpblck
Ta có thể ước lượng sự thay đổi trong psoda bằng cách nhân thêm hệ số tương ứng với prpblck với sự thay đổi trong prpblck
- Do đó, khi prpblck thay đổi X đơn vị thì psoda thay đổi = 0.064927 * X đơn vị (*)
Hay ta nói tỉ lệ da màu có tác động tích cực lên giá bán soda, khi tỉ lệ da màu tăng X đơn vị
thì giá của soda trung bình sẽ tăng 0.064927*X đơn vị
• So sánh tác động của prpblck đến prsoda ở mô hình hồi quy đơn này với mô hình (1)
- Ở mô hình (1): Khi prpblck tăng X đơn vị thì psoda tăng = 0.114988 * X (**)
Từ (*) và (**) Ta thấy sau khi loại biến income ra khỏi mô hình (1) thì tác động của prpblck đến psoda giảm đi: 0.050057 * X đơn vị = > giảm 43.535847%
- Mặt khác mô hình (1) có hệ số tương quan là R2 = 0.064220
- Mô hình bỏ income có hệ số tương quan là R2 = 0.018076
Từ đó ta kết luận : Ở mô hình (1) hệ số tương quan cao hơn mô hình bỏ income => nên
mô hình (1) phù hợp hơn mô hình khi bỏ income
Trang 9Câu 4: Xét mô hình: log(psoda) = β0 + β1prpblck + β2log(income) + u (2)
(i) Phân tích các nội dung như câu 2
a) Ước lượng mô hình hồi quy như sau:
Từ kết quả trên ta thu được mô hình hồi quy mẫu sau:
log(psoda) = -0.7938 + 0.1216prpblck + 0.0765log(income)
b) Ý nghĩa thống kê và ý nghĩa kinh tế của các tham số trong mô hình (1):
Gọi: β0 là hệ số chặn của mô hình (1): β0 =-0.7938
β1 là hệ số độ dốc ứng với biến prpblck của mô hình (1): β1 =0.1216
β2 là hệ số độ dốc ứng với biến income của mô hình (1): β2 =0.0765
❖ Kiểm định giả thuyết thống kê (Dùng thống kê t):
- Kiểm định β0
H0: β0=0
H1: β0≠0 p-value=0 < α= 0.01, 0.05, 0.1 => Bác bỏ H0 => B0 có ý nghĩa thống kê
- Kiểm định β1
H0: β1=0
H1: β1≠0 p-value=0 < α=0.01, 0.05, 0.1 => Bác bỏ H0 => B1 có ý nghĩa thống kê
Trang 10- Kiểm định β2
H0: β2=0
H1: β2≠0 p-value=0 < α=0.01, 0.05, 0.1
=> Bác bỏ H0 => B2 có ý nghĩa thống kê
❖ Ý nghĩa kinh tế:
- β0(hat)<0 không có ý nghĩa kinh tế vì khi prpblck=0 và income=0 thì psoda<0
- β1(hat)=0,1216 có ý nghĩa kinh tế vì Khi tăng thêm prpblck 1 đơn vị thì psoda tăng lên 12,16%(các hệ số khác không đổi)
- β2(hat)=0,0765 có ý nghĩa kinh tế vì Khi income tăng thêm 1% thì psoda tăng lên 0.0765%( Các hệ số khác không đổi)
c) Xây dựng khoảng tin cậy 99%, 95%, 90% của các tham số độ dốc?
❖ Khoảng tin cậy của Prpblck:
+ Khoảng tin cậy 99%: 0.05 < Prpblck(hat) < 0.19
+ Khoảng tin cậy 95%: 0.07 < Prpblck(hat) < 0.17
+ Khoảng tin cậy 90%: 0.08 < prpblck(hat) < 0.16
❖ Khoảng tin cậy của income:
Khoảng tin cậy 99%: 0.03 < income(hat) < 0.12
Khoảng tin cậy 95%: 0.04 < income(hat) < 0.11
Khoảng tin cậy 90%: 0.05 < income(hat)< 0.10
d) Đánh giá sự phù hợp của mô hình? Kiểm định giả thuyết về phân phối chuẩn
và phương sai sai số không đổi của phần dư?
❖ Đánh giá sự phù hợp của mô hình: Kiểm định F
Trang 11H0: R2=0
H1: R2≠0
p-value=0 < α = 0.01, 0.05, 0.1
=> Bác bỏ H0
Kết luận: Mô hình hồi quy phù hợp
Ta có R2 = 0.0681 cho biết tỷ lệ nghèo (prpblck) và thu nhập trung bình của hộ gia đình (income) trong mô hình trên giải thích được 6.81% sự thay đổi của giá soda
❖ Kiểm định giả thuyết về phân phối chuẩn của phần dư:
H0: Phần dư có phân phối chuẩn
H1: Phần dư không có phân phối chuẩn
p-value=0 < α = 0.01, 0.05, 0.1 => bác bỏ H0
Kết luận: Phần dư không có phân phối chuẩn
Trang 12❖ Kiểm định phương sai sai số thay đổi của phần dư bằng kiểm định White:
H0: Phương sai sai số không đổi
H1: Phương sai sai số thay đổi F-stat=1.06 với p-value=0.3803 > α = 0.01, 0.05, 0.1
LM-stat=5.3251 với p-value= 0.3775 > α = 0.01, 0.05, 0.1
=> Không thể bác bỏ H0
Kết luận: Phương sai sai số không đổi
(ii) Nếu prpblck tăng 0.2 đơn vị thì psoda thay đổi như thế nào?
=> Khi prpblck tăng 0.2 đơn vị thì psoda sẽ tăng 0.2x12.16=2.43%
Trang 13Câu 5: Thêm biến prppov vào mô hình (2) và gọi là mô hình (3) Hãy ước lượng
mô hình (3) ? Nhận xét về hệ số ước lượng của prpblck ?
Phương trình mô hình hồi quy :
Log(psoda) = - 1,463332 + 0,072807prpblck + 0,136955log(income) + 0,38036prppov
❖ Ý nghĩa thống kê của prpblck :
p-value = 0,018 < α=0,05;0,1 nhưng > 0,01=> prpblck có ý nghĩa ở mức 5% và 10% nhưng không có ý nghĩa ở mức 1%
● Nhận xét về hệ số ước lượng của prpblck
- Ở mô hình (2) prpblck có ý nghĩa thống kê ở các mức α nhưng lại không có ý nghĩa thống
kê ở mức α=1%
- Ở mô hình (2) sự tăng lên của prpblck tác động lên psoda nhiều hơn prpblck ở mô hình (3)
- Dẫn đến giá của soda bị ảnh hưởng bởi tỉ lệ da màu trở nên ít hơn do xuất hiện thêm biến -
tỷ lệ nghèo
- Khi prpblck tăng lên 1 đơn vị thì psoda tăng 7,28% ở mô hình (3) trong khi psoda chỉ tăng tới 12,158%
Trang 14Câu 6: Phân tích sự tương quan giữa prppov và log(income) ? Ý nghĩa thực tế của sự tương quan này ? Từ đó nhận xét về vấn đề đa cộng tuyến trong mô hình (3) ? Ý nghĩa thực tế của mô hình (3) đối với ý tưởng của nhà nghiên cứu ở đề bài
❖ Phân tích sự tương quan giữa prppov và log( income):
❖ Hệ số tương quan:
- Có mối liên hệ tương quan nghịch mạnh giữa tỷ lệ nghèo (prppov) và thu nhập trung bình của hộ gia đình (income)
- Ý nghĩa thực tế của sự tương quan:
+ Khi tỷ lệ nghèo tăng sẽ giảm nhu cầu tiêu dùng, hạn chế đầu tư và kìm hãm tăng trưởng kinh tế, vì vậy thu nhập trung bình giảm
Trang 15+ Khi tỷ lệ nghèo giảm sẽ tăng nhu cầu tiêu dùng, khuyến khích đầu từ và thúc đẩy tăng trưởng kinh tế, vì vậy thu nhập trung bình của hộ gia đình tăng
❖ Nhận xét về đa cộng tuyến trong mô hình (3):
- Ma trận hệ số tương quan:
r34= -0.8402 rất lớn => nghi ngờ có đa cộng tuyến
- Hồi quy phụ biến prppov theo income:
Trang 16R2 thu được từ mô hình hồi quy phụ lớn hơn R2 toàn bộ( 0.703>0.087)=> có đa cộng tuyến
❖ Hồi quy giữa một biến giải thích với tất cả các biến giải thích:
Kiểm định thống kê:
Gọi: β1 là hệ số độ dốc ứng với biến log(income) của mô hình (3): β1 = 0,1593
β2 là hệ số độ dốc ứng với biến prppov của mô hình (3): β2 = 2,4034
- Kiểm định β1
H0: β1=0 H1: β1≠0 p-value=0 < α=0.01, 0.05, 0.1
Trang 17=> Bác bỏ H0 => β1 có ý nghĩa thống kê
- Kiểm định β2
H0: β2=0 H1: β2≠0 p-value=0 < α=0.01, 0.05, 0.1
=> Bác bỏ H0=> β2 có ý nghĩa thống kê
=> Có sự tương quan giữa các biến giải thích
=> Mô hình hồi quy (3) có đa cộng tuyến
❖ Ý nghĩa thực tế:
Mô hình này dự đoán giá soda dựa trên tỉ lệ da màu, thu nhập và tỉ lệ nghèo Kết quả cho thấy giá soda cao hơn ở khu vực có nhiều người da màu, thu nhập cao và nhiều người nghèo Mô hình có thể được ứng dụng để đánh giá hiệu quả chính sách giá soda và xác định thị trường mục tiêu cho doanh nghiệp
Gọi: