- Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập ước lượng các tham số của mô hình.. - - Trong mô hình hỏi quy qua góc toạ độ: RÊ thô được tính bằng tỉ
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM INDUSTRIAL
MON: KINH TE LUQNG
BÀI TIỂU LUẬN NHÓM
GIẢNG VIÊN: LÊ NAM HÁI
NHÓM: 10
LỚP HOC PHAN: DHMK17F - 420300367213
NAM: 2022 — 2023
Trang 2DANH SÁCH THÀNH VIÊN NHÓM 10
1 Lý thuyết câu 3
2 Bài tập
1 Nguyễn Thị Kim Chi | 21129961 100%
1.Lý thuyết câu 5
2 Bài tập
2 Võ Minh Thư 20009451 90%
1.Lý thuyết cau 1
3 Luong Thi Thity Trang | 21075941) 2 Bài tập 100%
3 Lam Word
1.Ly thuyét cau 6
4 Ly Anh Việt 21118721| 2 Bài tập 100%
3 Làm PPT
2 Bài tập
Trang 3
MỤC LỤC
PHAN 12 LY THUYET c.ccesesccsssssesccssessvsscssvssssssssvssssssssvessvavsssesavsvesssavsnessvssvsnssnsnusavensesusavensesnsavesavanssuesavenssnvenvensenvensenss 1 Câu 1 Trong kinh tế lượng, có những dạng dữ liệu nào? Anh chị hãy trình bày cụ thẻ và cho ví dụ minh họa thực tế tương ứng với những dạng dữ liệu đó? Gợi ý: anh/chị có thẻ vào trang web của tông cục thống kê để lấy ví dụ minh
họa và trình bày só liệu dudi dang bang biéu dé trực quan cho ví dụ của mình -:-:©sccccxccccrerrerrreerrvee 1 Câu 2 Trình bày sự hiệu biết của anh chị về mục đích của phân tích hồi qU2 5:55 cccverxeerrrrrrerrrrrree 3 Câu 3 Từ việc áp dụng phương pháp OLS trong phân tích hỏi quy hai biến chúng ta có thể suy ra một số tính chất
hIÊ- ni syớnÔdẢúẮ ]HÄ]d Ỏ 3 Câu 4 Ước lượng OLS là BLUE (Best Linear Unbiased Estimator) khi nầO? - HH 3
Câu 5: Trong mô hình hỏi quy qua gốc tọa độ (tung độ góc không có hay bằng 0), chúng ta có thê so sánh RÊ thô
trong mô hình hồi quy nảy với R2 trong mô hình hỏi quy trước (mô hình có tung độ gốc) hay không? 4
Câu 6: Trình bày sự hiệu biết của anh chị về hiện tượng phương sai sai số thay đôi, hiện tượng đa cộng tuyến và hiện tượng tự tương quan trong phân tích hồi quy? Cac van dé trên xảy ra khi nào? Biện pháp khắc phụG?
PHAN 2: BAI TAP 5-44
ii is 8
i01 10
is 12
In = 15
F.5)000nn 1/04/9011 : £‹£1£ŒäLH.LH).) H.HẬH), 17
Trang 4PHAN 1: LY THUYET
Câu 1 Trong kinh tế lượng, có những dạng dữ liệu nào? Anh chị hãy trình bày cụ thể và cho ví dụ minh họa thực tế tương ứng với những dạng dữ liệu đó? Gợi ý: anh/chị có thể vào trang web của tổng cục thống kê đề lấy ví dụ minh họa và trình bày số liệu dưới dạng bảng biếu đề trực quan cho ví dụ
của mình
1 Có 4 loại dữ liệu:
1.1 Dữ liệu chéo
- Bao gỏm các cá nhân, hộ gia đình, công ty, thành phó, quốc gia hoặc các đơn vị khác, được lấy tại một thời điểm hoặc trong một khoáng thời gian nhát định
- Các quan sát thường độc lập với nhau, có thé giá định rằng mẫu được thu thập ngẫu nhiên từ tông thê
- Đôi khi là việc lầy mẫu ngấu nhiên bị vi phạm
- Ví dụ minh họa: Diện tích và mật độ dân sé cua mét sé tinh/thanh phó năm 2021
Tỉnh Diện tích (km2) [ Mật độ dân số ( Người/km?)
Hà Nội 3.359,82 2.480,00 Vĩnh Phúc 1.236,00 964,00
Bắc Ninh 822,71 1.778,00
Quang Ninh 6.207,79 218,00
1.2 Dữ liệu chuỗi thời gian
- Các quan sát của một hay nhiều biến theo thời gian
- Các quan sát chuỗi thời gian thường gặp vấn đề tương quan chuỗi
- Thứ tự quan sát cũng truyền tái những thông tin quan trọng
- Có tính xu thế và thời vụ
Ví dụ minh họa:
Chỉ số giá tiêu dùng các tháng trong năm chia theo Năm và Các tháng (tháng trước = 100)
Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng Tháng
1 2 3 4 5 6 7 8 9 10 11 12
2021 100,06 101,52; 99,73 99,96 100,16 100,19| 100,62 100,25 99,38 99,80 100,32 99,82 1.3 Dữ liệu chéo gộp
- Hai hay nhiều bộ đữ liệu chéo được két hợp thành một tập hợp dữ liệu
- Các dữ liệu chéo thường độc lập với nhau
- Dữ liệu chéo gộp thường dùng đề đánh giá thay đổi chính sách
- Ví dụ minh họa:
Trang 5Tổng số Chỉ số phát triển (Năm trước = 100) - %
Trường ngoài công viên ngoài công Trường ngoài công Giáo viên ngoài công
2019 172,00 65,00 56,99 16,14 100,00 100,00) 100,01 98,87
2020 176,00 66,00 58,40 18,24 102,33 101,54) 102,37 112,98
1.4 Dữ liệu bảng/dữ liệu dọc
- Dữ liệu chuỗi thời gian cho các đữ liệu chéo
- Cac don vi trong dữ liệu chéo là giống nhau theo thời gian ( cá nhân, công ty, thành phỏ, )
- Ví dụ minh họa:
Diện tích, dân số và mật độ dân số phân theo địa phương chia theo Địa phương, Năm và Chỉ tiêu
Diện tích(Km2) Dân số trung bình (Nghìn người) Mật độ dân số (Người/km2) Bình Định
2018 6.066,20 1.534,80 253,00
2019 (*) 6.066,20 1.487,80 245,00
2020 (*) 6.066,21 1.487,90 245,00
2021 (*) 6.066,40 1.508,32 249,00 Kon Tum
2018 9.674,20 535,00 55,00
2019 (*) 9.674,20 543,40 56,00
2020 (*) 9.674,18 555,64 57,00
2021 (*) 9.677,30 568,78 59,00
Bạc Liêu
2018 2.669,00 897,00 336,00
Trang 6Diện tích, dân số và mật độ dân số phân theo địa phương chia theo Địa phương, Năm và Chỉ tiêu
Diện tích(Km2) Dân số trung bình (Nghìn người) Mật độ dân số (Người/km2)
2019() 2.669,00 908,20 340,00
2020 (*) 2.669,01 913,48 342,00
2021 (*) 2.667,88 918,51 344,00
Câu 2 Trình bày sự hiểu biết của anh chị về mục đích của phân tích hồi quy?
- Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập (ước lượng các tham số của mô hình)
- Kiểm định các giá thuyết về bản chát của mi quan hệ giữa biến phụ thuộc và biến độc lập mà lý thuyết kinh tế đưa ra
- Trong trường hợp này phải trả lời hai câu hỏi:
+ Có tỏn tại quan hệ giữa biến phụ thuộc và biến độc lập hay không?
+ Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
- Dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập
Câu 3 Từ việc áp dụng phương pháp OLS trong phân tích hồi quy hai biến chúng ta có thế suy ra một
số tính chất đại số nào?
Một sé tinh chat đại số được suy ra từ việc áp dụng phương pháp OLS:
- Tổng các phần dir OLS bang 0: > ô¡ = 0
- Hiệp phương sai giữa các biến độc lập và phân dư bằng 0: > Xiô¡= 0
- Điểm trung bình mẫu @Â) luôn nằm trên đường hỏi quy mẫu: * Bo + BX
Câu 4 Ước lượng OLS là BLUE (Best Linear Unbiased Estimator) khi nao?
Ước lượng OLS là BLUE (Best Linear Unbiased Estimator) khi
- Công thức ước lượng không chệch tuyền tính tốt nhát (Best Linear Unbiased Estimator -BLUE) là công thức ước lượng có phương sai nhỏ nhát trong tát cá các công thức ước lượng tuyến tính và không chệch
(tức giá trị kỳ vọng của nó băng giá trị chân thực của tham sé)
- Ước lượng bang OLS có tính chát đặc biệt gọi là ước lượng tuyến tính không chệch hiệu quả nhát (BLUE), thỏa mãn đồng thời 5 gia thuyét:
1 Mô hình hài quy có dạng tuyến tinh theo tham sé
2 Chọn mẫu ngẫu nhiên
3 Không có cộng tuyéền hoàn háo giữa các biến giải thích
(Các giá trị của x trong mẫu không được nhận cùng một giá trị)
4 Trung bình có điều kiện của sai số bằng 0
E (uilX4, Xa, ,X⁄) = 0 với VÍ => Ước lượng của OLS là không chệch => 5 @B
Trang 75 Với các giá trị của các biến giái thích cho trước, phương sai của sai số là một hằng só
Var (ulX+, Xa, Xa) = ø2; (Vi)
Câu 5: Trong mô hình hải quy qua gốc tọa độ (tung độ gốc không có hay bằng 0), chúng ta có thế so sánh RÊ thô trong mô hình hồi quy nảy với R2 trong mô hình hài quy trước (mô hình có tung độ gốc)
hay không?
- Không thế so sánh R? thô trong mô hình hỏi quy qua góc tọa độ với RZ trong mô hình hải quy có tung độ góc Vì R2 trong hai mô hình có cách tính khác nhau và BZ có thé âm đối với mô hình hỏi quy qua góc tọa độ
làm cho RẺ không có ý nghĩa -
- Trong mô hình hỏi quy qua góc toạ độ: RÊ thô được tính bằng tỉ lệ phương sai của biến phụ thuộc được giải
thích bởi biên độc lập
- Trong mô hình hỏi quy có tung độ góc: RÊ được tính bang tỉ lệ phương sai của biến phụ thuộc được giải
thích bởi cả biên độc lập và hệ sô góc
- RỶ thô trong mô hình hài quy qua góc toạ độ chỉ cho biết mức độ giải thích của biến độc lập đối với biến
phụ thuộc trong khi R? trong mô hình hỗi quy có tung độ góc cho biết mức độ giải thích cua cả biên độc lập
và hệ Số góc đôi với biên phụ thuộc
- Vậy đề so sánh hiệu quá giữa mô hình hài quy qua góc tọa độ và mô hình hỏi quy trước (có tung độ góc),
chúng ta nên so sánh R? được điều chỉnh thay vì R2 thô Néu R? được điều chỉnh của mô hình qua góc toa dé
cao hơn so với RÊ được điều chỉnh của mô hình có tung độ góc, thì ta có thế két luận rằng mô hình qua góc tọa độ có hiệu quá hơn trong việc giải thích sự biến động của mẫu dữ liệu
Câu 6: Trình bày sự hiểu biết của anh chị về hiện tượng phương sai sai số thay đối, hiện tượng đa cộng tuyến và hiện tượng tự tương quan trong phân tích hồi quy? Các vẫn đề trên xảy ra khi nào? Biện
pháp khắc phục?
6.1 Hiện tượng phương sai sai số thay đổi (Heteroscedasticity)
Định nghĩa:
- Phương sai thay đổi là tình huống thống kê trong đó có Sự thay đổi theo một quy luật nào đó trong phần dư
hoặc sai số sau khi phương trình hồi quy được ước lượng từ các kết quá quan sát mẫu của biến độc lập và phụ thuộc Nếu hệ só hỏi quy ước lượng được là những ước lượng tốt không chệch cho hệ số chân thực của các biến độc lập tính cho cá tổng thẻ, thì khi đó các giá trị của phần dư phái tuân theo phân phối ngẫu nhiên
và có phương sai không đổi Nếu chúng thay đổi, phương trình ước lượng được sẽ không chính xác hoặc đã
bỏ qua những biến độc lập quan trọng tác động tới biến phụ thuộc Hiện tượng phương sai thay đổi xảy ra khi phương sai của sai số không phải là hằng số, mà tăng hoặc giám khi biến độc lập tăng
- Hiện tượng phương sai sai số thay đổi thường hay xuất hiện trong dữ liệu bảng (panel-data) và đữ liệu cắt
ngang (cross-sectional data)
Vấn để phương sai sai số thay đổi xảy ra do những nguyên nhân:
Nguyên nhân gây ra hiện tượng phương sai không đồng nhát rát da dang:
- Do từ trong bản chát các yéu tố của hiện tượng kinh té
Trang 8tính toán có xu hướng giám xuống, kéo theo hiện tượng phương sai giảm dân
- Do hành vi của con người trong các hoạt động ngày càng hoàn thiện, các sai sót do đó cũng giảm theo, làm cho phương sai có xu hướng giảm
- Do điểm năm ngoài hay còn gọi là điểm vượt trội (outlier), đó là một vài trường hợp bắt thường với giá trị của dữ liệu rất khác biệt, hậu qua là phương sai thay đổi rất lớn
-Ngoài ra, việc xác định sai dạng mô hình, có thế làm cho một biến quan trọng bị bỏ sót cũng góp phân làm
phương sai của sai số lớn và thay đổi
Biện pháp khắc phục phương sai sai số thay đổi:
Khi đã phát hiện phương sai thay đôi, ta có thế khắc phục vi phạm này bằng các biện pháp sau đây:
(1) Đã biết ø?: Sử dụng phương pháp bình phương nhỏ nhất có trọng só (WLS) hoặc phương pháp bình phương nhỏ nhát tống quát (GLS)
(2) Chưa biết ø?: xây dựng mô hình hải quy dựa trên một só giả thiết, ví dụ thay vì thực hiện hỏi quy tuyến
tính thông thường, ta nên sử dụng mô hình dạng tuyền tính logarit: In Y¡ =B+ +Ba ln X¡ + Ú¡ Việc ước lượng
mô hình hỏi quy tuyến tính logarit này có thẻ làm giảm phương sai thay đổi Ngoài ra, phép biến đôi logarit
có ưu thế ở Chỗ:
+ Giá trị của Ln(X;) và Ln(Y;) trở nên rát bé so với giá tri cua Xi va Yi Vi du: Xi = 10.000 > Ln(Xi) =
921034 Điều này giúp thuận tiện hơn khi xử lý số liệu cũng như vẽ biéu đồ Thật vậy, vẽ biếu đồ với giá trị tuyệt đối của X¡ và Y¡ quá lớn sẽ khó khăn và thiếu chính xác khi chọn đơn vị trên các trục, chưa kế hình
dạng đường biếu diễn cũng bị lệch lạc
+ Hệ số góc /; chính là hệ số co giãn của Y đối với X Khi đề cập tới hệ số co giãn, đơn vị đo lường của biến
X và của biến Y không được nhắc tới nữa, nghĩa là vấn đề kháo sát không còn phụ thuộc vào đơn vị đo lường Điều này giúp cho mô hình hải quy dạng log - log trở nên rát thông dụng khi khảo sát và phân tích một hiện tượng kinh té
Lưu ý:
- Điều kiện để sử dụng phương pháp logarit hóa là giá trị của các biến phải dương Ta có thê dựa vào biểu đồ phan dư Ẵ; theo (X) đề khảo sát tính không đổi của phương sai
- Trong thực hành, có thẻ sử dụng phân mềm EVIEWS để kiểm định và khắc phục hiện tượng phương sai
thay đổi Ví dụ như sử dụng phương pháp ARCH
6.2 Hiện tượng đa cộng tuyến (Multicollinearity)
Định nghĩa:
- Đa cộng tuyến là hiện tượng tạo nên từ mối quan hệ tương quan mạnh giữa các biến độc lập với nhau trong
mô hình hài quy tuyến tính Hiện tượng này được thế hiện đưới dạng hàm số sau khi vi phạm giá thuyết của
mô hình hài quy tuyến tính có điển (Giá thuyết vi phạm: Các biến độc lập không có quan hệ tuyến tính với
nhau)
Trang 9- Trong thống kê , đa cộng tuyến (cũng là tính cộng tuyến) là hiện tượng trong đó một biến dự báo trong mô hình hỏi quy bội số có thế được dự đoán tuyến tính từ các biến khác với mức độ chính xác đáng kế Trong trường hợp này, các ước lượng hệ số của hỏi quy bội có thê thay đổi thất thường để đáp ứng với những thay
đổi nhỏ trong mô hình hoặc dữ liệu
(Đa cộng tuyến không làm giám sức mạnh dự đoán hoặc độ tin cậy của mô hình nói chung, ít nhát là trong tập dữ liệu mẫu; nó chỉ ánh hưởng đến các tính toán liên quan đến các yếu tố dự đoán riêng lẻ Nghĩa là, một
mô hình hài quy đa biến với các yếu tổ dự đoán cộng tuyến có thẻ cho biết toàn bộ nhóm các yếu tố dự báo
dự đoán biến kết quá tốt như thế nào, nhưng nó có thê không đưa ra kết quả hợp lệ về bát kỳ dự đoán riêng lẻ
nào hoặc vẻ những yéu tố dự đoán nào là dư thừa so với những người khác.)
Van dé đa cộng tuyến xáy ra khi:
(1) Các biến độc lập được chọn có quan hệ nhân quá hay có mi quan hệ tương quan cao vì cùng phụ thuộc vào một điều kiện khác
(2) Kích cỡ mẫu quá bé
(3) Cách thu thập mẫu cục bộ, tạo thành một mẫu không có tính đại diện cao cho tổng thẻ
(4) Chọn biến Xi có độ biến thiên nhỏ, nghĩa là mức độ biến động giữa các biến X không cao
Biện pháp khắc phục hậu quá của Đa cộng tuyến:
(1) Sử dụng thông tin có trước
(2) Thu thập thêm số liệu hoặc lấy mẫu mới
(3) Kết hợp số liệu chéo và số liệu chuỗi thời gian
(4) Bỏ đi biến độc lập có đa cộng tuyến
(5) Chuyên dạng đữ liệu bằng cách sử dụng sai phân bậc một, chuẩn hóa só liệu
6.3 Hiện tượng tự tương quan (Autocorrelation)
Định nghĩa:
Tự tương quan là sự tương quan giữa các thành phản của chuỗi các quan sát được sắp xép theo thứ tự thời
gian trong các só liệu chuỗi thời gia n hoặc sắp xép theo thứ tự không gian, đối với các số liệu the o khô ng gian (số liệu chéo)
Tự tương quan bậc 1: Ut = øÙi-1 + et
Ty tuong quan bac 2: Ut = pUt1 4+ poUte + et -lspst)
Tổng quát, tự tương quan bậc p: Ut = pUt1+ p2Ut-2 + ppUty + øt (ÝJ<ð<7)
Trang 10Vấn đề tự tương quan xảy ra do những nguyên nhân sau:
(1) Nguyên nhân khách quan
- Quán tính của các biến kinh té (Inertia)
Thẻ hiện rõ ở tính chu kỳ đối với các chuỗi thời gian như tổng sản phẩm, tỷ lệ thát nghiệp hay chỉ số giá
- Hiện tượng mạng nhện (Cobweb phenomenon)
Một số hoạt động kinh tế có phán ứng chậm với sự biến động của các yếu tó tác động, lý do là phái mát một khoáng thời gian để các biến động đó có hiệu lực Ví dụ như việc thay đổi mức cung của một số hàng hóa do ảnh hưởng của sự biến động về giá được thực hiện sau một khoảng thời gian kẻ từ khi giá thay đi Lý do ở chỗ, ngay từ đầu năm, khi quy hoạch sản lượng sản xuất, các nhà sản xuất đã chuân bị một lượng cung với
mức giá cũ Vì vậy hàm cung như sau: Y=Bi+ BaP:-+U
- Các độ trễ (Lags): Khi phân tích chuỗi thời gian, có thê xáy ra hiện tượng biến phụ thuộc ở thời kỳ t bị anh hưởng bởi chính biến phụ thuộc đó ở thời kỳ (t— 1) Thật vậy, chỉ tiêu cho tiêu dùng ở thời điểm hiện tại chăng hạn, ngoài việc phụ thuộc thu nhập hiện tại còn có thẻ bị ánh hưởng bởi tiêu dùng ở thời kỳ trước đó
Vì vậy hàm chi tiêu dùng theo thu nhập có thê được đề nghị như sau: Y¡ = B1 + BoXt + BaYta + Ut
(2) Nguyên nhân chủ quan
- Xử lý số liệu
- Mô hình bị sai lệch:
+ Thiếu biến quan trọng
+ Dạng hàm sai
Biện pháp khác phục hiện tượng tự tương quan:
Đề khắc phục hậu quá trên, các biện pháp sử dụng còn tùy thuộc vào bán chất của nhiễu Ta phân biệt ha
trường hợp:
- Khi đã biết (p)
- Trường hợp chưa biết hệ số tự tương quan (p)
Thực té, rất hiếm khi ta biết được giá trị của hệ số tự tương quan (p), nên thông thường trong xử lý số liệu, ta
phái ước lượng p Sau đây là một số phương pháp đùng để ước lượng p
a Ước lượng p dựa vào thống kê d
b Phương pháp Durbin — Watson hai bước
c Thủ tục lặp Cochrane — Orcutt (CORC)
Lưu ý: Trong thực hành, để nhận biết cũng như khắc phục hiện tượng tự tương quan, ta có thế sử dụng phản mèm EVIEWS, nhanh chóng và hiệu quá