- Phương sai của các ước lượng trong mô hình thừa biến lớn hơn trong mô hình đúng.- Khoảng tin cậy rộng, các kiểm định không còn tin cậy nữa.. Đa cộng tuyến: a Khái niệm Trong các giả đị
Trang 1fdgdrTRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA MARKETING
Trang 2Mục lục
A.Mở đầu……… 3
Trang 3B Cơ sở lí thuyết……… 3 1.Các khuyết tật……… 2.Các lí thuyết liên quan………
3 3 C.Thực hành……… 8
1.Mô hình hồi
2.Mô hình hồi quy mẫu cụ thể……… 9 3.Thừa thiếu biến……… 10 4.Tự tương
luận………
29
Trang 4A Lời mở đầu
Trước khi vào bài bài thảo luận, nhóm 5 xin gửi lời cảm ơn chân thành tới thầy MaiHải An – giảng viên của bộ môn kinh tế lượng trường Đại Học Thương Mại vì đãđồng hành giảng dạy, chỉ dẫn nhiệt tình trong suốt quá trình nhóm thực hiện đề tài.Gạo Việt Nam được tôn vinh là ngon nhất thế giới Luôn là quốc gia đứng nhất nhì về xuất khẩu gạo, nay giá trị của hạt gạo Việt qua bàn tay chăm chút của các nhà khoa học càng được quốc tế công nhận
Năm 2020 vừa qua, trong bối cảnh nhiều doanh nghiệp trong lĩnh vực công nghiệp và dịch vụ lao đao vì dịch Covid 19, ngành nông nghiệp lại nổi lên như một điểm sáng, một trụ đỡ cho nền kinh tế Việt Nam với mức đóng góp hơn 41 tỷ USD kim ngạch xuất khẩu Theo ước tính của liên bộ, xuất khẩu gạo năm 2020 đạt khoảng 6,15 triệu tấn, trị giá đạt khoảng 3,07 tỷ USD Mặc dù lượng gạo xuất khẩu giảm khoảng 3,5%
so với năm 2019, chủ yếu vì mục tiêu bảo đảm an ninh lương thực quốc gia, nhưng trị giá xuất khẩu lại tăng tới 9,3% Giá xuất khẩu bình quân cả năm ước đạt 499 USD/tấn,tăng 13,3% so với năm 2019
Vậy đối với một nền nông nghiệp lúa gạo mang tính quan trọng như vậy thì những nhân tố ảnh hưởng đến giá trị xuất khẩu gạo sẽ luôn là một trong những vấn đề được quan tâm hàng đầu Trong bài thảo luận này, nhóm 5 sẽ đi sâu vào các yếu tố: Năng suất, chỉ số giá tiêu dùng, diện tích gieo trồng, sản lượng trong nước, thu nhập bình quân
Trang 5- Phương sai của các ước lượng trong mô hình thừa biến lớn hơn trong mô hình đúng.
- Khoảng tin cậy rộng, các kiểm định không còn tin cậy nữa
1.2 Thiếu biến:
- TH1: Nếu biến có số liệu
+ Ước lượng mô hình có thêm
+ Kiểm định Ho: Nếu bác bỏ Ho thì mô hình ban đầu đã bỏ sót biến
- TH2 : Không biết số liệu của
Kiểm định Reset of Ramsey
B1: Ước lượng mô hình gốc ban đầu:
TCKĐ: F ( trong đó m là số biến độc lập mới thêm vào mô hình,
k là số tham số trong mô hình mới)
- Nếu hoặc p-value < a ®Bác bỏ Ho
1.3 Đa cộng tuyến:
a) Khái niệm
Trong các giả định của mô hình hồi quy tuyến tính cổ điển (CLRM), có giảthiết: Các biến độc lập không có mối quan hệ tuyến tính chính xác Nếu giảthiết này vi phạm, sẽ có hiện tượng đa cộng tuyến, đó là hiện tượng các biếnđộc lập trong mô hình phụ thuộc lẫn nhau và thể hiện được dưới dạng hàmsố
b) Bản chất của đa cộng tuyến
Xét mô hình hồi quy tuyến tính cổ điển nhiều biến:
- Đa cộng tuyến hoàn hảo (toàn phần) xảy ra giữa các biến giải thích
Trang 6Nếu tồn tại không đồng thời bằng 0 thỏa mãn:
thì mô hình có đa cộng tuyến hoàn hảo
- Đa cộng tuyến không toàn phần xảy ra giữa các biến giải thích
Nếu tồn tại không đồng thời bằng 0 thỏa mãn:
=> Mô hình xảy ra hiện tượng đa cộng tuyến không toàn phần
Nhận xét: Trong thực tế chủ yếu gặp phải đa cộng tuyến không toàn phần.
- Có 3 cách phát hiện đa cộng tuyến:
Cách 1: Hệ số xác định bội R2cao nhưng tỉ số t thấp
Trong trường hợp R cao (thường R > 0,8) mà tỷ số t thấp ( )2 2
® Mô hình có đa cộng tuyến
Nhược điểm: Chỉ thể hiện rõ khi có đa cộng tuyến ở mức độ cao
Cách 2: Hệ số tương quan cặp
=> Hệ số tương quan cao
® Xảy ra đa cộng tuyến giữa
Cách 3: Thực hiện mô hình hồi quy phụ (hồi quy của mỗi biến độc lập theo cácbiến độc lập còn lại)
- Giải pháp 1: Bỏ bớt biến độc lập (điều này xảy ra với giả định rằng không có mối
quan hệ giữa biến phụ thuộc và biến độc lập bị loại bỏ mô hình)
- Giải pháp 2: Bổ sung dữ liệu hoặc tìm dữ liệu mới, tìm mẫu dữ liệu khác hoặc gia
Trang 7tăng cỡ mẫu.
- Giải pháp 3: Thay đổi dạng mô hình, mô hình kinh tế lượng có nhiều dạng hàm khácnhau Thay đổi dạng mô hình cũng có nghĩa là tái cấu trúc mô hình
- Giải pháp 4: Sử dụng phương trình sai phân cấp 1
1.4 Phương sai sai số thay đổi:
a) Kiểm định Park:
Park đưa ra giả thiết:
«
Vì chưa biết nên ước lượng hàm trên park đề nghị sử dụng thay cho
B1: Ước lượng mô hình hồi quy gốc để thu được các phần dư
B2: Ước lượng hồi quy:
Nếu có nhiều biến giải thích thì ước lượng hồi quy này với từng biến giải thích B3: KĐGT:
B1: ước lượng mô hình gốc thi được
B2: ước lượng mô hình White ở dạng (1) hoặc (2) thu được
B3: KĐGT: «
TCKĐ:
Trang 8nếu H đúng0
Dựa vào bảng kiểm định white bằng phần mềm eview ta có được p-value
Với α cho trước, nếu p-value < α, bác bỏ Ho
c) Kiểm định Glejser:
Tương tự kiểm định Park, nhưng mô hình ở B2 thay thế bởi một trong các mô hình:
d) Kiểm định G-Q:
B1: sắp xếp các giá trị quan sát theo chiều tăng dần biến
B2: Bỏ c quan sát ở giữa theo quy tắc
Nếu n= 30 lấy c= 4 hoặc c=6
Nếu n=60 lấy c=10
Các quan sát còn lại chia làm 2 nhóm mỗi nhóm có (n-c)/2 quan sát
B3: ước lượng mô hình với (n-c)/2 quan sát đầu và cuối thu được và tương ứng vớibậc tự do là:
B1: ước lượng mô hình gốc thi được
B2: ước lượng mô hình thu được
Trang 9Dựa vào bảng kiểm định B-G bằng phần mềm eview ta có được: p-value
Với α cho trước, nếu p-value < α, bác bỏ Ho
Trường hợp tự tương quan bậc nhất ( với n và k’, tra bảng thống kê d ta tìm được và):
- Nếu 0 < d < có tự tương quan dương
- Nếu : không đủ cơ sở để kết luận
- Nếu : không có tự tương quan
Trang 10- Nếu : có tự tương quan âm
2 Các lý thuyết khác liên quan đến đề tài
2.1 Tỷ giá hối đoái
Là giá cả một đơn vị tiền tệ của một nước được tính bằng tiền của nước khác Hay nóikhác đi, là số lượng đơn vị tiền tệ cần thiết để mua một đơn vị ngoại tệ
- Quy ước:
E: Tỷ giá hối đoái của đồng ngoại tệ tính theo đồng nội tệ (tỷ giá hối đoái củađồng tiền có liên quan trong thị trường ngoại hối đang xem xét): Cho biết muốn cómột đồng ngoại tệ thì cần phải có bao nhiêu đồng nội tệ (Ví dụ: EUSD/VNĐ =21.300)
e: Tỷ giá hối đoái của đồng nội tệ tính theo đồng ngoại tệ,cho biết muốn có mộtđồng nội tệ thì có bao nhiêu đồng ngoại tệ
Nếu E gọi là tỷ giá hối đoái danh nghĩa: là tỷ lệ mà tại đó một người đổi đồng tiền củamột quốc gia này lấy một đồng tiền quốc gia khác
Tỷ giá hối đoái thực tế (còn gọi là sức cạnh tranh của hàng hoá trong nước - Er): là tỷ
lệ mà tại đó một người trao đổi hàng hoá và dịch vụ của nước này lấy hàng hoá vàdịch vụ của nước khác: E = E.(r
: Giá cả của hàng hoá trên thị trường thế giới
CPI: Giá cả của hàng hoá trên thị trường trong nước
Hoặc CPI : Nội tệ
: Ngoại tệ
2.2 Các nhân tố ảnh hưởng đến tỷ giá hối đoái
tăng dẫn đến nhu cầu về hàng hoá và dịch vụ tăng ( cả hàng hoá dịch vụnước ngoài) Do đó, nhu cầu sử dụng ngoại tệ tăng dẫn đến đồng ngoại tệtăng giá nên tỷ giá hối đoái tăng và ngược lại
- Chênh lệch lạm phát: là một trong những yếu tố ảnh hưởng mạnh, có mối quan hệhai chiều Khi lạm phát cao, mọi người không tin nội tệ mà đi tích ngoại tệ làm tý giáhối đoái biến động Theo nguyên tắc chung, khi một đất nước duy trì tỷ lệ lạm phát ởmức thấp, giá trị của đồng tiền nước này sẽ tăng lên, bởi sức mua trong nước tăng lêntương đối so với các đồng tiền khác
Công thức CLLP= LPM – LPVN
Trang 11- Cán cân thương mại: Là mức chênh lệch của giá trị xuất khẩu và nhập khẩu Nếu tốc
độ tăng giá xuất khẩu của một quốc gia nhanh hơn tốc độ tăng giá nhập khẩu, thì tỷ lệtrao đổi thương mại đã được cải thiện tích cực Tỷ lệ trao đổi thương mại tăng chothấy nhu cầu về hàng xuất khẩu của nước đó đang tăng, dẫn đến doanh thu từ xuấtkhẩu tăng, và nhu cầu cho nội tê tăng lên (và giá trị của đồng nội tệ tăng) nên tỷ giáhối đoái tăng và ngược lại
- Chênh lệch lãi suất: Một nền kinh tế có lãi suất cho vay cao sẽ đem lại lợi nhuận caohơn cho chủ nợ so với các nền kinh tế khác Do đó, lãi suất cao thu hút vốn đầu tưnước ngoài và làm tỷ giá hối đoái tăng Tuy nhiên, tác động của lãi suất cao sẽ trở nêntiêu cực, nếu lạm phát trong nước cao hơn nhiều so với các nước khác, hoặc nếu cóthêm những yếu tố khác làm giảm giá trị đồng tiền Ngược lại, lãi suất giảm có xuhướng làm giảm tỷ giá hối đoái
Công thức CLLS= LSM - LSVN
C.Thực hành
1 Mô hình hồi quy
Khi ước lượng mô hình giá trị xuất khẩu gạo theo năng suất, chỉ số giá tiêu dùng, diện tích gieo trồng, sản lượng trong nước, thu nhập bình quân ta được mô hình sau:
+ + +
Trong đó
Yt là giá trị xuất khẩu gạo (triệu USD)
Xt là năng suất (tạ/ha)
Zt là chỉ số giá tiêu dùng (%)
Mt là diện tích gieo trồng (nghìn ha)
St là sản lượng trong nước (nghìn tấn)
Kt là thu nhập bình quân đầu người
- Khi năng suất tăng, giá trị xuất khẩu tăng nên mang dấu (+)
- Khi chỉ số giá tiêu dùng tăng, giá trị xuất khẩu giảm nên mang dấu (+)
Trang 19Prob(F-statistic) 0.521498
Bài toán kiểm định :
Tiêu chuẩn kiểm định :
Ước lượng mô hình có dạng:
Thực hiện kiểm định Park trên phần mềm Eviews ta có kết quả như sau:
Dependent Variable: LOG(RESID^2)
Method: Least Squares
Date: 03/27/21 Time: 15:12
Sample: 2005 2019
Included observations: 15
Trang 20Variable Coefficient Std Error t-Statistic Prob
C 1028.445 2711.886 0.379236 0.7124 LOG(X) -692.1557 1130.518 -0.612247 0.5540 LOG(M) -553.0558 1143.021 -0.483855 0.6389 LOG(S) 625.6462 1130.671 0.553340 0.5922 LOG(K) 5.267952 4.565384 1.153890 0.2754
R-squared 0.407331 Mean dependent var 9.227023 Adjusted R-squared 0.170263 S.D dependent var 2.311387 S.E of regression 2.105440 Akaike info criterion 4.588128 Sum squared resid 44.32878 Schwarz criterion 4.824144 Log likelihood -29.41096 Hannan-Quinn criter 4.585614 F-statistic 1.718205 Durbin-Watson stat 1.642740 Prob(F-statistic) 0.222053
Trang 21Bài toán kiểm định:
Tiêu chuẩn kiểm định:
Ước lượng mô hình có dạng:
Dependent Variable: ABS(RESID)
Method: Least Squares
Trang 22R-squared 0.301967 Mean dependent var 1.495914
Adjusted R-squared 0.022754 S.D dependent var 0.876779 S.E of regression 0.866747 Akaike info criterion 2.813062 Sum squared resid 7.512505 Schwarz criterion 3.049079 Log likelihood -16.09797 Hannan-Quinn criter 2.810548 F-statistic 1.081492 Durbin-Watson stat 1.963563 Prob(F-statistic) 0.415935
Bài toán kiểm định:
Tiêu chuẩn kiểm định:
Nếu đúng thì
Trang 23Ta thấy rằng hệ số xác định bội R của mô hình là rất gần 1, chứng tỏ mô hình đưa ra 2
là hoàn toàn phù hợp Các thống kê t đều có |t| >t12 (2.179) => mô hình không xảy ra
α/2
đa cộng tuyến
b, Hệ số tương quan cặp giữa các biến giải thích cao:
Ta có bảng thể hiện hệ số tương quan cặp giữa các biến:
Trang 24Ta thấy:
|r(X,S)|= 0,974363 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến X và S
|r(X,K)|= 0,914242 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến X và K
|r(S,K)|= 0,856363 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến S và K
|r(S,M)|= 0.892852 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến S và M
=> có cơ sở kết luận có đa cộng tuyến trong mô hình
Trang 25R-squared 0.591367 Mean dependent var 54.40667
Adjusted R-squared 0.559933 S.D dependent var 3.259594
S.E of regression 2.162334 Akaike info criterion 4.503819
Sum squared resid 60.78394 Schwarz criterion 4.598226
Log likelihood -31.77864 Hannan-Quinn criter 4.502814
F-statistic 18.81336 Durbin-Watson stat 0.652634
Prob(F-statistic) 0.000805
Với = 0,05, kiểm định giả thuyết Ho: R = 02
P-giá trị= 0.0008 < 0,05 -> bác bỏ giả thuyết Ho -> Mô hình xảy ra hiện tượng đa cộng tuyến
*Tiến hành hồi quy X theo S:
Dependent Variable: X
Method: Least Squares
Date: 03/26/21 Time: 17:30
Sample: 1 15
Trang 26R-squared 0.949384 Mean dependent var 54.40667
Adjusted R-squared 0.945490 S.D dependent var 3.259594
S.E of regression 0.761028 Akaike info criterion 2.415273
Sum squared resid 7.529132 Schwarz criterion 2.509680
Log likelihood -16.11455 Hannan-Quinn criter 2.414268
F-statistic 243.8346 Durbin-Watson stat 0.708835
Prob(F-statistic) 0.000000
Trang 27Với = 0,05, kiểm định giả thuyết Ho: R = 0
P-giá trị= 0.0000 < 0,05 -> bác bỏ giả thuyết Ho -> Mô hình xảy ra hiện tượng đa cộng tuyến
*Tiến hành hồi quy X theo K:
Trang 28Adjusted R-squared 0.823211 S.D dependent var 3.259594
S.E of regression 1.370540 Akaike info criterion 3.591852
Sum squared resid 24.41893 Schwarz criterion 3.686259
Log likelihood -24.93889 Hannan-Quinn criter 3.590847
F-statistic 66.19024 Durbin-Watson stat 0.846545
Prob(F-statistic) 0.000002
Với = 0,05, kiểm định giả thuyết Ho: R = 02
P-giá trị= 0.0000 < 0,05 -> bác bỏ giả thuyết Ho -> Mô hình xảy ra hiện tượng đa cộng tuyến
6.2 Khắc phục đa cộng tuyến (Bỏ bớt biến độc lập)
|r(X,S)|= 0,974363 > 0,8 -> X và S có tương quan chặt chẽ Nhiều thông tin về Y chứa ở X cũng có thể chứa ở S Vậy nếu bỏ 1 trong 2 biến X hoặc S thì sẽ giải quyết vấn đề đa cộng tuyến nhưng một phần thông tin về Y sẽ mất đi
*Hồi quy Y theo X:
Trang 29R-squared 0.519751 Mean dependent var 2642.667
Adjusted R-squared 0.482809 S.D dependent var 753.6811
S.E of regression 542.0172 Akaike info criterion 15.55204
Sum squared resid 3819175 Schwarz criterion 15.64645
Log likelihood -114.6403 Hannan-Quinn criter 15.55103
F-statistic 14.06931 Durbin-Watson stat 0.612437
Prob(F-statistic) 0.002423
*Hồi quy Y theo S:
Dependent Variable: Y
Trang 30Method: Least Squares
R-squared 0.507214 Mean dependent var 2642.667
Adjusted R-squared 0.469307 S.D dependent var 753.6811
S.E of regression 549.0467 Akaike info criterion 15.57781
Sum squared resid 3918880 Schwarz criterion 15.67222
Log likelihood -114.8336 Hannan-Quinn criter 15.57680
F-statistic 13.38060 Durbin-Watson stat 0.655551
Trang 31Prob(F-statistic) 0.002893
Từ hai bảng kết quả, ta có:
· R2 khi loại bỏ biến X = 0,519751
· R2 khi loại bỏ biến S = 0,507214
=> vậy ta có thể loại bỏ biến X ra khỏi mô hình để khắc phục hiện tượng đa cộng tuyến Theo đó, sẽ không còn hiện tượng đa cộng tuyến giữa X và K
|r(S,K)|= 0,856363 > 0,8 -> K và S có tương quan chặt chẽ Nhiều thông tin về Y chứa
ở K cũng có thể chứa ở S Vậy nếu bỏ 1 trong 2 biến K hoặc S thì sẽ giải quyết vấn đề
đa cộng tuyến nhưng một phần thông tin về Y sẽ mất đi
*Hồi quy Y theo K:
Trang 32K 0.496618 0.266447 1.863853 0.0851
R-squared 0.210875 Mean dependent var 2642.667
Adjusted R-squared 0.150173 S.D dependent var 753.6811
S.E of regression 694.7888 Akaike info criterion 16.04866
Sum squared resid 6275509 Schwarz criterion 16.14307
Log likelihood -118.3649 Hannan-Quinn criter 16.04765
F-statistic 3.473948 Durbin-Watson stat 0.653662
Prob(F-statistic) 0.085081
Từ bảng kết quả, ta có:
· R2 khi loại bỏ biến K = 0,210875
· R2 khi loại bỏ biến S = 0,507214
=> vậy ta có thể loại bỏ biến S ra khỏi mô hình để khắc phục hiện tượng đa cộng tuyến Theo đó, sẽ không còn hiện tượng đa cộng tuyến giữa S và M
Như vậy sau khi kiểm tra tự tương quan thì nhóm loại đi 2 biến đó là S và X
7 Kiểm định tính phân phối chuẩn của sai số ngẫu nhiên Ui:
Giả thiết cặp cần kiểm định:
Tiêu chuẩn kiểm định:
JB = n
Trang 33Nếu đúng thì JB ~
Ta có kết quả Eview:
Từ kết quả Eview ta có:
P-value = 0,647586 > 0.05 => Nên chấp nhận H 0
Kết luận: Ui có phân phối chuẩn
8 Đưa ra mô hình cuối và giải thích ý nghĩa
Sau khi kiểm tra lần lượt khuyết tật của mô hình và khắc phục khuyết tật thừa biến ta thu được mô hình: