Phân tích hồi quy tuyến tính

10 0 0
Phân tích hồi quy tuyến tính

Đang tải... (xem toàn văn)

Thông tin tài liệu

Dieãn giaûi keát quaû Phaân taùn ñoà cho thaáy giöõa hai bieán döôøng nhö coù söï töông quan raát keùm vaø nghòch vôùi nhau. 1.1.1.2. Laäp phöông trình hoài quy ñôn bieán Ñeå laäp phöông trình hoài quy ñôn bieán, chuùng ta söû duïng leänh regress. Cuù phaùp regress bpt bñl Ví duï: laäp phöông trình hoài quy cho bieán so2 vaø bieán temp . regress so2 temp Source | SS df MS Number of obs = 40 + F( 1, 38) = 9.42 Model | 3077.5813 1 3077.5813 Prob > F = 0.0039 Residual | 12408.3187 38 326.534703 Rsquared = 0.1987 + Adj Rsquared = 0.1776 Total | 15485.9 39 397.074359 Root MSE = 18.07 so2 | Coef. Std. Err. t P>|t| 95% Conf. Interval + temp | 1.221609 .3979167 3.07 0.004 2.027149 .4160688 _cons | 96.32878 22.42333 4.30 0.000 50.93512 141.7224

Hoài quy ñôn bieán Hoài quy ñôn bieán laø phöông trình hoài quy tuyeán tính ñôn giaûn nhaát trong ñoù chæ coù moái quan heä giöõa hai bieán laø moät bieán phuï thuoäc vaø moät bieán ñònh tính Quy trình 1.1.1.1 Veõ phaân taùn ñoà Ñeå veõ phaân taùn ñoà chuùng ta thöïc hieän leänh scatter Cuù phaùp scatter bpt bñl Ví duï: veõ phaân taùn ñoà cho bieán so2 vaø bieán temp Dieãn giaûi keát quaû Phaân taùn ñoà cho thaáy giöõa hai bieán döôøng nhö coù söï töông quan raát keùm vaø nghòch vôùi nhau 1.1.1.2 Laäp phöông trình hoài quy ñôn bieán Ñeå laäp phöông trình hoài quy ñôn bieán, chuùng ta söû duïng leänh regress Cuù phaùp regress bpt bñl Ví duï: laäp phöông trình hoài quy cho bieán so2 vaø bieán temp regress so2 temp Source | SS df MS Number of obs = 40 -+ F( 1, 38) = 9.42 Model | 3077.5813 1 3077.5813 Prob > F = 0.0039 Residual | 12408.3187 38 326.534703 R-squared = 0.1987 -+ Adj R-squared = 0.1776 Total | 15485.9 39 397.074359 Root MSE = 18.07 so2 | Coef Std Err t P>|t| [95% Conf Interval] -+ temp | -1.221609 3979167 -3.07 0.004 -2.027149 -.4160688 _cons | 96.32878 22.42333 4.30 0.000 50.93512 141.7224 Dieãn giaûi keát quaû  Heä soá töông quan bình phöông R-squared = 0.1987=19.87% noùi leân raèng nhieät ñoä trung bình giaûi thích cho 19.87% söï thay ñoåi veà maät ñoä SO2  Döïa vaøo baûng heä soá chuùng ta coù ñöôïc phöông trình hoài quy Maät ñoä SO2= 96.32878 –1.221609 x nhieät ñoä Nhö vaäy neáu nhieät ñoä taêng leân moät ñôn vò thì maät ñoä so2 giaûm ñi 1.221609  Giaù trò t ôû doøng temp cho bieát giaù trò cuûa pheùp kieåm duøng ñeå kieåm tra moái quan heä giöõa hai bieán thaät söï coù yù nghóa hay khoâng (giaû thuyeát H0 : b =0) Trong baûng treân ta nhaän thaáy p=0.004 chöùng toû baùc boû giaû thuyeát H0, nhö vaäy giöõa hai bieán thaät söï coù moái lieân heä 1.1.1.3 Veõ ñöôøng thaúng hoài quy tuyeán tính Ñeå veõ ñöôøng thaúng hoài quy chuùng ta phaûi thöïc hieän caùc böôùc sau 1.1.1.3.1 Taïo giaù trò döï baùo cho bieán phuï thuoäc Giaù trò döï baùo cuûa bieán phuï thuoäc coù nghóa laø khi toâi theá moät giaù trò cuûa bieán ñoäc laäp vaøo phöông trình thì seõ ra moät giaù trò cuûa bieán phuï thuoäc töông öùn, vì vaäy Stata giuùp chuùng ta taïo ra caùc giaù trò döï baùo ñeå töø ñoù coù theå veõ ñöôïc ñöôøng thaúng hoài quy Chuùng ta seõ söû duïng leänh predict ñeå thieát laäp giaù trò döï baùo Cuù phaùp predict varname Ví duï: taïo bieán giaù trò döï ñoaùn cho bieán so2 predict yhat (option xb assumed; fitted values) 1.1.1.3.2 Veõ ñöôøng thaúng hoài quy Chuùng ta seõ söû duïng laïi leänh scatter vôùi caùc tuyø choïn connect (.1) : ñöøng noái lieàn caùc giaù trò taïo ra bôûi x vaø y maø haõy noùi lieàn caùc giaù trò cuûa x vaø yhat symbol(o i) : haõy söû duïng nhöõng voøng troøn nhoû cho y vaø aån bieåu töôïng cho yhat Ví duï: veõ ñöôøng hoài quy cho bieán so2 vaø temp scatter so2 yhat temp, connect( 1) symbol(o i) (note: named style 1 not found for style connectstyle, default attributes used) Hoài quy ña bieán Quy trình Moâ taû moái töông quan giöõa caùc bieán Loaïi boû giaù trò ngoaïi lai neáu coù Laäp phöông trình hoài quy tuyeán tính Loaïi boû moái töông quan ñoàng tuyeán tính Laäp laïi phöông trình hoài quy tuyeán tính Kieåm tra heä soá dö Moâ taû moái töông quan baèng ñoà thò Nhaèm muïc ñích ñaùnh giaù chung veà moái quan heä giöõa caùc bieán, xaùc ñònh nhöõng con soá ngoaïi lai, neâu leân ñöôïc nhöõng vaán ñeà veà ñoàng tuyeán tính tieàm naêng giöõa caùc bieán giaûi thích Ta söû duïng ma traän chaám ñieåm (scatter plot matrix) baèng leänh graph matrix Cuù phaùp graph matrix bpt varlist-bñl, options hoaëc graph matrix bpt varlist, options Ví duï: graph matrix so2 temp-days Dieãn giaûi keát quaû  Haøng ñaàu tieân moâ taû moái quan heä giöõa bieán phuï thuoäc (so2) vaø caùc bieán giaûi thích Chuùng ta nhaän thaáy caùc moái quan heä naøy khoâng tuyeán tính  Moät soá ñoà thò chaám cho thaáy daáu hieäu coù soá ngoaïi laïi (giöõa so2 vaø manuf, so2 vaø pop)  Moái quan heä giöõa bieán manuf vaø bieán pop raát maïnh (theo daïng tuyeán tính neân goïi laø ñoàng tuyeán tính) cho thaáy neáu chuùng ta cuøng söû duïng caû hai bieán naøy nhö laø bieán giaûi thích seõ gaây ra raéc roái Nhö vaäy, qua ñoà thò naøy chuùng ta phaûi thöïc hieän caùc böôùc tieáp theo laø loaïi boû giaù trò ngoaïi lai vaø khöû moái quan heä ñoàng tuyeán tính giöõa manuf vaø pop Loaïi boû giaù trò ngoaïi lai Töø ñoà thò ôû treân chuùng ta nghi ngôø coù giaù trò ngoaïi lai nhöng chuùng ta khoâng bieát giaù trò ngoaïi lai ñoù laø cuûa thaønh phoá naøo ñeå chuùng ta loaïi boû noù Vì vaäy chuùng ta phaûi thöïc hieän caùc caâu leänh sau: gen str3 twn= substr(town,1,3) Caâu leänh naøy nhaèm taïo bieán str3 chính laø bieán town nhöng teân cuûa caùc thaønh phoá chæ laáy 3 kyù töï ñaàu Chuùng ta söû duïng bieán naøy vì neáu söû duïng caû bieán town thì khi gaùn leân caùc chaám seõ raát daøi vaø laøm khoù nhìn Sau khi taïo bieán môùi chuùng ta goõ laïi leänh graph matrix nhöng theâm caùc option sau graph matrix so2-days, msymbol(none) mlabel(twn) mlabposition(0) Trong caâu leänh treân, mlabel( ) duøng ñeå gaén cho caùc ñieåm teân thaønh phoá töông öùng Tuy nhieân, nhöõng teân naøy cuõng seõ bò chuyeån thaønh daïng chaám vì vaäy chuùng ta phaûi söû duïng option msymbol(none) ñeå maùy hieåu maø khoâng chuyeån nhöõng chöõ naøy thaønh chaám mlabposition(0) seõ ñöa nhöõng teân thaønh phoá vaøo chính giöõa daáu chaám ñeå deã theo doõi Nhìn vaøo keát quaû treân chuùng ta nhaän thaáy roõ raøng thaønh phoá Chicago chính laø giaù trò ngoaïi lai Vì vaäy chuùng ta phaûi khöû giaù trò naøy drop if town==”Chicago” Nhö vaäy, thaønh phoá Chicago ñaõ bò loaïi ra khoûi boä soá lieäu, chuùng ta coù theå kieåm tra laïi baèng caùch goõ browser Laäp phöông trình hoài quy ña bieán Ñeán ñaây ta ñaõ khöû ñöôïc giaù trò ngoaïi lai neân ta seõ laäp phöông trình hoài quy nhöng chöa khöû moái quan heä ñoàng tuyeán tính giöõa bieán manuf vaø pop Cuù phaùp regress bpt varlist-bñl Ví duï: regress so2 temp-days Source | SS df MS Number of obs = 40 6.20 -+ F( 6, 33) = 0.0002 0.5297 Model | 8203.60523 6 1367.26754 Prob > F = 0.4442 14.855 Residual | 7282.29477 33 220.675599 R-squared = -+ Adj R-squared = Total | 15485.9 39 397.074359 Root MSE = so2 | Coef Std Err t P>|t| [95% Conf Interval] -+ temp | -1.268452 6305259 -2.01 0.052 -2.551266 0143631 manuf | 0654927 0181777 3.60 0.001 .0285098 1024756 pop | -.039431 0155342 -2.54 0.016 -.0710357 -.0078264 wind | -3.198267 1.859713 -1.72 0.095 -6.981881 5853468 precip | 5136846 3687273 1.39 0.173 -.2364966 1.263866 days | -.0532051 1653576 -0.32 0.750 -.3896277 2832175 _cons | 111.8709 48.07439 2.33 0.026 14.06278 209.679 Dieãn giaûi keát quaû  Trong keát quaû cuûa leänh regress chuùng ta coù hai phaàn: moät laø baûng phaân tích phöông sai cuûa pheùp kieåm F-test vaø hai laø baûng öôùc löôïng caùc tham soá  Kieåm ñònh F coù giaû thuyeát H0 laø taát caû caù heä soá töông quan cuûa caùc bieán giaûi thích ñeàu baèng khoâng ngoaïi tröø soá dö  Ta nhaän thaáy giaù trò F vôùi 6 vaø 33 ñoä töï do coù giaù trò = 6.20, vaø giaù trò p keát hôïp raát nhoû (p=0.0002) Ñieàu ñoù chöùng toû giaû thuyeát H0 bò baùc boû  Bình phöông heä soá töông quan ña bieán (R2) baèng 0.53 coù nghóa laø coù ñeán 53% söï thay ñoåi maät ñoä taäp trung SO 2 coù theå ñöôïc giaûi thích baèng 6 bieán coøn laïi trong taäp tin soá lieäu  Giaù trò R2 hieäu chænh (Adj R-squared) laø öôùc löôïng giaù trò R2 cuûa daân soá töø soá lieäu maãu  MSE chính laø öôùc löôïng ñoä leäch chuaån cuûa daân soá  Coef: chính laø heä soá töông quan cuûa caùc bieán giaûi thích Noù ñöa ra söï thay ñoåi öôùc löôïng khi bieán ñaùp öùng thay ñoåi moät ñôn vò trong bieán giaûi thích töông öùng vôùi nhöõng bieán khaùc giöõa nguyeân giaù trò  P>/t/: giaù trò p cuûa pheùp kieåm t- test ñoái vôùi töøng bieán döï ñoaùn trong ñoù giaû thuyeát Ho laø söï thay ñoåi cuûa töøng bieán döï ñoaùn khoâng lieân quan ñeán söï thay ñoåi cuûa bieán so2 Loaïi boû moái töông quan ñoàng tuyeán tính Nhö ñaõ thaáy qua ñoà thò, giöõa bieán manuf vaø bieán pop coù moái töông quan ñoàng tuyeán tính maïnh Chuùng ta caàn phaûi kieåm tra laïi moái quan heä naøy baèng caùch söû duïng caâu leänh sau correlate manuf pop (obs=40) | manuf pop -+ manuf | 1.0000 pop | 0.8906 1.0000 Chuùng ta coù theå tìm hieåu kyõ hôn baèng caùch tính VIF cuûa taát caû caùc bieán giaûi thích baèng leänh vif sau khi cho chaïy leänh regress vif Variable | VIF 1/VIF -+ manuf | 6.28 0.159275 pop | 6.13 0.163165 temp | 3.72 0.269156 days | 3.47 0.287862 precip | 3.41 0.293125 wind | 1.26 0.790619 -+ Mean VIF | 4.05 Theo Chatterjee nhöõng giaù trò vif cuûa bieán naøo thoaû moät trong hai quy luaät döôùi ñaây caàn phaûi loaïi boû ra khoûi phöông trình hoài quy  Giaù trò VIF lôùn hôn 10 chöùng toû laø coù ñoàng tuyeán tính  Heä soá VIF cuûa bieán ñoù lôùn hôn nhieàu so vôùi heä soá VIF trung bình ÔÛ ñaây chuùng ta nhaän thaáy khoâng coù giaù trò VIF lôùn hôn 10 nhöng giaù trò VIF cuûa bieán manuf vaø bieán pop lôùn hôn nhieàu so vôùi VIF trung bình neân chuùng ta caàn phaûi loaïi moät trong hai bieán manuf hay pop ra khoûi phöông trình hoài quy Ôû ñaây chuùng ta seõ loaïi bieán manuf ra khoûi phöông trình hoài quy Laäp laïi phöông trình hoài quy ña bieán Giôø ñaây chuùng ta coù theå laäp ñöôïc phöông trình hoài quy ña bieán cho bieán so2 regress so2 temp pop wind precip days Source | SS df MS Number of obs = 40 3.58 -+ F( 5, 34) = 0.0105 0.3448 Model | 5339.03465 5 1067.80693 Prob > F = 0.2484 17.275 Residual | 10146.8654 34 298.437216 R-squared = -+ Adj R-squared = Total | 15485.9 39 397.074359 Root MSE = so2 | Coef Std Err t P>|t| [95% Conf Interval] -+ temp | -1.867665 7072827 -2.64 0.012 -3.305037 -.430294 pop | 0113969 0075627 1.51 0.141 -.0039723 0267661 wind | -3.126429 2.16257 -1.45 0.157 -7.5213 1.268443 precip | 6021108 4278489 1.41 0.168 -.2673827 1.471604 days | -.020149 1920012 -0.10 0.917 -.4103424 3700445 _cons | 135.8565 55.36797 2.45 0.019 23.33529 248.3778 Chuùng ta kieåm tra laïi baèng Vif thì thaáy cuõng thoaû vif Variable | VIF 1/VIF -+ days | 3.46 0.288750 temp | 3.46 0.289282 precip | 3.40 0.294429 wind | 1.26 0.790710 pop | 1.07 0.931015 -+ Mean VIF | 2.53 Nhìn vaøo baûng treân chæ coù bieán temp thaät söï coù heä soá töông quan coù yù nghóa thoáng keâ (p=0.012) caùc bieán phuï thuoäc coøn laïi coù heä soá töông quan khoâng coù yù nghóa thoáng keâ Tuy nhieân, chuùng ta khoâng theå loaïi boû caùc bieán coøn laïi ra khoûi phöông trình hoài quy vì giöõa caùc bieán coøn coù moái lieân heä vôùi nhay Neáu boû caùc bieán naøy thì seõ laøm sai leäch heä soá töông quan vaø sai soá chuaån Nhö vaäy, thay vì duøng pheùp kieåm t nhö trong leänh regress chuùng ta phaûi söû duïng “phöông phaùp xaùc minh (confirmmatory approach) Phöông phaùp naøy seõ chia caùc bieán giaûi thích thaønh hai nhoùm bao goàm bieán khí haäu (temp, wind, precip, days) vaø bieán sinh thaùi ngöôøi (pop), sau ñoù xeùt xem moät hoaëc caû hai bieán treân cuøng aûnh höôûng ñeán bieán phuï thuoäc hay khoâng Caâu leänh seõ nhö sau: sw regress so2 (temp wind precip days) (pop), pe(0.05) begin with empty model p = 0.0119 < 0.0500 adding temp wind precip days Source | SS df MS Number of obs = 40 -+ F( 4, 35) = 3.77 0.0119 Model | 4661.27545 4 1165.31886 Prob > F = 0.3010 Residual | 10824.6246 35 309.274987 R-squared = 0.2211 17.586 -+ Adj R-squared = Total | 15485.9 39 397.074359 Root MSE = so2 | Coef Std Err t P>|t| [95% Conf Interval] -+ temp | -1.689848 7099204 -2.38 0.023 -3.131063 -.2486329 wind | -2.309449 2.13119 -1.08 0.286 -6.635996 2.017097 precip | .5241595 4323535 1.21 0.234 -.3535647 1.401884 days | 0119373 1942509 0.06 0.951 -.382413 4062876 _cons | 123.5942 55.75236 2.22 0.033 10.41091 236.7775 Dieån giaûi keát quaû:  Option pe(0.05) coù muïc ñích chæ lieät keâ nhoùm bieán naøo cho keát quaû p value cuûa F- test nhoû hôn 0.05  Keát quaû cho thaáy chæ coù nhoùm bieán khí haäu coù yù nghóa thoáng keâ vôùi p=0.0119 < 0.05  Nhö vaäy phöông trình hoài quy ña bieán mong muoán chæ coù 4 bieán laø temp, wind, precip, vaø days Kieåm tra soá dö cuûa phöông trình hoài quy ñaõ choïn

Ngày đăng: 20/03/2024, 08:25

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan