1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÁO cáo bài tập lớn môn học xác SUẤT THỐNG kê tập tin house price csv chứa thông tin về giá bán ra thị trường (đơn vị đô la) của 21613

26 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

I HC QUăC GIA TH NH PHă H CH MINH TRìNG I HC B CH KHOA KHOA Kò THU T X Y DÜNG B OC OB IT PL˛N M˘N H¯C X C SU T THăNG K NHM: XD19 - GI NG VI N HײNG D N: DANH S CH NH´M: H¯C KÝ 211 T I: 01 ThS NGUY N KI U DUNG STT Hå v t¶n Tp Hỗ Ch Minh, ThĂng 01/11/2021 B IT PLNX CSU TTHăNGK GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang B I T P L˛N X C SU T THăNG K Nhõm XD19 Mửc lửc HO T ¸NG 1: 1.1 1.2 1.3 Ho⁄t ºng 2.1 GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG •bi Cì sð lỵ thuyt Thüc hi»n 1.3.1 åc dœ li»u ( 1.3.2 L m s⁄ch dœ 1.3.3 L m rê d liằ 1.3.4 XƠy dỹng m n gi¡ nh ð q 1.3.5 Thüc hi»n d •bi Trang B I T P LN X C SU T THăNG K Nhõm XD19 Danh sĂch bÊng GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang B I T P L˛N X C SU T THăNG K Nhõm XD19 Danh sĂch hnh v‡ code R v k‚t qu£ åc dœ liằu v xem dặng u tiản ca d liằu code R v k‚t qu£ t⁄o mºt dœ li»u mỵi ch bao gỗm cĂc bin chnh code R v k‚t qu£ ki”m tra dœ li»u khuy‚t new_DF code R thay th‚ gi¡ trà trung b…nh ð c¡c quan s¡t cỈn l⁄i cıa bi‚n price t⁄i tr‰ chøa dœ li»u khuy‚t code R v k‚t code R v k‚t code R v k‚t qu£ t‰nh c¡c bi‚n price, sqft_above, sqft_living, sqft_basement code R v k‚t qu£ t‰nh c¡c bi‚n price, sqft_above, sqft_living, sqft_basement ¢ chuy”n sang d⁄ng log(x+1) 10 code R v kt quÊ v biu ỗ histogram th” hi»n ph¥n phŁi cıa bi‚n price 10 code R v k‚t qu£ v biu ỗ histogram th hiằn phƠn phi ca bi‚n log(price+1) 11 code R v kt quÊ v biu ỗ boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng ph¥n lo⁄i cıa bi‚n floors 12 code R v k‚t qu£ v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n floors 13 code R v k‚t qu£ v biu ỗ boxplot th hiằn phƠn phi ca bin price theo tłng ph¥n lo⁄i cıa bi‚n floors 14 code R v k‚t quÊ v biu ỗ boxplot th hiằn phƠn phi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n condition 15 code R v kt quÊ v biu ỗ boxplot th hiằn ph¥n phŁi cıa bi‚n price theo tłng ph¥n lo⁄i cıa bi‚n view 16 code R v kt quÊ v biu ỗ boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n view 17 code R v k‚t qu£ v‡ bi”u ç ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bin sqft_above trữợc v sau chuyn sang dng v log(x+1) 18 code R v kt quÊ v biu ỗ phƠn t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n sqft_living trữợc v sau chuyn sang dng v log(x+1) 19 code R v kt quÊ v biu ỗ phƠn tĂn th hiằn phƠn phi ca bin price theo bin sqft_basement trữợc v sau chuy”n sang d⁄ng v log(x+1) 20 code R v k‚t quÊ xƠy dỹng mổ hnh hỗi quy tuyn tnh lm_model_1 Gi£ng vi¶n hữợng dÔn: Th.S NGUY N KI U DUNG Trang B I T P LN X C SU T THăNG K Nhâm XD19 code R v k‚t qu£ v‡ ỗ th phƠn tch thng kim tra cĂc gi£ ành cıa mæ h… nh 22 code R v k‚t qu£ thüc hi»n dü b¡o cho gi¡ nh 21 GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang B I T P LN X C SU T THăNG K Nhõm XD19 T I01 1.1 HO T áNG 1: ãbi Tp tin "house_price.csv" chøa thỉng tin v• gi¡ b¡n tr÷íng ( ìn ỉ la) cıa 21613 ngỉi nh qun King nữợc M khoÊng thới gian t th¡ng 5/2014 ‚n 5/2015 B¶n c⁄nh gi¡ nh , dœ liằu cặn bao gỗm cĂc thuc tnh mổ tÊ chĐt lữổng ngổi nh D liằu gc ữổc cung cĐp t⁄i: C¡c bi‚n ch ‰nh bº dœ li»u: • price: GiĂ nh ữổc bĂn ã floors: S tng ca ngổi nh ữổc phƠn loi t - 3.5 • condition: i•u ki»n ki‚n tróc cıa ngỉi nh tł - 5, 1: r§t t» v 5: r§t tŁt • view: ¡nh gi¡ c£nh quan xung quanh nh theo mức t thĐp n cao: - ã sqft_above: Di»n t‰ch ngỉi nh • sqft_living: Di»n t‰ch khuổn viản nh ã sqft_basement: Diằn tch tng hm CĂc bữợc thỹc hiằn: ồc d liằu (Import data): "house_price.csv" L m s⁄ch dœ li»u (Data cleaning): NA (dœ li»u khuy‚t) L m rª dœ li»u: (Data visualization) (a) Chuy”n Œi bi‚n (n‚u cƒn thi‚t) (b) ThŁng kả mổ tÊ: dũng thng kả mÔu v dũng ỗ th XƠy dỹng mổ hnh hỗi quy tuyn tnh Ănh giĂ cĂc nhƠn t cõ th Ênh hững ‚n gi¡ nh ð qu“n King Thüc hi»n dü bĂo cho giĂ nh qun King 1.2 Cỡ s lỵ thuyt GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang B I T P L˛N X C SU T THăNG K 1.3 1.3.1 Nhõm XD19 Thỹc hiằn åc dœ li»u (Import data) åc dœ li»u "house_price.csv" H…nh 1: code R v k‚t qu£ 1.3.2 åc dœ liằu v xem dặng u tiản ca d liằu L m s⁄ch dœ li»u (Data cleaning) T⁄o mºt dœ liằu mợi ch bao gỗm cĂc bin chnh m ta quan tƠm, lữu vợi tản l new_DF Hnh 2: code R v k‚t qu£ t⁄o mºt dœ li»u mỵi ch bao gỗm cĂc bin chnh Kim tra d liằu khuyt new_DF GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang B I T P L˛N X C SU T THăNG K Nhõm XD19 Hnh 3: code R v k‚t qu£ ki”m tra dœ li»u khuy‚t new_DF Nh“n x†t: Düa v o k‚t qu£ thu ÷ỉc ki”m tra dœ li»u khuy‚t new_DF, ta nh“n th§y câ 20 dœ li»u khuy‚t t⁄i bi‚n price Vy nản ta cn xò lỵ cĂc d liằu khuyt õ Phữỡng phĂp xò l ữổc ã xuĐt l thay th‚ gi¡ trà trung b…nh ð c¡c quan s¡t cỈn l⁄i cıa bi‚n price t⁄i tr‰ chøa dœ li»u khuy‚t H…nh 4: code R thay th‚ gi¡ trà trung b…nh ð c¡c quan s¡t cỈn l⁄i cıa bi‚n price t⁄i tr‰ chøa dœ li»u khuy‚t Ki”m tra l⁄i xem cỈn dœ li»u khuy‚t hay khỉng H…nh 5: code R v k‚t qu£ ki”m tra l⁄i dœ li»u khuy‚t hay khỉng Nh“n x†t: Ta nh“n th§y sau xò lỵ, khổng cặn d liằu khuyt GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang B I T P L˛N X C SU T THăNG K Nhõm XD19 Hnh 8: code R v kt qu£ t‰nh c¡c bi‚n price, sqft_above, sqft_living, sqft_basement ¢ chuyn sang dng log(x+1) V biu ỗ histogram th hiằn phƠn phi ca bin price trữợc v sau chuyn sang d⁄ng log(x+1) H…nh 9: code R v k‚t qu£ v biu GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG ỗ histogram th hiằn phƠn phi ca bi‚n price Trang 10 B I T P L˛N X C SU T THăNG K Hnh 10: code R v kt quÊ v biu Nhõm XD19 ỗ histogram th hiằn phƠn phi ca bin log(price+1) Nhn xt: Dỹa trản biu ỗ histogram ca bin price, ta nhn thĐy phƠn phi ca bin price cõ xu hữợng lằch phÊi, cho thĐy phn lợn ngổi nh cõ giĂ tiãn gn nhữ nhau, v ch¿ câ sŁ ‰t ngæi nh câ gi¡ tr cao hỡn Trong vợi biu ỗ ca bin log(price + 1) câ h…nh d⁄ng ph¥n phŁi chu'n V‡ biu ỗ boxplot th hiằn phƠn phi ca bin price v log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n floors H…nh 11: code R v kt quÊ v biu ỗ boxplot th” hi»n ph¥n phŁi cıa bi‚n price theo tłng phƠn loi ca bin floors GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 11 B I T P LN X C SU T THăNG K Nhõm XD19 H…nh 12: code R v k‚t qu£ v‡ bi”u ç boxplot th” hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tng phƠn loi ca bin floors V biu ỗ boxplot th” hi»n ph¥n phŁi cıa bi‚n price v log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n condition H…nh 13: code R v kt quÊ v biu ỗ boxplot th hiằn ph¥n phŁi cıa bi‚n price theo tłng ph¥n lo⁄i cıa bin floors GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 12 B I T P L˛N X C SU T THăNG K Nhõm XD19 Hnh 14: code R v kt quÊ v biu ỗ boxplot th hi»n ph¥n phŁi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i ca bin condition V biu ỗ boxplot th hiằn phƠn phŁi cıa bi‚n price v log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n view H…nh 15: code R v k‚t qu£ v biu ỗ boxplot th hiằn phƠn phi ca bi‚n price theo tłng ph¥n lo⁄i cıa bi‚n view Gi£ng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 13 B I T P L˛N X C SU T THăNG K Nhõm XD19 Hnh 16: code R v kt quÊ v biu ỗ boxplot th hiằn phƠn phi cıa bi‚n log(price+1) theo tłng ph¥n lo⁄i cıa bi‚n view V biu ỗ phƠn tĂn th hiằn phƠn phi ca bin price theo bin sqft_above trữợc v sau chuyn sang d⁄ng v log(x+1) H…nh 17: code R v k‚t quÊ v biu ỗ phƠn tĂn th hiằn phƠn phŁi cıa bi‚n price theo bi‚n sau chuy”n sang dng v log(x+1) sqft_above trữợc v GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 14 B I T P LN X C SU T THăNG K Nhõm XD19 Nhn xt: Dỹa trản ỗ th phƠn tĂn ca price v sqft_above, ta chữa nhn thĐy thĐy rê mi quan hằ tuyn tnh gia bin Tuy nhiản vợi ç ph¥n t¡n cıa log(price + 1) v log(sqft_above + 1) ta nhn thĐy rê hỡn vã mi quan h» tuy‚n t‰nh giœa bi‚n n y (cö th” l quan hằ ỗng bin) V biu ỗ phƠn tĂn th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n sqft_living trữợc v sau chuyn sang dng v log(x+1) Hnh 18: code R v kt quÊ v biu ỗ ph¥n t¡n th” hi»n ph¥n phŁi cıa bi‚n price theo bin sau chuyn sang dng v log(x+1) sqft_living trữợc v Nhn xt: Dỹa trản ỗ th phƠn tĂn ca price v sqft_living, ta chữa nhn thĐy thĐy rê mi quan hằ tuyn tnh gia bin Tuy nhiản vợi ç ph¥n t¡n cıa log(price + 1) v log(sqft_living + 1) ta nhn thĐy rê hỡn vã mi quan h» tuy‚n t‰nh giœa bi‚n n y (cö th” l quan hằ ỗng bin) V biu ỗ phƠn tĂn th” hi»n ph¥n phŁi cıa bi‚n price theo bi‚n sqft_basement trữợc v sau chuyn sang dng v log(x+1) GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 15 B I T P L˛N X C SU T THăNG K Nhõm XD19 Hnh 19: code R v kt quÊ v biu ỗ phƠn tĂn th hiằn phƠn phi ca bin price theo bin sqft_basement trữợc v sau chuy”n sang d⁄ng v log(x+1) Nh“n x†t: Düa tr¶n ỗ th phƠn tĂn ca price v sqft_basement, ta chữa nhn thĐy thĐy rê mi quan hằ tuyn tnh gia bin Tuy nhiản vợi ỗ th phƠn tĂn ca log(price + 1) v log(sqft_basement + 1) ta nh“n th§y rê hỡn vã mi quan hằ tuyn tnh gia bin n y (cử th l quan hằ ỗng bin) Tõm li, dỹa trản cĂc ỗ th trản, ta nhn th§y vi»c chuy”n Œi c¡c bi‚n sang d⁄ng log(x+1) s‡ hi»u qu£ hìn vi»c ph¥n t‰ch mŁi quan h» tuy‚n t‰nh giœa c¡c bi‚n ºc l“p vỵi bi‚n phư thuºc (gi¡ nh ) C¥u häi °t lóc n y l mŁi quan h» giœa c¡c bi‚n vỵi gi¡ nh l ngÔu nhiản hay thỹc sỹ cõ mi quan h» tuy‚n t‰nh giœa c¡c bi‚n vỵi gi¡ nh Mổ hnh hỗi quy tuyn tnh s giúp ta kim tra i•u n y thỉng qua c¡c kho£ng tin c“y v c¡c ph†p ki”m ành Hìn nœa, nâ cỈn cho php ta ữợc lữổng giĂ tr ca bin phử thuc (gi¡ nh ) theo c¡c bi‚n ºc l“p (sŁ tƒng, i•u ki»n ngỉi nh , di»n t‰ch nh , ) 1.3.4 XƠy dỹng mổ hnh hỗi quy tuyn tnh Ănh giĂ cĂc nhƠn t cõ th Ênh hững n gi¡ nh ð qu“n King Chóng ta muŁn t…m hi”u cõ nhng nhƠn t n o v tĂc ng nhữ th‚ n o ‚n gi¡ nh ð qu“n King X†t mổ hnh hỗi quy tuyn tnh bao gỗm: Bin phử thuºc: price Bi‚n ºc l“p: floors, condition, view, sqft_above, sqft_living, sqft_basement (lữu ỵ cĂc bin price, sqft_above, sqft_living, sqft_basement  ÷æc chuy”n sang d⁄ng log(x+1)) Mæ h…nh ÷æc bi”u di„n nh÷ sau: log(price + 1) = + f loors + condition + view + log(sqf t_above + 1) + log(sqf t_living + 1) + log(sqf t_basement + 1) GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 16 B I T P LN X C SU T THăNG K Nhõm XD19 Ta thỹc hiằn ữợc lữổng cĂc hằ s i, i = 0; :::; düa tr¶n t»p tin new_DF2: H…nh 20: code R v k‚t qu£ x¥y düng mỉ hnh hỗi quy tuyn tnh lm_model_1 Nhn xt: T kt quÊ phƠn tch, ta thu ữổc: b0 = 7:168351; b1 = 0:102574; b2 = 0:075131; b3 = 0:125203 b4 = 0:544601; b5 = 0:172785; b6 = 0:042919 Nh÷ v“y, ÷íng thflng hỗi quy ữợc lữổng cho bi phữỡng trnh sau: log(price + 1) = 7:168351 + 0:102574 f loors + 0:075131 condition + 0:125203 view + 0:544601 log(sqf t_above + 1) + 0:172785 log(sqf t_living + 1) + 0:042919 log(sqf t_basement + 1) Kim nh cĂc hằ s hỗi quy: GiÊ thuyt H0: Hằ s hỗi quy khổng cõ ỵ nghắa thng kả ( i = 0) GiÊ thuyt H1: Hằ s hỗi quy cõ ỵ nghắa thng kả ( i 6= 0) + P r(> jtj) cıa c¡c h» s ứng vợi cĂc bin ãu b hỡn mức ỵ nghắa = 0:05 nản ta bĂc bọ giÊ thuyt H0 Do â h» sŁ øng vỵi c¡c bi‚n n y ãu cõ ỵ nghắa vợi mổ hnh hỗi quy ta x¥y düng Ph¥n t‰ch sü t¡c ºng cıa c¡c nh¥n t lản giĂ nh : Nhữ vy mổ hnh hỗi quy tuyn tnh vã Ênh hững ca cĂc nhƠn t lản giĂ nh ữổc cho bi: log(price + 1) = 7:168351 + 0:102574 f loors + 0:075131 condition + 0:125203 view + 0:544601 log(sqf t_above + 1) + 0:172785 log(sqf t_living + 1) + 0:042919 log(sqf t_basement + 1) hay ta câ th” suy ra: price = e7:168351 e0:102574 floors 0:172785 e0:075131 condition e0:125203 view 0:042919 (sqf t_living + 1) : (sqf t_basement + 1) Trữợc ht, ta thĐy rng p value tữỡng ứng vợi thng kả F b hìn 2:2e n y ch¿ r‹ng, ‰t nh§t mºt bin dỹ bĂo mổ hnh cõ ỵ nghắa giÊi th‰ch r§t cao ‚n gi¡ nh ” x†t £nh h÷ðng cư th” cıa tłng bi‚n ºc l“p, ta x†t trång sŁ (h» sŁ i) v p value t÷ìng øng Ta thĐy rng p value tữỡng ứng vợi cĂc bin •u b† hìn 2e 16 (ngo i trł bi‚n sqft_living câ p value = 3:37e 09), i•u n y nâi lản rng Ênh hững ca cĂc bin n y cõ ỵ nghắa rĐt cao lản giĂ nh price Mt khĂc, hằ s hỗi quy i ca mt bin dỹ bĂo cơng câ th” ÷ỉc xem nh÷ £nh h÷ðng trung b…nh lản bin phử thuc price tông mt ỡn v cıa bi‚n dü b¡o, gi£ sß r‹ng c¡c bi‚n dü bĂo khĂc GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 17 b B IT PLNX CSU TTHăNGK khỉng Œi Cư th”, = 0:102574 th… sŁ tƒng cıa mºt ngæi nh (0:102574) ký vång log(price + 1) tông lản 0.102574 vã mt ỡn v ca log(price + 1) hay price + tông lản e = 10:8% so price + ban ƒu (gi£ sß r‹ng c¡c bi‚n dü b¡o kh¡c khỉng Œi) Vỵi = 0:075131 th iãu kiằn ngổi nh tông thảm 1, ta câ th” ký vång log(price + 1) t«ng lản b (0:075131) 0.075131 vã mt ỡn v ca log(price + 1) hay price + tông lản e = 7:8% so price + ban ƒu (gi£ sß r‹ng c¡c bi‚n dü b¡o kh¡c khỉng Œi) Ho°c vỵi b = 0:544601 th… di»n t‰ch (0:544601) ngæi nh cng (sqft_above + 1) tông lản 1%, price + tông lản 1 = 0:5% so price + ban ƒu (gi£ sß r‹ng c¡c bi‚n dü b¡o kh¡c khæng Œi) H» sŁ R hi»u ch¿nh bng 0.5134 nghắa l 0.5134% sỹ bin thiản giĂ nh ‚n ÷ỉc gi£i th‰ch bði c¡c bi‚n c¡c bi‚n ºc l“p Ki”m tra c¡c gi£ ành cıa mæ h…nh Nhc li cĂc giÊ nh ca mổ hnh hỗi quy: Yi = + 1:X1 + ::: i:Xi + i, i = 1; :::n + T‰nh tuy‚n t‰nh cıa dœ li»u: mŁi quan h» giœa bi‚n dü b¡o X v bin phử thuc Y ữổc giÊ sò l tuyn tnh + Sai s cõ phƠn phi chu'n + Phữỡng sai cıa c¡c sai sŁ l h‹ng sŁ: i N(0; ) + C¡c sai sŁ 1; :::; n th… ºc lp vợi Ta thỹc hiằn phƠn tch thng ” ki”m tra c¡c gi£ ành cıa mæ h…nh: H…nh 21: code R v kt quÊ v ỗ th phƠn tch thng hnh kim tra cĂc giÊ nh ca mổ GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 18 B I T P L˛N X C SU T THăNG K GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Nhâm XD19 Trang 19 B I T P LN X C SU T THăNG K Nhõm XD19 ỗ th thứ (Residuals vs Fitted) v‡ c¡c gi¡ trà dü b¡o vỵi c¡c gi¡ trà th°ng d÷ (sai sŁ) t÷ìng øng, dịng ” ki”m tra t‰nh tuy‚n t‰nh cıa dœ li»u (gi£ ành 1) v tnh ỗng nhĐt ca cĂc phữỡng sai sai s (giÊ nh 3) Nu nhữ giÊ nh vã tnh tuyn tnh cıa dœ li»u KH˘NG thäa, ta s‡ quan s¡t th§y rng cĂc im thng (residuals) trản ỗ th s phƠn b theo mt hnh mÔu (pattern) c trững n o â (v‰ dư parabol) N‚u ÷íng m u ä trản ỗ th phƠn tĂn l ữớng thflng nm ngang m khỉng ph£i l ÷íng cong, th… gi£ ành t‰nh tuyn tnh ca d liằu ữổc thọa mÂn kim tra giÊ nh thứ (phữỡng sai ỗng nhĐt) th cĂc im thng dỹ phÊi phƠn tĂn ãu xung quanh ữớng thflng y = ỗ th thứ (Normal Q-Q) cho php kim tra giÊ nh vã phƠn phŁi chu'n cıa c¡c sai sŁ N‚u c¡c i”m th°ng nm trản ữớng thflng th iãu kiằn vã phƠn phi chu'n ữổc thọa ỗ th thứ (Scale - Location) v‡ c«n b“c hai cıa c¡c gi¡ tr thng ữổc chu'n hõa vợi cĂc giĂ tr dü b¡o, ÷ỉc dịng ” ki”m tra gi£ ành thø (ph÷ìng sai cıa c¡c sai sŁ l h‹ng sŁ) Nu nhữ ữớng m u ọ trản ỗ th l ÷íng thflng n‹m ngang v c¡c i”m th°ng d÷ ph¥n tĂn ãu xung quanh ữớng thflng n y th giÊ ành thø ÷ỉc thäa N‚u nh÷ ÷íng m u ä câ º dŁc (ho°c cong) ho°c c¡c i”m th°ng phƠn tĂn khổng ãu xung quanh ữớng thflng n y, th giÊ nh thứ b vi phm ỗ thø (Residuals vs Leverage) cho ph†p x¡c ành nhœng i”m câ £nh h÷ðng cao (influen-tial observations), n‚u chóng câ hi»n di»n bº dœ li»u Nhœng i”m câ £nh h÷ðng cao n y câ th” l c¡c i”m outliers, l nhng im cõ th gƠy nhiãu Ênh hững nhĐt phƠn tch d liằu Nu nhữ ta quan sĂt thĐy mt ữớng thflng m u ọ ứt nt (Cook’s distance), v câ mºt sŁ i”m v÷ỉt qua ÷íng thflng kho£ng c¡ch n y, ngh¾a l c¡c i”m â l c¡c i”m câ £nh h÷ðng cao N‚u nh÷ ta ch quan sĂt thĐy ữớng thflng khoÊng cĂch Cook gõc ca ỗ th v khổng cõ im n o vữổt qua nõ, nghắa khổng cõ im n o thỹc sỹ cõ Ênh hững cao Nhn xt: + ỗ th Normal Q-Q cho thĐy giÊ nh sai s cõ phƠn phi chu'n thọa mÂn + ỗ th thứ (Residuals vs Fitted) cho thĐy giÊ nh vã tnh tuyn tnh ca d liằu chữa thỹc sỹ thoÊ mÂn + ỗ thø v thø (Scale - Location) cho ta thĐy rng giÊ nh vã tnh ỗng nhĐt ca phữỡng sai tữỡng i thoÊ mÂn + ỗ th thứ ch¿ câ c¡c quan tr›c thø 18877, 3915 v 13529 câ th” l c¡c i”m câ £nh h÷ðng cao bº dœ li»u 1.3.5 Thüc hi»n dü b¡o cho giĂ nh qun King Dỹa trản mổ hnh hỗi quy ta xƠy dỹng, hÂy dỹ bĂo giĂ mt ngổi nh câ: + tƒng + i•u ki»n ki‚n tróc ngæi nh : + ¡nh gi¡ quang c£nh ngæi nh : + Di»n t‰ch ngæi nh : 2170 m + Di»n t‰ch khn vi¶n nh 2570 m + Di»n t‰ch tƒng hƒm 400 m Gi£ng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 20 B I T P L˛N X C SU T THăNG K Nhõm XD19 Hnh 22: code R v kt qu£ thüc hi»n dü b¡o cho gi¡ nh Nh“n x†t: Düa v o k‚t qu£ dü b¡o, ta nh“n ÷æc: + Gi¡ nh dü b¡o trung b…nh l 658028.3 + Kho£ng tin c“y so vỵi gi¡ trà dü b¡o (648685.9; 667505.3) Ta nh“n th§y gi¡ nh quan s¡t ð thuºc t‰nh tr¶n (538000) khỉng thuºc kho£ng tin c“y vła tm ữổc, chứng tọ mổ hnh hỗi quy ta xƠy dỹng chữa thỹc sỹ tt GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 21 B I T P LN X C SU T THăNG K 2.1 Hot Nhõm XD19 ng ãbi Sinh viản tỹ tm mt b d liằu thuc vã chuyản ng nh ca mnh Khuyn khch sinh viản sò dửng d liằu thỹc t‚ sfin câ tł c¡c th‰ nghi»m, kh£o s¡t, dü ¡n, chuy¶n ng nh cıa m…nh Ngo i sinh vi¶n câ th” tü t…m ki‚m dœ li»u t nhng nguỗn khĂc hoc tham khÊo kho d liằu cung cĐp tin "kho_du_lieu_BTL_xstk.xlsx" Sinh viản ữổc tỹ chồn phữỡng phĂp lỵ thuyt phũ hổp Ăp dửng phƠn tch d liằu ca mnh, phÊi £m b£o phƒn: L m rª dœ li»u (data visualization) v mỉ h…nh dœ li»u (model fitting) Gi£ng vi¶n hữợng dÔn: Th.S NGUY N KI U DUNG Trang 22 B I T P LN X C SU T THăNG K Nhâm XD19 T ILI UTHAMKH O Ho ng Vôn H , B i giÊng XĂc suĐt Thng Kả Nguy„n Ti‚n Dơng (chı bi¶n), Nguy„n …nh Huy, X¡c suĐt - Thng kả & PhƠn tch s liằu, 2019 GiÊng viản hữợng dÔn: Th.S NGUY N KI U DUNG Trang 23 ... Th.S NGUY N KI U DUNG Trang B I T P L˛N X C SU T THăNG K Nhõm XD19 T I01 1.1 HO T áNG 1: ãbi Tp tin "house_ price. csv" chứa thổng tin vã giĂ bĂn th trữớng ( ìn æ la) cıa 21613 ngæi nh ð qu“n King... histogram th hiằn ph¥n phŁi cıa bi‚n price 10 code R v k‚t qu£ v‡ biu ỗ histogram th hiằn phƠn phi ca bin log (price+ 1) 11 code R v kt quÊ v biu ỗ boxplot th hiằn ph¥n phŁi cıa bi‚n price. .. KI U DUNG ỗ histogram th hiằn phƠn phi cıa bi‚n price Trang 10 B I T P L˛N X C SU T THăNG K Hnh 10: code R v kt quÊ v biu Nhõm XD19 ỗ histogram th” hi»n ph¥n phŁi cıa bi‚n log (price+ 1) Nh“n x†t:

Ngày đăng: 05/12/2022, 06:24

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w