Phương pháp thống kê định lượng và điều tra tổng hợp

36 501 0
Phương pháp thống kê định lượng và điều tra tổng hợp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Phng phỏp thng kờ nh lng v iu tra tng hp Ludovic Lebart Trung tõm Nghiờn cu Khoa hc quc gia Phỏp (CNRS), Marie Piron Vin Nghiờn cu Phỏt trin (IRD) Thng kờ kho sỏt : phõn tớch nhõn t v phõn loi  1.1 Nguyờn tc  1.2 Hai nhúm phng phỏp b sung  1.3 Mụ hỡnh c s: yu t quan sỏt v gii thớch (hoc minh ha)  Thụng qua miờu t  2.1 Phng phỏp Bootstrap  2.2 Kt hp miờu t suy rng thng kờ  La chn cỏc bng chộo phự hp v ht nhõn nhõn t  Cõu hi úng v cõu hi m  Vớ d ng dng thc t  Kt lun chung  Trao i  Bi c  Phng phỏp ca chỳng tụi trung vo phõn tớch tng th cỏc d liu iu tra khoa hc nhõn Phng phỏp ny xut phỏt t thc t l cỏc bin c lp (cỏc cõu tr li nh lng hoc nh tớnh cho bn hi ca cuc iu tra) thng khụng cú phm cht cn thit c a trc tip vo mụ hỡnh thng kờ Cỏc d liu cú th cú sai s, sai sút hay b sút Cõu hi khụng phi lỳc no cng d hiu, ngi c phng khụng phi lỳc no cng bit a cõu tr li cn thit, tinh thn cuc iu tra, bn cht ca vic t cõu hi khụng phi lỳc no cng c lnh hi Sau c mó húa di dng s, mt bin c lp khụng cũn cha cỏc yu t cho phộp phờ duyt bin ú Tuy nhiờn, mt s bin liờn quan n cựng mt ch cú th phờ duyt ln thụng qua phõn tớch a bin Chỳng tụi mun xut cỏc phng phỏp ỏp dng k thut phõn tớch d liu (phõn tớch kho sỏt a chiu) phờ duyt v ỏnh giỏ thụng tin c s Hai bc u tiờn x lý s liu iu tra theo phng phỏp ny gm: Lm sch s liu v mụ t s b (sp xp d liu, lc , tớnh s liu thng kờ ban u, trung bỡnh, lch chun, giỏ tr cc tr, ng phõn v, bng phõn t chộo) ; xem xột tớnh gn kt tng th, hin th d liu, c cu s liu, phõn loi theo phng phỏp kho sỏt Phng phỏp ny gm hai nhúm ln sau: phng phỏp nhõn t (phõn tớch theo thnh phn chớnh, phõn tớch tng quan n gin v phc tp) v phng 114 114 117 117 119 119 120 121 121 123 125 126 127 phỏp phõn loi t ng Chỳng tụi mun nhn mnh trc ht n bc th hai cú tờn gi xem xột tớnh gn kt tng th õy l ng dng mi trc õy khụng cú cỏc phn mm tin hc truyn thng Trong ú õy l bc quan trng giỳp ỏnh giỏ cht lng thụng tin, xỏc nh mi quan h tng tỏc gia tt c hay tng phn c im ca tng th nghiờn cu Bc ny cho phộp ỏnh giỏ tớnh gn kt tng th ca d liu, xõy dng cỏc ch s tng hp v a cỏc bc tip theo quỏ trỡnh x lý s liu iu tra Thng kờ kho sỏt: phõn tớch nhõn t v phõn loi Nguyờn tc Phng phỏp ny cho phộp sp xp, phõn loi, to mi quan h tng tỏc v t ú c cu thụng tin cha cỏc d liu ln Phng phỏp a mt cỏi nhỡn tng th v cỏc thụng tin Trc tiờn chỳng ta ụn li cỏc nguyờn tc chung ca mi phng phỏp thng kờ mụ t a chiu Mt cuc iu tra cú th cú kt qu l mt bng s liu ln hỡnh ch nht Mi chiu ca hỡnh ch nht cho phộp xỏc nh khong cỏch xa (hay khong cỏch gn) gia cỏc phn t nh hỡnh chiu cũn li ca bng: nh vy, ton b cỏc ct ca bng (cỏc cõu hi iu tra: cỏc bin, thuc tớnh, kt qu o lng) cho phộp tớnh khong cỏch gia cỏc dũng (h gia ỡnh, cỏ th, cỏc quan sỏt) da trờn cỏc cụng thc thớch hp Tng t, 112 Khúa hc Tam o 2008 ton b cỏc dũng (h gia ỡnh, cỏ th, quan sỏt) cho phộp tớnh toỏn khong cỏch gia cỏc ct (cỏc cõu hi iu tra: cỏc bin, thuc tớnh, kt qu o lng) Khi ú ta thu c cỏc bng tớnh khong cỏch tng ng vi cỏc biu din th phc Phng phỏp Phng phỏp ny nhm a cỏc hỡnh nh i din gn sỏt nht vi trc giỏc, m bo yờu cu lm mt ớt thụng tin c s nht Ta bit rng cú hai loi phng phỏp cho phộp gim ớt thụng tin c s Phng phỏp nhõn t, cũn gi l phng phỏp phõn tớch trc chớnh a cỏc hỡnh nh biu din th trờn ú mc gn k v mt hỡnh hc gia cỏc im-dũng (cỏ th) v gia cỏc im-ct (cỏc bin) phn ỏnh mi liờn h thng kờ gia cỏc cỏc th v gia cỏc bin Cỏc phng phỏp ny ch yu l phõn tớch thnh phn chớnh (ACP), phõn tớch a bin n gin (AC) v phõn tớch a bin phc (ACM) Phng phỏp phõn loi a cỏc hp theo loi (phõn t) (hoc theo nhúm loi cú th t) cỏc dũng v ct õy ch yu l phõn loi cỏc dũng ca bng (h gia ỡnh, cỏ th, quan sỏt) Tc ta lp cỏc nhúm ng nht cỏc cỏ th tham gia tr li iu tra Phng phỏp ny ch yu gm phng phỏp phõn loi theo nhúm v phng phỏp phõn loi theo th t Hai nhúm phng phỏp ny cú th c s dng b sung cho nhm mụ t mt cỏch hiu qu cỏc bng s liu ca cỏc cuc iu tra Lý gii cỏc biu tng cú c t nhng k thut rỳt gn ny khụng n gin nh lý gii cỏc th ca thng kờ mụ t s cp Gii thớch cỏc biu , th cỏc chui niờn i thng mang tớnh trc giỏc, cũn phõn tớch a bin, cn phi nm c cỏc k thut phõn tớch kt qu phc mc dự cỏc hỡnh nh i din thng mang tớnh cht gi m Do ú, a s cỏc trng hp, cn phi cú o to v thc hnh thc t Mụ hỡnh c bn: phn t tớch cc v minh ho (hoc b sung) Bõy gi chỳng ta cn tng i húa cỏi gi l mụ t tng th v a khỏi nim mụ t theo ch (topical description) Mt cuc iu tra, cng nh bng cỏ th_bin thu c t cuc iu tra, l mt tng th khụng thun nht Bng hi (cỏc ct ca bng) thng gm cỏc ch khỏc nh thu nhp ca h gia ỡnh, tiờu dựng ca h gia ỡnh hay mụ t v nhõn khu-xó hi ca h gia ỡnh Bc u, nờn tin hnh mụ t tng th nhng kt qu thu c thng thiu tinh t Lm th no gii thớch khong cỏch gia cỏc cỏ th nu khong cỏch ny c tớnh toỏn trờn hp cỏc bin? Nu hai cỏ th rt gn thỡ khụng cú gỡ, iu ú chng t cú s tng ng i vi tt c cỏc bin, v nh vy l vi tt c cỏc ch (thu nhp, tiờu dựng, c im nhõn khu-xó hi) Nhng nu chỳng ch tng i gn thụi thỡ ch no gii thớch cho khong cỏch ny ? Do ú s hiu qu hn nu ta tin hnh mụ t theo ch , iu ny th hin qua vic la chn cỏc hp bin tớch cc (thuc v cựng mt ch ) Vớ d, ta s phõn loi cỏc cỏ th theo c im tiờu dựng Khi ú cú th d dng lý gii cỏc khong cỏch: khong cỏch gn ng ngha vi cỏch thc tiờu dựng Nhng cỏc phng phỏp ny cng cho phộp xỏc nh cỏc bin minh ho hay cũn gi l bin b sung l nhng bin tớch cc cú t trng vụ cựng nh Nhng bin ny khụng can thip vo vic tớnh toỏn cỏc trc chớnh hay cỏc t, nhng sau ú nú giỳp gii thớch cho cỏc kt qu Nh vy ta cú th a dng húa cỏch th hin v ch tiờu dựng theo v trớ ca gii tớnh, tui, trỡnh hc Mt u im quan trng khỏc ca phng phỏp ny l khụng cú cõu tr li hay tr li l tụi khụng bit cú th c xỏc nh nh l cỏc bin minh ho, giỳp gii thớch cỏch ng x ca nhng ngi c hi Riờng vic phõn bit gia cỏc bin tớch cc v minh ho ó hỡnh thnh nờn mt mụ hỡnh Ta cú th d dng chng minh mụ hỡnh ny gn vi hi quy tuyn tớnh phc Cỏc bin tớch cc (to thnh mt tng th ng nht) xỏc nh mt tiu khụng gian gii thớch trờn ú nh v (ln lt tng bin mt) cỏc bin cn phi gii thớch, ú l cỏc bin minh (v mt toỏn hc, v trớ ny n gin l mt hỡnh chiu) Phờ duyt cỏc kt qu hin th Cho ti gn õy, cỏc cụng c hin th c s dng ch mụ t v ỏnh giỏ v mt nh tớnh, cú th em li cỏc ý tng hay trc giỏc cho cỏc nh nghiờn cu Cỏc k thut kim nh thng kờ quỏ phc nờn khú thc hin Phng phỏp Bootstrap Cỏc phng phỏp tỏi chn mu hin i (nht l k thut Bootstrap) l cỏc phng phỏp ũi hi phi tớnh toỏn rt nhiu (cn s dng rt nhiu n mỏy tớnh) v cho phộp xỏc nh cỏc vựng tin cy s v tr cỏc bin kt qu hin th, ú cú th thc hin cỏc suy rng thng kờ khuụn kh a chiu phc Nh ú, ta cú th xỏc minh c mt s bin b sung nm cỏc v trớ quan trng: ta cú th bit c liu cỏc tiờu thc ca bin tham chiu chộo gii tớnh/ hc cú mi liờn h cht ch hay khụng vi c cu tiờudựng Kt hp gia mụ t v suy rng thng kờ B cụng c ca cỏn b thng kờ gm cỏc mụ hỡnh c thự cho phộp da vo mt s bin no ú d kin trc c mt bin nh lng (hi quy, phõn tớch phng sai v hip phng sai), mt bin nh tớnh (phõn tớch s khỏc bit, hi quy lụ gic), nghiờn cu cỏc kt hp cỏc bng s ngu nhiờn (mụ hỡnh kt hp, mụ hỡnh lụga tuyn tớnh) Mt nhng khú khn chớnh kt hp gia mụ t v cỏc mụ hỡnh l Phng phỏp thng kờ ta khụng th kim nh trờn cỏc d liu mt mụ hỡnh c tỡm t chớnh cỏc d liu ú Tt nhiờn x lý d liu cỏc cuc iu tra khụng phi l lnh vc nht gp phi nhng ny Cỏc k thut tỏi chn mu theo dng mu kim nh hay phờ duyt chộo cú th giỳp khc phc nhng tr ngi ny La chn cỏc bng chộo mt cỏch phự hp v rừrng Ta hay kt hp cỏc c im nh tui, gii tớnh, trỡnh hc nghiờn cu cỏc nhúm cỏ th tng ng vi xột v mt khỏch quan (thc hin mi cụng vic u tng ng) Tuy nhiờn, nu kt hp nh vy s to hng ngn nhúm cỏ th, m ta s gp khú khn nghiờn cu mt mu iu tra cú hng ngn cỏ th Hn na, vic kt hp cỏc c im khụng lu ý n mi quan h gia chỳng: mt s nhn nh l hin nhiờn (khụng cú nhúm ngi ôdi 40 tui nhúm hu trớ), mt s nhn nh ó c bit trc, vi mt s trng hp ngoi l (khụng cú sinh viờn hon cnh goỏ), cỏc nhn nh khỏc thiờn v thng kờ (trong nhúm trờn 65 tuiằ, cú nhiu n hn) Hóy cựng xem xột mt cuc iu tra quc gia Do c cu dõn s, cỏc c im c bn (gii tớnh, mc sng, tỡnh trng hụn nhõn, trỡnh hc vn, ) khụng c lp vi nhau, k thut ỏp dng l mụ t mng li cỏc mi quan h tng tỏc gia tt c cỏc c im c bn ny, tip ú s dng cỏc ch khỏc ca cuc iu tra nh l phn t minh ho Khi ú, c im ca nhng i tng tham gia tr li c th hin rừ nu mi quan h tng tỏc gia cỏc c im c lm rừ Nh vy, vic s dng cỏc bng chộo (m khụng tớnh n cỏc nhõn t trc ú) s l tha nu nh cỏc c im s dng thit k bng chộo cú mi liờn h qua li vi Vic chiu cỏc bin b sung ú giỳp tit kim thi gian v trỏnh sai s c kt qu Cõu hi úng v cõu hi m Cõu hi úng: ỏnh mó v ỏnh li mó cỏc bin Theo cỏch tip cn th nht, phn ln cỏc k thut nờu trờn cú th ỏp dng trc tip vi nhng phn mm chun Tuy nhiờn, ngi s dng s cú yờu cu ngy cng cao ó quen vi ch no ú Cn phi kt hp cỏc bin c s, to cỏc nhúm bin, phõn cỏc bin liờn tc thnh cỏc nhúm túm li l chun b v mt s liu cho phộp phõn tớch sõu Quỏ trỡnh ỏnh li mó l mt phn chu trỡnh lp giỳp hi t v mt thụng tin c bn 113 Cõu hi m: phõn tớch cõu tr li di dng li Trong mt s trng hp, nờn cú mt vi cõu hi m, vi mi cõu hi m s cú cõu tr li di dng li cú di ngn khỏc Vic x lý thụng tin loi ny ng nhiờn rt phc Cỏc cụng c tớnh toỏn v phng phỏp trỡnh by trờn õy s giỳp phõn tớch cỏc cõu tr li m nh vy Kt lun Cỏc k thut phõn tớch d liu cho phộp nõng cao hiu sut lao ng, ci thin cht lng cỏc kt qu v cỏc thụng tin mi Phng phỏp phõn tớch d liu cú ba chc nng chớnh sau: - Giỏm sỏt cht lng thụng tin: giỏm sỏt cht lng thụng tin bng cỏch phờ chun b mu qua trin khai thc t, phờ chun bng hi (phỏt hin thiu sút vic chn cỏc bin), mó húa (a mó chun v phõn t mt s bin) Quỏ trỡnh x lý v hin th thụng tin nờu trờn cho phộp tớnh n hin tng thiu thụng tin c s (vớ d nh khụng tr li) cng nh cỏc bin kim tra liờn quan n cht lng ca thụng tin c s; - Tng hp: sp xp, c cu v túm tt thụng tin cha d liu ln Cỏc phng phỏp phõn tớch nhõn t v phõn loi ỏp dng b sung cho nhau, cho phộp phõn loi theo mc cỏc kt qu mụ t t tng hp nht cho n chi tit nht; - Nghiờn cu: nh hng khai thỏc d liu iu tra thụng qua vic m rng phm vi cỏc gi thuyt: cú th thng xuyờn nhn xột cỏc gi thuyt c bn ca bng hi hoc gi ý cỏc gi thuyt mi (Ni dung tỏch bng) Stộphane Lagrộe Bõy gi tụi xin phộp nhng li cho hai ging viờn Marie Piron v Ludovic Lebart Hai v ó tham gia vo Khúa hc hố ln th nht v cỏm n vỡ ó tip tc tham gia ln hai Ludovic Lebart Xin cỏm n ban t chc v quớ v tham d Khúa hc nm nay, chỳng tụi tip tc cp n phng phỏp nh lng iu tra tng hp iu tra m chỳng tụi nhc n õy l tt c cỏc cuc iu tra chn mu lnh vc kinh t, xó hi hay dõn s Chỳng tụi s dng li phn ln ni dung ó trỡnh by Khúa hc nm ngoỏi1 Chỳng tụi s nhn mnh vo mt s im c ỏnh giỏ l quan trng Chỳng tụi s khụng phỏt trin quỏ sõu tt c cỏc ni dung Lebart L., Piron, M., K thut mi v x lý thng kờ d kin iu tra Lagrộe Stộphane (Biờn tp), Khúa hc Tam o, Nhng cỏch tip cn phng phỏp mi ng dng phỏt trin, thỏng 11/2008, Nh xut bn Th gii, H Nụi, Tr 55-64 (bn ting Vit) 114 Khúa hc Tam o 2008 trng hp cỏc hc viờn ch mi tham d khúa hc ln ny Chỳng tụi khụng mun tỡnh trng thụng tin khụng ng u Cỏch trỡnh by ca chỳng tụi l nhn mnh n phõn tớch tng th s liu iu tra í tng ban u nh sau: cỏc cõu hi tỏch bit khụng cú nhiu ý ngha, ý ngha ca cỏc cõu hi s c gia tng cựng vi s lng cõu hi Theo cụng thc tớnh toỏn, nh lut Gauss cho thy chớnh xỏc s tng bng cn bc hai ca s im quan sỏt nh lut ny ỳng vi cỏc quan sỏt cng cú th ỳng vi cỏc bin mt chng mc no ú Khi cú nhiu bin, ta s bit rừ thc t n ng sau cỏc bin ta phõn tớch Vỡ cn cỏch tip cn tng th i vi bin ? Con s thng kờ khụng ging nh cỏc th khỏc Vi mt doanh nghip sn xut sa chua, bt thc phm hay xe ụ tụ, mi sn phm c sn xut ra, ngi ta cú th phõn tớch bit giỏ tr ca nú Nhng ta cú mt s, vớ d s 637, ta khụng th bit c liu s ny l ỳng hay sai Cú th nú khụng cú ý ngha gỡ Chỳng ta cú nim tin mự quỏng vo o c v ý thc ngh nghip ca nhng ngi to thụng tin ny Nhng thng kờ, cú mt lnh vc cnh tranh Nu nh mun bit thụng tin ny cú cht lng hay khụng, cn phi chng minh thụng qua c quan kim toỏn c lp Núi cỏch khỏc, cỏc thụng tin ri rc, thụng tin s húa thỡ khụng cú giỏ tr Ngoi cỏc quy trỡnh phỏp quy v k thut ỏp dng kim soỏt, ch cú nhng s m ngi ta cú c l cỏc ch s o lng tớnh gn kt tng th ca thụng tin (trựng lp nhiu bin, tng liờn gia cỏc bin, v.v) Thng thỡ cỏc b s liu bao gi cng cũn nhng sai s hay nhm ln Mt im quan trng na l khụng phi lỳc no nhng ngi c hi cng hiu rừ cỏc cõu hi Cn thc hin cỏc bin phỏp cn thit, vớ d nh a cõu hi m bng hi Tinh thn ca cuc iu tra, ý ngha ca cõu hi khụng phi lỳc no cng c hiu rừ Trong mt cuc iu tra chớnh thc tin hnh Phỏp i vi nhng ngi cú hon cnh khú khn, cú mt cõu hi v ý kin nhng ngi liờn quan v mc thu nhp ti thiu Cú ngi ó tr li cõu hi m ny nh sau: Tụi b m mỏu Trờn thc t, i tng ny ngh rng iu tra viờn n chm súc mỡnh v khụng hiu rng õy l mt cõu hi v mt c ch, khỏi nim c th Sau ó c mó húa di dng s, cỏc bin s khụng cũn cỏc yu t giỳp xỏc nhn nú Nhiu bin cựng mt ch cú th xỏc nhn ln thụng qua vic phõn tớch mi tng liờn Cỏc bc u tiờn x lý s liu iu tra ó c trỡnh by nm ngoỏi: phõn loi, xp loi, bng chộo c s, phn trm cỏ th, tớnh trung bỡnh õy l mt vớ d lc rt cn bn v t l nam, n: c tớnh tui, tui nht, tui ln nht, tui trung bỡnh, lch chun Hai bc u x lý s liu iu tra Hai bc u x lý s liu iu tra l lm sch v miờu t ban u gi l bc xem xột tớnh gn kt tng th, c cu s liu hoc phõn loi theo phng phỏp kho sỏt Cỏc phng phỏp kho sỏt gm hai loi: phng phỏp phõn tớch nhõn t phõn tớch cỏc nhõn t chớnh, phõn tớch cỏc tng ng n v phc v phng phỏp xp loi t ng Chỳng tụi mun nhn mnh n cỏch tip cn tng th giỳp xỏc nhn v phờ bỡnh mt cỏch tớch cc v lm giu thụng tin c s Tụi mun lu ý l bc ny khụng cú nhiu lý thuyt miờu t Trong mt s kinh t quc t ni ting, ụi cú th bt gp cỏc cụng trỡnh da trờn cỏc cuc iu tra thc hin i vi khong 200 sinh viờn m khụng cú thụng tin v cht lng mu Núi cỏch khỏc, cụng vic sn xut s liu thng kờ, phờ bỡnh v nhn xột s liu l phn vic him cú ch ng cỏc lý thuyt, cỏc bi vit v kinh t lng v kinh t m thng ch cú ch ng khoa hc xó hi Bc ba v bn x lý s liu iu tra Bc ba l xem xột cỏc gi thit a theo phng phỏp khng nh hoc bc cu Bc ch liờn quan n cỏc cuc iu tra cú s dng cõu hi m õy ta s x lý cỏc cõu tr li t ca cỏc cỏ nhõn Ta s thy rng ch t cõu hi m thỡ ta mi thc s bit liu ngi c hi cú thc s hiu cõu hi hay khụng Bc cui l ỏnh giỏ thụng tin c s, quay tr li s liu ban u a gi thit mi, vũng lp mi Thng kờ kho sỏt: phõn tớch nhõn t v phõn loi 1.1 Nguyờn tc Cỏc phng phỏp thng kờ kho sỏt ch yu l cỏc k thut miờu t thụng qua cỏc trc chớnh m thng ngi ta gi l phõn tớch theo nhõn t v k thut phõn loi Cỏc phng phỏp ny giỳp sp xp, xp loi v c cu thụng tin cha ng mt b s liu Phng phỏp ny giỳp cú mt cỏch nhỡn bao quỏt v tng hp v thụng tin Tụi xin nhc li l cỏc k thut ny thuc v nhúm cỏc thut toỏn cú gc gỏc t u th k 20 Phõn tớch nhõn t xut hin nm 1904 Tụi xin m ngoc núi qua v lch s nm 1904, nm ú nh thng kờ ngi Anh Charles Spearman, di c sang M, cho xut bn mt bi bỏo gõy nhiu tranh cói cú Phng phỏp thng kờ tiờu General intelligence, objectively determined and measured1 Bi bỏo ny chớnh l ngun gc ca phõn tớch nhõn t c in í ngha lý lun ca bi bỏo ny ln hn rt nhiu giỏ tr khoa hc ca nú 115 K t ú, cỏc phng phỏp ny c gi tờn l phng phỏp kho sỏt, phng phỏp c cu Vo nm 1904, chng cú cỏc cụng c cn thit s dng phng phỏp ny Trong nhng nm 1960, phng phỏp ny c ng dng mt cỏch rt vng v v lm gim giỏ tr ca cụng vic phõn tớch nhõn t gii khoahc Chia tỏch giỏ tr riờng bit Cn phi i n nm 1936 thỡ nh lý chia tỏch giỏ tr riờng bit [Singular Value Decomposition] mi c cụng b nh lý ny cho rng tt c cỏc bng hỡnh ch nht cú th c chia tỏch mt cỏchcomme ti u nh tng rectangulaire peut ờtre dộcomposộ de faỗon optimale une somme de v ca cỏc vộc-t ú l cỏch chia tỏch ti u cú th lm dune dộcomposition optimale quitt est possible qui pour to c i vi c cỏc hỡnh ch et nht Núi est cỏchvalable khỏc, rectangulaires Autrement un hc, thộorốme mathộmatique, õy ldit mtcest nh lý toỏn khụng phi l mt mụ hỡnh et non thng kờ statistique tụi ó s dng hỡnh nh ca mt bỏo hoa Nous avons pris limageChỳng dun guộpard Cest une image classique qui est publi õy l mt hỡnh nh c in c xut bn cun de Marc Nelson ô Data sỏch compression ằ Data compression ca Marc Nelson Mụ hỡnh ny rt n gin Nu nh hỡnh v tụi mu xanh lỏ cõy v mu xanh da tri nhn mnh rng mụ hỡnh ny rt khỏc bit vi nhng mụ hỡnh khỏc thng kờ vỡ õy, nhng gỡ ta bit u nm v trỏi phng trỡnh v nhng gỡ cha bit nm bờn phi iu ny rt khỏc vi hi quy, ngi ta mun ly bin v phi gii thớch cho bin v trỏi ca phng trỡnh õy, ta quan sỏt c iu gỡ ú v õy l ln u tiờn ta t hi cú cỏi gỡ ng sau quan sỏt m khụng cú Hỡnh nh mt conguộpard bỏo hoa Image dun bt k lý thuyt hay s gii thớch c a trc le i tableau ci-dessous une petite partie du codage de limage te ú Theo hng ny, cỏch Vous lm s avez rt cdans bit v mi im s ca cỏ nhõn ifigurer cho mụndans j ph thuc Trong bng sau õy l mt phn 200 nh mó ce húaqui veut di votre appareil photographique: image x 320, nht im s f m Spearman gi l nhõn t chung v hỡnh nh theo cỏch b trớ cỏc im nh mỏy nh: lignes et 320 colonnes pour dộcrire ce guộpard Le nombre que vous avez da thỏi hay cũn gi l trớ tu Spearman núi: khụng kh nh 200 x 320, cú ngha l cú 200 dũng v 320 ct correspond niveau gris, mesures laCon couleur demi ụ ng 255, depuis le cn phi bit cỏc im s ca cỏc mụn hcau khỏc de miờuaux tra chỳ bỏo hoade ny s ca mt cỏ nhõn bn bit trớ tu ca anh ta. Mụ vi mc mu xỏm, n v o mu t n 255, tip noir hỡnh ca Spearman mang tớnh chiu.la Mụdộcomposition hỡnh ny ú l mu trng v de muce en Si n je fais singuliốre tableau, je vais trouver un prem c b sung a nhõn t th hai vo, ngoi trớ tu, Nu thc hin thao tỏc chia tỏch n bng s liu ny, deuxiốme facteur, comme si u cộtait lintelligence et nh la mộmoire l trớ nh cựng cỏc h s ca nú Trờn thc t, cụngetc.,tụi s cú nhõn t tiờn, nhõn t th hai, v.v ging progressivement trỡnh ca Garnett v Thurstone ó khỏi quỏt húareconstituer mụ nhõn tletrớtableau tu v trớ nh v dn dn cú th tỏi lp bng hỡnh ny2 a thờm vo nhiu nhõn t gii thớch Hỡnh u tiờn (bờn trỏi) khụnglimage c p(lm ! Nhngde gris de Extrait du tableau numộrique codant niveaux Cỏc mụn nh s hay a cn nhiu trớ nh hn mụn ta cú th nhỡn thy hai mt v mi ca bỏo Lỳc (200 lignes, 320 colonnes) toỏn, vỡ vy cn a cỏc h s khỏc cho cỏc im chỳng ta cú 200 x 300 s, tc l 60 000 s mụn khỏc Vi (200 + 300) x s, ngha l 1000 s, chỳng ta cú 88 87 95 88 95 95 95 106 95 78 65 71 151 151 153 170 183 181 162 140 116 128 133 144 153 151 162 166 162 151 126 117 128 143 147 175 143 144 133 130 143 153 159 175 192 201 188 162 Charles Spearman, 1904, American Psychology, p 201-293 123 Journal 112 of116 130 s 15, 143 147 162 183 166 135 123 120 151Charles 162Spearman, 166 Jean 170 188 166 v Howard 128 116 132 tõm 140 Trong s cỏc hc gi v trớ tu,133 cn k n Piaget, Lev Vigotsky Gardner Nh lý ngi 126 160 168nghiờn 166 159 tớch 135 93v ó nờu 98 yu 120t tng 128 126 Anh Spearman (1863-1945) ó trung cu phõn nhõn t 101 trớ tu quỏt v trớ tu 147 154 155 153 144 126 106 118 133 136 153 159 153 [BT] 159 153 147 159 150 154 155 153 158 170 159 147 Garnett J.-C (1919) General ability, and purpose Psych., 9,166 p 345-366 (1947)- 153 Multiple 130 151 cleverness 144 147 176 British 188J of 170 183Thurstone 170 L L.166 Factor Analysis The University of Chicago Chicago 155 181 Press, 183 162 144 147 147 144 126 120 123 129 166 147 [Nộn 129 123 133 Paris, 144 1993 133 109 118 132 112 Mark Nelson, La compression de donnộes, d liu] NXB Dunod, [BT] 117 136 130 136 147 147 140 136 144 140 132 129 151 78 159 181 135 116 143 154 162 130 132 130 109 153 lignes et 320 colonnes pour dộcrire guộpard nombre vous avez dans chaque case lignes et 320 colonnes pour dộcrire ce ce guộpard Le Le nombre queque vous avez dans chaque case correspond au niveau de gris, aux mesures de la couleur de 255, depuis le blanc jusquau correspond au niveau de gris, aux mesures de la couleur de 255, depuis le blanc jusquau noir noir je fais laTam dộcomposition singuliốre tableau, je vais trouver premier facteur, 116 hcdộcomposition o 2008 singuliốre Si Si je Khúa fais la de de ce ce tableau, je vais trouver un un premier facteur, un un deuxiốme facteur, etc., comme si cộtait lintelligence et la mộmoire et je pourrais deuxiốme facteur, etc., comme si cộtait lintelligence et la mộmoire et je pourrais progressivement reconstituer le tableau progressivement reconstituer le tableau Extrait tableau numộrique codant limage ( niveaux 255) Extrait du du tableau numộrique codant limage ( niveaux de de grisgris de de 0255) (200 lignes, 320 colonnes) lignes, 320xỏm colonnes) Trớch bng s húa hỡnh(200 nh (mc mu t n 255) (200 dũng v 320 ct) 88 88 87 87 95 95 88 88 95 95 95 95 95 95 106106 95 95 78 78 65 65 71 71 78 78 77 77 77 77 151151 151151 153153 170170 183183 181181 162162 140140 116116 128128 133133 144144 159159 166166 170170 153153 151151 162162 166166 162162 151151 126126 117117 128128 143143 147147 175175 181181 170170 166166 143143 144144 133133 130130 143143 153153 159159 175175 192192 201201 188188 162162 135135 116116 101101 123123 112112 116116 130130 143143 147147 162162 183183 166166 135135 123123 120120 116116 116116 129129 133133 151151 162162 166166 170170 188188 166166 128128 116116 132132 140140 126126 143143 151151 144144 160160 168168 166166 159159 135135 101101 93 93 98 98 120120 128128 126126 147147 154154 158158 176176 154154 155155 153153 144144 126126 106106 118118 133133 136136 153153 159159 153153 162162 162162 154154 159159 153153 147147 159159 150150 154154 155155 153153 158158 170170 159159 147147 130130 136136 140140 151151 144144 147147 176176 188188 170170 166166 183183 170170 166166 153153 130130 132132 154154 162162 155155 181181 183183 162162 144144 147147 147147 144144 126126 120120 123123 129129 130130 112112 101101 166166 147147 129129 123123 133133 144144 133133 117117 109109 118118 132132 112112 109109 120120 136136 136136 130130 136136 147147 147147 140140 136136 144144 140140 132132 129129 151151 153153 140140 128128 Trớch bng s húa hỡnh nh (mc mu xỏm (200principaux dũng v 320 ct) Reconstitution limage avec etaxes 4255) axes Reconstitution de de limage avec 2tet20 4n principaux image ( gauche) nest pas trốs jolie ! Mais vous voyez les yeux et le nez du rs quau dộpart on avait 200 x 300 nombres, ce qui fait 60 000 nombres Avec thcest tỏi lpc nh phn trờn l mt ma trn tng liờn nh chỳng ta thay i trt t cỏ x nombres, dire hỡnh 1000 nombres, onõy arrive dng reconstituer limage du nu haut nộn cht v ng nhiờn cht lng s rt xu bờn th dũng V nu chỳng ta thay i trt t cỏc s forte compression etNelson, ộvidemment de trốs qualitộ A droite nous avons Mark La compression de mauvaise donnộes, ẫditions Dunod, Paris, 1993 [note de lộditeur] Mark Nelson, La compression de donnộes, ẫditions Dunod, Paris, 1993 [note de lộditeur] tay phi, chỳng ta cú trc Chỳng ta thy dn dn bin, chỳng ta khụng lm oit se dessiner progressivement le visage du guộpard Enfin en bas, vous avez 10 thay i cỏc tng liờn Nh hin lờn khuụn mt bỏo hỡnh di, vi 10 ct, ta vy ta khụng lm thay i giỏ tr ca ma trn tng espondent cúune thmeilleure tỏi lp hỡnh reconstitution nh rừ nột hn liờn, cú ngha l phn k thut toỏn hc cho phộp tớnh 8 toỏn chia tỏch Núi cỏch khỏc, s dng mt phn nh thụng tin, chỳng ta cng cú th nộn c thụng tin Trong mỏy nh, ú l thut toỏn JPEG cú tớnh n v trớ ca dũng v ct bng Thut toỏn ny va nhanh v hiu qu hn vỡ nú s dng mt thụng tin b sung quan trng: mi im nh c bao quanh bi nhiu im nh khỏc Bõy gi ta quay tr li bng s liu iu tra ban u Mi chiu hai chiu ca bng cho phộp xỏc nh Tỏi lp hỡnh nh vi 10 trc chớnh khong cỏch gia cỏc chiu khỏc ca bng Reconstitution de limage Trờn c s bng ny, ta ó tớnh khong cỏch gia cỏc avec 10 axes principaux Vi 40 trc (thay vỡ 200 nh lỳc u), khuụn mt dũng v ct Thng thỡ cỏc ct l cỏc bin, cỏc dũng bỏo khụng th phõn bit c vi hỡnh nh lỳc u l cỏc cỏ th, h gia ỡnh, cỏc quan sỏt hoc n v es (au lieu Vỡchỳng de 200 ta aubt dộpart), de lakờ figure u vi la 200figure chiu, est nờn indiscernable chỳng ta ó thng Trong initiale thng kờ, ta thng cú thúi quen lm gim ln thụng tin m tỏi hin c ton b vi cỏc bin, tớnh tng liờn Vic tớnh khong cỏch est parti de 200 dimensions, on a divisộ par linformation en reconstituant thụng tin ban u gia cỏc cỏ th mi c thc hin Chỳng ta s thc t linformation initiale Ta thy rng mụ hỡnh ny phỏt huy tớnh nng hn ta hin vi c cỏc cỏ th v cỏc bin Bit rng cỏc cỏ th que ces modốles sont beaucoup plus puissants que ce quon imagine Pour un tng i vi mt bỏo hoa, mụ hỡnh ny khụng v cỏc bit c gn vi bi mt ni dung toỏn modốle nutilise mờme pas la position des lignes et des colonnes, s dng v trớ cỏc dũng v ct, cỏc im nh Tha cỏc hc: nộn.des pixels La on valeur singuliốre, lescỏcmathộmaticiens, le trỡnh savent nh toỏn hc, cỏn b thng kờ cúles mtstatisticiens ti õy, vic parmi Nhng vous gỡ tụi ó by n lỳc ny chớnh l bc chia tỏchdes giỏ lignes tr riờng et bitdes khụng ph thuc trt t Vous miờune t changez thụng qua pas cỏc trc end pas de lordre colonnes du vo tableau la chớnh Phng phỏp th hai dũng v ct bng Chỳng ta khụng lm thay i rt khỏc bit: ú l phng a corrộlation si vous changez lordre des individus dans les lignes Si vous phỏp phõn loi dre des variables, vous ne changez pas les corrộlations Vous ne changez donc propre de la matrice de corrộlation cest dire la partie technique mathộmatique e calculer cette dộcomposition Autrement dit, en utilisant quune toute une petite nformation, on a rộussi compresser linformation Naturellement, ce que vous otre appareil photographique, cest lalgorithme JPEG qui prend en compte la ective des lignes et des colonnes du tableau Cet algorithme est la fois plus eaucoup plus efficace parce quil utilise une information supplộmentaire Phng phỏp thng kờ 1.2 Hai nhúm phng phỏp b sung Phng phỏp nhõn t a cỏc biu din bng mt phng th trờn ú khong cỏch hỡnh hc gia cỏc cỏ th, hay cỏc ct, cú ngha l cỏc bin phn ỏnh cỏc kt ni v thng kờ gia cỏc cỏ th, cỏc bin Phng phỏp phõn loi, phng phỏp clustering, a cỏc hp theo loi hoc t hp cú sp xp th t ca cỏc dũng v ct Lu ý v thut ng t ting Anh classification cú ngha l xp loi ting Phỏp, ch khụng phi l phõn loi Cú ngha l ó cú cỏc loi ri v cn phi sp xp cỏc cỏ th vo cỏc loi khỏc ú l sp xp Cũn thut ng ting Anh, classification l clustering Trong ting Phỏp, t xp loi cú ngha u tiờn l clustering Cũn nu khụng, chỳng ta cú th s dng thut ng phõn bit, hoc phõn b Cỏc k thut rt c bn ny cn phi tuõn th cỏc nguyờn tc c kt qu cng nh hng dn s dng 1.3 Mụ hỡnh c s: yu t quan sỏt v gii thớch (hoc minh ha) Tip theo k thut nộn thụng tin, mt mụ hỡnh rt n gin nhm phõn bit cỏc yu t quan sỏt v cỏc yu t gii thớch Cú th miờu t s liu theo mt quan im v biu din nú vi cỏc thụng tin khỏc khng nh quan im ny Cú th lm cỏc kim nh thng kờ tng i hin i v cỏc gi thit phc nhng thc t hn so vi gi thit hi quy n hoc hi quy phc Thc hin miờu t cn khụng tt c cỏc s liu cựng nộn Vớ d, ly li hỡnh bỏo hoa: cỏc mc xỏm, rt ng b, cựng cú vai trũ nh nhau, vy cú th nộn c Nhng iu tra, chỳng ta cú nhiu ch : i vi h gia ỡnh ú l tiờu dựng, y t, dõn s, xó hi, thu nhp, gii trớ, qu thi gian cú ngha l vic s dng thi gian Trong cỏc cuc iu tra phc tp, cú th thc hin miờu t vi tng ch Sau ú xem xột cỏc ch khỏc vi cựng mt kớnh ny vi cụng c quan sỏt c bit ú l cỏch ngi ta gi l miờu t theo ch Vớ d, nhiu bin k thut cú th c nh v nh cỏc bin gii thớch Cỏc trng hp khụng tr li i vi mt vi bin l mt dng thc c thự, cú th cú giao thoa i vi cỏc trng hp khụng tr li Ti lp hc chuyờn ti Tam o, chỳng ta s thy rng vic phõn bit bin quan sỏt v bin gii thớch ng vi mt mụ hỡnh cho phộp tng quỏt khỏi nim hi qui phc (xem S cui trang) Bõy gi chỳng ta cựng ly vớ d v mt cuc iu tra v qu thi gian Mc ớch l o lng thi gian thc hin cỏc hot ng ngy Cú hai n v thng kờ cho phộp so sỏnh mi th kinh t: tin bc v thi gian Bin quan sỏt (qu thi gian) Lm vic cú tr lng n nh ú n Ni tr 117 Lm vic Con cỏi n sỏng Nh v sinh Chi - Lm i ch n ti nh hng Gii trớ Bun ng Thm bn bố Do chi c sỏch Quan h Nghe a Gii trớ bờn ngoi Biu din mi tng liờn gia cỏc khong thi gian hot ng qua phng phỏp phõn tớch thnh phn chớnh 118 Khúa hc Tam o 2008 Vớ d, cú th o lng thi gian ng, ngh, n, i do, i lm, lm vic nh, lm vic bờn ngoi, i n nh hng, c sỏch, xem vụ tuyn, v.v Thi gian l n v nht cú th so sỏnh mt cỏch thit thc cỏc hot ng Ngy nay, mi ngi hay núi n hin tng bựng n ca cỏc phng tin i chỳng Phi chng iu ny cú ngha l cỏc cỏ nhõn thng b cun vo cỏc mi liờn h vi truyn hỡnh, bỏo, i, in nh, internet, cỏc mi liờn h ? Thi gian l n v nht bit cỏch thc ca mi cỏ nhõn th hin s quan tõm ca mỡnh i vi cỏc hot ng õy, chỳng ta cú cuc iu tra vi cú c mu l 18000 ngi, vi mc tiờu tỡm hiu mi liờn h gia thi gian dnh cho cỏc hot ng 18 hot ng c biu din trờn th Chỳng ta cú c phng ỏn phõn tớch theo thnh phn chớnh phớa trờn, bờn trỏi, ta cú tng thi gian n, cỏc hot ng ni tr, thi gian dnh cho n sỏng v i ch ngoi cựng bờn phi, ú l cụng vic c tr lng v cụng vic lm nh Cuc iu tra c tin hnh vi ton b dõn s nhng cú mt t s cỏc mu l nam gii ang i lm Mc dự vy, thi gian i lm c coi l bin loi tr qu thi gian bờn phi l hot ng i n nh hng, nghe a v bng cỏt-sột, gii trớ bờn ngoi Thng thỡ th ny s d quan sỏt hn so vi ma trn tng liờn Nhng trờn th d dng biu din cỏc thụng tin c thự cho cỏc cỏ th (xem S cuitrang) Tiu hc Vớ d, cú th biu din thnh ba nhúm tui: nhúm cao tui bờn trỏi, nhúm trung niờn trờn v nhúm niờn di, bờn phi Cú th thy mi tng liờn u tiờn l nhúm niờn lm vic nhiu hn, cú nhiu mi quan h bờn ngoi hn nhúm cao tui Bin th hai, trỡnh hc cú th chia thnh ba nhúm: thp, trung bỡnh v cao Trỡnh hc cng l bin loi tr cỏc hot ng vỡ ngi ta quan sỏt thy rng cỏc hot ng giao tip, c sỏch, gii trớ bờn ngoi-bao gm c vic i thm bn bố- rt cú quan h vi trỡnh hc Cỏc bin ny u gn vi cỏc bin khỏc Nu nh cuc iu tra cú khong 10 bin vi khong 60 cõu hi v qu thi gian v khong 10 bin v kinh t, dõn s, chỳng ta s cú c thụng tin tng i phong phỳ v cỏch thc nhng ngi c hi s dng thi gian Mụ hỡnh ny rt n gin: chỳng ta ó chn mt nhúm cỏc bin ng b liờn quan n thi gian thc hin cỏc hot ng v ó phúng chiu trc cỏc d liu dõn s, xó hi Cn phi ỏnh giỏ thụng tin trờn c s cỏc th ny v hiu rừ ý ngha ca cỏc bin khỏc Ta nhn thy rng ngi ta cú nhiu hot ng gn vi trỡnh hc c bn õy l mt im chung cỏc cuc iu tra ti Phỏp Trờn thc t, s lng hot ng ca nhng cỏ nhõn cú trỡnh hc thp rt nghốo nn, cũn i vi nhng ngi cú hc cao, cỏc hot ng rt a dng õy l loi nhn xột m ta cú th a v cỏc cuc iu tra, phõn tớch s liu iu ny thng cho phộp chỳng ta cú quan im mang tớnh phờ bỡnh vic thit k bng hi Trung niờn Bin quan sỏt v bin b sung Lm vic cú tr lng n nh ú n Ni tr Cao tui Lm vic Con cỏi n sỏng Nh v sinh Chi - Lm Trung hc i ch n ti nh hng Gii trớ Bun ng Thm bn bố Do chi c sỏch Quan h Nghe a Gii trớ bờn ngoi Thanh niờn i hc V trớ ca cỏc bin gii thớch trờn hỡnh trc Phng phỏp thng kờ Thụng qua miờu t 119 Bootstrap l mt t ting Anh Ngun gc thut ng ny bt ngun nh sau Bootstrap l mt di dõy (thng bng da) xõu giy (bt), cú mt cõu ting Anh nh sau: dn ngi lờn bng cỏch kộo di dõy xõu giy, theo ngha búng cú ngha l t xoay s vi nhng gỡ mỡnh cú Phn th hai ny rt quan trng vỡ nú giỳp a mt v trớ khoa hc cho nhng gỡ chỳng ta ang thy hin nay, mc dự nú cũn mang nng tớnh nh tớnh cho dự ó cú s h tr ca mỏy tớnh T nm 1904 n 1964, gn nh l khụng cú cụng c giỳp chia tỏch cỏc giỏ tr riờng bit v cỏc phng Vy thỡ phng phỏp bootstrap cú nguyờn tc gỡ? phỏp phỏi sinh Thi gian t nm 1964 n khong ú l cỏi m chỳng ta gi l rỳt ri t tr li Gi nm 2000 c ỏnh du bng s thiu vng cỏc s chỳng ta cú 18 000 cỏ th ban u, chỳng ta s cụng c thụng qua Nhng s phỏt trin nhanh chúng ly mt cỏ th, ri t tr li, tip tc ly ngu nhiờn ca tin hc ó lm nờn nhng iu tuyt vi nh chỳng mt cỏ th, nhng sau ú u t tr li Lm cụng ta bit Bt k chic mỏy tớnh xỏch tay no chỳng ta s vic ny 18 000 ln Nh vy chỳng ta s cú mt mu dng hụm cng cú tớnh nng mnh hn tng nng khỏc, cựng quy mụ vi mu u nhng mt vi cỏ lc tớnh toỏn y ban nng lng nguyờn t v ca th s xut hin hai ln hoc nhiu hn v cỏc cỏ th Trung tõm nghiờn cu khoa hc quc gia Phỏp thi tụi khỏc s khụng tỏi xut hin Mu ny gi l Tỏi to cũn l sinh viờn ! Ngy nay, bt k gia ỡnh no cng bootstrapằ Nh thng kờ hc Bradley Efron1 l ngi s hu mt nng lc tớnh toỏn tng ng vi nng lc u tiờn cụng b ni dung ny vo nm 1979 tớnh toỏn ca mt trung tõm nghiờn cu ca nhng í tng nh sau: thc hin khong 12 tỏi to v phõn ô rộplication bootstrap ằ La premiốre communication survlesosujet, rộalisộe nm 1960 Chỳng ta cú nhiu kh nng tớnh toỏn cú tớch cỏcscientifique bng tỏi to sỏnhetchỳng vi le bng u th s dng phngBradley phỏp gi l tỏi nhdec1979 mu v tiờn Núi cỏch khỏc l chỳng ta lm xỏo trn d liu v , date statisticien Efron c bit l phng phỏp bootstrap quan sỏt xem trỳc cú nh khụng K thut ny Lidộe est la suivante : effectuer des dizaines de rộplications et cu analyser cesn tableaux rộpliquộs ging nh chỳng ta rung cõy tỏo v xem et comparer avec le tableau initial Autrement dit, on perturbe les donnộes et on regarde si la xem tỏo 2.1 Phng phỏp Bootstrap s lon ri xung tun hayarbre cũn trờn cõy.siChỳng structure est stable Exactement comme lorsque secoue pour savoir les ta ch gi nhng phn n nh cu trỳc pommes vont rester sur larbre ou si les pommes vont tomber par terre ! On ne conserve que Nhng phng tỏi de nh mu hin i l nhng õy l cỏc vựng tin cy i vi im Vựng tin cy cú la partiephỏp stable la c structure phng phỏp tớnh toỏn tớch cc da trờn cỏc mụ phng ngha l chỳng ta chcIlchn cỏcdu im s trung Voici les zones de confiance que lon peut obtenir pour points sagit le mờme K thut graphique bootstrap giỳp xỏc nh cỏc vựng tin cy mt vựng nht nh Ngay c ta thc hin cuc iu que tout lheure un petit peu grandi avec les mờmes temps dactivitộs Ces zones xỏc nh de v trớconfiance cỏc bin biu din tra khỏc, theo lý thuyt, ta cng s cú c signifient que lon est certain que les points vont se trouver dans une zone th ny imnous nm dit vựng cy particuliốre Mờme si on fait une autre enquờte,vilacỏc thộorie que lontintrouvera cette figure avec les points qui restent lintộrieur de leurs zones de confiance Lm vic c tr lng n nh ú n Lm vic Con cỏi Ni tr n sỏng Ngh Toilette Chi_Lm Mua sm Do chi c sỏch Gii trớ Bun ng Thm bn bố Hot ng Quan h n nh hng Bng a Gii trớ bờn ngoi Vớ d vựng bootstrap bootstrap ipour vi mt vi bin quan sỏt actives Exemple de zones quelques variables Voil des zones de confiance bootstrap pour les variables supplộmentaires Bradley Efron, R.J Tibshirani, Introduction to the Bootstrap Monographs on Statistics and Applied Probability 57, 1993, Chapman & Hall/CRC, 1998, CRC Press LLC [BT] 120 Khúa hc Tam o 2008 Tiu hc Ngi cao tui Trung niờn Trung hc i hc Thanh niờn Exemple de zones bootstrap pour quelques variables supplộmentaires Vớ d vựng bootstrap i vi mt vi bin gii thớch On peut aussi, comme on le verra en atelier, avoir des zones bootstrap sur les variables õy l vựng tin cy bootstrap mt vidõge bin gii thyzones cu trỳc rt cettrng s liu ú, vỡ supplộmentaires : icii lesviclasses avec ta leurs de ny confiance les vi niveaux thớch dộducation avec leurs zones de confiance Cela chỳng ta phỏt hin thụng qua ú Nhng nous montre, par exemple, que le secondaireiu ny khụng phi lỳc no cng ỳng vỡ thng kờ chỳng et le supộrieur sont trốs proches en rộalitộ La trốs importante diffộrence propos des budgetsChỳng ta cú th cú cỏc vựng bootstrap i vi cỏc ta khụng th c lng c xỏc sut ca temps est lopposition entre primaire et non primaire Ceci est un exemple de conclusion mt s kin bin giiCes thớchellipses (ni dung sellipses c núidajustement k hn ti lpdes rộplications m ta cú thcorrespondant phỏt hin thụng chớnh point cỏc s liu ú sontny des qua un mờme chuyờn ) õy cú cỏc nhúm tui vi cỏc vựng tin Hóy tng tng tt c nhng gỡ chỳng ta cú th lm Cette procộdure ộtait coỷteuse en 1979, elle est maintenant quasiment gratuite et instantanộe cy v cỏc nhúm trỡnh hc cng cú cỏc vựng tin gii quyt ny Cú th thy ba cỏ th cú khỏc On nosait mờme pas penser ce genre de procộdures en 1960 cy iu ny cho thy rng trờn thc t trỡnh trung bit ụi chỳt v chỳng ta phi a quy lut chung 2.2 Larticulation description infộrence bỡnh v cao rt gn Mt s khỏc bit ln v qustatistique Nu thc s ba cỏ th ny i din cho mt cỏi gỡ ú, thi gianIllexiste s iunlp gia trỡnh thp v trỡnh thỡ cn phisea mtles mu mi bit problốme trốs difficile en statistiques, auquel heurtent mộthodes dontxem je liu cú khụng thp õy l mt vớ d kt lun thc s tn ti hin tng i din cho cỏ th ny viens de parler : larticulation entre description et infộrence Cỏc hỡnhSiờ-lớp l nhng ờ-lớp iu chnh cỏc tỏi to khụng Lỳc u hin tng ny cũn l iu khú hiu vous dộcouvrez une structure sur des donnộes, vous allez trouver que cette structure est tng ng vi cựng mt im K thut ny rt tn i vi cụng chỳng significative sur les mờmes donnộes, puisque vous lavez dộcouverte Mais ce nest pas kộm vovalable nm 1979, l khụng estimer Nh xỏc sut hc ni ting Emile Borel núi: nu tụi parcenhng quonbõy ne gi peutgn pasnh en statistique la probabilitộ dun ộvộnement que, lon mt nhiu chi phớ v thc hin c Cú l nhỡn thy ba ngụi to thnh mt hỡnh a dộcouvert sur les donnộes elles-mờmes Imaginez tout ce quon peut faire avec ce genre detam giỏc nhng nm 1960 cha dỏm ngh n lch, tụi khụng quyn hi: õu problốme On peut trouver quiliu y a ny individus qui sont un petitcúpeu aberrants et l enxỏc tirersut une cú th thy ba ngụi to mt hỡnh tam giỏc cõn loi gộnộrale Si ces individus reprộsentent vraiment quelque chose, il faut refaire un autre trờn bu 2.2 Kt ộchantillon hp miờu tpour suy rngsil thng kờ triphộnomốne ? bi l tụi s thy nú s liu Nu nh savoir existe effectivement le reprộsentộ partrong ces 3cỏc individus lỳc u tụi t cõu hi, tụi cú th ngc nhiờn, nhng Ce phộnomốne est lorigine de beaucoup dincomprộhensions de la statistique par le grand Cú mt rt khú khn thng kờ m cỏc lỳc ú thỡ tụi cú th nhn rng iu ú l khụng public phng phỏp tụi va trỡnh by vp phi: kt hp miờu thằ Cú nhiu iu khụng chớnh xỏc vit v ni dung Un grand probabiliste du nom dEmile Borel , disait : ô si je dộcouvre que ộtoiles forment t v suy rng ny, vớ d nh cun Ngu nhiờn v s cn thit un triangle latộrale dans le ciel, je nai pas le droit de me poser la question : quelle est la Nu nh chỳng ta phỏt hin cu trỳc s liu, chỳng ot gii Nobel ca Jacques Monod2 ễng a cõu ẫmile Borel (1871-1956) fut mathộmaticien, professeur la Facultộ des sciences de Paris, spộcialiste de la thộorie des fonctions et des probabilitộs, membre de lAcadộmie des sciences mais aussi homme politique Avec ẫmile Borel (1871-1956) l nhLebesgue, toỏn hc,ilging khoa Khoa hcde tilaParis, chuyờn v lý thuyt phng trỡnh v Renộ Baire et Henri-Lộon ộtait viờn parmi les pionniers thộorie de lagia mesure et de son application xỏc sut, thnh viờn Vin Hn lõm khoa hc, ng thi l chớnh tr gia Cựng vi Renộ Baire v Henri-Lộon Lebesgue, ụng l la thộorie des probabilitộs Le concept de tribu borộlienne est nommộ en son honneur Dans lun de ses livres sur mt nhng ngi tiờn phong lýlamusante thuyt o expộrience lng v ng lý thuyt sut Khỏi paradoxe nim i s les probabilitộs, il prộsente dedng pensộe connuexỏc sous le nom du Borel singe c savantt out tờn ụng analogues a ộgalement ộditộvun nombre darticles dethớ recherche la thộorie qu'un Trong mt cunIlsỏch ca ụng vit xỏccertain sut, ụng cú trỡnh by mt nghim sur vui nhn v t des jeux cainsi bit n di cỏi tờn vộritable monument surngi le jeu ễng de bridge [note de vit lộditeur] kh bỏc hc hay vt ging cú mt s bi v lý thuyt cỏc trũ chi cng nh mt cụng trỡnh nghiờn cu v trũ ỏnh bi brit [BT] Nm 1965, Jacques Monod nhn gii Nobel sinh hc hay14 y hc cựng Franỗois Jacob v Andrộ Lwoff cho cỏc cụng trỡnh v gien Cun sỏch ô Ngu nhiờn v s cn thit ằ (1970) ca ụng cú ting vang ln, kộo theo nhiu tho lun v sinh hc trờn cỏc din n ễng nờu quan im ca mỡnh v t nhiờn v ngi v tr [BT] 132 Khúa hc Tam o 2008 Ly im ny lm gc tc l tr i giỏ tr bỡnh quõn ca mi bin j Nh vy, ta iu chnh cỏc thang ng thi bin bng d liu R thnh mt bng d liu X mi bng cỏch sau: Cỏc bin tiờu chun nh vy u cú phng sai, s2(xj), bng 1/n v bỡnh quõn, xj bng Nh vy cú th so sỏnh vai trũ cỏc bin vi Nh vy, phõn tớch c chun húa 3.3 Phõn tớch hp cỏc cỏ th (nc) Vic bin i d liu dn n vic tnh tin gc to ti trng tõm ca hp v thay i (trong trng hp phõn tớch chun húa) t l trờn cỏc trc phõn tớch hp cỏc im-nc Pp, ma trn XX cn biu din theo ng chộo khụng gian ny l ma trn cỏ tng quan (bng l mt vớ d) cú cỏch tớnh chung nh sau: cjj l h s tng quan gia cỏc bin j v j Cỏc to ca n im-cỏ th trờn trc nhõn t ua l n thnh phn ca vect ca= Xua Hỡnh 5a biu din th cỏc cỏ th-nc mt phng chớnh (1, 2) 3.4 Phõn tớch hp cỏc bin (ch tiờu) Cỏc to nhõn t waj ca cỏc im-bin trờn trc a l thnh phn ca v ta cú waj = cor (j, ca) Trờn hỡnh 5b, cng nh trờn ma trn tng quan tng ng (bng 3), tui th v t l bit ch ngi ln tng quan cht ch thun chiu vi nhau, tc giao theo cựng mt chiu Hai ch tiờu ny cng tng quan cht ch nhng nghch chiu vi t l t vong tr em, cỏc giỏ tr thp ca tui th (v t l bit ch ngi ln) tng quan vi cỏc giỏ tr cao ca t l t vong tr em (v ngc li) 3.5 Din gii Cỏc bin tng quan cht ch vi mt trc s gúp phn xỏc nh trc2 Mi tng quan ny th hin trc tip trờn th vỡ y chớnh l to ca im-bin j trờn trc a Ta quan tõm trc ht ti cỏc bin cú to ln nht v ta s gii thớch cỏc thnh phn chớnh trờn c s kt qu phõn t mt s bin v so sỏnh vi cỏc bin khỏc Hỡnh 5a mụ t hp cỏc im-nc trờn mt phng chớnh (1, 2) Lo v Cam-pu-chia gn trờn hỡnh ny v i lp vi cỏc nc khỏc Hỡnh 5b, biu din hp cỏc im-ch tiờu cho chỳng ta thy rng hai nc ny cú t l t vong tr em cao v tui th v t l bit ch ngi ln thp; hai nc ny khỏc vi cỏc nc khỏc cú t l t vong tr em thp v tui th v t l bit ch ngi ln cao hn Ma-lai-xi-a (hỡnh 5a) ni lờn vi Thu nhp bỡnh quõn tớnh theo u ngi v t l dõn thnh th cao (hỡnh5b) So sỏnh hai bỡnh 5a v 5b cng cho thy dõn s In-ụnờ-xi-a ụng nht Ta s thy hỡnh biu din ny, tt c cỏc imbin nm trờn mt phm vi bỏn kớnh hng vo gc cỏc trc3 Cỏc mt phng iu chnh s ct phm vi ny thnh cỏc vũng trũn ln (bỏn kớnh 1), gi l cỏc vũng trũn tng quan, ú cỏc im-bin c xỏc nh v trớ Nh vy, to wa ca mt im-bin j trờn trc a chớnh l h s tng quan ca bin ny vi ca (t hp tuyn tớnh ca cỏc bin gc) c coi l mt bin gi cú ta c hỡnh thnh t n ln chiu cỏc cỏ th trờn trc ny Do cỏc trc nhõn t trc giao tng cp mt, ta thu c mt chui cỏc bin gi khụng tng quan vi c gi l cỏc thnh phn chớnh1 tng hp cỏc tng quan ca ton b cỏc bin gc Phõn tớch theo cỏc thnh phn chớnh ch th hin cỏc mi quan h tuyn tớnh gia cỏc bin Hai bin cú h s tng quan thp cú ngha l cỏc bin ny c lp tuyn tớnh, cú th cú mt mi quan h phi tuyn tớnh Vớ d ny tt nhiờn khụng i din gii thớch mt phng m ch nhm kt hp bng d liu v kt qu Khụng phõn tớch cỏc im-bin Pn so vi trng tõm ca th (khỏc vi phõn tớch cỏc im-cỏ th) m so vi gc ca cỏc trc Khong cỏch t mt bin j n gc O chớnh l : Phng phỏp thng kờ 133 Bng ch tiờu dõn s ca cỏc quc gia ụng Nam T l t vong tr em 2003 Dõn s 2003 Thu nhp T l tng % dõn thnh Tui th 2003 T l bit ch quc dõn ngi ln trng dõn s th 2003 thun tớnh 2000 1990-2003 theo u rayon 1), les cercles de corrộlations, lintộrieur desquels sont positionnộs les points-variables (Tx_morti) (Popul03) ngi 2003 (Tx_alph) (Tx_accr) (%pop_urb) (Esp_Vie) (RNB/Hab) Population RNB/hab Espộr_Vie Tx 97mortalitộ 14144 310 57 Tx alphab 68 Tx accr dộmo 2,9 % pop 19 Cam-pu-chia urbain 2003 2003 adult 2000 infantile 2003 2003 2003 1990-2003 31 219883 810 67 (Tx_alph) 87 (Tx_accr) 1,4 (%pop_urb) 46 In-ụ-nờ-xi-a (Popul03) (RNB/Hab) (Esp_Vie) (Tx_morti) rayon 1), les cercles de corrộlations, lintộrieur desquels sont positionnộs les points-variables 82 320 310 55 65 2,4 Lo Cambodge 97 5657 14144 57 68 2,9 1921 Indonộsie 31 219883 810 67 87 1,4 4664 24425 3780 73 87 2,4 Ma-lai-xi-a Tx accr dộmo 2,4% pop Tx mortalitộ82 Population Laos 5657 RNB/hab320Espộr_Vie 55 Tx alphab 65 21 urbain 2003 6461 200324425 2003 infantile 20037 79999 27 10803780 2003 70 951990-2003 2,4 2,1 Phi-lớp-pin Malaisie 73 adult 2000 87 (Popul03) (RNB/Hab) (Esp_Vie) (Tx_alph) (Tx_accr) (Tx_morti) (%pop_urb) Philippines 27 62833 79999 21901080 70 95 2,1 6132 23 69 96 1,1 Thỏi Lan Cambodge 97 14144 310 57 68 2,9 19 Thaùlande 23 62833 2190 69 96 1,1 32 Indonộsie 31 81377219883 6769 87 93 1,4 1,6 46 19 480810 26 Vit Nam Viet Nam 19 81377 480 69 93 1,6 26 Laos 82 5657 320 55 65 2,4 21 Malaisie Tableau : Tableau 3780dộmographiques 73 87 pays de lAsie 2,4 64 de24425 indicateurs pour du Sud-Est Philippines 27 79999 Bng 1080 70 95 2,1 61 Ma trn tng quan Thaùlande 23 62833 2190 69 96 1,1 32 Viet Nam 19 81377 480 69 93 1,6 26 ! Tx_morti Popul03 RNB/Hab Esp_Vie Tx_alph Tx_accr %pop_urb -+ Tableau : Tableau de indicateurs dộmographiques pour pays de lAsie du Sud-Est Tx_morti ! 1.00 Popul03 ! -.40 1.00 RNB/Hab ! -.64 -.15 1.00 Popul03 RNB/Hab Esp_Vie Tx_alph Tx_accr %pop_urb Esp_Vie !! Tx_morti -.97 36 68 1.00 -+ Tx_alph ! -.90 46 42 92 1.00 Tx_morti ! 1.00 Tx_accr !! 63 -.64 -.10 -.52 -.73 1.00 Popul03 -.40 1.00 %pop_urb ! -.69 28 66 76 56 -.08 1.00 RNB/Hab ! -.64 -.15 1.00 -+ Esp_Vie ! -.97 36 68 1.00 Tx_alph ! -.90 46 42 92 1.00 Tableau-.10 : Matrice Tx_accr ! 63 -.64 -.52de corrộlations -.73 1.00 %pop_urb ! -.69 28 66 76 56 -.08 1.00 -+ Hỡnh 5a Phõn tớch theo thnh phn chớnh trờn bng cỏc ch tiờu dõn s ca ụng Nam Biu din quc gia trờn mt phng (1,2) Tableau : Matrice de corrộlations Inụnờxia Vit Nam Thỏi Lan Lo Campuchia Philipin Malaysia Figure 5a : Analyse en composantes principales sur le tableau des indicateurs dộmographiques de lAsie du Sud-Est Reprộsentation des pays dans le plan (1,2) Figure 5a : Analyse en composantes principales sur le tableau des indicateurs dộmographiques de lAsie du Sud-Est Reprộsentation des pays dans le plan (1,2) (contrairement lanalyse des points-individus) mais par rapport l'origine des axes La distance d'une variable j n 134 Khúa hc Tam o 2008 Hỡnh 5b Phõn tớch theo thnh phn chớnh trờn bng cỏc ch tiờu dõn s ca ụng Nam Biu din ch tiờu dõn s trờn mt phng (1,2) Hỡnh 5b : Phõn tớch theo thnh phn chớnh trờn bng cỏc ch tiờu dõn s! c&a ụng Nam Figure 5b : Analyse en composantes surtrờn le tableau des indicateurs (1,2) dộmographiques de Biu din chprincipales tiờu dõn s! mt phng lAsie du Sud-Est Reprộsentation des indicateurs dộmographiques dans le plan (1,2) 4.4 Phõn tớch tng quan PHN TCH CC T NG QUAN ANALYSE DES CORRESPONDANCES Vic phõn tớch cỏc tng quan ỏp dng trc ht vi Vớ d xem xột bng s ngu nhiờn sau õy cú c mt bng s ngu nhiờn K, cũn c gi l bng phõn phõn hc sinh theo hc v Vic phõndes tớch cỏc t ng quan ỏp d#ng en tr !c ht bng v!i bng sbngu nhiờn K,trỡnh cũn "c Lanalyse correspondances sapplique premier lieumcỏch tune table de contingence K, appelộe t chộo, cú n dũng v p ct, phõn b mt tng th theo theo cỏc vựng ca Vit Nam (xem bng 4) gi ltableau bng phõn t chộo, cú n dũng p c t, phõn b m t une tngpopulation th theo hai bindeux nhvariables l "ng n aussi croisộ, n lignes et p v colonnes, qui ventile selon hai bin nh lng n v p dng thc Nh vy cỏc v pv dng Nh vy cỏcLes dũng v et c les t cúcolonnes vai trũ nh qualitatives th%c nvai et ptrũ modalitộs lignes jouent donc des rụles similaires dũng ct cú nh Vớ d# xem xột bng s ngu nhiờndesau õy cú "c bng cỏch en phõn b hclessinh theo trỡnhleur Considộrons par exemple, le tableau contingence suivant obtenu ventilant ộlốves selon hcdộtude vn vettheo cỏc vựng c$a Vit Nam (xem bng niveau les rộgions vietnamiennes (cf tableau 4) 4) Bng Bng s ngu nhiờn giao gia trỡnh hc v cỏc vựng Tableau : Tableau de contingence croisant les niveaux dộtude et les rộgions Bng : Bng s! ngu nhiờn giao gi(a trỡnh $ h c vn v cỏc vựng Red Rive Delta (ng bng "ng sụng bng Hng)sụng H"ng North East ụng Bc (ụng Bc) Tõy Bc North West (Tõy Bc Bc)Trung B$ North Central Coast Duyờn hi Nam (Bc Trung B) Trung B$ South Central Coast Cao nguyờn trung (Duyờn hi Nam Trung B) b$ Central Highlands ụng (Tõy Nguyờn)Nam B$ South "ng East bng sụng C'u (ụng Nam B)Long Mekong RiverT ng Deltas (ng bng sụng Cu Long) 4.1 NhnTotal xột Primary (Tiu hc) Tiu h c Lower secondary (Trung Trunghc h cc c s) s% 1312609 1312609 1323078 1323078 837174 837174 786024 786024 382698 382698 20058962005896 287374 287374 969567 969567 656461 199754 199754 1035637 1035637 624048 78353 78353 471696 471696 273293 565481 565481 2476900 2476900 1553802 656461 616412 624048 411546 273293 174915 1553802 1202873 616412 1145006 411546 899455 174915 417419 24618801202873 1479397 1145006 1091718 899455 456084 417419 30271992461880 6371260 1091718 2973936 456084 16649196 3027199 2973936 16649196 7304000 1479397 7304000 6371260 Upper secondary Total Trung c ph# (Trungh hc ph thong) T ng s thụng 719478 3355165 719478 3355165 Thớ d# k =  kij l tng tt c cỏc phn t& kij c$a bng s ngu nhiờn K (t%c k= 198742 cỏ ij th l dõn s lao ng) f ijij =kkl Ta cú Ta fcú cỏc l tn cỏc s* tntng s* tng *i (thớ *i d3 (thớcỏc d3 t8 cỏcl&t8phn l& phn trmtrm trờn trờn tonton b t,ng b t,ng th%) th%) v/i v/i ij = k ij k f = 1f , =f 1=,  f =f  vf  i j i ij j ij i i j ij j fv= f , lf ij cỏc , l tn cỏc s* tncn s* biờn cn biờn tng tng *i *i j =f ij ij j i Phng phỏp thng kờ i 135 BngBng s* ngu s* ngu nhiờnnhiờn K m.t K m.t m"t m"t 2c 2c bi#nbi#n ,i thnh ,i thnh bngbng profile-dũng profile-dũng (cỏc (cỏc t8 l&t8 phn l& phn trmtrm theotheo f ij f if.ij (xem f i (xem f ij f.fjij (xem f j (xem dũng) dũng) bngbng 5.a) v 5.a)m"t v m"t khỏckhỏc thnhthnh bngbng profile-c.t profile-c.t (cỏc (cỏc t8 l&t8 phn l& phn trmtrm bngbng 5.b).5.b) Bng 5.a : bng cỏc profils-dũng TrungTrung TrungTrung TngTng Tiu hc Tiu hc hc ph hc ph hc chc s c s s s thụngthụng ngng bng bng 39,1 39,1 39,4 39,4 21,4 21,4 100 100 sụng Hng sụng Hng ụngụng bc bc 41,7 41,7 39,2 39,2 19,1 19,1 100 100 Tõy bc Tõy bc 50,8 DuyờnDuyờn hi hi 39,1 bc trung bc trung b b DuyờnDuyờn hi hi 42,3 nam trung nam trung b b Cao nguyờn Cao nguyờn 51,2 trungtrung b b 46,5 ụngụng nam b nam b ngng bng bng sụng Cu sụng Cu 48,9 Long Long ProfilProfil trungtrung 43,9 bỡnh bỡnh 50,8 35,3 35,3 13,9 13,9 100 100 39,1 41,8 41,8 19,0 19,0 100 100 42,3 40,2 40,2 17,6 17,6 100 100 51,2 34,2 34,2 14,5 14,5 100 100 46,5 36,5 36,5 17,0 17,0 100 100 48,9 36,1 36,1 15,1 15,1 100 100 43,9 38,3 38,3 17,9 17,9 100 100 BngBng 5.a : 5.a bng : bng cỏc profils-dũng cỏc profils-dũng Bng 5.b : bng cỏc profils-ct TrungTrung TrungTrung ProfilProfil trungtrung Tiu hc Tiuhc hcchc c hc ph hc ph bỡnh bỡnh s s thụngthụng ngng bng bng 18,0 18,0 20,8 20,8 24,2 24,2 20,2 20,2 sụng Hng sụng Hng 12,1 12,1 ụngụng bc bc11,5 11,5 12,3 12,3 12,9 12,9 Tõy bc Tõy bc 3,9 DuyờnDuyờn hi hi 13,3 bc trung bc trung b b DuyờnDuyờn hi hi 9,0 nam trung nam trung b b Cao nguyờn Cao nguyờn 8,4 trungtrung b b 15,7 ụngụng nam b nam b ngng bng bng sụng Cu sụng Cu20,3 Long Long 3,9 3,1 3,1 2,6 2,6 3,4 3,4 13,3 16,3 16,3 15,9 15,9 14,9 14,9 9,0 9,8 9,8 9,2 9,2 9,3 9,3 8,4 6,5 6,5 5,9 5,9 7,2 7,2 15,7 14,1 14,1 14,0 14,0 14,8 14,8 20,3 17,1 17,1 15,3 15,3 18,2 18,2 TngTng s s 100 100 100 100 100 100 100 100 BngBng 5.b : 5.b bng : bng cỏc profils-ct cỏc profils-ct PhộpPhộp toỏntoỏn ny ny a a cỏc k#t cỏc qu k#t qu vớ d3vớnh d3 nh bngbng 5a n cú5a39,1% cú 39,1% s* cỏc h(c s*dũng h(c sinhsinh vựng c4acỏc vựng 4.1 Nhn xột Tatrong quan tõm profil ca vỡc4a ta tỡm vựng +ng +ng b!ngb!ng sụgnsụgn H+ng H+ng l h(c l h(c sinhsinh ti%u ti%u h(c h(c v ch' vcúcú ch' cúphõn 21,4% s*bh(c s* h(c sinh c4a c4a nyhc ny tsinh trỡnh tcỏch trỡnh t21,4% l trỡnh sinh hc vựng vựng ca Thớ d l tng tt c cỏc phn t k ca bng xa t l phõn b ca ton b dõn s nht Nhng cp cp LmLm th# no th# no % ỏnh % ỏnh giỏ giỏ ngha ngha c4a m.t c4a m.t con s* c3s*th% c3 th% bngbng tr/ctr/c ú ? ú ? ta ij s ngu nhiờn K (tc k= 198742 cỏ th l hc sinh) cựng tỡm cỏc dũng ging hay i lp nhiu TrờnTrờn th7cth7c t#, cỏc t#, t8 cỏcl&t8phn l& phn trmtrm xutxut hi&nhi&n m-i m-i dũngdũng phiphi 2c 2c so sỏnh so sỏnh v/i t8 v/il&t8phn l& phn trmtrm Ta cú eij = kij/k l cỏc tn s tng i (thớ d cỏc t l nht õy l trng hp ca ụng bc v cao nguyờn c4a dũng c4a dũng tng tng 5ng 5ng v/i ton v/i ton b Vi&t b Vi&t Nam Nam , t5c , profile t5c profile trung trung bỡnh bỡnh phn trm trờn ton b tng th) vi trung b ni cú profile khỏ ging v rt khỏc so , v , l cỏc tn s cn vựng ng bng sụng Hng Vic c bng 5b NhNh vy,vy, t8 l&t8 51,2% l& 51,2% h(c h(c sinh sinh ti%u ti%u h(c h(c c4a vựng c4avivựng cao nguyờn cao nguyờn trungtrung b ch' b cú ch' cú ngha ngha khi biờn tng i cng ging nh vy v ta cng cú cỏc profil ct, cú em em so sỏnh so sỏnh v/i bỡnh v/i bỡnh quõnquõn tonton qu*cqu*c l 43,9% l 43,9% : ngha trỡnh : trỡnh ti%u ti%u h(c h(c chi#m chi#m t8 tr(ng t8 tr(ng rt l/n rt l/n l phõn b hc sinh ca mi vựng theoti miti trỡnh vựng cao nguyờn cao nguyờn b.,c b., bin khii chi#m khithnh chi#m t8 tr(ng t8 rt nh) rt nh) ti vựng ti vựng +ng +ng b!ngb!ng sụngsụng H+ng H+ng Bng s vựng ngu nhiờn K trung mt trung mt tr(ng hc bng(39,1%) profil-dũng (cỏc t ltng phn trm theoprũil dũng) ij/i bỡnh Lu ý lton cú s khỏc bitkhu quan trng gia phng phỏp (39,1%) v nú vtng nú 5ng 5ng v/i prũil v/i trungtrung bỡnh c4a ton c4a Vi&t Vi&t Nam Nam ti ti khu v7c v7c duyờn duyờn hi nam hi nam (xem bng 5.a) v mt khỏc thnh bng profile-ct phõn tớch cỏc tng quan v phng phỏp phõn tớch trungtrung b Tuy b Tuy nhiờn nhiờn cựngcựng duyờn duyờn hi ny hi ny li cú lit8cútr(ng t8 tr(ng h(c h(c sinhsinh cp 2cp l/n2 nht l/n nht (cỏc t l phn trm ij/i (xem bng 5.b) theo cỏc thnh phn chớnh: cỏc phộp bin i tin trờn vựng cỏc v cỏc ct trỡnh ca l Ta quan Ta quan tõm tõm #n #n profile profile c4a cỏc c4a dũng cỏc dũng vỡ tavỡtỡm tahnh cỏc tỡm vựng cỏc cúdũng t8cúl&t8 phõn l& phõn b, b, bng trỡnh h(c ging h(c vn vn Phộp toỏn ny a cỏc kt qu vớ d nh (vỡ cỏc hp cú cỏc tng ng vi úng vai trũ c4a h(c c4a h(c sinhsinh cỏchcỏch xa t8xal&t8phõn l& phõn b, c4a b, ton c4a ton b dõn b dõn s* nht s* nht Nhng Nhng ta cựng ta cựng tỡm cỏc tỡm dũng cỏc dũng gi*ng gi*ng bng 5a cú 39,1% s hc sinh ca vựng ng bng nh nhau): khụng cú cỏc bin v cỏ th m l cỏc nhau hay hay *i lp *i lp nhi$u nhi$u nht nht õy õy l tr0ng l tr0ng h2p h2p c4a ụng c4a ụng b c v b c cao v nguyờn cao nguyờn trung trung b b sụng Hng l hc sinh tiu hc v ch cú 21,4% s hp theo dũng v theo ct) ni profile cú profile khỏt khỏ gi*ng gi*ng nhau v rt vkhỏc rt khỏc so so vựng v/i vựng +ng +ng b!ngb!ng sụngsụng H+ng H+ng Vi&cVi&c (c (c bngbng hc ni sinhcú ca vựng ny trỡnh cp Lm thv/i no 5b cng ỏnh giỏ ý ngha ca mt s c th 4.2 Gi thuyt c lp 5b cng gi*ng gi*ng nh nh vy vy v tavcng ta cng cú cỏc cú profil cỏc profil c.t, c.t, cú ngha cú ngha l phõn l phõn b, h(c b, h(c sinhsinh c4a m-i c4a m-i bng trc ú ? Trờn thc t, cỏc t l phn trm xut vựngvựng theotheo m-i m-i trỡnhtrỡnh h(c h(c vn.vn hin mi dũng phi c so sỏnh vi t l phn trm Vic liờn kt gia hai bin nh tớnh chớnh l xem liu ca dũng tng ng vi ton b Vit Nam, tc profil giaphỏp haiphỏp bin cútớch s c vi hay khụng LuLu l cúls7cúkhỏc s7 khỏc bi&t bi&t quanquan tr(ngtr(ng gi6agi6a phng phng phõnny phõn tớch cỏc tng cỏc lp tng quan quan v phng v phng trung bỡnh Ta bit l gia hai bin bin i cú s c lp nu nh phỏpphỏp phõnphõn tớch tớch theotheo cỏc thnh cỏc thnh phnphn chớnh chớnh : cỏc: phộp cỏc phộp bi#nbi#n ,i ti#n ,i ti#n hnhhnh trờn trờn cỏc dũng cỏc dũng v cỏc v cỏc Nh vy, t l 51,2% hc sinh tiu hc ca vựng cao vi mi i v mi j: ij = i x j c.t c4a c.t bng c4a bng l gi*ng l gi*ng nhau (vỡ cỏc (vỡ tp cỏc h2p tp h2p cú cỏc cú tng cỏc tng 5ng 5ng v/i v/i úng úng vai trũ vai nh trũ nh nhau) nhau) : : nguyờn trung b ch cú ý ngha em so sỏnh vi khụng cú cỏc cú bi#n cỏc bi#n v cỏvtrỡnh th% cỏ m th%tiu l mcỏc l tp cỏc h2p tp h2p theo dũng dũng vcỏc theo vtn theo c.t) bỡnhkhụng quõn ton quc l 43,9%: hc chim Ta theo cú bng sc.t) quan sỏt c (xem bng 6), t trng rt ln ti vựng cao nguyờn trung b, tc bng cỏc t l phn trm tớnh trờn ton b s dõn: chim t trng rt nh ti vựng ng bng sụng Hng ij = kij/k (39,1%) v nú tng ng vi profil trung bỡnh ca ton Vit Nam ti khu vc duyờn hi nam trung b Tuy Trong s 20,2% hc sinh ca vựng ng bng sụng nhiờn cựng duyờn hi ny li cú t trng hc sinh cp 35Hng, 35 theo gi thuyt v s c lp ta s thy 43,9% ln nht l hc sinh tiu hc (tc chim 8,8% tng s hc sinh, thay vỡ 7,9% thc s quan sỏt c), 38,3% l hc sinh cp (s l 7,7% thay vỡ 8,0%) hay nhaukhụng hay khụng Ta bi!tTalbi!t gi4alhai gi4a bi!n haibi!n bi!n +i bi!n cú +i s5 ,c cú s5lp ,c n!u lpnh n!uv-i nh m'i v-ii v m'im'i i vj :m'i j : f ij = f i fij =f j f i  f j Ta cú Ta bng cú cỏc bng tn cỏc s)2008 tn quan s) sỏt quan /c sỏt (xem /c bng (xem 6), bng t1c6), bng t1c cỏc bng t6 cỏc l% phn t6 l% trm phntớnh trmtrờn tớnhton trờn 136 Khúa hc Tam o b, s) dõn: b, s) fdõn: ij = kij f ijk= kij k ton TrongTrong s) 20,2% s) 20,2% h'c sinh h'cc0a sinh vựng c0a *ng vựng bng *ngsụng bngH*ng, sụng H*ng, theo gi theo thuy!t gi thuy!t v" s5 ,c v" s5 lp ,c ta slp ta s thy 43,9% thy 43,9% l h'cl sinh h'cti#u sinhh'c ti#u (t1c h'cchi!m (t1c chi!m 8,8% t+ng 8,8%s)t+ng h'cs) sinh, h'cthay sinh,vỡthay 7,9% vỡ th5c 7,9%s5th5c quan s5sỏt quan sỏt Bng Bng cỏc tn s quan sỏt c Bng Bng cỏc tn s lý thuyt /c), /c), 38,3%38,3% l h'cl sinh h'ccp sinh (s cpl2 7,7% (s l thay 7,7%vỡthay 8,0%) vỡ 8,0%) Profil Profil Trung Trung Profil Profil Trung hc TrungTrung hc Trung trung trung Trung hc Trung hchc c hc c trung trung Tiu hcTiu phhc thụng phhc thụng c s hc c s bỡnh bỡnh Tiu hcTiu phhc thụng ph thụng s s bỡnh bỡnh ng bng ng bng ng bng ng bng 7,9 7,9 8,0 8,04,3 4,3 20,2 20,2 sụng Hng sụng Hng sụng Hng sụng Hng 8,8 8,87,7 7,73,6 3,6 20,2 20,2 ng bc ng bc 5,0 5,0 4,7 4,72,3 2,3 12,1 12,1 ng bc ng bc 5,3 5,34,6 4,62,2 2,2 12,1 12,1 Tõy bcTõy bc1,7 1,7 1,2 1,20,5 0,53,4 3,4 Tõy bcTõy bc1,5 1,51,3 1,30,6 0,6 3,4 3,4 Duyờn hi Duyờn bc hi bc Duyờn hi Duyờn bc hi bc 5,8 5,8 6,2 6,22,8 2,8 14,9 14,9 trung btrung b trung btrung b 6,5 6,55,7 5,72,7 2,7 14,9 14,9 Duyờn hi Duyờn hi Duyờn hi Duyờn hi 3,9 3,9 3,8 3,81,6 1,69,3 9,3 4,13,6 3,61,7 1,7 9,3 9,3 nam trung nam btrung b nam trung nam btrung4,1 b Cao nguyờn Cao nguyờn Cao nguyờn Cao nguyờn 3,7 3,7 2,5 2,51,1 1,17,2 7,2 trung btrung b trung btrung b 3,2 3,22,8 2,81,3 1,3 7,2 7,2 ụng nam ụng b nam6,9 b 6,9 5,4 5,42,5 2,5 14,8 14,8 ụng nam ụng b nam6,5 b 6,55,7 5,72,6 2,6 14,8 14,8 ng bng ng bng ng bng ng bng sụng Cu sụng Cu 8,9 8,9 6,6 6,62,7 2,7 18,2 18,2 sụng Cu sụng Cu Long Long Long Long 8,0 8,07,0 7,03,3 3,3 18,2 18,2 Profil trung Profil trung Profil trung Profil trung 43,9 43,938,3 38,317,9 17,9 100 100 38,3 38,3 17,9 17,9 100 100 bỡnh bỡnh bỡnh bỡnh 43,9 43,9 Bng 6Bng : Bng :cỏc Bng tncỏc s quan tn ssỏt quan  c sỏt  c Bng 7Bng : Bng :cỏc Bng tncỏc s l tnthuyt s l thuyt Bng ôcỏc tn s lý thuytằ (xem bng 7) ij = i x j th hin gi thuyt hai bin c lp vi Gi f ij =7)f i fij =f j f ith# Bng Bng cỏc c tn ô cỏc s)th tn l hin thuy!t s) l trờn thuy!t ằ cỏc (xemprofil-dũng ằ bng (xem 7) bng hi%n thuy!t gi thuy!t hai bi!n hai ,c bi!nlp ,c lp  fhi%n j th#gi thuyt ny ô cng v-i v-i Gi thuy!t thuy!t ny ny /c th# /c hi%n th# hi%ncỏc trờn profile-dũng cỏc profile-dũng Trờn th5c Trờnt!, th5c v-it!, m'i v-ij, m'i ta j, ta Trờn thc t, vi mi j,Gi ta cú kt cng qu: /i = tttrờn ijcng j , Nu c cú cỏck!t profil ôVựngằ ging v nh vy ging vi f ij f:i =f ij f jf.i N!u = f j tt cú qu k!t: qu N!u c cỏc tt c profile cỏc profile ô Vựng ô Vựng ằ gi)ng ằ gi)ng v nhvvy nhgi)ng vy gi)ng v-i v-i profile bỡnh quõn tng ng thỡ gia vựng v khu vc profileprofile bỡnh quõn bỡnh tng quõn tng 1ng thỡ1ng gi4a thỡvựng gi4a v vựng khuvv5c khuhot v5c ,ng hot cú ,ng s5 ,c cú s5lp ,c dolp vi%cdobi!t vi%c bi!t hot ng cú s c lp vic bit n vựng khụng !n vựng !n khụng vựng khụng lm thay lm +i thay s5 +i phõn s5 b) phõn cỏc b) khu cỏc v5c khu hot v5c ,ng hot ,ng Cng Cng tng tng t5 nh t5 vy nh )i vy )i lm thay i s phõn b cỏc khu vc hot ng Cng =f ij f i f: j = f i : v-itcỏc v-i profile-c,t cỏc i profile-c,t v-i kbt i tak cúibt :taf ijcú tng nh vy viv-i cỏcbt profil-ct vi kf:.ij ta cú: ij/j = i Doxem ú,Do xem ú,xột xem cỏc y!u cỏc t)y!u lõn t) cnlõn gi4a cntc cỏc gi4a cỏc profile t1c l t1c xemlxột xem s5xột lõns5 cnlõn gi4a cnt2ng gi4a t2ng Do ú, xột cỏc yu txột lõn cn gia cỏc profil lprofile profile v-icn profile v-i bỡnh quõn, bỡnhviquõn, i"u ny i"u cho nyphộp cho nghiờn phộp nghiờn c1u m)i c1uliờn m)ih%liờn gi4a h%hai gi4a bi!n hai &nh bi!n &nh xem xột sprofile lõn giaprofile tng profil profil bỡnh quõn, iu ny cho phộp nghiờn cu mi liờn h gia hai Khong cỏch ca cho phộp kim chng nguyờn tớnh, t1c tớnh, m1c t1c , m1c ,c ,lp ,c lp bin nh tớnh, tc mc c lp tc phõn b tng ng Nguyờn tc ny m bo Trờnbng m,t Trờn bng m,t l-n, bng rtl-n, khúrt 'c khú tr5c 'c ti!p tr5ccỏc ti!p profile-dũng cỏc profile-dũng v profile-c,t cng nh sỏnh so sỏnh Trờn mt ln, rt khú c trc tip cỏc profil-dũng s chc chn cav ktprofile-c,t qucng phõnnh tớch so cỏc tng ng v profil-ct cng nh so sỏnh cỏc profil ny vi profil phõn tỏch mt cỏch ch quan theo dng thc cỏc profile cỏc profile ny v-i ny profile v-i profile bỡnh quõn bỡnh quõn Do vy, Dotavy, phitati!n phihnh ti!n phõn hnh tớch phõncỏc tớch tng cỏc tng 1ng 1ng bỡnh quõn Do vy, ta phi tin hnh phõn tớch cỏc Ni dung ca nguyờn tc ny l: nu hai dũng (hoc tng hai tng ct) ca bng s ngu nhiờn cú cựng profil (t l 4.3.ng Kho ng 4.3 Kho

Ngày đăng: 21/09/2016, 06:27

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan