8/25/2009 Thӵc hành dӏch tӉ hӑc thú y dŚƐ͘ >ġ dŚĂŶŚ ,ŝӅŶ Mөc Tiêu • Giӟi thiӋu chung mӝt sӕ phҫn mӅm sӱ dөng trong dӏch tӉ » Phҫn mӅm quҧn lý sӕ liӋu » Phҫn mӅm thӕng kê • Sӱ dөng các phҫn mӅm trong phân tích dӏch tӉ hӑc cѫ bҧn » Phân tích ÿѫn biӃn » Phân tích ÿa biӃn • Làm quen vӟi phҫn mӅm R 1 8/25/2009 Chѭѫng trình y Ngày 1 y Giӟi thiӋu y Quҧn lý sӕ liӋu bҵng EpiData y Giӟi thiӋu phҫn mӅm thӕng kê STATA y Ngày 2 y y y y y Các nghiên cӭu dӏch tӉ Các ÿҥi lѭӧng sӱ dөng trong nghiên cӭu dӏch tӉ Dùng STATA ÿӇ tính các ÿҥi lѭӧng dung trong nghiên cӭu dӏch tӉ Phân tích ÿa biӃn bҵng Logistic Bài tұp y y y y Thҧo luұn vӅ bài tұp Giӟi thiӋu phҫn mӅm R ThiӃt lұp bҧn ÿӗ nguy cѫ bҵng R SaTScan ÿӇ xác ÿӏnh cluster trên bҧn ÿӗ dӏch tӉ y Ngày 3 ŚƚƚƉ͗ͬͬĚŝĐŚƚĞ͘ũŝŵĚŽ͘ĐŽŵͬ 2 8/25/2009 EŐăLJ ϭ Quҧn lý sӕ liӋu ÿiӅu tra dӏch tӉ 3 8/25/2009 Sѫ ÿӗ nghiên cӭu Ĉһt giҧ thiӃt ThiӃt kӃ khҧo sát, thí nghiӋm KiӇm chӭng Thu thұp, quҧn lý sӕ liӋu Ӭng dөng thӵc tiӉn Xӱ lý sӕ liӋu KӃt luұn DөĐ ƚŝġƵ ^ĂƵ ŬŚŝ ŚŽăŶ ƚŚăŶŚ ƉŚҫŶ ƚŚӵĐ ƚұƉ ŶăLJ͕ ĐĄĐ ƐӁ͗ ϭ͘ ,ŝӇƵ ÿѭӧc ĐĄĐ ƚŚăŶŚ ƉŚҫŶ ĐӫĂ ĚĂƚĂďĂƐĞ Ϯ͘ ŝӃƚ ĐĄĐŚ ƚŚŝӃƚ ŬӃ ĨůĂƚͲĨŝůĞ ĚĂƚĂďĂƐĞ ďҵŶŐ ĐĄĐŚ Ɛӱ ĚөŶŐ ƉŝĂƚĂ ϯ͘ ,ŝӇƵ ÿѭӧc ĐĄĐ ŶŐƵLJġŶ ƚҳĐ ĐӫĂ ĚĂƚĂďĂƐĞƐ ϰ͘ ŝӃƚ ÿѭӧc ĐĄĐ ƉŚѭѫnŐ ƉŚĄƉ ŬŚĄĐ ŶŚĂƵ ÿӇ ŝŵƉŽƌƚ ĚĂƚĂ ǀ㎠ХРƉŚҫŶ ŵӅŵ ƚŚӕŶŐ Ŭġ 4 8/25/2009 ӏŶŚ ŶŐŚšĂ • ,Ӌ ƚŚӕŶŐ ƋƵҧŶ ůlj ĂƚĂďĂƐĞ – ĂƚĂďĂƐĞ ƐŽĨƚǁĂƌĞ • ĂƚĂďĂƐĞ – ͞ŽůůĞĐƚŝŽŶ ŽĨ ĚĂƚĂ ƐƚŽƌĞĚ ŝŶ ƐŽŵĞ ŽƌŐĂŶŝnjĞĚ ĨĂƐŚŝŽŶ͟ с ͞ƚұƉ ŚӧƉ ĐĄĐ Ěӳ ůŝӋƵ ĐŚӭĂ ƚƌŽŶŐ ŶŚӳŶŐ ĚҥŶŐ Đſ ƚә ĐŚӭĐ͟ ĄĐ ŚŞŶŚ ƚŚӭĐ ůѭƵ ƚƌӳ ĚĂƚĂ BiӃn (Variables = Fields) Mã xác ÿӏnh (Unique identifier = primary key, id) Dӳ liӋu quan sát (Records) 5 8/25/2009 ĄĐ ďѭӟc ƚƌŽŶŐ ƋƵҧŶ ůlj Ěӳ ůŝӋƵ ϭ͘ ӏŶŚ ŶŐŚšĂ ďŝӃŶ Ϯ͘ dҥŽ ĐҩƵ ƚƌƷĐ ĚĂƚĂďĂƐĞ ǀă ĚĂƚĂ ĚŝĐƚŝŽŶĂƌLJ ϯ͘ Describe data > Summary statistics > Nhͅp weight cho “variables” và ̽n“Repeat commands by group” chͥn“sex” 22 8/25/2009 • tabstat weight, by(sex) columns(variables) • GUI: Statistics > Summaries, tables, and tests > Tables > Tables of summary statistics (tabstat) > chͥn weight cho “variable” và “group statistics” b͉ng sex. BiӇu ÿӗ • histogram weight, percent by(barn) • GUI: Graphics > Histogram > chͥn “weight” là bi͗n chính(Main tab), “percent” cho trͽc y (Main tab), và “barn” nh́ là bi͗n phân lͥai (By tab) 23 8/25/2009 Vҩn ÿӅ khác • • • • Lѭu graph log , copy cӱa sә result cd "C:\...\“ ÿӇ cài ÿһt thѭ mөc hiӋn hành Thӵc tұp do-file – Dùng “*” ÿӇ phân biӋt câu không lӋnh – Dùng “/” ÿӇ báo hiӋu câu lӋnh xuӕng dòng EŐăLJ Ϯ 24 8/25/2009 dŚӵĐ ŚăŶŚ ӎ, dӈ ,Ӑ ѫ ҧŶ • ӏĐŚ ƚӉ ŚӑĐ ůă ŵƀŶ ŚӑĐ ŶŐŚŝġŶ ĐӭƵ ǀӅ ŵӕŝ ůŝġŶ ƋƵĂŶ ŐŝӳĂ ƚĄĐ ŶŚąŶ ŐąLJ ďӋŶŚ͕ LJӃƵ ƚӕ ƚƌƵLJӅŶ ůąLJ͕ ŵƀŝ ƚƌѭӡŶŐ ǀă ǀұƚ ĐŚӫ 25 8/25/2009 • dŚĞŽ >ĂƐƚ ;ϭϵϵϱͿ͕ ͣĐŚ ƚ͝ ŚͥĐ ůă ŵƀŶ ŚͥĐ ŶŐ ĚͽŶŐ ƚŚͩŶŐ Ŭġ ǀă ŶŚŝ͙Ƶ ŶŐăŶŚ ŬŚŽĂ ŚͥĐ ŬŚĄĐ Ĝ͛ ŶŐŚŝġŶ ĐƵ ǀ͙ ƐΉ ƉŚąŶ ďͩ ď͟ŶŚ͕ ĐĄĐ LJ͗Ƶ ƚͩ ůŝġŶ ƋƵĂŶ Ĝ͗Ŷ ď͟ŶŚ ƚƌŽŶŐ ŵͱƚ ƋƵ̿Ŷ ƚŚ͛ džĄĐ ĜͣŶŚ͘ ŶŐ ĚͽŶŐ ƚƌŽŶŐ ǀŝ͟Đ džĄĐ ĜͣŶŚ ŶŐƵLJġŶ ŶŚąŶ ŐąLJ ď͟ŶŚ ǀă Ŭŝ͛ŵ ƐŽĄƚ ĚͣĐŚ ď͟ŶŚ ĄĐ ŶŐŚŝġŶ ĐӭƵ ĚӏĐŚ ƚӉ ŚӑĐ • ӏĐŚ ƚӉ ŚӑĐ ŵƀ ƚҧ ;ĚĞƐĐƌŝƉƚŝǀĞ ĞƉŝ͘ ^ƚƵĚLJͿ Ͳ ŝ͍ Ąŝ ŐŞ͍ ӣ ĜąƵ͍ 1 Æ có mӕi liên quan; yӃu tӕ nguy cѫ có thӇ làm tăng tӍ lӋ bӋnh OR < 1 Æ mӕi liên quan dҥng bҧo vӋ dŚӵĐ ŚăŶŚ ƚşŶŚ ZZ͕ KZ ďҵŶŐ ^ƚĂƚĂ • Dӣ ĨŝůĞ ůĂďͺĚĂLJϮ͘ĚƚĂ • ƶŶŐ ůӋŶŚ ĐĐ ĚŝƐĞĂƐĞ ĞdžƉŽƐĞ ĐŚŽ ĐĂƐĞͲ ĐŽŶƚƌŽů ƐƚƵĚLJ ǀă ĐƐ ĐŚŽ ĐŽŚŽƌƚ ƐƚƵĚLJ ÿӇ ƚşŶŚ ĐĄĐ ƚŚƀŶŐ Ɛӕ ĚӏĐŚ ƚӉ • 'h/͗ ^ƚĂƚŝƐƚŝĐƐ х Ɖŝ͘ ŶĚ ƌĞůĂƚĞĚ х dĂďůĞƐ ĨŽƌ ĞƉŝĚĞŵŝŽůŽŐŝƐƚ х 35 8/25/2009 •zӃƵ ƚӕ ŐąLJ ŶŚŝӉƵ ;ĐŽŶĨŽƵŶĚĞƌͿ dƌŽŶŐ ĐĄĐ ŶŐŚŝġŶ ĐӭƵ ĚӏĐŚ ƚӉ ŚӑĐ ŵƀ ƚҧ ůүŶ ƉŚąŶ ƚşĐŚ͕ ŶŐѭӡŝ ƚĂ ƚŚѭӡŶŐ ƋƵĂŶ ƚąŵ ĜӃŶ LJӃƵ ƚӕ ŶŚŝӉƵ ŵă ůăŵ ĐŚŽ ŬӃƚ ƋƵҧ ŬŚҧŽ ƐĄƚ ŐŝӳĂ ĐĄĐ ƋƵąŶ ƚŚӇ Đſ ƚŚӇ ďӏ ҧŶŚ ŚѭӣŶŐ͘ ǀş Ěө ŶŚѭ Ɛӵ ƉŚąŶ ďӕ ǀӅ ƚƵәŝ ŐŝӳĂ Ϯ ƋƵąŶ ƚŚӇ ŬŚĄĐ ŶŚĂƵ ůăŵ ĐŚŽ ƚӍ ůӋ ďӋŶŚ ĐӫĂ ĐŚƷŶŐ ŬŚĄĐ ŶŚĂƵ ŶŚѭŶŐ ǀӅ ďҧŶ ĐŚҩƚ ůă ƚӍ ůӋ ďӋŶŚ ŐŝӳĂ ŚĂŝ ƋƵҫŶ ƚŚӇ ŶăLJ ůă ƚѭѫŶŐ ĜѭѫŶŐ͘ 36 8/25/2009 Ӈ ŬŚҳĐ ƉŚөĐ ƚŞŶŚ ƚƌҥŶŐ ŶăLJ͕ ŶŐѭӡŝ ƚĂ ƚŚѭӡŶŐ ĚƶŶŐ ĐĄĐ ďŝӋŶ ƉŚĄƉ ƐĂƵ͗ •ůҩLJ ŵүƵ ĚҥŶŐ ďҳƚ ĐһƉ ;ĚƶŶŐ ƚƌŽŶŐ ĚӏĐŚ ƚӉ ƉŚąŶ ƚşĐŚͿ ;ŵĂƚĐŚŝŶŐͿ •ƉŚąŶ ƚҫŶŐ ;ƐƚƌĂƚŝĨŝĐĂƚŝŽŶͿ •ƚŚġŵ ďŝӃŶ ƚƌŽŶŐ ŵƀ ŚŞŶŚ ;ĚƶŶŐ ƚƌŽŶŐ ƚŚŝӃƚ ůұƉ ƚѭѫŶŐ ƋƵĂŶ ƚƵLJӃŶ ƚşŶŚͿ •ŚŝӋƵ ĐŚӍŶŚ ;ĚƶŶŐ ƚƌŽŶŐ ĚӏĐŚ ƚӉ ŵƀ ƚҧͿ •ĄŶŚ ŐŝĄ LJӃƵ ƚӕ ŐąLJ ŶŚŝӉƵ͗ Ӈ džĄĐ ĜӏŶŚ džĞŵ LJӃƵ ƚӕ y Ŷ㎠Ĝſ Đſ ƉŚҧŝ ůă LJӃƵ ƚӕ ŶŚŝӉƵ ƚƌŽŶŐ ŵӕŝ ƋƵĂŶ ŚӋ ŐŝӳĂ ǀă ͕ Đſ ŶŚŝӅƵ ĐĄĐŚ ĜĄŶŚ ŐŝĄ͘ Ͳ dŚƀŶŐ ƚŚѭӡŶŐ Đſ ƚŚӇ ĜĄŶŚ ŐŝĄ ďҵŶŐ ĐĄĐŚ ƚşŶŚ ƉŚҫŶ ƚƌĉŵ ŐŝӳĂ ĐŚӍ Ɛӕ ůŝġŶ ƋƵĂŶ ZZ ŚĂLJ KZ ĐŚѭĂ ŚŝӋƵ ĐŚӍŶŚ ǀă ĜĆ ŚŝӋƵ ĐŚӍŶŚ͘ DӭĐ ŬŚĄĐ ďŝӋƚ ƚƌġŶ ϭϬй ĐŚŽ ƚŚҩLJ ŬŚҧ ŶĉŶŐ y ůă LJӃƵ ƚӕ ŶŚŝӉƵ͘ Ͳ ġŶ ĐҥŶŚ Ĝſ͕ ƚƌŽŶŐ ƚŚӕŶŐ Ŭġ Đſ ƚŚӇ ĚƶŶŐ ƌĞƐůŽǁͲĂLJ ƚĞƐƚƐ ĜӇ ĜĄŶŚ ŐŝĄ ŵӭĐ Ĝӝ ƚѭѫŶŐ ĜӗŶŐ ĐӫĂ ŚĂŝ ŐŝĄ ƚƌӏ ůŝġŶ ƋƵĂŶ ŚŝӋƵ ĐŚӍŶŚ ǀă ĐŚѭĂ ŚŝӋƵ ĐŚӍŶŚ͘ 37 8/25/2009 dŚӵĐ ŚăŶŚ ÿáŶŚ ŐŝĄ LJӃƵ ƚӕ ŶŚŝӉƵ ďҵŶŐ ^d d • ĐƐ ĚŝƐĞĂƐĞ ďĂƌŶ͕ ďLJ;ƐĞdžͿ • 'h/͗ ^ƚĂƚŝƐƚŝĐƐ х Ɖŝ͘ ŶĚ ƌĞůĂƚĞĚ х dĂďůĞƐ ĨŽƌ ĞƉŝĚĞŵŝŽůŽŐŝƐƚ х VH[ 55 > &RQI ,QWHUYDO@ IHPDOH PDOH &UXGH 0+ FRPELQHG 7HVW RI KRPRJHQHLW\ 0+ FKL 0+ :HLJKW 3U!FKL PHÂN TÍCH ĈA BIӂN BҴNG LOGISTIC 38 ůŽŐŝƚ 8/25/2009 ϴ ϲ ϰ Ϯ Ϭ ͲϮ Ϭ Ϭ͘Ϯ Ϭ͘ϰ Ϭ͘ϲ Ϭ͘ϴWƌŽďĂďŝůƚLJ ϭ Ͳϰ Ͳϲ Ͳϴ >ŶƉͬ;ϭͲƉͿ с ɴŽ н ɇɴũyũ dƌŽŶŐ Ĝſ Ɖ ůă džĄĐ ƐƵҩƚ ĜӇ džҧLJ ƌĂ ƚşŶŚ ĐŚҩƚ ĐҫŶ džĄĐ ĜӏŶŚ ;ĐŚҷŶŐ ŚҥŶ ŶŚѭ džĄĐ ƐƵҩƚ Đſ ďӋŶŚͿ ǀă y ůă ĐĄĐ LJӃƵ ƚӕ ƋƵĂŶ ƐĄƚ Đſ ҧŶŚ ŚѭӣŶŐ͘ dӍ Ɛӕ Ɖͬ;ϭͲƉͿ ĜѭӧĐ Őӑŝ ůă KĚĚ сх KĚĚс Ğ ɴŽ н ɇɴũyũ 39 8/25/2009 sş Ěө HUS: Hemolytic-uremic syndrome 40 8/25/2009 • ĄŶŚ ŐŝĄ Ͳ ŝӅƵ ƚƌӏ ďҵŶŐ ŬŚĄŶŐ ƐŝŶŚ ůăŵ ƚăŶŐ ŽĚĚ ĐӫĂ ,h^ ϯ͘ϭϯ ůҫŶ ;Ğϭ͘ϭϰͿ͘ – dž͗ ŽĚĚƐ ĐӫĂ ,h^ ďҵŶŐ Ϭ͘ϵϳ ůҫŶ ĐŚŽ ŵӛŝ ƚƵәŝ ůӟŶ͕ ŚŽһĐ Ϭ͘ϳϯ ůҫŶ ĐŚŽ ŬŚŽҧŶŐ ϵ ƚƵәŝ ĐŚġŶŚ ůӋĐŚ͘ 41 8/25/2009 Ĉӝ ý nghƭa cӫa mô hình 1. Wald tests - TӍ sӕ giӳa coefficient (log odds scale) và standard error. - Có phân phӕi chuҭn z - Tests coefficient (log odds scale) bҵng “0” (Ho) - Không nên quá phө thuӝc vào test này Ϯ͘ >ŝŬĞůŝŚŽŽĚ ƌĂƚŝŽ ƚĞƐƚ Ͳ 'ϮŽ ƐŽ ƐĄŶŚ ŵƀ ŚŞŶŚ ĨƵůů ǀă ŵƀ ŚŞŶŚ ŶƵůů͘ ſ ƉŚąŶ ďӕ ĐŚŝͲƐƋ͘ dѭѫnŐ ƚӵ & ƚĞƐƚ ƚƌŽŶŐ EKs Ͳ 'Ϯ с Ϯ ;ůŶ > ĨƵůů ʹ ůŶ > ƌĞĚͿ͘ ^Ž ƐĄŶŚ ŵƀ ŚŞŶŚ ĨƵůů ǀă ŵƀ ŚŞŶŚ ƌĞĚƵĐĞĚ ;ŶĞƐƚĞĚͿ͘ с WĂƌƚŝĂů & ƚĞƐƚ 42 8/25/2009 43 8/25/2009 Chӑn lӵa mô hình tӕi ѭu • estat ic ÿӇ xem AIC cӫa mô hình; AIC càng nhӓ càng tӕt • Mô hình càng ÿѫn giҧn càng tӕt ůŝŶĐŽŵ 44 8/25/2009 Sӱ dөng biӃn liên tөc trong mô hình • Ĉánh giá xu hѭӟng bҵng lintrend hay lowess hay lintrend Y X, groups (#) plot(log) ŚƵLJӇŶ ďŝӃŶ ůŝġŶ ƚөĐ ƚŚăŶŚ ďŝӃŶ ƉŚąŶ ůŽҥŝ • Mx colnames(Mx) rownames(Mx) Mx Nhұp bҧng sӕ liӋu tӯ file text MyData save.image("C:\\Users\\....\Documents\\mydata") > save(MyData,Mx, file=""C:\\Users\\....\Documents\\mydata") ls() # liӋt kê các ÿӕi tѭӧng trong file > MyData glm1 ^͕ƋƵŽƚĞс&Ϳ ŚĞĂĚ;Ɖƌǀ͘ĐĂƐ͕ϯ͗ϰͿ Ɖƌǀ͘ĐƚůΨWK^фͲƌĞƉ;ϭ͕ůĞŶŐƚŚ;Ɖƌǀ͘ĐƚůΨWK^ͿͿ η ÿәŝ ƉŽƐ ͞Ϭ͟ ƚŚăŶŚ ͞ϭ͟ ǁƌŝƚĞ͘ƚĂďůĞ;Ɖƌǀ͘Đƚů͕ϯ͗ϰ͕Η͗ͬĚĂƚĂͬƉƌǀ͘ĐƚůΗ͕ƌŽǁ͘ŶĂŵĞƐсdZh͕ĐŽů͘ŶĂŵ ĞƐс& >^͕ƋƵŽƚĞс&Ϳ ŚĞĂĚ;Ɖƌǀ͘Đƚů͕ϯ͗ϰͿ 57 8/25/2009 Khӣi ÿӝng SaTScan • Download tӯ http://www.satscan.org/. • Install • Khӣi ÿӝng Nhұp dӳ liӋu trong SaTScan 58 8/25/2009 59 8/25/2009 60 8/25/2009 61 8/25/2009 Tҥo bҧn ÿӗ có trung tâm dӏch bҵng R sau khi ÿã có kӃt quҧ tӯ SaTScan par(pty="s") polymap(ak.poly, xlab="Easting", ylab="Northing") points(prv.ctl$X,prv.ctl$Y, ƉĐŚсϭ͕ ĐĞdžсϬ͘ϳ͕ ĐŽůсϭ) points(prv.cas$X,prv.cas$Y, pch=16 ͕ ĐĞdžсϬ͘ϳ͕ ĐŽůсϰ) cluz [...]... n y ÿѭӧc hiӇu là dҥng văn bҧn và ÿѭӧc tӵ ÿӝng chuyӇn sang dҥng kí tӵ viӃt hoa – Ĉӝ rӝng cӫa trѭӡng tѭѫng ӭng vӟi sӕ kí tӵ “trӕng” (dҩu cách) giӳa hai dҩu “ ... ĚĂƚĂƐĞƚƐ х Mӝt sӕ lӋnh khác • Codebook • summarize bysort – – – – Summarize summarize, detail summarize weight, detail bysort sex: summarize weight – GUI: Data > Describe data > Summary statistics