1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Phân tích số liệu bằng Epi Info 2002 - Phần 4 pot

14 410 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 14
Dung lượng 394,6 KB

Nội dung

Qun lý s liu c tiêu Sau khi kt thúc bài hc này, sinh viên có th: 1.  dng Epi Info c các s liu t các chng trình khác 2.  dng c các câu lnh trong Epi Info  làm sch b s liu 3. Thao tác vi c s d liu trong Epi Info: mã hoá li, to thêm các bin Gii thiu Tuy ã có h thng mã kim tra u vào ca d liu nhng khi nhp s liu cng không th tránh khi hoàn toàn các li nh d liu không hp l, d liu không phù hp. Vì y trc khi chúng ta tin hành phân tích s liu thì công vic u tiên ca chúng ta phi làm sch li b s liu ca mình. Trong khoá hc này chúng tôi không k vng là có th gii thiu ht vi các bn v k nng làm sch s liu mà ch xin gii thiu mt vài k nng ch yu  bn có th làm sch mt b s liu chun b phân tích.  s liu mu Bài tp yêu cu bn phi thc hin làm sch b s liu ca mt trung tâm t vn và xét nghim HIV t nguyn. ây là b s liu VTC c trích ra t mt nghiên cu ca nghiên cu v HIV/AIDS do vn phòng CDC ti Vit nam tin hành. Mc tiêu ca nghiên cu này là theo dõi tình hình bnh nhân n t vn, nhng thay i hành vi ca nh nhân khi c t vn và các yu t liên quan khác (xem chi tit b câu hi và mã bin  mc lc 1).  s liu c xây dng phc v cho công tác hc tp không có tác dng nghiên cu hay xut bn. 1 c mt project trong Epi Info 1.1M mt project có kiu d liu là kiu d liu Epi Info 2002 1.Kích vào nút Analyze Data  màn hình chính ca ca Epi Info  vào chng trình phân tích s liu Thành phn ca màn hình Analysis: Command Generator – Danh sách lnh có sn trong Analysis cho ngi s dng có th tham kho t command tree (cây lnh). Program Editor – Phn hin nguyên vn các câu lnh ã thc hin HTML Browser – Phn thc hin lnh c ly t cây lnh 2. Kích vào Read(Import) t cây lnh. Mt hp thoi m ra. Phân tích s liu bng Epi Info 28 nh Read(Import) cho phép c mt file vi kiu file c th, chúng ta có th thao tác bng tay nh là lit kê, v th, tính tn s, bn  và thc hin các cha ng khác vi b s liu ó. 3.Kích vào Change Project. Tìm và chn project vtc.mdb ca bn t folder c:\Epi_Info.Chn All  hin th lên các bng s liu. Chn bng có tên là vtc. Kích Open. Change Project s cho phép bn thc hin chc nng là tìm mt project hoc file .mdb c th. Tt c công vic c thc hin trong Analysis s  trong project VCT1.mdb. 1.2.M mt project có kiu d liu là kiu Excel (gi s file bn mun m có tên là STinfect.xls trong project STI.mdb) 1.Kích vào lnh Read (Import). Kim tra li có phi hin nay bn ang thao tác vi project mà bn mun trong trng hp này là STI, nu không phi, s dng nút lnh Change Project chn và m project ca bn 2.Kích vào hp chn Data Format và chn Excel 8.0. 3.Kích vào nút ba chm (…)  bên phi hp Data Source. Mt ca s s xut hin  n có th chn file Excel mà bn mun c. Chn STInfect.xls mà bn mun c sau ó kích Open. S có hai nút cho phép bn chn mt trong hai Worksheets hoc tên Ranges. Trong trng hp này là Worksheetsc hin th và kích OK. 4. hp thoi Filespec, hãy kim tra chc chn rng bn ã kích vào hp First Row contains field names và kích OK 1.3 c file .DBF Bây gic mt file d liu c mang tên STInfect.dbf. I.Ghi file .DBF vào trong bng . MDB hin thi 1.Kích vào Write (Export). nh Write(Export) s copy bng hin ti (bng mà bn c gn ây nht) và dán chúng hoc mt phn ca chúng vào file cn thit và/hoc vào file có dng c th c ch ra. Tu chn bin vi p chn lnh Write (Export) : p chn All – ghi tt c trng và d liu vào c s d liu p chn All (*) Except – vit tt c trng và d liu vào c s d liu ngoi tr nhng ch sáng nht. S la chn này ch tr nên có giá tr khi có ít nht t trng c la chn (ch sáng nht) và không có giá tr nu nh hp chn All oc chn. Phân tích s liu bng Epi Info 29 Chc nng Append -  la chn mc nh cho u ra sc thêm vào d liu  la chn bng d liu. Chc nng Replace - chc nng u ra s thay th nhng d liu ã tn ti trong bng d liu. 2.Chn STI.mdb t hp File Name, s dng nút ba chm ( ) và ánh “STInfect” vào p Tables. Kích vào Replace và kích OK. II. c project STI. 1. Kích vào la chn All  hin lên bng danh sách STInfect. Chn bng STInfect và kích OK. 1.4c Reading (importing) mt bng  mt trang HTML 1. Kích vào lnh Read(Import). Kim tra li rng project hin ti ca bn STI.mdb. u không, s dng nút lnh Change Project chn và m project ca bn. 2. Chn HTML nh là nh dng d liu. Tìm ngun d liu có tên ICD9 Cod.htm. Nó  nm  C:\Epi_Info\ Kích Open, hoc kích úp vào file. 3. Kích vào bng 7:1. Bng này cha mã ICD 9. Analysis hin th mt danh sách a ch có cha bng bn ang m. Nu bng không hin th, kích vào danh sách mi m thanh Start áy màn hình. Kim tra li rng bng cha mã ICD-9 và s miêu t ca chúng. óng ca s danh sách li. Trang HTML mi không phi là mt phn ca project hin ti. Mt hp thoi mi xut hin hi nu bn mun to mt liên kt ti mt trang hay là mt  thm ving n thun. 4.Vi bng 7:1 phn c làm sáng. Mt hp thoi m ra và hi li  to mt liên kt m thi hay mt liên kt vnh vin trong project ca chúng ta ti bng này. Chúng ta s o mt liên kt tm thi. i s mc nh, Anylasis st tên các liên kt là TMPLNK_x, vi x là  nào ó. Nu bn t tên cho link (liên kt) nó sc ghi li. Nu bn không mun to s liên kt tm thi ti trang này, kích OK s xoá s liên kt khi project c thay i hay khi Analysis c óng li. Kích Cancel s xoá b vic c s hot ng.  thay i tên ca s liên kt cho phép bn liên ti file và tip nhn mt s p nht làm mt file hay bng 5.Kích OK. Phân tích s liu bng Epi Info 30 1.5 c các nh dng khác trong Analysis Ghi (Writing (exporting)) mt liên kt tm thi ti mt bng HTML trong .MDB 1.Lp li các bc 1 – 4  trên c file HTML tng t. 2.ánh ICD9_LINK, tên khác vi tên mc nh TMPLINK_x. 3.Kích OK. S liên kt ICD9_LINK sc ghi li nh là s tham kho thông tin t file ICD9 Cod.htm . 4.Read (Import) c)project STI. Kích vào All  nhìn bng danh sách ICD9_LINK. Chn bng ICD9_LINK và kích OK. Bng s có 677 bn ghi. 1.6 Trn d liu t nhiu ngun và t nhiu nh dng khác nhau 1.Kích Read(Import). Chn Epi6 Direct Read nh mt file nh dng t hp kéo chn Data Format . 2.Kích vào nút ba chm (…) bên phi ca hp chn Data Source.  C:\Epi_Info, chn STInfect.rec, mt file .REC cu Epi 6.Kích Open 3.Kích OK ca s Read(Import) . 4.Kích Write(Export). Kim tra li rng nh dng u ra là Epi2000. Chn project STI.mdb nh là tên file và ánh “thông tin bnh nhân” nh là tên bng. 5.Kim tra li rng u ra là Append. Kích OK. Ghi mt file .REC vào mt bng mi s tng sinh ra mt view cho file d liu ó. 2.Làm sch s liu 2.1K hoch làm sch s liu Sau khi chúng ta nhp s liu, các s liu phi c làm sch trc khi a ra phân tích. c tiêu làm sch s liu ch yu tp trung vào: x lý các giá tr không hp l, kim tra các kiu d liu ngày tháng, kim tra li tính phù hp ca các bn ghi trong d liu Trong phn này chúng tôi s dng b s liu vtc.mdb  hng dn cách làm sch s liu. Trong b s liu này chúng ta phi làm các công vic sau: Kim tra mã ca khách hàng Kim tra các mã tnh Kim tra các bin ngày Mã hoá li mt s các trng d liu Kim tra li tính phù hp ca d liu nh nu không tham gia xét nghim mà li có kt qu, ngày xét nghim …. Kim tra li các thông tin b thiu trong các bin Phân tích s liu bng Epi Info 31 u có th hãy i chiu tt c các li vi phiu gc, bn s xác nh c các li mã hoá hoc nhp s liu mà có th chnh sa c Tuy nhiên, có nhiu li do ngi tr li không nht quán thông tin nên nu có th bn hãy liên lc li vi h xác nh các thông tin nhng u này là không th thc hin c. Nên nhiu lúc bn phi t mình thay i hay sa li các thông tin cho phù hp 2.2Kim tra tính duy nht ca mã Trong nghiên cu này mi mt khách hàng n t vn thì có mt mã riêng bit nu khách hàng ó n mt ln khác thì phi có mã khác. Cho nên trng Mã khách hàng phi duy nht ( xác nh i tng) hay trong trng ó không có hai giá tr lp li. u có giá tr lp li thì bn phi kim tra xem có phi i tng ó ã b nhp liu hai hay nhiu ln (tu thuc vào s ln lp li) không? Nu có thì phi loi ht ch li t bn ghi. Nu không thì do h thng ánh s b sai và ó là bn ghi thông tin ca nhng ngi riêng bit.  kim tra s ging nhau ca các mã khách hàng, cách n gin nht là tn s ca mã. t c các tn xut ca mã phi bng 1 nu có mt mã nào có tn s nhiu hn 1 thì tc là có bn ghi trùng nhau và bn phi kim tra li phiu  chnh sa li mã. 1. Bn nháy kép vào lnh Frequency trên cây lnh. Chng trình s hin ra mt bng thoi ca lnh Freq nh sau Các thành phn trong hp thoi Freq: Thành phn Miêu t Weight Ch ra bin (bt k) nào là trng s ca phép phân tích s liu Output to Table Ch ra u ra ca câu lnh là mt bng (tu chn) Frequency of Xác nh nhng bin nào mun tính tn s Phân tích s liu bng Epi Info 32 All (*) Except Nu bn ánh du vào tu chn này thì ch ra tt c các bin loi tr nhng bin c chn c tính tn s Stratify by Ch ra bin nào c dùng  phân tn d liu Settings u chn Settings thì chng trình s m mt ca s ca câu Clear Xoá form. Help là mt nút hp tu chn chun, nu bn chn nút này thì chng trình s chy file tr giúp tng ng trong Epi Info. Cancel óng ca s to câu lnh mà không ghi cng không thc hin câu lnh Save Only Ch cho phép ngi dùng ghi vào lnh vào file c th mà OK u bn kích OK thì câu lnh c thc hin và ghi vào son 2.Vào ô frequency of chn bin Clientcode và kích OK Kt qu ca bn nh sau: Mã khách hàng Frequency Percent Cum Percent 003178 1 0.40% 0.40% 003179 1 0.40% 0.70% 003180 1 0.40% 1.10% 003181 1 0.40% 1.40% 003182 1 0.40% 1.80% 003187 1 0.40% 2.20% 003463 2 0.70% 73.20% 003464 2 0.70% 73.90% 003465 2 0.70% 74.60% 003466 2 0.70% 75.40% 003467 2 0.70% 76.10% 003468 2 0.70% 76.80% Phân tích s liu bng Epi Info 33 003469 2 0.70% 77.50% 003470 2 0.70% 78.30% 003471 2 0.70% 79.00% 003472 2 0.70% 79.70% 003473 2 0.70% 80.40% 003474 1 0.40% 80.80% 003475 1 0.40% 81.20% 003476 1 0.40% 81.50% 003477 1 0.40% 81.90% 003478 1 0.40% 82.20% 003526 1 0.40% 99.60% 003459 1 0.40% 100.00% Total 276 100.00% 100.00% Nhìn vào bng kt qu thì có mt s mã có nhiu hn mt giá tr bn phi quay li phiu  kim tra và chnh sa li. 2.3Hin th các giá tr trong mt bin ca b s liu 1.Bm vào lnh List  xem mt bin. Có hai cách  hin th mt bin trong Epi Info. Có th hin th di dng HTML (Web) nhã cài t trc, hoc có th hin th di dng mt bng ô (Grid Table). Khi bn  hin th di dng bng ô (Grid table), bn có th hin th s liu di dng có th sa i thì cho phép bn thay i, chnh sa li d liu. Khi sa nhng giá tr trong bng, nhng mã kim tra liên kt vi trng này  không hot ng. Th hin th mt bin bng nhiu cách: hin th di dng Web, dng bng grid (không chnh sa) hoc bng allow updates (có th chnh sa) u sao (*) thay mt cho tt c các bin trong b d liu. Nu bn ch mun hin th mt vài bin, thay vì chn du sao (*), chn các bin trong bng tên bin Phân tích s liu bng Epi Info 34 (nháy chut vào mi tên ch xung bên tay phi du sao). Chú ý rng cách này ng có th giúp bn lit kê ra tt c các bin (bng cách chn tt c các bin). 2.Nhp vào ô Variable (nhng) bin mà bn mun lit kê và kích OK 2.4 Mã hoá li b s liu 2.4.1 nh ngha ra mt bin mi Trong b s liu Vtc1, mt s câu hi ch có mt la chn nhng ngi qun tr d liu i mã hoá thành nhiu bin nh trong các câu hi nhiu l chn. u này gây ra mt  khó khn cho chúng ta khi phân tích s liu nh s làm các phép tính toán dài hn. Ví d nh chúng ta có th tính toán trc tip l nam/n chim bao nhiêu phn trm trong lng khách hàng n t vn ti Trung tâm bng mt lnh thì chúng ta phi tính toán t hai câu lnh t hai bin s. 1.Chn lnh Define trong cây lnh Select. nh Define cho phép ngi dùng to ra mt bin/ trng mi cho c c d liu ang  hin nay nh Define to ra các trng và các giá tr nht thi. Khi óng chng trình Analysis và c mt bng hoc mt c s d liu khác thì các lnh trên s b xoá  2.4.2.Gán giá tr cho các bin s dng câu u kin (IF) 1.To mt trng mi, tên là “Sex”, không thay i các nh dng có sn trong mc ó, m OK. Bc tip theo là mã li trng Sex theo các thông tin t trng n2c1 và n2c2  gán giá tr cho bin mi Sex, s dng lnh If. To câu lnh nh sau: IF n2c1 = (+) Then Sex = 1 ELSE Sex = 2 END 2.Dùng lnh List hin th các bin sau: Sex di dng bng ô (grid). Sau ó bm OK. n c tin hành tng t vi các bin v ni  ca khách hàng, tình trng hôn nhân  Phân tích s liu bng Epi Info 35 2.4.5Mã hoá li các trng dng s (numberic) Trong b s liu có trng tui ca các khách hàng n t vn. Bây gi chúng ta mun mã hoá bin tui này thành nhóm tui  xem nhóm tui nào thng hay n Trung tâm  vn 1.Dùng lnh Define to mt trng mi ly tên là Agegroup Dùng lnh Recode  chuyn các giá tr t trng N3 sang trng AgeGroup, nh sau: 2. Chn lnh Recode cây lnh Analysis.  mc From chn bin và  mc To chn bin NewValue. t u tiên là giá tr ban u. Ct th ba s là ct cha giá tr mã li cho giá tr ban u Các kí t phi c ánh trong du ngoc kép (khi thao tác trong Program Editor). S dng ELSE  ch ra tt c các giá tr còn li (không có trong ví d này). Lnh Recodes c tin hành theo trình t, trong trng hp 2 giá tr c Value trùng nhau, dòng u tiên sc thc hin. Các s mã li ánh cách nhau bi phím cách, du ngang (-) và phím cách, ví d: 1 – 5. Nhng giá tr âm cng c chp nhn, ví d -10, -9 và -8. From To AgeGroup LOVALUE 14 <14 15 19 15 – 19 20 24 20 – 24 25 29 25 – 29 30 34 30 – 34 35 39 35 – 39 40 44 40 – 44 45 49 45 – 49 50 HIVALUE 50 and over Các ch LOVALUE và HIVALUE c s dng i din cho nhng giá tr nh nht và ln nht trong b s liu. Các trng c to ra trong Analysis c s dng  lu gi các kt qu tính toán hoc các u kin ginh. Các giá tr ca các bin này sc u chnh cho mi bn ghi theo nh nhng qui c trong bng. Bi vì ây là nhng bin tm thi nên các giá trc gán cho các bin này s mt ti ln m sau (khi bn dùng lnh Read ). Khi mã hoá li, cn phi a vào tt c các giá tr, k c nhng giá tr hp l nu không nhng giá tr không c a vào bng s b mã hoá li thành MISSING. Phân tích s liu bng Epi Info 36 n chú ý là Analysis không th mã hoá li hn 12 giá tr.  làm c u này, tham kho ví d trong mc How To Chapter  phn hng dn (Epi Info Help) v mã hoá theo mt cách khác. 3.Khi tt c các giá trã c nhp, bm OK  ra khi hp thoi Recode. 2.5 Kim tra li nhng giá tr phù hp cho bin phân loi Khi chúng ta tin hành nhp s liu có th nhp các mã mà không tn ti. Ví d nh trng hc vn chng hn chúng ta ch có các mã sau 1- tiu hc 2- trung hc c s 3- Trung hc ph thông 4 - i hc và trên i hc. Chúng ta không th bit c nhp liu viên ca chúng ta nhp vào mt mã nào khác vi 4 mã chúng ta ã quy nh.  kim tra các mã không phù hp này bn phi lit kê các giá tr ca bin ó (Dùng lnh Frequencies). Trong bng kt qu bn s kim tra xem có mã nào không hp l không. u có mã nào không hp l bn phi i chiu li phiu  kim tra tin hành chnh a li Lnh Tables c dùng  lp mt bng cho 2 bin. 2.6 Kim tra các giá tr bt thng (outliner) cho bin liên tc Kim tra các giá tr bt thng là mt trong các bc quan trng khi làm sch s liu. Các i lng thng kê mô tu bnh hng u bnh hng bi các giá tr tt cùng (bao gm c thp và cao) nht là giá tr trung bình. Giá tr bt thng này có th là i do nhp s liu nh thay vì nhp tui là 20 nhp liu viên li nhp giá tr là 200 hoc chúng có th là giá tr thc s. Kim tra các giá tr bt thng có th bng kim tra i các phiu u tra xem các giá tró có phi thc hay không? nu ó là giá tr thc thì bn phi a nó vào chng trình phân tích ca mình hoc gii thích cn k nguyên nhân ti sao bn li a vào hay không a vào phân tích giá tró.  kim tra các giá tr bt thng ca các bin s ví d nh bin tui chúng ta dùng nh freq nhã trình bày  trên. 1.Trên cây lnh chn lnh Frequencies 2.Kích vào hp thoi frequency of  chn bin bn cn tính, trong trng hp ca chúng ta là bin tui 3.Sau ó kích OK  thc hin t quu ra ca câu lnh s lit kê ht toàn b các giá tr mà b s liu có. Bn có th nhìn vào bng kt qu xem b s liu ca bn có gái tr bt thng hay không? Nu có và bn mun chnh sa thì bn phi lit kê giá tró  ch cho phép update. 2.7Kim tra ngày tháng  phát hin các sai sót khi nhp d liu ngày tháng n mun tìm các d liu ngày tháng mà không chính xác, ví d nh ngày phng vn m ngoài thi gian u tra hay ngày sinh ca các i tng phng vn nm ngoài tui [...]... n phân lo i, ví d nh ki m tra s phù h p c a nhóm tu i và bi n ngh nghi p) 2.9.1Ch n m t t p con c a b n ghi 1 Ch n l nh Select trong cây l nh b ng cách nháy kép, Ch ra h ptho i c a câu l nh select nh sau: 37 ng trình s hi n th Phân tích s li u b ng Epi Info 2.Dùng h p tho i Availabel variable tho mãn Kích vào ch n 3.Kích Ok ch n bi n t o u ki n và ch n u ki n u ki n là N3 . 1 0 .40 % 0 .40 % 003179 1 0 .40 % 0.70% 003180 1 0 .40 % 1.10% 003181 1 0 .40 % 1 .40 % 003182 1 0 .40 % 1.80% 003187 1 0 .40 % 2.20% 00 346 3 2 0.70% 73.20% 00 346 4 2 0.70% 73.90% 00 346 5 2 0.70% 74. 60% 00 346 6. 79.70% 00 347 3 2 0.70% 80 .40 % 00 347 4 1 0 .40 % 80.80% 00 347 5 1 0 .40 % 81.20% 00 347 6 1 0 .40 % 81.50% 00 347 7 1 0 .40 % 81.90% 00 347 8 1 0 .40 % 82.20% 003526 1 0 .40 % 99.60% 00 345 9 1 0 .40 % 100.00% Total 276 100.00%. 75 .40 % 00 346 7 2 0.70% 76.10% 00 346 8 2 0.70% 76.80% Phân tích s liu bng Epi Info 33 00 346 9 2 0.70% 77.50% 00 347 0 2 0.70% 78.30% 00 347 1 2 0.70% 79.00% 00 347 2 2 0.70% 79.70% 00 347 3 2 0.70% 80 .40 % 00 347 4

Ngày đăng: 22/07/2014, 09:20

TỪ KHÓA LIÊN QUAN