Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 89 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
89
Dung lượng
1,31 MB
Nội dung
I H C QU C GIA TP HCM I H C BÁCH KHOA NGUY N TH NG D NG KHAI PHÁ D QUY NH TRONG QU LI U VÀ H H TR U TR B NG TÍP Chuyên ngành: H th ng thông tin qu n lý Mã s : 603448 LU TP H RA -HCM : TS Lê Thanh Vân : : n Thanh Hiên HQG Tp HCM ngày 27 tháng 12 2013 (Ghi TS Lê Thanh Vân TS Lê Thanh Hiên TS Lê Thanh Sách n ã OA I H C QU C GIA TP.HCM I H C BÁCH KHOA C NG HÒA XÃ H I CH c l p - T - H nh phúc T NAM NHI M V LU H tên h c viên: NGUY N TH MSHV:11320964 inh: 16/12/1984 Qu ng Ngãi Chuyên ngành: H th ng thông tin qu n lý I Mã s : 603448 TÀI: ng d ng khai phá d li u h h tr quy nh qu tr b nh ng típ u II NHI M V VÀ N I DUNG: Thu nh p ti n x lý d li li tìm tri th c c s d ng thu t toán khai phá d Xây d ng mơ hình phân l p b nh nhân Tìm lu t gi a thu c tính c a b nh nhân Xây d d c i b nh nhân mơ hình phân l p xây Xây d n lý vi u tr c a b nh nhân III NGÀY GIAO NHI M V : 14/01/2013 IV NGÀY HOÀN THÀNH NHI M V : 22/11/2013 V CÁN B NG D N: TS Lê Thanh Vân Tp HCM, ngày 22 t CÁN B NG D N CH NHI M B NG KHOA O i L ic cg n TS LÊ THANH VÂN i h c bách khoa H Chí Minh, c gi ng viên t ki n th c, kinh nghi m nh ng g i ý giúp tơi hồn thành lu Ti p theo tơi mu n g i l i c n i trú n i ti N TH ih c H Chí Minh, c c p s li u ch d n cho nh ng ki n th cv b ng ng nh n xét y khoa cho k t qu nghiên c u Tôi xin chân thành c y cô Khoa Khoa H c & K Thu t Máy Tính, Khoa Qu n Lý Công Nghi i H c Qu i h c Bách Khoaia gi ng d y, qu n lý l p h c truy t ki n th c cho tơi su t khóa h c v a qua L ic c am cg n bè, l ng viên m tin công vi c TP.HCM ngày 22 tháng H c viên cao h c khóa 2011 Nguy n Th ii tài c th c hi n nh m nghiên c u y u t b n vi ng típ t i Vi t Nam hi n i c a y u t nh m m u tr b nh t nh m u tr quan tr ng i b nh nhân, giúp cho bác i hi n t i u m i quan h thu c tính c a b nh nhân, t xem xét xét nghi m c n thi c ti giúp cho q trình ch n ốn b nh c a b nh nhân hi u qu Nghiên c c ti d li u; c chính: (1) thu th p d li u; (2) x lý c ti n y h Thu th p d li u ng Hb c x lý c ti n hành b ng cách l y d li u nghiên c theo dõi ki N i Ti c t d li ng huy t b ng típ nh i ng Tp H Chí Minh t ch c X lý d li u: g c ti n x lý d li u s d ng ph n m m x lý d li u c ti tham kh o ý ki th c ti n t lu Ngoài ch nh k , gi c trích tài xu n lý Ch nh nhân b ng cách xây d ng m v nh c nh b nh nhân ngày tái khám c m c c a b nh nhân có th c p nh t báo v s c kh e cho b nh nhân m t cách hi u qu nh t iii ABSTRACT The purpose of this study is to investigate the factors that affect the treatment of type diabetes in Vietnam, determine the relative weight of these factors to classify patient, help the doctor the treatment in a more efficient way This study also investigates the relationship among the properties of type diabetes to give recommendation to doctors, help them determine the necessary medical test to increase performance of diagnostic process The study is carried out through three steps: (1) data collecting; (2) data processing; (3) medical data meaning Hb Association of Endocrine and Diabetes Ho Chi Minh City The data processing includes two steps: the data are firstly pre-processed then processed using WEKA software Medical data meaning: the mining rules generated from WEKA software are passed to specialist doctors to deduct medical meaning Moreover, the study also proposes the idea of doing patient care through patient management module This module will have some function like prepare schedule and remind patient to go to the doctor, manage patient questions and send iv li c s d ng nghiên c u s li u s li u th c, nh p li u t b nh án xét nghi m m t cách trung th c khách quan Vi c kh o sát, nghiên c u th c hi n t làm v L i TÓM T T N I DUNG LU ii ABSTRACT iii L iv M C L C v DANH M C CH VI T T T x DANH M C B NG xi DANH M C HÌNH xii .1 1.1.1 ng d ng h h tr quy c y t 1.1.2 Hi u qu c a h h tr quy nh y t .2 1.1.3 M t s k t qu nghiên c u, ng d c tài 1.2.1 Th c tr ng b 1.2.2 M t s v ng nt c ta yt c ta .4 1.2.3 Tình hình ng d ng CNTT vào y t .5 tài .7 .7 1.7 T ng k t N TH NV B NG TÍP .9 ng típ 2.1.2 Các y u t phát tri n b .9 vi 2.2 Bi n ch ng b ng 10 2.3 Các y u t nb 2.3.1 Thu ng 11 u 11 2.3.2 Béo phì 11 12 2.3.4 Gi i tính .12 2.4 HbA1c 12 12 .12 2.5 Khái ni ng huy 12 u tr b ng IDF 13 T 15 3.1 T ng quan v h h tr quy 3.1.1 Khái ni m h h tr quy nh (DSS-Decision Support System) 15 nh-DSS 15 c c a h h tr quy 3.1.3 H h tr quy nh: 15 nh y t (CDSS) 15 3.1.4 Mơ hình h h tr quy nh s d 17 3.2 Bài toán phân l p b nh nhân d a lu t sinh t t p d li u .17 3.2.1 Phát bi u toán phân l p b nh nhân d a tr n lu t sinh t t p d li u 17 lý thuy t .18 3.2.2.1 Khai phá d li u (data mining) .18 3.2.2.2 Bài toán phân l p 20 3.2.2.3 Trình bày quy 3.2.3 M t s v nh 23 v i toán phân lo i 25 t h p b phân lo i 26 3.2.4.1 Khái ni m k t h p b phân lo i 26 vii 3.2.4.2 Các cách ti p c 3.2.4.3 Mơ hình ho t h p b phân lo i 27 ng c a Bagging (Boostrap Aggregation) 27 3.3 Khai phá s k t h p c a thu c tính 28 3.3.1 Phát bi u toán 28 lý thuy t .28 3.3 T ng k t 31 NX LÝ D LI U & PHÂN TÍCH S PHÂN B CÁC THU C TÍNH C A B NH NHÂN 32 4.1 Ngu n d li u 32 c x lý d li u 32 4.2.1 Lo i b hi u ch nh l i d li u 33 4.2.2 Chuy i d li u .34 4.2.3 Chuy i thu c tính có d ng s thành d ng Nominal 35 4.2.3.1 Phân lo i BMI theo tiêu chu n 35 4.2.3.2 Phân lo i vòng eo 35 4.2.3.3 Phân lo 4.2.3.4 Phân lo ng huy 35 tu i 36 4.3 Th ng kê thu c tính c a b nh nhân 36 4.3.1 Th ng kê s b nh nhân theo tu i 36 4.3.2 Th ng kê s b nh nhân theo ch s BMI .37 4.3.3 Th ng kê s b nh nhân theo th i gian m c b nh 38 4.3.4 Th ng k s b nh nhân theo ch s ng huy .39 4.3.5 Th ng k s b nh nhân theo ch s HbA1c 40 4.3.6 Th ng k s b nh nhân theo vòng eo 41 4.3.6 Th ng kê t l ph 4.3.7 Th ng kê t l ph ut c i b nh 42 d ng lo i thu c c i b nh .43 60 6.2 Ch n lý thông tin b nh nhân m t thành ph h tr quy + ih nh Vi c qu n lý thông tin b nh nhân g m tác v sau: li u b nh nhân k t qu ch d li u +N u b nh nhân có l ch tái khám l p l ch g i email tin nh n nh c nh b nh nhân +Ngồi ra, có th g i thơng tin, tài li u có +Cung c i b nh thơng tin, ti n trình, b nh s c ab u tr thích h p 6.2 d li u c a ph n m m, ch ng h p ch n sung vào t p d li u hu n luy n c qu ch u 6.3 Các yêu c u thi t k v t ho m c c tóm 61 Hình Theo hình i qu n lý b ph n giao di m thành n ph n m m Weka t p d li u hu n luy n ki m tra 6.3.2 Ngôn n Thành ph n tr ng tâm c m m Weka s d ng x lý phân l p b nh nhân, ph n n x l phân l i d ng hàm API mã ngu n m Ngôn ng s d ng Weka Java v y ngơn ng l p c l a ch n thu n l V i ngôn ng l l a ch n nh m m i Weka n ph n m m n giao di t k giao di n m t cách tr c quan d dàng c 62 V ph d li n v li i d ng file n m m Weka Khi c n phát tri n v i d li u l n, m t s d li u vi t b ng ngôn ng Java có th V i vi c l a ch n ngôn ng l ch n ti cs d n ph n m ng phát tích h a l p trình phát tri n ph n m m Hình thành ph n liên quan Hình ng phát tri n Eclipse v n 63 6.3 6.3.2 Giao di u vào g nh p thông s b li u hu n luy n, ngồi cịn có m t s pd nh p thông tin ph c v m qu n lý 6.3.2 Giao di u n v i ch sau: + i dùng n nút v i mã s phù h trình s tìm ki m thơng tin b nh nhân d li hình hi n th lên c s d ng cho b nh nhân tái khám nh m gi m th i gian khai báo thông tin + n nút ch g i hàm phân l p b nh nhân xu t d ki + li mm t qu d li u b nh nhân l p l ch h n tái khám + m tra d li tình hình b nh s c a b nh nhân + p nh t d li cs d it pd li u hu n luy n, nh m c p nh t nh ng k t qu hu n luy n t c a mơ hình quy tin c y nh Chi ti t c a thành ph n giao di c minh h 6.3 64 Hình 6 6.4 Khi kh ki m tra mơ hình quy n, ho c p nh t so v i t p d li u hu n luy nh s g i n ph n m m Weka xây d ng mơ hình quy c s d ng Sau xây d ng mơ hình, t p hu nh quy nh theo c s d ng l p d li u ki m tra tin c y c a mơ hình K t qu xây d ng ki m tra mơ hình nh s c thơng báo c a s 65 Hình 6.4 Sau nh thông tin b nh nhân k t qu xét nghi m, ch n i s d ng có th ng huy c ki m soát t t) bi t k t qu b nh nhân thu c c ki m sốt t ng huy t 66 Hình 6.4 Ki m tra d li u b nh nhân ph n ch trình, thơng qua ch m theo mã s b c tình hình b nh s c a b nh nhân nh nh u tr thích h p Thơng qua vi c ki m tra d li u b t l ch tái khám cho b nh nhân nh m ch D li u c a b n lý c u tr i d ng b 67 Hình 6 t V ch c hi nh nhân c ch n lý típ n thân thi n, , không i nhi u hi u bi t v ph n m m, thu t tốn c n th c hi n Ngồi ra, d cho phép ch nh s a, t qu ch n c a ph n m m mã ngu n m Weka, t tốn xây d ng mơ hình quy d m p nh t t c c hoàn thi n h nh, xu t k t ng mã ngu n Tuy nhi u h n ch v m k t n i v i h th ng thơng tin y t , truy m có th kh c ph trình ch c phát tri nb c Vi c s d ng ngôn ng c nhi u n n t ng ph n c ng khác ch y trình c p d dàng, m i lúc, m t th nh nhân truy i CNTT hi n 68 7: tóm t t l i k t qu a k t lu n t nghiên c u m ph n sau: (1) Tóm t t n i dung nghiên c u; tài; (3) H n ch c a ng nghiên c u ti p theo 7.1 M c tiêu nghiên c u c d li tài s d ng thu t toán khai phá d li u t p p x xây d ng mơ hình phân lo i b nh nhân theo l p: l p b ng huy t ki m soát t t l p b c ki m sốt t t Mơ hình phân lo nh m m ng huy t u vào c a h h tr quy i b nh nhân theo kh ý, ch d ng huy t u tr b nh nhân t Bên c i u m i liên quan hay lu t gi a thu c tính c a b b nh c a b nh, Vi t hi u qu ng qu n lý h cho vi c qu n lý b t hi u qu nh án c a b nh nhân, giúp tài s d ng ngôn ng Java, xây d n lý h tr u tr b nh 7.1 + Th ng kê thu c tính c a b i + Th ng kê tình hình s d ng thu c c a b + Xây d ng mơ hình phân lo i b nh nhân theo l p: l p b huy t ki m soát t t l p b + ng huy ng c ki m soát t t c lu t k t h p gi a thu c tính c a b nh nhân + Xây d v i máy tính v i m nv phân lo i d li u m i hay b nh nhân m i 69 + Xây d ng ch n lý có nhi m v nh c nh ngày khám b nh cho ib liên quan 7.2 7.2 tài tài ch nghiên c u h nh án c a b nh nhân t i m t th m c t t v s ti n tri n b nh c a b c l ch s b nh c a b nh nhân Ví d b nh n i v i m t s b nh nhân m c i v i b nh nhân có thêm b nh khác, vi c s d ng thu s u không th a nh ng b nh nhân ch có th là: ví d m c tiêu ch s Nghiên c u mu phú t 7.5 c k t qu t t c n có kho d li y k t qu nghiên c u m phong c ti n cao, m c ng d ng r ng rãi vào th c ti n Tuy nhiên d li u nghiên c u c a toán cịn ít: kho ng 900 b nh nhân, thơng tin c a t ng b c tri n khai áp d li cs (22 thu c tính) c vào th c ti n c n có thêm d ng d n c a chuyên gia giàu kinh nghi c ng 7.2 p theo ng nghiên c u ti m r ng tính ng d ng c c ph c h n ch c tài tài vào th c ti n b ng công vi c sau: 1/Thu nh p b sung thêm d li u Thu nh p d li u lâm sàn c a b nh nhân Thu nh p k t qu xét nghi m có liên quan Thu nh u tr b nh rõ ràng chi ti t: thu u tr , li ng, cách dùng 2/ Mã hóa d li u theo tiêu chu n chung c k t n i vào h th ng khác áp d ng mơ hình nghiên c u vào b nh khác u b nh tim m 70 c áp d ng vào th c t thách th c l n c c nhà v n m t tài nói riêng c a nghành CNTT nói chung B i vi c áp d ng CNTT vào y t v n g p r t nhi u tr ng i Theo Ti Qu c Tri u, B ng B Y T phát bi u t i h i ngh l n th IV (19/02/2013) d i ti cyt léo nh ng d ng CNTT ngành y t c s d ng khai thác, ng d ng t CNTT hi n v n h n ch c n u qu c a v t ch t, ph n m m ng d c ng m v c a ngành Bên c u tr ng d ng c n s xác cao, thông minh khéo u tr ph n m m ng d ng h t s c h n ch [29] 71 [1] D http://en wikipedia org/wiki/Clinical_decision_support_system, 1/10/2013 [2] - Workshop on Systems Development in SOA Environments, 2007 [3] i pháp b nh vi http://benhvienthongminh vn, 21/11/2013 [4] Thành, Tr n Minh B ch T p chí khoa h [5] ng ng h h tr quy nh i h c Hu , T p 74A, S 5, pp.129-139 Vi http://vov.vn/Suc-khoe/Benh-dai- thao-duong-o-Viet-Nam-dang-co-chieuhuong-gia-tang/104433 vov, 6/12/2012 [6] Qu c Minh Internet: http://dddn com vn/20120907113111229cat7/nganh-y- te-ung-dung-cntt xay-dung-he-thong-du-lieu-quoc-gia htm, 11/11/2013 [7] B u th c tr ng b nh B c K [8] u tr t i b nh vi n tài t t nghi p th i h c Thái Nguyên, 2009 Manson J E, Ajani U A, Liu S, Nathan DM A prospective study of cigarette smoking and the incidence of diabetes mellitus among US male physicians Am J Med, 109, pp 538-542 [9] Nguy t s ch s nhân tr c m i ch n i l n T p chí Y h c th c hành, 2006, pp 515-523 [10] Analysis and Modeling Limburgs [11] i th o khoa h c ti p c ng huy u tr h p lý: nh Chí Minh 18/07/2013 [12] Manuel Mora Autonomous,Guisseppi A Forgionne, JatinderN D Gupta -5 72 [13] Nguy ng H c k c 2011-2012, Ch ng môn h c ngành i h c bách khoa H Chí Minh [14] Anurag Srivastava, Eui- Hong Han, Vipin Kumar, Vieet Singh Parallel Formulations of Decision-Tree Classification Algorith Kluwer Academic Publisher, 1999 [15] - A Scalable Paralllel Very Large Database, India, 1996 [16] http://cse-wiki unl edu/wiki/index php/Bagging_and_Boosting, 21/11/2013 [17] Kaufmann, San Francisco, 2006 [18] Information Systems, Vol 14, Issue 1, pp.1-37, December 2007 [19] Data,Proc ng Association Rules Between Of the 1993 ACM SIGMOD International Conference on Management of Data, Washington, D C., United States, pp.207-216, 1993 [20] Proceedings of the 20th International Conference on Very Large Data Bases, VLDB, Santiago, Chile, pp 487-499, September 1994 [21] ACM SIGMOD international conference on management of data, pp 12, Dallas, Texas, USA, 2000 [22] Tr d ng d thông, 2011 u k t h p b phân lo i cho toán nh n tài t t nghi p th c vi n công ngh n 73 [23] achine Learning Ensemble of Technology, Hoboken NJ 07086 [24] Jiawei Han, Micheline Kamber Data Mining: Concepts and Techniques Second Edition, Morgan Kaufmann Publishers, 2006 [25] Making Carlo Vercellis, John Wiley & Sons Business Intelligence: Data Mining and Optimization for Decision Ltd ISBN: 978-0-470-51138-1 [26] Lê Thanh Vân H c k -2013, Ch sinh viên cao h ng môn h c i h c bách khoa H Chí Minh [27] T Nh ng nguyên lý n n t ng - máu Nxb Y h c, Hà N i, 2007 [28] http://www wi hs-wismar de/~laemmel/en/course- dm-en html, 21/11/2013 [29] i ngh ng d ng CNTT vào ngành y t vn/extensions html, 21/11/2013 [30] University College London April 2007 (revised August 2008) http://www dalieu 74 H tên: Nguy n Th : Qu ng Ngãi Email: thhuongvp02@gmail.com O 2002-2007 t thong HCM 2011-2013 Khoa Tp HCM QUÁ TRÌNH CƠNG TÁC 2007- 2010 Cơng Ty TMA Solutions 2010- Công Ty GCS-Global Cyber Soft ... 3 .2. 2 .2 Bài toán phân l p 20 3 .2. 2.3 Trình bày quy 3 .2. 3 M t s v nh 23 v i toán phân lo i 25 t h p b phân lo i 26 3 .2. 4.1 Khái ni m k t h p b phân lo i 26 ... 3 .2. 4 .2 Các cách ti p c 3 .2. 4.3 Mơ hình ho t h p b phân lo i 27 ng c a Bagging (Boostrap Aggregation) 27 3.3 Khai phá s k t h p c a thu c tính 28 3.3.1 Phát bi u toán 28 lý. .. N TH NV B NG TÍP .9 ng típ 2. 1 .2 Các y u t phát tri n b .9 vi 2. 2 Bi n ch ng b ng 10 2. 3 Các y u t nb 2. 3.1 Thu ng 11 u 11 2. 3 .2 Béo phì