Tìm hiểu phương pháp lập luận mờ và ứng dụng để xây dựng hệ dự đoán bệnh đái tháo đường

Đặc biệt là việc ứng dụng các kỹ thuật như hệ hỗ trợ quyết định, khai phá dữ liệu, hệ chuyên gia, logic mờ để xây dựng các hệ thống chẩn đoán bệnh đã giúp các bác sỹ chuyên khoa có thể t

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO DAI HOC HUE

TRUONG DAI HOC KHOA HOC

TRAN THI THU HUYEN

TIM HIEU PHUONG PHAP LAP LUAN MO VA UNG DUNG DE XAY DUNG HE DU

DOAN BENH DAI THAO DUONG

LUAN VAN THAC SI KHOA HOC

CONG NGHE THONG TIN

Thừa Thiên Huế, 2018

Trang 2

đường cao nhất thé giới Thống kê của Liên đoàn Đái tháo đường quốc tế (IDF) cho

thấy, trên 50% bệnh nhân đái tháo đường ở Việt Nam chết vì căn bệnh này trước

năm 60 tuôi

Biện pháp hữu hiệu để làm giảm tiến triển và biến chứng của bệnh, chỉ phí

chữa bệnh ít tốn kém nhất là phải phát hiện sớm và điều trị cho bệnh nhân kịp thời Tuy nhiên, công tác phát hiện sớm, chăm sóc và điều trị bệnh đái tháo đường còn

gặp rất nhiều khó khăn do kết quả chân đoán phụ thuộc rất nhiều vào kinh nghiệm của bác sỹ cũng như suy luận tại thời điểm chân đốn, chứ khơng dựa trên quy tắc tiêu chuẩn nảo

Một hệ thống chân đoán bệnh, sẽ hỗ trợ cho bác sỹ rất nhiều trong việc đưa ra

kết quả chân đoán cuối cùng Với việc áp dụng CNTT, ngành y tế hiện nay đã đạt

được nhiều thành tựu to lớn trong việc vận hành hệ thống khám chữa bệnh Đặc biệt là việc ứng dụng các kỹ thuật như hệ hỗ trợ quyết định, khai phá dữ liệu, hệ chuyên

gia, logic mờ để xây dựng các hệ thống chẩn đoán bệnh đã giúp các bác sỹ chuyên

khoa có thể tiếp cận và đưa ra chân đoán bệnh một cách nhanh chóng, chính xác Từ

đó, có thể đưa ra phương pháp điều trị bệnh hiệu quả, đồng thời tiết giảm chỉ phí

điều trị

Trong lĩnh vực y tế tri thức chuyên gia là rất quan trọng và những tri thức này phần lớn được phát biêu bằng ngôn ngữ với các thông tin mờ và không chắc chắn, chuyên gia càng làm việc lâu năm thì càng tích luỹ nhiều kinh nghiệm, nhưng kinh nghiệm này không tổn tại mãi mãi với thời gian, vì vòng đời của con người là có giới hạn Vì vậy, nghiên cứu phát triển phương pháp luận nhằm thu thập, duy trì và khai thác để phát huy được các tri thức chuyên gia này là một nhu cầu rất cần thiết

Trang 3

Pháp lấy phần bù của một tập mờ:

Cho 44 là tập mờ xác định trên tập vũ trụ X, có hàm thuộc /„ Phép lay bù của tap A la mot tap mo, ký hiệu ~⁄4, với hàm thuộc được định nghĩa như sau: tia = 1- ua Vx EX a tuc(xì Hình 1.9 Bù của một tập mờ

Tích đại số của hai tập mờ

Cho 41, Z là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt

là g(x), up (x) Tich đại số của hai tập mờ 44 và Ö là một tập mờ, ký hiéu A.B, voi

hàm thuộc được định nghĩa như sau:

HABG) = MAG):Mn(), VXCX

Tổng đại số của hai tập mờ

Cho A, B la hai tap mo xác định trên tập vũ trụ X và có các hàm thuộc lần lượt

là grạ, tg Tong dai số của hai tập mờ 44 và Ö là một tập mờ, ký hiệu 4 ® B, voi ham

thuộc được định nghĩa như sau:

HẠ $ p(X) = Hạ(X) + Ug (X) — Hạ(%) ng(x), vx EX

Tích Descartes của hai tập mờ

Trang 4

\ 0 đ<3 H,()=1x/5-0.6 3<=x<=8 mm» x>8

Ta thu duoc biéu dién mo cua tap mẫu như bảng dưới đây (Ký hiệu: MF-

Membership Function la ham thuéc, N: Khong, Y: Co):

Bang 1.3 Biéu diễn mờ của tập mẫu

Day | Tem | MF (h) | MF (m) MF(c) | Wind | ME (w) | ME (st) | Traffic | MF (1) | MF (sh) |cp DI | 32 |0.7 0.6 0 3 1 0 T5 0.25) | 0.25 D2 |33 |0§ 04 0 45 0.13 03 68 018 | 0.37 N D3 | 30 «| 05 1 0 35 1 0 83 0633 | 0.12 TY D+ | 24 |0 1 0 1.5 l 0 9 04 0 Y DS |ä 0 0 1 25 1 0 38 0 0.87 Y D6 |1 0 0 1 5 0 04 45 0 08 N D |§ |0 02 1 4 0.5 02 37 |0 1 Y D |12 |0 047 1 3 l 0 67 017 0.38 N pe |-5 |0 0 1 2 1 0 3$ |0 092 |Y Did [13 |0 0.47 1 2.5 1 0 4i Ũ 0.82 Y bu {is |0 0.67 0 6 0 0.3 23 Jo 1 Y DỊ) |22 |0 1 a 5 0 04 73 |03 | 0.28 Y DI3 | 32) |07 0.6 0 2.5 l ũ 16 0 1 Y D4 |25 |0 1 0 4 0.25 03 103 [053 |0 N Sum 3 Tal 6 9 11 109 [T81

Như ví dụ ở trên, ta đã phân vùng tập mẫu thành những khoảng khác nhau Sự phân vùng này là đầy đủ (mỗi giá trị trong miễn là thuộc vào ít nhất một tập con) vả là không nhất quán (một giá trị trong miền có thê tìm thấy trong nhiều hơn một tập con)

thuộc Đài (MF()) là 0, còn giá trị của hàm thuộc Ngắn (MF(sh)) là 1

Trang 5

MỤC LỤC IUNv e.- I Lời cảm ơn Mục lỤc L0 1222011112111 1121111511111 111 11111111 kEngkk kg k KT k kg kg x k1 1xx u P101 0 Danh mục các hỉnh - 2112221111221 111511 1115211111011 1 1101111111111 11k kg x kg kg yn Danh mục các chữ viết tắt

1.1 LY THUYET TAP MO "

1.1.1 Tập kinh điển 55 S5 S2 2212222222222 rea 1: 12: DìmlrngiiTa TẬP TH toaisnttbitlotiGDIGIEDIUERONISHENGSEXSHBNHESENNIEELVSEEHDNSESHĐRSSEE 6 1.1.3 Các thông số đặc trưng cho tập mờ 1.1.4 Biển ngôn ngĩt 55 5S S2 2221222222222 ea 9 1.1.5 Cac phép 056 16 10124.0 Il 1.1.6 Quan hé mo

1.2 CAY QUYET DINH

1.2.1 Định nghĩa cây quyết định 55 52 5221122112212

1.2.2 Ưu điểm của cây quyết định

1.2.3 ấn đề xây dựng cây quyết định 55 52 5221122112121 1.2.4 Rút ra các luật từ cây qHyẾt định 55 55 5221122121222 1.2.5 Thuật toán xây dựng cây quyết định C4.5

1.3 CÂY QUYÉT ĐỊNH MỜ - 5 2T E221 1 21tr rau

1.3.1 Định nghĩa cây quyết định mờ -2- 52 222 5122112112112

13.2 Dữ liệu mẫu với biểu điỄn Hờ - 5 SE 1 111111121 1121112 xa 1.4 TIỀU KÉT CHƯƠNG L 2-©22222222212221221221211211221221.2.2 te CHUONG 2 LOGIC MO VA LẬP LUẬN MỜ . 55ccccsecrersee 2.1 LOGIC MỜ 2 22 222221122212211211121112211212122222222122222re 2.1 1 Mệnh đề mờ 55 S55 221 22222221222221 22221 sa 21:2: TẠI THÍ THỪ osasttiiogtititiegBlititGRSHISSGRNHIXGGERHIDRGSERIIRGRGIREIISSSHISSSRGIrixgtm 25

2.13 Phép toán kéo theO HHỜI St SE SE tre 26

2.2 PHƯƠNG PHÁP LẬP LUẬN XÁP XỈ DỰA TRÊN TẬP MỜ 26 2.3 PHÉP SUY DIẾN MỜ 2 22222221121111112111221222112222222222e 29 2.4 HỆ MỜ 522 222221221122112111211211211211112111122212222212 re 30

2.4.1 Cấu trúc và hoạt động của hệ mờ tổng quát -2 ccscscccscsce 30

V0 nã ng 6n n6 A313 32

Trang 6

2.4.3 Bộ suy điỄN HHời, 0 55 5S 21 222221211221121121212122121121 ra 32

bốn In nh cố 34

bến n1 nan nh < 36

2.5 TIỀU KẾT CHƯƠNG 2 -2- 22 22222112111211121111121112111211121212 xe 37 CHƯƠNG3 XÂY DỰNG HỆ DỰ ĐOÁN BỆNH ĐÁI THÁO ĐƯỜNG 38 3 1 TÔNG QUAN VẺ BỆNH ĐÁI THÁO ĐƯỜNG 222225 222c22zcsze2 38 3.1.1 Thực trạng bệnh đái tháo đhường cc eee ete eens eneeneeeneens 38

3.1.2 Định nghĩa bénh dai thao AUONG 2 ccc cece eect eee tsetse neenetteeeneens 39 3.1.3 Nguyên nhân, các yếu tố nguy cơ của bệnh đái tháo đường 39 3.1.4 Triệu chứng đặc trưng của bệnh đái thảo đường 40 3.1.4.1 Triệu chứng lâm sàng c c 2: 2S Street 40 3; 1;4:2› Triệu:chững cẩn lẫm sẵn :z:ssszssssirssnsosngetesaiogtiotosasiasssewsserad 41 3.1.5 Chẩn đoán và phân loại bệnh đái thao AUONg o.oo c2 42

3.1.5.1 Chẩn đoán đái tháo đường -222 2222122122121 ee 42 3.1.5.2 Chẩn đoán tiền đái tháo đường ©2222 2222212221222 e6 43

3.1.5.3 Tiêu chuẩn để làm xét nghiệm chẩn đoán 22222222 43

3.1.5.4 Phân loại đái tháo đường :¿-©22-2222 2221222122112 22c 44

3.2 QUY TRINH CHAN ĐOÁN BỆNH 222 222222122212211221221.2 2 xe 47

3.2.1 Lập luận chẩn đoán bệnh: -.- 5S SE 2111111212111 112122 47

3.2.2 Các kiểu triệu chứg, s55 2S 212211221122122222222 xe 48

3.2.3 Quy trình chẩn đoán bệnh -2- 5s 2222122112212212212222 xe 48 3.2.4 Các quy luật chẩn đoám 52-552 22 2212211221122122121.222 xe 49

3.3 QUY TRÌNH ỨNG DỰNG LOGIC MỜ VÀO CHÂN ĐOÁN BỆNH ĐÁI THÁO ĐƯỜNG -2- 22 2212221211121121112112112121121122222222 2e 49

E178 7i nn 49

3.3.2 Mô hình kiến trúc hệ thống 52-552 2522221222122 ee 40

h1 na 30

3.3.4 Xây dựng và biếu diễn tri thứ Hờ 55552255 22S2221221221122122 e6 52 3.3.4.1 Phân tích các bước xây đựng hệ thống chân đoán 52 3.3.4.2 Minh họa xây dựng hệ dự đoán bệnh đái tháo đường 53 3.4 THIẾT KÉ HỆ THÓNG 222 S22 2222221222122112112112211222222.2 re 63 3.5 THỬ NGHIỆM VÀ ĐÁNH GIIÁ 222222 222222122212221221221.2 2 xe 66 3.6 TIEU KET CHUONG 3 -22©22221222122122112112112211222222 ae 67 KET LUAN VÀ HƯỚNG PHÁT TRIỂN - 5© ©25c©cscccsecxeerreerreee 68

TẤT LIỆU THẤM KHẢO susnsgnngngrssabidirdsdtdrgtuiBangiRttöiSGEnitStitditASi8nnd ung 70

Trang 7

DANH MỤC CÁC BẢNG

Bang 1.1 Bảng dữ liệu phân lớp mức lương ó5: St St SstErsrxerrerrrrerres 16

Bảng 1.2 Dữ liệu mẫu về việc tự lái xe đi làm (Car Driving) ò.- 20

Trang 8

DANH MỤC CÁC HÌNH

Hình 1.1 Hàm thuộc /„(x) của tập kinh điển 4 22 22 22222222252223122312122222-e2 6

Hình 1.2 Hàm thuộc /;(x) của tập mờ Ö Sc 2S nhe 7

Hình 1.3 Ba tập mờ Cold (lạnh), Warm (ấm) và Hot (nóng) dạng hình thang 8

Hình 1.4 Dé thị hàm thuộc của tập mo A voi các số tự nhiên nhỏ hơn 5 § Hình 1.5 Độ cao, miễn xác định, miễn tin cậy của tập mờ

Hình 1.6 Biến ngôn ngữ 22222 222122122212112211211211222222222 2e Tình 1.7: Hợp của bai TẬP HờszssesirsensirbsetiitidgilgERORSSSERGRHSVESHRNHGSGIABN(IRO8itHGa 11 Hinh:1:8 Giao ciiashai tap: MG crcessven essences vere meeers meen wenn remem ammo meeneeees 11

Hinh 1.9 Bu ctia mOt tap MO ec cece eee eee eseeenreneeneetienieserenreneee 12

Hình 1.10 Cây quyết dinh phan lop mite Wrong oo cee cece cece cece ceee cesses teteeeteees 16

Hình 1.11 Hình biểu diễn hàm thuộc của thuộc tính Tắc đường (ME) 21

Hình 1.12 Quá trình phát triển cây của thuật toán Fuzzy ID3 - 23

Hình 2.1 Cấu trúc của mô hình mờ -5¿c2: 222222 treo 30 Hình 2.2 Mô hình hệ mờ nhiều đầu vào - một đầu ra : -c: 32

Hình 2.3 Các dạng hàm thuộc thường được sử dụng trong hệ mờ 35

Hình 2.4 Phương pháp giải mờ cực địạiI cc t S2 Snhnhnnh nhe rerret 36 Hình 2.5 Phương pháp giải mờ trọng {Âm .- - 32: t2 32x Errsrrrrrrrrrek 37

Hình 3.1 Mô hình kiến trúc hệ thống chẩn đoán bệnh - 222222222222 50 Hình 3.2 Các hàm thuộc của mức độ tiểu .- 222221 1251211112111121111211x51 1x6 55 Hình 3.3 Các hàm thuộc của mức độ uống THƯỚC .Ặ2.2 2 222201122221 22 2xx 56 Hình 3:4: Gác hàm thuộc của mức độ ăN:::ccaossecygrniointrraratigtddttigttotxgphonayeaaa 57

Hình 3.5 Các hàm thuộc của mức độ giảm cÂn :- ccc cScSnnnieireree 58

Hình 3.6 Các hàm thuộc biểu diễn nông độ Glucose máu lúc đói 59 Hình 3.8 Form chan doan bénh dai tháo đường . - 22222 221222122212222 e6 64 Hình 3.9 Form chấn đoán bệnh đái tháo đường với bộ dữ liệu cụ thể 64

Hình 3.10 Form chỉ dẫn cách phòng bệnh đái tháo đường . -55¿ 65

Trang 9

PHỤ LỤC PHỤ LỤC 1

PHIẾU ĐIÊU TRA NGHIÊN CỨU CÁC TRIEU CHUNG LÂM SÀNG CỦA BỆNH ĐÁI THÁO ĐƯỜNG Tại tỉnh Quảng Trị L Hành chính 1.0/08 .ĂăĂăĂăĂăĂaaIiI - Tuổi: - Dân tỘC: 222cc - GIỚI: 1.Nam 2.Nữ - Nghề nghiệp: - - 2 121 S22212212121111212111222212221212 ra - Địa chỉ: 022211 ng II Lam sang: 1 Tiền sử: 1.1 Bản thân đã bị bệnh đái tháo đường: Có Không

1.2 Gia đình có người thân bị đái tháo đường Có Không

1.3 Sinh con >4 kg Có Không 2 Thời gian mắc bệnh:

Dưới l nắm Từ l- 5 năm Trên 5 năm

Trang 10

MỞ ĐẦU

1 Lý do chọn đề tài

Chuẩn đoán bệnh trong y học là một lĩnh vực tương đối phức tạp, lĩnh vực này

có những đặc điểm khác biệt đó là mối quan hệ tương hỗ giữa lý thuyết và thực

hành Đối tượng của lĩnh vực này là những bệnh nhân, những con người thực sự

Kiến thức y học cũng khá phức tạp Dé tìm ra những kiến thức mới, phương pháp truyền thống là dựa trên sự mô tả của các hồ sơ bệnh án, nhật ký y khoa, cơ sở dữ liệu dé tài nghiên cứu, Chính vì thế, người bác sỹ thường bị tràn ngập trong

núi đữ liệu không lồ Và đặc biệt là những đữ liệu đó ở mỗi bệnh nhân lại có sự mơ

hồ khác nhau, gắn với cảm xúc của mỗi người Người bác sỹ luôn phải làm việc trong trạng thái căng thắng trong khi yêu cầu phải đưa ra được những quyết định

đúng đắn hiệu quả nhất

Hiện nay, Đái tháo đường là bệnh nhận được sự quan tâm đặc biệt trong giới y

khoa Bệnh này nằm trong số 10 nguyên nhân gây tử vong và tàn phế hàng đầu ở cả hai giới, gây ra các biến chứng nặng nề về tim mạch, tổn thương thần kinh, mù mắt, suy thận, nhiễm trùng và gây tốn thương bàn chân có thể dẫn đến phải cắt cut chi Bệnh đã và đang trở thành vấn đề mang tính xã hội cao ở nhiều quốc gia bởi sự bùng phát nhanh chóng, mức độ nguy hại đến sức khoẻ ĐTĐ còn trở thành lực cản của sự phát triển, gánh nặng cho toàn xã hội khi mà mỗi năm thế giới phải chi số tiền không lỗ từ 232 tỷ đến 430 tỷ USD cho việc phòng chống và điều trị

Theo Tổ chức y tế thế giới (WHO), năm 1985 có khoảng 30 triệu người mắc đái tháo đường trên toàn cầu, năm 2004 có khoảng 98,9 triệu người mac, đến năm 2009 có khoảng 180 triệu người và con số đó có thể tăng gấp đôi lên tới 366 triệu

người vào năm 2030

Hiện Việt Nam có trên Š triệu người mặc bệnh đái tháo đường Theo Bộ y tế,

con số này được dự báo tiếp tục gia tăng trong thời gian tới Theo thống kê trong 10

năm qua, số lượng bệnh nhân mắc bệnh đái tháo đường ở nước ta tăng 211%, và với

Trang 11