BÁO CÁOKHOA HỌC Đề tài : XÂYDỰNGHỆCHUYÊNGIAMỜỨNGDỤNGTRONGXÁCĐNNHNGUYCƠMẮCBỆNHMẠCHVÀNHTIM T¹p chÝ Khoa häc & C«ng nghÖ - Sè 1 ( 45 ) Tập 2 / N¨m 2008 109 XÂYDỰNGHỆCHUYÊNGIAMỜỨNGDỤNGTRONGXÁCĐNNHNGUYCƠMẮCBỆNHMẠCHVÀNHTIM Vũ Đức Thi - Tô Hữu Nguyên - Phùng Trung Nghĩa- (Khoa Công nghệ thông tin – ĐH Thái Nguyên) 1. Đặt vấn đề Hiện nay, nhu cầu áp dụng công nghệ thông tin trong các lĩnh vực chNn đoán và điều trị bệnh phát triển rất nhanh. Cho dù sự thật là các lĩnh vực chNn đoán và điều trị có sự hỗ trợ của máy tính có độ phức tạp cao và không thật sự chắc chắn, việc sử dụng các hệ thống thông minh như lôgic mờ, mạng nơ ron nhân tạo và giải thuật di truyền vẫn đã và đang được nghiên cứu và ứng dụng. Trong lĩnh vực đánh giánguycơmắcbệnh MVT, một hệ thống dựa vào các đối tượng mờ đã được đề xuất trong [5] và đã chứng tỏ được hiệu quả. Trong nghiên cứu này, một giải pháp thay thế được trình bày với trường hợp có nhiều các luật đầu vào hơn với cùng một luật kết quả. Kết quả thực nghiệm của một chương trình thử nghiệm đánh giánguycơmắcbệnh MVT dùng phương pháp này đã cho thấy sự hiệu quả của phương pháp. Trong lĩnh vực đánh giánguycơ khi mắcbệnh MVT, cholesterol được xem là yếu tố chính dẫn tới chứng nhồi máu cơtim dẫn tới cái chết đột ngột. Khi thử máu, nhà chNn đoán lâm sàng đầu tiên phải tìm ra mức cholesterol tổng (T). Nếu mức này quá cao cần xem thêm mật độ lipoprotein thấp (LDL) và lipoprotein cao (HDL) trong cholesterol. Hai tỉ lệ T / HDL và LDL / HDL cũng quan trọng vì chúng cung cấp thêm các chỉ thị ý nghĩa về nguycơ MVT hơn là giá trị cholesterol tổng T. Đánh giánguycơ để xác định nguycơ phát triển bệnh MVT trong vòng 10 năm đã được thực hiện sử dụng bảng điểm nguycơ Framingham. Các yếu tố nguycơ 10 năm trong tính toán Framingham gồm: tuổi, mức tổng cholesterol(T), HDL, huyết áp, cách điều trị tăng huyết áp và việc hút thuốc lá. Bước đầu tiên là tính toán số lượng các điểm ứng với mỗi yếu tố nguy cơ. Đánh giá ban đầu cần các giá trị T và HDL. Vì với cơ sở dữ liệu lớn hơn, các ước lượng Framingham với giá trị mức cholesterol tổng tốt hơn là giá trị LDL. Dù vậy, mức cholesterol LDL sẽ cung cấp thông tin cho giải pháp điều trị. Điểm nguycơ tổng cộng tính bằng cách cộng tổng các điểm của từng yếu tố nguy cơ. Nguycơ nhồi máu cơtimtrong vòng 10 năm và chết đột ngột được ước lượng từ điểm tổng và người bệnh được phân nhóm theo mức nguycơtrong vòng 10 năm. Nguycơ MVT trong vòng 10 năm tiếp theo sẽ được tính từng bước, mỗi bước tính tại các thời điểm xác định. Bảng 1. Phân loại mức cholesterol LDL, T, HDL (mg/dl) theo [3] LDL cholesterol <100 100 – 129 130 – 159 160 – 189 >= 190 Tốt nhất Gần tốt nhất Giới hạn caoCao Rất cao T cholesterol <200 200 – 239 >=240 Giá trị mong muốn Giới hạn caoCao HDL cholesterol <40 >=60 Thấp Cao T¹p chÝ Khoa häc & C«ng nghÖ - Sè 1 ( 45 ) Tập 2 / N¨m 2008 110 Giá trị T và HDL được xem là mờtrong khi giá trị LDL không được chấp nhận là mờ. Nếu chúng ta thêm vào các yếu tố tuổi và huyết áp, cũng là mờ, chúng ta có thể xâydựng một hệmờ cho phép xác định tỷ lệ nguycơ MVT. Việc xác định nguycơtrong 10 năm tiếp theo cũng phụ thuộc vào các thông số khác như cân nặng, việc hút thuốc lá, giới tính, tiền sử bệnh lý của bệnh nhân, yếu tố di truyền gia đình, Và không có một công thức để xác định nguycơ theo các thông số này. Trong nghiên cứu này, chúng tôi giả sử tuổi, mức cholesterol, HDL, huyết áp là các yếu tố thiết yếu để xác định nguycơ MVT. Do vậy 4 thông số này sẽ được sử dụng làm các thông số đầu vào của hệ thống. Với một tỉ lệ nguycơ MVT hệ thống tính được, một quá trình điều trị sẽ được xác định dựa vào mức LDL. Có 3 nhóm nguycơ như trình bày trong bảng 2 Bảng 2. Giá trị LDL, TLC và liệu pháp dùng thuốc với các nhóm nguycơ theo [3] Nhóm nguycơ LDL-C ðiểm cắt LDL bắt ñầu thay ñổi cách ñiều trị Mức LDL phải xem xét khả năng dùng thuốc MVT và các nguycơ tương tự MVT (tỉ lệ nguycơ MVT trong vòng 10 năm >20%) <100 mg/dl >=100 mg/dl >= 130 mg/dl (100-129 mg/dl dùng thuốc là một lựa chọn tốt) Các yếu tố nguycơ phức tạp 2+ (tỉ lệ nguycơ MVT trong 10 năm 10-20% và <10%) <130 mg/dl >=130 mg/dl tỉ lệ nguycơ MVT trong vòng 10 năm 10- 20%: >130 mg/dl tỉ lệ nguycơ MVT trong vòng 10 năm <10%: >=160 mg/dl Yếu tố nguycơ 0-1 <160 mg/dl >=160 mg/dl >=190mg/dl (160-189 mg/dl ít dùng thuốc là một lựa chọn tốt) Đầu tiên, tỉ lệ nguycơ tổng cộng được tính. Theo đó, một bộ luật nhỏ bao gồm các tham số tuổi, giới tính, hút thuốc lá, yếu tố di truyền, HDL, Nếu tỉ lệ nguycơ tổng cộng lớn hơn hoặc bằng 2, hệchuyêngiamờ FES sẽ làm việc như trong hình 1.Sau khi tính tỉ lệ nguycơtrong 10 năm bằng FES hoặc tỉ lệ nguycơ tổng cộng nhỏ hơn 2, cần quan tâm đến giá trị LDL. Tùy vào giá trị mức LDL này, hệ thống sẽ khuyến cáo 3 loại đầu ra sống bình thường, ăn kiêng hoặc sử dụng thuốc. 2. Hệchuyêngiamờ và ứngdụngtronghệ thống 2.1 HệchuyêngiamờHệchuyêngiamờ (fuzzy expert systems (FES)) là một hệchuyêngia dựa lý thuyết tập mờ (Fuzzy Set Theory (FST))các luật mờTrongmô hình FES, các giá trị đầu vào và đầu ra là các giá trị “cứng”. Bằng cách làm mờ hóa các giá trị cứng đầu vào sẽ nhận được các giá trị mờ. Những giá trị mờ nhận được xử lý trong một cơ cấu suy diễn mờ. Do đó các giá trị mờ đầu ra nhận được sử dụng các luật được đưa tới bộ phận “giải mờ” để nhận được các giá trị cứng đầu ra cuối cùng. Trong nghiên cứu này, một hệchuyêngiamờ được thiết kế để xác định tỉ lệ nguycơ MVT trong 10 năm tiếp theo của bệnh nhân là cần thiết và hữu dụng. Hệ thống là phương tiện thay thế trợ giúp bác sỹ khi dữ liệu của người bệnh được đưa vào đầu vào của hệ thống. T¹p chÝ Khoa häc & C«ng nghÖ - Sè 1 ( 45 ) Tập 2 / N¨m 2008 111 2.2 Xâydựnghệ thống Có thêm dữ liệu thực tế và sự trợ giúp của chuyêngia bác sỹ, chúng tôi đã xác định được tính mờ của các tham số đầu vào, đầu ra. Theo đó, có 3 giá trị mờ cho tuổi (trẻ, già và trung tuổi), 3 giá trị mờ cho mức Cholesterol (thấp, cao và trung bình), 3 giá trị mờ cho mức HDL (cao, thấp và trung bình), 4 mức giá trị mờ cho huyết áp (thấp, trung bình, cao và rất cao), 5 giá trị mờ chu nguycơ MVT đầu ra (rất thấp, thấp, trung bình, cao và rất cao). Hình 1. Hệ thống phân cấp bao gồm FES Ví dụ nếu bệnh nhân không hút thuốc, một số luật được trình bày trong bảng 3. Chúng tôi định nghĩa các biểu thức mờ cho các tham số đầu vào (tuổi, mức cholesterol, HDL, huyết áp) và tham số tỉ lệ nguycơ MVT đầu ra Với giá trị tuổi (gọi là x), biểu thức mờ sẽ là (1) 108 luật được trình bày trong bảng 3. Một số được liệt kê dưới đây: - Luật 1: Nếu tuổi là trẻ, Cholesterol là thấp, HDL là thấp, huyết áp là thấp thì nguycơ là rất thấp. - Luật 2: Nếu tuổi là trẻ, Cholesterol là thấp, HDL là thấp, huyết áp là trung bình thì nguycơ rất thấp. - Luật 3: Nếu tuổi là trẻ, Cholesterol là thấp, HDL là thấp, huyết áp là cao thì nguycơ là rất thấp. - Luật 55: Nếu tuổi là trung niên, Cholesterol là trung bình, HDL là trung bình, huyết áp là cao thì nguycơ là thấp. - Lu ật 108: Nếu tuổi là già Cholesterol là cao, HDL là cao, huyết áp là rất cao thì nguycơ là cao. Tuổi Giới tính HDL - C LDL - C Huy ết áp TIền sử bệnh Thu ốc lá Các yếu tố khác If tổng nguycơ >=2 then True False Cholesterol Tu ổi Cholesterol Huyết áp HDL - C Hệchuyêngiamờ (FES) Nguycơ Mức độ LDL-C Bình thường Ăn kiêng Dùng thuốc Di truyền T¹p chÝ Khoa häc & C«ng nghÖ - Sè 1 ( 45 ) Tập 2 / N¨m 2008 112 Bảng 3 Luật mờ với người không hút thuốc lá Luật ð ầ u vào ð ầ u ra Tuổi Cholesterol HDL-C Huyết áp Nguycơ Luật 1 Trẻ Thấp Thấp Thấp Rất thấp Luật 2 Trẻ Thấp Thấp Trung bình Rất thấp Luật 3 Trẻ Thấp Thấp Cao Rất Thấp … Luật 55 trung niên trung bình trung bình Cao Thấp …. Luật 108 GiàCaoCao Rất caoCao Công thức xác định giá trị mờ của tuổi (x) Công thức xác định giá trị mờ của hàm lượng tổng Cholesterol (y) Công thức xác định giá trị mờ hàm lượng HDL-C (h) Công thức xác định giá trị mờ của huyết áp (z) Công thức xác định giá trị mờnguycơmắcbệnhmạchvànhtim (R) <≤ − < = 4030 10 )40( 301 )( x x x x tre µ <≤ − ≤≤ <≤ − = 7050 20 )70( 50401 4030 10 )30( )( x x x x x x nientrung µ ≥ <≤ − = 701 7050 20 )50( )( x x x x gia µ <≤ − < = 200160 10 )40( 1601 )( x x y y thap µ <≤ − ≤≤ <≤ − = 280240 40 )280( 24002001 200160 40 )160( )( y y y y y y thuongbinh µ ≥ <≤ − = 2801 280240 40 )240( )( y y y y cao µ <≤ − < = 4025 15 )40( 251 )( h h h h thap µ <≤ − ≤≤ <≤ − = 6050 10 )60( 50401 4025 15 )25( )( h h h h h h thuongbinh µ ≥ <≤ − = 601 6050 10 )50( )( h h h h cao µ <≤ − < = 130100 30 )130( 1001 )( z z z z thap µ <≤ − ≤≤ <≤ − = 155140 15 )155( 1401301 130100 30 )100( )( z z z z z z thuongbinh µ ≤≤ − ≤≤ <≤ − = 220180 40 )220( 1801451 145130 15 )130( )( z z z z z z cao µ ≥ <≤ − = 2001 200145 55 )145( )( z z z z caorat µ <≤ − < = 50 5 )5( 10 )( R R R R thaprat µ <≤ − <≤ − = 155 10 )15( 52 3 )2( )( R R R R R thap µ ≥≤ − <≤ − = 2515 10 25( 155 10 )5( )( R R R R R thuongbinh µ <≤ − <≤ − = 3520 10 )35( 2015 5 )15( )( R R R R R cao µ ≥ <≤ − = 351 3525 10 )25( )( R R R R caorat µ T¹p chÝ Khoa häc & C«ng nghÖ - Sè 1 ( 45 ) Tập 2 / N¨m 2008 113 Hình 2. Đồ thị minh hoạ các giá trị mờ (a) Biến đầu vào tuổi (b) Biến đầu vào Cholesterol tổng (c) Biến đầu vào HDL-C (d) Biến đầu vào huyết áp (e) Biến đầu ra nguycơmắcbệnh MVT Cơ cấu suy diễn theo phương pháp Mandani đã được sử dụng, độ đúng đắn α của mỗi luật theo luật max-min Mandani được trình bày theo các công thức dưới đây: ……. …. Giá trị lớn nhất của các giá trị độ đúng đắn của các luật được tính theo công thức dưới đây: Tại khối giải mờ, biểu thức giải mờ nhận được với phương pháp trọng tâm tính theo độ đúng đắn. 3. Xâydựng chương trình thực nghiệm và đánh giá Chương trình thử nghiệm được xâydựng bằng ngôn ngữ JAVA trên NetBean 5.0. Giao diện chương trình được thiết kế đơn giản để người sử dụngcó thể dễ dàng sử dụng chương trình. )(),(),(),(min( 2 zlowhlowylowxyoung = α )(),(),(),(min( 1 zhighhlowylowxyoung = α )(),(),(),(min( 55 zhighhmiddleynormalyxagemiddle = α )(),(),(),(min( 108 zhighveryhhighyhighxold = α ), ,max( 21, 2,1 nn αααα = T¹p chÝ Khoa häc & C«ng nghÖ - Sè 1 ( 45 ) Tập 2 / N¨m 2008 114 Hình 3. Giao diện chương trình Hình 3 là giao diện chương trình với một trường hợp ví dụ các giá trị tham số đầu vào, trong đó bệnh nhân là nam, không hút thuốc, 45 tuổi, cholesterol tổng là 300 mg/dl, huyết áp là 155 mm/hg, HDL-C là 47 mg/dl, luật 67 và 68 được cháy. Nguycơmắcbệnh MVT tính được thuộc vào nhóm cao và rất cao là 15%. Do đó trong trường hợp này, giải pháp điều trị khuyến cáo là dùng thuốc. Bảng 4 So sánh với bảng điểm nguycơ Framinggham ATP III STT Tuổi CHOL HDL-C Huyết áp ATPIII FES 1. 30 180 37 160 0 1,84 2. 35 190 45 145 0 6,27 3. 48 260 33 120 8 12,7 4. 57 300 67 110 8 11,6 5. 65 250 54 170 18 21 6. 75 290 25 135 30 26 7. 30 160 49 160 0 1,54 8. 40 310 33 140 8 19,2 9. 55 300 26 200 30 24,7 10. 60 230 39 110 11 13,7 11. 70 210 45 130 16 15 12. 30 240 50 150 0 1,54 13. 35 180 65 160 0 6,27 14. 45 300 47 155 9 15 15. 55 300 49 160 16 20,2 16. 65 250 41 140 18 18,2 17. 70 260 38 190 30 28,2 18. 44 210 37 180 5 12,2 19. 55 150 30 200 11 18 20. 66 150 26 200 28 26,4 T¹p chÝ Khoa häc & C«ng nghÖ - Sè 1 ( 45 ) Tập 2 / N¨m 2008 115 Bảng 4 so sánh nguycơmắcbệnh MVT với đàn ông không hút thuốc được đánh giá theo bảng điểm nguycơ Framingham ATP III khảo sát tỉ lệ mắcbệnh MVT của các bệnh nhân được theo dõi trong vòng 10 năm [6] và hệchuyêngiamờ được xâydựng ở đây. Chỉ có hai trường hợp bệnh nhân hệchuyêngiamờ cho kết quả nguycơmắcbệnh MVT rất khác với thông số thực tại ATP III, các trường hợp còn lại cho kết quả tương đương nhau. Điều này có thể đưa đến kết luận rằng phương pháp sử dụngtrong nghiên cứu này là một phương pháp hiệu quả và có thể sử dụng như một giải pháp trợ giúp cho chuyêngiatrong chNn đoán và điều trị bệnh. Hướng phát triển tiếp theo của nghiên cứu là xâydựnghệ thống chNn đoán và điều trị bệnhdùng mạng Neural mờ. 4. Kết luận Trong bài báo này, chúng tôi đã nghiên cứu về các thông số được sử dụng để đánh giánguycơmắcbệnh MVT. Dựa trên các kiến thức của các chuyêngia y tế và lý thuyết hệchuyên gia, chúng tôi đã xâydựng một hệchuyêngiamờ đánh giánguycơmắcbệnh MVT trong vòng 10 năm của người bênh. Các kết quả thực nghiệm được so sánh với bảng điểm nguycơ Framingham ATP III khảo sát tỉ lệ mắcbệnh MVT của các bệnh nhân được theo dõi trong vòng 10 năm và cho thấy hệchuyêngiamờ được xâydựng chNn đoán nguycơmắcbệnh khá chính xác. So với nghiên cứu trong [5], hệchuyêngiamờ của chúng tôi sử dụng nhiều luật đầu vào hơn với cùng một đầu ra. Kết quả thực nghiệm nhận được khi so sánh với bảng điểm ATP III cho thấy phương pháp sử dụngtrong nghiên cứu này có kết quả chính xác hơn và hứa hẹn có thể phát triển tiếp để ứngdụng hiệu quả trong việc hỗ trợ chNn đoán bệnh và điều trị bệnh. Tóm tắt BUILDING A FES TO DETERMINE THE CORONARY ARTERY DISEASE RISK Mục đích của nghiên cứu này là thiết kế một hệchuyêngiamờ để xác định nguycơmắcbệnhmạchvànhtim (MVT) của người bệnhtrong 10 năm tiếp theo. Hệ thống cung cấp cho người sử dụng tỉ lệ nguycơmắcbệnh và khuyến cáo sử dụng một trong ba kết quả: sống bình thường, ăn kiêng, dùng thuốc. Hệ thống này có thể được xem như một giải pháp thay thế cho các phương pháp hiện tại dùng để xác định nguycơmắcbệnh MVT. Tài liệu tham khảo [1]. Đỗ Trung Tuấn (1999)-Hệ chuyên gia(Exper System),Nxb GD, Hà Nội. [2]. Nguyễn Huy Dung (2005) -Nội khoatim mạch, Nxb Y học, Hà Nội . [3]. Chu Văn Ý (1999) - Bệnh học nội khoa tập I, II, Nxb Y học, Hà Nội. [3] ATPIII Online Calculator, (http://www.hp2010.nblbihin.net/atpiii/ calculator. asp), [5] Dubitzky W., Schuster A., Hughes J. and Bell D. An Advanced Case-Knowledge Architecture Based on Fuzzy Objects, Applied Intelligence, Volume 7, Number 3 / July,1997, pp. 187-204. [6] Detection, Evaluation and Treatment of High Blood Cholesterol in Adults, National CholesterolEducation Program-ATP III (Adult Treatment Panel III) Report, National Institutes of Health, National Heart, Lung and Blood Institute, Executive Summary, 40 p., May, 2001,://www.nhlbi.nih.gov/guidelines/cholesterol /atp3xsum.pdf . BÁO CÁO KHOA HỌC Đề tài : XÂY DỰNG HỆ CHUYÊN GIA MỜ ỨNG DỤNG TRONG XÁC ĐNNH NGUY CƠ MẮC BỆNH MẠCH VÀNH TIM T¹p chÝ Khoa häc & C«ng nghÖ. 109 XÂY DỰNG HỆ CHUYÊN GIA MỜ ỨNG DỤNG TRONG XÁC ĐNNH NGUY CƠ MẮC BỆNH MẠCH VÀNH TIM Vũ Đức Thi - Tô Hữu Nguy n - Phùng Trung Nghĩa- (Khoa Công nghệ thông tin – ĐH Thái Nguy n) 1 một hệ chuyên gia mờ để xác định nguy cơ mắc bệnh mạch vành tim (MVT) của người bệnh trong 10 năm tiếp theo. Hệ thống cung cấp cho người sử dụng tỉ lệ nguy cơ mắc bệnh và khuyến cáo sử dụng