LÊTHỊ HUỆ CHI
SO SÁNH KÉT QUÁ SÀNG LỌC NGUY co MANG GEN THALASSEMIA BÀNG PHÀN MÈM
HỌC MÁY VÀ PHÀN MÈM HỆ CHUYÊN GIA TẠI BỆNH VIỆN PHỤ SẢN TRUNG ƯƠNG
KHÓALUẬNTÓT NGHI ẸP BÁCSỶY KHOAKHÓA2017 - 2023
HÀ NỘI 2023
Trang 2TRƯỜNGDẠI IKK YHÀ NỘI ***
LÊ THỊHUỆ CHI
SO SÁNH KÉT QUÁ SÀNG LỌC NGUY co MANG GEN THALASSEMIA BÀNG PHÀN MÈM
HỌC MÁY VÀ PHÂN MÈM HỆ CHUYÊN GIA TẠI BỆNH VIỆN PHỤ SẢN TRUNG ƯƠNG
Ngành đào tạo :BãcsỳYkhoa
Trang 3tới PGS.TS Nguyễn ThịTrang - Giang viên cao cấp Bộ môn Y sinh học -Di truyền và PGS.TS Trần Danh Cường TuningBộ mòn Sanphụkhoa, trường Dại họcY Hà Nội Thầy cô đà trục tiếp chidạy.hướng dần tận tinh và luòn tạodienkiện tốt nhắt cho em trong suốt quá trinh học tập nghiên cửu và hoàn thành khóaluận náy Thầy cô là người dà dinh hướng, diu dắtem nhùng bước di dầutiên trên conđườngnghiêncứu khoa học.
Em xin cam on Ban giám hiệu nhà trường Phòng Dào lạo Dại học, Phòng Cõngtác chinh trị & Học sinh sinh viên, bộ mòn Y sinh học - Ditruyền Trường DạihọcY Hà Nội cùngnhưcáckhoa, bộ môn em tùng theo học dà tạo diềukiện thuận lụi choem học tập và thựchiệnlốtkhóaluận cua minh.
Em xincamơncácthầycỏ.anhchị nội trú và cãcanh chị kỹ thuật viên tại Bộ mòn Y sinh học Di truyền trường Dạihọc Y Hà Nội dà hướngdần tận tình, giúp dỡ emtừbước dầu thuthập sổliệu trong nghiên cứukhoahục cũngnhưlàmluậnvăn tốt nghiệp.
Cuối cùng,con xincámơn bổ mẹ.anh trai vànhùngngườithântrong gia đinh cùng bạn bè mọi người dà luôn bèn cạnh úng hộ tạo dien kiện lốt nhấtcho con học tập và hoànthànhkhóa luận.
Hà Nội ngày tháng năm
Lê Thị Huệ Chi
Trang 4Tôi là Lê Thị Huệ Chi sinh viênkhóa 2017 - 2023 chuyên ngành Bác sỳ đa khoa Trường Đại học Y Hà Nội xin cam đoan:
1 Dây là luậnvân do banthân tòi trựctièpthực hiệndưới sự hướngdàn cùa PGS.TS Nguyen Thị Trang vá PGS.TS 'Trần Danh Cường 2 Cóng trinh náy khôngtrùng lặp với bất kỳ nghiên cứu nãokhác dà
3 Các số liệu và thông tin trong nghiên cứu là trung thực và khách quan, dược xác nhận và chấp nhận cua cơ sờ nơi nghiên cint cho phéplấy sổ liệu.
Tỏi xin hoàntoànchịutráchnhiệm trước phápluật về nhữngcamkếtnày.
Xác nhận giăng viên hướng dẫu
Hà NỘI ngày tháng nám
Xgườí viết camđoan
Lê ThịHuệChi
Trang 5CHƯƠNG 1 TONG QUANTÀI LIỆU•••••••••••••■••■••■••■••••••••■•••••••••••••■•••••••••a3 1.1 Tông quan về bệnh thalassemia 3
1 1.1.Định nghía bệnh thalassemia 3
1.1.2 Cơ chế bệnhsinh và phảnloạibệnh thalassemia 4
1.1.3 Tinh hĩnh mắcbệnh thalassemia 7
1.1.4 Các phương phápsànglục nguy cơ mang gen thalassemia 8
1.1.5.Phươngpháp chân đoánthalassemia 9
1.2 Úng dụng tó tuệ nhàn tạo trong sàng lọc nguy cơ mang gcn thalassemia 9
CHƯƠNG 2.ĐÓI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨƯ 14
2.1.1 Tiêuchuẩnlựa chọn 14
2.1.2 Tiêu chuẩn loại trừ 14
2.2 Địa diêm và thờigiannghiên cữu 14
2.3 Cờ mầunghiêncứu 14
2.4 Phươngphápnghiêncứu 15
2.5 Quy trinh nghiên cứu 16
2.5.1 Sơđồquy trinh nghiên cứu 16
2.5.2 Các bước tiến hành nghiên cữu 17
Trang 62.5.4 Phân tích và xử lý sổ 2.6 Vấn đề đạo đức nghiên cún 20 CHƯƠNG 3 KÉTQUÁ NGHIÊN cúv 21
3.1 Độc điểm cúabợdừliệuthứ nghiệm cuaphần màn học máy và phần 1111111 hệ ni thúc chuyên gia trong sàng lọc nguy cơ mang gcn thalassemia 21 3.1.1 Bộ dừliệuđẩuvào 21 3.1.2 Dặc diem cáckếtquadự báo cua phần mem 24 3.2 Đánhgiáhiệuqua cùa phần mem học máyvàphần mềm hệ trithức
chuyên gia trong sàng lọc nguy cơmanggen thalassemia 28 3.2.1 Đánh giá hiệuquá cua phần mềm họcmáy: 28 3.2.2 Đánh giá hiệuqua cua phần mềm hệ trithức chuyên gia: 29 3.2.3 So sánhđộ chinh xáccùa phần mềmhọc máy và phần mềm hệ tri thứcchuyêngia 31 CHƯƠNG 4 BÀNLUẬN 32
•1.1 Một sổ đặc điềm cùabộdừliệudầuvào và dừliệudầura bộ cơ sớdừ liệucua phần mem Al sàng lọc nguy cơ mang gen thalassemia thư nghiệmtạibệnh việnPhụsanTrungƯơng 33 4.1.1 Bộdữliệu dầu vào 33 4.1.2 Ketquadựbáo cua phẩn mem 36 4.2 Độ chinh xác cua phần mem hục máy vã phần mem hộ tri thức
chuyên gia trongsànglọc nguy cơmang gen thalassemia 37 KÉTLUẬN 42 KI ÉN NGHI 43 TÀILIỆU THAM KHÁO
PHỤ LỤC
Trang 7FN Âm tinh gia FP Dương linh gia
INPUT Bộđừliệu dầu vào
MCH Lượnghuyếtsắctố trung binh hồngcầu MCHC Nồng độ huyết sactố tiling binh hốngcầu
MCV Tile tích tiling binh hồngcầu OUTPUT Bộdừliệuđẩura
TIF HiệphộiThalassemiaquốcte TN Ả1ÌÌ tính thật
TP Dương linh thật WHO Tồ chức y tc thegiới
Trang 8Bang 1.1 Sosánh ưu nhược diem cua phần mần hệ trithức chuyêngia
vàphần mềm học mây 13
Bang 2.1 Cácbiền số và chi số sư dụng trong nghiêncứu 19
Báng 3.2 Giá trịtrung binh câcchisốcõngthức máu sắt huyết thanh và ferritin cùa thaiphụ và chồng thaiphụ 22
Bang 3.3 Ket quadiện di cua cácthaiphụ và chồng thaiphụ 23
Bảng 3.4 Kct quaxétnghiệmgen 24
Bang 3.5 Kct quã VC nguy co mang gcn từ phần mềm học mây 25
Bang 3.6 Kết luận vềtinh trạng công thức máu của phẩnmềm hộ tri thứcchuyêngia 26
Bàng 3.7 Kết luận vê tinh trạng sắt cuaphầnmềmhộ tri thứcchuyên gia 27 Băng 3.8 Kết luận về nguycơ mang gcn từphần mần hệ tri thúcchuyêngia 27
Bang 3.9 Liên quan giữa nguy cơmang gen thalassemia theo kềt luận cùa phần mem học máy với kếtquàxẽtnghiệm gen.28 Báng 3.10 Đánh giá hiệu quá cua phẩn mềm học máy xác định nguycơ mang gen thalassemia 29
Đãng3.11 Liên quan giữa nguy cưmang gen thalassemia theo kết luận cùa hệ trithứcchuyêngia với kểt quàxẽtnghiệmgen 29
Bang 3.12 Đánh giã hiệu quà cùa phần mềm hệtri thức chuyên gia xác định nguy cơ mang genthalassemia 30
Báng3.13 Sosánhdộ chinh xãc cua phần niềm hực may vã phần mềm hộ trithúcchuyêngia 31
Trang 9Hinh 1.1 Mỏ hĩnh cẩu trúcphân tư hemoglobin binh thường 3
Hình 1.2 Phân bỗbệnh hemoglobin trẽnthe giới 7
Hinh 1.3 Kiến trúc cơ bân cua một hộchuyêngia 11
Hĩnh 1.4 Kiến trúc cơban cua các phương pháphọcmây có giâm sát 13
Hĩnh 3.1 Mán hình dự bãonguycơcuaphản mềm học máy 24
Hình 3.1 Màn hình dựbáonguycơ cuaphan mằn hệ trithứcchuyên gia 25
Trang 10Sơđồ 2.1 Quy trinh nghiên cim 16 Biêu đồ3.1.Sosánhđộ chinh xác cua phần mềm họcmáy và phần mềm hộ
trithứcchuyêngia 31
Trang 11HỆ CHUYÊN GIA TẠIBỆNH VIỆN PHỤSÁNTRƯNG ƯƠNG
Tóm tắt:
Dạt vần dề: Thalassemia thuộc nhóm bệnh rói loạn tông hợp huyết sầc tố là bệnh di truyền phổ biến nhất thế giới Việc sàng lọc trước sinh bệnh thalassemia có vaitròvòcùngquan trọng tuy nhiên còn gập nhiềukhó khán Do đó việc ứng đụng tri tuệ nhàn tạo hỗ trợ sàng nguy co mang gen thalassemia là một phương án rắt hiệuquá.
Mụctỉêu: (1) Mò tácác dặc điếm cua bộdữliệu dầu vào (INPUT) và dữliệu dầu ra (OUTPUT) bộ co so dừliệucúaphần mem AI sànglọc nguy co mang gen thalassemia thưnghiệmtại bệnhviện Phụ sảnTrung Ương (2)Đánhgiá độ chính xáccuaphầnmềmhọcmáy vã phầnmềmhộtri thức chuyêngia trong sàng lọc nguy co manggenthalassemia
Dối tượng và phương pháp: Nghiên cứu mò tá cảt ngang 187 thai phụ và chổngthaiphụ đến khâm sàng lọctrước sinh bệnh thalassemia tại Bệnh viện Phụ SanTW từ tháng 10/2022đến6/2023.
Kct quá: Trong còng thức mâu so vói nhùng người binh thường, nhùng người mang gen thalassemia có sự làng RBC RDW và có sựgiàm HGB HCT MCV MCH, MCHC Phần mem học mây và phần mèmhệ tú thức chuyên gia có độ chinh xác lương đương (95.19% và 94.48%) Độdạc hiệu cua phần mềm hục máy (90.70%) cao hơn phẩn mềm hộtri thức chuyên gia (73.33%) Độ nhạy cua phần mềm hộ ui thức chuyên gia (99.25%) cao hơn phần mềm học mày (96.53%).
Từkhóa: thalassemia, sàng lọc nguy cơ mang gcn, tri tuệ nhân tạo phần mem học mây phần mem hệ trithứcchuyêngia.
Trang 12EXPERTSYSTEMSOFTWARE AT THEVIETNAMESENATIONAL HOSPITAL OFOBSTETRICSANDGYNECOLOGY
Introduction: Thalassemia belongs to the groupof disorders ofhemoglobin synthesis, which isthemost common inheriteddisease in the world Prenatal Testing for thalassemia has a significant position However, westill needto deal with many difficulties Therefore, the application of artificial intelligence supports prenatal testing of Thalassemiaas an effective option.
Objective: (I) Describethe characteristics ofINPUT and OUTPUT data of the database of AI software toscreen for the risk carriers experiment at the Vietnamese National Hospital of Obstetrics and Gynecology (2)Evaluatethe accuracyof machine learning softwareandexpert system software in carriers screening for Thalassemia.
Subject aud Methods: In this cross-sectional descriptive study of 187 pregnant and theirhusbandswhowent to the Vietnamese NationalHospitalof Obstetricsand Gynecology for prenataltesting ofThalassemia fromOctober 2022 to June 2023.
Results: In the complete blood count, compared with normal people, carriers of thalassemia have an increase in RBC.RDW and adecrease in HGB HCT MCV MCH and MCHC Machine learning software and expert system software have the same accuracy (95.19% and94.48%) The specificity ofthe machine learningsoftware (90.70%) ishigherthan that of the expert system software(73.33%) The sensitivityof the expertsystem software (99.25%) is higherthanthatofthemachinelearning software (96.53%).
Keywords: thalassemia, earners screening, artificial intelligence, machine learningsoftware, expert system software.
Trang 13ĐẠT VÁN ĐÈ
Bệnh Tan ináubain sinh hay còn gụi là bệnhThalassemia, thuộc nhóm bệnh rói loạn tổng họphuyết sắctố là bệnh di truyền phóbiến nhất the giới với ước tinh khoang 7% dân số mang gen bệnh ‘ Việt Nam lã một trong nhữngnướcnằm trong vành daicó ty lệmắcbệnhThalassemia cao Nguyên nhãngãybệnh là do đột biền gcn quy định tônghọp chuồi globin dần đen mất cân bằngcác loại chuồi globin,tạo nênbắt thưởng về huyếtsắc tố vãthành phầncácloại huyết sắctố.gáy ra tinh trạng thiếu máumạn tính và nhiềubiến chứng nguy hiêmớ người bệnh Nước ta hiện nay dang tậptrung dây mạnh vào việc dự phòng bệnh, lire lã giám thiêu những đứa trê có kha nâng mắc bệnh ra dời.trong đó phương pháp sàng lọctrước sinh nham phát hiệnsớm nhùngthai nhi cókhanângmắcbệnhthựchiện trên nhùng cặp vợ chồngđen khám thai có vai trò vỏ cũngquan trọng Tuy nhiên, việcsànglọc trước sinh bệnh thalassemiachotẳt cathaiphụ ViệtNam còn gậpnhiều khó khán, dậc biệt các tuyến dưới hoặc cácvùngdân tộc thiêu số Việc dưa racác chidinh xét nghiệm đột biểngen chắn đoán thalassemia chotất cá thai phụlà không cần thiết, lum nừachiphi lèn đếnhángtriệu đổng, vượtkhanăngchi tracùa người dán Ớ Việt Nam tháng4/2020 Bộ y te dà ban hãnh thông lư hưởng dẫnsàng lục thalassemia trước sinh trong quỷ dầu cùa thai kỳ và yêu cầu tất cathaiphụphai thục hiệnxétnghiệm tông phân tích tề bão màu, kết hợp tiền sưbệnh, tiền sứ gia dinh, kétquaxét nghiệm máu cua chồng đê xác định sớm nguy cơ người mang gen vã cõ chinh sách dự phỏngvà canthiệp kịp thời Tuy nhiên, dê đánh giá các kết quáxẽt nghiệm mâu vã kết hợp tiền sú gia dinh cầnphải có chuyêngia di truyền, huyct học hoặc chuyên gia sankhoacỏ kỉnh nghiệm Điêunáylại không kha thi ớcãc tuyến dưới và nhiều vùngdân tộc thiêu số Đo dó việc sứdụngtri tuệ nhântạo với khánângphânlíchnhiều chi số xẽtnghiệm dê dưa radự bão nguy cơ mang gen thalassemia cho ngưởi
Trang 14hiệuquà.hoàntoàn kha thi.Phần mềm sàng lọc trước sinhsau khi được xây dụng bao gồm2 nhánh cùa tri tuệnhântạo làhộtrithứcchuyêngiavàphẩn mềm học máy.đềucùngmụcđích lã dự báo người có nguycơ cao hoặc thấp mang genbệnh, nhưng quytrinh xây dựng lã khácnhau Đồng thờiphần mềm cùngnhấtthictphai trai qua quátrinh so sánh vãđánh giã mứcđộ chính xác và hiệuquá trước khi dưa vào áp dụngthựctiền.
Chinh vi những lỳ dotrên, chững tỏi tiến hành dề tài "Sosánh kết qua sàng lọc nguy cơ mang gen thalassemia băng phần mềm học máy và phàn mem hộ chuyêngiatạibệnhviện Phụ sán Trung Ương" vói 2 mụctiêu:
1.Mò ỉacácdụcdiêm Cua bộ dừ liệu dần vào (INPUT) rờ dữ liệu dầura(OUTPUT) bộcơ sở dừ lieu cùaphần mềm AI sàng lọcnguy cơ manggen thalassemia ỉhữ nghiệm tại bênhviện Phụ sán Trung ương.
2 Dànhgiàđộchinh xác cua phầnmềm học máy vàphầnmềm hê tri thúcchuyêngiatrong sàng lục nguycơ mang genthalassemia.
Trang 15CHƯƠNG1TONG QI AN TÀILIỆU
1.1 Tống quan về bệnh thalassemia
1.1.1.Dịnh nghĩa bịnh thalassemia
Hemoglobin là một protein trong hồng cẩu có chức nângvậnchuyênoxy trong cơ thè về mặt cấu trúc, hemoglobin làmộttetramcređược cẩu tạotừ I monomere Mỗi monomere gồm 2 thành phần là nhàn Hem vàglobin Hem gồm I vòngporphyringắnvới Fe2+Ư chínhgiữa, có sắc tổđó, giống nhau ơ mọi người Globin có nhiều loại vã mỏi phân tử hemoglobin sẽ gồm 4 chuồi globin thuộc 2 loạinhất định, từđó hĩnh thành nèn cảcloại hemoglobin khác nhau Ớngười trương thành có 4 loại globin là a, p ổ và Ỵ tươngứngtạora HbA(2 chuồi a 2 chuồi p), HbA2 (2 chuỗi a 2 chuồi ổ) vã HbF (2 chuồi ư 2 chuồi y).
CÁU TRÚC HEMOGLOBIN
lỉinh ỉ ỉ Mô hình cẩn trúc phântứ hemoglobin bình thường 9
Gcn quy địnhtông hợp globin a nầmtrênnhánhngấn nhiêm sấc thêsố 16 gồm 4 gen mỏi nhiềm sắcthê chứa2 gen alpha 1 vã genalpha 2 (HBA1 và HBA2) Gcn quy định tông hợp globin (ỉ nằmtrênnhánhngắn nhiễm sắc the sỗ 11 cùngvớicác gcn quy định chuồi c,Ỵvãổ và mồi nhicm sấcthechi chứa 1 gen p(HBB) ơ người trong suốt quátrinhphát triển tửphôi thai đến khi trường thành, các gen globin đóng mơ lần lượt nhầm tônghợp cãc loại
Trang 16hemoglobin phù họp về chức năng và phục vụ quá trinh vậnchuyênoxy tới cáctếbào cua co the.
Thalassemia là bệnh thiếu máu tan máu di truyền gâyra do giâm hoặc mấthãn sự tổng họp cua một hoặc nhiều loại chuồi globin Tùytheo sự thiếu hụt tỏng họp ờ chuỗi alpha (a), beta ((I), hayca chuỗi delta (ồ) và beta mà có têngọi lã a thalassemia, pthalassemiahayổpthalassemia.-5
1.1.2 Cư chề bệnhsinh và phânloạibệnhthalassemia
Gen globin cô the bị dột biến lãm giâm hoặc mất khả nàng tông hợp chuồi globin, tù đólãmgiamsố luting chuồi globin có chức nàng binh thuồng gáyrabệnh thalassemia.
1.1.2.ỉ.Alpha- thalassemia
Các đột biến gày bệnh alpha-thalassemia chu yếu là dột biển mất gen alpha-globin n bẽn cạnh đỏ còn cócácdộtbiển điểm làm thay dốicấu trúc hoặc chức nâng cùa chuỏi globin alpha, dan den hmh thành các chuồi polypeptid bấtthường, số lượnggen bị dột biền càng nhiều thi số lượng chuỗi alphabinhthường càng giâm và biêuhiệnlàmsàng cua bệnh cảng nặng.
Như vậy dựa vào sỗ genalpha trên ca 2 nhiễm sắc thê bị đột biến mà biêuhiện ra các thè lâmsàng với mứcđộnặngnhẹ khác nhau.
- Thê ẩn haythe thầm lặng: nguyênnhãndo đột biến cùa 1 gen trên tống 4 gen alpha (cỏ thề lã mất đoạn hoặc đột biếndiêm) Bệnh nhân mắc thenày không cõ biêuhiện trẽn lãm sàng, các chi sổhuyếthọc vã thành phàn huyết sấc tổ không thay dôi Đây còn lã thèngười Lành mang bệnh, bệnhnhãn có thê không biết minh mang gen dột biền nhưng vàn có thètruyềnlạigenbệnh chocảcthểhộsau.
-Thểnhẹ(thêtrait): do 2 genalpha bị đột biến và kiêugen cỏ the ờ 2 dạng: -a/-a (dạng trans dồng họp tư a‘-thalassemia: hay gặp ở Châu Phi) hoặc -/aa (dạng cis- dị hợp từ a°-thalassemia: hay gặp ớ Đông Nam Ả).
Trang 17Bệnhnhân không cõ biếuhiện làmsàng nhưng MCV và MCH giám Đặcbiệt dạng /ưa chứa nhiễm sắcthế không CO genalphanào nỏn nếu 2 vợ chồng cỏ cúngkiêu gen nàysè có nguy cơ sinh con mang kiềugcn / và gâyra tinh trạngphũthai.
-Thê trung gian (bệnh Hemoglobin H hay HbH): trong 4 genalpha chi có 1 gen hoạtdộng binh thường, có kiều gcn (í-/-, gọi là dị hụp tứkép «°-a+-thalassemia Õ nhùng bệnh nhân này do số lượng chuỗi alpha San xuất không đu de tạo nên HbA («202)nêncó sự tàng sanxuất chuỗi p globin de bũ trừ Lượng 0 globin dư thừa sẽ kết hợp lại với nhau tạo thành một loại hemoglobincó tên là HbH gồm4 chuồi [I hợp thành Đây là loại Hb không bềnnênhồng cầu cuangườibệnhHbH dề bị phá huyhon.dời sóng ngần hơn binh thường dần dền thiếu máuvừa hoặc nặngngaytừlúc mói sinh MCV và MCHgiám, xét nghiệmmáuxuấthiệnHbH
-Thêphù thai: Đây lã thêbệnhmá tầt cacácgenalphađểu bị dột biển, venkiêu gen lã "/" (dồng hợp tir a°-thal) dẫnđếnhoãntoàn không tống họp được chuỗialpha Ớgiaiđoạn đầu bão thaivầnpháttriền binhthường docó gcn£hoạtđộng tông hụp nên Hb Portland (Í2Y2K Đây là loại Hb có khanăng vận chuyên oxy đê cung cấp cho các mô trong cơ thẻ Sau đỏ gcn £sèdần ngùnghoạtdộng và khi không côn globin ụ các chuồi Y sẻkết hợp với nhau tạo thành libBart’s (4v) lib Bart's là loại Hb không có khanâng vận chuyên oxynên không the duytri sinh sống cho cơ the dần den tinh trạng phũ thai, phù rau thai Thaisè có biêu hiện: phũtoàn thản,gan láchto suy tim thiều tnáu l ắt nặng, hống cầu nhó nhượcsắc hình bia bẳn nhiều hồng cầu non điện di Hbchu yếu làHb Bart's, hậu qualã thai chết khicỏn trong tứcung hoặc ngay sau sinh.
Trang 18LJ.2.2 Beta- thalassemia
Dột biển xay ra trên gcn p rắt đa dạng, cõ the thay dối ờ I base đơn thuần, mấtđoạn lỏn bấthoạtgcn,dộtbiến vỏnghĩa, dột biếndịchkhung,đột biến xay ra trên vũng diều hòagen Các dột biến này đượccilialàni 2 loại:
p"-thalassemia: làcácdộtbiến lãm gen 0 hoàn toàn không có kha nãng tống họp chuồi p
p+-thalassemia: là cácđộtbiến lãm giâm tông họp chuỏi p°-thalassemia ư nhiềumửcđộ khác nhau
Các thep -thalassemia bao gồm: - Hie nhẹ(the Minor)
Thenãydomột gen p trên I nhiễmsấc the bị dột biển, kiêu gcn là pp* hoặc pp°, Bệnh nhãnbiêuhiệnhồng cầu nhò nhưócsac (MCV MCH giâm), đa số cỏ thiếu máu l2 Xét nghiệm sinh hóa cho thấysắt ferritin huyết thanh, độ bào hòa transferrin binh thường Diện di HbAbinh thường hoặc giảm nhẹ, IlbA2, I lbF tângnhẹ.
-Thể trung gian
Người mấc the trung gian khi cá 2 gcn đều giám hoặc không sán xuất đượcchuỗi Lãm sàng cua thênãy rất đa dạng, từ không triệuchứng den triệu chime nặng, biển dạng mặt xương sọ thiếu máu ờ nhiều mức độ Ferritin tảng, điện di thấyHbA giám, HbA2,HbFtáng.
-Thênặng(the Major)
Tile nãy do cá 2 gcn p đều không tông hợp dược chuồi p (kiêu gen p°p°) Bệnh nhânbiêuhiện lảm sàngrấtsớm từ thảng thứ 7 trong bàỏ thai, rỏ nhất là khi tré được2-6thángtuổi, thiều máurấtnặng(hồngcầunhò nhược sác nặng) Ferritin tâng cao diện di thầy hoàntoàn không cỏ HbA trong khi HbA2 và HbF tăngcao.
Trang 191.1.3.Tình hình ntắcbệnhthalassemia
Hieo Tốchức Y tể ThếGiới, bệnh huyết sẳc tổ anh hường tới 71% sổ nước trênthegiới ' Hàng năm có khoảng 330.000 tre sinh ra bị bệnh (trong đó có 83% là hồng cầu hình hem vã 17% là bệnh thalassemia) 4 \ Bệnh Thalassemia phânbốkhấptoàn cầu song cótinhđịa dư thưởng gậpơvùng Địa Tiling Hai.khu vực Trung Đòng DôngNam Ẳ và Bấc Phi \
ỉỉình 1.2 Phânbốbệnh hemoglobin trên thể giói(TheoGalanello, et al)6
Tylệ người mang genbệnhớViệtNamkhá cao phànbỗừkhắpcáctinh và dàn tộc trong ca nước, đặcbiệtlãcácdãn tộc it người ở cac tinh miền núi trong dó người Mường gặp với ti lệ 25%.ngườiThãi là 16.6% người Nùnglã 7.1% Theo Dương Bã Trực vã cộng sự cõ khoang 2.3% tre mang gen a-thalassemiasống ớ Hà Nội gồm 2 thêbệnh a-1 vàa-2 có 13.75%bệnhnhi HbH trong tông số bệnhnhânthalassemiađenkhám, trong đó bệnhnhingười Kinh chiếm 84.7% và dãn tộc it người chiếm 15.3% ' Như vậy bệnh a-thalasscmia cùng rất phổ biến ờ ngước ta với nhiều the bệnh Venhỏm tuồi mắc thalassemia, theo một nghiêncửu được thựchiện ờ Viện huyết học và truyền máu Trung ương thực hiện vào nảm 2011 trẽn 1500 bộnh nhãn, có
16.6% tre dưới 6 tuồi 27.4% bệnhnhântừ6 den 15 tuổi 27.7% số bệnhnhân từ 16 tới 30 tuổivả 28.8% người trên30 tuổis.
Trang 201.1.4.Các phương phàp sùng lọc nguy cư mang gen thalassemia
Các xẻt nghiệm sànglọc chưa chophépxác định một cách chinh xãcmột người cỏ mang gen bệnhthalassemiahay không mãchiphát thiên sớmnhững người cỏ nguy co cao mang gcn bệnh hoặc mắc bệnh Đêxác định chính xác có phailà mang genbệnh thalassemia hay không cằn phai có cácxét nghiệm đê xác định chân đoán.
-Tòngphàn tích tểbàomáu ngoại vi luôn lã xét nghiệm đầu taydược sử dụng đê sàng lọc thalassemia Đấu hiệu gợi ý người lành manggen bệnh là tinh trạng thiều máu hồng cầu nhó nhược sằc MCV và MCH giâm là 2 ngưỡngchi số dượcTỏ chức YtếThếgiới (WHO) vã hộiThalassemiaquốc tể (TIF) khuyên cáo sư dụng 10 Bên cạnh đỏ nhiều quốc gia và Việt Nam cùng dùng chi số MCV và MCH đê sàng lọc.TheokhuyểncãocùaBộYTố nảm 2020 nếu MCV<85 ÍL hoặc MCH < 28 pg bước tiếp theo là diện di hemoglobin xác định loại hemoglobin trong hồngcầu 10.Tẩtcabệnhnhân [> thalassemia từ thề nhọ den nặng đều có MCV MCH giam nên dâylà 2 chi số rắt hữu hiộu dê phát hiện bệnh, tuy nhiên dối với trường hợp u-thalassemia the ẩn (cln mất 1 gen ơ) cóMCVvàMCHbìnhthường thi cõ the bị bósót.
- Cãc xét nghiệm về sảt trong huyết thanh: Trong bệnh thalassemia, lượng sẳt trong máu.dộ bào hóasầt và Ferritin huyết thanhđều tângdo tinh trạng ứsắt trong cơ thê.Cãc chi sổ này dược sư dụng dê phân biệt với tinh trạng tlũcu mâu thiếu sắt cùng cỏ MCV vã MCI I thấp nhưng lọi có Fe vã Ferritin đềugiâm.
-Điện di hemoglobin
Người inning thành binh thường trong mâu cỏ HbA chiếm 96.5-98.5% HbA2 chiêm 0.5-3.5%và HbF chiếm khoang 0.5% 10 Điện di hemoglobin hoặc cảcphươngpháp khác nhưsấckỹ long hiệu nâng cao(1IPLC) có giã trị định hướngthêbệnh de thựchiệncácxét nghiệm di truyền phântưpháthiện
Trang 21dụtbiến trên gen alpha hay beta Đặcbiệt nếu trong mâuxuấthiệncãc Hb bất thưởngnhưHbH.HbBart's, HbCs,HbQs thi cógiátrị định hưởngrấtcao.
Xétnghiệm di truyền phân tư giúp chi ra chinh xác vị tri đột biến trẽn 2
gen HbA vàHbB cùng như chấn đoán chinh xác the bệnh Vi vậyđâyđược coi là xét nghiệmcuốicùng nhầm chân đoản bệnh thalassemia Ngàynay trên thể giới có rất nhiều các kĩ thuật khác nhau nhằm phát hiện dột biến gen globin, dasốlà dựatrênphan ứng PCR Các phương pháp hay dùng ơ Việt Nam gồtn cô: multiplex gap-PCR ARSM-PCR MLPA giai trình gen phươngpháplai ngược (reverse hybridization)
1.2 ủng đụngtrì tuệ nhântạotrongsànglọc nguyCO'manggen thalassemia Ngày nay.tri tuệnhãn tạo đà không còn quá xa lạ với con người khi nó dã được ứngdụng trong hầu hết mọi lĩnh vựctrẽn thếgiới Trong lĩnh vụcy tể trituệnhântạothườngdược ứngdụng dê xâydựngcáchộthốnghỗtrợra quyết dinh lâm sàng (clinical decision support system) Các hộ thống cỏ nhiệm vụhồtrợcác bác sĩ hoậc nhânviênytề trong việc raquyểt dịnh làm sàng giúp nângcao chất lượng cóngtãcchăm sóc sức khoebàngviệc dưa ra các thông tin tham kháo cho bác sĩ dựa trẽn nhùng tri thức được học từ chuyêngia hoặc dựa trêncácdừliệu trong quákhứ.
Trên thegiới, các hệ thốnghòtrợra quyct định lãmsàng dã đượcnghiên cứu phát triển từ những năm 1970, vi dụ như các hộ thống MYCIN INTERNIST-1 và CASNET Các hệthống hỗtrọ ra quyết định dã dược phát triểnvã ứng dụngvào thực liền trongnhiều lĩnhvực Cuay tề như chân đoán bệnh, xây dựng phác dỗ diều trị, chế tạo thuốc, theo dỏi và châm sóc bệnh nhân Các hệthốngnày dà được áp dụng trên nhiều cơsớtrênthểgiới.
Trongnhữngnăm gan đây việc phát triền, ứngdụngcáchộ thống hổtrợ ra quyết định lâmsàngngày càng dượcđẩymạnh.Có nhiều nguyên nhândẫn
Trang 22den sự phát triển nảy dó lã sự phát triển cua phần cứng dản tới khá núng tinh toán tăng len rút ngán thời gian thu thập và xứ lý dừ liệu; khối lượngdừliệu liên quanđen y tế thu thập từcác thict bị y te và thiết bị cá nhân ngày càng lảng; sự phát triển cua cáccơsỡdử liệugen;các hệthốngquàn lỷ hồ sơ bệnh án điện tư ngày càng phô biến; sự phát triền cứa các kì thuật tri tuệ nhân tạo tiên tiên có độ chính xác cao (nhưcác phương pháp hục sâu) trong các lĩnh vực thị giác máytinhvàxử lý ngôn ngữ tự nhiên giúp nângcaođộ chinh xác cùa cáchộthốngtrituệnhântạo.
Cóthê chia cáchệthonghồ trợ raquyết định làm sàng lãm 2 loại là các hệ thống dựa trên tri thức chuyên gia và các hộ thống không dựa trên tri thức chuyêngia.Sựkhácnhau cơ bán cua hailoại hệ thốngnày là mộtloại dựa trên cơ sơ trithứcdượcthuthập từ kiếnthứccùacác chuyên gia(còndược gọi lảhệ chuyêngia), côn mộtloại dựa trẽn việcmáy tinh khai phá tri thức tử dừliệuy te thông qua một dạng cua tri tuệ nhân tạo là các phương pháphọc máy.
Các hộ tri thức chuyên gia là một nhánh cua trituệnhãn tạo sư dụngcác tri thứcchuyên gia de giãi quyết vấn đề ° Chuyên gia lã những người có Iri thức hoặc các kì năng đặc biệt về một hoặc một sốvan đề nhất định Thông thườngcáchệ chuyên gia bao gồm ba thành phầnchinh:
- Cơ sờ tri thức (knowledge base) -Bộmáysuyluận (inference engine) -Giaodiệnngườidùng (I linh 1.3).
Cơ sờtri thứclàmột tậphợpcác thòng tin trong đómỗi thông tin dược Cấu trúc dưới dạng luật IF-THEN Vi dụ trong một hệ thống VC tương tác thuốc, một luật có the ơ dạng IF uống thuốc X vã IF uống thuốc Y THEN canh báo người dũng Trong các hộtrithứcchuyên gia người dũngnhậpvào thông tin cua bệnh nhân, sau dóbộmáysuyluận kết hợpcác luật trong cơsơ tri thứcvớidừ liệucũa bệnh nhân đê đưa racác kết luận Người dùng có the
Trang 23nhậpdửliệu cua bệnhnhãnmột cách thủ công, nhưng dối vớibệnhviện có hộ thống bệnh ándiện tư thi dừ liệu cùa bệnh nhãn cóthê dược cung cấp trực tiếp tữ các hộthốngquan lý bệnh ãn diện tư Giaodiện ngườidùng cho phép nhập dữ liệu cùa bệnh nhân vã sau đỏ hệ thống hiển thị kết qua lá cãc chấn doán bệnh hoặc cách diều tộ dược thông báo tới người dùng dirới dụngcác khuyến nghị hoặc canhbáo Trong một số trường họp các cánh báo có thê dược gưi tự dộng qua email hoặc gưi tin nhan Hệ thống cỏ giao diện đê chuyêngiacóthêđưacáctrithức dưới dụng luật vào cơ sờ tri thức.
TntM chiMngM
ĩỉình 1.3 Kiền trúc cưbáncuamột hệchuyên gìn
Trong phan mèmsàng lọc trước sinh thalassemia,hộ tri thứcchuyên gia được xây dựng từ cơ sờ tri thứcvềtầm soát trước sinh chứa các tập luậtdưới dạng IF-THEN dựa trên kêt qua xét nghiệm sinh hóa (công thức màu sất ferritin huyết thanhvà phân tich thành phần huyết sẳc tố) Trong tông phân tích tề bào máu cua thai phụhoặc chồng thai phụ thi cần sư dụngcác chi sổ bao gồm: MCV.MCH HGB, đếđánh giá trinh trạng thicu máu hồng cầu nho nhược sảc Chi sổ sât ferritin dê đành giá tinh trụng ứ sải trong cơ the Điện di Hb giúp phân tích thành phần Hbvà phát hiện các Hb bất thường trong màu Các chuyên giasècung cắp cho máy tri thức ve sự kết hợp giừa các chi sổ trẽn là phan ánh nguy cơ cao hay thấp mắc thalassemia cua thai phụ chồng thai phụ vàthai nhi từ dómáycóthê đưa ra kết luận khi nhậpdữ liệumới lữ bệnh nhânthựcte.
Trang 24Khác với hộ tri thức chuyên gia các hộ thống hục máy không sư (lụng cáctri thứccũacác chuyên gia mà ãp dụngcácphươngpháp học máytrêndừ liệuyhục Học máy có thehiếu là quá trinh mà một hệ thống tự "học”từcãc kinh nghiệm trong quá khứ và chuyên các“bài học" dóthànhtri thức cua nó thay visứ dụng những cơ sơ tri thứcđượcxâydựng lừ trước haycác hướng dẫn cụ thê Một địnhnghĩa cùa hục máydược trích dần phô biên trong cộng đồng khoa học do Tom M Mitchell dưa ra 14 như sau: "Một chương trình máy tính đượccoi là học từ kinhnghiệm E dối với lớpnhiệmvụ 7' và độdo hiệu nângp nếu hiệu nâng cua chương trinh do bang dộdop khi thực hiện lớpnhiệmvụ T trờnên tốt honsaukhitráiquakinh nghiệm E" Dèhoạt động dược thi các hộ thống sư dụng học máy cần dược huấn luyện Nói một cách đơn gián, họcmáy lã mộtlĩnhvựcthuộc ngành Khoahọcmáy tính, nó có khá nâng tự học hói dựa trêndừ liệu đưa vào mà không cần phaiđượclập trinh cụ thê'\
Dựa trên phương thức học các thuật toán cùa học máy có thêphànchia thành 4 nhõm: Hục máy có giám sát (supervised learning), hục máy không giám sát (unsupervised learning), hục máy bán giám sát (scmí-supervised learning) vã họccungcổ (reinforcement learning) Hệ thống hỗtrợ lâm sáng sư dụng chu yếu là các phương pháp học máy cỏ giám sát (supervised learning).Cơ chếcua thuật toán nãy lả ban dầu chúng ta huấn luyệnchomảy bangcáchcung cấp cáctậpdừliệu gọilả "training data" gồm cácdừliệudầu vào (data) và đau ra(label)mongmuốn, sau dónhiệmvụcua thuật toán látìm mối liênquangiữadầuvảovã đầu ra đẻ xâydựng mô hình toánhọc, lừ đỏdự đoándầu ra cho các trường hợpđẩuvàomới.
Trang 25NhlndữKuDử neuhuín luyện
Thu# toến hoc mây
Dữltệumờ* * MÓNnhdựdoỉn * Két qui dự đoan
Hình 1.4 Kiền trúc cơ hùn cùa các phương pháphọcmáy có giámsát
Các phương pháp học máy có giám sát được sư dụng phò biến trong cảc bãi toán trong lình vực y te là support vector machine (SVM), mạng noTon nhàn tạo,hổiquylogistic (logistic regression), cây quyết định (decision tree), randomforest Naive Bayes n.
Báng 1.1 So sánh im, nhược diemClia phần mềm hộtri thứcchuyên gìn vãphần mềm học máy.
Hệ tri thứcchuyêngia Họcmáy
ƯU diêm
-Dựa vào tri thứccuachuyên gia nên các chân đoánđềucó cơ sớ yhọc
-(ỉiai thích dược lý do dưa ra kết qua
-Học từ sỏ lượng lớn các dừ liệu dâu vào => Học được câc quy luật sát với dữ liệu
-Không giái thích dược tại sao lụi dưa ra kết qua đó > "hộp đen”
Trang 26ĐÓITƯỢNG VÀ PHƯƠNGPHÁP NGHIỀNcứt
2.1 Dốitượng nghiên cứu
Các cặp vợ chồng thai phụ đến khám sàng lọc truck sinh bệnh thalassemiatụi Bệnh viện Phụ san Trungương.
2.J.I.Tiên chIIấnlụnchọn
Thai phụ và chồng cỏ kct quả xét nghiệm tông phân tích te bào máu ngoại vi hoặc cỏ tiền sư liênquan đền thalassemia gồm: tiền sứ sinh con mắc thalassemia, tiền sư phú thai vã tiền sứ trong gia đinh có người mắc thalassemia, đồngthời có kếtquaxétnghiệmđộtbien gen thalassemia.
2.1.2 Tiên ch nấnloạitrừ
Thaiphụ hoặc chồng cõ các bệnh li làm anh hướng đến cãcchi số huyết hục: ung thư.viêmnhiễmmạntinh,các bệnli VC thận, bệnh lí huyết họckhác, các bệnh truyền nhiêm như lao HIV AIDS, hoặc viêm nội tàm mạc bệnh viêm khớp dạng thấp, bệnh CTohn.
2.2 Địa điềm và thời giau nghiên cứu
-Địa điểm nghiên cứu:Bệnhviện Phụ Sân Trung Ương -Thời gian: từ thăng10 năm2022 đến tháng 6năm2023 2.3 Cô- mẫu nghiên cứu
- Cờ mầu:
Độ nhạy tối thiều mong muốn cùaphần mem lã Pk=0.95 Độ dặc hiệu tổi thiêu mong muốn của phần mềm làp,p=0.95.
TP EN.TN.FP lần lượtlà sổ dương tinh thật,âmtínhgia.âm tính thật và dương tinh giá.
TP + F'N = ÍííIùíỉỉL/ùí!
tứ*TN+ FP = £Lí£íe2Ị12ĩììi>
Trang 27Cô mầu đế dành giá độnhạy tinh theocõngthức:
N1 làcỡmẫu nghiên cứu de đảnh giá dộnhạy N? lá cừ mầu nghiên cửudêdánhgiádộdậchiệu.
a lả sailầmloạiI Với khoang tin cậy là 95%.ta cỏ a= 0.05 Như vậy Z(llà 1.96.
0) lả chi số dao độngcuađộnhạy vã dộdậc hiệu o^O.L
Pu lã xác suất dương tinhthật (hay độ nhụy) tồi thiêu Ta có p.e 0.95 pvlá xác suất âmtinh thật (hay độđặchiệu) tối thiếu Ta có p,?=0.95 p lã tỷ lộ mang gen bệnh thalassemia, ớ Việt Nam ướctinh có khoang 13%
Ảp dụngkỉ thuật chọn mầu thuận tiện: chọn tầt caphụnữ mang thai đền khám thai và lãmsànglọc trước sinhtạibệnhviện Phụ Sàn Trung Ương 2.4 Phương pháp nghiên cứu
Nghiêncứu mỏ tácẩtngang.
Trang 282.5 Quytrinlinghiên cứu
2.5.1 Sơ đồ quy trình nghiên cừu
Sơ đồ 2.1.ộuy trinh nghiên ctru
Trang 292.5.2 Các hước tiềnhànhnghiêncứu
Rước ỉ: Thu thập thòng tin bệnhnhân và nhậpdữliệu vàophần mềm nhậplicit
Thông tin đượcthuthậptừcácbệnháncuacácbệnh nhân đến khám tại bệnh viện Phụ san Trung ương thỏa màn các tiêu chuân lựa chụn vã tiêu chuàn loạitrừ bao gồm:
- Dữ liệu đầu vào:
+ Cácthông tin chung baogồm:hụ vã tên tuỏi giớitinh, dân tộc + Các chi sổ côngthứcmáu
+ Các chi số sắt huyết thanh và ferritin huyết thanh nếucỏ + Các chi số diện di hemoglobin nếucó
+ Tiền sứbân thân, tiền sư thaisăn.tiền sứ gia dinh liênquanđềnbệnh thalassemia
- kềl qua xét nghiệm gcn tim dột biến gen thalassemia bao gồm các trườnghợp:
+ Có mang đột biểngenalpha-thalassemia • »■ Có mang dột biếngeti beta thalassemia + Khôngmang đột biềngentlialassemia
Rưừc 2: Làm sạch sồliệu:
Băng cáccáchlàm sạch như:lục kiếmtra sưa lỗi
fíườc 3:Phântich bộdừ liệu dầuvàoblingphần mềm học máy và thu thập bộdừhệudầu ra baogồm:
• Nguy cơ cao mang gen thalassemia: xác suất dự bãongười mang gen trên 50%
- Nguy cơthắp mang gen thalassemia: xácsuất dự báo người mang gen dưới 50%
Trang 30Rước 4: Phân tichbộ dữ ìiỳu dầuvào bẵng phần mềm hộtrithứcchuyêngia và thu thập bộdữ Ilợn dầu rabaogồm:
-Độc diêm huyết học cùa dổi lượng nghiên cửu - Nguy cơ cao mang gen thalassemia
- Nguy cơthấp mang genthalassemia -Gợi ý thếbệnhthalassemia
fíưàc 5: So sành dừ lieu dầu ra VÔI kềt qua.xétnghiệmgencùa dồi tượngtighten cừu dê dành giả /liêuquà cùa phần mềm hục mâyvà phần mềm hý trtthứcchuyêngia dồng thờiso sành hai phần mềm VỚInhau.
Kct quá gân nhăn Kết luậncùa
hệ thống
Nguy cơ cao True positive (TP) False positive (FP) Nguy cơ thấp False negative (FN) True negative(TN) Đêdãnh giá giá trị cua phần mein cần dựaváocác chi số bao gốm:
- Giã trịdựbáo dương tinh = Tp Fp
- Giã trịdựbáoảmtinh - -7-7—
TN+FN
Trang 312.5.3 Cácbiển số vàchì số nghiên cứu:
Háng 2.1 Các bicn số rà chi sổ sứ (tụng trong nghiên cừu
Tênbiên Loại bicn DỊnh nghĩa/ Chi sổ Thiểu ináu Dịnh lượng Tinh trạng sắt Địnhlượng Thiếu sât: Ferritin <15 ng/inl
Không thiều sát: Ferritin >= 15 ng/ml Mang gen
thalassemia Định tính
Kếtquaxétnghiệmgen tim thấy dột biến trẽn genHBA và/hoộc HBB(trừ đột biến gâybệnhHbE)
Không mang gen Địnhtinh
Kềt qua xẽt nghiệm gen không tim thấy bất ki đột biến trên gen HBA và/hoặc
HBB(trừdộtbiển gây bệnhHbE)
- Tiền sư binh thưòng
- Viền sư sinh con mactlialassemia - Tiền sửphùthai
- Tiền sư gia dinh có người mang gen thalassemia.
Trang 322.5.4 Phân tích và xứlý sổ liệu
- Các thôngtinsau khi được thu thậpđượcnhập vàophần mềm nhập liệu - Phân tích số liệu bang phần mềmthống kê y học theo chương trinh SPSS 16.0 và stata.
- Số liệuđược trinh bây.sắpxếptheocácbiếnsốnghiên cửu đặtratrong nội dung phương phápnghiêncứu.
-MứcP-value<0.05dượccoi là có ỷnghĩathốngké.
- Độ chính xác.độđặc hiệu, dộnhụy,giátrịdự báo dương tinh, giá trịdự báo âm tính dùng dê đánh giá độchính xác cùatừng phàn meinso với tiêu chuẩn vãng.
2.6.Vấn đề dạođức nghiên cứu
- Trước khi tiến hành nghiên cứu, cácdổitượngnghiêncửuđượcnghe thòng báo VC mục dich nghiên cửu quyền lợi và trách nhiệmkhi tham gia nghiên cứu.
- Các thòng tin liênquantớiđốitượngnghiêncứuđược giừ bi mật chi phụcvụ cho mụcđichnghiêncứu.
- Cáctrường hợp mang da hình gen được giai thíchvà lư vấn biệnpháp phông bệnh và can thiệp thích hợp.
- Đãdược thòng qua tại Bệnh viện Phụ sân Trung ương.