xây dựng mô hình học máy dự đoán vi khuẩn đề kháng sinh và hỗ trợ lựa chọn kháng sinh kinh nghiệm ban đầu trong điều trị nhiễm khuẩn

65 0 0
Tài liệu đã được kiểm tra trùng lặp
xây dựng mô hình học máy dự đoán vi khuẩn đề kháng sinh và hỗ trợ lựa chọn kháng sinh kinh nghiệm ban đầu trong điều trị nhiễm khuẩn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINHCHƯƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞBÁO CÁO TỔNG HỢPKẾT QUẢ NHIỆM VỤ NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆXÂY DỰNG MÔ HÌNH HỌC MÁY DỰ ĐOÁNVI KHUẨN

Trang 1

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

CHƯƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ

BÁO CÁO TỔNG HỢP

KẾT QUẢ ĐỀ TÀI NGHIÊN CỨU KHOA HỌC

XÂY DỰNG MÔ HÌNH HỌC MÁY DỰ ĐOÁN

VI KHUẨN ĐỀ KHÁNG KHÁNG SINH VÀ HỖ TRỢ LỰA CHỌNKHÁNG SINH KINH NGHIỆM BAN ĐẦU

TRONG ĐIỀU TRỊ NHIỄM KHUẨN

Cơ quan chủ trì nhiệm vụ: Khoa Dược - Đại học Y Dược TP.HCMChủ trì nhiệm vụ: TS Nguyễn Quốc Hoà

GS TS Sun-Yuan Hsieh (NCKU)

Thành phố Hồ Chí Minh - 2023

Trang 2

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

CHƯƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ

BÁO CÁO TỔNG HỢP

KẾT QUẢ NHIỆM VỤ NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ

XÂY DỰNG MÔ HÌNH HỌC MÁY DỰ ĐOÁN

VI KHUẨN ĐỀ KHÁNG KHÁNG SINH VÀ HỖ TRỢ LỰA CHỌNKHÁNG SINH KINH NGHIỆM BAN ĐẦU

TRONG ĐIỀU TRỊ NHIỄM KHUẨN

(Đã chỉnh sửa theo kết luận của Hội đồng nghiệm thu ngày…./…./….)

Cơ quan chủ quản(ký tên và đóng dấu)

Chủ trì nhiệm vụ(ký tên)

Nguyễn Quốc Hoà

Cơ quan chủ trì nhiệm vụ(ký tên và đóng dấu)

Trang 3

CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAMĐộc lập - Tự do - Hạnh phúc

TP Hồ Chí Minh, ngày tháng năm 2023BÁO CÁO THỐNG KÊ

KẾT QUẢ THỰC HIỆN ĐỀ TÀI NGHIÊN CỨU KHOA HỌCI THÔNG TIN CHUNG

1 Tên đề tài: Xây dựng mô hình học máy dự đoán vi khuẩn đề kháng khángsinh và hỗ trợ lựa chọn kháng sinh kinh nghiệm ban đầu trong điều trị nhiễmkhuẩn

Thuộc lĩnh vực (tên lĩnh vực): Y dược

2 Chủ nhiệm nhiệm vụ:

Họ và tên: Nguyễn Quốc Hoà

Ngày, tháng, năm sinh: 14/04/1990 Nam/ Nữ: NamHọc hàm, học vị: Tiến sĩ

Chức danh khoa học: Chức vụ: Giảng viênĐiện thoại: Tổ chức: Nhà riêng: Mobile: 0931139815Fax: E-mail: nqhoa@ump.edu.vn

Tên tổ chức đang công tác: Khoa Dược, Đại học Y Dược TPHCMĐịa chỉ tổ chức: 41 Đinh Tiên Hoàng, P Bến Nghé, Quận 1, TPHCM

Địa chỉ nhà riêng: 3 Tổ chức chủ trì nhiệm vụ(1):

Tên tổ chức chủ trì nhiệm vụ: Khoa Dược, Đại học Y Dược TPHCM

1

Trang 4

Điện thoại: (+84-28) 3829 5641 - (+84-28) 3829 8233Fax: (+84-28) 3822 5435

E-mail: Website: https://pharm.ump.edu.vn/

Địa chỉ: 41 Đinh Tiên Hoàng, P Bến Nghé, Quận 1, TPHCM

4 Tên cơ quan chủ quản đề tài: Đại học Y Dược thành phố Hồ Chí Minh

II TÌNH HÌNH THỰC HIỆN1 Thời gian thực hiện nhiệm vụ:

- Theo Hợp đồng đã ký kết: từ tháng 05 năm 2021 đến tháng 10 năm 2022- Thực tế thực hiện: từ tháng 06 năm 2021 đến tháng 10 năm 2023

- Được gia hạn (nếu có): Từ tháng 10 năm 2022 đến tháng 06 năm 20232 Kinh phí và sử dụng kinh phí:

a) Tổng số kinh phí thực hiện: 92 tr.đ, trong đó:

+ Kính phí hỗ trợ từ ngân sách khoa học của nhà trường: 92 tr.đ+ Kinh phí từ các nguồn khác: không

b) Tình hình cấp và sử dụng kinh phí từ nguồn ngân sách khoa học:

Theo kế hoạch Thực tế đạt được Ghi chú(Số đề nghịquyết toán -

tr.đ)Thời gian

Kinh phí(Tr.đ)

Thời gian(Tháng, năm)

Kinh phí(Tr.đ)

1 06/2023

05/2021-92 10/2023

2

Trang 5

c) Kết quả sử dụng kinh phí theo các khoản chi:

Đơn vị tính: Triệu đồngSố

Nội dungcác khoản chi

Theo kế hoạch Thực tế đạt đượcTổng NSKH Nguồn

Tổng NSKH Nguồnkhác1 Trả công lao động

(khoa học, phổthông)

80,88 80,88 0 80,88 80,88 0

2 Nguyên, vật liệu,năng lượng

3 Thiết bị, máy móc4 Xây dựng, sửa

Tên tổ chứcđăng ký theoThuyết minh

Tên tổ chức đãtham gia thực

Nội dungtham giachủ yếu

Sản phẩmchủ yếuđạt được

- Lý do thay đổi (nếu có):

4 Cá nhân tham gia thực hiện nhiệm vụ:

Trang 6

(Người tham gia thực hiện đề tài thuộc tổ chức chủ trì và cơ quan phối hợp theosố lượng đã được phê duyệt tại Thuyết minh đề tài)

Tên cá nhânđăng ký theoThuyết minh

Tên cá nhânđã tham giathực hiện

Nội dungtham gia

Sản phẩmchủ yếu đạt

Ghichú*1 TS Nguyễn

Quốc Hòa

Nguyễn QuốcHòa

Viết đề cương,xây dựng mụctiêu và phươngpháp nghiên cứu,giám sát và góp ýcác bước thựchiện, hoàn thiệnbáo cáo đề tài.

Hai mô hìnhhọc máy dựđoán, bản thảođể nộp đăngbáo

2 PGS TS ĐặngNguyễn ĐoanTrang

Đặng NguyễnĐoan Trang

Viết đề cương,xây dựng mụctiêu và phươngpháp nghiên cứu,giám sát và góp ýcác bước thựchiện, hoàn thiệnbáo cáo đề tài.

Hai mô hìnhhọc máy dựđoán, bản thảođể nộp đăngbáo

3 PGS TS NguyễnNgọc Khôi

Nguyễn NgọcKhôi

Viết đề cương,xây dựng mụctiêu và phươngpháp nghiên cứu,giám sát và góp ýcác bước thựchiện, hoàn thiệnbáo cáo đề tài.

Hai mô hìnhhọc máy dựđoán, bản thảođể nộp đăngbáo

Trang 7

4 GS TS Yuan Hsieh

Sun-Sun-Yuan HsiehViết đề cương,xây dựng mụctiêu và phươngpháp nghiên cứu,giám sát và góp ýcác bước thựchiện, hoàn thiệnbáo cáo đề tài.

Hai mô hìnhhọc máy dựđoán, bản thảođể nộp đăngbáo

5 DS Trần HoàngTiên

Trần Hoàng TiênTham gia viết đề

phương phápnghiên cứu, xâydựng mô hìnhhọc máy, viếtbáo cáo đề tài

Hai mô hìnhhọc máy dựđoán, bản thảođể nộp đăngbáo

ThS NguyễnMinh Hà

Nguyễn Minh Hà Tham gia viết đề

phương phápnghiên cứu, xâydựng mô hìnhhọc máy, viếtbáo cáo đề tài

Hai mô hìnhhọc máy dựđoán, bản thảođể nộp đăngbáo

DS Vũ Thị LanNhi

Vũ Thị Lan Nhi Tham gia viết đề

phương phápnghiên cứu, xâydựng mô hìnhhọc máy, viếtbáo cáo đề tài

Hai mô hìnhhọc máy dựđoán, bản thảođể nộp đăngbáo

- Lý do thay đổi ( nếu có):

Trang 8

5 Tình hình hợp tác quốc tế:

Theo kế hoạch(Nội dung, thời gian, kinh

phí, địa điểm, tên tổ chứchợp tác, số đoàn, số lượng

người tham gia )

Thực tế đạt được(Nội dung, thời gian, kinhphí, địa điểm, tên tổ chứchợp tác, số đoàn, số lượng

người tham gia )

- Lý do thay đổi (nếu có):

6 Tình hình tổ chức hội thảo, hội nghị:Số

Theo kế hoạch(Nội dung, thời gian, kinh

phí, địa điểm )

Thực tế đạt được(Nội dung, thời gian,kinh phí, địa điểm )

Ghi chú*

- Lý do thay đổi (nếu có):

7 Tóm tắt các nội dung, công việc chủ yếu:

(Nêu tại mục Tiến độ thực hiện của đề cương, không bao gồm: Hội thảo khoahọc, điều tra khảo sát trong nước và nước ngoài)

Các nội dung, công việcchủ yếu

(Các mốc đánh giá chủ yếu)

Thời gian(Bắt đầu, kết thúc

- tháng … năm)

Người,cơ quanthực hiện

Trang 9

Theo kếhoạch

Thực tếđạt được1 Thu thập và làm sạch dữ liệu1/5/2021 –

1/5/2021 –31/7/2021

Khoa Dược,ĐH Y Dược

2 Xây dựng mô hình học máy dựđoán tên vi khuẩn gây bệnh

1/8/2021 –15/9/2021

1/8/2021 –15/9/2022

Khoa Dược,ĐH Y Dược

3 Xây dựng mô hình học máy dựđoán khả năng đề kháng

15/8/2021 –30/9/2021

15/8/2021 –30/9/2022

Khoa Dược,ĐH Y Dược

4 Báo cáo kết quả nghiên cứu15/8/2021 –31/10/2022

01/9/2022 –31/8/2023

Khoa Dược,ĐH Y Dược

- Lý do thay đổi (nếu có): thời gian nghiên cứu bị chậm trễ do ảnh hưởng củadịch COVID-19, thời gian bình duyệt trên tạp chí quốc tế được thông báo cóthể chậm trễ hơn do số lượng bài cần bình duyệt tồn đọng vì ảnh hưởng củadịch COVID-19.

III SẢN PHẨM KH&CN CỦA ĐỀ TÀI1 Sản phẩm KH&CN đã tạo ra:

a) Sản phẩm Dạng I:

Tên sản phẩm vàchỉ tiêu chất lượng

chủ yếu

vị đo Số lượng

Theo kếhoạch

Thực tếđạt được1

- Lý do thay đổi (nếu có):b) Sản phẩm Dạng II:

Trang 10

Thực tếđạt được1

- Lý do thay đổi (nếu có):

xuất bản)Theo

kế hoạch

Thực tếđạt được

thuận đăng bài

Chưa được chấpthuận đăng bài

- Lý do thay đổi (nếu có):d) Kết quả đào tạo:

Cấp đào tạo, Chuyênngành đào tạo

(Thời giankết thúc)Theo kế

Thực tế đạtđược

- Lý do thay đổi (nếu có):

đ) Tình hình đăng ký bảo hộ quyền sở hữu công nghiệp:

Trang 11

TT đăng ký Theokế hoạch

Thực tếđạt được

(Thời giankết thúc)1

- Lý do thay đổi (nếu có):

e) Thống kê danh mục sản phẩm KHCN đã được ứng dụng vào thực tế

Tên kết quả

đã được ứng dụng Thời gian

Địa điểm(Ghi rõ tên, địa

chỉ nơi ứngdụng)

Kết quảsơ bộ

2 Đánh giá về hiệu quả do đề tài mang lại:a) Hiệu quả về khoa học và công nghệ:

Nghiên cứu cho thấy tính khả thi trong việc xây dựng mô hình học máy dự đoán nhóm vikhuẩn và khả năng đề kháng kháng sinh của vi khuẩn.

b) Hiệu quả về kinh tế xã hội:

Tăng cường hiệu quả giảng dạy, nâng cao chất lượng thực hành lâm sàng3 Tình hình thực hiện chế độ báo cáo, kiểm tra của đề tài:

Thời gianthực hiện

Ghi chú

(Tóm tắt kết quả, kết luậnchính, người chủ trì…)

Trang 12

I Báo cáo tiến độ 10/2023 Tóm tắt kết quả đề tài, dựkiến các công việc cầnhoàn thành

Chủ nhiệm đề tài

(Họ tên, chữ ký)

Thủ trưởng tổ chức chủ trì(Họ tên, chữ ký và đóng dấu)

Trang 13

1.2.2 Co sở cho giải pháp tiềm năng 3

1.3 ỨNG DỤNG MÔ HÌNH HỌC MÁY TRONG HỖ TRỢ LỰA CHỌNKHÁNG SINH KINH NGHIỆM 4

1.3.1 Ứng dụng học máy trong dự đoán kháng sinh hiệu quả 4

1.3.2 Công cụ xây dựng mô hình học máy 5

1.3.3 Điểm hạn chế của nghiên cứu liên quan 5

CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 7

2.1 ĐỊA ĐIỂM NGHIÊN CỨU 7

2.2 ĐỐI TƯỢNG NGHIÊN CỨU 7

2.2.1 Tiêu chuẩn chọn mẫu 7

2.2.2 Tiêu chuẩn loại trừ 7

2.3 PHƯƠNG PHÁP NGHIÊN CỨU 7

2.3.1 Cấu trúc mô hình ML 7

2.3.2 Các biến sử dụng trong mô hình ML 8

2.3.2.1 Cơ sở lựa chọn biến 8

2.3.2.2 Biến dự đoán và biến kết quả 8

2.3.3 Phương pháp làm sạch dữ liệu 12

Trang 14

2.3.3.1 Dự đoán nhóm vi khuẩn 12

2.3.3.2 Dự đoán khả năng đề kháng kháng sinh 13

2.3.4 Phương pháp phân tích số liệu 14

2.3.4.1 Dự đoán nhóm vi khuẩn 14

2.3.4.2 Dự đoán độ nhạy cảm với kháng sinh 15

2.4 Y ĐỨC VÀ BẢO MẬT THÔNG TIN 16

4.3 DỰ ĐOÁN KHẢ NĂNG ĐỀ KHÁNG KHÁNG SINH 30

4.4 HẠN CHẾ CỦA NGHIÊN CỨU 30

CHƯƠNG 5 KẾT LUẬN VÀ ĐỀ NGHỊ 32

5.1 KẾT LUẬN 32

5.2 ĐỀ NGHỊ 32

5.2.1 Ưu – nhược điểm của nghiên cứu 32

5.2.2 Hướng nghiên cứu 33

TÀI LIỆU THAM KHẢO 34

PHỤ LỤC 1

Phụ lục 1: Thông số chính trong xây dựng mô hình học máy 1

Phụ lục 2: Độ chính xác và giá trị F1 của 144 cấu trúc cây khả dĩ từ bốnnhóm vi khuẩn (nhóm 1 đến nhóm 4) 2

Phụ lục 3: Thuật toán học máy kết hợp kỹ thuật điều chỉnh mẫu áp dụngcho 5 nhóm vi khuẩn và 7 kháng sinh 4

Trang 15

Phụ lục 4: Đường cong ROC từ thuật toán học máy kết hợp kỹ thuật giảmmẫu áp dụng cho 5 nhóm vi khuẩn và 7 kháng sinh 7

Trang 16

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Tiếng Anh WHO World Health OrganizationTiếng Việt BVĐHYD

Bệnh viện Đại học Y Dược TP.HCM

Tiếng Anh AMR Antimicrobial resistanceTiếng Anh LMIC Low-middle income countryTiếng Anh MDR Multidrug resistance

Tiếng Anh LR Logistic RegressionTiếng Anh SVM Support Vector Machine

Tiếng Anh XGBoost eXtreme Gradient Boosting

Tiếng Anh AUROC Area under the receiver operatingcharacteristic

Trang 17

DANH MỤC BẢNG

Bảng 2.1 Định nghĩa biến sử dụng trong mô hình học máy 9Bảng 2.2 Phân chia tập huấn luyện và tập kiểm tra bằng phương pháp điềuchỉnh mẫu trong xây dựng mô hình dự đoán nhóm vi khuẩn 12Bảng 3.1 Đặc điểm của đối tượng nghiên cứu 17Bảng 3.2 Độ chính xác và giá trị F1 của các mô hình phân loại nhị phân cácnhóm vi khuẩn 19Bảng 3.3 Kết quả cấu trúc cây cuối cùng 3421:111 21Bảng 3.4 Đặc điểm mẫu vi sinh từ bảy loại kháng sinh khảo sát và năm nhómvi khuẩn 24Bảng 3.5 Thuật toán ML có giá trị AUROC lớn nhất 26

Trang 18

DANH MỤC HÌNH

Hình 2.1 Các cấu trúc cây khả dĩ với 4 nhóm vi khuẩn 15Hình 3.1 Mức độ nhạy cảm kháng thuốc của 5 nhóm vi khuẩn với 7 loại khángsinh 19Hình 3.2 Cấu trúc cây cuối cùng với độ chính xác cao nhất và điểm F1 sử dụngthuật toán XGBoost 21Hình 3.3 Tầm quan trọng của các yếu tố dự đoán trong bốn thuật toán XGBoostdự đoán 5 nhóm vi khuẩn 23Hình 3.4 Tầm quan trọng của các yếu tố dự đoán trong ba thuật toán có giá trịAUROC lớn nhất 27

Trang 19

ĐẶT VẤN ĐỀ

Theo Tổ chức Y tế Thế giới (WHO), vấn đề đề kháng kháng sinh hiện đang ởmức báo động và trở thành một vấn đề cấp bách của ngành y tế trên toàn thếgiới trong thập kỷ qua Trong đó, Việt Nam được WHO xếp vào danh sách cácnước có tỉ lệ đề kháng kháng sinh ở mức cao trên thế giới.

Việc điều trị bệnh nhiễm khuẩn thông thường được tiếp cận bằng cách sử dụngkháng sinh kinh nghiệm lúc ban đầu vì cần khoảng thời gian tối thiểu 48 giờmới có thể xác định tác nhân gây bệnh bằng cách xét nghiệm vi sinh Do đó,việc lựa chọn kháng sinh kinh nghiệm có thể chưa phù hợp với tác nhân gâybệnh chưa biết, khiến cho quá trình điều trị có thể kéo dài và làm tăng thời giannằm viện, thời gian sử dụng kháng sinh.

Hiện đã có nghiên cứu ở nước ngoài xây dựng mô hình giúp dự đoán vi khuẩnđề kháng kháng sinh trong bệnh lý nhiễm khuẩn nhằm hỗ trợ lựa chọn khángsinh kinh nghiệm ban đầu [1,2] Dù vậy, các mô hình này chủ yếu dựa trên cácthông tin cơ bản như tuổi, giới tính, mẫu bệnh phẩm, kết quả nhuộm Gram vàkháng sinh sử dụng để dự đoán khả năng đề kháng kháng sinh Bên cạnh đó,đặc điểm đề kháng kháng sinh tại Việt Nam có thể khác biệt so với nước mànghiên cứu xây dựng mô hình học máy được áp dụng (Hi Lạp) [1,2] Vì vậy,đề tài thực hiện với mục tiêu chính xây dựng mô hình học máy giúp dự đoán vikhuẩn đề kháng trong bệnh nhiễm khuẩn và hỗ trợ lựa chọn kháng sinh kinhnghiệm điều trị ban đầu tại bệnh viện Đại học Y Dược TP.HCM Các mục tiêucụ thể bao gồm:

+ Xây dựng mô hình học máy giúp dự đoán vi khuẩn gây bệnh dựa vào đặcđiểm của bệnh nhân và tình trạng bệnh.

+ Xây dựng mô hình học máy giúp dự đoán khả năng đề kháng của vi khuẩngây bệnh với các kháng sinh liên quan dựa vào đặc điểm của bệnh nhân, tìnhtrạng bệnh và tên vi khuẩn được dự đoán ở mô hình trước.

Trang 20

CHƯƠNG 1 TỔNG QUAN Y VĂN

1.1 ĐỀ KHÁNG KHÁNG SINH VÀ SỬ DỤNG KHÁNG SINH

1.1.1 Đề kháng kháng sinh

Theo Tổ chức Y tế Thế giới (WHO), vấn đề đề kháng kháng sinh (AMR) hiệnđang ở mức báo động và trở thành một vấn đề cấp bách của ngành y tế trên toànthế giới trong thập kỷ qua Ứớc tính có ít nhất 1,27 triệu ca tử vong mỗi nămdo AMR, cao hơn tỷ lệ tử vong do HIV/AIDS hoặc sốt rét trên toàn thế giới[3] Theo báo cáo của Tổ chức Y tế Thế giới (WHO), số ca tử vong ước tính doAMR sẽ vượt quá 10 triệu mỗi năm vào năm 2050 [4].

Ở các quốc gia có thu nhập thấp đến trung bình (LMIC), đã có báo cáo về tỷ lệAMR cao Việt Nam được WHO xếp vào danh sách các nước có tỉ lệ đề khángkháng sinh ở mức cao trên thế giới, đặc biệt là trực khuẩn Gram âm khángcarbapenem Nhiễm khuẩn bệnh viện do tác nhân đa kháng thuốc (multidrugresistance, MDR) có liên quan đến tỉ lệ tử vong cao và tăng chi phí điều trị[5,6].

1.1.2 Tình hình sử dụng kháng sinh

Một trong những yếu tố dẫn đến AMR đó là việc sử dụng kháng sinh khônghợp lý Tỉ lệ sử dụng kháng sinh không hợp lý được báo cáo lên đến 25% cáctrường hợp dẫn đến không những làm tăng nguy cơ bệnh nhân gặp các phảnứng có hại của thuốc mà còn góp phần phát triển đề kháng kháng sinh, tăng tỉlệ tử vong [7,8].

1.2 GIẢI PHÁP CẢI THIỆN TÌNH TRẠNG ĐỀ KHÁNG

1.2.1 Giải pháp thực tại

Giải pháp hiện nay để đối phó AMR liên quan đến việc phát triển các loạikháng sinh mới nhưng cần tốn nhiều thời gian và tốn kém chi phí Một giảipháp khác là thực hiện chương trình quản lý sử dụng kháng sinh, đây là một

Trang 21

chương trình phức tạp gồm nhiều bên liên quan, thúc đẩy việc kê đơn khángsinh phù hợp Theo Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh (CDC),cải thiện việc kê đơn kháng sinh thông qua chương trình quản lý kháng sinhlà hành động quan trọng nhất để chống lại AMR [9] Tuy nhiên, một trongnhững thách thức chính đối với tính phù hợp của việc sử dụng kháng sinh làkê đơn theo kinh nghiệm, trong đó kháng sinh được kê đơn trước khi biết rõmầm bệnh cụ thể và tính nhạy cảm cua mầm bệnh đó với kháng sinh Thựctiễn hiện nay cho thấy việc lựa chọn kháng sinh theo kinh nghiệm là dựa trêncơ sở tham khảo các khuyến cáo sử dụng kháng sinh của bệnh viện tại địaphương; các khuyến cáo này được xây dựng thông qua ý kiến chuyên gia tronglĩnh vực cũng như kết quả của phòng vi sinh tại cơ sở điều trị [10,11] Dù vậy,phương pháp này có thể bỏ qua những đặc điểm của bệnh nhân có thể hữu íchtrong việc gợi ý điều trị phù hợp.

1.2.2 Co sở cho giải pháp tiềm năng

Từ quan điểm lâm sàng, việc sàng lọc sớm đề kháng thuốc trước khi có kết quảđịnh danh và độ nhạy cảm giúp kịp thời thực hiện những hành động để kiểmsoát nhiễm khuẩn hiệu quả như dùng kháng sinh ban đầu phù hợp hay thực hiệnsớm việc cách ly người bệnh Các nghiên cứu về sử dụng kháng sinh cho thấynếu kháng sinh kinh nghiệm phù hợp được khởi trị càng sớm thì tử lệ tử vongcàng thấp, đặc biệt trong bệnh cảnh nhiễm khuẩn huyết hay sốc nhiễm khuẩn[12,13] Do đó, hiện tại, nhiều cơ sở y tế tập trung nỗ lực vào vấn đề phát hiệnsớm nhiễm khuẩn nặng, bao gồm ổ nhiễm khuẩn, tác nhân nghi ngờ và nhạycảm kháng sinh để lựa chọn sớm kháng sinh hiệu quả Tuy nhiên, cho đến nay,việc lựa chọn kháng sinh điều trị theo kinh nghiệm giai đoạn ban đầu chỉ dựatrên các hướng dẫn khuyến cáo thực hành lâm sàng và kinh nghiệm lâm sàngcủa bác sĩ điều trị Nhiều kỹ thuật sinh học phân tử hiện đại giúp phân loại kiểuđề kháng dựa trên giải trình tự bộ gen phức tạp, tốn kém và không phổ biến.

Trang 22

Tại Việt Nam, các phòng xét nghiệm vi sinh thường sử dụng phương pháp visinh truyền thống là nuôi cấy, định danh và làm kháng sinh đồ Mặc dù có sựcải tiến của quy trình xét nghiệm vi sinh nhưng trong đa số trường hợp vẫn cầnít nhất 24-48 giờ đến khi có kết quả nuôi cấy và tương tự 24-48 giờ cho kết quảđịnh danh vi khuẩn cũng như kháng sinh đồ để hướng dẫn dùng kháng sinhđiều trị trúng đích.

KHÁNG SINH KINH NGHIỆM

1.3.1 Ứng dụng học máy trong dự đoán kháng sinh hiệu quả

Những tiến bộ trong trí tuệ nhân tạo đã cải tiến kỹ thuật chăm sóc sức khỏe,góp phần cải thiện kết quả điều trị đồng thời giảm chi phí chăm sóc sức khỏe.Các kỹ thuật học máy (machine learning, ML) là một lĩnh vực của trí tuệ nhântạo, liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệthống “học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể một cách linhđộng mà không phải dựa trên mô hình toán học được thiết kế sẵn Học máyđược ứng dụng trong tạo lập một hệ thống sàng lọc hỗ trợ quyết định lâm sàngcủa bác sĩ điều trị bao gồm chỉ định kháng sinh kinh nghiệm.

Nhiều nghiên cứu đã báo cáo về việc sử dụng các phương pháp tiếp cận dựatrên dữ liệu để hỗ trợ trong việc đề nghị kháng sinh kinh nghiệm dựa trên cáthể [14–17] Những nghiên cứu này đã cho thấy việc lựa chọn kháng sinh đượctạo ra từ mô hình ML có giám sát có thể nâng cao hiệu quả của kháng sinh điềutrị đồng thời giảm mức độ ảnh hưởng của AMR [1,17–19] Các thuật toán họcmáy này sử dụng một lượng lớn dữ liệu bệnh nhân có trong hệ thống thông tinbệnh án của bệnh viện và phòng xét nghiệm vi sinh nhằm dự đoán đề khángkháng sinh dựa trên một số yếu tố như vị trí nhiễm khuẩn, loại mẫu cấy vi sinh,kết quả nhuộm Gram và thông tin nhạy cảm kháng sinh trước đó cũng như các

Trang 23

đặc điểm của người bệnh (độ tuổi, giới tính, cân nặng, chiều cao, chẩn đoán,bệnh đồng mắc) để dự đoán tính nhạy cảm với kháng sinh một cách tiết kiệmthời gian và chi phí.

1.3.2 Công cụ xây dựng mô hình học máy

Có nhiều công cụ hỗ trợ trong việc xây dựng các mô hình học máy Thôngthường, các công cụ thường dựa vào ngôn ngữ lập trình phổ biến có mã nguồnmở như R hay Python Công cụ Scikit-learn là một thư viện phần mềm họcmáy miễn phí dành cho ngôn ngữ lập trình Python Công cụ được thiết kếnhằm hỗ trợ người sử dụng không chuyên xây dựng các mô hình học máy,nhấn mạnh vào sự đơn giản hóa việc sử dụng, hiệu suất, câu lệnh cũng nhưtính nhất quán của giao diện ứng dụng lập trình Scikit-learn có thể hỗ trợ thiếtlập nhiều mô hình học máy, bao gồm các mô hình học máy giám sát và khônggiám sát, sử dụng giao diện nhất quán và hướng đến nhiệm vụ, do đó thuậntiện trong việc so sánh giữa các phương pháp khác nhau cùng cho một mụcđích Vì công cụ này dựa trên ngôn ngữ lập trình Python nên có thể dễ dàngđược tích hợp vào các ứng dụng nằm ngoài phạm vi phân tích dữ liệu thốngkê truyền thống [20].

1.3.3 Điểm hạn chế của nghiên cứu liên quan

Các nghiên cứu nước ngoài trước đây sử dụng các thông tin cơ bản như tuổi,giới tính, mẫu bệnh phẩm, kết quả nhuộm Gram và kháng sinh sử dụng đểdự đoán khả năng đề kháng kháng sinh Độ chính xác của các mô hình nàyvào khoảng 67,8-72,6% [1,2] Tuy nhiên, hầu hết các nghiên cứu này đượcthực hiện ở các nước có thu nhập cao, nơi tỷ lệ AMR thấp so với LMIC.Ngoài ra, một số yếu tố dự đoán kháng thuốc tiềm năng đối với thuật toánML đã được báo cáo trong các nghiên cứu trước đây, chẳng hạn như nhuộmGram, lại có thể không trích xuất được ỡ những nước LMIC Hơn nữa, cácnghiên cứu này cũng có một hoặc nhiều hạn chế sau: (a) Tập trung vào một

Trang 24

loại nhiễm khuẩn duy nhất, (b) Chỉ sử dụng 2 hoặc 3 mô hình ML có chọnlọc và (c) Sử dụng các công cụ dự đoán và phương pháp học máy tương tựnhau Ngoài ra, việc phát triển các thuật toán ML để dự đoán các tác nhângây bệnh ở những khu vực có tỷ lệ AMR kháng thuốc cao chưa được nghiêncứu nhiều; chất lượng của mỗi mô hình học máy phụ thuộc vào tính đại diệnvà chất lượng của dữ liệu.

Trang 25

CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1 ĐỊA ĐIỂM NGHIÊN CỨU

Nghiên cứu này được thực hiện nhằm mục đích phát triển các thuật toán MLđể hỗ trợ kê đơn kháng sinh theo kinh nghiệm dựa trên trích xuất dữ liệu hồsơ bệnh án điện tử của bệnh nhân nhập viện nghi ngờ nhiễm khuẩn tại Bệnhviện Đại học Y Dược Thành phố Hồ Chí Minh (BVĐHYD TPHCM) – mộtbệnh viện với quy mô 1.000 giường bệnh và điều trị 55.000 người bệnh nộitrú mỗi năm.

2.2 ĐỐI TƯỢNG NGHIÊN CỨU

2.2.1 Tiêu chuẩn chọn mẫu

Tất cả các kết quả xét nghiệm vi sinh và kháng sinh đồ từ 01/2017 đến 03/2021từ mẫu bệnh phẩm của bệnh nhân điều trị nội trú tại bệnh viện Đại học Y DượcTP.HCM.

2.2.2 Tiêu chuẩn loại trừ

Mẫu xét nghiệm thiếu một trong các thông tin sau: thông tin về đặc điểm bệnhnhân (giới tính, tuổi, chẩn đoán, bệnh kèm).

2.3 PHƯƠNG PHÁP NGHIÊN CỨU

2.3.1 Cấu trúc mô hình ML

Phương pháp ML được sử dụng để xây dựng:

+ Mô hình ML giúp dự đoán vi khuẩn gây bệnh dựa vào đặc điểm của bệnhnhân và tình trạng bệnh.

+ Mô hình ML giúp dự đoán khả năng đề kháng của vi khuẩn gây bệnh với cáckháng sinh liên quan dựa vào đặc điểm của bệnh nhân, tình trạng bệnh và tênvi khuẩn được dự đoán ở mô hình trước.

Một mô hình ML gồm có các đặc điểm sau:

Trang 26

1) Mô hình phân tích: cách thức để xây dựng một mô hình bằng các thuậttoàn thống kê (ví dụ: Logistic Regression, k-Nearest Neighbors,…).2) Biến dự đoán (predictor): một mô hình ML có thể có một hoặc nhiều

biến dự đoán Các biến này góp phần dự đoán kết quả cuối cùng từ môhình ML.

3) Biến kết quả (outcome): là kết quả thu được từ các biến dự đoán.

2.3.2 Các biến sử dụng trong mô hình ML

2.3.2.1 Cơ sở lựa chọn biến

Nhận thấy tình hình đề kháng kháng sinh ở Việt Nam có khác biệt so với nghiêncứu tại nước ngoài và một số yếu tố khác có thể giúp dự đoán vi khuẩn gâybệnh hoặc khả năng đề kháng (như tuần suất nhập viện, sử dụng kháng sinhtrước đó, chẩn đoán, bệnh kèm), nhóm nghiên cứu xây dựng mô hình học máyphù hợp với tình hình ở Việt Nam, có sử dụng thêm các yếu tố dự đoán khácnhằm cải thiện độ chính xác của mô hình.

Độ tin cậy của mô hình ML phụ thuộc vào số lượng quan sát của mỗi loại giátrị có trong một biến dự đoán/ kết quả Vì vậy, để tăng tính khả thi trong việcxây dựng và phát triển thuật toán ML, vi khuẩn phân lập từ mẫu bệnh phẩmqua kết quả vi sinh được chia thành 5 nhóm: nhóm 1 - Acinetobacter spp., nhóm2 - Escherichia coli, nhóm 3 - Klebsiella spp., nhóm 4 - Staphylococcus spp.,nhóm 5 - Pseudomonas aeruginosa Đây là 5 nhóm vi khuẩn thường gặp trongbệnh lý nhiễm khuẩn cũng như được báo cáo liên quan đến tình trạng đề khángkháng sinh [1,17–19].

2.3.2.2 Biến dự đoán và biến kết quả

Có 24 biến dự đoán từ dữ liệu thu thập Tuy nhiên, dựa trên thảo luận với cácdược sĩ lâm sàng tại BVĐHYD TPHCM và nghiên cứu trước đó [14–17], 9 và10 biến dự đoán lần lượt được chọn để dự đoán các nhóm vi khuẩn và độ nhạycảm với kháng sinh Danh sách các biến số được trình bày tại Bảng 2.1.

Trang 27

Các biến dự đoán của các mô hình học máy gồm có: tuổi, giới tính, mẫu bệnhphẩm, nơi lưu trú, số lần nhập viện, có nhập viện trước đó trong vòng 1 năm,chẩn đoán loại nhiễm khuẩn, bệnh kèm (gồm 10 loại), nhóm vi khuẩn (chỉ đưavào trong mô hình dự đoán đề kháng) và kháng sinh sử dụng trong kháng sinhđồ ứng với tên vi khuẩn.

Các biến kết quả của các mô hình học máy gồm có: nhóm vi khuẩn (trong môhình dự đoán vi khuẩn), khả năng đề kháng (trong mô hình dự đoán đề kháng/nhạy cảm với kháng sinh) Về dự đoán độ nhạy cảm với kháng sinh, biến kếtquả là biến nhị phân gồm kháng (R) hoặc nhạy cảm (S) được xác định cho 07loại kháng sinh quan tâm (amikacin, cefoxitin, ceftazidime, levofloxacin,meropenem, piperacillin/tazobactam, vancomycin).

Bảng 2.1 Định nghĩa biến sử dụng trong mô hình học máy

khuẩn; dự đoán đềkháng kháng sinhGiới tính Biến nhị

khuẩn; dự đoán đềkháng kháng sinhNơi lưu trú Biến định

Tên tỉnh/ thành phố Dự đoán nhóm vikhuẩn; dự đoán đềkháng kháng sinhMẫu bệnh

Biến địnhdanh

Bao gồm các loại mẫu sau:- Đàm

- Nước tiểu- Máu

Dự đoán nhóm vikhuẩn; dự đoán đềkháng kháng sinh

Trang 28

- Dịch hút phế quản

- Dịch các loại (như dịch nãotủy)

- Mủ các loại (mủ vết mổ)Chẩn đoán Biến định

Bao gồm chẩn đoán liên quanđến nhiễm khuẩn như sau:- Nhiễm khuẩn hô hấp

- Nhiễm khuẩn tiết niệu/ sinhdục

- Nhiễm khuẩn da, mô mềm- Nhiễm khuẩn huyết

- Nhiễm khuẩn ổ bụng- Nhiễm khuẩn khác

Dự đoán nhóm vikhuẩn; dự đoán đềkháng kháng sinh

Khoa điềutrị

Biến địnhdanh

Khoa điều trị mà bệnh nhânđược lấy mẫu

Dự đoán nhóm vikhuẩn; dự đoán đềkháng kháng sinhNhập viện

trước đótrong vòng1 năm

Biến nhịphân

Bệnh nhân có nhập viện trướcđây trong vòng 1 năm kể từ lầnnhập viện hiện tại

Dự đoán nhóm vikhuẩn; dự đoán đềkháng kháng sinh

Số lần nhậpviện

Biến rời rạc Được xác định bằng các mãnhập viện có chung mã bệnhnhân

Dự đoán nhóm vikhuẩn; dự đoán đềkháng kháng sinh

Trang 29

Bệnh kèm Biến nhịphân

Bệnh nhân có các loại bệnh kèmsau hay không (10 biến nhịphân):

- Đái tháo đường (có/không)- Bệnh phổi mãn tính(có/không)

- Suy tim (có/không)- Suy thận (có/không)- Suy gan (có/không)- Ung thư (có/không)

- Suy giảm miễn dịch (kể cảdùng thuốc ức chế miễn dịch)(có/không)

- Có mang thiết bị y tế xâm lấn(có/không)

- Bệnh nhiễm khuẩn khác(có/không)

- Bệnh kèm khác (có/không)

Dự đoán nhóm vikhuẩn; dự đoán đềkháng kháng sinh

Nhóm vikhuẩn

Biến địnhdanh

Gồm các nhóm vi khuẩn sau:Nhóm 1 - Acinetobacter spp.,Nhóm 2 - Escherichia coli,Nhóm 3 - Klebsiella spp., Nhóm4 - Staphylococcus spp., Nhóm5 - Pseudomonas aeruginosa.

Dự đoán nhóm vikhuẩn (biến kếtquả)

Dự đoán đề khángkháng sinh (biếndự đoán)

Trang 30

Kháng sinh(kháng sinhđồ)

Biến địnhdanh

Bao gồm các kháng sinh sau:Amikacin, cefoxitin,ceftazidime, levofloxacin,meropenem,

Dự đoán đề khángkháng sinh (phânloại)

Khả năng đềkháng

Biến nhịphân

Nhạy cảm (S) hoặc đề kháng (Ivà R)

Dự đoán đề khángkháng sinh (biếnkết quả)

2.3.3 Phương pháp làm sạch dữ liệu

2.3.3.1 Dự đoán nhóm vi khuẩn

Thuật toán StratifiedShuffleSplit được sử dụng để phân chia ngẫu nhiên dữ liệucủa từng nhóm vi khuẩn thành 80% làm tập huấn luyện và 20% tập kiểm tratương ứng (Bảng 2.2).

Bảng 2.2 Phân chia tập huấn luyện và tập kiểm tra bằng phương pháp điềuchỉnh mẫu trong xây dựng mô hình dự đoán nhóm vi khuẩn

Tập banđầu, N

Tậpkiểmtra, N

Tập huấnluyện, N

Tập huấn luyện (sauphương pháp giảm mẫu),

Trang 31

Sau đó, phương pháp giảm mẫu (undersampling technique) theo tỷ lệ được ápdụng cho các tập dữ liệu huấn luyện nhằm làm cân bằng dữ liệu Kỹ thuật nàyđược sử dụng để giảm ảnh hưởng của các nhóm đa số dựa trên số lượng củanhóm thiểu số (tức là nhóm vi khuẩn có số lượng quan sát tối thiểu) nhằm làmgiảm sai lệch do chênh lệch tỷ lệ lớn Kỹ thuật này sử dụng công thức sau:

trong đó xi là số lượng quan sát từ nhóm đa số thứ i; xmin là số lượng quan sáttừ nhóm thiểu số; xri là tỷ lệ giảm mẫu; và % lấy mẫu dưới là phần trăm giảmquan sát từ nhóm đa số thứ i dựa trên sự khác biệt giữa nhóm đa số thứ i vànhóm thiểu số Các quan sát sau đó được loại bỏ ngẫu nhiên khỏi mỗi nhóm đasố để đạt được % mẫu giảm (Bảng 2.2).

2.3.3.2 Dự đoán khả năng đề kháng kháng sinh

Thông tin về độ nhạy cảm với kháng sinh được thu thập từ kết quả vi sinh, baogồm R (kháng, bao gồm nhạy cảm trung gian) hoặc S (nhạy cảm) đối với cácloại kháng sinh quan tâm Tuy nhiên trong nghiên cứu này, đối với mỗi nhómvi khuẩn, độ nhạy cảm với kháng sinh chỉ được xét cho 07 loại kháng sinh phổbiến (amikacin, cefoxitin, ceftazidime, levofloxacin, meropenem,piperacillin/tazobactam, vancomycin) dựa trên hướng dẫn tại BVĐHYDTPHCM Do có sự không đồng đều về số lượng quan sát trong từng loại khángsinh, nhóm nghiên cứu phân chia thành 07 nhóm kháng sinh và xây dựng môhình ML theo từng nhóm Tập dữ liệu phân tích được chia ngẫu nhiên thànhhai tập: 80% để huấn luyện và 20% để kiểm tra.

Ngoài ra, do tỷ lệ AMR cao, chúng tôi đã cân nhắc sự mất cân bằng giữa tỷ lệkháng thuốc và nhạy cảm vào kế hoạch phân tích (các mẫu vi khuẩn khángthuốc nhiều hơn những mẫu vi khuẩn nhạy cảm với kháng sinh được thử

Trang 32

nghiệm) Do đó, phương pháp điều chỉnh mẫu (resampling technique) đã đượctiến hành để giải quyết những vấn đề này Dữ liệu được xử lý trước bằngphương pháp giảm mẫu ngẫu nhiên trên mẫu vi khuẩn kháng kháng sinh(undersampling) hoặc phương pháp tăng mẫu ngẫu nhiên trên mẫu vi khuẩncòn nhạy cảm với kháng sinh (oversampling) trước giai đoạn phân tích tập huấnluyện Hai phương pháp này được thực hiện nhằm cân bằng lại mẫu đề kháng/nhạy cảm nhằm cải thiện hiệu suất của mô hình ML phân loại.

2.3.4 Phương pháp phân tích số liệu

2.3.4.1 Dự đoán nhóm vi khuẩn

Phương pháp phân loại nhị phân nhiều bậc (multiple binary classification) vớithuật toán XGBoost được sử dụng để dự đoán các nhóm vi khuẩn Theo phươngpháp này, thuật toán XGBoost đã được xây dựng để phân loại nhị phân giữatừng mỗi nhóm vi khuẩn và bốn nhóm còn lại nhằm xác định một mô hình đầutiên có độ chính xác cao nhất (mô hình 0) Sau đó, các cấu trúc cây (treestructure) khả dĩ của bốn nhóm vi khuẩn còn lại được thiết lập dựa trên mô hình0 (Hình 2.1) và thuật toán XGBoost đã được xây dựng để xác định cấu trúc câyvới độ chính xác cao nhất (mô hình 1 đến mô hình 3) Các tiêu chí đánh giá baogồm độ chính xác và giá trị F1 được sử dụng để đánh giá và chọn ra mô hìnhcó thông số tốt nhất (mô hình 0 ~ mô hình 3) Dựa vào các nghiên cứu đã côngbố trước đây [14–17], độ chính xác và giá trị F1 được xem là tốt khi kết quả dựđoán đúng từ 70% trở lên với tập kiểm tra.

Ngày đăng: 03/06/2024, 15:31

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan