TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN VÕ MINH TRUNG GIẢI TRÌNH TỰ VÀ LẮP RÁP BỘ GENE CỦA CÁC VI KHUẨN NHÓM STAPHYLOCOCCI ĐƯỢC PHÂN LẬP TỪ MÔI TRƯỜNG ĐỂ PHÂN TÍCH ĐẶC ĐIỂM KHÁNG LINEZOLID LUẬ
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA
NGUYỄN VÕ MINH TRUNG
GIẢI TRÌNH TỰ VÀ LẮP RÁP BỘ GENE CỦA CÁC VI KHUẨN NHÓM STAPHYLOCOCCI ĐƯỢC PHÂN LẬP TỪ MÔI TRƯỜNG ĐỂ PHÂN TÍCH ĐẶC ĐIỂM KHÁNG LINEZOLID
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, tháng 6 năm 2024
Trang 2Cán bộ hướng dẫn khoa học 1:
TS NGUYỄN THỊ LỆ THỦY Cán bộ hướng dẫn khoa học 2:
PGS.TS NGUYỄN THÚY HƯƠNG Cán bộ chấm nhận xét 1:
TS BÙI HOÀNG PHÚC Cán bộ chấm nhận xét 2:
TS HỒNG VŨ THÚY UYÊN Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 12 tháng 6 năm 2024
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: (Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
1 Chủ tịch: PGS.TS Hoàng Anh Hoàng
2 Thư ký: TS Huỳnh Ngọc Oanh
3 Phản biện 1: TS Bùi Hoàng Phúc
4 Phản biện 2: TS Hồng Vũ Thúy Uyên
5 Ủy viên: TS Nguyễn Thị Lệ Thủy Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có)
Trang 3NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: NGUYỄN VÕ MINH TRUNG MSHV: 2070451 Ngày, tháng, năm sinh: 27/11/1997 Nơi sinh: TP.HCM Chuyên ngành: Công nghệ sinh học Mã số : 8420201
I.TÊN ĐỀ TÀI: Giải trình tự và lắp ráp bộ gene của các vi khuẩn nhóm staphylococci được phân lập từ môi trường để phân tích đặc điểm kháng Linezolid (Sequencing and assembling genomes of staphylococci isolated from environment samples for linezolid resistance characteristics)
II.NHIỆM VỤ VÀ NỘI DUNG:
• Giải trình tự bộ gene các chủng staphylococci kháng Linezolid phân lập • Lắp ráp, chú giải, định danh
• Phân tích gene kháng/đột biến kháng/gene độc lực • Phân tích cải thiện plasmid
• Phân tích tính di động của plasmid và vùng lân cận gene kháng cfr, optrA
• So sánh với các plasmid trên CSDL và phân tích nguồn gốc plasmid
III.NGÀY GIAO NHIỆM VỤ: 10/09/2023 IV.NGÀY HOÀN THÀNH NHIỆM VỤ: 06/05/2024 V.CÁN BỘ HƯỚNG DẪN:
CBHD1: TS Nguyễn Thị Lệ Thủy CBHD2: PGS.TS Nguyễn Thúy Hương
Nguyễn Thúy Hương
CHỦ NHIỆM BỘ MÔN ĐÀO TẠO
Trang 4LỜI CẢM ƠN
Lời đầu tiên, em xin gửi lời cảm ơn chân thành tới Bộ môn Công nghệ sinh học, Khoa Kỹ Thuật hóa học, Trường Đại học Bách khoa TP Hồ Chí Minh và Trung tâm Công nghệ Sinh học TP Hồ Chí Minh đã tạo điều kiện thuận lợi cho em hoàn thành luận văn thạc sĩ này
Em xin gửi lời cảm ơn chân thành đến tới các quý Thầy, Cô trong bộ môn đã truyền đạt, hướng dẫn, chia sẻ những kiến thức vô cùng quý báu trong suốt thời gian em học tập tại trường Đặc biệt, em muốn gửi lời cảm ơn đến TS Nguyễn Thị Lệ Thủy và PGS.TS Nguyễn Thúy Hương đã giao cho em đề tài và hướng dẫn em tận tình, chia sẻ những kinh nghiệm cũng như kiến thức vô cùng bổ ích về mặt học thuật
Em cũng xin gửi lời cảm ơn đến PGS.TS Hồ Huỳnh Thùy Dương và TS Nguyễn Thụy Vy, cố vấn khoa học Công ty TNHH Khoa học KTest đã tạo điều kiện thuận lợi cho em được sử dụng các trang thiết bị, máy móc để có thể thực hiện luận văn này
Cuối cùng, em xin gửi lời cảm ơn tới gia đình và những người đồng nghiệp, bạn thân của em, đã luôn bên cạnh, hỗ trợ và động viên để em có thể hoàn thành luận văn này một cách tốt nhất
Trang 5TÓM TẮT
Nghiên cứu này tập trung vào việc phân tích dữ liệu giải trình tự thế hệ mới 06 mẫu vi khuẩn nhóm staphylococci kháng linezolid được phân lập từ môi trường chăn nuôi Độ hoàn chỉnh các bộ gene thô lắp ráp đều > 95%, tổng kích thước bộ gene thô xấp xỉ kích thước kích thước các chủng vi khuẩn được định danh và tổng số contig đều <200 Các bộ gene thô này tiếp tục được chú giải và trích xuất hồ sơ các gene kháng và gây độc Tất cả bộ gene
đều có mang một hoặc cả hai gene kháng linezolid là cfr và optrA, không ghi nhận đột biến
gây ra tính kháng linezolid 4/6 bộ gene được phân tích có gene kháng nằm trên những plasmid Đây là những plasmid mang gene kháng linezolid đã được lắp ráp cải thiện bằng các thuật toán tin sinh học Xung quanh những vùng gene kháng, chúng tôi ghi nhận sự hiện diện của những vùng IS và những gene liên quan tới chuyển vị khác trên cả 6 mẫu (kể cả 2 mẫu gene kháng nằm trên nhiểm sắc thể) Phân tích BLAST và khoảng cách Mash cho thấy sự tương đồng đáng kể giữa bộ khung plasmid mang gene kháng của các mẫu và các plasmid pLEW6932, pSA159, và pSS-03 từ cơ sở dữ liệu NCBI và PLSDB Tuy nhiên, phân tích phả hệ vùng lân cận gene kháng của các mẫu lại chỉ ra sự tương đồng cao với các plasmid khác so với các plasmid bộ khung Các khác biệt này cho thấy có sự kiện chuyển vị đáng kể trong vùng mang gene kháng kháng sinh (AMR) Kết quả nghiên cứu này nêu bật động lực phức tạp và tiềm năng lan truyền tính kháng linezolid bởi nhóm vi khuẩn staphylococci ở môi trường chăn nuôi Việt Nam
Trang 6ABSTRACT
This study focuses on the analysis of next-generation sequencing data obtained from six linezolid-resistant staphylococci isolated from livestock environment The completeness of all assemblies was >95%, with the size of the draft genomes correspond to identified bacteria and the total number of contigs <200 These draft genomes were further annotated and extracted for profiles of resistance and virulence genes All samples contained one or
both resistance genes cfr and optrA which responsible for linezolid resistance; however,
ribosomal mutation was not detected Four out of six of the analysed genomes had resistance genes located on plasmids These are plasmids carrying linezolid resistance genes that were improved by bioinformatics algorithms Surrounding the resistance gene regions, we noted the presence of IS regions and other transposition-related genes in all 6 samples (including 2 samples with resistance genes located on the chromosome) BLAST and Mash distance measurements revealed significant similarities between the plasmid backbones of the samples and those of plasmids pLEW6932, pSA159, and pSS-03 from the NCBI and PLSDB database However, phylogenetic analysis of the flanking regions in the samples revealed high similarities with the plasmids that differed from the backbone sequences The discrepancies imply substantial transposition events in the antimicrobial resistance (AMR) region Overall, these findings highlight the intricate dynamics and transmission potential of linezolid resistance among staphylococci in Vietnam’s livestock settings
Trang 7CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của học viên cao học Nguyễn Võ Minh Trung, khóa 2020 đợt 2 dưới sự hướng dẫn của TS Nguyễn Thị Lệ Thủy và PGS.TS Nguyễn Thúy Hương Các chủng vi khuẩn được phân lập từ phòng thí nghiệm của TS Nguyễn Thị Lệ Thủy Việc chuẩn bị thư viện WGS và giải trình tự được thực hiện tại công ty TNHH Khoa học KTest theo đơn đặt hàng của nhóm nghiên cứu Các số liệu và kết quả trong luận văn là trung thực, chưa từng được công bố riêng lẻ bởi tác giả khác trong bất kỳ công trình nào trước đây Trong quá trình viết bài, các tài liệu tham khảo liên quan đã được trích dẫn nguồn cụ thể và rõ ràng theo đúng yêu cầu Nếu không đúng như đã nêu, tôi xin hoàn toàn chịu trách nhiệm về đề tài của mình
Trang 81 TỔNG QUAN TÀI LIỆU 3
1.1 Nhóm tụ cầu khuẩn (staphylococci) 3
Trang 9Sơ đồ nghiên cứu 15
2.1.Vật liệu, máy móc 15
2.2.2.2.1 Nguồn mẫu môi trường 15
2.2.2 Môi trường phân lập và kit sinh hóa sử dụng 16
2.2.3 Kit tách chiết và máy giải trình tự 16
2.2.4 Platform phân tích 16
Phương pháp 16
2.3.2.3.1 Thu mẫu, phân lập vi khuẩn, xác định kháng sinh đồ và định danh sinh hóa 16
2.3.2 Tách chiết DNA và giải trình tự 17
2.3.3 Phân tích tin sinh 18
3 KẾT QUẢ VÀ THẢO LUẬN 22
Kết quả phân tích draft genome (xử lý dữ liệu, lắp ráp, chú giải) 22
3.1.Kết quả phân tích định danh, đặc điểm kháng và gene độc lực ở các chủng kháng 3.2.LZD 23
3.2.1 Định danh bằng WGS 23
3.2.2 Phân tích gene kháng và độc lực 24
3.2.3 Phân tích đột biến trên gene kháng (cfr, optrA) 26
3.2.4 Phân tích đột biến trên gene đích (23S, rplC, rpl4) 27
Kết quả phân tích các yếu tố di truyền động trên các chủng kháng LZD 27
3.3.3.3.1 Lắp ráp cải thiện plasmid 27
3.3.2 Tóm tắt và phân tích chung 29
3.3.3 Mẫu 1- Staphylococcus ureilyticus 33
3.3.4 Mẫu 2- Staphylococcus arlettae 34
3.3.5 Mẫu 3- Staphylococcus arlettae 36
3.3.6 Mẫu 5- Staphylococcus ureilyticus 39
Trang 103.3.7 Mẫu 6- Aerococcus urinaeequi 40
3.3.8 Mẫu 7- Staphylococcus arlettae 41
Bàn luận chung 433.4
4 KẾT LUẬN VÀ ĐỀ XUẤT 47
Kết luận 474.1
Đề xuất 474.2
TÀI LIỆU THAM KHẢO 48
PHỤ LỤC
Trang 11Hình 2.1: Sơ đồ nghiên cứu từ bước thu mẫu tới phân tích tin sinh 15Hình 3.1: Kết quả sắp gióng cột trình tự gene kháng của các mẫu với trình tự tham chiếu
gene kháng cfr NG_047631 26
Hình 3.2: Kết quả sắp gióng cột trình tự gene kháng của các mẫu với trình tự tham chiếu
gene kháng optrA NG_048023 26Hình 3.3: So sánh cấu trúc vùng flanking bao quanh gene kháng cfr 31Hình 3.4: So sánh vùng bao quanh cfr của plasmid mẫu 1 và mẫu 3 cho thấy có Tn552-
like transposon 32
Hình 3.5: So sánh cụm chức năng bao quanh gene kháng optrA 32Hình 3.6: Cấu trúc plasmid thiết lập mang gene kháng cfr của mẫu 1 (pLEW6932-like)
33Hình 3.7: So sánh cấu trúc plasmid mang gene kháng LZD của mẫu 1 với pTZ44 (CP098658) và pLEW6932 (NC_009130) 34
Hình 3.8: Phân tích vùng bao xung quanh gene kháng cfr mẫu 1 34Hình 3.9: Cấu trúc plasmid thiết lập mang gene kháng cfr và optrA của mẫu 2 (pSA159-
like mẫu 2) 35
Hình 3.10: Cấu trúc IS21-Tn558 bao quanh gene kháng cfr và optrA, có các vùng
ISSau9_IS21 và gene transposase 36Hình 3.11: So sánh toàn vùng trình tự plasmid mang gene kháng mẫu 2 với trình tự gần nhất trên CSDL về backbone (CP090408-pSA159,) và trình tự tương đồng nhất khi so sánh vùng bao xung quanh (CP096536-pM047916_1) 36
Hình 3.12: Cấu trúc plasmid lai thiết lập mang gene kháng cfr và optrA của mẫu 3 37
Trang 12Hình 3.13: Vùng bao xung quanh gene cfr, bao gồm vùng IS21 và các gene của
Tn558-like transposon 37
Hình 3.14: Vùng bao xung quanh gene optrA, bắt đầu từ vùng radC cho tới vùng IS6 38
Hình 3.15: So sánh pSA159, plasmid hybrid mẫu 3 (component 1) và vùng bao quanh
gene kháng cfr và optrA của plasmid pwo28-3 39
Hình 3.16: Vùng IS21-Tn558 mang gene kháng LZD trên chromosome mẫu 5 39Hình 3.17: So sánh clinker cho thấy trình tự chromosome mẫu 5 có độ tương đồng vùng bao quanh gene kháng LZD cao so với cluster gene S031-25 (KX447569) 40
Hình 3.18: Vùng bao quanh gene kháng optrA của mẫu 6 trên chromosome 40
Hình 3.19: So sánh clinker vùng bao quanh gene kháng trình tự chromosome mẫu 6 với
các cluster gene optrA gần nhất 41Hình 3.20: Cấu trúc plasmid thiết lập mang gene kháng cfr của mẫu 7 (pSS-03-like) 42Hình 3.21: Cấu trúc transposon Tn558 mang gene optrA điển hình 42
Hình 3.22: So sánh clinker vùng bao quanh gene kháng trình tự chromosome mẫu 7 với
các cluster gene optrA gần nhất 43
Trang 13DANH MỤC BẢNG BIẾU
Bảng 1.1: Các đơn vị transposon liên quan đến tính kháng ở các chủng tụ cầu và cầu
khuẩn [26] 8
Bảng 2.1: Thông tin các mẫu vi khuẩn phân lập có tính kháng LZD 17
Bảng 3.1: Thông số giải trình tự thô 22
Bảng 3.2: Thông số genome được lắp ráp 23
Bảng 3.3: Kết quả chú giải bằng Prokka v1.14.6 23
Bảng 3.4: Bảng định danh các mẫu bằng phương pháp sinh hóa và WGS 24
Bảng 3.5: Kết quả MIC (ug/mL) kháng sinh LZD của 6 mẫu khảo sát 25
Bảng 3.6: Tóm tắt số lượng gene kháng kháng sinh và sự hiện diện của các gene kháng LZD 25
Bảng 3.7: Bảng các biến thể trên gene optrA của các mẫu khi so sánh với NG_048023 27
Bảng 3.8: Kết quả đánh giá trước và sau lắp ráp cải thiện plasmid mang gene kháng 28
Bảng 3.9: Kết quả thẩm định plasmid sau khi lắp ráp cải thiện 29
Bảng 3.10: Thông tin tóm lược các plasmid và vùng chromosome mang gene kháng LZD của các mẫu 30
Trang 14DANH MỤC CHỮ VIẾT TẮT
AMR Antibiotic microbial
resistance
Tính kháng kháng sinh của vi sinh vật
ANI Average nucleotide identity Độ tương đồng
nucleotide trung bình BHI Brain heart infusion Môi trường dịch trích
não và tim bò để nuôi cấy vi sinh
BLAST Basic Local Alignment Search
Tool
Công cụ tìm kiếm dựa trên sắp gióng cột cục bộ cơ bản
CARD Comprehensive Antibiotic
Resistance Database
CSDL kháng kháng sinh tổng quát CoNS Coagulase-negative
staphylococci
Nhóm tụ cầu không sinh men coagulase CoPS Coagulase-positive
năng cao IS Insertion sequence Trình tự đoạn chèn LA Livestock Associate Liên quan đến gia súc LRCoNS Linezolid resistant coagulase-
negative staphylococci
Nhóm tụ cầu không sinh men coagulase
Trang 15kháng linezolid LRSA Linezolid resistant
Staphylococcus aureus
S aureus kháng
linezolid
MGE Mobile genetic element Nhân tố di truyền động
concentration
Nồng độ ức chế tối thiểu
MLST Multilocus sequence typing Định type vi khuẩn
bằng nhiều locus trình tự
MPF Mate pair formation MRCoNS Methicillin-resistant
coagulase-negative staphylococci
nhóm tụ cầu không sinh men coagulase kháng methicillin MRSA Methicillin-resistant
Staphylococcus aureus
S aureus kháng
methicillin MSA Multiple sequence alignment Sắp gióng cột đa trình
tự MSA medium Mannitol salt agar medium Môi trường thạch có
chứa Mannitol và muối để nuôi cấy chọn lọc vi sinh
NGS Next-Generation Sequencing Giải trình tự thế hệ
mới Q30 Percentage of bases with
quality score of 30
Phần trăm base có điểm chất lượng lớn hơn 30
SCC Staphylococcal cassette
chromosome
Trang 16TNHH Trách nhiệm hữu hạn VFDB Virulence factor database CSDL nhân tố gây độc VRE Vancomycin-Resistant
Enterococcus
Enterococcus kháng Vancomycin
WGS Whole genome sequencing Giải trình tự toàn bộ
bộ gene
Trang 17ĐẶT VẤN ĐỀ
Việt Nam đang đối mặt với vấn đề kháng kháng sinh nghiêm trọng Điều này là do một số yếu tố, bao gồm việc lạm dụng kháng sinh, thuốc kém chất lượng, giám sát không đầy đủ và sự thiếu nhận thức của cộng đồng [1, 2] Ở cấp độ bệnh viện, người ta ước tính rằng một phần ba số kháng sinh được sử dụng là không cần thiết Tỷ lệ này có thể còn cao hơn ở cấp độ cộng đồng, nơi mọi người thường đến các hiệu thuốc tư nhân hoặc những người bán hàng không chính thức để mua thuốc [2]
Trong các trường hợp nhiễm vi khuẩn kháng kháng sinh gây bệnh, vi khuẩn
Staphyloccus aureus kháng methicillin (MRSA) và các tụ cầu khuẩn coagulase âm tính
kháng methicillin (MRCoNS) được phát hiện và báo cáo nhiều nhất tại các bệnh viện Việt Nam [3] Chúng gây ra tỷ lệ nhiễm trùng và tử vong cao hơn vì có khả năng kháng hầu hết phác đồ kháng sinh hiện tại Linezolid là kháng sinh đầu tiên thuộc nhóm kháng sinh oxazolidinone được cấp phép lưu hành, có hoạt tính tốt chống lại các vi khuẩn Gram dương, đặc biệt là các staphylococci đa kháng thuốc (bao gồm cả MRSA và MRCoNS),
Enterococcus faecium và Enterococcus faecalis (bao gồm cả Vancomycin-Resistant Enterococcus-VRE) Với những ưu điểm đó, linezolid đang ngày càng được sử dụng rộng
rãi trên lâm sàng Tuy nhiên, các khảo sát đã cho thấy xu hướng tiêu thụ linezolid gia tăng có liên quan đến tỷ lệ sử dụng không phù hợp và tỷ lệ phân lập được các chủng đề kháng [4]
Một nghiên cứu của Nguyễn Thị Lệ Thủy và cộng sự vào năm 2020 phát hiện hai chủng tụ cầu khuẩn coagulase âm tính kháng linezolid (Linezolid resistant coagulase-negative staphylococci-LRCoNS) tại Việt Nam Trong 70 chủng thu nhận từ khoa Vi Sinh, đại học Dược thành phố HCM, có 2 chủng phân lập từ mẫu máu bệnh nhân trong phòng hồi sức cho thấy tính kháng linezolid Cả hai chủng phân lập đều mang đột biến trong các thành phần
ribosome, cũng như gene kháng cfr (chloramphenicol - florfenicol resistance) gene cfr này
nằm trên plasmid có liên quan chặt chẽ với plasmid pLRSA417, trước đây được tìm thấy ở Trung Quốc [5]
Sự xuất hiện của LRCoNS ở Việt Nam là một mối lo ngại nghiêm trọng Linezolid là liệu pháp kháng sinh cuối cùng để điều trị nhiễm trùng tụ cầu Cũng theo bài báo trên, 2
Trang 18kháng sinh khác Vì vậy câu hỏi nghiên cứu được đặt ra là: các staphylococci ngoài môi
trường có thể mang các plasmid hoặc nhân tố chuyển vị mang gene kháng linezolid không?
Các plasmid hoặc nhân tố chuyển vị có liên hệ thế nào với các plasmid mang gene kháng đã biết trên thế giới?
Có rất ít nghiên cứu, theo chúng tôi biết hiện nay làm về sự hiện diện của các gene kháng và nhân tố chuyển vị trên nền mẫu môi trường Việc phân tích trên một số chủng phân lập từ môi trường như thực phẩm, cơ sở chăn nuôi động vật, nước thải,…sẽ bổ sung thông tin về đặc điểm kháng thuốc của nhóm tụ cầu khuẩn ở Việt Nam Qua đó, các nghiên cứu sau có thể đưa ra được các chiến lược cụ thể cho việc kiểm soát sử dụng và phát triển liệu pháp kháng sinh ở Việt Nam Để thực hiện được mục tiêu này, chúng tôi sử dụng công cụ phân tích trình tự bộ gene (WGS) vi khuẩn, ứng dụng giải trình tự thế hệ mới (NGS) để tìm hiểu sâu hơn về những cơ chế di truyền đằng sau sự lây lan tính kháng linezolid của nhóm staphylococci
Đó là mục tiêu để đề tài: “Giải trình tự và lắp ráp bộ gene các vi khuẩn nhóm
staphylococci được phân lập từ môi trường để phân tích đặc điểm kháng linezolid”
được tiến hành
Trang 191 TỔNG QUAN TÀI LIỆU
1.1 Nhóm tụ cầu khuẩn (staphylococci) 1.1.1 Phân bố
Staphylococci là nhóm vi khuẩn Gram dương có hình cầu và tạo thành chùm giống như quả nho Chúng thường được tìm thấy trong môi trường và trên da và niêm mạc của người và động vật [6, 7] Hầu hết các loài staphylococci đều vô hại, nhưng một số loài có thể gây bệnh Sự phân bố của staphylococci trong môi trường bị ảnh hưởng bởi một số yếu tố bao gồm: nhiệt độ, độ ẩm chất dinh dưỡng [7, 8] Nhóm staphylococci thích nhiệt độ ấm áp Chúng có thể tồn tại ở nhiệt độ từ 4°C đến 45°C, nhưng phát triển tốt nhất ở nhiệt độ từ 30°C đến 37°C Nhóm vi khuẩn này cũng cần độ ẩm và chất dinh dưỡng để tồn tại Khi
bước vào trạng thái thiếu dinh dưỡng trong thời gian dài, 99 đến 99,9% tế bào S aureus mất
khả năng sống sót trong vòng 2 ngày đầu tiên ở 37°C Khả năng tồn tại của dòng vi khuẩn sau đó vẫn tương đối ổn định trong khoảng thời gian vài tháng [9] Môi trường không khí có bụi bẩn có thể giữ sức chống chịu, khả năng gây viêm nhiễm và tạo biofilm của vi khuẩn
S aureus trong các hạt sol khí Tuy nhiên các tế bào này thường ở trạng thái không nuôi cấy
được [10] Các loài staphylococci có thể tồn tại trong nhiều môi trường khác nhau vì chúng có một số cách thích nghi cho phép [7] Các loài staphylococci có một lớp vỏ nang bảo vệ chúng khỏi hệ thống miễn dịch Chúng cũng có protein bề mặt giúp bám dính trên bề mặt và trốn tránh hệ thống miễn dịch và chúng cũng có nhiều enzyme giúp tăng cường hoạt động trao đổi chất hoặc phân hủy kháng sinh, kim loại nặng,… [7, 11]
1.1.2 Phân loại tụ cầu
Các nghiên cứu phân loại thường quan tâm phân biệt giữa nhóm tụ cầu dương tính men coagulase (Coagulase-positive staphylococci - CoPS) và nhóm âm tính (Coagulase-negative
staphylococci - CoNS) CoPS mà tiêu biểu là S aureus có khả năng làm đông máu qua việc
chuyển hóa fibrinogen thành fibrin CoNS không tạo enzyme này và như vậy không làm đông máu [12] Người ta cũng quan sát được sự khác nhau trong cấu trúc thành tế bào giữa hai nhóm này [13] Khả năng sinh men coagulase trước đây được kiểm tra bằng huyết thanh thỏ (slide or tube coagulase testing) hoặc bằng bộ test chuyên dụng Staphaurex hoặc
Trang 20Pastorex [14, 15] Hiện tại đã có nhiều thông tin về đặc tính các loài tụ cầu, nên người ta có thể thực hiện định danh bằng các kit hóa sinh API STAPH để xác định loài và suy ra khả năng sinh men coagulase [16]
1.1.3 Độc lực
Độc lực của các loài staphylococci có thể khác nhau giữa các loài và các chủng Một số
loài có độc lực cao hơn những loài khác và có nhiều khả năng gây bệnh hơn Ví dụ S
aureus là loài staphylococci gây bệnh phổ biến nhất S aureus có thể gây ra nhiều loại bệnh
nhiễm trùng, bao gồm nhiễm trùng da, viêm phổi và nhiễm trùng huyết [17] Trong khi đó
Staphylococcus epidermidis (S cholermidis) là một loại vi khuẩn phổ biến trên da thường
chỉ gây nhiễm trùng ở những người có hệ thống miễn dịch yếu [17] Độc lực của chủng staphylococci cũng bị ảnh hưởng bởi các yếu tố môi trường, chẳng hạn như sự hiện diện của các vi khuẩn khác và sự sẵn có của các chất dinh dưỡng Các độc tố tụ cầu phổ biến bao
gồm: hemolysin-α (hla ), hemolysin-β (hlb), leukotoxin (Luk),…[18, 19] Các độc tố này biểu hiện mạnh ở S aureus và có khả năng phá hủy màng tế bào vật chủ bằng việc phân hủy
cấu trúc mạng lưới tế bào hoặc gây ra phản ứng quá mẫn [19] Độc lực còn được xác định qua khả năng vi khuẩn bám dính vào tế bào và mô và trốn tránh hệ thống miễn dịch – một
chức năng của protein bề mặt [20] Một chủng S aureus đột biến thiếu sortase dẫn tới thiếu
tất cả các protein neo ở thành tế bào của nó sẽ ít độc hơn so với chủng tự nhiên của nó trong mô hình nghiên cứu áp xe da Ngoài ra, các chủng đặc biệt thiếu protein A, protein liên kết fibronectin, yếu tố kết khối A hoặc protein bề mặt SasF cũng bị suy giảm độc lực
1.1.4 Tính kháng kháng sinh
Kháng kháng sinh là khả năng vi khuẩn chống lại tác dụng của kháng sinh [21] Kháng kháng sinh có thể xảy ra một cách tự nhiên, thông qua đột biến DNA Nhưng nó cũng có thể thu được thông qua việc chuyển gene kháng từ vi khuẩn này sang vi khuẩn khác
Các loài staphylococci ngày càng trở nên kháng thuốc kháng sinh Tụ cầu vàng kháng
methicillin (Methicillin-resistant Staphylococcus aureus-MRSA) là một ví dụ điển hình
[22] MRSA lần đầu tiên được xác định vào đầu những năm 1960 tại Vương quốc Anh Nó nhanh chóng lan sang các nơi khác trên thế giới và đến đầu những năm 1990, MRSA là một vấn đề lớn tại các bệnh viện ở Hoa Kỳ Kháng MRSA là do sự hiện diện của một gene gọi là
mecA Gene mecA mã hóa PBP2A (penicillin-binding protein 2A) làm cho các vi khuẩn
Trang 21MRSA kháng methicillin và các kháng sinh nhóm beta-lactam khác Các yếu tố góp phần vào sự lây lan của MRSA bao gồm việc lạm dụng kháng sinh, thiếu phát triển kháng sinh mới và khả năng MRSA lây lan dễ dàng từ người sang người
Nhóm CoNS bao gồm Staphylococcus epidermidis, Staphylococcus haemolyticus,
Staphylococcus saprophyticus và một số loài khác Hầu hết chúng chỉ hội sinh trên da người
và tất cả đều ít gây bệnh hơn so với S aureus Tuy nhiên, chúng có thể gây nhiễm trùng khi
bệnh nhân suy giảm sức đề kháng Nghiên cứu gần đây trên gia cầm đã chỉ ra rằng nhóm tụ cầu không có men coagulase kháng methicillin (Methicillin-resistant coagulase-negative staphylococci-MRCoNS) đã được tìm thấy trong 100% các mẫu được thử nghiệm và phổ biến trong chăn nuôi gia cầm [23] Đây là một mối quan tâm lớn, vì gia cầm là nguồn thực phẩm chính cho con người Việc sử dụng kháng sinh trong chăn nuôi gia cầm được cho là một trong những nguyên nhân chính dẫn đến sự lây lan của MRCoNS
1.1.5 Plasmid và nhân tố chuyển vị
Staphylococci có thể kháng thuốc kháng sinh thông qua nhiều cơ chế khác nhau, bao gồm cả việc thu nhận các yếu tố di truyền di động (Mobile genetic element-MGE) [24] MGE là các cấu trúc DNA có thể di chuyển từ vi khuẩn này sang vi khuẩn khác (plasmid, prophage,…) hoặc giữa các phân tử DNA với nhau (IS, transposon,…) Chúng có thể mang gene kháng thuốc kháng sinh, cũng như gene mã hóa các yếu tố độc lực
Hai trong số các loại MGE phổ biến nhất ở staphylococci là plasmid và transposon (Hình 1.1) [24] Plasmid là các phân tử DNA dạng vòng, nhỏ có thể sao chép độc lập với chromosome của vi khuẩn Transposon là các chuỗi DNA có thể di chuyển trong chromosome của vi khuẩn hoặc giữa các plasmid
Plasmid và transposon có thể mang nhiều loại gene, bao gồm cả gene quy định khả năng kháng thuốc kháng sinh Ví dụ, các vùng cassette từ chromosome của staphylococci
(SCCmec) là một nhân tố chuyển vị lớn mang gene mã hóa kháng methicillin [25]
Transposon cũng có thể mang gene mã hóa khả năng kháng thuốc kháng sinh [24] Ví dụ,
transposon Tn552 mang gene của blaZ β-lactamase, có thể tạo ra khả năng kháng penicillin
và các kháng sinh beta-lactam khác
Trang 22Hình 1.1: Mô phỏng con đường và chức năng của các MGE nội tế bào và liên tế
bào [26]
1.1.5.1 Plasmid
Quá trình nhân đôi plasmid bắt đầu từ một khu vực xác định, gốc nhân đôi (Ori), được
kích hoạt bởi một chuỗi RNA hoặc phổ biến hơn, bởi sự gắn kết của một protein khởi đầu
(Rep), được mã hóa bởi một gene rep trên plasmid, với các chuỗi lặp DNA lân cận được gọi
là iterons [26] Gốc nhân đôi và gene khởi đầu (thường được đặt cùng vị trí) tạo thành thành phần cơ bản của tất cả plasmids, replicon tối thiểu Do đó, plasmids mã hóa phần đặc tính khởi đầu nhân đôi của chúng nhưng thường sử dụng chung bộ máy nhân đôi của tế bào chủ có mã gene trên chromosome (helicase, primase, polymerase, v.v.) cho quá trình tổng hợp DNA Sự tương tác và phụ thuộc vào các protein nhân đôi DNA được mã hóa bởi tế bào chủ là một trong những yếu tố ảnh hưởng đến phạm vi vật chủ (host range) của plasmids
Sau khi sao chép, plasmid cần được phân chia đồng đều giữa các tế bào con Đối với các plasmid nhỏ có số lượng bản sao cao, quá trình phân ly ngẫu nhiên đã đủ Tuy nhiên, các plasmid lớn thường tồn tại ở số lượng bản sao thấp để giảm thiểu gánh nặng cho vật chủ của chúng Do đó chúng có nguy cơ bị đào thải nếu các tế bào không có plasmid cạnh tranh
Trang 23tốt hơn Vì vậy, các plasmid lớn có số lượng bản sao thấp thường sở hữu thêm các hệ thống chức năng góp phần duy trì phân phối plasmid xuống các tế bào con [27] Chúng bao gồm
hệ thống phân giải cụm đa phân tử (res), phân vùng (par) và hệ thống giết chết chọn lọc sau
phân ly [26] Plasmid được nhân lên và lan truyền không chỉ qua phân chia tế bào mà còn thông qua truyền ngang sang các tế bào vi khuẩn khác [26] Plasmid tiếp hợp (tự truyền) sở hữu các hệ thống phức tạp về mặt di truyền để chuyển plasmid ngang, bao gồm vùng chuyển plasmid
và các DNA transfer replication protein (DTR) Vùng chuyển plasmid (tra region) mã hóa
các protein để hình thành cặp giao phối (MPF; được phân loại thành 8 loại [28]) hoạt động như một kênh chuyên biệt của hệ thống tiết loại IV (T4SS) Protein DTR bao gồm một
protein relaxase đặc hiệu cắt gốc chuyển plasmid (oriT) của sợi DNA plasmid được truyền
sang tế bào nhận [29] Một số plasmid không tiếp hợp có thể được chuyển ngang bằng cách khai thác bộ máy MPF do plasmid tiếp hợp có trong cùng tế bào cung cấp (còn gọi là plasmid helper) Các plasmid đó chỉ mang một tập hợp con của các chức năng DTR (thường
được gọi là mob), bao gồm oriT và một gene mã hóa relaxase tương ứng [26, 29]
1.1.5.2 Transposon và IS
Các trình tự di động (Insertion Sequence-IS) là các đoạn DNA di động có kích thước
nhỏ, chỉ mang theo một (đôi khi là hai) gene transposase (tnp) [26] IS có thể được phân
nhóm dựa một phần vào mô-típ vị trí hoạt động trong protein Tnp, được chỉ định bởi các amino acid then chốt tập hợp lại tại vị trí hoạt động, thông thường nhất là DDE (ký tự viết tắt của chuỗi amino acid Aspartic acid, Aspartic acid, và Glutamic acid) Sự chuyển vị có thể mang tính bảo toàn hoặc nhân bản Chuyển vị bảo toàn triển khai theo cơ chế “cut-and-paste” trong đó IS được cắt ra từ DNA nguồn (donor) và được chèn vào DNA đích (recipient) Chuyển vị sao chép triển khai theo hướng “copy-and-paste”, trong đó IS được nhân bản và nối phân tử DNA nguồn và đích thành một phân tử liên hợp (cointegrate) và rồi phân giải phân tử này trở lại thành hai phân tử DNA ban đầu đều mang một bản sao của vùng IS Ngoài ra, việc chuyển vị sao chép cũng có thể triển khai theo hướng “copy-out-paste-in” (IS được sao chép thành một phân tử vòng mạch đôi trung gian sau đó tích hợp vào DNA đích) Thường IS mang chức năng chyển gene kháng khi hoạt động trong một
Trang 24transposon tổ hợp (compound transposon) Ngoài ra, một vùng trình tự được bao quanh bởi hai bản sao IS có liên hệ di truyền có thể được chuyển vị như 1 đơn vị duy nhất
Các transposon tổ hợp có liên hệ với nhóm tụ cầu thuộc nhóm Tn7, Tn7-like (Tn552) hoặc nhóm Tn khác (Tn554, Tn558) (Bảng 1.1) Tn554 và Tn558 có đặc trưng hệ gene
chuyển vị gồm 3 gene: tnpA, tnpB, tnpC TnpA và tnpB đều mã hóa chức năng transposase trong khi tnpC định vị mục tiêu và định hướng cho cụm transposon [30] Do đó, nhóm
transposon này có tính định vị và định hướng rất chuyên biệt Nhiều transposon thuộc họ Tn554, chẳng hạn như Tn5406, Tn554, Tn558 và Tn559 trong nhóm tụ cầu (staphylococci)
và cầu khuẩn ruột (enterococci) chuyển vị vào một vị trí đặc hiệu gần đầu 3’ của gene radC
trên chromosome vi khuẩn và không tạo các đoạn lặp ở vị trí đích (target site
duplication-TSD) [31, 32] Họ transposon này xuất hiện trong các nghiên cứu về gene kháng optrA hoặc
fexA [31, 33] Đặc biệt trước gene optrA có thêm gene mã hóa protein điều hòa araC/xylS có
thể ảnh hưởng đến việc biểu hiện gene [33]
Tn552 mang các gene mã hóa cho các protein tương đồng với TnsB và TnsC của Tn7,
cùng với gene binL-mã hóa một protein tái tổ hợp Các gene này được phân tách khỏi vùng điều hòa và gene kháng (blaI, blaR1, blaZ) bởi một vị trí res Tn552 được bao bởi các trình
tự DNA đặc hiệu (IR) và tạo ra các TSD khi nó di chuyển Giống như Tn5053, các
transposon giống Tn552 thường được tìm thấy trong plasmid, đặc biệt là tại vị trí res của hệ
Trang 25Kháng sinh linezolid 1.2.
1.2.1 Dược lực học và dược động học
Linezolid (LZD) là một loại kháng sinh oxazolidinone được sử dụng để điều trị các bệnh nhiễm trùng do vi khuẩn gram dương kháng thuốc gây ra Đây là loại kháng sinh duy nhất trong nhóm và có một cơ chế hoạt động độc đáo giúp nó có hiệu quả chống lại nhiều loại vi khuẩn kháng thuốc [24, 35] LZD được hấp thu sau khi uống và có khả năng thâm nhập mô tốt Nó được chuyển hóa ở gan và bài tiết qua nước tiểu Thời gian bán hủy của LZD là khoảng 5 giờ [35]
Dược lực học của LZD được đặc trưng bởi sự tiêu diệt phụ thuộc vào thời gian Điều này có nghĩa là thuốc tồn tại trong cơ thể càng lâu thì hiệu quả tiêu diệt vi khuẩn càng cao LZD cũng có tác dụng kìm khuẩn, có nghĩa là nó ngăn không cho vi khuẩn phát triển Hoạt tính diệt khuẩn của LZD phụ thuộc vào nồng độ Điều này có nghĩa là nồng độ cao hơn của thuốc có hiệu quả hơn trong việc tiêu diệt vi khuẩn [35]
1.2.2 Các cơ chế kháng LZD
1.2.2.1 Cơ chế kháng LZD thông qua đột biến
Đột biến ở gene 23S rRNA là cơ chế kháng LZD phổ biến nhất ở staphylococci Các đột biến có thể kể đến G2576T, T2500A, C2461T, or G2447T, … [36, 37] Một đánh giá có hệ thống đã phát hiện ra rằng đột biến phổ biến nhất gây ra tình trạng kháng LZD là G2576T
Đột biến này được tìm thấy ở 63,5% các chủng S aureus kháng linezolid (Linezolid
resistant Staphylococcus aureus - LRSA) khi tổng hợp số liệu từ các bài báo khác [38] Thời gian để chủng vi khuẩn đạt được khả năng kháng trong khoảng từ 20 tới 48,9 tháng tiếp xúc nhưng cũng có thể trong vòng 2 tuần [38, 39] Những đột biến này thường xảy ra do đột biến tự nhiên hoặc tái tổ hợp nội bộ gene và thường không thông qua việc chuyển gene ngang
Trong những năm gần đây, các nhà khoa học đã xác định được một cách khác khiến vi khuẩn có thể kháng lại LZD Điều này là thông qua các đột biến trong protein L3 ribosome Protein L3 nằm trên bề mặt của ribosome, nhưng một phần của nó kéo dài đến PTC (trung tâm peptidyl transferase), là nơi LZD liên kết Đột biến trong protein L3 có thể thay đổi hình dạng của PTC, khiến LZD khó liên kết hơn [40] Bốn đột biến khác nhau đã được tìm
thấy trong protein ribosome L4 trong một nghiên cứu khác về các chủng S epidermidis
Trang 26kháng LZD Trong đó, đột biến K68Q trên protein L4 được tìm thấy trong nghiên cứu chọn
lọc S aureus đề cập ở trên được cho là có vai trò kháng thuốc [36] (Hình 1.2)
Hình 1.2: Những đột biến trên khu vực ribosome đích (gồm 23S RNA, protein L3,
L4) của kháng sinh LZD [36]
1.2.2.2 Cơ chế kháng LZD qua thu nhận gene kháng
Bên cạnh các đột biến gây ra tính kháng, sự hiện diện của một số gene gây ra tính kháng
LZD ở staphylococci đã được mô tả Gene cfr mã hóa enzyme methyltransferase xúc tác
quá trình methyl hóa adenosine ở vị trí 2503 trong 23S rRNA Quá trình methyl hóa này xảy ra trong vị trí liên kết chồng lấp của phenicols, lincosamid, oxozolidinone, pleuromutilin và streptogramin A (Hình 1.3) Quá trình methyl hóa vị trí này ngăn không cho các kháng sinh trên liên kết với mục tiêu của chúng từ đó tạo ra khả năng kháng Kiểu hình kháng thuốc
này được gọi là PhLOPSA [5, 41-43] Các nghiên cứu in vitro sử dụng plasmid tương đồng
với pSCFS7 đã chỉ ra rằng các cơ chế chuyển gene ngang, chẳng hạn như tiếp hợp và tải
nạp, có liên quan đến việc truyền các plasmid này giữa các chủng CoNS và S aureus [42] Tuy nhiên không phải cứ có gene cfr là vi khuẩn mặc định có thể kháng LZD Một nghiên cứu ở Italy cho thấy các phiên bản gene cfr bị dịch khung đã được tái tổ hợp vào
Trang 27chromosome không tạo tính kháng LZD cho vi khuẩn [44] Gần đây người ta cũng phát hiện
kiểu hình nhạy nhóm kháng sinh PhLOPSA do một đột biến Q148K trên gene cfr gây nên Tuy nhiên các chủng vi khuẩn này cũng mang gene kháng kháng sinh fexA đồng lây nhiễm với cfr được cho là làm giảm sức ép chọn lọc do kháng sinh của kiểu hình này [45] Protein
FexA là một thành viên của họ vận chuyển ABC, hay còn gọi là bơm tống xuất kháng sinh (efflux pump) chịu trách nhiệm bơm các chất có hại ra khỏi tế bào, trong trường hợp này là các loại kháng sinh như chloramphenicol và florfenicol
Hình 1.3: Vị trí methyl hóa của protein methyltransferase cfr dẫn tới kiểu hình
PhLOPSA [46]
Các gene kháng LZD khác là optrA và poxtA mã hóa các protein ATP-binding cassette
(ABC)-F Những protein này hoặc cung cấp tính kháng hoặc giảm sự nhạy cảm đối với oxazolidinones và phenicols bằng cách bảo vệ ribosome đích [47, 48] Cụ thể qua một
nghiên cứu gần đây phân tích tương tác protein và kháng sinh, gene potxA có thể làm gián
đoạn quá trình tổng hợp protein bằng cách làm cho đầu CCA của tRNA tại vị trí P dịch chuyển ra khỏi ribosome Sự dịch chuyển này làm cho chuỗi polypeptide mới được gắn vào dịch chuyển một axit amin, phá vỡ vị trí liên kết của kháng sinh [49] (Hình 1.4) Chúng
cũng hiện diện trên nhiều chủng vi khuẩn gây bệnh (Escherichia coli, Mycobacterium
Trang 28tuberculosis, Staphylococcus sciuri…) [50, 51] Gene kháng potxA được phát hiện vào năm
2018, sau optrA và có độ tương đồng trình tự protein với optrA là 32% Khi khảo sát tính kháng, các chủng tụ cầu hoặc cầu khuẩn mang gene kháng cfr hoặc optrA cho MIC cao hơn các chủng chỉ mang gene potxA [43, 47, 52] Gene kháng cfr, optrA và potxA thường nằm
trên các nhân tố di truyền động (plasmid, prophage, transposon,…) và có thể chuyển ngang giữa nhiều chi, loài vi khuẩn [43, 47, 52]
Hình 1.4: Cơ chế ABC-F protein giải phóng ribosome đích khỏi sự ức chế của
cho 16 chủng MRSA lâm sàng được phân lập ở Nhật Bản [42] Tất cả 16 chủng này đều có
nhân tố chuyển vị SCCmec II chứa gene mecA kháng methicillin Cụ thể, chủng S
epidermidis SE45 có thể chuyển gene cfr sang tất cả các chủng MRSA được thử nghiệm,
Trang 29trong khi việc truyền từ SE50 chỉ được quan sát thấy ở một số chủng và với hiệu quả thấp hơn Nghiên cứu lâm sàng tương tự tại Đức và Tây Ban Nha cũng đồng thuận khi cho thấy
nhiều plasmid tiếp hợp được phân lập từ loài S epidermidis [55, 56]
Các gene kháng LZD khác là optrA và poxtA mã hóa các protein ATP-binding cassette
(ABC)-F Những protein này hoặc cung cấp kháng cự hoặc giảm sự nhạy cảm đối với
oxazolidinones và phenicols bằng cách bảo vệ ribosome [47, 48] Gene optrA được xác định
lần đầu tiên trong enterococci từ cả con người và động vật vào năm 2015 [48] Kể từ đó,
gene optrA đã được tìm thấy trên cả plasmid và chromosome, trong nhiều loại vi khuẩn khác nhau, như Staphylococcus, Aerococcus, Lactococcus, Vagococcus,… [57-59] Gene
optrA cũng có số lượng biến thể trình tự đa dạng [60] Gene poxtA được mô tả lần đầu tiên
trong một MRSA lâm sàng vào năm 2018 [47] và cũng đã được tìm thấy trong
Enterococcus và Ligilactobacillus [61]
Với sự phát triển của công nghệ giải trình tự thế hệ mới, các nghiên cứu gần đây còn mở rộng ra mẫu môi trường Những con lợn béo khỏe ở Bồ Đào Nha đã được lấy mẫu phết mũi và phân lập các chủng vi khuẩn [41] Người ta phát hiện một vài chủng MRSA phổ
biến ở lợn có mang gene kháng LZD cfr và gene kháng này được tìm thấy nằm trên
plasmid, giữa ISSau9 và transposon TnpR (hay còn gọi là IS21-558) Nói cách khác, gene
cfr này không những có thể chuyển thông qua plasmid mà còn có thể tái tổ hợp với bộ gene
vi khuẩn Điều này làm dấy lên lo ngại về những dịch bệnh truyền nhiễm từ gia súc sẽ ngày càng nguy hiểm hơn [41] Phân tích metagenomic mẫu sinh phẩm lấy từ các nông trại ở Trung Quốc cho thấy tính phổ quát của gene kháng và sự đồng lây nhiễm các gene kháng
florfenicol và oxazolidone (floR, cfr, và optrA) trên hệ vi sinh nông trại [62] Một biến thể của gene poxtA, được biết đến là poxtA2, gần đây đã được tìm thấy đồng vị trí với gene
cfr(D) trên một plasmid liên kết trong enterococci [63] Đáng tiếc là chưa có nhiều nghiên
cứu metagenomic hệ vi sinh bản địa Việt Nam cũng như phân tích các chủng vi sinh phân lập từ môi trường để xác định và có biện pháp ngăn chặn, giảm thiểu các dịch bệnh nguy hiểm trong tương lai
Ứng dụng giải trình tự thế hệ mới và phân tích whole genome sequencing 1.3.
Giải trình tự toàn bộ bộ gene (WGS) là một công cụ mạnh mẽ dựa trên nền tảng NGS được sử dụng để giải trình tự toàn bộ bộ gene của vi khuẩn [64] Thông tin này có thể được
Trang 30sử dụng để xác định vi khuẩn, để hiểu đặc điểm sinh học của nó và để phát triển các phương pháp điều trị mới cho các bệnh nhiễm trùng do vi khuẩn
WGS thường được thực hiện bằng các công nghệ giải trình tự thế hệ tiếp theo (NGS) Các công nghệ NGS mới gần đây (Illumina, Nanopore, DNB…) cho phép giải trình tự nhanh hơn và hiệu quả hơn nhiều so với phương pháp truyền thống (Sanger) [65-67]
Khi bộ gene đã được giải trình tự, nó có thể được lắp ráp thành một trình tự hoàn chỉnh Trình tự này sau đó có thể được so sánh với trình tự của các vi khuẩn khác để xác định vi khuẩn Trình tự này cũng có thể được sử dụng để xác định các gene liên quan đến đặc tính sinh học của vi khuẩn, chẳng hạn như các gene liên quan đến khả năng kháng kháng sinh hoặc độc lực
WGS là một công cụ có giá trị để nghiên cứu vi khuẩn Nó có thể được sử dụng để xác định vi khuẩn mới, để hiểu đặc điểm sinh học của vi khuẩn đã biết và phát triển các phương pháp điều trị mới cho các bệnh nhiễm trùng do vi khuẩn WGS là một lĩnh vực đang phát triển nhanh chóng và các ứng dụng mới cho WGS luôn được khám phá Dưới đây là một số ứng dụng phổ biến nhất của WGS trong nghiên cứu vi khuẩn:
Định danh vi khuẩn: WGS có thể được sử dụng để xác định vi khuẩn khó xác định bằng các phương pháp truyền thống, chẳng hạn như vi khuẩn mới đối với khoa học hoặc vi khuẩn kháng thuốc kháng sinh [68]
Dịch tễ học vi khuẩn: WGS có thể được sử dụng để theo dõi sự lây lan của vi khuẩn và xác định các đợt bùng phát [69]
Sự tiến hóa của vi khuẩn: WGS có thể được sử dụng để nghiên cứu sự tiến hóa của vi khuẩn và xác định các gene chịu trách nhiệm cho những thay đổi trong quần thể vi khuẩn [70]
Khám phá thuốc kháng sinh: WGS có thể được sử dụng để xác định các mục tiêu mới cho thuốc kháng sinh và phát triển các loại thuốc mới để điều trị nhiễm trùng do vi khuẩn [71]
WGS là một công cụ mạnh mẽ có tiềm năng cách mạng hóa cách các nhà sinh học tiếp cận với sinh giới Khi chi phí của WGS tiếp tục giảm, nó có thể sẽ được sử dụng rộng rãi hơn nữa trong nghiên cứu vi khuẩn
Trang 312 VẬT LIỆU – PHƯƠNG PHÁP NGHIÊN CỨU
Sơ đồ nghiên cứu 2.1.
Từ vấn đề được đặt ra trong mục ĐẶT VẤN ĐỀ và thông tin trong mục TỔNG QUAN TÀI LIỆU, nghiên cứu được tiến hành với các mục tiêu sau:
Lắp ráp và chú giải bộ gene thô của 1 số chủng Staphylococcus sp được phân lập từ
môi trường (thực phẩm, cơ sở chăn nuôi) Phân tích gene độc lực, gene kháng và đột biến kháng trên bộ gene Phân tích MGE, cụ thể là plasmid, transposon và IS có thể có So sánh plasmid, cụm trình tự mang gene kháng để truy vết nguồn gốc
Hình 2.1: Sơ đồ nghiên cứu từ bước thu mẫu tới phân tích tin sinh
Vật liệu, máy móc 2.2.
2.2.1 Nguồn mẫu môi trường
Mẫu thực phẩm: mẫu thịt động vật (heo, bò, gà, vịt) thu nhận từ các chợ tại Tp.HCM
Trang 32 Mẫu thu từ cơ sở chăn nuôi động vật: bao gồm mẫu phết mũi động vật, mẫu chất thải động vật, mẫu phết chuồng trại và nước thải chuồng trại của một số cơ sở và hộ nuôi heo, bò, gà, vịt tại tỉnh Bình Dương từ tháng 6 đến tháng 12/2023
2.2.2 Môi trường phân lập và kit sinh hóa sử dụng
Môi trường phân lập Staphylococci: Môi trường Mannitol salt agar (MSA medium)
Kit định danh sinh hóa: API Staph Identification kit (bioMérieux)
2.2.3 Kit tách chiết và máy giải trình tự
kit NEBNext Ultra II DNA Library Prep Máy giải trình tự MiniSeq paired-end 2x150bp
2.3.1 Thu mẫu, phân lập vi khuẩn, xác định kháng sinh đồ và định danh sinh hóa
Các mẫu môi trường bao gồm: mẫu thịt thu mua ở các chợ; mẫu phết trực tiếp trên động vật hay chuồng trại từ các cơ sở chăn nuôi heo, bò, gà, vịt được tiến hành thu nhận cho nghiên cứu Mẫu sau thu nhận được nuôi cấy, phân lập trên môi trường MSA đặc hiệu cho nhóm staphylococci để phân lập các dòng vi khuẩn quan tâm Đặc điểm kháng LZD của các chủng vi khuẩn được đánh giá bằng phương pháp đặt đĩa giấy kháng sinh và xác định nồng độ ức chế tối thiểu (MIC) bằng phương pháp vi pha loãng Sau đó các mẫu vi khuẩn xác định kháng LZD được định danh sinh hóa bằng API Staph Identification kit (bioMérieux) Các chủng staphylococci kháng LZD được bảo quản và tách chiết DNA bộ gene để thực hiện giải trình tự bộ gene (Bảng 2.1) Quy trình thu mẫu, phân lập, xác định kháng sinh đồ và định danh sinh hóa được tiến hành bởi bộ phận thực nghiệm của nhóm nghiên cứu
Trang 33Bảng 2.1: Thông tin các mẫu vi khuẩn phân lập có tính kháng LZD
Mẫu Ngày thu
2.3.2 Tách chiết DNA và giải trình tự
DNA bộ gene được tách chiết bằng kit ZymoBIOMICS DNA/RNA Miniprep Kit (Zymo) theo hướng dẫn của nhà sản xuất và kiểm tra chất lượng bằng Nanodrop Sau đó mẫu DNA được tiến hành tạo thư viện (phân cắt bởi các fragmentase, gắn adapter, index và nhân bản bằng PCR) bằng bộ kit NEBNext Ultra II DNA Library Prep kit for Illumina (NEB) Quy trình tạo thư viện được tiến hành theo hướng dẫn của nhà sản xuất Các thư viện sau đó được giải trình tự bằng kỹ thuật giải trình tự thế hệ mới (Next generation sequencing, NGS) trên hệ thống Illumina với chiều dài đoạn giải 2 x 150 bp Dữ liệu giải trình tự gốc được đánh giá các thông số Q30, dung lượng đạt yêu cầu đề ra trước khi phân tích Quy trình tách chiết DNA và giải trình tự được thực hiện bởi bộ phận thực nghiệm, công ty TNHH KTest
Trang 342.3.3 Phân tích tin sinh
2.3.3.1 Lắp ráp bộ gen, chú giải và định danh
Dữ liệu giải trình tự thô được tinh sạch bằng công cụ Fastp v0.23.1 [72] Các nucleotide có chất lượng giải không tốt, không đáng tin cậy hoặc không xác định được (nucleotide loại N) sẽ bị loại bỏ dựa vào giá trị Phred-score ghi nhận ở từng nucleotide (Illumina)
Các read sau khi được “tinh sạch” sẽ được lắp ráp de novo bằng công cụ Unicycler v0.4.8 [73] Chất lượng lắp ráp de novo được đánh giá thông qua công cụ Quast v5.2.0 [74]
và việc sắp gióng cột cục bộ các read lên các contig lắp ráp được Điều này cho phép phát hiện các vùng có giá trị độ phủ sâu thấp bất thường so với các vùng lân cận Đây là các vùng cần được lưu ý trong kết quả lắp ráp Cuối cùng, công cụ CheckM v1.2.1 [75] được dùng để kiểm tra chất lượng và độ hoàn chỉnh của kết quả lắp ráp
Bản lắp ráp sau đó sẽ được chú giải bằng hệ thống chú giải Prokka v1.14.6 để chú giải các contig lắp ráp được [76] Database được sử dụng là mặc định, bao gồm ISfinder, NCBI Bacterial Antimicrobial Resistance Reference Gene Database và UniProtKB (SwissProt) với version đi theo version của công cụ
Định danh vi khuẩn mục tiêu được thực hiện với công cụ GTDB-tk v2.1.1 và CSDL GTDB release 207 cập nhật chuyên dùng cho prokaryote [68]
2.3.3.2 Phân tích sơ lược plasmid và các nhân tố chuyển vị
Dữ liệu bộ gene được sắp gióng với CSDL curated plasmid bằng thuật toán BLAST, từ đó xác định plasmid và các vùng chú giải quan trọng với công cụ MOB-suite v3.1.0 [77] Sau đó, trình tự bộ gene cung cấp được phân tích các vùng integron với công cụ Integron_Finder v2.0.2 [78] Các trình tự plasmid sẽ được tách biệt bằng công cụ MOB-suite và chú giải bằng công cụ Bakta v1.6.1 [79] Kết quả phân tích sơ lược này chỉ có giá trị tham khảo để đưa ra các chiến lược phân tích mở rộng phù hợp nên không được trình bày trong nghiên cứu
2.3.3.3 Phân tích gene kháng kháng sinh và gene độc lực
Để tìm gene kháng trên các CSDL, dữ liệu bộ gene được phân tích bằng công cụ ABRicate v1.0.1 [80] kết quả chú giải và phối kiểm với công cụ RGI v6.0.2 trên database Comprehensive Antibiotic Resistance Database (CARD) online [81]
Trang 35Dữ liệu bộ gene cũng được chú giải mở rộng bằng công cụ Bakta v1.6.1 và trích xuất, phân tích những đặc tính gene gây độc trên CSDL Virulence factor database (VFDB)
2.3.3.4 Lắp ráp cải thiện plasmid
Dữ liệu lắp ráp bộ gene bằng read ngắn được gọi là draft genome do thông tin trong read ngắn không đủ để nối các contig tại các vùng lặp lại hoặc do thiếu vùng trình tự giàu GC, khó tách chiết Điều này cũng đúng với chromosome và hầu hết các plasmid cỡ lớn tầm 50kb trở lên [82] Để đóng vòng được plasmid mang gene mục tiêu, chúng tôi xem xét đồ thị lắp ráp *.gfa của bộ gene thô dựa trên hướng dẫn của Bandage v0.8.1 và phương pháp của nghiên cứu trước đây [83]
Cụ thể các contig plasmid được coi là cấu trúc đóng vòng nếu phép so khớp BLASTN ở hai đầu contig chồng lấn nhau bởi ≥50bp, cho thấy đồng nhất trình tự 100% và là duy nhất
trong contig (không phải vùng lặp lại) Với các mẫu có gene cfr hay optrA nằm trên contig
chưa thể đóng vòng, từ đồ thị lắp ráp, chúng tôi sử dụng Bandage v0.8.1 để mô phỏng và suy ra khả năng kết nối của bất kỳ nút contig (node) nào được liên kết với nút contig chứa
cfr/optrA ở mức độ xa nhất có thể dựa trên các mối liên kết contig và thống kê độ phủ dọc
của các contig riêng lẻ [84] Độ phủ sâu (depth) contig cao (>2 lần) so với độ phủ sâu đối với các contig được biết là thuộc chromosome đã được sử dụng làm dấu hiệu đại diện cho các trình tự liên quan đến các vùng đa bản sao hoặc plasmid Đối với các nút contig có độ bao phủ cao này, khả năng kết nối của bất kỳ nút nào được liên kết với contig chứa
cfr/optrA được xác định dựa trên tính nhất quán của độ phủ sâu giữa các nút đó
Để thẩm định các plasmid được đóng vòng bằng Bandage v0.8.1, chúng tôi tiến hành: Xác định bộ khung plasmid gần nhất bằng công cụ BLASTN online trên CSDL
genbank 24/5/2024 và Mash v2.3 trên CSDL PLSDB 2023_11_03_v2 [85, 86] Sử dụng công cụ Bakta v1.6.1 để chú giải các đặc tính của plasmid [79, 84] Từ
đó chúng tôi sử dụng Geneious v9.0.2 để xem xét các cấu trúc đặc trưng của
plasmid như vùng Ori, các gene rep,…
Ánh xạ read đã lắp ráp lên contig vừa được đóng vòng bằng công cụ BWA v0.7.17 và samtools v1.15 và cũng dùng Geneious v9.0.2 để đánh giá những vùng có độ phủ bất thường và đánh giá độ đúng của phép đóng vòng [87-89]
Trang 36 Thực hiện lắp ráp lại (re-assembly) bằng công cụ Unicycler v0.4.8 các read ánh xạ lên trình tự plasmid cải thiện để kiểm tra tính đồng thuận của đồ thị lắp ráp [90, 91]
2.3.3.5 Phân tích IS và các vùng chuyển vị
Để phân tích các nhân tố chuyển vị và vùng IS, chúng tôi dò tìm các cấu trúc IS hoặc gene có liên quan chuyển vị (transposase, integrase,…) dựa trên chú giải của Bakta v1.6.1 Chúng tôi cũng sử dụng BLASTN trên IS_finder và công cụ-database mobileOG-db để phối kiểm kết quả [92, 93] Tuy nhiên các kết quả phân tích của BLASTN và mobileOG-db không cung cấp thêm thông tin mới nên không được trình bày trong nghiên cứu
2.3.3.6 So sánh các trình tự mang gene cfr và optrA với trình tự trên CSDL
Chúng tôi tải dữ liệu trình tự plasmid mang gene cfr trên CSDL NCBI cùng với thông
tin metadata Các dữ liệu bộ gene được tải này sẽ được phân tích ANI (Average nucleotide
identity) cùng với các plasmid mang gene cfr kháng LZD của các mẫu 1,2,3,7 Vì các
plasmid có thể biến động nhiều do cơ chế chuyển gene ngang, chúng tôi chọn phân tích vùng lân cận gene kháng (flanking region) 2,000bp upstream và downstream của gene [94] Dữ liệu vùng flank xung quanh các gene được trích xuất bằng công cụ Flanker v0.1.5 và so sánh ANI, phân tích heatmap và cây phả hệ ANI bằng công cụ ANIclustermap v1.3.0 [95, 96] Cây phả hệ ANI được mô phỏng bằng iTOL v6 toolkit và iTOL server [97]
Chúng tôi tiến hành tương tự cho quá trình phân tích gene optrA trên các mẫu 2,3,5,6 Các trình tự cluster gene optrA được tải trên CSDL NCBI cùng với thông tin metadata Các
cluster gene này hầu hết được trích xuất từ những chủng vi khuẩn có khả năng chuyển gene
optrA ngang [98] Vùng bao quanh optrA khảo sát được thống nhất là 7,000bp, dựa trên
khoảng cách từ gene optrA đến các gene transposase chúng tôi quan sát được từ các trình tự
cluster gene trên Vùng bao quanh này được phân tích bằng công cụ Flanker và ANIclustermap tương tự như trên
Dựa trên kết quả phân tích ANI vùng bao quanh và xác định plasmid bộ khung, chúng tôi chọn ra được các plasmid hoặc cụm gene tiềm năng để so sánh cụm gene Chúng tôi sử dụng webserver CAGECAT-v1.0.0 với công cụ Clinker hỗ trợ trong việc trích xuất, so sánh
và vẽ hình các cấu trúc cụm gene [99] Với phân tích gene cfr, chúng tôi so sánh trình tự
plasmid mẫu với nhau, với các plasmid tương đồng trong cụm (được xác nhận bằng ANI) và
Trang 37với plasmid bộ khung tham chiếu (được xác nhận bằng BLASTN và Mash ở mục 2.3.3.4)
Với phân tích gene optrA, chúng tôi tiến hành so sánh clinker trên tất cả các mẫu và trình tự
được tải về từ NCBI để đánh giá mối quan hệ liên kết giữa các cụm gene đã được phân lập Các trình tự trên CSDL được tải để so sánh được trình bày trong PHỤ LỤC A
2.3.3.7 Sắp gióng cột gene cfr và optrA với trình tự mang chức năng
Để đánh giá các gene cfr và optrA có sự sai biệt nào so với trình tự tham chiếu có hoạt
tính kháng không, chúng tôi thực hiện sắp gióng cột toàn bộ đa trình tự (Multiple sequence alignment-global mode) bằng phần mềm MUSCLE v3.8.425 [100] Chúng tôi sử dụng platform Geneious v9.0.2 để biểu diễn kết quả và xác định các đột biến điểm có thể ảnh hưởng tới chức năng gene [88]
2.3.3.8 Phân tích các đột biến gene khác gây ra tính kháng LZD
Để đánh giá các đột biến điểm tạo tính kháng, chúng tôi sử dụng công cụ Amrfinder plus v3.11.26 trên server usegalaxy.eu với input là trình tự bộ gene thô của mỗi mẫu [101] Amrfinder truy xuất dữ liệu đột biến kháng trên CSDL amrfinderplus_V3.11_2022-12-19.1, trong đó có các đột biến kháng LZD được đề cập trong y văn [36, 38, 40] Sau đó chúng tôi sử dụng 1 script in-house để khu trú kết quả của gene 23S ribosome, gene L3, L4 50S ribosome
Trang 38
3 KẾT QUẢ VÀ THẢO LUẬN
Kết quả phân tích draft genome (xử lý dữ liệu, lắp ráp, chú giải) 3.1.
Hầu hết dữ liệu giải trình tự đều có trên 99% base chất lượng Q30 Dung lượng giải của mỗi mẫu từ 200-500 MB Các thông số khác đều đạt chất lượng để đưa vào quy trình lắp ráp (Bảng 3.1)
Bảng 3.1: Thông số giải trình tự thô
Sample Name
% Duplication
Mb Q30 bases
Reads After Filtering
GC content % PF
% Adapter
% Unclassified
Staphylococcus là 2-3Mbp (Bảng 3.2) Kết quả CheckM đánh giá các bộ gene đều hoàn
chỉnh >98% và chỉ số nhiễm <2% Tất cả bộ gene đều có độ phủ trung bình > 60X Với các thông số chất lượng trên, chúng tôi đánh giá tất cả bộ gene thô đều đạt chuẩn cho việc chú giải và các phân tích sau [64, 75]
Trang 39Bảng 3.2: Thông số genome được lắp ráp
Largest contig 568,802 531,302 531,301 525,640 182,996 372,605 Total length 2,735,292 2,697,537 2,676,926 2,683,601 2,064,800 2,722,090
Bảng 3.3: Kết quả chú giải bằng Prokka v1.14.6
Metric/Features Mau_1 Mau_2 Mau_3 Mau_5 Mau_6 Mau_7
CDS: 2,581 2,569 2,534 2,539 1,868 2,600 gene: 2,639 2,630 2,597 2,596 1,923 2,662
Kết quả định danh bằng công cụ GTDB-tk cho thấy cả 5/6 bộ gene vi khuẩn này thuộc
CoNS Chỉ có mẫu 6 thuộc loài Aerococcus urinaeequi Theo định danh cũ thì loài này cũng
Trang 40thể các loài S ureilyticus được định danh sinh hóa là S cohnii, còn S arlettae lại được xác định là S xylosus Điều này có thể hiểu vì các loài trong cùng chi Staphylococcus có mối quan hệ khá gần với nhau (đặc biệt S urelyticus có tên định danh cũ là S cohnii subsp
urealyticus corrig ) Ngoài ra khả năng định danh đúng của kit định danh sinh hóa API
Staph là từ trung bình đến thấp nếu so sánh với các phương pháp định danh phân tử (như WGS) [102] Vì vậy, chúng tôi lấy kết quả định danh WGS là kết quả chính thức của mỗi mẫu (Bảng 3.4)
Bảng 3.4: Bảng định danh các mẫu bằng phương pháp sinh hóa và WGS
APIStaph (%ID)
Identification by WGS
(%ANI) Mau_1