TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH KHOA KỸ THUẬT HÓA HỌC BỘ MÔN CÔNG NGHỆ SINH HỌC NGUYỄN TRƯƠNG PHI LUẬN VĂN TỐT NGHIỆP QUY TRÌNH TINH SẠCH VÀ PHÂN TÍCH GENOME CỦA THỰC KHUẨN THỂ NHẰM PHÒNG VÀ T[.]
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH KHOA KỸ THUẬT HĨA HỌC BỘ MƠN CƠNG NGHỆ SINH HỌC NGUYỄN TRƯƠNG PHI LUẬN VĂN TỐT NGHIỆP QUY TRÌNH TINH SẠCH VÀ PHÂN TÍCH GENOME CỦA THỰC KHUẨN THỂ NHẰM PHÒNG VÀ TRỊ BỆNH GAN THẬN MỦ Ở CÁ TRA KỸ SƯ NGÀNH CƠNG NGHỆ SINH HỌC TP HỒ CHÍ MINH, 2022 TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH KHOA KỸ THUẬT HĨA HỌC BỘ MƠN CƠNG NGHỆ SINH HỌC NGUYỄN TRƯƠNG PHI – 1813508 LUẬN VĂN TỐT NGHIỆP QUY TRÌNH TINH SẠCH VÀ PHÂN TÍCH GENOME CỦA THỰC KHUẨN THỂ NHẰM PHÒNG VÀ TRỊ BỆNH GAN THẬN MỦ Ở CÁ TRA EXTRACTION AND ANALYSIS OF PHAGE GENOMES TO PREVENT AND TREAT ENTERIC SEPTICEMIA CATFISH KỸ SƯ NGÀNH CƠNG NGHỆ SINH HỌC GIẢNG VIÊN HƯỚNG DẪN PGS.TS Hồng Anh Hồng TP HỒ CHÍ MINH, 2022 TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc KHOA KỸ THUẬT HĨA HỌC BỘ MƠN CƠNG NGHỆ SINH HỌC TP HCM, ngày….tháng… năm…… NHẬN XÉT LUẬN VĂN TỐT NGHIỆP CỦA CÁN BỘ HƯỚNG DẪN Tên luận văn: QUY TRÌNH GIẢI TRÌNH TỰ VÀ PHÂN TÍCH GENOME CỦA THỰC KHUẨN THỂ NHẰM PHÒNG VÀ TRỊ BỆNH GAN THẬN MỦ Ở CÁ TRA Sinh viên thực hiện: Cán hướng dẫn: Nguyễn Trương Phi 1813508 PGS.TS Hoàng Anh Hoàng Đánh giá Luận văn Về báo cáo: Số trang Số chương _ Số bảng số liệu Số hình vẽ _ Số tài liệu tham khảo Sản phẩm _ Một số nhận xét hình thức báo cáo: Về nội dung luận văn: Về tính ứng dụng: Về thái độ làm việc sinh viên: Đánh giá chung: Luận văn đạt/không đạt yêu cầu luận văn tốt nghiệp kỹ sư, xếp loại Giỏi/ Khá/ Trung bình Điểm sinh viên: Nguyễn Trương Phi:……… /10 Cán hướng dẫn 0B (Ký tên ghi rõ họ tên) TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc KHOA KỸ THUẬT HĨA HỌC BỘ MƠN CƠNG NGHỆ SINH HỌC TP HCM, ngày….tháng… năm…… NHẬN XÉT LUẬN VĂN TỐT NGHIỆP CỦA CÁN BỘ PHẢN BIỆN Tên luận văn: QUY TRÌNH GIẢI TRÌNH TỰ VÀ PHÂN TÍCH GENOME CỦA THỰC KHUẨN THỂ NHẰM PHÒNG VÀ TRỊ BỆNH GAN THẬN MỦ Ở CÁ TRA Sinh viên thực hiện: Cán phản biện: Nguyễn Trương Phi 1813508 Đánh giá Luận văn Về báo cáo: Số trang Số chương _ Số bảng số liệu Số hình vẽ _ Số tài liệu tham khảo Sản phẩm _ Một số nhận xét hình thức báo cáo: Về nội dung luận văn: Về tính ứng dụng: Về thái độ làm việc sinh viên: Đánh giá chung: Luận văn đạt/không đạt yêu cầu luận văn tốt nghiệp kỹ sư, xếp loại Giỏi/ Khá/ Trung bình Điểm sinh viên: Nguyễn Trương Phi:……… /10 Người nhận xét 1B (Ký tên ghi rõ họ tên) TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc KHOA KỸ THUẬT HĨA HỌC BỘ MƠN CƠNG NGHỆ SINH HỌC TP HCM, ngày….tháng… năm…… ĐỀ CƯƠNG CHI TIẾT TÊN LUẬN VĂN: QUY TRÌNH GIẢI TRÌNH TỰ VÀ PHÂN TÍCH GENOME CỦA THỰC KHUẨN THỂ NHẰM PHỊNG VÀ TRỊ BỆNH GAN THẬN MỦ Ở CÁ TRA Cán hướng dẫn: PGS.TS Hoàng Anh Hoàng Thời gian thực hiện: Từ 14/02/2022 đến 10/06/2022 Sinh viên thực hiện: Nguyễn Trương Phi -1813508 Nội dung đề tài: Đề tài nhằm giải trình tự phân tích genome thực khuẩn thể để xem xét tính khả thi áp dụng vào liệu pháp thực khuẩn thể bệnh gan thận mủ Đối tượng nghiên cứu hai thực khuẩn thể M18N M26N ly giải vi khuẩn gây bệnh Edwardsiella ictaluri Kết mong muốn tìm thực khuẩn thể tìm để ứng dụng vào liệu pháp thực khuẩn thể Kế hoạch thực hiện: Chuẩn bị dụng cụ, vật liệu thí nghiệm Hoạt hóa phage M18N (Drop Assay) thu Stock Drop M18N Hoạt hóa phage M26N (Drop Assay) thu Stock Drop M26N Thu Stock Plaque M18N M26N Tách chiết DNA M18N M26N Kiểm tra DNA gửi mẫu giải trình tự Nhận liệu tiến hành phân tích tin sinh Xác nhận Cán hướng dẫn TP HCM, ngày….tháng … năm… Sinh viên DANH SÁCH HỘI ĐỒNG BẢO VỆ LUẬN VĂN Hội đồng chấm luận văn tốt nghiệp, thành lập theo Quyết định số …………………… ngày ………………… Hiệu trưởng Trường Đại học Bách khoa TP.HCM ………………………………………… – Chủ tịch ………………………………………… – Thư ký ………………………………………… – Ủy viên ………………………………………… – Ủy viên ………………………………………… – Ủy viên LỜI CẢM ƠN Khơng có thành mà khơng cần đến giúp đỡ dù hay nhiều, suốt năm đại học trường Đại học Bách Khoa thành phố Hồ Chí Minh, em nhận nhiều giúp đỡ, dẫn thầy cô bạn bè động viên từ gia đình, để từ em hồn thành luận văn tốt nghiệp Với lòng biết ơn sâu sắc, em xin cảm ơn quý Thầy Cô khoa Kỹ Thuật Hóa Học – Trường Đại Học thành phố Hồ Chí Minh dùng nhiệt huyết, đam mê để truyền lại kiến thức quý báu cho sinh viên chúng em Sau khoảng thời gian học tập nghiên cứu đó, em hồn thành luận văn tốt nghiệp mình, “Quy trình giải trình tự phân tích genome thực khuẩn thể nhằm phịng trị bệnh gan thận mủ cá tra” Để hoàn thành luận văn này, em xin phép bày tỏ lời cảm ơn với kính trọng sâu sắc đến PGS.TS.Hoàng Anh Hoàng ThS.Từ Quang Vinh – người tận tình hướng dẫn em suốt thời gian hoàn thiện luận văn Xin cảm ơn chị phịng 107B2, phịng thí nghiệm cơng nghệ sinh học Đại Học Bách Khoa, thành phố Hồ Chí Minh Chị Phạm Ngọc Quỳnh Anh, chị Lê Thị Mỹ Duyên, chị Tơ Huệ Ngọc, ba chị tận tình hướng dẫn, góp ý kỹ thuật thao tác quy trình phịng thí nghiệm cho em Mặc dù có cố gắng học tập, nghiên cứu suốt thời gian qua, song thời gian kinh nghiệm có hạn nên luận văn khơng tránh khỏi thiếu sót Kính mong nhận góp ý, bổ sung từ q Thầy Cơ quan tâm đến đề tài này, để luận văn hoàn thiện nâng cao MỤC LỤC Chương 1: Tổng quan tài liệu .2 1.1 Bệnh gan thận mủ 1.2 Vi khuẩn gây bệnh Edwardsiella ictaluri 1.3 Liệu pháp thực khuẩn thể 1.3.1 Lược sử thực khuẩn thể 1.3.2 Tổng quan liệu pháp phage 1.3.3 Vòng đời chế lây nhiễm chung phage 1.4 Các nghiên cứu liệu pháp thực khuẩn thể ngồi nước 1.5 Quy trình chung 1.6 Tạo thư viện giải trình tự 10 1.6.1 Chuẩn bị thư viện .10 1.6.2 Giải trình tự Illumina 12 1.7 Mục tiêu đề tài 14 Chương 2: Vật liệu phương pháp 15 2.1 Vật liệu 15 2.2 Hóa chất, thiết bị dụng cụ 16 a) Hóa chất mơi trường 16 b) Dụng cụ thiết bị .18 2.3 Phương pháp 19 2.3.1 Chuẩn bị thực khuẩn thể đối tượng xâm nhiễm 19 2.3.2 Hoạt hóa Drop Assay .20 2.3.3 Plaque Assay 21 10 R 4688 4912 ATG TGA hypothetical protein 11 R 4917 5093 ATG TAG hypothetical protein 12 R 5991 8309 ATG TAG Putative replicative helicase/primase 13 R 8342 8458 ATG TAA hypothetical protein 14 R 8418 8627 ATG TAA hypothetical protein 15 F 8837 9280 ATG TAA hypothetical protein 16 F 9329 9862 ATG TAG hypothetical protein 17 F 9865 10098 ATG TAA hypothetical protein 18 F 10101 11360 GTG TAA hypothetical protein 19 F 11455 12240 ATG TAA hypothetical protein 20 F 12300 14507 ATG TGA DNA polymerase I 21 F 14518 14796 ATG TGA hypothetical protein 22 F 14841 15116 ATG TAG hypothetical protein 23 F 15079 15312 TTG TGA hypothetical protein 24 F 15309 15605 ATG TGA hypothetical protein 25 F 15565 15903 ATG TAA hypothetical protein 26 F 15890 17311 ATG TGA helicase 0.0E0 P-loop NTPase super family 1.04E-20 0.0E0 DNA pol A super family 1.41E-68 Edwardsiella phage eiAU-183 Edwardsiella phage eiDWF Edwardsiella phage eiAU-183 Edwardsiella phage eiAU Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiDWF Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Escherichia phage vb_EcoS_bov11C2 Cronobacter malonaticus 0.0E0 DEAD-like helicase super family N 1.38E-77 Edwardsiella phage eiAU Edwardsiella phage eiAU-183 27 F 17308 17853 ATG TAA hypothetical protein 28 F 17881 18777 ATG TAA DNA cytosine methyltransferase 29 F 18779 19324 ATG TAA N-6-adenine-methyltransferase 30 F 19432 19635 ATG TAA hypothetical protein 31 F 19638 20000 ATG TGA hypothetical protein 32 F 19997 20278 ATG TAA hypothetical protein 33 R 20290 20547 ATG TAG hypothetical protein 34 R 20534 21055 ATG TGA hypothetical protein 35 R 21077 21442 ATG TAA hypothetical protein 36 R 21211 21405 ATG TGA hypothetical protein 37 R 21494 22144 ATG TAA hypothetical protein 38 39 R R 22278 22574 22577 24082 ATG ATG TAA TGA hypothetical protein hypothetical protein 40 R 24101 27712 ATG TAA tail fiber 41 R 27712 28308 GTG TAA putative tail assembly protein 42 R 28296 29015 ATG TAA putative minor tail protein 43 R 29020 29790 ATG TGA minor tail protein 44 R 29787 30131 ATG TGA minor tail protein 1.45426E160 1.99934E121 Cyt C5 DNA methylase 6.68E-25 super family Dam super family 1.01E-46 0.0E0 COG4733 super family 0E+00 Lambda tail I super family 1.96E-57 MPN NLPC P60 4.83E-27 Phage tail L super family 6.43E-75 Phage tail super family 7.11E-20 3.01194E104 6.25617E167 1.83314E169 1.49347E73 Edwardsiella phage eiMSLS Edwardsiella phage PVN06 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Candidatus Lokiarchaeota archaeon Edwardsiella phage eiAU-183 Edwardsiella tarda Aeromonas media Edwardsiella phage eiMSLS Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 45 R 30191 32818 ATG TGA putative bacteriotail tape measure 0.0E0 protein 46 F 33393 33743 GTG TAA hypothetical protein 47 R 33760 34086 GTG TAG hypothetical protein 48 R 34065 34421 ATG TAA hypothetical protein 49 R 34484 35203 ATG TAA putative major tail protein 50 R 35236 35664 ATG TAA hypothetical protein 51 R 35661 36287 GTG TGA hypothetical protein 52 R 36290 36646 ATG TGA phage structure protein 53 R 36627 36782 ATG TAA hypothetical protein 54 R 36785 37285 ATG TGA hypothetical protein 55 R 37348 38448 ATG TAA phage structure protein 56 R 38536 39204 ATG TAA hypothetical protein 57 R 39291 40415 ATG TAA head morphogenesis protein 0.0E0 58 R 40402 41304 ATG TGA structural protein 0.0E0 59 R 41325 41939 ATG TTG hypothetical protein 1.48057E161 COG5281 super family 5.46E-61 Phage tail super family 5.59E-30 DUF4055 8.05E-30 8.00875E81 0.0E0 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiAU Edwardsiella phage eiMSLS Edwardsiella phage eiAU-183 Edwardsiella phage eiMSLS Edwardsiella phage eiMSLS Edwardsiella phage eiMSLS Edwardsiella phage eiMSLS Edwardsiella phage eiMSLS Edwardsiella phage eiMSLS Edwardsiella phage eiMSLS Edwardsiella phage eiAU-183 Edwardsiella phage eiAU-183 Edwardsiella phage eiMSLS P3 Quy trình giải SEA-PHAGE P4 Cây định giải SEA-PHAGE71 Sau giải cấu trúc, để Có ba hướng xem xét dựa chức muốn kiểm tra genome: gene mã hóa protein, khoảng trống, gene tRNA Để có chứng chức orf, tiến hành tra trình tự protein orf BLASTP, HHPred CCD P5 Số lượng orf có chức M18N M26N Chức STT M18N M26N DNA cytosine methytransferase 1 DNA polymerase 1 head morphogenesis protein 1 helicase 1 host specificity protein M15 family metallopeptidase 1 minor tail protein 2 N-6-adenine-methyltransferase 1 phage structure protein 2 10 prophage Ip2 protein 33 11 putative bacteriotail tape measure protein 1 12 putative holin 13 putative major tail protein 1 14 putative minor tail protein 15 putative replicative helicase/primase 1 16 putative tail assembly protein 17 structure protein 1 18 tail fiber 19 terminase large subunit 1 P6 Kế hoạch tiến độ luận văn Luận văn thực 61 ngày từ 14/02/2022 đến 10/06/2022, bao gồm hai phần chính: + Thực nghiệm, tách chiết genome phage M18N M26N, gửi mẫu giải trình tự, thực phịng thí nghiệm Cơng nghệ sinh học, Đại học Bách Khoa thành phố Hồ Chí Minh Thực 27 ngày (chiếm 44% thời gian làm luận văn) + Phân tích tin sinh bao gồm ráp ráp, giải phân tích genome thực khuẩn thể Thực 16 ngày (chiếm 26% thời gian làm luận văn) TÀI LIỆU THAM KHẢO Nguyen, T T et al Diverse Bacteriophages Infecting the Bacterial Striped Catfish Pathogen Edwardsiella ictaluri Microorganisms 2021, Vol 9, Page 1830 9, 1830 (2021) John P Hawke Enteric septicemia of catfish SRAC publication 477 (2015) Salmond, G P C & Fineran, P C A century of the phage: past, present and future Nature Reviews Microbiology 2015 13:12 13, 777–786 (2015) Haq, I U., Chaudhry, W N., Akhtar, M N., Andleeb, S & Qadri, I Bacteriophages and their implications on future biotechnology: a review Virology Journal 2012 9:1 9, 1–8 (2012) Sulakvelidze, A., Alavidze, Z & Morris, J Bacteriophage therapy Antimicrobial Agents and Chemotherapy 45, 649–659 (2001) Adhya, S & Merril, C The road to phage therapy Nature 443, 754–755 (2006) Wittebole, X., de Roock, S & Opal, S M A historical overview of bacteriophage therapy as an alternative to antibiotics for the treatment of bacterial pathogens Virulence 5, (2014) Doss, J., Culbertson, K., Hahn, D., Camacho, J & Barekzi, N A Review of Phage Therapy against Bacterial Pathogens of Aquatic and Terrestrial Organisms Viruses 2017, Vol 9, Page 50 9, 50 (2017) JR, P., J, C., N, Q.-P., N, C & RP, N Bacteriophage-mediated spread of bacterial virulence genes Curr Opin Microbiol 23, 171–178 (2015) 10 Erez, Z et al Communication between viruses guides lysis–lysogeny decisions Nature 2017 541:7638 541, 488–493 (2017) 11 Yasuike, M et al Complete Genome Sequences of Edwardsiella tarda-Lytic Bacteriophages KF-1 and IW-1 Genome Announc 1, (2013) 58 12 Yasuike, M et al Complete Genome Sequence of a Novel Myovirus Which Infects Atypical Strains of Edwardsiella tarda Genome Announc 1, (2013) 13 Hoang, H A., Yen, M H., Ngoan, V T., Nga, L P & Oanh, D T H Virulent bacteriophage of Edwardsiella ictaluri isolated from kidney and liver of striped catfish Pangasianodon hypophthalmus in Vietnam Diseases of Aquatic Organisms 132, 49–56 (2018) 14 Carrias, A et al Comparative genomic analysis of bacteriophages specific to the channel catfish pathogen Edwardsiella ictaluri Virol J 8, (2011) 15 Yasuike, M et al Complete Genome Sequence of the Edwardsiella ictaluriSpecific Bacteriophage PEi21, Isolated from River Water in Japan Genome Announcements 2, (2014) 16 Yasuike, M et al Full-genome sequence of a novel myovirus, GF-2, infecting Edwardsiella tarda: comparison with other Edwardsiella myoviral genomes Archives of Virology 160, 2129–2133 (2015) 17 Cui, H et al Complete genome analysis of the novel Edwardsiella tarda phage vB_EtaM_ET-ABTNL-9 Archives of Virology 165, 1241–1244 (2020) 18 Xu, Z et al Therapeutic Efficacies of Two Newly Isolated Edwardsiella Phages Against Edwardsiella piscicida Infection Microbiological Research 127043 (2022) doi:10.1016/J.MICRES.2022.127043 19 Nguyen, T T et al Diverse Bacteriophages Infecting the Bacterial Striped Catfish Pathogen Edwardsiella ictaluri Microorganisms 2021, Vol 9, Page 1830 9, 1830 (2021) 20 Kim, S G et al Genomic characterization of bacteriophage pEt-SU, a novel phiKZ-related virus infecting Edwardsiella tarda Archives of Virology 165, 219–222 (2020) 59 21 Elkins, K M DNA extraction in Forensic DNA Biology (Academic Press, 2013) 22 Trang chủ | KTest https://www.ktest.vn/ 23 Protocol for FS DNA Library Prep Kit (E7805, E6177) with Inputs ≤100 ng | NEB https://international.neb.com/protocols/2017/10/25/protocol-for-fs-dnalibrary-prep-kit-e7805-e6177-with-inputs-less-than-or-equal-to-100-ng 24 England Biolabs, N INSTRUCTION MANUAL NEBNext ® Ultra TM II DNA Library Prep Kit for Illumina ® 25 History of Illumina Sequencing and Solexa Technology https://www.illumina.com/science/technology/next-generationsequencing/illumina-sequencing-history.html 26 Turcatti, G., Romieu, A., Fedurco, M & Tairi, A.-P A new class of cleavable fluorescent nucleotides: synthesis and optimization as reversible terminators for DNA sequencing by synthesis Nucleic Acids Research 36, e25–e25 (2008) 27 Bentley, D R et al Accurate whole human genome sequencing using reversible terminator chemistry Nature 2008 456:7218 456, 53–59 (2008) 28 Fedurco, M., Romieu, A., Williams, S., Lawrence, I & Turcatti, G BTA, a novel reagent for DNA attachment on glass and efficient generation of solidphase amplified DNA colonies Nucleic Acids Research 34, e22–e22 (2006) 29 Adessi, C et al Solid phase DNA amplification: characterisation of primer attachment and amplification mechanisms Nucleic Acids Research 28, e87– e87 (2000) 30 Hutchison, C A DNA sequencing: bench to bedside and beyond Nucleic Acids Research 35, 6227–6237 (2007) 60 31 Dohm, J C., Lottaz, C., Borodina, T & Himmelbauer, H Substantial biases in ultra-short read data sets from high-throughput DNA sequencing Nucleic Acids Research 36, e105 (2008) 32 Shendure, J & Ji, H Next-generation DNA sequencing Nature Biotechnology 2008 26:10 26, 1135–1145 (2008) 33 Whiteford, N et al Swift: primary data analysis for the Illumina Solexa sequencing platform Bioinformatics 25, 2194–2199 (2009) 34 Nguyễn, N Phân lập phân tích genome thực khuẩn thể kháng vi khuẩn gây bệnh quan trọng cá tra (2021) 35 Nguyen, T.-T et al microorganisms Diverse Bacteriophages Infecting the Bacterial Striped Catfish Pathogen Edwardsiella ictaluri (2021) doi:10.3390/microorganisms9091830 36 Gumińska, N et al Culture purification and DNA extraction procedures suitable for next-generation sequencing of euglenids Journal of Applied Phycology 30, 3541–3549 (2018) 37 Isoamyl alcohol | C5H12O - PubChem https://pubchem.ncbi.nlm.nih.gov/compound/31260 38 Chloroform | CHCl3 - PubChem https://pubchem.ncbi.nlm.nih.gov/compound/6212 39 Phenol | C6H5OH - PubChem https://pubchem.ncbi.nlm.nih.gov/compound/996#section=AgrochemicalInformation 40 Sambrook, J , E F F and T M Molecular Cloning: A Laboratory Manual vol (1998) 41 K Barker Phenol-Chloroform Isoamyl Alcohol (PCI) DNA extraction in At the Bench (1998) 61 42 Babraham Bioinformatics - FastQC A Quality Control tool for High Throughput Sequence Data https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ 43 Rihtman, B., Meaden, S., Clokie, M R J., Koskella, B & Millard, A D Assessing Illumina technology for the high-throughput sequencing of bacteriophage genomes PeerJ 2016, e2055 (2016) 44 Shen, A & Millard, A Phage Genome Annotation: Where to Begin and End https://home.liebertpub.com/phage 2, 183–193 (2021) 45 Bushnell, B., Rood, J & Singer, E BBMerge – Accurate paired shotgun read merging via overlap PLoS ONE 12, (2017) 46 lh3/seqtk: Toolkit for processing sequences in FASTA/Q formats https://github.com/lh3/seqtk 47 Bankevich, A et al SPAdes: A New Genome Assembly Algorithm and Its Applications to Single-Cell Sequencing Journal of Computational Biology 19, 455 (2012) 48 Wick, R R., Schultz, M B., Zobel, J & Holt, K E Bandage: interactive visualization of de novo genome assemblies Bioinformatics 31, 3350–3352 (2015) 49 Langmead, B & Salzberg, S L Fast gapped-read alignment with Bowtie Nat Methods 9, 357 (2012) 50 Li, H et al The Sequence Alignment/Map format and SAMtools Bioinformatics 25, 2078–2079 (2009) 51 Robinson, J T et al Integrative Genomics Viewer Nat Biotechnol 29, 24 (2011) 62 52 Okonechnikov, K., Conesa, A & García-Alcalde, F Qualimap 2: advanced multi-sample quality control for high-throughput sequencing data Bioinformatics 32, 292–294 (2016) 53 Walker, B J et al Pilon: An Integrated Tool for Comprehensive Microbial Variant Detection and Genome Assembly Improvement PLOS ONE 9, e112963 (2014) 54 Altschul, S F., Gish, W., Miller, W., Myers, E W & Lipman, D J Basic local alignment search tool J Mol Biol 215, 403–410 (1990) 55 Sullivan, M J., Petty, N K & Beatson, S A Easyfig: a genome comparison visualizer Bioinformatics 27, 1009 (2011) 56 Garneau, J R et al High-throughput identification of viral termini and packaging mechanisms in virome datasets using PhageTermVirome Scientific Reports 2021 11:1 11, 1–9 (2021) 57 Rangel-Pineros, G et al From Trees to Clouds: PhageClouds for Fast Comparison of ∼640,000 Phage Genomic Sequences and Host-Centric Visualization Using Genomic Network Graphs https://home.liebertpub.com/phage 2, 194–203 (2021) 58 Besemer, J & Borodovsky, M GeneMark: web software for gene finding in prokaryotes, eukaryotes and viruses Nucleic Acids Research 33, W451 (2005) 59 Zimmermann, L et al A Completely Reimplemented MPI Bioinformatics Toolkit with a New HHpred Server at its Core Journal of Molecular Biology 430, 2237–2243 (2018) 60 Lu, S et al CDD/SPARCLE: the conserved domain database in 2020 Nucleic Acids Research 48, D265 (2020) 61 Bioinformatics Guide https://seaphagesbioinformatics.helpdocsonline.com/home 63 62 VFDB: Virulence Factor Database http://www.mgc.ac.cn/VFs/ 63 Alcock, B P et al CARD 2020: antibiotic resistome surveillance with the comprehensive antibiotic resistance database Nucleic Acids Res 48, D517– D525 (2020) 64 Alikhan, N F., Petty, N K., ben Zakour, N L & Beatson, S A BLAST Ring Image Generator (BRIG): Simple prokaryote genome comparisons BMC Genomics 12, 1–10 (2011) 65 Edgar, R C MUSCLE: multiple sequence alignment with high accuracy and high throughput Nucleic Acids Research 32, 1792 (2004) 66 Trifinopoulos, J., Nguyen, L T., von Haeseler, A & Minh, B Q W-IQTREE: a fast online phylogenetic tool for maximum likelihood analysis Nucleic Acids Research 44, W232–W235 (2016) 67 Letunic, I & Bork, P Interactive Tree Of Life (iTOL) v5: an online tool for phylogenetic tree display and annotation Nucleic Acids Research 49, W293– W296 (2021) 68 Desjardins, P & Conklin, D NanoDrop Microvolume Quantitation of Nucleic Acids JoVE (Journal of Visualized Experiments) e2565 (2010) doi:10.3791/2565 69 Rihtman, B., Meaden, S., Clokie, M R J., Koskella, B & Millard, A D Assessing Illumina technology for the high-throughput sequencing of bacteriophage genomes PeerJ 2016, e2055 (2016) 70 Xu, J., Hendrix, R W & Duda, R L Conserved translational frameshift in dsDNA bacteriophage tail assembly genes Mol Cell 16, 11–21 (2004) 71 Annotation Overview https://seaphagesbioinformatics.helpdocsonline.com/untitled-5 64