Những contig của hệ gen được thực hiện dự đốn bằng hai phần mềm là Prodigal (Hyatt và cs., 2010); GeneMarkS (Besemer và cs., 2001). Đối với Prodigal và GeneMarkS các thơng số được mặc định cho đối tượng vi khuẩn. Để chọn ra những gen để đảm bảo độ tin cậy, những gen cĩ trình tự tương đồng 100% giữa kết quả của cả 2 phần mềm được lọc để sử dụng cho các phân tích tiếp theo.
Các gen sau khi dự đốn được chú giải trên cơ sở dữ liệu NR (non- redundant) bằng phần mềm Blast ++ [83] với e-value = 1e-6. Những kết quả tương đồng trên cơ sở dữ liệu NR tiếp tục được chú giải trên cơ sở dữ liệu GO (Gene Ontology) (Ashburner và cs., 2000) và KEGG (Kyoto Encyclopedia of Genes and Genomes) (Kanehisa và Goto, 2000) bằng phần mềm Blast2GO (Conesa và cs.,2005) với các thơng số mặc định. AntiSMASH (antibiotics and secondary metabolite analysis shell) là phần mềm chạy từ web server tìm các cụm gen tham gia vào con đường sinh tổng hợp enzym bằng thuật tốn profile hidden Markov model (pHMM) (Weber và cs., 2015). AntiSMASH sẽ dự đốn bằng Prodigal với vi khuẩn đã tích hợp sẵn. NaPDos là cơng cụ phát hiện và phân tích nhanh các gen chuyển hĩa thứ cấp. Cơng cụ này được thiết kế và phát hiện domain C và KS từ dữ liệu DNA hoặc axit amin. Các domain chuyển hĩa thứ cấp được xác định bằng so sánh trình tự với tập hợp các gen tham chiếu từ các con đường hĩa học. Trình tự gen được tiên đốn sản phẩm tạo thành và xác định những sản phẩm này cĩ thể tạo ra những chất tương tự hay các con đường sinh tổng hợp đã biết.
Bản đồ đồ họa của hệ gen trịn được tạo bằng PATRIC (Wattam và cộng sự) [84]. Trình tự hệ gen dự thảo được gửi vào cơ sở dữ liệu GenBank (NCBI) theo số gia nhập: JAFGYF000000000
Phân tích sự giống nhau của tồn bộ hệ gen
Để phân loại chủng MP1 đến cấp độ lồi, sự tương đồng của tồn bộ hệ gen được tính tốn nhận dạng nucleotide trung bình (ANI) và lai DNA-DNA kỹ thuất sơ (dDDH) đã được thực hiện.ANI được tính tốn bằng cách sử dụng nhận dạng nucleotide trung bình trực giao (OrthoANI) [85]. Dữ liệu trình tự bộ gen MP1 đã được tải lên máy chủ để phân tích phân loại (http://tygs.dsmz.de).
Hệ gen so sánh và dự đốn hoạt tính Carbohydrate giũa chủng MP1 và 3 lồi
C.cellulans khác cĩ trong GenBank, bao gồm J36 (NZ_JAGJ01000000.1).