Một loạt các công cụ và phần mềm tin sinh chuyên dụng (SOAPdenovo, SOAPaligner, MetaGene Annotator và BLASTall) đã được sử dụng để phân tích và khai thác dữ liệu DNA metagenome hệ vi khuẩn ruột mối C. gestroi trên một số cơ sở dữ liệu (NCBI genome vi khuẩn, genome nấm, dữ liệu NR, KEGG và eggNOG) trong nghiên cứu này.
SOAPdenovo được sử dụng để lắp ráp lại bộ gen từ các trình tự đọc ngắn thu được trong quá trình giải trình tự gen thế hệ mới, gồm có 6 module được dùng để 1) sửa chữa các lỗi đọc trình tự; sau đó 2) xây dựng đồ thị de Bruijn để 3) lắp ghép các contig, rồi 4) kiểm tra lại kết quả lắp ráp bằng cách so sánh các contig với các trình tự
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
đọc được dùng để tạo ra nó; tiếp đến 5) tối ưu độ bao phủ và chiều dài các contig để 5) thu nhỏ các vùng gen không đọc được trình tự [43].
Phần mềm MetaGene Annotator (MGA) được sử dụng để dự đoán tất cả các loại gen của sinh vật nhân sơ (gồm có thể tiền thực khuẩn, vi khuẩn và cổ khuẩn) từ tập hợp các dữ liệu trình tự genome chưa biết. MGA có thể thiết lập mô hình thống kê của các gen đã biết cũng như các trình tự đưa vào để dự đoán gen. Do đó, phần mềm MGA có thể phát hiện được không chỉ những gen điển hình mà cả những gen không điển hình [54].
BLASTall (Basic Local Alignment Search Tool) là một tập hợp các chương trình tìm kiếm được thiết kế để khám phá tất cả các cơ sở dữ liệu trình tự có sẵn bất kể đó là protein hay DNA. BLAST sử dụng thuật toán tìm kiếm cục bộ heuristic và do đó có thể phát hiện ra mối liên hệ giữa các trình tự có những sự tương đồng riêng biệt. Có rất nhiều loại tìm kiếm khác nhau trên BLAST phục vụ cho những mục đích khác nhau: 1) BLASTp tìm kiếm tất cả các trình tự protein tương đồng với trình tự protein cần phân tích trong cơ sở dữ liệu protein; 2) BLASTn tìm kiếm tất cả các trình tự nucleotide tương đồng với trình tự DNA cần phân tích trong cơ sở dữ liệu DNA; 3) TBLASTn tìm trình tự protein tương đồng trong cơ sở dữ liệu DNA bằng cách dịch mỗi trình tự DNA ra tất cả 6 khung đọc mở; 4) BLASTx tìm trình tự nucleotide tương đồng trong cơ sở dữ liệu protein bằng cách dịch trình tự nucleotide cần phân tích sang tất cả 6 khung đọc mở [93]. Sau khi có được các khung đọc mở cần quan tâm, chúng tôi sử dụng công cụ tìm kiếm trình tự amino axít tương đồng trong BLASTp.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Chƣơng 3 – KẾT QUẢ VÀ THẢO LUẬN