Nghiên cứu gen mã hóa Enzyme tham gia thủy phân Cellulose từ khu hệ vi khuẩn ruột mối bằng kỹ thuật Metagenomics

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Nguyễn Thị Thảo NGHIÊN CỨU GEN MÃ HÓA ENZYME THAM GIA THỦY PHÂN CELLULOSE TỪ KHU HỆ VI KHUẨN TRONG RUỘT MỐI BẰNG KỸ THUẬT METAGENOMICS LUẬN ÁN TIẾN SĨ SINH HỌC Hà Nội - Năm 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Nguyễn Thị Thảo NGHIÊN CỨU GEN MÃ HÓA ENZYME THAM GIA THỦY PHÂN CELLULOSE TỪ KHU HỆ VI KHUẨN RUỘT MỐI BẰNG KỸ THUẬT METAGENOMICS LUẬN ÁN TIẾN SĨ SINH HỌC Chuyên ngành: Di truyền học Mã số: 62 42 01 21 NGƯỜI HƯỚNG DẪN KHOA HỌC: GS TS Trương Nam Hải TS Đỗ Thị Huyền Hà Nội - Năm 2015 LỜI CAM ĐOAN Tôi xin cam đoan: Đây công trình nghiên cứu số kết cộng tác với cộng khác Các số liệu kết trình bày luận án trung thực, phần công bố tạp chí khoa học chuyên ngành với đồng ý cho phép đồng tác giả Phần lại chưa tác giả công bố công trình khác Hà Nội, ngày tháng năm 2015 Tác giả Nguyễn Thị Thảo LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc tới GS.TS Trương Nam Hải TS Đỗ Thị Huyền phòng Kỹ thuật di truyền, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học Công nghệ Việt Nam thu nhận, hướng dẫn tận tình, quan tâm tạo điều kiện cho hoàn thành luận án Luận án thực phòng Kỹ thuật di truyền Phòng Thí nghiệm trọng điểm Công nghệ Gen, Viện Công nghệ sinh học, Viện Hàn lâm Khoa học Công nghệ Việt Nam hỗ trợ đề tài Nghị định thư với Nhật Bản: “Phân lập hệ gen mã hóa cho enzyme thủy phân lignocellulose từ khu hệ vi sinh ruột mối Việt Nam kỹ thuật Metagenomics” Trong thời gian học tập nghiên cứu phòng Kỹ thuật di truyền, nhận giúp đỡ bảo tận tình chuyên môn tập thể cán nghiên cứu phòng Tôi xin chân thành cảm ơn giúp đỡ quý báu đó! Tôi xin bày tỏ lòng cảm ơn sâu sắc đến thầy cô giáo Khoa Sinh học, Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội giảng dạy bảo cho kiến thức chuyên môn kỹ cần thiết Để hoàn thành luận án, nhận nhiều giúp đỡ quý báu nhiệt tình đồng nghiệp công tác khoa Sinh học, Trường Đại học Vinh, xin chân thành cảm ơn giúp đỡ quý báu đó! Với tất lòng biết ơn, xin dành cho gia đình, bố mẹ, chồng con, người thân thông cảm, động viên, tạo điều kiện chia sẻ khó khăn thời gian qua! Nguyễn Thị Thảo MỤC LỤC MỞ ĐẦU 14 Tính cấp thiết đề tài 18 Mục tiêu đề tài 20 Đối tượng phạm vi nghiên cứu 20 Nội dung nghiên cứu 20 Ý nghĩa khoa học thực tiễn đề tài 20 Đóng góp đề tài 20 Chƣơng TỔNG QUAN TÀI LIỆU 21 1.1 GIỚI THIỆU CHUNG VỀ LIGNOCELLULOSE 21 1.1.1 Cellulose 22 1.1.2 Hemicellulose 23 1.1.3 Lignin 24 1.2 GIỚI THIỆU CHUNG VỀ CELLULASE 24 1.2.1 Cơ chế hoạt động cellulase thủy phân cellulose 24 1.2.2 Cấu trúc cellulase 26 1.2.2.1 Cấu trúc chung cellulase 26 1.2.2.2 Cellulosome thủy phân cellulose 27 1.3 CELLULASE CỦA VI KHUẨN 28 1.3.1 Sơ lược họ cellulase 28 1.3.2 Cellulase vi khuẩn vi khuẩn cổ 30 1.3.2.1 Cellulase vi khuẩn vi khuẩn cổ ưa ấm 30 1.3.2.2 Cellulase vi khuẩn vi khuẩn cổ ưa nhiệt 31 1.3.3 Ứng dụng cellulase 31 1.3.3.1 Ứng dụng cellulase công nghệ sản xuất bia, rượu vang, chế biến thực phẩm thức ăn 32 1.3.3.2 Ứng dụng cellulase dệt may 33 1.3.3.3 Ứng dụng cellulase chế biến bột giấy giấy 33 1.3.3.4 Ứng dụng cellulase sản xuất cồn sinh học 34 1.4 MỐI VÀ HỆ VI SINH VẬT RUỘT MỐI LIÊN QUAN ĐẾN SỰ THỦY PHÂN LIGNOCELLULOSE 35 1.4.1 Sơ lược mối đa dạng mối Việt Nam 35 1.4.2 Hệ vi sinh vật ruột mối bậc thấp 36 1.4.3 Sự tiêu hóa lignocellulose mối 38 1.4.4 Tình hình nghiên cứu gen mã hóa cellulase sinh vật đường ruột mối bậc thấp 39 1.5 KHÁI QUÁT CHUNG VỀ METAGENOMICS 41 1.5.1 Phương pháp tiếp cận tìm gen Metagenomics 42 1.5.2 Phân lập gen từ thư viện DNA đa hệ gen 43 1.5.3 Khai thác phân lập gen từ liệu trình tự DNA đa hệ gen 45 1.5.3.1 Phương pháp giải trình tự số hệ thống máy hệ 45 1.5.3.2 Tập hợp read thành contig 47 1.5.4 Ứng dụng Metagenomics 50 1.5.4.1 Ứng dụng Metagenomics khai thác gen đánh giá đa dạng vi sinh vật 50 1.5.4.2 Tiềm ứng dụng Metagenomics 53 Chƣơng ĐỐI TƢỢNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU 55 2.1 ĐỐI TƢỢNG, VẬT LIỆU, HÓA CHẤT VÀ THIẾT BỊ MÁY MÓC 55 2.1.1 Đối tượng vật liệu 55 2.1.2 Hóa chất thiết bị máy móc 56 2.2 PHƢƠNG PHÁP NGHIÊN CỨU 58 2.2.1 Các phương pháp vi sinh 59 2.2.2 Các phương pháp sinh học phân tử 59 2.2.2.1 Tách chiết DNA hệ gen mối 59 2.2.2.2 Phương pháp thu nhận vi khuẩn ruột mối tách chiết DNA đa hệ gen chúng 59 2.2.2.3 Tinh DNA đa hệ gen phương pháp máng đơn (troughing) 60 2.2.2.4 Giải trình tự DNA đa hệ gen máy giải trình tự hệ HiSeq2000 Illumina 61 2.2.2.5 Phương pháp biến nạp DNA plasmid vào vi khuẩn E coli sốc nhiệt 62 2.2.2.6 Phương pháp tách chiết DNA plasmid từ tế bào vi khuẩn E coli 63 2.2.2.7 Phương pháp cắt ghép nối gen 63 2.2.2.8 Phương pháp tinh DNA từ gel agarose QIAquick Gel Extraction kit 64 2.2.2.9 Kỹ thuật PCR 64 2.2.2.10 Thiết kế vector biểu pET22b(+) mang gen egc 66 2.2.2.11 Điện di DNA gel agarose 66 2.2.2.12 Phương pháp biểu gen 66 2.2.2.13 Điện di biến tính protein gel polyacrylamide-SDS 67 2.2.2.14 Điện di protein gel polyacrylamide không SDS 68 2.2.3 Các phương pháp hóa sinh protein 68 2.2.3.1 Phương pháp tinh chế protein sắc kí lực his-tag 68 2.2.3.2 Định lượng protein phương pháp Bradford 69 2.2.3.3 Định lượng đường khử phương pháp DNS 69 2.2.3.4 Phương pháp xác định hoạt tính endoglucanase 70 2.2.3.5 Phương pháp xác định hoạt tính β-glucosidase β-xylosidase 71 2.2.3.6 Xác định ảnh hưởng nhiệt độ, pH, ion kim loại số hóa chất lên hoạt tính endoglucanase 72 2.2.3.7 Xác định độ bền enzyme 72 2.2.3.8 Xác định thông số động học enzyme 72 2.2.4 Các phương pháp tin sinh học xử lý số liệu phần mềm sinh học 73 2.2.4.1 Phân tích trình tự DNA đa hệ gen vi khuẩn ruột mối 73 2.2.4.2 So sánh trình tự ORF liệu DNA đa hệ gen với CSDL NCBI 74 2.2.4.3 Thiết kế mồi phần mềm FastPCR 75 2.2.4.4 Kiểm tra vị trí enzyme hạn chế gen quan tâm phần mềm trực tuyến RestrictionMapper 75 2.2.4.5 Chuyển mã trình tự DNA sang trình tự axit amin chương trình dịch mã ExPASy 75 2.2.4.6 Xây dựng phát sinh loài loài mối nghiên cứu với loài mối khác phần mềm Genedoc MEGA5 75 2.2.4.7 Dự đoán cấu trúc EGC phần mềm Phyre2 76 Chƣơng KẾT QUẢ VÀ THẢO LUẬN 77 3.1 KẾT QUẢ ĐỊNH LOÀI MỐI NGHIÊN CỨU BẰNG PHƢƠNG PHÁP PHÂN TỬ 77 3.1.1 Tách chiết DNA hệ gen mối 79 3.1.2 PCR khuếch đại đoạn DNA gen mã hóa RNA ribosome 16S ti thể mối 79 3.1.3 Phân tích sản phẩm PCR 76 3.2 TÁCH CHIẾT, ĐỌC VÀ PHÂN TÍCH TRÌNH TỰ DNA ĐA HỆ GEN VI KHUẨN RUỘT MỐI C gestroi 86 3.2.1 Tách chiết tinh DNA đa hệ gen vi khuẩn ruột mối C gestroi 86 3.2.2 Đọc phân tích trình tự DNA đa hệ gen vi khuẩn ruột mối C gestroi 87 3.2.2.1 Tập hợp trình tự xác định gen 87 3.2.2.2 Đa dạng vi sinh vật ruột mối C gestroi 90 3.3 GEN MÃ HÓA ENZYME THUỶ PHÂN CELLULOSE CỦA VI KHUẨN RUỘT MỐI C gestroi 96 3.3.1 Dự đoán chức gen DNA đa hệ gen vi khuẩn ruột mối C gestroi 96 3.3.2 Gen mã hóa enzyme phân hủy cellulose 98 3.3.3 Lựa chọn ORF cellulase để biểu 100 3.4 TÁCH DÕNG GEN egc 104 3.4.1 Trình tự ORF GL0130684 105 3.4.2 Khuếch đại gen egc 105 3.4.3 Ghép nối sản phẩm khuếch đại gen egc vào vector tách dòng pJET1.2/blunt 106 3.4.4 Biến nạp sản phẩm ghép nối vào tế bào E coli DH10b 107 3.4.5 Cắt kiểm tra plasmid tái tổ hợp enzyme hạn chế 108 3.4.6 Phân tích trình tự gen wegc phân lập từ DNA đa hệ gen vi khuẩn ruột mối C gestroi 108 3.4.7 Khuếch đại gen egc không chứa tín hiệu tiết từ khuôn pJET-wegc 111 3.4.8 Thiết kế vector biểu gen egc 111 3.4.8.1 Ghép nối gen egc vào vector biểu 111 3.4.8.2 Cắt kiểm tra plasmid tái tổ hợp pET22-egc 113 3.5 BIỂU HIỆN GEN egc TRONG VI KHUẨN E coli BL21(DE3) 114 3.5.1 Chọn dòng biểu gen egc tế bào E coli BL21(DE3) 114 3.5.2 Ảnh hưởng nhiệt độ đến biểu gen egc tế bào E coli BL21(DE3) 116 3.5.3 Ảnh hưởng nồng độ IPTG đến hiệu cảm ứng 117 3.5.4 Điện di kiểm tra hoạt tính endoglucanase EGC 119 3.5.5 Tinh chế protein EGC cột sắc kí lực His-tag 120 3.5.6 Tính đặc hiệu chất EGC 124 3.5.7 Ảnh hưởng nhiệt độ đến hoạt tính endoglucanase EGC 126 3.5.8 Ảnh hưởng pH đến hoạt tính EGC 127 3.5.9 Độ bền nhiệt EGC 128 3.5.10 Ảnh hưởng số ion kim loại hóa chất lên hoạt tính EGC 128 3.5.11 Đặc điểm động học EGC 132 KẾT LUẬN VÀ KIẾN NGHỊ 135 TÀI LIỆU THAM KHẢO 138 DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT Tên viết tắt BglB BglF BglG Tên tiếng Anh Beta-glucosidase B Beta-glucosidase F Beta-glucosidase G BLAST Basic Local Alignment Search Tool bp BSA Base pair Bovine serum albumin BWA Burrows-Wheeler Aligner CD Carbohydrate binding domain Catalytic domain cDNA Complementary DNA CBD Cel12A Cel45A (EGV) Cel48A Cel5A Cel6A (CBHII) Cel6B (EGVI) Cel7A (CBHI) Tên tiếng Việt Beta-glucosidase B Beta-glucosidase F Beta-glucosidase G Công cụ so sánh mức độ tương đồng trình tự nucleotide/axit amin trực tuyến NCBI Cặp base Albumin huyết bò Phần mềm kiểm tra sai lệch nhỏ trình giải trình tự đoạn DNA, trình tập hợp so với hệ gene tham khảo lớn Vùng liên kết với carbohydrate Vùng xúc tác DNA tổng hợp từ khuôn mRNA nhờ enzyme phiên mã ngược reverse transcriptase Endoglucanase glycoside hydrolase family 12 Endoglucanase glycoside hydrolase family 45 Exoglucanase glycoside hydrolase family Endoglucanase glycoside hydrolase family cellobiohydrolase cel6A (cellobiohydrolase II) Endoglucanase thuộc họ 12 Endoglucanase thuộc họ 45 Exoglucanase thuộc họ 48 Endoglucanase thuộc họ GH Cellobiohydrolase II (exoglucanase II) thuộc họ GH6 Endoglucanase EGVI Endoglucanase thuộc họ GH Cellobiohydrolase cel7A (Cellobiohydrolase I) Cellobiohydrolase I (exoglucanase II) thuộc họ GH7 10 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 GL0015669 GL0016646 GL0020512 GL0030004 GL0033469 GL0042676 GL0044782 GL0059221 GL0069437 GL0080140 GL0082788 GL0091566 GL0094550 GL0119948 GL0127463 GL0002534 GL0012451 GL0024052 GL0027923 GL0040260 GL0045236 GL0084641 GL0111947 GL0124174 102 GL0000760 103 GL0021447 104 GL0028356 105 GL0029859 106 GL0037950 107 GL0086917 108 GL0088027 109 GL0096676 110 GL0102859 thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' bglB E3.2.1.21 bglB bglB E3.2.1.21 bglB E3.2.1.21 bglB bglB bglB bglB bglB E3.2.1.21 E3.2.1.21 bglB E3.2.1.21 bglB bglB bglB bglB bglB bglB E3.2.1.21 bglB BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 GH1 E3.2.1.21 BGL 3.2.1.21 GH1 bglB BGL 3.2.1.21 GH1 bglB BGL 3.2.1.21 GH1 bglB BGL 3.2.1.21 GH1 bglB BGL 3.2.1.21 GH1 E3.2.1.21 BGL 3.2.1.21 GH1 bglB BGL 3.2.1.21 GH1 bglB BGL 3.2.1.21 GH1 E3.2.1.21 BGL 3.2.1.21 GH1 187 111 GL0024741 112 GL0074979 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 GL0016442 GL0018256 GL0023880 GL0038126 GL0057320 GL0071848 GL0071911 GL0085197 GL0109414 GL0113116 GL0121780 GL0002454 GL0015370 GL0022728 GL0023102 GL0023528 GL0030664 GL0033467 GL0034252 GL0036058 GL0039452 GL0040710 GL0042107 GL0043834 GL0044991 GL0050889 GL0059835 GL0061232 GL0065519 GL0072527 GL0076859 GL0085309 GL0085404 GL0086215 GL0090631 GL0090990 GL0095843 thiếu đầu 5' 3' thiếu đầu 5' 3' hoàn thiện hoàn thiện hoàn thiện hoàn thiện hoàn thiện hoàn thiện hoàn thiện hoàn thiện hoàn thiện hoàn thiện hoàn thiện thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' bglX BGL 3.2.1.21 GH20 bglX BGL 3.2.1.21 GH20 bglB E3.2.1.21 bglX bglX bglX bglX bglX E3.2.1.21 bglX bglX bglX bglX bglX E3.2.1.21 bglX bglX bglX bglX E3.2.1.21 E3.2.1.21 bglX E3.2.1.21 E3.2.1.21 E3.2.1.21 bglX bglX E3.2.1.21 bglX bglX bglX bglX bglX bglX E3.2.1.21 bglX bglX E3.2.1.21 BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 188 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 GL0097116 GL0097491 GL0107569 GL0114086 GL0114353 GL0117065 GL0119264 GL0119546 GL0121020 GL0121082 GL0124328 GL0129165 GL0010229 GL0015371 GL0016617 GL0016710 GL0032732 GL0055711 GL0058081 GL0063019 GL0066662 GL0069745 GL0071850 GL0072528 GL0075176 GL0076371 GL0078044 GL0096638 GL0102949 GL0114354 GL0129696 181 GL0003921 182 GL0004860 183 GL0007865 184 GL0008104 185 GL0008540 186 GL0011189 thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 3' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu E3.2.1.21 bglX bglX bglX bglX E3.2.1.21 bglX bglX bglX bglX bglX E3.2.1.21 E3.2.1.21 bglX E3.2.1.21 bglX bglX E3.2.1.21 bglX bglX bglX bglX bglX bglX bglX E3.2.1.21 E3.2.1.21 E3.2.1.21 E3.2.1.21 bglX bglX BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 189 187 GL0012336 188 GL0012992 189 GL0014246 190 GL0014860 191 GL0016372 192 GL0017909 193 GL0018660 194 GL0018979 195 GL0020490 196 GL0022125 197 GL0024591 198 GL0026977 199 GL0029709 200 GL0030582 201 GL0030583 202 GL0031170 203 GL0035481 204 GL0037119 205 GL0037908 206 GL0040295 207 GL0045033 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 190 208 GL0046913 209 GL0049618 210 GL0052519 211 GL0053229 212 GL0053492 213 GL0055212 214 GL0056861 215 GL0059047 216 GL0062696 217 GL0065939 218 GL0071865 219 GL0074491 220 GL0074790 221 GL0077232 222 GL0081502 223 GL0082066 224 GL0084570 225 GL0085162 226 GL0086847 227 GL0090395 228 GL0090510 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 191 229 GL0091291 230 GL0092426 231 GL0094183 232 GL0094836 233 GL0095956 234 GL0096807 235 GL0096889 236 GL0098639 237 GL0107561 238 GL0107996 239 GL0115386 240 GL0116273 241 GL0119019 242 GL0119032 243 GL0119661 244 GL0123936 245 GL0124511 246 GL0124809 247 GL0125293 248 GL0127047 249 GL0128670 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu E3.2.1.21 BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 E3.2.1.21 BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 192 250 GL0129877 251 GL0131070 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 GL0105118 GL0067692 GL0071847 GL0006163 GL0010047 GL0024269 GL0025309 GL0038846 GL0045454 GL0052442 GL0077130 GL0077351 GL0091471 GL0091598 GL0111694 267 GL0000188 268 GL0001647 269 GL0078548 270 GL0129240 271 GL0130373 272 GL0086178 273 GL0029222 274 GL0126118 275 276 GL0013032 GL0124161 277 GL0026343 278 GL0057988 279 GL0125533 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' hoàn thiện thiếu đầu 3' thiếu đầu 3' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu bglX BGL 3.2.1.21 GH3 bglX BGL 3.2.1.21 GH3 bglX bglX bglX bglX bglX bglX E3.2.1.21 bglX bglX E3.2.1.21 bglX bglX E3.2.1.21 bglX bglX BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL BGL 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 3.2.1.21 bglX BGL 3.2.1.21 bglX BGL 3.2.1.21 bglX BGL 3.2.1.21 bglX BGL 3.2.1.21 bglX BGL 3.2.1.21 E2.4.1.20 CelloP 2.4.1.20 CBM_X E2.4.1.20 CelloP 2.4.1.20 DUF608 E2.4.1.20 CelloP 2.4.1.20 GT36 E2.4.1.20 E3.2.1.91 CelloP C1,4-B Cello 2.4.1.20 3.2.1.91 E3.2.1.91 C1,4-B Cello 3.2.1.91 E3.2.1.91 C1,4-B Cello 3.2.1.91 E3.2.1.91 C1,4-B Cello 3.2.1.91 193 5' 3' 280 281 282 283 284 GL0033071 GL0005295 GL0016616 GL0069142 GL0091439 hoàn thiện thiếu đầu 3' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 endoglucanase endoglucanase 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 GH5 GH5 GH5 GH5 GH5 E3.2.1.4 endoglucanase 3.2.1.4 GH5 E3.2.1.4 endoglucanase 3.2.1.4 GH5 E3.2.1.4 endoglucanase 3.2.1.4 GH5 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 endoglucanase endoglucanase 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 GH8 GH8 GH8 GH8 GH8 GH8 endoglucanase endoglucanase endoglucanase 285 GL0017040 286 GL0074695 287 GL0111138 288 289 290 291 292 293 GL0040861 GL0130684 GL0001673 GL0048564 GL0096142 GL0103547 294 GL0100330 thiếu đầu 5' 3' E3.2.1.4 endoglucanase 3.2.1.4 GH8 295 GL0054843 thiếu đầu 3' E3.2.1.4 endoglucanase 3.2.1.4 GH9 296 GL0089085 E3.2.1.4 endoglucanase 3.2.1.4 GH9 297 GL0105391 E3.2.1.4 endoglucanase 3.2.1.4 GH9 298 299 300 301 302 303 304 GL0029085 GL0066724 GL0018286 GL0059546 GL0010783 GL0041367 GL0103808 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 E3.2.1.4 endoglucanase endoglucanase 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 3.2.1.4 E3.2.1.4 endoglucanase 3.2.1.4 E3.2.1.4 endoglucanase 3.2.1.4 E3.2.1.4 endoglucanase 3.2.1.4 E3.2.1.4 endoglucanase 3.2.1.4 E3.2.1.4 endoglucanase 3.2.1.4 E3.2.1.4 endoglucanase 3.2.1.4 305 GL0021006 306 GL0046788 307 GL0053543 308 GL0056332 309 GL0063511 310 GL0085423 hoàn thiện hoàn thiện thiếu đầu 3' thiếu đầu 3' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' 3' thiếu đầu 5' 3' hoàn thiện hoàn thiện thiếu đầu 3' thiếu đầu 3' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' thiếu đầu 5' 3' 194 endoglucanase endoglucanase endoglucanase endoglucanase endoglucanase endoglucanase endoglucanase endoglucanase endoglucanase 311 312 GL0071734 GL0076105 hoàn thiện hoàn thiện E3.2.1.58 E3.2.1.58 G1,3-Bglu G1,3-Bglu 3.2.1.58 3.2.1.58 313 GL0009916 thiếu đầu 3' E3.2.1.58 G1,3-Bglu 3.2.1.58 314 315 316 GL0050528 GL0071975 GL0101018 thiếu đầu 5' thiếu đầu 3' thiếu đầu 3' E3.2.1.39 E3.2.1.73 E3.2.1.73 Glu1,3-Bglu licheninase licheninase 3.2.1.39 3.2.1.73 3.2.1.73 GH17 GH5 Pectate lyase GH16 GH16 GH26 BGL: β-glucosidase; Glu1,3-Bglu: glucan endo-1,3-beta glucosidase Số lượng gen 14000 12000 10000 8000 6000 4000 2000 ABCD EFGH I J KLMNOPQRSTUVWZ Các lớp chức Phụ lục Các lớp chức gen dự đoán vi sinh vật sống ruột mối Coptotermes gestroi dưa sở liệu eggNOG A: ARN; B: nhiễm sắc thể; C: lượng; D: Chu kỳ tế bào; E: axit amin; F: nucleotide; G: carbohydrate; H: coenzyme; I: lipid;J: dịch mã; K: phiên mã; L: ADN; M: vỏ; N: vận động tế bào; O: protein turnover; P: vô cơ; Q: trao đổi chất thứ cấp; R: chức chung – general function; S: chức năng; T: dẫn truyền tín hiệu; U: tiết; W: ngoại bào; Z: khung tế bào 195 Phụ lục Kết lắp ráp tạo contig theo thông số k-mer khác Tổng chiều dài Contig dài Contig ngắn contig (bp) (bp) (bp) 79.262 90.150.894 183.853 500 K43 74.707 85.478.458 142.502 500 K45 70.272 80.908.174 142.504 500 K47 66.146 76.398.401 142.506 500 K49 61.708 71.740.590 183.995 500 k-mer Số contig K41 Phụ lục 10 Số liệu read dùng để lắp ráp contig sử dụng tham số k-mer khác So sánh trình tự read với trình tự contig k-mer PE SE Tổng trình tự Tỉ lệ (%) K41 18.709.714 3.063.638 54.316.028 40,09 K43 18.657.620 3.093.130 54.316.028 40,04 K45 18.614.692 3.133.613 54.316.028 40,04 K47 18.444.742 3.030.261 54.316.028 39,54 K49 18.252.980 3.039.030 54.316.028 39,20 Ghi chú: PE: read có hai đầu giống với trình tự tương ứng contig tập hợp SOAPdenovo; SE: read có đầu giống với trình tự tương ứng contig tập hợp SOAPdenovo 196 * 20 * 40 * -60 * -80 CBuiXuongT:TTACGCTGTTATCCCTAAGGTAATTTAGTCTTACAATCAAAATAAATGGATCAAACAATTATAAATCAATATAACCAAAA:80 CHungYenVN:TTACGCTGTTATCCCTAAGGTAATTTAGTCTTACAATCAAAATAAATGGATCAAACAATTATAAATCAATATAACCAAAA:80 CTanLinhVN:TTACGCTGTTATCCCTAAGGTAATTTAGTCTTACAATCAAAATAAATGGATCAAACAATTATAAATCAATATAACCAAAA:80 CthaiHaVN-:TTACGCTGTTATCCCTAAGGTAATTTAGTCTTACAATCAAAATAAATGGATCAAATAATTATAAATCAATATAACCAAAA:80 CVanQuanVN:TTACGCTGTTATCCCTAAGGTAATTTAGTCTTACAATCAAAATAAATGGATCAAATAATTATAAATCAATATAACCAAAA:80 CVongThiVN:TTACGCTGTTATCCCTAAGGTAATTTAGTCTTACAATCAAAATAAATGGATCAAACAATTATAAATCAATATAACCAAAA:80 TTACGCTGTTATCCCTAAGGTAATTTAGTCTTACAATCAAAATAAATGGATCAAAATTATATAATCAATATAACCAAAAA * -100 -* -120 -* -140 -* -160 CBuiXuongT:CTAAGAGGAGTTAAGTACATTCCTCCCATCACCCCAACAAAACAAAAAGCCCACTCACCAAAAATAAACAAACAACAAAC:160 CHungYenVN:CTAAGAGGAGTTAAGTACATTCCTCCCATCACCCCAACAAAACAAAAAGCCCACTCACCAAAAATAAACAAACAACAAAC:160 CTanLinhVN:CTAAGAGGAGTTAAGTACATTCCTCCCATCACCCCAACAAAACAAAAAGCCCACTCACCAAAAATAAACAAACAACAAAC:160 CthaiHaVN-:CTAAGAGGAGTTAAGTACATTCCTCCCATCACCCCAACAAAACAAAAAGCCCACTCACCAAAAATAAACAAACAACAAAC:160 CVanQuanVN:CTAAGAGGAGTTAAGTACATTCCTCCCATCACCCCAACAAAACAAAAAGCCCACTCACCAAAAATAAACAAACAACAAAC:160 CVongThiVN:CTAAGAGGAGTTAAGTACATTCCTCCCATCACCCCAACAAAACAAAAAGCCCACTCACCAAAAATAAACAAACAACAAAC:160 CTAAGAGGAGTTAAGTACATTCCTCCCATCACCCCAACAAAACAAAAAGCCCACTCACCAAAAATAAACAAACAACAAAC * 180 * -200 -* 220 -* 240 CBuiXuongT:AAGTAAATAAACCAAATGTCAAACTCTATAGGGTCTTCTCGTCCCACAAAAACATCTAAGAATTTTAACTCAAAGACCAA:240 CHungYenVN:AAGTAAATAAACCAAATGTCAAACTCTATAGGGTCTTCTCGTCCCACAAAAACATCTAAGAATTTTAACTCAAAGACCAA:240 CTanLinhVN:AAGTAAATAAACCAAATGTCAAGCTCTATAGGGTCTTCTCGTCCCACAAAAACATCTAAGAATTTTAACTCAAAGACCAA:240 CthaiHaVN-:AAGTAAATAAACCAAATGTCAAACTCTATAGGGTCTTCTCGTCCCACAAAAACATCTAAGAATTTTAACTCAAAGACCAA:240 CVanQuanVN:AAGTAAATAAACCAAATGTCAAACTCTATAGGGTCTTCTCGTCCCACAAAAACATCTAAGAATTTTAACTCAAAGACCAA:240 CVongThiVN:AAGTAAATAAACCAAATGTCAAACTCTATAGGGTCTTCTCGTCCCACAAAAACATCTAAGAATTTTAACTCAAAGACCAA:240 AAGTAAATAAACCAAATGTCAA CTCTATAGGGTCTTCTCGTCCCACAAAAACATCTAAGAATTTTAACTCAAAGACCAA * -260 * -280 -* -300 -* -320 CBuiXuongT:ATTCAATAAAACATTCAACACTAAGACAGCCCGTGCCTCGTCAAGCCATTCATTCCAGATCACAATTAAAGAACTAATGA:320 CHungYenVN:ATTCAATAAAACATTCAACACTAAGACAGCCCGTGCCTCGTCAAGCCATTCATTCCAGATCACAATTAAAGAACTAATGA:320 CTanLinhVN:ATTCAATAAAACATTCAGCACTAAGACAGCCCGTGCCTCGTCAAGCCATTCATTCCAGATCACAATTAAAGAACTAATGA:320 CthaiHaVN-:ATTCAATAAAACATTCAACACTAAGACAGCCCGTGCCTCGTCAAGCCATTCATTCCAGATCACAATTAAAGAACTAATGA:320 CVanQuanVN:ATTCAATAAAACATTCAACACTAAGACAGCCCGTGCCTCGTCAAGCCATTCATTCCAGATCACAATTAAAGAACTACCGA:320 CVongThiVN:ATTCAATAAAACATTCAACACTAAGACAGCCCGTGCCTCGTCAAGCCATTCATTCCAGATCACAATTAAAGAACTAATGA:320 ATTCAATAAAACATTCA-CACTAAGACAGCCCGTGCCTCGTCAAGCCATTCATTCCAGATCACAATTAAAGAACTA GA * 340 * -360 -* 380 -* 400 CBuiXuongT:TTATGCTACCTTTGCACGGTCATAATACCGCGGCCCTTCAACACCAAATGTCAGCGGGCAGGCCATACTTCAAAAACTAA:400 CHungYenVN:TTATGCTACCTTTGCACGGTCATAATACCGCGGCCCTTCAACACCAAATGTCAGCGGGCAGGCCATACTTCAAAAACTAA:400 CTanLinhVN:TTATGCTACCTTTGCACGGTCATAATACCGCGGCCCTTCAACACCAAATGTCAGCGGGCAGGCCATACTTCAAAAACTAA:400 CthaiHaVN-:TTATGCTACCTTTGCACGGTCAAAATACCGCGGCCCTTCAACACCAAATGTCAGCGGGCAGGCCATACTTCAAAAACTAA:400 CVanQuanVN:TTATGCTACCTTTGCACGGTCAAAATACCGCGGCCCTTCAACACCAAATGTCAGCGGGCAGGCCATACTTCAAAAACTAA:400 CVongThiVN:TTATGCTACCTTTGCACGGTCATAATACCGCGGCCCTTCAACACCAAATGTCAGCGGGCAGGCCATACTTCAAAAACTAA:400 TTATGCTACCTTTGCACGGTCA-AATACCGCGGCCCTTCAACACCAAATGTCAGCGGGCAGGCCATACTTCAAAAACTAA * 420 * CBuiXuongT:CAAGAAAAGATGTTTTTGATAAACAGGCGA:430 CHungYenVN:CAAGAAAAGATGTTTTTGATAAACAGGCGA:430 CTanLinhVN:CAAGAAAAGATGTTTTTGATAAACAGGCGA:430 CthaiHaVN-:CAAGAAAAGATGTTTTTGATAAACAGGCGA:430 CVanQuanVN:CAAGAAAAGATGTTTTTGATAAACAGGCGA:430 CVongThiVN:CAAGAAAAGATGTTTTTGATAAACAGGCGA:430 CAAGAAAAGATGTTTTTGATAAACAGGCGA Phụ lục 11 Mức độ tương đồng vùng trình tự 430 bp gen rRNA 16S ti thể mối Coptotermes thu thập từ địa điểm 197 * 20 -* 40 -* 60 CTanLinhVN : T : 65 CVanQuanVN : : 65 CgestEU805727TW : : 65 CgestFJ376672MY : : 65 CgestHQ231234IT : : 65 CgestJX128688CN : : 65 CgestJX128689TW : : 65 CgestKC887123CN : : 65 CheimAY558908IN : T C : 65 CheimGQ422885IN : T C : 65 CcarvAY558909MY : .C AC G : 65 CcurvFJ376681MY : .C AC G : 65 CformAB626145JP : AC .T : 65 CformEU805741TW : AC : 65 CformEU805742US : AC .T : 65 CformJN615270UK : AC .T : 65 CformKC887106CN : AC .T : 65 CinteAY558904TG : A A T : 65 CtravFJ915824MY : A : 65 CvastEF379971MY : : 65 AAACAAACAAC-AA—-A-—AAATAAACCAAATGT-AAACTCTATAGGGTCTTCTCGTCCCACAAA * 80 -* 100 -* -120 CTanLinhVN -: : 126 CVanQuanVN -: : 126 126 CgestEU805727TW : : CgestFJ376672MY : : 126 CgestHQ231234IT : : 126 CgestJX128688CN : : 126 CgestJX128689TW : : 126 CgestKC887123CN : : 126 CheimAY558908IN : : 126 CheimGQ422885IN : : 126 CcarvAY558909MY : .T : 126 CcurvFJ376681MY : .T : 126 CformAB626145JP : A .T .- : 125 CformEU805741TW : A .T : 126 CformEU805742US : A .T .- : 125 CformJN615270UK : A .T .- : 125 CformKC887106CN : A .T .- : 125 CinteAY558904TG : T T : 126 CtravFJ915824MY : .T T - : 125 CvastEF379971MY : : 126 AACATcTAAGAATTTTAACTCAAA ACCAAATTCAATAAAAcATTCAaCA TAAGACAGC Phụ lục 12 Sự xếp trình tự 126 bp khuếch đại cặp mồi thứ hai từ mẫu mối Văn Quán, Tản Lĩnh trình tự tương ứng sở liệu NCBI phần mềm Genedoc Cgest, Cheim, Ccarv, Ccurv Cform, Cinte Ctrav, Cvast tên viết tắt tương ứng C gestroi, C heimi, C carvinatus, 198 C curvignathus, C formosanus, C intermedius, C travians, C vastator Tên mẫu so sánh gồm viết tắt tên loài, mã số gen ngân hàng gen hai chữ viết tắt quốc gia phát loài mang gen tương ứng Phần dấu chấm thể trình tự nucleotide giống đoạn gen; nucleotide thể sai khác nucleotide gen Vị trí cắt tín hiệu tiết ORF atgatgaacgtagcccgctggatggcgctggtgctgactctgctggtcaccgtacaggcg M M N V A R W M A L V L T L L V T V Q A aacgccgcctgtcgctggccagcatgggatcagtttaaaaaggactatatcagcgacggt N A A C R W P A W D Q F K K D Y I S D G gggcgcgtcattgaccccagtgacgcgcgcaaaattaccacctcagaagggcaaagctat G R V I D P S D A R K I T T S E G Q S Y gccatgttcttcgcgctggtggcgaatgaccgtagcgcttttgccacgttgtatgactgg A M F F A L V A N D R S A F A T L Y D W acacaagacaatctcgcccagggtgatctgagcgcgaatctgcccgcctggctgtggggc T Q D N L A Q G D L S A N L P A W L W G aaaaacgaagataaatgggcgatacttgacagcaactccgcctctgacgccgatctgtgg K N E D K W A I L D S N S A S D A D L W atcgcctggtcgctgatggaagccgggcgcttatggaaggagccacgctacagcgacgcc I A W S L M E A G R L W K E P R Y S D A gggaaagggctgctgtcgcggattgctaaagatgaagtggtcactgtgccggggcttggc G K G L L S R I A K D E V V T V P G L G tcgatgctgttgccggggaaagtcggttttgtcgacgacaaaagctggcgtttcaacccc S M L L P G K V G F V D D K S W R F N P agctatttcccgccgcaactgaccagttactttgcccgtcttggcgcgccgtggagcaca S Y F P P Q L T S Y F A R L G A P W S T ttgcgggaaactaacctgcgcctgctgctggaaactgcgccaaaaggtttttcgccggac L R E T N L R L L L E T A P K G F S P D tgggtgcgctatgaaaaagacaaaggctggcagttaaagcaggataagacgctggttggc W V R Y E K D K G W Q L K Q D K T L V G agctatgacgcgattcgcgtctatctgtgggcgggcatgctgcacgacagcgatccgcaa S Y D A I R V Y L W A G M L H D S D P Q aaagcgcgcctgctgaagcgctttaacccgatggcagtgcaaaccacccgtgaaggattg K A R L L K R F N P M A V Q T T R E G L ccgccggagaaagttgatatcgcgaccggcaaggtcaccaataccggcccggtcgggttc P P E K V D I A T G K V T N T G P V G F tcggcctcgctgctgcctttcttacaaaatcgcgatgcccaggctgttcagcgccagcgc S A S L L P F L Q N R D A Q A V Q R Q R gtggcggataacttccctggcgcggacgcctattttaactatgtgctaaccctgtttgga V A D N F P G A D A Y F N Y V L T L F G caaggctgggatcaacaccgttttcgtttcaccgcccgcggtgaattactacctgactgg Q G W D Q H R F R F T A R G E L L P D W ggccaggaatgcgcaagttcacagtaa G Q E C A S S Q - Phụ lục 13 Trình tự nucleotide axit amin tương ứng ORF GL0130684 (gen egc) đọc máy HiSeq2000 Illumina 199 Vị trí cắt tín hiệu tiết Query ATGATGAACGTAGCCCGCTGGATGGCGCTGGTGCTGACTCTGCTGGTCACCGTACAGGCG |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ATGATGAACGTAGCCCGCTGGATGGCGCTGGTGCTGACTCTGCTGGTCACCGTACAGGCG 60 Sbjct Query 61 AACGCCGCCTGTCGCTGGCCAGCATGGGATCAGTTTAAAAAGGACTATATCAGCGACGGT 120 Sbjct 61 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| AACGCCGCCTGTCGCTGGCCAGCATGGGATCAGTTTAAAAAGGACTATATCAGCGACGGT 120 Query 121 Sbjct 121 Query 181 Sbjct 181 Query 241 Sbjct 241 Query 301 Sbjct 301 Query 361 Sbjct 361 Query 421 Sbjct 421 Query 481 Sbjct 481 Query 541 Sbjct 541 Query 601 Sbjct 601 Query 661 Sbjct 661 Query 721 Sbjct 721 60 GGGCGCGTCATTGACCCCAGTGACGCGCGCAAAATTACCACCTCAGAAGGGCAAAGCTAT |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| GGGCGCGTCATTGACCCCAGTGACGCGCGCAAAATTACCACCTCAGAAGGGCAAAGCTAT 180 GCCATGTTCTTCGCGCTGGTGGCGAATGACCGTAGCGCTTTTGCCACGTTGTATGACTGG |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| GCCATGTTCTTCGCGCTGGTGGCGAATGACCGTAGCGCTTTTGCCACGTTGTATGACTGG 240 ACACAAGACAATCTCGCCCAGGGTGATCTGAGCGCGAATCTGCCCGCCTGGCTGTGGGGC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ACACAAGACAATCTCGCCCAGGGTGATCTGAGCGCGAATCTGCCCGCCTGGCTGTGGGGC 300 AAAAACGAAGATAAATGGGCGATACTTGACAGCAACTCCGCCTCTGACGCCGATCTGTGG |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| AAAAACGAAGATAAATGGGCGATACTTGACAGCAACTCCGCCTCTGACGCCGATCTGTGG 360 ATCGCCTGGTCGCTGATGGAAGCCGGGCGCTTATGGAAGGAGCCACGCTACAGCGACGCC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| ATCGCCTGGTCGCTGATGGAAGCCGGGCGCTTATGGAAGGAGCCACGCTACAGCGACGCC 420 GGGAAAGGGCTGCTGTCGCGGATTGCTAAAGATGAAGTGGTCACTGTGCCGGGGCTTGGC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| GGGAAAGGGCTGCTGTCGCGGATTGCTAAAGATGAAGTGGTCACTGTGCCGGGGCTTGGC TCGATGCTGTTGCCGGGGAAAGTCGGTTTTGTCGACGACAAAAGCTGGCGTTTCAACCCC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| TCGATGCTGTTGCCGGGGAAAGTCGGTTTTGTCGACGACAAAAGCTGGCGTTTCAACCCC 180 240 300 360 420 480 480 540 540 AGCTATTTCCCGCCGCAACTGACCAGTTACTTTGCCCGTCTTGGCGCGCCGTGGAGCACA ||||||||||||||||||||||||||||||||||||||||||||||| |||||||||||| AGCTATTTCCCGCCGCAACTGACCAGTTACTTTGCCCGTCTTGGCGCACCGTGGAGCACA 600 TTGCGGGAAACTAACCTGCGCCTGCTGCTGGAAACTGCGCCAAAAGGTTTTTCGCCGGAC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| TTGCGGGAAACTAACCTGCGCCTGCTGCTGGAAACTGCGCCAAAAGGTTTTTCGCCGGAC 660 TGGGTGCGCTATGAAAAAGACAAAGGCTGGCAGTTAAAGCAGGATAAGACGCTGGTTGGC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| TGGGTGCGCTATGAAAAAGACAAAGGCTGGCAGTTAAAGCAGGATAAGACGCTGGTTGGC 720 AGCTATGACGCGATTCGCGTCTATCTGTGGGCGGGCATGCTGCACGACAGCGATCCGCAA |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| AGCTATGACGCGATTCGCGTCTATCTGTGGGCGGGCATGCTGCACGACAGCGATCCGCAA 780 200 600 660 780 Query 781 Sbjct 781 Query 841 Sbjct 841 Query 901 Sbjct 901 Query 961 Sbjct 961 Query 1021 Sbjct 1021 Query 1081 Sbjct 1081 AAAGCGCGCCTGCTGAAGCGCTTTAACCCGATGGCAGTGCAAACCACCCGTGAAGGATTG |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| AAAGCGCGCCTGCTGAAGCGCTTTAACCCGATGGCAGTGCAAACCACCCGTGAAGGATTG 840 CCGCCGGAGAAAGTTGATATCGCGACCGGCAAGGTCACCAATACCGGCCCGGTCGGGTTC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| CCGCCGGAGAAAGTTGATATCGCGACCGGCAAGGTCACCAATACCGGCCCGGTCGGGTTC 900 TCGGCCTCGCTGCTGCCTTTCTTACAAAATCGCGATGCCCAGGCTGTTCAGCGCCAGCGC |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| TCGGCCTCGCTGCTGCCTTTCTTACAAAATCGCGATGCCCAGGCTGTTCAGCGCCAGCGC 960 GTGGCGGATAACTTCCCTGGCGCGGACGCCTATTTTAACTATGTGCTAACCCTGTTTGGA |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| GTGGCGGATAACTTCCCTGGCGCGGACGCCTATTTTAACTATGTGCTAACCCTGTTTGGA 1020 CAAGGCTGGGATCAACACCGTTTTCGTTTCACCGCCCGCGGTGAATTACTACCTGACTGG |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| CAAGGCTGGGATCAACACCGTTTTCGTTTCACCGCCCGCGGTGAATTACTACCTGACTGG 1080 GGCCAGGAATGCGCAAGTTCACAG |||||||||||||||||||||||| GGCCAGGAATGCGCAAGTTCACAG 840 900 960 1020 1080 1104 1104 Phụ lục 14 So sánh trình tự nucleotide ORF GL013068 gen wegc phân lập từ DNA đa hệ gen vi khuẩn ruột mối Query: trình tự ORF GL013068; Sbjct: trình tự gen wegc 201

Định dạng
Số trang	201
Dung lượng	5,2 MB