Các beta-amylase (β-amylase, EC 3.2.1.2) thuộc họ glycosyl hydrolase 14 có chức năng phân cắt các liên kết (1,4)-α-D-glycosidic trong các phân tử tinh bột, giải phóng các maltose từ đầu không khử của chuỗi. Sử dụng phương pháp tin sinh học, tổng số 10 gene mã hóa β-amylase đã được xác định trong hệ gene của cây sắn. Các gene β-amylase của cây sắn phân bố trên 5 trong tổng số 18 nhiễm sắc thể.
KHOA HỌC TỰ NHIÊN Phân tích họ gene mã hóa β-amylase Ở CÂY SẮN (Manihot esculenta Crantz) BẰNG PHƯƠNG PHÁP TIN SINH HỌC Cao Phi Bằng Khoa Khoa học Tự nhiên – Trường Đại học Hùng Vương Nhận ngày 10/11/2017, Phản biện xong ngày 25/11/2017, Duyệt đăng ngày 26/11/2017 TÓM TẮT C ác beta-amylase (β-amylase, EC 3.2.1.2) thuộc họ glycosyl hydrolase 14 có chức phân cắt liên kết (1,4)-α-D-glycosidic phân tử tinh bột, giải phóng maltose từ đầu không khử chuỗi Sử dụng phương pháp tin sinh học, tổng số 10 gene mã hóa β-amylase xác định hệ gene sắn Các gene β-amylase sắn phân bố tổng số 18 nhiễm sắc thể Dựa kết phân tích phả hệ, β-amylase sắn xếp vào bốn phân họ khác nhau, gồm phân họ I, II, III IV Các gene mã hóa khơng liên tục với số lượng intron thay đổi theo phân họ theo gene phân họ Các protein suy diễn chúng có mức tương đồng cao so với β-amylase phân họ Arabidopsis Các protein β-amylase sắn có điểm đẳng điện (pI) dao động từ 5,44 tới 8,92 Tất β-amylase sắn mang vùng bảo thủ họ enzyme glycosyl hydrolase 14 hầu hết số chúng có mang amino acid giữ vai trò quan trọng chức enzyme Ngồi ra, MeBAM5 MeBAM10 chứa đoạn amino acid giống với vùng bảo thủ tác nhân điều hòa phiên mã chống chịu với Brassinazole đầu amin Từ khóa: β-amylase, sắn, phả hệ, đặc trưng gene, tin sinh học Đặt vấn đề Cây sắn (Manihot esculenta Crantz) lương thực quan trọng thứ giới sau lúa mì, lúa gạo, ngơ, khoai tây lúa mạch Cây sắn có nguồn gốc từ Nam Mỹ thuộc họ Euphorbiaceae trồng khắp vùng nhiệt đới cận nhiệt đới châu Phi, châu Á châu Mỹ, có Việt Nam [10] Củ sắn nguồn cung cấp lương thực cho khoảng 800 triệu người toàn cầu, tất phận sắn sử dụng [3] Củ sắn có hàm lượng tinh bột cao (20-40%), nguồn lượng tốt cho nhu cầu Tạp chí Khoa học & Cơng nghệ số (9) – 2017 49 KHOA HỌC TỰ NHIÊN người đặc biệt công nghiệp nhiên liệu sinh học Vì có vai trò lớn người nên hệ gene sắn giải trình tự [1; 17], sở cho nghiên cứu cấu trúc, chức tiến hóa gene, cơng cụ hữu hiệu chọn tạo giống lồi Các beta-amylase (β-amylase, EC 3.2.1.2) thuộc họ glycosyl hydrolase 14, xúc tác phản ứng thủy phân phân tử amylose liên kết (1,4)-α-D-glycosidic phân tử tinh bột, glycogene maltooligosaccharide [16] β-amylase có thực vật bậc cao số vi sinh vật β-amylase tích lũy nhiều hạt nảy mầm số mô chịu tác động yếu tố bất lợi [11; 23; 24] Enzyme có vai trò dự trữ protein hay hợp chất chứa nitơ [19] Ngồi ra, hai protein có chứa vùng bảo thủ β-amylase (BAM7 BAM8) hoạt động tác nhân điều hòa phiên mã kiểm sốt sinh trưởng thân phát triển Arabidopsis [20; 21] Các β-amylase thực vật có chứa vùng bảo thủ họ glycosyl hydrolase 14 [4] Cấu trúc không gian phân tử protein có chuỗi β vòng với trình tự đặc trưng [18] có chứa nhiều xoắn α cấu trúc bậc hai [13] Trên quy mô hệ gene, β-amylase phát Arabidopsis thaliana [5], 19 β-amylase phát đậu tương (Glycine max) [2] Phân tích phả hệ cho thấy β-amylase xếp vào bốn nhóm khác với cấu trúc khác [2] Không phải tất protein có mang amino acid đặc trưng khơng phải tất chúng có hoạt tính enzyme β-amylase [5] Cây sắn có chất dự trữ củ chủ yếu tinh bột, 50 Tạp chí Khoa học & Cơng nghệ số (9) – 2017 gene liên quan đến sinh tổng hợp tinh bột nghiên cứu [15] có nghiên cứu cấu trúc hoạt tính enzyme β-amylase [9; 14] chưa có nghiên cứu tồn diện họ gene quy mô hệ gene sắn Nghiên cứu hướng tới việc xác định gene mã hóa β-amylase hệ gene sắn, đồng thời phân tích đặc điểm họ gene phương pháp tin sinh học Những kết bước đầu cung cấp thông tin khoa học có ý nghĩa nghiên cứu chức β-amylase lương thực quan trọng Vật liệu phương pháp nghiên cứu 2.1 Cơ sở liệu trình tự hệ gene RNAseq sắn Trình tự hệ gene sắn lấy từ website phytozome (https://phytozome.jgi doe.gov/pz/portal.html#!info?alias=Org_ Mesculenta), tảng so sánh hệ gene thực vật [7], phiên 1.0 thuộc dự án PRJNA234389 Bredeson et al (2016) [1] 2.2 Xác định gene thuộc họ β-amylase sắn Các β-amylase Arabidopsis [5] dùng làm khuôn dò để tìm kiếm gene tương đồng liệu nucleotide toàn hệ gene sắn nhờ chương trình TBLASTN 2.3 Xây dựng phả hệ Các protein β-amylase Arabidopsis sắn dãy MAFFT [12] Cây phả hệ xây dựng phần mềm MEGA5 [22] 2.4 Phân tích đặc điểm hóa–lý Các đặc điểm vật lý, hóa học gene/ protein phân tích nhờ cơng cụ KHOA HỌC TỰ NHIÊN ExPASy [6] Cấu trúc CDS/intron thiết lập nhờ GSDS 2.0 [8] protein β-amylase sắn với Arabidopsis, giá trị dao động nằm khoảng từ 31% đến 76% (bảng 2) Khi so sánh β-amylase phân họ kết cho thấy, mức độ tương tự β-amylase phân họ I hai loài thấp 65% cao 71% Số liệu tương ứng β-amylase phân họ II 50% 76%, phân họ III 36% 74%, phân họ IV 49% 72% Như vậy, họ gene β-amylase sắn họ đa gene (10 gene), kích thước tương đồng với Arabidopsis (9 gene) [5], nhỏ so với đậu tương (19 gene) [2] Kết nghiên cứu thảo luận 3.1 Xác định họ gene β-amylase sắn Nhờ sử dụng protein β-amylase Arabidopsis làm khn dò tồn hệ gene sắn chương trình TBLASTN, tổng số 10 gene mã hóa cho β-amylase tìm thấy hệ gene sắn (bảng 1) Phân tích trình tự protein suy diễn cho thấy gene mang vùng bảo thủ họ glycosyl hydrolase 14 (pfam 01373) Khi so sánh mức độ tương tự Bảng Các gene thuộc họ β-amylase sắn đặc điểm chúng Gene MeBAM1 MeBAM2 MeBAM3 MeBAM4 MeBAM5 MeBAM6 MeBAM7 MeBAM8 MeBAM9 MeBAM10 Phân nhóm II II III IV IV I II III II IV Tên locus Manes.02G006200 Manes.03G155800 Manes.03G191000 Manes.05G034800 Manes.05G034900 Manes.12G078500 Manes.15G047700 Manes.15G060100 Manes.15G171200 Manes.15G190300 Kích thước gene (bp) 3158 2232 2180 6614 5676 4338 2553 7107 5823 34143 Chiều dài protein (aa) 569 581 535 545 701 594 582 522 546 689 Khối lượng protein (kD) 64,18 64,97 59,22 61,67 79,13 67,69 64,84 59,42 61,34 77,33 pI 8,59 5,67 6,04 5,69 5,63 6,04 6,05 8,92 8,7 5,44 Định khu tế bào Lục lạp Lục lạp Lục lạp Lục lạp Tế bào chất Tế bào chất Tế bào chất Ti thể Tế bào chất Nhân Số intron 3 9 Bảng So sánh cặp protein β-amylase tương đồng sắn Arabidopsis Giá trị biểu thị mức độ tương đồng (%) Gene Sắn MeBAM6 MeBAM1 MeBAM2 MeBAM7 MeBAM9 MeBAM3 MeBAM8 MeBAM4 MeBAM5 MeBAM10 Arabi dopsis Phân nhóm I II II II II III III IV IV IV AtBAM5 AtBAM6 AtBAM1 AtBAM3 AtBAM4 AtBAM9 AtBAM2 AtBAM7 AtBAM8 I I II II III III IV IV IV 71 37 49 51 48 34 42 54 50 41 65 35 46 47 48 34 42 55 53 44 48 50 76 76 60 40 44 50 47 40 48 50 62 58 72 41 45 52 48 42 41 38 43 42 46 38 74 42 38 42 31 34 37 36 38 57 36 34 35 35 47 37 49 50 50 35 42 72 71 57 44 35 43 44 45 34 38 68 68 49 39 37 38 40 41 37 36 59 52 69 Tạp chí Khoa học & Cơng nghệ số (9) – 2017 51 KHOA HỌC TỰ NHIÊN Hình Bản đồ phân bố gene mã hóa β-amylase sắn (chỉ thể NST có mang gene mã hóa β-amylase) 3.2 Bản đồ gene, phân tích phả hệ phân loại β-amylase Các gene β-amylase phân bố tổng số 18 nhiễm sắc thể (NST) sắn (hình 1) Trong đó, NST số 15 mang nhiều gene (4 gene), NST số số mang gene, hai NST số số 12 mang gene Kiểu phân bố bắt gặp Arabidopsis đậu tương Ở Arabidopsis, gene mã hóa cho β-amylase Hình Cây phả hệ xây dựng từ β-amylase sắn (Me) Arabidopsis thaliana (At) Cây phả hệ xây dựng từ 19 trình tự protein hai loài sắn Arabidopsis với tham biến: thuật tốn Maximum Likelihood, mơ hình Jones-Taylor-Thornton (JTT), phương pháp Bootstrap với 1000 lần lặp lại, giá trị bootstrap thể nhánh, thước tỷ lệ số amino acid thay vị trí 52 Tạp chí Khoa học & Cơng nghệ số (9) – 2017 phân bố tổng số NST [5] đậu tương, có 12 tổng số 20 NST có mang gene mã hóa β-amylase KHOA HỌC TỰ NHIÊN Cây phả hệ xây dựng từ 19 protein β-amylase hai loài sắn Arabidopsis sau chúng dãy thể hình Cây phả hệ chia làm bốn nhánh tương ứng với bốn phân họ khác kí hiệu từ I tới IV Số lượng gene β-amylase sắn thuộc phân họ I, II, III IV 1, 4, Có kiện nhân gene quy mô hệ gene (Whole Geneome Duplication, WGD) MeBAM2 MeBAM7 ghi nhận sau q trình biệt hóa tổ tiên Arabidopsis sắn 3.3 Đặc điểm gene β-amylase sắn Các gene β-amylase sắn có kích thước cấu trúc khơng giống nhau, chứa từ 2.180 đến 3.4143 nucleotide (bảng 1) Các gene β-amylase sắn có số lượng intron khơng giống Các gene phân họ I có intron, gene phân họ II có intron, gene phân họ III có intron gene phân họ IV có 8-9 intron (hình 3) Số lượng intron gene thuộc phân họ sắn tương đồng với đậu tương báo cáo [2] Các gene β-amylase sắn mã hóa cho protein có độ dài từ 522 tới 701 amino acid, tương ứng với khối lượng phân tử từ 59,22 kD tới 79,13 kD Các protein β-amylase sắn có điểm đẳng điện (pI) dao động từ 5,44 tới 8,92 (bảng 1) Các protein phân họ I phân họ IV có tính axit (với giá trị pI nhỏ 7) Trong đó, protein thuộc phân họ II phân họ III có tính kiềm tính axit Những đặc điểm vật lý β-amylase sắn tương đồng với đặc điểm β-amylase báo cáo Arabidopsis [5] Hình Cấu trúc CDS (trình tự mã hóa)/intron gene β-amylase sắn Tạp chí Khoa học & Cơng nghệ số (9) – 2017 53 KHOA HỌC TỰ NHIÊN 3.4 Các motif bảo thủ cấu trúc β-amylase sắn Các β-amylase sắn có chứa trình tự phận bắt đầu với chuỗi beta tiếp tục nối với vòng (β4/L4, β5/L5, β6/L6, β7/L7, β8/L8) Các đoạn trình tự phận, ngoại trừ L3/H5, có chứa amino acid giữ vai trò quan trọng trung tâm xúc tác enzyme, trì cấu trúc, liên kết với chất hay với chất ức chế [18] Tuy nhiên, tất protein họ có chứa đầy đủ amino acid giữ vai trò quan trọng chức enzyme, tương đồng với Arabidopsis [5] Riêng MeBAM5 MeBAM10 thuộc phân họ IV sắn, ngồi vùng bảo thủ họ glycosyl hydrolase 14, chứa đoạn amino acid giống với vùng bảo thủ tác nhân điều hòa phiên mã chống chịu với Brassinazole (Brassinazole resistant, BZR1) đầu amin (N-terminal) Kết phù hợp với kết phân tích cấu trúc hai gene BAM7 BAM8 (phân họ IV) Arabidopsis [20] Kết luận Trong cơng trình này, chúng tơi xác định phân tích họ gene β-amylase sắn phương pháp tin sinh học với tổng số 10 gene phát tồn hệ Hình Kết dãy protein β-amylase sắn Dấu đánh dấu amino acid bảo thủ, vùng bảo thủ đóng khung 54 Tạp chí Khoa học & Cơng nghệ số (9) – 2017 KHOA HỌC TỰ NHIÊN gene Các đặc điểm lý – hóa cấu trúc tất gene protein suy diễn họ xác định Các motif bảo thủ tìm thấy hầu hết protein họ β-amylase sắn Thơng qua phân tích phả hệ, phân loại β-amylase sắn vào bốn phân họ tương tự loài thực vật khác nghiên cứu Bản đồ phân bố gene họ nhiễm sắc thể xây dựng Kết nghiên cứu mở đường cho việc tách dòng gene phân tích chi tiết chức gene họ β-amylase sắn Lời cảm ơn Cơng trình hồn thành với hỗ trợ kinh phí từ chương trình nghiên cứu khoa học Trường Đại học Hùng Vương, tỉnh Phú Thọ Tài liệu tham khảo [1] Bredeson J V., Lyons J B., Prochnik S E., Wu G A., Ha C M., Edsinger-Gonzales E., Grimwood J., Schmutz J., Rabbi I Y., Egesi C., Nauluvula P., Lebot V., Ndunguru J., Mkamilo G., Bart R.S., Setter T L., Gleadow R M., Kulakow P., Ferguson M E., Rounsley S., Rokhsar, D S (2016) Sequencing wild and cultivated cassava and related species reveals extensive interspecific hybridization and genetic diversity Nat Biotechnol, 34(5), 562-570 doi:10.1038/nbt.3535 [2] Cao Phi Bằng, Trần Thị Thanh Huyền (2015) Phân tích họ gen β-amylase đậu tương (Glycine max) Tạp chí Sinh học, 37(1SE), 165176 doi:10.15625/0866-7160/v37n1se.6106 [3] Ceballos H., Okogbenin E., Pérez J C., LópezValle L A B., Debouck D (2010) Cassava In Root and tuber crops (pp 53-96): Springer [4] Filiz E (2014) In silico sequence analysis and homology modeling of predicted beta-amylase 7-like protein in Brachypodium distachyon L 3(1), [5] Fulton D C., Stettler M., Mettler T., Vaughan C K., Li J., Francisco P., Gil M., Reinhold H., Eicke S., Messerli G., Dorken G., Halliday K., Smith A M., Smith S M., Zeeman S C (2008) Beta-AMYLASE4, a noncatalytic protein required for starch breakdown, acts upstream of three active beta-amylases in Arabidopsis chloroplasts Plant Cell, 20(4), 1040-1058 doi:10.1105/tpc.107.056507 [6] Gasteiger E., Hoogland C., Gattiker A., Wilkins M R., Appel R D., Bairoch A (2005) Protein identification and analysis tools on the ExPASy server In The Proteomics Protocols Handbook (pp.571607): Springer [7] Goodstein D M., Shu S., Howson R., Neupane R., Hayes R D., Fazo J., Mitros T., Dirks W., Hellsten U., Putnam N., Rokhsar D S (2012) Phytozome: a comparative platform for green plant genomics Nucleic Acids Res, 40 (Database issue), D1178-1186 doi:10.1093/nar/gkr944 [8] Guo A Y., Zhu Q H., Chen X., Luo J C (2007) GSDS: a gene structure display server Yi Chuan, 29(8), 1023-1026 [9] Hirata A., Adachi M., Utsumi S., Mikami B (2004) Engineering of the pH optimum of Bacillus cereus beta-amylase: conversion of the pH optimum from a bacterial type to a higher-plant type Biochemistry, 43(39), 12523-12531 doi:10.1021/bi049173h [10] Howeler R., Lutaladio N., Thomas G (2013) Save and grow: Cassava A guide to sustainable production intensification Rome: FAO [11] Kaplan F., Guy C L (2004) Beta-Amylase induction and the protective role of maltose Tạp chí Khoa học & Công nghệ số (9) – 2017 55 KHOA HỌC TỰ NHIÊN during temperature shock Plant Physiol, 135(3), 1674-1684 doi:10.1104/pp.104.040808 [12] Katoh K., Standley D M (2013) MAFFT multiple sequence alignment software version 7: Improvements in performance and usability Mol Biol Evol, 30(4), 772-780 doi:10.1093/molbev/mst010 [13] Luo J C., Wang S C., Jian W B., Chen C H., Tang J L., Lee C I (2012) Formation of amyloid fibrils from beta-amylase FEBS Lett, 586(6), 680-685 doi:10.1016/j.febslet.2012.01.062 [14] Mikami B., Degano M., Hehre E J., Sacchettini J C (1994) Crystal structures of soybean beta-amylase reacted with betamaltose and maltal: active site components and their apparent roles in catalysis Biochemistry, 33(25), 7779-7787 [15] Munyikwa T R I., Langeveld S., Salehuzzaman S N I M., Jacobsen E., Visser R G F (1997) Cassava starch biosynthesis: new avenues for modifying starch quantity and quality Euphytica, 96(1), 65-75 doi:10.1023/A:1002935603412 [16] Oyefuga O H., Adeyanju M M., Adebawo O O., Agboola F K (2011) Purification and some properties of β-amylase from the nodes of sugar cane, Saccharium offinacium International Journal of Plant Physiology and Biochemistry, 3(5), 117-124 [17] Prochnik S., Marri P R., Desany B., Rabinowicz P D., Kodira C., Mohiuddin M., Rodriguez F., Fauquet C., Tohme J., Harkins T., Rokhsar D S., Rounsley S (2012) The Cassava Genome: Current Progress, Future Directions Tropical Plant Biology, 5(1), 88-94 doi:10.1007/s12042-011-9088-z [18] Pujadas G., Ramirez F M., Valero R., Palau J (1996) Evolution of beta-amylase: Patterns of variation and conservation in subfamily 56 Tạp chí Khoa học & Công nghệ số (9) – 2017 sequences in relation to parsimony mechanisms Proteins, 25(4), 456-472 doi:10.1002/ prot.6 [19] Qi J C., Zhang G P., Zhou M X (2006) Protein and hordein content in barley seeds as affected by nitrogen level and their relationship to beta-amylase activity Journal of Cereal Science, 43(1), 102-107 [20] Reinhold H., Soyk S., Simkova K., Hostettler C., Marafino J., Mainiero S., Vaughan C K., Monroe J D., Zeeman S C (2011) Beta-amylase-like proteins function as transcription factors in Arabidopsis, controlling shoot growth and development Plant Cell, 23(4), 1391-1403 doi:10.1105/tpc.110.081950 [21] Soyk S., Simkova K., Zurcher E., Luginbuhl L., Brand L H., Vaughan C K., Wanke D., Zeeman S C (2014) The Enzyme-Like Domain of Arabidopsis Nuclear beta-Amylases Is Critical for DNA Sequence Recognition and Transcriptional Activation Plant Cell, 26(4), 1746-1763 doi:10.1105/ tpc.114.123703 [22] Tamura K., Peterson D., Peterson N., Stecher G., Nei M., Kumar S (2011) MEGA5: Molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods Mol Biol Evol, 28(10), 2731-2739 doi:10.1093/molbev/msr121 [23] Todaka D., Kanekatsu M (2007) Analytical method for detection of beta-amylase isozymes in dehydrated cucumber cotyledons by using two-dimensional polyacrylamide gel electrophoresis Anal Biochem, 365(2), 277-279 doi:10.1016/j.ab.2007.03.026 [24] Todaka D., Matsushima H., Morohashi Y (2000) Water stress enhances beta-amylase activity in cucumber cotyledons J Exp Bot, 51(345), 739-745 KHOA HỌC TỰ NHIÊN SUMMARY Analysis of β-amylase encoded gene family in Cassava (Manihot esculenta Crantz) by using bioinformatic methods Cao Phi Bang Faculty of Natural Sciences – Hung Vuong University B eta-amylases (β-amylase, EC 3.2.1.2) belong to the glycosyl hydrolase family 14 which function by hydrolyzing the 1,4-α-D-glycosidic linkages in starch-type polysaccharide substrates to remove successive maltose units from the non-reducing ends of the chains Using bioinformatic methods, a total of 10 genes encoding the β-amylase was identified in the whole geneome of cassava These 10 genes distributed on out of 18 chromosomes Based on phylogenetic analysis, the cassava β-amylases were classified into four subfamilies I, II, III and IV All of 10 genes encoded discontinuously, their intron numbers differed up on the subfamily The pairwise comparison of predicted proteins from the same subfamily between the two species (cassava and Arabidopsis) showed that they were similar The pI values of soybean β-amylase ranged from 5.44 to 8.92 All cassava β-amylases contained the conserved domain of the glycosyl hydrolase family 14, and most of the proteins included amino acids which are important for the enzymatic function In addition, MeBAM5 and MeBAM10 proteins contained the amino acid sequence in N-terminal which was similar to the transcription factors of the Brassinazole Resistant1 (BZR1) type Keywords: β-amylase, cassava, phylogenetic tree, gene characterization, bioinformatics, gene identification Tạp chí Khoa học & Cơng nghệ số (9) – 2017 57 ... nghiên cứu tồn diện họ gene quy mô hệ gene sắn Nghiên cứu hướng tới việc xác định gene mã hóa β-amylase hệ gene sắn, đồng thời phân tích đặc điểm họ gene phương pháp tin sinh học Những kết bước... Khoa học & Công nghệ số (9) – 2017 51 KHOA HỌC TỰ NHIÊN Hình Bản đồ phân bố gene mã hóa β-amylase sắn (chỉ thể NST có mang gene mã hóa β-amylase) 3.2 Bản đồ gene, phân tích phả hệ phân loại β-amylase. .. khơng giống Các gene phân họ I có intron, gene phân họ II có intron, gene phân họ III có intron gene phân họ IV có 8-9 intron (hình 3) Số lượng intron gene thuộc phân họ sắn tương đồng với đậu