Phân tích đặc điểm in silico các gene mã hóa protein SWEET ở cây ca cao (Theobroma cacao L.)

8 18 0
Phân tích đặc điểm in silico các gene mã hóa protein SWEET ở cây ca cao (Theobroma cacao L.)

Đang tải... (xem toàn văn)

Thông tin tài liệu

Nghiên cứu này có mục tiêu xác định các gene mã hóa SWEET trong hệ gene của cây ca cao, phân tích các đặc điểm cấu trúc, sự phân bố của gene cũng như các đặc điểm hóa lí lí thuyết của các protein SWEET ở loài cây này và sự biểu hiện gene. Những kết quả nghiên cứu này bước đầu cung cấp các thông tin khoa học về cấu trúc, chức năng của các SWEET của loài cây công nghiệp quan trọng này.

BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM - HỘI NGHỊ KHOA HỌC QUỐC GIA LẦN THỨ DOI: 10.15625/vap.2020.00051 PHÂN TÍCH ĐẶC ĐIỂM IN SILICO CÁC GENE MÃ HÓA PROTEIN SWEET Ở CÂY CA CAO (Theobroma cacao L.) Cao Phi Bằng1,*, Nguyễn Văn Đính2, Trần Thị Thanh Huyền3, Lê Thị Mận1, Vũ Xuân Dương1, Tóm tắt SWEET (sugars will eventually be exported transporter) nhóm protein vận chuyển đường quan trọng thực vật Trong nghiên cứu này, 21 gene mã hóa protein SWEET hệ gene ca cao xác định phân tích Các gene có chiều dài từ 1379 đến 2700 gốc nucleotide, hầu hết gene có năm intron Các protein suy diễn có từ 232 tới 306 gốc axit amin có mang xoắn xuyên màng đặc trưng biết cho SWEET Hầu hết protein có tính kiềm Phân tích phả hệ cho thấy gene SWEET ca cao phân chia thành bốn nhóm, nhóm I (4 gene), nhóm II (4 gene), nhóm III (6 gene) nhóm IV (7 gene) Các gene phân bố không đồng hệ gene ca cao Nhiễm sắc thể số số mang 13 tổng số 21 gene SWEET Một số tượng nhân gene hai nhiễm sắc thể có liên quan đến số lượng nhiều gene SWEET nhóm III nhóm IV Mười hai tổng số 21 gene SWEET có mã phiên EST phát số loại mô khác ca cao, điều kiện khác Phần lớn số chúng có EST thu từ mô sinh sản mô chịu tác động stress vô sinh hữu sinh, gợi ý gene giữ vai trò quan trọng phát triển tính chống chịu ca cao Từ khóa: Biểu gene, ca cao, di truyền đặc, điểm gene, SWEET MỞ ĐẦU Ca cao (Theobroma cacao L.) loài nhiệt đới thường xanh có nguồn gốc vùng đất thấp rừng mưa nhiệt đới Amazon, người hóa 1.500 năm trước (Motamayor et al., 2002) Hiện nay, loài trồng 50 quốc gia giới, có Việt Nam Hạt ca cao chủ yếu sử dụng để làm socola, mứt công nghiệp mỹ phẩm (Figueira et al., 2005) Tuy ca cao coi đối tượng có nhiều hạn chế nghiên cứu (Figueira et al., 2005), hệ gene loài nguồn tài nguyên tốt cho phép tăng cường tiến chọn giống trồng trọt đặc tính hóa sinh (Motamayor et al., 2013) SWEET protein tham gia vào trình vận chuyển đường sucrose thực vật (Jeena et al., 2019) Các protein SWEET có cấu trúc gồm vùng xoắn xuyên màng Nhóm protein có chức vận chuyển sucrose, liên quan đến sự phát triển hoa, hạt, đồng thời có chức vận chuyển gibberellin sự phân bố 1Trường Đại học Hùng Vương 2Trường Đại học Sư phạm Hà Nội 3Trường Đại học Sư phạm Hà Nội *Email: phibang.cao@hvu.edu.vn PHẦN I NGHIÊN CỨU CƠ BẢN TRONG SINH HỌC 409 đường điều kiện stress thẩm thấu khác nhau, sự dinh dưỡng sinh vật gây bệnh liên quan đến sự điều hòa stress vô sinh (Jeena et al., 2019) Với vai trị quan trọng vậy, họ gene mã hóa SWEET nghiên cứu nhiều loài Aarabidopsis thaliana (Chen et al., 2010) lúa (Yuan & Wang, 2013), sắn (Chu Đức Hà nnk, 2018) nhiều loài thực vật khác (Li et al.,2018) Tuy nhiên, nghiên cứu họ gene SWEET ca cao đến chưa thực Cơng trình có mục tiêu xác định gene mã hóa SWEET hệ gene ca cao, phân tích đặc điểm cấu trúc, sự phân bố gene đặc điểm hóa lí lí thuyết protein SWEET loài sự biểu gene Những kết nghiên cứu bước đầu cung cấp thông tin khoa học cấu trúc, chức SWEET lồi cơng nghiệp quan trọng NGUYÊN LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU Cơ sở liệu Trình tự hệ gene ca cao lấy từ website phytozome (https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Tcacao) (Argout et al., 2011) Dữ liệu EST (expressed sequence tags) ca cao (txid3641) lấy từ sở liệu NCBI (https://www.ncbi.nlm.nih.gov/nuccore) Xác định gene thuộc họ SWEET ca cao Các protein SWEET Arabidopsis (Chen et al., 2010) sử dụng làm khn dị để tìm kiếm gene tương đồng liệu hệ gene ca cao nhờ chương trình TBLASTN, giúp tìm kiếm gene chưa giải tự động Xây dựng phả hệ Trình tự protein suy diễn SWEET ca cao, số có SWEET xác định quy mô hệ gene nho (đại diện thân gỗ hai mầm), A thaliana (hai mầm), lúa (một mầm) rêu (thực vật bậc cao) dãy MAFFT (Katoh & Standley, 2013), phả hệ xây dựng nhờ phần mềm MEGA X (Kumar et al., 2018) Phân tích đặc điểm hóa - lí Các đặc điểm vật lí, hóa học gene protein phân tích cơng cụ ExPASy (Gasteiger et al., 2005) Cấu trúc exon/intron xây dựng nhờ GSDS 2.0 (Guo et al., 2007) Nghiên cứu biểu gene Sự biểu gene khảo sát nhờ phân tích hệ EST (expressed sequence tags) ca cao có ngân hàng liệu NCBI KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN Xác định họ gene SWEET đặc điểm gene SWEET ca cao Tổng số 21 gene mã hóa cho SWEET ca cao xác định (Bảng 1) Họ SWEET ca cao lớn so với A thaliana (17 gene) (Chen et al., BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM 410 2010), nho (16 gene) (Afoufa-Bastien et al., 2010), tương đương với lúa, nhỏ so với sắn (28 gene) (Chu Đức Hà nnk., 2018) Phân tích cấu trúc cho thấy protein suy diễn gene mang vùng bảo tồn đặc trưng (MtN3_slv (PF03083)) (Chen et al., 2010) Bảng Các gene thuộc họ SWEET ca cao đặc điểm chúng Gene Tên locus Nhóm TcSWEET01 TcSWEET02 TcSWEET03 TcSWEET04 TcSWEET05 TcSWEET06 TcSWEET07 TcSWEET08 TcSWEET09 TcSWEET10 TcSWEET11 TcSWEET12 TcSWEET13 TcSWEET14 TcSWEET15 TcSWEET16 TcSWEET17 TcSWEET18 TcSWEET19 TcSWEET20 TcSWEET21 Thecc1EG004545 Thecc1EG008493 Thecc1EG012041 Thecc1EG014707 Thecc1EG014709 Thecc1EG014710 Thecc1EG015352 Thecc1EG016513 Thecc1EG016865 Thecc1EG016866 Thecc1EG021237 Thecc1EG026042 Thecc1EG026043 Thecc1EG026675 Thecc1EG026676 Thecc1EG026677 Thecc1EG026679 Thecc1EG026680 Thecc1EG029586 Thecc1EG032142 Thecc1EG035405 IV IV II IV IV IV I II II II III IV IV III III III III III I I I GL (bp) 1488 2080 1456 1474 2482 1766 1450 2102 1870 2449 2524 1379 1527 2700 1785 1715 1727 1628 1704 2671 2325 PL (aa) 306 287 232 281 289 285 255 255 247 235 237 254 301 245 302 265 299 293 233 287 252 MW (kD) 34,41 32,16 26,37 31,71 32,36 31,84 28,59 28,26 27,37 26,81 25,82 28,68 34,58 27,23 33,73 29,56 32,97 32,11 25,75 31,96 27,81 pI 9,47 8,75 9,36 9,18 8,66 9,42 9,10 9,52 8,97 9,01 7,70 8,45 9,28 7,72 6,20 9,13 9,11 9,45 9,18 8,53 9,23 NST IN 3 3 3 4 5 5 5 5 5 5 5 5 5 5 5 5 TMH SCL 7 7 7 7 7 7 7 6 7 7 PM PM PM PM PM PM PM PM PM PM PM PM PM PM PM PM PM PM PM PM PM Ghi chú: GL : Kích thước gene, PL: Chiều dài protein, MW: Khối lượng protein, NST: Nhiễm sắc thể, IN: Số lượng intron, TMH: Số lượng xoắn xuyên màng, SCL: Khu trú tế bào, PM: Plasma membrane Các gene mã hóa SWEET ca cao có chiều dài từ 1379 - 2700 nucleotide (Bảng 1) Các gene mã hóa khơng liên tục, hầu hết gene (19 gene) có năm intron, TcSWEET08 có bốn intron TcSWEET20 có bảy intron (Bảng 1) Các protein suy diễn có từ 232 (TcSWEET03) tới 306 (TcSWEET01) gốc axit amin, khối lượng phân tử lí thuyết từ 25,75 kDa (TcSWEET19) tới 34,58 kDa (TcSWEET13) Hầu hết protein có tính kiềm với giá trị pI từ 7,70 - 9,52, TcSWEET15 có pI lí thuyết 6,20 Các protein SWEET ca cao có giá trị GRAVY nằm khoảng 0,32 - 0,93 (Bảng 1) Như vậy SWEET ca cao có khối lượng pI tương đồng với SWEET sắn (Chu Đức Hà nnk.,2018) Hầu hết SWEET ca cao (18/21) có mang bảy vùng xoắn xuyên màng với cấu trúc đặc trưng gồm hai vùng xoắn xuyên màng theo cấu trúc 3+1+3 (Hình 1) Riêng ba phân tử TcSWEET14, TcSWEET16 TcSWEET17 có xoắn xuyên màng PHẦN I NGHIÊN CỨU CƠ BẢN TRONG SINH HỌC 411 (Bảng 1) Cấu trúc đặc trưng TcSWEET tương đồng với SWEET loài biết A thaliana, lúa (Chen et al., 2010) nhiều lồi khác (Jeena et al., 2019) Phân tích lí thuyết vị trí định khu tế bào cho thấy tất TcSWEET gắn với hệ thống màng (Bảng 1) Kết phù hợp với cấu trúc protein SWEET có chứa xoắn xuyên màng Hình Mơ hình cấu trúc với xoắn xun màng điển hình TcSWEET1 xây dựng nhờ TMHMM Server v.2.0 (http://www.cbs.dtu.dk/services/TMHMM) Phân tích di truyền Hình Cây di truyền xây dựng từ SWEET ca cao (Tc), A thaliana (At), nho (Vv), lúa (Os) rêu (Pp) Phân tích di truyền (Hình 2) SWEET ca cao thuộc bốn nhóm khác nhau, tương tự phả hệ xây dựng từ protein SWEET loài (Li et al., 2018) Nhóm I nhóm II có bốn gene, nhóm III có sáu gene nhóm IV có bảy gene Các gene SWEET ca cao phân bố không đồng tồn hệ gene Trong NST số 1; 2; 6; có gene, NST số có ba gene, NST số có sáu gene NST số có tới bảy gene (Hình 3) Sự phân bố khơng đồng gene SWEET ca cao tương đồng với sắn (Chu Đức Hà nnk., 2018) 412 BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM Vị trí xếp SWEET NST ca cao mức độ tương đồng gene cho thấy có nhiều sự kiện nhân gene SWEET xảy ra, góp phần làm tăng số lượng gene họ Căn vào vị trí gene di truyền vị trí gene hệ gene, có ba sự kiện nhân gene trước sau (tandem duplication) phát sinh cặp gene tương đồng TcSWEET12 TcSWEET13 (nhóm 4), TcSWEET15 TcSWEET16; TcSWEET17 TcSWEET18 (nhóm III) Sự nhân gene quan sát nhiều loài thực vật khác (Li et al., 2018) Hình Cây phả hệ xây dựng từ SWEET ca cao (Tc), A thaliana (At), nho (Vv), lúa (Os) rêu (Pp) Khảo sát biểu gene TcSWEET Sự biểu gene TcSWEET khảo sát từ hệ mã phiên EST xây dựng từ loại mô, giai đoạn phát triển điều kiện khác ca cao sở liệu NCBI (txid3641) (Bảng 2) Trong số 21 gene SWEET ca cao, gene TcSWEET03, TcSWEET10- TcSWEET13 TcSWEET16-TcSWEET18 khơng có EST phát Các gene cịn lại có số EST phát từ tới 10 Gene TcSWEET09 có EST từ thân, tương tự TcSWEET14 có EST từ trụ mầm mầm 2-3 tuần TcSWEET19 có EST từ hỗn hợp hạt TcSWEET01 có bốn EST phát có hai EST từ hạt 3-3,5 tháng sau thụ phấn hai EST từ vỏ thịt hạt trưởng thành TcSWEET04 có tới tám EST từ vỏ thịt hạt trưởng thành EST từ vỏ lên men tới 40 TcSWEET05 có EST thu từ rễ bị stress hạn TcSWEET08 EST thu từ rễ stress hạn cịn có EST thu từ nỗn 2-3 tháng sau thụ phấn TcSWEET07 có EST từ chồi non nhiễm Sahlbergella singularis Các gene TcSWEET02, TcSWEET15, TcSWEET20 TcSWEET21 có EST thu từ nhiều loại mô khác nhau, điều kiện thường bị nhiễm nấm (tác nhân sinh học) Sự biểu gene TcSWEET bước đầu PHẦN I NGHIÊN CỨU CƠ BẢN TRONG SINH HỌC 413 gợi ý chúng có vai trị định sự phát triển sự chống chịu điều kiện bất lợi vô sinh hữu sinh Trong có tám gene có EST quan sinh sản noãn, hạt vỏ Sự biểu gene SWEET liên quan đến sự vận chuyển đường liên tế bào sự phân bố dinh dưỡng tác nhân gây bệnh (Chen et al., 2010) Kết nghiên cứu khẳng định kết nghiên cứu sự biểu phân tích vai trị gene SWEET số loài thực vật khác (Jeena et al., 2019) Bảng Các EST gene TcSWEET phát hệ mã phiên ca cao Gene EST CU534764.1, CU534696.1 TcSWEET01 CU592828.1, CU592918.1 CU605659.1 ES442624.1 TcSWEET02 CU495103.1 CU533205.1 CU614537.1 Mô/điều kiện Vỏ thịt hạt trưởng thành Hạt 3-3,5 tháng sau thụ phấn Chồi non không nhiễm Sahlbergella singularis Đỉnh sinh trưởng từ 24h đến 90 ngày ủ với M Perniciosa Hoa nhiều giai đoạn phát triển Vỏ thịt hạt trưởng thành Vỏ lên men tới 40 Gene EST TcSWEET14 CU573462.1 TcSWEET15 CU477250.1, CU505531.1 CU474050.1 Mô/điều kiện Trụ mầm mầm 2-3 tuần Vỏ nhiễm Phytophthora palmivora Bầu giai đoạn tuần tới tháng TcSWEET16 nd nd TcSWEET17 nd nd TcSWEET18 nd nd TcSWEET19 CA798159.1 Hạt Hỗn hợp mô phân sinh không ủ Bầu non 7-10 ngày CU525166.1 ES442178.1 ủ với M perniciosa từ 24h sau thụ phấn đến 90 ngày Lá nhiễm Phytophthora TcSWEET03 nd nd CU497935.1 megakarya CU534075.1, CU534100.1, TcSWEET20 CU534128.1, CU534080.1, Vỏ thịt hạt trưởng Vỏ nhiễm CU578190.1 CU534743.1, thành Moniliophthora roreri TcSWEET04 CU534144.1, CU533939.1, CU534583.1 Vỏ lên men tới 40 CU479189.1, Vỏ nhiễm Phytophthora CU614935.1 CU480292.1 palmivora CU628934.1, Lá mầm mầm 1-3 TcSWEET05 CU490577.1 Rễ bị stress hạn CU628691.1 tuần Phần mơ phía vỏ TcSWEET06 nd nd CU541498.1 thân với ống lignin hóa Chồi non nhiễm Phần mơ phía vỏ TcSWEET07 CU569284.1 CU541052.1 Sahlbergella singularis thân với ống lignin hóa CU585235.1 Nỗn 2-3 tháng sau thụ phấn CU517604.1 Hạt 2-5 tháng sau thụ phấn TcSWEET08 TcSWEET21 CU491018.1 Rễ bị stress hạn CU596845.1 Hạt 4-5 tháng sau thụ phấn TcSWEET09 CU620334.1 Thân CU485950.1 Lớp đệm non TcSWEET10 nd nd CU503719.1 Noãn 1-7 ngày sau thụ phấn CU534434.1, TcSWEET11 nd nd Vỏ thịt hạt trưởng thành CU533859.1 TcSWEET12 nd nd Vỏ ủ với M perniciosa từ FC072071.1 24h đến 120 ngày TcSWEET13 nd nd Ghi chú: nd = không xác định 414 BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM KẾT LUẬN Trong công trình này, 21 gene mã hóa SWEET phát hệ gene ca cao Các protein suy diễn SWEET ca cao có cấu trúc đặc trưng cho SWEET biết Hầu hết TcSWEET có năm intron Các protein suy diễn có từ 232 tới 306 axit amin, hầu hết chúng có tính kiềm Các protein TcSWEET xếp bốn nhóm SWEET điển hình thực vật Các gene SWEET phân bố tám tổng số 10 nhiễm sắc thể ca cao Một số tượng nhân gene SWEET sau q trình biệt hóa lồi phát có liên quan đến số lượng lớn gene SWEET nhóm III IV lồi Mười hai số 21 gene biểu số loại mô ca cao, số điều kiện khác TÀI LIỆU THAM KHẢO Afoufa-Bastien D., Medici A., Jeauffre J., et al., 2010 The Vitis vinifera sugar transporter gene family: phylogenetic overview and macroarray expression profiling BMC Plant Biology, 10(1), 245 doi:10.1186/1471-2229-10-245 Argout X., Salse J., Aury J M., et al., 2011 The genome of Theobroma cacao Nat Genet, 43(2), 101-108 doi:10.1038/ng.736 Chen L Q., Hou B H., Lalonde S., et al., 2010 Sugar transporters for intercellular exchange and nutrition of pathogens Nature, 468(7323), 527-532 Figueira A., Alemanno L., Litz R E., 2005 Theobroma cacao Biotechnology of fruit and nut crops, 639-669 Gasteiger E., Hoogland C., Gattiker A., et al., 2005 Protein identification and analysis tools on the ExPASy server In The proteomics protocols handbook, Springer, 571-607 Guo A Y., Zhu Q H., Chen X., Luo J C., 2007 GSDS: a gene structure display server Yi Chuan, 29(8), 1023-1026 Chu Đức Hà, Phạm Thị Quỳnh, Phạm Thị Lý Thu, Nguyễn Văn Cương, Lê Tiến Dũng, 2018 Xác định họ gen mã hóa protein vận chuyển Sweet sắn (Manihot esculenta Crantz) Tạp chí Khoa học Trường Đại học Sư phạm Hà Nội, 63(3), 140-149 Jeena G S., Kumar S., Shukla R K, 2019 Structure, evolution and diverse physiological roles of SWEET sugar transporters in plants Plant Mol Biol, 100(4-5), 351-365 doi:10.1007/s11103019-00872-4 Katoh K., Standley D M, 2013, MAFFT multiple sequence alignment software version 7: improvements in performance and usability Mol Biol Evol, 30(4), 772-780 Kumar S., Stecher G., Li M., et al., 2018 MEGA X: Molecular Evolutionary Genetics Analysis across Computing Platforms Mol Biol Evol, 35(6), 1547-1549 Li X., Si W., Qin Q., et al., 2018 Deciphering evolutionary dynamics of SWEET genes in diverse plant lineages Scientific Reports, 8(1), 13440 doi:10.1038/s41598-018-31589-x Motamayor J C., Mockaitis K., Schmutz J., et al., 2013 The genome sequence of the most widely cultivated cacao type and its use to identify candidate genes regulating pod color Genome Biol, 14(6), r53 doi:10.1186/gb-2013-14-6-r53 Motamayor J C., Risterucci A M., Lopez P A., et al., 2002 Cacao domestication I: the origin of the cacao cultivated by the Mayas Heredity, 89(5), 380-386 PHẦN I NGHIÊN CỨU CƠ BẢN TRONG SINH HỌC 415 Yuan M., Wang S, 2013 Rice MtN3/saliva/SWEET family genes and their homologs in cellular organisms Mol Plant, 6(3), 665-674 doi:10.1093/mp/sst035 IN SILICO CHARACTERISATION OF GENES ENCODING SWEET PROTEIN IN COCOA (Theobroma cacao L.) Cao Phi Bang1,*, Nguyen Van Đinh2, Tran Thi Thanh Huyen3, Le Thi Man1, Vu Xuan Duong1 Abstract: SWEET (sugars will eventually be exported transporter) is one of the important sugar transport protein groups in plants In this study, 21 genes encoding the SWEET protein in the cocoa genome were identified and analyzed The genomic full-length of these genes ranged from 1379 to 2700 nucleotides, most of which have five introns The predicted proteins had 232 to 306 amino acids and contained the conserved transmembrane helix regions of known SWEETs Most of these proteins were alkaline Phylogeny analysis showed that the TcSWEETs were divided into four groups, group I (4 genes), group II (4 genes), group III (6 genes), and group IV (7 genes) These genes are not equally distributed in the cocoa genome Thirteen of the 21 SWEET genes presented in two chromosomes, and Some of the gene duplication events that occurred in these two chromosomes were related to the expansion of SWEET genes of group III and group IV Twelve of the 21 SWEET genes had EST which were detected in several different types of cocoa tissue, under different conditions Most of them had ESTs obtained from reproductive tissues or tissues affected by abiotic and biotic stress The expression of these genes suggested their important role in the development and stress resistance of the cocoa tree Keywords: SWEET, gene charaterization, gene expression, phylogeny, cocoa 1Hung Vuong University 2Hanoi Pedagogical University 3Hanoi *Email: National University of Education phibang.cao@hvu.edu.vn ... cứu họ gene SWEET ca cao đến chưa thực Cơng trình có mục tiêu xác định gene mã hóa SWEET hệ gene ca cao, phân tích đặc điểm cấu trúc, sự phân bố gene đặc điểm hóa lí lí thuyết protein SWEET. .. Bảng Các gene thuộc họ SWEET ca cao đặc điểm chúng Gene Tên locus Nhóm TcSWEET01 TcSWEET02 TcSWEET03 TcSWEET04 TcSWEET05 TcSWEET06 TcSWEET07 TcSWEET08 TcSWEET09 TcSWEET10 TcSWEET11 TcSWEET12 TcSWEET13... homologs in cellular organisms Mol Plant, 6(3), 665-674 doi:10.1093/mp/sst035 IN SILICO CHARACTERISATION OF GENES ENCODING SWEET PROTEIN IN COCOA (Theobroma cacao L.) Cao Phi Bang1,*, Nguyen Van Đinh2,

Ngày đăng: 09/10/2021, 13:41

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan