BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM - HỘI NGHỊ KHOA HỌC QUỐC GIA LẦN THỨ DOI: 10.15625/vap.2022.0098 XÁC ĐỊNH VÀ PHÂN TÍCH CÁC GEN MÃ HĨA HSP70 Ở CÂY SẮN (Manihot esculanta) BẰNG PHƯƠNG PHÁP TIN SINH HỌC Đồng Thị Xiêm1,2, Nguyễn Thị Oanh1, Trần Thị Thanh Huyền3, Trần Thị Mai Lan2, Lê Thị Mận2, Nông Thị Thu Huyền4, Cao Phi Bằng2,* Tóm tắt Họ gene Hsp70 có vai trị quan trọng phát triển tính chống chịu thực vật Tổng số có 22 gene mã hóa Hsp70 xác định hệ gene sắn phương pháp tin sinh học Các MeHsp70 sắn có kích thước từ 1719 tới 12265 bp Ngoại trừ bốn gene MeHsp70-14, MeHsp70-18, MeHsp70-19 MeHsp70-21, gene lại phân mảnh với số lượng intron từ đến 12 Các protein MeHsp70 có chiều dài từ 572 đến 894 amino acid, khối lượng từ 61,97 đến 99,39 kDa, có tính acid có lực với nước (ngoại trừ MeHsp70-21) Dựa phân tích phát sinh chủng loại, Hsp70 sắn xếp vào năm nhóm Sự biểu gene MeHsp70 không giống điều kiện stress lạnh khác Có 21 gene MeHsp70 thay đổi mức độ biểu (12 gene biểu tăng, gene biểu giảm) điều kiện sốc lạnh so với đối chứng 18 gene thay đổi mức độ biểu (11 gene biểu tăng, gene biểu giảm) điều kiện rèn luyện lạnh Tương tự, 17 gene thay đổi mức độ biểu (10 gene biểu tăng, gene biểu giảm) điều kiện sốc lạnh sau rèn luyện Gene MeHsp70-20 không thay đổi mức độ biểu tất điều kiện stress lạnh so với đối chứng Phân tích in silico họ gene Hsp70 sở cho nghiên cứu sâu tách dịng gene phân tích chức gene họ Hsp70 sắn Từ khóa: Biểu gene, phát sinh chủng loại, sắn (Manihot esculanta), protein sốc nhiệt 70 (Hsp70), tin sinh học ĐẶT VẤN ĐỀ Sắn (Manihot esculanta) lương thực lấy củ quan trọng tám trăm triệu người giới (Ceballos et al., 2020) Đồng thời, sắn nguyên liệu sản xuất nhiên liệu sinh học quan trọng (Fathima et al., 2022) Có nguồn gốc từ vùng Amazone, sắn trồng rộng rãi nhiều nơi giới, đặc biệt vùng nhiệt đới, khí hậu khơ, chí nghèo dinh dưỡng châu Phi, châu Á,… có Việt Nam (Fathima et al., 2022; Otun et al., 2022) Vì vậy, sắn thường xuyên đối mặt với nhiều tác nhân bất lợi môi trường nhiệt độ cao, nhiệt độ thấp, hạn, mặn,… tác nhân gây bệnh Vì vậy, nghiên cứu để nâng cao suất, chất lượng khả chống chịu với tác nhân bất lợi sắn trọng (Fathima et al., Trường THPT Trần Nhật Duật, Yên Bái Trường Đại học Hùng Vương Trường Đại học Sư phạm Hà Nội Trường THPT thành phố Cao Bằng, Cao Bằng * Email: phibang.cao@hvu.edu.vn PHẦN NGHIÊN CỨU ỨNG DỤNG SINH HỌC PHỤC VỤ ĐỜI SỐNG VÀ PHÁT TRIỂN XÃ HỘI 875 2022) Hệ gene sắn giải trình tự cung cấp tài nguyên quan trọng nghiên cứu mức phân tử loài (Bredeson et al., 2016; Lyons et al., 2022) Các protein sốc nhiệt (Hsp) nhóm protein sinh tổng hợp có sốc nhiệt, tìm thấy hầu hết tất sinh vật: Từ vi khuẩn đến thực vật, động vật người (Al-Whaibi, 2011) Ở thực vật, thành viên họ gene Hsp đóng vai trị quan trọng q trình phát triển, đáp ứng điều kiện môi trường bất lợi khác nhiệt độ thấp nhiệt độ cao, hạn, mặn (Al-Whaibi, 2011) sinh vật gây bệnh (Berka et al., 2022; Park and Seo, 2015) Căn vào khối lượng phân tử, Hsp chia thành nhóm: Protein sốc nhiệt phân tử nhỏ (sHsp), protein sốc nhiệt 60 (Hsp60), protein sốc nhiệt 70 (Hsp70), protein sốc nhiệt 90 (Hsp90) protein sốc nhiệt 100 (Hsp100) (Al-Whaibi, 2011) Trong số này, Hsp70 quan tâm có nhiều vai trị trình phát triển chống chịu trước nhiều tác nhân bất lợi khác (Berka et al., 2022; Usman et al., 2017) Hơn nữa, nhiều nghiên cứu gần protein sốc nhiệt HSP70 cịn có chức điều khiển phát triển thực vật (Chen et al., 2019; Su et al., 2019) Trên quy mô hệ gene, họ gene Hsp70 xác định phân tích nhiều lồi thực vật khác nhau, Arabidopsis thaliana (18 gene) (Lin et al., 2001; Sung et al., 2001), lúa (Oryza sativa) (26 gene) (Jung et al., 2013), cải bắp (Brassica oleracea var capitata) (52 gene) (Su et al., 2019), đậu xanh (Vigna radiata) (32 gene) (Jasrotia et al., 2019), bí đỏ (Cucurbita moschata) (21 gene) (Davoudi et al., 2022), đu đủ (Carica papaya) (12 gene) (Le et al., 2022) Tuy nhiên, họ gene Hsp70 chưa nghiên cứu sắn Nghiên cứu hướng tới mục tiêu xác định phân tích đặc điểm gene Hsp70 phương pháp tin sinh học sắn, loại lương thực lấy củ nhiệt đới quan trọng Kết nghiên cứu tiền đề cho nghiên cứu chọn tạo giống loại lương thực có giá trị tiền đề cho nghiên cứu sâu chức họ Hsp70 PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Cơ sở liệu Hệ gene sắn (Manihot esculanta L.) giải trình tự (Bredeson et al., 2016) đặt server phytozome (https://phytozome-next.jgi.doe.gov/) Dữ liệu RNA-seq khai thác từ sở liệu Gene Expression Omnibus, NCBI (https://www.ncbi.nlm.nih.gov/geo/) rễ sắn xử lí stress lạnh điều kiện khác nhau: sốc lạnh (nhiệt độ giảm từ 25 oC xuống oC với tốc độ giảm oC/h), rèn luyện lạnh (nhiệt độ giảm từ 25 oC xuống 14 oC với tốc độ giảm oC/h), stress lạnh sau rèn luyện (cây luyện lạnh ngày 14 oC sau chuyển sang phịng ni oC), đối chứng nuôi 24 oC (Zeng et al., 2014) 2.2 Xác định gene Hsp70 sắn Chương trình TBLASTN (Gertz et al., 2006) sử dụng để tìm kiếm gene tương đồng toàn hệ gene sắn, protein Hsp70 A thaliana (Lin et al., 2001; Sung et al., 2001) sử dụng làm khn dị BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM 876 2.3 Phân tích in silico Hsp70 sắn Cấu trúc intron-exon gene xây dựng công cụ Gene structure display server v2 (GSDS) (Hu et al., 2015) Các đặc điểm vật lí, hóa học protein MeHsp70 phân tích công cụ ProtParam server ExPASy (Expert Protein Analysis System) (Gasteiger et al., 2005) Vị trí khu trú protein tế bào phân tích nhờ Yl oC (Briesemeister et al., 2010) 2.4 Xây dựng phát sinh chủng loại Các protein Hsp70 sắn, A thaliana (Lin et al., 2001; Sung et al., 2001), đu đủ (Le et al., 2022) dãy MAFFT (Katoh and Standley, 2013), phát sinh chủng loại xây dựng nhờ phần mềm MEGA11 (Tamura et al 2021) 2.5 Phân tích biểu gene Sự biểu gene xác định qua phân tích liệu RNA-seq ngân hàng Gene Expression Omnibus hỗn hợp rễ sắn xử lí stress lạnh (GSE52178) gồm: Sốc lạnh (CS: xử lí nhiệt độ giảm đột ngột từ 24 oC xuống oC với tốc độ oC/h), rèn luyện lạnh (CA: xử lí nhiệt độ giảm từ 24 oC xuống 14 oC với tốc độ oC/h) stress lạnh sau rèn luyện (CCA: xử lí nhiệt độ giảm từ 24 oC xuống 14 oC với tốc độ o C/h, giữ ngày 14 oC sau giảm nhiệt độ xuống oC), đối chứng (C) trồng 24 oC (Zeng et al., 2014) Mức độ biểu tương đối gene tính tỉ lệ giá trị biểu điều kiện stress lạnh so với giá trị biểu gene điều kiện đối chứng Các tỉ lệ chuyển thành giá trị log số để xây dựng đồ nhiệt KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN 3.1 Xác định họ gene Hsp70 quy mô hệ gene sắn Bảng Các trình tự Hsp70 sắn Tên gene Tên locus MeHsp70-01 MeHsp70-02 MeHsp70-03 MeHsp70-04 MeHsp70-05 MeHsp70-06 MeHsp70-07 MeHsp70-08 MeHsp70-09 MeHsp70-10 MeHsp70-11 MeHsp70-12 Manes.01G053300 Manes.02G006000 Manes.03G128900 Manes.04G123400 Manes.07G024700 Manes.07G046700 Manes.07G114100 Manes.07G114200 Manes.07G114800 Manes.08G139371 Manes.08G118700 Manes.09G073400 Chiều Chiều dài dài MW pI AI GRAVY SL gene protein (kDa) (bp) (aa) 3280 664 73,31 5,13 88,1 -0,42 ER 3095 664 73,32 5,14 87,2 -0,46 ER 6472 761 84,50 5,38 81,4 -0,39 C 4000 849 93,88 5,25 77,4 -0,43 C 3574 702 75,27 5,20 84,6 -0,34 Cp 3396 680 73,22 5,57 85,5 -0,33 M 2893 587 64,95 5,13 83,4 -0,37 C 2459 648 71,11 5,16 82,8 -0,41 C 2780 648 71,08 5,13 83,3 -0,40 C 2630 647 70,97 5,17 82,8 -0,41 C 2860 660 73,14 5,28 88,5 -0,46 ER 12265 894 99,39 5,29 86,1 -0,46 ER PHẦN NGHIÊN CỨU ỨNG DỤNG SINH HỌC PHỤC VỤ ĐỜI SỐNG VÀ PHÁT TRIỂN XÃ HỘI Tên gene Tên locus MeHsp70-13 MeHsp70-14 MeHsp70-15 MeHsp70-16 MeHsp70-17 MeHsp70-18 MeHsp70-19 MeHsp70-20 MeHsp70-21 MeHsp70-22 Manes.10G031400 Manes.10G032000 Manes.10G094100 Manes.10G117300 Manes.11G047600 Manes.11G067500 Manes.11G067600 Manes.14G143500 Manes.15G028300 Manes.15G072300 877 Chiều Chiều dài dài MW pI AI GRAVY SL gene protein (kDa) (bp) (aa) 2450 649 71,26 5,14 83,0 -0,41 C 2508 648 71,16 5,10 83,2 -0,41 C 3668 680 73,27 5,57 87,1 -0,33 M 3486 704 75,38 5,24 85,6 -0,34 Cp 3822 850 93,78 5,32 78,7 -0,42 C 1968 655 71,88 5,26 81,9 -0,44 C 1968 655 71,80 5,30 82,5 -0,44 C 1950 649 71,26 5,27 83,4 -0,43 C 1719 572 61,97 5,50 96,8 0,01 C 5558 773 86,55 5,53 80,5 -0,40 C Ghi chú: MW: Khối lượng phân tử, pI: Điểm đẳng điện, AI: Chỉ số béo, GRAVY: Chỉ số ưa nước trung bình, SL: Vị trí khu trú tế bào, C: Tế bào chất, Cp: Lục lạp, ER: Lưới nội chất, M: Ti thể Tổng số 22 gene mã hóa cho Hsp70 xác định hệ gene sắn (Bảng 1) Kiểm tra Pfam (Finn et al., 2014) protein suy diễn tất MeHsp70 có chứa vùng bảo tồn Hsp70 (PF00012) điển hình họ protein Với 22 gene, họ gene Hsp70 sắn lớn họ gen A thaliana (18 gene) (Lin et al., 2001; Sung et al., 2001), bí đỏ (Cucurbita moschata) (21 gene) (Davoudi et al., 2022) đu đủ (Carica papaya) (12 gene) (Le et al., 2022) bé lúa (Oryza sativa) (26 gene) (Jung et al., 2013), đậu xanh (Vigna radiata) (32 gene) (Jasrotia et al., 2019) cải bắp (Brassica oleracea var capitata) (52 gene) (Su et al., 2019) 3.2 Phân tích đặc điểm cấu trúc gene, đặc điểm protein họ Hsp70 sắn Hình Cấu trúc intron-exon MeHsp70 878 BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM Các gene Hsp70 sắn có độ dài trình tự nucleotide từ 1719 tới 12265 cặp nucleotide (Bảng 1) Ngoại trừ bốn gene MeHsp70-18, MeHsp70-19, MeHsp70-20 MeHsp70-21, gene lại phân mảnh với số lượng intron dao động từ đến 12 (Hình 1) Đặc điểm cấu trúc gene Hsp70 sắn có điểm tương đồng với nhiều loài khác, tiêu biểu đu đủ (Le et al., 2022) Các protein suy diễn có độ dài từ 572 tới 894 amino acid, khối lượng phân tử nằm khoảng 61,97 kDa tới 99,39 kDa Giá trị điểm đẳng điện (pI) lí thuyết MeHsp70 dao động từ 5,10 tới 5,57 (Bảng 1) Điều chứng tỏ MeHsp70 giàu amino acid có tính acid Các đặc điểm tương đồng với đặc điểm Hsp70 A thaliana (Lin et al., 2001; Sung et al., 2001) đu đủ (Le et al., 2022) Kết phân tích vị trí khu trú tế bào cho thấy, có 14 tổng số 22 Hsp70 sắn nằm tế bào chất Hai protein (MeHsp70-5 MeHsp70-16) nằm lục lạp, hai protein (MeHsp70-6 MeHsp70-15) ti tể bốn protein (MeHsp70-01, MeHsp70-02, MeHsp70-11 MeHsp70-12) lưới nội chất Kết nghiên cứu tương đồng với kết nghiên cứu A thaliana đu đủ có phần lớn Hsp70 khu trú tế bào chất số lượng nhỏ khu trú bào quan lục lạp, ti thể lưới nội chất (Le et al., 2022; Lin et al., 2001) 3.3 Phân tích phát sinh chủng loại phân loại MeHsp70 Hình Cây phát sinh chủng loại xây dựng từ Hsp70 sắn, A thaliana đu đủ PHẦN NGHIÊN CỨU ỨNG DỤNG SINH HỌC PHỤC VỤ ĐỜI SỐNG VÀ PHÁT TRIỂN XÃ HỘI 879 Cây phát sinh chủng loại cho thấy Hsp70 sắn xếp vào nhóm với Hsp70 A.thaliana đu đủ Trong đó, nhóm (màu hồng) có MeHsp70, nhóm (màu cam) có MeHsp70, nhóm (màu xanh màu đỏ) có MeHsp70, nhóm (màu tím) có thành viên (MeHsp70-21) nhóm có MeHsp70 Nhóm tập hợp MeHsp70 khu trú tế bào chất MeHsp70 nhóm khu trú lưới nội chất, nhóm khu trú lục lạp (màu xanh) ti thể (màu đỏ), nhóm khu trú lưới nội chất nhóm khu trú tế bào chất Các Hsp70 A thaliana đu đủ xếp thành nhóm Kết khác với lúa, Hsp70 xếp thành nhóm Cây phát sinh chủng loại cho phép phát số tượng nhân lặp gene sắn hình thành nên gene tương đồng (nhóm gene MeHsp70-07, MeHsp70-08, MeHsp70-09 MeHsp70-13, nhóm gene MeHsp70-01 MeHsp70-02, MeHsp7005 MeHsp70-16, MeHsp70-06 MeHsp70-15, MeHsp70-03 MeHsp70-22, MeHsp70-04 MeHsp70-17) Hiện tượng nhân lặp gene Hsp70 phát A thaliana đu đủ (Le et al., 2022; Lin et al., 2001) Đặc biệt, cải bắp phát hiện tượng nhân lặp gene trước sau có tới 25 tượng nhân lặp gene lặp đoạn (Su et al., 2019) 3.4 Phân tích mức độ biểu gene Hsp70 sắn Mức độ biểu tương đối gene MeHsp70 điều kiện stress lạnh thể hình Kết nghiên cứu cho thấy có 12 gene Hsp70 sắn tăng cường biểu điều kiện sốc lạnh (MeHsp70-01, MeHsp70-06, MeHsp7007, MeHsp70-09, MeHsp70-11, MeHsp70-12, MeHsp70-15, MeHsp70-17, MeHsp70-18 MeHsp70-21), mức độ biểu tăng cao gặp gene MeHsp70-07 Gene MeHsp70-20 không thay đổi mức độ biểu so với đối chứng Chín gene cịn lại giảm biểu điều kiện sốc lạnh Tương tự, gene tăng cường biểu điều kiện sốc lạnh tăng cường biểu điều kiện rèn luyện lạnh, ngoại trừ gene MeHsp70-09), mức độ biểu tăng cao gặp gene MeHsp70-17 Ba gene MeHsp70-09, MeHsp70-19 MeHsp70-20 không thay đổi mức độ biểu so với đối chứng Bảy gene lại giảm biểu điều kiện rèn luyện lạnh Có 10 gene Hsp70 sắn tăng cường biểu điều kiện sốc lạnh sau rèn luyện so với đối chứng (MeHsp70-06, MeHsp70-07, MeHsp70-08, MeHsp70-09, MeHsp70-11, MeHsp70-12, MeHsp70-15, MeHsp70-17, MeHsp70-21) ), mức độ biểu tăng cao gặp gene MeHsp70-11 Năm gene (MeHsp70-02, MeHsp70-03, MeHsp70-04, MeHsp70-10 MeHsp70-20) không thay đổi mức độ biểu so với đối chứng Bảy gene lại giảm biểu điều kiện rèn luyện lạnh Như vậy, có bảy gene ln biểu tăng cường điều kiện stress lạnh so với đối chứng (MeHsp7006, MeHsp70-07, MeHsp70-11, MeHsp70-12, MeHsp70-15, MeHsp70-17, MeHsp7021) Đặc biệt, hai gene MeHsp70-08 MeHsp70-13 biểu giảm điều kiện sốc lạnh rèn luyện lạnh lại biểu tăng điều kiện sốc lạnh sau rèn luyện Sự biểu khác gene MeHsp70 cho thấy chúng có chức khác liên quan đến tính chống chịu điều kiện stress lạnh sắn Sự biểu khác gene Hsp70 điều kiện stress lạnh quan sát đu đủ (Le et al., 2022), A thaliana (Sung et al., 2001) 880 BÁO CÁO KHOA HỌC VỀ NGHIÊN CỨU VÀ GIẢNG DẠY SINH HỌC Ở VIỆT NAM Hình Mức độ biểu tương đối gene MeHsp70 điều kiện stress lạnh CS: sốc lạnh, CA: rèn luyện lạnh, CCA: sốc lạnh sau rèn luyện KẾT LUẬN Trong hệ gene sắn có tổng số 22 gene mã hóa Hsp70 xác định Cấu trúc gene đặc điểm lý - hóa protein Hsp70 sắn phân tích Các Hsp70 sắn có chiều dài từ 572 đến 894 amino acid, khối lượng từ 61,97 đến 99,39 kDa Các protein MeHsp70 có tính acid có lực với nước (ngoại trừ MeHsp70-21) Các Hsp70 sắn xếp vào năm nhóm Phân tích GO cho thấy MeHsp70 có chức liên quan đến nhiều trình sinh học chức phân tử Sự biểu gene Hsp70 hỗn hợp rễ sắn điều kiện thường stress lạnh phân tích từ hệ mã phiên cho thấy biểu khác biệt Có 21 gene MeHsp70 thay đổi mức độ biểu (12 gene biểu tăng, gene biểu giảm) điều kiện sốc lạnh so với đối chứng Tương tự, 11 gene 10 gene MeHsp70 biểu tăng điều kiện luyện lạnh sốc lạnh sau rèn luyện, gene biểu giảm hai điều kiện stress lạnh Gene MeHsp70-20 không thay đổi mức độ biểu tất điều kiện stress lạnh so với đối chứng Phân tích in silico họ gene Hsp70 có ý nghĩa lớn, mở đường cho việc tách dịng gene phân tích chức gene họ Hsp70 sắn đáp ứng với điều kiện stress vô sinh khác