3.1 Kết quả nghiên cứu in silico họ gen OsNHX
3.1.1.1 Vị trí phân bố các gen trên NST
Vị trí phân bố locus các gen của họ gen OsNHX đƣợc mô phỏng bằng công cụ
Chromosome Map Tool (http://viewer.shigen.info/oryzavw/maptool/MapTool.do). Theo đóOsNHX1, OsNHX2, OsNHX3, OsNHX4, OsNHX5 lần lƣợt phân bố trên các NST số 7, 11, 5, 6, và 9 (hình 3.1). Trong đó các gen OsNHX1và OsNHX4 nằm trên NST sợi (+),
Hình 3.1 Sơ đồ phân bố các gen OsNHX trên NST ở lúa 3.1.1.2. Cấu trúc của các gen thuộc họ gen NHX 3.1.1.2. Cấu trúc của các gen thuộc họ gen NHX
Sơ đồ tổ chức các gen thuộc họ gen NHX đƣợc mơ phỏng dựa trên kích thƣớc gen, số lƣợng các exon/intron và thơng tin về vùng 5’UTR, 3’UTR của mỗi gen đƣợc xử lý từ nhiều nguồn dữ liệu khác nhau nhƣ RAGP7 (http://rice.plantbiology.msu.edu),
Phytozome v10.2 database (http://phytozome.jgi.doe.gov/pz/portal.html) và PIECE database (http://wheat.pw.usda.gov/piece/index.php).
So sánh cấu trúc của 5 gen thuộc họ gen OsNHX chúng tôi ghi nhận các gen OsNHX1 và OsNHX3 có cùng số Exon/Intron (14 exon), trong khi đó cả 2 gen OsNHX2
và OsNHX4 đều chứa 13 exon. Sự khác biệt này là do exon số 5 (242bp) ở gen OsNHX2 đƣợc phân tách thành 2 exon với kích thƣớc nhỏ hơn (47bp và 195bp) có mặt ở các gen
khác biệt với 4 gen còn lại. Phân tích kích thƣớc và vị trí mỗi exon các gen từ OsNHX1 đến OsNHX4 cho thấy chúng có nhiều điểm tƣơng đồng khi có đến 7 exon giống nhau về kích thƣớc và trật tự phân bố. Thậm chí hai gen OsNHX1 và OsNHX3 có độ tƣơng đồng cao hơn khi có 12/14 exon giống nhau. Sự giống nhau giữa 12 exon này chứng tỏ chúng có tính bảo thủ cao trong q trình tiến hóa. Vùng 5’UTR của mỗi gen có cấu trúc khác nhau có thể liên quan đến mức độ biểu hiện của gen (Hình 3.2).
Hình 3.2 Cấu trúc exon/intron các gen thuộc họ gen NHX ở lúa
So sánh mức độ tƣơng đồng về trình tự nucleotide các gen thuộc họ gen OsNHX chúng tôi cũng nhận thấy các gen OsNHX1 và OsNHX2; OsNHX2 và OsNHX3 có mức độ
tƣơng đồng cao nhất 52%). Trong khi gen OsNHX5 có mức độ tƣơng đồng thấp so với
các gen OsNHX1, OsNHX2 và OsNHX3 (Bảng 3.2).
Bảng 3.2 So sánh mức độ tƣơng đồng về trình tự nucleotid các gen thuộc họ OsNHX
Độ tƣơng đồng
Nucleotid (%) OsNHX5 OsNHX4 OsNHX3 OsNHX2 OsNHX1
OsNHX5 x 50 42 49 45 OsNHX4 50 x 46 44 44 OsNHX3 42 46 x 52 47 OsNHX2 49 44 52 x 52 OsNHX1 45 44 47 52 x Kích thƣớc gen (bp) 10377 4280 6144 4105 4924
Nhìn chung các gen thuộc họ gen OsNHX ở lúa có kích thƣớc dao động từ 4-11kb. Các gen từ OsNHX1 đến OsNHX4 có đặc điểm tƣơng tự nhau về số lƣợng, cấu trúc và vị trí phân bố các exon/intron đồng thời chúng cũng khác biệt rất lớn so với gen OsNHX5.
Phân tích đặc điểm cấu trúc các gen có vai trị quan trọng trong việc xác định nguồn gốc tiến hóa của họ gen và nghiên cứu sự đáp ứng đặc hiệu của gen đối với các điều kiện stress từ ngoại cảnh.
3.1.1.3. Phân tích cấu trúc của protein
a) So sánh trình tự amino acid đƣợc mã hóa bởi các gen thuộc họ gen OsNHX
Trình tự amino acid của đƣợc mã hóa bởi 5 gen thuộc họ gen OsNHX ở lúa đƣợc thu thập và xử lý từ cở sở dữ liệu RAGP7 (http://rice.plantbiology.msu.edu) và
Phytozome v10.2 database (http://phytozome.jgi.doe.gov/pz/portal.html). Qua phân tích dữ liệu cho thấy, protein thuộc họ gen OsNHX có số amino acid vào khoảng từ 528 đến 549 với mức độ tƣơng đồng về trình tự amino acid dao động từ 19,75% đến 72,61%. Các protein OsNHX1 đến OsNHX3 có độ tƣơng đồng cao nhất (>70%), trong khi protein
OsNHX5 có độ tƣơng đồng thấp nhất khi so sánh với 4 protein còn lại (Bảng 3.3).
Bảng 3.3 So sánh mức độ tƣơng đồng về trình tự amino acid các protein họ OsNHX
protein (%) OsNHX5 x 21.193 19.749 20.57 20.382 OsNHX4 21.193 x 51.872 50.799 52.151 OsNHX3 19.749 51.872 x 71.245 70.26 OsNHX2 20.57 50.799 71.245 x 72.61 OsNHX1 20.382 52.151 70.26 72.61 x Kích thƣớc protein (aa) 549 528 544 545 535
b) Dự đoán cấu trúc xuyên màng các phân tử protein thuộc họ protein OsNHX
Cấu trúc bậc 2 của các protein OsNHX đƣợc biểu thị dƣới các dạng xoắn, các miền xuyên màng, miền bên trong hay bên ngồi bào quan và những miền có chức năng quan trọng. Sử dụng một số cơ sở dữ liệu dự đốn mơ hình cấu trúc protein nhƣ, FFAS03, SWISS-MODEL và Phyre2 chúng tôi đã xác định rằng các protein OsNHX đƣợc giải thích dựa mơ hình mẫu (c4cz8A) cấu trúc tinh thể protein PaNhaP của vi khuẩn
Pyrococcus abyssii. Kết quả phân tích này cũng phù hợp với dữ liệu từ Pfam cho phép
chúng tôi khẳng định họ protein PaNhaP ở vi khuẩn và họ protein OsNHX có điểm chung về nguồn gốc phát sinh chủng loại. Xác định các miền protein xuyên màng họ protein OsNHX bằng công cụ mô phỏng cấu trúc protein tại http://wlab.ethz.ch/protter/# và http://phobius.sbc.su.se/cgi-bin/predict.pl. Kết quả mô phỏng cho biết protein OsNHX1,
OsNHX3và OsNHX2 (Hình 3.3a, 3b và 3.3c) đều có 12 miền xuyên màng. Mặc dù Protein OsNHX4 và OsNHX5 đều có 11 miền xuyên màng tuy nhiên chúng lại khác biệt nhau rõ rệt về mặt cấu trúc (3.3d và 3.3e). Trong 5 phân tử protein chỉ có protein OsNHX5 là có tín hiệu peptid ở đầu N (Hình 3.3e). Kiểu dạng hình học các protein OsNHX1 và OsNHX3 cho thấy sự giống nhau rõ rệt về sự sắp xếp trật tự các miền xuyên màng, trong màng, ngồi màng và cả vị trí xảy ra sự N-glyco hóa.
Hình 3.3a Mơ hình cấu trúc các miền protein xun màng OsNHX1
Hình 3.3c Mơ hình cấu các miền protein xuyên màng OsNHX3
Hình 3.3e Mơ hình cấu trúc các miền protein xuyên màng OsNHX5
Hình 3.3a đến 3.3c (OsNHX1 đến OsNHX3) cho thấy chúng đều có 12 miền xuyên màng chứng tỏ chúng đƣợc xếp cùng nhóm chức năng đó là trao đổi Na+
/H+ ở màng khơng bào. Mặc dù protein OsNHX4 có 11 miền protein nhƣng những miền quan trọng nhƣ miền 3, 6, 7 đều giống với các miền 3,6,7 của các protein OsNHX1, OsNHX2 và OsNHX3. Do đó các protein OsNHX1 đến OsNHX 4 đều thực hiện chức năng ở màng khơng bào. Riêng OsNHX5 (hình 3.3e) có tín hiệu peptid ở đầu N và có các miền 3,6,7 khác với 4 protein cịn lại. Do đó OsNHX5 trao đổi Na+/H+ ở màng hệ Gônghi.
Khả năng hoạt động của các antiporter NHX nói chung đƣợc kiểm sốt bởi một vị trí bám đặc hiệu bởi phân tử amiloride tại miền TM3 của hầu hết các protein tƣơng đồng
họ NHX. Vị trí này có trình tự đặc trƣng là LFFIYLLPPI, có tính bảo thủ cao và ảnh hƣởng đến khả năng kìm hãm hoạt động các antiporter [24], [38].
Mức độ tƣơng đồng về trình tự amino acid và kiểu dạng hình học cấu trúc protein cũng thể hiện sự khác biệt giữa các miền. Đầu N có sự tƣơng đồng cao hơn trong khi đầu C có sự tƣơng đồng thấp hơn đặc biệt là các vị trí sau miền TM12 trở đi.
c) Dự đoán cấu trúc bậc 3 các phân tử protein thuộc họ gen OsNHX
Để xác định mơ hình cấu trúc bậc 3 họ protein NHX chúng tôi tiến hành alignment trình tự acid amin của các protein từ OsNHX1 đến OsNHX5 với các cơ sở dữ liệu FFAS03, SWISS-MODEL và PFAM. Phân tích mơ hình protein từ Phyre2 kết hợp với so sánh với các cơ sở dữ liệu trên, chúng tôi đã định xác rằng mơ hình cấu trúc bậc 3 protein OsNHX đƣợc giải thích dựa mơ hình mẫu (c4cz8A) cấu trúc tinh thể protein
PaNhaP của vi khuẩn Pyrococcus abyssii. Kết quả phân tích cho thấy mơ hình 3D protein từ OsNHX1 đến OsNHX5 có mức độ tƣơng đồng với mơ hình gốc (c4cz8A) lần lƣợt là: 23%, 22%, 23%, 19% và 21% (các hình 3.4a, 3.4b, 3.4c, 3.4d và 3.4e).
Hình 3.4c Mơ hình 3D protein OsNHX3 Hình 3.4d Mơ hình 3D protein OsNHX4
Hình 3.4e Mơ hình 3D protein OsNHX5
d) Đánh giá mơ hình cấu trúc 3D của các protein thuộc họ protein OsNHX ở lúa
Mô hình 3D các phân tử protein thuộc họ OsNHX đƣợc phân tích định lƣợng bằng các chƣơng trình nhƣ ProSA-web và VADAR ver1.8. Đánh giá cơ sở dữ liệu các protein OsNHX bằng cách tính toán chỉ số Z-score của mỗi mơ hình protein 3D OsNHX1, OsNHX2, OsNHX3, OsNHX4 và OsNHX5 so sánh với mơ hình mẫu (Phụ lục 1).
Kết quả đánh giá định lƣợng cơ sở dữ liệu bằng ProSA cho thấy protein OsNHX1 có giá trị Z-score là -3.7 gần với giá trị của mơ hình mẫu c4cz8A (Z-score là -4.68). Các protein
cịn lại có giá trị thấp hơn đặc biệt là protein OsNHX4 có giá trị Z-score khá thấp. Do đó để đánh giá mức độ tin cậy của các mơ hình 3D protein OsNHX chúng tơi sử dụng phƣơng pháp phân tích điểm Ramachandran.
Kết quả phân tích điểm Ramachandran bằng chƣơng trình VADAR ver.1.8 đƣợc thể hiện ở hình 3.5 và các hình 7, 8, 9, 10 ở phụ lục 1. Biểu đồ điểm (plot) cho thấy vị trí phân bố các gốc amino acid tại hai miền góc xoắn (torsion angles) là Phi (Φ) and Psi (Ψ), ngoại trừ các amino acid phân bố tại đầu cuối mỗi chuỗi polipeptid. Gốc glycine đƣợc biểu thi bằng hình tam giác màu đen. Các gốc amino acid nằm trong vùng lõi (màu đỏ) biểu thị vùng phân bố có ƣu thế nhất (most favored) cịn các gốc amino acid nằm trong vùng màu vàng (allowed) và xanh đƣợc gọi là vùng đƣợc phép thay đổi mở rộng (generously allowed). Vùng không cho phép có mặt các amino acid đƣợc thể hiện bằng màu xám (miền Outside). Mơ hình protein 3D gọi là có ý nghĩa khi có ít nhất 90% gốc amino acid nằm trong vùng màu đỏ (most favored) và vùng màu vàng (allowed).
Kết quả đánh giá bằng VADAR ver1.8 cho thấy hầu các protein đều có trên 90% amino acid nằm trong vùng màu đỏ và màu vàng. Trong số 5 mơ hình protein, OsNHX5 có mơ hình 3D đƣợc đánh giá với tỷ lệ phần trăm thấp nhất (90%) còn OsNHX1 đƣợc đánh giá với tỉ lệ cao nhất (95%). Bảng 3.4.
Bảng 3.4 Chỉ số đánh giá mơ hình 3D của các protein thuộc họ OsNHX
Protein models Core Allowed Generous Outside Total Value(%)
OsNHX1 451 (84%) 63(11%) 16 (2%) 5(0%) 95%
OsNHX2 419 (76%) 91(16%) 14(2%) 21(3%) 92%
OsNHX3 431(79%) 68(12%) 25(4%) 20(3%) 91%
OsNHX4 432(81%) 57(10%) 16(3%) 23(4%) 91%
OsNHX5 414(77%) 71(13%) 22(4%) 28(5%) 90%
3.1.2. Phân tích vùng promoter các gen thuộc họ gen OsNHX 3.1.2.1. Nhận diện các yếu tố cis thuộc vùng promoter 3.1.2.1. Nhận diện các yếu tố cis thuộc vùng promoter
Vùng lõi promoter của mỗi gen đƣợc xác định có vị trí xung quanh TSS vào khoảng +/-50 nucleotid. Trong vùng lõi, nhiều yếu tố quan trọng nhƣ TATA box, G box, CAAT box góp phần điều hịa hoạt động phiên mã của gen. Theo dữ liệu đƣợc cập nhật tại trang: http://grassius.org/tf_browsefamily.html?species=Rice, có ít nhất 1772 yếu tố
phiên mã đã đƣợc tìm thấy ở hệ gen của tất cả các loài lúa thuộc chi Ozyza sativa. Kết
quả tìm kiếm các yếu tố cis đƣợc thống kê ở phụ lục 2 cũng cho thấy có rất nhiều yếu tố điều hịa Cis trong vùng promoter của 5 gen OsNHX. Tuy nhiên chúng tơi chỉ phân tích một số yếu tố vùng lõi và các yếu tố có ảnh hƣởng đến cƣờng độ phiên mã và mức độ biểu hiện tính chịu mặn và chịu hạn của các gen nhƣ hộp TATA, CAAT, ABRE, GT1GMSCAM4, MBS, NAC, W-box, GCN4-motif, DRE, MYBCORE. Các yếu tố đƣợc đánh dấu (*) thể hiện kết quả tìm kiếm từ PLACE plant Database. Yếu tố phiên mã NAC đƣợc tìm kiếm từ cơ sở dữ liệu http://plantpan2.itps.ncku.edu.tw/.
Để có dữ liệu thơng tin về vị trí hộp TATA, trình tự TSS và một số yếu tố cis quan trọng chúng tơi có tham khảo kết quả nghiên cứu của tác giả Atsunori Fukuda đăng trên tạp chí springer tháng 1 năm 2011 [5]. Theo tác giả vị trí trình tự TSS của các gen
OsNHX1, OsNHX2, OsNHX3 và OsNHX5 lần lƣợt là: -313, -406, -538 và -150 so với vị trí ATG.
Dựa và trình tự TSS kết hợp với cơng cụ trực tuyến tại trang web chúng tơi tiến hành tìm kiếm các yếu tố cis và kết quả đƣợc trình bày nhƣ bảng 3.5.
Bảng 3.5 Vị trí trình tự TSS và các yếu tố cis vùng promoter các gen thuộc họ OsNHX
Gene Promoter
OsNHX1 OsNHX2 OsNHX3 OsNHX5
Vùng lõi
TATA box
-36 TATA
-20
TACAAAA Khơng có Khơng có
CAAT
-168 CAAAT
+29
CAAAT Khơng có Khơng có
G-Box -81 CACGTG -116 CACGTG -102, +13 CACGAC CACATGG Khơng có Y-Patch -47, -48, -49 CCTCCC CCCTCC -32, -33, -34 CCTCCT CCCTCC -14, -21,+37 TTTCTC CCCTCC -34, +15 +26 TTCTTC TTCCCC Stress mặn ABRE -81(-), -79 ACGTGGC -115, -118(-) -140 ACGTGGC CGGTGCA -219 ACGTCGGC Khơng có MBS -657 (-) CAACTG -868, -918 (T/C)AACTG -62(-) CGGTCAA -308,-472(-) TAACTG NAC -1145, -977(-) CAGTCAAAT GCTTGACTT +44 (-),-786(-) - 787(-),-788(-) CAATCATTA GATGCGTTTAG -37 TTTTCGTTA -940, -934(-) -464(-) AAGTCAATT TTAACTGAC ATAACTGGC
Ghi chú : * Các yếu tố được đánh dấu (*) thể hiện kết quả tìm kiếm từ PLACE plant Database;
Kết quả thu đƣợc ở bảng 3.5 cho thấy hầu hết vị trí TSS của các gen đều nằm gần sát vùng 5’UTR, cá biệt có gen nằm sâu vào khoảng 70 nucleotid nhƣ gen OsNHX5. Đặc điểm về trình tự TSS cũng cho thấy một quy luật đặc thù đó là quy luật Y/R. Ngƣời ta quy ƣớc nucleotide vị trí + 1 là vị trí TSS, kế đó vị trí -1 là nuleotid đầu tiên của trình tự ngƣợc dịng TSS. Nhƣ vậy theo quy luật này TSS (-1/+1) sẽ có dạng Y/R (-1/+1). Trong đó Y là các base pyrimidine, cịn R là các base Purine.
W-box -167, -747 TTGAC -745, -167 TTGAC -61, -789(-) TTGACC -473,-724(-) TTGACC GCN4-motif -290 TGTGTCA
Khơng có Khơng có Khơng có
Stress hạn ABRE -81(-), -79 ACGTGGC -115, -118(-) -140 ACGTGGC CGGTGCA -219 ACGTCGGC Khơng có MBS -657 (-) CAACTG -868, -918 (T/C)AACTG -62(-) CGGTCAA -308,-472(-) TAACTG DRE (*) -326 ACCGAGA Khơng có -216(-) ACCGAC - 1226 ACCGAC MYBCORE (*) -970 CNGTTR -967(-) -867(-) CNGTTR -727 CNGTTR -750,-305 -308(-) CNGTTR NAC -1145, -977(-) CAGTCAAAT GCTTGACTT +44 (-),-786(-) - 787(-),-788(-) CAATCATTA GATGCGTTTAG -37 TTTTCGTTA -940, -934(-) -464(-) AAGTCAATT TTAACTGAC ATAACTGGC
Một yếu tố khác cũng vô cùng quan trọng đó là TATA-box. Nó vừa nằm trong trình tự lõi của promoter vừa có vai trị tăng cƣờng sự biểu hiện của gen. Trong bốn gen đã biết thơng tin về TSS thì có hai gen OsNHX3, OsNHX5 khơng có hộp TATA và các
yếu tố cis quan trọng của vùng lõi nhƣ CAAT, G box. Mặc dù hộp TATA rất quan trọng cho sự hình thành phức hệ khởi đầu phiên mã và kiểm sốt phiên mã song khơng phải hệ gen thực vật nào cũng có hộp TATA trong vùng promoter. Theo tác giả P. Civáň, và M. Švecchỉ khoảng 19% hệ gen lúa có chứa hộp TATA, trong khi đó có ít nhất 50% hệ gen lúa có chứa yếu tố Y patch trong vùng lõi promoter. Kết quả thể hiện ở bảng 3.5 cũng cho thấy hầu hết các gen đều có yếu tố Y patch trong vùng promoter, tuy nhiên có điều đặc biệt là hai gen OsNHX3 và OsNHX5 có khá nhiều yếu tố Y patch xuất hiện gần sát với vị trí TSS. Việc nhiều yếu tố TSS xuất hiện ở gần TSS cho thấy khả năng chúng liên quan đến hoạt động phiên mã khi mà promoter vắng mặt TATA- box.
So sánh các yếu tố cis ta có thể nhận thấy yếu tố CAAT ở gen OsNHX2 và gen
OsNHX2 xuất hiện cao hơn so với những gen khác, trong khi gen OsNHX4 (Xem phụ
lục) có yếu tố này thấp hơn trong khi đó gen OsNHX3 và OsNHX5 gần nhƣ khơng có
CAAT box trong vùng lõi promoter.. Yếu tố CAAT đóng vai trị tăng cƣờng hoạt động phiên mã khi nó nằm càng gần trình tự TSS của gen do đó chúng tơi đề xuất hoạt động phiên mã ở gen OsNHX1 và OsNHX2 diễn ra mạnh mẽ hơn những gen khác khi chịu áp lực stress.
Một số yếu tố tham gia gián tiếp vào đáp ứng stress mặn cũng đƣợc tìm thấy trong vùng promoter của các gen OsNHX nhƣ HSE, LTR và W-box. Các yếu tố này tham gia