Chương 2: ĐẶC ĐIỂM CẤU TRÚC GENE CỦA SINH VẬT PROKARYOT VÀ EUKARYOT Tóm tắt: Những thao tác trên gene được dựa trên cơ sở những hiểu biết về đặc điểm cấu trúc của gene. Gene ở nhóm sinh vật Prokaryot và nhóm Eukaryot có những đặc điểm cấu trúc đặc trưng. Gene của đa số sinh vật Prokaryot có cấu trúc liên tục, bao gồm các trình tự mã hoá axit amin; gene của sinh vật Eukaryot có cấu trúc gián đoạn (gene phân mảnh) gồm các intron và exon xen kẽ nhau. Đặc điểm cấu trúc này đã quyết định sự khác nhau giữa quá trình phiên mã ở Prokaryot và Eukaryot. Các trình tự như promotor, operator, enhancer, yếu tố di truyền vận động (TGE), đoạn xen (IS), trình tự lặp lại CEN, TEL có cấu trúc và chức năng xác định trong hệ thống di truyền của tế bào. Hiện tượng biến tính, hồi tính của ADN, nhiệt độ chảy Tm cũng là cơ sở của một số kĩ thuật di truyền như lai phân tử, PCR, và một số kĩ thuật khác. Nội dung của chương gồm 3 vấn đề cơ bản : (1). Đặc điểm cấu trúc gene của sinh vật Prokaryot; (2). Cấu trúc phân đoạn gene của sinh vật Eukaryot; (3). Một số trình tự ADN. §1. ĐẶC ĐIỂM CẤU TRÚC GENE Ở PROKARYOT Gene của đa số sinh vật Prokaryol gồm nhiều cistron (đa cistron), trình tự promotor, operator. Gene cấu trúc của Prokaryot có cấu trúc liên tục, bao gồm những đoạn mã hoá axit amin. Promotor là trình tự trên phân tử ADN có ái lực với enzyme ARN-polimerase, có chức năng khởi động quá trình phiên mã. Operator là trình tự có ái lực với protein ức chế, nếu operator gắn với protein ức chế sẽ ngăn cản hoạt động của ARN-polimerase và ức chế quá trình phiên mã. Mỗi cistron chứa thông tin của một loại chuỗi polipeptit và cũng là nhân tố điều khiển quá trình tổng hợp chuỗi polipeptit thông qua quá trình phiên mã và dịch mã. §2. CẤU TRÚC PHÂN ĐOẠN GENE Ở EUKARYOT 2.1. Cấu trúc gene phân đoạn (gene phân mảnh) Một gene ở Eukaryot có cấu trúc bao gồm đoạn tăng cường (enhancer) đoạn khởi động (promotor), intron và kẽ nhau, cuối cùng là đoạn kết thúc. hoá (Noncoding Sequences) được gọi là intron hay gọi là đoạn xen (Intervening 25 Sequences) (IS) xen vào và làm gián đoạn các đoạn mã hoá (Coding Sequences) được gọi là exon. Hình 2.1. Cấu trúc gene phân đoạn ở Eukaryot Những gene có cấu trúc gồm exo được gọi là gene khảm (mosaic gene). Hiện nay, chưa rõ chức năng của intron, tuy nhiên có giả thuyết rằng, intron có vai trò như là các khoảng trống xen giữa các exon tạo thuận lợi cho sự tái tổ hợp giữa các exon. Thí nghiệm của Pierre Chambon (Pháp) phát hiện cấu trúc của exon - intron của gene ovalbumine gà. Ovalbumine là protein lòng trắng trứng. gồm một chuỗi polipeptit có 386 axit amin (tập hợp trong ống dẫn trứng ở thời kì gà mái đẻ trứng). Ngoài việc tách mARN của ovalbumine, sử dụng enzyme sao mã ngược tạo ra các bản sao của mARN sợi đơn được gọi là cADN và tạo thành cADN sợi kép. So sánh ADN hệ gene nhân với cADN khi giải trình tự cho phép phát hiện ra intron và exon. Kết quả ovalbumine trứng gà có 7 intron, 8 exon. 2.2. Phương pháp phát hiện các đoạn intron và exon 2.2.1. Phương pháp so sánh trình tự gene và trình tự cADN Bước 1: 1. Tách chiết ADN hệ gene. 2. Phân lập gene bằng kĩ thuật PCR hay enzyme cắt hạn chế. 3. Tạo dòng ADN tái tổ hợp, nhân dòng và tách dòng gene. 4. Giải trình tự gene. Bước 2: 1. Tách mARN trong tế bào chất (hàm lượng mARN rất lớn, mARN của ovalbumine chiếm tới 50% ARN trong các tế bào này). 2. Sử dụng enzyme sao mã ngược tổng hợp cARN. 3. Giải trình tự cARN. Bước 3: So sánh trình tự ADN hệ gene với trình tự cADN xác định được các đoạn intron và exon. 2.2.2. Phương pháp lai phân tử Phát hiện intron và exon còn được tiến hành theo phương pháp lai phân tử 26 và kiểm tra bằng kính hiển vi điện tử. 1. Tách ADN hệ gene và mARN tế bào chất. 2. Phân lập gene. 3. Lai phân tử giữa ADN và mARN sẽ xác định được intron và exon. Vấn đề đặt ra là khi phiên mã tổng hợp mARN thì các đoạn không mã hoá intron có được sao không ? Người ta thấy bản sao của ADN có cả exon và intron đó chính là tiền mARN (Pre-mARN), còn gọi là ARN không đồng nhất trong nhân (hn-ARN: heteroge nevusnucliar ARN). Loại hn-ARN chỉ được phát hiện ở sinh vật nhân chuẩn. §3. MỘT SỐ TRÌNH TỰ ADN 3.1. Promotor Thực chất của khởi đầu phiên mã là quan hệ tương tác giữa ARN- polimerase với trình tự promotor. Khi ARN-polimease gắn vào promotor thì quá trình phiên mã được thực hiện và kết quả sẽ tạo phân tử mARN. • Phần lớn các promotor ở E. coli về căn bản có cùng một cấu trúc theo sơ đồ sau: ADN sao mã hn-ARN ti ềnmARN processing cắt nối mARN -35 bp -10 bp +1 TTGACA mARN TATAAT Nếu bazơ đầu tiên được phiên mã ra mARN (thường là A) được đánh số +1 và tất cả các bazơ phía 5' hay phía trước nó không được phiên mã được ghi là (-). Ngay trước +l có 6 bazơ thường là trình tự TATAAT ở xung quanh -10, gọi là trình tự nhất trí (consensus sequense), có thể gọi pribnow box. Xung quanh trình tự -35 có trình tự nhất trí TTGACA. Cả hai trình tự phối hợp với nhau cho phép ARN-polimerase gắn vào promotor và quá trình phiên mã và dịch mã bắt đầu. Promotor ở Eukaryot nằm phía trước điểm xuất phát của mARN. Hộp TATA, định hướng cho ARN-polimerase bắt đầu phiên mã, nằm khoảng dưới 27 30 bp (động vật có vú) và 6-120 bp (nấm men). Trước hộp TATA có hai trình tự tương ứng phía trước khoảng 40 bp là CCAAT và 110 bp là trình tự giàu GC. -110 bp -40 bp -30 bp +1 GGGCGGG CCAAT TATA mARN Sự thay đổi hộp TATA làm giảm tốc độ phiên mã. Hiệu quả của tốt độ phiên mã đo bằng sự thay đổi từng bazơ trong promotor. Hộp TATA và các trình tự phía trước phải được nhận biết bởi các protein điều hoà, chính các protein này gắn với các điểm nhất định trên chúng và hoạt hoá sụ phiên mã. 3.2. Enhancer (trình tự tăng cường) Enhancer là trình tự có tác động cis (đều phía) có chức năng làm tăng tốc độ phiên mã, enhancer có hiệu quả ngay cả khi cách xa vài nghìn cặp bazơ và chúng hoạt động bất kì ở hướng nào, dù là ở trước hay sau promotor. Trình tự tham gia điều hoà - cis có cấu trúc gồm 2 phần đối xứng nhau: AGGTCA TGACCT TCCAGT ACTGGA Enhancer được tổ chức gồm một dãy các trình tự có tác động cis để nhận biến các nhân tố trans - nhân tốprotein tham gia điều hoà biểu hiện gene. Nhân tố trans gồm 2 vùng cấu trúc chức năng: vùng gắn trans với ADN và vùng tác động lên phiên mã. Các nhân tố trans có 4 kiểu tác động như: "Ngón tay kẽm" (zine-finger) "Xoắn-vòng-xoắn" (hehx-turn-hehx) "Xoắn-nút-xoắn" (hehx-loop-helix) "Dây kéo leucine" (leucine-zipper) Giữa trình tự cis và nhân tố trans thường có các tương tác đặc hiệu do những liên kết yếu hình thành giữa các phân tử của nhân tố trans với các bazơ của trình tự cis. Các trình tự cis thường tiếp nhận protein điều hoà (nhân tố trans) gồm 2 tiểu đơn vị (dimer). Nhân tố trans có thể có 4 nhóm cấu trúc, chúng luôn gắn lên cis. Điều hoà bằng cách biến đổi nhiễm sắc chất hay ADN. Nhiễm sắc thể tồn tại những vùng "nhạy cảm" tương ứng với các gene hoạt động. Các vùng nhạy cảm này dễ tiếp xúc với enzyme sao mã. Tóm lại, các gene của Eukaryot được hoạt hoá bởi hai trình tự ADN có tác động cis là promotor và enhancer. Chúng được nhận biết các nhân tố protein 28 có Lác động trans. Các nhân tố trans này cho phép ARN-polimerase khởi động phiên mã và đạt tốc độ phiên mã tối đa. 3.3. Yếu tố di truyền vận động (Transposable Genetic Element-TGE) Gene nhảy (Jumping genes -JG) Gene nhảy (Jumping genes) còn dược gọi là yếu tố di truyền vận động (TGE) lần đầu tiên được phát hiện bởi Barbara Mc Clintock khi nghiên cứu ở ngô vào những năm 40 của thế kỉ XX và bà đã được nhận giải thưởng Nobel 1983. TGE là những đoạn ADN đặc biệt xen vào một hoặc một số vị trí trong hệ gene, tạo nên những biến đổi di truyền. Loại TGE đơn giản nhất là các đoạn xen (Insertion Sequence - IS ). IS cần thiết cho quá trình xen ADN vào NST, cho quá trình chuyển TGE từ vị trí này sang vị trí khác trong hệ gene. Cấu trúc của IS giống nhau ở những sinh vật khác nhau. Người ta đã phát hiện được ở E. coli một đoạn xen IS1 chứa 720 bp (base pair), nằm giữa đoạn đảo ngược IR (24 bp) Hình 2.2. Đoạn xen IS1 ở E. coli Ở E. coli còn phát hiện ra gene nhảy mang tên Tn 1681 (Transposase) gồm 2 đoạn xen IS1 ở hai đầu và 1 gene khác dài 552 bp quy định độc tố chịu nhiệt gây ỉa chảy. Hình 2.3. Gene nhảy Tn 1681 ở E. coli Gene nhảy Tn ở E. coli có thể chuyển vị trí và xen vào một nhiễm sắc thể khác theo cơ chế được biểu diễn bằng mô hình ở hình 2.4. 3.4. Biến tính và hồi tính Hai mạch ADN liên kết với nhau bằng những liên kết hyđro. Khi nhiệt độ lên tới 80-950C thì hai mạch ADN tách nhau, được gọi là hiện tượng biến tính của ADN. 29 Nhiệt độ làm 2 mạch ADN tách rời nhau được gọi là điểm chảy (melting point). Điểm chảy được tính ở giữa đường cong OD hình Sigma. Điểm chảy kí hiệu Tm. ADN có hàm lượng G-C cao thì điểm chảy cao hơn. ADN có 60% là G- C thì Tm = 95 0 C. Hình 2.4. Cơ chế xen của gene nhảy Tn 1681 ở E. coli Khi nhiệt độ hạ xuống và trở lại bình thường, thì hai mạch đơn lại liên kết với nhau tạo thành ADN mạch kép. Hiện tượng này được gọi là hồi tính (Renaturation). 3.5. Trình tự lặp lại 3.5.1. Khái niệm Hiện tượng trong các phân tử ADN có các trình tự bazơ ngắn được lặp lại nhiều lần gọi là trình tự lặp lại. Ví dụ: ATAT GCGTCCATATCGCGCTATATGCGTAGC Sự không đồng nhất của ADN Eukaryot thể hiện rõ khi thực hiện phản ứng tái hợp ADN (Reassociation). • ADN bị cắt nhỏ bởi enzyme giới hạn. • ADN được biến tính. • Hồi tính: Các trình tự bổ sung dễ tái tổ hợp với nhau, từ đó nhận biết được các trình tự lặp lại. 30 Hình 2.5. Đường cong Tm • Trình tự CEN Các trình tự lặp lại cao CEN là nằm ở các tâm động (Centromere) của nhiễm sắc thể. ở nấm men Saccharomyces gồm các trình tự CEN. - Trình tự đầu có 9 cặp bazơ TCACATGAT (ở đầu 5') - Trình tự giữa 80 - 90 bp, rất giàu A - T (>90%) - Trình tự 11 cặp bazơ ở đầu 3': TGATTTCCGAA • Trình tự TEL (Telomere - đầu mút NST) Trình tự TEL có tính lặp lại cao, giàu A và C: CCCCACACACCA (nấm men) và CCCTAA (người). Đầu mút NST giàu G gập lại thành những hình kẹp tóc có cấu trúc bậc IV. Cấu trúc này bảo vệ đầu mút NST có thể bị cắt bởi nuclease, giữ cho đầu mút khỏi mất các trình tự mã hoá. 3.5.2.Ứng dụng nghiên cứu trình tự nucleotit lặp lại Gần đây một loại chỉ thị phân tử mới được gọi là vi vệ tinh - microsatehtte (Litt and Luti, 1989) hoặc trình tự nucleotit lặp lại đơn giản - Simple sequence repeat (Tautz 1989, Weber and May, 1989) đã được mô tả sau khi tiến hành phản ứng tổng hợp ADN nhờ polimeraza và điện li trên gel poliacrylamit người ta có thể phát hiện loại đa hình này. Trình tự hai nucleotit lặp lại rất phong phú trong bộ gene của người cũng như động thực vật. Tanksley và cộng sự, 1993 khi nghiên cứu hiện tượng đa hình của cá( vi vệ tinh ở lúa cho thấy 2 nucleotit lặp lại (GA)n hoặc (GT)n xuất hiện sau mỗi một đoạn ADN dài 150 Kb, tổng số 2 nucleotit này chừng 3000. Đây là nguồn phân tử ADN đa hình phong phú đối với việc lập bản đồ gene ở loại cây trồng này. Yanagisawa và cộng sự (1994) đã nghiên cứu dấu vân ADN của 47 giống 31 đậu tương thông qua chất dò Oligonucleotit nhằm phát hiện trình tự ADN lặp lại đơn giản và cho biết hiện trạng đa hình thể hiện rõ nhất là khi dùng Oligolucleotit (AAT)6 làm đoạn dò ADN tất cả giống đậu tương thử nghiệm đều phân biệt với nhau bởi đoạn dò đó. Khi sử dụng ba đoạn dò ADN khác nhau như (CT)8, (GAA)5 và (AAGG)4 thì không phát hiện được các băng ADN đa hình từ các giống đậu tương thuộc Subgeneus Soja (Glicine max và Glicine Soja), trái lại các băng ADN đa hình xuất hiện trong số các giống thuộc Subgeneus, Glicine. Kết quả nghiên cứu đã chứng tỏ G. max và G. Soja gần gũi nhau về cấu trúc bộ gene. THẢO LUẬN 1. Phân biệt cấu trúc của gene ở sinh vật Prokaryot và Eukaryot. Vấn đề về đặc điểm của gene ở sinh vật Eukaryot. 2. Phương pháp xác định các đoạn intron và exon trong gene của sinh vật Eukaryot. Cho ví dụ. 3. Phân biệt khái niệm về gene nhảy và đoạn xen. Cơ chế xen của gene nhảy. 4. Trình bày các khái niệm: trình tự lặp lại, biến tính và hồi tính. Ứng dụng của các kĩ thuật này trong phân tích sinh học phân tử. 32 . theo phương pháp lai phân tử 26 và kiểm tra bằng kính hiển vi điện tử. 1. Tách ADN hệ gene và mARN tế bào chất. 2. Phân lập gene. 3. Lai phân tử giữa ADN và mARN sẽ xác định được intron và. cARN. 3. Giải trình tự cARN. Bước 3: So sánh trình tự ADN hệ gene với trình tự cADN xác định được các đoạn intron và exon. 2. 2 .2. Phương pháp lai phân tử Phát hiện intron và exon còn được. kẽm" (zine-finger) "Xoắn-vòng-xoắn" (hehx-turn-hehx) "Xoắn-nút-xoắn" (hehx-loop-helix) "Dây kéo leucine" (leucine-zipper) Giữa trình tự cis và nhân tố trans