330 khối kiến thức 3 Di truyền học gen khác. Điều đáng lu ý là trong phạm vi mỗi gen nhất định, luôn chỉ có một mạch ADN đợc làm khuôn để phiên mã. Một phân tử mARN chỉ có trình tự bổ sung với mạch làm khuôn ADN theo nguyên tắc kết cặp của các bazơ, chứ không giống hệt mạch làm khuôn này. Sự kết cặp giữa các bazơ là giống nhau trong sao chép ADN và phiên mã, chỉ có đặc điểm khác là U thay thế cho T là thành phần bazơ của ARN; ngoài ra các nucleotit của ARN mang thành phần đờng là ribose thay cho deoxyribose trong phân tử ADN. Giống với mạch ADN mới, phân tử ARN đợc tổng hợp theo chiều đối song song với mạch ADN làm khuôn. (Xem các khái niệm về "đối song song" và "chiều 5 3" của chuỗi axit nucleic trên Hình 16.7). Ví dụ nh, trình tự ba bazơ ACC dọc phân tử ADN (viết là 3-ACC-5) làm khuôn tổng hợp nên trình tự 5-UGG-3 trên phân tử mARN. Mỗi bộ ba các bazơ của phân tử mARN đợc gọi là codon; và theo thói quen, chúng thờng đợc viết theo chiều 5 3. Trong ví dụ trên đây, UGG là codon mã hóa cho axit amin Tryptophan (viết tắt là Trp). Thuật ngữ codon trong thực tế cũng đợc dùng để chỉ bộ ba các bazơ thuộc mạch không làm khuôn trên phân tử ADN. Những codon này có trình tự các nucleotit bổ sung với mạch ADN làm khuôn, và vì vậy sẽ giống với trình tự các nucleotit trên mARN, trừ việc U đợc thay thế bằng T. (Vì lý do này, mạch ADN không làm khuôn lại đợc gọi là mạch mã hóa.) Trong quá trình dịch mã, trình tự các codon dọc phân tử mARN đợc giải mã, hay dịch mã, thành trình tự các axit amin từ đó hình thành nên chuỗi polypeptit. Các codon đợc bộ máy dịch mã đọc theo chiều 5 3 của mạch mARN. Mỗi codon xác định một trong 20 loại axit amin đợc lắp ráp vào đúng vị trí tơng ứng dọc chuỗi polypeptit. Do các codon là mã bộ ba, nên số nucleotit cần để mã hóa một thông điệp di truyền cần nhiều hơn ít nhất ba lần so với số các axit amin trong sản phẩm protein. Ví dự nh, để mã hóa một chuỗi polypeptit gồm 100 axit amin, cần một trình tự gồm 300 nucleotit dọc mạch ARN. Giải mã sự sống Các nhà sinh học phân tử đã giải mã sự sống thành công vào những năm đầu của thập kỷ 1960, khi một loạt các thí nghiệm hợp lý đã giúp làm sáng tỏ sự dịch mã các axit amin từ mỗi codon trên mARN. Codon đầu tiên đợc giải mã bởi Marshall Nirenberg và cộng sự tại Viện Y học Quốc gia Hoa Kỳ (NIH) vào năm 1961. Nirenberg đã tổng hợp nhân tạo đợc một phân tử mARN gồm toàn các nucleotit ARN thuộc loại uracil (U) liên kết với nhau. Bất kể khi mạch ARN đợc bắt đầu và kết thúc dịch mã nh thế nào, thì mã bộ ba lặp lại cũng luôn là UUU. Nirenberg đã bổ sung phân tử poly U này vào ống nghiệm chứa dung dịch hỗn hợp gồm các loại axit amin, ribosome và các thành phần khác cần cho sự tổng hợp protein. Hệ thống nhân tạo của Nirenberg và cộng sự đã dẫn đến sự hình thành một chuỗi polypeptit chỉ gồm toàn các axit amin phenylalanine (Phe) kết thành chuỗi liên tiếp, còn đợc gọi là chuỗi polyphenylalanine. Bằng cách đó, Nirenberg đã xác định đợc rằng codon UUU trên phân tử mARN xác định axit amin phenylalanine. Ngay sau đó, các axit amin đợc xác định bằng các codon AAA, GGG và CCC cũng đã đợc xác định. Mặc dù phải áp dụng một số kỹ thuật phức tạp hơn mới có thể giải mã các codon khác, nh AUA và CGA; nhng có thể nói đến giữa những năm 1960, tất cả 64 codon đã đợc giải mã hết. Nh đợc liệt kê trên Hình 17.5, trong số 64 codon có 61 codon mã hóa cho các axit amin. Ba codon không mã hóa cho bất cứ axit amin nào đợc gọi là các tín hiệu kết thúc dịch mã (stop codon); ở đó, quá trình dịch mã kết thúc. Điều đáng lu ý là codon AUG có hai chức năng: nó vừa mã hóa cho axit amin methinonine (Met), vừa là tín hiệu bắt đầu dịch mã (start codon). Điều này có nghĩa là, các thông điệp di truyền trên phân tử mARN luôn đợc bắt đầu từ codon AUG (trừ một số ngoại lệ); nói cách khác, đây cũng chính là tín hiệu thông báo cho bộ máy dịch mã bắt đầu quá trình dịch mã mARN. (Do AUG đồng thời mã hóa cho methionine, nên tất cả các chuỗi polypeptit đều bắt đầu bằng axit amin này khi chúng đợc tổng hợp. Tuy vậy, sau đó một enzym có thể cắt bỏ axit amin khởi đầu này hoặc không). Có một đặc điểm cần chú ý trên Hình 17.5 là mã di truyền có tính thoái hóa, nhng luôn đặc thù. Cụ thể nh, mặc dù các mã bộ ba GAA và GAG có thể đồng thời mã hóa cho axit glutamic (tính thoái hóa), nhng không có bất kỳ mã bộ ba nào đồng thời mã hóa cho hai axit amin trở lên (tính đặc thù). Ngoài ra, tính thoái hóa của mã bộ ba cũng không phải là ngẫu nhiên. Trong nhiều trờng hợp, các codon khác nhau có cùng nghĩa (mã hóa cho cùng một loại axit amin), mà chỉ khác nhau về bazơ thứ ba trong bộ ba nucleotit của chúng. ở phần sau của chơng này, chúng ta sẽ thấy u điểm của tính thoái hóa của mã di truyền trong các quá trình biểu hiện các gen. Hình 17.5 Từ điển mã di truyền. Thứ tự ba bazơ của các codon mARN đợc minh họa theo chiều 5' 3' trên phân tử mARN. (Thực hành sử dụng "Từ điển mã di truyền này" bằng việc tìm ra các codon trên Hình 17.4). Codon AUG không chỉ mã hóa axit amin methionine (Met) mà còn là tín hiệu "báo hiệu" cho ribosome bắt đầu dịch mã tại điểm này. Có 3 trong 64 codon có chức năng là "tín hiệu kết thúc dịch mã" (stop codon); nó báo hiệu sự kết thúc của một "thông điệp di truyền". Xem Hình 5.17 về cách viết tắt các axit amin bằng ba chữ cái. Bazơ mARN thứ hai Bazơ mARN thứ nhất Bazơ mARN thứ ba Chơng 17 Từ gen đến protein 331 Để có thể hiểu đợc một thông điệp hay một câu đợc viết theo một ngôn ngữ nào đó thì chúng ta phải đọc đợc các kí hiệu của ngôn ngữ đó khi chúng đợc xếp theo những những nhóm nhất định; nói cách khác là trong một khung đọc đúng. Hãy xem câu nói sau: con chó bắt con mèo. Nếu sự xếp nhóm của các chữ trong câu này bắt đầu từ một vị trí sai, thì câu sẽ trở nên vô nghĩa; chẳng hạn nh onc hób ắtc onm èo. Khung đọc cũng có vai trò quan trọng nh vậy trong ngôn ngữ phân tử của tế bào. Chẳng hạn nh đoạn polypeptit ngắn trên Hình 17.4 sẽ chỉ đợc tạo ra chính xác một khi các nucleotit trên phân tử mARN đợc đọc từ trái qua phải (chiều 5 3) đúng theo từng nhóm 3 kí tự là UGG UUU GGC UCA. Mặc dù thông điệp di truyền đợc viết liên tục (không có khoảng cách) giữa các mã bộ ba, nhng bộ máy tổng hợp protein của tế bào đọc đợc thông điệp đó bằng việc xếp các chữ cái (nucleotit) thành chuỗi các từ (codon) gồm ba chữ cái liên tục và không gối lên nhau. Thông điệp di truyền không đợc đọc theo kiểu các codon gối lên nhau, chẳng hạn nh UGG UUU; trong trờng hợp mã gối lên nhau, nghĩa của thông điệp sẽ thay đổi. Sự tiến hóa của mã di truyền Mã di truyền có tính phổ biến, nghĩa là giống nhau ở tất cả các loài từ các vi khuẩn đơn bào đơn giản nhất cho đến các loài động vật và thực vật có cấu trúc phức tạp nhất. Chẳng hạn nh, mã bộ ba CCG trên phân tử mARN đợc dịch mã thành axit amin proline ở mọi loài sinh vật đã từng nghiên cứu. Nhờ tính phổ biến của mã di truyền, trong phòng thí nghiệm, các gen đợc chuyển (biến nạp) từ loài này sang loài khác nhìn chung đợc phiên mã và dịch mã một cách hiệu quả đáng ngạc nhiên, nh ví dụ trên Hình 17.6 ! Một số protein của ngời đợc dùng trong y học, nh insulin, có thể đợc sản xuất bằng các tế bào vi khuẩn sau khi gen mã hóa protein đó đợc chuyển từ hệ gen ngời vào hệ gen vi khuẩn. Những thành tựu nh vậy của kỹ thuật "chuyển gen" đã tạo ra sự phát triển mạnh mẽ của công nghệ sinh học trong những năm gần đây (xem Chơng 20). Tuy vậy, có một số ngoại lệ so với tính phổ biến chung của mã di truyền. ở những trờng hợp này, hệ thống dịch mã đọc các mã bộ ba với nghĩa thay đổi chút ít so với các mã bộ ba tiêu chuẩn. Những thay đổi nhỏ này đã đợc tìm thấy ở một số loài sinh vật nhân thật đơn bào và trong hệ gen tế bào chất (ti thể và lạp thể) của một số loài. Ngoài ra, cũng có những ngoại lệ liên quan đến việc một mã bộ ba kết thúc đợc dịch mã thành một trong hai loại axit amin hiếm vốn không thấy có ở phần lớn các loài. Một trong những axit amin hiếm nh vậy (pyrrolysine) cho đến nay mới chỉ gặp ở liên giới vi khuẩn cực đoan (Archeae); trong khi đó, axit amin hiếm thứ hai (selenocysteine) đợc tìm thấy trong protein của vi khuẩn và thậm chí ở một số enzym của ngời. Mặc dù có ngoại lệ, nhng có thể nói tính phổ biến của mã di truyền là rõ ràng. Một ngôn ngữ đợc mọi hệ thống sống sử dụng chung là bằng chứng cho thấy nó xuất hiện ngay từ giai đoạn sớm của quá trình tiến hóa. Nói cách khác, ngôn ngữ này có mặt đủ sớm trong tổ tiên chung của mọi sinh vật còn tồn tại đến ngày nay. Ngôn ngữ di truyền đợc dùng chung đồng thời là một bằng chứng gợi nhớ về mối quan hệ họ hàng giữa mọi dạng sống trên Trái đất. Bây giờ chúng ta sẽ đề cập đến tính logic về khía cạnh ngôn ngữ và ý nghĩa tiến hóa của mã di truyền. Trớc tiên, chúng ta sẽ xem chi tiết hơn các bớc của phiên mã, giai đoạn thứ nhất trong quá trình biểu hiện của các gen mã hóa protein. Các thành phần phân tử của phiên m ARN thông tin, phân tử mang thông tin từ ADN tới bộ máy tổng hợp protein của tế bào, đợc phiên mã từ mạch làm khuôn của một gen. Một enzym đợc gọi là ARN polymerase có thể tách hai mạch ADN của chuỗi xoắn kép và lắp ráp các nucleotit ARN dọc theo mạch ADN làm khuôn dựa trên nguyên tắc kết cặp giữa các bazơ nucleotit (Hình 17.7). Giống với ADN Hình 17.6 Sự biểu hiện gen ở các loài khác nhau . Do các loài sinh vật khác nhau sử dụng chung một ngôn ngữ (bảng mã) di truyền, nên một loài có thể đợc "lập trình" để sản xuất một loại protein vốn trong tự nhiên chỉ có đặc thù ở một loài thứ hai bằng cách chuyển ADN từ loài thứ hai vào loài thứ nhất. (a) Lợn biểu hiện gen của sứa. Một gen mã hóa protein phát huỳnh quang đợc chuyển từ sứa vào trứng lợn đã thụ tinh. Một trứng nh vậy đã phát triển thành lợn phát huỳnh quang. (b) Cây thuốc lá biểu hiện gen của côn trùng. Màu vàng của cây đợc tạo ra bởi một phản ứng hóa học đợc xúc tác bởi một enzym do gen của côn trùng mã hóa. 17.1 1. Bạn mong đợi một chuỗi polypeptit do một đoạn mARN dài 30 nucleotit G (poly-G) mã hóa nh thế nào? 2. Mạch khuôn của một gen chứa trình tự nucleotit 3-TTCAGTCGT-5. Hãy vẽ mạch không làm khuôn và trình tự mARN, chỉ rõ các đầu 5 và 3. Hãy so sánh trình tự nucleotit của hai mạch vừa đợc vẽ. 3. Giả sử mạch không làm khuôn ở câu 2 đợc dùng để phiên mã thay cho mạch làm khuôn bình thờng. Hãy vẽ trình tự mARN và trình tự các axit amin trên chuỗi polypeptit đợc dịch mã dựa vào Hình 17.5. (Lu ý chiều các đầu 5 và 3). Dự đoán protein đợc tạo ra từ mạch không làm khuôn sẽ biểu hiện chức năng thế nào so với protein thông thờng. Xem gợi ý trả lời ở Phụ lục A. Kiểm tra khái niệm vẽ tiếp Điều gì nếu 1 7 . 2 Khái niệm Phiên m là quá trình tổng hợp ARN do ADN điều khiển: Quan sát gần hơn 332 khối kiến thức 3 Di truyền học polymerase trong sao chép ADN, ARN polymerase chỉ lắp ráp đợc các nucleotit vào chuỗi polynucleotit đang kéo dài theo chiều 5 3. Tuy vậy, không giống ADN polymerase, ARN polymerase có thể khởi đầu sự tổng hợp chuỗi polynucleotit ARN mà không cần một đoạn mồi sẵn có. Các đoạn trình tự nucleotit đặc thù trên phân tử ADN xác định vị trí mà quá trình phiên mã một gen bắt đầu và kết thúc. Đoạn trình tự mà ở đó các enzym ARN polymerase đính kết vào ADN và khởi đầu sự phiên mã đợc gọi là promoter (hay trình tự khởi đầu phiên mã); ở vi khuẩn, trình tự là tín hiệu kết thúc sự phiên mã đợc gọi là terminator (hay tín hiệu kết thúc phiên mã). (Sự kết thúc phiên mã ở sinh vật nhân thật diễn ra theo một cơ chế khác sẽ đợc đề cập sau). Các nhà sinh học phân tử thờng xem chiều phiên mã của một gen là xuôi dòng, trong khi chiều ngợc lại đợc gọi là ngợc dòng. Những thuật ngữ này còn đợc dùng để mô tả vị trí các trình tự nucleotit (đôi khi gọi là các yếu tố trình tự) trên các phân tử ADN và ARN. Vì vậy, trên ADN các promoter của một gen luôn nằm ngợc dòng so với terminator tơng ứng của nó. Đoạn trình tự ADN đợc dùng để phiên mà thành một phân tử ARN hoành chỉnh chức năng đợc gọi là một đơn vị phiên mã. Vi khuẩn có một loại ARN polymerase duy nhất không chỉ xúc tác tổng hợp mARN mà còn xúc tác tổng hợp các loại ARN khác, bao gồm cả các ARN là thành phần bộ máy tổng hợp protein nh ARN ribosome. Ngợc lại, các tế bào sinh vật nhân thật có ít nhất ba loại ARN polymerase khác nhau có trong nhân tế bào. Một loại đợc dùng trong phiên mã tổng hợp các mARN đợc gọi là ARN polymerase II. Các ARN polymerase khác đợc dùng để phiên mã các gen mã hóa cho ARN nhng không đợc dịch mã thành protein. Trong phần phiên mã đợc đề cập sau đây, chúng ta sẽ nêu trớc tiên những đặc điểm chung trong phiên mã ở vi khuẩn và sinh vật nhân thật, sau đó sẽ mô tả một số đặc điểm khác nhau cơ bản nhất. Tổng hợp bản phiên m ARN Nh đợc mô tả trên Hình 17.7, ba giai đoạn của sự phiên mã bao gồm khởi đầu phiên mã, kéo dài chuỗi ARN và kết thúc phiên mã. Xem kỹ Hình 17.7 để làm quen với các khái niệm và các giai đoạn cơ bản của một quá trình phiên mã. ARN polymerase và khởi đầu phiên mã Trình tự khởi đầu phiên mã (promoter) của một gen bao gồm điểm bắt đầu phiên mã (tức là nucleotit ở đó sự tổng hợp ARN thực sự bắt đầu) và phần mở rộng thờng nằm ngợc dòng hàng chục nucleotit kể từ điểm bắt đầu phiên mã. Ngoài chức năng là Tr ì nh t ự kh ở i đầ u phiên mã (Promoter) Đơn vị phiên mã Điểm bắt đầu phiên mã ADN ARN polyemrase Khởi đầu phiên mã . Sau khi ARN polymerase đã liên kết vào promoter, các mạch ADN giãn xoắn và enzym bắt đầu tổng hợp ARN từ điểm bắt đầu phiên mã trên mạch làm khuôn. Kéo dài chuỗi . Enzym ARN polymerase di chuyển xuôi dòng, làm giãn xoắn ADN và kéo dài bản phiên mã ARN theo chiều 5 3; ngay sau đó, các mạch ADN tái liên kết về dạng chuỗi xoắn kép. Bản phi ê n mã ARN ADN giãn xoắn Mạch khuôn ADN Kết thúc phiên mã . Cuối cùng, bản phiên mã ARN hoàn chỉnh đợc giải phóng và enzym polymerase rời khỏi ADN. Bản phi ê n mã ARN ADN "đóng xoắn" trở lại Bản phi ê n m ã ARN ho à n ch ỉ nh Hình 17.7 Các giai đoạn phiên mã: khởi đầu phiên mã, kéo dài chuỗi và kết thúc phiên mã. Hình mô tả các giai đoạn phiên mã ở đây là giống nhau ở cả vi khuẩn và sinh vật nhân thật; tuy vậy, chi tiết giai đoạn kết thúc phiên mã là khác nhau ở hai liên giới (xem mô tả trong phần diễn giải). Ngoài ra, ở vi khuẩn, bản phiên mã ARN có thể dùng ngay để dịch mã nh một phân tử mARN hoàn thiện; trong khi đó, ở sinh vật nhân thật, bản phiên mã thờng phải trải qua quá trình hoàn thiện trớc khi có thể đợc dùng làm khuôn để dịch mã. Kéo dài chuỗi ARN polymerase Mạch ARN mới tổng hợp Mạch ADN không làm khuôn Các nucleotit ARN Chiều phiên mã ("xuôi dòng") Mạch ADN làm khuôn Chơng 17 Từ gen đến protein 333 vị trí liên kết của ARN polymerase và xác định điểm bắt đầu phiên mã, promoter còn có vai trò xác định mạch nào trong hai mạch của chuỗi xoắn kép ADN đợc dùng làm khuôn. Một số phần của promoter có vai trò đặc biệt quan trọng đối với sự liên kết của ARN polymerase vào mạch khuôn ADN. ở vi khuẩn, bản thân enzym ARN polymerase (thực ra là tiểu phần polypeptit của nó) có khả năng nhận ra và liên kết vào promoter. ở sinh vật nhân thật, một nhóm gồm nhiều protein gọi là các yếu tố phiên mã điều hòa việc liên kết của ARN polymerase vào promoter và khởi đầu phiên mã của các gen. Từ Chơng 16, chúng ta nhớ rằng ADN trong nhiễm sắc thể ở sinh vật nhân thật đợc đóng gói ở dạng phức hợp với histone và một số protein khác và đợc gọi là chất nhiễm sắc. Vai trò của các protein này trong việc xác định khả năng bộc lộ của ADN đối với các yếu tố phiên mã sẽ đợc chúng ta đề cập ở Chơng 18. Chỉ khi một số yếu tố phiên mã nhất định đã liên kết vào promoter, ADN polymerase mới có thể liên kết vào nó. Toàn bộ phần phức hệ gồm các yếu tố phiên mã và ARN polymerase II đã liên kết vào promoter đợc gọi là phức hệ khởi đầu phiên mã. Hình 17.8 mô tả vai trò của các yếu tố phiên mã và một trình tự ADN thiết yếu thuộc promoter đợc gọi là hộp TATA trong quá trình hình thành phức hệ khởi đầu phiên mã ở một promoter của sinh vật nhân thật. Sự tơng tác giữa ARN polymerase II với các yếu tố phiên mã là một ví dụ điển hình về tầm quan trọng của tơng tác protein - protein trong điều hòa phiên mã ở sinh vật nhân thật. Một khi enzym polymerase đã liên kết ổn định với trình tự ADN tại promoter, hai mạch ADN tại đó sẽ giãn xoắn, và enzym sẽ bắt đầu sự phiên mã dựa trên mạch làm khuôn. Kéo dài mạch ARN Khi ARN polymerase di chuyển dọc mạch ADN khuôn, nó tiếp tục tháo xoắn chuỗi xoắn kép và vào mỗi thời điểm nó bộc lộ ra một đoạn dài khoảng 10 - 20 bazơ ADN để các bazơ ARN có thể tiến hành bắt cặp (xem Hình 17.7). Enzym này lần lợt bổ sung các nucleotit vào phía đầu 3 của phân tử ARN đang kéo dài khi nó di chuyển dọc chuỗi xoắn kép. Cùng với việc bộ máy tổng hợp ARN tiến về phía trớc, phân tử ARN mới tổng hợp sẽ tách khỏi mạch khuôn ADN, đồng thời chuỗi xoắn kép ADN hình thành trở lại. ở sinh vật nhân thật, quá trình phiên mã diễn ra với tốc độ khoảng 40 nucleotit mỗi giây. Sự phiên mã của mỗi gen đơn lẻ có thể đợc đồng thời xúc tác bởi nhiều enzym ARN polymerase cùng lúc (có thể tởng tợng giống nh nhiều chiếc xe tải nối đuôi nhau thành một đoàn dài). Từ mỗi phân tử enzym ARN polymerase, một mạch ARN đang kéo dài chui ra với chiều dài tơng ứng với khoảng cách mà enzym ARN polymerase đã trợt dọc trên mạch khuôn ADN kể từ điểm khởi đầu phiên mã (xem các phân tử mARN trên Hình 17.24). Sự tập hợp đồng thời của nhiều phân tử polymerase giúp lợng mARN đợc phiên mã từ mỗi gen tăng lên vào cùng một thời điểm; qua đó, tế bào có thể tổng hợp đợc một lợng lớn protein đặc thù vào các thời điểm khác nhau theo yêu cầu sinh trởng của nó. Kết thúc phiên mã Cơ chế kết thúc phiên mã có đặc điểm khác nhau giữa vi khuẩn và sinh vật nhân thật. ở vi khuẩn, sự phiên mã vợt qua một trình tự (tín hiệu) kết thúc phiên mã trên mạch khuôn ADN. Trình tự kết thúc phiên mã (terminator) có mặt trên mạch ARN đợc tạo ra có vai trò nh tín hiệu kết thúc phiên mã làm tách enzym polymerase rời khỏi ADN đồng thời giải phóng bản phiên mã vốn sau đó đợc dùng làm khuôn (mARN) để dịch mã. ở sinh vật nhân thật, ARN polymerase II phiên mã một trình tự trên ADN đợc gọi là trình tự gắn đuôi polyA; trình tự này thờng mã hóa cho một tín hiệu gắn đuôi polyA (là AAUAAA) trên phân tử tiền-mARN. Sau đó, tại một điểm cách tín hiệu AAUAAA khoảng từ 10 đến 35 nucleotit, các protein liên kết với mạch ARN đang kéo dài sẽ cắt rời phân tử Hình 17.8 Sự khởi đầu phiên mã ở promoter củ a sinh vật nhân thật. Trong tế bào sinh vật nhân thật, các protein đợc gọi là các yếu tố phiên mã điều hòa sự khởi đầu phiên mã của enzym ARN polymerase II. Giải thích sự tơng tác giữa ARN polymerase với promoter sẽ có đặc điểm khác nh thế nào nếu hình trên mô tả sự khởi đầu phiên mã ở vi khuẩn. Phiên m ã Các yếu tố phiên mã Mạch ADN làm khuôn Ho à n thi ệ n ARN D ị ch m ã ADN Tiền - mARN mARN Ribosome Polypeptit Điểm bắt đầu phiên mã Hộp TATA Promoter Các yếu tố phiên mã ARN polymerase II Bản phiên mã ARN Promoter ở sinh vật nhân thật thờng có một hộp TATA, nằm ngợc dòng và cách điểm bắt đầu phiên mã khoảng 25 nucleotit. (Theo thói quen, trình tự các nucletotit thờng đợc trình bày theo mạch không làm khuôn , tức là mạch mã hóa.) Một số yếu tố phiên mã , mà một trong số chúng nhận ra hộp TATA, liên kết ADN (promoter) trớc khi ARN polymerase có thể liên kết vào vùng này. Các yếu tố phiên mã bổ sung liên kết vào ADN cùng với ARN polymerase để hình thành nên phức hệ khởi đầu phiên mã. Chuỗi xoắn kép ADN đợc tháo xoắn và sự tổng hợp ARN bắt đầu diễn ra từ điểm khởi đầu phiên mã trên mạch ADN làm khuôn. Phức hệ khởi đầu phiên m ? ?? ? 334 khối kiến thức 3 Di truyền học này khỏi ARN polymerase, đồng thời giải phóng ra phân tử tiền-mARN. Tuy vậy, sau hoạt động cắt này, enzym polymerase tiếp tục phiên mã ADN khoảng vài trăm nucleotit kể từ khi phân tử tiền-mARN đợc giải phóng ra. Các nghiên cứu gần đây ở nấm men cho thấy: đoạn ARN đợc tạo ra từ việc phiên mã tiếp tục này đợc phân giải bởi một enzym di chuyển dọc ARN. Các số liệu ủng hộ cho quan điểm là: sự phiên mã chỉ thực sự kết thúc và enzym polymerase rời khỏi ADN khi enzym phân giải trên đây tiếp cận đợc polymerase. Đồng thời lúc này phân tử tiền-mARN trải qua giai đoạn chế biến hay hoàn thiện để trở thành phân tử mARN hoàn thiện sẵn sàng cho dịch mã. Quá trình hoàn thiện mARN ở sinh vật nhân thật đợc đề cập trong mục dới đây. Các enzym trong nhân tế bào sinh vật nhân thật có thể biến đổi phân tử tiền-mARN theo một số cách đặc trng trớc khi bản phiên mã di truyền đợc chuyển ra tế bào chất. Trong quá trình hoàn thiện mARN này, cả hai đầu của phân tử mARN tiền thân đều đợc biến đổi. Ngoài ra, trong phần lớn trờng hợp, một số phần bên trong phân tử ARN cũng đợc cắt bỏ, trong khi các phần còn lại nối lại với nhau. Kết quả của những biến đổi này là tạo ra một phân tử mARN sẵn sàng cho dịch mã. Sự biến đổi ở các đầu mARN Mỗi đầu của một phân tử tiền-mARN đợc biến đổi theo một cách đặc trng (Hình 17.9). Đầu tiên, đầu 5 đợc tổng hợp; nó tiếp nhận một mũ đầu 5, về bản chất là một dạng biến đổi của nucleotit guanine (G) đợc bổ sung vào đầu 5 của mARN đang kéo dài sau khi phiên mã đã diễn ra đợc khoảng từ 20 đến 40 nucleotit đầu tiên. Đầu 3 của phân tử tiền-mARN cũng đợc biến đổi trớc khi mARN rời khỏi nhân. Chúng ta nhớ lại rằng, trong quá trình phiên mã, mARN đợc giải phóng ngay sau khi tín hiệu gắn đuôi polyA (AAUAAA) đợc phiên mã. Tại đầu 3, một enzym sẽ bổ sung một chuỗi gồm khoảng từ 50 đến 250 nucleotit loại adenine (A) liên tiếp nhau, gọi là đuôi polyA. Đầu 5 cũng nh đuôi polyA của mARN có cùng một số chức năng quan trọng. Thứ nhất, chúng tạo điều kiện thuận lợi cho sự vận chuyển phân tử mARN hoàn thiện ra khỏi nhân tế bào. Thứ hai, chúng bảo vệ phân tử mARN khỏi sự phân giải do hoạt động của các enzym thủy phân. Và thứ ba, chúng giúp các ribosome đính kết đợc vào đầu 5 của phân tử mARN khi phân tử này đi vào tế bào chất. Hình 17.9 minh họa sơ đồ cấu trúc của một phân tử mARN hoàn thiện điển hình ở sinh vật nhân thật gồm cả phần mũ và đuôi. Sơ đồ này đồng thời cho thấy các vùng không đợc dịch mã (UTR) có ở cả hai đầu 5 và 3 của phân tử mARN (các vùng này thờng đợc gọi tơng ứng là 5UTR và 3UTR). Các vùng UTR là các phần của phân tử mARN hoàn thiện không đợc dịch mã thành protein, nhng chúng có một số chức năng khác trong dịch mã, chẳng hạn nh một vị trí liên kết của ribosome. Gen phân mảnh và sự ghép nối ARN Một giai đoạn đáng chú ý trong quá trình hoàn thiện mARN trong nhân của sinh vật nhân thật là việc loại bỏ đi một phần lớn các phân đoạn bên trong phân tử mARN tiền thân; một công việc giống nh cắt - dán các file video bằng các phần mềm máy tính (Hình 17.10) và đợc gọi là sự ghép nối ARN. Chiều dài trung bình của một đơn vị phiên mã dọc theo phân tử ADN của ngời gồm khoảng 27.000 cặp bazơ (bp); vì vậy, phân tử mARN tiền thân thờng có chiều dài tơng ứng. Tuy vậy, để mã hóa một phân tử protein có kích thớc trung bình gồm 400 axit amin, chỉ cần một phân tử ARN có kích thớc gồm 1200 nucleotit. (Nhớ rằng, mỗi axit amin đợc mã hóa bởi một bộ ba nucleotit.) Điều này có nghĩa là phần lớn các gen ở sinh vật nhân thật và các bản phiên mã ARN tiền thân của chúng chứa các phân đoạn nucleotit dài không mã hóa; đây là những phân đoạn không đợc dịch mã. Điều đáng ngạc nhiên 17.2 1. So sánh giữa ADN polymerase và ARN polymerase về sự biểu hiện chức năng, yêu cầu về mạch khuôn và các đoạn mồi, chiều tổng hợp và các loại nucleotit làm cơ chất. 2. Promoter là gì? Nó nằm ngợc dòng hay xuôi dòng so với đơn vị tái bản? 3. Điều gì giúp ARN polymerase có thể khởi đầu phiên mã tại vị trí chính xác (điểm khởi đầu phiên mã) ở tế bào vi khuẩn và ở tế bào sinh vật nhân thật? 4. Giả sử việc chiếu xạ tia X gây nên sự thay đổi trình tự ở hộp TATA trong vùng promoter của một gen. Hậu quả xảy ra đối với sự phiên mã của gen đó sẽ có xu hớng nh thế nào? Xem gợi ý trả lời ở Phụ lục A. Kiểm tra khái niệm điều gì nếu 1 7 . 3 Khái niệm Tế bào sinh vật nhân thật biến đổi ARN sau phiên m Hình 17.9 Sự hoàn thiện ARN: bổ sung mũ đầu 5 và đuôi polyA. Các enzym làm biến đổi hai đầu của phân tử tiền-mARN ở sinh vật nhân thật. Các đầu sau khi biến đổi thúc đẩy sự vận chuyển mARN từ nhân ra tế bào chất; đồng thời giúp bảo vệ mARN khỏi sự phân giải. Khi mARN đã ra đến tế bào chất, các đầu biến đổi này kết hợp với một số protein ở tế bào chất thúc đẩy sự đính kết của ribosome. Phần mũ đầu 5' và đuôi polyA đầu 3' không đợc dịch mã và thuộc các vùng đợc gọi tơng ứng là vùng đầu 5' không đợc dịch mã (5'UTR) và vùng đầu 3' không đợc dịch mã (3'UTR). Phiên m ã Ho à n thi ệ n ARN D ị ch m ã ADN Tiền - mARN mARN Ribosome Polypeptit 5'UTR Mũ đầu 5 Codon bắt đầu Codon kết thúc 3'UTR Đuôi polyA Đoạn mã hóa protein Tín hiệu gắn đuôi polyA Đuôi polyA gồm khoảng từ 50 đến 250 nucleotit loại adenine đợc bổ sung vào đầu 3' Một dạng biến đổi của nucleotit guanine đợc bổ sung vào đầu 5' . kỹ thuật "chuyển gen" đã tạo ra sự phát triển mạnh mẽ của công nghệ sinh học trong những năm gần đây (xem Chơng 20 ). Tuy vậy, có một số ngoại lệ so với tính phổ biến chung của mã. đoán protein đợc tạo ra từ mạch không làm khuôn sẽ biểu hiện chức năng thế nào so với protein thông thờng. Xem gợi ý trả lời ở Phụ lục A. Kiểm tra khái niệm vẽ tiếp Điều gì nếu 1 7 . 2 . bắt đầu Codon kết thúc 3'UTR Đuôi polyA Đoạn mã hóa protein Tín hiệu gắn đuôi polyA Đuôi polyA gồm khoảng từ 50 đến 25 0 nucleotit loại adenine đợc bổ sung vào đầu 3' Một dạng