Tuỳ thuộc vào từng họ khác nhau, hệ gen ARN của virus có thể là dạng sợi đơn hoặc sợi kép. Nếu là sợi đơn thì có thể là sợi d−ơng hoặc sợi âm. Tế bào vật chủ không chứa polymerase phụ thuộc ARN, chúng phải đ−ợc mã hoá bởi hệ gen của virus, và gen mã hoá cho polymerase này th−ờng là gen lớn nhất đ−ợc tìm thấy trong hệ gen ARN của virus. Điều này làm cho ARN của virus trở thành kẻ ký sinh thực sự vào sự dịch mã và th−ờng phụ thuộc cao vào nhân tế bào vật chủ để sao chép và phiên mã. Vì thế không nh− virus ADN của eukaryote, nhiều virus ARN sao chép trong tế bào chất. Polymerase phụ thuộc ARN không chính xác nh− polymerase phụ thuộc ADN, đồng thời không có khả năng đọc sửa, vì thế tỷ lệ đột biến rất caọ Vì thế loại virus này có thể thích nghi nhanh chóng với sự biến đổi của môi tr−ờng, các vật chủ mớị...
Các virus là retrovirus chứa ARN và chúng mã hoá một enzyme có tên gọi là reverse transcriptasẹ Phân tử ARN chứa trong retrovirus là một chuỗi đơn, có chiều dài khoảng 6-9kb, hệ gen chứa 3 gen cần thiết cho sự tích hợp của hệ gen virus vào hệ gen vật chủ, đó là gen gag (mã hoá cho protein capsid), gen pol (mã hoá cho protein cần thiết cho tái bản) và gen env (mã hoá cho màng bao bọc protein của virus). Khi đi vào tế bào, ARN đ−ợc phiên mã thành ADN, thực hiện bởi enzyme reverse transciptase, đ−ợc mã hoá bởi polymerasẹ Enzyme này sử dụng ARN sợi đơn làm khuôn mẫu tổng hợp nên một sợi ADN bổ sung. Sợi ADN này lại đ−ợc dùng để làm khuôn mẫu, tổng hợp nên một sợi ADN nữa, cuối cùng tạo nên một phân tử ADN kép, mang thông tin di truyền đã đ−ợc mã hoá trong ARN trong retrovirus. Trong giai đoạn đầu của quá trình lây nhiễm có thể sát nhập vào hệ gen của vật chủ. Sự sát nhập này là ngẫu nhiên. Tuy nhiên, gen của virus có thể đ−ợc thể hiện và những virus mới đ−ợc tổng hợp. Mặc dù ở các virus khác nhau, sự phiên mã ng−ợc có thể khác nhau về hình thái, cấu trúc hệ gen và chu trình sống nh−ng trình tự axit amin của enzyme phiên mã ng−ợc của chúng và các protein lõi đều giống nhau hoàn toàn cho thấy chúng có thể tiến hoá từ một tổ tiên chung. Hệ gen retrovirus có một số trình tự t−ơng đồng với retro-transposon đ−ợc tìm thấy ở nhiều eukaryote, nh− ở nấm men Tỵ
Sự phiên mã của provirus hợp nhất phụ thuộc ARN polymerase II của vật chủ. Sản phẩm phiên mã đ−ợc polyadenine hoá và có thể đ−ợc ghép nốị ARN ch−a ghép nối đ−ợc dịch mã trên ribosome trong tế bào chất để tạo ra một poly protein gag và một poly protein gag-pol (đ−ợc chế biến thành protein pol). mARN đ−ợc ghép nối đ−ợc dịch mã trên các ribosome bám màng để tạo ra glycoprotein màng. Một số retrovirus cũng tạo ra các ARN ghép nối khác nhau, các ARN này đ−ợc dịch mã để tạo ra các nhân tố khác nhau nh− Tat và Rev có chức năng điều hoà phiên mã và quá trình chế biến mARN.
Cơ chế biểu hiện của 3 gen đã nói ở trên là khác nhaụ Virus HIV là một tr−ờng hợp đặc biệt, ngoài 3 gen nói trên, nó còn có ít nhất 8 gen khác, trong đó có ít nhất 3 gen điều hoà. Protein điều hoà chính đ−ợc mã hoá bởi gen tat, có lẽ nó làm tăng sự phiên mã của ADN và
hiệu quả đối với sự giải mã thành protein từ ARN. Gen rev sẽ làm tăng sự di chuyển của mARN của virus vào tế bào chất. Tat và rev chịu trách nhiệm cho sự biểu hiện chính của gen cấu trúc của virus, chức năng của protein điều hoà thứ 3 cũng nh− chức năng của hầu hết các gen còn lại vif, vpr, vpu, vpt và hai gen tev, tnv ch−a đ−ợc làm rõ.
Sự phiên mã ng−ợc là sự biến đổi thứ nhất của thuyết trung tâm, sự biến đổi thứ 2 của thuyết này là ARN có thể hoạt động nh− khuôn mẫu cho sự sao chép của chính nó. Quá trình này xảy ra trong một lớp nhỏ phagẹ Những ARN phage nh− R17, f2, MS2, Qβ là những phage đơn giản nhất đ−ợc biết đến. MS2 chứa 3500nu và chỉ mã hoá cho 3 protein, một protein chịu trách nhiệm gắn và xâm nhập vật chủ, một protein vỏ và một tiểu đơn vị của enzyme replicasẹ Tiểu đơn vị này tổ hợp với 3 protein của tế bào để tạo thành enzyme ARN replicase cho phép sợi đơn ARN của phage tự sao chép. Protein cần để xây dựng enzyme ARN replicase phải đ−ợc tổng hợp tr−ớc khi phage sao chép ARN của nó. Để làm đ−ợc điều đó tr−ớc tiên ARN phage phải hoạt động nh− một tín hiệu khi nó nhiễm vào tế bàọ Vì thế có tr−ờng hợp protein đ−ợc tổng hợp mà không có quá trình phiên mã xảy rạ
Hình 3.13 : Sơ đồ quá trình phiên mã ng−ợc ở Retrovirus
Vật liệu di truyền virus, ARN, tr−ớc hết đ−ợc sử dụng nh− là tín hiệu cho quá trình dịch mã và sau đó đ−ợc sử dụng nh− là khuôn để tổng hợp chính nó.
CÂU HỎI ễN TẬP CHƯƠNG III
1. Hóy nờu những hiểu biết về cỏc loại enzyme tham gia vào quỏ trỡnh phiờn mó. 2. Mụ tả cấu trỳc promotor ở sinh vật nhõn sơ và sinh vật nhõn chuẩn.
3. Hóy trỡnh bày cỏc pha của quỏ trỡnh phiờn mó. 4. Phõn tớch cỏc hỡnh thức kết thỳc phiờn mó.
5. Hóy trỡnh bày và phõn tớch cỏc giai ủoạn chế biến mARN sau phiờn mó ở sinh vật nhõn chuẩn.
6. Phõn tớch sự chế biến mARN cú lựa chọn, sự chế biến rARN và tARN. 7. Mụ tả hỡnh thức phiờn mó xảy ra trong ty thể của sinh vật nhõn chuẩn. 8. Trỡnh bày và phõn tớch quỏ trỡnh phiờn mó ngược.
Ch−ơng 4. dịch mã - sinh tổng hợp protein
Trong sinh học phân tử, lý thuyết trung tâm bao hàm 2 vấn đề lớn nhất, đó là sự tự sao của phân tử ADN và qúa trình tế bào sinh tổng hợp protein. Thông tin di truyền đ−ợc biểu hiện thông qua protein, đặc biệt là các enzyme xúc tác các phản ứng trong quá trình trao đổi chất. Các protein đ−ợc cấu thành từ 20 aa có trong tự nhiên. Mỗi protein có thể bao gồm hàng trăm axit amin, do vậy số l−ợng protein khác nhau là vô hạn. Nh− vậy có thể đạt tới độ đa dạng to lớn về chủng loại và chức năng của protein chỉ cần một hệ thống mã hóa hết sức đơn giản.
Hình 4.1: Sơ đồ học thuyết trung tâm của sinh học phân tử (Theo Crick, năm 1961)
Dòng thông tin di truyền chảy theo một chiều từ ADN đến protein với sự trung gian của ARN thông tin (mARN). Quá trình tổng hợp ARN trên khuôn ADN gọi là phiên mã (transcription), sau đó thông tin trên mARN đ−ợc sử dụng để tổng hợp protein trong qúa trình gọi là dịch mã (translation). Mã di truyền là mã bộ ba (Triplet). Có 64 bộ ba mã hoá cho 20 axit amin ở các sinh vật. Các bộ ba đặc hiệu của mARN gọi là codon (mã) và bộ ba bổ sung với nó ở vùng xác định của tARN gọi là anticodon (đối mã). Song ngày nay, bằng việc phát hiện ra enzyme phiên mã ng−ợc và cơ chế phiên mã ng−ợc (ARNADN), hai khía cạnh của dòng chảy thông tin di truyền cần phải đ−ợc bổ sung, đó là:
+ Vật chất di truyền đ−ợc nhân đôi tr−ớc khi tế bào phân chia, gọi là quá trình sao chép ADN.
+ ở một số virus không có ADN, thay vào đó vật chất di truyền là ARN, các virus này chủ yếu thuộc nhóm retrovirus, có enzyme phhiên mã ng−ợc (reverse transcriptase). Enzyme này tạo ra ADN mạch kép từ hệ gen ARN mạch đơn.
Quá trình tổng hợp nên protein diễn ra phức tạp với sự tham gia của các yếu tố khác nhaụ
Ị mã di truyền
TTDT đ−ợc mã hoá trên phân tử ADN chính là trình tự xắp xếp của các nucleotid A,T,G,C qui định chính xác trình tự sắp xếp của các axit amin trên chuỗi polypeptid của phân tử protein. TTDT mã hóa trong ADN và ARN d−ới dạng tổ hợp của 4 loại nucleotid cần đ−ợc giải mã thành 20 loại axit amin cấu thành protein. Các công trình nghiên cứu khác nhau đã thiết lập đ−ợc hệ thống t−ơng ứng giữa 1 tổ hợp nucleotid với 1 axit amin, hệ thống này có tên là mã di truyền. Mã di truyền có một số đặc tính sau:
- Mã di truyền là mã bộ ba (Triplet). Có 64 bộ ba mã hoá cho 20 axit amin ở các sinh vật, các bộ ba đặc hiệu của mARN gọi là codon (mã) và bộ ba bổ sung với nó ở vùng xác định của tARN gọi là anticodon (đối mã).
- Mã di truyền không gối lên nhau (nonoverlapping) và mang tính tuyến tính: Thông tin trong đoạn mã hoá của mARN đ−ợc đọc theo chiều 5’-3’, bắt đầu từ codon khởi đầu, xác định chính xác trình tự axit amin trên chuỗi polypeptid của phân tử protein.
Hỡnh 4.2: Cỏc phõn tử tRNA mang amino acid Ser (trỏi) và Tyr (phải) ủọc mó trờn mRNA bằng cỏch khớp anticodon của chỳng với codon của mRNẠ
- Mã di truyền có tính thoái hoá (degenerafe): Phần lớn tr−ờng hợp có nhiều codon cùng xác định một axit amin (các codon đồng nghĩa), ngoại trừ AUG và UGG.
- Mó di truyền cú tớnh ủơn trị, rừ ràng (unambigous): Mỗi codon xỏc ủịnh một amino acid duy nhất, hoặc xỏc ủịnh sự kết thỳc dịch mó.
Bảng 4.1: Các trình tự mã bộ ba (codon) của các axit amin trên mARN
- Mã di truyền có các codon khởi đầu và codon kết thúc. Cụ thể:
+ Codon AUG nằm ở phía đầu 5’ của mARN là tín hiệu khởi đầu tổng hợp polypeptide, điều khiển đ−a formyl-methionin vào đầu chuỗi, mà về sau nó đ−ợc tách ra khỏi chuỗị Trong một số tr−ờng hợp, GUG thế chỗ cho AUG và đóng vai trò nh− trên.
+ Codon UAA, UGA hoặc UAG là tín hiệu kết thúc dịch mã nên gọi là codon kết thúc (termination), nh−ng vì chúng không mã hoá một axit amin nào nên gọi là các codon vô nghĩa (nonsense).
- Mã di truyền có tính phổ biến (universal) hay tính vạn năng: Mã di truyền đ−ợc sử dụng nh− nhau trong mọi loài sinh vật, nhờ tính chất này mà gen của loài này có thể đ−ợc đọc
bình th−ờng trong tế bào của loài khác, tính chất này đ−ợc áp dụng phổ biến trong công nghệ di truyền. Sự phổ biến của mã di truyền phản ánh nguồn gốc chung của sinh giớị
Tuy nhiên có một số tr−ờng hợp ngoại lệ của mã di truyền tìm thấy trong ty thể của một số loài sinh vật nh− nấm men, ruồi giấm và cả ở động vât có vú.
Bảng 4.2 Cỏc ngoại lệ so với mó "phổ biến"
Nguồn Codon
Nghĩa phổ
biến Nghĩa mới
Ty thể ruồi giấm UGA Kết thỳc Tryptophan AGA &
AGG Arginine Serine
AUA Isoleucine Methionine Ty thểủộng vật cú
vỳ
AGA &
AGG Arginine Kết thỳc AUA Isoleucine Methionine UGA Kết thỳc Tryptophan Ty thể nấm men CUN* Leucine Threonine *(N = U, C, A
hoặc G) AUA Isoleucine Methionine
UGA Kết thỳc Tryptophan Ty thể thực vật bậc
cao UGA Kết thỳc Tryptophan
CGG Arginine Tryptophan Cỏc nhõn Protozoa
UAA &
UAG Kết thỳc Glutamine
Mycoplasma UGA Kết thỳc Tryptophan
- Đối với mã ty thể ng−ời: Methionin đ−ợc xác định bởi AUG và cả AUA ( trong mã di truyền nhân AUA xác định leucin) và các codon này đ−ợc đọc bởi một tARNMet có anticodon UAU nhờ sự kết cặp linh hoạt giữa các bazơ. Tryptophan đ−ợc xác định bởi UGG và cả UGA ( trong mã di truyền nhân UGA là mã kết thúc) và chúng đ−ợc đọc bởi một tARNTrp mang anticodon UCẠ
- Đối với mã ty thể nấm men: AUG xác định methionin và AUA xác định isoleucine giống nh− mã di truyền nhân. Tryptophan đ−ợc xác định theo cách của mã ty thể ng−ờị Các codon bắt đầu bởi dinucleotid CU thì mã hoá cho treonine, thay vì leucine nh− trong mã di truyền nhân và mã di truyền ty thể ng−ờị
- Về phần kết thúc, đối với mã ty thể ng−ời, ngoài hai codon UAA và UAG đã đ−ợc xác định chắc chắn còn có hai codon sau AGA và AGG. Nh−ng đối với mã ty thể nấm men thì chỉ có hai codon UAA và UAG, còn hai codon AGA và AGG xác định Arg nh− mã phổ biến.
iị các yếu tố tham gia vào quá trình dịch mã