17 Ø Một số trình tự DNA ở prokaryote, eukaryote, plasmid và nhiều virus khó phân biệt được khái niệm sợi mang nghĩa và sợi đối nghĩa vì có hiện tượng các chồng gen overlapping gene.. Ø
Trang 1SINH HỌC PHÂN TỬ 2
SH2005 Học kỳ I, Năm học 2014 - 2015
Keep calm & Study Molecular Biology
“Stay hungry Stay foolish.” Steve Jobs
Trang 2số tiết =>>> KHÔNG nghỉ quá 02 buổi học
Trang 3SINH HỌC PHÂN TỬ 2 SH2005
Hình thức kiểm tra & Thi
ü Kiểm tra giữa kỳ: 01 bài, trắc nghiệm Theo lịch đào
tạo
ü 03 bài kiểm tra nhanh 10 phút đầu giờ: tự luận,
ü Thi cuối kỳ: trắc nghiệm, theo lịch đào tạo
ü Seminar: theo nhóm, trình bày powerpoint
Trang 4SINH HỌC PHÂN TỬ 2 SH2005
Nội dung:
Chương 1 Genome và sự hoạt động của gene
Chương 2 Các cơ chế điều hòa biểu hiện gene ở tế bào prokaryote
Chương 3 Sự phức tạp trong quá trình điều hòa biểu hiện gene ở tế bào eukaryote
Chương 4 Vận chuyển hướng đích và phân giải protein Chương 5 Epigenetics và sự điều hòa biểu hiện gene
Trang 61. Thế nào là nucleotide?
2. Phân tử DNA có 2 sợi Sợi nào sẽ được phiên mã?
3. Sợi DNA mang nghĩa (sense/coding) và đối nghĩa
(antisense/ anti coding)?
4. Quá trình phiên mã diễn ra theo hướng nào? và bắt đầu
từ đầu nào của phân tử DNA antisense?
5. Quá trình dịch mã được diễn ra từ chiều nào của sợi
mRNA?
6. Trình tự acid amin của chuỗi peptid được tổng hợp được bắt đầu từ chiều nào, đầu C hay N tận cùng?
Trang 71953 Double helix structure, 1962 Noble Prize
Trang 8Hai loại nucleic acid DNA và RNA
• DNA : D eoxyRibo N ucleic A cid
• RNA : R ibo N ucleic A cid
Trang 9H
O
CH2H
Trang 10Dạng biểu diễn của nucleotide
(RNA & DNA)
Molecular Biology Understanding the Genetic Revolution
Trang 11Bazo Nito – Purine
• Purine gồm
– Adenin (A)
– Guanine (G)
Trang 13Cấu trúc phân tử DNA
Trang 15Sợi mang nghĩa và sợi đối nghĩa (sense and antisense)
Trang 1616
Ở cả prokaryote và eukaryote các trình tự antisense
RNA đều được tạo ra nhưng chức năng chưa rõ Có khả năng các antisense RNA liên quan đến việc điều hòa
quá trình biểu hiện gen thông qua tương tác RNA-RNA
Cả hai trình tự sense và antisense đều tồn tại ở
những phần khác nhau của cùng một sợi DNA (nói
cách khác cả 2 sợi đều chứa các trình tự sense và
antisense)
5‘
5‘
Trang 1717
Ø Một số trình tự DNA ở prokaryote, eukaryote, plasmid và
nhiều virus khó phân biệt được khái niệm sợi mang nghĩa và sợi đối nghĩa vì có hiện tượng các chồng gen (overlapping gene)
Ø Trong những trường hợp này một số trình tự DNA có thể mã hóa cho một protein trên sợi này và một protein khác trên sợi kia (theo chiều ngược lại)
Trang 18Số lượng gene: Human Genome Project
• Năm 1999, dự đoán có khoảng hơn 100.000 mã hóa cho protein Tuy nhiên thực tế chỉ có khoảng hơn 20.000 gene được xác định (2004)
• Sau năm 2004, các hướng tiếp cận bioinformatics kết hợp với việc các nghiên cứu genome đã kiểm tra các transcriptome, xác định trình tự các thư viện cDNA, thử nghiệm (tạo ra các RNA ức chế các miRNA còn gọi là antagomir)
Có rất nhiều các bản phiên mã (transcript) không mã hóa cho
protein, những bản phiên mã này bao gồm các snoRNA và miRNA
Trang 19Cấu trúc hóa học RiboNucleotide Cấu trúc không gian của RNA
Liên kết photphodieste
Trang 20ü RNA mã hóa (mRNA) và
ü RNA không mã hóa (non-coding RNA)
(khoảng 97% ở eukaryote)
Trang 2121
RNA thông tin (mRNA) là RNA mang thông tin từ DNA đến ribosome để thực hiện quá trình dịch mã
Trình tự mRNA quyết định trình tự amino acid trong phân
tử protein được tạo ra
RNA mã hóa (mRNA)
Trang 2222
u Những RNA không mã hóa protein (non-coding RNA) có thể được mã hóa bởi các gene mã hóa cho non-coding
RNA, hoặc cũng có thể từ các mRNA intron
u Non-coding RNA bao gồm:
Các RNA không mã hóa (non-coding RNA)
1. rRNA
2. tRNA
3. snRNA (small nuclear RNA)
4. miRNA (micro RNA)
5. snoRNA (small nucleolar RNA)
6. ribozyme
Trang 24Section 12-3
mRNA
- Các mRNA có cấu trúc
đa dạng thường ngắn hơn đoạn gen DNA mà nó được mã hóa,
- mRNA sinh vật nhân thật: sau khi được phiên
mã từ DNA được đính mũ
7 methyl-Gppp vào đầu 5’
và đuôi 3’ là polyA
Trang 25tRNA
• Là phân tử RNA nhỏ (74-95 nu) có vai trò vận chuyển aa
• tRNA gắn aa ở đầu 3‘ (aminoacyl tRNA synthetase)
• Mỗi loại tRNA gắn với chỉ 1 loại aa
• Tính thoái hóa của mã di truyền (nhiều bộ ba cùng mã 1 aa) Do đó có nhiều tRNA khác nhau mang các vùng đối
mã khác nhau có thể mang cùng một loại aa
Trang 26Số lượng gene mã hóa cho tRNA rất
497 tRNA gene ở nhân mã hóa
cho các tRNA ở tế bào chất
324 tRNA có nguồn gốc từ các
gene giả (pseudogenes)
Genes mã hóa cho tRNA
Trang 28• rRNA có tính bảo thủ rất cao ở tất cả các tế bào Các gene mã hóa cho
rRNA (rDNA) có trình tự rất giống nhau ở các sinh vật trong cùng một taxon Do đó,
hàng nghìn trình tự rRNA được biết và lưu trữ trong các CSDL đặc thù
• Tại Bỉ, CSDL về trình tự rRNA được lưu trữ bao gồm CSDL về các
SSU (small subunit) và LSU (large subunit) của rRNA
sinh vật trong quá trình tiến hóa Trên thực tế người ta thường so sánh trình tự của các gene mã hóa 16S (vi khuẩn), 18S, 23S ở (eukaryote) để đánh giá mối quan hệ họ
hàng
của vi khuẩn bị tấn công bởi chloramphenicol, trong khi rRNA 80S của eukaryote không bị ảnh hưởng gì
Trang 2929
snRNA (small nuclear rRNA)
• snRNA là một lớp của các phân tử RNA nhỏ tìm thấy ở
trong nhân của eukaryote snRNA được phiên mã bởi RNA pol II
• snRNA liên quan đến quá trình loại bỏ intron khỏi các
pre-mRNA (hn RNA), điều hòa phiên mã và duy trì các telomere
• Các snRNA thường kết hợp với các protein để tạo thành
phức hợp snRNP (small nuclear ribonucleoprotein)
• Một nhóm lớn trong số các snRNA là snoRNA (small
nuleolar)
Trang 3131
snoRNA
• Small nucleolar RNAs (snoRNAs): là một lớp các phân tử RNA nhỏ có vai trò giúp cho các quá trình cải biến hóa học của các RNA khác, chủ yếu là rRNA, tRNA và snRNA
ü C/D box snoRNA: liên quan đến quá trình methyl hóa
ü H/ACA box: liên quan đến quá trình pseudouridyl hóa
• Ở động vật có xương sống, các gene snoRNA nằm trong các vùng intron của các protein liên quan đến tổng hợp ribosome hoặc các
protein tham gia trong quá trình dịch mã Các snoRNA được tổng hợp
pseudouridyl (Ψ) hóa là quá trình tạo ra các dạng đồng phân của uridine (glycosyl) trong phân tử RNA dưới sự xúc tác của các enzym gọi là Ψ synthases
Trang 3333
miRNA
• MicroRNAs (miRNAs) là các phân tử RNA có chiều dài trung bình 22 nucleotide
với các trình tự ở vùng không được dịch mã (3' UTRs) của phân tử
mRNA đích Kết quả thường dẫn đến làm gene không hoạt động (không
Trang 3434
miRNAs được tạo ra từ gene hoặc từ các intron
miRNP: Ribonucleoprotein complex
Trang 351 ds RNA is introduced into the cell either
using a short oligo (Short Interfering RNA)
siRNA or a DNA plasmid from which an siRNA can be transcribed
2 The Dicer protein in the cell digests dsRNA into 21 bp ds RNA (siRNA)
3 siRNA’s are integrated into the RNA
Induced Silencing Complex (RISC)
4 Within this RISC complex, the double
stranded siRNA’s undergo strand separation The antisense strand hybridizes to the
complementary / target mRNA in the cell
5 Nucleases within the activated RISC
degrade targeted mRNA
6 The fragmented mRNA cannot be
translated into protein This means the protein cannot be expressed, resulting in knockout of the protein
Trang 36• Giống như DNA, RNA có thể mang thông tin di truyền Ví dụ: Các virus RNA có genome là RNA mã hóa cho nhiều protein
• Các viroid là nhóm chỉ chứa RNA vòng, ở dạng trần không có vỏ (capsid) RNA của viroid không mã hóa bất kì protein nào và được sao chép bởi các polymerase của tế bào chủ
• RNA sợi kép (dsRNA): là RNA có 2 sợi bổ sung giống như DNA dsRNA là genome của một số dsRNA virus Các dạng dsRNA chẳng hạn như RNA virus hoặc siRNA có thể gây ra quá trình RNA
inteference ở eukaryote
Trang 37Where am I?
Trang 38Trình tự nucleotide trên các NST đã được xác định
Trang 3939
Trang 40Cấu trúc gene prokaryote và eukaryote
Trang 421. Người ta vẫn cho rằng các IGR là những „junk“ DNA
2. Phần lớn chức năng của các IGR vẫn chưa rõ Trong một số it trường hợp IGR tham gia điều khiển các gene xung quanh,
3. Ở người, các IGR chiếm một phần lớn trong genome Có thể các RNA không mã hóa định vị trong những vùng IGR, và vì vậy các IGR có thể tham gia điều hòa biểu hiện gene
4. Cần phân biệt rõ IGR và intron (intragenic)
Intergenic region
Intergenic region (IGR) là một vùng trình tự DNA định vị ở giữa các cụm gene (clusters of genes) IGR có thể chứa ít hoặc không có gene nào
Trang 43Khái niệm gene?
• Gene có nhiều loại:
– Gene tạo ra sản phẩm là protein, tRNA, rRNA: Gen cấu trúc
– Gene kiểm soát sự biểu hiện và mức độ biểu hiện của các gene khác: Gene điều hòa
– Một số gene cần thiết phải được biểu hiện ở tất cả các mô: House keeping gene (Liên quan đến quá trình sinh tổng hợp protein)
– Các gene khác chỉ biểu hiện ở những tế bào, mô nhất đinh: Gene đặc hiệu mô Chẳng hạn gene mã hóa insulin chỉ biểu hiện ở tế bào tuyến tụy (pancreatic β-cells)
Tóm lại cho dù thực hiện chức năng nào thì tất cả các gene chứa một vùng
mã hóa để tạo ra một chuỗi polypeptide hoặc một phân tử RNA
n Gene: một đoạn DNA nằm trên NST mã hóa cho một hoặc nhiều
protein/ RNA
Trang 44Gene và hoạt động của gene ở prokaryote
1. Mật độ gene cao (ít hoặc không có intron)
2. Các gene thường tập trung trong một cụm gọi là operon
3. Có 1 loại RNA polymerase chịu trách nhiệm tổng hợp tất cả các loại RNA
4. Quá trình phiên mã diễn ra đơn giản không đòi hỏi các giai đoạn xử lý sau phiên mã
5. Quá trình dịch mã diễn ra đơn giản không hoặc ít đỏi hỏi các cải biến sau dịch mã
Trang 45Start codon Stop codon
Vùng Promoter
• Shine-Dalgarno box (AGGAGG)
• Pribnow box (TATAAT)
Trang 46Cấu trúc gene Prokaryote
Trang 48•
So sánh trình tự vùng promoter ở E.coli
Trang 50Monocistronic & polycistronic mRNA
• 1 phân tử mRNA được coi là monocistronic khi nó chỉ chứa thông tin để dịch mã cho duy nhất 1 phân tử protein Hầu hết các mRNA của eukaryote thuộc loại này
• Polycistronic mRNA mang thông tin của một số gene, các gene này sẽ được dịch mã thành nhiều proteins (operon) Hầu hết các mRNA tìm thấy ở vi khuẩn và vi khuẩn cổ ở dạng polycistronic
• Dicistronic hoặc bicistronic: mRNA mã hóa cho 2 protein
Trang 51mRNA
Trang 52Khoảng cách giữa 2 vùng trình tự không phải là 17 nucleotide
Mỗi lần phiên mã cách nhau khoảng 10 phút (E.coli)
Trang 53RecA promoter là một promoter mạnh
Trang 54CTGACG 18 CTG
araBAD promoter là một promoter yếu
Trang 55Shine-Dalgarno sequence
1. Đề xuất bởi John Shine và Lynn Dalgarno năm 1975
2. Trình tự Shine-Dalgarno chỉ tồn tại ở Prokaryote, gồm khoảng 4-7 base phía trước của mã khởi đầu (AUG) trên mRNA
3. Consensus sequence gồm 6 base: AGGAGG (ở E.coli
AGGAGGU)
4. Giúp cho việc gắn của ribosome vào mRNA để khởi đầu tổng hợp protein
5. Trình tự Shine-Dalgarno bổ sung với trình tự
gaucaCCUCCUuaOH định vị ở đầu 3‘ của 16S rRNA
6. Đột biến ở vùng trình tự Shine Dalgarno sẽ ảnh hưởng đến hiệu quả dịch mã
Trang 56Khởi đầu dịch mã: Trình tự Shine-Dalgarno
GGAGGNNNNN AUG
Trang 57Các đặc điểm chính của tổ chức gene ở eukaryote
1. Mật độ gene thấp (3% mã hóa, 27% các trình tự promoter
và intron)
2. Các gene khác nhau về thành phần và kích thước
3. Có 3 loại RNA polymerase (từ 8-12 protein)
4. Các trình tự promoter tập trung ở vùng 5‘ upstream (có thể khá xa)
5. RNA pol I: (50% tổng các RNA được tổng hợp trong tế
bào: 18S, 5.8S, 28S )
RNA pol II (mRNA, hầu hết snRNA và microRNA)
RNA pol III (5S rRNA, tRNA và các RNA nhỏ khác)
6 Mỗi gene có trình tự promoter khác nhau: Chẳng hạn
TATA box (-25) chiếm 70% các gene
Trang 58n Tín hiệu polyadenyl hóa
Những tín hiệu quan trọng cho việc nhận biết
gene ở Eukaryote
Trang 60Promoter của Eukaryote
1. Các promoter của eukaryote cực kỳ đang dạng và rất khó xác định
2. Các promoter thường nằm ở vùng upstream của gene và
có thể có các yếu tố điều hòa nằm xa điểm khởi đầu phiên
mã vài kb
3. Phức hợp phiên mã ở eukaryote có thể làm cho DNA bẻ gập vì thế nó cho phép các yếu tố điều hòa nằm ở vị trí rất
xa có thể tham gia trong quá trình phiên mã
4. Nhiều promoter chứa TATA box (trình tự TATAAA) Trình tự này sẽ gắn với TATA binding protein (hỗ trợ cho RNA pol)
Trang 63CAT box
1. CCAAT box (CAAT box/ CAT box) là một vùng trình tự phổ biến với các nucleotide GGCCAATCT định vị cách
vị trí khởi đầu phiên mã khoảng 75-80 bases
2. CAAT box cung cấp tín hiệu cho việc bám của các TF (transcriptin factor) cùng với sự tham gia của GC box
3. CAAT và GC box thường định vị ở cách TATA box
khoảng +100-150bp
Trang 64• GC box nằm trong vùng Promoter thường có trình tự GGGCGG-3’
5’-• Nằm ở vị trí +100-150 cách TATA box
• Tham gia vào quá trình bám của các TF cho việc khởi đầu quá trình phiên mã
Trang 65Vị trí CpG là những vùng DNA mà ở đó một nucleotide
Cytosine kế cận với một nucleotide Guanine CpG là ký
hiệu viết tắt cho C-Phosphate-G
CpG island: là những vùng trong genome có nhiều vị trí CpG Trong genome của động vật có vú, các CpG island có chiều dài từ 300-3000 cặp base Chúng nằm liền kề nhau trong
vùng promoter Khoảng 70% promoter của các gene ở người
có thành phần CpG rất cao
Trang 67Là một trình tự có mặt trên mRNA của eukaryote, có tính phổ biến
Trang 68Các base bảo thủ xung quanh mã khởi đầu của các
mRNA ở người
Kozak consensus sequence:
Trang 70Đặc điểm cơ bản của một số vector biểu hiện