Chương 1 CẤU TRÚC VÀ CHỨC NĂNG CỦA CÁC ĐẠI PHÂN TỬ SINH HỌC Đối với các nghiên cứu sinh học cơ sở, bốn đại phân tử quan trọng phải kể đến là các các axit nucleic, protein, polysaccharide
Trang 1ĐẠI HỌC HUẾ TRUNG TÂM ĐÀO TẠO TỪ XA
HOÀNG TRỌNG PHÁN
SINH HỌC PHÂN TỬ (KHÁI NIỆM, NGUYÊN LÝ & QUÁ TRÌNH)
Huế - 2012
Trang 2L i nói đ u
Để góp phần đổi mới nội dung giáo trình Sinh học phân tử của Trung tâm Đào tạo Từ xa – Đại
học Huế theo hướng cập nhật kiến thức cũng như phương pháp dạy - học phù hợp với đối tượng
đặc thù, chúng tôi đã tham cứu nhiều tài liệu và cố gắng biên soạn giáo trình trên tinh thần ấy
Nội dung giáo trình gồm tám chương bao quát các kiến thức cơ bản của Sinh học phân tử mà học viên và sinh viên của Trung tâm và các trường Đại học cần nắm vững để có thể vận dụng tốt vào trong công tác nghiên cứu và giảng dạy của mình
Chương 1: Cấu trúc và chức năng của các đại phân tử sinh học
Chương 2: Tổ chức bộ gen các sinh vật
Chương 3: Cấu trúc và chức năng của gen
Chương 4: Tái bản của các bộ gen
Chương 5: Phiên mã và dịch mã
Chương 6: Điều hòa sự biểu hiện của gen
Chương 7: Các biến đổi của bộ gen
Chương 8: Các phương pháp sinh học phân tử và công nghệ ADN tái tổ hợp
Mở đầu mỗi chương có phần giới thiệu và mục tiêu giúp người học xác định các chủ đề chính cần tìm hiểu Sau mỗi chương có phần Tóm tắt nhằm giúp người học nắm nội dung khái quát của chương Cuối cùng là phần Câu hỏi và Bài tập, với 15-25 câu mỗi chương, yêu cầu người học tập vận dụng hiểu biết của mình vào giải quyết chúng trước khi sang chương mới Đặc biệt, trong khi biên soạn chúng tôi có đưa thêm phần Hướng dẫn Trả lời Câu hỏi và Bài tập cuối mỗi chương cùng với một số vấn đề liên quan thiết yếu khác vào phần Phụ lục (đặt ở cuối sách) nhằm giúp người học tra cứu, tham khảo cách học và giải quyết vấn đề khi cần
Hy vọng rằng giáo trình này sẽ đáp ứng được nhu cầu học tập của học viên và sinh viên về môn học vốn dĩ rất mới và rất khó này Tuy nhiên, vì khuôn khổ có hạn nên một số chủ để không thể đề cập sâu hơn trong sách này Hơn nữa, với khả năng có hạn, chắc chắn sách không thể tránh khỏi các sai sót trong khi biên soạn Chúng tôi rất mong nhận được sự phê bình và chỉ bảo của quý đồng nghiệp và bạn đọc để giáo trình được hoàn chỉnh hơn trong lần in sau
Huế, ngày 20 tháng 2 năm 2012
Tác giả
HOÀNG TRỌNG PHÁN
Trang 3Chương 1 CẤU TRÚC VÀ CHỨC NĂNG CỦA CÁC ĐẠI PHÂN TỬ SINH HỌC
Đối với các nghiên cứu sinh học cơ sở, bốn đại phân tử quan trọng phải kể đến là các các axit
nucleic, protein, polysaccharide và lipid Tuy nhiên, trên quan điểm của sinh học phân tử, protein và các axit nucleic là hai loại hợp chất quan trọng nhất mà chủ yếu là ADN và các thành phần của chúng Việc nghiên cứu cấu trúc và chức năng của các axit nucleic thực sự bắt đầu từ giữa thế kỷ
XX Vào năm 1944, O.T Avery, MacLeod và McCarty lần đầu tiên chứng minh ADN là vật chất mang thông tin di truyền Kế đó, sự khám phá ra cấu trúc phân tử ADN bởi James Watson và Francis Crick năm 1953 cùng với những hệ quả của nó đã là một trong những sự kiện khoa học nổi bật nhất của thế kỷ XX, đặt nền tảng cho sự ra đời và phát tiển của di truyền học và sinh học phân
tử
Trong chương này, chúng ta lần lượt tìm hiểu các vấn đề sau: (i) Cấu trúc và chức năng của các axit nucleic; (ii) Cấu trúc và chức năng của protein; (iii) Cấu trúc và chức năng của các polysaccharide và lipid; và (iv) Các liên kết hóa học cơ bản trong các hệ thống sống
1 Cấu trúc và chức năng của các Axit Nucleic
1.1 Đại cương về các axit nucleic
Ngày nay chúng ta đều biết rằng vật chất di truyền hay bộ gen của các sinh vật trên trái đất là
các axit nucleic mà hầu hết là acid deoxyribonucleic (ADN) và ở một số ít virus là acid ribonucleic
(ARN) Điều này đã được chứng minh qua các thí nghiệm kinh điển nổi tiếng, đó là: (i) Thí nghiệm biến nạp ở vi khuẩn được thực hiện đầu tiên bởi Griffith (1928) và sau đó là nhóm nghiên cứu của Avery và cộng sự (1944); (ii) Thí nghiệm của Hershey và Chase ở thể thực khuẩn T2; và (iii) Thí nghiệm của Conrat và Singer ở virus đốm thuốc lá (1956)
Các axit nucleic là những đại phân tử sinh học có trọng lượng phân tử lớn với thành phần gồm
các nguyên tố C, H, O, N và P Chúng được cấu thành từ các đơn phân (monomer) - các nucleotide; các đơn phân này nối với nhau bằng các liên kết phosphodiester tạo thành cấu trúc đa phân (polymer) gọi là các chuỗi, mạch hay sợi polynucleotide - cấu trúc sơ cấp của các phân tử ADN và
ARN
Vật chất di truyền có các đặc tính thiết yếu sau:
(1) Đặc tính thông tin sinh học: Nó chứa đựng toàn bộ thông tin di truyền cần thiết cho việc
xác định cấu trúc của các protein đặc thù của mỗi loài (các gen cấu trúc) và điều khiển các hoạt
động sinh trưởng, phân chia và biệt hoá tế bào
(2) Đặc tính tái bản: Đó là khả năng tự sao chép chính xác, đảm bảo thông tin di truyền của
thế hệ sau giống với thế hệ trước
(3) Đặc tính hoạt động của các gen: Các gen trong bộ gen có khả năng tổng hợp ra các sản
phẩm là những phân tử tham gia vào mọi động sống căn bản của tế bào Đó là các quá trình phiên
mã, dịch mã và điều hòa hoạt động của các gen
(4) Đặc tính biến đổi: Đó là khả năng bị biến đổi của các bộ gen từ các quá trình khác nhau
Trang 4như đột biến, tái tổ hợp, các yếu tố di truyền vận động Chính sự biến đổi này tạo ra các nguồn biến
dị di truyền đa dạng và phong phú cho quá trình chọn lọc và tiến hoá của sinh giới kể từ khi sự sống bắt đầu hình thành trên trái đất cách đây chừng 3 tỷ rưỡi năm
1.2 Cấu trúc của các nucleotide
Đơn vị cấu trúc cơ sở của các axit nucleic là các nucleotide Mỗi nucleotide gồm có: 1 bazơ
nitơ, 1 đường pentose, và 1 axit phosphoric
Bazơ nitơ - thành phần đặc trưng của các nucleotide - là các hợp chất purine và pyrimidine dị
vòng chứa nitơ có tính kiềm ADN chứa bốn loại bazơ chính là adenine (A), guanine (G), thymine (T) và cytosine (C); trong ARN cũng chứa 4 loại như thế, chỉ khác là uracil thay cho thymine (Hình 1.1) Ngoài ra, trong ADN còn có mặt các bazơ bị biến đổi chủ yếu do sự methyl hoá ở các vị trí
khác nhau, ví dụ: 5-methylcytosine, 5-hydroxymethylcytosine, 7-methylguanine v.v (Hình 1.2)
Đường pentose của ARN là D-ribose và của ADN là 2'-deoxy-D-ribose (ký hiệu D chỉ dạng
đường quay phải trước ánh sáng phân cực để phân biệt với dạng L quay trái không có trong thành
phần của các axit nucleic tự nhiên) Các phân tử đường này đều có cấu trúc vòng Vì các nguyên tử carbon ở đây xếp liên tục nên được đánh số thứ tự có dấu phẩy trên đầu, ví dụ C1', C2' cho đến C5' (Hình 1.3)
Hình 1.1 Cấu trúc 5 loại bazơ có mặt trong ADN và ARN
Trang 5
Hình 1.2 Một số dạng bazơ bị biến đổi chủ yếu do sự methyl hoá
Hình 1.3 (a) Cấu trúc của các phân tử đường ribose và deoxyribose
(b) Cấu trúc của ribonucleotide Adenine trong ARN
Hai phân tử đường này khác nhau ở C2'; trong ribose đó là nhóm hydroxyl và trong deoxyribose là một nguyên tử hydro Từ các gốc đường khác nhau này tạo ra hai loại nucleotide -
ribonucleotide và deoxyribonucleotide - cấu tạo nên hai loại axit nucleic khác nhau là ARN và
ADN Cần để ý rằng, trong các phân tử đường này có ba vị trí quan trọng có chứa nhóm hydroxyl (–OH) tự do, đó là: (i) nhóm –OH ở vị trí C1' có khả năng hình thành liên kết N-glycosid với gốc -
NH của các bazơ để tạo thành các nucleoside; (ii) nhóm -OH ở vị trí C5' có khả năng hình thành liên kết ester với nhóm phosphate để tạo ra các nucleotide; và (iii) nhóm –OH ở vị trí C3' có khả năng hình thành liên kết phosphodiester với nhóm phosphate của một nucleotide khác để tạo chuỗi
polynucleotide Như vậy, tính phân cực trong gốc đường mà từ đó quyết định tính phân cực của
các chuỗi polynucleotide được thể hiện ở hai vị trí C3' và C5'
Trong các nucleotide của ADN và ARN, nhóm phosphate liên kết với các nucleoside tại C5'
Mỗi nucleoside được tạo thành do một bazơ nối với đường tại C1' bằng một liên kết N-glycoside Cụ
thể, C1' nối với N1 của pyrimidine hoặc với N9 của purine Tên gọi chính thức hay danh pháp của các nucleoside bắt nguồn từ các bazơ tương ứng, trong đó các nucleoside là dẫn xuất của purine có
đuôi là -osine và các dẫn xuất của pyrimidine có đuôi là -idine (Bảng 1.1)
Tóm lại, mỗi nucleotide gồm 3 thành phần kết dính với nhau như sau: gốc đường nối với bazơ
tại C1' bằng một liên kết β-glycosid và nối với nhóm phosphate tại C5' bằng một liên kết
phosphomonoester (Hình 1.4)
Bảng 1.1 Tên gọi của các nucleoside và nucleotide của ARN và ADN
ARN
Adenine (A) Adenosine Adenosine 5'-monophosphate (AMP)
Guanine (G) Guanosine Guanosine 5'-monophosphate (GMP)
Cytosine (C) Cytidine Cytidine 5'-monophosphate (CMP)
Trang 6Uracil (U) Uridine Uridine 5'-monophosphate (UMP)
ADN
Adenine (A) Deoxyadenosine Deoxyadenosine 5'-phosphate (dAMP)
Guanine (G) Deoxyguanosine Deoxyguanosine 5'-phosphate (dGMP)
Cytosine (C) Deoxycytidine Deoxycytidine 5'-phosphate (dCMP)
Thymine (T) Deoxythymidine Deoxythymidine 5'-phosphate (dTMP)
1.3 Cấu trúc của các chuỗi polynucleotide
Các nucleotide trong ADN hoặc ARN nối với nhau bằng các mối liên kết đồng hoá trị
(covalent) có tên là liên kết 3',5'-phosphodiester (giữa gốc đường của nucleotide này với nhóm phosphate của nucleotide kế tiếp), tạo thành chuỗi polynucleotide Vì vậy các chuỗi này bao giờ
cũng được kéo dài theo chiều 5'→3' (đầu 5' mang nhóm phosphate và đầu 3' chứa nhóm -OH tự do) Chúng có bộ khung vững chắc gồm các gốc đường và phosphate xếp luân phiên nhau, còn các bazơ nằm về một bên Trình tự các bazơ vì vậy được đọc theo một chiều xác định 5'→3' Đây là cấu trúc
sơ cấp của ADN và ARN (Hình 1.5)
Hình 1.4 Cấu trúc của một deoxyribonucleotide (dAMP)
Thông thường người ta biểu diễn trình tự bazơ 5'→3' theo chiều từ trái sang phải Hình 1.5 cho thấy các chuỗi ADN và ARN chỉ khác nhau bởi bazơ U hoặc T và gốc đường trong các nucleotide của chúng Nếu bỏ qua sự khác biệt về gốc đường, ta có thể hình dung trình tự các bazơ của hai chuỗi polynucleotide của ADN và ARN đều sinh trưởng theo chiều từ 5' đến 3' (5'→3'), như sau:
Chuỗi ADN: (5') pApApTpTpCpTpTpApApApTpTpC -OH (3')
Chuỗi ARN: (5') pApApUpUpCpUpUpApApApUpUpC -OH (3')
Cần lưu ý rằng: (1) Các hợp chất dùng để polymer hoá là các nucleoside triphosphate, nhưng
Trang 7các monomer của axit nucleic lại là monophosphate Phản ứng trùng hợp này được xúc tác bởi các
enzyme ADN polymerase và ARN polymerase (2) Các oligonucleotide là những đoạn có độ dài
thường là ~10-100 nucleotide Các oligoribonucleotide tồn tại trong tự nhiên và được sử dụng như
là những đoạn mồi (primer) trong tái bản ADN và cho các mục đích khác nhau trong tế bào Các
oligonucleotide tổng hợp có thể tạo ra bằng sự tổng hợp hoá học và là nguyên liệu thiết yếu cho các
kỹ thuật sinh học phân tử, như: giải mã di truyền trong ống nghiệm; xác định trình tự ADN, phản
ứng trùng hợp chuỗi bằng polymerase (polymerase chain reaction = PCR), lai tại chỗ (in situ
hybridization), mẩu dò axit nucleic, lai axit nucleic v.v
Chu ỗ i polynucleotide c ủ a Ả N sai khác ở : Ribose (-OH) và baz ơ Uracil
Hình 1.5 Cấu trúc chuỗi polynucleotide của ADN (trên) và của ARN
1.4 Cấu trúc của phân tử ADN
1.4.1 Thành phần hóa học của ADN
Bảng 1.2 Thành phần bazơ của ADN ở một số loài
G A
+
+
C G
T A
++
Phage lambda 21,3 22,9 28,6 27,2 1,00 0,79 Phage T7 26,0 26,0 24,0 24,0 1,00 1,08
Zea mays (ngô) 26,8 27,2 22,8 23,2 0,98 1,17
Salmo salar (cá hồi) 29,7 29,1 20,8 20,4 1,02 1,43
Trang 8Gallus domestica (gà nhà) 29,5 27,7 22,4 20,4 1,08 1,34
Homo sapiens (người) 30,9 29,4 19,9 19,8 1,01 1,52
Hình 1.6 (a) R Franklin; (b) Nhiễu xạ tia X của ADN, và (c) Ảnh chụp
Erwin Chargaff (1949) lần đầu tiên áp dụng phương pháp sắc ký giấy vào việc phân tích thành phần hóa học của ADN các loài khác nhau đã khám phá ra rằng (Bảng 1.2): (i) Số lượng bốn loại bazơ trong ADN là không bằng nhau; (ii) Tỷ lệ tương đối của các bazơ là không ngẫu nhiên; trong tất cả các mẫu ADN nghiên cứu có tương quan về hàm lượng (%) giữa các bazơ: A≈T và
G≈C, nghĩa là tỷ số (A+G)/(T+C)≈1; và (iii) Mỗi loài có một tỷ lệ (A+T)/(G+C) đặc thù
1.4.2 Cấu trúc của chuỗi xoắn kép ADN
Vào năm 1951-1952, việc nghiên cứu cấu trúc ba chiều của ADN bằng phân tích nhiễu xạ tia
X được bắt đầu bởi Maurice Wilkins và Rosalind Franklin (Hình 1.6) Các bức ảnh chụp được gợi ý
rằng ADN có cấu trúc xoắn gồm hai hoặc ba chuỗi Tuy nhiên, giải pháp đúng đắn nhất là chuỗi
xoắn kép bổ sung do Watson và Crick đưa ra năm 1953 (Hình 1.7 và 1.8) Mô hình này hoàn hoàn
toàn phù hợp với các số liệu của Wilkins và Franklin cũng như của Chargaff Sự kiện này mở ra một bước ngoặt mới cho cho sự ra đời và phát triển nhanh chóng của sinh học phân tử Với phát minh về mô hình cấu trúc phân tử ADN, Watson và Crick cùng chia sẻ với Wilkins giải thưởng Nobel năm 1962
Trang 9Hình 1.7 J.Watson (trái) và F.Crick cùng với M Wilkins bên cạnh mô hình cấu trúc phân tử ADN
làm nên tên tuổi của họ
Mô hình Watson-Crick (hay ADN dạng B) có các đặc điểm sau:
(1) ADN gồm hai chuỗi đối song song (antiparallel) cùng uốn quanh một trục trung tâm theo
chiều xoắn phải, với đường kính 20Ao (1Angstrom = 10-10m), gồm nhiều vòng xoắn lặp lại một cách
đều đặn và chiều cao mỗi vòng xoắn là 34 Ao
, ứng với 10 cặp bazơ (base pair = bp)
(2) Các bộ khung đường-phosphate phân bố ở mặt ngoài chuỗi xoắn và các bazơ nằm ở bên trong; chúng xếp trên những mặt phẳng song song với nhau và thẳng góc với trục phân tử, với khoảng cách ~3,4 Ao
(3) Hai mạch đơn của ADN gắn với nhau bằng các liên kết hydro giữa các cặp bazơ đối diện
(nằm cách nhau khoảng 3Ao) theo nguyên tắc bổ sung, đó là: A-T (2 liên kết hydro) và G-C (3 liên
kết) - Hình 1.8 và 1.9a
(4) Tính chất bổ sung theo cặp bazơ dẫn đến sự bổ sung về trình tự các bazơ giữa hai mạch
đơn của mỗi chuỗi xoắn kép Vì vậy, trong bất kỳ một phân tử ADN mạch kép nào hoặc một đoạn
của nó bao giờ cũng có: A = T và G = C; nghĩa là: [A + G] = [T + C] hay A G 1
+ là đặc thù cho từng loài Như vậy, mô hình cấu trúc chuỗi xoắn kép của Watson-Crick
(1953) hoàn toàn thoả mãn các kết quả nghiên cứu của Chargaff (1949); và các biểu thức A = T và
G = C còn gọi là các quy luật Chargaff (Chargaff's rules)
Vì vậy, khi biết trình tự bazơ ở một mạch đơn của ADN, ta có thể xác định được trình tự bazơ
Trang 10nguyên lý căn bản chi phối các cơ chế di truyền ở cấp độ phân tử (tái bản, phiên mã và dịch mã),
mà ta có thể hình dung tổng quát ở sơ đồ gọi là Giáo lý trung tâm của Sinh học phân tử
Hình 1.8 Các mô hình cấu trúc chuỗi xoắn kép ADN
(a) (b)
Hình 1.9 (a) Hai kiểu kết cặp bazơ bổ sung A-T và G-C (b) Sơ đồ minh họa các khả năng kết cặp
“1 pyrimidine - 1 pyrimidine”, “1 purine - 1 purine”, và “1 purine - 1 pyrimidine” (xem giải thích trong bài)
Cần lưu ý rằng, theo nguyên tắc kết cặp các bazơ đối diện trên 2 mạch đơn của ADN có thể
có các trường hợp sau: "1 pyrimidine - 1 pyrimidine", "1 purine - 1 purine", "1 purine - 1 pyrimidine" như ở Hình 1.9b Tuy nhiên, như ta thấy, hai trường hợp đầu cho thấy chúng hoặc là quá mỏng hoặc quá dày so với đường kính phân tử Chỉ có trường hợp "1 purine - 1 pyrimidine" là phù hợp Như vậy có thể có 4 kiểu kết cặp là A-T, G-C, A-C và G-T; trong đó chỉ có hai kiểu A-T
Trang 11và G-C là bền vững, còn các kiểu A-C và G-T vì chỉ có một liên kết hydro, kém bền nên chúng chỉ xuất hiện như là ngoại lệ khi có sự hỗ biến của các bazơ và hậu quả là dẫn tới sự phát sinh các đột biến thay thế bazơ dạng đồng hoán trong quá trình tái bản ADN (chương 7)
1.4.3 Các dạng biến đổi của ADN
Mô hình Watson-Crick hay ADN dạng B là cấu trúc phổ biến Tuy nhiên, sau này người ta còn phát hiện ra nhiều dạng xoắn phải khác (A, C, D ); chúng có một số biến đổi so với ADN-B (Bảng 1.3) Bên cạnh các dạng ADN xoắn phải (A, B, C ), Alexander Rich và đồng sự (1979) còn phát hiện thêm một dạng ADN xoắn trái duy nhất cho đến nay Dạng ADN này có bộ khung zigzag uốn gập khúc theo chiều xoắn trái, mỗi vòng xoắn dài 45,6Ao chứa 12 cặp bazơ Nhìn chung, so với ADN dạng B, ADN-Z dài và thon gầy hơn, các rãnh lớn bị dẹt ra phần bề mặt của chuỗi xoắn; còn ADN dạng A ngắn và mập hơn (Hình 1.10; Bảng 1.3)
Bảng 1.3 Một số đặc điểm chính của các ADN dạng A, B và Z
Dạng Chiều xoắn Số bp/vòng xoắn Đường kính chuỗi xoắn
Sự chuyển đổi này diễn ra thuận lợi bởi sự có mặt của 5-methylcytosine và bởi trạng thái siêu xoắn âm (negative supercoiling) ADN là một phân tử động học, vì vậy nó có thể chuyển từ một cấu hình này sang một cấu hình khác dựa trên các lực bên ngoài trong tế bào Sự chuyển đổi từ dạng B sang dạng Z có thể có liên quan đến sự điều hoà biểu hiện gen Cấu trúc này cũng có mặt trong các
tế bào sống với một tỷ lệ rất nhỏ song chức năng của nó còn chưa thật sự hiểu rõ
Hình 1.10 Các mô hình ADN dạng A, B và Z
1.4.4 Đặc tính hóa lý của ADN
Một trong những đặc điểm quan trọng nhất của ADN là hai mạch đơn bổ sung của nó gắn với
Trang 12nhau bằng các liên kết hydro, vốn là lực hóa học yếu nên chúng có thể bị phân hủy dưới tác dụng
của các enzyme, năng lượng làm cho hai mạch đơn của chuỗi xoắn kép tách rời nhau, gọi là biến
tính (denaturation) Nhờ đó ADN mới có thể tái bản và các gen có thể phiên mã và biểu hiện ra sản
phẩm của chúng Mặt khác, ADN có thể phục hồi trạng thái ban đầu gọi là hồi tính (renaturation)
Bằng thực nghiệm, người ta đã chứng minh điều đó bằng cách sử dụng các tác nhân vật lý và hóa học khác nhau Chẳng hạn, khi đun nóng từ từ khi đun nóng từ từ dung dịch chứa ADN thì ở nhiệt độ vừa phải, thì các phân tử ADN bị biến tính từng phần, và khi tăng lên tới nhiệt độ gần
100oC (thường là 90-95oC) thì các liên kết hydro của chúng bị phá hủy hoàn toàn và hai mạch bổ sung tách ra (biến tính hoàn toàn) Điều đó có thể giải thích như sau: Vì mỗi cặp A-T chỉ có hai liên kết hydro, kém bền hơn so với mỗi cặp G-C có tới ba liên kết, cho nên các vùng giàu cặp A-T sẽ tách từng phần trước, trong khi các vùng giàu cặp G-C vẫn giữ nguyên đặc tính xoắn kép và chỉ tách ở nhiệt độ cao Ngược lại, khi làm nguội từ từ dung dịch ADN nóng chảy hoàn toàn này thì các mạch đơn thường cặp lại với mạch bổ sung của chúng và làm phục hồi cấu trúc chuỗi xoắn kép như lúc đầu Đây là hai quá trình thuận-nghịch
– Biến tính hay sự tách hai mạch của chuỗi xoắn kép ADN
Trong khi các tỷ số G với C và A với T trong ADN của một sinh vật là cố định, thì hàm lượng
GC (tỷ lệ phần trăm của G + C) có thể sai khác nhau một cách đáng kể giữa các ADN thuộc các loài khác nhau Bảng 1.4 cho thấy hàm lượng GC của ADN nhiều loài sinh vật Các trị số này biến thiên
từ 22% đến 73%, và điều đó được phản ảnh trong sự sai khác về các đặc tính của ADN
Nhiệt độ mà tại đó các mạch ADN tách nhau một nửa được gọi là nhiệt độ nóng chảy (melting
temperature), ký hiệu là Tm Tm là điểm giữa của pha chuyển tiếp và nó tùy thuộc vào hàm lượng
GC của ADN, nghĩa là đặc trưng cho ADN mỗi loài Trên thực tế, hàm lượng GC của ADN càng cao thì Tm của nó càng cao (Hình 1.12) Ví dụ, ADN của E coli với 50-51% GC thì có Tm là 69-
70oC Tương tự, kết quả xử lý nhiệt đối với ADN phế cầu khuẩn Streptococcus pneumoniae và
nhiệt độ nóng chảy của nó được đo bằng sự gia tăng độ hấp thụ ở 260-nm cho phép thu được đường cong nóng chảy của vi khuẩn này Tm cho ADN này dưới những điều kiện như thế là khoảng 85oC (Hình 1.11)
Bảng 1.4 Hàm lượng tương đối (G + C) của các ADN khác nhau
Dictyostelium (mốc nhầy) 22 Lách chuột 44
Streptococcus pyogens 34 Tinh trùng cá hồi 44
Hemophilus influenzae 39 Escherichia coli 51
Saccharomyces cerevisiae 39 Phage T7 51
Gan chuột (Rattus) 40 Neurospora crassa 54
Streptococcus pneumoniae 42 Herpes simplex virus 72
Trang 13Hình 1.11 Đường cong nóng chảy của ADN Streptococcus pneumoniae ADN sợi kép bị biến tính
bởi việc đun nóng và nhiệt độ nóng chảy của nó được đo bằng sự tăng độ hấp thụ ở bước sóng
260 nm Điểm mà tại đó 50% cặp bazơ bị biến tính hay một nửa ADN có dạng sợi đơn gọi là nhiệt độ nóng chảy (Tm) Ở ví dụ này là khoảng 85oC (Phỏng theo P Doty, The Harvey Lectures
55:121, 1961)
– Sự phục hồi trạng thái nguyên thể của ADN hay hồi tính
Một khi hai mạch của ADN tách ra, dưới những điều kiện thích hợp chúng có thể kết hợp trở lại và phục hồi trạng thái ban đầu Góp phần vào hiệu quả "hồi tính" này của ADN có nhiều nhân
tố Dưới đây nêu lên ba nhân tố quan trọng nhất: (i) Nhiệt độ tối ưu cho sự hồi tính của một ADN là
khoảng 25oC dưới nhiệt độ nóng chảy của nó; (ii) Nồng độ ADN trong dung dịch cũng quan trọng
Trong giới hạn hợp lý, nồng dộ ADN càng cao thì hai mạch bổ sung sẽ càng dễ dàng bắt gặp nhau trong một thời gian nào đó Nói cách khác, nồng độ càng cao thì sự hàn gắn trở lại càng nhanh (iii)
Thời gian cho phép hai mạch hàn gắn trở lại càng dài thì sự hồi tính xảy ra càng dễ dàng
Hình 1.12 Mối quan hệ giữa nhiệt độ nóng chảy của ADN và hàm lượng GC ADN chỉ có AT
(AT-DNA) là các ADN tổng hợp bao gồm chủ yếu là A và T (hàm lượng GC = 0) (Phỏng theo
P Doty, The Harvey Lectures 55:121, 1961)
Trang 141.4.5 Chức năng của ADN
Ngày nay, chúng ta đều biết rằng ADN hay bộ gen của tất cả các sinh vật nói chung có chức
năng chính là mang đầy đủ toàn bộ thông tin di truyền đặc trưng của loài Thông tin này được ghi lại dưới dạng mật mã, gọi là mã di truyền, chứa đựng trong các gen cấu trúc cũng như các yếu tố điều
hòa để điều khiển mọi hoạt động sinh trưởng, phân chia và biệt hoá của tế bào Các chức năng và cơ
chế truyền đạt thông tin di truyền chính yếu của ADN được mô tả tóm tắt như dưới đây
Hơn nữa, ADN hay vật chất di truyền nói chung đều có khả năng tự sao chép một cách chính
xác bản thân nó trong quá trình tái bản (replication) Đấy là cơ sở của sự tự nhân đôi nhiễm sắc thể và
phân chia tế bào, qua đó truyền đạt vật chất di truyền cho thế hệ sau Đó còn là các quá trình hoạt
động và điều hoà sự biểu hiện của các gen trong bộ gen, thường được kể đến như là các quá tình
phiên mã (transcription) và dịch mã (translation) để tổng hợp các phân tử ARN và cuối cùng là các
protein tham gia vào các cấu trúc và hoạt động cơ sở của tế bào Nhờ đó mà con cái sinh ra thường giống với cha mẹ, mỗi loài duy trì sự ổn định tương đối bộ gen của mình và nói rộng ra là, nhờ đó mà
sự sống được duy trì một cách liên tục kể từ khi sự sống bắt đầu hình thành trên trái đất cách đây chừng ba tỷ rưỡi năm
Mặt khác, ADN còn có khả năng phát sinh các biến đổi trong quá trình phát triển cá thể và sinh
sản Đó là các đột biến gen (gene mutations) gây ra bởi tác động của các tác nhân vật lý và hoá học
khác nhau, hoặc do chính các sai sót trong quá trình tái bản, hoặc do sự dịch chuyển vị trí của bản
thân các gen trong bộ gen - các yếu tố di truyền vận động (transposable genetic elements) hay còn gọi
là các gen nhảy (jumping genes) – gây nên sự biến động của bộ gen và biến đổi ở kiểu hình Ngoài ra,
đó còn là các quá trình tái tổ hợp di truyền (genetic recombination) tạo nên các biến dị tổ hợp phong
phú và đa dạng trong quá trình sinh sản của sinh vật Chính các quá trình biến đổi đa dạng này đã không ngừng tạo nên các nguồn biến dị di truyền sơ cấp và thứ cấp cho sự chọn lọc và tiến hoá của sinh giới
2 Cấu trúc và chức năng của protein
2.1 Cấu trúc của protein
Các protein là những polymer sinh học được tạo ra bởi sự kết nối của các axit amin (amino acid) với nhau bằng các liên kết peptide Có 20 loại L-α-axit amin được phát hiện trong các protein
của các tế bào
Về cấu trúc, nói chung, mỗi axit amin gồm có một nguyên tử carbon alpha (Cα) ở vị trí trung tâm, đính xung quanh nó là một nhóm ạmin (-NH2), một nhóm carboxyl (-COOH), một nguyên tử hydro (-H) và một gốc R hay chuỗi bên đặc trưng cho từng loại axit amin (Hình 1.14) Khi ở trạng thái dung dịch, các nhóm amin và carboxyl thường phân ly thành trạng thái ion, tương ứng là +H3N-
và -COO− (Hình 1.13)
Trang 15(a)
(b)
Hình 1.13 (a) Cấu trúc chung của các axit amin (b) Một dipeptide
Hai axit amin nối với nhau bằng một liên kết peptide (−CO−NH−) giữa nhóm carboxyl của
axit amin này với nhóm amin của axit amin kế tiếp và loại trừ một phân tử nước; cứ như thế các axit
amin kết nối với nhau tạo thành một chuỗi gồm nhiều axit amin, gọi là polypeptide (Hình 1.15)
Mỗi chuỗi polypeptide luôn luôn có chiều xác định +H3N → COO− (do tác dụng của
peptydyl-transferase) và được đặc trưng về số lượng, thành phần và chủ yếu là trình tự sắp xếp của các axit
amin
Có bốn mức độ cấu trúc của các protein (xem Hình 1.16)
Cấu trúc protein bậc I là trình tự sắp xếp của các axit amin trong một chuỗi polypeptide
Đây là bậc cấu trúc cơ sở quan trọng nhất của tất cả các protein do gen quy định
Trang 16Hình 1.14 Cấu tạo của 20 loại axit amin thuộc các nhóm khác nhau
Hình 1.15 Sự hình thành liên kết peptide giữa các axit amin
Hình 1.16 Bốn bậc cấu trúc của protein
Trang 17Cấu trúc protein bậc II xảy ra khi trình tự các axit amin trong một chuỗi polypeptide nối với
nhau bằng các liên kết hydro Cấu trúc này có hai kiểu cơ bản, đó là: chuỗi xoắn alpha (xoắn trái) và tấm beta (gấp nếp)
Cấu trúc protein bậc III xảy ra khi các lực hấp dẫn nào đó có mặt giữa các vùng xoắn alpha
và các tấm beta gấp nếp trong một chuỗi polypeptide, hình thành nên một cấu trúc cuộn gập có dạng khối cầu Một số protein chức năng có cấu trúc kiểu này, ví dụ myoglobin
Cấu trúc protein bậc IV là một protein gồm hai hoặc nhiều chuỗi polypeptide cùng loại hoặc
khác loại kết hợp với nhau Có khá nhiều protein chức năng có kiểu cấu trúc này; một số như hemoglobin còn có thêm ion kim loại như Fe++ trong túi hem của nó
2.2 Chức năng của protein
Nói chung, protein là các hợp chất hữu cơ vốn là cơ sở của sự sống, với các chức năng thiết yếu sau đây (Hình 1.17):
Hình 1.17 Tổng quát về cấu trúc và chức năng của protein
(i) Các protein là thành phần cấu tạo cơ sở của các tế bào, bao gồm các màng tế bào, các bào
quan, bộ máy di truyền của chúng Đó cũng là các protein dạng mạch làm thành các cơ quan, bộ phận trên cơ thể các động vật, như: collagen làm nên xương, sụn, gân và da; keratin cấu tạo nên các lớp ngoài cùng của da và tóc, móng, sừng và lông;
(ii) Các enzyme đóng vai trò xúc tác cho tất cả các phản ứng hóa học trong tế bào và cơ thể
đều là những protein hình cầu Quan trọng nhất là các enzyme tham gia vào các con đường chuyển
hóa và các enzyme tham gia vào các quá trình truyền thông tin di truyền trong tế bào (Hình 1.18)
Trang 18Hình 1.18 Lysozyme lòng trắng trứng gà (a) Lysozyme tự do (b) Lysozyme có cơ chất bám vào
(Phỏng theo Horton et al, 2006)
(iii) Các kháng thể (antibodies) trong hệ thống miễn dịch, còn gọi là các immunoglobulin, làm
ra hàng ngàn protein khác nhau vốn được sinh ra trong huyết thanh máu phản ứng lại với các kháng
nguyên (antigens) Chúng đóng vai trò bảo vệ cơ thể chống lại sự xâm nhập của các vật lạ
(iv) Các hormone protein bắt nguồn từ các tuyến nội tiết thì không hoạt động như các enzyme
Thay vì kích thích các cơ quan đích, chúng kiểm soát các hoạt động quan trọng, như tốc độ chuyển hóa và sản xuất các enzyme tiêu hóa và sữa chẳng hạn Insulin (từ tuyến tụy) điều hòa sự chuyển hóa carbohydrate bằng cách kiểm soát các mức glucose trong máu Thyroglobulin (từ tuyến giáp)
điều hòa các quá trình chuyển hóa nói chung; calcitonin cũng từ tuyến giáp làm hạ thấp mức calci
máu
(v) Ngoài ra, các protein còn là nguồn dinh dưỡng chính cung cấp năng lượng cho tế bào và
cơ thể duy trì các hoạt động trao đổi chất và lớn lên Ví dụ hemoglobin mang các sinh chất theo máu
đi khắp cơ thể; các fibrinogen và fibrin được biến đổi từ nó vốn có trong máu cần thiết cho quá trình đông máu Các protein cơ mà chủ yếu là myosin phối hợp với actin tạo thành actomyosin, chịu
trách nhiệm cho hoạt động co cơ
3 Cấu trúc và chức năng của các Polysaccharide
3.1 Cấu trúc của các Polysaccharide
Các polysaccharide và hợp chất carbohydrate nói chung có hành phần hóa học gồm các nguyên tố C, H và O, theo tỷ lệ thông thường là 1:2:1 hay (CH2O)n Đơn phân cấu tạo nên chúng là
các monosaccharide, chủ yếu là glucose Các monosaccharide nối với nhau bằng các liên kết
glycosid tạo thành các chuỗi polysaccharide (Hình 1.19 và 1.20)
Hình 1.19 (a) Glucose và (b) cellulose Cellulose là một polymer mạch thẳng do các gốc glucose
nối với nhau bằng các liên kết glycosid
Trang 19Hình 1.20 Sự hình thành các disaccharide Lactose (a) và Sucrose (b) bằng các liên kết β1,4- và
α1,2-glycosid
3.2 Chức năng của các Polysaccharide
Các polysaccharide có hai chức năng quan trọng nhất trong tế bào, đó là tham gia vào cấu tạo
và dự trữ năng lượng Về cấu tạo, cellulose tạo nên vách tế bào thực vật và nó là hợp chất hữu cơ có
mặt phổ biến trong sinh quyển Về năng lượng, nguồn dự trữ năng lượng ở tế bào động vật là
glycogen, trong khi đó ở các tế bào thực vật là tinh bột
4 Cấu trúc và chức năng của Lipid
4.1 Cấu trúc của Lipid
Đon vị cấu trúc cơ sở của lipid là các axit béo Mỗi axit béo bao gồm một chuỗi hydrocarbon đính vào nhóm carboxyl (–CÔOH); chúng khác nhau về chiều dài của mạch, số carbon cũng như số
lượng và vị trí của các liên kết đôi carbon-carbon (C=C) Các axit béo phổ biến trong các tế bào có
số nguyên tử carbon thường là 14, 16, 18 hoặc 20 (xem Bảng 1.5) Các axit béo thường được viết tắt Cx:y, trong đó x là số lượng carbon trong chuỗi và y là số liên kết đôi Chuỗi hay mạch
hydrocarbon dài của một axit béo có thể không chứa liên kết đôi thì gọi là axit béo no hay bão hòa (saturated) hoặc có một hay nhiều liên kết đôi thì gọi là axit béo không no hay không bão hòa
(unsaturated)
Bảng 1.5 Một số axit béo chiếm ưu thế trong các phospholipid (Lược từ Lodish et al, 2008)
Tên phổ biến của các axit (Dạng ion hóa trong ngoặc đơn) Viết tắt Công thức hóa học
Các axit béo bão hòa:
Palmitic (palmitate) C16:0 CH3(CH2)14COOH Stearic (stearate) C18:0 CH3(CH2)16COOH Các axit béo không bão hòa:
CH3(CH2)7CH=CH(CH2)7COOH Linoleic (linoleate) C18:2
CH3(CH2)4CH=CHCH2CH=CH(CH2)7COOH
Trang 20Tất cả các phosphoglyceride đều là những phân tử lưỡng cực (amphipathic), có một cái đuôi
kỵ nước (thường là hai chuỗi axit béo) và một cái đầu ưa nước (hydrophilic head; Hình 1.21a,b)
Trong dung dịch nước, hiệu quả ưa nước và các kiểu tương tác van der Waals đưa lại sự tổ chức và
ổn định các phospholipid vào một trong ba cấu trúc sau: micelle, liposome hoặc là màng hai lớp
(Hình 1.21c)
4.2 Chức năng của Lipid
Lipid là thành phần cấu tạo quan trọng của các màng sinh học (biomembrane; Hình 1.21),
ngăn cách giữa các tế bào với môi trường chung quanh, giữa các khoang trong tế bào sinh vật nhân chuẩn, đồng thời nó là nơi bám của một số protein
Cũng như glucose, các axit béo là nguồn năng lượng cho nhiều tế bào và được bảo quản dưới
dạng triacylglycerol (xem Hình dưới) trong mô mỡ Ngoài ra, các axit béo còn là những chất tiền
thân cho phospholipid và nhiều lipid khác với một loạt chức năng khác nhau
Hình 1.21 Cấu trúc của phospholipid (a) Cấu trúc của phosphat-idylcholine, một
phosphoglyceride điển hình, và (b) Mô hình cấu tạo của glycerophospholipid (c) Tổ chức của các phospholipid trong cấu trúc của một micelle, liposome và màng hai lớp trong dung dịch nước
Trang 215 Các liên kết hóa học cơ bản và vai trò của chúng
5.1 Các liên kết đồng hóa trị trong các đại phân tử sinh học
Liên kết hóa học là lực hút giữa các nguyên tử hay các phân tử với nhau Có hai loại liên kết
cơ bản với vai trò khác nhau, đó là: Các liên kết cộng hóa trị và các liên kết hóa học yếu (Hình 1.22)
5.1.1 Các liên kết cộng hóa trị hay đồng hóa trị (covalent)
Đó là các lực hóa học mạnh giữ chặt sự nối kết giữa các nguyên tử trong một phân tử hoặc tạo
ra các đại phân tử có cấu trúc bền vững Ví dụ, cầu disulfur (–S–S–), liên kết ester (xem Bảng 1.6) Ở đây, xin nhắc lại các liên kết đồng hóa trị quan trọng trong việc kết nối các đơn phân để tạo thành các cấu trúc đa phân chính yếu sau:
+ Các liên kết N-glycosid và liên kết ester nối kết giữa C1' và C5'của gốc đường với bazơ và nhóm phosphate trọ ra cấu trúc các nucleotide Các nucleotide nối với nhau bằng các liên kết
phosphodiester tạo thành các chuỗi polynucleotide – cấu trúc bậc I của các phân tử axit nucleic
+ Các axit amin nối với nhau bằng các liên kết peptid tạo thành các chuỗi polypeptide – cấu
trúc bậc I của các phân tử protein
+ Các monosaccharide kết hợp với nhau bằng các liên kết glycosid tạo thành các
polysaccharide; ví dụ các glucose nối với nhau bằng các liên kết β1,4-glycosid để tạo ra sợi cellulose
Bảng 1.6 Một số nhóm chức năng và liên kết đồng hóa trị cơ bản
5.1.2 Các liên kết hóa học yếu
Đó là các tương tác không phải đồng hóa trị (noncovalent interactions), có mức năng lượng
thấp thường dễ bị phá vỡ và chỉ tồn tại trong một thời gan ngắn Các liên kết này đóng vai trò rất quan trọng trong các hệ thống sống; chúng được hình thành do sự tương tác giữa các thành phần của một phân tử hay giữa các phân tử với nhau Có bốn loại liên kết hóa học yếu cơ bản (Hình 1.22
và 1.23), đó là:
(i) Liên kết hydro là lực hóa học yếu được hình thành do sự tương tác giữa nguyên tử hydro
(H) với nguyên tử oxy (O) hoặc nguyên tử nitơ (N) của các phân tử khác nhau Trong các hệ thống sống, chính sự có mặt của các nhóm amin (–NH2) và hydroxyl (–OH) trong thành phần của các axit
Trang 22nucleic, protein và carbonhydrate cho phép hình thành các liên kết hydro nội trong các đại phân tử này cũng như sự tương tác giữa chúng trong môi trường cơ bản của sự sống là nước
Như đã biết, các liên kết hydro trong các cặp G-C và A-T hoặc A-U không chỉ giúp ổn định cấu trúc các phân tử ADN và ARN mà còn cho phép chúng thực hiện các chức năng di truyền đặc thù như tái bản, phiên mã và dịch mã Trong protein, các liên kết hydro có vai trò đặc biệt trong việc hình thành cấu trúc bậc II như xoắn α hay phiến β, cấu trúc bậc III và từ đó quy định cấu hình
đặc trưng của từng protein (Hình 1.16)
Hình 1.22 Năng lượng tương đối của các liên kết đồng hóa trị và các tương tác không phải
đồng hóa trị Các năng lượng liên kết được xác định là năng lượng cần thiết để phân hủy một
kiểu liên kết cụ thể So với các tương tác không phải đồng hóa trị thì các liên kết đồng hóa trị
có lực mạnh gấp 100 đến 1.000 lần Năng lượng của các tương tác không phải đồng hóa trị lớn hơn nhiệt năng của nhiệt độ phòng (25oC) một chút Nhiểu quá trình sinh học kèm theo sự giải phóng năng lượng khi thủy phân một liên kết phosphoanhydride trong ATP (Theo Lodish et al, 2006)
(ii) Liên kết ion là lực tương tác tĩnh điện giữa hai nguyên tử hay hai nhóm có điện tích khác
dấu (nhóm tích điện âm gọi là cation và nhóm tích điện dương gọi là anion) Bởi vì điện tử liên kết
không phân chia đồng đều cho hai phía nên liên kết này không được xếp vào nhóm các liên kết
đồng hóa trị Trong hệ thống sống, đáng kể nhất đó là mối liên kết ion giữa các histone với ADN
trong nhân hay các protein và enzyme thực hiện các quá trình tái bản, phiên mã, điều hòa hoạt động của các gen cũng như của cả bộ gen, Về thực chất, đó là sự tương tác giữa cấu hình không gian đặc trưng của các protein với các đoạn trình tự đặc thù trên ADN
Hình 1.23 Tính chất bổ sung phân tử và việc bám dính của các protein nhờ các tương tác không
Trang 23phải đồng hóa trị (Lodish et al, 2006)
(iii) Tương tác van der Walls là lực tương tác không đặc hiệu xuất hiện giữa hai nguyên tử
khi chúng tiến lại gần nhau và gây ra sự phân cực nhất thời trên phân tử Đó là kết quả của các lực hút và đẩy của các đám mây điện tử trong một khoảng cách xác định Ví dụ, đó là sự tương tác giữa enzyme và cơ chất (Hình 1.18), giữa kháng nguyên và kháng thể
(iv) Tương tác kỵ nước (hydrophobic) là lực thúc đẩy các phân tử hoặc các vùng không phân
cực (non-polar) của chúng liên kết với nhau thay vì liên kết với các phân tử nước; vì thế gọi là tương tác kỵ nước hay “ghét nước”, “sợ nước” Các tương tác dạng này đóng vai trò quan trọng trong việc ổn định trạng thái của các phân tử protein, các phức hợp của protein với các phân tử khác (Hình 1.23)
Tóm lại, các kiểu liên kết hóa học yếu đóng vai trò vô cùng quan trọng đối với các hệ thống sống Nhờ có số lượng lớn các liên kết này mà các đại phân tử axit nucleic, các protein và các hệ thống sống nói chung vừa có tính ổn định vừa có tính linh động, vừa đảm bảo sự liên lạc giữa các
bộ phận và sự hài hòa của cả hệ thống
G, T và C, còn trong ARN có U thay cho T Các nucleotide nối với nhau bằng các liên kết phosphodiester tạo thành các polynucleotide theo chiều 5’→3’
(3) Hầu hết ADN có cấu trúc đúng như mô hình của Watson – Crick, với hai đặc điểm quan trọng nhất là: Sự ngược chiều của hai mạch đơn và tính chất bổ sung của các cặp bazơ Hệ quả của
nguyên tắc bổ sung là trong ADN luôn có A = T và G = C (còn gọi là quy luật Chargaff)
(4) Do tính chất đặc thù của các liên kết hydro mà ADN có thể biến tính và hồi tính Nhờ đó
ADN có thể thực hiện các quá trình truyền thông tin di truyền trong tế bào như tái bản, phiên mã và dịch mã
(5) Đơn vị cấu trúc cơ sở của protein là 20 loại α-axit amin; chúng nối với nhau bằng các liên kết peptide để tạo thành các chuỗi polypeptide Protein có 4 bậc cấu trúc I, II, III và IV Các protein
đảm nhận các chức năng khác nhau trong tế bào, như: cấu trúc, xúc tác, điều hòa, bảo vệ
(6) Các tương tác hóa học yếu như liên kết hydro, liên kết ion đóng vai trò rất quan trọng
đối với các hệ thống sống Nhờ đó các phân tử axit nucleic và protein vừa có tính ổn định về cấu
trúc vừa có tính linh động trong các quá trình di truyền, sinh hóa-sinh lý của tế bào
CÂU HỎI VÀ BÀI TẬP
1. Các axit amin nối với nhau bằng các liên kết _(a) _ và tạo nên cấu trúc bậc I gọi là _(b) _
2. Các nucleotide nối với nhau bằng các liên kết _(a) _ và tạo nên cấu trúc bậc I gọi là
Trang 247. Hai đặc điểm quan trọng nhất trong cấu trúc của ADN là (a) và (b)
8. Cấu trúc bậc I của protein gọi là _(a) _ , đặc trưng bởi _(b) _ có chiều N→C và loại liên kết hóa học yếu là _(c) _
9. Hemoglobin có mức độ cấu trúc cao nhất là _(a) _ với bốn chuỗi polypeptide khác nhau, đó
là _(b) _ và _(c)
10.Lipid là thành phần cấu tạo quan trọng của _(a) _; chúng có đơn vị cấu trúc cơ sở là _(b) _ Tất cả các phosphoglyceride đều là những phân tử _(c) _, có một đuôi _(d) _ và một đầu (e)
11. Phân tích và so sánh cấu trúc các nucleotide của ADN và ARN
12. Trình bày sự hình thành các chuỗi polynucleotide của ADN và ARN và chỉ ra những điểm giống nhau và khác nhau giữa chúng
13. So sánh đơn phân và cấu trúc bậc I của protein và axit nucleic
14. Tại sao chỉ từ 20 loại axit amin nhưng trong sự sống có thể có vô số loại protein khác nhau? (a) Một peptide gồm 5 axit amin khác nhau có thể có bao nhiêu cách sắp xếp khác nhau? (b) Câu hỏi tương tự cho một polypeptide có 30 axit amin, với 6 loại sau: 10 Phe, 6 Ser, 5 Leu, 4 Lys, 3 His và 2 Arg
15. Tại sao nói mô hình Watson-Crick thỏa mãn thành phần hóa học của ADN hầu hết các sinh vật, nhưng không thoả mãn bộ gen của một số virus? Cho ví dụ
16. Tính chất bổ sung và ngược chiều được thể hiện như thế nào trong cấu trúc và cơ chế tái bản của ADN?
17. Liên kết hydro là gì và có vai trò như thế nào trong cấu trúc và chức năng của ADN và protein?
18. Tại sao trong ADN chỉ tồn tại hai kiểu kết cặp bazơ A-T và G-C mà không là A-C và G-T? Nếu xảy ra các kiểu kết cặp A-C và G-T, trong điều kiện nào và hậu quả là gì? Cho các sơ đồ minh họa
19. Thế nào là biến tính và hồi tính của ADN? Giải thích và cho biết ý nghĩa sinh học cũng như
ứng dụng của các hiện tượng này
20. Hãy ước tính số lượng từng loại nucleotide và tổng số liên kết hydro trong ADN của một loài
vi khuẩn, biết rằng bộ gen của vi khuẩn này chứa 4,6 triệu cặp nucleotide và có tỷ lệ
Trang 2525. Hàm lượng cặp bazơ G-C của ADN thể thực khuẩn T3 (một loại virus ký sinh ở E coli) là
53% Theo lý thuyết, hàm lượng hay tỷ lệ %(G+C) của mARN thể thực khuẩn T3 là bao nhiêu?
Trang 26Chương 2
TỔ CHỨC BỘ GEN CÁC SINH VẬT
Để có thể đi sâu nghiên cứu đặc điểm và cơ chế của quá trình tái bản các bộ gen ở các sinh vật
(chương 3) cũng như các nội dung liên quan ở các chương về sau, trước tiên chúng ta sẽ tìm hiểu một cách đại cương về thành phần và tổ chức bộ gen của các nhóm sinh vật Chương này sẽ lần lượt trình bày và phân tích các vấn đề sau:
(i) Đại cương về các nhóm sinh vật trong sinh giới
(ii) Virus là gì? Bộ gen của các virus được tổ chức như thế nào?
(iii) Thế nào là sinh vật nhân sơ (prokaryote)? Bộ gen của các sinh vật nhân sơ mà đại diện là
vi khuẩn E coli được tổ chức như thế nào?
(iv) Sinh vật nhân chuẩn (eukaryote) bao gồm những nhóm nào? Bộ gen của chúng mà đại diện là con người có các thành phần chính yếu nào và được tổ chức ra sao?
(v) Mối quan hệ giữa kích thước bộ gen và trình độ tiến hoá của các sinh vật được hiểu như thế nào?
1 Đại cương về các nhóm sinh vật
Từ những thập niên đầu của thế kỷ XX các nhà khoa học phân chia sự sống thành hai giới là
động vật và thực vật, các vi khuẩn được xếp vào giới thực vật Mãi đến 1969, Whitaker chia toàn bộ
sự sống ra làm 5 giới: Monera (hay prokaryote), Protista (tức Protozoa hay động cật nguyên sinh),
Plantae (thực vật), Fungi (nấm) và Animalia (động vật)
Tuy nhiên, vào cuối thập niên 1970, Carl Woese dựa vào kết quả các nghiên cứu của mình về trình tự các gen ARN ribosome (rARN) của nhiều sinh vật khác nhau đã đi đến kết luận rất mới, đó là: Một lớp các sinh vật mà lâu nay được xếp vào nhóm vi khuẩn (bacteria) lại có các gen rARN
giống với các eukaryote hơn là các vi khuẩn như E coli Carl Woese đặt tên cho chúng là
archaebacteria (vi khuẩn cổ), để phân biệt với các vi khuẩn thật hay eubacteria Ngày càng có
nhiều bằng chứng sinh học phân tử tích lũy được thì vấn đề này càng trở nên rõ ràng, ở chỗ: Archaebacteria cần phải được tách thành một nhóm riêng Vì vậy Woese đã đổi tên chúng thành
archaea
Ngày nay chúng ta đều biết rằng, tất cả sự sống được gộp vào 3 siêu giới hay vực (domain),
đó là: bacteria, eukaryota và archaea (Hình 2.1) Mặc dù về mặt vật lý, archaea giống như các vi khuẩn, nhưng một số khía cạnh sinh học phân tử thì chúng tỏ ra giống với các eukaryota hơn
Trang 27Hình 2.1 Sơ đồ ba siêu giới hay là cây phát sinh sự sống
Điều đáng nói ở đây là các archaea sinh sống ở những vùng khắc nghiệt nhất trên trái đất Một
số trong chúng là các thermophile, nghĩa là các sinh vật “ưa nhiệt” (“heat-lovers”); chúng có thể
sinh sống được tại các khu vực nóng bức với nhiệt độ trên 1000C gần các các rãnh nứt địa nhiệt sâu dưới lòng đại dương hay các suối nước nóng ở Công viên Quốc gia Yellowstone (Yellowstone
National Park, Mỹ) Một số khác là các halophile (các sinh vật “ưa thích halogen”; halogen-lovers);
chúng có thể chống chịu được nồng độ muối rất cao mà thường thì các sinh vật khác không thể sống
được Và một nhóm khác nữa là các methanogen, nghĩa là sinh vật sản xuất methan
(“methane-producers”) mà môi trường sống của chúng là dạ dày của bò; điều đó giải thích tại sao các con bò lại là nguồn sinh khí methane tốt đến vậy
Do tính chất đặc thù của bộ môn, trong giáo trình này chúng ta đề cập chủ yếu vẫn là hai nhóm đầu, đó là: các sinh vật nhân sơ và sinh vật nhân chuẩn, thường gọi là prokaryote và eukaryote, bởi vì chúng được nghiên cứu kỹ nhất Dù vậy ở chương cuối cũng có nói đến loài
archaea mà từ đó Kary Mullis đã chiết xuất và sử dụng enzyme Taq-polymerase DNA để tạo dòng ADN in vitro, gọi là phương pháp PCR Và cũng biết rằng Methanococcus jannaschii (thuộc nhóm
archaea) là một trong những sinh vật đầu tiên có bộ gen được xác định trình tự đầy đủ
2 Tổ chức bộ gen của các virus
Virus là nhóm “sinh vật” bé nhất chưa có cấu tạo tế bào, không tồn tại đơn độc mà ký sinh bắt
buộc ở các tế bào sinh vật nhân sơ (prokaryote) hoặc sinh vật nhân chuẩn (eukaryote); chỉ trong
điều kiện đó chúng mới có khả năng tái bản và tổng hợp ARN và protein Các virus ký sinh hoặc
gây nhiễm vi khuẩn thì gọi là thể thực khuẩn (bacteriophage) hay phage Các virus có cấu trúc tương
đối đơn giản, với hai phần chính là lõi axit nucleic và vỏ protein Một số virus ở thực vật hoặc các
virus gây ung thư, AIDS, SARS ở người và động vật có bộ gen là ARN Số còn lại bao gồm nhiều virus ký sinh ở vi khuẩn và động vật có bộ gen là ADN mạch kép hoặc mạch đơn, mạch thẳng hoặc mạch vòng (Bảng 1.3)
Trang 28Hình 2.2 (A) Sơ đồ cấu tạo của phage T2 ở E coli (B) Ảnh hiển vi điện tử của T4, một phage có
quan hệ gần gũi với phage T2 (C) Sơ đồ cấu trúc của HIV - một retrovirus
Hình 2.3 Bản đồ ADN mạch đơn dạng vòng của phage φX174 (A), với một số gen gối nhau (B)
3 Tổ chức bộ gen của các sinh vật nhân sơ (prokaryote)
Nhóm prokaryote bao gồm các vi khuẩn (bacteria) và vi khuẩn lam (cyanobacteria), là các sinh vật có cấu tạo tế bào đơn giản nhất Vi khuẩn Escherichia coli (Hình 2.4) là đối tượng được sử
Trang 29dụng rộng rãi trong các nghiên cứu sinh học phân tử Bộ gen chính của nó (Hình 2.5) là một phân tử ADN mạch kép vòng có kích thước lớn, tức nhiễm sắc thể chính (4.639.221 cặp bazơ, với 4289 gen
mã hóa protein và 115 gen mã hóa các ARN khác) Nó thường tập trung ở một "vùng nhân" (nucleoid), không có màng nhân bao bọc và ở trạng thái siêu xoắn (supercoiled DNA) dưới sự kiểm soát của các topoisomerase Ngoài ra, còn có nhiều ADN mạch kép trần dạng vòng khác có kính thước bé hơn rất nhiều, gọi là các plasmid
Từ đầu thập niên 1990 đến nay, người ta còn phát hiện ra rằng bộ gen của một số vi khuẩn
không chỉ gồm một phân tử ADN mạch kép dạng vòng (như ở Bacillus, E coli, Pseudomonas v.v.)
mà còn có thể có các trường hợp ngoại lệ sau đây: 1 ADN mạch thẳng (Borella = 0,91 Mbp); 2 ADN mạch vòng (V cholera = 2,9 + 1,1 Mbp); hoặc 3 ADN vòng (Paracoccus denitrificans = 2,0
+ 1,1 + 0,64 Mbp); hoặc thậm chí gồm một ADN mạch thẳng (2,1 Mbp) và một ADN mạch vòng
(3,0 Mbp) như ở Agrobacterium tumefaciens v.v Về phần các plasmid cũng vậy, ví dụ ở chi
Borella có rất nhiều plasmid vòng và thẳng với kích thước biến thiên từ 5 đến 200 Kbp (Chú thích:
1 Mbp = 103 Kbp = 106 bp)
Hình 2.4 (a) Các tế bào E coli (b) ADN mạch kép vòng ở trạng thái siêu xoắn (trái) và giãn xoắn
Hình 2.5 Tổ chức phân tử của bộ gen vi khuẩn E coli
Trang 304 Tổ chức bộ gen của các sinh vật nhân chuẩn (eukaryote)
4.1 Cấu trúc chất nhiễm sắc
Các eukaryote là nhóm lớn nhất và tiến hóa đa dạng nhất về trình độ tổ chức cơ thể, bao gồm tất cả các sinh vật có cấu tạo tế bào (trừ vi khuẩn và vi khuẩn lam), có thể là đơn bào hoặc đa bào Trong tế bào chứa hai hệ thống di truyền, bộ gen nhân và bộ gen tế bào chất Bộ gen tế bào chất bao gồm các ADN mạch kép vòng, đó là: các ADN ty thể (mitochondrial DNA = mtDNA) có mặt trong tất cả các tế bào eukaryote, và ADN lạp thể (chloroplast DNA = cpDNA) chỉ có trong các tế bào thực vật
Hình 2.6 Cấu trúc của nucleosome
Trong nhân tế bào eukaryote chứa nhiều nhiễm sắc thể; mỗi nhiễm sắc thể là một phức hợp
nucleoprotein gọi là chất nhiễm sắc (chromatin), gồm một phân tử ADN mạch kép thẳng kích thước
lớn kết hợp với các phân tử protein kiềm tính (giàu lysine và arginine) gọi là các histone
Đơn vị tổ chức của cơ sở của nhiễm sắc thể eukaryote là các nucleosome (Hình 2.6) có đường
kính khoảng 10-11 nm, gồm một khối cầu tám phân tử histone (H2A+ H2B +H3+H4)2, gọi là lõi
octamer và đoạn ADN có kích thước 146 bp quấn xung quanh nó 1¾ vòng (nói chung là ~160 bp
quấn hai vòng quanh octamer, tùy từng loài) Một phân tử H1 bám vào các vùng ADN nối (linker
DNA) bên ngoài nucleosome, giữ vững sự tương tác của ADN với các histone lõi Các mức độ tổ chức hay sự hoá xoắn của nhiễm sắc thể eukaryote được mô tả ở Hình 2.7
Trang 31Hình 2.7 Tổ chức ADN trong nhiễm sắc thể eukaryote
Mức độ cấu trúc đầu tiên của chromatin được hình dung dưới dạng một chuỗi các
nucleosome, hay sợi nucleosome (nucleosome fiber) có độ dày 10 nm (1 nanomet = 10 Ao) Mức
thứ hai của cuộn gập chromatin có liên quan tới sự xoắn lại của sợi nucleosome tạo thành sợi dày 30
nm gọi là solenoid Các histone H1 tham gia vào sự xoắn lại này bằng cách tương tác với các phân
tử H1 khác Mức thứ ba của sự hóa xoắn có lẽ là cuộn vòng của sợi 30 nm tạo thành một cấu trúc tương tự như bàn chải với các vòng đeo dính vào một cái giá ở trung tâm (dày ~300 nm) Đây chính
là vùng giãn xoắn của nhiễm sắc thể, tương ứng với chất đồng nhiễm sắc (euchromatin) Sau đó các dãy vòng được sắp xếp trong các không gian ba chiều này cuộn chặt tạo thành các vùng gọi là chất
dị nhiễm sắc (heterochromatin) trên một chromatid với độ dày khoảng 700 nm Tại kỳ giữa của
nguyên phân, mỗi nhiễm sắc thể có cấu trúc điển hình gồm hai chromatid chị em dính chung nhau ở
tâm động (centromere) với độ dày toàn bộ chừng 1400 nm Như vậy, chất nhiễm sắc trong các tế
bào eukaryote tồn tại ở hai dạng: Chất dị nhiễm sắc là các phần cuộn xoắn chặt và không có hoạt tính phiên mã; và chất đồng nhiễm sắc là các vùng giãn xoắn và chí ít cũng có tiềm năng hoạt tính
Bảng 2.1 Tỷ lệ đóng gói các mức độ hóa xoắn của cấu trúc ADN
Trang 32Nhiễm sắc thể kỳ giữa co xoắn cực đại 8.000
4.2 Cấu trúc phân tử của centromere
Kết quả nghiên cứu gần đây cho thấy vùng lõi của centromere ở nấm men (S cerevisiae) có
kích thước khoảng 220 cặp nucleotide (tương đương 15-20 nm) Về cấu trúc, centromere có 3 đoạn trình tự CDE đặc thù nằm kế tiếp nhau theo chiều 5'→3' từ trái sang phải, ký hiệu là I, II và III; (Hình 2.8) trong đó:
– đoạn CDE-I có 8 cặp bazơ đặc thù là: RTCACRTG;
– đoạn CDE-II có ~78 đến 86 cặp bazơ đặc thù, với 91-95% cặp AT;
– đoạn CDE-III có 26 cặp bazơ đặc thù, đó là:
TGTTTRTG–TTTCCGAAA – – – –AAAAA
(Lưu ý: R ở đây biểu thị cho một bazơ purine, A hoặc G)
Với cấu trúc lõi ấy mà chúng có thể tương tác với các phức hợp protein đặc thù giúp cho sợi thoi có thể bám vào tâm động
(a) (b)
Hình 2.8 (a) Ảnh chụp bộ NST cho thấy các vùng tâm động bắt màu đặc thù (b) Sơ đồ một đoạn
sợi nucleosome băng qua vùng lõi tâm động, vị trí tiếp xúc với sợi thoi (c) Trình tự đặc thù của lõi centromere (CDE I, II và III) được bào tồn cao độ trong tiến hóa
4.3 Cấu trúc phân tử của telomere
Mỗi nhiễm sắc thể eukaryote có hai đầu mút với cấu trúc đặc trưng gọi là telomere Các kết
quả nghiên cứu đầu tiên của Elizabeth Blackburn và cs (1989) cho hay các telomere không chứa gen; thay vì thế chúng có cấu trúc đơn giản gồm những trình tự ngắn (6-8 bp) lặp lại nối tiếp cả ngàn lần và đặc thù cho từng loài (Hình 2.9)
Chẳng hạn, ở Tetrahymena, một nhóm động vật nguyên sinh có lông tơ, trình tự này là
Trang 33(TTGGGG)n; ở Caenorhabditis = (CCCTCCC)n; ở bọn Oxytrichia thuộc Euplotes = (CCCCAAA)n
v.v Ở người và các động vật có vú, trình tự telomere là 5'-TTAGGG-3' lặp lại ~1.000 - 2.000 lần, khoảng biến thiên phát hiện được trong các tế bào ở các giai đoạn khác nhau là 150 - 2.000 lần (Yakoob và cs, 1999)
Các nghiên cứu gần đây cho thấy: enzyme telomerase (chịu trách nhiệm tổng hợp các telomere) chỉ có mặt trong các tế bào mầm, các tế bào gốc phôi, các tế bào ung thư và các eukaryote
đơn bào như Tetrahymena thermophila Trong khi đó, các tế bào soma bình thường của động vật có
vú không thấy có telomerase Điều đó cho phép lý giải tại sao các tế bào mầm cũng như các tế bào ung thư có khả năng phân chia gần như là vô hạn Ngược lại, các tế bào soma chỉ có thể tiến hành khoảng 30-50 lần nguyên phân, và sau đó chúng mất hẳn khả năng phân chia, bước vào giai đoạn lão hóa và chết tự nhiên
Hình 2.9 Ảnh chụp cho thấy các telomere với màu vàng đặc trưng (trái) Trình tự telomere của
Tetrahymena (A) và mô hình vòng-T ở đầu mút nhiễm sắc thể (B)
4.4 Thành phần ADN trong bộ gen người
Nói chung, trong mỗi bộ gen eukaryote bao gồm các kiểu ADN chính sau đây, để cho tiện ta lấy bộ gen người làm thí dụ :
- ADN bản sao đơn (single-copy/unique), nghĩa là các gen có mặt chỉ một lần trong bộ gen;
loại này chiếm ~75% và bao gồm hầu hết các gen
- ADN lặp lại (repetitive) bao gồm một số gen được lặp lại vài lần cho đến hàng ngàn lần
trong bộ gen Nhóm này được chia làm hai loại:
+ ADN lặp lại kiểu phân tán (interspersed): loại này chiếm khoảng 15% và phân bố rải rác khắp bộ gen giữa các gen cũng như bên trong các gen; bao gồm các trình tự Alu (là các đoạn ADN
dài khoảng 300 bp và được lặp lại khoảng 300.000 lần trong bộ gen; chúng có thể có mặt ở chỗ tiếp
giáp hoặc bên trong các gen trong các intron hoặc các vùng không được dịch mã) và cả các đoạn
lặp nối tiếp có số lượng biến thên (VNTRs = variable numbers of tandem repeats), vốn là các đoạn
lặp ngắn chỉ vài cặp bazơ nhưng có chiều dài sai khác, còn gọi là các tiểu vệ tinh (minisatellite or microsatellite) Ví dụ: các đoạn lặp phân tán trong các đoạn trình tự Alu (Alu sequences):
Trang 345'– GCTGCGG GCTGAGG GCTGAGG –3'
+ ADN vệ tinh (satellite) hay ADN lặp lại nối tiếp (tandem): loại này chiếm khoảng 10% và
được lặp lại rất nhiều lần, bao gồm các trình tự đơn giản thường khu trú ở các tâm động
(centromere) và các đầu mút (telomere) của các nhiễm sắc thể Ví dụ: các đoạn lặp nối tiếp thuộc
các microsatellite hay telomere:
5'– TTAGGGTTAGGGTTAGGGTTAGGG –3' Nhìn chung, bộ gen người có các đặc điểm sau:
• Bộ gen nhân (xem sơ đồ):
- Bộ gen đơn bội có khoảng 3,2 tỷ cặp bazơ; hầu như tất cả mức độ phức tạp của nó đều nằm trong lớp ADN bản sao đơn (~75%);
- Chứa khoảng 25.000 gen mã hóa protein, trong đó đa phần là các gen phân đoạn với cấu trúc
phức tạp;
- Các gen chứa từ 1 cho đến trên 75 exon;
- Các gen sai khác nhau về chiều dài, biến thiên từ dưới 100 cho đến khoảng 2.400.000 cặp bazơ là chiều dài lớn nhất của gen được biết cho đến nay Đó chính là gen gây rối loạn dưỡng cơ DMD thuộc NST X;
- Trình tự Alu có mặt khắp bộ gen v.v
• Bộ gen ty thể (Hình 2.10):
Một số đặc điểm chính về cấu trúc và chức năng của ADN ty thể người như sau: (Nguồn:
Harding AE, Trends Neurol Sci 1991;14:132.)
Trang 35Hình 2.10 ADN ty thể của người
- Mỗi mtADN mạch kép dạng vòng có một sợi nặng (H) và một sợi nhẹ (L); nó chứa 16.569
bp, với 37 gen mã hóa cho các enzyme và các tARN, rARN, trong đó có 22 gen tARN, 2 gen rARN (16S và 12S), và 13 vùng mã hóa protein của chuỗi hô hấp, bao gồm:
+ 7 tiểu đơn vị của NADH dehydrogenase (phức hợp I);
+ Cytochrome b của phức hợp III;
+ 3 tiểu đơn vị của cytochrome oxidase (phức hợp IV);
+ 2 tiểu đơn vị của ATP synthase
- Mã di truyền có sai khác chút ít so với mã phổ biến, ở chỗ:
+ UGA (codon kết thúc của mã chuẩn) được đọc là Trp;
+ AGA và AGG (codon mã chuẩn cho Arg) được đọc là codon kết thúc
- Chứa rất ít trình tự không được dịch mã
- Tỷ lệ đột biến cao (gấp 5 đến 10 lần so với ADN nhân)
- Các so sánh về trình tự của các mtADN cung cấp bằng chứng về nguồn gốc tiến hóa của bộ linh trưởng (Primates) và các loài khác
5 Kích thước bộ gen và tính phức tạp về mặt tiến hoá
Dựa trên các kết quả phân tích bộ gen của các virus và vi khuẩn cũng như của bộ gen đơn bội
ở eukaryote, cho phép khái quát như sau: Kích thước của bộ gen tăng lên tương đối cùng với mức
độ phức tạp về mặt tiến hóa Thật vậy, từ bảng 2.2 cho thấy kích thước bộ gen của các virus nói
chung là rất nhỏ so với nhóm prokaryote, và kích thước bộ gen của các prokaryote lại tỏ ra quá đơn giản so với ngay cả một eukaryote đơn bào như nấm men Trong khi ADN của một vi khuẩn điển
hình như E coli chỉ có ~4,6 triệu cặp bazơ và chứa ~4.290 gen mã hóa protein, thì phage MS2 là
một trong các virus bé nhất, bộ gen ARN của nó cũngchỉ có 3.569 bazơ với tất cả 4 gen; hoặc có kích thước lớn như virus Epstein-Barr (ADN mạch kép vòng) cũng chỉ có 172.282 bp với tất cả 80 gen
Trang 36Nếu xét trên cả hai nhóm prokaryote và eukaryote, ta thấy rằng kích thước các bộ gen biến thiên rất lớn: bộ gen một vi khuẩn sống tự do được biết là bé nhất chứa khoảng 600.000 cặp bazơ, trong khi các bộ gen của người và chuột chỉ khoảng 3 tỷ bp Nếu xét riêng ở nhóm eukaryote, ta đã biết mỗi loài có một số lượng nhiễm sắc thể đặc trưng và nó không phản ánh trình độ tiến hóa của các loài Tuy nhiên, về mặt nào đó rõ ràng là có sự tương quan thuận giữa hàm lượng ADN của các
bộ gen đơn bội và nấc thang tiến hóa của các động-thực vật Dù vậy vẫn có một số ngoại lệ so với quy tắc này!
Hàm lượng ADN và nghịch lý giá trị C
Mặc dù Psilotum nudum, đôi khi gọi là "dương xỉ lông", là một loại thực vật đơn giản hơn nhiều so với loài Arabidopsis thaliana vốn là một thực vật có hoa thuộc họ cải, nhưng nó lại có kích
thước bộ gen lớn hơn tới 3.000 lần Đó là do trên 80% bộ gen của nó là ADN lặp lại không chứa thông tin di truyền nào cả! Hay một số thực vật (ngô, loa kèn) hay một số động vật (như lưỡng thê, cá) lại có kích thước bộ gen lớn gấp nhiều lần so với lớp thú (bảng 2.2) Một số lưỡng thê chứa ADN nhiều hơn bộ gen chúng ta đến 30 lần, nhưng chắc chắn không phải là chúng phức tạp gấp chúng ta 30 lần!
Bảng 2.2 Kích thước bộ gen của một số sinh vật thường gặp
Virus
Thể thực khuẩn MS2 3.569 4 1 (ARN m.đơn) Virus đốm thuôc lá (TMV) 6.400 4 1 (ARN m.đơn) Virus cúm (Influenza) 13.500 12 8 (ARN m.đơn) Thể thực khuẩn ØX174 5.386 10 1 (ADN m.đơn) Thể thực khuẩn lambda 48.502 60 1 (ADN m.kép) Thể thực khuẩn T4 200.000 165 1 (ADN m.kép)
Trang 37Caenorhabditis elegans 100 Mbp 19.000 6
Người (Homo sapiens) 3.300 Mbp 22.000 23
Arabidopsis thaliana 115 Mbp 25.000 5
Chuột (Mus musculus) 220 Mbp 25.000 19
Lúa (Oryza sativa ) 430 Mbp 45.000 12
Người ta gọi tổng hàm lượng ADN trong bộ gen đơn bội là giá trị C (C-value) Với phân tích
ở trên cho thấy không hề tồn tại một mối quan hệ ổn định nhất quán giữa giá trị C và tính phức tạp
của một sinh vật (như lưỡng thê với thú); cái đó gọi là nghịch lý giá trị C (C-value paradox)
Kích thước ADN của một số bào quan
Từ bảng 2.3 cho thấy ADN của một số bào quan có vẻ đơn giản và không có dấu hiệu tiến hóa
rõ rệt Nói chung, kích thước mỗi phân tử ADN ty thể của người và các động vật có vú thường nằm trong khoảng 15.000-17.000 cặp bazơ; trong khi đó, kích thước một ADN lạp thể ở phần lớn tế bào các thực vật thường biến thiên trong khoảng 130.000 - 150.000 bp Còn các plasmid của một số tế bào thực vật thường có kích thước rất bé khoảng 1-2 ngàn cặp bazơ
Bảng 2.3 Kích thước ADN bào quan ở một số sinh vật nhân chuẩn
Người (Homo sapiens) 16.569 O sativa (indica) 1.485
D melanogaster 19.517 O sativa (jap.) 2.135
Chúng ta cũng cần biết qua các sinh vật mô hình (Hình 2.11), tức các sinh vật đã được di
truyền học và sinh học phân tử nghiên cứu rất kỹ và đã giải trình tự đầy đủ bộ gen của chúng Tên
tuổi chúng, chẳng hạn ruồi giấm Drosophila hay E coli nổi tiếng đến độ bạn chỉ cần gõ tên và các
bộ máy tìm kiếm như Google sẽ cho bạn hàng triệu hình ảnh và các thông tin chi tiết đến không ngờ
Ở đây, chúng tôi lược nêu số lượng cặp bazơ trong bộ gen (đơn bội) và số lượng các gen khác
nhau có mặt trong mỗi bộ gen của các sinh vật mô hình được ước tính gần đây (Bảng 2.4) Qua đó bạn sẽ thấy được tuy có sự tương đồng giữa chúng về số gen hoặc thậm chí kích thước bộ gen nhưng hoàn toàn không có chút tương đồng nào về trình độ tiến hóa của chúng!
Trang 38Bảng 2.4 Kích thước bộ gen (đơn bội) và số gen khác nhau trong bộ gen của các sinh vật mô
hình (Nguồn: Eberhard Passarge, 2007)
Chimpanzee Hắc tinh tinh 3.000 1,2% sai khác
Anopheles gambiae Muỗi anôphen 278 ~14.000
Arabidopsis thaliana Thực vật có hoa 125 ~25.000
Hình 2.11 Các sinh vật mô hình tiêu biểu
TÓM TẮT
(1) Tất cả sự sống được gộp vào 3 siêu giới (domain): bacteria, eukaryota và archaea Tuy
nhiên, trong sinh học phân tử, các nghiên cứu kỹ nhất là các prokaryote và eukaryote, các virus virus ký sinh trên chúng
Trang 39(2) Bộ gen của virus rất đa dạng và đơn giản, chỉ là 1 phân tử axit nucleic - ADN hoặc ARN, mạch kép hoặc mạch đơn, dạng thẳng hoặc vòng; kích thước ngắn và chứa ít gen
(3) Bộ gen của tế bào prokaryote gồm có NST chính và các plasmid Thông thường chỉ có 1 NST chứa 1 phân tử ADN mạch kép vòng, vài triệu cặp bazơ và chứa vài ngàn gen; một số plasmid
có mang gen kháng thuốc được sử dụng rộng rãi trong kỹ thuật ADN tái tổ hợp
(4) Các tế bào eukaryote có hai bộ gen: Bộ gen nhân và bộ gen tế bào chất Mỗi NST trong nhân chứa 1 ADN mạch kép thẳng, kích thước lớn liên kết với các histone dưới dạng các nucleosome Nếu như bộ gen nhân chứa hầu hết các gen và các thành phần quan trọng của tế bào thì
bộ gen tế bào chất là các ADN mạch kép vòng, ngắn có trong ty thể (mtADN) và trong lạp thể ở tế bào thực vật (cpADN); chúng chỉ chứa vài chục gen liên quan chủ yếu đến hệ thống tổng hợp ATP
và protein của bào quan
(5) Trình độ tiến hóa của các sinh vật không hoàn toàn tỷ lệ với kích thước bộ gen cũng như
số lượng các gen mà chủ yếu phụ thuộc vào mức độ tổ chức tinh vi và phức tạp của chúng
CÂU HỎI VÀ BÀI TẬP
26. Bộ gen của virus HIV là hai phân tử ARN mạch đơn, mỗi phân tử có gắn một phân tử enzyme phiên mã ngược
30. Đơn vị tổ chức cơ sở của các nhiễm sắc thể sinh vật nhân chuẩn là (a) , có đường kính
khoảng (b) Angstrong, gồm một lõi octamer chứa (c) phân tử histone được quấn bên ngoài bới một đoạn (d) dài chừng 140-160 bp
31. Các mức độ hóa xoắn của ADN trong tổ chức phân tử của nhiễm sắc sinh vật nhân chuẩn có
đường kính 2, 11 và 30 nm được gọi tương ứng là: (a) , (b) , và (c)
32. Sự hóa xoắn của ADN tong nhiễm sắc thể có hai ý nghĩa chính là (a) và (b)
33. Các histone H1 bám giữ các vị trí (a) và (b) trên mỗi nucleosome; chúng đóng vai trò quan trọng trong (c)
34. Hai đầu mút của mỗi nhiễm sắc thể sinh vật nhân chuẩn có cấu trúc đặc trưng gọi là các (a) Đó là các đoạn trình tự (b) , ví dụ ở người là (c) ; với các vai trò chính yếu là (d) _
35. Hãy làm sáng tỏ nhận định sau: Nhóm virus có trình độ tổ chức "cơ thể" sơ khai nhất với các bộ gen rất đơn giản và đa dạng
Trang 4036. Hiện nay sinh giới được phân thành những siêu giới (domain) nào và dựa trên cơ sở nào? Hãy dựa vào sơ đồ "cây sự sống" để chọn vài ví dụ thích hợp cho mỗi siêu giới và chỉ ra mối quan hệ tiến hóa tổng quát giữa chúng
37. Trình bày các hiểu biết về các thành phần chính trong tổ chức của bộ gen vi khuẩn E coli
38. Phân tích và trình bày tổ chức phân tử của nhiễm sắc thể sinh vật nhân chuẩn, các mức độ đóng xoắn và ý nghĩa của hiện tượng đó
39. Trình bày hiểu biết hiện nay về các thành phần chính trong tổ chức phân tử của bộ gen người
40. Phân tích cấu trúc của telomere và centromere ở các nhiễm sắc thể eukaryote và cho biết vai trò của các cấu trúc này