Genlàgì?
Các thông tin di truyền sinh vật cần cho quá trình sinh trưởng, phát triển và
sinh sản nằm trong phân tử ADN của nó. Những thông tin này nằm trong
trình tự nucleotit của ADN và được tổ chức thành các gen.
Mỗi gen thường chứa thông tin để tổng hợp một chuỗi polypeptit hoặc một
phân tử ARN có chức năng riêng biệt. Xét về cấu trúc, mỗi genlà một đoạn
ADN riêng biệt mang trình tự bazơ thường mã hoá cho trình tự axit amin của
một chuỗi polypeptit. Các gen rất khác nhau về kích thước, có thể từ dưới
100 cặp đến vài triệu cặp bazơ. ở sinh vật bậc cao, các gen hợp thành các
phân tử ADN rất dài nằm trong các cấu trúc được gọi là nhiễm sắc thể. ở
người có khoảng 30.000 - 40.000 gen phân bố trên 23 cặp NST, trong đó có
22 cặp NST thường (autosome) và 1 cặp NST giới tính (X và Y). Như vậy, ở
người có 24 loại NST khác nhau. Trên nhiễm sắc thể, các gen thường nằm
phân tán và cách biệt nhau bởi các đoạn trình tự không mã hóa. Các đoạn
trình tự này được gọi là các đoạn ADN liên gen. ADN liên gen rất dài, như ở
người các gen chỉ chiếm dưới 30% toàn bộ hệ gen. Xét ở mỗi gen, chỉ một
mạch của chuỗi xoắn kép là mang thông tin và được gọi là mạch khuôn
dùng để tạo ra phân tử ARN mang trình tự bổ trợ để điều khiển quá trình tổng
hợp chuỗi polypeptit. Mạch kia được gọi là mạch không làm khuôn. Cả hai
mạch trên phân tử ADN đều có thể được dùng làm mạch để mã hoá cho các
gen khác nhau. Ngoài ra, người ta còn dùng một số thuật ngữ khác để chỉ
mạch khuôn và mạch không làm khuôn, như mạch đối nghĩa / mạch mang
nghĩa, mạch không mã hoá / mạch mã hoá. Cần chú ý là, mạch đối nghĩa
và mạch không mã hóa chính là mạch khuôn để tổng hợp phân tử ARN. Khả
năng lưu giữ thông tin di truyền của ADN là rất lớn. Với một phân tử ADN
có n bazơ sẽ có 4
n
khả năng tổ hợp trình tự bazơ khác nhau. Trong thực tế,
chỉ một số lượng hạn chế các trình tự mang thông tin có ích (thông tin mã hóa
các phân tử ARN hoặc protein có chức năng sinh học)
Gen được tổ chức như thế nào trên NST ?
Hầu hết các gen phân bố ngẫu nhiên trên nhiễm sắc thể, tuy nhiên có một số
gen được tổ chức thành nhóm, hoặc cụm. Có hai kiểu cụm gen, đó là các
operon và các họ gen.
Operon là các cụm gen ở vi khuẩn. Chúng chứa các gen được điều hoà hoạt
động đồng thời và mã hoá cho các protein thường có chức năng liên quan với
nhau. Ví dụ như operon lac ở E. coli chứa ba gen mã hoá cho các enzym mà
vi khuẩn cần để thủy phân lactose. Khi có lactose làm nguồn năng lượng (và
vắng mặt glucose) thì vi khuẩn cần ba enzym do operon lac mã hoá. Sự dùng
chung một trình tự khởi đầu phiên mã (promoter) của các gen trong operon
(hình 1) cho phép các gen đó được điều khiển biểu hiện đồng thời và sinh vật
có thể sử dụng nguồn năng lượng một cách hiệu quả.
Ở các sinh vật bậc cao không có các operon, các cụm gen được gọi là các họ
gen. Không giống như các operon, các gen trong một họ gen rất giống nhau,
nhưng không được điều khiển biểu hiện đồng thời. Sự cụm lại của các gen
trong họ gen có lẽ phản ánh nhu cầu cần có nhiều bản sao của những gen nhất
định và xu hướng lặp đoạn của nhiều gen trong quá trình tiến hóa. Một số họ
gen tồn tại thành nhiều cụm riêng biệt trên nhiều nhiễm sắc thể khác nhau.
Hiện tượng này có lẽ là do sự tái cấu trúc ADN trong quá trình tiến hoá đã
phá vỡ các cụm gen. Các họ gen có thể có cấu trúc đơn giản hoặc phức tạp. Ở
các họ gen đơn giản, các bản sao của gen giống hệt nhau. Ví dụ như họ gen
mã hóa ARN ribosom 5S (rARN 5S). Ở mỗi tế bào người, có khoảng 2000
cụm gen của gen này, phản ánh tế bào cần số lượng lớn sản phẩm của gen
này (hình 2a). Trong khi đó, các họ gen phức tạp chứa các gen tương tự
nhưng không giống hệt nhau. Ví dụ như họ gen globin ở người mã hóa cho
cho các chuỗi polypeptit tương ứng với các loại globin (hình 2b) chỉ khác
nhau vài axit amin. Các chuỗi polypeptit globin tương tác với nhau thành một
phức hệ, và kết hợp với các phân tử hem để tạo ra hemoglobin (một loại
protein vận chuyển oxy trong máu).
. nhóm, hoặc cụm. Có hai kiểu cụm gen, đó là các
operon và các họ gen.
Operon là các cụm gen ở vi khuẩn. Chúng chứa các gen được điều hoà hoạt
động đồng. như ở
người các gen chỉ chiếm dưới 30% toàn bộ hệ gen. Xét ở mỗi gen, chỉ một
mạch của chuỗi xoắn kép là mang thông tin và được gọi là mạch khuôn
dùng