Gen Gen Bởi: PGS TS Phạm Thành Hổ Về khái niệm Các thông tin di truyền sinh vật cần cho trình sinh trưởng, phát triển sinh sản nằm phân tử ADN Những thông tin nằm trình tự nucleotit ADN tổ chức thành gen Mỗi gen thường chứa thông tin để tổng hợp chuỗi polypeptit phân tử ARN có chức riêng biệt Xét cấu trúc, gen đoạn ADN riêng biệt mang trình tự bazơ thường mã hoá cho trình tự axit amin chuỗi polypeptit Các gen khác kích thước, từ 100 cặp đến vài triệu cặp bazơ sinh vật bậc cao, gen hợp thành phân tử ADN dài nằm cấu trúc gọi nhiễm sắc thể người có khoảng 30.000 - 40.000 gen phân bố 23 cặp NST, có 22 cặp NST thường (autosome) cặp NST giới tính (X Y) Như vậy, người có 24 loại NST khác Trên nhiễm sắc thể, gen thường nằm phân tán cách biệt đoạn trình tự không mã hóa Các đoạn trình tự gọi đoạn ADN liên gen ADN liên gen dài, người gen chiếm 30% toàn hệ gen Xét gen, mạch chuỗi xoắn kép mang thông tin gọi mạch khuôn dùng để tạo phân tử ARN mang trình tự bổ trợ để điều khiển trình tổng hợp chuỗi polypeptit Mạch gọi mạch không làm khuôn Cả hai mạch phân tử ADN dùng làm mạch để mã hoá cho gen khác Ngoài ra, người ta dùng số thuật ngữ khác để mạch khuôn mạch không làm khuôn, mạch đối nghĩa / mạch mang nghĩa, mạch không mã hoá / mạch mã hoá Cần ý là, mạch đối nghĩa mạch không mã hóa chínhlà mạch khuôn để tổng hợp phân tử ARN Khả lưu giữ thông tin di truyền ADN lớn Với phân tử ADN có n bazơ có 4n khả tổ hợp trình tự bazơ khác Trong thực tế, số lượng hạn chế trình tự mang thông tin có ích (thông tin mã hóa phân tử ARN protein có chức sinh học) Về tổ chức gen Hầu hết gen phân bố ngẫu nhiên nhiễm sắc thể, nhiên có số gen tổ chức thành nhóm, cụm Có hai kiểu cụm gen, operon họ gen 1/4 Gen Operon cụm gen vi khuẩn Chúng chứa gen điều hoà hoạt động đồng thời mã hoá cho protein thường có chức liên quan với Ví dụ operon lac E coli chứa ba gen mã hoá cho enzym mà vi khuẩn cần để thủy phân lactose Khi có lactose làm nguồn lượng (và vắng mặt glucose) vi khuẩn cần ba enzym operon lac mã hoá Sự dùng chung trình tự khởi đầu phiên mã (promoter) gen operon (hình 1) cho phép gen điều khiển biểu đồng thời sinh vật sử dụng nguồn lượng cách hiệu Một họ gen đơn giản (a), họ gen phức tạp (b) sinh vật bậc cao operon, cụm gen gọi họ gen Không giống operon, gen họ gen giống nhau, không điều khiển biểu đồng thời Sự cụm lại gen họ gen có lẽ phản ánh nhu cầu cần có nhiều gen định xu hướng lặp đoạn nhiều gen trình tiến hóa Một số họ gen tồn thành nhiều cụm riêng biệt nhiều nhiễm sắc thể khác Hiện tượng có lẽ tái cấu trúc ADN trình tiến hoá phá vỡ cụm gen Các họ gen có cấu trúc đơn giản phức tạp họ gen đơn giản, gen giống hệt Ví dụ họ gen mã hóa ARN ribosom 5S (rARN 5S) tế bào người, có khoảng 2000 cụm gen gen này, phản ánh tế bào cần số lượng lớn sản phẩm gen (hình 2a) Trong đó, họ gen phức tạp chứa gen tương tự không giống hệt Ví dụ họ gen globin người mã hóa cho cho chuỗi polypeptit tương ứng với loại globin α, β, ?, ε, ζ (hình 2b) khác vài axit amin Các chuỗi polypeptit globin tương tác với thành phức hệ, kết hợp với phân tử hem để tạo hemoglobin (một loại protein vận chuyển oxy máu) Trình tự khởi đầu phiên mã (promoter) Sự biểu gen điều khiển chặt chẽ Không phải tất gen có ADN tế bào biểu đồng thời Những gen khác hoạt hoá 2/4 Gen biểu vào thời điểm tế bào khác Tất gen biểu tế bào xác định đặc tính chức tế bào Ví dụ, gen biểu tế bào khác với gen biểu tế bào máu Sự biểu gen điều khiển đoạn trình tự ADN đứng trước (nằm ngược dòng phía đầu 5’) so với đoạn trình tự mã hóa gọi trình tự khởi đầu phiên mã (promoter, gọi trình tự khởi động) Đoạn trình tự khởi động chứa trình tự đặc hiệu ARN polymerase protein đặc biệt gọi yếu tố phiên mã nhận biết để gắn vào trình phiên mã gen Mức độ biểu gen tế bào xác định mức độ gắn kết (ái lực) ARN polymerase yếu tố phiên mã với promoter Exon Intron sinh vật bậc cao (sinh vật nhân chuẩn), thông tin di truyền mã hoá NST thường bị phân cắt thành nhiều đoạn trình tự ADN cách biệt gọi exon Các exon bị ngăn cách trình tự không mang thông tin có ích gọi intron (hình 3) Số lượng intron gen biến động lớn, có thẻ từ đến 50 phân đoạn Độ dài intron exon biến động, intron thường dài chiếm phần lớn trình tự gen Trước thông tin gen sử dụng để tổng hợp phân tử protein tương ứng, intron phải cắt bỏ khỏi phân tử ARN nhờ trình gọi trình cắt bỏ (quá trình hoàn thiện phân tử mARN) Trong trình đó, exon giữ lại nối lại với thành trình tự mã hoá liên tục Cấu trúc gen Việc xác định intron trình tự gen thực nhờ intron điển hình có trình tự bắt đầu 5’-GU kết thúc AG-3’ Tuy vậy, thực tế dấu hiệu này, việc cắt bỏ intron cần trình tự khác vùng nối intron exon (xem thêm mục III.1) Gen giả (pseudogene) Có số gen giống với gen khác trình tự bazơ chúng có sai sót làm cho chúng khả chứa thông tin sinh học hữu ích Những gen gọi gen giả sai sót đột biến trình tự ADN 3/4 Gen chúng xuất trình tiến hoá làm thông tin bị lẫn lộn đến mức không điều khiển trình sinh tổng hợp protein bình thường Những gen giả dấu vết trình tiến hoá Trải qua tiến hoá, biến đổi ban đầu bazơ gây thông tin lặp lặp lại đến mức trí trình tự bazơ gen giả khác hẳn với trình tự gen gốc ban đầu Ví dụ gen globin giả cụm gen globin 4/4 ... operon, gen họ gen giống nhau, không điều khiển biểu đồng thời Sự cụm lại gen họ gen có lẽ phản ánh nhu cầu cần có nhiều gen định xu hướng lặp đoạn nhiều gen trình tiến hóa Một số họ gen tồn... tiến hoá phá vỡ cụm gen Các họ gen có cấu trúc đơn giản phức tạp họ gen đơn giản, gen giống hệt Ví dụ họ gen mã hóa ARN ribosom 5S (rARN 5S) tế bào người, có khoảng 2000 cụm gen gen này, phản ánh... III.1) Gen giả (pseudogene) Có số gen giống với gen khác trình tự bazơ chúng có sai sót làm cho chúng khả chứa thông tin sinh học hữu ích Những gen gọi gen giả sai sót đột biến trình tự ADN 3/4 Gen