Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
260,55 KB
Nội dung
Phân tích gen sản phẩm gen Phân tích gen sản phẩm gen Bởi: PGS TS Phạm Thành Hổ Các kỹ thuật phân tích axit nucleic Điện di phân tích ADN ARN Có nhiều phương pháp khác sử dụng để phân tích ADN ARN, điện di gel phương pháp sử dụng phổ biến nhờ ưu điểm nhanh tương đối đơn giản Nguyên tắc phương pháp do: tác động điện trường, phân tử ADN (thường tích điện âm) khác kích thước, điện tích, mức độ cuộn xoắn dạng phân tử (mạch thẳng hay mạch vòng) di chuyển qua hệ mạng gel từ cực âm (cathode) sang cực dương (anode) với tốc độ di chuyển khác Vì vậy, chúng tách trường điện di, qua người ta thu thập phân tích phân đoạn ADN gen riêng rẽ Trên điện trường phân đoạn ADN có kích thước nhỏ có tốc độ di chuyển điện trường nhanh Sau điện di kết thúc, phân tử ADN quan sát thấy nhờ sử dụng thuốc nhuộm phát huỳnh quang, chẳng hạn ethidium (chất gắn kết với ADN cách cài vào khe nucleotit) Mỗi băng điện di thường phản ánh tập hợp phân tử ADN có kích thước Có hai loại vật liệu làm gel sử dụng phổ biến điện di, agarose polyacrylamid Trong đó, gel polyacrylamid có khả phân tách cao, khoảng kích thước ADN phân tích hẹp Vì vậy, điện di gel polyacrylamid phân tách phân đoạn ADN khác trí cặp nucleotit (1 bp) nhất, thường để phân tích đoạn ADN kích thước vài trăm bp Còn gel agarose có khả phân tách thấp phân đoạn ADN kích thước nhỏ, hiệu phân tách phân đoạn ADN kích thước lớn tới hàng chục hàng trăm kb (1 kb = 1000 bp) Các phân đoạn ADN kích thước lớn “lọt” qua lỗ có kích thước nhỏ gel, kể gel agarose Thay vào đó, chúng “trườn” qua mạng lưới gel việc đầu phân tử trước, đầu theo sau Kết phân đoạn ADN kích thước lớn (từ 30 đến 50 kb) có tốc độ di chuyển điện trường gần 1/27 Phân tích gen sản phẩm gen tương đương khó phân tách phương pháp điện di thông thường Đối với phân đoạn ADN kích thước lớn vậy, người ta phân tách việc sử dụng phương pháp điện di xung trường (pulsed-field gel electrophoresis) Trong phương pháp này, người ta sử dụng cặp điện cực nằm chéo góc điện di (hình 9) Việc “bật” “tắt” luân phiên cặp điện cực làm cho phân đoạn ADN lớn thay đổi chiều di chuyển họa hình vẽ Các phân đoạn ADN có kích thước lớn chậm trình thay đổi chiều di chuyển Nhờ vậy, phân đoạn có kích thước khác phân tách khỏi trình di chuyển Kỹ thuật điện di xung trường thực tế sử dụng để xác định kích thước đầy đủ nhiễm sắc thể vi khuẩn, nhiễm sắc thể loài sinh vật nhân chuẩn bậc thấp, nấm men Những loài có kích thước hệ gen khoảng vài Mb Điện di phân tách phân đoạn ADN khác kích thước mà hình dạng cấu hình không gian chúng Các phân tử ADN dạng mạch vòng giãn xoắn bị “đứt gãy” số nucleotit di chuyển chậm trường điện di so với phân tử ADN dạng mạch thẳng có khối lượng Tương tự vậy, phân tử ADN dạng siêu xoắn, kích thước thể tích thu nhỏ thường di chuyển nhanh trường điện di so với phân tử ADN dạng mạch vòng giãn xoắn có mức độ cuộn xoắn thấp có khối lượng Kỹ thuật điện di sử dụng để phân tách phân tử ARN Các phân đoạn ADN sợi kép mạch thẳng có cấu trúc bậc hai đồng nên tốc độ di chuyển trường điện di tương quan tỉ lệ thuận với khối lượng phân tử chúng Cũng giống ADN, phân tử ARN thường tích điện âm, cấu trúc dạng mạch đơn, cấu trúc bậc phân tử ARN có ảnh hưởng đến tốc độ di chuyển chúng trường điện di Để hạn chế điều này, thông thường người ta phải xử lý ARN với số hóa chất ngăn cản hình thành liên kết cục phân tử ARN, chẳng hạn glyoxal Hợp chất liên kết với nhóm -NH2 bazơ nitơ ngăn cản kết cặp nucleotit Các phân tử ARN xử lý glyoxal không hình thành cấu trúc bậc có tốc độ di chuyển trường điện di dường đơn phụ thuộc vào khối lượng phân tử chúng Sử dụng enzym giới hạn phân tích ADN Hầu hết phân tử ADN tự nhiên lớn nhiều so với kích thước thao tác phân tích cách thuận lợi phòng thí nghiệm Trong tế bào, phần lớn nhiễm sắc thể thường phân tử ADN dài chứa hàng trăm trí hàng nghìn gen khác Vì vậy, để phân lập phân tích gen, người ta phải cắt phân tử ADN kích thước lớn thành phân đoạn nhỏ Công việc thực nhóm enzym đặc biệt gọi enzym giới hạn Tất enzym giới hạn có hai đặc tính: 1) nhận biết trình tự đặc hiệu phân tử ADN (gọi trình tự giới hạn); 2) cắt bên phân tử ADN vị trí đặc 2/27 Phân tích gen sản phẩm gen hiệu (hoặc vị trí giới hạn nhóm enzym giới hạn loại II; cách vị trí giới hạn số nucleotit định nhóm enzym giới hạn thuộc nhóm I III) Trong nhóm enzym giới hạn, nhóm thường dùng nghiên cứu di truyền phân tử kỹ nghệ gen nhóm II nhờ vị trí trình tự cắt chúng xác định rõ Trong phạm vi giáo trình này, đề cập đến việc ứng dụng nhóm enzym giới hạn Các trình tự giới hạn enzym nhóm II thường gồm - bp, thông thường có tính đối xứng vị trí cắt thường nằm trình tự giới hạn Ví dụ enzym giới hạn EcoRI tìm thấy vi khuẩn E coli có trình tự giới hạn 5’-GAATTC-3’ với vị trí cắt G A Tên enzym gồm ký tự đầu tên loài vi khuẩn mà từ enzym tìm thấy (Eco = Escherichiacoli), ký tự sau tên chủng vi khuẩn số thứ tự enzym tìm thấy loài vi khuẩn (EcoRI enzym giới hạn tìm thấy E coli) Một enzym giới hạn có trình tự giới hạn gồm bp giống EcoRI thông thường trông đợi có trung bình vị trí cắt đoạn trình tự có kích thước khoảng kb (bởi theo nguyên tắc xác suất vị trí định xác suất để có loại nucleotit định 1/4, xác suất để có trình tự định gồm bp 1/46 = 1/ 4096) Giả sử có phân tử ADN mạch thẳng có vị trí cắt enzym EcoRI Việc cắt phân tử ADN EcoRI cho phân đoạn ADN khác Do đó, điện di gel sản phẩm cắt, phân đoạn ADN phân tách chúng khác khối lượng (vì chúng khác thành phần trình tự nucleotit) Như vậy, phân đoạn ADN tương ứng với vùng phân tử ADN ban đầu Việc sử dụng enzym giới hạn khác, chẳng hạn HindIII có trình tự giới hạn gồm bp, có trình tự giới hạn thay đổi (5’-AAGCTT-3’) cho sản phẩm cắt khác với sử dụng EcoRI (với phân tử ADN ban đầu) Như vậy, việc sử dụng đồng thời nhiều enzym giới hạn tạo kiểu hình phổ điện di phân đoạn cắt giới hạn đặc thù gen phân tích Đối với số enzym giới hạn khác, chẳng hạn Sau3A1 (tìm thấy vi khuẩn Staphylococcusaureus) có trình tự giới hạn ngắn (5’-GATC-3’), nên tần số cắt chúng thường cao enzym có trình tự giới hạn dài Theo xác suất, Sau3A1 có trung bình vị trí cắt đoạn trình tự khoảng 250 bp (1/44 = 1/256) Ngược lại, enzym NotI có trình tự giới hạn dài (5’-GCGGCCGC-3’) trung bình đoạn trình tự dài khoảng 65 kb, có vị trí cắt (1/48 = 1/65536) Các enzym giới hạn không khác trình tự giới hạn độ dài đoạn trình tự giới hạn đặc trưng chúng, mà chúng khác cách “cắt” phân tử ADN Chẳng hạn enzym HpaI tạo phân tử ADN dạng đầu (đầu tù), enzym EcoRI, HindIII PstI cắt phân tử ADN tạo phân đoạn có đầu dính Sở dĩ gọi “đầu dính” phần trình tự hai đầu sau enzym cắt bổ trợ với theo nguyên tắc Chargaff chúng có xu hướng “dính” trở lại với nhau, với 3/27 Phân tích gen sản phẩm gen phân tử ADN cắt loại enzym giới hạn Tính chất ứng dụng rộng rãi công nghệ ADN tái tổ hợp kỹ thuật tách dòng phân tử Các phương pháp lai phân tử mẫu dò Các phân tử ADN sợi kép có tính chất đặc biệt khả biến tính (phân tách thành hai mạch đơn) hồi tính (hai mạch đơn có trình tự bổ trợ có xu hướng liên kết trở lại vắng mặt tác nhân gây biến tính) Khả liên kết bổ trợ bazơ nitơ cho phép hai mạch ADN có nguồn gốc khác có trình tự bổ trợ liên kết với điều kiện phù hợp (về nhiệt độ, độ pH, ion hóa …) để tạo nên phân tử ADN Hiện tượng liên kết xảy hai mạch ADN với nhau, hai mạch ARN ADN ARN Phân tử axit nucleic sợi kép hình thành gọi phân tử lai trình kết cặp bazơ thuộc hai mạch đơn axit nucleic có nguồn gốc khác theo nguyên tắc bổ trợ gọi trình lai phân tử Nhiều kỹ thuật nghiên cứu di truyền phân tử dựa nguyên tắc lai phân tử Chẳng hạn, nguyên tắc người ta dùng trình tự ADN biết trước để xác định trình tự bổ trợ tương ứng có hệ gen mẫu phân tích Phân đoạn ADN có trình tự biết trước dùng phản ứng lai gọi mẫu dò Các mẫu dò có nguồn gốc từ phân đoạn ADN tự nhiên tổng hợp theo nguyên tắc hóa học, để nhận biết chúng, mẫu dò thường đánh dấu với chất phóng xạ phát huỳnh quang (ở đây, gọi tắt chất phát quang) Có hai phương pháp đánh dấu mẫu dò ADN Phương pháp thứ dùng nguyên tắc tổng hợp hóa học phân tử ADN với tiền chất phân tử đánh dấu Phương pháp thứ hai gắn phân tử đánh dấu vào đuôi trình tự ADN có sẵn Chẳng hạn, việc sử dụng enzym polynucleotide kinase, người ta bổ sung nhóm phosphat ? ATP vào nhóm 5’-OH phân tử ADN định đánh dấu Nếu nhóm phosphat đánh dấu đồng vị phóng xạ 32P phân tử ADN dánh dấu phóng xạ Phương pháp đánh dấu ADN thứ hai (sử dụng tiền chất đánh dấu) thường thực dựa phản ứng PCR, cần sử dụng đoạn mồi ngắn cho enzym ADN polymerase thực phản ứng kéo dài chuỗi Các tiền chất đánh dấu sử dụng thường loại nucleotit cải biến thành dạng đánh dấu cách gắn với nhóm chất phát quang nguyên tử phóng xạ Với phương pháp này, khoảng 25% nucleotit phân tử ADN đánh dấu điều đủ đáp ứng hầu hết nhu cầu nghiên cứu khác Các phân tử ADN đánh dấu với tiền chất phát quang phát cách chiếu xạ mẫu ADN với ánh sáng UV có bước sóng phù hợp đo bước sóng phát xạ tương ứng Các phân tử ADN đánh dấu phóng xạ thường phát cách chụp 4/27 Phân tích gen sản phẩm gen mẫu ADN với phim tia X, đo máy khuếch đại tín hiệu hạt β từ nguyên tố phóng xạ 32P 35S (đây hai nguyên tố phóng xạ sử dụng phổ biến để dánh dấu ADN) Trong nghiên cứu di truyền học phân tử nay, có nhiều cách để xác định phân đoạn ADN ARN đặc hiệu dựa phương pháp lai đây, đề cập đến hai phương pháp dùng phổ biến: Xác định phân đoạn ADN ARN điện di mẫu dò Phương pháp sử dụng mẫu dò kết hợp với điện di phương pháp giúp xác định mức độ phổ biến kích thước đoạn trình tự ADN hoăc ARN quan tâm nghiên cứu Chẳng hạn kỹ thuật này, người ta xác định so sánh mức biểu gen loại tế bào mô khác thông qua định lượng phiên mã mARN tương ứng gen tế bào mô tương ứng; hay để xác định kích thước đoạn ADN cắt giới hạn mang trình tự gen quan tâm nghiên cứu Giả sử cắt hệ gen nấm men enzym giới hạn EcoRI cần xác định kích thước phân đoạn ADN cắt giới hạn mang trình gen A Sản phẩm ADN tổng số sau cắt EcoRI tạo số lượng lớn phân đoạn có kích thước xấp xỉ kb (vì 46 = 4096 bp) Vì vậy, đem sản phẩm cắt giới hạn nhuộm với EtBr, sản phẩm điện di dải phân đoạn liên tục có kích thước xấp xỉ kb, xác định xác phân đoạn mang gen A Trong trường hợp đó, kỹ thuật thẩm tách Southern (còn gọi lai Southern) dùng để xác định phân đoạn mang gen Lúc này, người ta đem sản phẩm cắt giới hạn ngâm vào dung dịch có tính kiềm để làm biến tính phân đoạn ADN sợi kép Các phân đoạn sau chuyển sang màng tích điện dương gọi màng “thẩm tách” theo hình thức “đóng dấu” Nghĩa phân đoạn ADN định vị màng thẩm tách tương ứng với phân đoạn định vị gel điện di Các phân đoạn ADN gắn màng thẩm tách sau ủ với mẫu dò phân đoạn ADN chứa đoạn trình tự đặc trưng bổ trợ với trình tự gen A Quá trình ủ tiến hành điều kiện nhiệt độ nồng độ muối tương ứng với biến tính hồi tính axit nucleic Trong điều kiện đó, mẫu dò lai đặc hiệu với phân đoạn ADN mang gen A Do phân đoạn gen có kích thước thường lớn nhiều so với mẫu dò, nên khả hồi tính khó xảy khả lai với mẫu dò Sau đó, nhờ phương pháp phóng xạ tự chụp (mẫu dò đánh dấu phóng xạ), phân đoạn ADN bắt cặp với mẫu dò xác định phân lập rõ ràng Các phân đoạn phân đoạn mang trình tự gen A cần phân tích Một phương pháp tương tự áp dụng trực tiếp để phân tích sản phẩm phiên mã gen mARN, gọi phương pháp thẩm tách Northern (lai Northern) Tuy vậy, so với ADN phân tử mARN thường có kích 5/27 Phân tích gen sản phẩm gen thước ngắn (khoảng kb), nên thẩm tách Northern, phân tử mARN không cần cắt enzym giới hạn (nếu có cắt số vị trí cắt giới hạn enzym phân tử mARN thường thấp) Các phân tử mARN sau phân tách điện di chuyển lên màng tích điện dương lai với mẫu dò ADN có trình tự bổ trợ tương ứng thường đánh dấu phóng xạ (trong trường hợp này, sản phẩm lai kết cặp bazơ nitơ thuộc hai mạch ARN ADN có trình tự bổ trợ) Trong thực tiễn nghiên cứu, phương pháp thẩm tách Northern thường sử dụng để định lượng loại phân tử mARN định có mẫu phân tích, để xác định kích thước Lượng mARN xác định xem thông số phản ánh mức độ biểu gen mã hóa tương ứng Chẳng hạn như, phương pháp thẩm tách Northern, nhà nghiên cứu đánh giá ảnh hưởng tác nhân phiên mã đến biểu gen định tiến hành so sánh lượng mARN gen mã hóa có tế bào xử lý không xử lý với tác nhân phiên mã Tương tự vậy, kỹ thuật cho phép xác định so sánh mức độ biểu gen khác loại tế bào, mô quan khác thể giai đoạn giai đoạn khác trình phát triển thể Trong kỹ thuật thẩm tách Northern, mẫu dò thường đưa vào phản ứng lai với lượng dư vừa đủ để đảm bảo lượng phân tử lai tạo thành tương ứng với lượng mARN có mặt mẫu nghiên cứu Hay nói cách khác, qua lượng sản phẩm lai, định lượng lượng mARN Nguyên lý phương pháp lai Northern Southern sở kỹ thuật phân tích gen vi dãy phản ứng (microarray) phát triển ngày sử dụng rộng rãi nghiên cứu di truyền học phân tử gần Trong phương pháp microarray, mẫu dò thường đoạn cADN tạo từ việc phiên mã ngược phân tử mARN tương ứng tách chiết từ mô tế bào Các mẫu dò sau tiến hành lai với dãy phân tử ADN, dãy thường liên quan đến gen khác thể sinh vật nghiên cứu Cường độ biểu hiệu sản phẩm lai (nhờ có mặt phân tử đánh dấu) dãy khác góp phần phản ánh mức độ biểu khác gen phân tích Tách dòng phân tử xây dựng thư viện hệ gen Khái niệm tách dòng phân tử thư viện hệ gen Tách dòng phân tử (molecular cloning) khái niệm nhóm phương pháp sử dụng để: i) phân lập một trình tự gen (ADN) đặc hiệu từ hỗn hợp phân tử ADN ban đầu tách chiết từ mẫu sinh học vốn có cấu trúc phức tạp, kích 6/27 Phân tích gen sản phẩm gen thước lớn; ii) khuếch đại (sao chép) trình tự lên số lượng lớn đủ để tiến hành phân tích cấu trúc chức gen tương ứng Khả tinh đoạn gen (ADN) đặc hiệu có số lượng đủ lớn cần thiết để “thao tác” đoạn gen mục tiêu nghiên cứu khác Chẳng hạn, từ phân đoạn ADN tách dòng, người ta tạo phân tử ADN tái tổ hợp mang phân đoạn ADN mang nguồn gốc khác Các phân tử ADN tái tổ hợp làm thay đổi mức độ biểu bình thường gen (chẳng hạn việc dung hợp trình tự mã hóa loài với trình tự promoter loài khác) chí mã hóa tổng hợp loại protein “dung hợp” (protein lai) mang trình tự axit amin từ protein có nguồn gốc khác Hiện nay, kỹ thuật tách dòng phân tử (bao gồm PCR) trở thành công cụ thiết yếu nghiên cứu điều hòa biểu gen hệ gen loài sinh vật khác Quá trình tách dòng ADN tạo nên phân tử ADN tái tổ hợp điển hình thường liên quan đến việc sử dụng véctơ trình tự mang thông tin điều khiển hoạt động nhân lên (khuếch đại) và/hoặc biểu tế bào phân tử ADN tái tổ hợp mang đoạn ADN cài (đoạn trình tự phân lập) bao gồm trình tự gen quan tâm nghiên cứu Các “công cụ” để tạo nên phân tử ADN tái tổ hợp enzym giới hạn giúp cắt phân tử ADN vị trí xác định enzym nối cho phép ghép nối phân đoạn ADN có nguồn gốc khác với Bằng việc tạo nên phân tử ADN tái tổ hợp tự nhận lên tế bào chủ, đoạn ADN cài xác định phân lập, tinh nhân lên thành số lượng lớn Tiếp theo đây, mô tả cách phân tử ADN cắt, tái tổ hợp nhân lên, đồng thời đề cập đến việc xây dựng thư viện hệ gen gồm tập hợp phân tử ADN lai chứa đoạn cài xuất phát từ hệ gen cần thiết lập để phục vụ cho việc nghiên cứu, phân tích hệ gen Thông thường thư viện hệ gen thiết lập việc sử dụng chung loại véctơ mang phân đoạn ADN cài khác Chúng ta thấy cách phân đoạn ADN đặc hiệu xác định phân lập từ thư viện hệ gen Tách dòng ADN véctơ plasmit Sau phân đoạn ADN cắt khỏi phân tử ADN có kích thước lớn enzym giới hạn, phân đoạn ADN cần “cài” vào véctơ để nhân lên Hay nói cách khác phân đoạn ADN cần cài vào phân tử ADN thứ hai (véctơ) để nhân lên tế bào chủ nói Cho đến nay, tế bào chủ sử dụng rộng rãi để nhân lên đoạn ADN công nghệ ADN tái tổ hợp vi khuẩn E coli Các véctơ ADN điển hình thường có đặc tính: 7/27 Phân tích gen sản phẩm gen Chúng phải chứa trình tự khởi đầu chép (tái bản), cho phép chúng tự chép độc lập với nhiễm sắc thể tế bào chủ Chúng phải mang dấu chuẩn chọn lọc cho phép dễ dàng xác định phân lập tế bào mang véctơ tái tổ hợp (mang đoạn ADN cài) với tế bào không mang véctơ tái tổ hợp Có vị trí cắt nhiều enzym giới hạn khác Đây vị trí cài phân đoạn ADN cần tách dòng vào véctơ Véctơ tách dòng phổ biến phân tử ADN sợi kép, mạch vòng kích thước nhỏ (khoảng kb) gọi plasmit Các véctơ phần lớn có nguồn gốc từ loài vi khuẩn số từ sinh vật nhân chuẩn đơn bào (nấm men) Trong nhiều trường hợp, phân tử ADN tự nhiên mang sẵn gen mã hóa tính kháng chất kháng sinh Như vậy, plasmid tự nhiên có sẵn hai thuộc tính là: khả tự chép tế bào chủ có trình tự dấu chuẩn chọn lọc Ngoài ra, véctơ plasmit ưu điểm chúng đồng thời tồn nhiều tế bào Điều giúp khuếch đại phân lập số lượng lớn phân đoạn ADN từ quần thể tế bào nhỏ Trước đây, số véctơ plasmit có vị trí cắt enzym giới hạn Cùng với thời gian, cấu trúc véctơ plasmit cải tiến theo hướng cắt bỏ bớt trình tự không cần thiết gắn thêm vào đoạn trình tự cắt nhiều loại enzym giới hạn khác Vị trí véctơ mang đoạn trình tự gọi vị trí đa tách dòng (polycloning site) Có vị trí đa tách dòng có kích thước ngắn cắt 20 loại enzym giới hạn khác Nhờ đặc tính này, véctơ dùng để tách dòng nhiều phân đoạn ADN có nguồn gốc khác Trên sở nguyên tắc tương tự, véctơ plasmit, người ta phát triển nhiều loại véctơ khác có nguồn gốc phagơ, lai vi khuẩn - phagơ (như phagemid, cosmid …), có nguồn gốc từ nấm men (ví dụ: YAC) Việc cài phân đoạn ADN vào véctơ thường công việc tương đối đơn giản Người ta thường sử dụng loại enzym giới hạn để cắt véctơ đoạn ADN cài Chẳng hạn việc sử dụng enzym EcoRI cắt chuyển véctơ từ dạng “vòng” sang dạng “mạch thẳng” có hai đầu dính Do cắt enzym giới hạn, nên đoạn ADN cài có hai đầu dính với trình tự bổ trợ với trình tự đầu dính véctơ Các đầu dính liên kết véctơ đoạn ADN cài lại với hình thành nên phân tử ADN mạch vòng (phân tử ADN tái tổ hợp) thiếu hai liên kết phosphodieste lại mạch Hai liên kết “hàn” kín nhờ sử dụng enzym ADN ligase có mặt ATP Để hạn chế khả gắn kết lại hai đầu dính véctơ (vì hai đầu dính có trình tự bổ trợ) sau cắt enzym giới hạn, người ta thường cho lượng ADN cài dư thừa so với véctơ để phần lớn véctơ sau gắn lại véctơ tái tổ hợp mang đoạn ADN cài 8/27 Phân tích gen sản phẩm gen Một số loại véctơ cho phép phân lập tinh phân đoạn gen đó, mà điều hòa biểu gen nằm phân đoạn ADN cài Những véctơ gọi véctơ biểu Các véctơ thường phải chứa trình tự promoter nằm ngược dòng sát với vị trí cài gen Nếu vùng mã hóa gen (không chứa promoter) gắn vào véctơ theo chiều khung đọc gen, gen cài phiên mã thành mARN dịch mã thành protein tế bào chủ Các véctơ biểu thường sử dụng để biểu gen đột biến gen lai để tiến hành phân tích chức chúng Chúng dùng để sản xuất lượng lớn loại protein vốn không thu hiệu suất tương tự đường tự nhiên Ngoài ra, promoter véctơ biểu lựa chọn cho biểu gen cài điều hòa việc bổ sung hợp chất đơn giản vào môi trường nuôi cấy (như loại đường axit amin chẳng hạn) Việc điều khiển chủ động biểu gen có ý nghĩa quan trọng, đặc biệt gen gây độc Biến nạp véctơ ADN vào tế bào chủ Biến nạp trình thể chủ tiếp nhận phân tử ADN ngoại lai từ môi trường bên Một số vi khuẩn (trong E coli) có khả biến nạp tự nhiên gọi vi khuẩn khả biến di truyền Vi khuẩn E coli trở nên khả biến xử lý với ion Ca2+ Mặc dù chế khả biến chưa biết đầy đủ, dường ion Ca2+ bao bọc lại điện tích âm phân tử ADN tăng cường khả chúng xuyên qua màng tế bào Các tế bào xử lý với Ca2+ gọi tế bào khả biến Người ta sử dụng chất kháng sinh mà véctơ plasmid mang gen dấu chuẩn mã hóa tính kháng chất kháng sinh để chọn lọc thể mang plasmid tái tổ hợp Các tế bào mang véctơ tái tổ hợp sinh trưởng môi trường chứa chất kháng sinh, tế bào khác không Thông thường trình biến nạp có hiệu suất không cao Chỉ có tỉ lệ nhỏ tế bào xử lý biến nạp tiếp nhận plasmid tái tổ hợp Nhưng, hiệu biến nạp thấp giúp hầu hết tế bào mang véctơ tái tổ hợp thường tiếp nhận plasmid Thuộc tính giúp cho tế bào biến nạp dòng tế bào chúng sinh (do phân chia trực phân) mang véctơ ADN tái tổ hợp cho phép nhà nghiên cứu thể phân lập tinh gen hoặc sản phẩm gen riêng rẽ từ hỗn hợp biến nạp mang phân tử ADN khác Thiết lập thư viện hệ gen Đối với hệ gen đơn giản, kỹ thuật tách dòng thường đơn giản Chẳng hạn với hệ gen số virut có kích thước khoảng 10 kb, người ta trực tiếp tách chiết ADN, cắt chúng enzym giới hạn tiến hành phân tích điện di Các phân đoạn ADN tách biệt gel điện di cắt khỏi gel, tinh cài vào véctơ 9/27 Phân tích gen sản phẩm gen Trong đó, hệ gen phức tạp, kích thước lớn (như hệ gen người), việc cắt ADN tổng số enzym giới hạn phân tích điện di thường dẫn đến hình thành dải băng điện di liên tục có phân bố liên tục phân đoạn ADN cắt giới hạn khác một vài nucleotit Vì vậy, để đơn giản hóa quy trình tách dòng hệ gen này, người ta thường tiến hành biến nạp toàn phân đoạn ADN (thu sau cắt enzym giới hạn) vào véctơ tách dòng biến nạp tất chúng vào tế bào chủ, sau phân lập dòng tế bào mang véctơ tái tổ hợp có đoạn cài ADN khác Tập hợp dòng tế bào gọi thư viện hệ gen Như vậy, thư viện hệ gen tập hợp dòng tế bào mang véctơ tái tổ hợp chứa đoạn ADN cài khác có nguồn gốc (cùng hệ gen) Để thiết lập thư viện gen, hệ gen tế bào đích (chẳng hạn ADN hệ gen người) cắt enzym giới hạn để tạo phân đoạn ADN có kích thước trung bình mong muốn Kích thước phân đoạn (đoạn cài) dao động từ 100 bp đến Mb (đối với phân đoạn ADN kích thước lớn, phân tử ADN thường cắt không hoàn toàn enzym giới hạn) Các phân đoạn ADN cắt giới hạn sau “trộn” với loại véctơ phù hợp (trước cắt loại enzym giới hạn) ADN ligase Kết bước tạo tập hợp véctơ mang đoạn ADN cài khác Người ta tạo nhiều thư viện gen khác bắt nguồn từ nguồn vật liệu khác Thư viện hệ gen đơn giản bắt nguồn từ ADN hệ gen tổng số cắt enzym giới hạn nhất, gọi thư viện hệ gen Loại thư viện có ý nghĩa ứng dụng rõ rệt nhằm giải mã trình tự hệ gen Ngược lại, mục đích tìm phân lập phân đoạn mang gen mong muốn, thư viện hệ gen tỏ hiệu hệ gen chứa phần tương đối nhỏ vùng không mã hóa Đối với hệ gen phức tạp hơn, thư viện hệ gen không phù hợp cho việc tìm phân đoạn mang gen mong muốn phần lớn dòng thư viện mang đoạn cài thuộc vùng không mã hóa Để có thư viện gen mang hầu hết đoạn cài vùng mã hóa, người ta sử dụng thư viện cADN Các bước thiết lập thư viện cADN minh họa hình 10 Theo đó, bước thay ADN, người ta phiên mã ngược trình tự mARN thành trình tự ADN phiên (cADN) Quá trình gọi trình phiên mã ngược thực nhờ enzym ADN polymerase đặc biệt reverse transcriptase Enzym có khả tổng hợp ADN bắt nguồn từ phân tử ARN mạch đơn làm khuôn ban đầu Khi có mặt enzym reverse transcriptase, trình tự mARN phiên mã ngược thành phân tử ADN sợi kép, phân tử gắn vào véctơ Để phân lập đoạn cài riêng rẽ từ thư viện hệ gen, tế bào E coli tiến hành biến nạp với tất phân đoạn thư viện Mỗi tế bào biến nạp thường mang véctơ mang đoạn cài ADN Vì vậy, tế bào nhân 10/27 Phân tích gen sản phẩm gen tự ADN, nghiên cứu tạo đột biến điểm xác định vị trí, hay sử dụng cho công nghệ ADN tái tổ hợp Phản ứng PCR Ngoài kỹ thuật tách dòng khuếch đại gen sử dụng loại tế bào chủ, phương pháp khuếch đại gen có hiệu cao trở thành kỹ thuật phổ biến hầu hết nghiên cứu di truyền học phân tử kỹ thuật phản ứng chuỗi trùng hợp PCR (polymerase chain reaction) Đây kỹ thuật hóa sinh invitro túy Kỹ thuật PCR sử dụng enzym ADN polymerase để tổng hợp nên phân tử ADN từ trình tự phân tử ADN làm khuôn với tiền chất deoxyribonucleotit Như nêu Chương 2, enzym ADN polymerase tổng hợp ADN theo chiều 5’→ 3’ xúc tác gắn nucleotit vào phía đầu 3’ trình tự oligonucleotit có sẵn Nghĩa là, ta có đoạn trình tự oligonucleotit gắn vào mạch ADN làm khuôn có trình tự bổ sung với trình tự đoạn oligonucleotit, enzym ADN polymerase sử dụng đoạn oligonucleotit làm đoạn mồi tiếp tục kéo dài chuỗi ADN phía đầu 3’ dựa trình tự mạch ADN làm khuôn Vậy, cách người ta sử dụng phản ứng PCR enzym ADN polymerase để khuếch đại đoạn trình tự ADN đặc hiệu? Người ta tổng hợp sử dụng hai đoạn oligonuleotit Đoạn thứ có trình tự bổ sung với đầu 5’ mạch phân đoạn ADN cần khuếch đại (đoạn gọi mồi xuôi), đoạn trình tự thứ hai bổ sung với đầu 5’ mạch đối diện (mồi ngược) Phân tử ADN làm khuôn làm biến tính (bởi nhiệt) mồi xuôi môi ngược gắn vào trình tự bổ sung hai đầu đoạn ADN cần khuếch đại Với có mặt chất deoxyribonucleotit, enzym ADN polymerase tổng hợp kéo dài mạch phân tử ADN hai đoạn mồi Trong chu kỳ tiếp theo, phân tử ADN lại gây biến tính trình tổng hợp ADN lặp lại với cặp mồi Kết chu kỳ thứ hai tạo phân đoạn gen mong muốn Theo chế đó, chu kỳ biến tính tổng hợp ADN diễn lặp lặp lại làm khuếch đại phân đoạn ADN nằm trình tự mồi theo cấp số nhân (số tương ứng qua chu kỳ 2, 4, 8, 16, 32, 64, v.v…) Như vậy, cần từ ADN có mặt lượng mẫu nhỏ, thu lượng lớn xuất phát từ Xét khía cạnh đó, kỹ thuật tách dòng ADN PCR dùng để khuếch đại phân đoạn ADN đặc thù lên số lượng lớn Nhưng điểm khác biệt chỗ, kỹ thuật tách dòng, thường sử dụng hóa chất chọn lọc hay thiết bị để định vị trình tự ADN khuếch đại thư viện ADN có sẵn gồm nhiều dòng tế bào khác nhau, kỹ thuật PCR, hóa chất chọn lọc cặp mồi giúp hạn chế phản ứng khuếch đại tập trung vào đoạn ADN quan tâm từ đầu 13/27 Phân tích gen sản phẩm gen Giải mã trình tự ADN Trong phần xem xét cách xác định trình tự nucleotit phân đoạn toàn phân tử ADN mong muốn Về khía cạnh đó, coi giải mã trình tự nucleotit việc đánh dấu mẫu dò triệt để hệ gen với tính chọn lọc cao Chúng ta xác định toàn trình tự hệ gen thể sinh vật có mức độ cấu tạo phức tạp khác từ vi khuẩn loài người, điều cho phép tìm thấy trình tự đặc hiệu cách nhanh xác thông qua việc sử dụng phần mềm máy tính với thuật toán phù hợp Hay nói cách khác, “các chất chọn lọc” chuỗi bazơ nitơ nhập vào phần mềm máy tính Do sở liệu hệ gen ngày trở nên phong phú, nên ngày trở nên dễ dàng để tìm thấy trình tự hệ gen trình tự có liên quan loài loài khác Rõ ràng, việc giải mã trình tự nucleotit tạo sở liệu khổng lồ phục vụ cho nghiên cứu giải mã trình tự so sánh hệ gen đề cập Nguyên tắc giải mã trình tự ADN dựa việc phân tách phân đoạn ADN có kích thước khác giới hạn hai đầu Các phân tử ADN giống phần đầu 5’, kết thúc phía đầu 3’ có nucleotit khác Các thành viên nhóm có nucleotit phía đầu 3’ giống Như vậy, nhóm bao gồm tất phân tử ADN tận đầu 3’ G, nhóm khác tương ứng A, C T Trong nhóm phân tử có kích thước khác phụ thuộc vào vị trí nucleotit tương ứng (ví dụ G) nằm phân tử ADN Các phân đoạn khác biệt chiều dài phân tách nhờ sử dụng kỹ thuật điện di gel polyacrylamid Chẳng hạn chạy hỗn hợp phân tử ADN tận đầu G ta thu thang băng điện di tương ứng với phân đoạn, băng tương ứng với phân đoạn có chiều dài phản ánh vị trí nucleotit G phân tử ADN… Giải mã trình tự hệ gen vi khuẩn kỹ thuật shotgun (“giải mã đoạn ngẫu nhiên”) Vi khuẩn gây bệnh kiết lị người Hemophilus influenza loài sinh vật giải mã toàn hệ gen Sở dĩ hệ gen loài hoàn thành việc giải mã nhờ hệ gen nhỏ, chứa phân tử ADN kích thước 1,8 Mb Hệ gen vi khuẩn “cắt” thành phân đoạn nhỏ có kích thước trung bình khoảng kb Các đoạn ADN hệ gen sau tách dòng véctơ ADN plasmit tái tổ hợp ADN từ dòng vi khuẩn chứa phân đoạn ADN tái tổ hợp riêng rẽ giải mã trình tự riêng rẽ máy giải mã trình tự tự động sử dụng phương pháp ddNTP mô tả phần Phương pháp gọi phương pháp giải mã trình tự kiểu “shotgun” (bắn ngẫu nhiên) Các khuẩn lạc mang véctơ tơ tái tổ hợp mang đoạn ADN cài ngẫu nhiên phân lập, xử lý giải mã trình tự Để chắn nucleotit hệ gen vi khuẩn có mặt dòng vi khuẩn thư viện hệ gen, tổng cộng có khoảng 30.000 - 40.000 dòng tái tổ hợp khác 14/27 Phân tích gen sản phẩm gen sử dụng giải mã trình tự Từ đó, tạo khoảng 20 Mb liệu thô hệ gen (các phản ứng tạo trình tự có kích thước trung bình 600 bp, 20 Mb = 600 bp x 33.000 dòng vi khuẩn) Dữ liệu gọi vùng trình tự 10x Bởi vì, nucleotit hệ gen đọc lặp lại khoảng 10 lần Phương pháp dường tốn nhiều công sức, chi phí rẻ nhanh so với phương pháp truyền thống khác Một phương pháp giải mã trình tự trước dựa nguyên tắc giải mã phân đoạn ADN cắt giới hạn đồ vật lý nhiễm sắc thể vi khuẩn Một hạn chế kỹ thuật hầu hết phân đoạn cắt giới hạn có kích thước lớn kích thước giải mã trình tự hoàn toàn phản ứng thực Do vậy, để giải mã toàn hệ gen, người ta phải tiến hành cắt giới hạn, lập đồ giải mã trình tự nhiều lần Các bước lặp lặp lại nhiều lần tồn nhiều thời gian sử dụng phương pháp giải mã trình tự tự động phân đoạn ADN ngẫu nhiên Hay nói cách khác, nhờ sử dụng phần mềm máy tính việc xếp lại phân đoạn ADN ngẫu nhiên nhanh nhiều việc lập đồ phân đoạn cắt giới hạn NST vi khuẩn Khoảng 30.000 đoạn trình tự ADN giải mã trình tự ngẫu nhiên trực tiếp nhập vào phần mềm máy tính Nhiều phần mềm máy tính chuyên dụng xếp đoạn trình tự theo thứ tự dựa trình tự gối lên chúng Sự “lắp ráp” thành trình tự phân đoạn ADN ngắn cuối có trình tự liên tục nhất, gọi contig Kỹ thuật giải mã trình tự kiểu shotgun cho phép “ráp nối” phần hệ gen lớn Như trình bày việc giải mã đoạn trình tự ADN kích thước khoảng 600 bp thực cách tương đối đơn giản nhanh chóng đây, xem cách kỹ thuật “shortgun” áp dụng để giải mã trình tự hệ gen lớn Chẳng hạn, nhiễm sắc thể người có kích thước trung bình khoảng 150Mb Do vậy, đoạn trình tự ~600 bp giải mã chiếm 0,0004% NST Kết để xác định trình tự đầy đủ NST, người ta cần tạo số lượng lớn liệu trình tự từ nhiều phân đoạn ADN ngắn (hình 12) Các phân đoạn ADN nhỏ tạo từ 23 NST hệ gen người, sau cắt ngắn thành thư viện đoạn ADN nhỏ kỹ thuật “kim áp lực” Thông thường, có thư viện hệ gen chứa đoạn trình tự có kích thước khác (tăng dần) tạo ra, chẳng hạn tương ứng với đoạn trình tự có kích thước 1, 100 kb Các phân đoạn sau tách dòng ngẫu nhiên vào plasmit vi khuẩn theo phương pháp mô tả Các phân tử ADN tái tổ hợp mang phân đoạn ngẫu nhiên NST người sau phân lập từ plasmit vi khuẩn giải mã máy giải mã trình tự tự động Để 15/27 Phân tích gen sản phẩm gen đảm bảo nucleotit hệ gen giải mã, người ta phải tiến hành giải mã riêng rẽ khoảng triệu phân đoạn ADN khác Với kích thước phân đoạn giải mã xác khoảng 600 bp, quy trình tạo liệu khoảng tỉ bp, hay nói khác gấp ~10 lần kích thước trung bình NST Như trình bày với kỹ thuật giải mã trình tự vi khuẩn, việc phân tích mẫu với lượng trình tự gấp khoảng 10 lần lượng ADN thực cần giải mã trình tự đảm bảo phần NST phân tích Quá trình tạo thư viện tái tổ hợp mang trình tự ngẫu nhiên lượng lớn ADN cần phải giải mã trình tự ngẫu nhiên dường việc làm lãng phí Tuy vậy, với việc sử dụng hệ thống trăm máy giải mã trình tự tự động gồm 384 cột cho phép phân tích 10 lần nhiễm sắc thể người chi tiết vòng tuần Phương pháp nhanh nhiều phương pháp phân lập phần biết NST, sau giải mã trình tự tập hợp biết đoạn ADN đặt so le Vì vậy, chất công nghệ cốt lõi sử dụng để thúc đẩy việc giải mã hệ gen người dựa kĩ thuật giải mã trình tự ngẫu nhiên tự động, sau sử dụng phần mềm máy tính để xếp lại đoạn ADN khác giống trò chơi “ghép hình” Việc kết hợp sử dụng máy giải mã trình tự tự động với phần mềm máy tính giúp dự án giải mã toàn hệ gen người kết thúc sớm nhiều năm so với kế hoạch ban đầu Các chương trình máy tính phức tạp sử dụng để tập hợp đoạn ADN ngắn giải mã trình tự ngẫu nhiên thành đoạn trình tự dài kích thước lớn gọi contig Các đoạn trình tự nằm gối lên phần mềm xử lý nối lại với thành trình tự lớn Kích thước đoạn contig phụ thuộc vào lượng trình tự giải mã Nếu lượng trình tự giải mã nhiều, đoạn contig có kích thước lớn khoảng cách trống chưa giải mã nhỏ Thông thường đoạn contig riêng rẽ thường có kích thước 50.000 - 200.000 bp Nghĩa ngắn nhiều so với kích thước NST người Tuy vậy, đoạn contig hiệu phân tích hệ gen nhỏ Chẳng hạn, hệ gen ruồi dấm (Drosophila) trung bình có mật độ gen / 10 kb Vì vậy, contig điển hình thường chứa vài gen liên kết với Rất tiếc hệ gen lớn lại thường chứa mật độ gen thấp Hệ gen người có mật độ trung bình gen / 100 kb, contig điển hình thường không chứa trình tự trọn vẹn gen, chưa nói đến dãy gen liên kết Bây giờ, nói đến cách đoạn contig tương đối ngắn lắp ráp lại thành đoạn khung có kích thước 1-2Mb Phương pháp giải mã trình tự đầu cuối cho phép lắp ráp contig thành đoạn khung hệ gen kích thước lớn Một khó khăn lớn gặp phải thiết lập đoạn contig xuất đoạn ADN lặp lại Các đoạn trình tự làm việc ráp nối trở nên khó khăn phức tạp 16/27 Phân tích gen sản phẩm gen đoạn ADN không liên kết (từ NST khác nhau) bị xếp thành đoạn trình tự nằm gối lên chúng có trình tự lặp lại Một phương pháp sử dụng để khắc phục trở ngại kĩ thuật giải mã phần nối trình tự đầu cuối Kỹ thuật tương đối đơn giản hiệu mà mang lại cao Ngoài việc ADN hệ gen dùng để tạo nên thư viện đoạn ADN ngắn nhằm giải mã trình tự ngẫu nhiên, ADN hệ gen đồng thời dùng để tạo nên đoạn ADN tái tổ hợp mang đoạn có kích thước lớn, thường có kích thước 100 kb Giả sử có mẫu ADN từ NST người Một phần mẫu dùng để tạo nên phân đoạn có kích thước kb, phần khác dùng để tạo nên phân đoạn có kích thước kb Kết trình người ta thu thư viện hệ gen khác nhau, mang đoạn cài kích thước ngắn, thư viện đoạn cài kích thước lớn (hình 12) Tiếp theo, người ta sử dụng đoạn mồi “đa năng” (có tính chọn lọc thấp) gắn vào phần đoạn nối plasmit hai vùng biên đoạn ADN cài kích thước lớn Mỗi phản ứng giải mã trình tự cho phép tạo thông tin trình tự đoạn kích thước khoảng 600 bp hai đầu đoạn cài Một ghi nhớ ghi chép lại trình tự hai đầu phân đoạn kích thước lớn Việc dùng phần mềm sau cho thấy trình tự tìm thấy contig A, trình tự tìm thấy contig B Nếu contig A B có trình tự có mặt phân đoạn kích thước khoảng kb giả thiết chúng xuất xứ từ vùng NST Trong hầu hết phân đoạn ADN lặp lại thường có kích thước nhỏ 2-3 kb Vì vậy, đoạn trình tự ADN đầu cuối xuất xứ từ đoạn cài ~5kb đủ để nối contig bị ngắt quãng đoạn ADN có trình tự lặp lại Các nghiên cứu ban đầu thường tạo đoạn contig có kích thước nhỏ 500 kb Để thu liệu từ đoạn có trình tự dài, có kích thước vài Mb dài hơn, người ta cần liệu từ trình tự đầu cuối từ phân đoạn ADN lớn có kích thước 100 kb Các đoạn ADN thu từ véctơ tách dòng đặc biệt gọi nhiễm sắc thể nhân tạo vi khuẩn - BAC (bacterialartificialchromosome) Nguyên tắc đoạn dùng để tạo nên thông tin trình tự dài giống trường hợp sử dụng đoạn kb mô tả Các đoạn mồi dùng để xác định trình tự ~600kb hai đầu đoạn cài BAC Việc sử dụng BAC cho phép xếp nhiều đoạn contig khác vào đoạn khung có kích thước lớn tới vài Mb (hình 13) Chất lượng việc ráp nối hệ gen phép đo kích thước đoạn khung trung bình Những đoạn khung có kích thước từ Mb trở lên tìm thấy xem có kết ráp nối tốt Ví dụ như, loài cá bể dẹt (Tetraodontidae) có kích thước hệ gen 800 Mb, trình tự ráp nối toàn hệ gen gồm 500 đoạn khung khác nhau, đoạn khung có kích thước trung bình 1,6 Mb Một “hiệu quả” ráp nối cao tạo thuận lợi cho nhiều phân tích di truyền khác, chẳng hạn dễ dàng xác 17/27 Phân tích gen sản phẩm gen định tất vùng mã hóa hệ gen Đến năm 2000, kích thước trung bình đoạn khung xây dựng cho hệ gen người có kích thước Mb Điều đủ để tin cậy số gen ước lượng có hệ gen (xấp xỉ 30.000 gen) Phân tích mở rộng hệ gen Đối với hệ gen nhỏ vi khuẩn hay loài sinh vật nhân chuẩn đơn giản, việc xác định trình tự mã hóa protein thường ngoại suy trực tiếp từ kết giải mã trình tự, mà thực chất thông qua việc xác định ORF Mặc dù tất ORF (đặc biệt ORF ngắn) thực gen mã hóa protein, việc xác định thường hiệu quả, việc khó khăn thường việc xác định chức gen sản phẩm (protein) Việc xác định vùng mã hóa protein hệ gen loài động vật vốn phổ biến chứa cấu trúc exon - intron thực tế phức tạp nhiều Trong trường hợp này, người ta phải sử dụng “một loạt” công cụ tin sinh học để xác định gen thành phần di truyền hệ gen phức tạp Các chương trình máy tính lập trình để xác định vùng có tiềm mã hóa protein dựa số tiêu chí định, bao gồm xuất ORF chặn vị trí cắt hai đầu gần kề trình tự khởi đầu phiên mã (promoter) Tuy vậy, chương trình phân tích gen đến chưa hoàn thiện để khẳng định xác 100% Một tỉ lệ khoảng 3/4 số gen xác định phương pháp này, có nhiều gen bị bỏ sót; chí chi tiết gen, số trình tự exon bị bỏ sót Một hạn chế đáng kể chương trình tìm gen không xác định đầy đủ promoter Ví dụ promoter lõi điển hình động vật đa bào có kích thước khoảng 60 bp, chứa trình tự định dạng (motif), TATA, INR DPE, motif cần thiết cho gắn vào phức hệ khởi động TFIID phức hệ phiên mã enzym ARN Polymerase II Đáng tiếc trình tự yếu tố khởi đầu phiên mã lõi có mức độ biến đổi lớn Mặc dù phức hệ khởi đầu phiên mã tế bào đủ “thông minh” để xác định trình tự này, đến người chưa viết chương trình máy tính cho phép xác định đầy đủ promoter lõi dạng Tất nhiên, nhà sinh tin học tiếp tục hoàn thiện chương trình phần mềm để đến ngày xác định, phân tích tất thuộc tính gen nêu trên, bao gồm yếu tố promoter lõi, ORF, điểm cắt tái tổ hợp gen, v.v… để xác định đầy đủ gen mã hóa protein Phương pháp quan trọng để kiểm chứng gen mã hóa protein suy đoán xác định gen bị bỏ sót phần mềm máy tính sử dụng liệu cADN cADN tạo theo nguyên tắc phiên mã ngược từ phân tử mARN hoàn thiện, phản ánh trình tự exon thực Các phân tử cADN dùng để tạo sở 18/27 Phân tích gen sản phẩm gen liệu EST, hay gọi nhãn xác định trình tự biểu (expressedsequencetag), thực chất đoạn trình tự ngắn trích từ trình tự cADN biết Các trình tự cADN ngẫu nhiên (có thể trình tự đầy đủ hay trình tự phần EST) xác định sử dụng phương pháp giải mã trình tự ngẫu nhiên đối chiếu với đoạn khung hệ gen Các vùng tương ứng với EST xác định exon, vùng nằm exon tương ứng với intron (mặc dù, nguyên tắc cắt intron khác sử dụng exon mặt cADN hay EST giải mã trình tự) Các thông tin giải mã trình tự cADN EST giúp tìm liên kết contig, đoạn khung chúng với Chẳng hạn giả sử có phân tử cADN phiên mã từ gen kích thước lớn có chiều dài intron 100 kb Có hai đoạn khung chứa trình tự khác phân tử cADN chung này, nhiều khả chúng vùng liên kết hệ gen biểu đoạn gen Phân tích so sánh hệ gen Việc so sánh hệ gen loài động vật khác sở trực tiếp để đánh giá biến đổi cấu trúc gen trình tự chúng xuất trình tiến hóa Việc so sánh hệ gen đồng thời giúp khẳng định chắn vùng gen mã hóa protein hệ gen loài Ví dụ exon gen đồng tiến hóa có mức độ bảo thủ cao nhiều so với intron Việc so sánh hệ gen người chuột tìm thấy nhiều exon có tính bảo thủ cao Việc so sánh hệ gen đồng thời giúp xác định trình tự exon ngắn (hay tìm thấy phần đầu 5’ gen vùng promoter lõi) vốn thường bị sót xác định phần mềm máy tính Một khám phá bật phép phân tích so sánh hệ gen việc tìm phổ biến tính bảo thủ liên kết gen NST người chuột, bảo thủ tính liên kết gen NST phổ biến Trong nhiều trường hợp, tính bảo thủ tìm thấy loài xa trình tiến hóa, ví dụ loài cá bể dẹt có tổ tiên chung với loài động vật có vú từ 400 triệu năm trước Hiện tượng phổ biến bảo thủ tính liên kết nhiều gen cho thấy có nhiều khả gen “láng giềng” dùng chung trình tự điều hòa gen Một điều tra dùng phần mềm máy tính gần tìm thấy đoạn NST có kích thước 100 - 200 kb ruồi dấm Drosophila có 10 - 20 gen liên kết có hình thức điều hòa biểu giống hệt ruồi dấm có khoảng 500 - 1000 đoạn NST trì liên kết bảo thủ gen liên kết phụ thuộc vào trình tự điều hòa chung vùng NST Các trình tự mã hóa protein không vùng hệ gen giới hạn chức Các trình tự điều hòa (vị trí gắn yếu tố phiên mã yếu tố điều hòa hoạt động gen, yếu tố tăng cường enhancer) thường có tính bảo thủ cao Các trình tự thường xác định trình tự không mã hóa protein ngắn bảo thủ Ví dụ chương trình máy tính gọi VISTA (không phải hệ điều hành 19/27 Phân tích gen sản phẩm gen Microsoft) phân tích hệ gen nhiều loài khác tìm thấy bảo thủ ở tỉ lệ 70% đoạn trình tự phân tích 50 - 75 bp số trình tự ADN có vai trò điều hòa Hai loài cá bể dẹt chuột có khoảng 10.000 đoạn trình tự không mã hóa ngắn giống nhau, chúng trình tự tăng cường đặc trưng mô Tuy vậy, hai loài này, đặc biệt chuột, dường có nhiều trình tự điều hòa bị bỏ sót sử dụng phần mềm máy tính để phân tích trình tự gen Người ta xác định loài động vật bậc thấp Ciona intestialis có chứa khoảng 20.000 trình tự enhancer, ngạc nhiên người chuột có khoảng 50.000 - 100.000 trình tự enhancer hệ gen Các phương pháp sử dụng để xác định trình tự tăng cường dựa việc xác định vị trí liên kết yếu tố hoạt hóa ức chế phiên mã Việc xác định trình tự điều hòa phân tử ADN thách thức lớn so với việc xác định trình tự mã hóa protein trình tự điều hòa không bị hạn chế nguyên lý mã di truyền Vì vậy, dường việc phải phối hợp nhiều phương pháp sinh tin học chương trình máy tính cần thiết để xác định trình tự ADN điều hòa toàn hệ gen Công cụ phần mềm phân tích hệ gen sử dụng rộng rãi BLAST (basiclocalalignmenttool) Có số cải biến khác chương trình BLAST, tất chương trình có đặc điểm chung tìm vùng giống gen mã hoa protein khác Có nhiều cách để tìm liệu từ BLAST Một cách sử dụng công cụ tìm kiếm hệ gen hệ gen tất trình tự protein dự đoán trước gọi “querry sequence” Chẳng hạn ví dụ sau: gen eve mã hóa protein điều hòa phiên mã thiết yếu cho phân hóa tế bào phôi Drosophila Protein Eve có 376 axit amin Vùng chức protein nằm axit amin 71 - 130 Khi sử dụng trình tự 60 axit amin để tìm kiếm, kết cho thấy hệ gen Drosophila có 75 gen mã hóa chứa trình tự Như vậy, chương trình BLAST nhanh chóng xác định loạt gen có chức tương tự Một cách khác để khai thác sở liệu BLAST tra cứu theo trình tự nucleotit Chẳng hạn thí dụ trên, người ta sử dụng tương ứng trình tự 180 bp mã hóa cho hộp định loại gen (homeobox) Tóm lại, việc trình tự hệ gen đầy đủ loài khác ngày tăng lên cung cấp sở liệu ngày phong phú đầy đủ cho nghiên cứu hệ gen học so sánh Ngày có nhiều chương trình máy tính phát triển hoàn thiện để khai thác vốn thông tin di truyền ngày tạo đầy đủ qua chương trình giải mã ADN tự động 20/27 Phân tích gen sản phẩm gen Các kỹ thuật phân tích protein Chuẩn bị dịch chiết tế bào để tinh protein Việc phân lập tinh loại protein riêng rẽ có ý nghĩa định đến khả tìm hiểu chức chúng Mặc dù số trường hợp, nghiên cứu chức protein dạng hỗn hợp phức tạp, phần lớn nghiên cứu thường dẫn đến kết luận “mù mờ” Chẳng hạn nghiên cứu hoạt tính enzym ADN polymerase hỗn hợp protein thô (chẳng hạn từ dịch phân giải tế bào), enzym ADN polymerase protein thành phần khác ảnh hưởng đến hiệu suất tổng hợp ADN quan sát thực nghiệm Vì vậy, việc tinh protein bước quan trong trình tìm hiểu chức chúng Mỗi protein thường có số đặc tính riêng làm việc tinh chúng thường có tính đặc thù Điều trái ngược với ADN, vốn giống cấu trúc thành phần, khác trình tự nucleotit Các bước tinh loại protein thường dựa đặc tính đặc thù kích thước, hình dạng, điện tích nhiều chức chúng Vật liệu khởi đầu cho hầu hết trình tinh protein từ sinh vật dịch chiết tế bào Không giống ADN vốn có tính phục hồi cao điều kiện nhiệt độ sống khác nhau, protein dễ bị biến tính phá hủy sau bị giải phóng khỏi tế bào Vì lý này, hầu hết trình chuẩn bị dịch chiết tinh protein tiến hành nhiệt độ lạnh (4oC) Có số cách chuẩn bị dịch chiết tế bào Các tế bào phân giải sử dụng chất tẩy, lực làm vỡ thành tế bào, xử lý với dung dịch nhược trương (làm tế bào trương lên nước vào vỡ ra), thay đổi đột ngột áp suất Điểm chung tất phương pháp làm thành tế bào vỡ protein giải phóng Trong số trường hợp, tế bào chuyển trạng thái đông lạnh trước nghiền máy nghiền mẫu phòng thí nghiệm Sử dụng sắc ký cột tinh chế protein Phương pháp chiết xuất tinh protein phổ biến sắc ký cột Trong trường hợp này, phân đoạn protein cho chạy qua cột nhồi hạt agarose polyacrylamit nhỏ cải biến cho phù hợp Có số phương án khác việc sử dụng cột tách chiết tinh protein Các quy trình khác thiết lập khác đặc tính khác loại protein mô tả ba phương pháp Trong hai phương pháp đầu, protein phân lập dựa vào kích thước tính tích điện chúng Tóm tắt phương pháp nêu hình 14 Sắc ký trao đổi ion: Trong phương pháp này, phân tử protein phân lập dựa điện tích ion hóa bề mặt chúng việc sử dụng vật liệu làm cột hạt 21/27 Phân tích gen sản phẩm gen mang nhóm chức tích điện âm dương (đây gọi pha tĩnh) Các phân tử protein tương tác yếu với hạt (chẳng hạn phân tử protein tích điện dương cho chạy qua cột mang hạt tích điện âm) hồi lưu sử dụng dung dịch muỗi loãng chảy qua cột sau (dung dịch chạy mẫu gọi pha động) Các phân tử tương tác với pha động mạnh, cần dung dịch hàm lượng muối cao để hồi lưu mẫu (bởi muối làm “trung hòa” vùng mang điện tích cho phép phân tử protein giải phóng khỏi cột Bằng việc tăng dần nồng độ muối dung dịch đệm thu hồi mẫu, phân tử protein khác nhau, kể phân tử có đặc tính tích điện gần giống phân tách thành phân đoạn khác chúng hồi lưu từ cột Sắc ký lọc gel: Kỹ thuật cho phép phân tách loại protein cở sở đặc điểm khác loại protein hình dạng kích thước Khác với kỹ thuật sắc ký trao đổi ion, hạt sử dụng để nhồi cột kỹ thuật không mang nhóm tích điện mà thay vào mang lỗ có kích thước khác Các phân tử protein nhỏ có nhiều khả thâm nhập vào tất lỗ; vậy, thời gian chạy qua cột dài thời gian hồi lưu muộn Ngược lại, phân tử protein kích thước lớn có thời gian hồi lưu (chạy qua toàn cột) sớm Đối với loại cột, phân đoạn sắc ký thu nồng độ muối khác thời gian hồi lưu khác để thu loại protein quan tâm nghiên cứu Các phân đoạn có hoạt tính protein quan tâm cao tích lũy tiến hành tinh bổ sung Độ tinh sản phẩm protein tăng lên phân đoạn protein chạy qua nhiều cột sắc ký khác Thông thường cột sắc ký đơn lẻ không đủ để tinh loại phân tử protein mong muốn dù trình sắc ký lặp lặp lại nhiều lần, thay vào người ta thường phải áp dụng chuỗi bước kỹ thuật để thu phân đoạn chứa lượng lớn loại protein cần quan tâm nghiên cứu Chẳng hạn như, dù có nhiều phân tử protein hồi lưu dung dịch muối đậm đặc từ cột tích điện dương (đối với protein tích âm) hồi lưu sắc ký lọc gel (đối với protein kích thước tương đối nhỏ), kỹ thuật đơn lẻ thường không đủ để thu sản phẩm protein tinh hoàn toàn Sắc ký lực hỗ trợ trình tinh chế protein Các đặc tính đặc trưng loại protein tận dụng để giúp tinh loại protein tương ứng thuận tiện hiệu Giả sử, biết loại protein hoạt động liên kết đặc hiệu với ATP, dùng cột sắc ký mang vật liệu gắn kết ATP để phân tách protein Chỉ có protein liên kết với ATP cột giữ lại, cho phép hầu hết loại protein không liên kết với ATP chảy trôi qua cột Kỹ thuật tinh gọi sắc ký lực Có nhiều hợp chất khác sử dụng để gắn kết với cột giúp trình tinh protein dễ dàng hiệu 22/27 Phân tích gen sản phẩm gen Các hợp chất bao gồm trình tự ADN (để tinh protein liên kết ADN) trí loại protein để tinh loại protein khác biết mong đợi có tương tác phân tử với loại protein Như vậy, để bắt đầu tinh loại protein đó, cần phải có hiểu biết loại protein tìm cách khai thác, ứng dụng đặc tính có cho trình tách chiết tinh Một dạng phổ biến sắc ký lực sắc ký lực miễn dịch Trong phương pháp này, người ta gắn kháng thể đặc hiệu với protein đích lên vật liệu làm cột sắc ký Trong trường hợp lý tưởng, loại kháng thể liên kết với loại protein cần quan tâm cho phép tất loại protein khác chảy trôi qua cột Loại protein liên kết sau thu hồi (hồi lưu) cách sử dụng dung dịch muối dung dịch chất tẩy nhẹ chảy qua cột Khó khăn gặp phải phương pháp liên kết kháng thể protein bền vững đến mức phải gây biến tính protein thu hồi sản phẩm Trong khác với ADN, protein sau biến tính thường khả hồi tính, protein thu theo cách nhiều dạng không hoạt động chức giá trị sử dụng nghiên cứu Để tăng hiệu tinh sạch, protein cải biến Những cải biến bổ sung trình tự axit amin ngắn vào đầu C vào đầu N phân tử protein cần phân tích Những bổ sung này, hay gọi “trình tự đánh dấu” tạo công nghệ ADN tái tổ hợp Các trình tự peptit đánh dấu giúp thay đổi thuộc tính phân tử protein mong muốn giúp tinh chế protein dễ dàng Ví dụ như, số protein người ta tiến hành bổ sung chuỗi gồm histidin giúp protein liên kết với Ni2+ gắn cột chặt dễ phân tách hơn, thuộc tính thường phần lớn loại protein khác Ngoài việc sử dụng epitop đặc hiệu (thường trình tự peptit có - axit amin đặc hiệu xác định kháng nguyên) gắn vào phân tử protein cần tinh chế Các cải biến cho phép tinh loại protein sở nguyên tắc sắc ký lực miễn dịch sử dụng dị kháng nguyên mang epitop bổ sung Điều đặc biệt là, kháng thể epitop thay đổi tính liên kết kháng thể tùy thuộc vào điều kiện khác môi trường (chẳng hạn, lực tăng Ca2+, lực giảm có Ca2+) Điều giúp làm giảm ảnh hưởng yếu tố gây biến tính khác Nguyên tắc sắc ký lực miễn dịch dùng để làm kết tủa nhanh loại protein đặc hiệu (và loại protein liên kết chặt với nó) từ dịch chiết thô Trong trường hợp này, phản ứng kết tủa thu kháng thể gắn vào loại hạt sử dụng sắc ký cột Do hạt có kích thước lớn, nên chúng lắng nhanh xuống đáy ống nghiệm mang theo kháng thể protein liên kết với chúng Kỹthuật gọi kỹ thuật kết tủa miễn dịch, kỹ thuật ngày sử dụng phổ biến để tinh nhanh protein phức hệ protein từ dịch chiết thô Mặc dù sử dụng phương pháp riêng rẽ, thu sản phẩm protein tinh hoàn toàn, song phương pháp thường hiệu để xác định 23/27 Phân tích gen sản phẩm gen loại phân tử protein hợp chất khác (ví dụ ADN) có tương tác với loại protein đích Phân tích protein gel polyacrylamid Các loại protein thường không mang điện tích âm đồng hay có cấu trúc bậc hai đồng Thay vào đó, chúng tạo từ 20 loại axit amin khác nhau, số chúng không mang điện tích, số mang điện tích âm, số mang điện tích dương Ngoài cấu trúc bậc hai, protein hoạt động có cấu trúc bậc ba, bậc bốn điển hình Tuy vậy, protein xử lý với chất tẩy ion hóa mạnh SDS (sodium dodecyl sulphat) hợp chất khử, ví dụ mercapthoethanol, cấu trúc bậc 2, phân tử protein bị phá vỡ Nghĩa là, sau xử lý với SDS, protein trở thành dạng phân tử polymer cấu trúc Đồng thời, SDS tạo thành lớp vỏ ion làm phân tử protein trở nên tích điện âm đồng Mecarptoethanol làm giảm liên kết disulphit hình thành tiểu phần cystein Kết là, phân tử ADN ARN gây biến tính SDS mercaptoethanol, phân tách loại phân tử protein điện di chủ yếu khác biệt trọng lượng kích thước phân tử Sau điện di, phân tử protein nhuộm với thuốc nhuộm liên kết protein Coomassie brilliant blue quan sát Khi SDS, điện di phân tách loại protein, lúc có yếu tố khác loại protein trọng lượng phân tử, tổng điện tích điểm đẳng điện (xem đây) Định tính protein dựa phương pháp thẩm tách miễn dịch (immunoblotting) Mặc dù có chất khác ADN ARN, việc xác định có mặt loại protein số protein có mẫu sinh học theo nguyên tắc gần giống với phương pháp thẩm tách (còn gọi lai) Southern Northern (tương ứng với trường hợp ADN ARN) Tuy vậy, protein, phương định tính dựa dựa nguyên tắc miễn dịch đặc thù protein nên gọi phương pháp thẩm tách miễn dịch (immunoblotting) hay phương pháp thẩm tách (lai) Western Trong phương pháp thẩm tách miễn dịch, phân tử protein sau phân tách điện di chuyển gắn lên màng Màng sau ủ dung dịch chứa kháng thể đặc hiệu với loại protein tinh quan tâm nghiên cứu Kháng thể tìm thấy loại protein tương ứng màng lọc gắn vào Cuối cùng, việc sử dụng phản ứng enzym màu, người ta quan sát vị trí kháng thể liên kết màng Như vậy, tất phương pháp lai Southern, Northern Western có điểm chung sử dụng hợp chất chọn lọc để quan sát có mặt loại phân tử đặc thù hỗn hợp phức tạp 24/27 Phân tích gen sản phẩm gen Giải trình tự trực tiếp protein Mặc dù có cấu tạo phức tạp so với ADN ARN, phân tử protein giải trình tự trực tiếp, tức việc xác định thành phần thứ tự axit amin chuỗi polypeptit Có hai phương pháp sử dụng phổ biến là: 1) phương pháp biến tính Edman 2) phương pháp khối phổ Khả xác định trình tự protein có ý nghĩa quan trong nhiều nghiên cứu hệ protein học (proteomics) hệ gen học (genomics) Bởi với việc xác định dù trình tự ngắn axit amin phân tử protein đó, xác định gen mã hóa cho protein sở đối chiếu với khung đọc mở có hệ gen nhiều loài vốn giải mã hoàn toàn gần hoàn toàn nhưng chưa biết đầy đủ chức nhiều gen Phương pháp biến tính Edman phản ứng hóa học tiểu phần axit amin giải phóng từ đầu N chuỗi polypeptit Điểm mấu chốt phương pháp axit amin tận đầu N chuỗi polypeptit cải biến xử lý với phenylisothyocyanate (PITC) dẫn đến thay đổi gốc α-amino Axit amin cải biến sau cắt rời khỏi chuỗi polypeptit xử lý với axit điều kiện không làm phá hủy phần lại chuỗi polypeptit Việc xác định trình tự axit amin tiến hành dựa thứ tự hồi lưu axit amin cắt khỏi chuỗi kỹ thuật sắc ký lỏng hiệu cao HPLC (high performance liquid chromatography), nhờ đặc điểm loại axit amin có thời gian hồi lưu đặc trưng Mỗi vòng gây biến đổi axit amin cắt khỏi chuỗi polypeptit tạo chuỗi polypeptit nhóm α-amino Với việc lặp đi, lặp lại phản ứng cắt axit amin cho phép xác định trình tự đầu N chuỗi polypeptit Trong thực tế, chu kỳ gây biến tính lặp lặp lại từ - 15 lần để xác định protein Số chu kỳ thông thường đủ để xác định loại protein đặc thù Phương pháp giải mã trình tự tự động dựa nguyên lý biến tính Edman phương pháp hiệu sử dụng rộng rãi Tuy kỹ thuật gặp trở ngại đầu N tận phân tử protein bị cải biến mặt hóa học (ví dụ nhóm acetyl formyl), mà tượng vốn xảy tự nhiên điều kiện in vivo, trình tách chiết tinh protein Để khắc phục tượng này, người ta sử dụng protease để cắt chuỗi polypeptit phân tích trình tự bên chuỗi Phương pháp khối phổ (MS/MS) dùng để xác định vùng trình tự protein khác Khối phổ phương pháp xác định xác khối lượng các phân tử nhỏ Một cách vắn tắt phương pháp mô tả sau: phân tử cần phân tích cho bay qua thiết bị (trong điều kiện chân không) điều kiện tốc độ di chuyển tương quan với tỉ số khối lượng / điện tích Trên sở người ta đo thời gian bay phân tử xác định khối lượng Đối với 25/27 Phân tích gen sản phẩm gen phân tử sinh học có kích thước nhỏ chuỗi peptit phân tử protein nhỏ, trọng lượng phân tử xác định xác đến Dalton Để xác định khối lượng phân tử protein phương pháp MS/MS, trước tiên phân tử protein thường cắt thành đoạn peptit có trình tự ngắn (thường 20 axit amin) nhờ sử dụng enzym đặc hiệu, chẳng hạn trypsin Hỗn hợp đoạn peptit sau đưa vào phân tích khối phổ chúng phân tách dựa tỉ số khối lượng / điện tích Các đoạn peptit riêng rẽ sau bị bắt giữ phân đoạn thành chuỗi peptit thành phần Khối lượng peptit thành phần xác định phổ khối minh họa hình 15 Sự kết hợp liệu khối lượng đoạn peptit thành phần cho biết trình tự rõ ràng phân tử protein ban đầu Cũng giống phương pháp biến tính Edman, việc xác định trình tự của khoảng 15 axit amin đủ để so sánh với trình tự protein luận từ trình tự ADN giải mã Kỹ thuật MS/MS thực kỹ thuật có tính cách mạng việc xác định giải trình tự protein Trong phương pháp này, thông thường cần lượng mẫu nhỏ hết phân tích hỗn hợp nhiều loại protein đồng thời Hệ protein học (proteomics) Việc phát triển kỹ thuật giải mã trình tự ADN, kết hợp với phương pháp tách chiết, tinh phân tích trình tự protein mở đường cho hình thành chuyên ngành gọi hệ protein học Hệ protein học (proteomics) chuyên ngành nghiên cứu toàn tập hợp protein mô, tế bào thể tạo điều kiện đặc thù, phân tích mức độ phổ biến protein tương tác chúng với với phân tử khác (ví dụ ADN) trình hoạt động tế bào Nếu kỹ thuật phân tích vi dãy phản ứng (microarray) giúp nhận biết biểu gen cở sở phân tích hệ gen, kỹ thuật proteomics cho phép xác định hình ảnh tổng thể toàn vốn protein tế bào, mô thể Hệ protein học dựa ba phương pháp bản: điện di hai chiều gel polyacrylamid để tiến hành phân tách protein, khối phổ để xác định khối lượng phân tử định tính protein (hoặc đoạn peptit từ phân tử protein đó), sinh tin học để đối chiếu phân tử protein đoạn peptit với trình tự mã hóa chúng hệ gen Một tế bào riêng lẻ thường tạo hàng nghìn loại protein khác nhau, việc sử dụng đơn lẻ phương pháp điện di truyền thống gel polyacrylamid thường không đủ để phân lập tách biệt protein Vì vậy, tên gọi nó, phương pháp điện di hai chiều cho phép phân tách phân tử protein gel điện di theo hai chiều thực 26/27 Phân tích gen sản phẩm gen Trong bước thứ nhất, phân tử protein phân đoạn dựa điểm đẳng điện chúng (theo nguyên tắc hội tụ đẳng điện) Theo nguyên tắc này, gradient pH tạo từ đầu đến đầu điện di, vị trí pH tương ứng làm trung hòa điện tích phân tử protein làm phân tử protein tập trung (hội tụ) vị trí Trong bước thứ hai, phân tử protein điểm hội tụ tiếp tục phân tách sở khối lượng kích thước chúng di chuyển trường điện di polyacrylamid gây biến tính SDS mô tả Do phân tử protein đồng thời phân tách dựa hai thuộc tính (điểm đẳng điện trọng lượng phân tử), nên hàng nghìn loại protein khác phân tách khỏi thí nghiệm Sau phân đoạn theo phương pháp điện di hai chiều, loại protein riêng biệt đưa vào phân tích khối phổ để xác định xác khối lượng phân tử Như nói trên, để tăng hiệu phân tích, thông thường protein cắt thành đoạn peptit nhỏ nhờ sử dụng protease thay cho việc phân tích phân tử protein dạng nguyên vẹn có phân tử lượng lớn cấu trúc phức tạp Kỹ thuật phân tích MS/ MS cho phép giải trình tự chi tiết đoạn peptit xác định phân tử protein Cuối liệu trình tự hệ gen hoàn chỉnh thể trình tự peptit từ loại protein quan tâm nghiên cứu đưa vào phân tích phần mềm sinh tin học để xác định trình tự mã hóa đặc thù hệ gen tương ứng với loại protein có chức quan tâm nghiên cứu Như vậy, nghiên cứu hệ gen học (genomics) hệ protein học (proteomics) có mối quan hệ chặt chẽ nghiên cứu di truyền học phân tử 27/27 [...]... nhiều phân tích di truyền khác, chẳng hạn như có thể dễ dàng xác 17/27 Phân tích gen và sản phẩm của gen định được tất cả các vùng mã hóa của hệ gen Đến năm 2000, kích thước trung bình của các đoạn khung được xây dựng cho hệ gen người có kích thước là 2 Mb Điều này là đủ để có thể tin cậy về số gen ước lượng có trong hệ gen (xấp xỉ 30.000 gen) Phân tích mở rộng hệ gen Đối với các hệ gen nhỏ như của vi... di chuyển của nó tương quan với tỉ số khối lượng / điện tích Trên cơ sở này người ta có thể đo được thời gian bay của phân tử và xác định được khối lượng của nó Đối với 25/27 Phân tích gen và sản phẩm của gen các phân tử sinh học có kích thước nhỏ như các chuỗi peptit và các phân tử protein nhỏ, thì trọng lượng phân tử của nó có thể xác định chính xác đến từng Dalton Để xác định khối lượng phân tử protein... trình tự không mã hóa protein ngắn và bảo thủ Ví dụ một chương trình máy tính gọi là VISTA (không phải hệ điều hành mới đây của 19/27 Phân tích gen và sản phẩm của gen Microsoft) khi phân tích hệ gen ở nhiều loài khác nhau tìm thấy sự bảo thủ ở ở tỉ lệ 70% trong một đoạn trình tự phân tích 50 - 75 bp đối với một số trình tự ADN có vai trò điều hòa Hai loài cá bể dẹt và chuột cùng có khoảng 10.000 các... khi thu được sản phẩm protein được tinh sạch hoàn toàn, song phương pháp này thường rất hiệu quả để xác định các 23/27 Phân tích gen và sản phẩm của gen loại phân tử protein và các hợp chất khác (ví dụ như ADN) có tương tác với một loại protein đích nào đó Phân tích protein trên gel polyacrylamid Các loại protein thường không mang điện tích âm đồng đều hay có cấu trúc bậc hai đồng nhất Thay vào đó, chúng... được phân lập, xử lý và giải mã trình tự Để chắc chắn rằng mọi nucleotit trong hệ gen vi khuẩn đều có mặt trong các dòng vi khuẩn của thư viện hệ gen, tổng cộng có khoảng 30.000 - 40.000 dòng tái tổ hợp khác nhau được 14/27 Phân tích gen và sản phẩm của gen sử dụng và giải mã trình tự Từ đó, tạo ra khoảng 20 Mb dữ liệu thô về hệ gen (các phản ứng tạo ra trình tự có kích thước trung bình 600 bp, và 20... đặc thù, phân tích mức độ phổ biến của từng protein và sự tương tác của chúng với nhau và với các phân tử khác (ví dụ như ADN) trong quá trình hoạt động của tế bào Nếu như các kỹ thuật phân tích vi dãy phản ứng (microarray) có thể giúp nhận biết được sự biểu hiện của các gen trên cở sở phân tích hệ gen, thì các kỹ thuật proteomics cho phép xác định được hình ảnh tổng thể về toàn bộ vốn protein của một... thống trên gel polyacrylamid thường không đủ để phân lập và tách biệt các protein này Vì vậy, như tên gọi của nó, phương pháp điện di hai chiều cho phép phân tách các phân tử protein trên gel điện di theo hai chiều được thực hiện kế tiếp nhau 26/27 Phân tích gen và sản phẩm của gen Trong bước thứ nhất, các phân tử protein được phân đoạn dựa trên điểm đẳng điện của chúng (theo nguyên tắc hội tụ đẳng điện)... dụng protease thay cho việc phân tích phân tử protein ở dạng nguyên vẹn có phân tử lượng lớn và cấu trúc phức tạp Kỹ thuật phân tích MS/ MS cho phép giải trình tự chi tiết của các đoạn peptit và xác định phân tử protein Cuối cùng các dữ liệu về trình tự hệ gen hoàn chỉnh của một cơ thể và các trình tự peptit từ các loại protein được quan tâm nghiên cứu sẽ được đưa vào phân tích bằng các phần mềm sinh... nhiên vào các plasmit của vi khuẩn theo phương pháp được mô tả ở trên Các phân tử ADN tái tổ hợp mang các phân đoạn ngẫu nhiên của NST người sau đó được phân lập từ các plasmit vi khuẩn rồi giải mã bằng máy giải mã trình tự tự động Để 15/27 Phân tích gen và sản phẩm của gen đảm bảo mọi nucleotit trong hệ gen đều được giải mã, người ta phải tiến hành giải mã riêng rẽ khoảng 2 triệu phân đoạn ADN khác nhau... gen đầy đủ của các loài khác nhau ngày càng tăng lên đã cung cấp một cơ sở dữ liệu ngày càng phong phú và đầy đủ cho các nghiên cứu hệ gen học so sánh Ngày càng có nhiều các chương trình máy tính được phát triển và hoàn thiện để khai thác vốn thông tin di truyền đang ngày càng được tạo ra đầy đủ hơn qua các chương trình giải mã ADN tự động 20/27 Phân tích gen và sản phẩm của gen Các kỹ thuật phân tích ... phóng xạ), phân đoạn ADN bắt cặp với mẫu dò xác định phân lập rõ ràng Các phân đoạn phân đoạn mang trình tự gen A cần phân tích Một phương pháp tương tự áp dụng trực tiếp để phân tích sản phẩm phiên... véctơ tái tổ hợp mang đoạn ADN cài 8/27 Phân tích gen sản phẩm gen Một số loại véctơ cho phép phân lập tinh phân đoạn gen đó, mà điều hòa biểu gen nằm phân đoạn ADN cài Những véctơ gọi véctơ... VISTA (không phải hệ điều hành 19/27 Phân tích gen sản phẩm gen Microsoft) phân tích hệ gen nhiều loài khác tìm thấy bảo thủ ở tỉ lệ 70% đoạn trình tự phân tích 50 - 75 bp số trình tự ADN có vai