Lời nói đầu Mặc dù di truyền học đà đợc ngời ứng dụng công tác chọn, tạo giống vật nuôi trồng từ hàng nghìn năm trớc, nhng vòng 50 năm qua, nguyên lý di truyền học cấp độ phân tử dới tế bào dần đợc làm sáng tỏ Những hiểu biết chế di truyền từ gen đến hệ gen ngày trở nên sâu rộng Đặc biệt, kể từ năm 2000, dự án giải trình tự hệ gen ngời hoàn thành thảo đầu tiên, đà có nhiều đổi cách t nghiên cứu di truyền häc Cïng víi c«ng nghƯ th«ng tin, di trun häc phân tử đợc dự đoán hai chuyên ngành khoa học có ảnh hởng lớn đến đời sống xà hội giai đoạn tới Cả hai chuyên ngành khoa học liên quan đến việc khai thác, phân tích xử lý lợng lớn liệu đợc mà hóa dạng ngôn ngữ linh hoạt hiệu Nếu ngôn ngữ công nghệ thông tin ngời sáng tạo, ngôn ngữ thông tin di truyền đợc lu giữ hệ gen sinh vật ngày kết sống đà hình thành phát triển qua nhiều triệu năm tiến hóa Với cách đổi t nh vậy, giáo trình đợc biên soạn nhằm cung cấp cho sinh viên ngành sinh học, công nghệ sinh học s phạm sinh học nguyên lý di truyền học cấp độ phân tử tế bào phục vụ cho công việc học tập nghiên cứu Giáo trình đợc chia làm 11 chơng với nội dung sau: Chơng I Liên kết hóa học đại phân tử sinh học Chơng II Cấu trúc, đặc tính, chức đại phân tử sinh học (ADN, ARN protein) Chơng III Sao chép axit nucleic Chơng IV Phiên mà dịch mà di truyền Chơng V Gen điều hòa biểu gen Chơng VI Đột biến sửa chữa ADN Chơng VII Cơ sở di truyền học nhiễm sắc thể Chơng VIII Chu trình tế bào sở di truyền học ung th Chơng IX Điều hòa gen hệ miễn dịch động vật có xơng sống Chơng X Di truyền học phân tử tiến hóa Chơng XI Phân tích gen sản phẩm gen Ngoài việc sử dụng làm giáo trình học tập sinh viên ngành sinh học, công nghệ sinh học s phạm sinh học, sách đợc dùng làm tài liệu tham khảo cho sinh viên, học viên cao học nghiên cứu sinh có liên quan đến sinh học trờng Đại học Y, Đại học Dợc, Đại học Nông nghiệp, Đại học Lâm nghiệp nh với giáo viên giảng dạy sinh học trờng THPT, nhà khoa học viện nghiên cứu chuyên ngành quan tâm đến di truyền học Dù đà cố gắng cập nhật thông tin míi thc lÜnh vùc Di trun häc ph©n tư tế bào, nhng bối cảnh chuyên ngành phát triển mạnh mẽ không ngừng đổi mới, lần xuất đầu tiên, giáo trình tránh khỏi thiếu sót Các tác giả trân trọng đón nhận cảm ơn ý kiến nhận xét, góp ý đồng nghiệp làm công tác giảng dạy sinh học, nhà khoa học, sinh viên, học viên cao học, nghiên cứu sinh độc giả gần xa để lần xuất sau sách đợc hoàn chỉnh Các tác giả i Danh mục từ chữ viết tắt Từ viết t¾t NghÜa tiÕng ViƯt NghÜa tiÕng Anh Ψ / ΨU Pseudouridine Pseudouridine G Mức chênh lệch lợng tự Change in free energy 2-AP 2-aminopurine 2-aminopurine 2D-PAGE §iƯn di chiỊu trªn gel polyacrylamide 2-D polyacrylamide gel electrophoresis 3’UTR Vùng đầu không đợc dịch mà 3-untranslated region 5UTR Vùng đầu không đợc dịch mà 5-untranslated region 5-BU 5-bromouracine 5-bromouracine ADN Axit deoxyribonucleic Deoxyribonucleic acid ADN pol ADN polymerase / ADN polymeraza DNA polymerase ADP Adenosine diphosphate Adenosine diphosphate AIDS Hội chứng suy giảm miễn dịch mắc phải Acquired immunodeficiency syndrome AMP Adenosine monophosphate Adenosine monophosphate ARE Tr×nh tù ARN giµu AU AU-rich element (sequence) ARN Axit ribonucleic Ribonucleic acid ARN pol ARN polymerase / ARN polymeraza RNA polymerase ARNi ARN can thiÖp Interfering RNA ATP Adenosine triphosphate Adenosine triphosphate BER Sửa chữa cắt bỏ bazơ nitơ Base excision repair cADN ADN phiên mà ngợc từ ARN Complementary DNA (cDNA) cAMP AMP vßng Cyclic AMP CAP / CRP Protein hoạt hóa chất dị hóa / Protein thơ thĨ cđa cAMP Catabolite activator protein / cAMP receptor protein CDK Enzym kinase phô thuéc cyclin Cyclin-dependent kinase CE Điện di mao quản Capillary electrophoresis CML Ung th bạch cÇu thĨ tđy tr−êng diƠn Chronic myelogenous cancer cs Céng sù Co-workers CTAB Cetyltrimethylammonium bromide Cetyltrimethylammonium bromide Da Dalton Dalton DGGE §iƯn di biÕn tÝnh gradient Denaturing gradient gel electrophoresis DHU Dihydrouridine Dihydrouridine dNTP Deoxyribonucleotide triphosphate Deoxyribonucleotide triphosphate dsADN ADN sợi kép Double strand DNA ĐVCXS Động vật có xơng sèng Vertebrate animal EDTA Ethylene diamine tetraacetate Ethylene diamine tetraacetate EHMR Khối phổ độ phân giải cực cao Extremely high mass resolution EJC Phøc hƯ nèi c¸c exon Exon joining complex EMS Ethyl methane sulfonate Ethyl methane sulfonate ESI Ion hóa phun điện Electrospray ionization EST Đoạn đánh dấu trình tù biĨu hiƯn Expressed sequence tag iii Tõ viÕt t¾t NghÜa tiÕng ViÖt NghÜa tiÕng Anh FAP Héi chøng u tun polyp theo dßng hä Familial adenomatous polyposis FGF Ỹu tố tăng trởng nguyên bào sợi Fibroblast growth factor FISH Lai huỳnh quang chỗ Fluorescent insitu hybridization gARN ARN dÉn ®−êng Guide RNA GR Thơ thĨ glucocorticoid Glucocorticoid receptor HIV Virut gây suy giảm miễn dịch ngời Human immunodeficiency virus HLA Kháng nguyên liên kết tế bào lympho ngời Human leukocyte antigen HPLC Sắc ký lỏng cao áp / Sắc ký hiệu cao High pressure liquid chromatography IRES Vị trí vào ribosome Internal ribosome entry site IS Các trình tự (yếu tố) cài Insertion sequence Kcb H»ng sè c©n b»ng Equilibrium constant kDa Kilodalton Kilodalton LCR Vùng điều khiển locut Locus control region LINE Các trình tự dài nằm rải rác nhân Long interspersed nuclear element LTR Các trình tự lặp lại dài đầu tận Long terminal repeat MALDI Phân hủy laser chÊt mang Matrix-assissted laser desorption ionization mARN ARN th«ng tin Messeger RNA MHC Phức hệ kháng nguyên tơng hợp m« Major histocompability complex miARN TiĨu ARN Micro RNA (miRNA) MMR Sửa chữa kết cặp sai nhờ mạch khuôn đợc methyl hãa Methyl-directed mismatch repair MMS Methyl methane sulfonate Methyl methane sulfonate MS Khèi phæ Mass spectrophotometry mtARN ARN ti thể Mitochondrial RNA NER Sửa chữa cắt bỏ nucleotide Nucleotide excision repair NJ Thuật toán kết nối lân cận Neighbor joining NMD Phân hủy mARN mang đột biến vô nghÜa Nonsense mediated decay of mRNA NMR Céng h−ëng tõ hạt nhân Nuclear magnetic resonance NST Nhiễm sắc thể Chromosome NTP Ribonucleotide triphosphate Ribonucleotide triphosphate ORF Khung ®äc më Open reading frame PABP Protein liên kết đuôi polyA PolyA binding protein PAGE Điện di gel polyacrylamide Polyacrylamide gel electrophoresis PCR Phản ứng chuỗi trùng hợp Polymerase chain reaction PDGF Yếu tố tăng trởng có nguồn gốc tiểu cầu Platelet-derived growth factor PEP Phosphoenolpyruvate Phosphoenolpyruvate PFGE §iƯn di xung tr−êng Pulsed-field gel electrophoresis PITC Phenylisothyocyanate Phenylisothyocyanate PPi / ~ Nhãm pyrophosphate Pyrophosphate group PTS HƯ thèng phosphoryl hãa phơ thc vào PEP PEP-dependent phosphotransferase system iv Từ viết tắt Nghĩa tiÕng ViÖt NghÜa tiÕng Anh rARN ARN ribosome Ribosomal RNA RBS Vị trí liên kết ribosome Ribosome binding site RFLP Đa hình độ dài đoạn giới hạn Restriction fragment length polymorphism RISC Phøc hƯ t¾t gen kÝch øng bëi ARN RNA-induced silencing complex RPBS Vị trí liên kết protein điều hòa Regulatory protein binding site SCID Bệnh suy giảm miễn dịch kết hợp nghiêm trọng Severe combined immunodeficiency disease SDS Sodium dodecyl sulfate Sodium dodecyl sulfate siARN ARN can thiƯp kÝch th−íc nhá Small interfering RNA SINE C¸c u tố trình tự ngắn nằm rải rác nhân Short interspersed nuclear element SMC Protein tr× cÊu tróc nhiƠm sắc thể Structural maintenance of chromosome snARN ARN nhân kích thớc nhỏ Small nuclear RNA snoARN ARN hạch nhân kích th−íc nhá Small nucleolar RNA snRNP Ribonucleoprotein kÝch th−íc nhá Small nuclear ribonucleoprotein SRP ARN ARN nhËn biÕt tÝn hiÖu Signal recognition RNA ssADN ADN mạch đơn Single strand DNA SSB Protein bám mạch đơn Single strand binding protein STR / SSR Tr×nh tù vi vƯ tinh Microsatellite / simple tandem repeats tARN ARN vËn chuyÓn Transfer RNA TBP Protein liªn kÕt hép TATA TATA-box binding protein TE Ỹu tè di truyền vận động / gen nhảy Transposable element TIC Hệ thống vận chuyển translocase màng lạp thể Translocase, inner chloroplast TIM HƯ thèng vËn chun translocase mµng ti thĨ Translocase, inner mitochondrial tmARN ARN tÝch hỵp cđa mARN tARN tmRNA TMV Virut khảm thuốc Tobacco mosaic virus TOC HƯ thèng vËn chun translocase mµng ngoµi l¹p thĨ Translocase, outer chloroplast TOF Thêi gian bay Time of flight TOM HƯ thèng vËn chun translocase mµng ngoµi ti thĨ Translocase, outer mitochondrial uORF Khung ®äc më n»m ngợc dòng Upstream open reading frame UPGMA Thuật toán phân cặp dựa giá trị trung bình Unweighted pair group with arthmetic means UV Tia cùc tÝm Ultra violet VNTR Trình tự nucleotide ngắn lặp lại liên tục với số lợng biến động/ tiểu vệ tinh Variable number tandem repeats / minisatellite v Chơng 11 Phân tích gen sản phẩm gen trình tự lặp có xu hớng bị nén lại chạy qua cột chứa gel (lắp máy), dẫn đến tợng pic vùng trình tự lặp lại có xu hớng lồng vào (không phân tách) nên khó xác định trình tự xác Các trình tự thờng cần đợc kiểm tra lại phơng pháp thủ công Trong thực tế, đoạn ADN cuối đợc giải trình tự dự án hệ gen ngời (hoàn thành năm 2006) đoạn ADN có mức độ lặp lại lớn thuộc NST số 11.2.9.2 Giải trình tự toàn hệ gen Nh nêu trên, việc giải trình tự đoạn ADN ngắn thực đợc tơng đối dễ dàng nhờ máy giải trình tự tự động Tuy vậy, hệ gen lớn đợc giải trình tự nh nào? Dới số phơng pháp giải trình tự hệ gen Từ phần trên, biết xõy dng ngân hµng hƯ gen, tồn ADN hệ gen cắt thnh cỏc on ngắn trc c nhân dũng trì nhờ vectơ Mặc dự v nguyờn tc, việc giải trình tự thực trực tiếp trờn ADN h gen, nhng thực t cn phải bit trớc nhiu trỡnh t hệ gen míi cã thĨ thiÕt kÕ mồi để nhân đoạn khác nm dc h gen khc phc khó khăn ny, ngi ta nhân dũng cỏc on ADN b»ng véctơ, đoạn cµi sau giải trình tự nhờ dïng mồi oligonucleotide kết cặp với trình tự ®· biÕt véctơ Vấn đề cịn lại cách tái tổ chức lại đoạn ADN riêng rẽ thành trình tự đầy đủ liờn tc ca h gen Có thể thực đợc việc mt s cỏch sau đây: ã Tỏch dịng trình tự nằm gối lên (contig) Cách đơn giản để tạo trình tự nằm gối lên phân lập giải trình tự mt dũng t ngân hàng h gen, ri dùng trỡnh tự dịng thứ ®Ĩ xác định dịng thứ hai có phần đoạn cài nằm gối lên đoạn thứ (nhê lai víi mÉu dß) Dịng thứ hai lại giải trình tự thơng tin trình tự lại dùng để xác định đoạn thứ ba nằm gối lên đoạn thứ hai, v.v Nguyên tắc sở phương pháp bước nối tiếp nhiễm sắc thể dïng để xây dựng trình tự ADN nằm gối lên (contig) xuất phát từ đoạn ADN ngắn tách dòng nhê véctơ Tuy vậy, phương pháp tốn nhiều cơng sức Một dịng phải phân lập giải trình tự trước tìm thấy dịng tiÕp theo Ngồi ra, trình tự lặp lại kÕ tiếp (phỉ biÕn) hệ gen dễ g©y xếp nhầm • Giải trình tự ngẫu nhiên tồn hệ gen (kü thuËt "shortgun") Toµn bé đoạn ADN hệ gen c nhân dũng nhờ Giải trình tự ngẫu Giải trình tự ngẫu vectơ v gii trỡnh t ngu nhiờn nhiên phân cấp nhiên toàn hệ gen Cỏc trỡnh t sau phân ADN hƯ gen tích b»ng phÇn mỊm m¸y tÝnh khả nằm gối lên chúng (tức trình tự xuất nhiu phõn on khỏc nhau) Giải trình tự ngẫu nhiªn trình tự tồn hệ gen xây dựng dựa tổ hợp đồng thời S¾p xÕp trỡnh t nm gi lờn trình tự (hỡnh 11.14) Phương pháp lần Tr×nh tù hƯ c dùng gii trình tự gen đợc xác định hệ gen vi khuẩn Haemophilus influenzae Toàn hệ gen ca vi Hình 11.14 Giải trình tự hệ gen phơng khuẩn ny c phõn ct ngu pháp giải trình tự ngẫu nhiên toàn hệ gen giải nhiờn thnh nhng đoạn nhỏ trình tự ngẫu nhiên phân cấp 341 Đinh Đoàn Long phng phỏp siờu õm, ri đoạn nhỏ (1,5 – Kb) nh©n dịng b»ng véctơ plasmid pUC18 Tổng cộng thư viện hệ gen lồi gồm khoảng 20.000 dịng vi khuẩn khác Mỗi dòng (tương ứng với đoạn ADN) sau giải trình tự để tổ hợp lại tạo nên tập hợp thơng tin trình tự ADN gồm 12 triệu bp Độ dài toàn cỏc trỡnh t đợc giải mà gp ln dài hƯ gen vi khuẩn Trình tự hệ gen cuối thu nhờ tổ hợp on ADN ngn thnh cỏc on contig Cỏc on rỗng contig cui cựng c lp y bng vic xác định dịng bổ sung từ sè ng©n hàng hệ gen khỏc (thực tế, để giải trình tự hệ gen, ngời ta cần xây dựng ngân hàng gen mang đoạn cài có kích thớc trung bình khác nhau, ví dụ: 1, vµ 10 Kb) Ưu điểm râ phương pháp “shortgun” khơng cần biết trước trình tự h gen tốc độ giải trình tự nhanh, đặc biƯt víi c¸c hƯ gen nhá (nh− vi khn) Phần lớn hệ gen vi khuẩn giải mã xong vài tuần phương pháp giải trình t ngẫu nhiên Tuy vy, giải trình tự hƯ gen lín (nh− ng−êi), phương pháp có nhược im l gặp khó khăn xỏc nh trật tự đoạn contig cỏc vùng hệ gen mang nhiều trỡnh t lp li liên tip; ra, số lợng contig lớn nên cần phần mềm hệ thống máy tính có hiệu cao để xử lý liệu ã Gii trỡnh t ngu nhiờn phõn cp giải trình tự hệ gen lớn, cú cải tiến ADN toàn hệ gen ban đầu cắt thành đoạn lớn tách dòng vào cỏc NST nhõn to vi khun (BAC) Sau ú, dòng BAC đợc dùng để xây dựng ngân hàng mang đoạn ADN cài kích thớc ngắn (vÝ dơ: b»ng vect¬ pUC18) ViƯc giải trình tự ngẫu nhiờn đợc tiến hành lần lợt ngân hàng Phng phỏp gii trỡnh t ngu nhiờn phân cấp giúp việc xếp contig dƠ dµng hn 11.2.9.3 Tìm gen từ hệ gen đà đợc giải trình tự Sau h gen ca mt sinh vật giải tr×nh tù xong, người ta dùng số phương pháp khác để tìm xác định vị trí gen NST, bao gồm: • Duyệt trình tự Các gen mã hóa cho protein phải chứa khung đọc mở (ORF) mang chuỗi (khơng dấu “phảy”) ba (codon) mã hóa tương ứng cho trình tự axit amin protein Khung c m s bt đầu bi mó m u 5’-ATG3’ mạch mã hóa (tương ứng với 3’-TAC-5’ mạch khơng mã hóa, tức mạch làm khn; mã 5’-AUG-3’ mARN), đồng thời kết thúc mã ba (TAA, TAG TGA) Chiều dài trung bình ORF khác lồi Ở E coli, chiều dài trung bình ORF 317 codon; nấm men, chiều dài trung bình ORF 483 codon Nhưng nhìn chung, ORF thường chứa nhiều 50 codon Vì vậy, để tìm gen hệ gen, áp dụng phương pháp duyệt trình tự theo kiểu trượt dọc mạch ADN tìm codon mở đầu codon kết thúc cách 100 codon Phương pháp hiệu duyệt trình c¸c hƯ gen prokaryote hệ gen chúng tính phân m¶nh Nhưng, với hệ gen eukaryote, phương pháp gặp khó khăn ORF thường bị phân mảnh thành exon intron Việc duyệt trình tù hệ gen eukaryote, k c ngời thờng phải nhờ phần mềm máy tính nh Grail, Genemark, v.v Những phần mềm xác định ORF không dựa mà mở đầu kết thúc dịch mÃ, mà dựa số thuật toán thống kê xác định đoạn có tiềm mà hóa, nh trình tự vùng biên exon intron, trình tự điều hòa phiên mÃ, nh hp TATA, INR, DPE trình tự cần thiết cho gắn kết yếu tố TFIID phức hệ phiên mà ARN pol II (xem chơng 3) Tuy vậy, mà mở đầu kết thúc dịch mÃ, trình tự khác có mức độ biến đổi lớn, nên việc xác định 342 Chơng 11 Phân tích gen sản phẩm gen xác gen lúc Để hạn chế nhợc điểm này, phơng pháp bổ sung gen đợc xác định sở gen đà biết loài sinh vật khác (vì chúng thờng có trình tự tơng đồng giống nhau) Tuy vậy, phơng pháp đối chiếu có nguy gen giả (pseudogene, thờng không đợc phiên mÃ) đợc tính nhầm gen ã So sánh cADN Một cách hiệu để xác định gen hệ gen so sánh trình tự với cADN tơng ứng Chúng ta biết rằng, cADN đợc tạo từ mARN chủ yếu chứa trình tự exon ORF Việc so sánh trình tự thực nhờ phần mềm máy tính sử dụng phơng pháp lai đoạn ADN hệ gen với mARN (phơng pháp lai Northern) Các đoạn đánh dấu trình tự biểu - EST (expressed sequence tag) thờng đợc sử dụng cho mục đích EST thực chất đoạn trình tự ngắn (thng di 200 500 bp) thờng đợc tạo sở giải trình tự từ hai đầu cADN Nhờ EST có tính đại diện cho phần hệ gen đợc biểu nên chúng hiệu để tìm kiếm gen Trong thực nghiệm, EST nhiều u điểm khác nữa, là: (1) đoạn EST đợc tạo tơng đối dễ dàng chi phí thấp; (2) cần giải trình tự lần đủ để tạo EST đặc thù với cADN, tức gen; (3) lỗi gây giải trình tự thờng không cần kiểm tra lại, EST đợc dùng để tìm trình tự gần giống Các sở liệu EST (ví dụ: http://www.ncbi.nlm.nih.gov/dbEST/) cung cấp triệu trình tự EST khác ngời Tất nhiên, có nhiều trình tự trùng nhiều lần (đặc biệt gen có mức độ biểu cao phổ biến); thiếu số EST tơng ứng với gen có mức độ biểu thấp gặp (ví dụ: tế bào, biểu điều kiện đặc biệt) a) 11.2.10 Xác định vai trò chức gen Galactokinase Các dự án giải trình tự hệ gen đà dẫn đến nhiều kết thú vị không bất ngờ Chẳng hạn nh, nghiên cứu E coli S cereviseae dờng nh đà tiến hành chi tiết b) hàng chục năm, nhng giải trình tự xong hƯ gen cđa chóng, ng−êi ta míi biÕt r»ng míi chØ cã 30 - 40% sè gen cđa chóng đà đợc nghiên cứu loài khác, bao gồm ngời, tỉ lệ gen đà đợc nghiên cứu thấp nhiều Tuy vậy, sau hệ gen đà đợc giải trình tự xong, có số phơng pháp khác giúp nhanh chóng xác định đợc vai trò chức Hình 11.15 So sánh trình tự galactokinase từ loài khác nhiỊu gen hƯ gen, bao gåm: a) Ph¶n øng xúc tác enzym galactokinase ã Tìm kiếm trình tự giống b) So sánh đoạn trình tự axit amin cđa Cịng gièng nh− viƯc sư dơng c¸c công cụ galactokinase loài Hs: Homo sapiens, tin học việc tìm kiếm trình tự Sc: Saccharomyces cerevisiae, mà hóa hệ gen, sở liệu Ec: Escherichia coli, gen đà biết (ở loài sinh vật khác nhau) Bs: Bacillus subtilis, dùng để xác định vai trò chức Ca: Candida albicans, gen cha biết Việc tìm kiếm Hi: Haemophilus influenza, trình tự giống thờng dựa St: Salmonella typhimurium, trình tự axit amin tơng ứng với Kl: Kluyveromyces lactis, trình tự gen, tính đa dạng trình At: Arabidopsis thaliana 343 Đinh Đoàn Long tự ADN thờng cao trình tự polypeptide tơng ứng tính thoái hóa mà bé ba Thùc nghiƯm cịng x¸c nhËn r»ng, c¸c gen có chức sinh vật khác có đặc điểm chung Chẳng hạn nh, hầu hết loài có khả chuyển hóa galactose glucose-6-P, enzym tham gia bớc đờng chuyển hóa (galactose galactose-1-P) galactose kinase có tính đặc thù loài, nhng chúng có số đoạn trình tự giống (hỡnh 11.15) Nh đà nói, trớc giải xong trình tự hệ gen nấm men, có khoảng 30% tổng số 6000 gen nấm men đà đợc biÕt Nh−ng, sau gi¶i m· xong hƯ gen nÊm men, phơng pháp tìm kiếm trình tự giống nhau, ngời ta xác định đợc thêm chức khoảng 30% gen Nh vậy, khoảng 40% gen cha rõ chức Tất nhiên, số có số gen giả Việc xác định chức gen cần phơng pháp phối hợp khác ã Xác định chức gen thực nghiệm loài sinh vật mô hình, nh E coli hay S cereviseae, phơng pháp để xác định chức gen cha biết làm bất hoạt gen kỹ thuật knock-out Trong kỹ thuật này, ngời ta dùng nguyên tắc tái tổ hợp tơng đồng để làm hỏng bình thờng gen Kiểu hình thể đột biến đợc kiểm tra đối chiếu với kiểu dại để xác định chức gen Phơng pháp có hiệu nghiên cứu xác định vai trò nhiều gen Chẳng hạn nh nấm men, việc so sánh trình tự không giúp xác định đợc chức gen có tên SNU17, trình tự khác với trình tự gen đà biết Nhng gen bị hỏng, tế bào nấm men phát triển chậm thờng có nhiều sai hỏng trình hoàn thiện mARN Qua đó, chức SNU17 đợc tìm thấy yếu tố tham gia hoàn thiện mARN Điểm khó phơng pháp nhiều trờng hợp, cá thể mang gen bị hỏng chết sớm không biểu kiểu hình khác biệt Cả hai trờng hợp không dẫn đến kết luận chắn Khi gen bị knock-out gây chết suy luận protein gen mà hóa có vai trò sống sinh vật, nhng vai trò cụ thể không rõ Một phơng pháp cải tiến khác để xác định vai trò gen làm tăng mức biĨu hiƯn cđa nã, råi theo dâi kiĨu h×nh thĨ đột biến Mặc dù đà có phơng pháp phát chức gen nh trên, nhng nhìn chung nhiều gen, chức gen phải đợc phân tích sở gen riêng rẽ Thế nên, khối lợng công việc cho mảng nghiên cứu lớn Riêng nấm men, khoảng 2000 gen cha đợc xác định chức năng, ngời vào khoảng 20.000 gen 11.3 Các kỹ thuật phân tích protein Mặc dù biểu gen thờng đợc đánh giá mức độ phiên mà thông qua việc phân tích sản phẩm phiên mà mARN (chẳng hạn phơng pháp lai Northern đà nêu trên), nhng thực tế lợng mARN có tế bào lúc tơng đồng với lợng protein sản phẩm cuối gen hoạt tính Sự không tơng đồng lợng sản phẩm phiên mà với lợng hoạt tính sản phẩm dịch mà nhiều nguyên nhân, bao gồm: a) Một số ARN không đợc dùng để dịch mà nên không tạo protein b) Một số tiền-ARN có cách xén intron biến đổi nên gen đợc dùng mà hóa nhiều protein khác c) Tốc độ dịch mà biến tính mARN khác khác nhau, nên lợng mARN có tế bào cha đà tơng quan với lợng protein 344 Chơng 11 Phân tích gen sản phẩm gen d) Hoạt tính nhiều protein thay đổi cải biến protein sau dịch mÃ, chẳng hạn nh biến đổi sè axit amin, sù bỉ sung hay mÊt ®i mét sè nhãm chøc (nh− acetyl, phosphate, AMP, ADP-ribose, v.v ) e) Nhiều protein đợc cắt tỉa sau dịch mÃ, đợc bổ sung thêm gốc đờng hay lipid để tạo thành glycoprotein lipoprotein f) Bản thân protein có độ bền tốc độ phân hủy khác g) Đó cha kể đến biến đổi protein phụ thuộc vào điều kiện sinh trởng, phát triển tế bào; phụ thuộc vào hoạt động tơng tác protein với gen protein khác Vì vậy, để đánh giá mức ®é biĨu hiƯn cđa mét gen, kh«ng thĨ chØ dõng mức phiên mà cần đánh giá mức dịch mà Ngoài ra, sau giai đoạn nhiều hệ gen sinh vật mô hình ngời đà đợc giải trình tự, vấn đề tồn lại phần lớn gen chúng cha rõ chức Ví lý nµy, nhiỊu nhµ khoa häc cho r»ng thÕ kû 21 kỷ hệ protein học Dới số phơng pháp phân tích protein 11.3.1 Chuẩn bị dịch nghiền tế bào để tinh protein Việc phân lập tinh protein riêng rẽ có ý nghĩa định đến khả tìm hiểu chức chúng Mặc dù số trờng hợp, nghiên cứu chức protein dạng hỗn hợp phức tạp, nhng phần lớn nghiên cứu thờng dẫn đến kết luận không rõ ràng Chẳng hạn nh nghiên cứu hoạt tính enzym ADN pol hỗn hợp protein thô (chẳng hạn từ dịch phân giải tế bào), enzym ADN pol protein thành phần khác ảnh hởng đến hiệu suất tổng hợp ADN quan sát đợc thực nghiệm Vì vậy, việc tinh protein bớc quan trọng trình tìm hiểu chức chúng Mỗi protein thờng có số đặc tính riêng nên qui trình tinh chúng thờng có tính đặc thù Điều trái ngợc với ADN, vốn nhìn chung giống cấu trúc thành phần, khác trình tự nucleotide Các bớc tinh protein thờng dựa đặc tính chúng kích thớc, hình dạng, điện tích nhiều chức Vật liệu khởi đầu cho hầu hết trình tinh protein từ sinh vật dịch nghiền tế bào Không giống ADN vốn có khả hồi tính kể tế bào, protein dễ bị biến tính bị phân hủy sau bị giải phóng khỏi tế bào Vì lý này, hầu hết trình chuẩn bị dịch chiết tinh protein cần đợc tiến hành nhiệt độ lạnh (dới 4oC) Có số cách chuẩn bị dịch nghiền tế bào Các tế bào đợc phân giải hóa chất, biện pháp học làm vỡ thành tế bào, xử lý với dung dịch nhợc trơng (làm tế bào trơng lên nớc vào vỡ ra), v.v Điểm chung phơng pháp làm thành tế bào vỡ giải phóng protein Trong nhiều trờng hợp, tế bào cần đợc chuyển trạng thái đông lạnh, ví dụ: máy cô lạnh chân không, sau đợc nghiền máy nghiền mẫu trớc tiến hành chiết xuất tinh protein 11.3.2 Sử dụng sắc ký cột để tinh protein Cách tinh protein phổ biến sử dụng phơng pháp sắc ký cột Trong phơng pháp này, protein đợc cho chạy qua cột chứa hệ thống mạng lới hình thành hạt agarose, polyacrylamide dextran (Sephadex) Tùy thuộc vào đặc tính protein, sử dụng số phơng pháp qui trình kỹ thuật khác Có ba phơng pháp sắc ký cột sắc ký trao đổi ion, sắc ký lọc gel sắc ký lực 345 Đinh Đoàn Long 11.3.2.1 Sắc ký trao đổi ion Trong phơng a) b) pháp này, protein ++đợc phân tách dựa -+ điện tích ion hóa + bề mặt chóng -++b»ng viƯc sư dơng c¸c vËt liƯu nhåi cét (còn Protein tích đợc gọi pha tĩnh) điện dơng hạt mang Hạt nhồi cột nhóm tích điện âm tích điện âm dơng (hình Protein tích 11.16a) Các protein điện âm tơng tác yếu với pha tĩnh (chẳng hạn, protein tích điện dơng đợc cho chạy qua pha tĩnh mang điện âm) ban đầu đợc giữ lại cột, Hình 11.16 Sắc ký cột để tinh protein a) Sắc ký trao đổi ion, b) Sắc ký lọc sau đợc rửa gel (vẽ theo Watson et al., 2004) chiết dung dịch muỗi loÃng chảy qua cột (dung dịch đệm chạy mẫu đợc gọi pha động) Các protein tơng tác với pha tĩnh mạnh, cần nồng độ muối cao để rửa chiết Bằng việc tăng gradient nồng độ muối dung dịch đệm rửa chiết, protein khác kích thớc, khối lợng mức độ ion hóa bề mặt phân tách khỏi thành phân đoạn chúng qua cột 11.3.2.2 Sắc ký lọc gel Sắc ký lọc gel (hình 11.16b) cho phép phân tách protein chủ yếu khác hình dạng kích thớc Khác với sắc ký trao đổi ion, vật liệu để nhồi cột không mang nhóm tích điện mà thay vào chúng tạo nên hệ thống mạng có kích thớc lỗ khác (giống gel, gọi sắc ký lọc gel) Các phân tử protein nhỏ có khả thâm nhập vào tất lỗ có kích thớc khác nhau; vậy, thời gian chạy qua cột dài đợc rửa chiết muộn Ngợc lại, phân tử protein lớn đợc rửa chiết sớm Trong sắc ký cột, phân đoạn thu đợc nồng độ muối khác thời gian khác nhau, đồng thời có hoạt tính protein mong đợi cao đợc tích lũy tinh bổ sung Mức độ tinh protein có xu hớng tăng lên phân đoạn protein đợc cho chạy qua nhiều loại cột sắc ký khác Thờng cột sắc ký đơn lẻ không đủ để tinh loại protein mong muốn dù qui trình sắc ký đợc lặp lại nhiều lần Thay vào đó, ngời ta thờng áp dụng loạt kỹ thuật để thu hồi phân đoạn chứa lợng lớn protein đợc quan tâm Nói cách khác, có nhiều phân tử protein đợc rửa chiết dung dịch muối đậm đặc từ cột tích điện dơng (ví dụ trờng hợp protein tích đợc âm) đợc rửa chiết sắc ký läc gel (víi protein kÝch th−íc nhá), c¸c kü tht đơn lẻ thờng không đủ để thu đợc sản phẩm protein tinh hoàn toàn 11.3.2.3 Sắc ký lực hỗ trợ tinh protein Đặc tính loại protein đợc dùng nhằm làm tinh loại protein tơng ứng Chẳng hạn, loại protein có tính liên kết đặc hiệu với ATP, 346 Chơng 11 Phân tích gen sản phẩm gen dùng cột sắc ký mang vật liệu gắn kết với ATP để phân tách protein Chỉ có protein liên kết với ATP đợc cột giữ lại, hầu hết protein không liên kết với ATP bị rửa trôi khỏi cột Kỹ thuật tinh đợc gọi sắc ký lực Có nhiều chất khác đợc dùng để gắn kết với vật liệu nhồi cột giúp trình tinh protein đạt hiệu cao Các chất bao gồm ADN (để tinh protein liên kết ADN) hay chí protein (để tinh loại protein khác tơng tác đặc thù với nó) Nh vậy, để tinh protein đó, cần phải có hiểu biết đặc tính lý hóa protein Một dạng sắc ký lực đợc dùng phổ biến sắc ký lực miễn dịch Trong phơng pháp này, ngời ta gắn kháng thể đặc hiệu với protein đích lên vật liệu làm cột Trong trờng hợp lý tởng, loại kháng thể liên kết với protein cần tinh Loại protein liên kết với kháng thể sau đợc rửa chiết cách cho chảy qua cột dung dịch muối chất tẩy nhẹ Khó khăn gặp phải với phơng pháp liên kết kháng thể - protein bền vững đến mức phải gây biến tính protein thu hồi đợc sản phẩm Nhng, không gièng ADN, protein sau biÕn tÝnh th−êng kh«ng håi tính điều kiện in vitro, nên protein thu đợc nhiều không dạng hoạt động chức Để tăng hiệu suất tinh sạch, cải biến protein Một ví dụ cải biến bổ sung đoạn peptide ngắn vào đầu C đầu N phân tử protein cần phân tích Việc bổ sung trình tự đánh dấu thực đợc kỹ thuật di truyền Các trình tự peptide đánh dấu làm thay đổi số thuộc tính protein giúp việc tinh chế dễ dàng Ví dụ, số protein sau đợc bổ sung chuỗi peptide gồm His trở nên tơng tác với cột Ni2+ tốt dễ phân tách (trong protein khác đặc tính này) Cũng sử dụng epitop đặc hiệu (thờng đoạn peptide có - axit amin xác định kháng nguyên) để tinh loại protein có lực cao với Các cải tiến cho phép tinh protein sở nguyên tắc miễn dịch Ưu điểm phơng pháp là: epitop thay đổi tính liên kết kháng thể tùy thuộc vào điều kiện môi trờng (chẳng hạn, lực giảm có Ca2+, tăng Ca2+) Điều giúp hạn chế việc sử dụng yếu tố gây biến tính khác Nguyên tắc sắc ký lực miễn dịch đợc dùng để gây kết tủa nhanh loại protein đặc hiệu từ dịch chiết thô Trong trờng hợp này, phản ứng kết tủa miễn dịch xảy kháng thể đợc gắn vào loại vật liệu làm pha tĩnh sắc ký cột Do hạt có kích thớc lớn nên chúng lắng nhanh ống nghiệm chứa dung dịch đệm mang theo protein liên kết với chúng (qua kháng thể) Kỹ thuật đợc gọi kết tủa miễn dịch, đợc dùng ngày phổ biến thí nghiệm cần tinh protein Mặc dù dùng riêng rẽ phơng pháp này, thu đợc sản phẩm protein tinh hoàn toàn, song phơng pháp hiệu để xác định loại protein hợp chất khác (ví dụ trình tự ADN) có tơng tác với loại protein đích 11.3.3 Phân tích protein gel polyacrylamide 11.3.3.1 Kỹ thuật điện di gel polyacrylamide (PAGE) Không giống axit nucleic, protein thờng không mang điện tích đồng ®Ịu hay cã cÊu tróc bËc hai ®ång nhÊt däc chiều dài phân tử Thay vào đó, từ 20 loại axit amin (trong có 15 axit amin trung tính, axit amin tích điện dơng, axit amin tích điện âm; xem chơng 1) phần lớn protein trung tính, số khác tích điện dơng, số lại tích điện âm Ngoài cấu trúc bậc 2, protein dạng hoạt động thờng có cấu trúc bậc điển hình Nhng đợc đợc xử lý với chất tẩy (ion hóa) mạnh nh 347 Đinh Đoàn Long SDS (sodium dodecyl sulphate, công thức CH3-(CH2)11SO4-) hay chất khử nhóm sulfhydryl, nh -mercapthoethanol (HS-CH2CH2OH) cấu trúc bậc 2, protein bị phá vỡ Lúc này, SDS tạo thành lớp vỏ ion âm bao bọc protein làm protein trở nên tích điện âm đồng dọc phân tử -mecarptoethanol làm đứt gÃy liên kết disulfide (S-S) Cys Trên sở này, phân tử protein đợc gây biến tính SDS -mercaptoethanol, phân tách protein điện di chủ yếu khác biệt kích thớc khối lợng phân tử Khi SDS -mercaptoethanol, protein phân tách điện di, nhng lúc phân tách chúng phụ thuộc vào nhiều yếu tố khác nh cấu hình, điểm đẳng điện, tơng tác phân tử Một điểm khác biệt so với axit nucleic protein thờng có kích thớc trung bình nhỏ nhiều so với axit nucleic, nên gel điện di protein thờng đợc làm từ polyacrylamide Hệ thống mạng mà hợp chất polyme nhân tạo tạo nhỏ so với gel agarose Kỹ thuật điện di gen polyacrylamide đợc viết tắt PAGE Sau điện di, để quan sát protein đợc nhuộm với hai chất nhuộm phổ biến Coomassie blue bạc (Ag2+) Coomassie blue liên kết chặt với protein tạo nên băng điện di có màu xanh; nguyên tử bạc liên kết mạnh với protein tạo nên phức hệ có màu nâu đen Nhuộm bạc thờng nhạy coomassie blue, nhng đắt 11.3.3.2 Điện di protein gel polyacrylamide hai chiều (2D-PAGE) Do số lợng phân tử protein mẫu sinh học thờng lớn nên phơng pháp điện di thông thờng không đủ để phân tách protein giống khỏi Vì vậy, phân tử protein thờng đợc tách trớc tiên dựa khác biệt điện tích bề mặt chúng (gọi chiều thứ nhất); sau đó, dựa khác biệt kích thớc (gọi chiều thứ hai) Phơng pháp điện di đợc tiến hành gel polyacrylamide đợc gọi tắt 2D-PAGE Trong chiều thứ nhất, gradient pH (từ ~3 đến 10) đợc tạo dọc gel Các protein tùy theo điện tích bề mặt chúng dịch chuyển gel điện di vị trí có độ pH tơng đơng với điểm đẳng điện (pI) chúng (là điểm mà điện tích chúng đợc trung hòa) Các protein có điểm đẳng điện sau đợc phân tách nhờ khác kích thớc theo phơng pháp điện di thông thờng Các kỹ thuật 2D-PAGE cải tiến gần cho phép phân tách đồng thời 10.000 protein khác Trên điện di 2D-PAGE, loại protein thờng "hội tụ" thành "vết đốm" Mỗi vết đốm sau đợc cắt khỏi gel, xử lý với protease, phân tích phơng pháp khối phổ (xem dới đây) để xác định loại protein 11.3.4 Định tính protein dựa thẩm tách miễn dịch lai Western Tuy có chất khác ADN ARN, việc xác định có mặt loại protein mẫu sinh học đợc thực theo nguyên tắc lai đợc gọi lai Western Tuy nhiên, không giống phơng pháp lai axit nucleic dựa nguyên tắc liên kết Chargaff (bảng 11.2), lai Western phơng pháp định tính protein dựa nguyên tắc miễn dịch; vậy, đợc gọi thẩm Bảng 11.2 Các phơng pháp lai để phân tích ADN, ARN protein tách miễn dịch Phơng pháp lai Loại phân tử cần phân tích Bản chất mẫu dò (immunoblotting) Trong lai Western, Southern ADN ADN (mạch đơn) phân tử protein sau đợc phân Northern ARN ADN (mạch đơn) tách điện di Western Protein Kháng thể đợc chuyển lên màng Màng sau South-Western Protein ADN (sợi kép) đợc ủ 348 Chơng 11 Phân tích gen sản phẩm gen dung dịch chứa kháng thể đặc hiệu với protein đợc quan tâm nghiên cứu Kháng thể gắn vào loại protein tơng ứng màng Cuối cùng, phản ứng enzym màu, ngời ta quan sát đợc vị trí kháng thể màng, qua cho biết có mặt khối lợng phân tử protein Nh vậy, điểm chung tất phơng pháp lai Southern, Northern Western sử dụng hợp chất chọn lọc để phát có mặt loại phân tử đặc thù hỗn hợp phức tạp Một phơng pháp lai cải tiến khác đợc dùng để phát protein liên kết ADN lai South-Western Trong phơng pháp này, ngời ta dùng mẫu dò ADN (thay cho kháng thể lai Western) để lai với protein Nếu nh lai Southern, mẫu dò ADN thờng dạng mạch đơn, mẫu dò lai South-Western thờng dạng sợi kép, phần lớn protein liên kết với ADN sợi kép 11.3.5 Định loại giải trình tự protein Mặc dù có cấu tạo phức tạp so với axit nucleic, phân tử protein giải trình tự trực tiếp Có hai phơng pháp đợc sử dụng phổ biến là: (1) phơng pháp biến tính Edman (2) phơng pháp khối phổ 11.3.5.1 Giải trình tự protein phơng pháp gây biến tính Edman Phơng pháp gây biến tính Edman phơng pháp giải trình tự axit amin đoạn peptide ngắn, dựa việc đánh dấu cắt axit amin đầu N lần lợt khỏi chuỗi peptide mà không ảnh hởng đến liên kết peptide khác phân tử protein Phản ứng cắt đợc thực phenylisothyocyanate (PITC, hình 11.17) Trong dung dịch kiềm nhẹ, PITC phản ứng với axit amin đầu N để hình thành nên dẫn xuất phenylthiocarbamoyl Khi chuyển sang môi trờng axit, axit amin đầu N bị đứt d¹ng dÉn xuÊt axit amin thiazolinone Axit amin thiazolinone sau đợc chiết xuất chọn lọc dung môi hữu cơ, xử lý với loại axit để hình thành nên dẫn xuất bền vững axit amin phenylthiohydantoin (PTH) Chất xác định sắc ký điện di Quy trình đợc lần lợt lặp lại axit amin cuối chuỗi polypeptide để giải trình tự Hạn chế lớn kỹ thuật hiệu giải trình tự thấp đoạn peptide dài 30 axit amin Sở dĩ nh vậy, phản ứng biến tính axit amin đoạn peptide dài thờng không triệt để Một hạn chế khác kỹ thuật gặp trở ngại axit amin đầu N bị cải biến hóa học (ví dụ đợc gắn thêm nhóm acetyl formyl) mà tợng vốn xảy tự nhiên điều kiện in vivo, trình tách chiết tinh protein Tuy vậy, hai hạn chế Chu kỳ biến tính Chu kỳ biÕn tÝnh Ph¶n øng biÕn tÝnh Edman Phenylisothiocyanate Alanine Đánh dấu axit amin đầu N Đánh dấu axit amin đầu N Giải phóng axit amin đầu N Đánh dấu axit amin đầu N Giải phóng axit amin đầu N PITC-alanine Giải phóng axit amin đầu N Đoạn peptide ngắn axit amin Hình 11.17 Giải trình tự protein trực tiếp phơng pháp biến tính Edman (vẽ theo Watson cs, 2004) 349 Đinh Đoàn Long đợc khắc phục cách dùng protease cắt đoạn peptide lớn thành đoạn peptide nhỏ trớc giải trình tự Với đoạn peptide dài 30 axit amin, độ xác giải trình tự phơng pháp Edman 98% Dựa nguyên lý biến tính Edman, máy giải trình tự protein tự động đà đợc phát triển dùng rộng rÃi 11.3.5.2 Giải trình tự protein phơng pháp khối phổ Việc phân tích protein đoạn peptide phơng pháp khối phổ (MS) dựa kỹ thuật hóa phân tích có độ xác cao; gần đợc thiết kế thành hệ thống tự động máy tính điều khiển Trong phơng pháp này, có hai kỹ thuật quan trọng phân hủy laser chất mang (thờng gọi tắt MALDI) ion hóa phun điện (gọi tắt ESI) Kỹ thuật MS giúp ®o tØ sè [khèi l−ỵng / ®iƯn tÝch] (m/z) cđa ion, từ xác định đợc khối lợng phân tử Nhng kỹ thuật MALDI ESI, MS không trực tiếp phân tích đợc phân tử lớn nh protein Trong kỹ thuật MALDI (hình 11.18a), xung laser đợc dùng để bắn phá tinh thể chất rắn truyền lợng để ion tinh thể bắn dạng khí Đối với protein, mẫu đợc tinh thể hóa (chuyển sang dạng rắn) việc sử dụng chất Chất đợc dùng kỹ thuật MALDI thờng axit thơm nh 4-methoxy cinnamic acid Sau bị tia laser bắn phá, chất truyền lợng cho tinh thể protein, làm giải phóng ion mà kích thớc điện tích chúng đặc thù với loại protein Các ion (lúc dạng khí) đợc gia tốc mét tr−êng ®iƯn tõ cã hiƯu ®iƯn thÕ cao bay qua ống chân không tới cảm biến tín hiệu Thiết bị cảm biến đo đợc khoảng thêi gian bay cđa ion tõ ngn ph¸t sinh ion (tinh thể protein) tới điểm cảm biến Thời gian ion bay tỉ lệ thuận với bậc hai tỉ sè m/z ThÕ nªn, tõ thêi gian bay cã thĨ xác định đợc tỉ số m/z ion; tập hợp tín hiệu ion cho phép xác định trình tự axit amin protein Phơng pháp xác định tỉ số m/z qua thời gian bay ion đợc gọi kỹ thuật tách thời gian bay (gọi tắt TOF) Phơng pháp MS dựa hai kỹ thuật MALDI TOF đợc gọi chung MALDI-TOF Vì kỹ thuật MALDI-TOF nhạy nên lợng mẫu đa vào phân tích cần nhỏ 10-12mole Để có đợc mẫu protein tinh lợng nhỏ, ngời ta thờng tiến hành điện di 2D-PAGE để phân tách protein; protein đợc khỏi gel cắt protease (ví dụ trypsin) thành tập hợp đoạn peptide (thờng ngắn 20 axit amin) đặc thù protein Ngoài việc xác định đợc trình tự axit amin, kỹ thuật MALDI-TOF đồng thời cho phép phát đợc protein đợc biến đổi sau dịch mÃ, chẳng hạn xác định đợc axit amin đợc gắn thêm gốc phosphate gốc đờng Kỹ thuật MALDI-TOF cho phép giải trình tự protein có khối lợng tới a) b) Tia laser Mao quản dẫn mẫu Chất mang Lới Phân tử mẫu bị ion hóa tích điện Cảm biến TOF Vùng chuyển trạng thái 350 Vùng chuyển trạng thái Dung dịch chứa mẫu Giọt dịch Hạt ion Giọt dịch mang mẫu trần mang mẫu nhỏ Cảm biến tứ cực (bẫy ion) Phân tử mẫu dạng tinh thể đợc gắn lên chất mang Lới tích điện Hình 11.18 Các phơng pháp khối phổ a) Phơng pháp khối phổ phân hủy laser chất mang kết hợp với thời gian bay (MALDI/TOF), b) Phơng pháp ion hóa phun điện (ESI) Chơng 11 Phân tích gen sản phẩm gen 100.000 Da lần công phá mẫu Tuy vậy, với cải tiến kü tht kh«ng ngõng, cã lÏ thêi gian tíi, giíi hạn phân tích protein MALDI-TOF tiếp tục tăng lên Nếu MALDI kỹ thuật đợc dùng để tạo ion dạng khí từ chất rắn, ESI đợc dùng để tạo ion dạng khí từ dịch lỏng Trong ESI, ngời ta dùng mao quản để nhỏ giọt chất lỏng vào trờng ®iƯn tõ cã hiƯu ®iƯn thÕ cao (h×nh 11.18b) Dung môi bay nhanh giọt nhỏ vỡ ra” Sù nh− vËy diƠn nhiỊu lÇn liên tiếp tạo nên ion độc lập (ion trần) Các hạt ion đợc gia tốc bay ống chân không đến tiếp cận đợc đo khối lợng cảm biến tứ cực, gọi bẫy ion Nh vậy, bẫy ion thờng đợc dùng với khối phổ ESI Khối phổ ESI có u điểm thờng đợc nối trực tiếp với hệ thống phân tách dịch lỏng, bao gồm kỹ thuật điện di mao quản (CE) sắc ký lỏng cao áp (HPLC) Mặc dù thông thờng không đợc nối trực tiếp với hệ thống MALDI-TOF, nhng kỹ thuật CE HPLC đợc dùng để tinh protein trớc phân tích MALDI-TOF Ngoài ra, kỹ thuật MS, tợng ion gốc phân rà thành ion con, nên kỹ thuật khối phổ đợc thực nhiều lần để thu đợc số liệu phân tích chi tiết phân tử protein Kỹ thuật đợc gọi khối phổ (viết tắt MS/MS) Kỹ thuật cho phép phân biệt đợc hai ion có khối lợng (ví dụ: để phân biệt hai đoạn peptide ngắn có thành phần axit amin nhng khác trình tự) Trong thực tế, để giải a) trình tự đoạn peptide protein mới, ngời ta Yếu tố phiên mà thờng phải dùng phơng pháp khối phổ Miền hoạt Miền liên 11.3.6 Phân tích tơng tác protein - protein Dọc theo giáo trình này, nhận thấy mối tơng tác đại phân tử (ADN, ARN protein) có vai trò trung tâm điều hòa hầu hết hoạt động sống tế bào thể sinh vật Trong đó, tơng tác protein với có vai trò định trực tiếp đồng thời có tính đa dạng phức tạp Có nhiều phơng pháp khác đợc dùng để đánh giá tơng tác protein nhằm góp phần làm sáng tỏ chức chúng đây, đề cập đến phơng pháp là: (1) hệ thống lai hai dòng nấm men, (2) đồng kết tủa miễn dịch (3) kü thuËt vi d·y protein hãa enzym kÕt ADN ARN pol ADN Gen chØ thÞ VÞ trÝ nhËn biÕt b) Vật săn mồi Miền hoạt hóa enzym Mồi Miền liên kết ADN Vật săn mồi không bắt ARN pol đợc mồi Gen thị 11.3.6.1 Hệ thống lai hai dòng nấm men Hệ thống lai hai dòng dựa đặc điểm cấu trúc phân tử phần lớn protein hoạt hóa phiên mà Từ chơng biết rằng, nhiều protein hoạt hóa phiên mà có hai miền hoạt tính: miền liên kết ADN, viết tắt DBD (thờng nhận đoạn trình tự đặc hiệu ngợc dòng promoter) miền hoạt hóa, viết tắt AD (có vai trò thúc đẩy phiên mà sau đính kết với ARN polymerase) Khi hai miền tơng tác với nhau, chúng hoạt hóa phiên mà gen Về nguyên tắc, hai miền AD DBD không thiết phải liên kết cộng hóa trị phân tư Gen biĨu hiƯn Gen kh«ng biĨu hiƯn c) “VËt săn mồi Mồi Miền liên kết ADN Miền hoạt hóa enzym Vật săn mồi ARN pol bắt đợc mồi Gen thị Gen biểu Hình 11.19 Nguyên tắc hệ thống lai hai dòng Xem nội dung phần diễn giải (vẽ theo Clark, 2006) 351 Đinh Đoàn Long protein Thế nên, hệ thống lai hai dòng, hai miền AD DBD đợc "dung hợp" với hai protein khác nhau, giả sử đợc kí hiệu A B (hình 11.19) Hai protein lai đợc coi "mồi" (AD-A) "vật săn mồi" (DBD-B) Nếu "vật săn mồi" bắt đợc "mồi", tức A B tơng tác với nhau, phức hệ hình thành ho¹t hãa gen Ng−êi ta sư dơng mét gen chØ thị để xác nhận có hay không tơng tác hai protein lai Mô hình lai hai dòng đợc phát triển nấm men đợc dùng để kiểm tra mối tơng tác khoảng 6000 loại protein khác sinh vật Theo lý thuyết, phải kiểm tra 6000x6000 tổ hợp protein khác Để thực đợc điều đó, ORF hệ gen nấm men đợc nhân dòng vào hai loại vectơ khác nhau: vectơ mang miền AD, vectơ mang miền DBD Nói cách khác, protein nấm men đợc kiểm tra vai trò "mồi" "vật bắt mồi" Các vectơ đợc thiết kế cho ORF tơng ứng với hai miền AD DBD đợc hoạt hóa biểu yếu tố hoạt hóa phiên mÃ, ví dụ nh GAL4 (hình 11.20) Vectơ A có vị trí "đa nhân dòng" nằm ngợc dòng đoạn gen GAL4-AD giúp tạo nên phân tử lai A-GAL4-AD, vectơ B có vị trí nằm xuôi dòng đoạn gen GAL4-DBD giúp tạo nên phân tử lai GAL4-DBD-B mồi Hai vectơ plasmid lai đợc biến nạp vào tế bào nấm men khác giới tính Kết hình thành hai nhóm giới tính, nhóm gồm 6000 dòng tế bào nấm men mang vectơ biến nạp khác Sau đó, dòng tế bào thuộc nhóm (giới tính này) đợc đem lai với dòng thuộc Điểm khởi đầu nhóm (giới tính kia) Điểm chép vi khuẩn Nghĩa khả tổ khởi đầu chép hợp AD DBD nấm Vectơ Vectơ thuộc protein khác men mồi vật bắt mồi xảy Khi dòng (A) (B) nấm men "lai" với nhau, chúng hình thành nên dạng Promoter Trình tự vật bắt mồi Trình tự mồi bào tử lỡng bội (2n) mang hai plasmid "mồi" "vật săn mồi" Nếu hai protein vật bắt mồi lai A B tơng tác với nhau, gen thị biểu Tơng tác Trong mô hình nấm lực cao protein men, hai gen thị đợc sử dụng HIS3 URA3 Nếu gen HIS3 URA3 không đợc hoạt hóa, tế bào nấm men chết môi trờng tơng ứng histidine (His) uracine (U) Nh− vËy, nÕu tÕ bµo nÊm men lai (2n) sinh trởng đợc môi trờng ARN ARN His U chứng tỏ pol pol ADN ADN gen thị HIS3 URA3 đà đợc hoạt hóa; tức hai protein A B đà tơng tác với Trên mô hình Chọn khuẩn lạc màu xanh lam Chọn lọc môi hình 11.20, hai gen thị môi trờng có X-gal trờng thiếu His (His-) đợc dùng HIS3 LacZ Hình 11.20 Các vectơ đợc thiết kế cho hệ thống lai hai dòng Trong đó, gen LacZ mà hóa Xem nội dung phần diễn giải (vẽ theo Clark, 2006) cho -galactosidase Enzym 352 Chơng 11 Phân tích gen sản phẩm gen chuyển hóa hợp chất không màu X-gal (5brom-4-chlor-3-idolyl--D-galactoside) thành hợp chất có màu xanh lam 5-brom-4-chlorindigo Vì vậy, gen thị LacZ, có tơng tác protein, tế bào có màu xanh lam nuôi môi trờng có X-gal Phân tử ARN Miền hoạt hóa enzym Miền liên kết ADN ADN ARN pol Gen thị Ưu ®iĨm nỉi bËt nhÊt cđa hƯ thèng lai kÐp ë nấm men cho phép đánh giá tơng Vị trí tác protein protein tế bào Tuy vậy, nã nhËn biÕt cịng cã mét sè h¹n chÕ KiĨu tơng tác protein Hình 11.21 Mô hình lai ba dòng - protein giới hạn nhân tế bào Hầu hết protein màng tế bào "gấp nếp" sai Gen Trình tự FLAG nhân; ngợc lại, protein nghiên cứu nhân có xu hớng bị biến đổi sai tế bào chất Độc tính tạo tơng tác ADN plasmid protein lín (c¸c protein lai th−êng cã kÝch BiÕn nạp vào tế thớc lớn dạng tự nhiên) dẫn đến bào động vật nuôi cấy in vitro Promoter việc đánh giá sai số tơng tác quan trọng động vật có vú Ngoài ra, số tơng tác protein-protein Thu tế bào phụ thuộc vào có mặt ARN số tách tế bào chất phân tử nhỏ khác không chứng minh đợc mô hình Protein Kháng thể Một hệ thống lai đợc cải tiến nhằm khắc phục hạn chế đợc gọi hệ thống lai ba dòng (hình 11.21) Trong hệ thống này, hai protein (AD-A DBD-B) đợc đánh giá tơng tác đồng thời với phân tử ARN mà hai protein liên kết Mô hình đợc dùng để sàng lọc protein tơng tác ARN Hệ thống lai hai dòng nấm men cịng cã thĨ ¸p dơng víi c¸c gen tõ c¸c loài khác Ngoài ra, số hÃng (nh Stratagene, Mỹ) ®· thiÕt lËp hƯ thèng lai hai dßng dïng vi khuẩn E coli Trong mô hình E coli, hai gen thị đợc dùng bla (kháng ampicillin) lacZ 11.3.6.2 Phơng pháp đồng kết tủa miễn dịch khác Phức hệ protein FLAG Hạt đợc bọc protein A Ly tâm thu hạt chạy điện di gel SDS-PAGE loại protein liên kết phức hệ Protein đợc đánh dấu FLAG Hình 11.22 Phơng pháp ®ång kÕt tđa miƠn dÞch ë ®éng vËt cã vó, tơng tác protein xác định đợc phơng pháp đồng kết tủa miễn dịch (hình 11.22) Gen mà hóa cho protein đợc biến nạp biểu tế bào động vật; sau đó, phân lập loại protein đợc quan tâm nghiên cứu vừa tổng hợp từ tế bào chất nhờ kháng thể Trong trờng hợp cha có kháng thể tơng ứng, protein đợc gắn với peptide đánh dấu, gọi FLAG Sau đó, kháng thể tơng ứng với FLAG đợc dùng để phân lập protein cần nghiên cứu Thờng việc phân lập protein dựa nguyên tắc kháng nguyên - kháng thể đợc thực điều kiện in-vitro giống với điều kiện in-vivo Vì vậy, sau phân lập, protein nghiên cứu liên kết với kháng thể đồng thời dạng phức hệ với protein khác Phức hệ protein sau đợc phân tách điện di SDS-PAGE nhằm xác định xem có protein thành phần tham gia vào phức hệ Việc xác định protein thành phần thực phơng pháp khối phổ giải trình tự protein 353 Đinh Đoàn Long Ngời ta dùng phơng pháp đồng kết tủa miễn dịch để kiểm tra mối tơng tác protein protein hệ thống lai hai dòng Trớc tiên, loại protein đợc quan tâm nghiên cứu đợc gắn tơng ứng với peptide đánh dấu FLAG His6 Hai cấu trúc ADN mà hóa tơng ứng cho protein dung hợp đợc đồng biến nạp vào tế bào động vật Sau đó, lần lợt loại kháng thể tơng ứng với peptide đánh dấu đợc dùng để phân lập phức hệ protein; phức hệ sau đợc tiến hành điện di SDS-PAGE Gel điện di sau đợc chuyển lên màng nitrocellulose đợc lai với mẫu dò kháng thể tơng ứng với His6 (anti-His6) FLAG (anti-FLAG) Nếu hai loại protein tơng tác với nhau, chúng xuất hai gel lai Western 11.3.6.3 Vi d·y protein (protein microarray) Các phơng pháp nghiên cứu protein trớc thờng phân tích loại protein riêng lẻ Cùng với tiến gần giải trình tự hệ gen, có nhiều phơng pháp đợc cải tiến cho phép phân tích đồng thời nhiều protein Trong đó, có phơng pháp vi dÃy protein Th viện protein đánh dấu His6 HHHHHH HHHHHH HHHHHH HHHHHH HHHHHH His6 HHHHHH + Lam kính gắn ion Niken Protein liên kết với Ni qua His6 Các phơng pháp vi dÃy protein đợc dùng phổ biến nghiên cứu hóa sinh xác định hoạt độ enzym; đồng thời để xác định tơng tác protein với Đến nay, phần lớn qui trình vi dÃy protein dựa mô hình nấm men S cerevisiae Hình 11.23 Kỹ thuật gắn protein lên Để nghiên cứu tơng tác hệ protein nấm lam kÝnh vi d y protein men (gåm kho¶ng 6000 protein), 90% sè gen m· hãa protein tõ ng©n hàng hệ gen đà đợc tái tổ hợp với đoạn ADN mà hóa peptide đánh dấu His6 Đoạn peptide đánh dấu cho phép protein "gắn lên" chất qua liên kết His Ni (hình 11.23) Tơng tác protein phân tích cặp protein riêng biệt, đợc "sàng lọc" với hỗn hợp toàn hệ protein; sau phân thành nhóm nhỏ để tiếp tục phân tích kết tơng tác dơng tính Các thí nghiệm phân tích chức đợc thiết kế cho việc phân tích dÃy phản øng thn tiƯn nhÊt (th−êng dïng c¸c chÊt ph¸t quang, dùng đồng vị phóng xạ).Ví dụ: để tìm protein nấm men đính kết với calmodulin (một protein liên kết Ca2+) hay phospholipid (thành phần màng tế bào), ngời ta sử dụng vi dÃy protein đánh đấu His6 đính kết lên lam kính gắn Ni Cả calmodulin phospholipide đợc đánh dấu biotin Các protein tơng tác calmodulin phospholipide đợc nhận diện nhờ streptavidin mang chất phát quang Cy3 (hình 11.24) Bằng phơng pháp này, phòng thí nghiệm Đại học Yale (Mỹ) thí nghiệm vi dÃy protein đà tìm đợc 139 protein liên kết calmodulin 150 protein liên kết phospholipid tõ nÊm men 11.3.7 VỊ hƯ protein häc (proteomics) hệ chuyển hóa học (metabolomics) Việc phát triển kỹ thuật giải trình tự ADN, kết hợp với tách chiết, tinh giải trình tự protein đà mở đờng cho đời chuyên ngành gọi hệ protein học (proteomics) Hệ protein học nghiên cứu toàn protein đợc 354 Chơng 11 Phân tích gen sản phẩm gen mô, tế bào thể tạo điều kiện định, đồng thời xác định mức độ phổ biến loại protein tơng tác chúng với với phân tử khác (nh ADN hay ARN) NÕu nh− c¸c kü thuËt vi d·y ADN giúp xác định đợc biểu gen cở sở phân tích hệ gen, kỹ thuật proteomics cho phép xác định đợc tranh tổng thể toàn protein tế bào, mô thể Proteomics dựa ba phơng pháp chính, bao gồm: (1) 2D-PAGE để phân tách protein, (2) MS để xác định khối lợng phân tử trình tự axit amin, (3) tin sinh học để so sánh phân tử protein đoạn peptide với trình tự mà hóa chúng hệ gen Trong thực tế, nghiên cứu hệ gen học (genomics) hệ protein học (proteomics) thờng đợc phối hợp với nghiên cứu di truyền học phân tử đại Bên cạnh hệ gen học hệ protein học, gần lĩnh vực nghiên cứu thờng đợc phối hợp với hai chuyên ngành nêu đợc gọi hệ chuyển hóa học hay hệ trao đổi chất học (metabolomics) Hệ chuyển hóa học nghiên cứu toàn chất chuyển hóa đợc tích lũy mô, tế bào thể điều kiện định Hầu hết chất chuyển hóa xác định đợc phơng pháp khối phổ (MS), phơng pháp cộng hởng từ hạt nhân (NMR) Phơng pháp MS có độ nhạy Các protein đợc sàng lọc cao dùng phân tích nhiều nhóm phân tử khác 12C có khối lợng 12 Da Trong đó, khối His6 lợng nguyên tử khác, nh 14N hay 16O, số nguyên Các phơng pháp MS sử dụng độ Ni Ni Ni Ni Ni Ni phân giải khối lợng cực cao, gọi EHMR, giúp Lam xác định xác công thức phân tử hầu hết ủ với phospholipid đợc kÝnh chÊt chun hãa tÕ bµo sinh vËt, kĨ đồng đánh dấu Biotin phân (có công thøc ph©n tư gièng nhau) Biotin Phospholipid Ni Ni Ni Ni Ni Ni Bổ sung avidin gắn với chất phát quang Cy3 ChÊt ph¸t quang Avidin Avidin Ni Ni Ni Ni Ni Ni Các phân tích hệ chuyển hóa đặc biệt hữu ích nghiên cứu chất sinh học thứ cấp (nh chất tạo màu, tạo mùi, alkaloid, saponin, v.v) vốn đặc thù thực vật Ví dụ, sử dụng hai dịch chiết nớc hữu từ dâu tây, ngời ta đà xác định đợc khoảng 7000 chất chuyển hóa khác Nếu in phổ EHMR dài vài ba km Việc so sánh hệ chuyển hóa dạng đột biến trắng với dạng kiểu dại đỏ đà trực tiếp cho thấy khác hàm l−ỵng mét sè chÊt chun hãa trung gian đờng tổng hợp chất tạo màu (sắc tố) nói chung sắc tố đỏ nói riêng (hình 11.25) Quả trắng X Quả đỏ X Y Hình 11.24 Sàng lọc protein phơng pháp vi d y sử dụng Hình 11.25 Phổ MS cho biết thành phần chất chuyển hóa khác Biotin / Streptavidin dạng kiểu dại (quả đỏ) đột biến (quả trắng) dâu tây 355 ... Chơng VII Cơ sở di truyền học nhiễm sắc thể Chơng VIII Chu trình tế bào sở di truyền học ung th Chơng IX Điều hòa gen hệ miễn dịch ®éng vËt cã x−¬ng sèng Ch−¬ng X Di trun häc phân tử tiến hóa... soạn nhằm cung cấp cho sinh viên ngành sinh học, công nghệ sinh học s phạm sinh học nguyên lý di truyền học cấp độ phân tử tế bào phục vụ cho công việc học tập nghiên cứu Giáo trình đợc chia làm... trờng Đại học Y, Đại học Dợc, Đại học Nông nghiệp, Đại học Lâm nghiệp nh với giáo viên giảng dạy sinh học trờng THPT, nhà khoa học viện nghiên cứu chuyên ngành quan tâm đến di truyền học Dù đÃ