Hệ gen học (Genomics)

Một phần của tài liệu sinh học phân tử (Trang 55 - 61)

Genomics là khoa học nghiên cứu hệ gen của các sinh vật, bao gồm giải trình tự toàn bộ hệ gen và lập bản đồ di truyền chi tiết của các gen.

Thuật ngữ genomics có thể được hiểu khác nhau. Trong khi sinh học phân tử tập trung vào chức năng của các gen đơn lẻ thì genomics nghiên cứu toàn bộ hệ gen. Tuy nhiện, xét theo góc độ lịch sử, genomics ra đời từ lịch sử phát triển của sinh học phân tử, khi người ta quan tâm đến mối tương tác và điều hòa tổng thể giữa các gen và nhất là do kỹ thuật giải trình tự toàn hệ gen phát triển.Vì vậy, genomics là khoa học nghiên cứu tất cả các gen của một tế bào hoặc mô ở mức độ DNA (genome), mRNA (transcriptome), hay protein (proteome) trong một điều kiện sinh lý nhất định.

Genomics được bắt đầu từ những đóng góp của Frederick Sanger khi lần đầu tiên giải trình tự toàn bộ hệ gen của một virus và một ti thể (mitochondrion). Nhóm nghiên cứu của Sanger đã tạo ra những kỹ thuật genomics như giải trình tự, lập bản đồ hệ gen, dự trữ dữ liệu và phân tích tin sinh vào những năm 1970-1980. Một mặt, hệ gen học cấu trúc (structural genomics) với nhiệm vụ giải trình tự toàn bộ các hệ gen vẫn đang được tiến hành. Mặt khác, hệ gen học chức năng (functional genomics), chủ yếu quan tâm đến các mô hình biểu hiện gen (gene expression) trong các điều kiện sinh lý khác nhau đã được thành lập và đưa những thông tin trình tự vào cuộc sống thực. Những công cụ quan trọng nhất ở đây là proteomics, microarrays và tinh sinh học (bioinformatics). Proteomics nghiên cứu một tập hợp đầy đủ các protein trong một kiểu tế bào hay mô, và những thay đổi trong những điều kiện khác nhau. Một quan điểm tương tự áp dụng với các mRNA được gọi là transcriptomics với công cụ nghiên cứu là kỹ thuật microarrays.

Các mốc thời gian quan trọng của genomics:

1972: Walter Fiers, Đại học Ghent, Bỉ, lần đầu tiên giải trình tự của một gen mã hóa cho protein vỏ của Bacteriophage MS2

1976: Nhóm nghiên cứu của Fiers đã giải trình tự toàn bộ hệ gen RNA của bacteriophage MS2.

1977: Hệ gen DNA đầu tiên được giải trình tự. Đó là hệ gen của bacteriophage Φ-X174 (5,368 bp), được thực hiện bởi Frederick Sanger.

1995: Hệ gen của sinh vật sống tự do đầu tiên được giải trình tự: Haemophilus influenzae (1.8 Mb), kéo theo sau đó một loạt các hệ gen được giải trình tự

2001: Bản sơ bộ trình tự toàn bộ hệ gen người (Human Genome Project) được công bố

2007, tháng 9: Hoàn thành trình tự nucleotide của khoảng 1879 virus, 577 loài vi khuẩn và 23 sinh vật nhân chuẩn, trong đó một nửa là nấm (fungi). Hầu hết các vi khuẩn được giải trình tự là các loài gây bệnh. Những loài khác được chọn thường là

những loài mô hình. E. coli là loài mô hình cho vi khuẩn Gram âm, còn Bacillus subtilis là cho vi khuẩn Gram dương. Nấm men (Saccharomyces cerevisiae) được coi là sinh vật mô hình của tế bào nhân chuẩn, trong khi đó ruồi giấm Drosophila melanogaster có vai trò quan trọng trong di truyền học cổ điển (tiền phân tử, pre- molecular genetics). Giun tròn Caenorhabditis elegans đại diện cho các sinh vật đa bào. Cá zebrafish Brachydanio rerio thường được sử dụng cho nghiên cứu sinh học phát triển và cây hoa Arabidopsis thaliana điển hình cho thực vật có hoa. Cá Japanese pufferfish (Takifugu rubripes), cá spotted green pufferfish (Tetraodon nigroviridis) đại diện cho các hệ gen nhỏ mang rất ít trình tự DNA không mã hóa. Các loài động vật có vú như chó (Canis familiaris), chuột nâu Rattus norvegicus, chuột Mus musculus, và vượn (Pan troglodytes) là những loài động vật mô hình trong y học.

Phụ lục:

Thuật ngữ

Adenosine diphosphate (ADP). Một ribonucleoside 5’-diphosphate được cấu tạo từ adenine, đường ribose (5C) và hai gốc phosphate. ADP có tác dụng nhận phosphate trong chu trình năng lượng của tế bào.

Adenosine triphosphate (ATP). Một ribonucleoside 5’-triphosphate được cấu tạo từ adenine, đường ribose (5C) và ba gốc phosphate. ATP là phân tử chứa năng lượng hóa học chính của tế bào, chủ yếu được tập hợp trong ty thể (mitochondria) và lạp thể (chloroplast). Các gốc phosphate của ATP có mang các liên kết khi bị thủy phân sẽ phóng thích một năng lượng tự do lớn. Năng lượng của quá trình hô hấp hoặc quang hợp được sử dụng để tạo thành ATP từ ADP. Sau đó, ATP được biến đổi ngược lại thành ADP ở nhiều vùng khác nhau của tế bào, năng lượng phóng thíchra được dùng để điều khiển các phản ứng hóa sinh nội bào. Đôi khi cũng xảy ra sự thủy phân tiếp ADP thành những AMP (adenosine monophosphate) để phóng thích nhiều hơn.

Amino acid. Là một phân tử nhỏ mang một gốc amine (-NH3) và một gốc carboxyl

(-COOH) liên kết với cùng một nguyên tử carbon. Amino acid là đơn vị cấu trúc cơ sở của chuỗi

polypeptide. Có 20 amino acid khác nhau trên các chuỗi polypeptide có trong tự nhiên. Trình tự sắp

xếp của các amino acid trên chuỗi polypeptide quyết định cấu trúc và chức năng của polypeptide

và protein mà nó tạo thành.

BAC (bacteria artificial chromosome). Nhiễm sắc thể nhân tạo của vi khuẩn, dựa trên cơ sở

plasmid F-factor, được sử dụng làm vector tạo dòng. BAC có thể tái bản trong E. coli với các đoạn

chèn DNA có kích thước lên đến 300 kb.

Bản đồ cắt hạn chế (restriction map). Trình tự các vị trí nhận biết (recognition sites) của tất cả

các enzyme hạn chế (restriction enzyme hay restriction endonuclease, RE) trên một phân tử DNA.

Bazơ nitơ (nitrogen base). Loại phân tử cấu cấu tạo nên nucleic acid (DNA và RNA). Các nitrogen base có trong nucleic acid là adenine, guanine, cytosine và thymine (DNA) hoặc uracil

cơ thể sinh vật.

Bắt cặp bổ sung (complementary base pairing). Sự kết hợp thành từng đôi giữa các nitrogen base

nằm trên hai mạch đơn của chuỗi xoắn kép DNA-DNA, DNA-RNA hoặc RNA-RNA thông qua các mối liên kết hydrogen. Sự bắt cặp đó mang tính đặc hiệu: guanine bắt cặp với cytosine, còn adenine bắt cặp với thymine trên DNA hoặc uracil trên RNA.

Biến nạp (transformation). Là quá trình truyền DNA ngoại lai vào một tế bào nhận, chẳng hạn

sphaeroplast hoặc protoplast, và có thể hợp nhất trong nhiễm sắc thể nhờ sự tái tổ hợp tương đồng

hoặc được biến đổi trong một đơn vị sao chép tự trị (autonomous replicon). Sự biến nạp có thể xuất

hiện trong các điều kiện tự nhiên ở một số vi khuẩn (ví dụ: Bacillus, Haemophilus, Neisseria

Streptococcus), nhưng ở nhiều vi khuẩn (ví dụ: E. coli) và các cơ thể sinh vật eukaryote sự biến nạp

chỉ có thể xuất hiện ở những tế bào “thấm” được DNA bằng các phương pháp nhân tạo như: hóa

biến nạp, điện biến nạp..

Biến nạp bằng điện (electroporation). Kỹ thuật dùng xung điện tạo ra các lỗ thủng tạm thời trên màng sinh chất để đưa DNA ngoại lai vào bên trong tế bào vật chủ

Biến tính (denaturation). Là hiện tượng chuyển từ dạng mạch kép sang dạng mạch đơn của DNA và RNA thường do nhiệt gây nên. Biến tính của protein là hiện tượng chuyển từ cấu hình hoạt động

thành dạng không hoạt động.

Biểu hiện của gen (gene expression). Là các quá trình phiên mã (transcription) và dịch mã (translation) của một gen để tạo ra sản phẩm protein của nó.

Cặp base (base pair, bp). Là liên kết A-T hoặc C-G trên một phân tử DNA mạch kép, và là đơn vị đo chiều dài của một phân tử DNA.

Chromosome walking. Kỹ thuật này dùng để lập bản đồ nhiễm sắc thể từ tập hợp các đoạn DNA

cắt hạn chế chồng lên nhau (overlapping). Bắt đầu từ một thư viện trong đó chứa các đoạn DNA nói trên đã được tạo dòng. Một đoạn DNA mang một gen đã biết được lựa chọn và sử dụng như

một mẫu dò để nhận dạng (ví dụ: bằng cách lai khuẩn lạc) các đoạn khác, là các đoạn chồng lên nhau chứa cùng một gen. Sau đó, trình tự nucleotide của các đoạn này sẽ được phân tích và nhờ vậy

có thể xác định được toàn bộ các đoạn của nhiễm sắc thể. Từ đó, bản đồ của một vùng đặc biệt sẽ được xây dựng dần dần.

Chu trình sinh tan (lylic cycle). Một kiểu chu trình sống của thực khuẩn thể (bacteriophage) khi

sinh ra các bacteriophage thế hệ con, chui ra khỏi tế bào vi khuẩn sau khi phá vỡ tế bào đó.

C(lysogenic cycle). Là hiện tượng hệ gen của bacteriophage hiện diện ở trạng thái ổn định và không sinh tan trong tế bào vật chủ sống của nó. Các tế bào vật chủ có thể tiếp tục sinh trưởng và phân chia, và sự sao chép của hệ gen bacteriophage (prophage) được phối hợp với nhiễm sắc thể

của vật chủ sao cho khi tế bào phân chia thì prophage cũng được chuyển vào trong cả hai tế bào

con. Prophage được duy trì bằng cách hoặc hợp nhất trong nhiễm sắc thể vật chủ (ví dụ: bacteriophage λ, bacteriophage Φ105) hoặc như là một plasmid bên ngoài nhiễm sắc thể (ví dụ:

bacteriophage P1 và bacteriophage F116). Tế bào vật chủ có thể hoặc không thể biểu hiện ra một

kiểu hình biến đổi.

Chuỗi contig (contiguous sequence). Một đoạn trình tự dài được hình thành từ một số các đoạn

phân tử ngắn chồng lên nhau (overlapping).

Chuỗi khảm (concatemer). Phân tử DNA bao gồm nhiềuđoạn cá biệt nối với nhau thong qua các đầu dính.

Chuỗi mã hóa (coding sequence). Đoạn phân tử DNA mang mã di truyền xác định để phiên mã

thành mRNA và sau đó dịch mã thành chuỗi polypeptide.

Chuyển gen (transgenic). Quá trình chuyển một đoạn DNA ngoại lai (foreign DNA) bằng các kỹ

thuật khác nhau (Agrobacterium, vi tiêm, bắn gen, xung điện...) vào một cơ thể vật chủ (vi sinh vật, động vật hoặc thực vật).

Chuyển nhiễm (transfection). Kỹ thuật đưa DNA phage hoặc DNA virus vào các tế bào vật chủ.

Cosmid. Vector lai (hybrid vector) được cấu thành từ các đoạn trình tự của plasmid và các vị trí cos ( đầu dính) của bacteriophage λ.

Công nghệ DNA tái tổ hợp (DNA recombinant technology). Hệ thống các phương pháp phòng thí nghiệm cho phép cắt đoạn DNA từ một sinh vật để ghép nối vào DNA của một sinh vật khác tạo

ra phân tử DNA tái tổ hợp. Phân tử này được đưa vào các sinh vật khác nhau để tạo ra những giống

chủng vi sinh vật, thực vật và động vật mới có những phẩm chất đặc biệt, đáp ứng nhu cầu ngày càng cao của sản xuất và đời sống con người. Công nghệ này có ứng dụng rộng rãi trong y học, dược học, nông nghiệp và nhiều ngành công nghiệp khác.

Công nghệ sinh học (biotechnology). Theo nghĩa rộng là các quá trình công nghiệp có sử dụng vi

sinh vật hoặc các tế bào động vật và thực vật (công nghệ sinh học truyền thống ). Theo nghĩa phổ

nghệ DNA tái tổ hợp (công nghệ sinh học hiện đại).

Deoxyribonucleotide triphosphate (dNTP). Tiền chất đã được triphosphoryl hóa (“ năng lượng

cao”) cần thiết cho quá trình tổng hợp DNA. N được ký hiệu cho một trong bốn nitrogen base (A,

Một phần của tài liệu sinh học phân tử (Trang 55 - 61)