Chƣơng II LƢỢC KHẢO TÀI LIỆU
2.6. Nhận diện vi khuẩn bằng kỹ thuật sinh học phân tử
2.6.1. Trình tự 16S rRNA
16S rRNA (16S ribosomal RNA) là một thành phần của tiểu đơn vị 30S cấu tạo nên ribosome ở tế bào sơ hạch. 16S rRNA dài khoảng 1542 nucleotide. Các gen mã hóa cho chúng đƣợc gọi là 16S rDNA (DNA ribosome) và đƣợc sử dụng để xây dựng cây phả hệ. Trong một tế bào vi khuẩn có thể tồn tại nhiều chuỗi 16S rRNA (Case et al., 2007).
16S rRNA có chức năng: (1) Tƣơng tự nhƣ 23S rRNA, 16S có vai trị cấu tạo nên cấu trúc của ribosome và hoạt động nhƣ các giàn giáo (scaffold) xác định vị trí của các phân tử protein ribosome. (2) Đầu 3’ chứa trình tự anti-Shine-Dalgarno giúp liên kết với bộ ba mã mở đầu (AUG) trên mRNA. (3) Tƣơng tác với 23S, hỗ trợ hình thành liên kết giữa hai bán đơn vị 30S và 50S. (4) Ổn định liên kết chính xác giữa bộ ba mã hóa và bộ ba đối mã tại vị trí A bằng việc hình thành liên kết hydro giữa nguyên tử N1 của Adenin tại vị trí 1492 và 1493 với gốc 2’OH của mạch sƣờn mRNA.
Trình tự gen 16S rRNA có chứa các vùng siêu biến nên có thể cung cấp các trình tự đặc hiệu để có thể định danh vi khuẩn. Phân tích trình tự gen 16S rRNA trở thành phƣơng pháp phổ biến để định danh vi khuẩn nhanh và chính xác (Clarridge, 2004). Woese là ngƣời tiên phong trong việc sử dụng 16S rRNA. Gen 16S rRNA đƣợc sử dụng trong các nghiên cứu về cây phát sinh loài (Weisburg et al., 1991) vì có tính bảo tồn cao giữa các loài vi khuẩn và cả cổ khuẩn (Coenye và Vandamme, 2003).
2.6.2. Mồi và cặp mồi tổng
Mồi (primer) là những đoạn DNA ngắn, có khả năng bắt cặp bổ sung với một đầu của mạch khuôn và DNA polymerase sẽ nối dài mồi để hình thành mạch mới; các mồi này gồm một mồi xuôi (forward primer) và mồi ngƣợc (reverse primer) [Trần Linh Thƣớc, 2005].
Cặp mồi tổng (Universal primer) là mồi đƣợc dùng trong phản ứng PCR để khuếch đại gen 16S rRNA. Các mồi này nhắm đến các gen có trình tự bảo tồn cao và khuếch đại các gen mục tiêu với các đoạn ngắn.
Thực hiện phản ứng PCR với cặp mồi tổng để khuếch đại gen 16S rRNA nhằm định danh và nghiên cứu thông tin về di truyền phả hệ. Phổ biến nhất là cặp mồi đƣợc thế kế bởi Weisburg et al. (1991) và hiện đang đƣợc gọi là 27F và 1492R.
2.6.3. Kỹ thuật PCR
Kỹ thuật PCR (Polymerase chain reaction), phản ứng tổng hợp dây chuyền nhờ polymerase, do Mullis phát minh năm 1985, là kỹ thuật nhân nhanh một đoạn phân tử DNA in vitro. Kỹ thuật này hiện đƣợc sử dụng phổ biến trong nhiều lĩnh vực thuộc về sinh học, đặc biệt trong lĩnh vực sinh học phân tử.
Nguyên tắc
PCR là phƣơng pháp tạo dịng in vitro, khơng cần hiện diện của tế bào. Kỹ thuật PCR đƣợc hình thành dựa trên đặc tính tổng hợp mạch DNA mới từ mạch khuôn của DNA polymerase với sự hiện diện của mồi chuyên biệt. PCR giúp khuếch đại một trình tự DNA ban đầu thành hàng triệu bản sao nhờ hoạt động của: enzyme polymerase, một cặp mồi đặc hiệu cho đoạn DNA này, các loại nucleotide tự do, dung dịch đệm và theo các chu kỳ nhiệt (Trần Linh Thƣớc, 2005). Phản ứng PCR là một chuỗi gồm nhiều chu kỳ nối tiếp nhau, lặp đi lặp lại nhiều lần. Số lƣợng DNA bản sao đƣợc tạo ra tăng theo cấp số nhân (2n
).
Mỗi chu kì phản ứng PCR gồm 3 bƣớc (Trần Linh Thƣớc, 2005):
Biến tính (denaturation): phân tử DNA đƣợc biến tính (mạch đơi DNA tách ra
thành hai mạch đơn) với nhiệt độ cao hơn nhiệt nóng chảy (Tm) của phân tử, thƣờng là 940C – 950C trong 30 – 60 giây.
Bắt cặp (anealing): Nhiệt độ hạ thấp hơn Tm của mồi, cho phép các mồi
chuyên biệt bắt cặp với trình tự DNA khn. Nhiệt độ 400C – 700C trong 30 – 60 giây.
Kéo dài (elongation): DNA polymerase tổng hợp mạch mới kể từ mồi đã bắt
polymerase chịu nhiệt) hoạt động tổng hợp tốt nhất. Thời gian tùy thuộc độ dài trình tự DNA cần khuếch đại mà có thể kéo dài từ 30 giây đến vài phút.
2.6.4. Kỹ thuật giải trình tự DNA
Kỹ thuật giải trình tự DNA (DNA sequencing) là kỹ thuật xác định tất cả những hợp phần do nucleotide hình thành nên phân tử DNA chuyên tính nào đó (Nguyễn Thị Lang và Bùi Chí Bửu, 2005). Hiện nay có 2 phƣơng pháp giải trình tự DNA là phƣơng pháp hóa học, phƣơng pháp dideoxy.
Giải trình tự DNA bằng phƣơng pháp hóa học do Maxam và Gilbert đề xuất năm 1977 nên còn gọi là phƣơng pháp Maxam và Gilbert. Phƣơng pháp này dựa trên cơ sở phân cắt hóa học tại vị trí đặc biệt của các base, tạo ra một phân tử DNA có đầu đƣợc đánh dấu, hình thành một phân tử đƣợc đánh dấu tận cùng bằng một base (A, hoặc G, hoặc C, hoặc T). Trình tự DNA có thể đƣợc đọc từ kết quả của các “ladder” hay còn gọi là “sequencing ladder”. (Nguyễn Thị Lang và Bùi Chí Bửu, 2005).
Giải trình tự DNA bằng phƣơng pháp dideoxy là kỹ thuật do Sanger et al. (1977) phát minh. Nguyên tắc cơ bản của phƣơng pháp này dựa vào hoạt động của enzyme DNA polymerase trong quá trình tổng hợp DNA. Enzyme DNA polymerase xúc tác gắn các nucleotide vào mạch đơn DNA đang tổng hợp ở vị trí 3’OH, khi gặp nucleotide khơng có nhóm 3’OH thì phản ứng tổng hợp bị dừng lại một cách ngẫu nhiên. Đặc trƣng của phƣơng pháp dideoxy là phản ứng đƣợc thực hiện riêng rẽ; thành phần phản ứng bao gồm DNA khuôn, DNA mồi, đầy đủ các loại dNTP, enzyme Taq DNA polymerase, dung dịch đệm và các điều kiện thích hợp đồng thời có thêm khoảng 1% mỗi loại ddNTP (dideoxynucleotide: ddATP, ddGTP, ddCTP, ddTTP - Các dideoxynucleotide mất hai nguyên tử oxy ở vị thí C3 và C2). Kết quả phản ứng tổng hợp nên các đoạn oligonucleotide dài ngắn khác nhau một nucleotide, có thể nhận biết nhờ phƣơng pháp điện di (Khuất Hữu Thanh, 2006).
Ngày nay, giải trình tự gen bằng máy giải trình tự tự động đã trở nên phổ biến. Nguyên tắc chung của máy giải trình tự là dựa trên cơ sở phƣơng pháp dideoxy. Máy đọc trình tự cả trên hai mạch đơn, do vậy có thể phát hiện và giảm nhầm lẫn do kỹ thuật. Có hai loại mồi (mồi xuôi và mồi ngƣợc) đƣợc sử dụng cho mỗi mạch đơn DNA. Tiến hành biến tính DNA trong mơi trƣờng có urea và nhiệt độ cao (khoảng 550C), hai mạch đơn DNA tách rời nhau không bắt cặp lại với nhau. Chùm tia laser
đánh dấu vị trí và thời gian đi qua của các nucleotide, từ đó tổng hợp đƣợc trình tự sắp xếp của gen (Khuất Hữu Thanh, 2006).
2.6.5. Công cụ BLAST
Trong tin sinh học, BLAST (Basic Local Alignment Search Tool) là một thuật tốn dùng để so sánh thơng tin của các chuỗi sinh học, chẳng hạn nhƣ các chuỗi amino acid của các phân tử protein khác nhau hoặc nucleotide của các chuỗi DNA. Có 5 chƣơng trình BLAST, các chƣơng trình BLAST đƣợc thiết kế bởi Altschul et al. (1990) tại NIH và đã đƣợc xuất bản trên tạp chí sinh học phân tử năm 1990 (Altschul et al., 1990). Trong đó BLAST N (Nucleotide BLAST) cho phép so sánh cấu trúc chuỗi nucleotide cần phân tích với cấu trúc chuỗi nucleotide trong ngân hàng dữ liệu.
BLAST cho phép so sánh cấu trúc của chuỗi DNA, chuỗi amino acid cần phân tích với các chuỗi tƣơng ứng lƣu trữ trong ngân hàng dữ liệu, nhằm tìm kiếm chuỗi (hay một số chuỗi) tƣơng đồng nhất với chuỗi cần kiểm tra. Trọng tâm của kỹ thuật phân tích là tìm kiếm xác định các vùng tƣơng đồng nhau về cấu trúc trên các chuỗi để xác định mức độ phân ly tƣơng đối của chuỗi cần phân tích với chuỗi khác trong ngân hàng dữ liệu. Về phƣơng diện kỹ thuật, BLAST cho phép phát hiện sự tƣơng đồng ở hai mức độ là mang tính cục bộ ở một vùng hay mang tính tổng thể giữa hai chuỗi với nhau.
2.6.6. Phân tích phát sinh lồi
Trong sinh học, Phylogenetics là ngành khoa học nghiên cứu mối quan hệ tiến hóa giữa các nhóm sinh vật (nhƣ lồi, quần thể,…) dựa vào dữ liệu các trình tự phân tử hay ma trận dữ liệu về hình thái. Thuật ngữ “Phylogenetics” xuất phát từ sự kết hợp hai từ gốc Hy Lạp: “phylo” có nghĩa là quần thể (bộ tộc) hay loài và “genesis” có nghĩa là nguồn gốc hay khai sinh. Vậy “Phylogenetics” đƣợc tạm dịch là sự phát sinh lồi.
Phân tích phát sinh lồi (hay cịn gọi là phân tích phả hệ) là phƣơng tiện suy luận, ƣớc tính các mối quan hệ. Lịch sử tiến hóa đƣợc suy luận từ phân tích phát sinh lồi, thƣờng đƣợc mơ tả bằng biểu đồ hình cây phân nhánh trong đó thể hiện các mối quan hệ di truyền giữa các phân tử (phân tử di truyền), các sinh vật hay cả hai (Brinkman và Leipe, 2001).
Theo Brinkman và Leipe (2001) quá trình phân tích phát sinh lồi có thể chia thành 4 bƣớc cơ bản sau:
1. Alignment (xắp sếp theo kiểu so sánh giữ các trình tự)
[bao gồm cả việc xây dựng kiểu cơ sở dữ liệu và xuất thành một dãy dữ liệu chứa các trình tự cần phân tích].
2. Lựa chọn phƣơng pháp xây dựng, kiểm tra và các phƣơng pháp bổ sung khác
3. Xây dựng cây phát sinh loài hay cây phả hệ (phylogenic tree) 4. Đánh giá cây phát sinh loài
Khi xây dựng cây phát sinh loài từ một ma trận dữ liệu, có thể sử dụng phƣơng pháp khoảng cách (Distance based method) [có phƣơng pháp UPGMA, phƣơng pháp neighbor joining] hay phƣơng pháp đặc tính (Character based method) [có phƣơng pháp Minimum Parsimony và phƣơng pháp MaximumLikelihood]. Hiện nay có rất nhiều các phần mền có thể thực hiện phân tích phát sinh lồi nhƣ ClustalW, PAUP*, PUZZLE (hay TREE-PUZZLE), PHYLIP, … (Brinkman và Leipe, 2001).
Khi đánh giá cây phát sinh loài, các nhà nghiên cứu trƣớc đây thƣờng sử dụng phƣơng pháp kiểm tra sai lệch (Skewness test) hay kiểm tra hoán vị (Permutation test). Sau này các nhà nghiên cứu thƣờng sử dụng phƣơng pháp kiểm tra tỉ lệ xuất hiện (Likelihood ratio test) để đánh giá các cây phả hệ. Bootstrapping là phƣơng pháp đánh giá cây phát sinh lồi có lặp lại, các cây này đƣợc xây dựng (vẽ) dựa trên các phƣơng pháp Distance, Minimum Parsimony, Maximum Likelihood vả cả các phƣơng pháp khác. Bootstrapping đƣợc phát minh năm 1979 (Efron, 1979) và đƣợc giới thiệu nhƣ là phƣơng pháp đánh giá cây phát sinh loài bởi Felsenstein (1985). Kết quả phân tích bootstraping là giá trị bootstrap (theo phần trăm) gắn liền với một nhánh đặc biệt thể hiện mối liên hệ của các thành viên trong nhánh.