Phƣơng pháp mã vạch ADN ứng dụng trong nhận dạng các loài động vật

Một phần của tài liệu Xây dựng cơ sở dữ liệu sinh học phân tử trong nhận dạng các loài động vật hoang dã phục vụ thực thi pháp luật và nghiên cứu đa dạng sinh học tại Việt Nam (Trang 47)

vật hoang dã

Ứng dụng công nghệ dựa trên ADN vào việc điều tra tội phạm buôn bán và tiêu thụ động vật hoang dã đã mở ra khả năng tăng cƣờng hiệu quả thực thi pháp

Lê Thị Phƣơng – K18CHKHMT 48 luật. Ví dụ trong trƣờng hợp sử dụng kính kiển vi để xác định loài đƣợc cho là Linh dƣơng Tây Tạng từ những chiếc khăn quàng đƣợc dệt, việc xác định tới cấp độ loài có thể đƣợc thực hiện bằng cách sử dụng việc xác định kiểu ADN nơi mà kết quả không dựa vào phán đoán chủ quan của ngƣời kiểm tra. [13]

*Các bƣớc thực hiện

- Thu thập mẫu vật động vật hoang dã trong khu vực hoặc vùng lân cận. - Chiết xuất và tinh chế ADN từ mẫu mô hoặc vật liệu đƣợc chế biến.

- Khuếch đại một khu vực cụ thể của gen lục lạp hoặc ty lạp thể bằng cách PCR và phân tích sản phẩm PCR bằng phản ứng điện li keo.

- Sử dụng Blast (Basic Local Alignment Search Tool ) để nhận diện các trình tự trong cơ sở dữ liệu.

- Sử dụng các công cụ sắp xếp nhiều trình tự và xây dựng cây để phân tích các mối quan hệ phát sinh loài.

* Vai trò của ADN

Bộ gen ty thể ở tế bào nhân chuẩn có 37 gen, 22 gen mã hóa ARN vận chuyển (tARN), 2 gen mã hóa ARN ribosomal (rARN) và 13 gen khác mã hóa protein chủ yếu liên quan đến quá trình hô hấp oxi hóa. Số lƣợng gen trên hệ gen ty thể phần lớn là bất biến cho tất cả các hệ gen ty thể của các loài động vật có xƣơng sống nhƣng thứ tự của các gen có thể thay đổi. Thứ tự của các vị trí trên hệ gen ty thể thì tƣơng tự nhau trong các loài động vật có vú nhƣng có thể khác nhau giữa các bậc phân loại: ví dụ thứ tự khác nhau giữa gen ty thể của gia cầm và động vật có vú. [13]

Một lý do chính cho việc sử dụng ADN ty thể (mtADN) là không có một sự tái tổ hợp của mtADN. Với tất cả các thành phần mã hóa của hệ gen ty thể mã hóa cho protein hoặc phân tử ARN liên quan đến hô hấp, ngƣời ta hi vọng rằng sẽ có

Lê Thị Phƣơng – K18CHKHMT 49 một sự bảo vệ các trình tự khi bất kỳ một sự thay đổi nào ở protein hoặc phân tử ARN có thể tác động tiêu cực đến sinh vật. Không giống nhƣ hạt nhân, không có lỗi xảy ra trong việc đọc enzyme tồn tại trong ty thể để sữa chữa những gốc ADN đƣợc thêm vào một cách không chính xác trong suốt quá trình sao chép. Do vậy, sự tích tụ của những thay đổi cơ sở riêng lẻ trong ty thể là cao hơn gấp 5 lần so với những lỗi do sự sao chép trong hạt nhân. Ngoài ra có nhiều bản sao của ADN ty thể trên 1 tế bào so với 2 bản sao của ADN hạt nhân. Trong mỗi tế bào có nhiều ty thể phụ thuộc vào loại tế bào và trong mỗi ty thể có nhiều ADN ty thể. Các ty thể có một lớp protein để bảo vệ các mtADN khỏi sự phân hủy. Các vật liệu sinh học đã bị phân hủy cao , do đó, có khả năng tuân theo việc xác định kiểu mtADN nhiều hơn là sự cần thiết sinh ra một hồ sơ di truyền từ ADN hạt nhân khi xác định kiểu răng, xƣơng hoặc tóc.[13]

*Vị trí gen đƣợc sử dụng trong phân loại

Các vị trí gen của sự lựa chọn cho nhận dạng pháp y các loài đƣợc dựa vào các nghiên cứu có nguồn gốc từ phân loại và cây phát sinh loài và chủ yếu đƣợc tìm thấy ở bộ gen ty thể. Trong phạm vi mtADN một số trình tự gen đƣợc cho là thể hiện ít sự biến đổi trong cùng chủng loại (trong các thành viên của cùng một loài) nhƣng lại thể hiện đầy đủ sự biến đổi không trong chủng loại (giữa các loài khác nhau) để cho phép ƣớc lƣợng về mức độ liên quan và số lần sai khác qua đồng hồ phân tử đƣợc hiệu chỉnh. Vị trí chính đƣợc sử dụng trong các nghiên cứu về phân loại và phát sinh chủng loại cho đến gần đây là gen cytocrome b (cyt b) cái mà xuất hiện giữa hai bazo 14747 và 15887 trong mtADN của ngƣời và mã hóa 1 protein có chiều dài 380 amino axit. Vị trí cyt b đã đƣợc sử dụng rộng rãi trong các nghiên cứu phân loại và pháp y, bao gồm các bộ phận cơ thể của hổ, trứng rùa, vỏ và da cá sấu, sừng tê giác, ngà voi, con công trống , mật gấu. Gần đây hơn, việc sử dụng gen cytochrome c oxidase I (COI) đã tăng lên chủ yếu do sự thông qua của tổ chức mã vạch của sự sống (Barcod of life consortium- CBOL). COI đƣợc tìm thấy giữa các bazo 5904 và 7945 ở mtADN ngƣời. COI ban đầu đƣợc sử dụng để nhận dạng các

Lê Thị Phƣơng – K18CHKHMT 50 loài động vật không xƣơng sống. Chẳng bao lâu sau nó đã trở thành vị trí lựa chọn trong côn trùng học pháp y để nhận dạng ấu trùng bọ cánh cứng trên xác chết. Vì đây là một vị trí có thể nhận dạng những loài này, nó đã đƣợc sử dụng nhiều hơn với mục tiêu trở thành vị trí đƣợc lựa chọn cho nhận dạng tất cả các loài động vật.[13]

Các vị trí gen khác trên hệ gen ty thể cũng đã đƣợc sử dụng trong nhận dạng một số loài. Chúng bao gồm các vị trí rARN 12s và 16s và họ gen NDH. D- loop (Displacement- loop) đƣợc sử dụng ít trong nhận dạng các loài nhƣng nhiều hơn trong nhận dạng các loài trong cùng chủng loại. Bởi vì sự biến đổi lớn hơn ở các trình tự không đƣợc mã hóa, nó bây giờ đang đƣợc sử dụng nhƣ một công cụ để nhận dạng sự có mặt của một loài đặc biệt trong hỗn hợp nhiều loài khác nhau.[13]

*Các vị trí gen ty thể sử dụng trong phân loại

Quá trình nhận dạng các loài trong khoa học pháp y đang trở nên thƣờng xuyên hơn nhƣng vẫn chƣa đƣợc chuẩn hóa tới một vị trí gen duy nhất. Bất chấp vị trí gen đƣợc sử dụng, quá trình tƣơng tự không đƣợc biết, hoặc đƣợc đặt câu hỏi, mẫu vẫn đƣợc phân tích bằng cách khuếch đại một phần của gen, chủ yếu là một phần gen cyt b hoặc COI. Đoạn PCR (polymerase chain reaction) này sau đó đƣợc chạy trình tự một cách trực tiếp và trình tự ADN sẽ đƣợc so sánh với các trình tự ADN từ một ngân hàng dữ liệu mở nhƣ Genbank. Không chắc chắn rằng sẽ có một mẫu tham khảo từ một loài đã biết cho việc so sánh trực tiếp, vì vậy có một sự phụ thuộc vào dữ liệu trình tự ADN trên cơ sở dữ liệu. Genbank hiện có hơn 108 triệu trình tự (tháng 08/2009), và do đó, có một khả năng cao là mẫu chƣa đƣợc biết sẽ phù hợp với một trình tự ADN từ một mẫu tham khảo đƣợc gửi lên cơ sở dữ liệu. Trong trƣờng hợp có 100% sự tƣơng đồng thì chúng ta có thể chắc chắn rằng mẫu không đƣợc biết là một thành viên của loài mà có trình tự ADN phù hợp với nó. Hình dƣới đây chỉ ra sự tƣơng thích của một trình tự của mẫu lấy từ khăn choàng đƣợc dệt từ lông của Linh Dƣơng Tây Tạng (P. hodgsonii) với trình tự trên cơ sở dữ

Lê Thị Phƣơng – K18CHKHMT 51 liệu của Genbank. Hình 14a và 14b dƣới đây chỉ ra một phần nhỏ trình tự ADN gen cyt b và sự khác nhau cho 4 loài của chúng. Hình 14a chỉ ra cặp bazo 121- 241 của gen cyt b cho loài linh dƣơng Tây Tạng (accession number AF034724) so với các loài động vật có vú với sự tƣơng đồng gần nhất với một phần của trình tự; là cừu (Ovis aries: accession AB0068000), the Pyrenean Chamoix (Rupicapra pyrenaica: accession number AF034726) và một con dê (Capra sumatrensis: accession number AY669321). Trình tự chƣa đƣợc biết đến từ một chiếc khăn choàng bị nghi ngờ là lấy từ bộ lông của linh dƣơng Tây Tạng.[13]

Hình 14b cho thấy số lƣợng cặp bazo sai khác giữa bốn loài (đáy của hình tam giác) và tỷ lệ phần trăm tƣơng tự qua 120 cặp. Thông thƣờng ngƣời ta thƣờng sử dụng trên 400 cặp bazo để tìm kiếm sự tƣơng tự nhƣng trên đây là nghiên cứu thử nghiệm nên chỉ sử dụng 120 cặp. 121 131 141 151 161 171 181 Unknown1 TTGGTTTTACAAATCCTAACAGGCCTATTCCTAGCAATACACTACACATCTGATACAAC A Pantholops TTGGTTTTACAAATCCTAACAGGCCTATTCCTAGCAATACACTACACATCTGATACAAC A Ovis TTAATTTTACAGATTCTAACAGGCCTATTCCTAGCAATACACTATACACCCGACACAAC A Rupricapra TTAATTTTACAGATCCTAACGGGCCTATTCCTAGCAATACACTACACATCTGACACAAC A Capra CTAATTCTACAAATCCTAACAGGCCTATTCCTAGCAATACACTACACATCCGATACAAC G

Lê Thị Phƣơng – K18CHKHMT 52 182 191 201 211 221 231 241 Unknown1 ACAGCATTCTCTTCTGTAACCCACATTTGCCGAGATGTTAACTATGGCTGAATTATTCGA Pantholops ACAGCATTCTCTTCTGTAACCCACATTTGCCGAGATGTTAACTATGGCTGAATTATTCGA Ovis ACAGCATTCTCCTCTGTAACCCACATTTGCCGAGACGTGAACTATGGCTGAATTATCCG A Rupricapra ATAGCATTCTCCTCTGTAACCCACATTTGCCGAGATGTAAACTACGGCTGAATCATCCG A Capra ACAGCATTTTCTTCTGTAACACACATTTGCCGAGACGTAAACTATGGCTGAATTATCCG A

Hình14a: Đoạn gen cyt b từ cặp bazo 121-241 của bốn loài và loài chƣa biết.

Pantholops Ovis Rupricapra Capra Unknown 1

Pantholops 90.00 91.67 90.84 100.00

Ovis 12 91.67 90.84 90.00

Rupricapra 10 10 88.33 91.67

Capra 11 11 14 90.84

Unknown 1 0 12 10 11

Hình 14b: So sánh số cặp bazo sai khác và % tƣơng đồng qua 120 cặp bazo

Sự sẵn có của những cơ sở dữ liệu ADN đƣợc truy cập mở đã mang đến nhiều thuận lợi nhƣng cũng luôn tồn tại những rủi ro nhất định. Điều này là bởi vì những trình tự ADN đƣợc đăng ký ở Genbank đã không yêu cầu rằng mẫu trƣớc

Lê Thị Phƣơng – K18CHKHMT 53 tiên phải đến từ mẫu vật chứng từ ví dụ nhƣ các mẫu từ viện bảo tàng cái mà đƣợc coi nhƣ mẫu chứng từ đã đã đƣợc phát hiện là nhầm lẫn. Chẳng hạn nhƣ trong một nghiên cứu về nấm ngƣời ta đã phát hiện ra rằng có khoảng 20% các trình tự đƣợc đăng ký có thể bị xác định nhầm. Tuy nhiên các cơ sở dữ liệu trực tuyến và công cộng đang phát triển theo một tốc độ cấp số nhân, nhiều trình tự hơn sẽ đƣợc thêm vào cơ sở dữ liệu.và quan trọng hơn nhiều trình tự từ các loài giống nhau đƣợc thêm vào, điều này làm cho chúng ta dễ dàng nhận dạng hơn và có thể loại bỏ các trình tự nhầm lẫn. Nếu bất kỳ trình tự nào có sự sai khác lớn nhất với các trình tự khác thì trình tự khác thƣờng này sẽ nằm ở cuối trong danh sách. Điều này không chỉ cho thấy lợi ích của việc có nhiều trình tự khác nhau cho cùng một loài mà còn chỉ ra khả năng sẽ nhận dạng nhầm nếu chỉ có một trình tự cho một loài cụ thể ở một vị trí gen cụ thể.[13] (adsbygoogle = window.adsbygoogle || []).push({});

Nếu các trình tự ADN từ các mẫu không đƣợc biết cho thấy một sự phù hợp 100% với trình tự tham khảo cho P. hodgsonii và 84% với loài gần nhất tiếp theo thì có thể chắc chắn rằng mẫu chƣa đƣợc biết chính là Linh Dƣơng Tây Tạng. Sự chắc chắn này đã đặt ra câu hỏi mẫu đến từ Linh dƣơng Tây Tạng và không phải là một số loài khác giả sử nhƣ: (1) tất cả các loài đƣợc đƣa ra trên cơ sở dữ liệu và không có một loài nào có cùng trình tự ADN đƣợc phân tích, (2) tất cả các thành viên của Linh dƣơng Tây Tạng có cùng một trình tự ADN nhƣ đã đƣợc đăng ký trên Genbank (không có biến dị trong cùng loài) và (3) dữ liệu trình tự cho loài gần nhất tiếp theo (theo hình trên là loài dê) cũng là đại diện cho loài này và không một thành viên nào của loài này, ngẫu nhiên, có trình tự tƣơng tự nhƣ trình tự của mẫu đƣợc yêu cầu. Cho đến gần đây vẫn chƣa có một nghiên cứu nào định lƣợng biến thể trong loài trong phạm vi các vị trí gen đƣợc sử dụng cho nhận dạng loài. Một nghiên cứu nhƣ vậy sẽ giải quyết các giả định trên và cung cấp một giá trị cho sự chắc chắn về sự phù hợp 100%. Nó cũng sẽ giải quyết vấn đề liên quan tới sự phù hợp 99% hoặc nhỏ hơn để xác định liệu bất kỳ sự biến đổi trình tự có phải là do biến dị trong loài hay không.[13]

Lê Thị Phƣơng – K18CHKHMT 54 Trƣờng hợp của cyt b và COI các việc thực hành nhìn chung là để khuếch đại một phần gen cho việc phân tích trình tự. Hơn nữa, nhiều mẫu đƣợc kiểm tra có thể ở dạng vết, có nhiều chất ức chế quá trình PCR, và bị phân hủy cao. Trong trƣờng hợp đoạn cyt b của gen đƣợc sử dụng thông thƣờng là 400 bazo đầu tiên và trong trƣờng hợp sử dụng COI là khoảng 600 cặp và không ít hơn 500 bazo.

*Sự biến đổi trong loài và khác loài gen Cyt b và COI

Bằng cách sử dụng mô hình2 tham số Kimura (K2P- Kimura 2-parameter model), nhìn chung các tác giả nhận định rằng sự thay đổi trong cùng loài nằm trong phạm vi < 2-3% (giữa 7.93% và 0.43% với loài chim cho COI; giữa 5.7% và 1.5% với loài Stenella cho Cyt b). Khi những bất thƣờng nảy sinh, điều này đƣợc hiểu là các loài ẩn sinh mặc dù các loài ẩn sinh này có thể đƣợc dựa vào biến đổi trong loài từ chỉ 2 cá thể. Ví dụ cụ thể này liên quan đến một loài chim Bắc mỹ. Một nghiên cứu đƣợc thực hiện bởi Kartavtsev và Lee đã điều tra các loại nucleotit giữa cyt b và COI ở mức độ loài, chi và quần thể. Họ đã phân tích một phạm vi rộng của các loài động vật có xƣơng sống và không có xƣơng sống nhƣng đã hợp nhất tất cả các kết quả mà không tách biệt thành các lớp khác nhau. Họ đã xác định rằng bất kỳ hai mẫu nào gần gũi hơn dựa theo phân loại, chúng sẽ gần gũi hơn về mặt di truyền dựa theo khoảng cách – p (tƣơng tự K2P nhƣng không có sự phân biệt giữa xác suất cho sự chuyển tiếp và sự chuyển đổi nhƣ hình dƣới). Các nghiên cứu của Kartavtsev và Lee đã chỉ ra rằng các giá trị đƣợc đề nghị cho cả hai gen này xuất hiện là chính xác. Tuy nhiên, rõ ràng chúng ta có thể thấy đƣợc có một sự chồng chéo giữa sự biến đổi trong loài và khác loài của COI với các loài anh chị em.

Lê Thị Phƣơng – K18CHKHMT 55

Hình 15: Một minh họa cho sự thay đổi dựa vào khoảng cách – P của cả hai vị trí gen cyt b (màu đen) và COI (màu đỏ) bằng cách sử dụng các nhóm động vật phân loại khác nhau. Nhóm 1 là những thay đổi trong phạm vi một loài; nhóm 2 là biến đổi giữa các loài anh chị em; nhóm 3 là thay đổi giữa các loài trong phạm vi cùng một chi và nhóm 4 là biến đổi giữa các loài trong các chi khác nhau nhƣng cùng một họ. Hình vuông trung tâm chỉ ra giá trị trung bình, hộp lớn hơn là sai số chuẩn (SE) ± 1.00 và các vạch ở các phía của hộp thể hiện sai số chuẩn ± 1.96. Đồ thị này thì đƣợc chuyển thể từ kết quả nghiên cứu của Kartavtsev và Lee.

Một nghiên cứu gần đây của Tobe et al, điều tra chỉ ở nhóm động vật có vú với các trình tự gen Cyt b và COI đã đƣợc so sánh cho 217 loài động vật có vú khác nhau để đánh giá sự biến đổi của các loài khác loài, 945 ngƣời, 130 gia súc nuôi trong nhà và 35 chó nuôi trong nhà để đánh giá biến dị trong cùng loài. Những dữ liệu này đã chỉ ra một khoảng cách giữa sự thay đổi đƣợc nhìn thấy lớn nhất trong cùng loài (1.5%) với sự thay đổi gần nhất khác loài (2.5%), dựa trên giá trị K2P.

Lê Thị Phƣơng – K18CHKHMT 56 Một ngƣỡng có thể ứng dụng cho việc đƣa ra dự đoán về sự biến đổi lớn nhất trong và khác loài.

Bằng cách liên kết tất cả các bộ dữ liệu lại với nhau, gần 1 triệu so sánh K2P đã đƣợc thực hiện. Kết quả của họ chỉ ra rằng mặc dù cả hai loài thì tƣơng tự nhau trong khả năng phân biệt các loài cụ thể, cyt b đã thể hiện tốt hơn so với COI. Một ngƣỡng K2P ở 1.5 chỉ ra rằng, với COI, tỷ lệ sai số dƣơng là 4.85x10-4

và giá trị dƣơng dự đoán là 0.9995, trong khi đó với cyt b, tỷ lệ sai số dƣơng tính là 2.02x10-4 và giá trị dƣơng đƣợc dự đoán là 0.998. Những số liệu này chỉ ra rằng cả hai vị trí gen đã thể hiện một độ chắc chắn cao trong việc nhận dạng các loài nếu dữ liệu nằm trong ranh giới cùng loài nhƣng thậm chí khả năng nhầm lẫn là ít hơn nếu sử dụng cyt b. Nhƣ là một thí nghiệm mở rộng của 2 gen, Tobe at el đã xây dựng các cây phát sinh loài bằng cách sử dụng dữ liệu trình tự cho mỗi gen. Họ đã nhận thấy rằng

Một phần của tài liệu Xây dựng cơ sở dữ liệu sinh học phân tử trong nhận dạng các loài động vật hoang dã phục vụ thực thi pháp luật và nghiên cứu đa dạng sinh học tại Việt Nam (Trang 47)