Vị trí khởi đầu và con đường di cư của chó

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu đa dạng di truyền quần thể chó phú quốc dựa trên trình tự HV1 thuộc vùng CR trên hệ gen ty thể (Trang 40 - 50)

(theo nguồnWang và cs. (2016) [96])

Oskarsson và cộng sự đã khảo sát sự phân bố của haplotype A29 vốn được xem là haplotype khởi thủy của chó dingo và các haplotype cổ Arc1 và Arc2 (thuộc vùng HV1, dài 263 nucleotide từ vị trí 15458 đến 15720) của chó vùng Polynesia [72] (Đa đảo) trên 674 mẫu chó ở vùng Đơng Nam Á và 232 mẫu chó dingo. Kết quả phân tích cho thấy từ trước thời kỳ đồ đá, chó từ trong đất liền vùng Đơng Nam Á, di cư sang Indonesia rồi từ đó tiếp tục di cư rồi phân hóa thành chó dingo châu Úc và chó ở vùng Polynesia ngày nay. Khảo sát cho thấy tất cả 232 cá thể chó dingo châu Úc đều mang haplotype A29 hoặc khác A29 một nucleotide [54].

Một nghiên cứu của Ardalan và cộng sự (2015) [9] trên vùng HV1 của 329 con chó khu vực châu Phi (trong đó có 139 con sống ở vùng Madagascar) cho thấy chó xuất hiện ở vùng Madagascar không phải từ những người thổ dân đầu tiên nói ngơn ngữ Nam Đảo (Austronesia), mà có mặt ở Madagascar cùng với việc di cư của con người ở những giai đoạn sau này.

1.4.2.3. Nghiên cứu về đa dạng di truyền của các giống chó

Ở mức độ giống, sự đa dạng di truyền ở DNA ty thể là rất cao. Hầu hết các giống khảo sát (với vài cá thể mỗi giống) đều có ít nhất là 3-6 trình tự khác nhau [95]. Do DNA ty thể được di truyền theo dòng mẹ, điều này cho thấy rằng nhiều con cái đã cùng góp phần vào sự hình thành các giống chó [93], [95]. Một số ít các giống chó có các trình tự chun biệt, cịn đa số các giống chó lại có trình tự DNA ty thể tương tự nhau. Mối liên hệ giữa các trình tự này khơng tương quan với mối quan hệ địa lý giữa các giống chó. Nguyên nhân của hiện tượng này có thể là do sự hình thành nhiều giống chó xảy ra mới chỉ cách đây vài trăm năm nên những đột biến trong vùng kiểm sốt đặc trưng giữa các giống chó cũng chưa hình thành.

Gundry và cộng sự (2007) đã tiến hành phân tích trình tự vùng CR của 125 con chó nhà (Canis familiaris) thuộc 43 giống và 2 con chó sói. Có tất cả 40 SNP được phát hiện trong 45 haplotype, trong đó có 26 SNP tốt nhất được lựa chọn để nhận diện cho tồn bộ các nhóm chó nhà lớn và vị trí nucleotide đa hình nhất được xác định là 15639. Phân tích của nghiên cứu này đã xây dựng một bộ dữ liệu tham khảo về vùng CR DNA ty thể nhằm phục vụ phân tích pháp y cũng như công tác xác định các giống [26]. Imes và cộng sự (2012) đã giải trình tự DNA ty thể của 100 con chó nhà (Canis lupus familiaris) và xác định được 35 haplotype dựa vào vùng HV1, trong đó có 23 haplotype đã được xác định, 11 haplotype lạ và 1 haplotype chưa rõ ràng. Các haplotype này được phân vào 4 nhóm A, B, C và D; trong đó 10 haplotype xuất hiện với tần số cao là A2, A3, A11, A16, A17, A18, A19, A20, A22, A26, B1, B6, C1, C3 và C5 [34], [55].

Nhiều cơng trình nghiên cứu cho thấy mật độ và tần suất xuất hiện các đột biến cao nhất tại vùng HV1 [11], [14], [34], [62], [73], [78]. Chính vì thế, nhiều nhóm nghiên cứu trên thế giới đã sử dụng các đoạn trình tự khác nhau trong vùng HV1 làm marker để phân tích, so sánh và đánh giá sự đa dạng di truyền cũng như tìm hiểu mối quan hệ di truyền giữa các giống chó hoặc giữa lồi chó với các lồi động vật khác.

Một cơng trình nghiên cứu của Himmelberger và cộng sự (2008) đã phát hiện một đoạn trình tự đặc biệt nằm ở vị trí 15.595 – 15.654 trên vùng HV1 DNA ty thể chó. Các vị trí đa hình này được xem như một công cụ tiềm năng và giá trị trong việc phân tích các mẫu DNA với số lượng ít hoặc bị suy thối trầm trọng. Ngồi ra, nhóm nghiên cứu cũng phân tích và tìm hiểu về đặc điểm di truyền của DNA ty thể chó nhà. Kết quả nghiên cứu cho thấy có 16 haplotype (44,44%) và 32 SNP (5,26%) được tìm thấy trong 36 cá thể. Tiếp tục so sánh với 201 trình tự chó nhà

(Canis lupus familiaris), 2 trình tự chó sói (Canis lupus) và 2 trình tự chó sói đồng

cỏ Bắc Mỹ (Canis latrans) phát hiện thấy 66 haplotype; trong đó, có 62 haplotype (99,94%) chỉ xuất hiện ở chó nhà và có 14 haplotype (22,58%) xuất hiện với tần số cao trong số 16 haplotype đã nhận diện [29]. Baute và cộng sự (2008) cũng đã sử dụng đoạn trình tự 60 cặp base của 83 cá thể chó nhà và xác định được 18 SNP (12,41%) và 19 haplotype (22,89%) nhằm phục vụ các phân tích pháp y. Kết quả của nghiên cứu nhấn mạnh sự mạnh mẽ và hữu hiệu khi sử dụng đoạn trình tự 60 cặp base trong việc sàng lọc nhanh chóng các mẫu phân tích cũng như giúp định loại các mẫu DNA bị suy thoái trầm trọng [11].

Sindičić và cộng sự (2011) sử dụng đoạn trình tự 281 cặp base vùng HV1 như là một công cụ để nhận diện loài và phân biệt chó sói với chó Croatia. Kết quả nghiên cứu đã xác định được 12 haplotype chó Croatia với 17 SNP (6,0%) và 4 haplotype chó sói với 11 SNP (3,9%). Các haplotype chó Croatia khác nhau từng đôi trong khoảng 1 (0,3%) đến 10 (3,6%) SNP; các haplotype sói khác nhau từng đôi trong khoảng 1 (0,3%) đến 9 (3,2%) SNP. Sự khác biệt giữa haplotype chó sói với chó Croatia từ 3 đến 12 SNP. Khơng có haplotype nào được chia sẻ giữa chó Croatia và chó sói cho thấy có thể sử dụng vùng HV1 để phân biệt các nhóm đối tượng khác nhau ở Croatia [77].

Cho rằng các đoạn trình tự 60 hay 281 cặp base không cung cấp đủ thông tin khi nghiên cứu mối quan hệ di truyền giữa các cá thể trên vùng địa lý lớn hơn, Savolainen đã mở rộng vùng trình tự khảo sát lên 582 cặp base để tìm hiểu sự đa dạng di truyền của các giống chó trên thế giới [74]. Li và Zang (2012) đã sử dụng

đoạn trình tự 582 cặp base của vùng HV1 để truy tìm nguồn gốc của chó Ngao Tây Tạng. Bằng cách so sánh trình tự nucleotide của chó Ngao Tây Tạng với các giống chó khác trên thế giới, kết quả cho thấy tỷ lệ haplotype của chó Ngao Tây Tạng là 30%, cao hơn so với chó khu vực Đơng Á (16,58%). Có tất cả 15 haplotype được phát hiện; trong đó, chó Ngao Tây Tạng cùng với chó sống ở cao nguyên Tây Tạng và chó Nhật Bản chia sẻ 3 haplotype A11, A19 và A29. Chứng tỏ chúng có mối liên kết với nhau về mặt di truyền [100].

Trình tự 585 cặp base vùng HV1 cũng được sử dụng để phân tích mối quan hệ di truyền giữa hai giống chó chăn cừu nổi tiếng của Thổ Nhĩ Kỳ: chó Kangal và chó Akbash. So sánh 105 trình tự của chó Kangal và 9 trình tự của chó Akbash cho thấy tỷ lệ xuất hiện SNP của chó Kangal (5,12%) cao hơn chó Akbash (3,08%) nhưng mức độ phát hiện haplotype của chó Akbash (55,56%) lại cao hơn chó Kangal (20,96%). Kết quả phân tích dựa trên đoạn trình tự 585 cặp base vùng HV1 cho thấy chó Kangal và chó Akbash khá khác biệt nhau về di truyền, với giá trị Fst 0,20856 thể hiện mức độ khác biệt khá cao. Ngồi ra, chó Kangal có mối quan hệ di truyền gần với chó Bắc Âu và Tây Nam Á hơn, trong khi chó Akbash lại có mối quan hệ di truyền gần với chó châu Âu và Đơng Á. Ngồi ra, chó Kangal mang một haplotype chỉ tìm thấy ở những con chó Bắc Âu, Bồ Đào Nha, Thổ Nhĩ Kỳ và một con chó Tây Ban Nha nhưng khơng có ở chó Akbash, Trung Đơng, châu Âu, Đơng Á và Ấn Độ [42].

Sự đa dạng di truyền vùng HV1 trong nội bộ các giống chó rất khác nhau, phản ánh mức độ cách ly về mặt địa lý của giống chó nghiên cứu. Castro Laboreiro là giống chó chăn cừu Bồ Đào Nha, được xếp vào giống chó cổ, kích thước lớn, được dùng trong chăn dắt và bảo vệ cừu, đặc biệt là trước sự tấn cơng của chó sói. Giống chó này bắt nguồn từ vùng đất hẻo lánh, chỉ được biết đến gần đây. Sự cách ly về mặt địa lý đã ảnh hưởng đến mức độ đa dạng di truyền vùng HV1 của giống chó này. Khảo sát trên 58 cá thể chó thuộc giống Castro Laboreiro chỉ phát hiện được 2 haplotype thuộc haplogroup A [90]. Như vậy, mức độ phát hiện haplotype chỉ là 2/58 (3,45%) và độ đa dạng haplotype được xác định là rất thấp: 0,1 ± 0,052.

Giống chó chăn bị Azores có nguồn gốc ở đảo São Miguel (Bồ Đào Nha) thì có mức độ phát hiện haplotype cao hơn (21,74%), độ đa dạng haplotype là 0,64 ± 0,065. Giống chó này có kích thước vừa, rất hung tợn và được sử dụng trong chăn nuôi gia súc cũng như canh gác, bảo vệ. Chó chăn bị Azores được cho là hình thành từ những con chó được những người Bồ Đào Nha, Tây Ban Nha, Bỉ, Pháp di cư và mang lên đảo từ thế kỷ 15. Do được hình thành từ nhiều cá thể chó có nguồn gốc địa lý khác nhau nên sự đa dạng di truyền vùng HV1 cũng ở mức cao hơn so với chó Castro Labreiro. Trong số 23 cá thể chó khảo sát, có 5 haplotype thuộc 3 haplogroup khác nhau được ghi nhận, đó là các haplotype A2, A5, A17, C3 và 1 haplotype thuộc haplogroup B [90]. Chó Shiba của Nhật Bản có nguồn gốc từ 3 dịng chó thuộc 3 vùng địa lý khác nhau: Shinshu Shiba từ Nagano, Mino Shiba từ Gifu, và San'in Shiba từ Tottori và Shimane [101] nên sự đa dạng di truyền vùng HV1 khá cao so với hai giống chó Bồ Đào Nha kể trên. Trong 28 cá thể chó khảo sát, mức độ phát hiện haplotype lên đến 28,57% với 8 haplotype khác nhau ghi nhận được, đạt mức độ đa dạng haplotype lên đến 0,8161 ± 0,0447 [51].

Như vậy, có thể thấy trình tự 582 cặp base của vùng CR DNA ty thể không những là cơng cụ đắc lực giúp tìm hiểu mối quan hệ di truyền giữa các giống chó mà cịn là cơng cụ hữu hiệu để truy tìm nguồn gốc tiến hóa cũng như mối quan hệ di truyền giữa các giống chó. Thơng qua việc xác định SNP và định loại haplotype có thể giúp phân biệt các cá thể trong quần thể; phân tích, đánh giá và so sánh mức độ đa dạng di truyền giữa các quần thể cùng lồi. Dựa vào tình hình nghiên cứu thực tế chung của thế giới, sự sẵn có của dữ liệu trong GenBank cũng như nguồn lực tài chính, vùng trình tự 582 cặp base DNA ty thể chó - đại diện cho vùng CR – được sử dụng trong đề tài này để khảo sát sự đa dạng di truyền, làm cơ sở tìm hiểu về nguồn gốc của chó lưng xốy Phú Quốc.

1.5. Cơ sở dữ liệu DNA GenBank và dữ liệu vùng trình tự HV1 DNA ty thể

1.5.1. Cơ sở dữ liệu DNA GenBank

Được phát triển và quản lý bởi Trung tâm thông tin Công nghệ Sinh học Quốc gia Hoa Kỳ (National Center for Biotechnology Information), GenBank là cơ sở dữ liệu lớn lưu trữ thơng tin các trình tự protein và nucleotide đã được giải trình tự. Nguồn dữ liệu của GenBank chủ yếu được đóng góp bởi các nhà khoa học trên tồn thế giới nhằm chia sẻ thơng tin về cơng trình nghiên cứu hoặc được xem như là một cơng đoạn trong q trình cơng bố kết quả nghiên cứu. GenBank, cùng với hai đối tác là Ngân hàng dữ liệu DNA Nhật Bản (DNA Data Bank of Japan – DDBJ) và cơ sở dữ liệu nucleotide của Phịng Thí nghiệm Sinh học phân tử châu Âu (European Molecular Biology Laboratory – EMBL) dù là những cơ sở dữ liệu riêng biệt nhưng có cơ chế trao đổi thơng tin hằng ngày nên thơng tin liên quan đến các trình tự sinh học nhanh chóng được lan truyền rộng khắp.

Với mục tiêu chia sẻ thông tin nhanh chóng, các trình tự DNA và protein trong cơ sở dữ liệu GenBank hầu như không được kiểm tra về mặt khoa học. Các trình tự khi được tác giả đệ trình lên GenBank sẽ chỉ được kiểm tra tự động về khả năng chứa các đoạn trình tự của vector được giải mã cùng trong quá trình giải mã trình tự, hoặc việc xác định vùng mang thơng tin mã hóa, thơng tin phân loại sinh vật hoặc sự chính xác của việc trích dẫn tài liệu tham khảo... Số lượng các trình tự nucleotide được lưu trữ trong GenBank trong những năm gần đây đã tăng lên rất nhanh, có thể do sự phát triển nhanh về các kỹ thuật giải trình tự trên thế giới. Vào tháng 12 năm 2010, GenBank lưu trữ 129.920.276 trình tự với 122.082.812.719 nucleotide, đến tháng 8 năm 2016, số lượng trình tự là 196.120.831 với 217.971.437.647 nucleotide. Có thể nhận thấy, với sự phát triển nhanh về mặt số lượng, sự chính xác về mặt khoa học của các trình tự DNA, protein có trong GenBank cũng là một trong những yếu tố được cân nhắc khi sử dụng trong nghiên cứu. Nhiều cơ sở dữ liệu về một nhóm protein hay DNA chuyên biệt đã được xây dựng nhằm tập hợp các trình tự về đối tượng quan tâm, biên tập dữ liệu, phát hiện và sửa chữa các sai sót trong dữ liệu trên GenBank để phục vụ các nghiên cứu xa

hơn, chẳng hạn cơ sở dữ liệu về Polyhydroxyalkanoates [41], TEM β-lactamases [87], dehydrogenases [88] hoặc các phần mềm máy tính được thiết kế để hiệu chỉnh dữ liệu về hệ gen vi khuẩn [75]... Các nghiên cứu này đã cho thấy nhiều trình tự được lưu trữ trong GenBank có sự sai lệch đáng kể giữa trình tự và thơng tin chú thích, hoặc khơng hợp lý trong việc xác định các biến thể..., chẳng hạn trình tự protein có mã số truy cập AAK82652.1 có các đột biến A25V, H26R, A184V và L250V nhưng được công bố là L21F, R164S, T265M [87].

1.5.2. Dữ liệu về trình tự vùng HV1 DNA ty thể trên GenBank

Nhiều nghiên cứu trên vùng HV1 của DNA ty thể đã được tiến hành và cơng bố trình tự DNA trên cơ sở dữ liệu GenBank. Bằng cách sử dụng chương trình BLAST với trình tự DNA ty thể được xem là trình tự chuẩn của chó (mã số GenBank U96639.2) với các thơng số tìm kiếm mặc định, 45415 trình tự DNA này thuộc 864 lồi và phân lồi khác nhau được tìm thấy có độ tương đồng với trình tự tìm kiếm ở các mức độ khác nhau. Trong số này có 1004 trình tự có nguồn gốc từ

Canis lupus và 4530 trình tự có nguồn gốc từ Canis lupus familiaris. Trong số 100

trình tự được lựa chọn ngẫu nhiên để đọc thơng tin lưu trữ thì chỉ có 1 trình tự có thơng tin về haplotype vùng HV1. Thử nghiệm sơ bộ cho thấy dù số lượng các trình tự vùng HV1 của chó được lưu trữ trong GenBank là tương đối lớn, nhưng thông tin về haplotype của trình tự thường thiếu trong các bản thơng tin.

Trong số các bản thông tin lưu trữ trong GenBank có thơng tin về haplotype, các trình tự DNA ty thể cũng được xác định haplotype theo nhiều hệ thống khác nhau. Vùng trình tự được sử dụng để xác định haplotype có thể là đoạn DNA nhỏ chỉ gồm 60 cặp base [11], hoặc đoạn bao gồm 582 cặp base [55], hay 660 cặp base [81] trong vùng HV1 của DNA ty thể, hay là thông tin kết hợp từ vùng 582 cặp base và vùng HV2 của DNA ty thể [92]. Trong số các đoạn trình tự DNA này, đoạn 582 cặp base được sử dụng phổ biến nhất trong những nghiên cứu hiện nay [9], [10], [55], [74], [91]. Dữ liệu về haplotype dựa theo hệ thống sử dụng 582 cặp base này chiếm đa số trong số các bản thông tin trong GenBank. Theo hệ thống này, các haplotype của DNA ty thể ở chó được chia thành 6 nhóm, tương ứng với 6

haplogroup được đặt tên từ A đến F. Một haplotype được đặt tên bằng cách ghép tên haplogroup (A, B, C, D, E, F) với một số thứ tự, chẳng hạn A19, B27. Hệ thống đánh số thứ tự tuyệt đối các nucleotide ở vùng kiểm sốt của chó cũng sử dụng hệ thống đặt tên các haplotype này [57].

Thơng tin về trình tự vùng HV1 của chó được lưu trữ nhiều trên GenBank cùng chung với nhiều trình tự DNA, protein của các loài sinh vật khác nhau. Tuy nhiên, các trình tự này, như đã đề cập ở trên, cần phải được phân tích, nghiên cứu kỹ để làm rõ, hiệu chỉnh các sai sót cho hợp lý trong các nghiên cứu về đa dạng di truyền của chó. Do đó, trước khi tiến hành các nghiên cứu về đa dạng di truyền của chó lưng xốy Phú Quốc, cần thiết phải có một cơ sở dữ liệu về trình tự vùng HV1 của chó, lưu trữ các dữ liệu đã được kiểm tra tính chính xác cũng như đảm báo tính thống nhất, đặc biệt là trong thơng tin về haplotype. Ngồi ra, cơng cụ giúp xác định

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu đa dạng di truyền quần thể chó phú quốc dựa trên trình tự HV1 thuộc vùng CR trên hệ gen ty thể (Trang 40 - 50)

Tải bản đầy đủ (PDF)

(159 trang)