Haplogroup Bộ đột biến đặc trƣng B C15526, T15612, C15632, T15639, G15652, T15800, C15814 C15955 C C15508, C15526, T15639, T15650, T15800, C15912, C15955 D T15625, C15632, T15636, T15639, T15800, C15814, T15815, G15848, C15912, C15959 E C15526, A15553, T15639, G15652, T15800, C15814, C15912, G15938 F A15490, T15523, T15611, A15627, T15628, T15639, G15652, T15800, C15814, C15912
Các bộ đột biến đặc trưng cho các haplogroup này sẽ được sử dụng cho việc nhận diện haplogroup của một trình tự có haplotype mới. Chương trình máy tính “Haplotype identifier” đã được xây dựng trên cơ sở phân tích trình tự truy vấn để xác định các đột biến, dựa trên các đột biến đặc trưng của haplotype đã biết hoặc của các haplogroup để xác định haplotype của trình tự hoặc haplogroup của trình tự (trong trường hợp là haplotype mới chưa được đặt tên).
Để đánh giá hiệu quả của công cụ định loại haplotype, 50 trình tự được lựa chọn ngẫu nhiên từ cơ sở dữ liệu sẽ được đưa vào công cụ để xác định haplotype. Đồng thời, các trình tự này cũng được sử dụng cùng với 319 trình tự có haplotype đã được công bố để xây dựng cây phát sinh chủng loại bằng phương pháp Neighbor-Joining với 2000 lần lặp lại. Sáu trình tự tương ứng của Canis latrans
được sử dụng làm nhóm ngoại. Trong 50 trình tự này, cơng cụ xác định haplotype nhận diện được 27 trình tự thuộc haplogroup A, trong đó có 20 trình tự có haplotype đã biết, 7 trình tự có haplotype mới; 11 trình tự thuộc haplogroup B bao gồm 7 trình tự có haplotype đã biết và 4 trình tự có haplotype mới; 5 trình tự thuộc haplogroup C bao gồm 4 trình tự có haplotype đã biết và 1 trình tự có haplotype mới; 3 trình tự có haplotype đã biết thuộc haplogroup D; 3 trình tự thuộc haplogroup E gồm 1 trình tự có haplotype đã biết và 2 trình tự có haplotype mới; và 1 trình tự có haplotype mới thuộc haplogroup F (Bảng 3.4).
Bảng 3.4: Xác định haplotype của 50 trình tự bằng cơng cụ xác định haplotype và bằng cây phát sinh chủng loại
STT Mã số
GenBank Haplotype identifier
Cây phát sinh chủng loại
1 KM061511.1 A1 Haplogroup A
2 AB605501.1 A1 Haplogroup A
3 KJ637099.1 A5 Haplogroup A
4 EU223487.1 A11 Haplogroup A
5 KM061549.1 A11 Haplogroup A
6 EF122414.1 A16 Haplogroup A
7 JF342851.1 A17 Haplogroup A
8 D83617.1 A17 Haplogroup A
STT Mã số
GenBank Haplotype identifier
Cây phát sinh chủng loại
10 JF342812.1 A18 Haplogroup A
11 HQ997449.1 A18 Haplogroup A
12 EU223687.1 A20 Haplogroup A
13 EU223655.1 A26 Haplogroup A
14 AY240089.1 A29 Haplogroup A
15 KF002332.1 A30 Haplogroup A
16 AF531684.1 A32 Haplogroup A
17 AY240100.1 A33 Haplogroup A
18 EU816489.1 A117 Haplogroup A
19 KF002304.1 A176 Haplogroup A
20 HQ452453.1 A222 Haplogroup A
21 KU290672.1 Haplogroup A Haplogroup A 22 KU290445.1 Haplogroup A Haplogroup A 23 AB605507.1 Haplogroup A Haplogroup A 24 KJ139357.1 Haplogroup A Haplogroup A 25 KM201268.1 Haplogroup A Haplogroup A 26 KF574036.1 Haplogroup A Haplogroup A 27 KU290692.1 Haplogroup A Haplogroup A
28 JF342842.1 B1 Haplogroup B 29 EU223476.1 B1 Haplogroup B 30 AF531723.1 B2 Haplogroup B 31 EU816542.1 B25 Haplogroup B 32 HM560915.1 B36 Haplogroup B 33 HQ452475.1 B40 Haplogroup B 34 JF342826.1 B41 Haplogroup B 35 HM560920.1 Haplogroup B Haplogroup B 36 EU223589.1 Haplogroup B Haplogroup B 37 JF342908.2 Haplogroup B Haplogroup B 38 KF661056.1 Haplogroup B Haplogroup B 39 EU223397.1 C3 Haplogroup C 40 KM201262.1 C5 Haplogroup C 41 EF380220.1 C7 Haplogroup C 42 EU816553.1 C13 Haplogroup C 43 KJ637138.1 Haplogroup C Haplogroup C 44 KF002323.1 D1 Haplogroup D 45 AF098138.1 D1 Haplogroup D 46 KF574016.1 D6 Haplogroup D 47 D83632.1 E1 Haplogroup E
STT Mã số
GenBank Haplotype identifier
Cây phát sinh chủng loại
48 AB480744.1 Haplogroup E Haplogroup E 49 EF380227.1 Haplogroup E Haplogroup E 50 AB499822.1 Haplogroup F Haplogroup F
Cây phát sinh chủng loại được thiết lập có hình dạng và sự phân nhóm tương tự như cây đã được công bố trước đây [74]. Haplogroup của các trình tự khảo sát dễ dàng được xác định nhờ vào vị trí của chúng trên các nhánh cây. Tuy nhiên, trên cây phát sinh chủng loại, haplotype chính xác của các trình tự khơng thể xác định được. Ví dụ trường hợp của trình tự JF342842.1 trên cây phát sinh chủng loại có khoảng cách gần nhất với trình tự có haplotype B25, thuộc hai nhánh khác nhau (Hình 3.1). Các phân tích thủ cơng tiếp theo cho thấy hai trình tự này giống nhau 100%, nghĩa là trình tự JF342842.1 có haplotype B25, nhưng thông tin này không thể xác định được thông qua quan sát cây phát sinh chủng loại. Kết quả định loại haplogroup của hai phương pháp đều trùng khớp với nhau. Trong khi cây phát sinh lồi chỉ có thể giúp xác định haplogroup của trình tự, Haplotype identifier cịn ưu thế hơn với khả năng xác định chính xác các haplotype đã biết.
Để xác định haplotype của một trình tự theo cách làm truyền thống bằng cách sử dụng cây phát sinh chủng loại cần rất nhiều thời gian, tùy vào phương pháp sử dụng. Với khoảng 320 trình tự có chiều dài 582 cặp base, thời gian có thể dao động từ khoảng 10 phút trong trường hợp sử dụng phương pháp Neighbor-joining đến 8 giờ trong trường hợp sử dụng phương pháp Maximum Likelihood. Trong khi đó, với cơng cụ Haplotype identifier, người dùng chỉ mất chưa đến 1 giây để có thể xác định được haplotype của trình tự truy vấn. Hơn nữa, để sử dụng công cụ Haplotype identifier, người dùng chỉ cần một thiết bị có trình duyệt Web có kết nối Internet (máy tính, điện thoại thơng minh, máy tính bảng…), và khơng phụ thuộc vào hệ điều hành của thiết bị đang sử dụng (Windows, Macintosh, Android, iOS…) trong khi với cách xây dựng cây phát sinh chủng loại, người dùng cần phải cài đặt các phần mềm chuyên dụng trên máy tính (MEGA, Paup*…) và địi hỏi phải có
diện thân thiện cũng là một ưu thế của Haplotype identifier, người dùng chỉ cần đưa trình tự cần truy vấn vào khung làm việc của công cụ và ấn "Submit", kết quả định loại haplotype sẽ hiển thị sau khoảng 1 giây.
Hình 3.1: Phân bố của các trình tự thuộc haplogroup B
Cây phát sinh chủng loại được thiết lập từ 375 trình tự vùng 582 cặp base bằng phương pháp Neighbor-Joining với 2000 lần lặp lại. Nhóm ngoại bao gồm các trình
tự của Canis latrans được lược bỏ. Các nhánh thuộc haplogroup C, D, E, F được nhóm lại (các hình tam giác màu đen). Nhánh haplogroup A không được thể hiện trong hình. Nhánh haplogroup B được trình bày chi tiết cho thấy bao gồm các trình
tự JF342842.1, EU223476.1, AF531723.1, EU816542.1, HM560915.1, HQ452475.1, JF342826.1, HM560920.1, EU223589.1, JF342908.2, KF661056.1.
Các ưu điểm của việc định loại haplotype bằng công cụ Haplotype identifier so với phương pháp xây dựng cây phát sinh chủng loại có thể được tóm tắt trong bảng sau (Bảng 3.5):
Bảng 3.5: So sánh việc định loại haplotype bằng Haplotype identifier và bằng xây dựng cây phát sinh chủng loại
Haplotype identifier Xây dựng cây phát sinh chủng loại Trình tự có haplotype trùng với haplotype đã công bố Xác định được chính xác haplotype Khơng xác định được Trình tự có haplotype khơng trùng với haplotype đã công bố
Xác định được haplogroup Xác định được haplogroup
Thời gian xác định haplotype
Nhanh (~ 1 giây/trình tự) Thời gian xác định lâu, tùy vào phương pháp sử dụng (10 phút đến 8 giờ)
Phần mềm chuyên dụng
Không cần Cần
Yêu cầu kinh nghiệm Người dùng không cần biết kỹ thuật định loại haplotype
Người dùng phải nắm được kỹ thuật xây dựng cây phát sinh chủng loại
Sự trùng khớp kết quả xác định haplogroup của hai phương pháp và khả năng nhận diện chính xác haplotype của trình tự cho thấy công cụ xác định haplotype đã hoạt động tốt, có thể được sử dụng để xác định các haplotype của các trình tự khác trong cơ sở dữ liệu, và các trình tự của chó lưng xốy Phú Quốc, phục vụ cho các nghiên cứu tiếp theo.
để sử dụng miễn phí thơng qua mạng Internet tại http://chd.vnbiology.com. Việc xác định nhanh haplotype của một đoạn 582 cặp base vùng HV1 DNA ty thể trong đề tài sẽ được thực hiện bằng cơng cụ này.
Hình 3.2: Giao diện trang chủ hỗ trợ khai thác cơ sở dữ liệu
A B
3.2. Xác định trình tự đoạn 582 cặp base vùng HV1 DNA ty thể chó nhà Việt Nam và chó lƣng xốy Phú Quốc
3.2.1 Xác định quy trình tách chiết DNA từ lơng chó
3.2.1.1. Khảo sát các điều kiện cho quy trình tách chiết DNA