Hình 2.7: Vị trí các mồi sử dụng trong phản ứng PCR và trong giải trình tự
Cặp mồi 15412F – 16625R được sử dụng để khuếch đại vùng trình tự HV1, cặp mồi 15412F – 16114R được sử dụng để giải trình tự 582 cặp base vùng HV1 (từ vị trí
nucleotide 15458 đến 16039) 2.2.2.6. Giải trình tự và biên tập trình tự
Sản phẩm PCR được giải trình tự tự động bằng phương pháp Sanger [71] tại
NICEM – Hàn Quốc (The National Instrumentation Center for Environmental Management). Mỗi sản phẩm khuếch đại vùng HV1 được gửi đi giải trình tự hai mạch độc lập với hai mồi 15412F và 16114R (Bảng 2.2 và Hình 2.7). Kết quả giải trình tự được hiển thị trên phần mềm FinchTV dưới dạng đồ thị huỳnh quang (Hình 2.8). Trình tự nucleotide sau khi đọc được biên tập bằng mắt với sự trợ giúp của phần mềm FinchTV 1.4.0 và SeaView 4.2.12 để loại bỏ các vùng tín hiệu nhiễu, các đỉnh màu khơng rõ ràng. Hai mạch của một trình tự được giải độc lập, sẽ được so sánh để khẳng định một nucleotide ở một vị trí nhất định, nâng cao độ tin cậy của
Tên mồi Trình tự nucleotide
Nhiệt độ nóng chảy Kích thƣớc sản phẩm Tài liệu tham khảo 15412F 5’-CCACTATCAGCACCCAAAG-3’ 53,2 oC 1,2 kb Gundry và cs. [26] 16625R 5’-AGACTACGAGACCAAATGCG-3’ 54,6 oC 16114R 5’- CCTGAAACCATTGACTGAATAG-3’ 51 oC
kết quả giải trình tự. Tất cả các trình tự đều được sắp gióng cột với trình tự tham khảo chuẩn (mã số GenBank U96639.2 [37]) để xác định đoạn trình tự 582 cặp base. Vùng trình tự này sẽ được sử dụng cho các phân tích về sau.
Hình 2.8: Một đoạn đồ thị huỳnh quang – kết quả giải trình tự mẫu PQ101
2.2.3. Đánh giá sự đa dạng di truyền của chó lưng xốy Phú Quốc dựa trên đoạn 582 cặp base vùng HV1 DNA ty thể 582 cặp base vùng HV1 DNA ty thể
Các số liệu trong đề tài được xử lý thống kê bằng phần mềm thống kê R [61]. Các biểu đồ thể hiện, minh họa số liệu tính tốn được cũng như các chỉ số về đa dạng di truyền quần thể được tính tốn bằng phần mềm chuyên dụng Arlequin 3.5 [20].
2.2.3.1. Xác định độ đa dạng haplotype
Độ đa dạng haplotype là xác suất bắt được ngẫu nhiên hai haplotype khác nhau trong quần thể. Trong đề tài, các thông số này được thực hiện bằng phần mềm Arlequin 3.5 [20], với các công thức:
a. Độ đa dạng haplotype:
̂
∑
b. Phương sai của chỉ số độ đa dạng: ̂ { [∑ (∑ ) ] ∑ (∑ ) } Độ lệch chuẩn: s.d.( ̂) = √ ̂ Trong đó: n là tổng số trình tự trong quần thể
k là số lượng các haplotype trong quần thể pi là tần số của haplotype i trong quần thể
2.2.3.2. Xác định độ đa dạng nucleotide
Độ đa dạng nucleotide là số nucleotide khác biệt trung bình mỗi vị trí giữa hai trình tự DNA bất kỳ trong quần thể. Nói cách khác, chỉ số độ đa dạng nucleotide thể hiện xác suất bắt được ngẫu nhiên hai nucleotide khác nhau tại một vị trí bất kỳ trên hai trình tự DNA bất kỳ trong quần thể. Trong đề tài, các thông số này được thực hiện bằng phần mềm Arlequin 3.5 [20], với các công thức:
a. Độ đa dạng nucleotide:
̂ ∑ ∑ ̂
b. Phương sai của độ đa dạng nucleotide:
̂ ̂ ̂ Độ lệch chuẩn: s.d.( ̂ = √ ̂ Trong đó: n là tổng số trình tự trong quần thể
dịj là số đột biến xảy ra giữa hai haplotype i và j k là số lượng các haplotype trong quần thể pi là tần số của haplotype i trong quần thể
2.2.3.3. Xây dựng mạng lưới quan hệ của các haplotype
Mối quan hệ giữa các haplotype có thể được thể hiện rõ hơn bằng cách biểu diễn dưới dạng một mạng lưới. Trong đó, mỗi haplotype là một nút mạng (node), hai haplotype kế cận được nối nhau bằng một đường nối thể hiện nucleotide sai khác giữa hai haplotype đó.
Mạng lưới ban đầu thể hiện mối quan hệ giữa các haplotype trong quần thể và số nucleotide sai khác của các haplotype kế cận được tính bởi phần mềm Arlequin 3.5 [20]. Trong trường hợp những haplotype sai khác nhiều hơn 1 nucleotide so với haplotype gần nhất, các haplotype trung gian sẽ được tìm kiếm thủ cơng trong danh sách các haplotype đã được công bố, và sẽ được chèn vào mạng lưới ở vị trí tương ứng. Trong đề tài, mạng lưới quan hệ giữa các haplotype bao gồm các haplotype có trong quần thể và các haplotype trung gian khơng có trong quần thể, sao cho mỗi haplotype chỉ sai khác 1 nucleotide so với haplotype gần nhất.
2.2.3.4. Xác định khoảng cách di truyền giữa hai quần thể
Khoảng cách di truyền (DA) giữa hai quần thể là số nucleotide khác biệt trung bình giữa hai quần thể [50], được phần mềm Arlequin 3.5 tính theo cơng thức:
̂ ∑ ∑ ̂ ̂ ̂ Trong đó
D: độ khác biệt nucleotide thơ trung bình giữa hai quần thể
DA: khoảng cách di truyền, là độ khác biệt nucleotide trung bình giữa hai quần thể sau khi trừ đi độ khác biệt trong nội bộ mỗi quần thể k và k’ là số haplotype tương ứng trong quần thể 1 và 2
là tần số của haplotype thứ i trong quần thể 1
2.2.3.5. Phân tích phương sai phân tử (AMOVA)
Khác biệt di truyền giữa các nhóm cá thể trong một lồi có thể được đánh giá thơng qua phân tích phương sai phân tử (AMOVA) [99]. Phương pháp này phân tích độ khác biệt di truyền ở các phân cấp khác nhau (giữa các nhóm quần thể, giữa các quần thể, giữa các cá thể) và xác định sự ảnh hưởng của độ khác biệt di truyền đó vào sự đa dạng di truyền chung của toàn bộ quần thể. Tỷ lệ phần trăm biến thiên của từng phân cấp sẽ cho biết mức độ đóng góp của sự đa dạng di truyền ở phân cấp đó vào sự đa dạng di truyền chung của quần thể. Mức chính xác của các độ khác biệt ở mỗi phân cấp đó được đánh giá qua các kiểm định Fisher. Theo đó, giá trị F (chỉ số F) sẽ dao động từ 0 đến 1, trong đó, F = 0 biểu thị khơng có sự khác biệt giữa các nhóm so sánh, F =1 biểu thị có sự khác biệt hồn tồn giữa các nhóm so sánh.
Trong đề tài, phần trình bày kết quả phân tích AMOVA được sắp xếp lại, chỉ số bậc tự do sẽ khơng được trình bày, chỉ số F và giá trị p của kiểm định F sẽ được trình bày chung trong bảng để dễ dàng đánh giá mức ý nghĩa (độ tin cậy) của mỗi kiểm định. Nội dung trình bày sẽ theo mẫu ở bảng dưới (Bảng 2.3).