Khoảng cách di truyền mô phỏng khối lƣợng tiến hoá xảy ra giữa các loài, nó phản ánh mức độ quan hệ di truyền giữa các loài với nhau. Các loài càng xa nhau khoảng cách di truyền càng lớn và ngƣợc lại.
Khi so sánh cấu trúc 2 trình tự DNA, kết quả quan sát đƣợc về sự giống hay khác nhau giữa chúng không phản ánh đƣợc khối lƣợng tiến hoá giữa hai loài. Do chỉ có 4 trạng thái nucleotide A, T, G, C nên tại mỗi vị trí base đa hình, số lƣợng đột biến thay thế nucleotide đã xảy ra quan sát đƣợc chỉ là một, trong khi thực tế có thể đã xảy ra nhiều hơn một đột biến. Các nhà khoa học cho rằng số lƣợng đột biến trong thực tế sẽ lớn hơn rất nhiều khối lƣợng đột biến thu đƣợc từ thống kê các nucleotide đa hình.
Hình 3.10 cho biết 6 trƣờng hợp đột biến có thể xảy ra trong quá trình hình thành loài từ loài tổ tiên. Trƣờng hợp thứ nhất (a) là sự thay thế đơn, kết quả dẫn đến sự thay thế một nucleotide này thành một nucleotide khác và đột biến chỉ xảy ra một lần trong quá trình hình thành loài. Nếu số lƣợng các đột biến nucleotide xảy ra giữa các loài là nhỏ, đột biến có thể coi là các đột biến đơn do xác suất xuất hiện nhiều hơn một đột biến tại cùng một vị trí là rất nhỏ. Tuy nhiên nếu tốc độ biến đổi gen lớn, khả năng lặp lại đột biến tại cùng một vị trí sẽ cao hơn. Sự lặp lại đột biến thay thế nucleotie nhiều lần tại cùng một vị trí nucleotide sẽ gây ra khó khăn trong tái dựng lịch sử tiến hoá, nói cách khác nó làm sai lệch cây tiến hoá đƣợc thiết lập từ phần mềm máy tính với tiến hoá diễn ra trong thực tế. Hình 3.10b là một trƣờng hợp cụ thể về đa đột biến xảy ra trên cùng một vị trí. Ở đây một loài con cháu đã xảy ra 2 đột biến (A C và C T), ngƣợc lại ở hình 3.10c là một trƣờng hợp đột biến đơn khác. Trong cả hai trƣờng hợp, hai loài con cháu chỉ cho thấy một sự khác nhau mặc dù đã xảy ra hai đột biến. Sự tính toán đơn giản khoảng cách di truyền giữa các loài con cháu đánh giá không đúng khối lƣợng thay đổi tiến hoá trong thực tế. Ba trƣờng hợp đa đột biến d, e, f hình 3.10 cho thấy tiềm năng có thể xảy ra rất nhiều trƣờng hợp khác nhau. Trong
mỗi trƣờng hợp, hai trình tự con cháu là giống nhau mặc dù không có trƣờng hợp nào đƣợc di truyền trực tiếp từ tổ tiên.
Hình 3.10.Mô hình 6 loại đột biến nucleotide (Page, 2000 [51]).
(Mỗi gạch ngang tƣợng đƣơng cho một đột biến; d, e, f là các trƣờng hợp có đột biến nhƣng không biến đổi nucleotde )
Để tính toán đƣợc khoảng cách di truyền giữa các loài dựa trên trình tự DNA, một ngành công nghiệp mới “tin sinh học” đã ra đời. Đã có rất nhiều nghiên cứu và phƣơng pháp đƣợc đề xuất để hiệu chỉnh khoảng cách di truyền thu đƣợc từ các nucleotide đa hình giữa các trình tự thành khoảng cách tiến hoá diễn ra trong thực tế. Các kỹ thuật này thƣờng đƣợc gọi là “làm đúng khoảng cách (distance correction)”. Các mô hình chỉnh sửa bao gồm: mô hình Jukes – Cantor (JC), mô hình 2 thông số
của Kimura (Kimura’s 2 parameter model (K2P)), mô hình F81 của Felsenstein
(1981), mô hình HKY85 (1985) của Hasegawa, Kishino và Yano, mô hình REV
(1990) của Rodri’guez et al., Yang et al., 1994). [51]
Trong nghiên cứu này, khoảng cách di truyền giữa 25 mẫu đại điện cho 5 loài nghiên cứu đã đƣợc tính toán theo bộ dữ liệu tổ hợp của 4 vùng nucleotide: ITS, gen K, và vùng đệm H. Trình tự DNA sau khi alignment, cắt bỏ các
phần không trùng khớp hai đầu đƣợc ghép lại với nhau. Tính toán khoảng cách đƣợc thực hiện trên phần mềm MEGA 4.0 theo các thông số mặc định và mô hình hiệu chỉnh K2P của Kimura, khoảng cách di truyền đƣợc tính theo cả đột biến hoán đổi (transition) nucleotide A T hoặc GC và hoán vị (tranversion) nucleotide AC hoặc AG hoặc TC hoặc T G. Dữ liệu DNA đƣợc coi là các trình tự tƣơng đồng (homologous) có nghĩa là các loài tiến hoá từ một tổ tiên.
Kết quả thu đƣợc ở bảng 3.4 cho thấy khi so sánh khoảng cách di truyền giữa 5 cá thể của cùng một loài cao nhất là D.nigrescens (từ 0 – 0,2 %), tiếp đến là 3 loài D. assamica, D.oliveri và D. tonkinensis(từ 0 – 0.1%) và có khoảng cách di truyền giống nhau hoàn toàn (100%) là loài D. cochinchinensis. Kết quả nhận đƣợc cũng cho thấy khoảng cách địa lý đã không tạo ra sự khác biệt di truyền rõ rệt giữa các cá thể cùng loài. Các mẫu D. assamica 1 và 2 thu đƣợc ở VQG Cúc Phƣơng có sự sai khác di truyền với các mẫu D. assamica 3 và 4 thu ở Hà Nội, tuy nhiên lại tƣơng đồng 100% với mẫu D. assamica5 cũng đƣợc thu ở Hà Nội. Hay các mẫu D. cochinchinensis 1, D. cochinchinensis2 và mẫu D. cochinchinensis3 thu đƣợc ở VQG York Đôn (Đắk LắK) giống nhau 100% với các mẫu D. cochinchinensis 4 và 5 thu ở K’Bang (Gia Lai). Tuy nhiên các mẫu D. nigrescens chỉ đƣợc thu ở VQG York Đôn lại vẫn có sự khác nhau (giữa D. nigrescens4 với các mẫu còn lại). Kết quả cũng tƣơng tự khi so sánh các mẫu địa lý khác nhau của loài D. tonkinensis.
Kết quả ở bảng 3.4 cũng đã chỉ ra khoảng cách di truyền là tƣơng đối cao khi so sánh giữa các loài với nhau. Khoảng cách di truyền thay đổi thấp nhất là 2,1% (mẫu
D.oliveri 1, 4 và mẫu 5 so với mẫu D.assamica 4)và cao nhất là 4,6% (tất cả 5 mẫu
D.nigrescens với 5 mẫu D cochinchinensis). Các mẫu của ba loài còn lại có sự sai khai di truyền từ 2,7% đến 4,1%, cụ thể nhƣ sau: Giữa các mẫu D. assamica và D. cochinchinensistừ 3,4% – 3,5%; giữa các mẫu D. assamica và D. nigrescenstừ 2,7% – 2,8%; D. assamica và D. oliveri từ 2,1% - 2,3% (giá trị nhỏ nhất); D. assamica
Bảng 3.4. Khoảng cách di truyền giữa 25 mẫu nghiên cứu của 5 loài gỗ quý (nền xám chỉ khoảng cách giữa các mẫu cùng loài)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 D.assamica 1 *** 2 D.assamica 2 0 *** 3 D.assamica 3 0.1 0.1 *** 4 D.assamica 4 0.1 0.1 0.1 *** 5 D.assamica 5 0 0 0.1 0.1 *** 6 D.cochinchinensis 1 3.4 3.4 3.5 3.4 3.5 *** 7 D.cochinchinensis 2 3.4 3.4 3.5 3.4 3.5 0 *** 8 D.cochinchinensis 3 3.4 3.4 3.5 3.4 3.5 0 0 *** 9 D.cochinchinensis 4 3.4 3.4 3.5 3.4 3.5 0 0 0 *** 10 D.cochinchinensis 5 3.4 3.4 3.5 3.4 3.5 0 0 0 0 *** 11 D.nigrescens 1 2.7 2.7 2.7 2.7 2.7 4.6 4.6 4.6 4.6 4.6 *** 12 D.nigrescens 2 2.7 2.7 2.7 2.7 2.7 4.6 4.6 4.6 4.6 4.6 0 *** 13 D.nigrescens 3 2.7 2.7 2.7 2.7 2.7 4.6 4.6 4.6 4.6 4.6 0 0 *** 14 D.nigrescens 4 2.8 2.8 2.8 2.8 2.8 4.6 4.6 4.6 4.6 4.6 0.2 0.2 0.2 *** 15 D.nigrescens 5 2.7 2.7 2.7 2.7 2.7 4.6 4.6 4.6 4.6 4.6 0 0 0 0.2 *** 16 D.oliveri 1 2.2 2.2 2.2 2.1 2.2 3 3 3 3 3 3.4 3.4 3.4 3.5 3.4 *** 17 D.oliveri 2 2.3 2.3 2.3 2.2 2.3 3 3 3 3 3 3.5 3.5 3.5 3.6 3.5 0.1 *** 18 D.oliveri 3 2.3 2.3 2.3 2.2 2.3 3 3 3 3 3 3.5 3.5 3.5 3.6 3.5 0.1 0 *** 19 D.oliveri 4 2.2 2.2 2.2 2.1 2.2 3 3 3 3 3 3.5 3.5 3.5 3.6 3.5 0 0 0 *** 20 D.oliveri 5 2.2 2.2 2.2 2.1 2.2 3 3 3 3 3 3.5 3.5 3.5 3.6 3.5 0 0 0 0 *** 21 D.tonkinensis 1 3.8 3.8 3.9 3.8 3.8 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.2 4.1 3.9 3.9 3.9 3.9 3.9 *** 22 D.tonkinensis 2 3.8 3.8 3.9 3.8 3.8 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.1 4.2 4.1 3.9 3.9 3.9 3.9 3.9 0 *** 23 D.tonkinensis 3 3.9 3.9 4 3.9 3.9 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.3 4.2 4 4 4 4 4 0.1 0.1 *** 24 D.tonkinensis 4 3.8 3.8 3.9 3.8 3.8 4.2 4.2 4.2 4.2 4.2 4.1 4.1 4.1 4.2 4.1 3.9 4 4 3.9 3.9 0 0 0.1 *** 25 D.tonkinensis 5 3.9 3.9 4 3.9 3.9 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.3 4.2 4 4 4 4 4 0.1 0.1 0 0.1 ***
với D. tonkinensis từ 3,9% đến 4,0%; giữa D. cochinchinensis và D. nigrescens là 4,6% (giá trị cao nhất); D. cochinchinensis với D. oliveri là 3,0%; giữa D. cochinchinensis và D. tonkinensis từ 4,1% - 4,2%; giữa D. nigrescensvới D. oliveri từ 3,4% - 3,6%; giữa D. nigrescens với D. tonkinensis từ 4,1% đến 4,2% và giữa D. oliveri và D. tonkinensistừ 3,9% đến 4,0%.
Các kết quả nhận đƣợc trên đây chúng tôi có nhận xét hai loài D. assamica với loài D. oliveri có khoảng cách di truyền gần nhau nhất và xa nhất là loài D. cochinchinensis và loài D. nigrescens.
Các đột biến nucleotide có thể đƣợc phân loại theo nhiều cách khác nhau. Khoảng cách di truyền cũng có thể đƣợc tính toán theo các phân loại loại này. Theo cách sắp xếp nucleotide là purine hay pyrimidine, một đột biến làm thay đổi một purine thành một purine khác hoặc một pyrimidine thành một pyrimidine khác đƣợc gọi là đột biến hoán đổi (transition). Ngƣợc lại một đột biến làm biến đổi một purine thành một pyrimidine thì đƣợc gọi là đột biến hoán vị (transversion). Trong một gene đột biến hoán đổi dễ xảy ra hơn so với đột biến hoán vị. Các đột biến cũng có thể tính toán theo sự biến đổi thành phần amino axit trong phân tử protein mà gene mã hoá. Tuy nhiên sự thoái hoá mã di truyền đã không xẩy ra tất cả các đột biến để dẫn đến sự sai khác amino acid. Một đột biến không làm thay đổi amino acid đƣợc gọi là đột biến “synonymous”, ngƣợc lại đột biến làm thay đổi amino acid đƣợc gọi là đột biến “non- synonymous”.