Cây phát sinh chủng loại là một sơ đồ mô tả mối quan hệ tiến hoá giữa các loài, đƣợc xây dựng dựa trên sự giống và khác nhau các đặc điểm vật chất di truyền hay cơ thể. Trong nghiên cứu này là sự giống và khác nhau về cấu trúc DNA giữa các loài. Các taxa đƣợc nối với nhau trên cây thể hiện mối quan hệ di truyền giữa chúng, khoảng cách càng lớn, mối quan hệ di truyền càng xa và ngƣợc lại. Trên cây có rễ
(hình 3.11 và 3.12) mỗi nút bên trong cây đại diện cho một loài tổ tiên chung. Giả định nút gần nhất với rễ là loài khởi điểm, các nút còn lại đƣợc toả ra từ nút này đƣợc gọi là con cháu. Mỗi một nút đƣợc gọi là một đơn vị phân loại, các nút trong cây đƣợc gọi là các đơn vị phân loại giải thiết. Độ dài của cành cây mô phỏng thời gian tiến hoá. Cây không rễ là cây không có điểm khởi đầu, do đó nó không tái dựng lịch sử tiến hoá của các loài. Cây không rễ chỉ cho biết mối quan hệ họ hàng giữa các loài hiện tại. Có 4 phƣơng pháp tạo cây bao gồm: (1) phƣơng pháp Neighbor – Joining (NJ), (2) phƣơng pháp Minimum Evolution, (3) phƣơng pháp Maximum Parsimony và (4) phƣơng pháp UPGMA, trong đó Neighbor – Joining là phƣơng pháp thƣờng đƣợc sử dụng nhất [49]. Khoảng cách di truyền giữa các loài cũng đƣợc ƣớc lƣợng thông qua độ dài của cành cây.
Dữ liệu DNA sau khi thực hiện ghép nối, xắp xếp thẳng hàng (alignment) đƣợc tạo cây tiến hoá bằng phần mềm MEGA 4.0, sử dụng phƣơng pháp Neighbor –Joining (NJ) với các thông số phân tích nhƣ sau:
- Kiểm tra phân tích: kiểm tra bằng giá trị bootstrap với số lần lặp lại (replicate) là 1000 lần.
- Dữ liệu thiếu/ khoảng trống nucleotide (do đột biến thêm bớt tạo ra): đƣợc xoá bỏ theo cặp (pairwise deletion).
- Mô hình đột biến: mô hình Maximum composite Likelihood với số lƣợng đột biến đƣợc tính bao gồm cả đột biến hoán đổi (A↔T, G↔C) và hoán vị (A↔C, A ↔ G, T ↔ C, T↔ G). Giả thuyết sự giống nhau giữa các loài là giống nhau (sự giống nhau giữa hai trình tự DNA con cháu đƣợc di truyền từ cùng một tổ tiên đƣợc gọi là sự giống nhau “homogeneous”, sự giống nhau này nếu đƣợc di truyền từ 2 tổ tiên khác nhau đƣợc gọi là sự giống nhau chất (homoplasious), tốc độ đột biến coi nhƣ không đổi theo thời gian.
D.assamica.1 D.assamica.2 D.assamica.5 D.assamica.3 D.assamica.4 D.nigrescens.4 D.nigrescens.3 D.nigrescens.2 D.nigrescens.1 D.nigrescens.5 D.oliveri.1 D.oliveri.5 D.oliveri.4 D.oliveri.2 D.oliveri.3 D.tonkinensis.4 D.tonkinensis.1 D.tonkinensis.2 D.tonkinensis.3 D.tonkinensis.5 D.cochichinensis.3 D.cochichinensis.4 D.cochichinensis.2 D.cochichinensis.1 D.cochichinensis.5 86 38 75 100 100 92 100 71 71 100 43 47 72 60 48 100 0.002
Hình 3.11. Cây phát sinh chủng loại của 5 loài Dalbergia nghiên cứu với 4 gen (ITS, trnL,
matK và psbA - trnH (các chữ số dƣới mỗi nhánh chỉ giá trị bootstrap lặp lại 1000 lần)
Kết quả phân tích (hình 3.11) cho thấy cây phát sinh chủng loại của 5 loài nghiên cứu phân tích với 4 vùng gen (ITS, trnL, matK và psbA – trnH) tạo ra 5 nhóm riêng biệt của 5 loài gỗ thuộc chi Dalbergia. Tại mỗi nhóm giữa các cá thể có sự phân tách nhỏ, điều này đƣợc giải thích do giữa những cá thể cùng loài có một vài nucleotide khác nhau. Các giá trị bootstrap thu đƣợc tại điểm nút tạo nhóm của mỗi loài là 100/100 cho thấy kết quả phân tích là rất tin cây. Mối quan hệ gần gũi nhất đƣợc chỉ ra trên cây tiên hoá là giữa D. assamica và D. nigrescens. Trong số 5 loài nghiên cứu thì loài D. cochinchinensis đƣợc giả thuyết nhƣ loài tổ tiên của bốn loài còn lại.