4 LTS 00 22037’770”, 102028’181” 1667 m Lá và thân rễ cây trưởng thành
3.6 Khoảng cách di truyền giữa các mẫu nghiên cứu
Khoảng cách di truyền mơ phỏng khối lượng tiến hố xảy ra giữa các lồi, nó phản ánh mức độ quan hệ di truyền giữa các loài với nhau. Các loài càng xa nhau khoảng cách di truyền càng lớn và ngược lại.
Khi so sánh cấu trúc 2 trình tự DNA, kết quả quan sát được về sự giống hay khác nhau giữa chúng khơng phản ánh được khối lượng tiến hố giữa hai lồi. Do chỉ có 4 trạng thái nucleotide A, T, G, C nên tại mỗi vị trí base đa hình, số lượng đột biến thay thế nucleotide đã xảy ra quan sát được chỉ là một, trong khi thực tế có thể đã xảy ra nhiều hơn một đột biến. Các nhà khoa học cho rằng số lượng đột biến trong thực tế sẽ lớn hơn rất nhiều khối lượng đột biến thu được từ thống kê các nucleotide đa hình.
Hình 3.4 cho biết 6 trường hợp đột biến có thể xảy ra trong q trình hình thành lồi từ loài tổ tiên. Trường hợp thứ nhất (a) là sự thay thế đơn, kết quả dẫn đến sự thay thế một nucleotide này thành một nucleotide khác và đột biến chỉ xảy ra một lần trong quá trình hình thành lồi. Nếu số lượng các đột biến nucleotide xảy ra giữa các lồi là nhỏ, đột biến có thể coi là
các đột biến đơn do xác suất xuất hiện nhiều hơn một đột biến tại cùng một vị trí là rất nhỏ. Tuy nhiên nếu tốc độ biến đổi gen lớn, khả năng lặp lại đột biến tại cùng một vị trí sẽ cao hơn. Sự lặp lại đột biến thay thế nucleotie nhiều lần tại cùng một vị trí nucleotide sẽ gây ra khó khăn trong tái dựng lịch sử tiến hố, nói cách khác nó làm sai lệch cây tiến hoá được thiết lập từ phần mềm máy tính với tiến hố diễn ra trong thực tế. Hình 3.11b là một trường hợp cụ thể về đa đột biến xảy ra trên cùng một vị trí. Ở đây một loài con cháu đã xảy ra 2 đột biến (A C và C T), ngược lại ở hình 3.11c là một trường hợp đột biến đơn khác. Trong cả hai trường hợp, hai loài con cháu chỉ cho thấy một sự khác nhau mặc dù đã xảy ra hai đột biến. Sự tính tốn đơn giản khoảng cách di truyền giữa các lồi con cháu đánh giá khơng đúng khối lượng thay đổi tiến hoá trong thực tế. Ba trường hợp đa đột biến d, e, f hình 3.11 cho thấy tiềm năng có thể xảy ra rất nhiều trường hợp khác nhau. Trong mỗi trường hợp, hai trình tự con cháu là giống nhau mặc dù khơng có trường hợp nào được di truyền trực tiếp từ tổ tiên.
Hình 3.4. Mơ hình 6 loại đột biến nucleotide [51].
hợp có đột biến nhưng khơng biến đổi nucleotde)
Để tính tốn được khoảng cách di truyền giữa các lồi dựa trên trình tự DNA, một ngành công nghiệp mới “tin sinh học” đã ra đời. Đã có rất nhiều nghiên cứu và phương pháp được đề xuất để hiệu chỉnh khoảng cách di truyền thu được từ các nucleotide đa hình giữa các trình tự thành khoảng cách tiến hoá diễn ra trong thực tế. Các kỹ thuật này thường được gọi là “làm đúng khoảng cách (distance correction)”. Các mơ hình chỉnh sửa bao gồm: mơ hình Jukes – Cantor (JC), mơ hình 2 thơng số của Kimura (Kimura’s 2 parameter model (K2P)), mơ hình F81 của Felsenstein
(1981), mơ hình HKY85 (1985) của Hasegawa, Kishino và Yano, mơ hình REV (1990) của Rodri’guez et al., Yang et al., 1994).
Trong nghiên cứu này, khoảng cách di truyền giữa 07 mẫu đại điện cho 02 lồi nghiên cứu đã được tính tốn theo bộ dữ liệu tổ hợp của 1 vùng nucleotide ITS-rDNA. Trình tự DNA sau khi alignment, cắt bỏ các phần không trùng khớp hai đầu được ghép lại với nhau. Tính tốn khoảng cách được thực hiện trên phần mềm MEGA 4.0 theo các thơng số mặc định và mơ hình hiệu chỉnh K2P của Kimura, khoảng cách di truyền được tính theo
cả đột biến hoán đổi (transition) nucleotide A T hoặc GC và hoán vị
(tranversion) nucleotide AC hoặc AG hoặc TC hoặc T G. Dữ liệu DNA được coi là các trình tự tương đồng (homologous) có nghĩa là các lồi tiến hoá từ một tổ tiên.
Kết quả thu được ở bảng 3.3 cho thấy khoảng cách di truyền giữa các loài khác nhau là khác nhau và khi so sánh khoảng cách di truyền giữa các loài trong chi Panax dao động từ 0% (P. japonicus var. bipinnatifidus / P. pseudogingseng var. bipinnatifidus) đến 2.4% ( SLC1/ Panax sinensis),
khoảng cách di truyền thấp nhất (0%) là khi so sánh 2 loài (P. japonicus var. bipinnatifidus và P. pseudogingseng var. bipinnatifidus) đồng thời khơng tìm thấy số lượng nucleotide sai khác của 2 lồi này, khoảng cách di truyền cao nhất (2,4%) là khi so sánh 2 loài (SLC1 và Panax sinensis) đồng thời khơng tìm thấy số lượng nucleotide sai khác của 2 lồi này. Khi so sánh khoảng cách di truyền giữa lồi SLC1 và SNL thì khoảng cách di truyền rất thấp (0,7%) và số vị trí nucleotide sai khác của 2 lồi này là 4 nucleotide. Tương tự, khoảng cách di truyền giữa loài SLC1 và P. sinensis (2,4%) và số nucleotide sai khác (13); SLC1 và P. japonicus var. bipinnatifidus (2,2%) và số nucleotide sai khác (12); SLC1 và P. pseudogingseng var. bipinnatifidus (2,2%) và số nucleotide sai khác (12);
SNL và P. sinensis (2,0%) và số nucleotide sai khác (11); SNL và P. japonicus var. bipinnatifidus (1,8%) và số nucleotide sai khác (10); SNL
và P. pseudogingseng var. bipinnatifidus (1,8%) và số nucleotide sai khác
(10).
Kết quả nhận được cho thấy loài cùng chi Panax có khoảng cách di
truyền rất thấp đồng nghĩa chúng tương đồng về mặt di truyền cao > 97% và số vị trí nucleotide sai khác lớn nhất là 13 nucleotide.
Các kết quả nhận được trên đây chúng tơi có nhận xét hai lồi SLC1 với lồi SNL có khoảng cách di truyền gần nhau nhất và xa nhất là loài P.
sinensis và loài P. japonicus var. bipinnatifidus.
Các đột biến nucleotide có thể được phân loại theo nhiều cách khác nhau. Khoảng cách di truyền cũng có thể được tính tốn theo các phân loại loại này. Theo cách sắp xếp nucleotide là purine hay pyrimidine, một đột biến làm thay đổi một purine thành một purine khác hoặc một pyrimidine thành một pyrimidine khác được gọi là đột biến hoán đổi (transition). Ngược lại một đột biến làm biến đổi một purine thành một pyrimidine thì được gọi là đột biến hoán vị (transversion). Trong một gene đột biến hoán đổi dễ xảy ra hơn so với đột biến hốn vị. Các đột biến cũng có thể tính tốn theo sự biến đổi thành phần amino axit trong phân tử protein mà gene mã hoá. Tuy nhiên sự thối hố mã di truyền đã khơng xẩy ra tất cả các đột biến để dẫn đến sự sai khác amino acid. Một đột biến không làm thay đổi amino acid được gọi là đột biến “synonymous”, ngược lại đột biến làm thay đổi amino acid được gọi là đột biến “non-synonymous”.Khi so sánh cấu trúc 2 trình tự DNA, kết quả quan sát được về sự giống hay khác nhau giữa chúng khơng phản ánh được khối lượng tiến hố giữa hai lồi. Do chỉ có 4 trạng thái nucleotide A, T, G, C nên tại mỗi vị trí base đa hình, số lượng đột biến thay thế nucleotide đã xảy ra quan sát được chỉ là một, trong khi thực tế có thể đã xảy ra nhiều hơn một đột biến. Các nhà khoa học cho rằng số lượng đột biến trong thực tế sẽ lớn hơn rất nhiều khối lượng đột biến thu được từ thống kê các nucleotide đa hình.
Bảng 3.3. Hệ số sai khác (dòng trên) và số lượng nucleotide sai khác (dịng dưới) giữa Sâm Lai Châu và các lồi sâm gần nhất. SLC1: Sâm
Lai Châu, SNL: Sâm Ngọc Linh
1 SLC1 - 0.0073 0.02372 0.02194 0.0219 2 SNL 4 - 0.02007 0.01828 0.01825 2 SNL 4 - 0.02007 0.01828 0.01825 3 P. sinensis 13 11 - 0.0128 0.01277 4 P. japonicus var. bipinnatifidus 12 10 7 - 0 5 P. pseudogingseng var. bipinnatifidus 12 10 7 0 -
3.7 Xây dựng cây phát sinh chủng loại
Cây phát sinh chủng loại xây dựng theo phương pháp Maximum Parsimony trên cơ sở đối chiếu các trình tự tương đồng với trình tự ITS- rDNA của các mẫu sâm thu ở Lai Châu (trình tự đại diện P. vietnamensis SLC) và Quảng Nam (P. vietnamensis SNL) được thể hiện trên hình 3. Lồi Polyscias javanica được sử dụng làm tham chiếu ngồi nhóm, phân tích bootstrap với 1000 lần lấy lại mẫu. Mơ hình lựa chọn: TrNef+G, -lnL = 1790.0665, Shape=0.3464.
Hình 3.5. Mối quan hệ di truyền của Panax vietnamesesis trên cơ sở phân tích trình tự vùng ITS-rDNA bằng phương pháp Maximum Parsimony. SNL: mẫu thu ở Quảng Nam, SLC: mẫu thu ở Lai Châu, số
ở các gốc là giá trị bootstrap.
Cây phát sinh cho thấy nguồn gốc chung của các quần thể sâm tại Lai Châu và Quảng Nam rất gần gũi với giá trị bootstrap 93%. Tổ tiên