Phần 3 Vật liệu và phƣơng pháp nghiên cứu
3.5. Phƣơng pháp nghiên cứu
3.5.5. Phân tích cấu trúc di truyền của tập đoàn mẫu giống nghiên cứu
Cấu trúc di truyền của tập đoàn mẫu giống nghiên cứu đƣợc phân tích 2 lần. Lần 1 đƣợc thực hiện trên bộ dữ liệu thu đƣợc từ kết quả phân tích DArT. Lần 2 đƣợc thực hiện sử dụng dữ liệu thu đƣợc từ kết quả phân tích GBS, chúng tôi chọn ngẫu nhiên một phần nhỏ các SNP marker có tỷ lệ dữ liệu bị khuyết dƣới 2,5% và khoảng cách giữa 2 marker ≤ 100 kb. Phần mềm sử dụng là STRUCTURE đƣợc phát triển bởi Pritchard et al. (2000). Dữ liệu đầu vào là ma
trận gồm bộ dữ liệu haplotype của các giống lúa với các marker đƣợc chọn, sử dụng mơ hình hỗn hợp kết hợp với tần số tƣơng quan với 200000 thử nghiệm trên một lần lặp lại, và lặp lại 200000 lần, số thành phần quần thể dự kiến (K) biến đổi từ 1 đến 10, 10 lần chạy lặp lại đối với mỗi một giá trị K. Sau khi loại bỏ các lần chạy khơng có sự hội tụ, kết quả thu đƣợc đƣợc phân tích bằng phần mềm Structure Haverster (Earl and vonHoldt, 2012), kết hợp chặt chẽ với những phát triển ban đầu của Evano et al. (2005) giúp xác định số lƣợng các nhóm giống có quan hệ gần gũi về di truyền trong tập đoàn giống nghiên cứu. Đồng thời bƣớc này cũng đƣợc tiến hành bằng phƣơng pháp phân tích thành phần chính (DAPC) đƣợc phát triển bởi Jombard et al. (2010) sử dụng phần mềm R Adegenet
(Jombart, 2008). Một mẫu giống đƣợc xác định là thuộc một nhóm nào đó khi mang 75% thành phần genome của nhóm giống đó. Chỉ số Fst (the pairwise Wright’s fixation index) đo mức độ phân hóa di truyền giữa các nhóm (Wright, 1978), đƣợc tính tốn bằng phần mềm Arlequin (Excoffier et al., 2005) với 1000 hoán vị để xác định mức ý nghĩa của sự sai khác giữa chúng.
Để hình ảnh hóa mối quan hệ di truyền giữa các mẫu giống nghiên cứu chúng tôi tiến hành xây dựng cây phân loại Neighbour-Joining (NJ) với một ma trận các thuộc tính khác biệt của các mẫu giống. Với các DArT marker, ma trận này đƣợc tính tốn sử dụng hệ số Sokal and Michener [dij=u/[m+u]] (Sokal, 1958), trong đó u là số alen khác biệt giữa cá thể thứ i và cá thể thứ j, còn m là số alen trùng hợp trong ma trận dữ liệu thu đƣợc từ DArT. Đối với SNP marker, ma trận này đƣợc tính tốn dựa trên chỉ số chia sẻ của các alen. Tất cả các phân tích này đƣợc tiến hành trên phần mềm DARwin (Perrier, 2006). Cấu trúc quần thể nghiên cứu đƣợc biểu diễn dựa trên tọa độ của các mẫu giống trên bản đồ di truyền hình cây.
Lần thứ hai tiến hành phân tích cấu trúc quần thể, sử dụng số lƣợng lớn SNP marker, sự đa hình trong quần thể nghiên cứu đƣợc thể hiện càng rõ ràng
hơn qua số lƣợng và khoảng cách di truyền giữa các phân nhóm giống trong từng nhóm lồi phụ đã đƣợc xác định khi phân tích đa dạng di truyền với chỉ thị DArT trƣớc đó.