a) Chia nguồn gen thành nhóm
Sự thu mẫu đại diện cho toàn bộ đa dạng di truyền của nguồn gen hiệu quả phụ thuộc vào chia nguồn gen lần thứ nhất thành các nhóm, kỹ thuật này gọi là phân lớp, các nhóm có mức độ biến dị tối đa giữa các nhóm và tối thiểu trong một nhóm. Đây là kỹ thuật chìa khóa để thu thập mẫu hạt nhân thành công. Có nhiều phương pháp tiếp cận khác nhau dựa trên thông tin đã có, vốn gen và ngân hàng gen. Hintum 1994 chia lần thứ nhất dựa trên phép phân loại, phân chia loài hoang dại theo các loài trồng và trong các nhóm này phân chia theo các loài và loài phụ theo phương thức bậc thang. Sử dụng phân loại và những kiến thức về thuần hóa, phân bố, lịch sử tạo giống, công thức luân canh, sử dụng một trật tự cấu trúc như vậy có thể phát triển thành cây đa dạng di truyền
Qúa trình phân lớp thường liên quan đến tính xác thực của các nhóm phân loại, chia các loại cây trồng hoặc thành các nhóm sinh thái (nhóm sinh thái được hình thành với một lịch sử lâu dài). Ví dụ phân thành lúa mạch mùa xuân và lúa mạch mùa đông ( Knupffer và Van Hintum 1995), Zhang và công sự ở Trung Quốc phân nhóm vùng theo vùng trồng, ở nước ta các nhóm sinh thái lúa có thể chia thành các nhóm lúa xuân và lúa mùa, lúa cạn, lúa có tưới, lúa chịu nước sâu và luá nổi. Để phân nhóm nguồn gen cần có lượng thông tin phong phú khi thu thập ban đầu tạo ngân hàng gen gốc hoặc thông tin bổ sung trong quá trình nghiên cứu nguồn gen. Như vậy có thể phân chia thành các nhóm đồng nhất về di truyền.
Một phương pháp tiếp cận khác là tạo các nhóm tương tự như mẫu nguồn gen bằng sử dụng phân tích đa biến (Crossa và cộng sự 1995), nếu có sẵn dữ liệu về marker, đặc điểm hình thái hoặc đặc điểm khác. Nếu có thể xây dựng cây di truyền của các nhóm, sử dụng một dãy của phân tích đám (cluster), phương pháp phân tích tổ hợp hay biệt thức. Phương pháp này có thể sử dụng cùng với phương pháp phân loại mô tả trên. Trong nghiên cứu cây vừng ở Trung Quốc 14 nhóm khác nhau được thiết lập sử dụng địa lý, loại giống (giống cải
tiến, giống địa phương) và vùng sinh thái sản xuất. Phân tích đám của 14 đặc điểm hình thái, nông học và sử dụng phương pháp Ward cuối cùng của các nhóm hình thành mẫu hạt nhân cần thu thập. Trong trường hợp dữ liệu là các tính trạng số lượng, phương pháp này có thể bị ảnh hưởng bởi tương tác kiểu gen môi trường và sai số thí nghiệm
Hình 2-13 : Cây đa dạng nguồn gen cây rau diếp sau khi phân thành các nhóm từ ngân hàng
gen gốc
b) Xác định số dòng (entries) trong một nhóm
Phương pháp xác định số dòng trên một nhóm trên cở sở số mẫu nguồn gen trong mỗi nhóm. Kỹ thuật xác đinh số dòng trên một nhóm trên cơ sở số mẫu nguồn gen có trong mỗi nhóm, số mẫu nguồn gen của nhiều nhóm thường có các chỉ số tốt cho sử dụng và đảm bảo đa dạng trong các nhóm. Brown đề nghị cơ sở để xác định cỡ nhóm dựa trên 3 chiến lược chính là:
- Chiến lược cân bằng(C): ấn định một số dòng bằng nhau trong mỗi nhóm độc lập với số lượng mẫu nguồn gen của mỗi nhóm
- Chiến lược tỷ lệ (P): số dòng của mỗi nhóm tỷ lệ với số mẫu nguồn gen có trong mỗi nhóm
- Chiến lược cỡ mẫu logic (L): số dòng trong mỗi nhóm là loga của số mẫu nguồn gen trong nhóm đó
Bảng 2-9 : Ấn định số dòng với các nhóm khác nhau bằng chiến lược xác định cỡ mẫu trong
thu thập điểm nguồn gen, nếu 30 dòng được chọn thu từ 205 mẫu nguồn gen
Số dòng lấy mẫu điểm bằng chiến lược khác nhau Nhóm Số mẫu nguồn gen đã thu thập C L P 1 120 8 10 18 2 50 8 8 7 3 25 7 7 4 4 10 7 5 1 Tổng số 205 30 30 30
Mỗi chiến lược cho kết quả số dòng trong một nhóm khác nhau và hiệu quả của chúng so sánh với số công thức thực hiện, chiến lược C thường kém hiệu quả hơn hai chiến lược còn lại do vậy hai phương pháp L và P được sử dụng rộng rãi hơn.
Kỹ thuật xác định số dòng trong một nhóm dựa trên đa dạng marker: ngoài phương pháp lấy mẫu dựa trên cơ sở số mẫu nguồn gen đã thu thập, ngày nay lấy mẫu số dòng còn
dựa trên đa dạng marker. Phương pháp này dựa trên số liệu thu được bằng phân tích marker phân tử, trong mỗi nhóm hoặc đa dạng gen trong chúng ( Brown và Schoen,1994)
Chiến lược H, marker gen như allozyme hoặc DNA marker cho biết tần suất của các allel tại locus đa hình được đưa vào tính chỉ số đa dạng gen (h); Chỉ số này tương đương như tần suất dị hợp của quần thể giao phấn hoàn toàn. Lý thuyết trên cơ sở tối đa của các allel trong tổng số mẫu hạt nhân (tổng số allel được tổ hợp trong mẫu) gợi ý rằng đóng góp của mỗi nhóm vào mẫu hạt nhân là ngang bằng với đa dạng của mỗi nhóm {h/(1-h)}. Phương pháp tiếp cận này có thể mở rộng áp dụng với số liệu số lượng. Ước lượng biến dị di truyền hiệu ứng cộng có thể áp dụng để ước lượng {h/(1-h)} như là một yếu tố trọng số thêm. Nếu biến động môi trường là một hằng số thì các giá trị kiểu hình coi là một yếu tố trọng số bổ sung thêm của phân bố nhóm đối với đa dạng của mẫu hạt nhân.
Chiến lược M lựa chon sử dụng marker tập trung phân biệt các dạng allel biểu hiện phạm vi locus cho mỗi mẫu nguồn gen. Nó xác định sử dụng các số liệu marker hơn là phân tích thống kê. Sử dụng chương trình đường tuyến tính để tìm tổ hợp của các mẫu nguồn gen sẽ quan sát được tối đa số allel tại mỗi locus trong mẫu hạt nhân, trong khi đó nó lại giữ cho tổng số mẫu lấy từ mỗi nhóm là ít nhất
Cả hai chiến lược đảm bảo các yếu tố đa dạng thông tin được sử dụng là ngang bằng giá trị của chúng như là một tiêu chí của tổng đa dạng bên trong các nhóm