Sơ đồ các bƣớc thực hiện phân tích đa dạng di truyền với DArT

Một phần của tài liệu (LUẬN văn THẠC sĩ) xác định các gen alen đặc thù liên quan đến sự phát triển bộ rễ của các giống lúa việt nam (Trang 66)

Phần 5 Kết luận và kiến nghị

3.2. Sơ đồ các bƣớc thực hiện phân tích đa dạng di truyền với DArT

Một ma trận gồm tên marker, tên giống và kết quả biểu hiện của marker ở từng giống đƣợc thiết lập, trong đó "1" là ký hiệu cho việc có sự bắt cặp giữa ADN của mẫu giống nghiên cứu với ADN của các giống đối chứng, "0" là ký hiệu sự bắt cặp đã không xảy ra, và "-9" là ký hiệu cho các vị trí mà tín hiệu bắt cặp khơng đƣợc xác định rõ ràng.

Chất lƣợng và độ tin cậy của mỗi maker đƣợc đánh giá bằng hai thông số là chỉ số lặp lại (Reproducibility) và chỉ số P-value. Chỉ số lặp lại chính là khả năng đƣa ra kết quả giống nhau của marker đó sau mỗi lần lặp lại, đƣợc tính toán dựa trên việc đếm số lần đƣa ra kết quả sai khác trong n lần lặp lại của mẫu. Chỉ số P- value biến thiên từ 0 đến 1, đƣợc tính tốn bằng cách chia phƣơng sai cƣờng độ tín hiệu lai giữa hai lớp có tín hiệu "1" và khơng có tín hiệu lai "0" với tổng phƣơng sai cƣờng độ tín hiệu lai của marker đó, chỉ số P-value càng lớn thì marker đó càng đáng tin cậy.

Bảng 3.1. Các giống lúa đƣợc dùng để xây dựng thƣ viện DArT markers

STT Tên Giống Nguồn gốc Nhóm giống

1 63-83 Senegal tropical japonica

2 Apo Philippines indica

3 Arborio Ý Temperate japonica

4 Azucena Philippines tropical japonica

5 Baldo 363 Ý Temperate japonica

6 Bomba Ý Temperate japonica

7 Cigalon Pháp Temperate japonica

8 Gambiaka Mali indica

9 IAC 165 Brazil tropical japonica

10 IR64 Philippines indica

11 Kalinga III Ấn Độ indica

12 Khao Dam Thái Lan tropical japonica

13 Khao Dawk Mali 105 Thái Lan indica

14 Koral Bồ Đào Nha Temperate japonica

15 Makalioka 34 Madagascar indica

16 Miara Ý Temperate japonica

17 Moroberekan Guinea tropical japonica

18 Nipponbare Nhật Bản Temperate japonica

19 Oryzica Llanos 5 Colombia indica

20 Ribe Jaune Ý Temperate japonica

21 Swarna Ấn Độ indica

22 Tequing Trung Quốc indica

23 Thaibonnet Mỹ Temperate japonica

24 Vandana Ấn Độ indica

25 Viale Tây Ban Nha Temperate japonica

Trong đó: Temperate Japonica là lúa Japonica ơn đới, Tropical Japonica là lúa japonica nhiệt đới,

indica là lúa thuộc lồi phụ indica

Các marker khơng đa hình trong tập đoàn nghiên cứu bị loại bỏ, thƣờng là những marker có P-value nhỏ hơn 0,8 và có nhiều hơn 10% tín hiệu khơng rõ. Một ma trận dữ liệu tƣơng tự sau đó đƣợc tạo thành nhờ sử dụng phần mềm

DARwin 5 để loại bỏ các điểm đánh dấu với các mẫu giống hệt nhau (Perrier, 2006). Hàm lƣợng thơng tin đa hình PIC đƣợc tính tốn dựa trên bộ dữ liệu với các marker còn lại. Một cây phân loại đƣợc xây dựng bằng phần mềm DARwin 5 để xác định mối quan hệ họ hàng gần gũi giữa các giống, nhóm giống trong tập đoàn nghiên cứu (Perrier, 2006). Căn cứ vào kết quả này chúng tôi lựa chọn các mẫu giống lúa tham gia vào phân tích kiểu gen sử dụng phƣơng pháp GBS để nâng cao hiệu quả nghiên cứu và giảm thiểu nguy cơ dƣơng tính giả trong nghiên cứu GWAS sau đó.

3.5.4. Phân tích kiểu gen thơng qua giải trình tự (GBS)

Thí nghiệm phân tích kiểu gen thơng qua giải trình tự đƣợc thực hiện tại công ty Diversity Arrays Technology Pty Ltd (DArT P/L) - Australia. Phƣơng pháp đƣợc sử dụng do chính cơng ty này xây dựng, kết hợp giữa DArT và cộng nghệ giải trình tự NGS đƣợc gọi tắt là DArTseqTM. Phƣơng pháp DArTseqTM sử dụng các enzyme giới hạn PstI/TaqI để làm giảm sự phức tạp của genome, kết hợp với cơng nghệ đọc trình tự ngắn Illumina, phƣơng pháp này đã đƣợc mô tả rất kỹ trong một công bố của Courtois et al. (2013). Bộ tiếp hợp đặc hiệu với enzyme PstI đƣợc gắn với 96 mã vạch khác nhau, sau đó đƣợc gắn với các đoạn cắt giới hạn đƣợc đặt trong các đĩa ADN khác nhau, 96 mẫu ADN này đƣợc trộn với nhau và lần lƣợt chạy qua máy đọc trình tự Illumina Hiseq2000 theo một chiều duy nhất. Các bộ tiếp hợp PstI đƣợc gắn kèm một trình tự mồi để đảm bảo rằng vị trí đầu tiên đƣợc đọc trình tự ln xuất phát từ vùng trình tự nhận biết của enzyme PstI. Các chuỗi kết quả đƣợc lọc và phân loại tƣơng ứng với các dữ liệu mục tiêu và các trình tự mã vạch đã đƣợc cắt tỉa. Đoạn ADN đã đƣợc cắt tỉa gồm 69 bp (5 bp là trình tự nhận biết của enzyme cắt giới hạn, và 64 bp có mức độ đặc hiệu tuyệt đối). Kết quả giải trình tự sẽ đƣợc phân tích bằng phần mềm đƣợc phát triển bởi công ty DArT P/L.

Dữ liệu giải trình tự thơ (raw data) đƣợc cơng ty DArT P/L bàn giao sau khi việc giải trình tự hoàn thành, và đƣợc nghiên cứu sinh tiếp tục xử lý, phân tích bằng các phần mềm chuyên dụng. Các chỉ thị khơng xuất hiện trong trình tự của Nipponbare và có trên 20% dữ liệu khơng có tín hiệu hoặc dữ liệu không rõ bị loại bỏ khỏi bộ dữ liệu ban đầu. Sau đó, để đáp ứng với yêu cầu của GWAS, các marker có tần số “minor allele” dƣới 5% bị loại bỏ. Các dữ liệu bị khuyết đƣợc khôi phục nhờ sử dụng phần mềm BEAGLE 3.3.2 (Browning and Browning, 2007). Bộ dữ liệu cuối cùng có chất lƣợng tốt nhất đƣợc sử dụng để tiến hành các phân tích cấu trúc quần thể và GWAS.

3.5.5. Phân tích cấu trúc di truyền của tập đồn mẫu giống nghiên cứu

Cấu trúc di truyền của tập đồn mẫu giống nghiên cứu đƣợc phân tích 2 lần. Lần 1 đƣợc thực hiện trên bộ dữ liệu thu đƣợc từ kết quả phân tích DArT. Lần 2 đƣợc thực hiện sử dụng dữ liệu thu đƣợc từ kết quả phân tích GBS, chúng tôi chọn ngẫu nhiên một phần nhỏ các SNP marker có tỷ lệ dữ liệu bị khuyết dƣới 2,5% và khoảng cách giữa 2 marker ≤ 100 kb. Phần mềm sử dụng là STRUCTURE đƣợc phát triển bởi Pritchard et al. (2000). Dữ liệu đầu vào là ma

trận gồm bộ dữ liệu haplotype của các giống lúa với các marker đƣợc chọn, sử dụng mơ hình hỗn hợp kết hợp với tần số tƣơng quan với 200000 thử nghiệm trên một lần lặp lại, và lặp lại 200000 lần, số thành phần quần thể dự kiến (K) biến đổi từ 1 đến 10, 10 lần chạy lặp lại đối với mỗi một giá trị K. Sau khi loại bỏ các lần chạy khơng có sự hội tụ, kết quả thu đƣợc đƣợc phân tích bằng phần mềm Structure Haverster (Earl and vonHoldt, 2012), kết hợp chặt chẽ với những phát triển ban đầu của Evano et al. (2005) giúp xác định số lƣợng các nhóm giống có quan hệ gần gũi về di truyền trong tập đoàn giống nghiên cứu. Đồng thời bƣớc này cũng đƣợc tiến hành bằng phƣơng pháp phân tích thành phần chính (DAPC) đƣợc phát triển bởi Jombard et al. (2010) sử dụng phần mềm R Adegenet

(Jombart, 2008). Một mẫu giống đƣợc xác định là thuộc một nhóm nào đó khi mang 75% thành phần genome của nhóm giống đó. Chỉ số Fst (the pairwise Wright’s fixation index) đo mức độ phân hóa di truyền giữa các nhóm (Wright, 1978), đƣợc tính tốn bằng phần mềm Arlequin (Excoffier et al., 2005) với 1000 hoán vị để xác định mức ý nghĩa của sự sai khác giữa chúng.

Để hình ảnh hóa mối quan hệ di truyền giữa các mẫu giống nghiên cứu chúng tôi tiến hành xây dựng cây phân loại Neighbour-Joining (NJ) với một ma trận các thuộc tính khác biệt của các mẫu giống. Với các DArT marker, ma trận này đƣợc tính tốn sử dụng hệ số Sokal and Michener [dij=u/[m+u]] (Sokal, 1958), trong đó u là số alen khác biệt giữa cá thể thứ i và cá thể thứ j, còn m là số alen trùng hợp trong ma trận dữ liệu thu đƣợc từ DArT. Đối với SNP marker, ma trận này đƣợc tính tốn dựa trên chỉ số chia sẻ của các alen. Tất cả các phân tích này đƣợc tiến hành trên phần mềm DARwin (Perrier, 2006). Cấu trúc quần thể nghiên cứu đƣợc biểu diễn dựa trên tọa độ của các mẫu giống trên bản đồ di truyền hình cây.

Lần thứ hai tiến hành phân tích cấu trúc quần thể, sử dụng số lƣợng lớn SNP marker, sự đa hình trong quần thể nghiên cứu đƣợc thể hiện càng rõ ràng

hơn qua số lƣợng và khoảng cách di truyền giữa các phân nhóm giống trong từng nhóm lồi phụ đã đƣợc xác định khi phân tích đa dạng di truyền với chỉ thị DArT trƣớc đó.

3.5.6. Xác định mức độ phân rã của Linkage Disequilibrium

Để đánh giá mật độ của các marker có đáp ứng yêu cầu của các nghiên cứu di truyền liên kết hay không, sự mất cân bằng liên kết (Linkage Disequilibrium - LD) trong tồn bộ tập đồn nghiên cứu đƣợc tính tốn bằng hệ số r2 giữa các cặp SNPs marker, sử dụng phần mềm Tassel 5.0 trên dữ liệu của từng nhiễm sắc thể (Bradbury et al., 2007). Bởi vì LD chịu ảnh hƣởng rất lớn bởi cấu trúc quần thể nên chúng tơi chỉ tiến hành tính tốn sự mất cân bằng liên kết - LD bên trong mỗi nhóm mẫu giống indica và japonica. Chỉ số LD kém với những marker có tần số alen thấp (Flint-Garcia et al., 2003), do đó, chỉ có những marker có tần số “minor allele” trên 10% đƣợc sử dụng. Khoảng cách vật lý giữa các cặp marker đƣợc tính tốn dựa trên mỗi nhiễm sắc thể. Bởi vì biến động rất lớn trong việc ƣớc lƣợng LD cho từng cặp SNP marker, các cặp marker đƣợc thiết lập trong phạm vi khoảng cách 25kb, và chỉ số r2 đƣợc ghi nhận là trung bình cộng của r2 của các nhóm marker có khoảng cách 25kb này theo đề xuất của (Mather et al., 2007). Một định luật hàm mũ (y =axk) đƣợc sử dụng để xác định mối tƣơng quan giữa khoảng cách vật lý giữa hai marker (x) và chỉ số r2 (y).

3.5.7. Phƣơng pháp đánh giá kiểu hình bộ rễ

3.5.7.1. Bố trí thí nghiệm

Thí nghiệm đƣợc thực hiện trong nhà lƣới chống côn trùng tại Trạm thực nghiệm Văn Giang - Viện Di truyền Nông nghiệp, thuộc xã Liên Nghĩa - huyện Văn Giang - Hƣng Yên, đƣợc thiết kế theo kiểu alpha-lattice với 3 lần lặp lại, mỗi lần lặp gồm 200 giống lúa đƣợc chia làm 10 khối (block), mỗi khối chứa 20 giống. Các khối đƣợc bố trí để hạn chế tác động của yếu tố mơi trƣờng đến sinh trƣởng phát triển của các giống trong mỗi một lần nhắc lại.

Thí nghiệm áp dụng phƣơng pháp ống rễ cải tiến để phù hợp với mục đích, và điều kiện thực hiện thí nghiệm tại Việt Nam. Cây lúa đƣợc trồng trong các “ống” đƣợc tạo thành từ ống nhựa PVC và bên trong là túi nilon đen dài 80 cm, đƣờng kính 16 cm. Giá thể sử dụng là cát sơng, đƣợc trộn đều với nhau và với phân bón NPK 5:10:3 theo tỉ lệ 20 kg phân cho 1 m3 cát. Hạt đƣợc gieo vào ống

sau khi đã đƣợc ủ 03 ngày trong điều kiện 28oC cho nảy mầm trên giấy lọc. Ban đầu gieo 5 hạt/ống, sau khi cây có 1 lá thật thì chỉ giữ lại 01 cây ở chính giữa ống, các cây xung quanh sẽ bị nhổ bỏ đi. Cây đƣợc tƣới 4 lần/ ngày vào các giờ nhất định (6 giờ, 10 giờ, 12 giờ và 18 giờ), trừ khi trời mƣa. Sau gieo 3 tuần, tƣới bổ sung phân bón NPK 15/15/15 hòa tan cho cây với liều lƣợng 2,5g/cây (ống). Bộ rễ đƣợc thu sau 6 tuần kể từ ngày gieo hạt vào ống (45 ngày kể từ khi gieo hạt). Sau khi rửa sạch, bộ rễ đƣợc đánh giá về các tính trạng quan tâm.

3.5.7.2. Các chỉ tiêu theo dõi

Đối với mỗi mẫu thí nghiệm, chúng tơi tiến hành thu thập số liệu của 11 chỉ tiêu sơ cấp gồm: 1) Chiều dài thân: đƣợc tính từ gốc đến đỉnh của lá dài nhất, ký hiệu là LLGTH; 2) Số nhánh: chỉ tính các nhánh đã thực sự xuất hiện từ gốc thân, ký hiệu là TIL; 3) Khối lƣợng khô của phần thân, ký hiệu là SDW; 4) Độ ăn sâu của rễ: là độ dài của rễ khi cịn ngun bầu cát, hay có thể gọi là điểm sâu nhất của rễ khi phát triển trong túi, ký hiệu là DEPTH; 5) Số lƣợng rễ bất định: gồm cả rễ bất định sinh ra từ nhánh chính và các nhánh thứ cấp, đếm ở cách gốc rễ 2 cm, ký hiệu là NCR; 6) Độ dày của rễ: là đƣờng kính của rễ bất định, đƣợc đo bằng kính lúp chuyên dụng tại điểm cách gốc rễ 2 cm, đo 5 rễ/cây, sau đó lấy trung bình cộng của 5 rễ đó, ký hiệu là THK; 7) Khối lƣợng khơ của phần rễ từ 0 đến 20 cm tính từ gốc: cân bằng cân vi lƣợng điện tử, số liệu lấy đến 4 số sau dấu phảy, ký hiệu là DW0020; 8) Khối lƣợng khô của phần rễ từ 20 đến 40 cm tính từ gốc, ký hiệu DW2040; 9) Khối lƣợng khô của phần rễ từ 40 đến 60 cm tính từ gốc, ký hiệu DW4060; 10) Khối lƣợng khô của phần rễ dài hơn 60 cm tính từ gốc, ký hiêu DWB60. 11) Chiều dài rễ tối đa: Đo sau khi bộ rễ đƣợc rửa sạch, ký hiệu là MRL. Chú ý: tất cả các chỉ tiêu liên quan đến khối lƣợng khô mẫu vật điều đƣợc sấy ở 72o

C, liên tục trong 03 ngày cho tới khi kiểm tra thấy khối lƣợng không đổi; số liệu đƣợc cân bằng cân vi lƣợng điện tử, số liệu lấy đến 4 số sau dấu phảy. Có thể hình dung cách thức và vị trí thu thập số liệu theo sơ đồ đƣợc thể hiện trên Hình 3.2.

Các chỉ tiêu thứ cấp lần lƣợt đƣợc tính tốn là: 12) Khối lƣợng khơ của toàn bộ rễ , ký hiệu là RDW; 13) Khối lƣợng khô của phần rễ ăn sâu (phần rễ dài hơn 40 cm), ký hiệu là DRW; 14) Khối lƣợng khô của cả cây lúa (cả thân và rễ), ký

hiệu PDW; 15) Phần trăm khối lƣợng khô của phần rễ ăn nông (DW0020), ký hiệu SRP; 16) Phần trăm khối lƣợng khô của phần rễ ăn sâu, ký hiệu là DRP; 17) Tỷ lệ khối lƣợng khô giữa phần rễ và phần thân cây cũng đƣợc tính tốn, ký hiệu là R_S; 18) Số rễ bất định trung bình/nhánh đƣợc ký hiệu là NR_T.

Trong đó: LLGTH: Chiều dài thân; MRL: Chiều dài rễ tối đa; TIL: Số nhánh; SDW: Khối lƣợng khô phần thân; DEPTH: Độ ăn sâu của rễ; NCR: Số lƣợng rễ bất định; THK: Độ dày của rễ; DW0020: Khối lƣợng khô của phần rễ từ 0 đến 20 cm tính từ gốc; DW2040: Khối lƣợng khơ của phần rễ từ 20 đến 40 cm

tính từ gốc; DW4060: Khối lƣợng khơ của phần rễ từ 40 đến 60 cm tính từ gốc; DWB60: Khối lƣợng khơ của phần rễ dài hơn 60 cm tính từ gốc; RDW: Khối lƣợng khơ của tồn bộ rễ lúa; DRW: Khối lƣợng khơ

của phần rễ ăn sâu hơn 40 cm tính từ gốc; PDW: Khối lƣợng khô của cả cây lúa (cả thân và rễ); SRP: Phần trăm khối lƣợng khô của phần rễ ăn nông; DRP: Phần trăm khối lƣợng khô của phần rễ ăn sâu; R_S:

Tỷ lệ khối lƣợng khô giữa phần rễ và phần thân cây ; NR_T: Số rễ bất định trung bình trên 1 nhánh.

Hình 3.3. Các chỉ tiêu và vị trí thu thập số liệu các tính trạng liên quan đến sự phát triển bộ rễ của các giống nghiên cứu

3.5.7.3. Phương pháp phân tích số liệu kiểu hình

Sau khi thu thập, số liệu thô đƣợc nhập vào Excel để kiểm tra và sắp xếp. Sau đó các số liệu đƣợc đƣa vào phân tích phƣơng sai (ANOVA) để xem xét ảnh hƣởng của đa dạng di truyền, số lần lặp và các block đến kết quả thí nghiệm, sử dụng phần mềm SAS 9.2 (SAS Institute, Cary NC, USA). Trung bình bình phƣơng của các giống đƣợc tính tốn để hiệu chỉnh sự mất cân bằng gây ra do hiệu ứng giữa các khối, sử dụng SAS 9.2, từ đó xác định đƣợc giá trị trung bình của mỗi giống ở mỗi tính trạng quan tâm sau khi đã hiệu chỉnh. Giá trị trung bình đã đƣợc hiệu chỉnh sẽ đƣợc sử dụng để tính tốn mối tƣơng quan giữa các kiểu hình giữa các đặc điểm nghiên cứu. Bộ dữ liệu gồm giá trị trung bình đã đƣợc hiệu chỉnh của các giống sẽ đƣợc sử dụng trong phân tích GWAS ở phần tiếp theo. Để làm rõ hơn mối quan hệ giữa sự biến đổi kiểu hình và cấu trúc di truyền, chúng tơi cũng tiến hành phân tích ANOVA cho từng nhóm lồi phụ indica và japonica. Tiến hành phép kiểm định Newman &Keuls để xác định sự sai khác có

Một phần của tài liệu (LUẬN văn THẠC sĩ) xác định các gen alen đặc thù liên quan đến sự phát triển bộ rễ của các giống lúa việt nam (Trang 66)

Tải bản đầy đủ (PDF)

(168 trang)