Phần 5 Kết luận và kiến nghị
4.5. Cây phân loại di truyền của 270 mẫu giống với 241 DArT marker
Hình 4.5 thể hiện một cây phân loại có cấu trúc lƣỡng cực với hai nhóm chính, nhóm chính thứ nhất có các mẫu giống chỉ thị màu đỏ là nhóm I – nhóm
indica; nhóm chính thứ hai có mẫu giống chỉ thị màu xanh lục, là nhóm VI –
nhóm japonica theo phân loại isozyme của Glasmanz et al. (1987). Giữa hai
nhóm này có hai nhóm nhỏ tƣơng ứng với nhóm II và nhóm V theo phân loại isozyme của Glasmanz et al. (1987), trong kết quả phân tích cấu trúc di truyền
với chỉ thị DArT bằng phần mềm STRUCTURE đây là các mẫu giống có thành phần genome dạng trung gian (m). Nhóm có các mẫu giống chỉ thị màu xanh lá cây là Sadri/Basmati (nhóm V) có nền di truyền gần với nhóm japonica hơn
trong khi các mẫu giống thuộc nhóm nhỏ màu da cam là Aus/Boro (nhóm II) lại có khoảng cách gần hơn với các mẫu giống thuộc nhóm indica.
Chúng tôi nhận thấy một số giống lúa đặc sản của Việt Nam với các đặc tính nhƣ: hạt cơm dẻo, có mùi thơm đặc trƣng đều thuộc nhóm Sadri/Basmati, ví dụ nhƣ các giống: Tám Thơm, Tám Ấp Bẹ (Ninh Bình), Tám Xoan Hải Hậu… (Phụ lục 2). Phần lớn các mẫu giống thuộc nhóm japonica là các giống đang
đƣợc gieo trồng ở các vùng núi cao trong điều kiện thiếu nƣớc hoặc canh tác nhờ nƣớc trời. Phần lớn các mẫu giống thuộc nhóm indica là các giống đang đƣợc
gieo trồng ở các vùng đồng bằng, đồng bằng ven biển, hay các tỉnh Nam bộ có khí hậu ấm áp và ln có đủ nƣớc (Phụ lục 1 và 2).
Khơng chỉ có vậy, sự phân nhóm di truyền giữa các mẫu giống còn phần lớn trùng khớp với kết quả phân nhóm theo tính trạng thời gian sinh trƣởng tính từ khi gieo hạt tới khi cây trỗ bông (Phụ lục 5).
Phân tích Structure đã xác nhận cấu trúc lƣỡng cực, với K = 2 là số nhóm có khả năng nhất. Cây phân loại xây dựng bằng DARwin 5 có FST = 0,51 cho thấy sự gắn bó mật thiết giữa kết quả STRUCTURE và cây phân loại “Neighbor Joining Tree” đƣợc vẽ bởi DARwin. Trong số 270 giống tham gia vào sơ đồ cây phân loại di truyền này, có 168 mẫu giống đƣợc xác định là indica, 88 mẫu giống là japonica, và 14 mẫu giống dạng trung gian tƣơng ứng với nhóm trung gian
trong nghiên cứu phân tích cấu trúc di truyền bằng STRUCTURE trƣớc đó. Các mẫu giống ở gần nhau trên cây phân loại thƣờng có nhiều đặc điểm tƣơng đồng nhƣ trong tên gọi có các chữ giống nhau, hoặc đƣợc thu thập ở các địa phƣơng
gần nhau (ví dụ: các giống “Nếp” trong Nếp vằn ruộng Hịa Bình và Nếp vàng ong Lạc Sơn Hịa Bình, hoặc “Ble” trong trƣờng hợp của Ble-Blau-da và Ble- Blau-Blau). Một số mẫu giống có tên giống nhau, và ở cùng một vị trí trong cây phân loại nhƣ: “Tan Ngần” trong 02 mẫu giống ký hiệu là G86 và G298 hay “Ba- cho-kte” trong 02 mẫu giống G84 và G297. Vài trƣờng hợp hai mẫu giống có tên khác nhau nhƣ lại có cùng vị trí trên cây phân loại, nhƣ: Ble-Blau-Da và Ble- Blau-Blau trong 02 mẫu giống G197 và G198 (Phụ lục 2). Qua đây có thể hình dung rõ ràng hơn về lịch sử di thực và chọn lọc các giống lúa của ngƣời dân ở các vùng bản địa. Kết quả phân tích đa dạng di truyền với cây phân loại Neibourgh- Joining đã phản ánh rõ nét mối quan hệ họ hàng giữa các mẫu giống lúa nghiên cứu. Căn cứ vào kết quả này, chúng tơi đã loại bỏ các mẫu giống có quan hệ quá gần gũi, hoặc các mẫu giống có cùng nền di truyền nhƣng khác tên (điều này thƣờng gặp ở các giống lúa địa phƣơng Việt Nam, mặc dù giống có nền di truyền giống nhau nhƣng khi đƣa đến các địa phƣơng khác nhau lại đƣợc ngƣời dân địa phƣơng gọi với các tên khác nhau) và chọn đƣợc một tập đoàn gồm 200 giống lúa gồm 197 giống lúa Việt Nam và 3 giống lúa đối chứng (Niponbare đại diện cho lúa japonica ôn đới; Azucena đại diện cho lúa japonica nhiệt đới; và IR64 đại diện cho lúa indica). Thí nghiệm đánh giá kiểu hình bộ rễ
đƣợc thực hiện với 200 mẫu giống đƣợc chọn. Đồng thời, 200 mẫu giống này cũng đƣợc chúng tơi tiến hành phân tích kiểu gen, sử dụng phƣơng pháp GBS (Genotyping By Scequencing) để đánh giá đa hình nucleotide phục vụ cho xác định sự đa dạng alen trong các mẫu giống lúa nghiên cứu và làm cơ sở cho nghiên cứu GWAS.
4.3. KẾT QUẢ PHÂN TÍCH KIỂU GEN THƠNG QUA GIẢI TRÌNH TỰ (GBS – GENOTYPING BY SEQUENCING) (GBS – GENOTYPING BY SEQUENCING)
4.3.1. Kết quả phân tích đa hình và cấu trúc di truyền với SNPs marker
Với tổng số 50000 chỉ thị GBS đã đƣợc sử dụng với 200 mẫu giống lúa, sau khi phân tích kết quả thô, các mẫu giống xuất hiện quá nhiều điểm khuyết dữ liệu kiểu gen sẽ bị loại bỏ. Kết quả, một ma trận haplotype đã đƣợc thành lập bởi 185 mẫu giống lúa, trong đó có 182 giống lúa Việt Nam và 3 giống lúa đối chứng (IR64, Niponbare, Azucena) 25971 marker, có hàm lƣợng thơng tin đa hình
(PIC) biến động từ 1% đến 50%, trung bình là 32,0%.
Để chuẩn bị dữ liệu cho GWAS, các marker có tần số alen thấp (< 5%) bị loại bỏ. Các dữ liệu bị khuyết sẽ đƣợc quy đổi căn cứ vào các dữ liệu đối chứng. Cuối cùng, một ma trận haplotype đƣợc xây dự bởi 185 giống lúa, trong đó có 3 giống đối chứng (IR64, Niponbare, Azucena) và 21623 marker. Các maker đƣợc phân bố đều trong genome với khoảng cách trung bình là 17,1 kb (Hình 4.6). Chúng tơi quan sát đƣợc hai khoảng trống lớn hơn 500 kb trên các nhiễm sắc thể 1, 6, 7, 8 và 11; và 12 khoảng trống có kích thƣớc từ 300 kb đến 500 kb trên các nhiễm sắc thể số 1, 2, 4, 5, 7, 8,và 9.
Chú thích: C là vị trí tâm động của mỗi nhiễm sắc thể; trục tung là chỉ số thơng tin đa hình (PIC); trục hồnh biểu diễn vị trí của marker trên nhiễm sắc thể, kích thƣớc đƣợc tính bằng Mb.
Hình 4.6. Phân bố của GBS marker trên 12 nhiễm sắc thể và hàm lƣợng thông tin đa hình (PIC) của chúng trong ma trận haplotype chuẩn bị cho
nghiên cứu GWAS
Để so sánh và tìm kiếm các vùng QTLs đặc trƣng cho từng nhóm giống, 2
C C C C C C C C C C C C
thuộc nhóm indica (114 giống Việt Nam và IR64) và 64 giống lúa thuộc nhóm japonica (62 giống Việt Nam và Niponbare, Azucena). Số lƣợng marker trong
hai ma trận này lần lƣợt là 13814 và 8821 tƣơng ứng cho từng nhóm giống indica và japonica.
Sự đa hình alen của quần thể đƣợc hình ảnh hóa thơng qua cấu trúc di truyền. Một phân tích cấu trúc di truyền quần thể đƣợc thực hiện trên 1275 SNP marker, kết quả cho thấy tập đoàn 182 giống lúa Việt Nam chia thành hai nhóm rõ rệt gồm 114 giống thuộc loài phụ indica, 62 giống thuộc lồi phụ japonica,
cịn lại là 6 giống thuộc dạng trung gian giữa hai lồi phụ trên. Phân nhóm của các giống trong tập đoàn nghiên cứu gần nhƣ trùng khớp với kết quả trong lần phân tích với các chỉ thị DArT ban đầu. Chỉ có một số trƣờng hợp ngoại lệ: G181 đƣợc phân vào nhóm japonica trong kết quả phân tích với DArT nhƣng ở đây lại đƣợc phân vào nhóm indica; G211 đƣợc phân vào nhóm trung gian khi phân tích với DArT thì theo kết quả GBS lại thuộc nhóm indica, ngƣợc lại G207 ban đầu
theo kết quả của DArT thuộc nhóm indica nhƣng theo GBS lại ở nhóm trung
gian. Các ngoại lệ này xảy ra không ngoại trừ khả năng có sự gắn nhãn sai tại một vài điểm trong q trình đọc tín hiệu ADN, nhƣng cũng có khả năng do số lƣợng SNPs marker đƣợc sử dụng khá lớn (gấp gần 6 lần DArT marker) nên đã tìm ra một số vùng đặc hiệu hơn để nhận biết và phân tách nhóm giống chính xác hơn. Mặc dù vậy, chỉ với 241 marker, kết quả phân tích đa dạng, phân tách nhóm giống của DArT lại gần nhƣ không sai biệt lắm với GBS đã chứng tỏ sức mạnh và độ tin cậy của cơng nghệ DArT trong lĩnh vực phân tích đa dạng di truyền. Song đối với các nghiên cứu GWAS, để đảm bảo mật độ marker cao, bao phủ tồn bộ genome thì thí nghiệm phân tích kiểu gen sử dụng phƣơng pháp GBS với một lƣợng lớn chỉ thị SNPs là rất cần thiết.
Tiến hành phân tích mối quan hệ giữa 115 mẫu giống thuộc loài phụ indica, sử dụng 840 SNP marker đã xác định đƣợc có 6 phân nhóm, đƣợc ký hiệu lần lƣợt từ I1 đến I6, kết quả này một lần nữa đƣợc xác định bằng phƣơng pháp phân tích thành phần chính (DACP) (Jombary et al., 2010); 6 phân nhóm này đƣợc
biểu diễn ở Hình 4.7.
giống thuộc lồi phụ japonica, sử dụng 780 SNPs marker. Kết quả xác định đƣợc 4 phân nhóm và một nhóm trung gian. Sơ đồ cây phân loại đƣợc vẽ bởi phần mềm DARwin và đƣợc trình bày ở Hình 4.8.
Sự khác biệt giữa các phân nhóm đƣợc đo bằng chỉ số FST giữa từng cặp phân nhóm ở cả hai nhóm lồi phụ indica và japonica, đƣợc trình bày ở Bảng
4.4. Qua Bảng 4.4 cho thấy các giá trị FST đều có mức ý nghĩa cao, dao động từ 0,001 đến 0,003. Giá trị FST trong các nhóm japonica là từ 0,428 đến 0,692, cao hơn chỉ số này giữa các phân nhóm trong nhóm indica (0,264 đến 0,555). Số liệu này cũng đƣợc minh chứng qua hình ảnh cây phân loại của hai nhóm, nhóm
indica cây phân loại có cấu trúc gần giống cấu trúc tỏa tròn, cho thấy mối quan
hệ khá gần gũi và khoảng cách di truyền khác đồng đều giữa các phân nhóm, trong khi nhóm japonica chúng ta thấy rõ phân nhóm J3 và phân nhóm J2 gần
nhƣ tạo thành hai cực đối xứng và cách nhau khá xa.
Bảng 4.4. Chỉ số FST giữa các phân nhóm và mức ý nghĩa P-value
indica I1 I2 I3 I4 I5 I6 I1 0,001 0,003 0,001 0,001 0,001 I2 0,303 0,001 0,001 0,001 0,001 I3 0,406 0,453 0,001 0,001 0,001 I4 0,327 0,301 0,498 0,001 0,001 I5 0,374 0,405 0,555 0,381 0,001 I6 0,264 0.270 0,375 0,269 0,347 japonica J1 J2 J3 J4 J1 0,001 0,003 0,001 J2 0,528 0,001 0,001 J3 0,428 0,692 0,001 J4 0,461 0,542 0,676
Trong đó: Giá trị FST đƣợc ghi dƣới đƣờng chéo, giá trị P-value đƣợc ghi phía trên đƣờng chéo tƣơng ứng
4.3.2. Đặc điểm của các mẫu giống lúa trong các phân nhóm khác nhau
Các đặc điểm của giống nghiên cứu thuộc các nhóm khác nhau đƣợc tổng hợp và ghi nhận tại Bảng 4.5. Tập hợp kết quả ở Bảng 4.5 sử dụng phần mềm
DARwin để biểu diễn các thông tin về đặc điểm các giống nghiên cứu trên cây phân loại của từng nhóm giống, kết quả cho thấy các giống ở chung một phân nhóm thƣờng có một số đặc điểm đặc trƣng cho phân nhóm đó.
4.3.2.1. Đặc điểm của các phân nhóm giống thuộc nhóm indica
Trong 114 giống lúa indica Việt Nam đƣợc chia làm 6 phân nhóm, đƣợc ký hiệu lần lƣợt từ I1 đến I6. Phân nhóm I1 (có 11 mẫu giống), chủ yếu là các giống lúa tẻ, cải tiến, có thời gian sinh trƣởng ngắn, đƣợc canh tác trong điều kiện chủ động tƣới tiêu, nguồn gốc từ Đồng bằng Sông Cửu Long và Đồng bằng Sông Hồng, hạt dài mảnh. Phân nhóm I2 (26 mẫu giống), bao gồm hầu hết là các giống lúa có thời gian sinh trƣởng dài và rất dài, đƣợc canh tác trong điều kiện nƣớc trời nơi thấp trũng ở Đồng bằng Sông Cửu Long, cùng là gạo tẻ nhƣng có hình dạng hạt rất đa dạng. Phân nhóm I3 (5 mẫu giống), là các giống lúa nếp đƣợc trồng trên nƣơng rẫy tại vùng núi Đông Bắc Bộ và Tây Bắc Bộ, thời gian sinh trƣởng từ dài đến rất dài, dạng hạt dài và mảnh. Phân nhóm I4 (18 mẫu giống), gồm các giống lúa có thời gian sinh trƣởng thuộc nhóm trung ngày đƣợc thu thập từ vùng Đồng bằng Sông Hồng và Tây Bắc bộ, là lúa tẻ; chiều dài hạt trung bình, chiều ngang hẹp. Phân nhóm I5 (9 mẫu giống) là những mẫu giống có thời gian sinh trƣởng trung bình, đƣợc thu thập ở nhiều nơi từ các tỉnh phía Bắc đến Đồng bằng Duyên hải Nam Trung Bộ, là lúa nếp có dạng hạt dài và nhỏ. Phân nhóm I6 (18 mẫu giống), đây là một nhóm có đặc điểm rất phức tạp, gồm cả gạo nếp và gạo tẻ (gạo tẻ chiếm số đông), phân bố ở nhiều nơi từ vùng Tây Bắc Bộ đến Duyên hải Nam Trung Bộ, thời gian sinh trƣởng dài ngắn khác nhau, kích thƣớc hạt từ nhỏ tới trung bình. Ngồi các mẫu giống thuộc 6 phân nhóm kể trên, trong nhóm indica cịn có 27 mẫu giống có nền di truyền pha trộn giữa các nhóm, khơng có đặc điểm đặc trƣng, ngoại trừ khá nhiều mẫu giống thuộc phân nhóm này thuộc dạng lúa nếp.
Trong nhóm lồi phụ indica, phân nhóm I1 tƣơng đƣơng với nhóm giống
cải tiến, năng suất cao; phân nhóm I2 mang nhiều đặc điểm của các giống lúa vùng đồng chiêm trũng, cảm ứng với quang chu kỳ, đƣợc trồng ở các vùng đất ngập nƣớc ở Đồng bằng Sông Cửu Long theo phân loại của Bùi Bá Bổng và cs. (2000); phân nhóm I3 gồm 5 giống không mang nhiều đặc điểm kinh điển đặc
trƣng cho indica, đồng thời cũng là nhóm có chỉ số FST cao nhất; trong các nhóm còn lại, đặc điểm của từng nhóm khá rõ ràng, phân nhóm I6 mang nhiều đặc điểm giao giữa các phân nhóm cịn lại.
Chú thích: Các mẫu giống có màu giống nhau thì cùng thuộc một phân nhóm; mẫu giống chƣa xác định đƣợc phân nhóm đƣợc biểu diễn bằng màu đen; IR64 (giống đối chứng đại diện cho nhóm
indica) nằm trong phân nhóm đƣợc biểu diễn bằng màu hồng (I1); Các đặc điểm đặc trƣng của các
phân nhóm đƣợc ghi cùng màu với phân nhóm đó, trong đó: 1) Đặc điểm vùng khí hậu nơi giống đƣợc thu thập: MRD = Vùng Đồng bằng Sông Cửu Long; SE = Vùng Đông Nam Bộ; CH = Vùng Tây Nguyên;
SCC = Vùng Duyên hải Nam Trung Bộ; NCC = Vùng Duyên hải Bắc Trung Bộ; RRD = Vùng Đồng bằng Sông Hồng; NW = vùng Tây Bắc Bộ; NE = Vùng Đông Bắc Bộ. 2) Sinh thái: IR = Chủ động tƣới
tiêu; RL = Canh tác nƣớc trời ở vùng đất thấp; UP = canh tác nƣơng rẫy; MX = đƣợc canh tác trong nhiều hệ sinh thái khác nhau. 3) Thời gian sinh trƣởng: E = Ngắn; M = Trung ngày; L = Dài ngày;
VL = Rất dài ngày. 4) Tỷ lệ giữa chiều dài và chiều rộng hạt thóc (L/W): A = L/W > 3,0; B = 2,5 ≤ L/W ≤ 3,0; C = L/W ≤ 2.5. 5) Đặc điểm nội nhũ: G = gạo nếp; NG = gạo tẻ.
Hình 4.7. Các phân nhóm trong nhóm mẫu giống thuộc lồi phụ indica
4.3.2.2. Đặc điểm của các phân nhóm giống thuộc nhóm japonica
Nhóm giống japonica gồm 62 mẫu giống lúa Việt Nam đƣợc chia làm 4
phân nhóm J1, J2, J3 và J4, và một số mẫu giống ở dạng trung gian. Phân nhóm J1 (36 mẫu giống), đa phần là các giống lúa có thời gian sinh trƣởng ngắn đến trung ngày, đƣợc gieo trồng ở vùng núi Đông Bắc bộ và Tây Bắc bộ, phần lớn là lúa nếp, có dạng hạt dài và rộng, là dạng phổ biến của lúa trồng trên các vùng nƣơng rẫy ở Đơng Nam Á. Phân nhóm J2 (10 mẫu giống), tất cả đều là dạng lúa nếp, có thời gian sinh trƣởng trung bình, hạt ngắn và rộng, tuy nhiên lại đƣợc phân bố ở nhiều vùng sinh thái khác nhau. Phân nhóm J3 (6 mẫu giống), gồm các giống lúa từ trung đến dài ngày, là gạo tẻ, phân bố chủ yếu ở cùng Duyên hải Nam Trung Bộ và Đông Nam Bộ, hạt dài và rộng. Phân nhóm J4 (6 mẫu giống), là các giống lúa ngắn ngày đƣợc trồng ở vùng đồng chiêm trũng và ven biển ngập mặn Đồng bằng Sơng Hồng, có dạng hạt ngắn hoặc trung bình.
Trong lồi phụ japonica, phân nhóm J1 có các đặc điểm đặc trƣng tƣơng
ứng với giống lúa Khao dam; phân nhóm J2 có đặc điểm tƣơng đƣơng với nhóm
japonica ơn đới đƣợc đại diện bởi các giống lúa nhƣ Nipponbare, Ariete và Giza
171. Ở vùng nhiệt đới, các giống lúa japonica ôn đới thƣờng đƣợc trồng trên các vùng núi cao có nhiệt độ thấp, phần lớn các giống lúa này đƣợc trồng trên các vùng đất có thể chủ động tƣới tiêu vì nƣớc là một nhân tố giúp cân bằng sự biến