Xây dựng phương pháp nhận diện và phân tích tính đa dạng di truyền của 21 dòng cacao băng kỹ thuật Microsatellite 4
Trang 1Qui trình li trích DNA của chúng tôi đạt hiệu quả vì DNA li trích có độ tinhkhiết cao, không bị lẫn tạp DNA lạ Vì ở qui trình li trích này, trong dịch trích DNAcó chất mercapto có khả năng phá vỡ thành tế bào rất mạnh Bước ủ Rnase sẽ phânhủy RNA có trong mẫu li trích, góp phần hạn chế lượng DNA tạp tổng hợp từ RNAtrong phản ứng PCR sau này Đặc biệt sự có mặt của muối sodium acetate có khảnăng làm biến tính enzyme phân hủy DNA Mặt khác, bước sử dụng Chloroformđược lặp lại 2 lần liên tiếp kết hợp với li tâm đã loại bỏ hết protein vàpolysaccharide có trong mẫu Do đó, DNA thu được rất tốt, đảm bảo cho phản ứngPCR xảy ra
Kết quả định lượng DNA bằng quang phổ kế cho thấy DNA của các mẫuđem li trích có độ tinh sạch tương đối cao với tỉ lệ OD260nm/OD280nm nằm trongkhoảng 1.5 đến 2.2 và lượng DNA có trong mỗi mẫu trung bình khoảng 50ng/µl.
Hình 4.1: Kết quả điện di sản phẩm li trích DNA
Trang 2 Những mẫu có tỉ lệ OD thấp, độ tinh sạch không cao, chúng tôi vẫn có thểchạy PCR đạt kết quả tốt bằng cách xử lý như sau: pha loãng mẫu 2-3 lần, rồi li tâmở 12000 vòng, trong 5 phút ở 4oC để lắng cặn xuống đáy ống, rồi nhẹ nhàng hútDNA ở khoảng giữa ống để thực hiện phản ứng PCR, trong trường hợp này thể tíchDNA trong phản ứng PCR được tăng lên gấp đôi (4µl thay vì 2µl) và giảm thể tíchnước đi 2µl
Bước pha loãng mẫu sẽ giúp giảm nồng độ tạp chất còn lẫn trong sản phẩm litrích sau cùng, bước li tâm tiếp theo sẽ giúp thu được DNA tinh sạch với nồng độthấp ở khoảng giữa ống và không bị lẫn tạp chất đã lắng xuống đáy ống
4.2.Sản phẩm PCR
Qui trình PCR cho kết quả ổn định với cả 5 cặp primer Tuy nhiên primermTcCIR11 thường cho những band rất mờ do mức độ khuếch đại thấp hơn cácprimer khác Vì vậy khi pha trộn mẫu với primer mTcCIR11 cần tăng nồng độ DNAlên gấp đôi
Hình 4.2: Kết quả điện di sản phẩm PCR với primer mTcCIR7
Qui trình PCR cho kết quả tương đối ổn định Những mẫu có nồng độ DNAli trích cao sẽ cho kết quả tốt khi chạy multiplex PCR, cho các band điện di sáng, rõ.Do đó khi thực hiện phản ứng multiplex PCR cần tăng nồng độ DNA lên gấp đôi.
Hình 4.3: Kết quả điện di sản phẩm multiplex PCR
Trang 34.3.Dữ liệu Microsatellite để định danh 21 dòng cacao
Sản phẩm PCR có thể đưa vào phân tích ngay trên máy giải trình tự DNA màkhông cần phải qua bước tinh sạch Vì kết quả so sánh giữa 2 nghiệm thức tinh sạch vàkhông tinh sạch cho kết quả phân tích như nhau Do đó sản phẩm PCR không cần phảitinh sạch trước khi phân tích để giảm tốn kém
Ngoài ra để giảm thời gian (1 giờ cho mỗi 16 giếng trên đĩa) và hóa chất phântích (size standard và hidi formamide), chúng tôi tiến hành trộn 3 sản phẩm PCR riêngbiệt (0.5µl/1sản phẩm) với cùng một lượng size standard và hidi formamide như với 1sản phẩm Điều này giúp giảm chi phí xuống 3 lần mà vẫn cho kết quả phân tích tốt
Những mẫu có sản phẩm PCR không xuất hiện band nào trên gel điện di hoặcband điện di quá mờ vẫn có thể cho kết quả khi phân tích trên máy giải trình tự DNAbằng cách tăng lượng mẫu PCR lên gấp đôi (1µl thay vì 0.5µl) trong hỗn hợp mangđiện di.
Trong trường hợp không nhận được kết quả khi phân tích microsatellite (Nodata), chúng tôi tiến hành hoàn thiện phản ứng bằng cách nâng lượng mẫu trong phảnứng PCR lên gấp đôi (4µl thay vì 2µl) Do đó chúng tôi thu được kết quả phân tích củatất cả các mẫu với 5 primer.
Kết quả phân tích 21 dòng cacao khảo sát với 5 cặp pimer được tóm tắt ở2 bảng 4.1 và 4.2 với các cặp al đặc trưng sau khi đã loại trừ những allele dropping(xem trang 54) Từ kết quả này, chúng tôi nhận thấy 5 primer sử dụng có thể phân biệtđược 21 kiểu gen khác nhau
Với đặc tính đồng trội (codominant), những cặp al khác nhau được gọi là dị hợp(VD: al 235- al 250), còn những cặp al giống nhau được gọi là đồng hợp(VD: al 288- al 288).
Dựa vào 2 bảng dữ liệu dưới đây chúng tôi có thể định danh được 21 dòngcacao khảo sát dựa vào đặc điểm microsatellite của chúng cũng như xây dựng đượcbảng dữ liệu microsatellite của 21 dòng cacao phục vụ cho công tác định danh và phântích đa dạng di truyền.
Trang 4Bảng 4.1: Dữ liệu microsatellite thu được với 3 primer
Thứ tự Tên dòngmTcCIR 8 mTcCIR 11 mTcCIR 15A1A2A1A2A1A2
1 BAL 209 288 290 298 305 252 2542 BAL 244 292 292 295 314 244 2463 BR 25 302 305 298 308 235 2444 KKM 225 286 286 295 298 235 2445 PBC 123 288 290 295 305 235 2506 PBC 154 288 305 298 305 232 2527 PBC 157 288 302 295 305 235 2508 PBC 159 288 302 298 305 235 2449 PBC 230 286 288 305 314 235 25010 PBC 236 290 290 298 305 235 25011 QH 1213 288 290 295 298 252 25412 QH 22 288 302 295 298 232 25213 QH 441 288 288 295 295 232 25214 CT1 288 288 141 314 248 25015 CT3 288 290 141 305 244 24816 CT4 269 269 150 150 242 25217 CT5 288 294 305 314 244 24818 CT6 288 288 288 314 252 25219 CT7 286 294 141 314 248 25020 CT8 288 288 288 288 248 25021 CT9 286 286 150 314 248 250
Bảng 4.2: Dữ liệu microsatellite thu được với 2 primer
Thứ tựTên dòngmTcCIR 7mTcCIR 18
1 BAL 209 155 157 344 3462 BAL 244 157 157 337 344
4 KKM 225 153 155 331 3465 PBC 123 155 157 331 3426 PBC 154 153 157 342 3447 PBC 157 155 157 331 3468 PBC 159 155 157 331 3469 PBC 230 155 157 331 34210 PBC 236 153 157 342 34411 QH 1213 153 157 344 346
Trang 5Allele dropping
Allele dropping là những al chỉ xuất hiện 1 lần trong 3 lần lặp lại thí nghiệm.Đó là những al xuất hiện không ổn định, có thể do nồng độ mẫu quá thấp, hoặc bị tạpnhiễm với 1 kiểu gen khác trong quá trình thí nghiệm, hoặc do việc thêm vào một
nucleotid adenosine (A) vào đầu 3’ của đoạn DNA khuếch đại (Smith et al., 1996),
hoặc do lỗi phân tích của máy ABI 3100 Những al đó cần được ghi nhận để loại bỏtrong những lần phân tích sau.
Trong quá trình thí nghiệm, một số mẫu được lặp lại 2-3 lần với cùng mộtprimer để tìm nồng độ pha loãng thích hợp và để định danh lại mẫu mã hóa Từ đó,chúng tôi ghi nhận được sự xuất hiện allel dropping của một số dòng như sau:
Dòng PBC 159 có 1 allele dropping với primer mTcCIR15: al 246. Dòng PBC 154 có 1 allele dropping với primer mTcCIR15:al 244. Dòng PBC 154 có 1 allele dropping với primer mTcCIR18:al 331. Dòng BAL 209 có 1 allele dropping với primer mTcCIR18:al 331.
Có 6 mẫu dưới đây chỉ mới lặp lại thí nghiệm 2 lần, do đó cần lặp lại thínghiệm một lần nữa để khẳng định allele dropping, bao gồm:
Dòng BAL 209 có 1 allele dropping với primer mTcCIR11: al 295. Dòng PBC 123 có 1 allele dropping với primer mTcCIR15: al 244. Dòng QH 441 có 1 allele dropping với primer mTcCIR15: al 244. Dòng QH 441 có 1 allele dropping với primer mTcCIR11: al 298 Dòng BAL 244 có 1 allele dropping với primer mTcCIR11: al 150.
Dòng QH 1213 có 2 allele dropping với primer mTcCIR15: al 235, al 244.
Al dropping 246
Trang 6
Hình 4.4: Giống PBC 159 có 1 allele dropping 246 với primer mTcCIR15.
4.4.Kết quả nhận diện các mẫu được mã hóa
Với dữ liệu microsatellite của 3 primer mTcCIR15, mTcCIR18 và mTcCIR8(bảng 3.7), chúng tôi tiến hành định danh bằng cách phân tích mức độ đồng nhất ditruyền giữa 13 mẫu mã hóa với 13 dòng cacao tương ứng với chúng bằng phần mềmCervus dựa trên các chỉ tiêu sau:
3 loci được đưa vào phân tích.
Có ít nhất 2 loci có al hoàn toàn giống nhau. Số loci sai khác cho phép là 1.
Sự chênh lệch giữa số lượng loci đưa vào phân tích và số loci giống nhau càngcao thì kết quả phân tích mức độ đồng nhất di truyền có độ tin cậy càng cao, hay kếtquả định danh sẽ càng chính xác và ngược lại Còn nếu số loci sai khác càng cao thì độtin cậy của kết quả càng thấp, việc định danh do vậy cũng không chính xác.
Hình 4.5: Các chỉ tiêu để kiểm tra mức độ đồng nhất di truyền
Trang 7Kết quả phân tích cho ra 10 cặp cá thể đồng nhất di truyền thỏa mãn các chỉ tiêutrên, đồng thời cũng là kết quả nhận diện hay định danh tương ứng với 10 mẫu mã hoá.Kết quả định danh có độ chính xác cao do hoàn toàn không có loci sai khác(mismatching loci bằng 0)
Bảng 4.3: Kết quả nhận diện trong phần mềm Cervus**** Parameters ****
Number of loci: 3
Minimum number of loci needed for match: 2Number of mismatching loci allowed: 1**** Genotype matches ****
The following individuals had matching genotypes in the genotype file:
ID1 Loci typed ID2 Loci typed Matching loci Mismatching loci
Còn lại ba mẫu mã hóa A2, A3, A14 và 3 dòng cacao là BAL 244, PBC 123 vàQH441 chưa được nhận diện Kết quả phân tích microsatellite cho thấy:
- Dữ liệu microsatellite với 3 primer mTcCIR18, mTcCIR15, mTcCIR8 của mẫuA2 và BAL244 hoàn toàn giống nhau với 2 loci của primer mTcCIR18 và mTcCIR8,chúng chỉ khác nhau ở 1 loci của primer mTcCIR15: mẫu A2 bị thiếu mất một al 246(xem phụ lục trang 65 ).
- Dữ liệu microsatellite với 3 primer mTcCIR18, mTcCIR15, mTcCIR8 của mẫuA3 và PBC123 hoàn toàn giống nhau với 2 loci của primer mTcCIR18 và mTcCIR8,
Trang 8chúng chỉ khác nhau ở 1 al của loci xác định bởi loci của primer mTcCIR15:al 250 làal đặc trưng của mẫu A3, nhưng ở mẫu PBC123 thì al 250 không phải là al đặc trưngmà thay vào đó là al 244 (xem phụ lục trang 66).
- Dữ liệu microsatellite với 3 primer mTcCIR18, mTcCIR15, mTcCIR8 của mẫuA14 và QH441 hoàn toàn giống nhau với 2 loci của primer mTcCIR18 và mTcCIR8,chúng chỉ khác nhau ở 1 al của loci xác định bởi primer mTcCIR15: al 252 là al đặctrưng của mẫu A14, nhưng ở mẫu QH441 thì al 252 không phải là al đặc trưng màthay vào đó là al 244 (xem phụ lục trang 77).
Sự sai khác ở 1 al như trên là do hiện tượng allele dropping xảy ra trong quá trìnhphân tích trình tự microsatellite Tuy có sự sai khác ở 1 al nhưng kết quả phân tích trênđủ để kết luận mẫu A2 mã hóa cho dòng cacao BAL244, mẫu A3 mã hóa cho dòngcacao PBC123, và mẫu A14 mã hóa cho dòng cacao QH441.
Bảng 4.4: Kết quả nhận diện các mẫu mã hóa
Giống lấy mẫu Mẫu mã hóa Giống nhận diện Đánh giá kết quả
BAL 244PBC 123QH 22KKM22PBC 236QH 1213PBC 159BR 25BAL 209PBC 157PBC 154PBC 230QH 441
BAL 244PBC 123QH 22KKM225PBC 236QH 1213PBC 159BR 25BAL 209PBC 157PBC 154PBC 230QH 441
Sai khác 1 alSai khác 1 alChính xácChính xácChính xácChính xácChính xácChính xácChính xácChính xácChính xácChính xácSai khác 1 al
Việc định danh này không sử dụng sự hỗ trợ của việc nhận diện kiểu hình nhưngtrên thực tế việc định danh luôn có sự hỗ trợ bằng cách nhận diện kiểu hình dựa vàokinh nghiệm (như nhận diện qua hình dạng, màu sắc của hoa, quả) nên sẽ đơn giản vàthuận tiện hơn
Trang 9Nhưng lợi thế của phương pháp định danh bằng microsatellite là có thể áp dụngtừ giai đoạn cây con còn đang được ươm trong nhà lưới, chưa có hoa hay quả để giúpcho việc nhận diện bằng kiểu hình Uu điểm của việc định danh từ giai đoạn cây con làgiúp loại bỏ kịp thời những cây bị nhầm lẫn giống trước khi đem ra vườn trồng.
4.5 So sánh dữ liệu microsatellite
Khi so sánh dữ liệu microsatellite của 3 giống cacao NA33, AMAZ15/15,PA107 tại vườn sưu tập giống cacao, Đại Học Nông Lâm, với dữ liệu tương ứng củachúng trên ngân hàng cacao thế giới ICGD chúng tôi nhận thấy có sự khác biệt ở ítnhất 2 primer (được trình bày ở 3 bảng 4.4, 4.5 và 4.6)
Như vậy 3 giống cacao NA33, AMAZ15/15, PA107 trong bộ sưu tập giốngcacao của Đại Học Nông Lâm và Ngân hàng cacao thế giới ICGD không giống nhau,có thể do nguồn gốc lai tạo khác nhau
Tuy nhiên, kết quả này cũng cho thấy phương pháp và kỹ thuật phân tích củachúng tôi đúng với phương pháp phân tích microsatellite của ngân hàng cacao thế giới.Điều này sẽ hỗ trợ cho việc so sánh sự đa dạng di truyền giữa các giống cacao tại ĐạiHọc Nông Lâm với các giống cacao trên thế giới dựa trên dữ liệu về Microsatellite.
Bảng 4.5: Dữ liệu microsatellite của giống NA33
NA33- ICGD
NA 33 Kết quả thí nghiệm
Kết quả trong cơ sởdữ liệu ICGD
Bảng 4.6: Dữ liệu microsatellite của giống AMAZ15/15
AMAZ15/15Kết quả thí nghiệm
Kết quả trong cơsở dữ liệu ICGDPrimer 8 288 292 289 293
Al dị hợp Al dị hợp
Primer15 244 254 245 257
Trang 10AMAZ15/15- ICGD
Al dị hợp Al dị hợp
Primer 18 333 346 340 340Al dị hợp Al đồng hợp
Bảng 4.7: Dữ liệu microsatellite của giống PA107
PA107-ICGD
PA107 Kết quả thí nghiệm
Kết quả trong cơ sởdữ liệu ICGD
Al đồng hợp Al đồng hợp
Primer18 337 346 337 347Al dị hợp Al dị hợp
4.6.Kết quả phân tích multiplex PCR
Một trong các lợi thế của kỹ thuật microsatellite thực hiện trên máy giải trình tựlà có thể thực hiện cùng lúc nhiều phản ứng PCR, hoặc cùng lúc điện di nhiều sảnphẩm PCR nhưng thiết bị vẫn có thể nhận diện từng sản phẩm Lợi thế này cho phépsự kết hợp thực hiện cùng lúc nhiều phản ứng PCR hay multiplex PCR để giảm chi phíhóa chất và thời gian thí nghiệm
Phản ứng multiplex PCR được thực hiện với 3 primer có cùng nhiệt độ bắt cặp46oC và có màu huỳnh quang khác nhau: mTcCIR8, mTcCIR11, mTcCIR15.
Kết quả phân tích microsatellite của sản phẩm multiplex PCR giúp phân biệtnhanh chóng những mẫu có kết quả giống nhau ở 1 đến 2 cặp primer Ví dụ 2 mẫuQH441 và BAL244 có kết quả giống nhau với primer mTcCIR8 nhưng có thể phânbiệt chúng dễ dàng vì kết quả của 2 primer còn lại khác nhau Do đó chỉ cần 1 lần phântích thay vì 3 lần với 3 primer riêng biệt
Quan trọng nhất là kết quả này có hiệu quả kinh tế cao, vì giúp giảm chi phí chocả giai đoạn PCR lẫn giai đoạn phân tích microsatellite
Trang 11Ngoài ra, nếu trộn 3 sản phẩm PCR riêng biệt với 3 primer (có màu huỳnhquang khác nhau) của cùng một mẫu rồi đem phân tích trình tự thì kết quả cũng tươngtự như khi thực hiện phản ứng multiplex PCR Ưu điểm của cách làm này so vớimultiplex PCR là có thể kết hợp phân tích cùng lúc những primer có nhiệt độ lai khácnhau (trong khi phương pháp multiplex PCR đòi hỏi các primer phải có cùng nhiệt độlai), nhưng khuyết điểm là chi phí cao hơn phương pháp multiplex PCR vì số phản ứngPCR thực hiện nhiều gấp 3 lần
Trang 12mTcCIR11
Trang 13Hình 4.6:So sánh kết quả của 2 mẫu multiplex PCR giống nhau ở primer mTcCIR8
mTcCIR15
Trang 14Hình 4.7:Kết quả phân tích mẫu CT3 bằng phương pháp kết hợp 3 sản phẩm PCR
riêng biệt với 3 primer mTcCIR7, mTcCIR15 và mTcCIR11.
4.7 Kết quả phân tích tính đa dạng di truyền
Với dữ liệu microsatellite của 21 dòng cacao khảo sát nằm trong 6 quần thể:CT, PBC, BAL, QH, BR và KKM, chúng tôi dùng phần mềm Genetix để xử lý dữ liệumicrosatellite của từng cá thể trong quần thể, từ đó mô tả được quan hệ di truyền gầnhoặc xa giữa các quần thể, cũng như giữa các cá thể trong quần thể dựa trên khoảngcách giữa chúng trên biểu đồ Kết quả phân tích như sau:
Các quần thể có quan hệ di truyền gần nhau:Quần thể QH và quần thể BAL.
Các cá thể phân tích trong quần thể BAL và QH có quan hệ di truyền gần vớinhau Riêng 2 quần thể BR và KKM chỉ có một cá thể đại diện nên không thể nhận xétvề mặt cá thể.
Quần thể PBC có 6 cá thể, trong đó:
3 cá thể PBC 123, PBC 157 và PBC 236 có quan hệ di truyền rất gần nhau2 cá thể PBC 159 và PBC 230 có quan hệ di truyền khá gần nhau nhưngkhá xa 3 cá thể trên.
Cá thể còn lại PBC 154 có quan hệ di truyền xa nhất với các cá thể kháctrong quần thể PBC.
Quần thể CT có 8 cá thể, trong đó:
5 cá thể CT1, CT5, CT7, CT8, CT9 có quan hệ di truyền rất gần nhau. 3 cá thể CT3, CT4 và CT6 có quan hệ di truyền khá xa với nhau và khá xavới cả 5 cá thể còn lại trong quần thể CT Riêng cá thể CT6 có quan hệ di truyền khágần với 2 cá thể PBC 154 và QH 441.