Chỉ thị phân tử ADN

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu đa dạng di truyền nguồn gen liên quan đến tính chịu mặn ở lúa việt nam (Trang 25 - 35)

Chương 1 : TỔNG QUAN

1.6. Chỉ thị trong đánh giá đa dạng di truyền

1.6.3. Chỉ thị phân tử ADN

Đầu những năm 80 của thế kỷ 20, kỹ thuật RFLP ra đời và được biết đến là loại chỉ thị mới- chỉ thị ADN thế hệ đầu tiên - với những ưu điểm vượt trội so với những chỉ thị hình thái và chỉ thị hố sinh đang được sử dụng trong đánh giá đa dạng di truyền lúc đó. Tuy nhiên mốc đánh dấu quan trọng nhất của công nghệ chỉ thị phân tử nói riêng và sinh học phân tử nói chung chính là phát minh phản ứng chuỗi polymerase (Polymerase Chains Reaction- PCR) của Karl Mullis (1983). Với khả năng tạo ra vô số bản sao của một đoạn ADN chỉ từ một vài phân tử ADN ban đầu, đây là phát minh mang tính bước ngoặt, làm thay đổi hoàn toàn cách thức tiếp cận - nghiên cứu sinh học phân tử và là cơ sở nền tảng ra đời cho thế hệ chỉ thị phân tử tiếp theo.

PCR (Polymerase Chains Reaction) là phản ứng nhân gen in-vitro, dựa trên

hoạt tính của loại enzym ADN polymerase chịu nhiệt.

Phản ứng PCR chuẩn có ba giai đoạn nhiệt độ được kiểm soát bởi máy gia nhiệt. Thành phần phản ứng bao gồm:

1. Đệm phản ứng bao gồm KCl, MgCl2 và Tris- HCl.

2. Enzym ADN polymerase chịu nhiệt có khả năng gắn nucleotit vào đầu 3’ của đoạn mồi gắn với ADN khuôn sợi đơn.

3. Bốn loại deoxyribonucleotit triphosphate (dNTP) là dATP, dCTP, dGTP và dTTP.

4. Hai đoạn mồi oligonucleotit được thiết kế bổ sung đặc hiệu với đoạn ADN cần nhân lên.

5. ADN khuôn.

Nguyên lý của phản ứng PCR được thể hiện ở hình 1.3. Dựa trên nguyên lý của phản ứng PCR, sử dụng các loại mồi oligonucleotit khác nhau (mồi ngẫu nhiên, mồi đặc hiệu) nhằm nhân lên các vùng trình tự ADN, nhiều chỉ thị ADN đã được phát triển và ứng dụng trong nghiên cứu đa dạng di truyền như SSR, RAPD AFLP,

SNP … [40]. Các chỉ thị này đã được ứng dụng và mang lại kết quả đáng tin cậy trong nghiên cứu đa dạng di truyền cũng như trong lĩnh vực công nghệ sinh học nông nghiệp khác.

Hình 1.3: Nguyên lý phản ứng PCR

1.6.3.1. Chỉ thị dựa trên cơ sở lai ADN- chỉ thị RFLP (Restriction Fragment Length Polymorphism)

Năm 1980, Botstein và cs. đã phát minh phương pháp RFLP (đa hình độ dài các đoạn cắt giới hạn) để xác định tính biến dị của ADN bằng cách sử dụng các enzym giới hạn. Những enzym này được sản sinh từ nhiều loại vi sinh vật khác nhau. Chúng có khả năng nhận biết các vị trí giới hạn, chứa một trình tự nucleotit đặc thù và sau đó cắt ADN tại vị trí đó. Vì vậy sau khi xử lý bằng enzym, phân tử

ADN sẽ bị cắt thành nhiều đoạn nhỏ có kích thước khác nhau. Sự khác nhau về kích thước của các phân đoạn ADN được tạo nên bởi enzym giới hạn gọi là RFLP.

Về nguyên lý, chỉ thị RFLP dựa trên sự phân cắt ADN hệ gen bằng các enzym giới hạn và sản phẩm cắt giới hạn có thể phát hiện bởi q trình lai Southern với các mẫu dị đánh dấu phóng xạ (đoạn trình tự ADN đặc hiệu được thiết kế có thể bắt cặp bổ sung và qua đó phát hiện được trình tự ADN mục tiêu) sau khi điện di trên gel agarose [76] . RFLP là chỉ thị đồng trội do có thể phát hiện được các alen khác nhau trong cùng một locut trong hệ gen nhân, hệ gen ti thể hay hệ gen lục lạp bằng một mẫu dò đặc hiệu [83].

RFLP là công cụ chủ yếu trong nghiên cứu đa dạng di truyền trong và giữa các loài động thực vật trong những năm 80 thế kỷ 20 [40, 76]. Rất nhiều nghiên cứu trên thực vật đã được thực hiện bằng chỉ thị RFLP. Tuy nhiên, do các thao tác thực hiện phức tạo, địi hỏi kỹ thuật viên có tay nghề cao, mất nhiều thời gian, cơng sức trong khi tiến hành thí nghiệm. Do vậy, khi các chỉ thị thị phân tử khác được tìm ra thì RFLP đã khơng cịn được sử dụng phổ biến.

1.6.3.2. Chỉ thị ADN ngẫu nhiên

Năm 1990, William và Welsh trong nghiên cứu độc lập đã phát triển chỉ thị ngẫu nhiên RAPD (Random Amplified Polymorphism DNA) dựa trên kỹ thuật PCR. Thực chất RAPD là phản ứng PCR nhân các đoạn ADN bằng những mồi không đặc hiệu. Đoạn mồi dài khoảng 9-12 nucleotit và có trình tự ngẫu nhiên, địi hỏi có trình tự G+C cao khoảng 60-70% để tăng độ bền cho đoạn bắt cặp giữa mồi và khuôn đảm bảo cho quá trình tổng hợp thuận lợi. Trong kỹ thuật RAPD, đoạn mồi ngẫu nhiên bắt cặp với ADN khn tại vị trí bổ sung và tổng hợp các đoạn ADN sản phẩm có kích thước khác nhau [83].

Kỹ thuật RAPD- PCR dễ thực hiện, chi phí rẻ hơn rất nhiều so với RFLP và chỉ yêu cầu một lượng nhỏ ADN khuôn cho phản ứng PCR. Tuy nhiên, do đặc điểm ngẫu nhiên của mồi RAPD nên kết quả phân tích khơng ổn định, thường có sai khác giữa những lần nghiên cứu cho dù chỉ thay đổi một thơng số thí nghiệm.

Bên cạnh đó, RAPD là chỉ thị trội nên không thể phát hiện được các cá thể dị hợp tử, do đó khó ứng dụng trong lập bản đồ di truyền [10, 76].

Để khắc phục những nhược điểm trên, nhiều biến thể của chỉ thị RAPD đã được nghiên cứu và phát triển như chỉ thị DAF (DNA Amplification Fringerprinting), chỉ thị AP- PCR (Arbitrary Primed polymerase Chain Reaction) [49]. Các chỉ thị này có chiều dài đoạn mồi ngẫu nhiên thay đổi (ngắn đến 5 nucleotide- DAF hoặc dài 10-50 nucleotit- AP- PCR) và được sử dụng trong điều kiện phản ứng khác nhau nhằm ổn định kết quả phản ứng nhân gen (chỉ thị AP- PCR) hoặc tạo nhiều đoạn ADN sản phẩm đa hình đơn khi phân tích các cá thể có quan hệ di truyền gần gũi (chỉ thị DAF). Tuy nhiên, do đòi hỏi các điều kiện thí nghiệm khắt khe nên các biến thể của chỉ thị RAPD ít được áp dụng, trong khi chỉ thị RAPD vẫn được sử dụng khá phổ biến, đặc biệt trong nghiên cứu các

đối tượng chưa có thơng tin trình tự ADN.

1.6.3.3. Chỉ thị ADN dựa trên đa hình các vị trí nhận biết giới hạn

RFLP là chỉ thị ADN thế hệ đầu tiên có thể phát hiện tính đa hình ADN giữa các cá thể nhờ vị trí nhận biết enzym giới hạn. Nhưng hiện nay chỉ thị RFLP ít được sử dụng do chi phí lớn, tốn thời gian và độc hại. Tuy nhiên, phân tích đa hình dựa trên các vị trí giới hạn cho kết quả đáng tin cậy và có thể ứng dụng trong xác định đột biến nên cùng với sự ra đời của kỹ thuật PCR, RFLP đã được cải tiến nhằm khắc phục những nhược điểm trên.

Năm 1991, William và cs đã cải tiến kỹ thuật RFLP khi sử dụng enzym giới hạn phân cắt sản phẩm PCR được nhân lên từ ADN hệ gen lúa bởi cặp mồi đặc hiệu và đã ghi nhận được kết quả đa hình ADN giữa các mẫu nghiên cứu [48, 83]. Kỹ thuật này được gọi là PCR-RFLP hay còn gọi là CAPS (Cleaved Amplified Polymorphic Sequences). Phân tích đa hình sử dụng chỉ thị CAPS đơn giản, nhanh chóng, chi phí thấp và có thể phân biệt được cá thể dị hợp tử. Tuy nhiên, mức độ đa hình phát hiện được bởi chỉ thị này phụ thuộc vào các vị trí giới hạn cũng như các enzym giới hạn sử dụng để phân cắt sản phẩm PCR.

Một cải tiến khác của chỉ thị RFLP cũng dựa trên kỹ thuật PCR là AFLP (Amplified Fragment Length Polymorphism) được Zabeau và cs phát triển năm 1993 [48]. Nguyên tắc của kỹ thuật AFLP như sau: (i) Tách chiết và tinh sạch ADN, phân cắt ADN bằng enzym giới hạn tạo đầu so le, sau đó gắn với adapter oligonucleotit có trình tự nhận biết các enzym giới hạn, (ii) Cặp mồi được thiết kế bổ sung với trình tự adapter gắn vào sẽ được sử dụng để nhân bản đoạn ADN giữa hai vị trí nhận biết, (iii) điện di phân tách sản phẩm PCR trên gel polyacrylamit [10,48].

Ưu điểm của chỉ thị AFLP là sự kết hợp giữa khả năng cho kết quả đa hình cao và ổn định. Nhờ đó chỉ thị AFLP không chỉ được áp dụng trong phân tích đa dạng di truyền mà còn được sử dụng trong xác định nguồn gốc cá thể (xác định bố- mẹ), trong chọn tạo giống và lập bản đồ gen [48,76].

1.6.3.4. Chỉ thị ADN dựa trên các trình tự lặp

Trong hệ gen sinh vật bậc cao, ngồi các đoạn trình tự (gen) mã hố protein cịn có các yếu tố ADN lặp lại, phân bố trên mọi nhiễm sắc thể và có kích thước khác nhau. Tùy thuộc vào sự phân bố trên hệ gen, các yếu tố ADN lặp lại được chia thành hai nhóm: trình tự ADN lặp rải rác (các ADN transposon) và trình tự ADN lặp lại nối tiếp có kích thước khác nhau (VNTR- Variable Number of Tandem Repeat) [48, 83]. VNTR bao gồm hàng loạt các đơn vị trình tự (motif) lặp lại nối tiếp nhau và có mặt trên các nhiễm sắc thể (kể cả nhiễm sắc thể giới tính). Các VNTR được phân chia thành các nhóm khác nhau dựa trên chiều dài motif, số lần lặp lại của các motif cũng như vị trí của chúng trên nhiễm sắc thể [79,83], bao gồm:

(i) ADN vệ tinh (Satellite ADN): năm 1974, khi thí nghiệm ly tâm gradient tỷ trọng nổi ADN tổng số, các nhà khoa học phát hiện các phân đoạn ADN tách riêng biệt và gọi là ADN vệ tinh (Skinner và cs, 1974) [83]. ADN vệ tinh bao gồm số lượng rất lớn các đoạn lặp của một motif (từ 1000 đến hơn 100.000 đoạn lặp), mỗi motif có chiều dài từ hai đến hàng trăm bp, nhưng phổ biến từ 100 đến

300bp. ADN vệ tinh thường tập trung thành nhóm lớn (lên đến 100 triệu bp) ở các vùng dị nhiễm sắc trên nhiễm sắc thể, gồm tâm động và đầu mút (telomer).

(ii) Minisatellite: là hệ lặp nối tiếp với mức độ trung bình của các motif có kích thước vừa phải (10 đến 60bp) và thường phân bố ở vùng nhiễm sắc trên nhiễm sắc thể (Jeffrey, 1985) [48].

(iii) Vi vệ tinh- Microsatellite: là các đoạn lặp nối tiếp của các motif có kích thước rất ngắn (1đến 6bp) (Litt và Lutty, 1989) [48]. Vi vệ tinh có nhiều motif khác nhau, thường có mức độ lặp lại thấp và biến đổi ở một locut nhất định, chính vì vậy số lượng alen ở mỗi locut SSR là rất nhiều. Các vệ tin có thể tìm thấy khắp nơi, ở vùng mang mã (exon) và không mang mã (intron) trên hệ gen trong nhân và cả hệ gen ngồi nhân (ti thể, lục lạp) (Trojanowska, 2004) [81]. Có nhiều danh pháp khác nhau được dùng để chỉ vi vệ tinh: trình tự lặp đơn giản- SRS (Simple Repetitive Sequences), đoạn lặp trình tự đơn giản- SSR (Simple Sequence Repeats) hay đoạn nối tiếp đơn giản- STR (Simple Tandem Repeat) [10, 76].

Trong ba loại trình tự lặp nêu trên, vi vệ tinh- SSR có số lượng motif rất phong phú, phân tán đều khắp hệ gen và có mức độ đa hình rất cao. Theo Jurka và Pethiyagoda (1995) [83], với bốn loại base A-T-G-C, số lượng các motif SSR trên cấu trúc sợi đơi ADN có thể lên đến 501 loại khác nhau, bao gồm 2 motif một nucleotit (monomeric), 4 motif hai nucleotit (dimeric), 10 motif ba nucleotit (trimeric), 33 motif bốn nucleotit (tetrameric), 102 motif năm nucleotit (pentameric) và 350 motif sáu nucleotit (hexameric). Motif phổ biến ở hệ gen động vật có vú là (A)n và (CA)n trong khi (A)n, (AT)n, (GA)n và (GAA)n là những motif lặp lại phổ biến nhất ở thực vật. Bên cạnh đa dạng về số lượng, sự sắp xếp các motif trong đoạn trình tự lặp cũng góp phần làm phong phú SSR trong hệ gen. Dựa trên mức độ hoàn chỉnh của các motif lặp, Weber (1990) đã phân chia các SSR thành ba nhóm khác nhau, bao gồm (1) SSR lặp lại hoàn chỉnh (Perfect repeats), bao gồm một motif lặp lại liên tục không bị ngắt quãng; (2) SSR lặp lại khơng hồn chỉnh (Imperfect repeat), chuỗi motif lặp lại bị gián đoạn bởi một hay vài base không thuộc cấu trúc

motif; (3) SSR lặp lại phức hợp (Compound repeat), là sự kết hợp xen kẽ có/khơng có quy luật của hơn hai motif khác nhau [83].

Trước đây, ADN lặp được coi là “ADN tạp” bởi chức năng của chúng chưa được tìm ra [81]. Ngày nay, mặc dù vai trò của ADN lặp đối với hệ gen vẫn chưa được làm sáng tỏ nhưng chúng đã trở thành công cụ quan trọng trong nghiên cứu di truyền, đặc biệt là các ADN vi vệ tinh- SSR. Các đặc điểm như phân bố khắp nơi trên hệ gen với tần suất xuất hiện cao (mỗi 21,2kb ở thực vật hai lá mầm và mỗi 64,6kb ở thực vật 1 lá mầm (Wang và cs, 1994) [74], có mức độ đa dạng alen ở mỗi locut cao, di truyền đồng trội đã đưa SSR trở thành loại chỉ thị ADN có hiệu quả nhất trong nghiên cứu đa dạng di truyền, lập bản đồ gen…Hiện nay, có nhiều loại chỉ thị ADN khác nhau được phát triển dựa trên các trình tự lặp, phổ biến hơn cả là chỉ thị SSR và ISSR.

a. Chỉ thị SSR (Simple sequence repeats)

Chỉ thị SSR cho phép ta phát hiện được tính đa hình về chiều dài các trình tự nucleotit đơn giản. Hiện nay, hơn 15.000 chỉ thị SSR đã được thiết lập [87], phủ kín trên bản đồ liên kết di truyền của lúa [36]. Nhiều cơng trình sử dụng chỉ thị SSR nghiên cứu đa dạng di truyền đã được công bố (Kalyan và cs., 2006 [49]; Jalaluddin và cs., 2007[47]; Muhammad và cs.,2009[60]; Navraj và cs., 2009 [62]). Ngoài ra, chỉ thị SSR cịn được dùng để chọn lọc tính kháng bệnh do khảm virut ở cây đậu tương, chọn lọc giống phân tử ở lúa, xác lập mối quan hệ thân thuộc giữa các giống cây trồng như ngô (Ngô Thị Minh Tâm, 2007), đậu tương (Lương Thị Thu Hương, 2006), xây dựng bản đồ liên kết (Zhao, 1993)… [ 10, 12, 40]. Chỉ thị SSR có hai ưu điểm lớn so với các chỉ thị ADN khác:

- Tính đặc hiệu cao: các đoạn mồi SSR được thiết kế dựa trên vùng trình tự sườn có tính bảo thủ cao của các đoạn lặp SSR, do đó sản phẩm nhân gen của phản ứng SSR-PCR đặc hiệu và ổn định hơn các chỉ thị ADN ngẫu nhiên. Bên cạnh đó, nhờ tính chất bảo thủ của vùng trình tự sườn mà các mồi SSR có thể được sử dụng chéo giữa các lồi có mối quan hệ di truyền gần gũi [10, 71].

- Di truyền đồng trội và mức độ đa hình cao: Trải qua tiến hố và các biến đổi di truyền, số lần lặp lại các motif SSR thay đổi rất nhiều và làm cho các đoạn SSR có chiều dài khác nhau. Bởi vậy phản ứng SSR- PCR có thể phát hiện các alen khác nhau trong cùng một locut SSR, qua đó phát hiện được các cá thể đồng hợp tử/dị hợp tử ở locut đó (chỉ thị đồng trội).

Khơng chỉ có những ưu điểm trên, với tần suất xuất hiện gen cao của các trình tự lặp thì số lượng chỉ thị SSR là rất phong phú với mức đa hình cao. Dựa trên kỹ thuật PCR và kết hợp với các phương thức phát hiện khác nhau, các phân tích sử dụng chỉ thị SSR rất đơn giản, nhanh chóng, tin cậy và đặc biệt có khả năng tự động hoá cao [10, 40, 74, 81], điều này rất phù hợp với các nghiên cứu di truyền quần thể như đánh giá đa dạng di truyền, lập bản đồ gen, chọn giống phân tử…Một số nghiên cứu so sánh, đánh giá ưu nhược điểm của chỉ thị SSR với các loại chỉ thị RFLP, AFLP, RAPD…đã khẳng định những ưu điểm của SSR so với các chỉ thị trên (Garcia và cs, 2004) [34, 42].

Hình 1.4: Đa hình ADN SSR giữa hai cá thể có motif (AT)n

Khác với chỉ thị ngẫu nhiên (RAPD) hay chỉ thị dựa trên các vị trí giới hạn (RFLP, AFLP), chỉ thị SSR được phát triển dựa trên trình tự ADN đã biết trước của đối tượng nghiên cứu. Quy trình phát triển chỉ thị SSR gồm hai giai đoạn chính là xác định các trình tự lặp trên hệ gen và thiết kế mồi đặc hiệu cho đoạn

trình tự đó, đây là quy trình phức tạp, địi hỏi áp dụng nhiều kỹ thuật, phương pháp khác nhau và đặc biệt có chi phí rất tốn kém [10, 55, 74, 81]. Vì vậy, chỉ thị SSR chỉ thực sự phát huy hiệu quả khi trình tự ADN hệ gen của đối tượng cần nghiên cứu đã được khám phá đầy đủ. Theo Brown và cs (1996), có ba hướng chính trong phát triển và thiết kế mồi SSR, bao gồm (i) tìm kiếm trình tự lặp và thiết kế mồi SSR trên cơ sở dữ liệu trình tự (ngân hàng cADN, EST, GeneBank); (ii) áp dụng tính chất bảo thủ của vùng trình tự sườn để áp dụng chéo mồi SSR giữa các đối tượng có quan hệ di truyền gần gũi và (iii) sàng lọc thư viện hệ gen (thư viện BAC, YAC) để phát hiện và thiết kế mồi SSR [55].

Mỗi hướng nghiên cứu phát triển chỉ thị SSR đã được cải tiến thành nhiều phương pháp khác nhau và được ứng dụng ở một số đối tượng như khoai tây (Milbourne và cs, 1998), lúa (Panaud và cs, 1995)… Hiện nay, với sự ra đời và phát

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu đa dạng di truyền nguồn gen liên quan đến tính chịu mặn ở lúa việt nam (Trang 25 - 35)