I. TỔNG QUAN VỀ CÁC LOÀI ỐC CỐI VÀ ĐỘC TỐ CỦA CHÚNG
I.3. NGHIÊN CỨU DI TRUYỀN VỀ ỐC CỐ
I.3.1. Hệ gen cơ quan tử
Hầu hết genome của cơ quan tử, nhưng không phải luôn luôn, có dạng phân tử DNA mạch vòng đơn của một chuỗi duy nhất. Genome của cơ quan tử mã hóa cho một số, không phải tất cả, các protein được tìm thấy trong cơ quan tử. Do có nhiều cơ quan tử trong một tế bào, cho nên có nhiều genome của cơ quan tử trên một tế bào. Mặc dù bản thân genome của cơ quan tử là duy nhất. Nhưng nó cấu tạo gồm một chuỗi lặp lại liên quan với mọi chuỗi không lặp lại của nhân. Về nguyên tắc, các gen cơ quan tử được phiên mã và dịch mã bởi các cơ quan tử.
I.3.2. Giới thiệu về hệ gen ty thể và hệ gen ribosom
DNA ty thể (mitochondrial DNA-mtDNA) là một genome độc lập, thường là mạch vòng, được định vị trong ty thể. Bộ gen ty thể có cấu tạo xoắn kép, trần, mạch vòng với 2 chức năng chủ yếu:
- Mã hóa nhiều thành phần của ty thể
- Mã hóa cho một số protein tham gia vào chuổi chuyền điện tử
DNA ty thể của tế bào động vật mã hóa đặc trưng cho 13 protein, 2 rRNA và 22 tRNA. DNA ty thể của nấm men Sacharomyces cerevisiae dài hơn mtDNA của tế bào động vật năm lần do sự có mặt của các đoạn intron dài.
Các genome ty thể có kích thước tổng số rất khác nhau, các tế bào động vật có kích thước genome nhỏ (khoảng 16,5 kb ở động vật có vú) (hình 1.15). Có khoảng một vài trăm ty thể trên một tế bào. Mỗi ty thể có nhiều bản sao DNA. Số lượng tổng số của DNA ty thể so với DNA nhân là rất nhỏ (<1%).
Hình 1.15: DNA ty thể người, bao gồm 22 gen tRNA, 2 gen rRNA, và 13 vùng mã hóa protein. Mũi tên chỉ các vùng gen đang được sử dụng trong nghiên cứu
Trong nấm men Sacharomyces cerevisiae, genome ty thể có kích thước khá lớn (khoảng 80 kb) và khác nhau tùy thuộc vào từng chủng. Có khoảng 22 ty thể trên
một tế bào, tương ứng khoảng 4 genome trên một cơ quan tử. Ở những tế bào sinh trưởng, tỷ lệ mtDNA có thể cao hơn (khoảng 18%).
Kích thước của genome ty thể ở các loài thực vật là rất khác nhau, tối thiểu khoảng 100 kb. Kích thước lớn của genome đã gây khó khăn cho việc phân lập nguyên vẹn DNA, nhưng bản đồ cắt hạn chế (restriction map) trong một vài loài thực vật đã cho thấy genome ty thể thường là một chuỗi đơn, được cấu tạo như một mạch vòng. Trong mạch vòng này có những chuỗi tương đồng ngắn và sự tái tổ hợp giữa chúng đã sinh ra các phân tử tiểu genome (subgenome) mạch vòng nhỏ hơn, cùng tồn tại với genome “chủ” (master genome) hoàn chỉnh, đã giải thích cho sự phức tạp của các DNA ty thể ở thực vật.
Bảng 1.3 tóm tắt sự phân công của các gen trong một số genome ty thể. Tổng số gen mã hóa protein là khá ít, và không tương quan với kích thước của genome. Ty thể động vật có vú sử dụng các genome 16 kb của chúng để mã hóa cho 13 protein, trong khi đó ty thể nấm men S. cerevisiae dùng các genome từ 60 - 80 kb mã hóa cho khoảng 8 protein. Thực vật với genome ty thể lớn hơn nhiều mã hóa cho nhiều protein hơn. Các intron được tìm thấy trong hầu hết các genome của ty thể, nhưng lại không có trong các genome rất nhỏ của động vật có vú.
Hai rRNA chính luôn được mã hóa bởi genome ty thể. Số lượng các tRNA được mã hóa bởi genome ty thể dao động từ không cho đến đầy đủ (25-26 trong ty thể). Nhiều protein ribosome được mã hóa trong genome ty thể của thực vật và sinh vật nguyên sinh, nhưng chỉ có một ít hoặc không có trong genome của nấm và động vật.
Ty thể di truyền theo dòng mẹ. Hệ gen ty thể có số lượng gen ít hơn hệ gen nhân, không có hiện tượng trao đổi chéo, các thay đổi chủ yếu do đột biến nên dựa vào tốc độ thay đổi nucleotide có thể xác định thời gian tiến hóa, xác lập đồng hồ phân tử
Bảng 1.3: Các genome ty thể có các gen mã hóa cho các protein, rRNA và tRNA
Hệ gen ribosom (Ribosomal DNA – rDNA)
Ribosomal DNA (rDNA) bao gồm một trình tự lặp lại song song của một phân đoạn đơn vị, một operon, bao gồm các NTS, ETS (External transcribed Space), vùng gen 18S, ITS1 (Internal Transcribed Space 1), vùng gen 5.8S, ITS2 (Internal Transcribed Space 2) và vùng gen 28S.
Hình 1.16: Cấu trúc hệ gen ribosome. Mũi tên chỉ vùng gen sử dụng trong nghiên cứu hiện tại
Các cụm gen DNA ribosome: Một tế bào có nhân điển hình đang phát triển có chứa khoảng 10 Mio ribosome, là bộ máy di động để sản xuất protein (bản dịch của mRNA thành protein). RNA ribosome là thành phần cấu trúc cơ bản của ribosome 10 Mio bản sao của từng loại phân tử RNA ribosome (5S, 5.8S, 18S, 28S rRNA) phải được tổng hợp trong mỗi thế hệ để đáp ứng các yêu cầu tế bào để tổng hợp protein. Để sản xuất đủ số lượng RNA ribosome có chứa nhiều bản sao của gen mã hóa cho RNA ribosome (rRNA gen = rDNA). Nhân tế bào có chứa khoảng 200
bản sao của gen rRNA mỗi bộ gen đơn bội, lan ra các cụm nhỏ trên nhiễm sắc thể khác nhau năm (nhiễm sắc thể 13, 14, 15, 21, 22), trong khi các tế bào của ếch
Xenopus laevis chứa khoảng 600 bản sao của gen rRNA trong một cụm trên một nhiễm sắc thể. Tuy nhiên, mô hình chung của các tổ chức gen rRNA và tổng hợp rRNA là giống hệt nhau trong tất cả các sinh vật nhân chuẩn. Các bản sao của gen rRNA bảo tồn trên một nhiễm sắc thể được nằm trong một loạt sắp xếp lặp lại, trong đó mỗi gen được tách ra từ các khu vực kế tiếp được gọi là đoạn chèn DNA, mà thay đổi theo chiều dài và trình tự giữa các loài. Một nhóm duy nhất bao gồm các gen rRNA cho 18S, 5.8S, và 28S rRNA phân tử mà được phân cách bởi các đoạn chèn bên trong (ITS-1 và ITS-2). cụm lân cận có chiều dài khoảng 10.000 nucleotide từng được ngăn cách bởi các vùng đệm bên ngoài (ETS).
Các gen rRNA được phiên mã bởi RNA polymerase I, và mỗi bộ gen tạo ra cùng một bản sao RNA, được gọi là 45 rRNA tiền rRNA (pre-rRNA). Trước khi rời khỏi tập hợp các hạt nhân trong ribosome, các tiền 45-rRNA bị cắt bỏ một bản sao của rRNA 28S (khoảng 5000 nucleotide), các rRNA 18S (khoảng 2000 nucleotide), và rRNA các 5.8S (khoảng 160 nucleotide ) của ribosome cuối cùng. Các bộ phận còn lại của từng phiên mã sơ cấp (ETS, ITS-1 và ITS-2) được lọai bỏ. Cùng với khoảng 200 protein khác nhau của tế bào và rRNA 5S bắt nguồn từ một quỹ tích nhiễm sắc thể, các rRNA mới tổng hợp được đóng gói để tạo ra các ribosome, quá trình này diễn ra trong nhân của tế bào, trong một cấu trúc lớn khuếch tán, được gọi là nucleolus.
Các phân tử rRNA là rất cần thiết cho hệ ribosome, tổng hợp protein, và chức năng tế bào. Vì vậy, gen ribosome thuộc về các gen được bảo tồn nhất trong các tế bào có nhân điển hình. Tuy nhiên, sự tương đồng trong các vùng đệm bên trong (ITS-1 và ITS-2) là rất thấp, vì các khu vực này DNA không đóng góp vào quá trình tổng hợp protein. Vì vậy, ít áp lực chọn lọc và sự khác biệt trình tự DNA (đột biến điểm), thậm chí giữa các loài của một giống, có thể được tìm thấy trong các khu vực này. Do các tính năng này dữ liệu phân tử rDNA là rất hữu ích để xác
định mối quan hệ phát sinh loài (cây phả hệ) hoặc phân loại giữa các loài có mối quan hệ gần gũi.
1.3.3. Tình hình nghiên cứu di truyền ốc cối
Sử dụng chỉ thị DNA ty thể trong phân loại và xây dựng hệ thống phát sinh loài của ốc cối.
Việc phân tích mối quan hệ phát sinh chủng loại của các loài dựa trên các đặc điểm hình thái giải phẫu (mà chủ yếu là kích thước, màu sắc, hoa văn vỏ, cấu tạo tuyến độc tố, cấu trúc răng kitin, …) đôi khi mang lại kết quả không chính xác, đặc biệt là đối với các loài có quan hệ gần gũi vì chúng có nhiều đặc điểm hình thái giải phẫu giống nhau. Vì vậy, việc sử dụng các chỉ thị phân tử để định danh loài và xác định một cách chính xác quan hệ phát sinh chủng loại loài là điều rất cần thiết. Việc xây dựng cây phát sinh chủng loại có thể dựa trên phân tích trình tự một gen hoặc một họ gen. Tuy nhiên, dữ liệu phân tích cũng có thể mở rộng hơn, chẳng hạn kết hợp nhiều gen hoặc nhiều vùng DNA khác nhau.
Với những loài có quan hệ gần, các gen hay vùng DNA có độ linh động cao (như intron, các vùng liên gen - đoạn chèn) thường hay được sử dụng. Song với các loài có quan hệ xa thì các gen hay vùng DNA có độ bảo thủ cao như gen mã hóa các rRNA hay một protein ty thể hoặc nhân thường được sử dụng. Để tăng độ tin cậy, các nghiên cứu hiện nay thường sử dụng kết hợp cả hai (vùng DNA có độ bảo thủ với vùng DNA có độ biến thiên cao). Hơn thế nữa, các chỉ thị ty thể cũng thường được sử dụng kết hợp với các chỉ thị nhân. Đối với các động vật thân mềm, DNA ty thể đã được chứng minh là công cụ hữu hiệu trong phân tích mối quan hệ loài. Các chỉ thị (marker) của DNA ty thể thường được sử dụng là các gen mã hóa 12S rRNA, 16S rRNA, cytochrome b, cytochrome oxydase, tRNA, và một số vùng không mã hóa như vùng liên gen trnF-cox3, atp6-trnM, cox1-cox2, cox3-trnK, nad1-trnP (Grande và cs, 2008; Michael và Robert, 2005). Tuy nhiên, sử dụng toàn bộ trình tự DNA ty thể sẽ giúp nâng cao độ phân giải và ý nghĩa thống kê so với việc sử dụng từng đoạn gen riêng lẻ. Gen 16S rRNA mang đặc điểm cấu trúc cơ bản, có mặt ở
khắp nơi và có đặc tính tiến hóa, bởi vậy nó trở thành marker phổ biến nhất trong sinh học phân tử.
Bandyopadhyay và cs (2008) khi phân tích trình tự bộ gen DNA ty thể của
C. textile đã phát hiện đoạn chèn (intergenic) giữa gen coxI/coxII của C. textile lớn hơn (165bp), nghiên cứu đã chứng minh đoạn chèn giữa gen này rất hữu dụng trong các nghiên cứu về tiến hóa, cũng như định danh loài.
Nghiên cứu mối quan hệ tiến hóa
Đối với lớp chân bụng Gastropoda, DNA ty thể đã được chứng minh là công cụ hữu hiệu trong phân tích đa dạng loài (Grande và cs, 2008). Các marker chuẩn của DNA ty thể thường được sử dụng là các gen mã hóa cytochrome b, 12S rRNA, 16S rRNA, tRNA-Val,...và một số vùng không mã hóa như vùng liên gen trnF- cox3, atp6-trnM, cox1-cox2, cox3-trnK, nad1-trnP. Việc sử dụng toàn bộ trình tự DNA ty thể cũng nâng cao độ phân giải và độ tin cậy thống kê so với sử dụng từng đoạn gen riêng lẻ.
Tuy nhiên, cho tới nay, mối quan hệ phát sinh chủng loại của các loài thuộc giống ốc cối vẫn chưa được giải quyết một cách triệt để do các marker phân tử của DNA ty thể tỏ ra ít tin cậy khi được áp dụng để xác định vị trí phân loại của các loài mới tách ra (Espiritu và cs, 2002; Duda và cs, 2001; Duda và Kohn, 2005). Vì vậy, trong các nghiên cứu tiến hóa gần đây, các marker DNA ty thể thường được sử dụng kết hợp với các marker nhân có tốc độ tiến hóa thấp hơn và trong một số trường hợp cho thấy mối quan hệ tiến hóa rõ hơn (Duda & Palumbi, 1999; Cunha và cs, 2005; Duda và Kohn, 2005; Bandyopadhyay và cs, 2008; Nam và cs, 2009). Một số marker nhân đã được khảo sát bao gồm các vùng gen mã hóa 18S rRNA, 28S rRNA, EF1-α, Histone H3, calmodulin,…và vùng không mã hóa như đoạn chèn ITS2 (Internal Transcribed Spacer 2).
Các marker phân tử cũng được ứng dụng rộng rãi để nghiên cứu sự tiến hóa và mối quan hệ loài của độc tố ốc cối. Espiritu và cs (2001) nghiên cứu sự đa dạng của độc tố δ-conotoxin trên 9 loài ốc cối. Kết quả cho thấy độc tố của các loài trên
phân thành những nhóm chuyên biệt (distinct clade): nhóm 5 loài ốc ở khu vực biển Ấn Độ Dương sử dụng thức ăn là cá (Clade 1), nhóm 2 loài ốc ăn nhuyễn thể (Clade 5) và nhóm 2 loài ốc ăn cá ngoài khu vực biển Ấn Độ Dương (Clade 3).
Duda và Kohn (2005) khảo sát giả thuyết về sự phát sinh loài dựa trên trình tự của DNA ti thể (16S) và gen calnodulin của DNA bộ gen của 138 loài ốc cối ở vùng biển Ấn Độ Dương, Tây Thái Bình Dương và Đại Tây Dương. Kết quả chỉ ra rằng các loài ốc cối là con cháu từ 2 dòng chính và phân hóa ít nhất cách đây 33 triệu năm. Dựa trên sự phân bố địa lý, 1 nhóm bắt nguồn từ vùng biển Ấn Độ Dương và nhóm kia thuộc khu vực Đông Thái Bình Dương và Tây Đại Tây Dương.
Duda và cs (2001) tiến hành nghiên cứu nguồn gốc của chế độ ăn của ốc cối dựa trên các marker phân tử 16S, calmodulin và sự kết hợp của 2 gen trên. Kết quả từ cây tiến hóa cho thấy chế độ ăn giun biển (errant polychaetes) là phương thức ăn cổ xưa nhất. Sự chuyên hóa trong chế độ ăn dựa trên các loài nhuyễn thể khác cũng như sự chuyển chế độ ăn trên các họ giun biển khác nhau như Terebellidae, Nereidae, và Amphinomidae, được tiến hóa riêng biệt và có lẽ chỉ 1 lần, trong khi đó chuyên hóa trên chế độ ăn các loài cá có thể xuất hiện 2 đến 3 lần. Sự khác biệt trình tự gen cho thấy sự phân hóa chế độ ăn của ốc cối xuất hiện ở kỷ Miocene và tồn tại cho đến ngày nay.
Nam và cs (2008) đề xuất việc sử dụng marker bộ gen (nuclear marker), đoạn chèn giữa gen N02 (đoạn giữa của 5,8S và 28S) của DNA ribosome - Internal Transcribed Spacer 2 (ITS2). Với 1 số đặc tính được ghi nhận (là đoạn không mã hóa nên ít chịu áp lực của quá trình tiến hóa, chứa tần suất lớn các indel), trình tự của ITS 2 rất hữu hiệu trong việc xác định vị trí phân loại ở mức độ loài. Các tác giả đã sử dụng 26 trình tự của ITS2 để xác định mối quan hệ loài của các loài ốc ăn nhuyễn thể với loài ăn cá và giun biển. Kết quả cho thấy trình tự ITS2 rất conserved giữa các cá thể của cùng 1 loài, nhưng lại thể hiện sự đa dạng ở mức độ phù hợp cho việc xác định vi trí phân loại của các loài mới phân hóa. Khi đoạn ITS2 được kết hợp với gen CO1 của DNA ti thể và các gen bảo tồn của DNA ribosome (16S và
12S), và với mô hình tiến hóa phù hợp, giá trị tin cậy tăng lên khi xây dựng cây tiến hóa, Có 3 nhánh chính được xác định trong nhóm 12 loài ốc ăn nhuyễn thể, đó là
Conus marmoreus và C. bandanus có quan hệ gần gũi với nhánh Cylinder
(Montfort, 1810; textile, ammiralis, dalli and gloriamaris) và nhánh Darioconus
(Iredale, 1930, aulicus, crocatus, episcopatus, omaria và furvus).
Nghiên cứu đinh danh các loài ốc cối và phân biệt các loài cận giống
Hiện nay, phân loại ốc cối chủ yếu dựa vào kích thước vỏ, kiểu, hoa văn và màu sắc hay vân trên vỏ, cụ thể là những đường gờ hay phần lồi trên vỏ (Kohn và cs, 1999). Bên cạnh đó, mô tả các dải răng chitin cũng được coi là một chỉ tiêu phân loại quan trọng (Frankin và cs, 2007, Duda và cs, 2009). Sự định danh chính xác loài ốc cối và chế độ ăn của ốc cối cũng cần đến các nghiên cứu về mối quan hệ tiến hóa giữa các loài trong giống Conus (Duda và cs, 2001). Hơn thế nữa, chỉ thị phân tử DNA ty thể đã được chứng minh là công cụ hữu hiệu trong phân tích mối quan hệ loài, đa dạng di truyền, định danh phân loại và phân biệt các loài cận giống (Baxter 2003, 2004 Hebert và cs, 2003 a, b; Stoekle 2003).
Duda và cs (2009) phát hiện trình tự DNA ty thể và DNA nhân khác biệt ở những cá thể loài ốc cối C. ebraeus có vùng phân bố rộng ở vùng biển nhiệt đới Okinawa. Các cá thể này không thể phân biệt được bằng hình dạng và kiểu vân trên vỏ. Trên thực tế, kích thước và hình dạng răng kitin, loại mồi trong tự nhiên và khu vực sống thể hiện sự khác biệt đáng kể và có thể phân thành 2 dạng hình thái. Cá thể trưởng thành với kiểu gen và hình thái răng kitin chuẩn của C. ebraeus chủ yếu ăn giun biển, trong khi đó dạng với trình tự DNA chủ yếu săn loại mồi là Sedentary