Cho đến nay, có nhiều phƣơng pháp đƣợc sử dụng cho nghiên cứu tiến hoá và phân loại muỗi sốt rét Anopheles dựa trên đặc điểm tập tính, sinh thái học, hình thái học, hoá sinh, di truyền tế bào [49] và gần đây là các kỹ thuật sinh học phân tử nhƣ phân tích ADN bằng PCR (AFLP, RFLP ...). Việc phát minh ra kỹ thuật phản ứng chuỗi polymerase (PCR) đã tạo ra một phƣơng tiện mới cho nghiên cứu di truyền sinh học phân tử hệ gen và các kỹ thuật sau đó tạo điều kiện thuận lợi cho những nghiên cứu di truyền của từng cá thể cũng nhƣ ở mức độ quần thể [39]. Các chỉ thị phân tử sử dụng trong nghiên cứu vector sốt rét xuất hiện trong vòng 10 năm trở lại đây rất đa dạng, phong phú trong đó có cả chỉ thị mới và các “chỉ thị kinh điển” (ADN ti thể và cDNA). Một trong những ƣu điểm lớn nhất của việc sử dụng một số lƣợng lớn các chỉ thị di truyền khác nhau là ngƣời nghiên cứu có thể lựa chọn, kết hợp các chỉ thị hay các kỹ thuật để trả lời nhiều câu hỏi có liên quan đến sự lan truyền sốt rét. Những chỉ thị phân tử này cũng cung cấp công cụ hữu hiệu cho nhiều nghiên cứu ứng dụng khác bao gồm: phân loại phân tử, hệ thống tiến hóa, di
17
truyền quần thể, bản đồ di truyền. Đã có nhiều bài báo công bố cũng nhƣ tổng kết thảo luận về hƣớng tiến hóa chuyên biệt, phân loại và ứng dụng hệ thống học khi sử dụng các chỉ thị này đặc biệt là ở phức hợp loài An. gambiae
[39,52,69].
Kỹ thuật PCR có một ƣu thế nổi bật so với các kỹ thuật trƣớc đây là nó có thể phân biệt đƣợc các loài dựa vào những đoạn trình tự ADN đặc trƣng mà ở đó các loài muỗi chỉ có những khác biệt rất nhỏ ở một vài cặp bazơ nitơ. Số lƣợng các đoạn ADN lặp lại khác nhau trong hệ gen của muỗi là một mục tiêu tốt để sử dụng trong phân loại. Những đoạn ADN lặp lại này rất phổ biến ở hệ gen ty thể, lạp thể, những hệ gen nhân có sự lặp lại nhƣ trong histon, gen 5S ARN, và ARN của ribosome (rRNA). ADN ribosome (rDNA) mã hoá rRNA cũng là một trong những chỉ thị tốt. Cả rRNA và các gen gốc mã hoá nó đều có tính bảo thủ rất cao (bền vững, đặc trƣng), do đó rRNA đƣợc sử dụng nhƣ là một công cụ quan trọng trong nghiên cứu hệ thống học nhất là nghiên cứu phân loại. Có những vùng của rRNA có những biến đổi thậm chí là giữa các loài có quan hệ gần gũi với nhau. Những vùng có nhiều biến đổi thƣờng tập trung ở các khoảng trình tự trống (không mã hoá), đây là nguồn cung cấp các công cụ hữu hiệu nhất cho cả việc phân loại các loài và xác định mối quan hệ họ hàng giữa các loài gần gũi nhau.
Những đoạn trình tự lặp lại cách nhau bởi các vùng đệm nội gen (intergenic spacers-IGS) và nối tiếp nhau thành một dãy dài. Một đơn vị sao chép cơ bản bao gồm vùng mã hoá các tiểu đơn vị rRNA (ở côn trùng là 3 tiểu đơn vị 18S; 5,8S và 28S) và một vài vùng phụ (vùng sao chép bên ngoài- external transcribed spacer: ETS và 2 vùng sao chép bên trong-internal transcribed spacer: ITS1 và ITS2) là những vùng chƣa biết rõ chức năng.
18
Các loài riêng biệt khác nhau ở trình tự ADN ribosome có thể dễ dàng phát hiện nhờ kỹ thuật PCR bằng thiết kế ra các mồi có thể gắn vào và nhân lên một sản phẩm đặc trƣng từ ADN khuôn. Cách đơn giản nhất là tạo ra các cặp mồi đặc hiệu để phân biệt các loài [47, 100].
Một thí nghiệm thiết kế mồi bám vào đoạn trình tự ở đầu 5‟ của đoạn IGS đã đƣợc tiến hành để phân biệt các loài trong phức hợp Anopheles gambiae. Kỹ thuật PCR sử dụng 5 mồi khác nhau: một mồi chung gắn vào đoạn trình tự ở đầu 5‟ của đoạn IGS có thể phát hiện ra tất cả các loài trong phức hợp và 4 mồi đặc hiệu, mỗi một mồi đặc trƣng cho một loài trong phức hợp (một mồi có thể phát hiện đƣợc 2 loài là Anopheles merus và Anopheles melas, là những loài không trùng vùng phân bố). Quá trình kéo dài của mồi xảy ra ở đầu các mồi đặc hiệu và tạo ra những đoạn ADN có chiều dài đặc trƣng cho từng loài [96].
Kỹ thuật này đã đƣợc thử nghiệm với các mẫu đƣợc thu từ thực địa và nó phù hợp hoàn toàn (100%) với các kỹ thuật khác đƣợc dùng nhƣ Southern blot [99], phân tích di truyền tế bào [59] và phân tích điện di isozyme [83]. Mức độ biến đổi của vùng IGS càng cao thì tính đặc hiệu để phân loại các loài càng tốt. Tuy nhiên, độ dài của đoạn IGS làm cho vùng này rất khó đƣợc nhân bản bằng kỹ thuật PCR. Do đó hiện nay ngƣời ta sử dụng phổ biến mồi đƣợc thiết kế để nhân đoạn ADN ngắn hơn và nói chung ít đa hình hơn đó là trình tự ITS. Vùng ITS2 thƣờng đƣợc sử dụng trong kỹ thuật PCR để phân biệt các loài Anopheles đồng hình.
Những đoạn này tƣơng đối ngắn (thƣờng ngắn hơn 1kb), sản phẩm PCR nhân bản là vùng xen giữa ITS2 và vùng rìa. Vùng trình tự ITS2 ngắn hơn đƣợc tìm thấy ở An. hermsi (305 bp) trong khi đó tìm thấy vùng ITS2 dài hơn (khoảng 700 bp) ở một số loài trong phức hợp An. farauti. Hơn nữa, những
19
biến đổi trong loài của vùng ITS2 thấp hơn những biến đổi giữa các loài, điều này cho phép phát triển kỹ thuật PCR chẩn đoán loài dựa vào vùng này, ví dụ nhƣ chỉ có một biến đổi đƣợc quan sát thấy trong 9 dòng ITS2 khác nhau đƣợc thu thập từ 4 quần thể địa lý của An. freeborni [86]. Mức độ biến đổi trong loài thấp nhƣ vậy cũng đƣợc quan sát thấy ở trình tự ITS2 của các loài trong phức hợp An. quandrimaculatus. Trong phức hợp loài An. gambiae, mức độ biến đổi trong loài của vùng ITS2 biến đổi từ 0,07% ở An. arabiensis
đến 0,43% ở An. gambiae trong khi đó biến đổi giữa các loài dao động từ 0,4 đến 1,6% . Mặt khác, Frizt và cs (1994) đã nhận thấy độ dài đoạn ITS2 biến đổi tới 2% ở vùng có các cặp nucleotide lặp lại ở các quần thể địa lý khác nhau của An.nuneztovari vùng Nam Mỹ. Những quần thể này có biểu hiện đặc điểm của những loài đồng hình hơn là những quần thể địa lý [60].
Một dạng ADN đƣợc sử dụng nhiều trong nghiên cứu muỗi sốt rét là ADN ở hệ gen ty thể. Hệ gen ty thể thƣờng xuyên đƣợc sử dụng để nghiên cứu chủng loại phát sinh và di truyền quần thể. Trình tự và cấu trúc hệ gen ty thể của An. gambiae đã đƣợc công bố hơn một thập kỷ trƣớc. Những thông tin này nhanh chóng đƣợc sử dụng trong những nghiên cứu trên thực địa cũng nhƣ trong phòng thí nghiệm dựa vào cả những đoạn có mã hoá (nhƣ tiểu phần NADH dehydrogenase (ND5) và tiểu phần I, II của cytochrome oxidase (COI và COII)) và không mã hoá (nhƣ tiểu phần 12S và16S ARN) thƣờng là những gen đích cho các nghiên cứu này.
Rất nhiều các nghiên cứu đã sử dụng ADN ty thể để xây dựng các cây chủng loại phát sinh của An. gambiae s.l. để trả lời các câu hỏi về cấu trúc di truyền của các thành viên trong phức hợp loài này. Những nghiên cứu về lịch sử tiến hoá phức tạp của nhóm loài này vẫn còn đang tiếp tục. Những kết luận khi nghiên cứu hệ gen ty thể thu đƣợc từ An. gambiae s.l. đôi khi cho kết quả
20
khác với những số liệu thu đƣợc từ việc nghiên cứu các chỉ thị di truyền khác của phức hợp loài này (nhƣ microsatellite và rADN) [75].
ADN ty thể cũng đƣợc sử dụng để phát hiện những biến đổi lớn ở muỗi giống Anopheles và các phức hợp loài Anopheles. Foley và cs, (1998) [58] đã sử dụng gen COII để xây dựng cây chủng loại phát sinh của muỗi Anopheles
ở Úc. De Merida (1999) [51] cũng sử dụng ADN ty thể (ND5) với kỹ thuật phân tích đa hình cấu trúc sợi đơn (SSCP) để nghiên cứu cấu trúc quần thể của An. albimanus. Fairley (2000) [55] sử dụng một đoạn gen COI để tìm hiểu cấu trúc di truyền và trao đổi dòng gen giữa các quần thể Anopheles punctipennis ở Vermont. Nghiên cứu này tìm thấy có sự khác biệt đáng tin cậy về sự đa hình di truyền trong một quần thể cũng nhƣ cấu trúc di truyền giữa các quần thể với nhau. Điều này có thể giải thích ít nhất là một phần sự thay đổi bất thƣờng về kích cỡ của các quần thể và các giới hạn của việc trao đổi dòng gen. Ngoài ra bằng cách nghiên cứu nhiều đoạn khác nhau trên hệ gen ty thể, ta có thể sử dụng toàn bộ hệ gen này để nghiên cứu về quần thể. Conn (1999) sử dụng kỹ thuật RFLP để phân tích ADN ty thể của Anopheles darlingi để chứng minh rằng các quần thể này bị cách ly theo khoảng cách địa lý và những sự cách ly này cho phép chúng ta quan sát đƣợc sự thay đổi kiểu hình trong loài [50]. Trong những ví dụ này, ADN ty thể đƣợc chứng minh là rất hữu ích cho việc nghiên cứu về phát sinh chủng loại và cấu trúc quần thể ở một vùng địa lý rộng lớn nhƣng điều này không đúng cho tất cả các loài
Anopheles (ví dụ An. gambiae s.l. nhƣ đã nêu ở trên). ADN ty thể cũng không thể sử dụng để phân biệt các loài đồng hình trong phức hợp An. maculipennis.
Trình tự của ADN mã hoá các thông tin cần thiết cho cơ thể sống có thể tồn tại và tái sinh. Việc xác định trình tự vì thế rất hữu ích với các nghiên cứu cơ bản cũng nhƣ nghiên cứu ứng dụng.
21
Giải trình tự gen tìm ra trình tự sắp xếp của các nucleotide trên đoạn gen đƣợc quan tâm nhằm phát hiện sự đột biến gen, thiết kế các mồi đặc hiệu hoặc tách dòng vector tạo ra các protein tái tổ hợp có giá trị cao nhƣ vắc xin, thuốc chữa bệnh, các sinh phẩm phục vụ chẩn đoán bệnh hoặc nghiên cứu khoa học. Tất cả các nghiên cứu về kỹ thuật PCR phân loại hay nghiên cứu đa hình ở muỗi bƣớc đầu đều đƣợc dựa trên số liệu của kỹ thuật giải trình tự. Các đoạn gen thƣờng đƣợc quan tâm nghiên cứu giải trình tự nhiều ở muỗi để phục vụ cho việc thiết kế các mồi đặc hiệu thƣờng là ITS1, ITS2 là những gen trên ribosome và COI và COII cũng nhƣ D3 là những đoạn gen trên ty thể.
Việc xác định đƣợc các gen có liên quan đến miễn dịch của muỗi với các ký sinh trùng gây bệnh là vô cùng quan trọng. Do đó việc giải trình tự toàn bộ hệ gen của các muỗi truyền bệnh là yêu cầu thiết yếu. Đầu năm 1998, Genoscop cùng với Khoa Sinh học phân tử, Sinh hoá Côn trùng thuộc Viện Pasteur Pháp đã đề xuất chƣơng trình giải mã hệ gen muỗi Anopheles. Nó đƣợc chính thức bắt đầu vào năm 2001 với mục tiêu chính là giải mã toàn bộ hệ gen An. gambiae vector truyền bệnh sốt rét chính ở Châu Phi. Đến tháng 3 năm 2002 đã có 14000 gen đã đƣợc xác định và đến nay việc giải mã hệ gen của loài muỗi này đã gần hoàn thiện.
Cùng với sự phát triển các kỹ thuật mới trong công nghệ sinh học để phân loại các loài đồng hình, các chƣơng trình, phần mềm tin học cũng đóng góp một vai trò quan trọng trong nghiên cứu phân loại. Nhờ có các chƣơng trình này, việc phân loại trở nên nhanh chóng, chính xác và dễ dàng hơn.
Tóm lại, để phân loại đƣợc các loài đồng hình chúng ta không nên sử dụng một kỹ thuật riêng biệt nào, cần kết hợp càng nhiều kỹ thuật càng tốt. Khi phân tích mẫu vật bằng nhiều kỹ thuật ta sẽ thu đƣợc một khối lƣợng thông tin lớn, kết quả phân tích sẽ đáng tin cậy hơn.
22