Vật liệu nghiên cứu

Một phần của tài liệu Nghiên cứu hệ gen ty thể, đơn vị mã hóa ribosome của sán lá phổi họ Paragonimidae tại Việt Nam và một số khu vực châu Á. (Trang 63)

2.2.1. Nguồn vật liệu là mẫu sán lá phổi nghiên cứu

Mẫu là SLP trưởng thành ở dạng tươi đông lạnh, hoặc trong cồn 70%, do các đối tác của Nhật Bản và Việt Nam cung cấp, sau đó được tách DNA tổng số tại Viện Công nghệ sinh học và được bảo quản ở –20oC cho đến khi sử dụng nghiên cứu. Bảng 2.1 thống kê các mẫu nghiên cứu, ký hiệu chủng và nguồn gốc xuất xử của mẫu sử dụng trong đề tài của luận án.

Bảng 2.1. Danh sách các loài và các chủng sán lá phổi châu Á Paragonimus spp. làm đối tượng chính thực hiện giải trình tự và nghiên cứu hệ gen ty thể (mtDNA) và đơn vị mã hóa ribosome (rTU) của nghiên cứu này

Loài Xuất xứ Ky hiệu chủng* mtDNA rTU

1 Paragonimus heterotremus Việt Nam Phet-LC-VN  

2 Paragonimus ohirai Nhật Bản Pohi-Kino-JP  

3 Paragonimus iloktsuenensis Nhật Bản Pilo-Amami-JP 

4 Paragonimus miyazakii Nhật Bản Pmiy-OkuST1-JP 

5 Paragonimus westermani Ấn Độ Pwes-Megha(2n)-IN 

Hàn Quốc Pwes-Bogil(3n)-KR 

* Chủng LC của loài P. heterotremus (Việt Nam), ký hiệu Phet-LC-VN và chủng Kinosaki của loài P. ohirai

(Nhật Bản), ký hiệu Pohi-Kino-JP được giải trình tự toàn bộ mtDNA và rTU và phân tích đặc điểm gen/hệ gen. Những chủng/loài còn lại là đối tượng chính đề tài lựa chọn để giải trình tự rTU và phân tích đặc điểm gen.

Mẫu cung cấp là SLP trưởng thành thu được sau khi gây nhiễm động vật bằng metacercaria, cụ thể:

Mô tả tóm tắt gây nhiễm chuột bằng metacercariae thu SLP trưởng thành P. ohirai do đối tác Nhật Bản thực hiện: Chuột Albino (Rattus norvegicus), được gây nhiễm metacercariae thu từ vật chủ trung gian tự nhiên là cua Sesarma dehaani (gần đây được đổi tên thành Chiromantes dehaani) [30]. Cua được thu thập tại vùng Kinosaki (quận Hyogo, 35◦37'0"N, 134◦49'0"E) và vùng Nagoya (35◦10'0"N, 136◦55'0"E), Nhật Bản. Chuột đực từ 5–8 tuần tuổi được sử dụng để gây nhiễm metacercariae qua đường miệng bằng ống thông dạ dày. Chuột được nhốt trong lồng riêng và cho ăn chế độ ăn bình thường. Sán trưởng thành được thu thập hai tháng sau khi nhiễm bệnh. Chuột bị nhiễm bệnh được gây mê bằng ête và gây chảy

máu cho đến chết rồi mổ khám thu sán trưởng thành [146].

Mẫu SLP trưởng thành P. heterotremus thu được sau khi gây nhiễm chuột hoặc chó bằng metacercariae thu thập từ cua (vật chủ trung gian) bị nhiễm trong tự nhiên ở các vùng dịch tễ tại Việt Nam (P. heterotremus ở Sìn Hồ, Lai Châu) do đối tác Việt Nam (TS. Đăng Tất Thế, Viện Sinh thái và Tài nguyên sinh vật, Viện Hàn lâm Khoa học và Công nghệ Việt Nam) thực hiện và cung cấp. Các mẫu SLP trưởng thành ở Nhật Bản/Hàn Quốc/Ấn Độ do GS.TS Takeshi Agatsuma (Trường Đại học Y khoa Kochi, Nhật Bản) cung cấp bao gồm: P. ohirai ở các vùng Kinosaki và Nagoya, Nhật Bản; P. miyazakii ở vùng Okuyanai, Kochi, Nhật Bản; P. iloktsuenensis ở vùng Amami, Kagoshima, Nhật Bản; P. westermani (3n) ở vùng Bogil, Hàn Quốc; và P. westermani (2n) ở vùng Meghalaya, Ấn Độ.

Ngoài 6 chủng/5 loài SLP Paragonimus kể trên, một số chủng khác của 5 loài này trong họ Paragonimidae cũng được sử dụng để thu nhận một số chỉ thị mtDNA và rTU để thẩm định loài bằng SHPT, so sánh với các chủng quốc tế có trong Ngân hàng gen hoặc đã công bố trước đây cho nghiên cứu phân tích phả hệ và tiến hóa.

2.2.2. Vật liệu khuôn DNA và các loại mồi sử dụng

Vật liệu nghiên cứu chính là DNA tổng số tách chiết từ SLP trưởng thành của 6 chủng/5 loài Paragonimus thuộc đối tượng chính của nghiên cứu, sử dụng để thực hiện PCR/LPCR và giải trình tự thu nhận mtDNA và rTU.

Các mồi sử dụng cho PCR và giải trình tự toàn bộ mtDNA của P. heterotremus và của P. ohirai (Phụ lục I: Bảng PL2.1), bao gồm các mồi chung của sán lá lớp Trematoda từ các nghiên cứu trước đây [85, 86, 90, 105], các mồi chung của SLP giống Paragonimus và các mồi đặc hiệu riêng của từng loài được được thiết kế trong nghiên cứu này.

Các mồi sử dụng cho PCR và giải trình tự toàn bộ rTU của 6 chủng/5 loài

Paragonimus trong nghiên cứu này, bao gồm một số mồi chung của đơn vị mã hóa ribosome của sán lá Trematoda từ các nghiên cứu trước đây [2, 124, 132] và các mồi mới được thiết kế trong nghiên cứu này (Phụ lục I: Bảng PL2.4).

2.2.3. Hóa chất, sinh phẩm, dụng cụ

Các sinh phẩm chủ yếu từ Hãng Thermo Fisher Scientific Inc. (MA, USA), bao gồm DreamTaq PCR Master Mix (2×); Kit tách chiết DNA tổng số GeneJET™

Genomic DNA Purification Kit; Kit tinh sạch DNA GeneJET Gel Extraction and DNA Cleanup Micro Kit; Kit tách chiết DNA plasmid tái tổ hợp GeneJET Plasmid Miniprep Kit. Kit tách dòng CloneJET PCR Cloning Kit (sản phẩm PCR ngắn) hoặc TOPO XL PCR Cloning Kit (sản phẩm PCR dài) từ Invitrogen Inc. (CA, USA). Các loại hóa chất như NaCl, KCl, Tris HCl, EDTA, NaOH, MgSO4, MgCl2, CaCl2, Triton-X 100, DMSO, agarose, sucrose, glucose, trypton, glycerol, cồn ethanol tuyệt đối, nước khử ion DEPC, các loại kháng sinh kanamycin, ampicilin và các hóa chất thông dụng khác của các hãng Fermentas, Thermo Fisher Scientific, Invitrogen, Merck, Sigma. Vật tư, hóa chất, dụng cụ thuộc loại tinh khiết, chất lượng tốt được đặt hàng theo yêu cầu của các đề tài NAFOSTED (mã số: 108.02- 2017.09 và 108.02-2020.07).

2.2.4. Trang thiêt bị

Máy đo quang phổ định lượng DNA Thermo Scientific Nanodrop 1000 UV/VIS spectrophotometer hoặc GBC UV/visible 911A spectrophotometer (GBC Scientific Equipment Pty. Ltd., Australia); máy PCR PTC-100 (Appied Biosystem, Mỹ) và máy PCR Eppendorf (Đức); bộ điện di Powerpac300 (Bio-Rad, Mỹ), máy soi DNA dưới tia UV gắn máy ảnh (Wealtec, Sparks, NV, USA); dụng cụ Vortex (Mimishaker, IKA, Đức), máy ly tâm Eppendorf. Ngoài ra cơ sở vật chất, trang thiết bị, dụng cụ có tại Viện Công nghệ sinh học (https://www.ibt.ac.vn/ ) đều hiện đại, đầy đủ cho nghiên cứu SHPT gen/hệ gen, bố trí tại Phòng Thí nghiệm của Phòng Miễn dịch học và Phòng Thí nghiệm trọng điểm Công nghệ gen.

2.3. Phương pháp nghiên cứu gen và hệ gen ty thể (mtDNA)

Các phương pháp kỹ thuật thường qui của nghiên cứu SHPT sử dụng trong nghiên cứu mtDNA và rTU trong đề tài này được giới thiệu và mô tả từng bước thực hiện ở Phần Phụ lục II, bao gồm:

+ PL2.1. Phương pháp tách chiết DNA tổng số

+ PL2.2. Phương pháp thiết kế mồi chung và mồi đặc hiệu mtDNA + PL2.3. Phương pháp thiết kế mồi giải trình tự rTU

+ PL2.4. Thành phần phản ứng, thực hiện PCR và kiểm tra sản phẩm + PL2.5. Phương pháp thu nhận DNA ribosome các loài sán lá phổi + PL2.6. Phương pháp tách dòng, thu DNA plasmid tái tổ hợp + PL2.7. Phương pháp giải trình tự và xử lý chuỗi nucleotide

+ PL2.8. Phương pháp truy cập thu thập chuỗi so sánh và sắp xếp căn chỉnh so sánh chuỗi nucleotide.

Các phương pháp, kỹ thuật SHPT cụ thể cho mỗi một nội dung nghiên cứu chính: i) Nghiên cứu mtDNA và ii) Nghiên cứu rTU, được mô tả cụ thể tại mỗi mục tương ứng.

2.3.1. Phương pháp xác định cấu trúc và sắp xêp gen ở hệ gen ty thể của sán lá phổi Paragonimus heterotremus và P. ohirai

Sử dụng các mồi liệt kê ở Bảng PL2.1 gồm mồi chung của mtDNA của sán lá và mồi đặc hiệu cho mỗi loài để thực hiện PCR/LPCR thu nhận mtDNA của P. heterotremus và P. ohirai với sản phẩm có kích thước khác nhau. Thực hiện PCR/LPCR được mô tả tại mục PL2.4 (Phụ lục II). Trên trình tự nucleotide của các chuỗi mới thu nhận, tiếp tục thiết kế mồi cho PCR/LPCR tiếp theo và giải trình tự bằng phương pháp kế tiếp lồng nhau, còn gọi là “lao mồi” trực tiếp hoặc/và sau khi tách dòng. Giải trình tự được thực hiện tại các cơ sở dịch vụ ở nước ngoài tại Macrogen (Hàn Quốc) (https://www.macrogen.com/en/main/ ); và trong nước, tại Công ty Nam Khoa (Việt Nam) (http://biotechem.com.vn/ ).

Xác định giới hạn và kích thước của từng gen ty thể, vùng giao gen, vùng không mã hóa và trật tự sắp xếp gen trong mtDNA của mỗi loài P. heterotremus và P. ohirai bằng cách so sánh với dữ liệu tương tự của sán dẹt có trong Ngân hàng gen và các công bố tại [85, 86, 90, 105]. Mười hai PCG được xác định bằng cách căn chỉnh đối chiếu với các PCG sẵn có của các loài sán lá đã công bố. Mã khởi đầu ATG hoặc GTG và mã kết thúc TAA hoặc TAG được xác định cho một PCG, riêng bộ mã TGA là mã kết thúc ở động vật bậc cao, nhưng ở mtDNA là bộ mã mã hóa cho amino acid tryptophan.

Sắp xếp 12 gen PCG, 2 gen MRG, 22 gen tRNA và vùng NCR của mtDNA của mỗi loài P. heterotremus và P. ohirai được minh họa cấu trúc ở dạng vòng tròn và dạng mạch thẳng mở vòng tại đầu 5’ của gen cox3. Cấu trúc dạng vòng tròn của toàn bộ mtDNA được xây dựng và mô hình hóa theo qui định cấu trúc của một mtDNA, sử dụng phần mềm chuyên biệt OGDRAW 1.3.1 tại (https://chlorobox.mpimp-golm.mpg.de/OGDraw.html) [147]; cấu trúc dạng thẳng được vẽ tay bằng cách sử dụng Microsoft PowerPoint dựa vào đối chiếu dữ liệu mtDNA thu được và trật tự sắp xếp gen/vùng giao gen.

2.3.2. Phương pháp phân tích đặc điểm gen RNA ribosome ty thể (MRG)

RNA ribosome ty thể (MRG) gồm 2 gen: rrnL (16S) và gen rrnS (12S). MRG ở mtDNA của sán lá có trật tự bảo tồn tuyệt đối, do vậy, mỗi loài P. heterotremus và P. ohirai được xác định theo như mô tả trong [86, 90], đó là rrnL (16S) có giới hạn nằm giữa hai gen tRNAThr (trnT) và tRNACys (trnC); và rrnS (12S) nằm giữa hai gen tRNACys và cox2.

Mô hình cấu trúc bậc hai của MRG được xây dựng dựa vào chương trình RNAfold có tại: http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/ [148]. Chuỗi nucleotide của mỗi một MRG của mỗi loài P. heterotremus và P. ohirai ở dạng fasta (.fasta) được nạp trực tiếp vào RNAfold, chương trình tự động chuyển đổi sang chuỗi ký tự gọi là dạng Vienna (Vienna format). Sau đó, chương trình tự động xây dựng đồ họa cấu trúc bậc hai (graphical output) ở dạng kết phẳng (plain sequence) và dạng kết vòng (centroid sequence), với năng lượng sử dụng kết nối tối thiểu

(MFE, mimum free energy). Mô hình cấu trúc bậc hai của MRG (16S và 12S) của

P. heterotremus được xây dựng bằng RNAfold ở dạng kết thẳng, sử dụng năng lượng kết nối nucleotide tối thiểu là –214.20 kcal/mol.

2.3.3. Phương pháp phân tích đặc điểm gen RNA vận chuyển ty thể (tRNA)

Các tRNA (hay còn được viết tắt là trn), gồm 22 gen được xác định bằng các phần mềm chuyên biệt và phối hợp với nhau, bao gồm: i) ARWEN có tại

http://130.235.244.92/bcgi/arwen.cgi [149]; ii) tRNAscan-SE1.21 có tại:

www.genetics.wustl.edu/eddy/tRNAscan-SE/ [150]; iii) MITOS có tại

http://mitos.bioinf.uni-leipzig.de/ [151].

Cụ thể như sau: Toàn bộ trình tự nucleotide của hệ gen ty thể của P. heterotremus hoặc P. ohirai ở dạng fasta (.fasta) được nạp vào các chương trình trực tuyến (online) kể trên. Điều chỉnh thông số theo yêu cầu tìm kiếm mô hình tRNA của các loài không xương sống (invertebrate) để truy cập. Kết quả thu được là trình tự nucleotide của mỗi một tRNA hoàn toàn (cấu trúc hình lá sồi) và của một số (nếu có) tRNA khuyết thiếu cánh tay DHU.

Sau khi đối chiếu, chuỗi nucleotide cuối cùng cho mỗi một tRNA của mtDNA từng loài được xác định chính xác. Cấu trúc bậc hai của 22 tRNA được mô hình hóa bằng hình vẽ theo qui định cấu trúc tRNA và qui luật cân đối 4 cánh tay (tRNA-arm) của tRNA các loài sán dẹt/sán lá, căn cứ theo mô hình trích lấy từ kết

quả của tRNAscan-SE1.21, ARWEN hay MITOS phối hợp để có hình vẽ cuối cùng [85, 86, 90]. Đồ họa cấu trúc dạng phẳng cuối cùng của tRNA được thực hiện bằng chương trình Microsoft PowerPoint.

2.3.4. Phương pháp phân tích vùng không mã hóa ở hệ gen ty thể

Vùng không mã hóa (non-coding region, NCR) trong mtDNA của mỗi loài

P. heterotremus và P. ohirai và các loài Paragonimus khác trong họ Paragonimidae được xác định là vùng DNA chủ yếu là chuỗi nucleotide nằm giữa ranh giới của 2 gen tRNA vận chuyển tRNAGlu (trnE) với cox3. Ngay sau gen nad5 là vị trí gen tRNAGly (trnG) và tiếp theo sau tRNAGly là gen tRNAGlu, sau đó là NCR nối tRNAGlu

với cox3. Trong NCR của mtDNA nhiều loài sán lá, thường có các chuỗi/đơn vị/cấu trúc lặp liền kề (tandem repeat unit, thường ký hiệu là TR hay RU hoặc TRU) nối tiếp nhau. Các TRU trong vùng NCR ở mtDNA của P. heterotremus và P. ohirai

được xác định bằng phần mềm Tandem Repeat Finder v3.01 có tại https://tandem.bu.edu/trf/trf.html [152].

2.3.5. Phân tích phương thức sử dụng nucleotide và tính toán giá trị độ lệch (skew/skewness) trong hệ gen ty thể

Giá trị độ lệch (skew/skewness value) là chênh lệch tỷ lệ (%) sử dụng từng A, T, G, C, được tính cho AT và GC để kiến tạo nên toàn bộ chuỗi nucleotide của toàn bộ hay một phần mtDNA, của một hay nhiều PCG khi phân tích; của chuỗi nucleotide không mã hóa; hoặc các gen 18S hay 28S rRNA hay vùng giao gen ITS1/ITS2 hoặc toàn bộ rTU; hoặc bất kỳ chuỗi nucleotide nào xây dựng từ A, T, G, C.

Giá trị độ lệch (skew) dao động theo lệch âm và lệch dương (từ −1 đến +1) được tính theo công thức: [AT-skew = (A–T)/(A + T) và GC-skew = (G–C)/(G + C)] (theo [153]). Nếu độ lệch bằng 0 thì tần số sử dụng A và T cũng như G và C như nhau; nếu AT-skew lệch âm thì được hiểu là T được sử dụng nhiều hơn A và nếu AT- skew lệch âm cao tiếp cận –0,500 thì T được sử dụng gấp rất nhiều lần A. Đối với sán lá, do tỷ lệ sử dụng T luôn luôn nhiều hơn A; và các nucleotide A, T luôn luôn nhiều hơn G, C, nên tổng tỷ lệ sử dụng A+T luôn luôn nhiều hơn tỷ lệ G+C. Do đó, ở sán lá, giá trị độ lệch của AT-skew luôn luôn có giá trị âm (–) và của GC-skew luôn luôn có giá dương (+) [85, 86, 90, 102, 154].

tính toán cho 3 đơn vị: 12 gen PCG, 2 gen MRG và mtDNA* (tạm ký hiệu là mtDNA*, đó là chuỗi nucleotide tính từ 5’ cox3 đến 3’ nad5, ngoại trừ vùng tRNAGly, tRNAGlu và NCR) của 9 chủng/4 loài Paragonimus ở nghiên cứu này và hiện có trong Ngân hàng gen. Sở dĩ không tính hết toàn bộ chuỗi mtDNA là do mtDNA của một số loài không được thu nhận đầy đủ. Mặt khác, vùng NCR có nhiều cấu trúc lặp làm sai số và sai lệch đáng kể việc đánh giá phương thức sử dụng thực tế nucleotide của hệ gen ty thể (Bảng PL2.2). Chín chuỗi nucleotide của 12 gen PCG, 2 gen MRG và mtDNA* của 9 chủng/4 loài sán lá phổi trong họ Paragonimidae được sử dụng bao gồm: P. heterotremus, Việt Nam (Phet-LC-VN);

P. heterotremus, Trung Quốc (Phet-GX-CN); P. ohirai, Nhật Bản (Pohi-Kino-JP);

P. westermani, Hàn Quốc (Pwes(2n)-Haenam-KR); P. westermani, Hàn Quốc (Pwes(3n)-Haenam-KR); P. westermani, Ấn Độ (Pwes-typeI-IN); P. westermani, Ấn Độ (Pwes-AP-IN); P. westermani, Ấn Độ (Pwes-IND2009-IN); và P. kellicotti, Mỹ (Pkel-Ozark-US) (Bảng PL2.2).

Cách tính toán: Chín chuỗi nucleotide của 9 chủng/4 loài của mỗi một 12 gen PCG, 2 gen MRG và mtDNA* được riêng biệt nạp vào GENEDOC2.7, tính tỷ lệ sử dụng nucleotide (%) cho A, T, G, C qua tham số Base Composition Report và thống kê giá trị của từng nucleotide và của tổng A+T và G+C cho từng chủng/loài đối tượng nghiên cứu. Tiếp theo, giá trị độ lệch (skew) được tính theo công thức: [AT-skew = (A–T)/(A+T) và GC-skew = (G–C)/(G+C)] (theo [153]).

2.3.6. Phương pháp tính khoảng cách di truyền giữa các loài sán lá phổi dựa trên chuỗi nucleotide của hệ gen ty thể

Khoảng cách di truyền (KCDT) (pairwise genetic distance) là giá trị đo sự khác biệt về di truyền giữa các chủng trong và ngoài loài, giữa các loài hoặc giữa các quần thể trong một loài, cho dù khoảng cách đo lường thời gian từ tổ tiên chung của các đơn vị so sánh này có mức độ khác biệt. Quần thể có nhiều alen giống nhau thì khoảng cách di truyền nhỏ. Điều này chỉ ra rằng các quần thể so sánh có quan hệ họ hàng gần và có một tổ tiên chung gần đây; ngược lại KCDT có giá trị lớn thì các quần thể so sánh có quan hệ họ hàng xa và có sự phân ly từ một tổ tiên chung rất lâu trước đó [155]. Thực tế, KCDT được tính toán là số lượng nucleotide hoặc amino acid khác biệt (variation) hoặc đột biến (mutation) giữa hai tập hợp các kết quả của hai đối tượng so sánh được tính bằng tỷ lệ phần trăm (%). Khoảng cách di truyền

bằng 0 có nghĩa là không có sự khác biệt về các kết quả so sánh, tức là một kết quả phù hợp chính xác giữa hai quần thể. Nếu tỷ lệ tiếp cận càng gần 0 (0%) thì chúng có quan hệ họ hàng càng gần, nếu tỷ lệ tiếp cận càng gần 1 (100%) thì chúng có quan hệ họ hàng càng xa.

Đối tượng tính toán: Trong nghiên cứu này, khoảng cách di truyền được tính toán cho 9 chuỗi nucleotide của phần mã hóa (mtDNA*/từ cox3 đến nad5) của 9 chủng/4 loài SLP trong họ Paragonimidae, gồm: 1) P. heterotremus Việt Nam (chủng Phet-LC-VN, độ dài: 13.230 bp); 2) P. heterotremus Trung Quốc (chủng Phet-GX-CN, độ dài: 13.222 bp); 3) P. ohirai (chủng Pohi-Kino-JP, độ dài: 13.202 bp); 4) P. westermani (2n) Hàn Quốc (chủng Pwes(2n)-Haenam-KR, độ dài: 13.213

Một phần của tài liệu Nghiên cứu hệ gen ty thể, đơn vị mã hóa ribosome của sán lá phổi họ Paragonimidae tại Việt Nam và một số khu vực châu Á. (Trang 63)

w