Phương pháp xây dựng cây chủng loại phát sinh 1. Định nghĩa

Một phần của tài liệu Luận văn thạc sĩ xây dựng quy trình định lượng nồng độ BKV DNA bằng kỹ thuật real time PCR và phân tích đặc điểm di truyền phân tử của virus BK ở bệnh nhân ghép thận (Trang 31 - 42)

Cây phát sinh chủng loại (phylogenic tree) mô tả lịch sử tiến hóa của một nhóm các loài với những đặc tính khác nhau nhưng cùng có mối quan hệ họ hàng với nhau và cùng hình thành từ một tổ tiên chung trong quá khứ. Có nhiều hướng nghiên cứu khác nhau để xây dựng cây chủng loại phát sinh như so sánh các hóa thạch (fossil) hoặc các di chỉ (record) của cổ sinh vật học (thuộc khảo cổ học - paleontology), đặc điểm hành vi của sinh vật hay so sánh trình tự các đoạn DNA (thuộc sinh học phân tử hay hệ gen học (genomics) [90].

Các chỉ số đại diện cho độ tin cậy của cây chủng loại được xây dựng bao gồm chỉ số bootstrap, chỉ số CI, chỉ số RI. Chỉ số bootstrap là tần số xuất hiện của một nhóm (cluster) trên số lần giản đồ được thiết lập, với đơn vị tính là % (phần trăm). Theo Felsenstein (1985), bootstrap là một công cụ hỗ trợ cho việc xây dựng cây phát sinh loài. Chỉ số bootstrap nói lên độ tin cậy của sự gần gũi các thành viên của nhóm trong cây phả hệ. Trong khi đó, chỉ số CI (Consistency Index) là tỉ số đo tương thích giữa một cây bất kỳ trong tổng số các cây được phân tích có tổng số

nhánh ít nhất. Giá trị CI biến động trong khoảng 1.0 (tương thích tối đa) tiệm cận đến 0 (ít tương thích nhất). Giá trị CI càng lớn thì kết quả có mức độ tin cậy càng cao. Ngoài ra, RI (Retention Index) là chỉ số thể hiện số lượng tính trạng tương đồng của 2 hay nhiều giống cùng tổ tiên trên cây phân loại [90].

1.6.2. Đặc điểm của các phương pháp xây dựng cây chủng loại

Hai tiêu chí chính được sử dụng để phân loại các phương pháp xây dựng cây phát sinh gồm loại dữ liệu sử dụng làm đầu vào và thuật toán sử dụng để xác định cây. Dữ liệu đầu vào có thể là dữ liệu phân tử hoặc có thể là dữ liệu khoảng cách.

Dữ liệu phân tử đặc trưng bởi các chuỗi liên kết (nucleotide hoặc axit amin), trong khi đó dữ liệu khoảng cách là một ma trận với một thước đo khoảng cách tiến hóa giữa mỗi cặp trình tự trong nhiều liên kết đã được tính toán. Ưu điểm chính của dữ liệu khoảng cách là cho phép tính toán nhanh chóng các cây phát sinh, tuy nhiên lại mất thông tin khi chuyển từ dữ liệu phân tử sang dữ liệu khoảng cách.

Phương pháp khoảng cách chỉ có thể được sử dụng trên dữ liệu khoảng cách, dựa trên ý tưởng từng cặp trình tự sẽ được so sánh thẳng hàng và ứng với từng cặp, khoảng cách di truyền được xác định. Thuật toán chỉ dừng lại khi tất cả các chuỗi đã được phân nhóm và các trình tự được nhóm lại sẽ xác định cấu trúc liên kết cây.

Phương pháp khoảng cách gồm hai thuật toán là UPGMA (Unweighted pair-group method using arithmetic averages) và NJ (Neighbour Joining).

UPGMA là thuật toán xây dựng cây đơn giản nhất với việc giả định tốc độ tiến hóa không đổi của các chuỗi trong tất cả các nhánh của cây (giả định đồng hồ phân tử). Giả định này rất khó có thể xảy ra nếu các trình tự cách nhau với khoảng cách tiến hóa lớn. Tuy nhiên, thuật toán này có ưu điểm là tạo ra cây có gốc với tốc độ rất nhanh [90].

Bên cạnh đó, NJ là phương pháp tiến hóa tối thiểu ở mỗi bước trong quá trình tính toán phân cụm. Khác với UPGMA, NJ không cho rằng tốc độ tiến hóa là như nhau trong tất cả các nhánh của cây và điều chỉnh tỷ lệ biến thể giữa các nhánh.

Phương pháp này bắt đầu với một cây gốc dạng như ngôi sao. Mỗi cặp sẽ được

đánh giá riêng và tổng của tất cả các chiều dài nhánh được tính toán để hình thành cây. Cặp có tổng nhỏ nhất thì có mối quan hệ gần nhất và do đó được nối lại với nhau để hình thành một nhánh mới. Quá trình này được lặp lại cho đến khi chỉ có một điểm đầu và một điểm cuối duy nhất. Phương pháp NJ tương đối nhanh và thường cho kết quả tốt hơn phương pháp UPGMA [90].

Phương pháp dựa trên ký tự có thể được sử dụng trên cả dữ liệu chuỗi và khoảng cách, dựa trên ý tưởng tạo ra tất cả các cấu trúc liên kết cây có thể từ các chuỗi dữ liệu đầu vào. Cây có xác suất xuất hiện cao nhất là cây phù hợp nhất với dữ liệu đầu vào. Nhược điểm của các thuật toán này là rất tốn thời gian vì số lượng cấu trúc liên kết cây phát triển rất nhanh với số lượng trình tự. May mắn thay, có các phương pháp tìm kiếm tránh phải đánh giá tất cả các cây, tuy nhiên, việc đánh giá nhiều cây khác nhau làm cho các phương pháp dựa trên ký tự tốn nhiều thời gian hơn so với các phương pháp phân cụm (khoảng cách). Trong khi phương pháp phân cụm cho kết quả trong vòng vài giây thì phương pháp ký tự có thể mất vài phút, thậm chí là hàng giờ, tùy thuộc vào số lượng trình tự và độ dài của chúng. Ưu điểm chính của các phương pháp dựa trên ký tự là chúng cho phép tính toán các chuỗi tổ tiên (nghĩa là chuỗi tại các nút bên trong của cây) và không bị mất thông tin (hoạt động trực tiếp trên nhiều dữ liệu căn chỉnh chuỗi) [90]. Thuật toán này gồm hai phương pháp là:

* MP (Maximum Parsimony: khả năng tối thiểu): cơ sở lý thuyết của phương pháp này là ý tưởng triết học của William of Ockham, với giả thuyết tốt nhất để giải thích một quá trình là một yêu cầu đặt ra các giả định nhỏ nhất. Phân tích tối đa được áp dụng cho việc xây dựng cây phát sinh liên quan đến việc tính toán số lượng thay thế tối thiểu trên tất cả các vị trí cho mỗi cấu trúc liên kết để hình thành chiều dài cây. Cây MP là cây có chiều dài cây tối thiểu với ưu điểm chính là phù hợp với các chuỗi liên quan rất xa do thông tin trong một số vị trí bảo tồn có xu hướng biến mất nếu sử dụng các phương pháp khoảng cách cho các chuỗi [90].

* ML (Maximum Likehood: khả năng tối đa): Đây là phương pháp tốn nhiều thời gian nhất nhưng lại cho kết quả đáng tin cậy nhất với khả năng tái cấu

trúc chính xác các mối quan hệ giữa các chuỗi đã được tách ra trong một thời gian dài hoặc đang phát triển nhanh chóng, đòi hỏi một phương pháp sửa chữa cho nhiều sự kiện đột biến tại cùng một vị trí. Ứng với mỗi mô hình tiến hóa được chọn, phương pháp này sẽ tính toán khả năng xác suất mà một cây tiến hóa có thể có từ chuỗi trình tự phân tích. Cây tiến hóa có xác suất cao nhất là cây cuối cùng được chọn [90].

1.6.3. Ứng dụng cây chủng loại phát sinh trong xác định genotype BKV

Kiểu gen BKV có thể được xác định thông qua phương pháp huyết thanh học và sinh học phân tử. Ngày nay, với sự phát triển mạnh mẽ của lĩnh vực sinh học phân tử, việc xác định kiểu gen BKV có thể được thực hiện thông qua các phương pháp như PCR hoặc real-time PCR đa mồi, RFLP… Tuy nhiên, giải trình tự và xây dựng cây chủng loại phát sinh là phương pháp tối ưu nhất với độ tin cậy, độ chính xác cao, đồng thời cho phép phân tích những đột biến SNP (Single Nucleotide Polymorphism) làm thay đổi độc lực của virus.

Việc lựa chọn gen đích và phương pháp xây dựng cây chủng loại phù hợp để xác định kiểu gen là vấn đề mấu chốt giúp cây chủng loại phát sinh có độ tin cậy cao. Nghiên cứu của Zhang-Yang Wang và cộng sự (2015) [87] trên 23 mẫu huyết tương và 95 mẫu nước tiểu dương tính với BKV dựa trên trình tự vùng gen VP2 và hai phương pháp phân tích UPGMA, Neighbour Joining cho độ tin cậy không cao khi giá trị bootstraps lần lượt là 25%-61% và 0%-17%. Trong quá trình phân tích phát sinh dựa trên trình tự gen VP2, nghiên cứu này cho thấy phương pháp NJ không thể tạo ra một cây phát sinh gen phù hợp và chỉ ra rằng phương pháp UPMGA tốt hơn cho kiểu gen. Mặt khác, đa hình cũng xuất hiện nhiều ở gen kháng nguyên T lớn, chiếm 11,39% trong tất cả các vị trí nucleotide. Các locus đa hình BKV cũng đã được phát hiện khi so sánh các vùng kiểm soát không mã hóa (NCCR). Nghiên cứu của Luo C và cộng sự cho thấy cây phát sinh gen dựa trên kháng nguyên T lớn (LTA) cho phép tách kiểu gen I thành các phân nhóm I/a, I/b-1, I/b-2 và I/c, với giá trị bootstrap là 100%, tốt hơn so với bootstraps thu được khi sử

dụng chuỗi VP1 (giá trị bootstrap từ 71% đến 97%). Tuy nhiên, sự phân chia của các phân nhóm IV cho giá trị bootstraps không cao (33%) [58].

Do bộ gen của BKV có rất nhiều vị trí đột biến, đặc biệt khu vực mã hóa đa hình nhiều nhất trong bộ gen virus là VP1 nên các nghiên cứu phần lớn đều tập trung vào tính đa hình của gen VP1 cũng như các đột biến trong dư lượng axit amin được mã hóa bởi gen VP1. Hơn nữa, hầu hết các nghiên cứu trước đây xác định 4 kiểu gen BKV dựa vào trình tự toàn bộ gen hoặc trình tự vùng gen VP1 với công bố đầu tiên của Jin và cộng sự (1993) [47]. Khi xây dựng cây chủng loại phát sinh dựa trên trình tự gen VP1, phương pháp NJ thường được áp dụng cho gen VP1 do tính đa dạng đa hình cao [15]. Đáng chú ý là kiểu gen dựa trên gen VP1 mang lại định nghĩa rừ ràng hơn về cỏc phõn nhúm khi phõn tớch cỏc đoạn gen ngắn hơn 300 bp [46]. Điều này chỉ ra rằng VP1 mang nhiều thông tin hơn. Nghiên cứu của Boukoum H và cộng sự (2016) [16] trên 72 bệnh nhân ghép thận tại Tunisia dựa trên đoạn trình tự 287 bp (1650-1936, chủng Dunlop-V01108) gen VP1 theo phương pháp xây dựng cây chủng loại phát sinh NJ cho thấy giá trị bootrap chính đều lớn hơn 60%. Tương tự, những nghiên cứu khác [44],[56] cũng đều chỉ ra việc xác định kiểu gen BKV bằng việc phân tích đoạn trình tự 287 bp trên vùng lặp BC thuộc gen VP1 cho độ tin cậy, độ chính xác cao. Do đó, kiểu gen BKV trên những bệnh nhân ghép thận tại Việt Nam xác định trong nghiên cứu này dựa trên vùng gen VP1 (1630-1956) và phương pháp NJ.

Chương 2

VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1. Nguyên liệu

2.1.1. Mẫu nghiên cứu

Mẫu huyết tương và nước tiểu của 131 bệnh nhân ghép thận (được thu thập tại cùng một thời điểm sau ghép) tại Bệnh viện Quân y 103 trong giai đoạn từ năm 2017 đến 2018.

Mẫu nước tiểu được thu thập trong ống fancol 50 ml, ly tâm 3200 vòng/phút, thu cặn nước tiểu, bảo quản -80oC cho đến khi tách chiết DNA.

Mẫu máu chống đông với K2/EDTA, ly tâm 3000 vòng/phút trong 10 phút, thu huyết tương, bảo quản -80oC cho đến khi tách chiết DNA.

Địa điểm nghiên cứu: Phòng Vi sinh và các mầm bệnh Sinh học, Viện Nghiên cứu Y dược học Quân sự, Học viện Quân y.

2.1.2. Các vật liệu

+ Dòng tế bào khả biến Escherichia DH5α được cung cấp bởi hãng ThermoFisher Scientific, Hoa Kỳ.

+ Vector tách dòng: Vector pGEM T easy cho phép chèn các đoạn có kích thước 6 bp - 10 kp. Kích thước plasmid nhỏ tạo điều kiện thuận lợi cho quá trình biến nạp dễ dàng. Vector với hai đầu dính T giúp gắn kết đoạn chèn và vector dễ dàng hơn, thuận tiện cho quá trình thao tác. Sản phẩm PCR đầu bằng tạo bởi DNA polymerase có chức năng đọc sửa, sau khi được gắn thêm đầu A sẽ gắn trực tiếp vào vector trong vòng 5 phút với hiệu suất 99% sản phẩm DNA tái tổ hợp. Mặt khác, DNA tái tổ hợp có thể biến nạp vào tất cả các chủng E. coli trong phòng thí nghiệm. Vector pGEM T easy chứa gen kháng kháng sinh ampicilin nên các tế bào nhận vector có thể mọc trên môi trường chọn lọc ampicilin. Mặt khác, ở vị trí đa điểm có chứa gen lac Z bị gián đoạn bởi đoạn chèn. Vì vậy, chỉ có những vi khuẩn mang DNA tái tổ hợp mới mọc thành khuẩn lạc có màu trắng. Những khuẩn lạc

không chứa đoạn chèn sẽ có màu xanh do gen lacZ hoạt động, mã hóa cho enzyme β galactosidase, kết hợp với cơ chất X-gal và IPTG tạo sản phẩm có màu xanh.

+ Bộ mẫu chuẩn được thiết lập bởi hãng Altona (RealStar® BKV PCR Kit, Đức, 2018)

Đây là bộ mẫu chuẩn đã được hiệu chỉnh từ bộ mẫu chuẩn của Tổ chức Y tế Thế giới về BKV, đã được cấp chứng chỉ IVD (In vitro diagnostic) của châu Âu. Bộ mẫu chuẩn định lượng chứa DNA đặc hiệu BKV có dải nồng độ từ 1.00E+01 đến 1.00E+4 [IU/àl]. Độ nhạy của kỹ thuật real-time PCR trung bỡnh phỏt hiện được là 0,712 copy/μl (dao động từ 0,404 – 1,693 copy/μl, với độ tin cậy 95%). Độ đặc hiệu cũng được đánh giá trên những chủng polyomavirus khác hoặc trên những mầm bệnh có ý nghĩa ở bệnh nhân suy giảm miễn dịch như: Cytomegalovirus, Epstein- Barr virus, Hepatitis A virus, Hepatitis B virus, Hepatitis C virus, Herpes simplex virus 1, Herpes simplex virus 2, Human herpesvirus 6A, Human herpesvirus 6B, Human herpesvirus 7, Human herpesvirus 8, Human immunodeficiency virus 1, JC virus, Simian virus 40, Varicella-zoster virus.

+ Bộ mẫu chuẩn của Tổ chức Y tế Thế giới (1st WHO International Standard for BK Virus DNA (2016, NIBSC code: 14/212)

Vào năm 2006 và năm 2008, Tổ chức Y tế thế giới đã tổ chức một cuộc họp quốc tế để thảo luận về yêu cầu tiêu chuẩn hóa quốc tế các xét nghiệm BKV NAT (BKV nucleic acid test) với sự tham gia của các giáo sư từ các trường đại học, công ty công nghiệp dược phẩm, các đơn vị ngoại kiểm (QCMD: Quality Control Molecular Diagnostics) và các tổ chức chính phủ (NIBSC: National Institute of Biologicals and Standards Control). Hai mẫu chuẩn BKV đông khô (subtype I/b-1 và subtype I/b-2) được pha trong 10 mM Tris-HCl pH 7,4, 0,5% albumin huyết thanh người, 0,1% D - (+) - Trehalose dehydrate được gửi tới 33 phòng thí nghiệm từ 15 quốc gia phân tích đánh giá, mỗi phòng thí nghiệm sử dụng các xét nghiệm thường quy để phát hiện và định lượng BKV. Kết quả khảo sát cho thấy trong 2 mẫu chuẩn thì mẫu chuẩn thứ 2 (code: 14/212) phù hợp nhất để sử dụng làm mẫu

chuẩn quốc tế của WHO. Đây cũng là bộ mẫu chuẩn được lựa chọn để đánh giá chất lượng bộ mẫu chuẩn cũng như kỹ thuật real-time PCR tự phát triển trong nghiên cứu này.

Hình 2. 1. Vector pGEM T easy 2.1.3. Hóa chất

Các kit sử dụng trong nghiên cứu này được trình bày cụ thể trong bảng 2.1.

Trình tự các cặp mồi tham khảo từ các bài báo quốc tế và các cặp mồi tự thiết kế được cung cấp bởi IDT trong bảng 2.2.

Bảng 2. 1. Các bộ kit tách chiết, các hóa chất sử dụng trong nghiên cứu

STT Tên kit, hóa chất Hãng sản xuất Cat No.

1 Kit tách chiết DNA từ máu và nước tiểu Exgene™ Blood SV

Gene - All

(Hàn Quốc) GA-105-101 2 Kit tách chiết DNA tổng số từ mẫu máu

QIAamp DNA Blood Mini Kit

Qiagen

(Đức) 51104

3 Kit tinh sạch DNA từ gel agarose:

GeneJET Gel Extraction Kit

Thermo Fisher

(Mỹ) K0691

4 Kit tinh sạch sản phẩm PCR:

GeneJET PCR Purification Kit

Thermo Fisher

(Mỹ) K0692

5 Kit tách Plasmid

GeneJET Plasmid Miniprep Kit

Thermo Fisher

(Mỹ) K0502

6 Kit tách dòng:

pGEM-T Easy Vector System

Promega

(Mỹ) A1360

7 Dòng tế bào khả biến DH5α Invitrogen 18260517

8

Các hóa chất chính:

Master mix PCR Quantitect probe PCR Tryptone

Cao nấm men Agarose

Thermo Fisher QIAGEN Merck Merck iNtRON

F531S 204345 1076800500 1037530500

32032

Bảng 2. 2. Trình tự các cặp mồi sử dụng trong nghiên cứu [82]

Mồi Trình tự (5’-3’)

Kích thước

(bp)

Mục đích

BKS ATCAAAGAACTGCTCCTCAAT

580 bp

Mồi xuôi, vòng ngoài

BKAS GCACTCCCTGCATTTCCAAGGG Mồi ngược,

vòng ngoài

BKF1 CAAGTGCCAAAACTACTAAT

327 bp

Mồi xuôi, vòng trong

BKR TGCATGAAGGTTAAGCATGC Mồi ngược,

vòng trong

qBKF ATGGCCCCAACCAAAAGAA

81bp

Mồi xuôi realtime PCR

qBKR TAGTTTTGGCACTTGCACGG Mồi ngược

realtime PCR

Pr BK

FAM-

TCCAGGGGCAGCTCCCAAAAAGCC- BHQ1

Taqman probe, realtime PCR 2.2. Thiết bị chính

 Máy PCR: Master cycler PCR (Eppendorf)

 Máy Real-time PCR: Rotor-Gene Q MDx (QIAGEN)

 Bộ điện di DNA (Labnet)

 Máy chụp ảnh gel (UVP Eppendorf)

 Máy lắc Gyromax 737R (Amerex instrument)

 Tủ ấm (Shelab)

 Tủ cấy an toàn sinh học (Nuaire)

 Máy ly tâm lạnh (Heraeus)

 Máy đo quang phổ nanodrop (Quickdrop)

 Tủ lạnh 0oC, 4 oC, -20 oC, -80 oC (Nuaire)

 Máy Vortex (OSI Rotolab)

 Bể ổn nhiệt (Memmert)

 Lò vi sóng (Sanyo)

 Cân điện tử (Adam)

 Pippetman (Gilson, Haminlton, Bio-rad)

 Các thiết bị chuyên dụng khác

Xác định SNP, xây dựng cây chủng loại phát sinh, xác định kiểu gen BKV Tinh sạch và giải trình

Đánh giá kỹ thuật real-time PCR

Một phần của tài liệu Luận văn thạc sĩ xây dựng quy trình định lượng nồng độ BKV DNA bằng kỹ thuật real time PCR và phân tích đặc điểm di truyền phân tử của virus BK ở bệnh nhân ghép thận (Trang 31 - 42)

Tải bản đầy đủ (DOCX)

(100 trang)
w