1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov

10 9 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 4,85 MB

Nội dung

Bài viết trình bày dự đoán quá trình tiến hóa của vi-rút HIV qua 14 đột biến kháng thuốc trong phác đồ điều trị sử dụng thuốc Efavirenz bằng mô hình Markov ẩn và cây đột biến di truyền. Với dữ liệu mới gồm 396 bệnh nhân trên cơ sở dữ liệu kháng thuốc HIV của trường đại học Stanford.

Các cơng trình nghiên cứu, phát triển ứng dụng CNTT Truyền thơng Q trình tiến hóa sinh kháng thuốc vi-rút HIV với đột biến di truyền theo mơ hình Markov Nguyễn Văn Thế1 , Tạ Văn Nhân2 , Nguyễn Thị Kim Duyên1 , Trịnh Mai Phương1 , Nguyễn Thị Hồng Minh1 Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, Hà Nội Công ty LOBI Việt Nam, Hà Nội Tác giả liên hệ: Tạ Văn Nhân, tavannhan@gmail.com Ngày nhận bài: 23/09/2021, ngày sửa chữa: 29/10/2021, ngày duyệt đăng: 15/11/2021 Định danh DOI: 10.32913/mic-ict-research-vn.v2021.n2.1014 Tóm tắt: Trong báo này, chúng tơi dự đốn q trình tiến hóa vi-rút HIV qua 14 đột biến kháng thuốc phác đồ điều trị sử dụng thuốc Efavirenz mơ hình Markov ẩn đột biến di truyền Với liệu gồm 396 bệnh nhân sở liệu kháng thuốc HIV trường đại học Stanford, tiến hành kiểm định giả thiết nhận thấy liệu phù hợp để đưa vào mơ hình tính tốn Phần thực nghiệm cho thấy thuật toán EM dùng để ước lượng tối ưu tham số áp dụng vào mơ hình có tốc độ hội tụ nhanh Hơn nữa, dựa vào tham số sau tối ưu, xác định thứ tự xuất đột biến theo thời gian đột biến K103N xuất sớm Từ khóa: Mơ hình Markov ẩn, thuật toán EM, đột biến di truyền, thuốc Efavirenz Title: Abstract: Keywords: Evolution of Drug Resistance of HIV Virus with Mutagenetic Tree according to Markov Model In this paper, we predict the evolution of 14 mutations associated with the HIV resistance to Efavirenz using mutagenetic tree hidden Markov model With new data of 396 patients from the HIV drug resistance database by Stanford University, we test statistical assumptions and found this data set significant for further modeling Model results show that applying EM algorithm to estimate and optimize parameters has fast convergence Furthermore, based on optimized parameters, we determine the occurrence order of mutations over time in which the K103N mutation appeared earliest Hidden markov model, EM algorithm, mutagenetic tree, efavirenz I MỞ ĐẦU phiên mã ngược chúng Trong báo này, tập trung nghiên cứu vi-rút HIV, loại vi-rút nguy hiểm phá hủy tế bào lympho CD4+, làm giảm khả miễn dịch qua trung gian tế bào, tăng nguy nhiễm trùng ung thư người mang vi-rút Hiện tại, có nhiều loại thuốc khác sử dụng kết hợp phác đồ điều trị HIV Trong có hai nhóm là: (i) nhóm ức chế phiên mã ngược nucleoside (Nucleoside Reverse Transcriptase Inhibitors, viết tắt NRTIs); (ii) nhóm ức chế phiên mã ngược không Nucleoside (Non-Nucleoside Reverse Transcriptase Inhibitors, viết tắt NNRTIs)1 Mặc dù trải qua nhiều năm với vơ vàn nỗ lực, lồi người chưa tìm phương pháp đặc trị vi-rút HIV Nguyên nhân gây khó khăn xác định trình điều trị, vi-rút xuất đột biến theo thời Luận thuyết trung tâm Crick cho thấy sơ đồ tổng hợp nên Protein bắt đầu trình phiên mã từ DNA thành RNA [1] Khơng lâu sau đó, nhà khoa học khám phá trình mà ban đầu tưởng mâu thuẫn với giáo điều luận thuyết trung tâm q trình phiên mã ngược (Retrotranscription) [2] Đối với q trình này, RNA thơng tin (mRNA) dùng làm khuôn để tạo sợi đơn DNA bổ sung (cDNA) giống khuôn phiên mã Một số loại vi-rút có khả phiên mã ngược (Retroviruses) sở hữu men phiên mã ngược (Reverse Transcriptase, viết tắt RT) Chẳng hạn vi-rút T-lymphotropic gây bệnh bạch cầu người (HTLV) [3], hay vi-rút gây suy giảm miễn dịch người (Human Immunodeficiency Virus, viết tắt HIV) [4] Hướng tiếp cận để điều trị bệnh gây Retroviruses phát triển loại thuốc gây ức chế men https://www.msdmanuals.com/professional/infectious-diseases/humanimmunodeficiency-virus-hiv/drug-treatment-of-hiv-infection 94 Tập 2021, Số 2, Tháng 12 gian có khả kháng lại thuốc ức chế Protein đột biến Bộ liệu công bố sở liệu kháng thuốc với HIV đại học Stanford Sau trình loại bỏ quan sát không đủ thông tin, giữ lại thông tin 396 bệnh nhân Những mô tả chi tiết mẫu, khuếch tán RNA, nhân hay giải trình tự xem [7] Tất kết nghiên cứu đưa vào phân tích bệnh nhân điều trị Efavirenz Để trình điều trị HIV hiệu hơn, nhà khoa học tiến hành nghiên cứu nhằm dự đoán thời điểm xảy đột biến kháng thuốc phác đồ sử dụng thuốc khác liệu thu từ trình điều trị Nghiên cứu Niko Beerenwinkel cộng vào năm 2007 q trình tiến hóa vi-rút HIV qua đột biến kháng thuốc điển hình [5] Phương pháp dựa vào đột biến di truyền mơ hình Markov ẩn Ngồi ra, việc xây dựng đột biến trình quan trọng để xác định q trình tiến hóa vi-rút Dữ liệu cho phân tích gồm 163 bệnh nhân với 3350 nhân trình tự (Clones) lấy từ ba nghiên cứu liệu pháp kết hợp sử dụng thuốc Efavirenz (DMP 266-003, -004, -005) [6] Tiếp tục kết nghiên cứu Niko Beerenwinkel, với mục tiêu thực nghiệm liệu làm sở cho phát triển phương pháp, nghiên cứu này, chúng tơi tiến hành dự đốn q trình tiến hóa vi-rút HIV qua 14 đột biến kháng thuốc với liệu gồm 396 bệnh nhân thu thập sở liệu kháng thuốc HIV trường Đại học Standford2 Với liệu từ năm 2005 đến nay, nhiều đột biến kháng thuốc xuất nhiều loại thuốc đời Để thực mô hình, chúng tơi tiến hành kiểm định lại ba giả thiết Niko Beerenwinkel nhận thấy chúng với liệu lớn Mặc dù, q trình tiến hóa vi-rút HIV phân tích dựa việc sử dụng thuốc Efavirenz nhóm NNRTIs, nhiên với liệu này, đột biến xây dựng lại với nhánh lớn hơn, số phụ thuộc nút đại diện cho đột biến nhiều Với giả thiết đột biến xuất theo thời gian tn theo q trình Poisson, chúng tơi đưa dự đoán thời điểm xuất đột biến kháng thuốc phác đồ điều trị có sử dụng Efavirenz Trong phần báo, chúng tơi trình bày liệu HIV cho nghiên cứu mục II, mơ hình Markov mục III Các nội dung tính tốn thực nghiệm trình bày mục IV, kết bàn luận mục V, cuối mục VI kết luận Nghiên cứu Bacheler cộng vào năm 2001 xác định dãy biến đổi axit amin trình phiên mã ngược HIV có ảnh hưởng tới việc kháng thuốc Efavirenz Họ đường chuyển hóa thay để kháng lại Efavirenz, chuyển hóa đột biến K103N (đường 103) lại đường chuyển hóa từ đột biến Y188L (đường 188) Chúng thực đánh giá đường sử dụng để xây dựng đột biến Trong số đột biến kháng thuốc Efavirenz, để đảm bảo thời gian thực tính tốn, trước mắt chúng tơi giới hạn lấy đột biến có tần suất xuất lớn 2% Sau trình tiền xử lí liệu, kết thu dãy 14 đột biến với tần suất xuất sau: K103N (52,4%), L100I (9,1%), N348I (8,4%), Y181C (7,8%), G190A (7,7%), H221Y (6,0%), G190S (5,5%), P225H (4,6%), Y188L (4,6%), V108I (4,3%), A98G (3,8%), K101E (3,6%), V179D (3,1%), V106I (2,4%) Ở chúng tơi giải thích thêm mẫu đột biến có liệu HIV Lấy ví dụ liệu bệnh nhân mã LB4P142, thời điểm trước điều trị (thời điểm 1996-12), có ba Clone mang đột biến K103N Đến mốc thời điểm (1997-01), đột biến V106I phát thêm quần thể vi-rút bệnh nhân Những liệu cho việc kiểm chứng giả thiết theo đề xuất Niko Beerenwinke, trình bày phần báo Kiểm định thống kê Để mơ hình hóa q trình tiến hóa tích lũy, Niko Beerenwinke đưa giả thiết [5]: (A1) Những đột biến thay không xảy độc lập Con đường tiến hóa vi-rút kháng thuốc xem xét với đột biến có tính trì II DỮ LIỆU (A2) Sự tồn đột biến quần thể vĩnh viễn, tức biến đổi diễn ln trì, khơng thể đảo ngược Dữ liệu HIV Dữ liệu tập hợp trình tự nhân HIV theo thời gian thu từ 25 nghiên cứu lâm sàng với phác đồ điều trị kết hợp có sử dụng thuốc Efavirenz Các nghiên cứu thực thời gian từ năm 1998 tới 2018 với 416 bệnh nhân, thông tin bệnh nhân gồm nhân trình tự Protein (Clones) thời điểm khác nhau, Clones xác định vị trí (A3) Tại thời điểm, quần thể vi-rút bị chi phối chủng Clones độc lập với Trong giả thiết trên, kiểm chứng thống kê giả thiết (A2) (A3) Chúng thực kiểm chứng hai giả thiết với liệu tiền xử lí phương pháp kiểm tra ngẫu nhiên hóa (Randomization Test) [8] Cụ thể sau: https://hivdb.stanford.edu/cgi-bin/RTIPairs.cgi 95 Các cơng trình nghiên cứu, phát triển ứng dụng CNTT Truyền thông a) Giả thiết (A2) nêu lên tính chất khơng thể đảo ngược thay thế, tức đột biến xuất Clone 𝑘 bệnh nhân 𝑖 thời điểm đột biến xuất tất Clones sau đó, khơng Giả thiết kiểm tra cách theo dõi thay đổi tần suất alen đột biến cho bệnh nhân theo thời gian Kí hiệu [𝑁] = {1, 2, , 𝑁 } tập bệnh nhân, [𝑀] = {1, 2, , 𝑀 } tập đột biến xem xét, [𝐾𝑖 𝑗 ] tập 𝐾𝑖 𝑗 Clones quan sát bệnh nhân 𝑖 (𝑖 = 1, , 𝑁) thời điểm 𝑗 ( 𝑗 = 1, , 𝐽𝑖 ) Hàm 𝑦 𝑖 𝑗 𝑘𝑚 ∈ {0, 1} thể diện hay không đột biến 𝑚 ∈ 𝑀 Clone 𝑘 ∈ [𝐾𝑖 𝑗 ] bệnh nhân 𝑖 thời điểm 𝑗 Khi đó, tần suất alen đột biến 𝑚 ∈ [𝑀] cho bệnh nhân 𝑖 = 1, , 𝑁 theo thời gian 𝑗 = 1, , 𝐽𝑖 xác định công thức ∑︁ 𝑦 𝑖 𝑗 𝑘𝑚 (1) 𝑓𝑖 𝑗𝑚 = 𝐾𝑖 𝑗 Hình Sự đột biến xuất trì theo thời gian Với đột biến, chấm tròn biểu thị số lần giảm tần suất quần thể theo thời gian Biểu đồ hộp biểu diễn phân phối giá trị thống kê tạo kiểm định ngẫu nhiên 1000 lần 𝑘 ∈ [𝐾𝑖 𝑗 ] Với đột biến 𝑚, giá trị kiểm định thống kê 𝐴𝑚 xác định mức độ tần suất alen giảm từ thời điểm thời điểm khác Với 𝐼 hàm chỉ, 𝐴𝑚 = 𝐽𝑖 −1 𝑁 ∑︁ ∑︁ 𝐼{ 𝑓𝑖, 𝑗,𝑚 > 𝑓𝑖, 𝑗+1,𝑚 } 𝑁 𝑖=1 𝐽𝑖 − 𝑗=1 định Clones không sinh chủng loài mà bảo tồn gene từ chủng Để đo đa dạng di truyền học hai Clone 𝑐 𝑐 ′ có hay khơng đột biến 𝑚 kí hiệu tương ứng 𝑐 𝑚 𝑐 ′𝑚 , khoảng cách Hamming sử dụng theo công thức (2) Sử dụng phương pháp kiểm định ngẫu nhiên (Randomization Test) với giả thuyết không (Null Hypothesis) xác suất việc tăng giảm tần số alen Phương pháp kiểm định ngẫu nhiên thực cách xáo trộn trình tự (Resampling) quần thể Clones Tại lần Resampling liệu, ta tính giá trị kiểm định thống kê Với giả thiết thay đảo ngược (A2), tỉ lệ % việc giảm tần suất đột biến chiếm số lượng nhỏ quần thể Để giả thiết đúng, giá trị kiểm định thống kê liệu ban đầu cần phải nhỏ giá trị kiểm định thống kê sau Resampling liệu 𝐷 𝐻 (𝑐, 𝑐 ′ ) = ∑︁ 𝐼{𝑐 𝑚 ≠ 𝑐 ′𝑚 } (3) 𝑚∈ [ 𝑀 ] Độ đa dạng mẫu gồm 𝑐 , , 𝑐 𝐾 gồm 𝐾 Clones giá trị kỳ vọng khoảng cách Hamming Clones mẫu đó, 𝐷 𝐻 (𝑐 , , 𝑐 𝐾 ) = ∑︁ 𝐷 𝐻 (𝑐 𝑘 , 𝑐 𝑘 ′ ) 𝐾 (𝐾 − 1) 𝑘 𝑚 Pr(𝑋 = 𝑥) = (6) Hình (a) Cây đột biến (b) mạng tinh thể cảm sinh trạng thái tương thích 𝑚∈ [ 𝑀 ] 𝑥 = (𝑥 , , 𝑥 𝑀 ) ∈ I với I = {0, 1} 𝑀 không gian trạng thái véc-tơ ngẫu nhiên 𝑋, 𝑥 = pa(𝑚) đỉnh cha 𝑚 𝑇 Ví dụ Trong mơ hình đột biến theo thời gian, đột biến xuất theo trình Poisson độc lập Nếu 𝜆 𝑚 tỷ lệ 97 Các cơng trình nghiên cứu, phát triển ứng dụng CNTT Truyền thơng q trình cạnh pa(𝑚) → 𝑚, xác suất để đột biến 𝑚 xuất khoảng thời gian Δ𝑡 Mơ hình Markov ẩn cho đột biến Chuyển qua trường hợp mẫu Clones quan sát thời điểm khác nhau, mơ hình hóa liệu việc giả sử Clones chép lỗi chuỗi đột biến ẩn mà chuỗi đột biến tiến hóa dựa theo đột biến Như vậy, 𝑋 𝑗𝑚 lúc biến nhị phân ẩn Dữ liệu quan sát ví dụ biến nhị phân ngẫu nhiên 𝑌 𝑗 𝑘𝑚 , 𝑘 ∈ [𝐾 𝑗 ] đột biến 𝑚 có diện đột Clone thứ 𝑘 lấy mẫu từ quần thể vi-rút thời điểm 𝑡 𝑗 hay không Các Clones độc lập có điều kiện với điều kiện (𝑋 𝑗 ), 𝑗 = 1, , 𝐽 cho trước Mơ hình đồ thị thu xem mơ hình Markov ẩn cho đột biến (Mtree-HMM), ví dụ xem Hình 𝑚 𝜗11 = Pr(𝑋𝑚 = | 𝑋pa(𝑚) = 1) = − 𝑒 −𝜆𝑚 Δ𝑡 Cây đột biến tái thiết lập từ liệu việc giải toán nhánh cực đại đồ thị đầy đủ tập đỉnh 𝑉 tổ hợp thuật toán hiệu quả, xem thêm [9, 10] để biết chi tiết thuật tốn Trong báo này, chúng tơi sử dụng thuật tốn nêu để thiết lập hình dạng 𝑇 Mơ hình Markov ẩn Giả sử ta quan sát chuỗi đột biến vi-rút bệnh nhân nhiều thời điểm Gọi 𝑋 𝑗𝑚 biến ngẫu nhiên xuất đột biến 𝑚 thời điểm 𝑡 𝑗 với 𝑗 = 1, , 𝐽 quần thể vi-rút bệnh nhân Ta giả thiết trình tiến hóa bắt đầu thời điểm trạng thái tự nhiên - khơng có đột biến Do đó, 𝑋1𝑚 = với 𝑚 ∈ [𝑀] với 𝑡 = Sử dụng kí hiệu 𝜀 + = (𝜀 1+ , , 𝜀 +𝑀 ) ∈ [0, 1] 𝑀 = (𝜀 1− , , 𝜀 −𝑀 ) ∈ [0, 1] 𝑀 véc-tơ tham số chứa xác suất quan sát phải dương tính giả âm tính giả đột biến Tỷ lệ dương tính giả âm tính giả cho biết khác biệt so với trạng thái quần thể phát sinh từ đột biến phản ứng PCR Do đó, tham số định lượng kỳ vọng đa dạng di truyền quần thể vi-rút Với điều kiện trạng thái 𝑋 𝑗𝑚 , xác suất quan sát đột biến 𝑚 Clone 𝑘 thời điểm 𝑡 𝑗 𝜀− Sự phát triển đột biến 𝑚 thời điểm 𝑡 𝑗 với 𝑗 ≥ 2, mã hóa biến ngẫu nhiên 𝑋 𝑗𝑚 , lúc phụ thuộc vào trạng thái thời điểm trước 𝑋 𝑗 −1,𝑚 , trạng thái đột biến cha 𝑋 𝑗,pa(𝑚) Sự phụ thuộc nảy sinh từ tính chất: diện đột biến 𝑚 thời điểm 𝑡 𝑗 kết trình phát triển qua cạnh pa(𝑚) → 𝑚 thời điểm 𝑡 𝑗 từ tính khơng thể đảo ngược quần thể vi-rút phụ thuộc vào diện thời điểm 𝑡 𝑗 −1 Cấu trúc phụ thuộc đột biến (𝑋 𝑗𝑚 | 𝑗 = 1, , 𝐽, 𝑚 ∈ [𝑀]) biểu thị đồ thị có hướng khơng có chu trình (Xem Hình 4) 0 − 𝜀 +𝑚 − 𝜃 ′ (𝜀 +𝑚 , 𝜀 𝑚 )= − 𝜀𝑚 Các yếu tố ma trận xác suất có điều kiện − 𝜃 ′ (𝜀 +𝑚 , 𝜀 𝑚 ) = Pr(𝑌 𝑗 𝑘𝑚 = 𝑦 𝑗 𝑘𝑚 | 𝑋 𝑗𝑚 = 𝑥 𝑗𝑚 ) Do đó, Clones khác 𝑌 𝑗 𝑘 = (𝑌 𝑗 𝑘1 , , 𝑌 𝑗 𝑘 𝑀 ), với 𝑘 ∈ [𝐾 𝑗 ] mô hình thành biến ngẫu nhiên độc lập phân bố Đặt Ma trận chuyển mơ hình xích Markov có dạng 00 01 𝜃 𝑗 (𝜆 𝑚 ) = 10 11 1 𝑒 −𝜆𝑚 (𝑡 𝑗 −𝑡 𝑗 −1 ) ∗ − 𝑒 −𝜆𝑚 (𝑡 𝑗 −𝑡 𝑗 −1 ) ∗ 𝑌 = (𝑌 𝑗 𝑘𝑚 | 𝑗 = 1, , 𝐽, 𝑘 ∈ [𝐾 𝑗 ], 𝑚 ∈ [𝑀]) (7) vec tơ biểu thị tất dãy quan sát Clones Mơ hình Markov ẩn cho đột biến họ phân bố đồng thời 𝑌 cho hàng đánh số cặp (𝑚, pa(𝑚)) ∈ {0, 1}2 Vị trí đánh dấu ∗ vị trí khơng cần phải xem xét khơng có đột biến 𝑚 xuất trước đột biến mẹ pa(𝑚) Với ma trận này, ta định nghĩa mơ hình Markov đột biến họ phân bố đồng thời có dạng 𝐽 Pr(𝑌 = 𝑦) = ∑︁ ··· 𝑥1 ∈ C (𝑇 ) ∑︁ 𝑥 𝐽 ∈ C ( T ) 𝑚∈ [ 𝑀 ] 𝑗=1 − 𝜃 ′ (𝜀 +𝑚 , 𝜗𝑚 ) 𝑥 𝑗𝑚 ,𝑦 𝑗 𝑘𝑚 , 𝜃 𝑗 (𝜆 𝑚 ) ( 𝑥 𝑗 −1,𝑚 ,𝑥 𝑗pa(𝑚) ),𝑥 𝑗𝑚 𝑘 ∈ [𝐾 𝑗 ] phép lấy tổng thực với tất trạng thái ẩn mơ hình Cấu trúc đồ thị mơ hình Markov ẩn cho đột biến biểu diễn Hình Pr(𝑋 𝑗𝑚 = 𝑥 𝑗𝑚 , 𝑗 = 1, , 𝐽, 𝑚 ∈ [𝑀]) 𝐽 𝜃 𝑗 (𝜆 𝑚 ) ( 𝑥 𝑗 −1,𝑚 , 𝑥 𝑗pa(𝑚) ) , 𝑥 𝑗𝑚 , = 𝜀 +𝑚 − − 𝜀𝑚 𝑗=1 𝑚∈ [ 𝑀 ] 𝑥 𝑗0 = 𝑡 = Điều dẫn tới Tính tốn tham số Pr(𝑋 𝑗𝑚 = 𝑥 𝑗𝑚 | 𝑋 𝑗 −1,𝑚 = 𝑥 𝑗 −1,𝑚 , 𝑋 𝑗pa(𝑚) = 𝑥 𝑗pa(𝑚) ) Với bệnh nhân 𝑖 ∈ [𝑁] = 1, 2, , 𝑁, ta có quan sát thời điểm 𝑡𝑖1 , 𝑡𝑖2 , , 𝑡 𝑖𝐽𝑖 Gọi 𝑋𝑖 𝑗𝑚 biến ngẫu = 𝜃 𝑗 (𝜆 𝑚 ) ( 𝑥 𝑗 −1,𝑚 , 𝑥 𝑗pa(𝑚) ), 𝑥 𝑗𝑚 98 Tập 2021, Số 2, Tháng 12 Hình Đồ thị khơng có chu trình mơ tả mơ hình Markov ẩn cho đột biến theo thời gian với thời điểm Các đỉnh trắng ứng với biến ngẫu nhiên ẩn đỉnh xám biến quan sát [5] Gọi {𝑥 𝑖 𝑗𝑚 } giá trị biến ẩn {𝑋𝑖 𝑗𝑚 } tương thích với mơ hình đột biến ẩn Tính chất sau suy trực tiếp từ mơ hình Markov ẩn nhiên xuất đột biến 𝑚 quần thể vi-rút bệnh nhân 𝑖 thời điểm 𝑡 𝑖 𝑗 Biến ngẫu nhiên 𝑌𝑖 𝑗 𝑘𝑚 xuất đột biến 𝑚 Clone 𝑘 ∈ [𝐾𝑖 𝑗 ] bệnh nhân 𝑖 thời điểm 𝑡𝑖 𝑗 Kí hiệu ma trận chuyển (7) tương ứng với bệnh nhân 𝑖 𝜃 𝑖 𝑗 (𝜆 𝑚 ), chẳng hạn 𝑥𝑖 𝑗𝑚 = 𝜃 𝑖 𝑗 (𝜆 𝑚 )01,0 = 𝑒 −𝜆𝑚 (𝑡𝑖 𝑗 −𝑡𝑖, 𝑗 −1 ) 𝜒𝑖 𝑗𝑚 (𝑎) ′ 𝜒𝑖 𝑗 𝑘𝑚 (𝑎, 𝑏) thực thời điểm {𝑡𝑖 𝑗 | 𝑖 ∈ [𝑁], 𝑗 = 1, , 𝐽𝑖 } tham số 𝜆 = (𝜆1 , , 𝜆 𝑛 ), 𝜀 + = 𝜀 1+ , , 𝜀 +𝑚 , − làm cực đại hàm Likelihood 𝜀 − = 𝜀 1− , , 𝜀 𝑚 𝑥11 ∈ C (𝑇 ) ∑︁ 𝐽𝑖 ∑︁ ∑︁ −𝜒𝑖 𝑗𝑚 (0)𝜆 𝑚 𝑡 𝑖 𝑗 − 𝑡𝑖, 𝑗 −1 𝑖 ∈ [ 𝑁 ] 𝑚∈ [ 𝑀 ] 𝑗=1 +𝜒𝑖 𝑗𝑚 (1) log − 𝑒 𝜆𝑚 (𝑡𝑖 𝑗 −𝑡𝑖, 𝑗 −1 ) ∑︁ + 𝑥 𝑁 𝐽 𝑁 ∈ C (𝑇 ) 𝑖 ∈ [ 𝑁 ] 𝑚∈ [ 𝑀 ] 𝑗=1 ∑︁ 𝜒𝑖′ 𝑗 𝑘𝑚 (0, 0) log − 𝜀 +𝑚 + 𝜒𝑖′ 𝑗 𝑘𝑚 (0, 1) log 𝜀 +𝑚 𝑘 ∈ [𝐾𝑖 𝑗 ] − − + 𝜒𝑖′ 𝑗 𝑘𝑚 (1, 1) log − 𝜀 𝑚 + 𝜒𝑖′ 𝑗 𝑘𝑚 (1, 0) log 𝜀 𝑚 𝜃 ′ (𝜀 + , 𝜀 − ) 𝑥𝑖 𝑗𝑚 ,𝑦𝑖 𝑗 𝑘𝑚 𝜃 𝑖 𝑗 (𝜆 𝑚 ) 𝑥𝑖, 𝑗 −1,𝑚 , 𝑥𝑖 𝑗pa(𝑚) ), 𝑥𝑖 𝑗𝑚 = 𝐼{𝑥 𝑖 𝑗𝑚 = 𝑎, 𝑦 𝑖 𝑗 𝑘𝑚 = 𝑏}, ℓhid (𝜆, 𝜀 + , 𝜀 − ) = 𝐽𝑖 ··· = 𝐼{𝑥 𝑖, 𝑗 −1,𝑚 = 0, 𝑥𝑖 𝑗pa(𝑚) = 1, 𝑥𝑖 𝑗𝑚 = 𝑎}, với 𝑎, 𝑏 = 0, Khi đó, hàm Log-Likelihood ℓhid (𝜆, 𝜀 + , 𝜀 − ) mơ hình ẩn xác định 𝑌 = 𝑌𝑖 𝑗 𝑘𝑚 | 𝑖 ∈ [𝑁], 𝑗 = 1, , 𝐽𝑖 , 𝑘 ∈ [𝐾𝑖 𝑗 ], 𝑚 ∈ [𝑀] 𝐿 obs (𝜆, 𝜀 + , 𝜀 − ) = 𝑥𝑖, 𝑗 −1,𝑚 = 1, 𝑥𝑖 𝑗pa(𝑚) = Gọi 𝐼 hàm đặc trưng (hàm chỉ) nhận giá trị 1, đặt Giả sử bệnh nhân độc lập với liệu bệnh nhân dựa theo mơ hình Markov ẩn 𝑇 cố định Khi đó, kết mơ hình cho quan sát ∑︁ 𝑘 ∈ [𝐾𝑖 𝑗 ] Để giải tốn tối ưu tìm ước lượng hợp lý cực đại, chúng tơi sử dụng thuật tốn 𝐸 𝑀 hay ForwardBackward mơ hình Markov ẩn Chi tiết thuật tốn tham khảo nhiều tài liệu, chẳng hạn xem [11] 𝑥 𝑖0𝑚 = 𝑡 𝑖0 = với 𝑖 ∈ [𝑁], 𝑚 ∈ [𝑀] Vì việc tính tốn hàm Likelihood khó khăn hơn, nên hàm Log-Likelihood sử dụng thay 99 Các cơng trình nghiên cứu, phát triển ứng dụng CNTT Truyền thông IV TÍNH TỐN THỰC NGHIỆM Thuật tốn 1: Hidden Markov Model Maximization HMMM(𝑐𝑆𝑒𝑡, 𝑚𝑆𝑒𝑡, 𝑟𝑇𝑟𝑒𝑒) Nhắc lại, thực tính tốn thực nghiệm liệu làm kiểm tra giả thiết bao gồm 14 đột biến vi-rút HIV Theo cách dựng đột biến trình bày mục III.A với, nút gốc K103N Y188C giả thiết xuất từ đầu (chỉ có trạng thái 1) tập đột biến có (compatible set) Mặt khác, nút khơng có nút cha mẹ, việc tính tốn tham số 𝜆 𝑚 , dương tính giả (𝜀 +𝑚 ), âm tính − ) thực dựa thống kê từ liệu ban giả (𝜀 𝑚 đầu Tham số nút cịn lại tối ưu nhờ q trình học thuật toán EM gồm hai bước Expectation (E-step) Maximization (M-step) [12] Trong bước E-step ta cần tính xác suất chuyển trạng thái 𝑢 𝑖 𝑗𝑚,𝑎 thông qua hàm GST, xác suất xuất quan sát 𝑢 𝑚,𝑎𝑏 thơng qua hàm ˜ GSE, a, b nhận giá trị 0, 1 10 11 12 13 14 15 16 17 GST : 𝑢 𝑖 𝑗𝑚,𝑎 = Pr(𝑥𝑖, 𝑗 −1,𝑚 = 0, 𝑥𝑖 𝑗 𝑝𝑎 (𝑚) = 1, 𝑥𝑖 𝑗𝑚 = 𝑎|𝑌 ) 18 19 𝐽𝑖 ∑︁ ∑︁ ∑︁ GSE : 𝑢 𝑚,𝑎𝑏 = 20 Pr(𝑥𝑖 𝑗𝑚 = 𝑎, 𝑦 𝑖 𝑗 𝑘𝑚 = 𝑏|𝑌 ) 21 𝑖 ∈ [ 𝑁 ] 𝑗=1 𝑘 ∈ [𝐾𝑖 𝑗 ] 22 Bước M-step thực nhờ vòng lặp để khép sai số − , thuật toán dừng lại sai số tham số 𝜆 𝑚 , 𝜀 +𝑚 , 𝜀 𝑚 hai bước 𝜆 𝑚 nhỏ 5.10−4 (Xem Thuật toán 1) 23 24 25 Để đánh giá hiệu mơ hình, chúng tơi dựa số tiêu chí gồm độ xác, độ hội tụ, thời gian tính tốn Độ xác mơ hình đánh giá xác suất dương tính giả, xác suất âm tính giả đột biến dự đoán đột biến quan sát liệu Độ hội tụ mơ hình xem xét thơng qua số vịng lặp thuật tốn tương ứng với đột biến Cuối cùng, thời gian tính tốn đo cho đột biến thực nghiệm hệ thống với cấu hình máy tính core i7, CPUs, 8GB RAM, ngôn ngữ Python 26 27 28 29 30 31 Dữ liệu vào: 𝑐𝑆𝑒𝑡: Compatible Set, 𝑚𝑆𝑒𝑡: Mutation Set, 𝑟𝑇𝑟𝑒𝑒: Reconstruction Tree Dữ liệu ra: 𝑝𝑟: Parameters Khởi tạo: 𝜆 𝑚 = [0.1] ∗ |𝑚𝑆𝑒𝑡| 𝜀 +𝑚 = 0.01 //Dương tính giả − = 0.01 //Âm tính giả 𝜀𝑚 Chuẩn bị trước: GEP: Function to Get Emission Probability GST: Function to Get Sum of Transition Probability begin for 𝑚 = 𝑚𝑆𝑒𝑡 [1] to 𝑚𝑆𝑒𝑡 [−1] 𝑝𝑟 = 𝑒𝑚 𝑝𝑡𝑦; while 𝑒𝑟𝑟𝑜𝑟 𝑜 𝑓 𝜆 𝑚 ≥ 5𝑒 − 04 − ); 𝑢 𝑚,00 = GEP(𝑐𝑆𝑒𝑡, 𝑟𝑇𝑟𝑒𝑒, 𝜆 𝑚 , 0, 0, 𝜀 +𝑚 , 𝜀 𝑚 + − 𝑢 𝑚,01 = GEP(𝑐𝑆𝑒𝑡, 𝑟𝑇𝑟𝑒𝑒, 𝜆 𝑚 , 0, 1, 𝜀 𝑚 , 𝜀 𝑚 ); − ); 𝑢 𝑚,11 = GEP(𝑐𝑆𝑒𝑡, 𝑟𝑇𝑟𝑒𝑒, 𝜆 𝑚 , 1, 1, 𝜀 +𝑚 , 𝜀 𝑚 + − 𝑢 𝑚,10 = GEP(𝑐𝑆𝑒𝑡, 𝑟𝑇𝑟𝑒𝑒, 𝜆 𝑚 , 1, 1, 𝜀 𝑚 , 𝜀 𝑚 ); 𝑢 𝑚,01 − = 𝜀𝑚 ; 𝑢 𝑚,00 + 𝑢 𝑚,01 𝑢 𝑚,10 ; 𝜀 +𝑚 = 𝑢 𝑚,10 + 𝑢 𝑚,11 −) ; 𝑢 𝑖 𝑗𝑚,0 = GST(𝑐𝑆𝑒𝑡, 𝑟𝑇𝑟𝑒𝑒, 𝜆 𝑚 , 0, 𝜀 +𝑚 , 𝜀 𝑚 + − 𝑢 𝑖 𝑗𝑚,1 = GST(𝑐𝑆𝑒𝑡, 𝑟𝑇𝑟𝑒𝑒, 𝜆 𝑚 , 1, 𝜀 𝑚 , 𝜀 𝑚 ) ; 𝑢 𝑖 𝑗𝑚,1 𝑖 𝜆 𝑚 = 𝑖 ∈ [ 𝑁 ] 𝐽𝑗=1 Δ𝑖, 𝑗 (𝑢 𝑖 𝑗𝑚,0 + 𝑢 𝑖 𝑗𝑚,1 ) end − ) to 𝑝𝑟 append (𝜆 𝑚 , 𝜀 +𝑚 , 𝜀 𝑚 end return 𝑝𝑟 end cho thấy đột biến K103N xuất sớm tuần −1 𝜆 𝐾103𝑁 = 157, đột biến Y181C, L100I, G190A, P225H, H221Y, V108I, A98G, N348I, Y188L, V179D, G190S, K101E, V106I (Xem Hình 6) V KẾT QUẢ Cây đột biến Hiệu mơ hình Sử dụng thuật tốn tái xây dựng đột biến từ liệu cắt ngang thu đột biến với 15 đỉnh (Xem Hình 5) Nhánh gồm đột biến K103N, L100I, P225H; nhánh hai gồm 11 đột biến Y188C, G190S, G190A, V108I, H221Y, A98G, K101E, N348I, V106I, Y188L, V179D Dương tính giả (𝜀 +𝑚 ) xuất đột biến dự đoán tồn trong quần thể virus, thực tế lại khơng tìm thấy nhân trình tự Protein (Clones) − ) xuất đột biến Ngược lại, âm tính giả (𝜀 𝑚 dự đốn khơng tồn quần thể lại tìm thấy Clones quan sát Theo kết tái xây dựng đột biến (xem phần V.1) ta thu hai nút gốc K103N Y188C cuả hai nhánh Với hai đột biến đóng vai trị hai nút gốc này, tham số tính dựa thống kê liệu ban đầu nên dương tính giả cao, xấp xỉ 0,5 Trong nghiên cứu tiếp theo, chúng tơi cải thiện kết cách sử dụng phương pháp mặt cắt ngang để ước lượng tham số khởi tạo cho hai nút gốc Các Quá trình tiến hóa vi-rút HIV Sau tối ưu tham số với hai có nút gốc K103N Y188C ta thu giá trị 𝜆 𝑚 tương ứng với đột biến Vì giá trị 𝜆 𝑚 mang ý nghĩa số lần xuất đột biến khoảng thời gian tuần nên giá trị lớn đột biến xuất sớm Kết 100 Tập 2021, Số 2, Tháng 12 Hình Tỷ lệ dương tính giả âm tính giả dự đoán ứng với đột biến Hai đột biến đóng vai trị gốc hai nhánh đột biến K103N Y181C có tỷ lệ dương tính giả lớn nhất, xấp xỉ 0.5 Ngược lại, đột biến khác có tỷ lệ dương tính giả nhỏ so với tỷ lệ âm tính giả Hình Mơ hình đột biến xuất kháng thuốc Efavirenz HIV Các đỉnh đặt tên theo thay axit amin gồm nút với thời gian tính tốn từ 1,15 đến 2,89 giây với đột biến, nhánh hai gồm 11 nút có thời gian tính tốn từ 168,1 đến 551,82 giây cho đột biến (xem bảng I) Hình Quá trình tiến hóa vi-rút HIV qua 14 đột biến kháng thuốc Trục hoành biểu diễn tên đột biến Trục tung biểu diễn − log10 (𝜆) Chỉ số trục tung lớn đột biến xuất muộn trình điều trị Hình Độ hội tụ thuật tốn thực vịng lặp cho đột biến khác với ngưỡng sai số hai bước nhỏ 5.10 −4 Trục hoành biểu diễn số bước lặp, trục tung biểu diễn log10 (𝑒𝑟𝑟𝑜𝑟) đột biến lại hai nhánh từ L100I đến V106I có xác suất dương tính giả nhỏ (từ 0,5% tới 10,4%) so với xác suất âm tính giả (từ 10,2% đến 45,3%) (Xem Hình 7) Dương tính giả nhỏ chứng tỏ giả thiết A2 đảo ngược đột biến có độ xác cao VI KẾT LUẬN Với mơ hình Markov ẩn đột biến di truyền áp dụng cho liệu kháng thuốc HIV cập nhật nhất, tìm q trình tiến hóa vi-rút HIV qua 14 đột biến kháng thuốc Efavirenz Thời điểm xuất đột biến dự đốn thơng qua tham số trình poisson Kết cho thấy đột biến K103N xuất sớm V106I xuất muộn Mặc dù vậy, kết hợp thuốc ngày phức tạp, nhiều thuốc Trong báo này, phương pháp ước lượng tối ưu tham số EM vào mơ hình Markov ẩn đột biến gene cho tốc độ hội tụ cao Ngoài hai nút gốc K103N Y188C tính tốn khơng dựa vào vịng lặp tham số 𝜆 𝑚 đột biến lại hội tụ từ đến bước với ngưỡng sai số 5.10−4 (Xem Hình 8) Với hai tạo từ việc xây dựng lại đột biến, nhánh 101 Các cơng trình nghiên cứu, phát triển ứng dụng CNTT Truyền thông LỜI CẢM ƠN Bảng I THỜI GIAN TÍNH TỐN CHO MỖI ĐỘT BIẾN VỚI SỐ VỊNG LẶP VÀ SAI SỐ TƯƠNG ỨNG N HÁNH CHỈ GỒM BA ĐỘT BIẾN K103N, L100I, VÀ P225H NÊN THỜI GIAN TÍNH TỐN NHANH HƠN CÁC ĐỘT BIẾN CỦA NHÁNH Đột biến K103N Y181C L100I G190A P225H H221Y V108I A98G N348I Y188L V179D G190S K101E V106I 𝜆 Số bước Sai số 0,0063689 0,0013390 0,0001269 0,0000788 0,0000654 0,0000610 0,0000364 0,0000091 0,0000084 0,0000080 0,0000018 0,0000016 0,0000007 0,0000004 2 4 4 4 3 0 0,00043 0,00035 0,00038 0,00032 0,00022 0,00011 0,0002 0,00019 0,00005 0,00001 0,00009 0,00009 Nghiên cứu hoàn thành nhóm nghiên cứu gồm học viên giảng viên chương trình đào tạo Thạc sĩ Khoa học Dữ liệu Khoa Toán-Cơ-Tin học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội với hai tác giả Nguyễn Văn Thế Tạ Văn Nhân Nghiên cứu hỗ trợ VinIF khuôn khổ chương trình hợp tác đào tạo thạc sĩ Khoa học liệu với khoa ToánCơ-Tin học, trường Đại học Khoa học Tự nhiên, Đại học quốc gia Hà Nội Nguyễn Văn Thế tài trợ Tập đoàn Vingroup – Cơng ty CP hỗ trợ chương trình học bổng đào tạo thạc sĩ, tiến sĩ nước Quỹ Đổi sáng tạo Vingroup (VINIF), Viện Nghiên cứu Dữ liệu lớn (VinBigdata), mã số VINIF.2020.ThS.KHTN.05 Thời gian (s) 2,891 168,1 1,167 551,783 1,151 551,818 360,737 550,339 528,277 363,145 463,144 278,808 330,593 358,929 TÀI LIỆU THAM KHẢO [1] F Crick, “Central Dogma of Molecular Biology,” Nature, vol 227, no 5258, pp 561–563, Aug 1970 [2] H M Temin and D Baltimore, “RNA-Directed DNA Synthesis and RNA Tumor Viruses,” in Advances in Virus Research, K M Smith, M A Lauffer, and F B Bang, Eds Academic Press, Jan 1972, vol 17, pp 129–186 [3] R C Gallo, “Summary of Recent Observations on the Molecular Biology of RNA Tumor Viruses and Attempts at Application to Human Leukemia,” American Journal of Clinical Pathology, vol 60, no 1, pp 80–87, Jul 1973 [4] B D Preston, B J Poiesz, and L A Loeb, “Fidelity of HIV-1 reverse transcriptase,” Science (New York, N.Y.), vol 242, no 4882, pp 1168–1171, Nov 1988 [5] N Beerenwinkel and M Drton, “A mutagenetic tree hidden Markov model for longitudinal clonal HIV sequence data,” Biostatistics (Oxford, England), vol 8, no 1, pp 53–71, Jan 2007 [6] S.-Y Rhee, M J Gonzales, R Kantor, B J Betts, J Ravela, and R W Shafer, “Human immunodeficiency virus reverse transcriptase and protease sequence database,” Nucleic Acids Research, vol 31, no 1, pp 298–303, Jan 2003 [7] L Bacheler, S Jeffrey, G Hanna, R D’Aquila, L Wallace, K Logue, B Cordova, K Hertogs, B Larder, R Buckery, D Baker, K Gallagher, H Scarnati, R Tritch, and C Rizzo, “Genotypic correlates of phenotypic resistance to efavirenz in virus isolates from patients failing nonnucleoside reverse transcriptase inhibitor therapy,” Journal of Virology, vol 75, no 11, pp 4999–5008, Jun 2001 [8] C E Lunneborg, “Random assignment of available cases: Bootstrap standard errors and confidence intervals,” Psychological Methods, vol 6, no 4, pp 402–412, 2001 [9] N Beerenwinkel and M Drton, Mutagenetic Tree Models Cambridge University Press, 2005 [10] R Desper, F Jiang, O.-P Kallioniemi, H Moch, C H Papadimitriou, and A A Schăaffer, Inferring Tree Models for Oncogenesis from Comparative Genome Hybridization Data,” Journal of Computational Biology, vol 6, no 1, pp 37–51, Jan 1999, publisher: Mary Ann Liebert, Inc., publishers [11] O Cappé, “Online EM Algorithm for Hidden Markov Models,” Journal of Computational and Graphical Statistics, vol 20, no 3, pp 728–749, 2011 [12] A P Dempster, N M Laird, and D B Rubin, “Maximum Likelihood from Incomplete Data Via the EM Algorithm,” Journal of the Royal Statistical Society: Series B (Methodological), vol 39, no 1, pp 1–22, 1977 sử dụng trước sử dụng Efavirenz phác đồ điều trị nên thời điểm xuất đột biến dự đoán muộn Để kết đạt độ xác cao cần tiếp tục tinh liệu làm cho liệu phù hợp với mô hình tính tốn Thời gian tính tốn đảm bảo không lớn với đột biến di truyền xây dựng lại gồm nhiều nút số lượng ảnh hưởng nút tăng lên đáng kể Tuy nhiên, tham số tính tốn với nút gốc K103N Y181C dựa thống kê liệu lý dẫn đến đột biến chưa tham gia vào trình tối ưu tham số Do đó, chúng cần tính tốn kĩ lưỡng dựa việc xây dựng lại đột biến di truyền Quá trình ước lượng tối ưu tham số nhờ thuật toán EM tỏ hiệu với mơ hình liệu báo Cụ thể, với sai khác giá trị tham số hai vịng lặp liên tiếp 5.10−4 , thuật tốn hội tụ từ đến bước với đột biến Đồng thời, xác suất dương tính giả đột biến q trình tiến hóa thấp, điều có ý nghĩa lớn lâm sàng ta không cần lựa chọn thuốc thay cho đột biến giả trình điều trị Cho nghiên cứu liên quan tới q trình tiến hóa chủng vi-rút, đặc biệt với vi-rút chứa men phiên mã ngược có ý nghĩa cấp thiết điều trị vi rút cơng tế bào thể người Do đó, tiếp tục phát triển nghiên cứu với liệu hơn, lớn Bên cạnh mục tiêu hồn thiện mơ hình đột biến, nghiên cứu tiến hóa vi-rút việc áp dụng phương pháp với loại vi-rút mới, biến đổi nhanh 102 Tập 2021, Số 2, Tháng 12 SƠ LƯỢC VỀ TÁC GIẢ Trịnh Mai Phương Hiện học viên chương trình thạc sĩ Khoa học liệu, trường Đại học Khoa học tự nhiên, Đại học Quốc gia Hà Nội Lĩnh vực nghiên cứu: Dự báo kinh tế kinh doanh, khai phá liệu lớn, học máy có giám sát tin sinh học Nguyễn Văn Thế Nhận cử nhân khoa học tài ngành Toán học năm 2020 Hiện học viên chương trình đào tạo thạc sĩ Khoa học liệu, trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Các lĩnh vực nghiên cứu: Tổ hợp, lý thuyết đồ thị, Giải tích ma trận, thuật tốn, tin sinh học Email: nguyenvanthe@hus.edu.vn Email: trinhmaiphuong_ch2020@hus.edu.vn Nguyễn Thị Hồng Minh Nhận học vị tiến sĩ Tốn - Tin năm 2001, học hàm Phó giáo sư ngành Công nghệ thông tin năm 2018 Hiện giảng viên cao cấp, trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Lĩnh vực nghiên cứu: Độ phức tạp thuật tốn, tính tốn song song, khai phá liệu, tính tốn mềm, tin sinh học Email: minhnth@hus.edu.vn Tạ Văn Nhân Nhận thạc sĩ ngành Khoa học liệu năm 2021, trường Đại học Khoa học tự nhiên, Đại học Quốc gia Hà Nội Hiện chuyên viên tin sinh học taị công ty LOBI Việt Nam Lĩnh vực nghiên cứu: Giải trình tự hệ gen người, dược học hệ gen, mơ hình Markov ẩn mạng Bayes tin sinh học Email: tavannhan@gmail.com Nguyễn Thị Kim Duyên Nhận cử nhân khoa học ngành Tốntin năm 2010 Hiện học viên chương trình đào tạo thạc sĩ Khoa học liệu, trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Lĩnh vực nghiên cứu: Điểm nguy đa di truyền, áp dụng mơ hình học máy tin sinh học Email: nguyenthikimduyen_ch2020@hus.edu.vn 103 ... giây cho đột biến (xem bảng I) Hình Quá trình tiến hóa vi-rút HIV qua 14 đột biến kháng thuốc Trục hoành biểu di? ??n tên đột biến Trục tung biểu di? ??n − log10 (

Ngày đăng: 06/04/2022, 09:28

HÌNH ẢNH LIÊN QUAN

Hình 1. Sự đột biến đã xuất hiện được duy trì theo thời gian. Với mỗi đột biến, chấm tròn biểu thị số lần giảm tần suất trong quần thể theo thời gian - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
Hình 1. Sự đột biến đã xuất hiện được duy trì theo thời gian. Với mỗi đột biến, chấm tròn biểu thị số lần giảm tần suất trong quần thể theo thời gian (Trang 3)
2. Mơ hình Markov ẩn - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
2. Mơ hình Markov ẩn (Trang 5)
Ma trận chuyển của mơ hình xích Markov này có dạng - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
a trận chuyển của mơ hình xích Markov này có dạng (Trang 5)
Hình 4. Đồ thị khơng có chu trình mơ tả mơ hình Markov ẩn cho cây đột biến theo thời gian với 3 thời điểm - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
Hình 4. Đồ thị khơng có chu trình mơ tả mơ hình Markov ẩn cho cây đột biến theo thời gian với 3 thời điểm (Trang 6)
 - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
(Trang 6)
3. Hiệu quả của mơ hình - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
3. Hiệu quả của mơ hình (Trang 7)
Hình 5. Mơ hình cây đột biến của sự xuất hiện kháng thuốc Efavirenz trong HIV. Các đỉnh được đặt tên theo các thay thế axit amin. - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
Hình 5. Mơ hình cây đột biến của sự xuất hiện kháng thuốc Efavirenz trong HIV. Các đỉnh được đặt tên theo các thay thế axit amin (Trang 8)
Hình 6. Q trình tiến hóa của vi-rút HIV qua 14 đột biến kháng thuốc. Trục hoành biểu diễn tên của các đột biến - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
Hình 6. Q trình tiến hóa của vi-rút HIV qua 14 đột biến kháng thuốc. Trục hoành biểu diễn tên của các đột biến (Trang 8)
Hình 8. Độ hội tụ của thuật tốn khi thực hiện vịng lặp cho các đột biến khác nhau với ngưỡng sai số giữa hai bước nhỏ hơn 5.10−4 - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
Hình 8. Độ hội tụ của thuật tốn khi thực hiện vịng lặp cho các đột biến khác nhau với ngưỡng sai số giữa hai bước nhỏ hơn 5.10−4 (Trang 8)
Hình 7. Tỷ lệ dương tính giả và âm tính giả của dự đoán ứng với các đột biến. Hai đột biến đóng vai trị gốc ở hai nhánh của cây đột biến là K103N và Y181C có tỷ lệ dương tính giả lớn nhất, xấp xỉ 0.5 - Quá trình tiến hóa sinh kháng thuốc của vi-rút HIV với cây đột biến di truyền theo mô hình Markov
Hình 7. Tỷ lệ dương tính giả và âm tính giả của dự đoán ứng với các đột biến. Hai đột biến đóng vai trị gốc ở hai nhánh của cây đột biến là K103N và Y181C có tỷ lệ dương tính giả lớn nhất, xấp xỉ 0.5 (Trang 8)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN