Bài viết Xác định công dụng mới của thuốc dựa vào mô hình cục bộ hai chiều thực hiện xác định công dụng thuốc mới như một bài toán dự đoán quan hệ thuốc-bệnh. Về mặt thuật toán, bài toán này tương tự với bài toán dự đoán tương tác thuốc-đích.
Tuyển tập Hội nghị Khoa học thường niên năm 2018 ISBN: 978-604-82-2548-3 XÁC ĐỊNH CÔNG DỤNG MỚI CỦA THUỐC DỰA VÀO MƠ HÌNH CỤC BỘ HAI CHIỀU Nguyễn Hằng Phương Trường Đại học Thủy lợi, email: phuongnh@tlu.edu.vn GIỚI THIỆU CHUNG Trong thời gian gần đây, xác định công dụng thuốc (drug repositioning - DR), việc tìm kiếm định cho thuốc tồn cho thuốc giai đoạn phát triển, lên hướng tiếp cận tiết kiệm thời gian tiền bạc cho nhiệm vụ thiết kế thuốc Cùng với phát triển mạnh mẽ liệu liên quan đến thuốc bệnh, nhiều phương pháp xác định công dụng thuốc khác đề xuất Các phương pháp phân loại thành hai nhóm chính: i) dựa vào mạng ii) dựa vào học máy Phần lớn phương pháp DR có chung ý tưởng việc sử dụng mơ hình tồn cục học từ tồn mạng/ma trận liên kết thuốc-bệnh để dự đoán cho loại thuốc/bệnh Tuy nhiên, việc sử dụng mô hình chung để dự đốn cho nhiều thuốc/bệnh khác đặc trưng thông tin dược lý/sinh học khác khơng hiệu Cho tới nay, mơ hình cục áp dụng thành cơng số tốn y sinh khác dự đoán cạnh liên kết mạng tương tác trao đổi chất protein [1] mạng tương tác gene [5] Bên cạnh đó, phương pháp mơ hình cục hai chiều (BLM), dạng khác mô hình cục bộ, đề xuất để dự đốn tương tác thuốc-đích mạng song phương thuốc đích [2] Trong báo cáo này, chúng tơi thực xác định cơng dụng thuốc tốn dự đoán quan hệ thuốc-bệnh Về mặt thuật toán, toán tương tự với toán dự đoán tương tác thuốc-đích Do đó, lấy cảm hứng từ thành cơng thuật tốn BLM dự đốn tương tác thuốc-đích [2], chúng tơi điều chỉnh thuật tốn mơ hình cục [1] để thực xác định công dụng thuốc Cụ thể hơn, quan hệ thuốc-bệnh biết biểu diễn thành mạng song phương với đỉnh thuốc bệnh, cạnh nối đỉnh thuốc đỉnh bệnh biểu thị mối liên hệ biết chúng Sau đó, mơ hình cục áp dụng để dự đoán mối liên hệ thuốc (dr) bệnh (di) theo hai giai đoạn: i) cho trước thuốc (dr), chúng tơi tính điểm số thể khả sử dụng thuốc (dr) để điều trị bệnh (di) nhờ sử dụng mối liên hệ biết thuốc với bệnh khác độ tương đồng bệnh, ii) cho trước bệnh (di), tương tự, điểm số thể khả bệnh điều trị thuốc (dr) tính tốn dựa mối liên hệ biết bệnh với thuốc khác độ tương đồng thuốc Cuối cùng, điểm số cục tổng hợp thành điểm số cuối cho biết liệu có tồn mối liên hệ thuốc bệnh xét Trong báo cáo này, mơ hình cục mạng hai chiều dùng xác định công dụng thuốc (hay BLMDR - Bipartite Local Models for Drug Repositioning) so sánh với phương pháp RLSDR [4], xác định công dụng thuốc dựa vào RLS (bình phương tối thiểu có điều chỉnh - Regularized Least Square) - mơ hình tồn cục điển hình Kết đánh giá hiệu dự đoán kiểm chứng chéo 10-fold liệu chuẩn Fdataset [3] cho thấy phương pháp đề xuất tốt RLSDR (với giá trị AUC trung bình 0.832 BLMDR 0.814 RLSDR) 181 Tuyển tập Hội nghị Khoa học thường niên năm 2018 ISBN: 978-604-82-2548-3 PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Bộ liệu chuẩn Trong báo cáo này, liệu sử dụng Fdataset [3] có chứa 593 loại thuốc DrugBank, 313 bệnh sở liệu OMIM 1933 mối liên hệ biết thuốc bệnh Bộ liệu Fdataset gồm có ba ma trận là: ma trận độ tương đồng thuốc Sdr (m×m), ma trận độ tương đồng bệnh Sdi (n×n) ma trận liên hệ Y {0,1}m×n biểu diễn mạng hai chiều gồm mối liên hệ biết bệnh thuốc 2.2 Mơ hình cục hai chiều Để tìm định thuốc mới, thay xây dụng mơ hình dựa tất mối liên hệ biết sau sử dụng để dự đốn cho thuốc/bệnh, chúng tơi xây dựng nhiều mơ hình cục sử dụng phần thông tin biết mối quan hệ thuốc bệnh Nói cách khác, chúng tơi xây dựng mơ hình khác cho thuốc/bệnh dựa phần thơng tin biết thuốc/bệnh Do đó, để dự đốn có hay khơng có cạnh nối eij thuốc dri bệnh dij xác định, BLMDR áp dụng thuật toán dự đoán hai lần cho cạnh hai chiều ngược nhau, dự đốn từ phía bệnh từ phía thuốc Cụ thể hơn, chiến lược dự đốn BLMDR cạnh eij mơ tả sau: Mơ hình dự đốn cho bệnh xây dựng dựa vào hiểu biết mối quan hệ thuốc dri tất bệnh (trừ bệnh dij ) mạng quan hệ thuốc - bệnh Mơ hình sau sử dụng để dự đoán cạnh bệnh dij thuốc dri Mơ hình dự đốn cho thuốc xây dựng dựa vào hiểu biết mối quan hệ bệnh dij tất thuốc (trừ thuốc dri ) mạng quan hệ thuốc-bệnh Mơ hình sau sử dụng để dự đoán cạnh thuốc dri bệnh dij Sau hai dự đoán này, ta thu hai điểm số độc lập cho cạnh Bằng cách lấy giá trị lớn hai điểm số này, ta có điểm số dự đốn cuối cho cạnh Việc dự đốn mối liên hệ loại thuốc/bệnh với bệnh/thuốc khác triển khai tốn phân loại nhị phân mối liên hệ biết biểu diễn mẫu dương mối liên hệ cịn lại (khơng có liên hệ mối liên hệ chưa kiểm nghiệm) biểu diễn mẫu âm Từ phía bệnh, mục tiêu ta dự đốn xem bệnh định có quan hệ với thuốc dri hay không dựa vào thông tin bệnh mối quan hệ biết dri bệnh Tương tự, từ phía thuốc, mục tiêu dự đốn xem thuốc định có quan hệ với bệnh dij hay không dựa vào thông tin thuốc mối quan hệ biết dij bệnh Trong báo cáo này, thông tin thuốc bệnh biểu diễn ma trận độ tương đồng thuốc Sdr ma trận độ tương đồng bệnh Sdi Do đó, máy véc-tơ hỗ trợ SVM, mơ hình phân loại dựa vào kernel tiêu biểu, lựa chọn làm phân loại Để sử dụng ma trận độ tương đồng sẵn có làm đầu vào huấn luyện mơ hình SVM, chúng cần biến đổi thành ma trận kernel, cụ thể Sdr Sdi chuyển thành kernel Sau đó, cặp thuốc bệnh, hai mơ hình dự đốn (một mơ hình cho bệnh cho thuốc) xây dựng Trong pha dự đoán, với cặp thuốc bệnh dri -dij chưa xác định mối liên hệ, bệnh dij dùng làm đầu vào mơ hình cho bệnh để thu điểm số yµ Tương tự, thuốc dri dùng làm đầu vào mơ hình cho thuốc để thu điểm số Điểm số dự đoán cuối cặp thuốc-bệnh tích hợp thành $y max $y1 , $y KẾT QUẢ NGHIÊN CỨU Trong mục này, ta đánh giá hiệu suất BLMDR liệu tiêu chuẩn trình bày trước Để việc đánh giá thuyết phục hơn, ta so sánh hiệu suất phương pháp đề xuất với phương pháp xác định công dụng thuốc khác RLSDR [4] điều kiện thử nghiệm RLSDR dựa vào phương pháp học bán giám sát bình phương 182 Tuyển tập Hội nghị Khoa học thường niên năm 2018 ISBN: 978-604-82-2548-3 tối thiểu chuẩn hóa để xếp hạng bệnh ứng viên mạng khơng đồng thuốc-bệnh để tìm cơng dụng thuốc Hiệu suất dự đoán BLMDR RLSDR đánh giá phương pháp kiểm chứng chéo 10fold Tức là, mối liên hệ biết chưa biết ma trận liên hệ liệu Fdataset chia ngẫu nhiên thành 10 phần (fold) Trong lần thử nghiệm, fold lấy làm tập kiểm tra fold lại làm tập huấn luyện AUC (area under the ROC curve) thông số đánh giá độ nhạy độ đặc hiệu mơ hình dự đốn sử dụng để đánh giá hiệu dự đoán Cụ thể, giá trị AUC gần mơ hình dự đốn hiệu Kết thử nghiệm cho thấy, phương pháp BLMDR với giá trị AUC trung bình 0.832 dự đốn tốt RLSDR với giá trị AUC trung bình 0.814 Các đường cong ROC fold có hiệu dự đốn tốt hai phương pháp thể Hình Các kết cho thấy phương pháp đề xuất dựa vào mô hình cục cho thuốc/ bệnh vượt trội phương pháp dựa vào mơ hình tồn cục việc dự đoán mối quan hệ thuốc - bệnh KẾT LUẬN Trong báo cáo này, đề xuất mơ hình cục hai chiều dùng xác định công dụng thuốc (BLMDR) BLMDR sử dụng thông tin quan hệ thuốc-bệnh biết, độ tương đồng thuốc độ tương đồng bệnh xây dựng nên mơ hình cục để dự đốn quan hệ thuốc-bệnh Kết so sánh hiệu dự đoán phương pháp đề xuất với phương pháp dựa mơ hình tồn cục RLSDR chứng tỏ hiệu vượt trội BLMDR Trong báo cáo này, điểm số dự đoán cuối cho cặp thuốc-bệnh tích hợp cách lựa chọn giá trị lớn hai điểm số độc lập Việc sử dụng cách tích hợp khác có tính đến trọng số thơng tin thuốc bệnh cải thiện hiệu dự đoán TÀI LIỆU THAM KHẢO [1] Bleakley et.al 2007 Supervised reconstruction of biological networks with local models Bioinformatics p i57-65 [2] Bleakley, K., Y Yamanishi 2009 Supervised prediction of drug-target interactions us ing bipartite local models Bioinformatics p 2397-403 [3] Gottlieb et.al 2011 PREDICT: a method for inferring novel drug indications with application to personalized medicine Mol Syst Biol p 496 [4] Le, D.H., D Nguyen-Ngoc 2018 Drug Repositioning by Integrating Known Diseas e-Gene and Drug-Target Associations in a Semi-supervised Learning Model Acta Biotheor [5] Mordelet, F J.P Vert 2008 SIRENE: supervised inference of regulatory networks Bioinformatics p i76-82 Hình Đường cong ROC BLMDR RLSDR Fdataset Các đường cong ROC vẽ cho fold xác định có giá trị AUC cao 10 fold thử nghiệm 183 ... này, đề xuất mô hình cục hai chiều dùng xác định cơng dụng thuốc (BLMDR) BLMDR sử dụng thông tin quan hệ thuốc- bệnh biết, độ tương đồng thuốc độ tương đồng bệnh xây dựng nên mô hình cục để dự đốn... dự đốn tốt hai phương pháp thể Hình Các kết cho thấy phương pháp đề xuất dựa vào mơ hình cục cho thuốc/ bệnh vượt trội phương pháp dựa vào mơ hình tồn cục việc dự đoán mối quan hệ thuốc - bệnh... bệnh Mơ hình sau sử dụng để dự đoán cạnh bệnh dij thuốc dri Mơ hình dự đốn cho thuốc xây dựng dựa vào hiểu biết mối quan hệ bệnh dij tất thuốc (trừ thuốc dri ) mạng quan hệ thuốc- bệnh Mơ hình