Các phương pháp dự đoán và ứng dụng vào bài toán đoán nhận khả năng ức chế của siRNA (TT)

26 601 0
Các phương pháp dự đoán và ứng dụng vào bài toán đoán nhận khả năng ức chế của siRNA (TT)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN BÁ QUÂN CÁC PHƢƠNG PHÁP DỰ ĐOÁN VÀ ỨNG DỤNG VÀO BÀI TOÁN ĐOÁN NHẬN KHẢ NĂNG ỨC CHẾ GEN CỦA siRNA Ngành: Hệ thống thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 01 04 TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN HÀ NỘI - 2016 MỞ ĐẦU Andrew Fire Craig Mello tiến hành nghiên cứu chế điều khiển biểu gen giun tròn (C Elegans), hai ông thực hàng loạt thí nghiệm việc tiêm RNA vào phận sinh dục giun tròn phát chế gọi can thiệp RNA Năm 2006 Fire Mello nhận giải thưởng Nobel cho đóng góp nghiên cứu can thiệp RNA (RNAi) Quá trình nghiên cứu họ người khác việc phát RNAi có tác động to lớn nghiên cứu y sinh học Rất áp dụng y tế để tạo loại thuốc để điều trị nhiều loại bệnh virus cúm A, HIV, virus viêm gan B, ung thư… Trong RNAi, siRNA tổng hợp tiêm vào tế bào để ức chế mRNA, nhằm mục đích kiểm soát bệnh Do tổng hợp siRNA có hiệu cao để thiết kế loại thuốc vấn đề quan trọng nghiên cứu can thiệp RNA Nghiên cứu siRNA liên tục thử nghiệm để tìm phương pháp hiệu nghiên cứu tập trung vào vấn đề việc tìm kiếm quy tắc thiết kế siRNA Mỗi quy tắc thiết kế siRNA tìm đặc tính quan trọng tác động đến hiệu ức chế Nhiều quy tắc thiết kế để tìm siRNA có khả ức chế cao phát trình thực nghiệm sinh học sinh học tính toán Hướng nghiên cứu tập trung vào vấn đề xây dựng mô hình dự báo để dự đoán hiệu ức chế siRNA, kỹ thuật học máy chủ yếu sử dụng để giải theo hướng nghiên cứu Tuy nhiên số hạn chế hầu hết quy tắc thiết kế siRNA có hiệu suất thấp nhiều siRNA tạo không hoạt động không khả ức chế không cao hiệu suất mô hình dự báo đề xuất thấp giảm thử nghiệm liệu độc lập Nên việc tìm kiếm giải pháp cho hai vấn đề nêu để tạo siRNA có khả ức chế hiệu cao thách thức lớn Do hạn chế nên trình nghiên cứu để tìm phương pháp để tạo siRNA hiệu cao không xuất Với hướng tìm hiểu nghiên cứu phương pháp ứng dụng vào việc dự đoán khả ức chế siRNA Luận văn tập trung vào việc tổng hợp lại quy tắc thiết kế siRNA hiệu phương pháp dự đoán khả ức chế siRNA Đồng thời tiến hành áp dụng thực nghiệm số phương pháp học máy so sánh kết đạt với phương pháp học máy tổng hợp Kết đạt giúp có cách nhìn tổng quan áp dụng cách phù hợp vào giải toán nhằm xây dựng số mô hình dự đoán khả thi để đoán nhận khả ức chế siRNA hỗ trợ cho việc điều chế thuốc Luận văn chia làm năm chương chính: Chƣơng 1: Giới thiệu tổng quan đoạn ngắn RNA có khả ức chế (siRNA) Ở chương mở đầu trình bày số kiến thức tảng RNAi trình bày tổng quát siRNA bao gồm chức năng, hoạt động, ứng dụng, hạn chế phương pháp giải toán siRNA Chƣơng 2: Các quy tắc thiết kế siRNA hiệu quả: Trình bày khái quát tìm hiểu nhà nghiên cứu cách tìm quy tắc thiết kế siRNA hiệu hai cách tiếp cận sinh học sinh học tính toán Chƣơng 3: Phương pháp dự đoán khả ức chế gen siRNA Chương tập trung vào giới thiệu tổng quan nghiên cứu xây dựng mô hình dự báo cách áp dụng phương pháp học SVM RF để dự đoán khả ức chế gen siRNA đồng thời trình bày phương pháp học biểu diễn liệu áp dụng cho phần thực nghiệm Chƣơng 4: Thực nghiệm đánh giá Đây phần nêu lên kết đạt suốt trình thực hiện, đề cập đến khó khăn vấn đề vướng mắc phát sinh, sau đánh giá kết đạt chi tiết bước thực Chƣơng 5: Kết luận Tổng kết lại nội dung luận văn, đưa hướng hướng áp dụng thực tế CHƢƠNG GIỚI THIỆU TỔNG QUAN VỀ ĐOẠN NGẮN RNA CÓ KHẢ NĂNG ỨC CHẾ (siRNA) 1.1 Can thiệp RNA Can thiệp RNA (RNAi) hệ thống bên tế bào sống, giúp kiểm soát gen hoạt động đoạn ngắn RNA giúp tế bào ức chế biểu gen có trình tự tương đồng với Đây hệ thống tự vệ tế bào nhằm chống lại xâm nhập siêu vi khuẩn, phần tử di truyền ngoại lai khác 1.1.1 Các chế, thành phần RNAi RNAi trình phân hủy mRNA (Hình 1.1), dsRNA (Double stranded RNA) mạch kép sợi tóc bị cắt thành đoạn ngắn RNA (siRNA) enzyme ribonuclease III Dicer Các siRNA tháo xoắn thành hai sợi sense antisense họ protein gọi RNA- phức hệ gây im lặng (RISC) mang sợi antisense siRNA bám vào mRNA đích có trình tự tương đồng với phân hủy mRNA Nên trình chuyển hóa mRNA thành Protein hay lây nhiễm virut RNA bị ngăn chặn Hình 1.1: Sơ đồ hoạt động RNAi siRNA Có ba thành phần liên quan đến trình can thiệp RNA: siRNA, enzyme Dicer, phức hệ (RISC) 1.1.2 Vai trò RNAi RNAi có nhiều chức quan trọng tế bào như: Bảo vệ tế bào chống lại gen ký sinh trùng, virus yếu tố di truyền vận động, điều hòa biểu gen, điều khiển phát triển tổ chức trì hình dạng nhiễm sắc thể tăng cường phiên mã… 1.1.3 Thành phần RNAi siRNA RNA ngắn có kích thước khoảng 21 đến 25 nucleotit, hình thành từ RNA sợi đôi, tham gia vào trình tổng hợp protein, miRNA (micro RNA) đoạn RNA ngắn khoảng từ 19 đến 24 nucleotit, không tham gia vào trình tổng hợp protein 1.1.4 Nghiên cứu can thiệp RNA Can thiệp thực vật Ở thực vật ức chế RNA phát thực biến đổi gen yến thảo với dự kiến có màu tím hơn, năm 1990 Tuy nhiên thay hình thành màu tím cánh hoa mong đợi chúng lại thể đốm màu khác chí màu trắng (Hình 1.2), Hình 1.2: Đồng ức chế yến thảo, bên trái dại, bên phải chứa biến đổi gen Hiện tượng nhà khoa học đặt thuật ngữ "cosuppresion" nghĩa "đồng ức chế" biểu gen ngoại sinh gen nội sinh hoa yến thảo bị ức chế Thuật ngữ "đồng ức chế" trình mô tả mRNA gen nội sinh gen ngoại sinh phiên mã Can thiệp tế bào động vật có vú Tuschl đồng nghiệp phát RNAi tế bào động vật có vú tạo hội cho phương pháp điều trị nghiên cứu điều trị, siRNA trước tiên tổng hợp phosphoryl 5' kinase CLP1 sau đưa vào tế bào [51] mô tả RNAi (Hình 1B) Ức chế biểu gen mục tiêu thường kéo dài 5-7 ngày, Một siRNA chống thành phần protein có chức vận chuyển lipid hệ thống tuần hoàn cho thấy có hoạt động chuột vài ngày sau chín ngày trở lại đến 70% mức khởi điểm ban đầu Trong sử dụng ức chế với loài linh trưởng người 11 ngày [49] Thời gian tác dụng siRNA phụ thuộc vào nhiều yếu tố, chẳng hạn quan đích, gen đích loài 1.2 Nghiên cứu siRNA Các đoạn ngắn RNA có khả ức chế (siRNA) phân tử RNA sợi kép nhỏ, kích thước khoảng 21 đến 25 nucleotit, tạo Dicer, RNA endonuclease nhóm III, thành phần phức hợp RISC có chức phân hủy mRNA đồng dạng 1.2.1 Lịch sử nghiên cứu siRNA Nguồn gốc hình thành siRNA từ kỹ thuật antisense-RNA Tuy nhiên, đến năm 1990 nhà khoa học phát chế gây ức chế gen Đó nghiên cứu loài hoa yến thảo Năm 1994, Cogoni cộng tiến hành thí nghiệm nhằm phát triển màu cam nấm Tuy nhiên nấm lại màu cam Năm 1995, Guo Kemphues đưa chứng tuyến trùng Caenorhabditis elegans Cho đến đa số siRNA công bố có nguồn gốc ngoại sinh Tức có nguồn gốc từ bên đưa vào tế bào thể sống đường khác siRNA nội sinh lần Baulcome Hamilton vào năm 1999 Các tác giả chuyển gen aco, gus vào cà chua thuốc Trên phát hiện tượng PTGS, tác giả phát phân tử RNA nhỏ, đặc hiệu ngược chiều với gen chuyển (chứng tỏ sản phẩm phân hủy mRNA gen trên) Sau nghiên cứu Tuschl công bố phát siRNA gây bất hoạt gen động vật 1.2.2 Chức siRNA  Bảo vệ tế bào chống lại gen ký sinh trùng, virut yếu tố di truyền vận động  Giữ gìn nhiễm sắc thể tăng cường phiên mã 1.2.3 Ứng dụng siRNA Nghiên cứu chức gen Xác định chức gen trở thành nhiệm vụ nghiên cứu quan trọng Trong vài năm gần việc áp dụng RNAi phương pháp tiêu chuẩn nghiên cứu sinh học phân tử phòng thí nghiệm hóa sinh sử dụng với số lượng lớn, kể từ ức chế gen thực với ghép đôi mRNA siRNA, chức gen kiểm tra nhanh nhiều Ứng dụng điều trị Phương pháp điều trị can thiệp RNA thử nghiệm bắt đầu người ba năm rưỡi sau siRNA lần sử dụng tế bào động vật có vú Bệnh mắt Nghiên cứu can thiệp RNA lần bắt đầu 2004 với siRNA chống lại yếu tố tăng trưởng nội mạc (VEGF) Các siRNA thử nghiệm tên Bevasiranib Phương pháp điều trị siRNA bắt đầu nghiên cứu lâm sàng với biến đổi hóa học siRNA Trong nghiên cứu y học mới, siRNA RTP801i-14 chống lại rtp801 gen thiếu oxy gây sử dụng để điều trị bệnh thoái hóa điểm vàng tuổi theo dược phẩm Quark, cách an toàn hiệu so với chất NTI-VEGF Nhiễm Virut Kể từ báo cáo tác dụng kháng virus siRNA chống virus hợp bào hô hấp (RSV), RNAi thành công với hầu hết virus có liên quan y tế, bao gồm HIV-1, HBV, HCV, SARS, virus cúm, virus bại liệt, công bố [28] Ung thƣ Có nhiều nghiên cứu công bố cho thấy tăng trưởng khối u bị chậm lại động vật kỹ thuật RNAi Ví dụ siRNA chống CD31 ức chế tăng trưởng khối u mô hình chuột mô ghép (xenograft) khác [38] Các siRNA thâm nhập vào tế bào khối u nội mô lipoplexes khối mạch Các thử nghiệm lâm sàng khác RNA sử dụng chiến lược điều trị chống suy thận cấp Năm 2008, Transderm Inc bắt đầu nghiên cứu lâm sàng để điều trị nhiễm sắc thể di truyền bệnh dày móng bẩm sinh (Pachyonychia congenital) Các siRNA tiêm vào đặc biệt ức chế biểu keratin đột biến K6a [40] 1.2.4 Những thách thức nghiên cứu siRNA siRNA RNA mạch kép ngắn có khoảng 21-25 nucleotit với đầu 5’- P 3’-OH có hai nucleotit nhô (Hình 1.1A) Chúng đưa trực tiếp cách chuyển vào tạo tế bào từ dsRNA bị cắt thành siRNA nhờ Dicer, siRNA mở xoắn tạo thành hai sợi sense antisense, sợi antisense bám vào mRNA nhờ phức hợp RISC cắt mRNA phân hủy mRNA tương đồng với Để tạo siRNA có khả ức chế cao ta phải giải hai vấn đề quan trọng sau (Hình 1.3):   Làm siRNA tránh hiệu ứng ức chế sai mục tiêu Làm để tạo siRNA có hiệu cao Hình 1.3: Hai vấn đề quan trọng RNA Tạo siRNA hiệu cao Vấn đề 1: Tìm quy tắc thiết kế siRNA hiệu Vấn đề 2: Xây dựng mô hình dự báo để dự đoán hiệu ức chế siRNA Vấn đề 3: Tạo siRNAs hiệu cao 1.3 Kết luận Các siRNA tổng hợp đưa vào tế bào để làm ức chế gen đích dẫn việc tạo nhiều loại thuốc siRNA làm ức chế mRNA cấp độ khác nên việc tạo nhiều siRNA hiệu cao vấn đề quan trọng Ngoài việc thực mô hình dự báo liệu siRNA lớn Vì để tạo nhiều siRNA hiệu cao thách thức nhiều kỹ thuật tiên tiến nên đề xuất để giải vấn đề Trong luận văn tập trung vào việc tìm hiểu nghiên cứu nhà khoa học nhằm giải vấn đề hai để tìm siRNA hiệu cao CHƢƠNG CÁC QUY TẮC THIẾT KẾ siRNA HIỆU QUẢ 2.1 Quy tắc thiết kế siRNA Bài toán: Đầu vào chuỗi siRNA, sử dụng phương pháp tiếp cận sinh học sinh học tính toán để đưa quy tắc thiết kế siRNA hiệu Quy tắc thiết kế siRNA tìm đặc điểm ảnh hưởng đến hiệu ức chế siRNA, chiều dài, vị trí, hạn chế A/U, tính chất nhiệt …Hình 2.1 Hình 2.1 Quy tắc thiết kế siRNA hiệu 2.2 Quy tắc thiết kế siRNA hiệu phƣơng pháp sinh học Các tính định vị, nhiệt động học, cấu trúc bậc hai siRNA xem yếu tố quan trọng để tìm quy tắc thiết kế siRNA Có nhiều quy tắc đưa (Hình 2.2) Sau quy tắc dự đoán quan trọng Quy tắc thiết kế Tuschl Quy tắc thiết kế Reynolds Quy tắc Amarzguioui Quy tắc thiết kế Stockholm Quy tắc thiết kế Ui-Tei Quy tắc thiết kế Hseih 11 Teramoto [46] đồng nghiệp sử dụng Máy vector hỗ trợ (Support Vector Machine (SVM)) sử dụng để phân biệt siRNA hiệu không hiệu phát 20 đặc điểm siRNA Ladunga đồng nghiệp [33] sử dụng gói SVMLight với đa thức kernel để huấn luyện 2200 siRNA, dựa mạng nơron định (Hình 2.3) để lựa chọn siRNA hiệu từ nhiều mục tiêu Hình 2.3: Tìm quy tắc thiết kế dựa mạng nơron định Các nhà nghiên cứu dùng hai cách tiếp cận với nhiều quy tắc tìm thấy để tìm kiếm siRNA hiệu cao có hạn chế chung Đó không thống quy tắc thiết kế siRNA Hiệu đạt thấp 20% siRNA tạo quy tắc không hoạt động, 65% siRNA tạo quy tắc hoạt động không hiệu Do để tìm kiếm siRNA hiệu cao mục tiêu phải tiếp tục tìm quy tắc thiết kế siRNA tốt hơn, đồng thời tìm đặc điểm quan trọng siRNA ảnh hưởng đến hiệu ức chế Trong trình nghiên cứu tìm kiếm quy tắc siRNA hiệu cao nhà khoa học đồng thời sử dụng phương pháp học máy để xây dựng mô hình dự đoán khả ức chế gen siRNA 12 2.4 Kết luận Như để tạo siRNA có hiệu cao hai cách tiếp cận sinh học sinh học tính toán có nhiều quy tắc thiết kế siRNA đưa Tuy nhiên nhiều hạn chế, để tạo quy tắc thiết kế siRNA hiệu cao ta phải tiếp tục nghiên cứu thử nghiệm để tìm quy tắc tốt tìm đặc điểm quan trọng siRNA để phát quy tắc thiết kế hiệu 13 CHƢƠNG PHƢƠNG PHÁP DỰ ĐOÁN KHẢ NĂNG ỨC CHẾ CỦA siRNA 3.1 Tổng quan số phƣơng pháp xây dựng mô hình dự đoán ức chế siRNA Bài toán: Đưa vào tập liệu siRNA gán nhãn, tập hợp quy tắc thiết kế siRNA, áp dụng phương pháp học máy để xây dựng mô hình dự báo đưa k ết dự báo khả ức chế siRNA Quy trình xây dựng mô hình dự báo để đưa kết dự đoán khả ức chế siRNA Hình 3.1 Hình 3.1: Quy trình xây dựng mô hình dự đoán khả ức chế siRNA Giải pháp giải việc xây dựng mô hình dự báo, nhiều kỹ thuật học máy áp dụng để dự đoán hiệu ức chế siRNA bảng 3.1 14 Bảng 3.1: Các phƣơng pháp học máy sử dụng xây dựng mô hình dự báo Chalk et al sử dụng tính chất nhiệt động học cách sử dụng hồi quy phần mềm BioJava Theo họ hệ số đánh giá siRNA gia tăng (0, 7) Huesken et al đề xuất mô hình dự báo, biểu tượng nhận biết siRNA hiệu không hoạt động phát mạng nơron nhân tạo (ANN) huấn luyện 2.182 siRNA thử nghiệm 249 siRNA với R= 0.66 Các chức BIOPREDsi phát triển số đặc trưng nhạy cảm ANN Bộ liệu họ sử dụng rộng rãi thử nghiệm mô hình hồi quy khác Qui đồng nghiệp sử dụng nhiều vector hỗ trợ hồi quy với đa nhân cho dự đoán hiệu siRNA với R=0.62 với liệu Huesken gồm 2431siRNA Đáng ý Sciabola et al [41] sử dụng phương pháp học máy véc tơ hỗ trợ hồi quy sử dụng cấu trúc ba chiều siRNA để tăng khả dự báo mô hình hồi quy (Hình 3.2) Hầu hết phương pháp bị số nhược điểm Mối tương quan giá trị dự báo giá trị thực nghiệm biến phụ thuộc khác nhau, từ 0, 60 tới 0, 68 giảm đáng kể thử nghiệm liệu độc lập.Bởi thực tế số liệu Huesken nhỏ để đại diện cho siRNA có khoảng 419 thể siRNA 15 Hình 3.2: Ví dụ sử dụng mô hình SVR dự đoán khả ức chế siRNA Ngoài việc thực phương pháp học máy phụ thuộc nhiều vào lựa chọn biểu diễn liệu (hoặc tính năng) áp dụng Đó lý nhiều nỗ lực thực tế việc triển khai thuật toán học máy vào việc tìm phương pháp biểu diễn hỗ trợ phương pháp học máy hiệu 3.2 Phƣơng pháp máy vecto hỗ trợ (SVM- Support vector machine) Máy véc tơ hỗ trợ SVM Trong thập kỷ gần đây, nghiên cứu gen di truyền phát triển có thành công định, đồng thời tạo khối lượng lớn liệu đa dạng gen sinh học Tuy nhiên, để khám phá khai thác thông tin quý giá liệu để hiểu hệ thống sinh học, ta phải cần đến phương pháp tính toán phức tạp với giải thuật tính toán xác hiệu Rất nhiều vấn đề quan trọng sinh học tính toán liên quan đến toán phân lớp hay dự báo như: Dự báo vị trí cắt-nối để tìm kiếm gen, dự báo cấu trúc gen, chức gen, tương tác, vai trò gen số loại bệnh tật v.v Một kỹ thuật tính toán tiếng cho toán phân lớp/dự báo cho độ xác cao sử dụng rộng rãi cộng đồng 16 nghiên cứu tin sinh học năm gần kỹ thuật phân lớp sử dụng máy vec-tơ hỗ trợ SVM, toán đoán nhận khả ức chế siRNA áp dụng (Hình 3.2) Với khả vượt trội SVM tính hiệu quả, độ xác, khả xử lý liệu cách linh hoạt, việc sử dụng máy vectơ hỗ trợ SVM lựa chọn tối ưu việc giải toán phân loại, dự báo số ngành khoa học nghiên cứu siRNA Đã có nhiều nhóm nghiên cứu dựa SVM để áp dụng tìm quy tắc thiết kế dự đoán siRNA 3.3 Phƣơng pháp dự đoán rừng ngẫu nhiên (Random Forest) Phân lớp liệu có số chiều lớn có nhiễu liệu gen biết 10 vấn đề khó cộng đồng khai phá liệu Mô hình học phân lớp thường cho kết tốt huấn luyện lại cho kết thấp dự báo Vấn đề khó khăn thường gặp số chiều lớn lên đến hàng nghìn chiều chí đến triệu liệu thường tách rời không gian có số chiều lớn việc tìm mô hình phân lớp tốt có khả làm việc với liệu có số chiều lớn khó khăn có nhiều khả lựa chọn mô hình Việc tìm mô hình phân lớp hiệu không gian giả thiết lớn vấn đề khó Phương pháp rừng ngẫu nhiên cho độ xác cao so sánh với thuật toán học có giám sát nay, bao gồm AdaBoost, ArcX4, SVM, ý tưởng giải thuật random forest: + Từ tập học LS có N phần tử + Xây dựng tập hợp T mô hình sở độc lập + Mô hình thứ i xây dựng tập mẫu bootstrap, - Tại nút trong, chọn ngẫu nhiên n’ thuộc tính (n’[...]... phƣơng pháp xây dựng mô hình dự đoán ức chế của siRNA Bài toán: Đưa vào tập dữ liệu siRNA được gán nhãn, và một tập hợp các quy tắc thiết kế siRNA, áp dụng các phương pháp học máy để xây dựng mô hình dự báo đưa ra k ết dự báo khả năng ức chế của siRNA Quy trình xây dựng các mô hình dự báo để đưa ra kết quả dự đoán khả năng ức chế của siRNA như Hình 3.1 Hình 3.1: Quy trình xây dựng mô hình dự đoán khả năng. .. được áp dụng kỹ thuật máy học thay thế để phát hiện quy tắc thiết kế siRNA và dự đoán hiệu quả ức của siRNA Luận văn tổng hợp nghiên cứu về bài toán siRNA để giúp chúng ta có cách nhìn tổng quan và áp dụng một cách phù hợp vào giải quyết bài toán nhằm xây dựng một số mô hình dự đoán khả thi, để đoán nhận khả năng ức chế của siRNA hỗ trợ cho việc điều chế thuốc Liên quan đến việc phát hiện các quy tắc... quả của 18 phương pháp đã được báo cáo (bảng 4.5) Kết quả đạt được ta thấy các phương pháp thử nghiệm với bộ dữ liệu được biểu diễn bằng cách chuyển sang ma trận với các phương pháp SVR, Linear Regression, Random Forest có kết quả cao hơn rất nhiều một số phương pháp khác Điều đó chứng tỏ kết quả phụ thuộc nhiều vào việc lựa chọn các phương pháp dự đoán và các phương pháp biểu diễn, với mỗi phương pháp. .. số phương pháp khác Tuy rằng luận văn mới dừng lại ở bước thực hiện thực nghiệm trên các phương pháp đưa ra, nhưng kết quả mang lại cũng có những ý nghĩa nhất định giúp các nhóm nghiên cứu khác có nhìn tổng quan về việc sử dụng các mô hình học máy để đoán nhận khả năng ức chế siRNA Trong quá trình thực hiện luận văn này tôi đã cố gắng tập trung nghiên cứu bài toán dự đoán khả năng ức chế của siRNA và. .. tục tìm ra các quy tắc thiết kế siRNA tốt hơn, đồng thời tìm ra các đặc điểm quan trọng của siRNA ảnh hưởng đến hiệu quả ức chế Trong quá trình nghiên cứu tìm kiếm quy tắc siRNA hiệu quả cao thì các nhà khoa học cũng đồng thời sử dụng các phương pháp học máy để xây dựng các mô hình dự đoán khả năng ức chế gen của siRNA 12 2.4 Kết luận Như vậy là để tạo siRNA có hiệu quả cao trong cả hai cách tiếp cận... kiếm gen, dự báo cấu trúc gen, chức năng của gen, sự tương tác, và vai trò của gen trong một số loại bệnh tật v.v Một trong những kỹ thuật tính toán nổi tiếng cho bài toán phân lớp /dự báo cho độ chính xác cao và được sử dụng rộng rãi trong cộng đồng 16 nghiên cứu tin sinh học trong những năm gần đây là kỹ thuật phân lớp sử dụng máy vec-tơ hỗ trợ SVM, và trong bài toán đoán nhận khả năng ức chế siRNA cũng... vấn đề siRNA hiệu quả, có rất nhiều các phương pháp trong cả hai hướng tiếp cận sinh học và sinh học tính toán được đưa ra Một số đặc điểm mới của siRNA ảnh hưởng đến hiệu quả của ức chế siRNA đã được phát hiện, những phương pháp này đã được trình bày trong chương 2 Việc giải quyết bài toán siRNA không chỉ nhằm tìm kiếm các quy tắc thiết kế tạo ra các siRNA hiệu quả các nhà khoa học còn tập trung vào. .. vào 25 việc xây dựng các mô hình học máy để dự đoán khả năng ức chế của siRNA Đã có rất nhiều các phương pháp học máy được đưa ra, với nhiều kết quả thử nghiệm khác nhau đã được trình bày trong chương 3 Trong chương này cũng trình bày một phương pháp biểu diễn để áp dụng cho phần thực nghiệm Kết quả chạy thực nghiệm đã chứng minh được rằng lựa chọn các phương pháp thực nghiệm và phương pháp biểu diễn... mô hình dự đoán khả năng ức chế của siRNA Giải pháp giải quyết việc xây dựng mô hình dự báo, nhiều kỹ thuật học máy đã được áp dụng để dự đoán hiệu quả ức chế siRNA như bảng 3.1 14 Bảng 3.1: Các phƣơng pháp học máy sử dụng xây dựng mô hình dự báo Chalk et al sử dụng tính chất nhiệt động học bằng cách sử dụng cây hồi quy trong phần mềm BioJava Theo họ hệ số đánh giá của một siRNA được gia tăng là (0,... áp dụng (Hình 3.2) Với khả năng vượt trội của SVM về tính hiệu quả, độ chính xác, khả năng xử lý các bộ dữ liệu một cách linh hoạt, việc sử dụng máy vectơ hỗ trợ SVM đã và đang là sự lựa chọn tối ưu nhất trong việc giải quyết các bài toán phân loại, dự báo trong một số các ngành khoa học và trong nghiên cứu siRNA Đã có rất nhiều nhóm nghiên cứu dựa trên SVM để áp dụng tìm ra các quy tắc thiết kế dự đoán

Ngày đăng: 14/09/2016, 23:07

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan