1. Trang chủ
  2. » Công Nghệ Thông Tin

Dự đoán cấu trúc bậc hai RNA bằng sự kết hợp thuật toán di truyền và logic mờ

10 28 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 614,92 KB

Nội dung

Bài viết giới thiệu sự kết hợp giữa thuật toán GA với logic mờ (Fuzzy Logic). Từ thuật toán kết hợp này chúng tôi áp dụng cho bài toán dự đoán cấu trúc bậc hai của các phân tử RNA (Ribonucleic Acid). Bài toán dự đoán cấu trúc bậc hai mà chúng tôi đề cập dựa trên phương pháp nhiệt động lực học, với việc tìm cấu trúc bậc hai có năng lượng cực tiểu.

Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00015 DỰ ĐOÁN CẤU TRÚC BẬC HAI RNA BẰNG SỰ KẾT HỢP THUẬT TỐN DI TRUYỀN VÀ LOGIC MỜ Đồn Duy Bình1, Phạm Minh Tuấn2, Đặng Đức Long3, Nguyễn Hữu Danh2 Khoa Tin học, Trường Đại học Sư phạm, Đại học Đà Nẵng Khoa Công nghệ thông tin, Trường Đại học Bách khoa, Đại học Đà Nẵng Viện Nghiên cứu Giáo dục Việt Anh, Đại học Đà Nẵng doanduybinh@gmail.com, pmtuan@dut.udn.vn, long.dang@vnuk.edu.vn, danh.nghuu@gmail.com TÓM TẮT: Trong báo này, chúng tơi giới thiệu kết hợp thuật tốn GA với logic mờ (Fuzzy Logic) Từ thuật toán kết hợp chúng tơi áp dụng cho tốn dự đoán cấu trúc bậc hai phân tử RNA (Ribonucleic Acid) Bài toán dự đoán cấu trúc bậc hai mà đề cập dựa phương pháp nhiệt động lực học, với việc tìm cấu trúc bậc hai có lượng cực tiếu Với kết cấu trúc tìm thuật tốn kết hợp mà chúng tơi giới thiệu, chúng tơi hy vọng đóng góp vào kho liệu sinh học phân từ, phục vụ cho nghiên cứu ngành sinh học phân tử Đồng thời giới thiệu cách tiếp cận thuật tốn di truyền Từ khóa: RNA; Thuật toán di truyền; Logic mờ; Cấu trúc bậc hai; Dự đoán; I GIỚI THIỆU RNA chuỗi nucleotide đơn bao gồm adenine (A), guanine (G), cytosine (C) uracil (U) tự gấp lại để tạo thành cấu trúc bậc hai với cặp base A ≡ U, G = C, G - U Có nhiều dạng RNA khác tìm thấy: RNA nhân không đồng (hnRNA), RNA thông tin (mRNA), RNA vận chuyển (tRNA), RNA ribosome (rRNA) RNA nhân nhỏ Về mặt cấu trúc, hnRNA mRNA hai sợi đơn, rRNA tRNA hình thành cấu hình phân tử ba chiều Mỗi loại RNA có vai trị khác q trình tế bào khác mang thơng tin di truyền (mRNA), dịch mã (rRNA) chuyển mã di truyền (tRNA) Mỗi chuỗi RNA, gấp lại để hình thành số cấu trúc bậc hai bậc hai xảy Xác định cấu trúc bậc hai xác gọi tốn dự đốn cấu trúc bậc hai [1] Các phương pháp vật lý để xác định cấu trúc RNA, chẳng hạn tia X, tinh thể quang phổ cộng hưởng từ hạt nhân (Nuclear Magnetic Resonance - NMR) khó khăn, dễ bị lỗi, tốn thời gian, tốn chi phí số trường hợp không khả thi [2] Do đó, phương pháp tính tốn phương án thay thích hợp để dự đốn cấu trúc bậc hai phân tử RNA Hiên nay, phương pháp dự đốn cấu trúc RNA tính tốn chủ yếu tập trung vào dự đoán cấu trúc bậc hai RNA - tập hợp cặp base hình thành phân tử RNA gấp lại Cấu trúc ba chiều ARN, xác định tọa độ nguyên tử, gọi cấu trúc bậc ba Mặc dù khó khăn, có cách tiếp cận để dự đoán cấu trúc bậc ba RNA [3], [4] Dự đoán cấu trúc bậc hai RNA dễ cấu trúc bậc ba cấu trúc bậc hai RNA làm sáng tỏ cấu trúc bậc ba RNA Hai phương pháp tính tốn khác tồn cho dự đốn cấu trúc bậc RNA là: Phương pháp so sánh Tối ưu hóa nhiệt động lực học Kể từ RNA gấp lại tùy thuộc vào luật nhiệt động lực học, có giả định cấu trúc xác cấu trúc lượng thấp Sự ổn định cấu trúc bậc hai phụ thuộc vào lượng lượng tự giải phóng để tạo thành cặp base Do đó, lượng tự cấu trúc tiêu cực, chuỗi đặc biệt ổn định hình thành Cấu trúc gọi cấu trúc bậc hai lượng tự tối thiểu (MFE) [5] Trong trường hợp có chuỗi phân tử RNA biết, phương pháp ab initio sử dụng để thực dự đoán cấu trúc bậc hai RNA tốn cực hiểu hóa lượng thơng qua việc sử dụng mơ hình nhiệt động lực học Những phương pháp hai quy hoạch động metaheuristics Thuật toán áp dung cho Mfold RNAfold thuật toán quy hoạch động cho dự đoán cấu trúc bậc hai RNA dựa việc tìm lượng tự tối thiểu Thuật toán quy hoạch động kỹ thuật tốn học đạt tối ưu tồn cục tốn nhỏ Nhưng tốn thực tế, có số nhược điểm Ví dụ, số lượng biến tăng lên, số lượng đánh giá hàm đệ quy tăng theo cấp số nhân Đối với toán dự đoán cấu trúc bậc hai RNA, số lượng lớn phương án cấu trúc làm cho khó xác định xác Ngồi ra, thuật tốn dự đoán cấu trúc lượng tự tối thiểu, cấu trúc tự nhiên thường có lượng tự khoảng 5-10 % từ lượng tự tối thiểu chuỗi Mặt khác, nhiều thuật metaheuristics đề xuất thuật toán di truyền; RnaPredict [6] -Mơ luyện kim; SARNA-Predict - Tối ưu hóa bầy đàn; HelixPSO [7] thuật tốn tìm kiếm Harmony; HSRNAFold [8] Các thuật toán tạo vector cấu trúc thay cấu trúc lượng tự tối thiểu Đối với dự đoán cấu trúc bậc hai, thuật tốn di truyền thực tế giải vấn đề kích thước lớn Trong báo này, giải toán dự đoán cấu trúc bậc hai RNA sử dụng thuật tốn di Đồn Đ Duy Bình, Phạm Minh T Tuấn, Đặng Đứcc Long, Nguyễn n Hữu Danh 111 trruyền lạại với logic mờ Kết thử nghiệm cho o thấy vớới thuật tốn ddi truyền chúng tơi có mộột cải tiến lớn lên thhuật toán truyềền thống Hình M Mơ hình mà chúng tơi sử dụng t nghiên cứứu Bài báoo chhúng tơi trình bày vấấn đề sau: giớ ới thiệu bàii toán dự đoán án cấu trúc bậc c hai RNA đ thể phần II, phần III giớii thiệu thuậật toán di truy yền, mục IV ggiới thiệu loogic mờ giới thiệu kết k hợp thuật toán t di truyềnn với logic mờ Phần V VI kết thhực nghiệm kkhi triển khai thuật toán, đánh đ giá kếết luận III DỰ ĐOÁN N TRÚC BẬC C HAI RNA 2.1 Cấu trúc bậc hai Các phân tử RNA đư ược mô tả đặặc điểm m chuỗi bốn loại ribonnucleotide hooặc base e: Adenine (A), Cytosine (C), Guaninee (G) Uraciil (U) Một ch huỗi tuyến tín nh base củủa sợi RNA ttạo thành cấu trúc h chuỗi Dư ưới mà số khái niệm m làm sáng tỏ ỏ chuỗi RN NA cấu trúc bậc hai RNA A sau: a) Mộtt chuỗi RNA A có chiều ddài n ribo onucleotide làà chuỗi x    ,  ,  …,  , g ∈ , C, G, U, ∀ ∈ 1, … , n b) Tronng cấu trúúc bậc hai củaa RNA, cặặp base hình h thành m ba ccặp sau: C-G C (G-C), A-U A (U-A) G-U (U-G) C Các cặp base {(A-U), (U A), (C-G), (G G-C)} gọi ccác cặp Watsoon-Crick cặp base b tắcc Cặp base {((G-U), (U-G)}} gọi cặp base không bền vững (W Wobble) Sự ổnn định cá ác cặp base đ cho mối m quan hệ saau đây: C-G> > A-U ≥ G-U [9], [10] Hình Các cặp base chíính tắc c) Vớii , biiểu diễn cho ccặp base hình thành basse vị trí thứ ứ i và base vị trí thứ j, sa ao cho tập ∈ Y , ,1 t bậc hai RNA R y thỏỏa mãn điềều kiện sau: gọi cấu trúc  ,  llà cặp basse tắc;  Cho , ∈ ,  Nếu , ∈ , , ∈ , ; 3;  Mỗi base b ghép ccặp với vàà base khác cấ ấu trúc d) Chúúng ta ggọi hai cặp basse   và ( , ^ ^′ , , tương thíích nếu:  (chúúng cặp base);   , ^′ trước , ) hoặc;   ├ , ┤ bao ggồm , ); e) Cấuu trúc bậc hai RNA khơng ccó nút thắtt (pseudoknot free, Hình 3.)) y tương ứngg với chuỗi RN NA x có độ dài d n là cấu trúúc bậc hai RN NA bbất kỳ hai cặp base , , , chúngg lồồng nhau, tức i 112 DỰ ĐOÁN N CẤU TRÚC BẬC HAI RNA A BẰNG SỰ KẾT K HỢP THUẬ ẬT TOÁN DI T TRUYỀN VÀ LOGIC L MỜ j, làà liên tiếp nhauu, tức i i j Ở giả định mà kkhông tínnh tổng qt r i   j, Hình Cấu trú úc RNA khơng có nút thắt 2.2 Bài toán dự d đoán cấu ttrúc bậc hai R RNA Bài toánn dự đoán cấuu trúc bậc hai R RNA đ trình bày sau:  Cho: chuỗi RN NA có độ dài , với   lượng tự [11] t phát triểnn thuật toáán  Mục tiêu:   ,  , ,  … ,   , ∈ , , , , ∀ ∈ 1, … , v mơ hình trả ả nhiều n cấu trúcc bậc hai tươ ơng ứng với ch huỗi Phươngg pháp phổ bbiến để có đư ược cấu trúc bậc b hai tìm m cấu trúc có mức nănng lượng tự cực tiếu (minimum freee energy - MF FE) y chuỗi RN NA cho theo mô hì hình lượnng Cách tiếp cận dựa d giả địịnh pphân tử RNA có khuynh hư ướng gấp vào cấu hình nnăng lượng tự ự cực tiểu chúng, đ thể qua công thứcc sau: ∈ arg g ∈ ∆ , , (1) Trong đ biểu thị m tập tất cấu bậc hai h chuỗi , ∆ llà hàm lư ượng cho phép đo độ ổn định đ cấu trrúc arg n ∈ ∆ bbiểu thị cho năăng lượng mà ∆ llà cực tiểu Một mơơ hình lư ượng tự RN NA cấu u trúc lý thuyếết miêu tả choo quy tắc vvà biến tù ùy theo chuỗi c RNA nàào mà hình thàành nên ccấu trúc bậc haai tương ứng Chúng tơi xeem xét mơơ hình lư ượng tự RNA R có ba thàành phần chínnh: Một M tập hợp ccác cấu trúc thhành phần , , … , , tro ong sốố cấu trúc thànnh phần cấ ấu trúc bậc h RNA Mộột cấu trúc thàành phần mộ hai ột đoạn cấu trrúc bậc hai RN NA có nhiệt đđộng lực học đ coi q quan trọng chho việc tạo thàn ành cấu trúc bậậc hai RNA Một M tập hợp ccác tham số năăng lượng tự d , ,…, với tham số lượngg tự c trúc thànhh phần Thaam số đôi kh cấu hi ký hiệệu ∆ Một M hàm năngg lượng tự xác định tính ổn định nhiệtt động lực họcc chuỗỗi c trúc bậc hhai cụ thể phhù hợp với cấu gấp thành Hầu hếtt mơ hình cho dự đốn cấu trúc bậc hai h giả định rằằng hàm lượng tự ccủa chuỗi tuyến tính trrong mơ hình lượng , có dạng: ∆ Trong đ phần p , ≔ , ,…, cấu c trúc bậc hhai ≔∑ , , , , ⊺ biểuu thị véc tơ củ giá trị th ham số chuỗi , : , Các cấuu trúc thành phhần cấu trrúc bậc hai RN NA bao gồm: ,…, cấu trúc (2) , , tươn ng ứng với , lần xuấtt cấu trúc thành biểu thị véc tơơ số lượng g đặc điểm Đoàn Đ Duy Bình, Phạm Minh T Tuấn, Đặng Đứcc Long, Nguyễn n Hữu Danh 113 Hình Cấu trúc t thành phần RNA Năng lư ượng cấuu trúc bậc hai trrong cấu trúc bậc hai sau: o o o o o chuỗi năn ng lượng đónng góp cácc cấu trúc thành phần Vịng kẹp tóóc (Hairpin Looop): , ; , Xếp chồng ((Stack): , , ; Vòng bên trrong (Internal loop): , , ’, ’ ; , ; Vòng lồi (Bulge): Vòng nhiều nhánh (MultiiLoop): , , , , , ; Năng lư ượng eM đượcc tính sauu: trrong đó: ’ , , trọng số, với: lượng g cặp basee đóng vịng; số lượng xoắn (helices); ’ số lượng baase không ghéép cặp vvòng; , lượn ng tưng ứng với v ’ (3) T TOÁ ÁN DI TRUYỀ ỀN TRONG BÀI TOÁN DỰ D ĐOÁN C CẤU TRÚC B BẬC HAI RNA III THUẬT 3.1 Giới thiệu u Thuật tốn t di truyền (GA) kỹ thhuật tìm kiếm ngẫu nhiên to oàn cục với viiệc giả lập cácc quy luật tiến n hóa di trruyền học để cố gắng tìm rra giải pháp tốối ưu cho tốn tối ưu hó óa phức tạp G GA đạt vvề mặt lý thuy yết thực nghiệm n đượ ợc chứng minhh nhằm cung cấp cho việc tìm kiếm mạn nh mẽ khhơng gian phứ ức tạp chún ng áp dụng d rộng rãi t kỹ thuậtt, kinh doanh vvà khoa học Thuật tốn di truyền mơ tả nhhư sau: Bước 1: Khởi tạo qu uần thể; Bước 2: Đánh giá, n đủ tốt kết k thúc; Bước 3: Chọn lọc; Bước 4: Lai ghép; Bước 5: Đột biến; Bước 6: Quay lại bư ước 2; Sơ đồ thhuật tốn: Hình Thuật T tốn di trruyền 114 DỰ ĐOÁN N CẤU TRÚC BẬC HAI RNA A BẰNG SỰ KẾT K HỢP THUẬ ẬT TOÁN DI T TRUYỀN VÀ LOGIC L MỜ 3.2 Các bướcc xây dựng th huật toán di trruyền cho toán 1 Bước 1: Cách đơn giản áp dụng thuậtt toán di truyềền đơn cho bàài toán dự đoáán cấu trúc bậậc hai bướ ớc khởi tạo quần q thể ta chọọn ngẫu nhiênn ∈ S Sau tạo cấu u trúc cáách sử dụng cáác cặp ngoặc ““(“ , “)” dấ ấu “.”, cách tạo sau: ứnng với cặp “(““ “)” liênn kết cặp c base h tắc (II.A), dấấu chấm biểu thị base không k ghép g cặp Ví dụ: 2 Bước 2: g nghiệm m Đánh giá dựa vào năăng lượng đ định ngh hĩa (công thứcc 2); 3 Bước 3: p với tỷ lệ 70 %, nghiệm có mứ ức lượng g cao bị Lựa chọọn nghiệnn có mực nănng lượng thấp loại bỏ, sau đóó bổ suung nghiệệm sau lai ghép bư ước 4 Bước 4: Quá trìnnh lại ghéo ơn giản cách sử dụng g lai ghép đồn ng l ghép đđiểm Tuy nhiiên việc lại ghép g gây r tình trạng pphá vỡ cấu trúc định nghĩa n Ví dụ có thểể sinh nnghiệm có ó ngoặc mở “(“ “ khơơng có ngoặc đđóng “)” hoặcc ngược lại ho oặc có dấu chấm “.”” Vấn đề nhóm tác giả khắc phục b cách áp dụng d logic mờ ờ, trình bày phần tiếp th heo 5 Bước 5: Đột biếến, tương tự nhhư lai ghép nóó sinh raa cấu trú úc không phùù hợp đđịnh nghĩa Trrong khn khổ k báo nàày nhóm tác ggiả chưa trìình bày phươn ng pháp áp dụ ụng logic mờ Chúng tơi sẽẽ trình bày tro ong báo b IV LOGIC MỜ Ờ 4.1 Giới thiệu u Mơ hìnnh hệ thống Fuuzzy Logic (FL) mơ hình h dựa tri thức t với qquy tắc ngôn nngữ Tập mờ đ mô tả cho c tất biến đầu vàoo đầu vàà tập luật Log gic mờ đảm bảảo phươnng tiện để xử llý kiến thức n tính tốn giá trrị đầu cho ccác liệu đầầu vào địn nh Vấn đề ch hính cách tiếp cận llà tìm quy tắc ngơn n ngữ phù hợp để xác đđịnh hệ thốngg mô phỏ ỏng [12] Hệ thống mờ đượợc biểu diễn theo quy tắc if-then h câu lệnh l có điều kkiện mờ ttrong biểu thứ ức dạng IF F A THEN B,, A vvà B nhãn c tập mờ m Tập hợp c quy tắc nêên hoànn thành cun ng cấp câu u trả lời cho m giá trị đầầu vào Một số ố đặc điểm quan q củaa FL là:  Kết luận rõ ràng rrút từ hệ thố ống phức tạp tạo mơ hồ, không rõ rànng, thông g tin khơng chínnh xác,  Lý luận l xácc xem nhhư trườ ờng hợp giới hạn h lý luậnn gần đúng,  Bất kỳ hệ thống llogic cũngg mờ Một hệ thống suy luậận mờ (FIS), nnhư thấy y sử dụn ng hàm thàành viên để “llàm mờ” liệu đầu vào v sau áp dụụng tập hhợp quy tắắc cho liệu mờ Hình Sơ đồ logic l mờ Trong nghiên n cứu nàày, nhóm tác ggiả tập trung ứng ứ dụng logic mờ để giải qquyết toánn lai ghép trình trrên Trong việệc lại ghéo mộột điểm có thểể dẫn đến kết qua khơng nh hư kỳ vọng có tượngg phá vỡ cấu trúc, Đồn Đ Duy Bình, Phạm Minh T Tuấn, Đặng Đứcc Long, Nguyễn n Hữu Danh 115 việc v trao đổi cấu c trúc có thểể thực bằnng điểm mờ Có C nghĩa mặc m dù hoán đỗỗi điểm m nhữn ng vị trí xa điểm đ lại ghép t xác suất táái lại ghép điểm điểm th hông thường Cách thhể lai ghéép điểm nnhư sau: Trước T lai ghép g Sau lai gh hép Các conn sinh raa trìnnh lai ghép đư ược thể sau: ẹ , , θ((i) ≥ ẹ , , θ((i) < Trong đó: đ 1, 0, 1, 1, (4) 4.2 Lai ghép thuật toán dii truyền loogic mờ Lợi ích thuuật tốn di truyyền có th hể sử dụ ụng để tìm cácc giá trị ttối ưu hóa từ khơng k gian tìm kiếm lớn c làm cho hệ thống học hỏ ỏi Đồng thời, hạn chế chínhh thuật tốán di truyền khơng có c khả lư ưu trữ kiến thhức miền nhưnng GA có thểể sử dụn ng để tìm giá ttrị tối ưu cho tham số hàm thành viên, v đặc biệt chọn lọc tthủ công ggiá trị úng trở nên kh hó khăn nhiềều thời gian để ể đạt Để Đ xử lý thơngg tin nêuu khơng xác, cách tiếp p cận định mờ đđược sử dụng Thực hiiện điểm mờ ttrong lai ghép thể n sau: Lai gh hép có điểm mờ m Việc tạo y y thực hiiện ngẫu nhiên n nhiều lần vàà chọn y Sờ S đồ thuật tốán di truyền cóó kết hợp với logic mờ có mức nnăng lượng thấ ấp 116 DỰ ĐOÁN N CẤU TRÚC BẬC HAI RNA A BẰNG SỰ KẾT K HỢP THUẬ ẬT TOÁN DI T TRUYỀN VÀ LOGIC L MỜ Hình h Thuật toán di truyền kết hợ ợp với logic mờờ V KẾT QUẢ VÀ ĐÁN NH GIÁ 5.1 Kết 1 Các thông số ban củaa thuật toán: _OF\_INDIVIIDUAL = 1000000; static intt AMOUNT\_ stattic List popullation = new; ArrayLiist(); static Double D Pc = 0.7; static Double D Pm = 0.3; sttatic float besstFreeEnergiees = 99999; stattic int position nOfBestFreeE Energies = 0;; 2 Các chuỗi đầu đ vào, kết qquả so sánhh Đồn Đ Duy Bình, Phạm Minh T Tuấn, Đặng Đứcc Long, Nguyễn n Hữu Danh 117 a) a E.Coli 221 Bases  Thôngg tin chuỗi B Bảng Thông g tin chuỗi E.Co oli 221 Bases Tên chuỗi E.C Coli 221 B Bases Thông tin Chuỗi ACAUG GGGGAUAAGG GGCAGGCGG G UGAAU UGCCUUGGCU UCUCGGAGG G dbE EST Id: 788664696 CGAAG GAAGGACGUG GAUAAGCUG G ES ST name: CFSW WEC38 AAGCCCGGCG GUAGGCGCA CGAUA GCCGUUAAUA ACCGGGGUU U AAUAG GeenBank Acc: JZ Z515411 UCCGAA AUGGGGCAA ACCCGCCGG GeenBank gi: 5577806034 GAGUA AAUUCCGGCA AUCUCUUGA A AAGAG GGGAGGCGAA ACGUGGGGA A LIB BRARY ACUGA AAACAUCUCA AGUACCUGC Libb Name: LIB BEST_027994 Immune respon nses AGGAA AAAAAAAAAA AAAAAAAAA A of Coptotermees formosanus Shiraki workerrs A against Escherichia coli ENTIFIERS IDE Orrganism: Orrgan: Cooptotermes form mosanus wholle body  Kết quuả so sánh Bảng Kếết so sán nh việc áp dụng d hai thuật ttoán GA Thuật toán di truyềền Năng lượ ợng Cấu trúc Beest freee Eneerg y: 23.7 (((( ((((( ((((((( ((( ))) )))))))) .)))))) .)))) Thuật to oán di truyền n kết hợp với logic mờ Năng lượng Best free Energy: 31.9 Cấu trúc (((((((((.((( ))) (((((((( ) )))) ))).))))))))) ((((( .( (((( ))))).)))))) b) b Bmori 219 Bases  Thôngg tin chuỗi Tên n chuỗi Bm mori 219 B Bases B Bảng Thông g tin chuỗi Bmori 219 Bases Thông tin t ENTIFIERS IDE dbbEST Id: 455323636 ES ST name: E EST0213 GenBank Acc: E EL928597 GenBank gi: 1333905746 LIBRARY Lib Name: LIB BEST_020979 ARS-CICGRU A ONmgEST O Orgganism: Ostrrinia nubilalis Straain: bivoltinne Z-pheromon ne strain Sex: male and ffemale midguut Orggan: Devvelop stage: 4thh and 5th instar larvae Lab host: XL1 Blue Veector: pDN NRLIB Ch huỗi A ACCACGGCA AUGUGCAAC G GGUGACUCC CGGCAGCGC U UCUAGUCCG GCCUGGACC G GCGGCACCC CAGAUCGGA A AUCGUGUCG GUGGGGCUU U C CCCCUGCGC CCCGCGGCGC C U UCCCGAUAU UGUUCGUCC G GAGUCAGCG GCCUUCCAA G GACUGGGUC CGCCCGCCAC C U UUCGUUGCU UUGAAUAAA A U UGACUUGAU UAUGAUCGU U C CAAAAAAAA AAAAAAAAA A A AAAAAAAAA AAAAA 118 DỰ ĐOÁN N CẤU TRÚC BẬC HAI RNA A BẰNG SỰ KẾT K HỢP THUẬ ẬT TOÁN DI T TRUYỀN VÀ LOGIC L MỜ  Kết quuả so sánh Bảng Kếết so sán nh việc áp dụng d hai thuật ttoán GA Thuậật toán di truyyền Năăng lượ ợng Beest freee Eneergy : -25.8 Cấu trú úc (((((((( (((((( ((( ((((((.((((( .))))))))) ).))) )))))) .)))))))) Thuật toán di truyềền kết hợp vớ ới logic mờ Năng lượng Cấu trúc Best free Energy : ((((( ((( ))) )))).((( ((((((((((( ))))))))))) .(((((( ))).))) ))) -34.6 c) c LSU 98 Baases  Thôngg tin chuỗi Bảng Thôn ng tin chuỗi LSU U 98 Bases Tên n chuỗi L LSU 98 B Bases Thông tin Chuỗii AAAUACUCCU UGGGUGACC C GACUA GAUAG GCGAAAUAG GUACCGUGAG G GGAAA AGGUGAAAA AGAACCCCCA A UCGGG GGAGUGAAA AAAAAAAAAA A AAAAA AAAAAA IDEN NTIFIERS dbES ST Id: 402663335 EST T name: MVE000001399 GenB Bank Acc: GenB Bank gi: Dataabase: EC C731497 1100045614 TBesstDB LIBR RARY Libb Name: LIIBEST_019927 Mesostigma viiride R Regular library Orgganism: Mesostigma viridee  Kết quuả so sánh Bảng Kếết so sán nh việc áp dụng d hai thuật ttoán GA Thuậtt toán di truyyền Thuật toán di truyềền kết hợp vớ ới logic mờ N Năng lượng Cấấu trúc Năng g lượng Cấu u trúc Bestt free Energy: (((((((.(((( (( ((( ))))) )))).)))) )))) Best freee Energy: (((((((.((((( ) ))) ((( (((( .)))))) ))) ))))) -16.2 -17.5 Đồn Duy Bình, Phạm Minh Tuấn, Đặng Đức Long, Nguyễn Hữu Danh 119 VI KẾT LUẬN Với kết thực nghiệm cho thấy thuật toán di truyền kết hợp với logic mờ cho cấu trúc tốt so với thuật toán di truyền túy Tuy nhiên chưa đạt đến mức độ tối ưu cho cấu trúc bậc hai RNA kỳ vọng Khi ghép thuật toán di truyền với logic mờ cho phép áp dụng dự đoán cấu trúc bậc hai RNA cho kết tốt Trong mơ hình nhiệt động học đơn giản thuật tốn di truyền tính tốn lượng tự cấu trúc thực tốt áp dụng DPA với mơ hình nhiệt động học phức tạp Đặc biệt với việc sử dụng thuật toán di truyền ghép với logic mờ việc tìm cấu trúc bậc hai tối ưu tốt Chúng xây dựng hàm mờ tập mờ ghép với thuật toán di truyền để áp dụng cho toán dự đoán cấu trúc bậc hai RNA đạt cấu trúc tối ưu VII TÀI LIỆU THAM KHẢO [1] M Zuker and D Sankoff Rna secondary structures and their prediction Bulletin of Mathematical Biology, 46(4):591-621, 1984 [2] B Felden Rna structure: experimental analysis Current Opinion in Microbiology, 10(3):286-291, 2007 [3] S Cao, S J Chen Physics-based de novo prediction of rna 3d structures Journal of Molecular Biology, 115(14):4216-4226, 2011 [4] M Parisien, F Major The mc-fold and mc-sym pipeline infers rna structure from sequence data Nature, 452(7183):51-55, 2008 [5] D M Layton, R Bundschuh A statistical analysis of rna folding algorithms through thermodynamic parameter perturbation Nucleic Acids Research, 33(2):519-524, 2005 [6] K C Wiese, A A Deschenes, A G Hendriks Rnapredict_an evolutionary algorithm for rna secondary structure prediction IEEE/ACM Transactions on Computational Biology and Bioinformatics, 5(1):24-41, 2007 [7] M Geis, M Middendorf A particle swarm optimizer for finding minimum free energy rna secondary structures Swarm Intelligence Symposium, 2007 SIS 2007 IEEE, pages 1-8, 2007 [8] A M Mohsen, A T Khader, D Ramachandram Hsrnafold: A harmony search algorithm for rna secondary structure prediction based on minimum free energy Innovations in Information Technology, 2008 IIT 2008, pages 11-15, 2008 [9] M Zuker and P Stiegler Optimal Computer Folding of Large RNA Sequences Using Thermodynamics and Auxiliary Information Nucleic Acids Research, 9:133-148, 1981 [10] M Zuker On Finding All Suboptimal Foldings of an RNA Molecule Science, 244(4900):48-52, 1989 [11] Ingo Müller A History of Thermodynamics - the Doctrine of Energy and Entropy Springer, 2007 [12] Seref Inal Sakir Tasdemir, Abdullah Urkmez Determination of body measurements on the holstein cows using digital image analysis and estimation of live weight with regression analysis Computers and Electronics in Agriculture, 76(2):189-197, 2011 RNA SECONDARY STRUCTURE PREDICTION BY A COMBINATION OF GENETIC ALGORITHM WITH FUZZY LOGIC Doan Duy Binh, Pham Minh Tuan, Dang Duc Long, Nguyen Huu Danh ABSTRACT: In this pape we introduce a hybrid Algorithm Genetic with Fuzzy Logic From this hybrid algorithm we apply the problem of predicting the second-ary structure of Ribonucleic Acid Problem predicted secondary structure that we mentioned methods based on thermodynamics, to find secondary structure with minimum energy With the results of the algorithms found by the hybrid algorithm we introduce, we hope to contribute to the molecular biology data warehouse for molecular biology research It also introduces a new approach to genetic algorithms ... logic mờ có mức nnăng lượng thấ ấp 116 DỰ ĐOÁN N CẤU TRÚC BẬC HAI RNA A BẰNG SỰ KẾT K HỢP THUẬ ẬT TOÁN DI T TRUYỀN VÀ LOGIC L MỜ Hình h Thuật tốn di truyền kết hợ ợp với logic mờ? ?? V KẾT QUẢ VÀ... dụng thuật toán di truyền ghép với logic mờ việc tìm cấu trúc bậc hai tối ưu tốt Chúng xây dựng hàm mờ tập mờ ghép với thuật toán di truyền để áp dụng cho toán dự đoán cấu trúc bậc hai RNA đạt cấu. .. AAAAA 118 DỰ ĐOÁN N CẤU TRÚC BẬC HAI RNA A BẰNG SỰ KẾT K HỢP THUẬ ẬT TOÁN DI T TRUYỀN VÀ LOGIC L MỜ  Kết quuả so sánh Bảng Kếết so sán nh việc áp dụng d hai thuật ttoán GA Thuậật toán di truyyền

Ngày đăng: 30/09/2021, 15:30

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w