Bài viết trình bày các kết quả nghiên cứu về việc sử dụng thuật toán ACO (Ant Colony Optimization) đã cải tiến để dự đoán cấu trúc bậc hai RNA, đồng thời đưa ra hướng nghiên cứu tiếp theo cần giải quyết.
UED Journal of Sciences, Humanities & Education – ISSN 1859 - 4603 TẠP CHÍ KHOA HỌC XÃ HỘI, NHÂN VĂN VÀ GIÁO DỤC Nhận bài: 21 – 09 – 2015 Chấp nhận đăng: 30 – 11– 2015 http://jshe.ued.udn.vn/ SỬ DỤNG KỸ THUẬT TÍNH TỐN MỀM DỰ ĐỐN CẤU TRÚC BẬC HAI CỦA RNA Đồn Duy Bình Tóm tắt: Dự đốn cấu trúc RNA đóng vai trị quan trọng nghiên cứu qúa trình tế bào Nhiều thuật toán phát triển hai thập kỷ qua để dự đoán cấu trúc chuỗi RNA biết trình tự xếp nucleotide, đến cịn nhiều vấn đề tồn Phương pháp tiếp cận toán mềm nhận quan tâm nhà khoa học việc giải trường hợp phức tạp chủ đề Ở đây, mô tả khái niện RNA yếu tố khác biệt cấu trúc, số kỹ thuật tính tốn mềm phát triển để dự đoán cấu trúc bậc hai RNA Trong báo này, chúng tơi trình bày kết nghiên cứu việc sử dụng thuật toán ACO (Ant Colony Optimization) cải tiến để dự đoán cấu trúc bậc hai RNA, đồng thời đưa hướng nghiên cứu cần giải Từ khóa: Cấu trúc RNA; axit ribonucleic; q trình tế bào; thuật tốn tối ưu đàn kiến; tính tốn mềm Đặt vấn đề Trong suốt vài thập kỷ qua, việc xác định cấu trúc RNA đóng vai trị quan trọng, sở cho việc tìm hiểu bệnh di truyền tìm loại thuốc [1] Bài tốn dự đoán cấu trúc bậc hai RNA vấn đề quan trọng lĩnh vực nghiên cứu sinh học phân tử Phương pháp nhiễu xạ tia X sử dụng để xác định trực tiếp cấu trúc bậc hai RNA Tuy nhiên, phương pháp khó thực hiện, tốn nhiều thời gian giá thành cao Vì vậy, việc phát triển phương pháp tốn học để tính tốn, dự đốn cấu trúc bậc RNA cần thiết Bài viết đưa nhìn tổng quan định kỹ thuật tính tốn mềm dựa kỹ thuật phát triển năm qua cho toán dự đoán cấu trúc bậc hai RNA Đầu tiên, mô tả vấn đề bản, liên quan đến sinh học với cơng việc dự đốn cấu trúc Tiếp * Liên hệ tác giả Đồn Duy Bình Trường Đại học Sư phạm, Đại học Đà Nẵng Email: doanduybinh@gmail.com theo, chúng tơi trình bày cơng cụ tính tốn mềm, đặc biệt thuật tốn ACO, từ đưa hướng nghiên cứu phát triển thuật toán áp dụng cho toán dự đoán cấu bậc hai RNA tối ưu tương lai Cấu trúc bậc hai RNA Cấu trúc bậc hai phân tử RNA sắp xếp bền vững không gian (2 chiều) nucleotide dựa việc cuộn mạch phân tử polymer cặp đôi (tạo liên kết khơng hóa trị) nucleotide mạch Cấu trúc bậc hai RNA tảng để tạo thành cấu trúc bậc ba hồn chỉnh khơng gian chiều phân tử yếu tố định tính chất, chức Người ta chứng minh rằng phân tử RNA có chức giống cấu trúc bậc hai chúng bảo tồn [1] Mỗi phần tử RNA biểu diễn chuỗi dài đơn phân gọi nucleotide nucleotide chứa base (bất kỳ loại sau: A (Adenine), C (Cytosine), G (Guanine) U (Uracil) Theo truyền thống, cấu trúc bậc hai RNA mơ hình hóa Sau đó, cấu trúc RNA xem chuỗi đặc biệt gọi mơ hình chuỗi [2, 6] Một dãy cụ thể Tạp chí Khoa học Xã hội, Nhân văn & Giáo dục, Tập 5, số 4B(2015), 1-8 | Đồn Duy Bình base dọc theo chuỗi gọi cấu trúc phân tử Các cấu trúc thường mô từ qua chữ A, U, G C Thơng qua việc tạo hai nhóm liên kết hydro cặp base bổ sung A-U C-G dạng cặp base ổn định gọi cặp Watson-Crick, cặp A-U hình thành hai liên kết hydro, cặp C-G hình thành ba liên kết hydro có xu hướng ổn định cặp A-U Những base khác ghép cặp, đặc biệt G-U Các cặp GU gọi cặp base chao đảo hình thành chỉ liên kết hydro 2.5 Định nghĩa Cấu trúc bậc hai RNA khơng có nút thắt (pseudoknot): - cấu trúc bậc hai RNA khơng có hai cặp khác biệt (i, j) (k, l) thỏa mãn i≤k≤j≤l Hình biểu diễn cấu trúc bậc hai RNA khơng có nút thắt 2.6 Định nghĩa 2.6.1 Xếp chồng cặp base Nếu cặp base (i, j) P (i+1, j-1) P tạo thành xếp chờng biểu diễn Hình Để mơ tả rõ tốn cấu trúc bậc hai RNA, cần thiết tìm hiểu số định nghĩa cấu trúc RNA [2] 2.1 Đinh nghĩa Bốn chữ sử dụng để biểu diễn cho chuỗi RNA, cấu trúc RNA: S= s1s2…sn với si {A, U, G, C} i=1, 2,… n 2.2 Đinh nghĩa (Các cặp base tắc) Trong cấu trúc bậc hai RNA, cặp base hình thành ba cặp: C-G (G-C), AU (U-A) G-U (U-G) Các cặp base {(A, U), (U, A), (C, G), (G, C)} gọi cặp Watson-Crick Cặp base {(G, U), (U, G)} gọi cặp base lắc lư (Wobble) Hình Các cặp base xếp chồng 2.6.2 Vòng lặp Là (i, i+1,… k), i ≤ j ≤ k, base Sj khơng tạo thành cặp với base cịn lại hình thành vịng lặp (Hình kiểu vịng lặp) Hình Các cặp base tắc a b 2.3 Định nghĩa Với (i, j) biểu diễn cho cặp base hình thành base vị trí thứ i base vị trí thứ j, cho tập s = {(i, j), i j n} gọi cấu trúc bậc hai RNA s thỏa mãn điều kiện sau: 1.(i, j) cặp base tắc 2.Cho (I, j) s, (i’, j’) s, i i’ j j’ i=i’ Nếu (i, j) s, j-i> 2.4 Định nghĩa Chúng ta gọi hai cặp base (i, j) (i’, j’), tương thích nếu: 1.i=i’ j=j’ (chúng cặp base) 2.i