Chú giải hệ phiên mã bằng công cụ BLASTX

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân tích hệ phiên mã và sàng lọc một số gen giả định liên quan tới tình trạng tăng trưởng ở tôm sú (PENAEUS MONODON) (Trang 27 - 28)

CHƢƠNG 1 TỔNG QUAN

1.4. Các phƣơng pháp phân tích hệ phiên mã sử dụng các công cụ tin sinh

1.4.3. Chú giải hệ phiên mã bằng công cụ BLASTX

Xác định cấu trúc và chức năng của một trình tự mới được giải mã X là một

trong những bài toán quan trọng trong lĩnh vực nghiên cứu về tin sinh học. Có nhiều cách để xác định cấu trúc và chức năng của một trình tự X. Thơng thường, dự đoán chức năng và cấu trúc của X dựa vào chức năng và cấu trúc của các trình tự đã biết và có độ giống nhau cao với X. Đối với bài tốn tìm tất cả các trình tự trong cơ sở dữ liệu có độ giống nhau cao với một trình tự cho trước,một trong các phương pháp hiệu quả và phổ biến nhất là BLAST (Basic Local Alignment Search Tool) được đề xuất bởi Alschul và đồng nghiệp vào những năm 1970. Thuật toán BLAST cho phép so sánh rất nhanh một trình tự X với các trình tự trong cơ sở dữ liệu để tìm ra các cặp đoạn có độ giống nhau cao giữa chúng. Thuật tốn BLAST được phát triển để có thể làm việc được với nhiều loại dữ liệu khác nhau [42].

Thuật toán BLAST được đề xuất để tìm các cặp đoạn có độ giống nhau cao giữa một trình tự đầu vào X (query) với các trình tự có sẵn trong cơ sở dữ liệu. Xét hai trình tự nucleotideX = x1,..., xpvà Y =y1,..., yq, thuật toán BLAST xuất phát từ

nhận xét sau: “Cặp đoạn có độ giống nhau cao giữa 2 trình tự X và Y thường phải

độ dài lớn hơn hoặc bằng k (mặc định k = 11). Tư tưởng chính của thuật toán BLAST như sau [42]:

 Tìm tất cả các đoạn hạt giống giữa hai trình tự X và Y.

 Với mỗi đoạn hạt giống:

- Xác định vị trí xuất hiện của nó trên hai trình tự X và Y.

- Mở rộng nó cả về hai phía trái và phải để thu được cặp đoạn có độ giống nhau cao giữa X và Y. Quá trình mở rộng sẽ dừng lại nếu như việc mở rộng thêm một vị trí sẽ làm điểm giống nhau của cặp đoạn mở rộng nhỏ hơn điểm giống nhau cao nhất được tìm thấy trong quá trình mở rộng một ngưỡng θ cho trước. Quá trình mở rộng sẽ được tiến hành lặp đi lặp lại cho đến khi không thể mở rộng được nữa. Gọi (Xi, Yj) là cặp đoạn thu được sau khi kết thúc quá trình mở rộng. Cặp đoạn (Xi, Yj) được gọi là cặp đoạn có điểm số

giống nhau cao giữa X và Y (High Scoring Segment Pair – HSP).

Chương trình BLAST dùng để so sánh cấu trúc của chuỗi DNA, chuỗi amino acid phân tích với các chuỗi tương ứng lưu giữ trong ngân hàng dữ liệu, nhằm tìm kiếm chuỗi hay một số chuỗi tương đồng nhất với chuỗi kiểm tra. Trong đó cơng cụ BLASTX dùng để so sánh cấu trúc chuỗi nucleotide (cDNA) cần phân tích (dưới dạng được dịch đầy đủ sang cấu trúc chuỗi amino acid) với cấu trúc chuỗi protein trong ngân hàng dữ liệu. Phương án so sánh này được sử dụng để tìm hiểu đặc điểm sản phẩm sẽ được tạo ra khi lựa chọn đoạn chuỗi này [2].

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân tích hệ phiên mã và sàng lọc một số gen giả định liên quan tới tình trạng tăng trưởng ở tôm sú (PENAEUS MONODON) (Trang 27 - 28)

Tải bản đầy đủ (PDF)

(87 trang)