.2 Ví dụ bài tốn gióng hàng 2 trình tự Sequence 1– Sequence 2

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng thuật toán burrows wheeler transform trong quá trình giải mã hệ gen lúa tại việt nam (Trang 25 - 27)

Nội dung của bài tốn so sánh cặp trình tự được trình bày như sau :

+ Cho 2 chuỗi trình tự sinh học S1,S2. Gióng cặp chuỗi này được thực hiện bằng cách chèn thêm vào hai chuỗi S1 và S2 các dấu cách (“gap” kí hiệu là “-“) tại các vị trí bất kỳ với số lượng khơng hạn chế để tạo ra 2 chuỗi S1‟ và S2‟ tương ứng, sau đó đặt một chuỗi trên chuỗi kia sao cho mỗi kí tự của chuỗi này gióng thẳng với một kí tự của chuỗi kia và cặp trình tự gióng khơng đồng thời là dấu cách.

+ Chuỗi sinh học ban đầu khơng có dấu cách và nếu loại bỏ dấu khỏi S1‟ và S2‟ ta sẽ có S1 và S2 ban đầu.

2.1.3 Ý nghĩa sinh học của bài tốn gióng hàng trình tự

Gióng hàng trình tự nhằm nghiên cứu sự tiến hóa Hoặc để tìm kiếm, so sánh mức độ tương đồng giữa các trình tự

Đánh giá mức độ sai khác giữa các trình tự do nhiều nguyên nhân. Có thể ứng dụng để:

 phát hiện các đột biến điểm hoặc mất đoạn Nucleotide.

 Xác định được các Intron, exon(khi so sánh một trình tự mRNA với trình tự DNA).

 Xác định được các vùng bảo thủ trong các trình tự chẳng hạn như vùng Promoter(kỹ thuật footprinting).

 Nghiên cứu và xây dựng cây phát sinh chủng loại(Phylogenetic).

Các trường hợp xác định được khi gióng hàng trình tự là việc thêm/ bớt một nucleotide (insertion/ deletion) hay còn gọi là SNP, việc thay thế một nucleotide (mismatch) hay còn gọi là Indel và việc trùng khớp các nucleotide(match).

Ví dụ hai trình tự u = “ATCTGATG” và v = “TGCATAC”. Khi lấy u làm căn cứ, thì v có: 4 điểm match, 1 điểm mismatch, 3 điểm insertion và 2 điểm deletion như mô tả dưới đây:

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng thuật toán burrows wheeler transform trong quá trình giải mã hệ gen lúa tại việt nam (Trang 25 - 27)

Tải bản đầy đủ (PDF)

(80 trang)