Suy diễn haplotype theo tiêu chuẩn pure parsimony

Một phần của tài liệu Phương pháp tối ưu đàn kiến và ứng dụng (Trang 81 - 82)

Như vậy, với một danh sách genotype, có độ dài đã cho bài toán HI là tìm danh sách haplotype giải thích hợp lý các genotype này.

Hiện nay có hai cách tiếp cận chính cho bài toán này là: Phương pháp tổ hợp và phương pháp thống kê (xem [33-35,58]). Lời giải cho bài toán tùy thuộc vào mô hình di truyền là tiêu chuẩn cho xác định tập haplotype. Theo phương pháp tổ hợp, tiêu chuẩn pure parsimony nhằm tìm tập haplotype nhỏ nhất, giải thích do Gusfield [34, 35] đề xuất theo gợi ý của Hubbel (xem [34]) đang được nhiều người sử dụng. Lời giải cho bài toán suy diễn haplotype theo tiêu chuẩn pure parsimony (Haplotype Inference

by Pure Parsimony - HIPP) được phát biểu như sau.

Định nghĩa 4.3. (Lời giải theo tiêu chuẩn pure parsimony)

Nếu danh sách là một lời giải HI của có số lượng haplotype khác nhau của (như là tập hợp) ít nhất, ta nói nó là lời giải của bài toán HI theo tiêu chuẩn pure parsimony (viết tắt là HIPP) hay suy diễn từ .

Ví dụ: Với danh sách gồm 3 genotype =(121, 002, 221) thì =(101, 111, 000, 001, 011, 101) là một lời giải gồm 5 haplotype khác nhau. Tuy nhiên, lời giải =(101, 111, 000, 001,001, 111) gồm 4 haplotype khác nhau mới là lời giải tối ưu.

Bài toán HIPP thuộc loại NP-khó [33,34] và đã có nhiều thuật toán bao gồm heuristic tham ăn, giải đúng và xấp xỉ theo hướng này được công bố (xem [7,11,32- 35,43,46,48,58,68,69]). Trong số các thuật toán này, Benedettini và các cộng sự [7] đã

84

thử nghiệm một thuật toán ACO hai mức nhưng hiệu quả không cao khi so với RPoly [32]. Trong các chương trình hiện hành giải HIPP [32], RPoly là phương pháp giải đúng tốt nhất, còn CollHap [68] là phương pháp giải gần đúng tốt nhất hiện nay. Thuật toán ACOHAP mà luận án đề xuất được trình bày dưới đây sẽ được so sánh với các chương trình này.

Một phần của tài liệu Phương pháp tối ưu đàn kiến và ứng dụng (Trang 81 - 82)

Tải bản đầy đủ (PDF)

(132 trang)