Bài toỏn tối ưu tổ hợp và tiếp cận mềm

Chương 1 DểNG HÀNG CÁC MẠNG PROTEIN VÀ TỐI ƯU MỀM

1.2. Tối ưu mềm

1.2.1. Bài toỏn tối ưu tổ hợp và tiếp cận mềm

1.2.1.1. Phỏt biểu bài toỏn tối ưu tổ hợp tổng quỏt

Trong cỏc bài toỏn thực tiễn, ta thường gặp cỏc bài toỏn TƯTH, trong đú cần tỡm cực trị của một hàm với biến nhận giỏ trị trong một tập hữu hạn.

Một cỏch tổng quỏt, mỗi bài toỏn TƯTH cú thể phỏt biểu như sau: (xem [Dorigo & Stỹtzle, 2004; Schrijver, 2006]). Cho một bộ ba (𝑆, 𝑓, Ω), trong đú

S là tập hữu hạn trạng thỏi (lời giải tiềm năng hay phương ỏn), f là hàm mục tiờu xỏc định trờn S, cũn Ω là tập cỏc ràng buộc. Mỗi phương ỏn s ∈ S thỏa món cỏc ràng buộc Ω gọi là phương ỏn (hay lời giải) chấp nhận được. Mục đớch của ta là tỡm phương ỏn chấp nhận được s∗ tối ưu húa toàn cục hàm mục tiờu f. Chẳng hạn với bài toỏn cực tiểu thỡ f(s∗) ≤ f(s) với mọi phương ỏn chấp nhận được s.

Đối với mỗi bài toỏn, đều cú thể chỉ ra một tập hữu hạn gồm n thành phần C = {c1, … , cn} sao cho mỗi phương ỏn s trong S đều biễu diễn được nhờ

liờn kết cỏc thành phần trong nú. Cụ thể hơn, cỏc tập S, C và Ω cú cỏc đặc tớnh sau:

1) Ký hiệu 𝑋 là tập cỏc vectơ trờn 𝐶 cú độ dài khụng quỏ

ℎ: 𝑋 = {< 𝑢0, . . . , 𝑢𝑘 > 𝑢𝑖𝐶𝑖𝑘ℎ}. Khi đú, mỗi phương ỏn 𝑠 trong 𝑆 được xỏc định nhờ ớt nhất một vectơ trong 𝑋 như ở điểm 2) dưới đõy.

2) Tồn tại tập con 𝑋∗của 𝑋 và ỏnh xạ  từ 𝑋∗ lờn 𝑆 sao cho−1(𝑠) khụng rỗng với mọi 𝑠𝑆,trong đú tập 𝑋∗cú thể xõy dựng được từ tập con 𝐶0 nào đú của 𝐶 nhờ thủ tục mở rộng tuần tự ở điểm 3) dưới đõy.

3) Từ 𝐶0ta mở rộng tuần tự thành 𝑋∗như sau:

i) Ta xem 𝑥0 = < 𝑢0 >là mở rộng được với mọi 𝑢0 𝐶0.

ii) Giả sử 𝑥𝑘 =< 𝑢0, . . . , 𝑢𝑘 > là mở rộng được và chưa thuộc 𝑋∗. Từ tập ràng buộc Ω, xỏc định tập con 𝐽(𝑥𝑘) của 𝐶, sao cho với mọi 𝑢𝑘+1 𝐽(𝑥𝑘)

thỡ 𝑥𝑘+1 =< 𝑢0, . . . , 𝑢𝑘, 𝑢𝑘+1 >là mở rộng được.

iii) Áp dụng thủ tục mở rộng từ cỏc phần tử 𝑢0 𝐶0 cho phộp ta xõy dựng được mọi phần tử của 𝑋∗.

Như vậy, mỗi bài toỏn TƯTH được xem là một bài toỏn cực trị hàm cú ℎ

biến, trong đú mỗi biến nhận giỏ trị trong tập hữu hạn 𝐶 kể cả giỏ trị rỗng. Núi một cỏch khỏc, nú là bài toỏn tỡm kiếm trong khụng gian vectơ độ dài khụng quỏ ℎ trờn đồ thị đầy đủ cú cỏc đỉnh cú nhón trong tập 𝐶.

Để hiểu rừ hơn về bài toỏn tối ưu tổ hợp và tiếp cận tớnh toỏn mềm, phần này giới thiệu bài toỏn TƯTH điển hỡnh thuộc loại NP-khú: bài toỏn người chào hàng.

Bài toỏn TSP [Dorigo & Stỹtzle, 2004] là bài toỏn TƯTH cú nhiều ứng dụng và được xem là bài toỏn chuẩn để đỏnh giỏ hiệu quả cỏc lược đồ giải bài toỏn TƯTH mới. Bài toỏn này được phỏt biểu như sau:

Cho một tập gồm 𝑛 thành phố (hoặc điểm tiờu thụ) 𝐶 = {𝑐𝑖}𝑖=1𝑛, độ dài đường đi trực tiếp từ thành phố ci đến thành phố cj là di,j . Một người chào hàng muốn tỡm một hành trỡnh ngắn nhất từ nơi ở, đi qua mỗi thành phố đỳng một lần để giới thiệu sản phẩm, sau đú trở về nơi xuất phỏt.

Như vậy, ta cần tỡm chu trỡnh Hamilton của một đồ thị đầy đủ cú trọng số

𝐺 = (𝑉, 𝐸), trong đú 𝑉 là tập đỉnh với nhón là cỏc thành phố trong 𝐶, 𝐸 là cỏc cạnh nối cỏc thành phố tương ứng, độ dài cỏc cạnh chớnh là độ dài đường đi giữa cỏc thành phố đó biết.

Trong bài toỏn này, tập 𝑆 là cỏc chu trỡnh Hamilton trờn 𝐺, 𝑓 là độ dài của chu trỡnh, Ω là ràng buộc đũi hỏi chu trỡnh là chu trỡnh qua tất cả cỏc đỉnh, mỗi đỉnh đỳng một lần (Hamilton), 𝐶 là tập thành phố được xột (trựng với 𝑉),

𝐶0trựng với 𝐶, tập 𝑋 là vectơ độ dài 𝑛: 𝑥 = (𝑥1, … , 𝑥𝑛) với 𝑥𝑖 ∈ 𝐶 ∀ 𝑖 ≤ 𝑛, cũn

𝑋∗là cỏc vectơ trong đú 𝑥𝑖 khỏc 𝑥𝑗 đối với mọi cặp (𝑖, 𝑗).

Cỏc tiếp cận giải cỏc bài toỏn TƯTH khú

Với cỏc bài toỏn TƯTH NP-khú cú cỡ nhỏ, người ta cú thể tỡm lời giải tối ưu nhờ tỡm kiếm vột cạn. Tuy nhiờn, với cỏc bài toỏn cỡ lớn thỡ đến nay chưa thể cú thuật toỏn tỡm lời giải đỳng với thời gian đa thức nờn chỉ cú thể tỡm lời giải gần đỳng hay đủ tốt.

Theo cỏch tiếp cận truyền thống hay là tiếp cận cứng, cỏc thuật toỏn gần đỳng phải được chứng minh tớnh hội tụ hoặc ước lượng được tỷ lệ tối ưu. Với việc đũi hỏi khắt khe về toỏn học như vậy làm hạn chế số lượng cỏc thuật toỏn cụng bố, khụng đỏp ứng được nhu cầu ngày càng phong phỳ và đa dạng trong nghiờn cứu và ứng dụng. Để khắc phục tỡnh trạng này, người ta dựng tiếp cận

đủ tốt để xõy dựng cỏc thuật toỏn tối ưu mềm.

1.2.1.2.Tớnh toỏn mềm

Tớnh toỏn mềm [Volna, 2013] cho một cỏch tiếp cận để giải quyết cỏc bài toỏn khú, thụng tin khụng đầy đủ, thiếu chắc chắn và cho kết quả là những lời giải đủ tốt hoặc gần đỳng mà tiếp cận truyền thụng hay tớnh toỏn cứng khụng giải quyết được. Tiếp cận này gồm cỏc phương phỏp sử dụng tập mờ/ tập thụ, cỏc phương phỏp học mỏy như mạng nơ ron nhõn tạo, mỏy tựa vộctơ (SVM), cỏc giải thuật tiến húa như cỏc giải thuật di truyền, tối ưu bầy đàn, tối ưu đàn kiến, tối ưu bầy ong, giải thuật memetic, hệ miễn dịch nhõn tạo, v.v.

Đối với cỏc bài toỏn TƯTH khú, cỏc phương phỏp tớnh toỏn mềm được đỏnh giỏ chất lượng dựa trờn thực nghiệm mà khụng nhất thiết phải chứng minh tớnh hội tụ hoặc ước lượng tỷ lệ tối ưu. Cỏc thuật toỏn thường được xõy dựng dựa trờn một ý tưởng “cú lý” và hiệu quả của chỳng được đỏnh giỏ dựa vào kết quả thử nghiệm trờn tập dữ liệu đủ tin cậy.

Cỏc phương phỏp này phỏt triển theo hai hướng heuristic và metaheuristic

[X.-S. Yang, 2014; X.-S. Yang & Wiley InterScience (Online service), 2010].

Cỏc thuật toỏn heuristic đề xuất riờng biệt cho từng bài toỏn cụ thể, cho phộp tỡm nhanh một lời giải đủ tốt hoặc xấp xỉ tối ưu địa phương

Theo cỏch hiểu chung nhất, mỗi thuật toỏn metaheuristic tổng quỏt là một lược đồ tớnh toỏn đề xuất cho lớp bài toỏn rộng, khi dựng cho cỏc bài toỏn cụ thể cần thờm cỏc vận dụng chi tiết cho phự hợp. Nhờ cỏc lược đồ này, người dựng cú thể xõy dựng được thuật toỏn cho bài toỏn trong thực tế mà khụng đũi hỏi cú kiến thức tốt về toỏn học tớnh toỏn, vỡ vậy, hiện nay chỳng đang được dựng phổ biến trong ứng dụng. Cỏc thuật toỏn này thường cú thời gian chạy lõu hơn cỏc thuật toỏn truyền thống và tỡm kiếm địa phương nhưng lời giải hướng tới tối ưu toàn cục. Khi đề xuất thuật toỏn metaheuristic mới, người ta phải thử

nghiệm trờn bài toỏn chuẩn để kiểm định chất lượng so với cỏc thuật toỏn khỏc, sau đú, người dựng vận dụng cho cỏc bài toỏn khỏc. Cỏc thuật toỏn tổng quỏt này thường dựa trờn ý tưởng mụ phỏng tự nhiờn với ngầm định rằng qua quỏ trỡnh chọn lọc tự nhiờn, cỏc đặc điểm và đặc tớnh sinh học hiện cú thường mang tớnh tối ưu.

Dưới đõy sẽ giới thiệu cỏc phương phỏp và khỏi niệm cần dựng cho cỏc thuật toỏn được đề xuất trong luận ỏn bao gồm phương phỏp ACO, tớnh toỏn tiến húa và cỏc thuật toỏn memetic, tỡm kiếm Tabu. Trong đú tập trung giới thiệu và phõn tớch sõu về thuật toỏn ACO, vỡ ACO là thuật toỏn cơ sở để đề xuất cỏc thuật toỏn mới được trỡnh bày ở chương 2 và chương 3.

Bài toỏn tối ưu tổ hợp và tiếp cận mềm

Bài toỏn dúng hàng mạng tương tỏc protein-protein

Phương phỏp tối ưu đàn kiến