Một số mô hình tiến hóa - cơ sở toán học của giải- 123docz.net

Các thuật toán tiến hoá khi cài đặt cần tuân theo một mô hình tiến hoá nào đó, dưới đây sẽ giới thiệu một số mô hình thông thường.

Mô hình MGG được giới thiệu bởi Satoh, Yamamura và Kobayashi (1996) và được sử dụng trong nhiều nghiên cứu cũng như thử nghiệm. Thuật toán chi tiết được mô tả như sau:

1) Khởi tạo quần thể: Tạo lập quần thể khởi tạo bởi các véc tơ với các thành phần thực một cách ngẫu nhiên.

2) Chọn để tạo sinh: Chọn ngẫu nhiên m cá thể cha mẹ từ quần thể. 3) Tạo sinh: Sử dụng một thuật toán lai ghép nhiều cha mẹ để tạo ra thế hệ con, các cá thể đã chọn và các con tạo nên một quần thể trung gian.

4) Chọn lọc để tái sinh: Chọn ngẫu nhiên một cặp cha mẹ trong các cá thể cha mẹ đã chọn. Chọn một cá thể tốt nhất từ quần thể trung gian gồm các cha mẹ đã chọn và các con vừa sinh ra. Một cá thể khác được chọn trong quần thể này theo cách dùng bánh xe Roulette. Hai cá thể này sẽ thay thế cặp cha mẹ đã chọn ban đầu.

5) Lặp lại từ bước 2 đến bước 4 cho đến khi thoả điều kiện dừng.

b) Mô hình G3 (Generalized Generation Gap)

G3 là mô hình được cải biên từ mô hình MGG như sau:

1) Từ quần thể P(t) chọn một cá thể cha tốt nhất và µ− 1 cá thể khác một cách ngẫu nhiên làm cha mẹ.

2) Sinh ra λ con cháu từ các cha mẹ đã chọn sử dụng một toán tử lai ghép nhiều cha mẹ nào đó.

3) Chọn ngẫu nhiên 2 phần tử từ quần thể P(t).

4) Từ tổ hợp quần thể gồm các cha mẹ đã chọn, các con vừa sinh ra và 2 phần tử vừa chọn, chọn ra 2 cá thể tốt nhất và thay thế 2 cá thể cha mẹ vừa chọn trên.

c) Mô hình DDA (Distance Dependent Alternation)

O. Takahashi, H. Kita và S. Kobayashi giới thiệu mô hình DDA cũng là mở rộng của MGG như sau:

Chọn m+ 2 cá thể cha mẹ rồi áp dụng toán tử lai ghép U N DX −m

để tạo ra một vài con cháu. DDA chọn cá thể con tốt nhất vừa tạo celite

trội hơn pnear thì thay thế pnear bởi celite; nếu không thì chọn ngẫu nhiên một cha mẹ khác và nếu cá thể cha mẹ vừa chọn kém hơn celite thì thay thế nó bởi celite.

Trong các mô hình tiến hóa trên, mô hình MGGthường được sử dụng vì nó vừa có tính tinh hoa, vừa đảm bảo tính đa dạng của quần thể.

Chương 2

Cơ sở toán học của giải thuật di truyền

Không như các phương pháp tối ưu đơn định thông thường, với các phương pháp tối ưu xác suất rất khó để hình thức hoá vì rằng tác động của thuật toán là không đơn định trong tự nhiên. Các phương pháp này chỉ có thể cho các thông tin về kỳ vọng hoặc tác động trung bình của giải thuật. Trong giải thuật di truyền còn có một số khó khăn hơn trong việc đánh giá sự hội tụ vì:

- Chỉ một sự chuyển tiếp đơn giản từ một lần tạo sinh đến thế hệ kế tiếp đã thường sử dụng tới ba toán tử xác suất, hơn nữa cấu trúc bên trong giải thuật di truyền khá phức tạp.

- Mỗi toán tử xác suất sử dụng trong GA đều rất phức tạp, có nhiều dạng khác nhau được đề xuất, vì vậy sẽ là không phù hợp nếu đưa ra một kết quả về hội tụ nói chung do việc chọn lựa toán tử ảnh hưởng đến cơ sở của sự hội tụ.

Trong chương này tôi trình bày một định lý quan trọng là định lý sơ đồ của Holland đưa ra năm 1975.

2.1 Định lý sơ đồ của Holland.

2.1.1 Một số khái niệm

- Một chuỗi H = (h1, ..., hn) trên bảng chữ cái {0,1,∗} gọi là một sơ đồ (nhị phân) độ dài n. Ký hiệu ∗ được gọi là ký tự đại diện.

- Một chuỗi S = (s1, ..., sn) trên bảng chữ cái {0,1} gọi là thoả sơ đồ

H = (h1, ..., hn) nếu và chỉ nếu nó trùng khớp với H tại các vị trí không là ký tự đại diện ∗, nghĩa là với ∀i ∈ {j|hj =6 ∗} thì si = hi. Ta có thể ký hiệu khi đó S ∈ H.

- Bậc của sơ đồ H là số các ký hiệu xác định (khác ∗) trong H:

O(H) =|{i ∈ 1, ..., n|hi 6=∗}|

- Khoảng cách giữa các vị trí xác định đầu tiên và cuối cùng gọi là chiều dài xác định sơ đồ H:

δ(H) = max{i|hi 6=∗} −min{i|hi 6=∗}

Xét giải thuật di truyền với phép chọn tỷ lệ và hàm thích nghi f tuỳ ý (song đã cố định). Ta xét thêm một số khái niệm sau:

- Số các cá thể thoả sơ đồ H tại thời điểm t được ký hiệu là

rH,t = |Bt ∩H| - Biểu thức f(t) = 1 m m P i=1

f(bi,t) cho độ thích nghi trung bình thu được tại thời điểm t.

Ký hiệu f(H, t) chỉ độ thích nghi trung bình quan sát được của sơ đồ

H tại thời điểm t:

f(H, t) = 1 rH,t X i∈{j|bj,t∈H} f(bi,t) Định lý sơ đồ (Holland 1975)

Định lí 2.1. Với giải thuật di truyền, bất đẳng thức sau được duy trì với mỗi sơ đồ H E[(rH,t+1] ≥rH,t.f(H, t) f(t) .(1−pc δ(H) n−1).(1−pm) O(H) (2.1)

Chứng minh. Xét sơ đồ H, ta có xác suất để chọn được cá thể thoả sơ

đồ H là P i∈{j|bj,t∈H} f(bi,t) m P i=1 f(bi,t) (2.2)

Xác suất này không đổi trong quá trình lặp lại phép chọn, hơn nữa mỗi cá thể trong m cá thể được chọn hoàn toàn độc lập với cá thể khác. Sau đó, số cá thể chọn được thoả sơ đồ H là phân phối nhị thức với tổng số mẫu là m và xác suất cho bởi (2.2). Vì vậy chúng ta thu được kỳ vọng của việc chọn được các cá thể thoả H là:

m P i∈{j|bj,t∈H} f(bi,t) m P i=1 f(bi,t) = mrH,t rH,t P i∈{j|bj,t∈H} f(bi,t) m P i=1 f(bi,t) = rH,t P i∈{j|bj,t∈H} f(bi,t) rH,t m P i=1 f(bi,t) m = rH,t.f(H, t) f(t)

Nếu hai cá thể được chọn lai ghép đều thoả H thì hai con tạo được đương nhiên cũng thoả H. Số các chuỗi thoả H chỉ giảm khi một chuỗi thoả H lai với một chuỗi không thoả H và cũng chỉ trong trường hợp điểm lai ghép được chọn nằm ở một trong các vị trí xác định củaH. Xác suất để chọn điểm lai ghép nằm trong chiều dài xác định H là δ(H)

Từ đó xác suất sống sót pS của H nghĩa là xác suất để chuỗi thoả H

tạo lập được một con cũng thoả H có thể được ước lượng như sau:

pS ≥ 1−pc

δ(H)

n−1 pC là xác suất lai ghép.

Các phép chọn và lai ghép được tiến hành một cách độc lập, do vậy ta có thể tính kỳ vọng của chuỗi thoả H sau lai ghép một cách đơn giản:

f(H, t) f(t) .rH,t.pS ≥ f(H, t) f(t) .rH,t.(1−pc δ(H) n−1)

Sau khi lai ghép, số chuỗi thoả H có thể giảm nếu một chuỗi thoả H

bị thay đổi qua phép đột biến tại một điểm xác định của H. Xác suất để mọi vị trí xác định của H được giữ nguyên qua phép đột biến là

(1−pM)O(H)

Kết hợp kết quả này với công thức trên ta được (2.1).

Thay đổi các đối số trong chứng minh định lý trên cho các phép lai và đột biến khác ta cũng được kết quả tương tự.

Hệ quả 2.1. Với giải thuật di truyền đã mô tả như trên và toán tử chọn

lọc theo bánh xe Roulette, bất đẳng thức sau được duy trì E[rH,t+1]≥ f(H, t)

f(t) .rH,t.PC(H).PM(H)

với mỗi sơ đồ H, ở đây PC(H) là một hằng số chỉ phụ thuộc sơ đồ H và phép lai ghép; PM(H) là hằng số chỉ phụ thuộc sơ đồ H và phép đột biến.

Cụ thể chúng ta có các ước lượng sau :

PC(H) = 1−pC.(δ(H)/(n−1)) với lai ghép 1 điểm

PC(H) = 1−pC.(1−(1/2)O(H)) với lai ghép đồng dạng

PC(H) = 1−pC Các phương pháp lai ghép khác

PM(H) = (1−PM)O(H) đột biến bitwise

PM(H) = 1−PMO(H)/n đảo ngược 1 bit đơn

PM(H) = 1−PM đảo ngược bitwise

Một sơ đồ có độ thích nghi trên độ thích nghi trung bình của quần thể gọi là “trên trung bình”. Từ định lý sơ đồ có thể thấy rằng các sơ đồ trên trung bình sẽ nhận được số cá thể trong quần thể kế tiếp tăng lên trong khi các sơ đồ “dưới trung bình” nhận số chuỗi giảm đi.

Từ công thức (2.1) có thể phát biểu định lý sơ đồ sau

Định lí 2.2 (Định lý sơ đồ). Các sơ đồ ngắn, bậc thấp, trên trung bình

nhận số chuỗi phù hợp tăng theo luỹ thừa trong các thế hệ tiếp theo của giải thuật di truyền.

Có một số hạn chế của định lý sơ đồ : Thứ nhất do đánh giá là bất đẳng thức, việc các chuỗi bị bỏ qua tăng và các chuỗi bị mất đi nên có nhiều thông tin bị bỏ qua. Việc chưa chính xác của bất đẳng thức còn hạn chế ở chỗ định lý sơ đồ dự báo việc biểu diễn sơ đồ riêng đối với việc tạo sinh phức tạp, kết quả dự báo trong một số trường hợp có thể bị lỗi hoặc có hại.

Thứ hai là độ thích nghi quan sát của sơ đồ H tại thời điểm t có thể thay đổi đột ngột như quần thể tập trung các mẫu mới trong một bộ phận con đặc biệt của sơ đồ. Do vậy độ thích nghi trung bình của các chuỗi trong một sơ đồ đặc biệt chỉ quan hệ với lần tạo sinh thứ nhất hay thứ hai.

Nhìn chung, định lý sơ đồ đã chuẩn bị một cận dưới cho chỉ một lần tạo sinh trong tương lai. Tuy nhiên nó không thể dự báo biểu diễn của sơ đồ H với các lần tạo sinh phức tạp.

∗ Giả thuyết khối kiến trúc

Giải thuật di truyền tìm việc thực hiện gần tối ưu thông qua việc đặt gần nhau các sơ đồ ngắn, bậc thấp, hiệu quả cao được gọi là các khối kiến trúc.

Giả định này đã chỉ ra rằng khi làm việc với những khối kiến trúc, chúng ta sẽ giảm được độ phức tạp của bài toán. Thay cho việc phải xây dựng một chuỗi có sức khoẻ tốt bằng việc thử tất cả các tổ hợp của các khối kiến trúc, chúng ta chỉ việc xây dựng các chuỗi tốt dần lên từ các khối của các chuỗi đã có trong các lần thử trước. Giả thuyết này cũng

cho thấy việc biểu diễn nhiễm sắc thể cho GA có tính quyết định đối với việc thực hiện nó và việc biểu diễn này cần thoả mãn ý tưởng về các khối kiến trúc.

Ta đã thấy một quần thể kích cỡ m với chiều dài L tạo ra ít nhất 2L

và nhiều nhất là m ∗2L sơ đồ. Một số sơ đồ được xử lý theo hướng có lợi, chúng sinh sản theo tốc độ luỹ thừa và không bị loại bỏ qua phép lai và đột biến (điều này có thể xảy ra với các sơ đồ có chiều dài xác định lớn và bậc cao). Cũng cần lưu ý thêm là đây chỉ là giả thuyết và được tin là đúng. Nó có thể bị vi phạm, chẳng hạn xét 2 sơ đồ ngắn bậc thấp:

S1 = (1 1 1 ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗)

S2 = (∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗1 1)

là trên trung bình, song kết hợp chúng lại ít phù hợp hơn:

S3 = (1 1 1 ∗ ∗ ∗ ∗ ∗ ∗1 1)

2.2 Mô hình Markov của giải thuật di truyền

Trong giải thuật di truyền, mỗi quần thể được tạo sinh có đặc trưng là chỉ phụ thuộc theo xác suất vào quần thể trước đó, do vậy GA có thể được mô hình hóa bởi một xích Markov. Các tính chất của quần thể hữu hạn, chẳng hạn như xu hướng di truyền có thể được khảo sát cẩn thận sử dụng xích Markov hữu hạn. Không giống như nhiều phương pháp mô phỏng khác, xích Markov có thể mô tả chính xác và chi tiết cho mỗi lớp đặc biệt. Từ năm 1992, Nix và Vose đã mô hình hóa GA kinh điển (biểu diễn chuỗi nhị phân chiều dài cố định, lai ghép một điểm, chọn lọc tỷ lệ) như một xích Markov trong đó mỗi trạng thái là một quần thể. Vose đã mở rộng mô hình này đến mô hình “tìm kiếm ngẫu nhiên Heuristic” trong đó mỗi cá thể của lần tạo sinh kế tiếp được chọn theo một phân bố xác suất trên các cá thể của không gian tìm kiếm. Suzuki đã giới thiệu mô hình của một lớp giải thuật di truyền ưu tú và đưa ra kết quả về số

lần tạo sinh cần thiết để hội tụ dựa trên xác suất đột biến. Năm 1996, Aytug và Koehler đưa ra chặn trên cho số lần tạo sinh cần thiết đối với GA kinh điển để hội tụ đến quần thể có chứa chuỗi tối ưu dựa trên xác suất đột biến.

Phần dưới đây trình bày vắn tắt mô hình xích Markov của giải thuật di truyền đơn giản

2.2.1 Tính Markov

- Một hệ vật lý hoặc hệ trạng thái nào đó gọi là có tính Markov nếu sự tiến triển của hệ trong tương lai chỉ phụ thuộc vào hiện tại và độc lập với quá khứ. VD sự tăng dân số.

- Ký hiệu E là không gian trạng thái của X(t); nếu X(t) có tính Markov và E là tập đếm được thì X(t) gọi là xích Markov. Nếu giá trị của thời điểm t là 0,1, . . . thì ta nói xích Markov với thời gian rời rạc. Nếu t∈ [0,∞] thì ta có xích Markov với thời gian liên tục.

- ĐN: Ta nói X(t) có tính Markov nếu:

P{X(tn+1) = j|X(t0) = i0, . . . , X(tn) = i} = P{X(tn+1) = j|X(tn) = i}

với bất kỳ t0 < t1 < . . . < tn < tn+1 < . . .;i0, . . . , in, j ∈ E

- Đặt p(s, i, t, j) = P{X(t) = j|X(s) = i}(s < t) là xác suất có điều kiện để hệ tại thời điểm s ở trạng thái i, đến thời điểm t chuyển đến trạng thái j và gọi là xác suất chuyển của hệ. Nếu xác suất này chỉ phụ thuộc vào t−s hay p(s, i, t, j) = p(s+h, i, t+h, j) thì hệ là thuần nhất theo thời gian.

- Ký hiệu pij = P{Xn+ 1 = j|Xn = i} và ma trận [pij] gọi là ma trận xác suất chuyển sau 1 bước. Theo công thức xác suất đầy đủ ta có

0≤ pij ≤ 1 và X

pij = 1 (ma trận ngẫu nhiên) - Xác suất chuyển sau n bước :

Khi đó p(1)ij = pij. Quy ước pij(0) = 1(i = j) và là 0 với i <> j

Đặt Pn = (p(ijn)) là ma trận xác suất chuyển sau n bước. - Ta có phương trình Chapman-Kolmogorov

p(ijm+n) = X

k∈E

pnikpnjk

- Một ví dụ về GA được mô hình hóa bởi một xích Markov: Giả sử ta xét cỡ quần thể cố định gồm2N gene kết hợp từ các cá thể loại a và loại

A. Sự hình thành thế hệ sau được xác định bởi 2N phép thử nhị thức độc lập như nhau: Nếu loài bố mẹ có j a−gene và (2N −j) A−gene

thì mỗi phép thử có kết quả là a hay A với xác suất tương ứng là

pj = j

2N và qj = 1− j

Các chọn lọc được lặp lại và được tiến hành có thay thế. Bằng cách này ta có xích Markov {Xn} trong đó Xn là số a − gene ở thế hệ thứ

n trong cỡ loài không đổi gồm 2N cá thể. Không gian trạng thái E =

{0,1,2, ...,2N} gồm 2N + 1 giá trị. Ma trận xác suất chuyển P = (pjk)

tính theo phân phối nhị thức là:

pjk = P{Xn+1 = k|Xn = j} = C2kNpkjq2jN−k (j, k = 0,1, ...,2N) (2.3) Chú ý rằng các trạng thái Xn = 0 (hoặc 2N) là hấp thụ hoàn toàn theo nghĩa khi Xn = 0 (hoặc 2N) thì Xn+k = 0 (hoặc 2N, tương ứng) với mọi k ≥ 0.

Một trong những vấn đề thú vị là xác định xác suất để loài sẽ đạt tới fixation với điều kiện X0 = i, tức là nó sẽ trở thành một quần thể thuần chủng chỉ có a −gene hoặc A−gene. Việc xác định tốc độ đạt tới fixation cũng là điều đáng quan tâm. Ta sẽ nghiên cứu những vấn đề như thế trong phân tích tổng quát về xác suất hấp thụ.

Một mô hình đầy đủ hơn phải tính đến những mutation pressures (tác nhân đột biến). Ta giả sử rằng trước khi hình thành thế hệ mới, mỗi gene có xác suất đột biến, tức là xác suất chuyển thành gene của

loại kia. Đặc biệt, ta giả sử rằng đối với mỗi gene hiện tượng đột biến

a → A xảy ra với xác suất x1 và hiện tượng đột biến A → a xảy ra với