Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 82 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
82
Dung lượng
354,55 KB
Nội dung
CƠ SỞTOÁNHỌCCỦA GT GEN I-ĐỊNH LÝ CƠ BẢN CỦA GIẢI THUẬT GEN: Các thao tác của GAs bắt đầu với một dân số ngẫu nhiên có n chuỗi , rồi sao chép các chuỗi theo khuynh hướng đến cái tốt , ghép cặp và đổi các chuỗi con thành phần , thỉnh thoảng làm đột biến giá trị bit để cósố đo tốt . Mặc dù các GAs đã xử lý trực tiếp dân sốcủa các chuỗi theo cách không phức tạp , qua chương 1 chúng ta đã bắt đầu nhận ra rằng quá trình xử lý các chuỗi một cách tường minh gây nên sự xử lý ngầm nhiều sơ đồ trong mỗi thế hệ .Để phân tích sự tăng trưởng và suy giảm của nhiều sơ đồ chứa trong một dân số , chúng ta cần vài ký hiệu bổ sung.Hãy xem xét các thao tác sinh sản , ghép chéo và đột biến trên sơ đồ chứa trong một dân số. Không làm mất tính tổng quát , chúng ta xét một chuỗi được tạo từ bộ ký tự nhị phân V ={0,1} .Theo quy ước , chúng ta ký hiệu chuỗi bằng ký tự in hoa , các ký tự riêng biệt bằng chữ thường có đánh chỉ số vị trí . Ví dụ , chuỗi A gồm 7 bit : A =0111000 , được biểu diễn dưới dạng sau : A = a 1 a 2 a 3 a 4 a 5 a 6 a 7 Ơ đây , a i chỉ đặc tính nhị phân đơn (còn gọi là gen a i ), mỗi đặc tính có thể nhận giá trị 1 hoặc 0 (đôi khi chúng ta còn gọi giá trị ai là gen tương ứng) .Trong chuỗi cụ thể , a 1 = 0 ,a 2 =1 ,a 3 =1,a 4 =1,a 5 = 0… Cũng có thể có các chuỗi mà đặc tính không được sắp thứ tự như chuỗi A , thí dụ :A’ = a 2 a 6 a 4 a 3 a 7 a 1 a 5 . Chương sau sẽ khai thác hiệu quả của sự mở rộng việc biễu diễn chuỗi để cho phép các đặc tính bố trí độc lập với nhiệm vụ của chúng . Hiện thời ,giả thiết nhiệm vụ của đặc tính có thể được xác định bằng vị trí của nó . Giải thuật gen đúng nghĩa yêu cầu một dân số các chuỗi , chúng ta xét dân sốcủa các chuỗi riêng lẻ Aj , j=1,2,3,… ,n, chứa trong dân số A(t) ở thời điểm (hay thế hệ) t,chữ in đậm để chỉ dân số .Bên cạnh các ký hiệu mô tả các dân số , các chuỗi ,các vị trí bit , và các gen tương ứng , chúng ta cần các ký hiệu quy ước để mô tả sơ đồ được chứa trong các chuỗi cá thể và các dân số .Xét một sơ đồ H tạo nên từ bộ 3 ký tự V+={0,1,*} , trong đó * được so trùng với cả ký tự 0 và 1 .Thí dụ ,xét sơ đồ 7 ký tự H = *11*0* * , chúng ta thấy chuỗi A = 0111000 nói ở trên là một ví dụ củasơ đồ H . Từ kết quả của chương trước, ta biết có 3 1 sơ đồ (hay sự tương đồng) được xác định từ một chuỗi nhị phân có chiều dài l. Tổng quát, nếu bộ ký tự có k ký tự thì ta có (k+1) 1 sơ đồ. Hơn nữa, trong một chuỗi dân sốcó n phần tử thì sẽ có nhiều nhất là n*2 1 sơ đồ được chứa trong dân số đó, vì bản thân mỗi chuỗi là biểu diễn của 2 1 sơ đồ.Những tính toán này cho chúng ta một cảm nhận nào đó về độ lớn của thông tin được xử lý bởi GAs .Tuy nhiên, để hiểu rõ tầm quan trọng của những khối gạch xây đối với những giải pháp trong tương lai, chúng ta cần phân biệt sự khác nhau giữa các loại sơ đồ. Tất cả các sơ đồ không được tạo nên một cách đồng đều, có một sốsơ đồ đặc biệt hơn những cái khác . Ví dụ,sơ đồ 011*1* * là một thể hiện xác định hơn về sự tương đồng quan trọng so vớisơ đồ 0* * * * * * . Hơn nữa , một sơ đồ nào đó có thể trải rộng với chiều dài chuỗi nhiều hơn các sơ đồ khác. Ví dụ, sơ đồ 1* * * *1* sẽ trải một phần của chuỗi rộng hơn sơ đồ 1*1* * * *. Để đánh giá những ý tưởng này, chúng ta cần giới thiệu về hai đặc trưng củasơ đồ: bậc (other) củasơ đồ và chiều dài định nghĩa (defining length) củasơ đồ. Bậc củasơ đồ H , ký hiệu là o(H), là số các vị trí xác định (trong bộ ký tự nhị phân, chính là tổng số các bit 1 và 0) có trong mẫu. Ví dụ: bậc củasơ đồ 011*1* * là 4 (ký hiệu o(011*1**) = 4) còn bậc củasơ đồ 0* * * * * * là 1. Chiều dài định nghĩa củasơ đồ H ,ký hiệu δ(H) là khoảng cách giữa vị trí có giá trị xác định đầu tiên với vị trí có giá trị xác định sau cùng củasơ đồ .Thí dụ , sơ đồ 011*1* * có chiều dài định nghĩa δ = 4 , vì vị trí xác định cuối cùng là 5 và vị trí xác định đầu tiên là 1 .do đó khoảng cách giữa chúng là δ(H) = 5-1 = 4 . Sơ đồ 0* * * * * * chỉ có một vị trí xác định ,do đó vị trí đầu và cuối trùng nhau , nên chiều dài định nghĩa δ = 0 Sơ đồ và những đặc trưng của nó là những công cụ ký hiệu thích hợp để thảo luận và phân loại chính xác các sự tương đồng của chuỗi .Hơn thế nữa chúng cung cấp các phương tiện cơsở để phân tích hiệu quả ròng của việc sinh sản và các thao tác di truyền trên các khối gạch xây được chứa bên trong dân số .Chúng ta hãy xem xét hiệu quả riêng và hiệu quả phối hợp của việc sinh sản ,ghép chéo và đột biến ,trên sơ đồ được chứa trong dân sốcủa các chuỗi . Dễ dàng xác định hiệu quả của việc sinh sản trên một số lượng mong muốn của các sơ đồ trong một dân số .Giả sử tại bước thời gian (thế hệ) đã biết thứ t có m ví dụ của một sơ đồ cụ thể H, chứa trong dân số A(t) .Chúng ta viết m = m(H,t) (có thể có những số lượng khác nhau của các sơ đồ khác nhau tại những thế hệ t khác nhau). Khi sinh sản , một chuỗi sẽ được sao chép theo giá trị thích nghi của nó , hay chính xác hơn là chuỗi A I sẽ được tuyển chọn với xác xuất p I =f i / Σ f j . Sau khi chọn một dân số không phủ lắp (trùng lớp một phần ) có kích thước n với sự thay thế từ dân số A(t) ,chúng ta mong muốn có m(H,t+1) đại diện cho sơ đồ H trong dân số , tại thế hệ thứ t+1 , được xác định qua phương trình : m(H,t+1) = m(H,t) * n * f (H)/ Σ f j trong đó f(H) là dộ thích nghi trung bình của các chuỗi đại diện cho sơ đồ H ở thế hệ thứ t . Nếu chúng ta nhận thấy được độ thích nghi trung bình củatoàn bộ chuỗi có thể được tính theo f = Σ f j / n ,chúng ta có thể viết lại phương trình tăng trưởng củasơ đồ sinh như sau: m(H,t +1) = m(H,t) *f(H) / f Qua đẳng thức trên chúng ta nhận thấy ,một sơ đồ cụ thể sẽ tăng trưởng tỉ lệ với độ thích nghi trung bình của nó chia cho độ thích nghi trung bình củatoàn bộ dân số .Nói cách khác , các sơ đồ có giá trị thích nghi hơn độ thích nghi trung bình của dân số sẽ gia tăng số lượng các mẫu trong thế hệ kế , và ngược laị. Nghĩa là , mọi sơ đồ trong dân số sẽ tăng trưởng hay suy giảm tùy thuộc vào giá trị thích nghi trung bình của dân số , dưới tác động riêng rẽ của việc sinh sản . Cần nhớ rằng tại một thế hệ , có nhiều việc diễn ra song song với các thao tác đơn giản trên n chuỗi trong dân số . Anh hưởng của việc sinh sản trên sơ đồ là rõ ràng về mặt định tính :Các sơ đồ trên trung bình sẽ tăng trưởng và các sơ đồ dưới trung bình sẽ phải chết . Chúng ta có thể học thêm được điều gì khác nữa về dạng toánhọccủa sự tăng trưởng (hoặc suy giảm ) từ phương trình sai phân củasơ đồ ? Giả thiết sơ đồ đặc thù H vượt quá độ thích nghi trung bình một lượng với c là hằng số .Với giả thiết này , chúng ta có thể viết lại phương trình sai phân cuảsơ đồ như sau : m(H,t+1) = m(H,t) ( f + cf ) / f = ( 1+c ) m(H,t) Bắt đầu với t = 0 và giả thiết một giá trị c không , chúng ta được phương trình : m(H,t) = m(H,0)(1+c) t Ta nhận thấy phương trình này giống như phương trình tiền lãi phức hợp , các về toánhọc sẽ nhận thấy phương trình này giống như cấp số nhân hay phép tương tự rời rạc dạng hàm mũ . Hiệu quả của việc sinh sản rõ ràng là định tính được việc sinh sản cấp phát sự gia tăng (hay giảm) theo hàm mũ củasố lượng các phép thử đối với sơ đồ có độ thích nghi trên (hoặc dưới) trung bình . Bây giờ ta xét ảnh hưởng của ghép chéo và đột biến : Sự ghép chéo là sự trao đổi thông tin một cách ngẫu nhiên nhưng có cấu trúc giữa các chuỗi .Việc ghép chéo tạo ra những cấu trúc mới , với sự phá vỡ tổi thiểu đối với chiến lược cấp phát chỉ do sự sinh sản gây ra .Kết quả là các phần gia tăng(hay giảm) theo hàm mũ củasơ đồ trong một dân số trên nhiều sơ đồ , được chứa trong một thế hệ . Để thấy sơ đồ nào bị ảnh hưởng bởi sự ghép chéo và sơ đồ nào không bị ảnh hưởng , hãy xét một chuỗi A có chiều dài l = 7 và hai sơ đồ đại diện H 1 ,H 2 của nó : A = 0111000 H 1 = *1* * * * 0 H 2 = * * * 1 0 * * Rõ ràng hai sơ đồ H1 và H2 đại diện cho chuỗi A , nhưng để thấy ảnh hưởng của việc ghép chéo trên sơ đồ , trước tiên hãy nhớ lại rằng việc ghép chéo đơn giản tiến hành với sự lựa chọn ngẫu nhiên một cặp chuỗi sau đó chọn ngẫu nhiên vị trí ghép và trao đổi các chuỗi con từ đầu chuỗi đến vị trí ghép , với chuỗi con tương ứng . Giả sử chuỗi A được chọn để cặp đôi và ghép chéo , chiều dài của A là 7 . Quay xúc xắc để chọn chỗ ghép (có 6 chỗ có thể ghép trong một chuỗi có chiều dài là 7), giả sử xúc xắc ngửa mặt 3 nghĩa là chúng ta cắt cả 2 chuỗi ban đầu tại giữa vị trí bit thứ 3 và bit thứ 4 . Điểm ghép được đánh dấu bởi dấu |. A = 011 | 1000 H 1 = *1* * | * * * 0 H 2 = * * * | 10 * * Sơ đồ H1 sẽ bị phá hủy vì 1 ở vị trí 2 và 0 ở vị trí 7 sẽ được đặt vào các con cháu khác nhau (chúng ở hai phía của điểm ghép hay điểm cắt). Rõ ràng là cũng ở cùng một điểm cắt như vậy sơ đồ H 2 sẽ sống sót , bởi vì ở 1 vị trí 4 và 0 ở vị trí 5 sẽ được mang trọn vào 1 thế hệ con cháu nào đó . Dù rằng chúng ta đã thấy khá rõ là H 1 dường như ít khả năng sống sót hơn H 2 bởi vì theo trung bình thì điểm cắt rơi vào giữa những vị trí xác định xa nhất . Để định lượng sự quan sát này , chúng ta nhận thấy H 1 chiều dài định nghĩa là 5 . Nếu điểm ghép được chọn gống nhau 1 cách ngẫu nhiên trong số l – 1 = 7 –1 = 6 vị trí có thể có , rõ ràng là H 1 sẽ bị phá hủy với xác xuất Pd = δ(H1)/(l-1) =5/6 (nó tồn tại với xác suất P s = 1 - P d = 1/6). Tổng quát , chúng ta thấy giới hạn dưới của xác suất sống sót P s có thể đuợc tính theo 1 sơ đồ bất kỳ . Bởi vì , 1 sơ đồsống sót khi điểm cắt rơi bên ngoài chiều dài định nghĩa , xác suất sống sót của sự ghép chéo đơn giản là P s = 1 - δ(H) /(l-1) , từ đó sơ đồ nhường như bị phá hủy bất cứ lúc nào tại 1 vị trí nằm trong chiều dài định nghiã ,được chon từ l-1 vị trí có thể có . Nếu việc ghép chéo tự thân nó thực hiện bằng sự lựa chọn ngẫu nhiên , chúng ta nói rằng với xác suất P c ở một cặp ghép cụ thể , xác suất sống sót có thể được cho bằng biểu thức : Ps ≥ 1 – P c * δ(H) /(l-1) Hiệu qủa phức hợp của sự sinh sản và ghép chéo giờ đây có thể được xem xét . khi xét riêng việc sinh sản chúng ta quan tâm đến việc tính toánsố lượng của 1 sơ đố H cụ thể được mong đợi trong thế hệ kế tiếp . Giả sử hai thao tác sinh sản và ghép chéo là độc lập với nhau chúng ta có thể ước lượng sau : m(H,t+1) ≥ m(H,t) * f(H) * [1 - P e * δ(H) /(l-1)] f So sánh đẵng thức này với các biểu thứ c trước đây cho việc sinh sản riêng lẻ , hiệu quả của ghép chéo và sinh sản đạt được bằng cánh nhân với số lượng sơ đồ mong muốn cho việc sinh sản riêng lẻ bởi xác suất sống sót P s dưới tác dụng của việc ghép chéo . Sơ đồ H sẽ tăng trưởng hay bị phá hủy tùy thuộc vào thừa số nhân .Đối với cả hai việc ghép chéo lẫn sinh sản , thừ số nhân phụ thuộc vào 2 yếu tố : Sơ đồ đó là trên hay dưới trung bình dân số , và sơ đồ đó có chiều dài định nghĩa tương ứng là ngắn hay dài . Rõ ràng với những sơ đồ hội đủ 2 yếu tố trên (trên trung bình và chiều dài định nghĩa ngắn ) sẽ được chọn làm mẫu với tỉ lệ gia tăng theo hàm mũ . Thao tác cuối cùng cần xem xét là sự đột biến . Theo định nghĩa trước đây , sự đột biến là sự thay thế ngẫu nhiên một vị trí đơn với xác suất P m .Để một sơ đồ H sống sót được , tất cả những vị trí có giá trị xác định của nó phải được sống sót . Do đó, từ một gen tương ứng (allene) sống sót với xác suất (1-P m ) và từ mỗi đột biến độc lập theo thống kê , một sơ đồ cụ thể sẽ sống sót khi từng vị trí cố định o(H) bên trong sơ đồ đó sống sót . Nhân xác suất sống sót ( 1 - P m ) với chính nó o(H) lần , chúng ta được xác xuất của biến dị sống sót là (1-P m ) o(H) .Đối với giá trị P m nhỏ (P m << 1 ) , xác suất sống sót củasơ đồ có thể tính xấp xỉ bởi biểu thức 1 – o(H)*P m . Vì thế chúng ta kết luận rằng 1 sơ đồ H cụ thể nhận một số lượng mong muốn các bản sao trong thế hệ kế tiếp dưới tác dụng của sự sinh sản , ghép chéo , và đột biến theo đẳng thức sau (bỏ qua các đại lượng quá bé) : m( H,t +1 ) ≥ m (H,t).f(H) /f .{1-P c .δ(H) /(l-1) – o(H)P m } Sự đột biến thêm vào làm thay đổi một chút các kết luận trước đó . Những sơ đồ trên trung bình , bậc thấp , ngắn sẽ nhận số lần thử tăng theo hàm mũ trong nhũng thế hệ tiếp theo . Kết luận này quan trọng , rất quan trọng đến nỗi chúng ta đặt cho no một tên gọi là Định lí sơ đồ hay là Lý thuyết nền tảng của giải thuật gen . II-XỬ LÝ SƠ ĐỒ : Chương 1 đã trình bày cơ chế của giải thuật GEN đơn giản thông qua sự tính toán bằng tay cho một thế hệ . Chúng ta trở lại ví dụ này , nhưng lần này là để quan sát cách GAs xử lý sơ đồ – chứ không phải các chuỗi cá thể - bên trong một dân số . Sự tính toán bằng tay ở chương 1 được ghi lại trong bảng 2.1. Bảng 2.1:Xử lý GAs đơn giản ---------------------------------------------------------------------------------------------------- Xử lý chuỗi ---------------------------------------------------------------------------------------------------- Số tt Dân số Giá trị x Độ thích Pselect i f i Số đếm từ ban đầu nghi f(x)=x2 fi /Σf f bánh xe roulette ---------------------------------------------------------------------------------------------------- 1 01101 13 169 0.14 0.58 1 2 11000 24 576 0.49 1.97 2 3 01000 8 64 0.06 0.22 0 4 10011 19 361 0.31 1.23 1 ---------------------------------------------------------------------------------------------------- Sum 1170 1.0 4.00 4.0 Average 293 0.25 1.00 1.0 Max 576 1.49 1.97 2.0 ---------------------------------------------------------------------------------------------------- Trước khi sinh sản. ---------------------------------------------------------------------------------------------------- Đại diện chuỗi Độ thích nghi trung bình củasơ đồ f(H) ---------------------------------------------------------------------------------------------------- H1 1**** 2,4 469 H2 *10** 2,3 320 H3 1***0 2 576 ---------------------------------------------------------------------------------------------------- Sau khi sinh sản ---------------------------------------------------------------------------------------------------- Xử lý chuỗi ---------------------------------------------------------------------------------------------------- Bể ghép đôi ghép đôi Vị trí ghép Dân số Trị x f(x) = x 2 sau sinh sản với chuỗi mới ---------------------------------------------------------------------------------------------------- 0110|1 2 4 01100 12 144 1100|0 1 4 11001 25 625 11|000 4 2 11011 27 729 10|011 3 2 10000 16 256 ---------------------------------------------------------------------------------------------------- Sum 1754 Average 439 Max 729 ---------------------------------------------------------------------------------------------------- Sau sinh sản Sau mọi thao tác ---------------------------------------------------------------------------------------------------- Số đếm Số đếmĐại diện Số đếmSố đếm Đại diện mong muốn thật chuỗi mong muốn thật chuỗi ---------------------------------------------------------------------------------------------------- 3.20 3 2,3,4 3.20 3 2,3,4 2.18 2 2,3 1.64 2 2,3 1.97 2 2,3 0.0 1 4 ---------------------------------------------------------------------------------------------------- Cùng với các thông tin đã trình bày , chúng ta đếm được bao nhiêu lần chạy của 3 sơ đồ H1, H2 ,H3 với: H1 = 1**** H2 = *10* * H3 = 1***0 Quan sát hiệu quả của sự sinh sản , ghép chéo và đột biến trên sơ đồ H . Trong suốt giai đoạn sinh sản các chuỗi được sao chép một cách xác suất tùy theo giá trị thích nghi của chúng . Hãy xem cột thứ 1 trong bảng chúng ta thấy 2 chuỗi 2 và 4 cùng đại diện cho sơ đồ 1**** . Sau khi sinh sản , chúng ta thấy 3 bản sao củasơ đồ được tạo ra (chuỗi 2 , 3, 4 trong cột ghép cặp). Số lượng này có phù hợp với giá trị được tiên đoán trong định lí sơ đồ ? Từ định lí sơ đồ , chúng ta mong muốn có m * f(H) /f bản sao . Tính trung bình củasơ đồ f(H 1 ) , chúng ta được (576 + 361)/2 = 468.5 . Chia cho trung bình dân số f = 293 và nhân với số lượng sơ đồ H 1 có ở thế hệ t , m (H,t) = 2 , chúng ta được số lượng mong muốn củasơ đồ H 1 tại thế hệ t+1 là m ( H,t+1 ) = 2 * 468.5 / 293=3.2 . So sánh với số lượng sơ đồ thực sự (là 3) chúng ta thấy rằng đã có đúng số lượng các bản sao như mong muốn . Thực hiện thêm một bước nữa , chúng ta thấy việc ghép chéo không có thêm bất kỳ một tác dụng nào , bởi vì chiều dài định nghĩa δ(H 1 )=0 đã ngăn cản sự phá vỡ một bit đơn . Thêm nữa , với P m =0.001 chúng ta muốn có m* P m =3* 0.001= 0.003 hoặc không có bit nào bị thay đổi bên trong 3 bản sao củasơ đồ trong 3 chuỗi . Kết quả quan sát cho thấy đối với sơ đồ H 1 , chúng ta nhận được sốsơ đồ tăng theo tỉ lệ với hàm mũ đúng như định lí sơ đồ đã tiên đoán . Đến giờ mọi việc đều tốt đẹp ; nhưng sơ đồ H 1 chỉ có một bit xác định , dường như chỉ là một trường hợp đặc biệt . Hãy xét sự nhân giống củasơ đồ H 2 = *10** và H 3 = 1***0 . Sự sinh sản trước khi ghép chéo các bản sao sơ đồ là đúng .Trường hợp H 2 bắt đầu với 2 ví dụ trong dân số ban đầu và kết thúc với 2 bản sao qua sự sinh sản . Điều này tương đồng với số lượng các bản sao mong muốn , m (H 2 )= 2*320/293=2.18, trong đó 320 là độ thích nghi trung bình củasơ đồ và 293 là độ thích nghi trung bình của dân số . Trường hợp H 3 bắt đầu với một ví dụ đơn (chuỗi 2) và kết thúc với 2 bản sao qua sự sinh sản (chuỗi 2 và 3 trong cột các bản sao của chuỗi ). Điều này tương đồng với số lượng các bản sao mong muốn m(H 3 ) = 1* 576 /293= 1.97 , trong đó 576 là độ thích nghi trung bình củasơ đồ và 293 là độ thích nghi trung bình của dân số .Tình huống ghép chéo sau đây phức tạp hơn một chút .Để ý rằng đối với sơ đồ ngắn như sơ đồ H 2 , hai bản sao vẫn được duy trì mặc dù sự ghép chéo đã xảy ra . Bởi vì chiều dài định nghĩa ngắn , chúng ta mong đợi sự ghép chéo để làm gián đoạn quá trình chỉ một lần trong bốn lần (l- 1= 5-1=4).Kết quả là , sơ đồ H 2 sống sót với xác suất cao . Số lượng mong muốn thực tế củasơ đồ H 2 sau đó là : m(H 2 ,t+1)=2.18*0.75=1.64, hoàn tòan tương ứng với số lượng thực là 2 sơ đồ . Còn H 3 thì lại mang màu sắc khác .Vì chiều dài định nghĩa lớn (δ(H 3 )=4) , do đó sự ghép chéo thường phá hủy sơ đồ này . III-BÀI TOÁN 2-Armed Bandit và K-Armed Bandit: Hiệu quả của sự sinh sản ghép chéo và đột biến đã rõ ràng cả về mặt định tính lẫn định lượng . Những sơ đồ có chiều dài định nghĩa ngắn , bậc thấp , độ thích nghi trên trung bình ( những khối gạch xây ) sẽ tăng trưởng tỉ lệ với hàm mũ trong các thế hệ tương lai .Nhưng mặc dù đã chứng minh kỹ lưỡng về điều này , vẫn còn một câu hỏi tồn tại :Tại sao đây là một việc tốt để làm ? Tại sao phải chọn hàm mũ ? Những câu hỏi này dẫn đến một bài toán quan trọng của lí thuyết quyết định theo thống kê , bài toán máy đánh bạc 2 – cần và dạng mở rộng của nó là bài toán máy đánh bạc k- cần . Giả sử chúng ta có một máy đánh bạc 2 cần với 2 cần có tên là Trái và Phải. Giả thuyết chúng ta biết rằng một cần sẽ trả phần thưởng µ 1 với độ biến thiên δ 1 2 và cần kia là trả thưởng µ 2 với δ 2 2 , trong đó µ 1 ≥ µ 2 .Chúng ta nên chơi cần nào? Hiển nhiên là chúng ta muốn chơi với cần trả thưởng thường xuyên hơn (cần có tiền thưởng là µ 1 ), nhưng chúng ta không biết trước cần nào sẽ trả thưởng cao hơn (Trái hay Phải ) , chúng ta đang đối mặc với tình huống khó xử . Không những chúng ta phải ra một quyết định về việc chơi cần nào , mà cùng lúc ấy chúng ta còn phải thu thập thông tin xem cần nào tốt hơn . Sự trao đổi giữa việc khảo sát cho tri thức và việc khai thác cho các tri thức ấy là một chủ đề nền tảng quan trọng trong lí thuyết và các hệ thống đáp ứng . Cách thức xác định tình thế khó xử này sẽ nói lên nhiều điều về thành công cuối cùng của một phương pháp . Một cách để tiếp cận sự trao đổi này là tách sự khảo sát ra khỏi sự khai thác , bằng cách thực hiện trước một thí nghiệm đơn và sau đó ra một quyết định đơn tất yếu (không thể đảo ngược được) dựa trên kết quả của thí nghiệm đó .Đó là cách tiếp cận của lí thuyết quyết định truyền thống (cổ điển) mà chúng ta có thể miêu tả chính xác như sau : Giả sử chúng ta có tổng số lần thử là N cho cả 2 cần .Đầu tiên ,chúng ta đặt một số lượng các phép thử bằng nhau n cho mỗi một trong hai cần (2n < N) trong suốt giai đoạn thí nghiệm . Sau khi thí nghiệm xong , chúng ta đặt N-2n phép thử còn lại cho cần nào cho số trả thưởng tốt nhất mà ta quan sát được .Giả sử , chúng ta biết rằng từ N, µ 1 , µ 2 , δ 1 , δ 2 chúng ta có thể tính được sự mất mát theo mong muốn (De Jong , 1975) : L(N,n) = | µ 1 - µ 2 | . | ( N- n ) q (n) + n ( 1 – q(n) ) | trong đó : q(n) là xác suất mà cần xấu được quan sát là tốt , sau n phép thử trên mỗi máy .Xác suất này sẽ được xấp xỉ chính xác bởi phần đuôi của phân bố chuẩn : ; với Từ đẳng thức này ,chúng ta có thể thấy hai nguyên nhân mất mát liên quan đến thủ tục . Sự mất mát thứ nhất là kết quả của việc thực hiện n phép thử trên cần sai (muốn thử trên cần tốt nhưng lại thử nhầm trên cần xấu) trong suốt thời gian thử nghiệm . Sự mất mát thứ hai là kết quả của việc chọn phải cần có phần thưởng thấp (µ 2 ) ngay cả sau khi hoàn thành việc thử nghiệm .Chúng ta không thể nào khẳng định là vào cuối cuộc thí nghiệm chúng ta sẽ chọn được đúng cần như mong muốn hay không , vì thế chúng ta hy vọng rằng sẽ ít chọn phải cần xấu và chịu thêm một sự mất mát trong N – 2n phép thử còn lại trong giai đoạn khai thác .Chúng ta có thể giải quyết cho kích thước thí nghiệm tối ưu là n* bằng cách lấy đạo hàm của phương trình mất mát và đặt nó bằng 0. Holland (1975) đã tính toán và chỉ ra cách phân phối các phép thử vào 2 cần như thế nào để tối thiểu hóa sự mất mát theo như mong đợi .Điều này dẫn đến kết quả là đặt n* phép thử vào cần xấu nhất và N – n* phép thử cho cần được thấy là tốt hơn , với n* được tính bằng phương trình sau đây : trong đó b = σ 1 /( µ 1 -µ 2 ) Xoay quanh phương trình này, chúng ta nhận thấy rằng số lần thử cho bởi cần tốt hơn quan sát được ,thì tuân theo phương trình: Nói cách khác , để đặt các phép thử một cách tốt ưu (theo nghĩa mất mát ít nhất như mong muốn ) , chúng ta nên tăng thêm một chút số lượng phép thử gia tăng theo hàm mũ cho cần được quan sát là tốt hơn . Nhưng không may là chiến lược này không hiện thực , vì có yêu cầu biết kết quả trước khi có kết quả . Tuy nhiên , điều này tạo nên một giới hạn quan trọng trong việc thực hiện , đó là một chiến lược hiện thực nên cố gắng để đạt đến .Chắc chắn có nhiều chiến lược có thể đạt đến sự lý tưởng này .Tiếp cận bằng thực nghiệm được phân tích ở trên cho thấy bằng cách nào mà số lượng lần thử ít hơn (theo hàm mũ) được đặt vào cần xấu , với tư cách là số lượng các phép thử được gia tăng .Một phương pháp khác thậm chí đã dẫn đến gần với việc bố trí các phép thử lý tưởng , đó là GAs đã được thảo luận . Định lý sơ đồ bảo đảm cung cấp ít ra là một số lượng gia tăng theo hàm mũ của các phép thử , cho những khối gạch xây được quan sát thấy là tốt nhất. Bằng cách này, GAs là một thủ tục hiện thực nhưng lại gần tối ưu ( Holland, 1973, 1975) để tìm kiếm những giải pháp lựa chọn. Với GAs, chúng ta sẽ giải quyết máy đánh bạc 2-cần đơn giản một cách nhanh chóng; trong GAs thông thường, chúng ta xem xét giải pháp đồng thời của nhiều máy đánh bạc nhiều cần. Để làm việc này một cách mạnh mẽ, trước tiên chúng ta xét dạng giải pháp đối với máy k-cần đơn và sau đó chứng minh rằng GAs thông thường có thể được xem là sự hợp thành của nhiều máy có k-cần như thế. Dạng của giải pháp bài toán k-cần giới hạn được Holland khám phá ra năm 1973 . Giải pháp mất mát tối thiểu theo mong muốn để bố trí các phép thử vaò k-cần cạnh tranh nhau thì tương tự như giải pháp cho 2 cần: một số lượng lớn hơn (tăng theo hàm mũ) củasố các phép thử sẽ được đưa cho những cần được nhận thấy là tốt nhất . Kết quả này không làm ngạc nhiên, nhưng nó luôn liên hệ chặt chẽ với những nhận xét của chúng ta về việc xử lí sơ đồ, nếu như chúng ta xem một tập các sơ đồ đang cạnh tranh nhau như là một máy đánh bạc k-cần chuyên biệt. Để thấy sự liên hệ này , chúng ta xác định các yếu tố của một tập hợp các sơ đồ đang cạnh tranh , và sau đó đếm số lượng và kích thước của các bài toán máy đánh bạc k-cần đang được giải quyết bên trong một GAs của chiều dài chuỗi đã cho. Hai sơ đồ A và B với các vị trí riêng biệt a 1 và b 1 là đang cạnh tranh nếu ở tại mọi vị trí i = 1,2,…,l, chúng ta có hoặc là a i = b i =* hoặc là a i ≠ *, b i ≠ *, a i ≠ b i tại ít nhất một giá trị i. Thí dụ, xét tập hợp 8 sơ đồ cạnh tranh tại các vị trí 2,3,5, trong các chuỗi có chiều dài 7 dưới đây: * 0 0 * 0 * * * 0 0 * 1 * * * 0 1 * 0 * * * 0 1 * 1 * * * 1 0 * 0 * * * 1 0 * 1 * * * 1 1 * 0 * * * 1 1 * 1 * * Có 8 sơ đồ cạnh tranh trên 3 vị trí 2, 3 và 5, bởi vì bất kì vị trí nào trong số 3 vị trí này đều có thể chiếm hoặc là giá trị 1 hoặc là giá trị 0 (2 3 = 8). Chúng ta có thể bắt đầu thấy sự liên hệ với bài toán k-cần trong danh sách 8 sơ đồ cạnh tranh ở trên .Từ những sơ đồ được xác định trên các vị trí giống nhau này, chúng cạnh tranh với cái khác để chiếm những khe hở dân số quí giá.Để đặt các khe dân số một cách thích hợp, chúng ta cần đặt các số tăng theo hàm mũ cho những sơ đồ được thấy là tốt nhất, chỉ khi chúng ta cho các phép thử gia tăng tỉ lệ với hàm mũ cho cần được thấy là tốt nhất trong số k-cần. Một trong những khác biệt giữa tình thế của chúng ta trong một GAs và bài toán k-cần là chúng ta có một số các bài toán tiến hành song song. Thí dụ, với 3 vị trí cố định trên một chuỗi chiều dài 7, có [ 7 3 ]= 35 của ( 2 3 = 8) các bài toán 8 cần. Tổng quát, cho sơ đồ bậc j trên các chuỗi có chiều dài l , chúng ta có { l j } bài toán k j cần khác nhau, trong đó k j = 2 j . Không phải tất cả Σ{ l j }= 2 1 bài toán đều được giải quyết tốt như nhau, vì sự ghép chéo có khuynh hướng phá vỡ những máy nào có các chiều dài định nghĩa lớn như đã nói trước đây. Trong phần kế, chúng ta đếm sốsơ đồ xử lí hiệu quả bằng Gas. IV-SỐ SƠ ĐỒ ĐƯỢC XỬ LÝ HIỆU QUẢ : Các đối số đếm được từ trước đến nay đã chỉ rằng chúng ta có từ 2 1 cho tới n * 2 1 sơ đồ đang xử lý trong một dân số chuỗi với chiều dài l và kích thước n . Như đã biết , không phải tất cả đều được xử lý với xác suất cao , bởi vì sự ghép chéo đã phá vỡ những sơ đồ với chiều dài định nghĩa tương đối lớn . Trong phần này chúng ta sẽ tính toán một giới hạn thấp nhất của những sơ đồ được xử lý hữu ích – đó chính là mẫu cho tỷ lệ gia tăng theo hàm mũ . Mặc dù bài toán chỉ n cấu trúc cho mỗi thế hệ , nhưng một GTGENcó vẻ như phải xử lý đến n 3 sơ đồ . Kết quả này rất quan trọng và Holland đã cho nó một tên gọi đặc biệt là sự song song ngầm .Mặc dầu ở mỗi thế hệ chúng ta thực hiện sự tính toán tỷ lệ với độ lớn của dân số , chúng ta đạt đến sự xử lý hữu ích một số lượng dường như là n 3 sơ đồ theo cách song song , mà không cần tốn thêm vùng nhớ đặc biệt nào hơn chính bản thân dân số .Chúng ta hãy nhận lại sự ước lượng này để hiểu những giả thuyết nền tảng của nó và khảo sát nguồn gốc của đòn bẫy tính toán này . Xét một dân số gồm n chuỗi nhị phân có chiều dài l .Chúng ta chỉ xét các sơ đồ sống sót với một xác suất lớn hơn hằng số P s . Giả thiết thao tác ghép chéo là đơn giản và tỷ lệ lỗi ε < 1 - P s .Điều này dẫn chúng ta đi đến việc chỉ quan sát những sơ đồ có chiều dài l s < ε (l -1) +1 . Với một chiều dài sơ đồ cụ thể , chúng ta có thể ước tính một giới hạn thấp nhất củasố các sơ đồ duy nhất được xử lý bởi một dân số ngẫu nhiên ban đầu của các chuỗi .Để làm điều này , đầu tiên chúng ta đếm số lượng các sơ đồ có chiều dài l s hay ngắn hơn .Sau đó nhân với một độ lớn dân số thích ứng , được chọn theo ý chúng ta muốn , theo trung bình thì không lớn hơn 1 đối với mỗi sơ đồ có chiều dài l s /2 .Giả sử chúng ta muốn đếm được sốsơ đồ có chiều dài l = 10 như sau: 1 0 1 1 1 0 0 0 1 0 Để làm điều này , chúng ta tính số lượng sơ đồ trong ô nhớ thứ nhất gồm 5 vị trí : 1 0 1 1 1 0 0 0 1 0 sao cho bit cuối cùng của ô là cố định .Điều này có nhgĩa là chúng ta muốn mọi sơ đồ có dạng : %%%%1 * * * * * trong đó các dấu * là giá trị nào đó và các dấu % sẽ lấy hoặc là giá trị cố định (1 hay không ở vị trí đó ) hoặc là giá trị nào đó . Rõ ràng có 2 (ls –1) sơ đồ ,bởi vì l s –1 = 4 vị trí có thể được cố định hay nhận giá trị nào đó . Để đếm số lượng tổng cộng của những sơ đồ này , đơn giản là chúng ta chỉ ta cần trượt khung mẫu gồm 5 vị trí dọc theo sơ đồ : 1 0 1 1 1 0 0 0 1 0 Chúng ta thực hiện việc này tổng cộng là l - l s + 1 lần và chúng ta có thể ước lượng tổng số các sơ đồ có chiều dài l s hay nhỏ hơn là 2 (ls-1) * (l - l s + 1). Đó là số lượng các sơ đồ trong chuỗi cụ thể đã cho . Để phỏng định toàn thể số lượng các sơ đồ như thế trong toàn bộ dân số , đơn giản là chúng ta có thể nhân với độ lớn n của dân số và có được n * 2 (ls - 1 ) * (l - l s + 1 ). Số này hiển nhiên là phỏng định cho con số chính xác , bởi vì chắc chắn là sẽ có những sự lặp lại của các sơ đồ bậc thấp trong các dân số lớn . Để tinh chế lại sự phỏng định này , chúng ta lấy ra một độ lớn dân số n = 2 ls/2 . Bằng cách chọn lựa theo phương thức này chúng ta muốn cótoàn bộ (hay là một số ít hơn ) số các sơ đồ có bậc l s /2 hoặc lớn hơn . Nhận thấy rằng số lượng sơ đồ được phân bố thành 2 thành phần (nhị thức , binomially) , chúng ta kết luận là một nửa có bậc cao hơn l s /2 và một nửa bậc thấp hơn l s /2 . Nếu chúng ta chỉ đếm nhũng sơ đồ có bậc cao hơn , chúng ta ước chừng một giới hạn thấp cho các sơ đồ như sau : n s ≥ n( l – l s + 1 )2 (l s -2) Điều này khác với sự phỏng định trước đó bởi thừa số l/2 .Hơn nữa , nếu giới hạn độ lớn trong giá trị cụ thể 2 ls/2 ,cho kết quả là biểu thức sau : 4 )1( 3 nll s +− n s = Từ n s = C n 3 ,chúng ta kết luận là số lượng sơ d0ồ tỉ lệ với lũy thừa bậc 3 của độ lớn dân số , và do có bậc n 3 ,tức (o(n 3 )) Vì thế , chúng ta thấy rằng mặc dầu có sự phá hủy những sơ đồ bậc cao ,dài bởi sự ghép chéo và đột biến ,các GTGEN vốn dĩ xử lí một số lượng lớn các sơ đồ ,trong khi xử lí một số lượng tương d0ối nhỏ các chuổi. V-CÁC GIẢ THUYẾT KHỐI GẠCH XÂY : Bức tranh của việc thực hiện GTGEN sẽ rõ ràng hơn với viễn cảnh được cung cấp bởi các sơ đồ . Những sơ đồ thấp bậc thấp và thích nghi cao sẽ được lấy mẫu liên kết lại và lấy mẫu lại để tạo nên các chuỗi có tiềm lực thích nghi cao hơn . Theo lối này bằng làm việc với những sơ đồ cụ thể này (những khối gạch xây) , chúng ta có thể giảm độ phức tạp của bài toán thay vì xây dựng các chuỗi hoàn thành cao bằng cách thử mọi tổ hợp có thể tưởng tượng được ,chúng ta xây dựng các chuỗi ngày càng tốt hơn từ những giải pháp riêng phần tốt nhất của các mẫu trong quá khứ . Bởi vì những sơ đồ thích nghi cao của các chuỗi có chiều dài định nghĩa ngắn và bậc thấp đóng vai trò quan trọng trong hành vi của các GAs ,chúng ta đã đặt cho chúng một tên gọi đặc biệt là khối gạch xây .Giống như trẻ con tạo các pháo đài nguy nga bằng cách ghép các mẫu gỗ đơn giản , các GAs sẽ tìm sự hoàn thành gần tối ưu thông qua việc đặt cạnh nhau các sơ đồ hoàn thành cao ,bậc thấp và ngắn ,hay đó chính là các khối gạch xây. Chương 1 đã nhấn mạnh nhiều lần rằng các ký hiệu sẽ liên kết lại để tạo nên những ý tưởng tốt hơn .Đến giờ chúng ta nhìn nhận rằng chính những khối gạch xây sẽ liên kết để tạo nên những chuỗi tốt hơn .Hiển nhiên là sự tăng lên của các bằng chứng theo kinh nghiệm đã cung cấp những yêu cầu trong một lớp rộng các bài toán .Bắt đầu từ 2 thập niên trước với các luận văn của hai nhà tiên phong (Babley , 1967 và Rosenberg ,1967 ) và được tiếp tục thông qua nhiều ứng dụng của GAs được nêu lên ở các hội nghị gần đây về GAs ,giả thuyết khối gạch xây được nêu ra trong nhiều bài toán khác nhau .Các bài toán đơn hình ,trơn , các bài toán đa hình có nhiễu , và các bài toán tối ưu hóa phức hợp, đều được giải quyết thành công nhờ GAs .Trong khi các bằng chứng theo kinh nghiệm có giới hạn thì không có lý thuyết chứng minh ,có gợi ý là GAs thích hợp cho nhiều dạng của bài toán mà chúng ta thường gặp . Mới đây , Bethke (1981) đã làm rõ thêm vấn đề này .Sử dụng các hàm Walsh và chuyển đổi khéo léo các sơ đồ , ông đã phát minh ra phương pháp phân tích hiệu quả các giá trị thích nghi trung bình nhờ dùng các hệ số Walsh .Điều này cho phép chúng ta xác định các hàm và mã đặc biệt đã cho ,các khối gạch xây phối hợp lại để tạo nên lời giải tối ưu hay gần tối ưu .Holland (1987) đã mở rộng các tính toáncủa Benthke để phân tích độ thích nghi trung bình củasơ đồ khi dân số không được phân bố đồng nhất . Việc chuyển đổi sơ đồ của Bethke và Holland vượt quá phạm vi nguyên cứu của chúng ta .Với người đọc quen thuộc với chuỗi Fourier ,tính tuần hoàn của các sơ đồ khác nhau được đặt ra .Thật ra ,chính sự tuần hoàn này cho phép phân tích hàm Walsh .Trong khi sự phân tích điều hòa xác định các đặc trưng vật lý thông qua sự kiểm tra độ lớn tương đối của các hệ số Fourier thì sự phân tích hàm Walsh sẽ xác định sự hiệu xuất tĩnh như mong muốn của GAs thông qua sự phân tích các độ lớn tương đối của những hệ số Walsh . Mặc dù những phương pháp chuyển đổi này là các công cụ toánhọc mạnh để phân tích GAs trong những trường hợp xác định ,nhưng sự tổng quát hóa những kết quả này cho việc mã hóa và các hàm tùy ý đã được chứng minh là rất khó khăn .Bethke đã tạo ra một số trường hợp thí nghiệm có thể dẫn đến sai lạc cho GTGEN 3 thao tác (chúng ta gọi tổ hợp các hàm –mã hóa này GAs –lầm lẫn ) .Những kết quả này nói lên rằng các hàm và việc mã hóa mà là GAs lầm lẫn ,có khuynh hướng chứa đỉnh tối đa cô lập : những điểm tốt nhất có khuynh hướng bị vây quanh bởi những điểm xấu nhất .Thực tế nhiều hàm chúng ta gặp phải trong thế giới thực không có các đặc trưng hi hữu này ; có một số tính đều đặn thông thường trong tổ hợp mã hóa hàm –giống như tính đều đặn của một hay nhiều sơ đồ –có thể được khai thác bởi sự tái liên kết những khối gạch xây .Tóm lại ,chúng ta có thể nói rằng việc tìm ra những hàm xấu loại này là khó khăn ,bất chấp kỹ thuật tìm kiếm .Tuy nhiên ,điều quan trọng phải ghi nhớ là GAs đơn giản phụ thuộc vào sự tái liên kết của các khối gạch xây để dò tìm những điểm tốt nhất .Nếu các khối gạch xây dẫn dắt kém hiệu quả ,vì sự mã hóa đã dùng hay do bản thân hàm ,bài toáncó thể yêu cầu một thời gian chờ đợi lâu hơn để đi đến những giải pháp gần tối ưu . -------------***--------------- CHƯƠNG III HIỆN THỰC GIẢI THUẬT GEN --------------***** --------------- [...]... -CHƯƠNG IV SỰ CẢI TIẾN VÀ ỨNG DỤNG CỦA GIẢI THUẬT GEN I-SỰ CẢI TIẾN CỦA GIẢI THUẬT GEN: 1.Sự tiến hóa của giải thuật gen: Qua các chương , những khái niệm cơ bản của GAs đã được đề cập ,tuy nhiên để GAs thực thi có hiệu quả hơn ,người ta đã thực hiên một số cải tiến GAs chuẩn này.Trước tiêncải tiến dựa trên chọn lọc các sơ đồ và sau đó là một số cải tiến trên toan tử gen a/Cải tiến trong việc chọn lựa... : Begin gen := 0; repeat {vòng lặp chính} gen := gen +1 ; generation; statictics(popsize, max, avg, min, sumfitness, newpop} report (gen} oldpop := newpop ; {hướng đến thế hệ mới} until (gen >= maxgen) ; end; Bắt đầu chương trình chính, chúng ta đặt bộ đếm thế hệ gen := 0 Sau đó chúng ta nhập dữ liệu vào chương trình , khởi tạo dân số ngẫu nhiên ban đầu, tính toán thống kê dân số ban đầu, và in ra báo... diễn vị trí gen hay tên gen Thông thường các toán tử tái lập lại bậc là toán tử đảo chiều Với toán tử này ,người ta chọn hai điểm trên chiều dài chuỗi ,sau đó ta tiến hành cắt lại điểm này ,và những điểm cuối của phần cắt sẽ hoán chỗ cho nhau Ví dụ ,hai chuỗi có 8 bit sẽ hoán đổi như sau : 12|3456|78 01|1110|10 Sau khi hoán đổi ta có : 12654378 01011110 3/ Giải thuật lai gen : Giải thuật lai gen đơn giản... như bài toán trạng thái bền ,các ràng buộc được đưa vào bài toán bằng phương pháp phạt bên ngoài ,dạng bậc hai 2 / Tối ưu hoá kết cấu qua GAs : Tác giả đã áp dụng GAs vào việc tối ưu hóa kết cấu của một khung phẳng gồm 10 thanh Mục tiêu của bài toán này là cực tiểu hóa trọng lượng của kết cấu ,Phụ thuộc vào các ràng buộc về ứng suất lớn nhất và ứng suất nhỏ nhất của mỗi thanh Trong công trình của tác... ,ông đã xem xét bài toáncủa Wong và Larson ,với hệ thống 10 máy nén khí ,10 ống dẫn khí nối tiếp Bài toán bị chi phối bởi phương trình chuyển đổi phi tuyến ,chỉ ra sự sụt áp qua các đường ống và sự tăng áp khi qua máy nén Để kiểm tra GAs đơn giản trong các bài toán đường ống khác nhau , tác giả đã mã hoá bài toán điều khiển nhất thời một đường ống của Wong và Larson Trong bài toán này, mục tiêu là... quyết các bài toán mà chúng ta gặp trong khoa học ,kinh doanh và kỹ thuật Trong phần này chúng ta giải quyết 2 nguyên lý cơ bản của sự mã hóa trong GAs để giúp thiết kế mã cho các bài toán khác nhau Sau đó ,chúng ta sẽ nghiên cứu cách mã hóa chuỗi nhị phân ,đã biến đổi và đa thông số ,mà cách này đã chứng tỏ có ích lợi tropng nhiều bài toán khác nhau Về một phương diện nào đó mã hóa một bài toán cho việc... khi nó dẫn đến cấu trúc phức tạp - Các toán tử tái lập lại bậc : Không giống như toán tử từ trước chỉ tìm kiếm trên tập allele tốt ,các toán tử này còn tìm kiếm trên những cách mã hóa cũng như tập các giá trị allele tốt hơn Những toán tử này thích hợp cho bài toán mà giá trị fitness phụ thuộc vào sự sắp xếp chuỗi ,chẵn hạn như trị fitness phụ thuộc vào tổ hợp của các giá trị allele v và bậc o , f =... cơ sở tối ưu tuyền thống khác.Có nhiều cách làm giảm sự hội tụ sớm này ,chúng ta sẽ nghiên cứu vài cách.Tuy nhiên sự thật của vấn đề là các GAs không đảm bảo hội tụ trong bài toán tùy ý Dù chúng ta rút ra được các miền đáng quan tâm của không gian tìm kiếm một cách nhanh chóng ,nhưng chúng là những phương pháp yếu ,không đảm bảo có những thủ tục hội tụ hơn.Điều nàynkhông làm giảm giá trị tiện ích của. .. thay đổi kích thước , và có thể là động cơcủa suốt quá trình tìm kiếm bằng gen nhân tạo để cho phép kích thưóc dân số thay đổ từ thế hệ này sang thế hệ khác Tuy nhiên , có một động cơ mạnh mẽ trong công việc hiện tại của chúng ta để giữ cho mọi việc đều đơn giản , và hướng dẫn lựa chọn các dân số không phủ lấp có kích thước cố định Hình 3.3:Khai báo biến toàn cục của GAs theo Pascal var oldpop,newpop,:... thích nghi của chuỗi, và x là biến thực tương ứng với gía trị thông số đã giải mã Bản thân kiểu chromosome là mảng của kiểu allene (đánh chỉ số từ 1 đến maxstring) Trong GAs , chúng ta áp dụng các toán tử gen trên toàn bộ dân số ở từng thế hệ Để thực hiện trên các thao tác này , chúng ta sử dụng 2 dân số không phủ lấp nhau , qua đó đơn giản hóa viện sinh sản của các con cháu và sự thay thế của các bố . CƠ SỞ TOÁN HỌC CỦA GT GEN I-ĐỊNH LÝ CƠ BẢN CỦA GIẢI THUẬT GEN: Các thao tác của GAs bắt đầu với một dân số ngẫu nhiên. Lý thuyết nền tảng của giải thuật gen . II-XỬ LÝ SƠ ĐỒ : Chương 1 đã trình bày cơ chế của giải thuật GEN đơn giản thông qua sự tính toán bằng tay cho một