Bắt nguồn ý tưởng của phương phỏp tiến húa cũng là từ những quan sỏt về sự sống trong tự nhiờn. Việc học tập và bắt chước tự nhiờn trong việc xõy dựng những chương trỡnh mỏy tớnh cú những tớnh chất của cuộc sống hữu cơ thực tế đó cú từ khỏ lõu, từ thuở sơ khai của lịch sử mỏy tớnh. Những người tiờn phong trong lịch sử mỏy tớnh là Alan Turing, John Von Neumann, Norbert Wiener… đó nghĩ tới việc đưa những khả năng giống như trớ tuệ của con người vào những chương trỡnh mỏy tớnh nhằm tạo ra những chương trỡnh cú khả năng đặc biệt như tự tỏi sinh (replication – reproduction), hay tự thớch nghi với mụi trường (adaptation). Sẽ là rất tự nhiờn khi quan sỏt và học tập từ chớnh tự nhiờn những tớnh chất đú để ỏp dụng vào mỏy tớnh, mong muốn sẽ tạo ra những chương trỡnh cú khả năng tư duy như bộ nóo con người, cú khả năng học tập và mở rộng kiến thức như con người và cú khả năng thớch nghi với mụi trường mới như con người. Dần dần những nghiờn cứu mụ phỏng theo cỏc mụ hỡnh sinh học đú đó phỏt triển thành 3 lĩnh vực khỏc nhau là mạng nơ-ron (neural networks), học mỏy (machine learning) và tớnh toỏn tiến húa (evolutionary
Chương 3 THUẬT TOÁN DI TRUYỀN
computation) - lĩnh vực ta quan tõm hơn cả trong luận văn này. Tớnh toỏn tiến húa bao gồm những lĩnh vực nhỏ hơn sau đõy:
Cỏc chiến lược ti n húa (ế Evolutionary Strategies ES) – Quy ho ch ti n húa (ạ ế Evolutionary Programming EP) – Cỏc thuật toỏn di truyền (Genetic Algorithms – GA) Lập trỡnh genetic (Genetic Programming – GP) Và cỏc hệ ố th ng phõn lo i (Classifier Systems – ạ CS)
Tuy nhiờn cỏc nhỏnh phỏt triển của tớnh toỏn tiến húa ban đầu lại được hỡnh thành độc lập với nhau.
Năm 1965, I. Rechenberg đề xuất ý tưởng đầu tiờn v cỏc chiề ến lược tiến húa, đõy là phương phỏp ụng đó dựng để ố ưu húa cỏc thụng số t i giỏ tr th c trờn cỏc thi t b kĩ thu t, ị ự ế ị ậ vớ d ụ như cỏnh mỏy bay. Nghiờn cứu của Rechenberg sau đú được Schwefel tiếp tục phỏt triển (1975, 1977) và cho đến ngày nay v n là mẫ ột đề tài thu hỳt nhi u nhà nghiờn c u. ề ứ Cựng thời gian đú, năm 1966 Fogel, Owens và Walsh xõy d ng và phỏt tri n k thu t quy ự ể ỹ ậ ho ch tiạ ến húa. Trong kĩ thuật này h ọ đưa ra nhiều phương ỏn khỏc nhau làm ứng c viờn ử cho lời giả ối đ i với một bài toỏn nào đú, rồi biểu diễn những phương ỏn lời giải này như nh ng mỏy tr ng ữ ạ thỏi hữu h n (ạ finite state machines). Sau đú là tiế- n hành một số thay đổi ng u nhiờn trờn biẫ ểu đồ thay đổi trạng thỏi (state transition diagram) với hy vọ- ng chỳng cú thể ẽ ến đổ s bi i thành nh ng l i giải tốt hơn. Cuốữ ờ i cựng là ch n lấ ờọ y l i giải tốt nh t thu ấ được. K thu t quy ho ch tiỹ ậ ạ ến húa cũng là một lĩnh vực nghiờn c u thu hỳt nhi u s chỳ ý ứ ề ự cho tới hiện nay.
Thuật toỏn di truyền được John Holland cựng với sinh viờn và đồng nghi p c a mỡnh ệ ủ ở trường đại học Michigan phỏt minh và phỏt tri n trong nhể ững năm 1960, 1970. Khụng giống như khi Rechenberg đưa ra cỏc chiến lư c tiến húa hay Fogel đề xuất kỹợ thuật quy ho ch ti n húa, mạ ế ục đớch ban đầu c a Holland khi xõy d ng thu t toỏn di truy n khụng ủ ự ậ ề hướng t i vi c gi i quy t m t bài toỏn c th nào. ễng mu n nghiờn c u m t cỏch khỏi ớ ệ ả ế ộ ụ ể ố ứ ộ quỏt v hiề ện tư ng thớch nghi trong tựợ nhiờn và cỏch thức đưa cơ chế thớch nghi này ỏp d ng vào trong h ụ ệ thống mỏy tớnh. Năm 1975, Holland cho xuất bản cuốn sỏch Adaptation in natural and artificial systems (sự thớch nghi trong cỏc h ệ thống t nhiờn và nhõn tự ạo). Trong cuốn sỏch này ụng đó đưa ra những mụ t ả cho mụ hỡnh cơ bản của thuật toỏn di truyền và ụng coi thu t toỏn di truyậ ền như một sự mụ ph ng t quỏ trỡnh ti n húa thớch ỏ ừ ế nghi trong tự nhiờn, đồng thời cũng xõy dựng nh ng n n t ng lý thuyữ ề ả ết cơ sở cho hoạt động c a thu t toỏn di truy n. ủ ậ ề
Như vậy, đồng thời nhưng độ ậc l p v i nhau, cỏc chiớ ến lược ti n húa, quy ho ch ti n húa và ế ạ ế thu t toỏn di truyậ ền đó hỡnh thành nờn những n n tề ảng ban đầu cho tớnh toỏn ti n húa. ế
Ngoài 3 lĩnh vực trờn, cũn cú r t nhi u cỏc cụng trỡnh nghiờn c u c a m t s nhà khoa học ấ ề ứ ủ ộ ố khỏc như Box (1957), Friedman (1959), Bledsoe (1961), Bremermann (1962), Baricelli (1967)… nh m xõy d ng thuằ ự ật toỏn giải cỏc bài toỏn tối ưu húa, học mỏy hay để ắm rừ n hơn quỏ trỡnh thực nghi m. Cỏch làm c a h ệ ủ ọ khụng đi theo cỏc chiến lư c ti n húa, quy ợ ế ho ch ti n húa hay thu t toỏn di truyạ ế ậ ền nhưng họ cú một điểm chung với 3 lĩnh vực này là ý tưởng cũng bắt ngu n t vi c h c t p và mụ ph ng s ti n húa trong t nhiờn. Vỡ v y ồ ừ ệ ọ ậ ỏ ự ế ự ậ nh ng cụng trỡnh cữ ủa họ cũng đúng gúp vào sự phỏt tri n chung c a tớnh toỏn ti n húa. ể ủ ế Năm 1992, John Koza phỏt triể ận l p trỡnh genetic nh m t ng tằ ự độ ạo ra cỏc chương trỡnh mỏy tớnh cú th hoể ạt động được để ả gi i quyết một bài toỏn nào đú. Để làm được điều này, l p trỡnh genậ etic cần cú phỏt biểu của bài toỏn ở ức cao tứ m c là nú c n biầ ết những gỡ c n ầ phải được hoàn thành, rồi sau đú sẽ ự độ t ng sản sinh ra chương trỡnh mỏy tớnh tương ứng để ải bài toỏn đú. Người ta đó biế gi t được cú 36 chương trỡnh khỏc nhau do lập trỡnh genetic tự độ ng sinh ra cú chất lượng khụng thua kộm chương trỡnh do con người viết ra. Những chương trỡnh này chủ ếu dựng để ải cỏc bài toỏn trong cỏc lĩnh vực như sinh họ y gi c phõn t ử tớnh toỏn (computational molecular biology), m ng s p x p (ạ ắ ế sorting networks), t ng hổ ợp thiết kế theo topo và theo kớch thước cỏc thành phần cho cỏc mạch điệ ử ộn t , b điều khi n controller… Ta cú th k tờn m t s ể ể ể ộ ố chương trỡnh đú như chương trỡnh tỡm m ng s p x p cho 7 ph n t ạ ắ ế ầ ử chỉ sau 16 bước, chương trỡnh tổng h p mợ ạch NAND, chương trỡnh tổng h p m ch chuyợ ạ ển đổi hiệu điện th - ế dũng điện, chương trỡnh nhận dạng đoạn màng ghộp (transmembrane segment) cho cỏc protein, chương trỡnh chơi búng đỏ được x p ế ở ị v trớ gi a b ng x p h ng trong giữ ả ế ạ ải Robo Cup 1998 trong đú cú 34 chương trỡnh là con người viết cũng tham gia… Tuy cũn mới m so vẻ ới cỏc lĩnh vực khỏc trong tớnh toỏn ti n ế húa nhưng lập trỡnh genetic l i là lĩnh v c triểạ ự n v ng, thu hỳt r t nhiềọ ấ u s ự chỳ ý và đó tạo thành m t nhỏnh phỏt tri n riờng trong tớnh toỏn ti n húa. ộ ể ế