Phân loại hoa diên vĩ bằng mạng noron kết hợp giải thuật di truyền. trí tuệ nhân tạo AI. Bài toán phân loại hoa diên vĩ sử dụng mạng neeuron kết hợp giải thuật di truyền để tìm trọng số tốt nhất cho bai toán
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG KHOA CƠNG NGHỆ THÔNG TIN BÁO CÁO TIỂU LUẬN MÔN HỌC: Phát triển hệ thống dựa tri thức Giảng viên giảng dạy: PGS TS Nguyễn Quang Hoan ĐỀ TÀI: PHÂN LOẠI HOA DIÊN VĨ SỬ DỤNG MẠNG NEURON LAI VỚI GIẢI THUẬT DI TRUYỀN Mã lớp: H-105 sdt: 0352525024 LỜI CẢM ƠN VÀ CAM ĐOAN Trước tiên em xin gửi lời cảm ơn sâu sắc tới thầy Nguyễn Quang Hoan ln tận tình hướng dẫn, tạo điều kiện thời gian bảo em kiến thức chuyên môn, cách thức làm việc kinh nghiệm thực tế suốt trình thực đề tài Em xin cam đoan nội dung em thực hướng dẫn trực tiếp thầy Nguyễn Quang Hoan Mọi nội dung tham khảo luận văn trích dẫn rõ ràng tác giả, tên cơng trình, thời gian địa điểm cơng bố Mọi chép không hợp lệ, vi phạm quy chế đào tạo hay gian lận em xin chịu hoàn toàn trách nhiệm Trong trình thực nghiên cứu em cố gắng tìm hiểu, trau dồi kiến thức để hồn thành cách tốt Tuy nhiên với kinh nghiệm hạn chế non kém, đồ án khơng thể tránh khỏi thiếu sót Vì vậy, em mong nhận bảo, đóng góp thầy để bổ sung thiếu hụt nâng cao kiến thức Làm tảng để phục vụ cho cơng tác thực tế sau Em xin chân thành cảm ơn! Hà Nội, ngày 03 tháng 05 năm 2023 HỌC VIÊN DANH MỤC VIẾT TẮT Từ viết tắt GA KNN ANN MIMO NST ReLU Tiếng Anh Nghĩa tiếng Việt Genetic Algorithm K-Nearest Neighbors Artificial Neural Networks Multiple-Input Multiple-Output Giải thuật di truyền K láng giềng gần Mạng Nơ-ron nhân tạo Nhiều đầu vào đầu Chromosome Nhiễm sắc thể Rectified Linear Unit Hàm kích hoạt phi tuyến tính DANH MỤC CÁC BẢNG VÀ HÌNH VẼ STT Tên Hình 1.1 Hình 1.2 Hình 2.1 Hình 2.2 Hình 2.3 Hình 2.4 Bảng 2.1 Hình 3.1 Hình 4.1 Hình 4.2 Hình 4.3 Hình 4.4 Hình 4.5 Hình 4.6 Hình 4.7 Hình 4.8 Chú giải Hoa diễn vĩ Các loại hoa diên vĩ Tế bào thần kinh Mơ hình cấu trúc tế bào thần kinh Cấu trúc mạng neuron Cấu trúc neuron Bảng hàm kích hoạt Các bước giải thuật di truyền Sơ đồ thuật toán Code load iris dataset Code in input nhãn Code quy định nhãn Code khởi tạo model Code xây dựng hàm giá Code thuật toán di truyền Kết demo MỞ ĐẦU • Lý chọn đề tài Bài toán nhận dạng mẫu (Pattern Recognition) vấn đề quan trọng nhiều lĩnh vực Trường hợp đối tượng cần nhận dạng với đặc trưng có phi tuyến, độ phức tạp cao, sử dụng phương pháp giải tích thơng thường để nhận dạng khó khăn, chí khơng thực Để khắc phục, nhà khoa học sử dụng cơng cụ tính tốn mềm như: hệ mờ,mạng neuron, GA, v.v để nhận dạng đối tượng Việc phân loại hoa diên vĩ vấn đề quan trọng lĩnh vực Sinh học Nông nghiệp Bằng cách sử dụng kỹ thuật Machine Learning Neural Network, xây dựng mơ hình phân loại hiệu để nhận diện phân loại loại hoa diên vĩ Giải thuật di truyền phương pháp tối ưu hoá sử dụng phổ biến Machine Learning, giúp tìm tham số tối ưu cho mơ hình Neural Network Do đó, việc kết hợp giải thuật di truyền vào việc huấn luyện mạng Neural Network giúp cải thiện đáng kể độ xác độ tin cậy mơ hình phân loại Ngoài ra, đề tài cung cấp cho hội để tìm hiểu áp dụng kiến thức kỹ Machine Learning, Neural Network giải thuật di truyền vào thực tế • Mục đích nghiên cứu tiểu luận, đối tượng, phạm vi nghiên cứu • Mục tiêu nghiên cứu tiểu luận Mục tiêu đề tài thiết kế xây dựng mơ hình phân loại xác hiệu sử dụng mạng neuron lai giải thuật di truyền để phân loại loại hoa diên vĩ theo đặc trưng chúng Việc áp dụng mạng neuron lai giải thuật di truyền vào toán phân loại hoa diên vĩ giúp cải thiện độ xác mơ hình phân loại, đồng thời giúp tối ưu hóa q trình huấn luyện giảm thiểu thời gian chi phí đào tạo mơ hình Mục tiêu chủ đề tạo mơ hình phân loại hoa diên vĩ xác hiệu quả, áp dụng để phân loại lồi hoa khác tương lai • Đối tượng phạm vi nghiên cứu • Đối tượng nghiên cứu Đối tượng nghiên cứu là: Đối tượng nghiên cứu đề tài "Phân loại hoa diên vĩ sử dụng mạng neuron lai với giải thuật di truyền" loài hoa diên vĩ (Iris), cụ thể liệu Iris dataset chứa thông tin bốn đặc trưng ba loài hoa diên vĩ: Iris Setosa, Iris Versicolor, Iris Virginica • Phạm vi nghiên cứu Phạm vi nghiên cứu đề tài "Phân loại hoa diên vĩ sử dụng mạng neuron lai với giải thuật di truyền" bao gồm: • • • • Thu thập xử lý liệu loài hoa diên vĩ bao gồm đo kích thước bốn đặc trưng: chiều dài cánh hoa, chiều rộng cánh hoa, chiều dài cánh hoa, chiều rộng đài hoa Thiết lập mơ hình mạng neuron lai kết hợp với giải thuật di truyền để phân loại loài hoa diên vĩ dựa bốn đặc trưng Đánh giá độ xác mơ hình cách sử dụng tập liệu kiểm tra So sánh độ xác mơ hình với phương pháp phân loại khác học máy, học sâu, học có giám sát, học khơng giám sát Phạm vi nghiên cứu giúp xây dựng hệ thống phân loại tự động cho lồi hoa diên vĩ, ứng dụng nhiều lĩnh vực khoa học địa chất, sinh thái học, nơng nghiệp mơi trường • Phương pháp nghiên cứu Phương pháp nghiên cứu đề tài bao gồm: • Thu thập liệu: Sử dụng liệu hoa diên vĩ (Iris Dataset) có sẵn thư viện Scikit-learn • Tiền xử lý liệu: Thực chuẩn hóa liệu để đưa khoảng giá trị, chia liệu thành hai tập train test theo tỷ lệ 70- • • • • 30% Huấn luyện mơ hình: Sử dụng mạng neuron lai với giải thuật di truyền để huấn luyện mơ hình phân loại hoa diên vĩ Đánh giá mơ hình: Đánh giá mơ hình cách tính tốn độ xác tập liệu test So sánh với phương pháp khác: So sánh mơ hình với phương pháp phân loại khác phân loại SVM, phân loại Naive Bayes Trình bày kết quả: Trình bày kết mơ hình báo cáo nghiên cứu • Lịch sử nghiên cứu tích hợp mạng neuron GA cho toán nhận dạng mẫu Việc tích hợp mạng neuron giải thuật di truyền (GA) nghiên cứu áp dụng lĩnh vực nhận dạng mẫu suốt nhiều năm Đây phương pháp phổ biến để giải toán phân loại Một nghiên cứu sớm việc tích hợp mạng neuron GA thực vào năm 1995 Deb đồng nghiệp báo "A neural network method for multi-objective optimization" Nghiên cứu mô tả phương pháp để sử dụng GA để tối ưu hóa trọng số mạng neuron Sau đó, nhiều nghiên cứu khác thực để nghiên cứu hiệu việc tích hợp mạng neuron GA toán phân loại nhận dạng mẫu Năm 2000, Goldberg Deb đề xuất phương pháp để sử dụng GA để tối ưu hóa cấu trúc mạng neuron Cùng năm đó, Ishibuchi đồng nghiệp đề xuất phương pháp khác để tối ưu hóa trọng số cấu trúc mạng neuron sử dụng GA Với phát triển mạng neuron sâu gia tăng khả tính tốn, việc tích hợp mạng neuron GA sử dụng rộng rãi nhiều toán phân loại nhận dạng mẫu CHƯƠNG I: TỔNG QUAN VỀ PHÂN TÍCH ĐỀ TÀI • Giới thiệu toán phân loại hoa diên vĩ Hoa diên vĩ hay Iris loài thuộc chi Diên Vĩ (Iridaceae), họ hàng với Lay ơn Tên gọi Diên Vĩ theo tên chi, Iris tên theo tiếng Anh Chi Diên Vĩ có đến 1800 loài khác phân bố rộng khắp giới Hình 1.1 Hoa diên vĩ Hoa Diên Vĩ lồi thân thảo, cao trung bình 40-80cm Lá xanh lục hình lưỡi kiếm Bài tốn phân loại hoa diên vĩ toán phân loại lĩnh vực học máy thị giác máy tính Hoa diên vĩ lồi hoa thường sử dụng nghiên cứu làm việc với học máy tính đa dạng chúng Các lồi hoa diên vĩ khác phân loại dựa đặc trưng chúng chiều dài chiều rộng cánh hoa lá, chiều dài nhị hoa cột hoa Bài tốn phân loại hoa diên vĩ địi hỏi mơ hình học máy có khả học từ liệu huấn luyện dự đốn lồi hoa mẫu hoa dựa đặc trưng chúng Việc phân loại loài hoa diên vĩ có ứng dụng nhiều lĩnh vực, từ khoa học đến sản xuất, tính đa dạng lồi hoa diên vĩ tính ứng dụng chúng nhiều lĩnh vực khác Hoa diên vĩ loại hoa phổ biến sử dụng nhiều nghiên cứu khoa học công nghệ Tuy nhiên, khơng phải phân biệt loài hoa diên vĩ với dựa đặc điểm hình dáng kích thước Vì vậy, việc phân loại hoa diên vĩ sử dụng công nghệ máy tính đưa để giúp cho cơng việc trở nên dễ dàng Bài toán phân loại hoa diên vĩ toán phân loại đa lớp (multi-class classification), mẫu liệu phân loại vào lớp hoa diên vĩ khác dựa đặc trưng hình dáng kích thước hoa Việc phân loại hoa diên vĩ sử dụng nhiều lĩnh vực khác nghiên cứu sinh học, công nghệ, khoa học liệu, đơn giản để phục vụ nhu cầu cá nhân Trong đề tài này, sử dụng mạng neuron nhân tạo với giải thuật di truyền (GA) để phân loại hoa diên vĩ Giải thuật di truyền sử dụng để tối ưu hóa tham số mạng neuron nhằm cải thiện độ xác mơ hình phân loại Mơ hình xây dựng giúp phân loại loại hoa diên vĩ khác cách xác nhanh chóng • Một số phương pháp phân loại hoa diên vĩ Hoa diên vĩ chia làm loại: - Setosa - Versicolour - Virginica Hình 1.2 Các loại hoa diên vĩ Về bản, để phân biệt hoa diên vĩ cần phân biệt dựa theo cấu tạo cây: - Chiều dài (cm) - Chiều rộng (cm) - Chiều dài cánh hoa (cm) - Chiều rộng cánh hoa (cm) Có nhiều phương pháp khác để phân loại hoa diên vĩ, bao gồm phương pháp thống kê, truyền thống học máy Sau số phương pháp phân loại phổ biến: • K-nearest neighbors (KNN): KNN phương pháp học có giám sát, dựa việc tìm điểm liệu có đặc trưng gần với điểm liệu cụ thể để phân loại vào lớp định • Decision tree: Decision tree phương pháp học có giám sát dựa việc tạo định để phân loại liệu Cây định bao gồm nút biểu diễn thuộc tính cạnh biểu diễn định • Random forest: Random forest phương pháp học có giám sát dựa việc tạo nhiều định ngẫu nhiên để phân loại liệu Kết tính cách lấy trung bình phiếu bầu định • Support vector machine (SVM): SVM phương pháp học có giám sát dựa việc tìm siêu mặt phẳng tốt để phân chia điểm liệu khơng gian đặc trưng • Neural networks: Neural networks loại phương pháp học sâu, lấy cảm hứng từ cấu trúc não Nó bao gồm nhiều lớp nơ-ron kết nối với để tạo mơ hình phân loại tốt Các phương pháp có ưu điểm hạn chế riêng tùy thuộc vào liệu cụ thể yêu cầu toán mà phương pháp phù hợp hơn.Và báo cáo tiểu luận phân loại sử dụng mạng neural lai với giải thuật di truyền CHƯƠNG II: TỔNG QUAN VỀ MẠNG NƠ RON NHÂN TẠO Mạng neuron nhân tạo (Artificial Neural Networks – ANN) hệ thống xây dựng dựa nguyên tắc cấu tạo não người Nó cho hướng nghiên cứu hệ thống thơng tin Mạng neuron nhân tạo thực tốn: Tính tốn gần hàm số, thực toán tối ưu, nhận mẫu, nhận dạng điều khiển đối tượng hiệu so với phương pháp truyền thống 15 Mạng neuron nhân tạo có số lượng lớn mối liên kết phần tử biến đổi có liên kết song song Nó có hành vi tương tự não người với khả học tổng hợp thông tin từ luyện tập tập mẫu liệu Các phần tử biến đổi mạng neuron nhân tạo gọi neuron nhân tạo gọi tắt neuron Hàm truyền Hard Limit Symmetrical Hard Limit (hardlims) Linear (purelin) Symmetric Saturating Linear Unipolar Sigmoid (Hàm Sigmoid đơn cực) Đồ thị Định nghĩa a=0n1 Hàm sử dụng cho mạng huấn luyện thuật tốn Lan truyền ngược, dễ lấy đạo hàm, giảm đáng kể tính tốn trình huấn luyện mạng Hàm ứng dụng cho chương trình ứng dụng mà đầu mong muốn rơi vào khoảng [0,1] ReLU Hàm ReLU sử dụng nhiều năm gần huấn luyện mạng neuron ReLU đơn giản lọc giá trị < Bảng 2.1 Bảng hàm kích hoạt Các tính chất mạng nơ-ron • Là hệ phi tuyến: Mạng neuron có khả to lớn lĩnh vực nhận dạng điều khiển đối tượng phi tuyến • Là hệ xử lý song song: Mạng neuron có cấu trúc song song, có độ tính tốn cao, phù hợp với lĩnh vực nhận dạng điều khiển • Là hệ học thích nghi: Mạng luyện từ số liệu khứ có khả tự chỉnh số liệu đầu vào bị mất, điều khiển online • Là hệ nhiều biến, nhiều đầu vào, nhiều đầu (MIMO), tiện dùng đối tượng điều khiển có nhiều biến số • Ngun tắc hoạt động mạng nơ-ron nhân tạo Ta thấy neuron lớp nhận tín hiệu đầu vào lúc Do đó, nguyên tắc chúng xử lý song song Hoạt động mạng neuron xem hoạt động hệ thống xử lý thông tin cấu thành từ nhiều phần tử hoạt động song song Khi mạng neuron hoạt động, thành phần vectơ tín hiệu vào x = ( x1, x2, , xN) đưa vào mạng, tiếp neuron lớp ẩn lớp kích hoạt Sau q trình tính tốn neuron mạng kích hoạt hồn tồn cho vectơ tín hiệu đầu y = (y1 , y2 , , yk) S neuron lớp ra, Ta coi mạng neuron bảng tra cứu y x mà không cần biết hàm quan hệ tường minh y theo x Sự khác biệt mạng neuron hệ thống xử lý thơng thường khả thích nghi với liệu vào Đó ma trận trọng số độ lệch (hệ số bias) mạng hiệu chỉnh để mạng thích nghi với tốn đặt Quá trình hiệu chỉnh trọng số hệ số bias CHƯƠNG III: GIẢI THUẬT DI TRUYỀN • Giới thiệu Từ trước đến nay, nghiên cứu ứng dụng tin học xuất nhiều tốn chưa tìm phương pháp giải nhanh hợp lý Phần lớn tốn tối ưu nảy sinh ứng dụng Để giải tốn người ta thường phải tìm đến giải thuật hiệu mà kết thu xấp xỉ tối ưu Trong nhiều trường hợp sử dụng giải thuật xác suất, khơng bảo đảm kết tối ưu chọn giá trị cho sai số đạt nhỏ mong muốn Theo lời giải xác suất, việc giải tốn quy q trình tìm kiếm khơng gian tập hợp lời giải Tìm lời giải tốt trình hiểu tối ưu Với miền tìm kiếm nhỏ, số thuật toán cổ điển sử dụng Tuy nhiên miền lớn, phải sử dụng kỹ thuật trí tuệ nhân tạo đặc biệt, giải thuật di truyền cơng cụ Ý tưởng GA mơ mà tự nhiên thực GA hình thành dựa quan niệm cho rằng: q trình tiến hố tự nhiên q trình hồn hảo nhất, hợp lý tự mang tính tối ưu Giải thuật di truyền áp dụng q trình tiến hóa tự nhiên để giải toán tối ưu thực tế (từ tập lời giải ban đầu thơng qua nhiều bước tiến hóa hình thành tập hợp với lời giải tốt cuối tìm lời giải gần tối ưu) Giải thuật di truyền (Genetic Algorithm: GA) kỹ thuật chung giúp giải vấn đề-bài tốn cách mơ tiến hóa người hay sinh vật nói chung (dựa thuyết tiến hóa mn lồi Darwin) điều kiện qui định sẵn môi trường Mục tiêu GA không đưa lời giải xác mà đưa lời giải tương đối tối ưu Mục tiêu GA khái qt sau: Trừu tượng hố mơ q trình thích nghi hệ thống tự nhiên Thiết kế phần mềm, chương trình mơ phỏng, nhằm trì chế quan trọng hệ thống tự nhiên Giải thuật di truyền sử dụng số thuật ngữ ngành di truyền học như: NST, quần thể (Population), Gen NST tạo thành từ Gen (được biểu diễn chuỗi tuyến tính từ Gen) Mỗi Gen mang số đặc trưng có vị trí định NST Mỗi NST biểu diễn lời giải toán Bảng cho biết khái niệm thuật ngữ tham số sinh học chuyển đổi sang CNTT • Tư tưởng giải thuật di truyền (Genetic Algorithm - GA) Giải thuật di truyền loại thuật tốn mơ tượng tự nhiên: kế thừa đấu tranh sinh tồn để cải tiến lời giải khảo sát không gian lời giải Khái niệm kế thừa đấu tranh sinh tồn giải thích qua ví dụ tiến hố quần thể thỏ sau: Có quần thể thỏ Trong số có số nhanh nhẹn thơng minh khác Những thỏ nhanh nhẹn thơng minh có xác suất bị chồn, cáo 39 ăn thịt nhỏ hơn, chúng tồn để làm tốt có thể: tạo thêm nhiều thỏ tốt Dĩ nhiên, số thỏ chậm chạp, đần độn sống may mắn Quần thể thỏ cịn sống sót bắt đầu sinh sản Việc sinh sản tạo hỗn hợp tốt “nguyên liệu di truyền thỏ”: Một số thỏ chậm chạp có với thỏ nhanh, số thỏ nhanh với thỏ nhanh, số thỏ thông minh với thỏ đần độn,… Và tất cả, thiên nhiên lại ném vào thỏ “hoang dã” cách làm đột biến nguyên liệu di truyền thỏ Những thỏ con, kết nhanh thông minh quần thể gốc có nhiều bố mẹ nhanh nhẹn thơng minh thoát chết khỏi chồn, cáo (Thật chồn cáo trải qua tiến trình tương tự, khơng thỏ trở nên nhanh chóng thơng minh chồn, cáo khơng thể bắt chúng được) Khi tìm kiếm lời giải tối ưu, GA thực bước tương ứng với câu chuyện đấu tranh sinh tồn loài thỏ GA sử dụng thuật ngữ vay mượn di truyền học Ta nói cá thể (hay kiểu gen, cấu trúc) quần thể, cá thể gọi nhiễm sắc thể (chromosome) Điều gây chút nhầm lẫn: tế bào thể chủng loại cho mang số loại nhiễm sắc thể (ví dụ người có 46 nhiễm sắc thể), GA ta nói cá thể có nhiễm sắc thể Các nhiễm sắc thể tạo thành từ đơn vị - gen - biểu diễn chuỗi tuyến tính Mỗi gen kiểm sốt nhiều đặc trưng Gen với đặc trưng định có vị trí định nhiễm sắc thể Bất đặc trưng cá thể tự biểu cách phân biệt gen nhận số giá trị khác Một nhóm gen (nhiễm sắc thể) biểu diễn lời giải toán giải (ý nghĩa, cấu trúc nhiễm sắc thể người sử dụng xác định trước) Một tiến trình tiến hố thực quần thể nhiễm sắc thể tương ứng với q trình tìm kiếm lời giải khơng gian lời giải Thực ra, GA thuộc lớp thuật toán xác suất, lại khác thuật toán ngẫu nhiên chúng kết hợp phần tử tìm kiếm trực tiếp ngẫu nhiên Khác 40 biệt quan trọng phương pháp tìm kiếm GA phương pháp tìm kiếm khác GA trì xử lý tập lời giải (quần thể) - tất phương pháp khác xử lý điểm khơng gian tìm kiếm Chính thế, GA mạnh phương pháp tìm kiếm có nhiều Cấu trúc giải thuật di truyền đơn giản tương tự cấu trúc chương trình tiến hố Phép lai cho phép trao đổi thơng tin lời giải Khác với phép lai, phép đột biến thay đổi cách ngẫu nhiên hay nhiều gen nhiễm sắc thể chọn, thay đổi thực với xác suất thể tốc độ đột biến Phép đột biến cho phép đưa thêm thông tin vào quần thể làm cho chất liệu di truyền phong phú thêm • Cấu trúc giải thuật di truyền đơn giản Trong giải thuật di truyền đơn giản, hệ gen cá thể biểu diễn thành chuỗi nhị phân gồm giá trị Mỗi thành phần chuỗi số gọi allele (gen tương ứng) Giải thuật di truyền đơn giản bao gồm tốn tử sau: • • Tái tạo (Reproduction) • Lai ghép (Crossover) • Đột biến (Mutation) Tái tạo Tái tạo q trình chuỗi biểu diễn cá thể chép lại tuỳ theo giá trị hàm mục tiêu f (hàm thích nghi) Tốn tử xem q trình chọn lọc tự nhiên Hàm mục tiêu f(i) gán cho cá thể quần thể Việc chép lại chuỗi tuỳ theo giá trị thích nghi chúng có nghĩa là: Những chuỗi có giá trị thích nghi cao có nhiều hội đóng góp chuỗi cho hệ Thao tác sinh sản hay gọi thao tác chọn cha mẹ điều khiển cách quay bánh xe roulette, chuỗi quần thể chiếm khe có kích thước tỉ lệ với độ thích nghi (fitness) bánh xe • Lai ghép Mỗi chuỗi chọn để sinh sản, xác chuỗi tạo Các đưa vào bể ghép đôi (matingpool) Tốn tử lai ghép đơn giản tiến hành theo hai bước: Bước 1: Các thành viên chuỗi đơn giản bể ghép ghép đôi với cách ngẫu nhiên Bước 2: Mỗi cặp chuỗi trải qua việc ghép chéo sau: Một số nguyên vị trí k dọc theo chuỗi lựa chọn qua giá trị ngẫu nhiên nằm khoảng từ đến chiều dài chuỗi L-1 ([1, L-1]) Hai chuỗi tạo cách hoán đổi tương ứng chuỗi ký tự từ vị trí đến k từ k+1 đến L hai chuỗi cha-mẹ cho Cơ chế sinh sản ghép chéo đơn giản, bao gồm việc sinh số ngẫu nhiên, chép chuỗi trao đổi chuỗi thành phần Tuy nhiên, điểm cần nhấn mạnh việc sinh sản trao đổi thơng tin có cấu trúc (dù cách ngẫu nhiên) trình ghép chéo làm cho giải thuật di truyền tang thêm sức mạnh • Đột biến Nếu sinh sản theo độ thích nghi kết hợp với ghép chéo cho giải thuật di truyền có lực xử lý tốt hơn, đột biến đóng vai trò định thứ hai hoạt động giải thuật di truyền Sự đột biến cần thiết vì: cho dù sinh sản ghép chéo tìm kiếm hiệu tái kết hợp lại gen với nhau, chúng làm vài gen hữu ích (bít hay bít vị trí đặc biệt đó) Trong hệ thống gen nhân tạo, tốn tử đột biến chống lại mát không khơi phục Trong giải thuật di truyền đơn giản, đột biến thay đổi ngẫu nhiên không thường xuyên (với xác xuất nhỏ) trị số vị trí chuỗi Trong việc mã hóa nhị phân tốn hộp đen có nghĩa cần đổi thành ngược lại Sự đột biến hoạt động ngẫu nhiên không gian chuỗi, dùng với sinh sản ghép chéo sách bảo hiểm chống lại nguy mát gen quan trọng Ba toán tử tái tạo, lai ghép, đột biến áp dụng lặp lặp lại để tạo nhiễm sắc thể Coi hệ tương ứng với trình sinh sản