Nối tiếp phần 1, phần 2 của bài giảng Các hệ thống dựa trên tri thức tiếp tục trình bày các nội dung chính sau: Giải thuật di truyền; Các toán tử trong giải thuật di truyền; Đặc tính của hệ tính toán mềm; Hệ lai nơ ron mờ; Biểu diễn luật If-Then theo cấu trúc mạng nơ ron; Phân loại kết hợp mạng nơ ron và logic mờ. Mời các bạn cùng tham khảo để nắm nội dung chi tiết.
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG KHOA CÔNG NGHỆ THÔNG TIN BÀI GIẢNG CÁC HỆ THỐNG DỰA TRÊN TRI THỨC NGUYỄN QUANG HOAN HàNội 2017 CHƯƠNG 5: GIẢI THUẬT DI TRUYỀN Khái niệm về giải thuật di truyền 5.1 Giải thuật di truyền (Genetic Algorithm: GA) là kỹ thuật chung giúp giải quyết vấn đềbài toán cách mơ tiến hóa người hay sinh vật nói chung (dựa thuyết tiến hóa muôn loài Darwin) điều kiện qui định sẵn môi trường Mục tiêu GA không đưa lời giải chính xác mà đưa lời giải tương đối tối ưu Mục tiêu GA khái quát sau: - Trừu tượng hố mơ q trình thích nghi hệ thống tự nhiên Thiết kế phần mềm, chương trình mơ phỏng, nhằm trì chế quan trọng hệ thống tự nhiên Giải thuật di truyền sử dụng số thuật ngữ ngành di truyền học như: NST, quần thể (Population), Gen NST tạo thành từ Gen (được biểu diễn chuỗi tuyến tính từ Gen) Mỗi Gen mang số đặc trưng và có vị trí định NST Mỗi NST 78 biểu diễn lời giải bài toán Bảng cho biết khái niệm thuật ngữ và tham số sinh học và chuyển đổi sang CNTT Sinh học STT Công nghệ Thông tin Gen Hệ đếm: Nhị phân, Bát phân, Hecxa, Thập phân Nhiễm sắc thể Tập hợp n bit Ví dụ, n=5 cụ thể NST[01100] Quần thể Tập hợp nhiểu NST Thế hệ 5.2 (011001, 00000, 11111) Các toán tử giải thuật di truyền 5.2.1 Toán tử sinh sản Toán tử sinh sản gồm hai trình: sinh sản (phép tái sinh), chọn lọc (phép chọn) a) Phép tái sinh: trình NST chép sở độ thích nghi Độ thích nghi là hàm gán giá trị thực, tương ứng với NST q̀n thể Q trình này, mơ tả sau: Xác định độ thích nghi NST quần thể thế hệ thứ t, lập bảng cộng dồn giá trị thích nghi (theo thứ tự gán cho nhiễm sắc thể) Giả sử, quần thể có n cá thể Gọi độ thích nghi NSTi tương ứng là fi tổng cộng dồn thứ i fti xác định bởi: 𝑓𝑡𝑗 = ∑𝑡𝑗=1 𝑓𝑗 (5.1) Gọi Fn là tổng độ thích nghi toàn quần thể Chọn số ngẫu nhiên f khoảng từ tới Fn Chọn cá thể thứ k đầu tiên thoả mãn f ≥ ftk đưa vào quần thể b) Phép chọn: là trình loại bỏ NST thích nghi q̀n thể Q trình này mơ tả sau: - Sắp xếp quần thể theo thứ tự mức độ thích nghi giảm dần - Loại bỏ NSTở cuối dãy Giữ lại n cá thể tốt 5.2.2 Toán tử ghép chéo 79 Ghép chéo là trình tạo NST sở NST cha-mẹ cách ghép đoạn NST cha-mẹ với Toán tử ghép chéo gán với xác suất pc Q trình mơ tả sau: Chọn ngẫu nhiên cặp NST (cha-mẹ) quần thể Giả sử, NST cha-mẹ có độ dài m Tạo số ngẫu nhiên khoảng từ tới m-1 (gọi là điểm ghép chéo) Điểm ghép chéo chia NSTcha-mẹ thành hai chuỗi có độ dài m1, m2 Hai chuỗi tạo thành là: m11+ m22 m21+m12 Đưa hai NST vào quần thể 5.2.3 Toán tử đột biến Đột biến là tượng NST mang số đặc tính khơng có mã di truyền chamẹ • Chọn ngẫu nhiên NST quần thể; • Tạo số ngẫu nhiên k khoảng từ tới m,1 ≤ k ≤ m ; • Thay đổi bit thứ k Đưa NST này vào quần thể để tham gia q trình tiến hố thế hệ tiếp theo 5.3 Giải thuật di truyền 5.3.1 Các bước của giải thuật di truyền Một giải thuật di truyền đơn giản bao gồm bước sau: Bước 1: Khởi tạo quần thể ban đầu gồm chuỗi nhiễm sắc thể Bước 2: Xác định giá trị mục tiêu cho NST tương ứng Bước 3: Tạo NST dựa toán tử di truyền Bước 4: Xác định hàm mục tiêu cho NST và đưa vào quần thể Bước 5: Loại bớt NST có độ thích nghi thấp Bước 6: Kiểm tra thỏa mãn điều kiện dừng Nếu điều kiện đúng, lấy NST tốt nhất, giải thuật dừng lại; ngược lại, quay bước 80 Hình 5.1 : Cấu trúc thuật giải di truyền tổng quát Bắt đầu t =0; Khởi tạo P(t) Tính độ thích nghi cho cá thể thuộc P(t); Khi (điều kiện dừng chưa thỏa) lặp t = t + 1; Chọn lọc P(t); Lai ghép P(t); Đột biến P(t); Hết lặp Kết thúc 5.3.2 Các công thức của giải thuật di truyền Tính độ thích nghi eval(vi) NST vi (i =1 kích thước quần thể): 81 𝑒𝑣𝑎𝑙(𝑣𝑖 ) = 𝑓(𝑣𝑖 ) 𝑘í𝑐ℎ 𝑡ℎướ𝑐 𝑞𝑢â𝑛 𝑡ℎể ∑𝑖=1 𝑓(𝑣𝑖 ) (5.2) Với f (vi) là hàm mục tiêu Tìm tổng giá trị thích nghi quần thể 𝑘í𝑐ℎ 𝑡ℎướ𝑐 𝑞𝑢â𝑛 𝑡ℎể 𝐹 = ∑𝑖=1 𝑒𝑣𝑎𝑙(𝑣𝑖 ) (5.3) Tính xác suất chọn pi cho NST vi 𝑝𝑖 = 𝑒𝑣𝑎𝑙(𝑣𝑖 ) 𝑡ℎướ𝑐 𝑞𝑢â𝑛 𝑡ℎể ∑𝑘í𝑐ℎ 𝑒𝑣𝑎𝑙(𝑣𝑖 ) 𝑖=1 (5.4) Tính xác suất tích lũy qi cho NSTvi 𝑞𝑖 = ∑𝑖𝑗=1 𝑝𝑖 (5.5) Tiến trình chọn lọc thực cách quay bánh xe rulet kích thước quần thể Mỗi lần chọn NST từ quần thể hành vào quần thể theo cách sau: Phát sinh số ngẫu nhiên r khoảng [0, 1] Nếu r < q1 chọn NST v1, ngược lại chọn NSTvi (2 ≤ i ≤ kích thước quần thể) cho qi-1 < r ≤ qi a Hàm mục tiêu Cứ sau thế hệ hình thành, cần tính lại độ thích nghi cho cá thể để chuẩn bị cho thế hệ Do số lượng cá thể tăng lên, độ thích nghi cá thể khơng có chênh lệch đáng kể Do đó, cá thể có độ thích nghi cao chưa hẳn chiếm ưu thế thế hệ tiếp theo Vì vậy, cần ấn định tỷ lệ hàm thích nghi nhằm tăng khả cho NST đạt độ thích nghi cao Có chế định tỷ lệ sau: Định tỷ lệ tuyến tính Độ thích nghi xác định theo công thức: 𝑓(𝑣𝑖 )′ = 𝑎 ∗ 𝑓 (𝑣𝑖 ) + 𝑏 (5.6) Cần chọn tham số a, b cho độ thích nghi trung bình ánh xạ vào chính Tăng độ thích nghi tốt cách nhân với độ thích nghi trung bình Cơ chế này tạo giá trị âm cần xử lý riêng Ngoài ra, tham số a, b thường gắn với đời sống quần thể và khơng phụ thuộc vào bài tốn 82 Phép cắt Sigma Phương pháp này thiết kế vừa để cải tiến phương pháp định tỷ lệ tuyến tính vừa để xử lý giá trị âm, vừa kết hợp thơng tin mà bài tốn phụ thuộc Ở đây, độ thích nghi tính theo công thức: ̅̅̅̅̅̅̅ (𝑣𝑖 ) − 𝑐 ∗ 𝜎) 𝑓(𝑣𝑖 )′ = 𝑓 (𝑣𝑖 ) + ( 𝑓 (5.7) Trong c là số nguyên nhỏ (thường lấy giá trị từ tới 5);σ là độ lệch chuẩn quần thể Với giá trị âm f' thiết lập Định tỷ lệ cho luật dạng luỹ thừa Trong phương pháp này, độ thích nghi lúc khởi tạo có lực đặc biệt: 𝑓(𝑣𝑖 )′ = 𝑓 (𝑣𝑖 ) 𝑘 (5.8) với k gần Tham số k định tỷ lệ hàm f(.) Tuy nhiên, số nhà nghiên cứu cho nên chọn k độc lập với bài toán Bằng thực nghiệm cho thấy nên chọn k =1.005 b Điều kiện dừng của giải thuật Chúng ta khảo sát điều kiện đơn giản để dừng số thế hệ vượt ngưỡng cho trước Trong số phiên chương trình tiến hố khơng phải mọi cá thể tiến hố lại Vài cá thể có khả vượt từ thế hệ này sang thế hệ khác mà không thay đổi Trong trường hợp vậy, đếm số lần lượng hàm Nếu số lần lượng hàm vượt xác định trước dừng việc tìm kiếm Chúng ta nhận thấy, điều kiện dừng giả thiết người sử dụng biết đặc trưng hàm, có ảnh hưởng thế nào tới chiều dài tìm kiếm Trong số trường hợp khó xác định số lượng thế hệ (hay lượng giá hàm) phải là Giải thuật kết thúc hội cho cải thiện quan trọng chưa bắt đầu Có hai loại điều kiện dừng Các điều kiện này dùng đặc trưng tìm kiếm để quyết định ngừng trình tìm kiếm: Dựa cấu trúc nhiễm sắc thể: hội tụ quần thể cách kiểm soát số alen hội tụ, alen coi hội tụ nếu số phần trăm quần thể định trước có (hoặc tương đương biểu diễn không nhị phân) giá trị 83 alen Nếu số alen hội tụ vượt số phần trăm nào tổng số alen, việc tìm kiếm kết thúc Dựa ý nghĩa đặc biệt nhiễm sắc thể: đo tiến giải thuật số thế hệ cho trước Nếu tiến nhỏ số ε xác định, kết thúc tìm kiếm 5.4 Ví dụ về giải thuật di truyền 5.4.1 Ví dụ giải thuật di truyền với hàm mợt biến Bài toán: Tìm giá trị lớn hàm (15x-x2) với x khoảng [0;15] Chúng ta giả định x nhận giá trị nguyên, NST xây dựng với gen: Giả sử kích thước quần thể NSTN= Theo tài liệu thống kê dược, trung bình: xác suất lai ghép pc = 0,7, và đột biến pm = 0,001 Hàm f(x) = 15x-x2 GA tạo quần thể NST ban đầu cách điền chuỗi 4-bit với giá trị ngẫu nhiên và Quần thể ban đầu Một vấn đề khó khăn tính tốn là q̀n thể có hàng ngàn nhiễm sắc thể Bước tiếp theo là tính toán phù hợp NSTriêng lẻ Các kết thể Bảng 5.2 Sự tương thích trung bình quần thể ban đầu là 36 Để cải thiện nó, quần thể ban đầu thay đổi cách sử dụng lựa chọn, chéo và đột biến, toán tử di truyền Trong chọn lọc tự nhiên, có loài thích hợp sống sót, giống, và truyền gen cho thế hệ tiếp theo GAS sử dụng cách tiếp cận tương tự, không giống chất, quy mô quần thể NSTkhông thay đổi so thế hệ kế tiếp Bảng 5.2 Bảng quần thể ngẫu nhiên ban đầu nhiễm sắc thể 84 Hình 5.2 Hàm huấn luyện và phân bố nhiễm sắc thể (a)Sự phân bố nhiễm sắc thể ban đầu;(b) Sự phân bố nhiễm sắc thể sau huấn luyện Làm thế nào trì kích thước số, và đồng thời cải thiện tương thích trung bình nó? Cột cuối Bảng 5.2 cho thấy tỷ lệ tương thích NST cá nhân với tổng thể quần thể Tỷ lệ này xác định NST chọn để giao phối Như vậy, NST X5 X6 có hội chọn nhau, NST X3 X4 có xác suất chọn thấp Kết là, tương thích trung bình NSTcải thiện từ thế hệ tiếp theo Một lựa chọn kỹ thuật thường sử dụng NSTlà lựa chọn bánh xe roulette (Goldberg, 1989; Davis, 1991) Hình 5.4.1 minh họa ví dụ chúng tơi Như bạn thấy, NSTđược đưa lát bánh xe tròn Các khu vực slice bánh xe với tỷ lệ NST tương thích (xem Bảng 5.4.1) Ví dụ, NST X5, X6 (NST phù hợp nhất) chiếm diện tích lớn nhất, NST X3 X4 (phù hợp nhất) có phân đoạn nhỏ nhiều bánh xe Để chọn NST cho lai, số ngẫu nhiên tạo khoảng [0; 100], và NST có đoạn kéo dài số ngẫu nhiên chọn Nó giống quay bánh xe trịn nơi NST có phân khúc bánh xe tỷ lệ với tương thích Các bánh xe trịn chia, và mũi tên kèm với phần lại phân đoạn, tương ứng NSTđược chọn 85 Hình 5.3 Vịng trịn lựa chọn (Roulette Wheel Selection) Trong ví dụ chúng tôi, chọn quần thể ban đầu sáu nhiễm sắc thể Vì vậy, để lập quần thể thế hệ tiếp theo, đường tròn tách sáu lần Hai lần đầu tiên chọn NST X6 X2 đến trở thành cha mẹ, cặp thứ hai lần tiếp theo chọn NST X1 X5, và hai lượt cuối chọn NST X2 X5 Khi cặp NST cha mẹ chọn, toán tử chéo áp dụng Làm để lai (hay ghép chéo)? Đầu tiên, nhà ghép chéo chọn ngẫu nhiên điểm giao nơi hai NST cha mẹ khác nhau, và sau trao đổi phần NST sau điểm Kết là, hai đứa tạo Ví dụ, NST X6 X2 vượt qua sau gen thứ hai để sản xuất hai con, thể hình 5.3 Nếu cặp NST khơng vượt qua, sau NST nhân bản, tạo là chính xác cặp bố mẹ Ví dụ như, NST mẹ X2 X5 khơng vượt qua Thay vào đó, họ tạo thế hệ lai là chính xác cặp NSY, thể hình 5.3 86 Hình 6.6 cho ví dụ phân vùng mờ không gian đầu vào 3x3 không gian mờ Chấm đen và trắng biểu thị mô hình huấn luyện lớp và lớp 2, tương ứng Hình 6.9 : Phân vùng mờ lưới mờ × Hình 6.6 cho biết chu kỳ tiến hóa cấu trúc mạng nơ ron phân vùng xem bảng luật Các giá trị ngôn ngữ đầu vào x1 ( 1, 3) tạo trục ngang, giá trị ngôn ngữ đầu vào x2 ( 1, 3) tạo trục dọc Giao hàng và cột cho kết ḷt Trong bảng ḷt, khơng gian mờ có quy luật mờ IF- THEN, tổng số luật tạo lưới là K×K Luật mờ tương ứng với K phân vùng mờ K đại diện dạng chung là: Luật : IF x1pis Ai i = 1, 2,…, k AND x2pis Bj j = 1, 2,…, k THEN xp 𝜖𝐶n {CF𝐶𝐹𝐶𝑛𝐴𝑖𝐵𝑗 } xp = (x1p , x2p ), p = 1, 2,…, p; Trong đó, K là số khoảng mờ trục, là mơ hình huấn luyện đầu vào khơng gian 1×2, P là tổng số mơ hình đào tạo, là hệ luật (trong ví dụ, là hai loại loại 2), và là độ chắn hay khả mơ hình không gian mờ thuộc lớp 108 Để xác định hệ luật và độ chắn, sử dụng thủ tục sau đây: Bước 1:Phân hoạch khơng gian đầu vào K×K mờ, và tính độ mạnh mơ hìnhhuấn luyện mọi khơng gian mờ Mỗi lớp huấn luyện không gian mờ định đại diện mơ hình huấn luyện Hình 6.6 là phân vùng mờ lưới mờ 3x3 từ, không gian mờ, ḷt xác định mơ hình lớp huấn luyện đặc biệt xuất thường xun mơ hình lớp khác Độ mạnh lớp Cn không gian mờ xác định: 𝑝 βCn AiBj = =1,xp Cn(àAi (x1p ) ì àBj (x2p ) ) xp = (x1p , x2p ) (6.28) đó, 𝜇𝐴𝑖(𝑥1𝑝) 𝜇𝐵𝑖(𝑥2𝑝) là hàm thành viên mơ hình xp tập mờ Ai và tập Bj, tương ứng Trong hình 6.6, ví dụ, thế mạnh loại loại không gian mờ 𝐴2𝐵1 tính sau: 𝛽𝐴2𝐵1 𝐶𝑙𝑎𝑠𝑠1=𝜇𝐴2(𝑥4) × 𝜇𝐵1(𝑥4)+𝜇𝐴2(𝑥6) × 𝜇𝐵1(𝑥6)+𝜇𝐴2(𝑥8) × 𝜇𝐵1(𝑥8)+𝜇𝐴2(𝑥15) × 𝛽𝐴2𝐵1 𝐶𝑙𝑎𝑠𝑠1=𝜇𝐴2(𝑥4) × 𝜇𝐵1(𝑥4)+𝜇𝐴2(𝑥6) × 𝜇𝐵1(𝑥6)+𝜇𝐴2(𝑥8) × 𝜇𝐵1(𝑥8)+𝜇𝐴2(𝑥15) × 𝜇𝐵1(𝑥15)= 0.75 × 0.89 + 0.92 × 0.34 + 0.87 × 0.12 + 0.11 × 0.09 + 0.75 × 0.89 = 1.09 𝛽𝐴2𝐵1 𝐶𝑙𝑎𝑠𝑠2 = 𝜇𝐴2(𝑥1) × 𝜇𝐵1(𝑥1) + 𝜇𝐴2(𝑥5) × 𝜇𝐵1(𝑥5) + 𝜇𝐴2(𝑥7) × 𝜇𝐵1(𝑥7) = 0.42 × 0.38+ 0.54 × 0.81 + 0.65 × 0.21 = 0.73 Bước 2:Xác định hậu luật và yếu tố chắn không gian mờcon Khi kết luật xác định lớp mạnh, cần tìm lớp Cm C1 βCm AiBj = 𝑚𝑎𝑥 [βAiBj , βCm AiBj ,…… , βCN AiBj ] (6.29) Nếu lớp huấn luyện đặc biệt có giá trị tối đa, hậu luật xác định là Ví dụ, không gian mờ 1, luật hậu là lớp Sau đó, yếu tố chắn tính: Cm CFAiBj = βCm AiBj − βAiBj Cn ∑𝑁 𝑛=1 βAiBj Với : ∑Nn=1 βCn AiBj βAiBj = n≠m N−2 109 (6.30) Ví dụ, độ chắn (Certainty Factor) luật ứng với không gian mờ tính sau: Class2 CFA2B1 = 21 1.09 − 0.73 = 0.20 1.09 + 0.73 Hình 6.10 : Bảng các luật mờ Làm để giải thích yếu tố chắn đây? Nếu tất mơ hình huấn luyện khơng gian mờ thuộc lớp C, sau yếu tố chắn đạt tối đa; chắn mơ hình không gian thuộc lớp Tuy nhiên, nếu mơ hình huấn luyện thuộc lớp khác và lớp này có thế mạnh tương tự, sau độ chắn đạt tối thiểu và khơng đảm bảo mơ hình thuộc lớp Điều này có nghĩa là mơ hình khơng gian mờ dễ bị phân loại nhầm Hơn nữa, nếu khơng gian mờ khơng có mơ hình đào tạo, khơng thể xác định luật nào Trong thực tế, nếu phân vùng mờ là q thơ, nhiều mơ hình phân loại sai Mặt khác, nếu phân vùng mờ q tốt, nhiều ḷt mờ khơng thể có thiếu họcmẫu không gian mờ tương ứng Như vậy, chọn mật độ mạng mờ là quan trọng cho phân loại mơ hình đầu vào Trong đó, hình 6.10, mẫu huấn luyện không cần phân bố khơng gian đầu vào Kết quả, khó chọn mật độ thích hợp cho lưới mờ Để khắc phục khó khăn này, sử dụng nhiều luật mờ Một ví dụ cho hình 6.10 Số lượng bảng phụ thuộc vào độ phức tạp phân loại Luật mờ IF-THEN tạo cho không gian mờ nhiều tập mờ loại trừ bảng, luật hoàn chỉnh quy định như: SALL = ∑LK=2 SK , với K = 2,3, … , L (6.31) đó, là tập hợp luật tương ứng với bảng luật mờ K Các luật tạo nhiều bảng luật mờ Hình 6.10 chứa: 110 22 + 33 + 44 + 55 = 90 luật Khi luậtSALL tạo ra, mơ hình mới, phân loại theo thủ tục sau đây: Bước 1: Trongmỗi không gian mờ,tính độ tương thích mơ hình cho lớp: { }(x1) x µK{Bj } αCn K{Ai Bj } = µK Ai (x2) Cn x CFK{A i Bj } (6.32) n = 1,2, … , N; K = 2,3, … , L; i = 1,2, … K; j = 1,2, … , K Bước 2:Xác định độ tương thích tối đa mơ hình cho lớp: Cn Cn Cn αCn = max[α1{A , αCn K{Ai B2 } , αK{A2 B1 } , αK{A2 B2 } , i B1 } 𝛼𝐶𝑛 = max [𝛼1{𝐴1𝐵1} 𝐶𝑛 , 𝛼1{𝐴1𝐵2} 𝐶𝑛 , 𝛼1{𝐴2𝐵1} 𝐶𝑛 ,𝛼1{𝐴2𝐵2} 𝐶𝑛 , 𝛼2{𝐴1𝐵1} 𝐶𝑛 ,…,𝛼2{𝐴1𝐵𝐾} 𝐶𝑛 , 𝛼2{𝐴2𝐵1} 𝐶𝑛 ,…,𝛼2{𝐴2𝐵𝐾} 𝐶𝑛 ,…,𝛼2{𝐴𝐾𝐵1} 𝐶𝑛 ,…,𝛼2{𝐴𝑘𝐵𝑘} 𝐶𝑛 ,…, 𝛼𝐿{𝐴1𝐵1} 𝐶𝑛 ,…,𝛼𝐿{𝐴1𝐵𝐾} 𝐶𝑛 ,𝛼𝐿{𝐴2𝐵1} 𝐶𝑛 ,…, 𝛼𝐿{𝐴2𝐵𝐾} 𝐶𝑛 ,…, 𝛼𝐿{𝐴𝐾𝐵1} 𝐶𝑛 ,𝛼1{𝐴𝐾𝐵𝐾} 𝐶𝑛 ] ; N=1, 2,…, N Bước 3: Xác định lớp C mà mơ hình có độ tính tương thích cao nhất, là: αCm = max[αC1 , αC2 , … , αCN , Assign pattern x = (x1, x2)to class Cm Số lượng bảng luật mờ cần cho mơ hình phân loại lớn; đó, luật hoàn chỉnh là lớn Mặt khác, luật có khả phân loại khác nhau, chọn luật với tiềm cao để phân loại nhằm giảm kích thước luật Vấn đề chọn luật mờ IF-THEN xem tổ hợp bài toán tối ưu với hai mục tiêu Mục tiêu đầu tiên: tối đa hóa số lượng mơ hình phân loại; thứ hai giảm thiểu số lượng luật Trong thuật toán di truyền, giải pháp coi là cá thể; giải pháp cần đại diện cho tập hợp có tính khả thi luật IF- THEN là NST có chiều dài cố định Mỗi gen NST vậy đại diện cho luật mờ SAll SAll =22+33+44+55+66 Mục tiêu là thiết lập tập luật mờ S cách chọn luật thích hợp từ luật Nếu luật đặc biệt thuộc S, bit tương ứng NST thừa nhận giá trị 1, nếu khơng thuộc S, bit giả định giá trị -1 Luật Dummy đại diện số không 111 Luật giả Một luật giả tạo kết luật này không xác định Điều này xảy không gian mờ khơng có mơ hình huấn luyện Ḷt giả khơng ảnh hưởng đến hiệu suất hệ phân loại, loại trừ khỏi luật S Làm để định luật mờ thuộc cai trị đặt S? Trong quần thể khởi tạo, quyết định này dựa 50% hội Nói cách khác, luật mờ có xác suất 0,5 và nhận giá trị nhiễm sắc thể, đại diện quần thể khởi tạo Một thuật toán di truyền để chọn luật IF-THEN gồm bước: Bước 1: Tạo ngẫu nhiên quần thể gồm nhiều nhiễm sắc thể.Quy mơ q̀n thể cóthể tương đối nhỏ, ví dụ 10 20 nhiễm sắc thể Mỗi gen NST tương ứng với luật mờ IF-THEN thiết lập Các gen tương ứng với luật giả nhận giá trị 0, tất gen khác phân chia ngẫu nhiên là -1 Bước 2: Tính toán hiệu suất NST quần thể tại.Vấn đề chọn luật mờcó hai mục tiêu: để tối đa hóa tính chính xác việc phân loại mơ hình và để giảm thiểu kích thước luật Điều đạt cách huấn luyện cho hai trọng số tương ứng, 𝑊𝑃 𝑊𝑁 chức huấn luyện: f(S) = 𝑊𝑝 -𝑃𝑠 Ps PALL − 𝑊𝑁 Ns (6.33) NALL là số mẫu phân loại thành công, -𝑃𝐴𝐿𝐿 tổng số mẫu mô tả cho hệ phân loại, 𝑁𝑠 - 𝑁𝐴𝐿𝐿 số lượng luật mờ IF-THEN tập S 𝑆𝐴𝐿𝐿 tương ứng Độ xác phân loại quan trọng so với kích thước luật Điều này thể cách gán trọng số: