Cho X= (x1, x2,..., xn) ∈ Sn là một dân cư. Mức độ đa dạng dân cư của X được giả thiết là λ(X), và được xác định như số lượng các thành phần của vector ∑
= N i i x 1 mà có các giá trị không bằng nhau từ vị trí 1÷n. Nếu X được biểu diễn dưới dạng ma trận, khi đó λ(X) là số lượng cột của X mà có các giá trị phần tử trên cột đó có thể có giá trị bằng 0 hoặc bằng 1. Như vậy một tập dân cư X có tất cả các cá thể giống nhau thì λ(X) = 0.
Bên cạnh mức độ đa dạng λ(X) ta có khái niệm về mức độ hoàn thiện của X. Mức độ hoàn thiện của X được ký hiệu là β(X),β(X) = 1 - λ(X). Mức độ hoàn thiện β (X) được đánh giá bằng số lượng các giá trị gen bị mất. Nếu biểu diễn X dưới dạng ma trận thì β (X) là số lượng cột của ma trận X mà có các phần tử trên cột đó hoặc có giá trị tất cả bằng 0 hoặc có tất cả bằng 1. Một giản đồ gen L trong không gian S có thể được biểu diễn như sau [3.4]:
L = {X = (x1, ..,x1)∈S: xik = aik, 1≤ik≤l; 1≤k≤K} (3.29) Ở đây:
K là bậc của giản đồ gen L, 1≤k≤l. {i1,i2,…,ik} là các giá trị của từng phần tử.
Như vậy để biểu diễn giản đồ gen L bằng các phần tử xác định và giá trị tương ứng của từng phần tử , ta có thể biểu diễn L là (ai1, ...,aik). Rõ ràng là một giản đồ gen có bậc là K sẽ có 2−k các mẫu cấu trúc khác nhau. Nếu ik, 1≤k≤ β (X) thì giản đồ Gen L(ai1,…,
) (X i
aβ ) là giản đồ Gen tối thiểu chứa X và ký hiệu là L(ai1,…,aiβ(X), X) hoặc L(X).
Ví dụ với tập hợp dân số X = {(0001),(0010),(1010)}, ta thấy rằng tại các vị trí gen số 1, 3 và 4, các cá thể của X có giá trị bằng 1, do vậy λ(X) = 3. Và các cá thể của X chỉ có giá trị bằng 0 tại vị trí gen số 2 như vậy giản đồ gen tối thiểu chứa X là L (a2; X) = (*0**) với a2 = 0. Nghĩa “tối thiểu” ở đây có nghĩa rằng nếu tồn tại một giản đồ gen khác cũng chứa X thì ta luôn có L (a2, X) ⊆ L.
Để đánh giá và phân tích ảnh hưởng của sự đa dạng dân cư đối với quá trình tìm kiếm của thuật toán GA và ngược lại ta chứng minh các bổ đề và các định lý sau.
Bổ đề 3.3.4: Đối với tập hợp dân cư biểu diễn theo chuỗi Markov {Xk: k≥0} có xác suất đột biến pm = 0 và tập hợp dân cư ban đầu Xo = X thì:
{y∈X X = X}>0
p n o (3.30) (ii) Với mỗi Y∉L(ai1,...,aiβ;X) và bất kỳ n ≥ 0
{y∈X X = X}>0
p n o (3.31) Bổ đề này chỉ ra rằng khả năng tìm kiếm của thuật toán GA với xác suất
pm =0 bị hạn chế trong số lượng giản đồ gen tối thiểu chứa tập dân cư hiện tại. Như vậy mức độ đa dạng dân cư của quần thể hiện tại càng lớn thì khả năng tìm được giải pháp khả thi của GA càng lớn và ngược lại. Trong trường hợp λ(X)=0 với pm =0 nghĩa là không có đột biến thì thuật toán GA không có khả năng tìm được giải pháp khả thi tốt hơn những giá trị hiện tại và việc áp dụng các toán tử Ts và Tc của giải pháp GA có thể làm giảm tính đa dạng dân cư và làm giảm khả năng tìm kiếm của thật toán GA. Sau đây là kết quả nghiên cứu về tác động của các toán tử đó.