Hệ lai tiến hóa nơron

𝑦 = 𝑓(𝑤1 𝑥 1+ 𝑤2 𝑥2 ), 𝑓(𝑥) =

6.8 Hệ lai tiến hóa nơron

Mặc dù các mạng nơ ron được sử dụng để giải quyết nhiều vấn đề, nhưng chúng vẫn có một số hạn chế. Ví dụ, các thuật toán học lan truyền ngược thường được sử dụng vì nó là linh hoạt và dễ xử lý, nhưng nó có một nhược điểm: nó không đảm bảo giải pháp tối ưu toàn cục. Trong các ứng dụng, thuật toán lan truyền ngược có thể hội tụ về một tập hợp các giá trị tối ưu trọng cục bộ. Thuật toán di truyền là một kỹ thuật tối ưu hóa hiệu quả (cho toàn cục) và lựa chọn cấu trúc liên kết phù hợp.

Kỹ thuật tối ưu hóa trọng của mạng nơ ron bằng giải pháp tiến hóa (Montana và Davis, 1989; Whitley và Hanson , 1989; Ichikawa và Sawa, 1992), cụ thể là giải thuật di truyền có thể tóm tắt như sau. Để sử dụng các thuật toán di truyền, đầu tiên cần mô tả tên một NST (tiếng Anh: Chromosome). Các topology kết nối của mạng nơ ron thể hiện bởi một ma trận vuông kết nối (hình 6.11). Mỗi cột trong ma trận xác định loại kết nối từ một tế bào thần kinh (cột) khác (hàng), trong đó 0 biểu thị không có kết nối và 1 biểu thị kết nối mà trọng số được xác định thông qua quá trình học. Để chuyển đổi ma trận kết nối vào một nhiễm sắc thể, chỉ cần kết chuỗi các hàng của ma trận với nhau (hình 6.11).

114

Hình 6.11 : Tập mã hóa nhiễm sắc thể

Hình 6.12 : Lai ghép từ bố mẹ (Parent1 lai Parent1) tạo con (Child)

Giả sử, muốn tối ưu trọng cho mạng nơ ron nhiều lớp truyền thẳng, trọng ban đầu trong mạng được chọn ngẫu nhiên trong khoảng (-1, 1). Mô hình mạng nơ ron có thể biểu diễn bằng

115

một ma trận vuông, trong đó một số thực trong ma trận tương ứng với trọng số của một nơ ron, và số 0 trang ma trận (có nghĩa là không có kết nối giữa hai nơ ron) (hình 6.11). Tổng cộng, có 16 liên kết giữa các nơ ron (16 phần tử của ma trận có giá trị số; các phần tử còn lại đều bằng

Một nhiễm sắc thể là một bộ gen, một tập hợp của các số được đại diện bởi một 1 gen gồm 16 NTS, trong đó, mỗi gen tương ứng với một liên kết có trọng duy nhất trong mạng. Vì vậy, nếu xếp chuỗi các hàng của ma trận với nhau, bỏ qua số không, chúng ta có một NST (xem: Chromosome, Hình 6.11).

Bước tiếp theo, chọn các toán tử di truyền: toán tử lai ghép và đột biến. Toán tử lai từhai NST là bố mẹ, tạo đứa trẻ có di truyền từ bố mẹ. Mỗi gen trong NSTcủa trẻ đại diện bởi các gen tương ứng của bố mẹ được lựa chọn ngẫu nhiên (Hình 6.12).

Hình 6.13 cho ví dụ về đột biến.

Hình 6.13 : Mạng nơ ron tối ưu hóa: (b) đột biến

Xác định quy mô (số lượng) các quần thể (dân số), tức là số lượng các mạng với trọng

lượng khác nhau, kiểu lai và đột biến xác suất và số lượng của các thế hệ.

Đến nay, chúng ta giả định rằng cấu trúc của mạng cố định, và tiến hóa chỉ được sử dụng để tối ưu hóa trọng lượng trong các mạng cung cấp. Tuy nhiên, các kiến trúc của mạng (tức là số lượng nơ ron và họ mối liên kết, tức là trọng số) sẽ quyết định sự thành công hay thất bại của các ứng dụng. Các thuật toán di truyền cũng có thể giúp lựa chọn mạng kiến trúc (tức số lượng nơ ron trong mạng).

116

Ý tưởng cơ bản để phát triển một kiến trúc mạng phù hợp là tìm kiếm di truyền trong một quần thể (Miller et al., 1989; Schaffer et al., 1992). Trước tiên, chọn phương pháp mã hóa một kiến trúc mạng thành một nhiễm sắc thể. Có nhiều cách khác nhau để mã hóa cấu trúc của mạng. Điều quan trọng là quyết định bao nhiêu thông tin là cần thiết cho các mạng đại diện. Cho một tập các ví dụ huấn luyện và một chuỗi nhị phân cho kiến trúc mạng; một GA cơ bản có thể được mô tả bởi những điều sau đây bước sau:

Hình 6.14 : Mạng mã hóa trực tiếp

Bước 1: Chọn kích thước của một số nhiễm sắc thể, lai tạo, đột biến và xác định số lượng các

bước huấn luyện.

Bước 2: Xác định chức năng huấn luyện để đo hiệu suất của một NST riêng lẻ thíchhợp. Nói

chung, sự thích hợp của mạng không nên chỉ dựa vào độ chính xác, mà còn về tốc độ học, kích thước và độ phức tạp của nó. Tuy nhiên, hiệu suất của mạng quan trọng hơn so với kích thước của nó, do đó các chức năng vẫn có thể được xác định bởi tổng các bình phương lỗi.

Bước 3: Ngẫu nhiên tạo ra một số ban đầu của nhiễm sắc thể.

Bước 4: Giải mã một NST riêng lẻ thành một mạng nơ ron. Tính tổng các lỗi bìnhphương và

xác định tập thể dục của mạng.

Bước 5: Lặp lại bước 4 cho đến khi tất cả cá thể trong dân số đã được xem xét.

Bước 6: Chọn một cặp NST cho giao phối, với xác suất thích hợp

Bước 7: Tạo một cặp NSTcon bằng cách áp dụng các gen lai và đột biến. Một nhà điều hành

lai ngẫu nhiên, đơn giản là hoán đổi các hàng tương ứng giữa cha mẹ, tạo ra con cái. Đột biến một hoặc hai bit trong các NST với xác xuất thấp (khoảng 0.005)

117

Bước 8: Đặt cácNSTcon được tạo ra trong quần thể mới.

Bước 9: Lặp lại bước 6 cho đến khi kích thước của quần thểNSTmới bằng kích thướccủa quần

thể ban đầu; sau đó thay thế quần thể ban đầu bằng NST mới.

Hình 6.15 : Vòng đời tiến hóa của 1 mạng nơ ron

Bước 10: Quay về bước 4 và lặp lại quá trình này cho đến khi một số quy định của cácthế hệ

đạt được. Chu trình tiến hóa phát triển của mạng nơ ron được trình bày trong Hình 6.15. Ngoài việc học mạng nơ ron, tiến hóa tính toán cũng được sử dụng để tối ưu hóa các phép lai và chọn biến đầu vào.

Hệ lai tiến hóa mờ