GGGP với biểu diễn dạng cây

Một phần của tài liệu Nghiên cứu ngữ nghĩa trong hệ lập trình Gen định hướng bởi văn phạm nối cây và ứng dụng trong xấp xỉ hàm Q luận án tiến sỹ (Trang 31 - 33)

Những nghiên cứu đầu tiên gần như được đưa ra cùng một lúc bởi ba nhà nghiên cứu. Whigham [43] đề xuất sử dụng hệ CFG với văn phạm phi ngữ cảnh sử dụng để tạo ra quần thể là cây dẫn xuất trong CFG. Schultz trong [44] sử dụng hệ GGGP để học các qui tắc trong hệ chuyên gia.

21 Hệ này tương tự như Whigham, chỉ khác nhau ở thuật toán khởi tạo quần thể [45] [46] [47] [48] [49] [50] đề xuất sử dụng hệ LOGENPRO sử dụng văn phạm mệnh đề nhất định (DCG), một kiểu văn phạm logic trong LISP để tạo ra chương trình. DCG có tính biểu diễn cao hơn CFG, có khả năng tạo ra các ngôn ngữ cảm ngữ cảnh hơn.

Đây là điểm khác nhau giữa các hệ thống. Với ba hệ thống tương tự nhau, luận án trình bày ở đây chi tiết hơn về CFG-GP trong [43]. Năm thành phần cơ bản của GGGP cũng tương tự như hệ GP thông thường. Tuy nhiên, có một số đặc điểm lưu ý sau:

a. Biu din chương trình

Mỗi một chương trình là cây dẫn xuất được tạo ra bởi văn phạm G (CFG đối với hệ thống của Whigham và Schultz, văn phạm logic DCG đối với hệ của Wong).

b. Khi to qun th

Trong [43], một thuật toán đơn giản được đề xuất để tạo ra cây dẫn xuất ngẫu nhiên với gới hạn về độ sâu dựa trên thủ tục gắn nhãn chương trình. Bohm và Schultz đưa ra thuật toán để khởi tạo quần thể dựa trên phân phối chuẩn của bước dẫn xuất. Còn thủ tục khởi tạo trong LOGENPRO kế thừa cơ chế trong PROLOG [51].

c. Hàm thích nghi:

Được thực hiện với các toán tử, là cây dẫn xuất của G, tương tự như trong GP chuẩn.

d. Toán t di truyn:

Toán tử di truyền là cơ chế lựa chọn, tái sinh, lai ghép và đột biến. Việc lựa chọn và tái sinh được thực hiện tương tự như trong GP. Trong toán tử lai ghép, 2 nút phía trong với cùng nhãn không phải là ký hiệu kết trong văn phạm G được chọn ngẫu nhiên và hai cây dẫn xuất phía dưới sẽ được hoán đổi. Trong GGGP,

22 hiện tượng tương đồng là hai cây dẫn xuất bắt nguồn từ cùng một ký tự không kết.

Toán tử đột biến được thực hiện bằng cách lựa chọn một nút trong một cách ngẫu nhiên. Ký tự không kết trong nút này được đánh dấu và cây dẫn xuất phía dưới sẽ được xóa đi. Một cây dẫn xuất mới được tạo ra có gốc là ký tự không kết giống như trên thay thế vào cây dẫn xuất đã bị xóa.

e. Các tham s

Các tham số trong GP chuẩn bao gồm: kích cỡ quần thể, số thế hệ tối đa, độ sâu tối đa của cá thể và xác xuất thực hiện các toán tử di truyền.

Một phần của tài liệu Nghiên cứu ngữ nghĩa trong hệ lập trình Gen định hướng bởi văn phạm nối cây và ứng dụng trong xấp xỉ hàm Q luận án tiến sỹ (Trang 31 - 33)