Những nghiên cứu đầu tiên gần như được đưa ra cùng một lúc bởi ba nhà nghiên cứu. Whigham [43] đề xuất sử dụng hệ CFG với văn phạm phi ngữ cảnh sử dụng để tạo ra quần thể là cây dẫn xuất trong CFG. Schultz trong [44] sử dụng hệ GGGP để học các qui tắc trong hệ chuyên gia.
21 Hệ này tương tự như Whigham, chỉ khác nhau ở thuật toán khởi tạo quần thể [45] [46] [47] [48] [49] [50] đề xuất sử dụng hệ LOGENPRO sử dụng văn phạm mệnh đề nhất định (DCG), một kiểu văn phạm logic trong LISP để tạo ra chương trình. DCG có tính biểu diễn cao hơn CFG, có khả năng tạo ra các ngôn ngữ cảm ngữ cảnh hơn.
Đây là điểm khác nhau giữa các hệ thống. Với ba hệ thống tương tự nhau, luận án trình bày ở đây chi tiết hơn về CFG-GP trong [43]. Năm thành phần cơ bản của GGGP cũng tương tự như hệ GP thông thường. Tuy nhiên, có một số đặc điểm lưu ý sau:
a. Biểu diễn chương trình
Mỗi một chương trình là cây dẫn xuất được tạo ra bởi văn phạm G (CFG đối với hệ thống của Whigham và Schultz, văn phạm logic DCG đối với hệ của Wong).
b. Khởi tạo quần thể
Trong [43], một thuật toán đơn giản được đề xuất để tạo ra cây dẫn xuất ngẫu nhiên với gới hạn về độ sâu dựa trên thủ tục gắn nhãn chương trình. Bohm và Schultz đưa ra thuật toán để khởi tạo quần thể dựa trên phân phối chuẩn của bước dẫn xuất. Còn thủ tục khởi tạo trong LOGENPRO kế thừa cơ chế trong PROLOG [51].
c. Hàm thích nghi:
Được thực hiện với các toán tử, là cây dẫn xuất của G, tương tự như trong GP chuẩn.
d. Toán tử di truyền:
Toán tử di truyền là cơ chế lựa chọn, tái sinh, lai ghép và đột biến. Việc lựa chọn và tái sinh được thực hiện tương tự như trong GP. Trong toán tử lai ghép, 2 nút phía trong với cùng nhãn không phải là ký hiệu kết trong văn phạm G được chọn ngẫu nhiên và hai cây dẫn xuất phía dưới sẽ được hoán đổi. Trong GGGP,
22 hiện tượng tương đồng là hai cây dẫn xuất bắt nguồn từ cùng một ký tự không kết.
Toán tử đột biến được thực hiện bằng cách lựa chọn một nút trong một cách ngẫu nhiên. Ký tự không kết trong nút này được đánh dấu và cây dẫn xuất phía dưới sẽ được xóa đi. Một cây dẫn xuất mới được tạo ra có gốc là ký tự không kết giống như trên thay thế vào cây dẫn xuất đã bị xóa.
e. Các tham số
Các tham số trong GP chuẩn bao gồm: kích cỡ quần thể, số thế hệ tối đa, độ sâu tối đa của cá thể và xác xuất thực hiện các toán tử di truyền.