Sử dụng ngữ nghĩa dựa trên biểu diễn của GP

Một phần của tài liệu Nghiên cứu ngữ nghĩa trong hệ lập trình Gen định hướng bởi văn phạm nối cây và ứng dụng trong xấp xỉ hàm Q luận án tiến sỹ (Trang 54 - 56)

Khác với cách tiếp cận dựa trên văn phạm và trên phương pháp hình thức, ngữ nghĩa có thể trực tiếp tính toán, trích xuất từ biểu diễn dạng cây của GP. Ngữ nghĩa có thể trích xuất từ biểu diễn cây sẽ phụ thuộc vào bài toán cần giải quyết.

44 Trong các bài toán logic, ngữ nghĩa có thể tính chính xác theo nhiều cách. Beadle và Johnson [74] tính toán thông tin ngữ nghĩa dựa vào Cây quyết định nhị phân thứ tự [88]. Cây quyết định nhị phân thứ tự là một đồ thị quyết định nhị phân mà thứ tự các nhãn giữa các nút được đảm bảo. Điều đó có nghĩa là nhãn của một nút luôn lớn hơn nhãn của nút con.

McPhee và đồng nghiệp đã trích xuất thông tin ngữ nghĩa từ cây biểu thức logic bằng cách đánh số tất cả các khả năng đầu vào của mỗi cá thể [79]. Theo phương pháp này, họ quan tâm đến ngữ nghĩa của hai thành phần trong cây là cây con và ngữ cảnh, trong đó ngữ cảnh là phần còn lại của cây sau khi loại bỏ cây con.

Trong khi ngữ nghĩa của cây con có thể dễ dàng tính toán bằng cách đánh số tất cả các khả năng giá trị đầu vào thì ngữ nghĩa của ngữ cảnh phụ thuộc vào ba thành phần: toán tử g ngay trên điểm chèn vào, ngữ nghĩa của ngữ cảnh có được bằng cách loại bỏ cây con có gốc ở g và ngữ nghĩa cây con của các tham số khác của toán tử g, như hình vẽ sau:

Hình vẽ 2.3. Ngữ cảnh có được bằng cách loại bỏ cây con

Một phương pháp khác sử dụng cách đánh giá độ tốt của cá thể là trong [89]. Theo đó, bằng cách xác định ngữ nghĩa của ngữ cảnh có thể biết được cây con

45 sẽ ra sao nếu việc lai ghép được thực hiện ở vị trí cây con bị loại bỏ. Thông tin này sẽ được sử dụng để tính độ tốt và được gọi là hàm độ tốt tiềm năng [89].

Tuy nhiên, đối với các bài toán hồi qui tuyến tính với các hàm giá trị thực, việc tính toán chính xác ngữ nghĩa là không khả thi, do đó, có một phương pháp là tính toán xấp xỉ, được đề cập trong [90]. Theo đó, ngữ nghĩa của hai cá thể được gọi là tương đương khi thực hiện so sánh chúng trên một tập mẫu ngẫu nhiên các giá trị đầu vào. Hai cá thể được gọi là tương đương nếu lỗi trung bình của chúng trong tập mẫu ngẫu nhiên là nhỏ hơn một giá trị nhỏ tùy ý nào đó. Định nghĩa này sẽ được sử dụng để đơn giản cây trong quá trình tiến hóa.

Krawiec và Lichocki đề xuất phương pháp tính ngữ nghĩa của cá thể dựa trên các dữ liệu học [78], khi đó, ngữ nghĩa sẽ được định nghĩa là véc tơ trong đó mỗi thành phần là đầu ra tương ứng với giá trị đầu vào của dữ liệu học. Ngữ nghĩa này định hướng quá trình lai ghép và được gọi là toán tử lai ghép xấp xỉ không gian.

Một phần của tài liệu Nghiên cứu ngữ nghĩa trong hệ lập trình Gen định hướng bởi văn phạm nối cây và ứng dụng trong xấp xỉ hàm Q luận án tiến sỹ (Trang 54 - 56)