Biểudiễn ngữ nghĩa

Một phần của tài liệu Nghiên cứu tích hợp thành phần ngữ nghĩa vào văn phạm tag cho tiếng việt (Trang 29 - 32)

Đây là phần trình bày về cách thức biểu diễn ngữ nghĩa bằng logic vị từ cấp một. Các biểu diễn của chúng ta sẽ là phân tích cú pháp rồi sử dụng phép tính lambda để kết hợp các thành phần cú pháp lại thành công thức logic.

1.3.1.1. Các khái niệm ngữ nghĩa

Để tiến hành việc biểu diễn ngữ nghĩa thành công thức logic, chúng ta cần thêm một số khái niệm sau:

Từ vựng

Khi dùng logic vị từ cấp một để nói về một chủ đề, ta phải có từ vựng để nói về chủ đề ấy. Trong cách biểu diễn ngữ nghĩa bằng logic vị từ cấp một, chúng ta biểudiễn cấu trúc từ vựng như sau:

(Danh sách các hằng, Danh sách các tân từ) Ví dụ:

({AN, BÌNH, CHI, DUY},{(SINH-VIÊN, 1), (YÊU, 2), (XINH, 1)}) Trong đó:

 AN, BÌNH, CHI, DUY là các hằng;

 Các cặp (SINH-VIÊN, 1), (YÊU, 2), (XINH, 1) tương ứng có SINH-VIÊN, YÊU, XINH là vị từ và 1,2,1 là số đối số cho các vị từ ấy.

Để thuật tiện cho việc theo dõi, dấu cách giữa các tiếng sẽ được thay thế bằng dấu "-". Và các từ trong từ vựng sẽ được viết hoa toàn bộ các chữ cái.

28

Mô hình vị từ cấp một (gọi tắt là mô hình) là một cấu trúc được sử dụng để mô tả một tình huống. Mô hình cho chúng ta hai thông tin. Thông tin đầu tiên là tập hợp các thực thể (ký hiệu là D) được nói đến, được gọi là miền xác định (hay trường minh họa).

Ví dụ:

D ={d1, d2, d3, d4}

Thứ hai là hàm minh họa (ký hiệu là F), mỗi ký hiệu trong từ điển sẽ được ánh xạ với với một (hoặc nhiều) bộ các phần tử trong miền xác định. Một bộ tương ứng với một vị từ sẽ có số phần tử là số đối của ký hiệu đó, một bộ tương ứng với ký hiệu hằng sẽ có một phần tử. Tức là: với mỗi ký hiệu hằng c trong từ điển ta có F(c)  D, với mỗi quan hệ n-ngôi R ta có F(R)  Dn.

Định nghĩa 1.3.1.1(Mô hình)

Mô hình M là một cặp sắp thứ tự (D, F) trong đó D là trường minh họa và F là hàm minh họa xác định các giá trị trong D.

Ví dụ:

Giả sử ta có mô hình M=(D,F) như sau:

1. Từ vựng: ({AN, BÌNH, CHI, DUY},{(SINH-VIÊN, 1), (YÊU, 2), (XINH, 1)});

2. Miền xác định D ={d1,d2,d3,d4}; 3. Hàm minh họa F được cho như sau:

F(AN) = d1 F(BÌNH) = d2 F(CHI) = d3 F(DUY) = d4 F(SINH-VIÊN) = {d1,d2,d3,d4}; F(YÊU) = {(d1, d2), (d2, d3)}

29

F(XINH) = {d1, d3 }

Định nghĩa 1.3.1.2. (Mô hình chính xác)

Mô hình chính xác là mô hình trong đó mỗi thực thể trong trường minh họa có một tên (được gán giá trị cho một hằng).

Mô hình được cho ở ví dụ trên là một mô hình chính xác. Nếu chúng ta tạo một trường minh họa mới D’ = D {d5, d6} và có hàm minh họa F’ như sau:

F’(AN) = d1 F’(BÌNH) = d2 F’(CHI) = d3 F’(DUY) = d4 F’(SINH-VIÊN) = d1, d2, d3, d4 F’(YÊU) = (d1, d2), (d2, d3),(d5, d6) F’(XINH) = d1, d3

Khi đó, M’ = (D’, F’) là không còn là mô hình chính xác nữa. Tuy nhiên, đây vẫn là một mô hình hoàn toàn tốt.

Nhận xét. Chúng ta có nhận xét sau:

1. Không có yêu cầu bắt buộc mọi thực thể trong mô hình phải có tên.

2. Không có yêu cầu bắt buộc mỗi thực thể trong mô hình chỉ được minh họa cho một hằng. Ví dụ: một người có hai tên là Bình và Duy trong đó một tên là tên thật, một tên là tên thân mật.

Chúng ta sẽ xây dựng ngôn ngữ vị từ cấp một dựa trên từ điển với các thành phần sau:

1. Tất cả các ký hiệu trong từ điển (được gọi là ký hiệu phi logic). 2. Một tập hợp vô hạn đếm được các biến x, y, z, w,...

3. Các phép toán logic  (phủ định),  (kéo theo),  (tuyển),  (hội). 4. Các phép lượng hóa (toàn thể) và  (tồn tại).

30

5. Cặp dấu đóng, mở ngoặc ")" và "(" để nhóm các ký hiệu.

Các thành phần 2-5 chung cho mọi ngôn ngữ tân từ, thành phần duy nhất để phân biệt các ngôn ngữ với nhau là các ký hiệu phi logic (các ký hiệu trong từ điển).

Một phần của tài liệu Nghiên cứu tích hợp thành phần ngữ nghĩa vào văn phạm tag cho tiếng việt (Trang 29 - 32)