Cấu trúc đa ngữ nghĩa trong LFoC

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 69 - 70)

2.4.1.1. Cấu trúc đa ngữ nghĩa trong miền hạng từ của thuộc tính A

Có hai mối quan hệ ngữ nghĩa rõ ràng giữa các hạng từ trong miền hạng từ của thuộc tính A, cũng như trong LFoC của A. Các quan hệ ngữ nghĩa này dựa trên ngữ nghĩa vốn có của các hạng từ trong ngôn ngữ tự nhiên. Chúng tạo thành một cấu trúc đa ngữ nghĩa trong miền hạng từ của thuộc tính A.

Thứ nhất, cấu trúc dựa trên quan hệ thứ tự trong miền hạng từ của A. Theo lý thuyết ĐSGT, tồn tại một quan hệ thứ tự ngữ nghĩa giữa các hạng từ trong miền hạng từ của thuộc tính A dựa trên ngữ nghĩa định tính vốn có của các hạng từ trong ngôn ngữ tự nhiên. Do đó, miền hạng từ của thuộc tính A, ký hiệu là X, được coi như một cấu trúc thứ tự tuyến tính S≤ = (X, ≤). Cấu trúc sắp thứ tự này cung cấp một cơ sở hình thức hóa để định nghĩa ngữ nghĩa của các hạng từ: ngữ nghĩa của mỗi hạng từ x là một tập gồm tất cả các quan hệ thứ tự giữa x và các hạng từ còn lại.

Thứ hai, cấu trúc tính chung – riêng trong miền hạng từ của A. Khái niệm tính chung và tính riêng là cần thiết trong nhận thức thế giới thực và hình thành tri thức của con người cũng như trong trích rút tóm tắt tạo ra các câu diễn đạt bằng ngôn ngữ tự nhiên. Ở mức từ trong ngôn ngữ tự nhiên (không phải trong tri thức của con người), lý thuyết ĐSGT đã chỉ ra chức năng của gia tử ngôn ngữ là để sản sinh các từ có tính riêng hơn các từ ban đầu. Ví dụ, hạng từ ‘very young’ được sinh từ hạng từ ‘young’ sử dụng gia tử ‘very’. Rõ ràng, hạng từ ‘young’ có tính chung hơn hạng từ ‘very young’; ngược lại, hạng từ ‘very young’ có tính riêng hơn hạng từ ‘young’. Ký hiệu G(x, y) để chỉ hạng từ x có tính chung hơn hạng từ y, y có tính riêng hơn hạng từ x. Sau đây là định nghĩa hình thức hóa cho G(x, y):

Định nghĩa 2.2: Cho X là một tập các hạng từ trong cấu trúc ĐSGT của một thuộc tính A, một quan hệ nhị phân bộ phận G  XX được gọi là quan hệ tính chung – riêng, viết tắt là GS (generality - specificity), nếu quan hệ nhị phân bộ phận này là quan hệ nhỏ nhất thỏa các điều kiện sau đây:

(i) x ∈ X và h ∈H, G(x, hx) là đúng (dựa trên chức năng của gia tử). (ii) Phản xạ (reflexiveness): x ∈X, G(x, x) là đúng.

(iv) Bắc cầu (transitivity): x, y, z ∈X, G(x, y) & G(y, z) G(x, z).

Trong [56] đã chỉ ra rằng G(x, y) đúng khi và chỉ khi y = x, với  là một chuỗi các gia tử trong H, tức là x là hậu tố của y, tức là y được sản sinh từ x bằng áp dụng lần lượt các các gia tử trong . Ví dụ: x = ‘rather small’ có tính chung hơn y = ‘extremely very rather small’. Nếu xH(y) hoặc yH(x), G(x, y) không đúng. Do đó, tồn tại quan hệ nhị phân bộ phận GS dựa trên ngữ nghĩa vốn có của các hạng từ của thuộc tính A trong ngôn ngữ tự nhiên. Cấu trúc ngữ nghĩa của A có thể được xem xét là cấu trúc GS, ký hiệu là SG = (X, G).

Kết hợp hai cấu trúc S≤ và SG, ta có cấu trúc đa ngữ nghĩa trong miền hạng từ của thuộc tính A. Một cấu trúc kết hợp S≤ và SGđược ký hiệu là S≤,G = (X, ≤, G).

2.4.1.2. Cấu trúc đa ngữ nghĩa của khung nhận thức ngôn ngữ LFoC

Trong ứng dụng, chúng ta chỉ xem xét một khung nhận thức ngôn ngữ ở mức tính riêng , ℱκ, của mỗi thuộc tính A đã cho. Cấu trúc cú pháp và ngữ nghĩa được xác định như trong Định nghĩa 2.1 ở trên.

Chúng ta có x, y ℱκ, nếu xy (hoặc G(x, y)) trong X, thì cũng có xy

(hoặc G(x, y)) trong ℱκ. Do đó, coi ℱκ (= X(κ)) là một cấu trúc con đa ngữ nghĩa của

S≤,G = (X, ≤, G), ký hiệu là 𝑭≤𝜅,G = (ℱκ, ≤, G).

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 69 - 70)

Tải bản đầy đủ (PDF)

(148 trang)