CHƯƠNG 1 MỘT SỐ KIẾN THỨC CƠ SỞ
2.4. Cấu trúc đa ngữ nghĩa và tính mở rộng được của LFoC
2.4.2. Mơ hình bụi biểu diễn cấu trúc đa ngữ nghĩa của LFoC
Cấu trúc ngữ nghĩa phức tạp của miền hạng từ của thuộc tính A, khung nhận thức ngơn ngữ (LFoC) của A và mối quan hệ ngữ nghĩa của chúng có thể được phơi bày ra bởi sử dụng cấu trúc đồ thị dạng bụi (bush graph). Cấu trúc bụi có thể biểu diễn tất cả các quan hệ ngữ nghĩa giữa các hạng từ trong miền hạng từ của A.
2.4.2.1.Xây dựng cấu trúc bụi của A với ngữ nghĩa định tính đã được xác định và của LFoC tương ứng
Cấu trúc đa ngữ nghĩa S≤,G của A với ngữ nghĩa định tính, cú pháp đã xác định có thể được biểu diễn trong khơng gian 2 chiều như một cấu trúc bụi có hướng trong Hình 2.2. Trong đó, mỗi nút của bụi biểu diễn cho một hạng từ trong miền hạng từ của A, nút biểu diễn cho hạng từ x được gán nhãn là x.
o Với mọi k ≥ 1, các nút ở mức k (gọi tắt là mức k của bụi) biểu diễn cho các hạng từ có mức tính riêng k (tức là chiều dài k). Hơn nữa, theo thứ tự ngữ nghĩa các hạng từ này được sắp xếp từ trái sang phải trên mức k của bụi. o Mỗi nút x ở mức k là nút đầu của một cạnh mà nút cuối của nó là nút y, y là
một từ có dạng hx, hH, y có tính riêng hơn x. Do đó, các con của x nằm ở mức k + 1. Ký hiệu xL và xR lần lượt là hạng từ bên trái, bên phải của hạng từ x trong tập X(k) (là tập sắp thứ tự tuyến tính của tất cả các từ ở mức l, l ≤
k), thứ tự của x và hx, hH, được sắp xếp giữa xL và xR từ trái sang phải trên cấu trúc bụi. Ví dụ: với x = Mc–, khi đó xL = Vc– và xR = c– trong tập
X(2), các hạng từ EMc–, VMc–, MMc–, Mc–, RMc–, và LMc– (bao gồm Mc–
và các con của nó) được sắp xếp tăng dần từ trái qua phải giữa Vc– và c–
(Vc– ≤ c–) trên cấu trúc bụi.
Ký hiệu cấu trúc bụi đã xây dựng ở trên cho mỗi thuộc tính A là BA. Cấu trúc BA như trong Hình 2.2 là vơ hạn. Tức là BA bao gồm tất cả các mức k ≥ 1 và biểu diễn các mối quan hệ thứ tự ≤ và quan hệ chung - riêng GS giữa các hạng từ của thuộc tính A.
2.4.2.2.Mơ hình bụi của cấu trúc đa ngữ nghĩa của LFoC của thuộc tính A và khả năng mở rộng
Theo Định nghĩa 2.1, mỗi LFoC của thuộc tính A có dạng ℱκ = X(κ), cấu trúc bụi biểu diễn cấu trúc đa ngữ nghĩa của ℱκ là cấu trúc con của BA, nó gồm các nút ở mức k ≤ κ. Từ đó, định nghĩa về cấu trúc bụi gồm κ mức như sau:
c− Rc− Mc− VRc− LMc− ERc− MRc− RMc− Lc− RRc− LRc− LLc− W RLc− MLc− VLc− ELc− MMc− VMc− EMc− Vc− ... ...
Hình 2.2: Một phần cấu trúc bụi biểu diễn hai quan hệ ngữ nghĩa vốn của trong LFoC: quan hệ thứ tự và quan hệ tính chung – riêng
Định nghĩa 2.3: Cho cấu trúc bụi BA biểu diễn cấu trúc đa ngữ nghĩa của miền hạng từ của thuộc tính A, ký hiệu là S≤,G = (X, ≤, G). Một thành phần mức κ
của BA, ký hiệu là BA,κ, là một bụi thỏa các điều kiện sau đây: (i) Các nút của BA,κ là các nút của BA ở mức k, với k ≤ κ.
(ii) Các cạnh của BA,κ là tất cả các cạnh của BA, các nút đầu mút của chúng nằm ở mức k trên BA, với k ≤ κ.
Khái niệm LFoC của thuộc tính A và cấu trúc đa ngữ nghĩa của nó có hai ý nghĩa như sau:
o Khái niệm LFoC tương tự như trong trường hợp chúng ta sử dụng cấu trúc của tập các số nguyên. Tập tất cả các số nguyên là vô hạn, tuy nhiên trong các ứng dụng cụ thể chỉ có một tập hữu hạn các số nguyên được sử dụng mà vẫn đủ để thực hiện tính tốn. Khái niệm LFoC ℱκ của thuộc tính A
như trong định nghĩa 2.1 có thể bảo tồn tồn bộ ngữ nghĩa của các hạng từ trong ℱκ theo ngữ cảnh như sau: Mọi hạng từ x của A trong thực tế được định nghĩa trong ngữ cảnh toàn bộ các hạng từ hx, hH. Do đó, khi một hạng từ h’x trong ℱκ thì tất cả hạng từ có dạng hx cũng thuộc ℱκ. Bởi vậy, cấu trúc bụi BA,κ là thành phần mức κ của BA.
o Cấu trúc ngữ nghĩa của LFoC ℱκ của thuộc tính A là đủ đảm bảo khả năng mở rộng các hạng từ của ℱκ trong ngữ cảnh như được xem xét trong phần tiếp theo.