Mô hình bụi biểu diễn cấu trúc đa ngữ nghĩa của LFoC

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 70 - 72)

Cấu trúc ngữ nghĩa phức tạp của miền hạng từ của thuộc tính A, khung nhận thức ngôn ngữ (LFoC) của A và mối quan hệ ngữ nghĩa của chúng có thể được phơi bày ra bởi sử dụng cấu trúc đồ thị dạng bụi (bush graph). Cấu trúc bụi có thể biểu diễn tất cả các quan hệ ngữ nghĩa giữa các hạng từ trong miền hạng từ của A.

2.4.2.1. Xây dựng cấu trúc bụi của A với ngữ nghĩa định tính đã được xác định và của LFoC tương ứng

Cấu trúc đa ngữ nghĩa S≤,G của A với ngữ nghĩa định tính, cú pháp đã xác định có thể được biểu diễn trong không gian 2 chiều như một cấu trúc bụi có hướng trong Hình 2.2. Trong đó, mỗi nút của bụi biểu diễn cho một hạng từ trong miền hạng từ của A, nút biểu diễn cho hạng từ x được gán nhãn là x.

o Với mọi k ≥ 1, các nút ở mức k (gọi tắt là mức k của bụi) biểu diễn cho các hạng từ có mức tính riêng k (tức là chiều dài k). Hơn nữa, theo thứ tự ngữ nghĩa các hạng từ này được sắp xếp từ trái sang phải trên mức k của bụi. o Mỗi nút x ở mức k là nút đầu của một cạnh mà nút cuối của nó là nút y, y

một từ có dạng hx, hH, y có tính riêng hơn x. Do đó, các con của x nằm ở mức k + 1. Ký hiệu xLxR lần lượt là hạng từ bên trái, bên phải của hạng từ x trong tập X(k) (là tập sắp thứ tự tuyến tính của tất cả các từ ở mức l, l

k), thứ tự của xhx, hH, được sắp xếp giữa xLxR từ trái sang phải trên cấu trúc bụi. Ví dụ: với x = Mc–, khi đó xL = Vc– và xR = c– trong tập

X(2), các hạng từ EMc–, VMc–, MMc–, Mc–, RMc–, và LMc– (bao gồm Mc

và các con của nó) được sắp xếp tăng dần từ trái qua phải giữa Vc– và c

(Vc– ≤ c–) trên cấu trúc bụi.

Ký hiệu cấu trúc bụi đã xây dựng ở trên cho mỗi thuộc tính A là BA. Cấu trúc BA như trong Hình 2.2 là vô hạn. Tức là BA bao gồm tất cả các mức k ≥ 1 và biểu diễn các mối quan hệ thứ tự ≤ và quan hệ chung - riêng GS giữa các hạng từ của thuộc tính A.

2.4.2.2. Mô hình bụi của cấu trúc đa ngữ nghĩa của LFoC của thuộc tính A và khả năng mở rộng

Theo Định nghĩa 2.1, mỗi LFoC của thuộc tính A có dạng ℱκ = X(κ), cấu trúc bụi biểu diễn cấu trúc đa ngữ nghĩa của ℱκ là cấu trúc con của BA, nó gồm các nút ở mức kκ. Từ đó, định nghĩa về cấu trúc bụi gồm κ mức như sau:

cRcMcVRcLMcERcMRcRMcLcRRcLRcLLcW RLcMLcVLcELcMMcVMcEMcVc− ... ...

Hình 2.2: Một phần cấu trúc bụi biểu diễn hai quan hệ ngữ nghĩa vốn của trong LFoC: quan hệ thứ tự và quan hệ tính chung – riêng

Định nghĩa 2.3: Cho cấu trúc bụi BA biểu diễn cấu trúc đa ngữ nghĩa của miền hạng từ của thuộc tính A, ký hiệu là S≤,G = (X, ≤, G). Một thành phần mức κ

của BA, ký hiệu là BA,κ, là một bụi thỏa các điều kiện sau đây: (i) Các nút của BA,κ là các nút của BA ở mức k, với kκ.

(ii) Các cạnh của BA,κ là tất cả các cạnh của BA, các nút đầu mút của chúng nằm ở mức k trên BA, với kκ.

Khái niệm LFoC của thuộc tính A và cấu trúc đa ngữ nghĩa của nó có hai ý nghĩa như sau:

o Khái niệm LFoC tương tự như trong trường hợp chúng ta sử dụng cấu trúc của tập các số nguyên. Tập tất cả các số nguyên là vô hạn, tuy nhiên trong các ứng dụng cụ thể chỉ có một tập hữu hạn các số nguyên được sử dụng mà vẫn đủ để thực hiện tính toán. Khái niệm LFoC ℱκ của thuộc tính A

như trong định nghĩa 2.1 có thể bảo toàn toàn bộ ngữ nghĩa của các hạng từ trong ℱκ theo ngữ cảnh như sau: Mọi hạng từ x của A trong thực tế được định nghĩa trong ngữ cảnh toàn bộ các hạng từ hx, hH. Do đó, khi một hạng từ h’x trong ℱκ thì tất cả hạng từ có dạng hx cũng thuộc ℱκ. Bởi vậy, cấu trúc bụi BA,κ là thành phần mức κ của BA.

o Cấu trúc ngữ nghĩa của LFoC ℱκ của thuộc tính A là đủ đảm bảo khả năng mở rộng các hạng từ của ℱκ trong ngữ cảnh như được xem xét trong phần tiếp theo.

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 70 - 72)

Tải bản đầy đủ (PDF)

(148 trang)