Khung nhận thức ngôn ngữ trong lý thuyết đại số gia tử

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 66 - 68)

Trong phương pháp dựa trên lý thuyết tập mờ, khái niệm khung nhận thức FoC (Frame of Cognition) [61] của một thuộc tính bao gồm tập các hạng từ và các tập mờ tương ứng theo thứ tự biểu diễn ngữ nghĩa cho các hạng từ. Các điều kiện xem xét về tính giải nghĩa được đặt ra cho hình dạng, số lượng, vị trí của các tập mờ trên miền tham chiếu số của thuộc tính. Do đó, các hạng từ gán cho các tập mờ chỉ được coi là nhãn ngôn ngữ của tập mờ đó. Theo phương pháp tiếp cận dựa trên lý thuyết ĐSGT, các tác giả trong [56] đã đưa ra định nghĩa về khung nhận thức ngôn ngữ (linguistic frames of cognition - LFoC) để khảo sát tính giải nghĩa được của các hệ dựa trên luật mờ (fuzzy rule-based systems - FRBSs) và áp dụng vào giải bài toán hồi quy. Từ ‘linguistic’ được đưa thêm vào để nhấn mạnh một cách tiếp cận khác. LFoC được coi là một tập các hạng từ ngôn ngữ, mỗi hạng từ có ngữ nghĩa riêng vốn có của nó trong ngôn ngữ tự nhiên. Khái niệm LFoC được đưa ra dựa trên nghiên cứu về cấu trúc ngữ nghĩa, các mối quan hệ ngữ nghĩa vốn có của các hạng từ trong miền hạng từ của biến ngôn ngữ (thuộc tính) A.

Mỗi thuộc tính A của cơ sở dữ liệu được coi là một thuộc tính của các đối tượng trong thế giới thực RW (real world). Có ít nhất hai cách xem xét RW, một là xem xét dựa trên miền giá trị số của A (ký hiệu là UA), hai là xem xét dựa trên miền hạng từ xác định của A (ký hiệu là LDA). Rõ ràng, UA có cấu trúc toán học, do đó

LDA cũng có cần được xem xét về cấu trúc toán học của nó như cấu trúc dựa trên thứ tự ngữ nghĩa.

Trong thực tế, miền hạng từ LDA của thuộc tính A có khả năng vô hạn và chúng ta cần nắm bắt được ngữ nghĩa của mọi hạng từ x trong ngữ cảnh của toàn bộ

LDA. Tuy nhiên, chỉ có một tập con của LDA được sử dụng trong một thời điểm hiện tại, tập con các từ được sử dụng này được coi là một khung nhận thức ngôn ngữ (LFoC) của thuộc tính A. Do đó, mối quan hệ giữa cấu trúc ngữ nghĩa trong LFoC hiện tại và cấu trúc ngữ nghĩa của toàn bộ miền hạng từ LDA của thuộc tính A cần được khảo sát.

Trong phương pháp ĐSGT, mỗi miền hạng từ của thuộc tính A được coi là một cấu trúc đại số AA = (X, G, C, H, ≤). Để xác định cú pháp và ngữ nghĩa của thuộc tính A, chúng ta cần xác định các phần tử sinh của AA, các gia tử để tạo ra miền hạng từ. Tuy nhiên, trong ứng dụng cụ thể, chúng ta chỉ xem xét một LFoC giới hạn của A, nhưng ngữ nghĩa của các hạng từ trong LFoC phải được xác định trong ngữ cảnh toàn bộ miền hạng từ của A. Từ quan điểm đó, các tác giả trong [56] đã đưa ra định nghĩa về LFoC của thuộc tính A như sau:

Định nghĩa 2.1 [56]: Một LFoC ℱ của thuộc tính A là một tập các hạng từ được sinh từ các phần tử sinh sử dụng các gia tử của A thỏa các điều kiện sau đây:

(i) {0, c−, W, c+, 1} ℱ;

(ii) hx ℱ  (h’H)(h’xℱ) (tất cả các hạng từ hx, h H, hoặc cùng thuộc vào ℱ, hoặc cùng không thuộc vào ℱ);

(iii) xℱ & x = hx’ & hHx’ℱ . 

Điều kiện (ii) và (iii) được coi như kết quả của yêu cầu cần xem xét các hạng từ của ℱ trong ngữ cảnh toàn bộ miền hạng từ của thuộc tính. Tuy nhiên, vì LFoC là hữu hạn tại một thời điểm của ứng dụng đang xem xét, các điều kiện này xác định ℱ có dạng X(), tức là gồm tất cả các hạng từ trong miền hạng từ của thuộc tính A

mà mức độ tính riêng không quá . Do đó, ℱ được gọi là LFoC mức tính riêng , gọi tắt là mức . Trong các phần tiếp theo, luận án chỉ ra rằng khái niệm này tạo thành một cơ sở hình thức hóa để đảm bảo khả năng mở rộng cấu trúc ngữ nghĩa của LFoC và các biểu diễn tập mờ tương ứng của chúng.

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 66 - 68)

Tải bản đầy đủ (PDF)

(148 trang)