Các thuật toán suy luận

Một phần của tài liệu Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả (Trang 40 - 44)

1.5.2.1. Thuật toán bao hàm theo cấu trúc

Thuật toán bao hàm theo cấu trúc thực hiện quá trình suy luận dựa trên việc so sánh cấu trúc cú pháp của các khái niệm (thường đã được chuyển về ở dạng chuẩn phủ định). Thuật toán này tỏ ra hiệu quả đối với các ngôn ngữ logic mô tả đơn giản có khả năng biểu diễn yếu như F L0,F L⊥,ALN. Với các ngôn ngữ logic mô tả giàu ngữ

nghĩa hơn, chẳng hạn như ALC, ALCI, ALCIQ, SHIQ, SHOIQ, . . . , thuật toán bao hàm theo cấu trúc không thể giải quyết được các bài toán suy luận như đã đề cập trong Mục 1.5.1.

Thuật toán bao hàm theo cấu trúc được thực hiện theo hai pha [2]. Pha thứ nhất, chuyển các khái niệm về dạng chuẩn tương ứng với từng loại ngôn ngữ. Pha thứ hai, so sánh cấu trúc cú pháp của các khái niệm. Chẳng hạn, xét ngôn ngữ logic mô tả F L0, ngôn ngữ chỉ cho phép phép giao (CuD) và lượng từ hạn chế với mọi (∀r.C), một khái niệm trong ngôn ngữ F L0 được gọi là ở dạng chuẩn nếu nó có dạng:

A1uA2u · · · uAmu ∀r1.C1u ∀r2.C2u · · · u ∀rn.Cn,

trong đó A1, A2, . . . , Am là các tên khái niệm phân biệt nhau, r1, r2, . . . , rn là các tên vai trò phân biệt nhau, C1, C2, . . . , Cn là các khái niệm ở dạng chuẩn.

Việc so sánh cấu trúc cú pháp trong pha thứ hai của thuật toán bao hàm theo cấu trúc thực hiện dựa trên mệnh đề sau [2]:

Mệnh đề 1.1. Cho C ≡ A1 u A2 u · · · uAm u ∀r1.C1 u ∀r2.C2 u · · · u ∀rn.Cn và

D≡B1uB2u · · · uBku ∀s1.D1u ∀s2.D2u · · · u ∀sl.Dl là các khái niệm ở dạng chuẩn trong ngôn ngữ F L0. Lúc đó C vD khi và chỉ khi hai điều kiện sau đây thỏa mãn:

1. với mọi 1≤i≤k, tồn tại j,1≤j ≤m sao cho Aj ≡Bi,

2. với mọi 1≤i≤l, tồn tại j,1≤j ≤n sao cho rj ≡si và Cj vDi.

Thuật toán bao hàm theo cấu trúc trong các ngôn ngữ khác nhưF L⊥,ALN thực hiện một cách tương tự.

1.5.2.2. Thuật toán tableaux

Để khắc phục những nhược điểm của thuật toán bao hàm theo cấu trúc, năm 1991, Schmidt-Schauß và Smolka đề xuất thuật toán tableaux để kiểm tra tính thỏa mãn của một khái niệm trong logic mô tả ALC [55]. Hướng tiếp cận này sau đó đã được áp dụng cho các logic mô tả mở rộng của ALC [3], [23], [24], [39], [41], [40], [42] và được áp dụng để cài đặt các bộ suy luận FaCT, FaCT++, RACER, CEL và KAON 2.

Quá trình thực hiện thuật toán tableaux dùng để kiểm tra tính thỏa mãn của một khái niệm trong cơ sở tri thức, kiểm tra tính nhất quán của bộ khẳng định. Thuật toán này trải qua hai giai đoạn. Giai đoạn thứ nhất là chuyển các khái niệm về dạng chuẩn phủ định. Giai đoạn thứ hai là áp dụng các luật chuyển đổi tương ứng với từng logic mô tả cụ thể để tìm mâu thuẫn.

Độ phức tạp của thuật toán suy luận tableaux phụ thuộc vào từng logic mô tả. Logic mô tả càng có nhiều tạo tử với khả năng biểu diễn tốt sẽ dẫn đến độ phức tạp càng cao trong quá trình suy luận. Độ phức tạp đối với bài toán suy luận trong logic mô tả ALC, ALCI, ALCIQ và S là PSpace-đầy đủ (đối với trường hợp TBox rỗng hoặc TBox không vòng) và ExpTime-đầy đủ (đối với trường hợp TBox tổng quát); SH, SHI, SHIN và SHIQ là ExpTime-đầy đủ; SHOIN và SHOIQ là

NExpTime-đầy đủ; SROIQ là NExpTime-khó [28, 30, 26, 29, 38, 44, 42, 62].

Tiểu kết Chương 1

Trong chương này, luận án đã giới thiệu khái quát về logic mô tả, khả năng biểu diễn tri thức của các logic mô tả. Thông qua cú pháp và ngữ nghĩa của logic mô tả, luận án đã trình bày về cơ sở tri thức, mô hình của cơ sở tri thức trong logic mô tả và những vấn đề cơ bản về suy luận trong logic mô tả. Ngoài việc trình bày ngôn ngữ logic mô tả một cách tổng quát dựa trên logic ALCreg với các đặc trưng mở rộng I (vai trò nghịch đảo), O (định danh), F (tính chất hàm), N (hạn chế số lượng không định tính), Q (hạn chế số lượng định tính), U (vai trò phổ quát), Self (tính phản xạ cục bộ của vai trò), luận án còn xem xét các thuộc tính như là các thành phần cơ bản của ngôn ngữ, bao gồm thuộc tính rời rạc và thuộc tính số cũng như xem xét thêm vai trò dữ liệu trong ngôn ngữ. Cách tiếp cận này phù hợp đối với các hệ thống thông tin dựa trên logic mô tả thường có trong thực tế như SHOIN và SHOIQ là nền tảng để xây dựng OWL, SROIQlà nền tảng để xây dựng OWL 2 - những ngôn ngữ được W3C khuyến nghị để xây dựng ontology cho các hệ thống ngữ nghĩa.

Chương 2.

MÔ PHỎNG HAI CHIỀU TRONG LOGIC MÔ TẢ VÀ TÍNH BẤT BIẾN

2.1. Giới thiệu

Mô phỏng hai chiều được J. van Benthem giới thiệu lần đầu dưới tên gọi p-quan hệ (p-relation) [58] vàquan hệ zig-zag(zig-zag relation) [59]. Đây là một khái niệm rất quan trọng trong logic hình thái (modal logic) [60], [5], [6], [61] và trong các hệ thống chuyển trạng thái (state transition systems) [45], [22]. Mô phỏng hai chiều là một quan hệ hai ngôi cho phép đặc tả tính tương tự giữa hai trạng thái, hai đối tượng cũng như tính tương tự giữa các mô hình Kripke. Hai đối tượng được xem là không thể phân biệt được với nhau trên ngôn ngữ logic đang xem xét nếu chúng tương tự nhau theo mô phỏng hai chiều trong logic đó. Trên cơ sở này, các đối tượng không thể phân biệt được với nhau sẽ được đưa vào cùng một lớp khi phân hoạch miền trong quá trình học máy.

Mô phỏng hai chiều được sử dụng để phân tích khả năng biểu diễn của một lớp lớn các logic hình thái mở rộng. J. van Benthem đã phát biểu một định lý, được gọi làVan Benthem Characterization, nói lên rằng logic hình thái là phân nhánh bất biến đối với mô phỏng hai chiều của logic bậc nhất. Mô phỏng hai chiều đã thu hút được sự quan tâm nghiên cứu của các nhà khoa học bởi vì chúng là một công cụ phổ biến để mô tả mối quan hệ giữa các trạng thái trong logic tính toán. Về mặt tổng quát, mô phỏng hai chiều là một khái niệm rất tự nhiên về tính tương đương và do đó nó được đầu tư nghiên cứu trong lĩnh vực toán học và logic tính toán.

Divroodi và Nguyen đã nghiên cứu mô phỏng hai chiều trong một số logic mô tả cụ thể [13], [14]. Các công trình này tập trung nghiên cứu mô phỏng hai chiều đối với lớp các logic mô tả ALCreg với tập các đặc trưng là I,O,Q,U,Self. Các tác giả đã trình bày các điều kiện của mô phỏng hai chiều một cách thống nhất cho lớp các logic mô tả trên và giải quyết các vấn đề: điều kiện để TBox, ABox bất biến đối với mô phỏng hai chiều; điều kiện về bảo toàn hoặc bất biến của cơ sở tri thức đối với mô phỏng hai chiều. Ngoài ra, các công trình [13], [14] còn cung cấp một số kết quả về tự mô phỏng hai chiều lớn nhất, thuật toán để kiểm tra tính tương tự giữa hai diễn dịch và thuật toán tính phân hoạch tương ứng với tự mô phỏng hai chiều lớn nhất.

Nguyen và Sza las đã nghiên cứu về mô phỏng hai chiều và tính không phân biệt được của các đối tượng để áp dụng vào việc học khái niệm trong logic mô tả [44]. Đây là công trình tiên phong về học khái niệm cho các hệ thống thông tin sử dụng mô phỏng hai chiều. Các tác giả đã đề xuất phương pháp tổng quát để làm mịn miền của diễn dịch và thông qua đó để xây dựng khái niệm cần học. Hơn nữa, công trình này còn đề cập đến việc xấp xỉ khái niệm theo lý thuyết tập thô của Pawlak [46], [47]. Lớp các logic mô tả mà công trình này tập trung nghiên cứu là ALCreg với tập các đặc trưng là I,O,Q,U,Self. Ngoài những đặc trưng đã đề cập ở các nghiên cứu trên, trong chương này, chúng tôi tổng quát hóa và mở rộng các kết quả về mô phỏng hai chiều cho một lớp lớn hơn các logic mô tả bằng cách xem xét thêm các thuộc tính như là các phần tử cơ bản của ngôn ngữ và xem xét thêm vai trò dữ liệu. Bên cạnh đó, chúng tôi cũng đề cập đến các đặc trưngF,N cho lớp các logic mô tả trình bày trong luận án này.

Một phần của tài liệu Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả (Trang 40 - 44)