1. Trang chủ
  2. » Luận Văn - Báo Cáo

Một số phương pháp xử lý tri thức không nhất quán trong ontology tt

28 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 28
Dung lượng 508,85 KB

Nội dung

ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC NGUYỄN VĂN TRUNG MỘT SỐ PHƯƠNG PHÁP XỬ LÝ TRI THỨC KHÔNG NHẤT QUÁN TRONG ONTOLOGY CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 62.48.01.01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH HUẾ - NĂM 2018 Cơng trình hồn thành tại: Trường Đại học Khoa học - Đại học Huế Người hướng dẫn khoa học: PGS TS Hoàng Hữu Hạnh, Ban Hợp tác quốc tế, Đại học Huế Phản biện 1: Phản biện 2: Phản biện 3: Luận án bảo vệ Hội đồng chấm luận án cấp Đại học Huế họp Đại học Huế vào lúc ngày tháng năm 2017 Có thể tìm hiểu luận án thư viện: • Thư viện Quốc gia Việt Nam • Thư viện Trường Đại học Khoa học, Đại học Huế MỞ ĐẦU Tính cấp thiết đề tài Năm 2001, Tim Berners Lee cộng đưa phác thảo cho “dạng thức nội dung web mà dạng thức có ý nghĩa máy tính” Thế hệ web sử dụng dạng thức nội dung này, gọi Web ngữ nghĩa, cho phép máy tính “hiểu” tri thức lưu trữ, theo chia sẻ tái sử dụng sở tri thức hệ thống thông tin thuộc nhiều lĩnh vực khác So với Web – kho tài liệu liên kết với nhau, Web ngữ nghĩa tảng liệu mà thơng tin lưu dạng định nghĩa tường minh, cho phép máy tính người làm việc Web ngữ nghĩa lĩnh vực nghiên cứu phát triển nhanh nhận quan tâm cộng đồng nghiên cứu thập niên vừa qua Công nghệ Web ngữ nghĩa áp dụng vào nhiều lĩnh vực khác thực tế Thành phần quan trọng ứng dụng web ngữ nghĩa ontology Trong ontology người ta định nghĩa thực thể (bao gồm khái niệm, thuộc tính, cá thể) mối quan hệ thực thể theo ngữ nghĩa quy định tường minh ngôn ngữ logic xác định Ngôn ngữ ontology sử dụng phổ biến chuẩn hoá tổ chức tiêu chuẩn quốc tế W3C (World Wide Web Consortium) OWL Phiên ngôn ngữ OWL (được giới thiệu vào năm 2009) dựa logic mô tả SROIQ(D) Vấn đề quan trọng Web ngữ nghĩa phải xử lý tri thức không quán ontology Điều bắt nguồn từ đặc điểm xây dựng sử dụng ontology ứng dụng Web ngữ nghĩa: Đặc tính mở rộng, chia sẻ, tái sử dụng, phân tán đa người dùng tiềm ẩn khả làm xuất tri thức không quán ontology Trên thực tế, ontology không quán, truy vấn khơng có nghĩa Điều tiên đề hệ logic ontology khơng qn Nói cách khác, không quán làm ý nghĩa sử dụng ontology ứng dụng Web ngữ nghĩa Chính vậy, xử lý tri thức khơng qn ontology tốn quan trọng, có ý nghĩa thực tiễn cộng đồng khoa học máy tính quan tâm nghiên cứu Động lực nghiên cứu cách tiếp cận nghiên cứu luận án Các phương pháp xử lý tri thức khơng qn ontology phân làm hai nhóm: (1) nhóm phương pháp chấp nhận tồn tri thức không quán ontology, (2) nhóm phương pháp tìm cách loại bỏ tri thức không quán khỏi ontology: (1) Các giải pháp thuộc nhóm thứ – chấp nhận tồn tri thức không quán ontology Một số tiếp cận thuộc nhóm định nghĩa logic mơ tả với ngữ nghĩa nửa quán xây dựng ontology dựa logic Việc sử dụng logic với ngữ nghĩa nửa quán để xây dựng ontology, tạo mơ hình biểu diễn tri thức tồn diện lại khó triển khai thực tế tính phổ biến ngơn ngữ ontology chuẩn hoá khuyến nghị sử dụng tổ chức W3C Trong nhiều trường hợp thực tế, ứng dụng Web ngữ nghĩa cần truy vấn thông tin tổng hợp từ ontology đến từ nhiều nguồn khác (và khơng qn) mà không phép chỉnh sửa hay tạo ontology Một giải pháp cho vấn đề khung lập luận với ontology không quán sử dụng chiến lược phát triển tuyến tính tập tiên đề diễn giải, đề xuất nhóm tác giả Zhisheng Huang, Frank van Harmelen cộng Khung lập luận tìm câu trả lời có nghĩa cho truy vấn với ontology khơng quán cách chọn tập gồm tiên đề quán từ ontology đầu vào – gọi tập tiên đề diễn giải truy vấn: tập tiên đề có liên quan với truy vấn theo tiêu chí cụ thể cho trước trả lời truy vấn Phần quan trọng khung lập luận với ontology không quán hàm chọn để xây dựng tập tiên đề diễn giải truy vấn Hai hàm chọn điển hình nhóm tác giả phát triển hàm chọn dựa liên quan cú pháp hàm chọn dựa khoảng cách ngữ nghĩa theo máy tìm kiếm Google Hai hàm chọn có nhược điểm phụ thuộc vào cú pháp tiên đề Khắc phục nhược điểm động lực nghiên cứu luận án: Luận án đề xuất xây dựng tập tiên đề diễn giải theo độ liên quan ngữ nghĩa tiên đề với truy vấn đầu vào Độ liên quan xác định dựa khoảng cách ngữ nghĩa biểu thức khái niệm đặt chúng phân cấp khái niệm ontology gọi ontology tham chiếu (2) Các giải pháp thuộc nhóm thứ hai – tìm cách loại bỏ tri thức không quán thông qua việc xây dựng ontology từ nhiều ontology đầu vào Việc tạo ontology diễn theo hai chiến lược: chiến lược thứ nhất, dị tìm, đề xuất chỉnh sửa loại bỏ số tiên đề gây nên không quán khỏi ontology; chiến lược thứ hai, áp dụng lý thuyết đồng thuận để xây dựng tập tiên đề hợp lý (theo tiêu chuẩn xác định trước) đại diện cho ontology đầu vào Chiến lược thứ thường sử dụng để trì quán ontology, chiến lược thứ hai thường sử dụng để xử lý xung đột q trình tích hợp ontology đến từ nhiều nguồn phân tán, độc lập Các cơng trình xử lý tri thức khơng quán dựa lý thuyết đồng thuận tác giả Nguyễn Ngọc Thành đề xuất vào năm 2002 với cộng mở rộng năm Tác giả cộng phân loại xung đột q trình tích hợp ontology theo mức (mức khái niệm, mức quan hệ, mức cá thể) đề xuất phương pháp để xử lý xung đột theo mức Trong toán xử lý xung đột mức khái niệm, cấu trúc khái niệm xét theo hai khía cạnh: tập thuộc tính mơ tả khái niệm miền giá trị thuộc tính Tuy vậy, nghiên cứu xử lý xung đột mức khái niệm q trình tích hợp ontology tập trung xây dựng danh sách thuộc tính khái niệm cần tích hợp Miền giá trị thuộc tính xác định cách lấy hợp miền giá trị thành phần Điều có nghĩa xung đột miền giá trị thuộc tính chưa xét đến Luận án áp dụng mơ hình tổng quát tích hợp tri thức theo phương pháp đồng thuận đề xuất phương án xử lý xung đột mức khái niệm q trình tích hợp ontology, có xét đến hai khía cạnh: danh sách thuộc tính miền giá trị thuộc tính Một mức xung đột khác xảy trình tích hợp ontology xung đột mức tiên đề, theo đó, tập tiên đề ontology tham gia tích hợp có sai khác chí mâu thuẫn Tình thường xuyên xảy trình xây dựng ontology theo kiểu phân tán, cộng tác, đa người dùng mà đó, ontology xây dựng nhiều người dùng tự nguyện thông qua wiki ngữ nghĩa chuyên gia thuê Xung đột mức tiên đề q trình tích hợp ontology tốn chưa có giải pháp tốt thuyết phục mức khái niệm, quan hệ hay cá thể Bằng cách biểu diễn tiên đề dạng literal , ontology thành phần biểu diễn dạng hội literal Như vậy, tốn xử lý xung đột tập tiên đề dẫn tốn xử lý xung đột cấp độ cú pháp công thức hội Luận án xây dựng khoảng cách hai cơng thức hội, phân tích tiêu chuẩn cho công thức hội đồng thuận đề xuất phương án tìm cơng thức hội đồng thuận Kết áp dụng cho tốn xử lý xung đột mức tiên đề Mục tiêu, đối tượng phạm vi nghiên cứu luận án Đối tượng nghiên cứu luận án ontology, tri thức không quán ontology, phương pháp xử lý tri thức không quán ontology Trên sở phân tích động lực nghiên cứu, luận án xác định mục tiêu xử lý tri thức không quán ontology theo hai tác vụ truy vấn tích hợp Mục tiêu nghiên cứu cụ thể luận án giới hạn theo ba tốn sau đây: • Bài tốn thứ nhất: Xác định câu trả lời có nghĩa truy vấn với ontology không quán Trong toán này, luận án nghiên cứu đề xuất phương pháp sử dụng ontology tham chiếu để tính khoảng cách ngữ nghĩa hai khái niệm, hai biểu thức khái niệm, hai tiên đề Khoảng cách ngữ nghĩa dùng để xây dựng hàm chọn khung lập luận với ontology khơng qn • Bài tốn thứ hai: Xử lý xung đột mức khái niệm q trình tích hợp ontology Luận án áp dụng mơ hình tổng qt tích hợp tri thức theo phương pháp đồng thuậnđể tìm đồng thuận cho cấu trúc khái niệm Sự không quán cấu trúc khái niệm giải danh sách thuộc tính miền giá trị thuộc tính • Bài toán thứ ba: Xử lý xung đột mức tiên đề q trình tích hợp ontology Trên sở biểu diễn xung đột mức tiên đề q trình tích hợp ontology dạng xung đột cú pháp, luận án đánh giá độ sai khác tập tiên đề xây dựng phương pháp tìm tập tiên đề đồng thuận theo tiêu chuẩn dựa độ sai khác Chương TỔNG QUAN VỀ XỬ LÝ TRI THỨC KHÔNG NHẤT QUÁN TRONG ONTOLOGY 1.1 Ontology tri thức không quán Định nghĩa 1.1 (Ontology) Một ontology bốn C, I, R, Z , đó: C tập hợp khái niệm (các lớp); I tập hợp cá thể khái niệm; R tập hợp quan hệ; Z tập hợp tiên đề biểu diễn ràng buộc tồn vẹn dùng để mơ tả thực thể (khái niệm, cá thể, quan hệ) Ở Định nghĩa 1.1, R cịn gọi tập thuộc tính Người ta phân biệt hai loại thuộc tính: thuộc tính đối tượng dùng để liên kết cá thể, thuộc tính kiểu liệu dùng để liên kết cá thể với giá trị liệu Một ontology gọi khơng qn khơng có mơ hình Nguyên nhân dẫn đến điều tập tiên đề ontology có chứa mâu thuẫn Việc truy vấn ontology khơng qn khơng có nghĩa tiên đề hệ logic ontology không quán Luận án xử lý tri thức không quán ontology theo hai vấn đề: truy vấn ontology không quán xử lý tri thức khơng qn q trình tích hợp ontology Cơ sở lý thuyết cho vấn đề thứ khung lập luận với ontology không quán lý thuyết đồng thuận trình bày chương tổng quan 1.2 Khung lập luận với ontology không quán sử dụng chiến lược phát triển tuyến tính tập tiên đề diễn giải 1.2.1 Các khái niệm Khung lập luận với ontology không quán đề xuất Zhisheng Huang, Frank van Harmelen cộng vào năm 2005 Khung lập luận xem ontology tập hợp tiên đề không giới hạn cho loại ngôn ngữ ontology cụ thể Gọi L ngôn ngữ ontology, ký hiệu 2L tập gồm tất tập tiên đề ngơn ngữ L Ontology Σ xem tập tiên đề ngôn ngữ L: Σ ∈ 2L Để phân biệt với phép suy luận chuẩn |=, sử dụng |≈ để ký hiệu cho phép suy luận không chuẩn, phép suy luận tham số hố để chấp nhận khơng qn Định nghĩa 1.2 (Tính đúng) Một phép suy luận không chuẩn |≈ gọi tiên đề suy dẫn từ ontology khơng qn Σ theo |≈ suy dẫn từ tập gồm tiên đề quán Σ (gọi ontology quán Σ) phép suy luận chuẩn |= Định nghĩa 1.3 (Tính có nghĩa) Một kết phép suy luận khơng chuẩn gọi có nghĩa quán: Σ |≈ φ ⇒ Σ |≈ ¬φ Phép suy luận |≈ gọi có nghĩa câu trả lời có nghĩa Định nghĩa 1.4 (Truy vấn ontology không quán sử dụng phép suy luận không chuẩn) Một truy vấn φ với ontology không quánΣ sử dụng phép suy luận không chuẩn |≈ phép đánh giá quan hệ hệ “ Σ |≈ φ?” “ Σ |≈ ¬φ?” Có thể có bốn câu trả lời cho truy vấn tương ứng với bốn trường hợp sau (a) Quá xác định: Σ |≈ φ Σ |≈ ¬φ (b) Chấp nhận: Σ |≈ φ Σ |≈ ¬φ (c) Bác bỏ: Σ |≈ φ Σ |≈ ¬φ (d) Khơng xác định: Σ |≈ φ Σ |≈ ¬φ Định nghĩa 1.5 (Tính đầy đủ cục bộ) Cho Σ ontology không quán, Σ ⊂ Σ ontology quán Σ Với φ tiên đề, kết suy luận Σ |≈ φ gọi đầy đủ cục theo Σ nếu: Σ |= φ ⇒ Σ |≈ φ Phép suy luận |≈ với ontology Σ gọi đầy đủ cục theo Σ kết suy luận đầy đủ cục theo Σ Định nghĩa 1.6 (Tính cục bộ) Cho Σ ontology không quán, Σ ⊂ Σ ontology quán Σ Một trả lời truy vấn φ với Σ gọi cục theo Σ nếu:Σ |≈ φ ⇒ Σ |= φ Phép suy luận |≈ với ontology Σ gọi là cục theo Σ trả lời truy vấn Σ |≈ φ cục theo Σ Định nghĩa 1.7 (Tính cực đại) Cho Σ ontology không quán, Σ ⊂ Σ ontology quán Σ Phép suy luận |≈ với ontology không quán Σ gọi cực đại theo Σ nếu: (Σ |= φ) ⊥) ∧ (∀Σ ⊂ Σ : Σ ⊃ Σ ⇒ Σ |= ⊥) ∧ (∀φ : Σ |= φ ⇔ Σ |≈ Zhisheng Huang cộng rằng: Mệnh đề 1.1 Cho Σ ontology không quán, Σ ⊂ Σ ontology quán Σ, |≈ phép suy luận không chuẩn, φ tiên đề Khi đó: (a) Tính cục kéo theo tính tính có nghĩa (b) Tính cực đại kéo theo tính đầy đủ cục 1.2.2 Hàm chọn Cho L ngôn ngữ ontology, Σ ∈ 2L ontology, φ ∈ L tiên đề L Hàm chọn s trả tập Σ bước k > (k ∈ N) trình đánh giá truy vấn “ Σ |≈ φ?” định nghĩa tổng quát sau: Định nghĩa 1.8 (Hàm chọn) Hàm chọn s ánh xạ s : 2L × L × N → 2L cho s(Σ, φ, k) ⊆ Σ với ∀Σ ∈ 2L , φ ∈ L, k ∈ N Định nghĩa 1.9 (Hàm chọn đơn điệu) Một hàm chọn s gọi đơn điệu tập mà chọn tăng giảm cách đơn điệu theo bước lặp 1.2.3 Phép suy luận không chuẩn sử dụng hàm chọn đơn điệu Một phép suy luận sử dụng hàm chọn đơn điệu tăng (tương ứng, đơn điệu giảm) gọi phép suy luận sử dụng chiến lược mở rộng tuyến tính (tương ứng, rút gọn tuyến tính) Một chiến lược mở rộng tuyến tính thực Hình 1.1 Mệnh đề 1.2 (Tính chất chiến dụng chiến lược mở rộng tuyến tính (a) khơng q xác định (c) ln (e) luôn đầy đủ cục (g) ln ln cục lược mở rộng tuyến tính) Một phép suy luận sử thoả tính chất sau đây: (b) khơng xác định (d) ln ln đầy đủ cục (f) khơng cực đại Hình 1.1: Chiến lược mở rộng tuyến tính 1.2.4 Phép suy luận không chuẩn sử dụng hàm chọn dựa liên quan cú pháp Hàm chọn dựa liên quan cú pháp sSyn Với tiên đề φ, sử dụng I(φ), C(φ), R(φ) để tương ứng ký hiệu cho tập tên cá thể, tập tên khái niệm tập tên quan hệ xuất tiên đề Định nghĩa 1.10 (Liên quan trực tiếp) Hai tiên đề φ, ψ gọi liên quan trực tiếp với có tên thực thể xuất φ ψ , tức là: I(φ) ∩ I(ψ) = ∅ ∨ C(φ) ∩ C(ψ) = ∅ ∨ R(φ) ∩ R(ψ) = ∅ (1.1) Định nghĩa 1.11 (Liên quan trực tiếp với tập hợp) Một tiên đề φ gọi liên quan trực tiếp với tập tiên đề Σ tồn tiên đề ψ ∈ Σ cho φ ψ liên quan trực tiếp với Định nghĩa 1.12 (Hàm chọn dựa liên quan cú pháp) Hàm chọn dựa liên quan cú pháp định nghĩa sau: 2L × L × N → 2L (Σ, φ, k) → sSyn (Σ, φ, k) với: sSyn (Σ, φ, 0) := ∅; sSyn (Σ, φ, 1) := {ψ ∈ Σ | ψ liên quan trực tiếp với φ}; sSyn (Σ, φ, k) := {ψ ∈ Σ | ψ liên quan trực tiếp với sSyn (Σ, φ, k − 1)} (k > 1) Phép suy luận không chuẩn sử dụng hàm chọn sSyn Hàm chọn dựa liên quan cú pháp sSyn hàm chọn đơn điệu tăng Phép suy luận sử dụng hàm chọn sSyn khung lập luận mô tả phần trước, ký hiệu |≈Syn , thường phát triển đến tập hợp tiên đề khơng qn cách nhanh chóng Để cải thiện điều này, người ta buộc hàm chọn phải trả tập tiên đề quán Σ bước k sSyn (Σ, φ, k) không quán, cho sSyn (Σ, φ, k − 1) ⊂ Σ ⊂ sSyn (Σ, φ, k) Quy trình gọi quy trình xử lý xác định - ODP hàm chọn Tuy nhiên, trình xử lý ODP lại dẫn đến vấn đề gọi không định được: việc lựa chọn tập quán lớn s(Σ, φ, k) sinh nhiều câu trả lời cho truy vấn Σ |≈Syn φ 1.2.5 Các nghiên cứu liên quan đến khung lập luận với ontology không quán sử dụng chiến lược mở rộng tuyến tính tập tiên đề diễn giải Hàm chọn đóng vai trò quan trọng áp dụng khung lập luận với ontology không quán sử dụng chiến lược mở rộng tuyến tính tập tiên đề diễn giải Mục luận án phân tích hai hàm chọn xây dựng – hàm chọn dựa liên quan cú pháp hàm chọn dựa độ liên quan ngữ nghĩa sử dụng khoảng cách Google chuẩn hoá Hàm chọn dựa liên quan cú pháp có số nhược điểm: • Phép suy luận thường xuyên phải sử dụng thủ tục ODP để quay lui • Số lượng tiên đề bổ sung bước lặp thường lớn Hàm chọn dựa độ liên quan ngữ nghĩa sử dụng khoảng cách Google chuẩn hoá NGD - Normalized Google Distance đề xuất để khắc phục nhược điểm Tuy vậy, hàm chọn có nhược điểm phụ thuộc cú pháp tiên đề: • Chiến lược mở rộng tập tiên đề hoàn toàn phụ thuộc vào cú pháp biểu diễn thực thể (tên khái niệm, tên vai trị, tên cá thể) tiên đề • Chiến lược mở rộng tập tiên đề diễn giải không xét thực thể (tên khái niệm, tên vai trò, tên cá thể) tổng thể biểu thức chúng Để khắc phục nhược điểm nêu trên, luận án đề xuất phương án đánh giá liên quan hai tiên đề trình mở rộng tập tiên đề diễn giải dựa ngữ nghĩa ontology tham chiếu: liên quan hai tiên đề đánh giá dựa khoảng cách ngữ nghĩa biểu thức khái niệm (trong tiên đề) đặt chúng phân cấp khái niệm ontology tham chiếu 1.3 Xử lý khơng qn tri thức q trình tích hợp ontology theo phương pháp đồng thuận 1.3.1 Hồ sơ xung đột Gọi U tập hữu hạn đối tượng biểu diễn ý kiến tiềm chủ đề xung đột xác định trước; (U) tập tất gồm k phần tử lập từ U (k ∈ N∗ ) Mỗi phần tử (U) gọi hồ sơ xung đột, gọi ngắn gọn hồ sơ Chúng ta phân biệt lớp hồ sơ xung đột sau Định nghĩa 1.13 (Phân loại hồ sơ xung đột) Một hồ sơ xung đột X ∈ gọi là: (U) (1) Hồ sơ đồng phần tử giống nhau; nghĩa X = {n ∗ x} với x ∈ U n ∈ N (2) Hồ sơ phân biệt phần tử khác đơi (3) Bội hồ sơ Y, viết X = n ∗ Y, Y = {x1 , x2 , , xk } X = {n ∗ x1 , n ∗ x2 , , n ∗ xk } với k, n ∈ N n > (4) Hồ sơ tắc phân biệt bội hồ sơ phân biệt 1.3.2 Sự không quán tri thức Sự không quán tri thức tập cho trước tác tử chủ đề xác định biểu diễn hồ sơ xung đột Định nghĩa 1.14 (Sự không quán tri thức) Tri thức tác tử tham chiếu chủ đề s cho trước lập thành hồ sơ X+ (x) X− (s) Các hồ sơ tương ứng chứa trạng thái tri thức từ tập vũ trụ U biểu diễn khẳng định phủ định chủ đề s tác tử Chúng ta gọi có khơng qn tri thức hay xung đột tri thức chủ đề s xuất hai hồ sơ X+ (s) X− (s) không đồng Định nghĩa 1.15 (Hàm đánh giá khoảng cách) Hàm d : U × U → [0, 1] gọi hàm đánh giá khoảng cách hai phần tử tập vũ trụ U thoả tính chất: 1) Khơng âm: ∀x, y ∈ U : d(x, y) ≥ ; 2) Phản xạ: ∀x, y ∈ U : d(x, y) = x = y ; 3) Đối xứng: ∀x, y ∈ U : d(x, y) = d(y, x) Hàm đánh giá khoảng cách sử dụng làm sở để đánh giá mức độ quán xây dựng đồng thuận cho hồ sơ xung đột Độ quán hồ sơ xung đột đánh giá thông qua hàm c định nghĩa sau: c : (U) → [0, 1] Người ta đưa tiêu chuẩn P cho hàm quán (Định nghĩa 1.16) 1.3.3 Hàm đồng thuận Định nghĩa 1.17 Hàm đồng thuận không gian nửa-mêtric (U, d) ánh xạ C : (U) → 2U đó, 2U ký hiệu tập hợp gồm tất tập U Định nghĩa 1.18 (Tiêu chuẩn cho hàm đồng thuận) Gọi U tập vũ trụ, (U, d) không gian nửa-mêtric Một hàm đồng thuận cần thoả mãn nhiều tiêu chuẩn tiêu chuẩn sau (gọi tiêu chuẩn cho hàm đồng thuận): Tính tin cậy, Tính trí, Tính đơn giản, Tính gần-nhất trí, Tính quán, Tính quán Condorcet, Tính quán chung, Tính đồng biến, Tính tối ưu O1 , Tính tối ưu O2 (iii) Trong trường hợp lại, LCPO (CE , CE ) xác định theo định nghĩa khái niệm cha chung tối thiểu Mục 2.1: LCPO (CE , CE ) = CO | CE c ∧ CE c ∧ ∀c ∈ CO : CE c ∧ CE c ⇒c c∈ c (2) Chúng ta xác định µO (CE , CE ) nhờ vào giá trị µO (c1 , c2 ) với c1 , c2 ∈ CO theo nguyên tắc quy hoạch động (i) Tồn hai khái niệm c1 , c2 ∈ CO cho c1 ≡ CE c2 ≡ CE Đây trường hợp đơn giản nhất, đó: µO (CE , CE ) = µO (c1 , c2 ) (ii) Tồn khái niệm c1 ∈ CO cho c1 ≡ CE , đồng thời khơng tồn khái niệm có tên O tương đương với CE Khi đó: µO (CE , CE ) = µO (c1 , CE ) = min{µO (c1 , c) + | c ∈ DCO (CE )} (iii) Tồn khái niệm c2 ∈ CO cho c2 ≡ CE , đồng thời khơng có khái niệm có tên O tương đương với CE Khi đó: µO (CE , CE ) = µO (CE , c2 ) = min{µO (c, c2 ) + | c ∈ DPO (CE )} (iv) Khơng tồn khái niệm có tên O tương đương với biểu thức khái niệm CE , CE Khi đó: µO (CE , CE ) := min{µO (c, c ) + | c ∈ DPO (CE ), c ∈ DCO (CE )} Như vậy, xác định số cung nối trực tiếp tối thiểu hai biểu thức khái niệm đặt chúng phân cấp khái niệm ontology tham chiếu dựa vào µO (c1 , c2 ) tính trước cho ∀c1 , c2 ∈ CO 2.3 Khoảng cách ngữ nghĩa hai tiên đề theo ontology tham chiếu Định nghĩa 2.5 (Khoảng cách ngữ nghĩa hai tập biểu thức khái niệm theo ontology tham chiếu) Cho O ontology, A B hai tập hợp khác rỗng gồm biểu thức khái niệm Khoảng cách ngữ nghĩa hai tập theo ontology tham chiếu O, ký hiệu dO (A, B), xác định sau: δO (CE a , CE b ) dO (A, B) := CE a ∈A,CE b ∈B card(A).card(B) (2.3) Ta quy ước, dO (A, B) = A = ∅ B = ∅ Định nghĩa 2.6 (Khoảng cách ngữ nghĩa hai tiên đề theo ontology tham chiếu) Cho O ontology Khoảng cách ngữ nghĩa hai tiên đề φ, ψ theo ontology tham chiếu O, ký hiệu dO (φ, ψ), xác định theo công thức sau: dO (φ, ψ) := dO CE(φ), CE(ψ) , đó, CE(φ), CE(ψ) tập hợp biểu thức khái niệm tiên đề φ, ψ 12 2.4 Suy luận với ontology không quán sử dụng hàm chọn dựa khoảng cách ngữ nghĩa Luận án xây dựng hàm chọn dựa khoảng cách ngữ nghĩa để sử dụng khung lập luận với ontology không quán mô tả Mục 1.2 Hàm chọn cụ thể hoá Định nghĩa 1.8 cách sử dụng ontology tham chiếu để đánh giá khoảng cách ngữ nghĩa Định nghĩa 2.7 (Hàm chọn dựa khoảng cách ngữ nghĩa theo ontology tham chiếu) Gọi O ontology tham chiếu; Σ ontology không quán ngôn ngữ L Hàm chọn dựa khoảng cách ngữ nghĩa theo ontology tham chiếu O, ký hiệu sO Sem , định nghĩa sau: 2L × L × N → 2L (Σ, φ, k) → sO Sem (Σ, φ, k) sO Sem (Σ, φ, k) định nghĩa theo công thức truy hồi: - sO Sem (Σ, φ, 0) = ∅; O - sO Sem (Σ, φ, k) = sSem (Σ, φ, k − 1) ∪ ψ ∈ Σ | ¬∃ψ ∈ Σ : ψ ∈ / sO Sem (Σ, φ, k − 1) ∧ dO (ψ , φ) < dO (ψ, φ) , (k ≥ 1) Hàm chọn sO Sem hàm chọn đơn điệu tăng Chúng ta xây dựng phép suy luận |≈O sử dụng hàm chọn hàm chọn để mở rộng tuyến tính tập tiên đề diễn giải theo khung lập luận Mục 1.2 2.5 Thực nghiệm đánh giá kết Luận án tiến hành thực nghiệm với liệu gồm ontology Madcow, MiniEconomy Transportion lấy từ tập liệu thử nghiệm thuộc dự án nghiên cứu SEKT (http://www.sekt-project.com) Bảng 2.1 mô tả thông tin ontology liệu thử nghiệm Bảng 2.1: Các ontology thực nghiệm Ontology Số khái niệm Số khái niệm không thoả Số tiên đề Madcow MiniEconomy Transporation 54 338 445 51 62 174 314 380 Với ontology thử nghiệm Σ, gọi UΣ tập khái niệm không thoả Σ, tập truy vấn thử nghiệm có dạng Σ |≈ “C D? C ∈ UΣ D ∈ CΣ \ U Σ Bảng 2.2 Bảng 2.3 trình bày kết thực nghiệm hai phép suy luận |≈O |≈Syn với ontology liệu thực nghiệm Kết thực nghiệm cho thấy: 13 Bảng 2.2: So sánh theo số lượng kết xác định truy vấn Bảng 2.3: So sánh phát triển tập tiên đề diễn giải • Phép suy luận |≈O trả số lượng kết xác định nhiều so với phép suy luận |≈Syn Như phép suy luận |≈O cho phép khai thác ontology không quán tốt so với phép suy luận |≈Syn • Số tiên đề bổ sung sau bước mở rộng tập tiên đề diễn giải phép suy luận |≈O thấp nhiều so với phép suy luận |≈Syn Kết phù hợp với nhận định hàm chọn sO Sem định lượng khoảng cách tiên đề với truy vấn tốt so với hàm chọn sSyn • Số tiên đề cần loại bỏ quy trình xử lý ODP phép suy luận |≈O thấp nhiều so với phép suy luận |≈Syn : nhỏ 10 lần liệu thử nghiệm Nhờ vậy, chi phí tính tốn cho ODP phép suy luận |≈O thấp nhiều so với |≈Syn 2.6 Tiểu kết Chương Trong chương luận án xây dựng phương án hiệu dựa nguyên lý quy hoạch động để tính khoảng cách ngữ nghĩa hai biểu thức khái niệm theo ontology tham chiếu Luận án phân loại tiên đề ontology OWL 2, phân tách biểu thức thực thể dạng tiên đề làm sơ sở cho việc tính khoảng cách ngữ nghĩa hai tiên đề theo ontology tham chiếu Dựa khoảng cách ngữ nghĩa theo ontology tham chiếu hai tiên đề, luận án xây dựng hàm chọn áp dụng vào khung lập luận với ontology không quán Tính hiệu hàm chọn đề xuất luận án so với với hàm chọn dựa 14 liên quan cú pháp thể rõ qua kết thực nghiệm trình bày cuối chương Kết chương đăng Tạp chí Khoa học Cơng nghệ Trường Đại học Khoa học, Đại học Huế [CT6] Chương XỬ LÝ XUNG ĐỘT MỨC KHÁI NIỆM TRONG Q TRÌNH TÍCH HỢP ONTOLOGY 3.1 Mơ hình tích hợp tri thức dựa lý thuyết đồng thuận Định nghĩa 3.1 (Thế giới thực (A, V)) Gọi A tập hợp thuộc tính Mỗi thuộc tính a ∈ A có miền xác định tập hợp Va gồm giá trị sơ cấp Chúng ta giả thiết giá trị thuộc tính a tập Va phần tử Va Với V = a∈A Va , ta nói, giới thực biểu diễn cặp (A, V) Với T ⊆ A, ta ký hiệu VT = a∈T Va , VT = a∈T 2Va Định nghĩa 3.2 (Bộ phức kiểu T) Bộ phức kiểu T thành lập hàm r : T → V T cho r(a) ⊆ Va , ∀a ∈ T Thay viết r(a) viết kiểu T viết rT Một rT viết dạng tập hợp: rT = {(a, ) | a ∈ T} Tập hợp gồm tất kiểu T ký hiệu TUPLE(T) Định nghĩa 3.3 (Bộ sơ cấp kiểu T) Bộ sơ cấp kiểu T thành lập hàm r : T → VT cho r(a) ∈ Va , ∀a ∈ T Nếu Va = ∅ r(a) = ε, đó, ký hiệu ε biểu diễn giá trị đặc biệt, sử dụng miền xác định thuộc tính tập hợp rỗng Tập hợp tất sơ cấp kiểu T ký hiệu E-TUPLE(T) Định nghĩa 3.4 (Tổng hai bộ) Tổng hai rT r T r T = T ∪ T   với a ∈ T ∩ T ra ∪ ra = với a ∈ T \ T  r với a ∈ T \ T a Định nghĩa 3.5 (Tích hai bộ) Tích hai rT r T r T = T ∩ T r a = ∩ với a ∈ T T T , trong Định nghĩa 3.6 (Quan hệ ≺) Cho r ∈ TUPLE(T) r ∈ TUPLE(T ) T ⊆ T Ta nói r chứa r , ký hiệu r ≺ r , ⊆ với a ∈ T Bài tốn tích hợp tri thức phát biểu sau: Với hồ sơ xung đột X = {ri ∈ TUPLE(Ti ) | Ti ⊆ A với i = 1, 2, , n}, cần phải xác định r∗ kiểu T∗ ⊆ A cho r∗ đại diện tốt cho cho Bộ đồng thuận r∗ gọi tích hợp cho hồ sơ xung đột X 15 Đồng thuận “đại diện tốt nhất” hiểu đồng thuận thoả nhiều tiêu chuẩn thuộc tiêu chuẩn cho tích hợp (Định nghĩa 3.7): Tính bao đóng tri thức - (T1 ), tính bao đóng tri thức - (T2 ), tính quán tri thức (T3 ), tính ưu tiên tri thức - (T4 ), tính ưu tiên tri thức - (T5 ) độ tương tự cực đại (T6 ) 3.2 Các mức xung đột trình tích hợp ontology Người ta phân loại mức xung đột sau q trình tích hợp ontology: (1) Xung đột mức cá thể : Các cá thể có tên đặc tả khác ontology khác (2) Xung đột mức khái niệm: Các khái niệm có tên có cấu trúc khác ontology khác (3) Xung đột mức quan hệ : Cùng hai khái niệm có mối quan hệ không quán ontology khác (4) Xung đột mức tiên đề : Tập tiên đề khác ontology khác 3.3 Xử lý xung đột mức khái niệm trình tích hợp ontology Định nghĩa 3.14 (Bài tốn tích hợp ontology mức khái niệm) Gọi O1 , O2 , , On , (n ∈ N) ontology dựa - (A, V) Giả sử khái niệm c ontology Oi (c, Ai , Vi ), i = 1, 2, , n Từ hồ sơ xung đột X = (Ai , Vi ) | i = 1, 2, , n , xác định cặp (A∗ , V∗ ) biểu diễn tốt cấu trúc cho khái niệm c Luận án đề xuất Thuật toán 3.1 xác định cấu trúc tối ưu cho khái niệm Định lý 3.1 Với hồ sơ X = (Ai , Vi ) | i = 1, 2, , n , Thuật tốn 3.1 có tính chất sau đây: (a) Đồng thuận xác định thuật toán thoả tiêu chuẩn T1 , T2 , T3 , T4 (b) Nếu quy tắc R5 (quy tắc tần suất xuất bán thuộc tính hồ sơ xung đột) khơng áp dụng thuật tốn, đồng thuận xác định thuật toán thoả tiêu chuẩn T5 (c) Đồng thuận xác định thuật toán thoả mãn phần tiêu chuẩn T6 Một số nhận xét Thuật tốn 3.1: • Thuật tốn xác định cấu trúc đồng thuận cho khái niệm c hai thành phần: thuộc tính miền giá trị • Việc định có áp dụng quy tắc R5 hay không tuỳ thuộc vào lựa chọn “muốn lấy hết tất thuộc tính khái niệm ontology thành phần” hay không: − Lựa chọn “Có” phản ánh ý muốn khai thác tri thức tất chuyên gia − Lựa chọn “Khơng” phản ánh ý muốn cần có đồng thuận cao từ tác tử tri thức • Chúng ta chỉnh sửa Bước thuật tốn: Nếu Xa không khả đồng thuận theo tiêu chuẩn O1 , thay loại bỏ thuộc tính a khỏi A∗ , ta xác định miền giá trị Va∗ tổng miền giá trị cặp (Ai , Vi ) Điều chỉnh 16 Thuật toán 3.1: Xác định đồng thuận cấu trúc khái niệm Đầu vào: • Hồ sơ xung đột X = (Ai , Vi ) | i = 1, 2, , n , (Ai , Vi ) mơ tả cấu trúc khái niệm c ontology Oi • Ua (a ∈ A) tập vũ trụ, chứa tất giá trị cho Va (miền giá trị thuộc tính a) • da (a ∈ A) hàm đánh giá khoảng cách hai phần tử tập vũ trụ Ua Bước Bước Đầu ra: Cặp (A∗ , V∗ ) biểu diễn đồng thuận cấu trúc đại diện khái niệm c begin A∗ := ni=1 Ai ; foreach a, b ∈ A∗ if (a ↔ b a ↓ b) then Thay a b; A∗ := A∗ \ {a}; foreach a, b ∈ A∗ if (a → b) then A∗ := A∗ \ {b}; Bước 3a 3b Bước foreach a ∈ A∗ n if (số lần xuất a cặp (Ai , Vi ) nhỏ ) then A∗ := A∗ \ {a}; else Thành lập hồ sơ Xa := {V1 , V2 , , Vk } với Vj miền giá trị thuộc tính a cặp (Ai , Vi ), j = 1, 2, , k i = 1, 2, , n; if (Xa khả đồng thuận theo tiêu chuẩn O1 ) then Chọn Va∗ đồng thuận O1 không gian nửa-mêtric (Ua , da ): da (Va∗ , Xa ) = da (Va , Xa ) | Va ∈ Xa ; Đặt Va∗ miền giá trị cho thuộc tính a A∗ ; else A∗ := A∗ \ {a}; foreach a ∈ A∗ if (có mối quan hệ a ↔ b a → b a ↓ b) then A∗ := A∗ ∪ {b}; 17 giúp thu thập nhiều đặc tả thuộc tính khái niệm cần tích hợp (khơng ưu tiên đồng thuận miền giá trị) 3.4 Vấn đề xây dựng hàm đánh giá khoảng cách cho miền giá trị thuộc tính Để áp dụng Thuật toán 3.1, phải thành lập hàm đánh giá khoảng cách da hai miền giá trị thuộc tính a theo Định nghĩa 1.15 Có hai loại thuộc tính ontology thuộc tính đối tượng thuộc tính liệu: Thuộc tính đối tượng liên kết cá thể với nhau, thuộc tính liệu liên kết cá thể với giá trị liệu Luận án trình bày cách xây dựng hàm đánh giá khoảng cách cho kiểu miền giá trị tương ứng với hai kiểu thuộc tính ontology OWL biểu thức khái niệm biểu thức khoảng giá trị 3.5 Tiểu kết Chương Trong chương luận án đề xuất phương án xử lý xung đột mức khái niệm q trình tích hợp ontology sử dụng mơ hình tích hợp tri thức dựa lý thuyết đồng thuận Đồng thuận xác định theo phương pháp đề xuất luận án chứng minh thoả tiêu chuẩn quan trọng cho tích hợp Trong chương này, luận án trình bày phương pháp xây dựng hàm đánh giá khoảng cách cho dạng miền giá trị thuộc hai loại thuộc tính đối tượng thuộc tính liệu q trình đặc tả khái niệm ontology OWL Các kết chương công bố Hội thảo International Conference on Computitational Collective Intelligence - ICCCI (2014) [CT2], đăng Tạp chí Tin học Điều khiển học (2014) [CT1] Tạp chí Transactions of Computitational Collective Intelligence (2016) [CT5] Chương XỬ LÝ XUNG ĐỘT MỨC TIÊN ĐỀ TRONG QUÁ TRÌNH TÍCH HỢP ONTOLOGY 4.1 Mơ hình xử lý xung đột tri thức cấp độ cú pháp Giả sử để biểu diễn tri thức, tác tử hay chuyên gia sử dụng tập hợp hữu hạn L ký hiệu để biểu diễn giá trị logic khẳng định, tham chiếu đến kiện đối tượng cụ thể giới thực Mỗi ký hiệu biểu diễn cho phần tử riêng biệt giới thực Một literal tồn hai dạng literal dương literal âm Một tác tử đưa ý kiến chủ đề giới thực dạng công thức hội literal sau: t1 ∧ t2 ∧ · · · ∧ tk , ti ∈ L ti = ¬ti , với ti ∈ L, i = 1, 2, , k ti = tj với i = j; i, j = 1, 2, , k Ta ký hiệu Conj(L) tập hợp tất công thức hội với ký hiệu lấy từ tập hợp L Một công thức hội x biểu diễn cặp (x+ , x− ), x+ (tương ứng, x− ) gồm ký hiệu công thức thuộc literal dương (tương ứng, literal âm) Định nghĩa 4.1 Một công thức hội (x+ , x− ) với x+ , x− ⊆ L gọi không xung đột x+ ∩ x− = ∅ 18 + − Định nghĩa 4.2 Gọi x = (x+ , x− ), x = (x , x ) ∈ Conj(L) cơng thức hội khơng xung đột Ta nói: − (a) Công thức hội x không quán với công thức hội x x+ ∩ x = ∅ x + ∩ x− = ∅ , (b) Công thức hội x gọi không quán nghiêm ngặt với công thức hội x + − chúng không quán x+ ∩ x = ∅ x− ∩ x = ∅ Định nghĩa 4.4 Khoảng cách hai tập ký hiệu hữu hạn X1 , X2 ⊆ L tính card(X1 X2 ) , đó, X1 card(L) hiệu đối xứng hai tập hợp X1 X2 theo công thức η(X1 , X2 ) = X2 biểu diễn tập hợp Định nghĩa 4.5 Khoảng cách hai công thức hội x1 , x2 ∈ Conj(L) d∧ (x1 , x2 ) = w1 η(x+1 , x+2 ) + w2 η(x−1 , x−2 ) • η(x+1 , x+2 ) (tương ứng, η(x−1 , x−2 )) khoảng cách tập ký hiệu dương (tương ứng, ký hiệu âm) cơng thức hội x1 , x2 • w1 , w2 trọng số khoảng cách η(x+1 , x+2 ) η(x−1 , x−2 ) khoảng cách d∧ (x1 , x2 ), tương ứng, thoả điều kiện: w1 + w2 = < w1 , w2 < Trong luận án này, xem vai trò tri thức khẳng định tri thức phủ định nhau, theo w1 = w2 = 12 Chúng ta thấy hàm d∧ thoả tính chất quy định cho hàm khoảng cách phần tử thuộc tập vũ trụ Conj(L) theo Định nghĩa 1.15 4.1.1 Bài toán tìm đồng thuận cơng thức hội tiêu chuẩn cho đồng thuận Bài tốn tìm đồng thuận công thức hội phát biểu sau: “Cho − hồ sơ gồm công thức hội X := {xi = (x+ i , xi ) ∈ Conj(L) : i = 1, 2, , n} Cần xác định công thức hội x∗ ∈ Conj(L) đại diện tốt cho công thức hội thuộc hồ sơ X (còn gọi đồng thuận hồ sơ X)” Đại diện tốt hồ sơ X xác định hàm đồng thuận C : (Conj(L)) → Conj(L) Hàm cần phải thoả nhiều tiêu chuẩn nêu Định nghĩa 4.6 Định nghĩa 4.6 (Hàm đồng thuận hồ sơ công thức hội) Ánh xạ (Conj(L)) → 2Conj(L) C: hàm đồng thuận hồ sơ công thức hội thoả nhiều tiêu chuẩn sau + − x+ ⊆ x∗ , x∈X + − x− ⊆ x∗ x∈X − + H2 Mỗi công thức hội (x∗ , x∗ ) ∈ C(X) phải có x∗ ⊆ x+ , x∗ ⊆ x∈X 19 − + H1 Mỗi công thức hội (x∗ , x∗ ) ∈ C(X) phải có x− x∈X H3 Nếu X qn cơng thức hội ( x− ) đồng thuận x+ , x∈X x∈X X + − − + H4 Với (x∗ , x∗ ) ∈ C(X), ta có x∗ ∩ x∗ = ∅ H5 Một đồng thuận x∗ ∈ C(X) phải đạt cực tiểu tổng khoảng cách: d∧ (x∗ , x) = x∈X d∧ (x , x) | x ∈ Conj(L) x∈X H6 Với ký hiệu z ∈ L đồng thuận x∗ ∈ C(X), dạng thức xuất (tức là, dạng literal âm hay dương) z x∗ phụ thuộc vào dạng thức xuất cơng thức hội X − + − + Trong đồng thuận (x∗ , x∗ ) ∈ C(X), tập x∗ (tương ứng, tập x∗ ) gọi thành phần khẳng định (tương ứng, thành phần phủ định) đồng thuận 4.1.2 Phân tích tiêu chuẩn đồng thuận Ta ký hiệu Cco tập tất hàm đồng thuận cho hồ sơ công thức hội Mối liên hệ tính thoả tiêu chuẩn hàm đồng thuận thể qua định lý sau Định lý 4.1 (a) (∃C ∈ Cco ) ∃X ∈ Conj(L) : C(X) Hi i=1,2, ,6 (b) ¬ ∃C ∈ Cco : C Hi i=1,2, ,6 Định lý 4.2 Một hàm đồng thuận thoả tiêu chuẩn H5 thoả hai tiêu chuẩn H1 H2 ; tức (C H5 ) ⇒ (C H1 ∧ C H2 ) với C ∈ Cco Định lý 4.3 Thành phần khẳng định thành phần phủ định đồng thuận thoả tiêu chuẩn H5 xác định độc lập nhau; nghĩa là, công thức hội (x∗ + , x∗ − ) đồng thuận X công thức hội (x∗ + , ∅) đồng thuận X = {(xi + , ∅) : i = 1, 2, , n}, công thức hội (∅, x∗ − ) đồng thuận X = {(∅, xi − ) : i = 1, 2, , n} Định lý 4.4 Cho X = {xi ∈ Conj(L) | i = 1, 2, , n} hồ sơ xung đột gồm cơng thức hội, X ∈ (Conj(L)) Gọi: • Z+ (tương ứng, Z− ) tập hợp tất literal xuất thành phần dương (tương ứng, thành phần âm) công thức hội thuộc hồ sơ X • f + (z) (tương ứng, f − (z)) số lần xuất phần tử z thành phần dương (tương ứng, thành phần âm) công thức hội thuộc hồ sơ X Giả sử C(X) hàm chọn đồng thuận thoả tiêu chuẩn H5 Khi đó, x∗ = (x∗ + , x∗ − ) ∈ C(X) nếu: x∗ + = z ∈ Z+ | f + (z) >= + x− = z ∈ Z− | f − (z) >= n 20 n , 4.1.3 Thuật tốn xác định đồng thuận Dựa vào tính chất tiêu chuẩn phân tích Tiểu mục 4.1.2, phần trình bày cách xây dựng đồng thuận x∗ = (x∗ + , x∗ − ) hồ sơ xung đột X ∈ (Conj(L)) theo chiến lược ưu tiên tiêu chuẩn với thứ tự sau: H5 , H4 , H1 , H2 , H3 H6 Thuật toán 4.2: Xác định đồng thuận từ hồ sơ gồm công thức hội Đầu vào: Hồ sơ xung đột X ∈ (Conj(L)), X = (xi , xi ) | i = 1, 2, , n; n ∈ N∗ , xi + ∩ xi − = ∅ ∀i = 1, 2, , n Đầu ra: Đồng thuận x∗ ∈ Conj(L) thoả nhiều tiêu chuẩn tập hợp {H1 , H2 , H3 , H4 , H5 , H6 } + − begin x+ ; Z− := Z+ := x∈X x− ; x∈X foreach z ∈ Z+ Bước Bước f + (z) := card{x ∈ X | x+ z}; foreach z ∈ Z− f − (z) := card{x ∈ X | x− z}; n x∗ + := {z ∈ Z+ | f + (z) ≥ }; n ∗− − − x := {z ∈ Z | f (z) ≥ }; if (x∗ + ∪ x∗ − = ∅) then foreach z ∈ x∗ + ∩ x∗ − if d∧ (x∗ + \ {z}, x∗ − ), X < d∧ (x∗ + , x∗ − \ {z}), X then x∗ + := x∗ + \ {z}; else x∗ − := x∗ − \ {z}; Bước Bước else if (Z+ ∩ Z− = ∅) then x∗ := (Z+ , Z− ); else x∗ := x1 ; for i := to n if d∧ (x∗ , X) > d∧ (x, X) then x∗ := xi 4.2 Xử lý không qn mức tiên đề q trình tích hợp ontology Xét n ontology O1 , O2 , , On (n ∈ N∗ ), ontology Oi (i = 1, 2, , n) biểu diễn bốn Định nghĩa 1.1 Ci , Ii , Ri , Zi Ontology Oi (i = 1, 2, , n) thể trạng thái tri thức biểu diễn công thức z1i ∧ z2i ∧ · · · ∧ zni i Việc tích hợp n ontology O1 , O2 , , On hiểu tìm tập tiên đề tốt đại diện cho n tập tiên đề Z1 , Z2 , , Zn 21 Gọi Z := {t1 , t2 , , tm } (m ∈ N∗ ) tập literal cho tiên đề ontology Oi (i = 1, 2, , n) biểu diễn dạng literal phủ định literal Z: ∀α ∈ Z i (i = 1, 2, , n), ∃t ∈ Z : (t ≡ α) ∨ (¬t ≡ α) Với tập hợp Z này, xem ontology Oi trạng thái tri thức biểu diễn công thức hội xi ∈ Conj(Z) với xi ≡ z1i ∧ z2i ∧ · · · ∧ zni i Như vậy, với n ontology O1 , O2 , , On lập hồ sơ X = {x1 , x2 , , xn } xi ≡ z1i ∧ z2i ∧ · · · ∧ zni i Đồng thuận x∗ hồ sơ X xác định Thuật toán 4.2 tập tiên đề tốt mặt cú pháp từ ontology cho Tuy nhiên, x∗ khơng qn mặt ngữ nghĩa Đối với trường hợp này, khắc phục chọn Z1 , Z2 , , Zn tập tiên đề sai khác so với x∗ (tập tiên đề có tổng khoảng cách đến x∗ đạt cực tiểu) Từ phân tích nêu trên, luận án đưa Thuật toán 4.3 xác định đồng thuận mặt cú pháp tập tiên đề Z1 , Z2 , , Zn 4.3 Tiểu kết Chương Trong chương này, luận án trình bày mơ hình xác định đồng thuận tri thức biểu diễn dạng hội literal Sau định nghĩa khoảng cách hai tập hợp (là tập tập ký hiệu L cho trước), luận án phân tích tính chất chứng minh số định lý thể mối quan hệ tiêu chuẩn xác định đồng thuận hồ sơ công thức hội Trên sở luận án đề xuất thuật tốn xác định đồng thuận hồ sơ công thức hội Từ mơ hình xác định đồng thuận tri thức biểu diễn dạng hội literal , luận án đề xuất phương pháp xử lý xung đột cấp độ cú pháp q trình tích hợp ontology Phương pháp áp dụng để hỗ trợ xác định phiên tốt từ đóng góp tác tử phân tán q trình xây dựng ontology dạng cộng tác Kết chương trình bày Hội thảo Artificial Intelligence in Theory and Practice IV (2015) [CT4] đăng tạp chí Khoa học Đại học Huế (2015) [CT3] KẾT LUẬN Kết luận Ontology thành phần quan trọng tảng ứng dụng web ngữ nghĩa Đặc trưng mở rộng, tái sử dụng ontology mặt giúp hệ thống trao đổi chia sẻ tri thức, mặt khác tiềm ẩn khả làm xuất tri thức không qn Xử lý tri thức khơng qn nói chung xử lý tri thức không quán ontology nói riêng tốn phức tạp khoa học máy tính Hai tình điển hình xử lý tri thức không quán ontology là: (1) xác định kết có nghĩa truy vấn với ontology khơng qn, (2) tích hợp ontology khơng quán đến từ nhiều nguồn độc lập Luận án đề xuất phương án giải cho hai tình nêu Các kết luận án tóm tắt sau: 1) Xây dựng hàm chọn sO Sem dựa khoảng cách ngữ nghĩa theo ontology tham 22 Thuật toán 4.3: Xác định tập tiên đề đồng thuận ontology Bước Đầu vào: Ontology O1 , O2 , , On với tập tiên đề Z1 , Z2 , , Zn (n ∈ N∗ ) Đầu ra: Tập tiên đề x∗ đại diện tốt cho tập tiên đề ontology O1 , O2 , , On begin Z := ∅; foreach Oi ∈ {O1 , O2 , , On } foreach α ∈ Zi needAdd := true; foreach z ∈ Z if (z ≡ α) or (¬z ≡ α) then needAdd := f alse; break; if (needAdd = true) then Z := Z ∪ {α}; Bước foreach Oi ∈ {O1 , O2 , , On } foreach z ∈ Z \ Zi if (Zi |= z) then Zi := Zi ∪ {z}; if (Zi |= ¬z) then Zi := Zi ∪ {¬z}; Bước Bước Bước Lập hồ sơ xung đột X := {x1 , x2 , , xn } với xi ∈ Conj(Z) biểu diễn trạng thái tri thức tương ứng tập tiên đề Zi ontology Oi ; Xác định x∗ đồng thuận hồ sơ xung đột X theo Thuật toán 4.2; if (x∗ quán) then Z∗ := x∗ ; else Z∗ := Z1 ; foreach Z ∈ {Z2 , Z3 , , Zn } if η(x∗ , Z ) < η(x∗ , Z∗ ) then Z∗ := Z ; 23 chiếu áp dụng hàm chọn vào khung lập luận với ontology không quán Kết thực nghiệm việc áp dụng hàm chọn sO Sem vào khung lập luận với ontology không quán giúp trả nhiều kết xác định so với hàm chọn cơng bố trước Trong trình xây dựng hàm chọn, Luận án trình bày phương pháp quy hoạch động để tính khoảng cách ngữ nghĩa theo ontology tham chiếu hai biểu thức khái niệm, đồng thời phân loại trình bày cách xác định tập biểu thức khái niệm tiên đề ontology OWL – ngôn ngữ ontology thơng dụng chuẩn hố tổ chức W3C [CT6] 2) Xây dựng phương pháp đồng thuận để xử lý xung đột mức khái niệm q trình tích hợp ontology Cấu trúc khái niệm đồng thuận xác định với danh sách thuộc tính miền giá trị thuộc tính tương ứng Luận án đề xuất thuật tốn chứng minh tính thoả tiêu chuẩn đồng thuận xây dựng thuật tốn Luận án trình bày phương pháp xây dựng hàm đánh giá khoảng cách cho miền giá trị thuộc tính kiểu liệu thuộc tính đối tượng ontology OWL [CT1, CT2, CT5] 3) Xây dựng phương pháp đồng thuận để xử lý xung đột cấp độ cú pháp q trình tích hợp tri thức Luận án đề xuất sử dụng phương pháp tính khoảng cách hai tập ký hiệu, khoảng cách hai cấu trúc hội literal chứng minh số mối quan hệ tiêu chuẩn đồng thuận dựa theo khoảng cách Trên sở đó, luận án đề xuất thuật toán xác định đồng thuận hồ sơ xung đột gồm cấu trúc hội Bằng cách áp dụng thuật tốn tìm đồng thuận hồ sơ xung đột gồm cấu trúc hội literal , luận án đề xuất phương án để xử lý xung đột mức tiên đề q trình tích hợp ontology [CT3, CT4] Những vấn đề cần tiếp tục nghiên cứu Kết luận án mở rộng theo hướng sau đây: • Nghiên cứu thêm dạng truy vấn khác với ontology không quán, đặc biệt truy vấn SPARQL với ontology OWL không quán • Xét thêm mối quan hệ literal trình xử lý xung đột cấp độ cú pháp • Đề xuất khung xử lý xung đột tri thức ontology Khung xử lý áp dụng chiến lược khác cho tác vụ khác với ontology: tích hợp, truy vấn, tiến hố ontology 24 DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ ĐÃ CƠNG BỐ LIÊN QUAN ĐẾN LUẬN ÁN CT1 Nguyễn Văn Trung, Phan Bá Trí, Hồng Hữu Hạnh Tích hợp ontology với tiếp cận lý thuyết đồng thuận Tạp chí Tin học Điều khiển học T.30, S.3 (2014), 239-252 CT2 Trung Van Nguyen, Hanh Huu Hoang A Consensus-based Method for Solving Concept-level Conflict in Ontology Integration, In Proceeding of 6th International Conference on Computational Collective Intelligence Technologies and Applications, Seoul, Korea, 2014, LNCS 8733, Springer (2014) p414-423 CT3 Nguyễn Văn Trung, Hồng Hữu Hạnh Một phương pháp xử lý khơng quán tri thức mức cú pháp Tạp chí Khoa học Đại học Huế, T.106, S.7 (2015), 241-251 CT4 Trung Van Nguyen, Jason J Jung, Hanh Huu Hoang A Novel Approach for Resolving Knowledge Inconsistency on Ontology Syntactic Level In Proceeding of Artificial Intelligence in Theory and Practice IV (IFIP Advances in Information and Communication Technology), Springer (2015) p39-49 CT5 Trung Van Nguyen, Hanh Huu Hoang A Consensus-Based Method for Solving Concept-Level Conflict in Ontology Integration Transactions of Computational Collective Intelligence XXII, LNCS 9655, Springer (2016) p106-124 CT6 Nguyễn Văn Trung, Hoàng Hữu Hạnh Một phương pháp truy vấn ontology không quán sử dụng độ liên quan ngữ nghĩa Tạp chí Khoa học Cơng nghệ Trường Đại học Khoa học, Đại học Huế, T.9 S.1 (2017), 51-62 ... luận án ontology, tri thức không quán ontology, phương pháp xử lý tri thức không quán ontology Trên sở phân tích động lực nghiên cứu, luận án xác định mục tiêu xử lý tri thức không quán ontology. .. Luận án xử lý tri thức không quán ontology theo hai vấn đề: truy vấn ontology không quán xử lý tri thức không quán q trình tích hợp ontology Cơ sở lý thuyết cho vấn đề thứ khung lập luận với ontology. .. chuẩn dựa độ sai khác Chương TỔNG QUAN VỀ XỬ LÝ TRI THỨC KHÔNG NHẤT QUÁN TRONG ONTOLOGY 1.1 Ontology tri thức không quán Định nghĩa 1.1 (Ontology) Một ontology bốn C, I, R, Z , đó: C tập hợp khái

Ngày đăng: 18/05/2021, 12:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w