BỘ GIÁO DỤC VÀ ĐÀO TẠO DAI HOC HUE
TRUONG DAI HOC KHOA HOC
NGUYEN THI TRAM
TIM HIEU NGON NGU ONTOLOGY
OWL 2 VA UNG DUNG
LUAN VAN THAC SI KHOA HOC
CONG NGHE THONG TIN
Thira Thién Hué, 2020
Trang 2
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC HUE
TRƯỜNG ĐẠI HỌC KHOA HỌC
NGUYEN THI TRAM
TIM HIEU NGON NGU ONTOLOGY OWL 2 VA UNG DUNG
NGANH: KHOA HOC MAY TINH MA SO: 8.48.01.01
LUAN VAN THAC Si KHOA HOC
DINH HUONG NGHIEN CUU
NGUOI HUONG DAN KHOA HOC TS NGUYEN VAN TRUNG
Thira Thién Hué, 2020
Trang 3
Chú ý rằng, bằng cách dùng các nomznal, phát biểu khái niệm Mother(julia) cĩ thể chuyển thành một bao ham khái niệm {julia} Mother, và phát
biểu vai trị parentOf(julia, john) cĩ thể chuyển thành bao hàm khái niệm
{julia} AparentOf.{john}
1.2.4 Tạo tử vai trị
Khác với các tạo tử khái niệm, Logie mơ tả khơng hỗ trợ xây dựng nhiều vai trị phức tạp Trên thực tế, øø¿ trị nghịch đảo là tạo tử quan trọng nhất thường dùng Về mặt trực giác, mối quan hệ giữa các vai trị parentOf và childOf mang tính chất như thế Chẳng hạn, nếu Julia là cha- mẹ của John thì John là con của Julia và ngược lại Một cách hình thức thì, parenfOf là vai trị nghịch đảo của childOf Trong Logie mơ tả cĩ thể
biểu diễn bằng
parentOf = childOf”, (1.23)
trong đĩ vai trị phức childOf~ biểu diễn cho vai trị nghịch đảo của vai
tro childOf
Tương tự với khái niệm đỉnh, Logie mơ tả cũng cĩ vai trd tồn thể (universal role) U — lién két moi cap ca thé va vai tro réng tuong ting véi khái niệm đáy
1.2.5 Mơ tả tính chất của vai trị
Phần 1.1.3 đã trình bày ba dạng tiên đề RBox: tiên đề bao hàm vai trị, tiên đề vai trị tương đương và tiền đề tách rời vai trị Trên thực tế vai trị cịn cĩ thể được đặc tả thêm các tính chất như: tính bắc cầu, tính đối xứng, tính phản xạ, tính phản phản xạ
Tính bắc cầu là một dạng đặc biệt của bao hàm vai trị phức Ví dụ,
tính bắc cầu của ancestorOf cĩ thể được mơ tả bằng tiên đề ancestorOf o
ancestorOf E ancestorOf Một vai trị là cĩ tính bắc cầu nễu nĩ tương
đương với vai trị nghịch đảo của nĩ, ví dụ married To = marriedTo, và nĩ
Trang 4LỜI CẢM ƠN
Luận văn này là kết quả nghiên cứu, tổng hợp trong suốt thời gian đào tạo bại Trường Đại học Khoa học - Đại học Huế Tơi xin gửi lời cảm ơn đầu tiên đến Trường Đại học Khoa học, đặc biệt là Phịng Đào tạo Sau đại học — đã tạo điều kiện thuận lợi để tơi được học tập cũng như hồn thành luận văn này
Em xin chan thành cảm ơn tập thể quý Thầy Cơ tại Khoa Cơng nghệ Thơng tin, Trường Đại học Khoa học đã tận tình giảng dạy, truyền thụ kiến thức và kỹ năng nghiên cứu khoa học trong suốt thời gian em được học tập tại nhà trường
Để hồn thành luận văn, em nhận được sự giúp đỡ và hướng dẫn tận tình của TS Nguyễn Văn Trung Những kiến thức, kinh nghiệm trong được chỉ dạy từ thầy thật sự là hành trang quan trọng và kinh nghiệm quý báu về nghiên cứu khoa học đành cho em Em xin gửi lời cảm ơn sâu sắc đến thầy
Cảm ơn tất cả bạn bè, đồng nghiệp và người thân đã động viên, hỗ trợ tơi hồn thành luận văn này
Học viên
Trang 5Ví dụ này cho thấy các giới hạn thuộc tính cũng cĩ thể được dùng lồng nhau với các lớp phức
Giới hạn thuộc tính cũng cĩ thể dùng để mơ tả lớp gồm các cá thể được liên kết với một cá thể cho trước Chẳng hạn, chúng ta định nghĩa lớp gồm các người con của cá thể John như sau:
EquivalentGlasses (
: JohnsChildren
ObjectHasValue( :hasParent :John )
Trường hợp đặc biệt của các cá thể được liên kết với nhau thơng qua các thuộc tính, đĩ là một cá thể cĩ thể được liên kết với chính nĩ, chẳng hạn:
EquivalentClasses(
:NarcisticPerson
ObjectHasSelf( :loves )
Sử dụng lượng từ với mọi, chúng ta cĩ thể nĩi về tất cả cá thể con-cái của một cá thể nào đĩ, trong khi lượng từ tồn tại cho phép tham chiếu đến (tối thiểu) một trong những cá thể này Tuy nhiên, nếu cần đặc tả số lượng cá thể được bao gồm trong một giới hạn thì chúng ta cần một cách thức khác Ví dụ dưới đây phát biểu John cĩ nhiều nhất 4 người con:
ClassAssertion(
ObjectMaxCardinality( 4 :hasChild :Parent )
Trang 6Chương 3 XÂY DỰNG ONTOLOGY OWL2 BIẾU DIỄN CƠ SỞ
TRI THỨC VỀ CHƯƠNG TRÌNH ĐÀO TẠO ĐẠI HỌC vA UNG DUNG 45
3.1 Phát biểu yêu cầu bài tốn xây dựng ontology biểu diển cơ sở tri thức về chương trình đào tạo Q2 45 3.2 Phân tích, thiết kế ontology OWL 2 biểu diễn cơ sở tri thức về chương
trình đào bạo ee 46 3.21 Đặc tả khái nệm ChuongTrinhDaoTao 48 3.2.2 Đặc tả khái nệm KhoiKienThuc 50 3.2.3 Đặc tả khái niệm HocPhanTrongKhoiKienThuc 50 324 Địc tà khải niềm HocPhan ‹ : : : : :¿ : : ( : rẽ co 51 3.3 Khai báo các cá thể theo ontology chương trình đào tạo 54 3.4 Ứng dụng ontology về chương trình đào bạo trong chương trình Java 56
Trang 73.3 Khai báo các cá thể theo ontology chương trình đào tạo Với ontology chương trình đào tạo ở Phần 3.2, chúng ta cĩ thể xây dựng các chương trình đào tạo cụ thể bằng cách kha¿ báo các cá thể của các khái niệm KhoaHoc, NganhDaoTao, HocPhan, Chuong TrinhDao Tao,
KhoiKienThuc, HocPhan TrongKhoiKienThuc Tiếp đến, những cá thể này
được đặc tả các tính chất, mối quan hệ theo định nghĩa của ontology tương ứng với nội dung của chương trình đào tạo ngồi thực tế Hình 3.3 trình bày cách khai báo các cá thể trong quá trinh xây dựng chương trình đào tạo cụ thể
etdt (http://www.semanticweb.org/tramnguyen/ontologies/2020/9/ctdt) : [/mnt/DAT/OTA/OneDrive/Documents/02-C - O x
File Edit View Reasoner Tools Refactor Window Ontop Mastro Help
< © ctdt (http s/w | /ctdt) * Search › HocPhan v.semanticweb org/tramnquyen/ontologis/2
LActive ontology xEntities x Individuals by class x DL Query xDebugger +; Class hiera tier) alu] Annotations | Usage te 8 Kí ¥ @ ow: Thing @ ChuongTrinhDaoTao DonViPhuTrach HocPhanTrongKhoiKienThuc KhoaHoc KhoiKienThuc Types (@ NganhDaoTao @HocPhan TinHocDaiCuong TRE
Data property assertions
o Negative object property assertions For: @ HocPhan
@ LapTrinhHuongDoiTuong Neg data property assertions @ PhanTichvaThietKeCacHTIT
No Reasoner set, Select a reasoner from the Reasoner menu | Show Inferences 4h
Hình 3.3: Khai báo các cá thể để xây dựng chương trình đào bạo cụ thể
Uu điểm của việc dựa trên ontology khi xây dựng chương trinh dao tao so với các cách tiếp cận truyền thống - sử dụng cơ sở đữ liệu quan hệ - đĩ là, thơng tin luơn luơn được kiểm tra tính nhất quán một cách chặt chẽ Hình 3.4 trình bày giao diện kiểm tra tính nhất quán của cơ sở tri thức đang được xây dựng
Trang 8MỞ ĐẦU
1 Lý do chọn đề tài
Kho chứa thơng tin của nhân loại World Wide Web đang ngày càng phát triển với tốc độ khĩ kiểm sốt Bên cạnh yêu cầu nghiên cứu cơng nghệ lưu trữ thơng tin thì một nhu cầu khác cũng được nảy sinh đĩ là, làm thế nào để khai thác thơng tin trên web một cách hiệu quả Web thế hệ mới - Web Ngữ nghĩa - là một câu trả lời cho bài tốn này: cho phép thơng tin được lưu trữ theo cách mà con người và máy tính đều dùng chung Điều này khác với thế hệ web hiện nay: dữ liệu được lưu trữ ở các tài liệu web đơn thuần phục vụ cho mục đích biểu diễn cho con người đọc và tự phân tích, máy tính khơng thể tự động trích rút thơng tin từ các tài liệu web được!
Thành phần quan trọng nhất của Web Ngữ nghĩa chính là ontology biểu diễn các cơ sở tri thức Để hiện thực hố khả năng tự động trích rút, suy diễn, ontology cần được xây dựng dựa trên một nền tảng logic hình thức vừa cĩ khả năng biểu diễn thơng tin cao, vừa cĩ độ phức tạp tính tốn chấp nhận được Tổ chức World Wide Web Consortium (W3C) chuẩn hố ngén ngit ontology ding cho web đã đưa ra ngơn ngữ OWL với các biến thể để cân đối khả năng biểu diễn thơng tin và độ phức tạp tính tốn Phiên bản mới nhất của ngơn ngữ này là OWL2, được hồn thiện
vào năm 2012
Trang 92 Tình hình nghiên cứu của đề tài
Ngơn ngữ ontology dành cho web OWL được xây dựng dựa trên các
logic mé ta SHOIN, SROTQ Viéc tìm hiểu bản chất của logic mơ tả
này, cũng như các logic mơ tả nĩi chung, là một cơng việc khĩ, tuy vậy lại mang ý nghĩa khoa học và ứng dụng Hầu hết các cơng trình nghiên cứu về logic mơ tä và ngơn ngữ OWL, OWL,2 đều được cơng bố bởi cộng đồng nghiên cứu nước ngồi [4, 5, 6, 7, 10] Các cơng bố trong nước về logic mơ tả làm nền tảng cho OWL hay OWL2 là rất hạn chế
OWL được tổ chức W3C chuẩn hố lần đầu vào năm 2003 dựa trên
Logic mé ta SHOTN [10] Phiên bản tiếp theo của OWL là OWL,2, được chuẩn hố vào năm 2009, hồn thiện vào năm 2012 [S, 9, 16] OWL 2 được
dia trén Logic mo ta SROTQ
OWL nĩi chung, OWL2 nĩi riêng được nghiên cứu và sử dụng để xây dựng ontology cho nhiều lĩnh vực khác nhau Cĩ nhiều ontology được xây dựng để tái sử dụng trong nhiều lĩnh vực - đa ngành: SUMO (The Suggested Upper Merged Ontology) [11], CODE (Common Ontology DE-
velopment) [1, 2], DOLCE [3],
Bén canh ngon ngtt ontology, cộng đồng nghiên cứu cũng đã hồn thiện các cơng cụ hỗ trợ xây dựng ontology (nổi tiếng nhất là phần mềm Protégé
của Đại học Stanford [13]) và các bộ lập luận như Pellet [15], HermiT [14],
3 Mục tiêu nghiên cứu
Luận văn được nghiên cứu hướng đến các mục tiêu sau đây: e Tim hiéu vé nén tang logic cho ontology
e Tim hiéu OWL 2- ngơn ngữ ontology cho web - về cú pháp và ngữ nghĩa
Trang 10dụng cho bài tốn quản lý đào tạo đại học 4 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài là e Logic mé ta
e Ngén ngit ontology OWL 2
e Các khái niệm trong quy chế quản lý, kế hoạch đào tạo đại học, chương trình đào tạo đại học
Về phạm vi nghiên cứu, Luận văn giới hạn phạm vi nghiên cứu ở mức tìm hiểu cơ sở về Logic mơ tả, đặc biệt chú trọng đến Logic mơ tả S?@7Q ở mức cú pháp và ngữ nghĩa Đối với ngơn ngữ OWL 2, luận văn giới hạn nghiên cứu ở mức ứng dụng để mơ tả cơ sở tri thức về chương trình đào tạo đại học
5 Ý nghĩa khoa học và thực tiễn
Luận văn cĩ các ý nghĩa khoa học và thực tiễn sau đây:
Phần nghiên cứu lý thuyết sẽ hệ thống hĩa những khái niệm cơ bản về những nền tảng logic cho ontology, ngơn ngữ ontology cho web - OWL2 Những tổng gộp nghiên cứu này sẽ gĩp phần định hướng lựa chọn biến thể OWL2 phù hợp cho từng ứng dụng cụ thể trong thực tế
Về ứng dụng xây dựng ontology về chương trình đào tạo: Ontology đĩng vai trị là phần cốt lõi, cĩ thể được sử dụng trong các hệ thống thơng tin thơng minh, cho phép truy vấn, suy luận tự động
6 Phương pháp nghiên cứu
Trang 117 Nội dung và bỗ cục của luận văn
Với mục tiêu nghiên cứu, nội dung và phạm vi nghiên cứu của đề tài đã được xác định như trên, Luận văn sẽ được trình bày theo bố cục sau đây: Trong Chương 1, Luận văn trình bày các khái niệm cơ sở về logic mơ tả, nền tảng để xây dựng cơ sở tri thức dựa trên logic mơ tả Trên thực tế, ontology néi chung, hay ontology OWL 2 chinh 1a co sé tri thttc, va cach thức suy diễn thơng tin dựa trên cơ sổ tri thức này được quy định bởi ngữ nghĩa hình thức mà ontology đĩ lấy làm cơ sở Trong Chương 2 Luận văn trình bày các kỹ thuật áp dụng cấu trúc ngơn ngữ OWL2 để xây dựng ontology Dây chính là các kiến thức cơ sở được áp dung để xây dựng ứng dụng tronng Chương 3 của Luận văn
Trang 12Chương 1
GIỚI THIỆU LOGIC MƠ TẢ
Logic mơ tả là họ ngơn ngữ biểu diễn tri thức được sử dụng rộng rãi trong việc lập mơ hình ontology Một lý do quan trọng cho điều này đĩ là chúng cung cấp một trong những nền tảng chính cho ngơn ngữ OWL như là một chuẩn của tổ chức W3C Tuy vậy, các Logic mơ tả đã được dùng trong lĩnh vực biểu diễn tri thức trước đĩ rất lâu so với ứng dụng để lập mơ hình ontology ở Web ngữ nghĩa: ngơn ngữ lập mơ hình dựa trên Logic mơ tả xuất hiện đầu tiên là vào giữa thập kỷ 1980
Cac Logic mơ tả — như tên gọi của nĩ - là các logic (thực tế, hầu hết cac Logic mơ tả đều là đoạn khả quyét (deciable fragment) cia Logic bac nhất), và như vay chúng được trang bị một ngữ nghãa hành thúc, qua đĩ mot ontology Logic mé tả sẽ cĩ được một đặc tả chính xác về ngữ nghĩa Ngữ nghĩa hình thức cho phép con người và máy tính cĩ thể trao đổi các ontology Logie mơ tả mà khơng sợ nhầm lẫn về ý nghĩa của chúng, đồng thời cho phép dùng các phép suy dn logic dé suy ra cdc thong tin bổ sung từ các dữ kiện được phát biểu tường minh trong ontology — dé 1a d&c tinh quan trọng phân biệt ngơn ngữ Logic mơ tả với các ngơn ngữ lập mơ hình khác, chẳng hạn như UML
Khả năng suy dẫn tri thức bổ sung sẽ làm tăng sức mạnh mơ hình hố của Logie mơ tả, nhưng nĩ cũng đồi hỏi hiểu biết của người lập mơ hình đồng thời, trên tất cả, cần một cơng cụ đủ tốt để hỗ trợ tính tốn ra các kết luận Việc tính tốn các phép suy dẫn được gọi là lập luận và một mục tiêu quan trọng của thiết kế ngơn ngữ Logic mơ tả trước nay đĩ là đảm bảo các thuật tốn lập luận
Trang 13phần 1.1 nêu cách thức cơ bản để lập rmơ hành trí thúc trong DL, phan 1.2 giới thiệu các đặc trưng quan trọng về lập mơ hình của DL Tiếp đến Luận văn trình bày một Logic mơ tả cĩ khả năng biểu diễn tri thức cao gọi là SROTQ Phần 1.4 giải thích chỉ tiết các ý tưởng bên dưới của ngữ nghĩa Logic mé ta va dùng nĩ để định nghia cdc ontology SROTQ C6 mot sé Logic m6 ta nhan được bằng các bỏ đi một số đặc tính của S?@Ø7Ø, và trong phần 1.5 sẽ nêu một số Logie mơ tả quan trọng nhận được theo cách này Cụ thể, phần này sẽ bao gồm các Logie mơ tả thu gọn, cho phép lập luận đặc biệt hiệu quả Trong phần 1.6, Luận văn trình bày mối quan hệ giữa các Logic mơ tả với ngơn ngữ ontology dành cho web — OWL
1.1 Các thành phần cơ bản của một ontology Logic mơ tả Cac Logic mé tả cho phép đặc tả mối quan hệ giữa các thực thể trong một lĩnh vực Trong các Logie mơ tả, cĩ ba loại thực thể: (1) khái niệm (concept), (2) vai trị (role) và (3) tên cá thể (individual name) Khai niệm biểu diễn tập hợp cá cá thể, vai trị biểu diễn mối quan hệ hai ngơi gia các cá thể, và tên cá thể biểu diễn một cá thể trong lĩnh vực Các thuật ngữ này là gần tương ứng với các thuật ngữ œ¿ từ một ngdi (unary predicate), vi tt hai ngoi (binary predicate) va hang (constant) trong Logic bac nhat Vi du, mot ontology mơ tả về lĩnh vực con người và mối quan hệ gia đình cĩ thể cĩ các thực thể sau đây:
e Khái niệm Parent biểu diễn tập hợp các cá thể là cha-me, e Khái niệm Female biểu diễn tập hợp các cá thể phụ nữ,
e Vai trị parentOf biểu điễn các mối quan hệ (hai ngơi) giữa các cá thể là cha-me và con của cá thể đĩ
e Tên cá thể julia, john biểu diễn các cá thể Julia, John
Trang 14(axiom) Cac tién dé nay 1a ding trong trang thái được mơ tả — và thường chỉ là một phần tri thúc về trạng thái được nĩi đến Nghĩa là cĩ thể cịn cĩ thêm nhiều trạng thái khác của thế giới cũng nhất quấn với ontology dang được mơ tả! Người ta thường chia các tiên đề thành ba nhĩm: (1) tiên đề ABox - là những tiên đề khẳng định dữ kiện, (2) tiên đề TBox - là những tiên đề thuật ngữ, và (3) tiên đề RBox - là những tiên đề quan hệ
1.1.1 Phát biểu các dữ kiện với tiên đề ABox
Các tiên đề ABox thể hiện tri thức về các cá thể, tức là các khái niệm mà nĩ thuộc về cùng với cách mà chúng liên hệ với nhau Các tiên đề ABox thơng dụng nhất là các phát biểu kiểu dạng như
Mother(julia), z1)
khẳng định rằng Julia là một người mẹ, hay chính xác hơn, cá thể cĩ tên là julia là một #hể hiện (instance) cia khái niệm Mother
Khẳng định oai trị mơ tà mối quan hệ giữa các cá thể đã được đặt tên Khẳng định
parentOf (julia, john), (1.2)
cho biết, Julia là cha-mẹ của John, hay nĩi chính xác hơn, cá thể cĩ tên
julia tham gia vào mối quan hệ được biểu diễn bởi parentOf đến cá thể cĩ
tén john Câu trước cho thấy sẽ phức tạp hơn khi nêu rõ mối quan hệ được diễn tả bởi một tiên đề thực tế là các mối quan hệ giữa các cá thể, các tập hợp đồng thời các quan hệ mà được biểu diễn bởi các tên cá thể, khái niệm và vai trị tương ứng Giả sử sự khác biệt như vậy giữa các định danh về mặt cú pháp và các thực thể về mặt ngữ nghĩa được hiểu rõ, chúng ta thường phát triển một cơng thức dễ đọc hơn Phần 1.4 dưới đây sẽ mơ tả ngữ nghĩa bên dưới với độ chính xác cao hơn
Trang 15duy nhất, vì vậy, các tên khác nhau cĩ thể tham chiếu đến cùng một cá thể, trừ khi cĩ phát biểu tường minh về điều ngược lai nay Khang dinh sự khác biệt cá thể the julia ø# john (1.3) dùng để nĩi rằng Julia và John thực tế là các cá thể khác nhau Ngược lại, một khẳng định cá thể trùng nhau như john johnny, (1.4)
nĩi rằng hai tên khác nhau được xem như tham chiếu đến cùng một cá thể Những tình huống như vậy cĩ thể phát sinh, chẳng hạn, khi tổng hợp tri thức về cùng một lĩnh vực đến từ nhiều nguồn khác nhau, cĩ một cơng đoạn thường được gọi là ánh xa ontology
1.1.2 Tiên đề TBox
Các tiên đề TBox mơ tả mối quan hệ giữa các khái niệm Ví dụ, để nĩi tất cả các cá thể mẹ đều là cá thể cha-mẹ, chúng ta dùng tién dé bao ham
khái niệm
Mother E Parent, (1.5)
trong đĩ khái niệm Mother là được bao hàm bởi khái niệm Parent Kiểu tri thức như thé sẽ được dùng để suy luận ra thêm các dữ kiện cho các cá thể Chang hạn, (1.1) và (1.5) sẽ cho biết Julia là một cá thể cha-mẹ
Tiên đề tương đương khái niệm cho biết hai khái niệm cĩ chung tập cá thé, chang han
Person = Human (1.6)
Trang 161.1.3 Tiên đề RBox
Các tiên đề RBox mơ tả tính chất của các vai trị Cũng như đối với các khái niệm, Logic mơ tả cho phép bao hàm 0a¿ trị và tương đương 0ai trị Ví dụ
parentOf E ancestorOf (1.7)
®
cho biết parentOf là vai trod con của ancestorOf, tức là, mọi cặp cá thể
được liên kết bởi parentOf thì cũng được liên kết bởi ancestorOf Vì vậy
(1.2) và (1.7) suy ra rằng Julia là một hậu duệ của John
Trong tiên đề bao hàm vai trị, tổng gộp 0a¿ trị cĩ thể được dùng để mơ tả các vai trị như uncleOf Một cách trực giác, nếu Charles là anh của Julia va Julia là cha-mẹ của John thì Charles là một người chú hoặc cậu của John Kiểu quan hệ giữa hai vai trị brotherOf, parentOf và uncleOf được thể hiện bằng tiên đề bao hàm, 0a¿ trị phúc
brotherOf o parentOf E uncleOf (1.8)
Lưu ý rằng sự kết hợp vai trị chỉ cĩ thể xuất hiện ở phía bên trái của tiên đề bao hàm vai trị Ngồi ra, để đảm bảo tính khả quyết trong phép lập luận, các bao hàm vai trị phức được quản lý bằng các hạn chế cấu trúc (quy định một số tiên đề cĩ thể được sử dụng cùng nhau hay khơng trong một ontology)
Khơng cá thể nào cĩ thể vừa là cha-mẹ và vừa là con của cùng một cá thể khác Vì vậy hai vai trị parentOf và childOf là rời nhau Trong Logic mơ tả chúng ta cĩ thể biểu diễn sự rời nhau của hai vai trị như sau:
Disjoint(parentOf, childOf) (1.9)
Trang 171.2 Các tạo tử khái niệm và vai trị
Các loại tiên đề cơ bản như đã giới thiệu ở Phần 1.1 là khá hạn chế để mơ tả chính xác Dé mơ tả những tình huống phức tạp, các Logic mơ tả cho phép tạo ra các khái niệm và vai trị mới bằng cách dùng các fao tử (constructor) khác nhau Cố hai loại tạo tử: tạo tử khái niệm và tạo tử vai tro
1.2.1 Tạo tử khái niệm boolean
Tạo tử khái niệm boolean cho phép áp dụng các tốn tử Boolean gần giống với các tốn tử hợp, giao, lấy phần bù của các tập hợp, hoặc hội, hợp hay phủ định các biểu thức logic
Ví dụ, phép bao gồm khái niệm cho phép mơ tả tất cả các người mẹ đều là phụ nữ và đồng thời, tất cả các người mẹ đều là cha-me Các Logic mơ tả cho phép phát biểu kiểu này bằng cách tạo ra một khái niệm phúc gọi là øiøo (cũng được gọi là hơ?)
Female [1 Parent, (1.10)
biểu diễn tập hợp các cá thể vừa là phụ nữ øà vừa là cha-me Một khái niệm phức cũng cĩ thể được dùng trong các tiên đề như các khái niệm nguyên tử (alomác concept), chẳng hạn phát biểu Mother = Female [1 Parent
Hợp (cịn gọi là tuyển) được dùng bên cạnh phép giao Ví dụ, khái niệm
Father LI Mother (1.11)
mơ tả các cá thể hoặc là cha hoặc là mẹ Biểu thức khái niệm này cũng cĩ thể được dùng trong tiên đề, chẳng hạn Parent = Father LI Mother — dé cho biết một cá thể cha-mẹ thì, hoặc là một cá thể cha, hoặc là một cá thể mẹ (và ngược lại)
Trang 18cá thể này cĩ thể được biểu diễn bằng một khái niệm phức như sau Female [1 ¬Married, (1.12) trong đĩ phần bà (cịn gọi là phủ định) ¬Married biểu điễn tập hợp tất cả các cá thể khơng kết hơn Để phát biểu thơng tin đúng với mọi cá thể, chúng ta dùng tiên đề T CE Male LJ Female, (1.13)
trong đĩ khá¿ niệm dink T la mot khai niém dic biét ma moi cd thể đều là thể hiện của nĩ; nĩ cĩ thể xem là dạng viết tắt của biểu thức C LI ¬C với mọi khái niệm C bất kỳ Lưu ý cách lập mơ hình như thế này khá thơ vì nĩ ngầm định rằng mọi cá thể đều cĩ giống, và cĩ thể khơng hợp lý với các cá thể của khái niệm chang han nhu Computer (gồm các cá thể là máy tính) Những phần sau của Luận văn sẽ đề cập thêm nữa về khái niệm T Để khẳng định rằng khơng ai cĩ thể vừa là nam vừa là nữ cùng lúc, chúng ta cĩ thể dùng tiên đề mơ tả tập hợp các cá thể nam và tập hợp các cá thể nữ là rời nhau Điều này cĩ thể thực hiện trong các Logic mơ tả như sau:
Male [1 Female E L, (1.14)
trong đĩ khá» niệm đáy L là khái niệm song hành với khái niệm T, là khái niệm đặc biệt khơng chứa cá thể nào: nĩ cĩ thể xem là dạng viết tắt của biểu thức khái niệm CLI¬C với C là khái niệm bất kỳ Tiên đề trên vì vậy cho biết phần giao của hai khái niệm trên là rỗng
1.2.2 Giới hạn vai trị
Trang 19mẹ của ít nhất một cá thể nào đĩ Trong Logic mơ tả, mối quan hệ này được biểu diễn bằng khái niệm tương đương
Parent = 3parentOf.T, (1.15)
trong đĩ giới hạn tồn tại JparentOf.T 1a mot khái niệm phức mơ ta tập hộp các cá thể là cha-me của ít nhất một cá thể (là thể hiện của khái niệm T) Tương tự, khái niệm dparentOf.Female mơ tả các cá thể là cha-mẹ của ít nhất một cá thể nữ, tức là cĩ con gái
Để biểu diễn tập hợp các cá thể cĩ tất cả con là nữ, chúng ta dùng giới
han vdt mot
VparentOf.Female (1.16)
Chính xác hơn (nhưng cũng kém tự nhiên hơn), tiên đề cĩ thể mơ tả tập hợp tất cả cá thể “khơng cĩ người con nào ngồi con là nữ”, tức là, “khơng cĩ con nào mà khơng là nữ” Theo cách nĩi này, khái niệm (1.16) thực tế cĩ thể được biểu diễn tương đương thành ¬3parentOf.¬Female Nếu theo ý định này, cĩ thể mơ tả các cá thể cĩ ít nhất một con và với tất cả con
của họ đều là nữ bằng khái niệm (3parentOf.T) F1 (YparentOf.Female)
Giới hạn tồn tại và giới hạn với mọi được dùng kết hợp với khái niệm đỉnh để mơ tả miền zác định và giới hạn ùng giá trị của các vai trị Để giới hạn miền xác định của vai trị sonOf chỉ là các cá thể nam, chúng ta dùng tiên đề dsonOf.T CE Male, (1.17) 2 và giới hạn miền giá trị của nĩ chỉ là các cá thể cha-me chúng ta cĩ thể viết T.E VsonOf.Parent (1.18)
Trang 20nếu chỉ cho đữ kiện John là con-trai của Julia thì rằng buộc này là vi phạm (dẫn đến mâu thuẫn) chứ khơng ngầm định rằng John là một cá thể nam Giới hạn số lượng cho phép giới hạn số lượng cá thể trong một vai trị cho trước Ví dụ, cĩ thể thành lập giới hạn tối thiểu
>2 childOf.Parent (1.19)
để mơ tả tập hợp các cá thể là con của ít nhất hai cá thể cha-mẹ, và giới
hạn tối đa
<2 childOf.Parent (1.20)
cho các cá thể là con của tối đa hai cá thể cha-mẹ Tiên dé Person £
>2 childOf.Parent [1 <2 childOf.Parent cho biết mỗi cá thể người đều là
“⁄ : 2 2
con của đúng hai cá thể cha-mẹ
Cuối cùng, fính phản zạ cục bộ cĩ thể được dùng để mơ tả tập hợp các cá thể khơng liên quan đến chính nĩ thơng qua một vai trị cho trước Ví dụ, tập hợp các cá thể nĩi chuyện với chính nĩ được mơ tả bằng khái
niệm
dtalksTo Self (1.21)
1.2.3 Nominal
Cũng như việc định nghĩa các khái niệm thơng qua các khái niệm khác (hoặc các vai trị khác), chúng ta cĩ thể định nghĩa một khái niệm bằng
cách liệt kê đơn thuần các cá thể của nĩ: john, paul, george, và ringo Các
Trang 21Chú ý rằng, bằng cách dùng các nomznal, phát biểu khái niệm Mother(julia) cĩ thể chuyển thành một bao ham khái niệm {julia} Mother, và phát
biểu vai trị parentOf(julia, john) cĩ thể chuyển thành bao hàm khái niệm
{julia} AparentOf.{john}
1.2.4 Tạo tử vai trị
Khác với các tạo tử khái niệm, Logie mơ tả khơng hỗ trợ xây dựng nhiều vai trị phức tạp Trên thực tế, øø¿ trị nghịch đảo là tạo tử quan trọng nhất thường dùng Về mặt trực giác, mối quan hệ giữa các vai trị parentOf và childOf mang tính chất như thế Chẳng hạn, nếu Julia là cha- mẹ của John thì John là con của Julia và ngược lại Một cách hình thức thì, parenfOf là vai trị nghịch đảo của childOf Trong Logie mơ tả cĩ thể
biểu diễn bằng
parentOf = childOf”, (1.23)
trong đĩ vai trị phức childOf~ biểu diễn cho vai trị nghịch đảo của vai
tro childOf
Tương tự với khái niệm đỉnh, Logie mơ tả cũng cĩ vai trd tồn thể (universal role) U — lién két moi cap ca thé va vai tro réng tuong ting véi khái niệm đáy
1.2.5 Mơ tả tính chất của vai trị
Phần 1.1.3 đã trình bày ba dạng tiên đề RBox: tiên đề bao hàm vai trị, tiên đề vai trị tương đương và tiền đề tách rời vai trị Trên thực tế vai trị cịn cĩ thể được đặc tả thêm các tính chất như: tính bắc cầu, tính đối xứng, tính phản xạ, tính phản phản xạ
Tính bắc cầu là một dạng đặc biệt của bao hàm vai trị phức Ví dụ,
tính bắc cầu của ancestorOf cĩ thể được mơ tả bằng tiên đề ancestorOf o
ancestorOf E ancestorOf Một vai trị là cĩ tính bắc cầu nễu nĩ tương
đương với vai trị nghịch đảo của nĩ, ví dụ married To = marriedTo, và nĩ
Trang 22hạn Disjoint(parentOf, parentOf ) Khi can tinh phan xa todn cuc cé thé
được biểu diễn bằng cách đưa tính phản xạ tồn cục lên khái niệm đỉnh như T E_ 3knows.Seσ (Mọi cá thể đều biết đến chính cá thể đĩ) Một vai trị là phản phản zạ nếu nĩ khơng bao giờ phản xạ cục bộ như trường hợp
TL ¬HmarriedTo.Selƒ (khơng cĩ cá thể nào tự kết hơn với chính cá thể do)
1.3 Logic mé ta SROTQ
Trong phần này, Luận văn tĩm tắt các tính chất đã trình bày sơ lược ở trên để cĩ định nghĩa tồn diện về cú pháp của Logie mơ tả Định nghĩa này sẽ dẫn đến một Logie mơ tả gọi là S?Z@Z7Ø, là một trong những Logiec mơ tả cĩ khả năng biểu diễn cao và thơng dụng nhất hiện nay Đĩ cũng được là thành phần quan trọng để xây dựng ngơn ngữ ontology OWL 2 DL, mặc dù vẫn cĩ một số điểm khác biệt (sẽ được trình bày chỉ tiết ở
Phần 1.6)
Về mặt hình thức mọi ontology DL đều được dựa trên ba tập hữu hạn các ký hiệu: một tập Đr gồm các tên cá thể, một tập Ne gồm các tên khái niệm và một tập Ng gồm các tên 0a¿ trị Thơng thường những tập này được giả thiết là cố định trong một ứng dụng cụ thể và vì thế khơng được đề cập một cách rõ rang Bay gid tap hop cdc biéu thite vai tro SROTO dựa trên bộ ký hiệu này sẽ được định nghĩa theo ngữ pháp sau đây:
R:=U|Ne|Ne
trong đĩ Ù là vai trị tồn thể (xem Phần 1.2.4) Dựa vào đĩ, tập hợp các biểu thức khái niệm S?®@7Q được định nghĩa là:
C z:= Ne | (CTC) | (CLIC) | aC | T| | IRC |VRC|SnRC | <nRC | SR.S
trong đĩ ø là một số nguyên khơng âm Cách viết biểu thức (CT1C) biểu
diễn mọi biểu thức cĩ dạng CT1D với C,D € C Chúng ta cũng bỏ qua
các dấu ngoặc nếu khơng dẫn đến nhằm lẫn biểu thức hoặc làm sai lệch ngữ nghĩa Chang han cdc dấu ngoặc sẽ khơng cĩ nghia trong AU BUC
Trang 23Dùng các tập hợp tên cá thể, tên vai trị, tên khái niệm ở trên, các tiên đề của S?@Z7O được định nghĩa theo một trong các dang cơ bản sau:
ABox: C(N;) R(Nz, Nr) N; } Ny; Nr#N;
TBox: CLC C=C
RBox: RCR R=R RoRCR Disjoint(R, R)
với nghĩa cụ thể được giải thích ở Phần 1.1 và Phan 1.2
Cĩ thé hiéu, mot ontology SROTQ (hoac cơ sở trí thúc) đơn thuần là một tập hợp các tiên đề như vậy Để đảm bảo sự tồn tại của thuật tốn lập luận đúng và cĩ tính dừng, tuy vậy, người ta cần giới hạn cú pháp cho các ontology: Khơng chỉ dành cho các tiên đề mà cịn giới hạn về cấu trúc của tồn thể ontology, vì vậy cịn được gọi là giới hạn oề cấu trúc Hai điều kiện như vậy dành cho Š7?V@7@ được dựa trên khái niệm fính đơn giản và lính chính quy Đáng chú ý, cả hai đều tự động thoả cho các ontology khơng chứa các tiên đề bao hàm vai trị phức
Định nghĩa biểu thức øa¿ trị khơng đơn giản của ontology @ được cho bởi quy tắc:
e Nếu @ chứa một tiên đề So T ER, thì R là khơng đơn giản, e Nếu R là khơng đơn giản thì R~ là khơng đơn giản,
e Nếu R là khơng đơn giản và @ chứa tiên đề bất kỳ cĩ dạng R E §, ŠSŠ =R hoặc R =S, thì S cũng là khơng đơn giản
Mọi vai trị khác được gọi là đơn giản.! Như vậy đối với một ontology SROTO ching ta can cc tién dé va khái niệm sau đây chỉ chứa các vai trị đơn giản:
Tiên đề bị hạn chế: Disjoint(R, R)
Biểu thức khái niệm bị hạn chế: AR Self >nR.C <nR.C
Trang 24Các hạn chế cấu trúc khác liên quan đến S#@ØZ7@ được gọi là hạn chế chính quy va chỉ liên quan đến các tiên đề RBox Nĩi nơm na, việc hạn chế này bảo đảm phụ thuộc vịng giữa các tiên đề bao hàm vai trị phức chỉ xuất hiện ở một dạng cĩ giới hạn
1.4 Ngữ nghĩa của Logic mồ tả
Ngữ nghĩa hình thức của các tiên đề Logie mơ tả được cho bởi ngữ nghĩa lý thuyết-mơ hình Cụ thể, ngữ nghĩa này cho biết những hệ quả logic của ontology Ngữ nghĩa hình thức vì vậy chính là hướng dẫn chính cho các cơng cụ tính tốn hệ quả logic của các ontology DH
Về mặt trực giác, một ontology mơ tả một tình huống cụ thể trong một lĩnh vực cho trước Ví dụ, các tiên đề ở Phần 1.1 và Phần 1.2 mơ tả một tình huống cụ thể trong lĩnh vực “gia đình và các mối quan hệ gia đình” Tuy vậy, các onwology thường khơng thể mơ tả hồn tồn hết tình huống cụ thể đĩ Mặt khác, khơng cĩ mối quan hệ hình thức nào giữa các ký hiệu chúng ta dùng với các đối tượng mà các ký hiệu này biểu diễn: tên c4 thé julia chang hạn, chỉ là một định danh về mặt cú pháp chứ khơng mang ý nghĩa gì Chính vì vậy, ý nghĩa của các định danh trong ontology của chúng ta sẽ khơng ảnh hưởng đến ngữ nghĩa hình thức Mặt khác, các tiên đề trong ontology thường khơng cung cấp đầy đủ thơng tin Chẳng hạn (1.3) và (1.4) trong Phần 1.1.1 cho biết sự trùng lặp và khác biệt nhau giữa các tên cá thể, nhưng trong nhiều trường hợp những thơng tin này sẽ khơng được nêu rõ trong ontology
Trang 25World Assumption) vì nĩ bảo đảm thơng tin chưa đặc tả thì cĩ tính mổ.ˆ Một hệ quả logic của ontology là một tiên đề thoả mãn trong tất cả các phép diễn dịch của ontology đĩ Ontology chứa càng nhiều tiên đề thì cĩ càng nhiều ràng buộc được đưa ra cho các phép diễn dịch, theo đĩ sẽ cĩ càng ít phép diễn dịch tồn tại và thoả tất cả các tiên đề Ngược lại, nếu cĩ ít phép diễn dịch thoả mãn ontology thì cĩ càng nhiều tiên đề thoả tất cả chúng, và cĩ càng nhiều hệ quả logic suy ra được từ ontology Hai đặc điểm trên cho thấy ngữ nghĩa của Logic mơ tả cĩ tính đơn điệu: các tiên đề bổ sung luơn luơn dẫn đến các hệ quả bổ sung, hoặc nĩi dễ hiểu, đưa càng nhiều tri thức vào hệ thống Logie mơ tả thì nĩ trả về càng nhiều kết quả
Cĩ một trường hợp là khi ontology khơng thoả được trong bất kỳ phép dién dich nao Ontology khi đĩ được gọi là khơng thoả được hoặc là khơng nhất quán Trong trường hợp này mọ¿ tiên đề đều đúng trong tất cả (là 0) các phép diễn dịch thoả ontology Ontology như vậy rõ ràng là khơng cĩ giá trị gì, do đĩ việc đảm báo tính nhất quán trong quá trình xây dựng ontology là điều cực kỳ quan trọng
Chúng ta đã nêu các ý tưởng quan trọng nhất của ngữ nghĩa Logic mồ tả Phần cịn lại sẽ định nghĩa thế nào là một “phép diễn dịch” và điều kiện phải cĩ để cho các tiên đề cụ thể thoả được trong phép diễn dịch
đĩ Một phép diễn dịch Z bao gồm một tập AT gọi là miền xác định của
Z và một hàm diễn dịch -7 ánh xạ mỗi khái niệm nguyên tố 4 đến một
tap A? C A?, ánh xạ mỗi vai trị nguyên tố đến một quan hệ hai ngơi R? Cc A7 x AT, và ánh xạ mỗi tên cá thé a đến một phan ttt a? € A?
Phép diễn dịch của các khái niệm phức, vai trị phức sẽ tuân theo phép diễn dịch của các phần tử cơ sở Bảng 1.1 trình bày cách nhận được ngữ nghĩa của mỗi biểu thức phức từ ngữ nghĩa của các thành phần Chúng ta
hiểu “đối- R7 của #” nghĩa là tất cả các cá thể # sao cho (z,) € Rf
Trang 26Bảng 1.1: Cú pháp và ngữ nghĩa cua cdc tao tt SROTQ Cú pháp Ngữ nghĩa Cá thể: tên cá thể a at Vai tro: Vai trị nguyên tố R Rt Vai trị nghịch dao Ro {(z,y) | (y,v) € RT} Vai trị tồn thể U At x At Khái niệm:
Khái niệm nguyên tố A At
Giao khái niệm 11 C2 DE Hợp khái niệm CUD CFU Dt
Bù khái niệm aC A*\ CF
Khai niém dinh T At
Khai niém day Jl 0
Giới hạn tồn tại AR.C {x | cé mot déi-R? cia x trong C7}
Giới hạn với moi VR.C {z | tất cả đối-R7 của z đều ở trong C?}
Giới hạn tối thiểu >nR.C_ {z | tối thiểu cĩ n đối-R7 của z đều ở trong C?}
Giới hạn tối đa, <n R.C {x | cĩ téi da n déi-R? cia x trong C7}
Phan xa cục bộ AR Self {x | (x,x) € R7}
Nominal {a} {a7}
Trang 27
Bảng 1.2: Cú pháp và ngữ nghĩa của tiên dé SROTQ Cú pháp Ngữ nghĩa ABoz:
Phát biểu khái niệm C(a) at’ Ect
Phat biéu vai trd R(a, b) (a?,b*) € R?
Khang dinh bing nhau an at = bt Khang định khác nhau a#b at # bt
TBoz:
Gộp khái niệm CED CEC IDs Tương đương khái niệm C=D Cf = DF
RBoz:
Gộp vai trị RES Ric Sst Tương đương vai trị R=S eS Gộp vai trị phức RịoRaCS RịoHCS
Tách rời vai trị Däsjomnt(R,S) R7nS” =J
nếu œ thoả được trong mọi mơ hình của @ Điều đặc biệt là, một ontology khơng nhất quán sẽ kéo theo mọi tiên đề!
Hệ quả đáng chú ý của ngữ nghĩa này đĩ là ý nghĩa của các tên cá thé trong ontology Logic mơ tả Chúng ta đã lưu ý rằng các Logic mơ tả thường khơng cĩ Giả thiết tên duy nhất (Unique Name Assumption), va thực tế định nghĩa hình thức cĩ thể cho phép hai tên cá thể được diễn dịch như là một cá thể (phần tử trong miền xác định) Thậm chí miền xác định
của phép diễn dịch được phép chứa nhiều cá thể khơng được biểu diễn bởi
tên nào! Một nhầm lẫn chung trong khi xây dựng ontology xuất phát từ việc ngầm giả thiết rằng phép diễn dịch chỉ phải chứa các cá thể được biểu diễn thơng qua các tên cá thể (những cá thể như vậy cịn được gọi là cá
thể đã được đặt tên
Chẳng hạn, cĩ người nghĩ rằng tập tiên đề
Trang 28khi ở đây chỉ cĩ một (John) Tuy vậy, cĩ thể tưởng tượng cĩ nhiều mơ hình mà trong đĩ Julia cĩ 3 con, ngay cả khi chỉ cĩ một người con trong số đĩ được đặt tên rõ ràng
Một điểm lưu ý khác đĩ là đặc tả trên của ngữ nghĩa khơng gợi ý cách tính ra các hệ quả cĩ liên quan để xây dựng các cơng cụ phần mềm Cĩ thể
cĩ nhiều phép diễn dịch, mỗi phép diễn dịch cĩ thể cĩ một miền xác định
vơ hạn (thực tế cĩ một số ontology chỉ thoả được bởi miền xác định vơ hạn) Vì vậy khơng thể kiểm tra hết mọi phép diễn dịch để biết xem chúng cĩ mơ tả một ontology cho trước hay khơng, và cũng khơng thể kiểm tra tất cả mơ hình của một ontology xem thử mơ hình đĩ cĩ kéo theo một tiên đề cho trước hay khơng Thay vào đĩ, người ta phải nghĩ ra các thủ tục suy điễn và chứng minh tính đúng theo các đặc tả nêu trên Ảnh hưởng của các khả năng biểu diễn cĩ thể làm cho thuật tốn lập luận phức tạp hơn và trong một số trường hợp nĩ thậm chí cĩ thể khơng tồn tại thuật tốn đúng và cĩ tính dừng! (tức là phép lập luận là khơng khả quyết)
1.5 Một số đoạn S?#@Z7@ quan trọng
Nhiều Logie mơ tả khác nhau đã được giới thiệu Thơng thường chúng cĩ thể được đặc trưng bởi các loại tạo tử và các tiên đề mà chúng chấp nhận, thudng 1a tap con cla cac tao tit trong SROTQ Ví dụ, Logic mơ ta ALC la mot doan cia SROTQ khơng chấp nhận tiên đề RBox mà chỉ chấp nhận các tạo tử khái niệm [], LI, ¬, 3 và V ,4£€ thường được gọi là Logic mơ tả cơ bản nhất Mỏ rộng Logic mơ tả ,4£€ bằng các vai trị bắc cầu sẽ được ký hiệu bằng ký tự SŠ Một số ký tự khác được dùng trong tên của Logic mơ tả biểu diễn cho một tạo tử cụ thể, chẳng hạn vai trị nghịch dao Z, nominal, Ò, hạn chế số lượng định tính Q, và phân cấp vai trị (tiên đề bao hàm vai trị khơng phức tạp) ? Như vậy, ví dụ Logic mơ
tả tên là ACCHTQ sé md rong Logic mé ta ALC védi các phân cap vai trị,
Trang 29đối xứng, tính bất đối xứng, tách rời vai trị, tính phản xạ và tính phan phan xạ Cách đặt tên này cũng giải thích cho cai ten SROZQ
Trong những năm gần đây, các đoạn Logic mơ tả đã được phát triển riêng nhắm đến một tính chất tính tốn cụ thể Với mục đích này, Logic mé ta ALC là quá lớn, vì nĩ chỉ chấp nhận các thuật tốn lập luận chạy trong tình huống xấu nhất với thời gian mũ Các Logic mơ tả nhẹ hơn cĩ thể nhật được bằng cách giới hạn bĩt khả năng diễn tả, trong khi số lượng tính chất bổ sung S?@Z7@ cĩ thể thêm vào mà khơng làm mất đi các ưu thế tính tốn Ba cách tiếp cận chính để nhận được các Logic mé tả nhẹ là €£, DIP và DL-L#e, tương ứng với các đoạn ngơn ngữ OWL EL và OWL QL của Ngơn ngữ OWL
Họ Logic mơ tả €£ được đặc trưng bởi việc chấp nhận dùng vơ hạn các lượng từ tồn tại và phép giao khái niệm Logic mơ tả gốc ££ chỉ cho phép những đặc trưng này và T chứ khơng chấp nhận các lượng từ tồn thể, phép bù, với mọi và các tiên đề RBox Mỏ rộng hơn nữa của ngơn ngữ này cịn gọi là €£€*T* Mỏ rộng lớn nhất như thế chấp nhận các tạo tử n, T, L, 5, Self, nominal va vai trd toan thé, cing nhu hé tro tat ca loai tiên đề ngoại trừ vai trị đối xứng, bất đơi xứng và phản phản xạ
Các tác vụ lập luận chuẩn cho Logie mơ tả này vẫn cĩ thể giải quyết được với thời gian xấu nhất là đa thức Người ta cĩ thể bỏ đi giới hạn cấu trúc về tính chính quy cho S%@Z7@ €£ đã được dùng để xây dựng các ontology lớn nhưng đơn giản, chứa chủ yếu các dữ liệu thuật ngữ, đặc biệt là trong khoa học đời sống Một số bộ lập luận được tối u để xử lý các ontology kiểu €£, mà gần đây nhất là bộ lập luận ELK cho OWL EL
1.6 Mối quan hệ với ngơn ngữ OWL
Trang 30thay thế cho phiên bản OWL 1 ra đời năm 2004
Thành phần chính của OWL thực tế rất tương tự với các Logie mơ tả, chỉ cĩ khác biệt là, các khái niệm được gọi là lớp, các vai trị được gọi là thuộc tính Logie mơ tả ảnh hưởng lớn đến sự phát triển OWL và các tính chất diễn tả tri thức mà ngơn ngữ này hỗ trợ Tuy nhiên, về mặt lịch sử OWL lại được mổ rộng từ RDE — một ngơn ngữ mơ hình hố dữ liệu Web cĩ khả năng diễn tả được so sánh với các ABox trong Logic mơ tả
Trong phần này, Luận văn chỉ xét đến Ngữ nghĩa hình Trực tiếp của OWL Ngữ nghĩa này chỉ định nghĩa cho các ontology OWL cĩ giới hạn về cú pháp (về bản chất các tiên đề OWL cĩ thể được đọc như các tiên đề S®SG7@ tuân thủ các giới hạn về cấu trúc được mơ tả ở Phần 1.3) Đoạn cú pháp này của OWL được gọi là OWL DL Nĩ biến thé ti SROTOQ
Ví dụ, tiên đề Mother = Female F1 Parent cĩ thể được viết như sau trong OWL:
EquivalentClasses( Mother 0bjectIntersection0f( Female Parent ) )
trong đĩ ký hiệu Mother, Female và Parent là các chuối định danh tuân theo đặc tả OWL Ví dụ trên minh hoạ mối quan hệ gần gũi giữa cú pháp cta SROTO va OWL Trong nhiéu trudng hop, cĩ thể dịch một ký hiệu toan tit cha SROTQ sang tên tốn tử tương ứng trong OWL, sau đĩ viết dưới dạng hàm Chuẩn OWL cung cấp một số dạng cú pháp cĩ thể dùng
để biểu diễn ontology OWL
Vẫn cĩ một số điểm khác biệt giữa OWL DL dưới ngữ Ngữ nghĩa Trực tiếp và S?@7@ Về mặt cú pháp, OWL cung cấp nhiều tốn tử hơn, mặc đù là thừa về mặt logic, nhưng cĩ thể thuận tiện cho người dùng và được xem là cách viết nhanh cho các tiên dé Logic mơ tả Chẳng hạn, OWL cĩ cấu trúc đặc biệt để mơ tả miền xác định và miền giá trị của thuộc tính, dé dễ định nghĩa nhưng nĩ lại khơng cĩ trong Logic mơ tả
Trang 31tự như các lớp và tên cá thể nhưng được diễn dịch theo một cách cố định, cho trước Chẳng hạn, kiểu dữ liệu cho các giá trị Boolean cĩ đúng hai phần tử true và false - trong bất kỳ phép dién dich nào Điều này cũng cĩ thể làm được trong các Logic mơ tả bằng thứ gọi là miền xác định cụ thể
(concrete dornøin, tức là, một miền xác định được định nghĩa trước cho phép dién dich Ca Logic mơ tả và OWL trong trường hợp này đều phân biệt rõ ràng các vai trị/thuộc tính liên quan đến các cá thể “trừu tượng” mà từ đĩ liên quan đến những giá trị của một kiểu dữ liệu cụ thể Trong OWL, cấu trúc liên quan đến kiểu dữ liệu cĩ chữ “Data” trong tên, cịn các cấu trúc liên quan đến các cá thể trữu tượng sé chtta “Object” trong tên Ví dụ OWL phân biệt 0bjectIntersection0f (đã đùng ở trên) với DataIntersection0f (phép giao của kiểu dữ liệu)
Đặc tính logic duy nhất bị thiếu trong các Logie mơ tả là Key (Khoa) Đây là các dạng đặc biệt của quy tắc, cĩ thể dùng để tích hợp dữ liệu Một
key (khố) cho biết hai cá thể được đặt tên sẽ được suy diễn là bằng nhau
nếu chúng bằng nhau về giá trị thuộc tính nào đĩ và thuộc cùng một lớp, tương tự như ràng buộc khố trong cơ sở dữ liệu Ví dụ, kết hợp quốc tịch và số đăng ký cĩ thể tạo ra khố cho phương tiện giao thơng
Trang 32Chương 2
WEB NGỮ NGHĨA VÀ NGƠN NGU ONTOLOGY DÀNH CHO WEB OWL 2
Trong chương này Luận văn sẽ trình bày về Web ngữ nghĩa và ngồn ngữ OWL2- ngơn ngữ dùng để biểu diễn các ontology dành cho web Phần 2.1 sẽ trình bày vấn đề chuẩn hố ngơn ngữ ontology trong Web ngữ nghĩa Phan 2.2 trình bày các cấu trúc xây dựng ontology điển hình của ngơn ngữ OWL.2 Các đặc trưng tính tốn và ngữ nghĩa của OWL2 sẽ được trình bày ở cuối chương
2.1 Web ngữ nghĩa và vấn đề chuẩn hố ngơn ngữ ontology OWL 2 là ngơn ngữ mang tính khai báo, nĩ mơ tả những gì đang xảy ra theo một cách cĩ logic Các bộ lập luận sẽ suy dẫn các thơng tin về những gì đang xảy ra này Cách thức suy dẫn thơng tin được quy định bởi ngữ nghĩa hình thức Trên thực tế, cĩ hai ngữ nghĩa hình thức: (1) Ngữ nghĩa Truc tiép (OWL 2 Direct Semantics) và (2) Ngũ nghĩa dựa trên RDF dược ấp dụng cho ngơn ngữ OWL2
2.2 Phân loại tiên đề trong OWL 2 và kỹ thuật sử dụng các tiên
đề
OWL2 là một ngơn ngữ biểu diễn tri thức, được thiết kế để xây dựng, trao đổi và lập luận từ tri thức về một lĩnh vực cho trước Cơ sở tri thức được xây dựng bằng ngơn ngữ này được gọi là ontology OWL2, gồm các thành phần cơ bản:
Trang 33e Biểu thức: chứa các thực thể để thành lập nên một mơ tả phức tạp từ các mơ tả cơ bản
Tên của các thực thể trong OWL cĩ thể được sử dụng trong các biểu thức thơng qua các tạo tử Chẳng hạn, các lớp nguyên tố như Female (Nữ),
Professor (Giáo sư) cĩ thể được kết hợp cùng nhau để mơ tả những Nữ
giáo sư Các cá thể mới cĩ thể được định nghĩa thơng qua biểu thức lớp trong OWL, roi stt dung trong các phát biểu hoặc biểu thức khác
Các tiên đề trong ontology OWL 2 cĩ thể được phân loại theo hình dưới đây:
|: áo thuộc tính
+ Khai bao f Khẳng định tính thuộc của cá thể
Khang định dữ kiện thuộc tính của 1 cá thé
Khai bị p tương đương
—Ì Tiên đề cholớp LÍ kss.,
Hình 2.1: Phân loại các tiên đề trong ontology OWL2
Trang 342.2.1 Mơ tả Lớp, Cá thể và Cây phân cấp lớp
Để khẳng định một cá thể thuộc về một lĩp, chúng ta sử dụng tiên đề cĩ dạng:
GlassAssertion( :Person :Mary )
Tiên đề này nĩi về một cá thể tên là Mary, khẳng định cá thể này là một con người
Quan hệ quan trọng giữa hai lĩp là quan hệ bao hàm — nĩ sẽ định ra một cây phân cấp lĩp Để biểu diễn mối quan hệ bao hàm, OWL sử dụng tiên đề dạng như sau:
SubClassOf( :Woman :Person )
Tiên đề này cho phép bộ lập luận suy dẫn mọi cá thể thuộc về lĩp
Woman thì cũng là cá thể thuộc về lớp Person
Quan hệ bao hàm cĩ tính bắc cầu Chẳng hạn, nếu cĩ thêm phát biểu SubClassOf( :Mother :Woman )
thì bộ lập luận cĩ thể suy ra được, một cá thể nếu là thể hiện của lĩp lớúpMother thì cũng là cá thể của lớp lớpPerson
Các lớp trong bộ từ vựng cĩ thể tham chiếu đến cùng một tập hợp các cá thể OWL cho phép mơ tả điều này bằng tiên đề cĩ dạng:
EquivalentClasses( :Person :Human )
Tiền dé này cho biết Person va Human là tương đương nhau
Trang 35và Woman, chúng ta thấy khơng thể cĩ cá thể nào cĩ thể đồng thời là thể hiện của cả hai lớp này Chúng ta thể hiện điều này bang tién dé sau:
DisjointClasses( :Woman :Man )
2.2.2 Mơ tả Thuộc tính kiểu đối tượng
Ỏ phần trên, chúng ta mơ tả các cá thể, tính thuộc của lĩp, và cách mà các lớp quan hệ với nhau dựa trên các thể hiện của chúng Nhưng thơng thường, ontology cũng cĩ đặc tả cách mà các cá thể quan hệ với nhau
ObjectPropertyAssertion( :hasWife :John :Mary )
Tiên đề nĩi trên cho biết hasWife là một thuộc tính, và thuộc tính này
liên kết hai cá thể John và Mary lại với nhau (John cĩ vợ là (basWe)
Mary
Chúng ta cũng cĩ thể phát biểu hai cá thể khơng liên kết uới nhưu bởi một thuộc tính nào đĩ Chẳng hạn tiên đề sau đây nĩi rằng, Mary khơng phải là uợ cha Bill:
NegativeObjectPropertyAssertion( :hasWife :Bill :Mary )
Phát biểu phủ định thuộc tính là cách duy nhất để nĩi về những thứ mà chúng ta cho rằng là khơng đúng trong cơ sở tri thức Kiểu thơng tin này cực kỳ quan trọng trong OWL, nơi ngầm định rằng bất cứ thứ gì cũng cĩ thể xảy ra cho đến khi chúng ta phát biểu ngược lại một cách rõ ràng
(Giả thiết Thế giới mổ —- OWA)
Trang 36Thơng thường, thơng tin về hai cá thể được liên kết nhau bằng một thuộc tính nào đĩ sẽ cho phép suy ra được các thơng tin mới về các cá thể Đặc biệt, chúng ta cĩ thể suy ra được tính thuộc của cá thể Chang han, nếu nĩi B là vợ của A thì chúng ta suy ra B phải là một Woman, cịn A là một Man OWL cung cấp dạng tiên đề như sau:
ObjectPropertyDomain( :hasWife :Man ) ObjectPropertyRange( :hasWife :Woman )
Nếu cĩ hai tiên đề này, và giả sử cĩ thơng tin Sasha được liên kết với Hillary thơng qua thuộc tính hasWife, bộ lập luận cĩ thể suy ra rằng Hillary là cá thể của lĩp Woman và Sasha là cá thể của lớp Man
Như phần trên cĩ đề cập, với Giả thiết thế giới mổ, mọi thơng tin đều cĩ thể đúng trừ khi chúng ta cĩ phát biểu rõ ràng điều ngược lại Chẳng hạn, John và Mary khơng tham chiếu đến cùng một cá thể, vì chúng thuộc về hai lớp tách rời nhau (Man và Woman) Tuy nhiên, nếu chúng ta bổ sung thơng tin về các cá thể khác, ví dụ là Bill và nĩi rằng cá thể này thuộc về lớp Man, thì khơng cĩ gì đảm bảo Bill và John là khác nhau OWL khơng cĩ giả thiết tên khác nhau! Dé nêu rõ hai cá thể là khác nhau, chúng ta sử dụng tiên đề cĩ dạng:
DifferentIndividuals( :John :Bill )
Chúng ta cũng cĩ thể phát biểu các tên là tham chiếu đến cùng một đối tượng Ví dụ, cĩ thể nĩi James và Jim cùng nĩi về một cá thể:
SameIndividual( :James :Jim )
Trang 372.2.3 Kiểu dữ liệu và Thuộc tính kiểu dữ liệu
Các phần trước đã cho thấy cách mơ tả cá thể thơng qua tính thuộc của lớp, thơng qua mối quan hệ giữa các cá thể với cá thể khác Trong nhiều trường hợp, các cá thể cĩ thể được mơ tả bằng các giá trị dữ liệu Chẳng hạn, ngày sinh, tuổi, địa chỉ email, của một người OWL cung cấp một loại thuộc tính khác gọi là thuộc tính Kiểu dữ liệu (Datatype property) Những thuộc tính này sẽ liên kết các cá thể với các giá trị dữ liệu (thay vì liên kết với các cá thể khác như ở phần trước) Sau đây là một ví dụ — phát biểu tuổi của cá thể tên John là 51:
DataPropertyAssertion( :hasAge :John "B1"^^xsd:integer )
Chúng ta cũng cĩ thể phát biểu rằng, tuổi của cá thể tên Jack khơng phải là 53 như sau
NegativeDataPropertyAssertion( :hasAge :Jack "B3"^^xsd:integer )
Miền xác định và miền giá trị của thuộc tính kiểu dữ liệu cũng cĩ thể được phát biểu tương tự như ở thuộc tính kiểu đối tượng Tiên đề sau đây cho biết thuộc tính hasAge chỉ được sử dụng để liên kết các cá thể thuộc lĩp Person với các số nguyên khơng âm
DataPropertyDomain( :hasAge :Person )
DataPropertyRange( :hasAge xsd:nonNegativeInteger )
2.2.4 Định nghĩa Lớp phức
Trang 38Giao của hai lớp sẽ bao gồm đúng các cá thể là thể hiện của cả hai lớp Tiên đề dưới đây phát biểu lớp Mother gồm các đối tượng là thể hiện của cả hai lớp Woman và Parent:
EquivalentGlasses (
:Mother
ObjectIntersectionOf( :Woman :Parent )
Bộ lập luận sẽ suy ra được từ tiên đề này là, mọi cá thể là thể hiện của lớp Mother thì cũng là thể hiện của lớp Parent
Hợp của hai lĩp sẽ bao gồm các cá thể được chứa trong ít nhất một hai lớp đĩ Chẳng hạn, để mơ tả lĩp gồm tất cả các cá thể cha-me, ching ta dùng hợp của hai lớp Mother và Father:
EquivalentGlasses (
:Parent
ObjectUnionOf( :Mother :Father )
Trang 39Các ví dụ trên minh hoạ cách sử dụng các tạo tử của lớp để định nghĩa lớp mới dưới dạng tổ hợp các lớp khác Tuy nhiên, chúng ta cũng cĩ thể dùng các tạo tử của lớp cùng với các phát biểu bao hàm lớp để nêu điều kiện cần, điều kiện đủ cho một lớp Ví dụ sau đây cho biết mọi cá thể của
Granfather đều là cá thể của Man và Parent (nhưng điều ngược lại là chưa
chắc đúng):
SubClassOf ( :Grandfather
ObjectIntersectionOf( :Man :Parent )
Nĩi chung các lớp phức cĩ thể được dùng ở bất cứ nơi nào — tương tự như lĩp nguyên tố Ví dụ minh hoạ dưới đây khẳng định cá thể tên Jack là một người, và khơng phải là một cá thể cha-me: ClassAssertion( ObjectIntersectionOf ( :Person ObjectComplementOf( :Parent ) : Jack
Trang 40:Parent
ObjectSomeValuesFrom( :hasChild :Person )
Tiên đề này nĩi rằng với mọi cá thể của lĩp Parent, tồn tại ít nhất một cá thể con-cái mà cá thể con-cái này thuộc về lĩp Person Dạng tiên đề này được dùng trong các cơ sở tri thức khơng đầy đủ Ví dụ, Sally nĩi rằng Bob là một cá thể cha-mẹ, và vì thế chúng ta cĩ thể suy ra rằng Bob cĩ ít nhất một người con ngay cả khi chúng ta khơng biết tên của người con này
Một ràng buộc về thuộc tính khác gọi là định lượng với mọi, được dùng để mơ tả một lớp cá thể liên kết với các cá thể chỉ thuộc về một lớp đã cho nào đĩ Chúng ta dùng phát biểu dưới đây
EquivalentGlasses (
:HappyPerson
ObjectAllValuesFrom( :hasChild :HappyPerson )
Ví dụ này cũng cho thấy các phát biểu của OWL cho phép định nghĩa đ
tương đương
-‹®) quy; lớp HappyPerson được dùng trong cả hai phía của một phát biểu
Chúng ta làm rõ hơn định nghĩa HappyPerson với phát biểu:
EquivalentGlasses (
:HappyPerson
ObjectIntersectionOf (