1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng web ngữ nghĩa căn bản

34 1,3K 11

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 1,21 MB

Nội dung

Bài giảng web ngữ nghĩa căn bản Tim BernersLee: Web có ngữ nghĩa là sự mở rộng của WEB hiện tại mà trong đó thông tin được định nghĩa rỏ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách hiệu quả hơn. (Được định nghĩa để máy tính xử lý được, tích hợp DL động; DLtri thức được sử dụng lại thông qua các ứng dụng khác nhau)

1. Web ngữ nghĩa là gì? Tim Berners-Lee: Web có ngữ nghĩa là sự mở rộng của WEB hiện tại mà trong đó thông tin được định nghĩa rỏ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách hiệu quả hơn. (Được định nghĩa để máy tính xử lý được, tích hợp DL động; DL/tri thức được sử dụng lại thông qua các ứng dụng khác nhau) Theo định nghĩa của Tổ chức World Wide Web (W3C): “WebNN là một cách nhìn về cách thức tổ chức dữ liệu: đó là ý tưởng về việc dữ liệu trên Web được định nghĩa và liên kết theo một cách mà nó có thể được sử dụng bởi máy tính với mục đích không chỉ cho việc hiển thị mà còn tự động hoá, tích hợp và sử dụng lại dữ liệu qua các ứng dụng khác nhau”. ⇒Phân biệt WebNN với Trí tuệ nhân tạo: TTNT là làm cho máy tính thông minh hơn còn WebNN là làm cho ứng dụng thông minh hơn (Biểu diễn thông tin, DL theo cách nào đó để ứng dụng có thể hiêu được) ⇒Tại sao cần đến WebNN: Vấn đề chính với Web hiện nay là nội dung web thiếu ngữ nghĩa, dẫn đến việc tìm kiếm DL trên web chủ yếu dựa vào keyword và theo đó là: -Tìm ra nhiều kết quả→tính chính xác thấp -Không có kết quả nếu tìm quá chặt chẽ -Kq rất phụ thuộc vào sự “nhạy cảm” của từ ngữ -Người sử dụng phải tốn nhiều thời gian, công sức để xử lý kết quả trả về. →Nói chung thao tác chủ yếu là thao tác trên nội dung thấy được. Quan trọng là máy tính không hiểu được ngữ nghĩa của DL. 2. Kiến trúc của WebNN Trong đó: -Unicode và URI: cơ sở để xây dựng các tài liệu -XML+NS+XMLschema: Công nghệ xây dựng tài liệu bán cấu trúc -RDF và RDFs: mô tả siêu DL trên WebNN -Ontology vocabulary: Mô tả các quan hệ cũng như các khái niệm trong miền ứng dụng. -Logic: Cơ sở để chuẩn hóa các khái niệm cho WebNN -Proof và Trust: Là các ứng dụng cao cấp mà WebNN muốn đạt đến cho Web hiện tại. Trong đó: -Unicode và URI: cơ sở để xây dựng các tài liệu -XML: công nghệ xây dựng tài liệu bán cấu trúc. -RDF: Chuẩn trao đổi siêu DL WebNN -Ontology (RDFs, OWL) và ngôn ngữ các luật: Mô tả các quan hệ cũng như các khái niệm trong miền ứng dụng và suy diễn của chúng. +SPARQL: ngôn ngữ truy vấn cho DL RDF và ontology -Đồng nhất về logic: cơ sở để chuẩn hóa các khái niệm cho WebNN -Proof và Trust: Là các ứng dụng cao cấp mà WebNN muốn đạt đến ho web hiện tại. -Tầng trên cùng: Giao diện người dùng và các ứng dụng. Giải thích chi tiết: Từ sơ đồ kiến trúc của Web ngữ nghĩa, ta thấy có bảy tầng kiến trúc. Trong đó, với hệ thống Web hiện tại (World Wide Web) là đang ở tầng thứ hai. Unicode: là một bảng mã chuẩn chung có đủ các ký tự để thống nhất sự giao tiếp trên tất cả các quốc gia, đáp ứng tính nhất quán toàn cầu của web. URI (Uniform Resource Identifier): là kí hiệu nhận dạng Web đơn giản. Cụ thể, nó là một xâu ngắn cho phép nhận dạng tài nguyên Web như: với các xâu bắt đầu với "http:" hoặc "ftp:" mà chúng ta thường thấy trên World Wide Web. Bất kỳ một người nào cũng có thể tạo một URI, và sở hữu chúng và chúng là một công nghệ cơ sở để xây dựng một hệ thống Web toàn cầu. Hệ thống World Wide Web được xây dựng trên chúng và bất kỳ cái gì mà có một URI thì được coi là "trên Web". URL (Uniform Resource Locator): là một dạng đặc biệt của URI, cụ thể nó là một địa chỉ trên mạng. (URI (Uniform Resource Identifier) có thể hiểu là một chuỗi định danh tài nguyên trên mạng. Mỗi một nguồn tài nguyên trên mạng sẽ có một địa chỉ duy nhất xác định nó, đó chính là URI. Một dạng thức quen thuộc của URI là URL (Uniform Resource Locator) được sử dụng để định danh một địa chỉ Web nào đó trên Internet. Nói theo cách khác, URI là sự mở rộng của URL.) RDF (Resource Description Framework): Khung mô tả tài nguyên - RDF được W3C giới thiệu để cung cấp một cú pháp chuẩn để tạo, thay đổi và sử dụng các chú thích trong Web ngữ nghĩa. Một mệnh đề RDF là một bộ ba có dạng: [chủđề thuộctính đốitượng]. Trong đó, chủ đề là tài nguyên mà được mô tả bằng thuộc tính và đối tượng. Thuộc tính thể hiện mối quan hệ giữa chủ đề và đối tượng. Còn đối tượng ở đây có thể là một tài nguyên hoặc một giá trị. Ba thành phần trên trong RDF đều là các URI. RDFS (RDF schema): RDFS là một ngôn ngữ ontology đơn giản của web ngữ nghĩa, được coi là một ngôn ngữ cơ sở của web ngữ nghĩa. RDFS là ngôn ngữ mô tả bộ từ vựng trên các bộ ba RDF. Nó cung cấp các công việc sau: - Định nghĩa các lớp tài nguyên - Định nghĩa các quan hệ giữa các lớp - Định nghĩa các loại thuộc tính mà các lớp trên có - Định nghĩa các mối quan hệ giữa các thuộc tính. Ontology Vocabulary: Bộ từ vựng ontology được xây dựng trên cơ sở tầng RDF và RDFS, cung cấp biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên web và có khả năng hỗ trợ lập luận. Để xây dựng được các bộ từ vựng này, người ta đã sử dụng các ngôn ngữ ontology để biểu diễn chúng như: RDFS, OIL, DAML, DAML+OIL, OWL, Các ngôn ngữ này cung cấp khả năng biểu diễn và hỗ trợ lập luận khác nhau và chúng dựa trên nền tảng là các ngôn ngữ logic mô tả tương ứng khác nhau. Tầng Logic: Việc biểu diễn các tài nguyên dưới dạng các bộ từ vựng ontology có mục đích là để máy có thể lập luận được. Mà cơ sở lập luận chủ yếu dựa vào logic. Chính vì vậy mà các ontology được ánh xạ sang logic, cụ thể là logic mô tả để có thể hỗ trợ lập luận. Vì logic mô tả có biểu diễn ngữ nghĩa hình thức (đặc trưng của lý thuyết mô hình), và cung cấp các dịch vụ lập luận, là cơ sở để hỗ trợ máy có thể lập luận và hiểu tài nguyên. Tầng Proof: Tầng này đưa ra các luật để suy luận. Cụ thể từ các thông tin đã có ta có thể suy ra các thông tin mới. Ví dụ: A là cha của B, A là em trai C thì khi đó ta có thông tin mới là C là bác của B. Để có được các suy luận này thì cơ sở là FOL (First-Order-Logic). Và tầng này hiện nay các nhà nghiên cứu đang xây dựng các ngôn ngữ luật cho nó như: SWRL, RuleML. Tầng Trust: Đảm bảo tính tin cậy của các ứng dụng trên Web ngữ nghĩa. Ví dụ: có một người bảo x là xanh, một người khác lại nói x không xanh, như thế Web ngữ nghĩa là không đáng tin cậy? Câu trả lời ở đây được xem xét trong các ngữ cảnh. Mỗi ứng dụng trên web ngữ nghĩa sẽ có một ngữ cảnh cụ thể, chính vì thế các mệnh đề trên có thể nằm trong các ngữ cảnh khác nhau khi đó ngữ nghĩa tương ứng khác nhau nên các mệnh đề đó vẫn đúng, đáng tin cậy trong ngữ cảnh của nó. Để có được sự chứng minh về độ tin cậy thì các lập luận được áp dụng là không đơn điệu và có các cơ chế kiểm tra chứng minh kết hợp với công nghệ chữ ký điện tử để xác nhận độ tin cậy. Các ngôn ngữ chứng minh là ngôn ngữ cho ta chứng minh một mệnh đề là đúng hay sai. 3. RDF (Resource Description Framework): Khung mô tả tả tài nguyên Khung mô tả tài nguyên (RDF) là một ngôn ngữ siêu dữ liệu để biểu diễn dữ liệu trên Web và cung cấp một mô hình để mô tả và tạo các mối quan hệ giữa các tài nguyên. RDF định nghĩa một nguồn tài nguyên (resource) như một đối tượng bất kỳ có khả năng xác định duy nhất bởi một URI. Các nguồn tài nguyên có các thuộc tính đi kèm. Các thuộc tính (predicate/property) được xác định bởi các kiểu thuộc tính và các kiểu thuộc tính có các giá trị tương ứng. Kiểu thuộc tính biểu diễn các mối quan hệ của các giá trị được kết hợp với các tài nguyên. Mô hình dữ liệu của RDF là các bộ ba (triple) gồm: <Chủ thể, Thuộc-tính, Đối tường> • Chủ-thể (Subject): được xác định bởi URI cụ thể. • Thuộc-tính (Predicate): thuộc tính của siêu dữ liệu, cũng được xác định bởi một URI. • Đối-tượng (Object): giá trị của thuộc tính, có thể là một giá trị (literal) hoặc một URI. Ví dụ: Dữ liệu về tên họ của một cá nhân có mã số (ID) xác định RDF mô tả siêu dữ liệu về các tài nguyên trên Web. RDF dựa trên cú pháp XML tuy nhiên XML chỉ mô tả dữ liệu, RDF còn có khả năng biểu diễn ngữ nghĩa giữa chúng thông qua các tài nguyên được định danh bằng URI. Ở kỳ này chúng ta sẽ có một cái nhìn cụ thể và bao quát hơn về RDF. Thông tin và tri thức trên web ngữ nghĩa sử dụng liên kết URIs và RDF. Giống như web của văn bản, web của dữ liệu được xây dựng dựa trên các tài liệu trên web. Tuy nhiên, không giống web của văn bản, các liên kết là quan trên văn bản biểu diễn dưới dạng HTML, web của dữ liệu liên kết các “thực thể được đặt tên” thông qua RDF. URIs xác định các loại đối tượng và khái niệm. RDF chính là nền tảng trung tâm của web ngữ nghĩa. Trong khi XML cung cấp cú pháp để mã hóa dữ liệu thì RDF mô tả siêu dữ liệu về các tài nguyên trên Web. RDF dựa trên cú pháp XML tuy nhiên XML chỉ mô tả dữ liệu, RDF còn có khả năng biểu diễn ngữ nghĩa giữa chúng thông qua các tài nguyên định danh bằng URI. *Nguyên lý: Tim Berners- Lee tóm tắt 4 nguyên lý nền tảng cho hoạt động của dữ liệu liên kết (Linked Data) trong bài báo “Design Issues: Linked Data” (2006): - Sử dụng các URIs để xác định, “đặt tên” các “thực thể” - Sử dụng giao thức HTTP URI để con người có thể tìm kiếm, duyệt chúng - Cung cấp thông tin hữu ích ( siêu dữ liệu, mô tả có cấu trúc) về các “thực thể được đặt tên” đó khi URI của chúng được duyệt - Chứa các liên kết đến các URIs khác liên quan trong dữ liệu vừa được duyệt giúp có thể duyệt các thông tin khác liên quan. Hiện tại có các định dạng cú pháp tuần tự hóa để cài đặt dữ liệu liên kết, chú thích ngữ nghĩa như RDF, RDFa, RDF/XML, N3, Turtle RDF - Resource Description Framework, định dạng dữ liệu cho phép mô tả thực thể, tài nguyên và quan hệ nội tại giữa chúng bằng bộ ba đối tượng – thuộc tính – giá trị ( subject – predicate – object). RDFa (RDF – in – attributes) bổ sung tập các thuộc tính mở rộng cho XHTML để nhúng siêu dữ liệu trong văn bản web. N3 (Notation3): cú pháp phi XML của RDF, được thiết kế dễ đọc hơn so với các chú thích RDF/XML. Turtle (Terse RDF Triple Language) định dạng tuần tự hóa cho các đồ thị RDF, tập con của N3. Ví dụ: Mô hình RDF được chú thích bằng XML chuẩn 3.1. Mô hình RDF 3.1.1. Namespace và Qualified name: Namespace là một tập các tên( name) , được định danh bởi các URI, được sử dụng trong các tài liệu XML như các element type và attribute name. Một namespace được khai báo sử dụng một tập các thuộc tính có đã được định nghĩa. Tên của một thuộc tính phải có xmlns hay xmlns: như là một tiếp đầu ngữ. Cách khai báo một namespace: NSAttName ::= PrefixedAttName | DefaultAttName PrefixedAttName ::= 'xmlns:' NCName DefaultAttName ::= 'xmlns' NCName ::= (Letter | '_') (NCNameChar)* NCNameChar ::= Letter | Digit | '.' | '-' | '_' | CombiningChar | Extender Qualified name (QName) bao gồm một tiếp đầu ngữ đã được gán trước đó bởi một URI theo sau là dấu ‘:’ và tên cục bộ. - Cách định nghĩa một QName QName::= (Prefix ':')? LocalPart Prefix::= NCName LocalPart::= NCName - Cách dùng QName đối với kiểu dữ liệu là element STag::= '<' QName (S Attribute)* S?'>’ ETag::= '</' QName S? '>' EmptyElemTag::= '<' QName (S Attribute)* S?'/>' 3.1.2. Bộ ba RDF (RDF triple) Mô hình cơ bản của RDF gồm ba bộ phận sau: - Tài nguyên (Resources) là tất cả những gì được mô tả bằng biểu thức RDF - Thuộc tính (Properties) là đặc tính hay quan hệ mô tả tính chất tài nguyên - Phát biểu (Statements) mỗi phát biểu gồm ba thành phần sau + Subject (chủ thể): địa chỉ hay vị trí tài nguyên muốn mô tả. + Predicate (thuộc tính): xác định tính chất của tài nguyên. + Object (đối tượng): nội dung gán cho thuộc tính. Mỗi một mệnh đề (subject, predicate, object) còn gọi là một bộ ba (triple). Ví dụ: Xét mệnh đề 1 Le Van Son works for Semantic Groups Mệnh đề 2: “Le Van Son was born in 1948” Mệnh đề 3: “Semantic Group is headquartered in Da Nang” Các bộ ba liên kết với nhau tạo thành đồ thị RDF Tập các triple hợp lại tạo thành đồ thị RDF (RDF Graph). Các node trong đồ thị có thể là các subject và object trong triple và các cung (arc) trong đồ thị là các predicate. Nên một triple còn có thể được mô tả dưới dạng node-arc-node. Hướng của đồ thị rất quan trọng, cung của đồ thị luôn bắt đầu từ subject đến object. 3.1.3. Literal Literal được sử dụng để biểu diễn các giá trị như con số, ngày tháng, chuỗi Bất cứ cái gì có thể biểu diễn bởi một giá tri Literal cũng có thể được biểu diễn dưới dạng một URI. Một Literal có thể là object của một phát biểu nhưng không thể là subject hay là predicate. Literal có hai kiểu sau: plain literal hay là typed literal. - plain literal là một chuỗi được kết hợp với một tag tùy ý. Trong ngôn ngữ tự nhiên ta có thể gọi nó là một kiểu text. - typed literal hình thành bằng cách kết hợp một chuỗi với định danh URI để biểu diễm kiểu dữ liệu đặc biệt nào nó. Kết quả trả về là một node trong đồ thị tương tự như kiểu literal. Kiểu giá trị được biểu diễn bằng typed literal sẽ được ánh xạ đến kiểu giá trị đặc biệt mà ta đã khai báo thông qua URI. 3.1.4 Kiểu dữ liệu có cấu trúc và Blank node Hầu hết các dữ liệu trên Web đều liên quan đến các cấu trúc phức tạp.Trong ví dụ trên ngày của trang web được tạo ra được khai báo bởi thuộc tính exterms:creationdate, với một kiểu dữ liệu là plain literal. Các mệnh đề RDF (bao gồm các cung và node) sau đó sẽ được biểu diễn ra trong đồ thị với node mới vừa tạo là subject. Xét đồ thị sau: Có thể viết dưới dạng tripple như sau: exstaff:85740 exterms:address exaddressid:85740 . exaddressid:85740 exterms:street "1501 Grant Avenue" . exaddressid:85740 exterms:city "Bedford" . exaddressid:85740 exterms:state "Massachusetts" . exaddressid:85740 exterms:postalCode "01730" . Cách biểu diễn thông tin có cấu trúc như vậy đòi hỏi phải có một địa chỉ URI exaddressid:85740 để mô tả khái niệm kết hợp( địa chỉ của Mr Joe). Những khái niệm như thế này có thể không được sử dụng bởi các thành phần khác trong đồ thị và chính vì vậy định danh này không cần thiết. Chính vì vậy ta nên dùng một node trống (blank node) để biểu diễn node này. Và có thể mô tả dưới dạng tripple như sau: exstaff:85740 exterms:address ??? . ??? exterms:street "1501 Grant Avenue" . ??? exterms:city "Bedford" . ??? exterms:state "Massachusetts" . ??? exterms:postalCode "01730" . ??? để chỉ sự hiện diện của blank node. Trong trường hợp đồ thị sử dụng nhiều blank node, để phân biệt các blank node ta dùng một định danh (blank node identifiers), có dạng _:name, để chỉ sự hiện diện của một blank node. Ví dụ như, trong ví dụ này định danh _:joeaddress được sử dụng để chỉ blank node (là địa chỉ của Mr Joe). Viết lại tripple sau: exstaff:85740 exterms:address _:joeaddress . _:johnaddress exterms:street "1501 Grant Avenue" . _:johnaddress exterms:city "Bedford" . _:johnaddress exterms:state "Massachusetts" . _:johnaddress exterms:postalCode "01730" . 3.2. Cấu trúc RDF/XML Mô hình RDF thể hiện một mô hình ở mức trừu tượng để định nghĩa metadata. Cú pháp RDF được dùng để tạo ra và trao đổi metadata. RDF dựa trên cú pháp XML. Cú pháp cơ bản của RDF có dạng như sau: [1] RDF ::= ['<rdf:RDF>'] description* ['</rdf:RDF>'] [2] description ::= '<rdf:Description' idAboutAttr? '>' propertyElt* '</rdf:Description>' [3] idAboutAttr ::= idAttr | aboutAttr [4] aboutAttr ::= 'about="' URI-reference '"' [5] idAttr ::= 'ID="' IDsymbol '"' [6] propertyElt ::= '<' propName '>' value '</' propName '>'| '<' propName resourceAttr '/>' [7] propName ::= Qname [8] value ::= description | string [9] resourceAttr ::= 'resource="'tham chiếu URI'"' [10] Qname ::= [ NSprefix ':' ] name [11] URI-reference ::= string, interpreted per [URI] [12] IDsymbol ::= (bất kỳ ID nào hợp lệ nào của XML) [13] name ::= (bất kỳ tên hợp lệ nào của XML) [14] NSprefix ::= (bất kỳ tiếp đầu ngữ namespace hợp lệ nào) [15] string ::= (bất kỳ chuỗi nào) Ví dụ : Xét phát biểu ex:index.html exterms:creation-date "August 16, 1999" . Cú pháp RDF/XML để biểu diễn cho phát biểu trên như sau: 1. <?xml version="1.0"?> 2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 3. xmlns:exterms="http://www.example.org/terms/"> 4. <rdf:Description rdf:about="http://www.example.org/index.html"> 5. <exterms:creation-date>August 16, 1999</exterms:creation-date> 6. </rdf:Description> 7. </rdf:RDF> Trong đó: Dòng 1: là khai báo XML, cho biết nội dung theo sau dựa trên cú pháp XML và phiên bản XML được dùng. Dòng 2 và 3: bắt đầu với thẻ rdf:RDF , cho biết rằng nội dung XML tiếp theo mô tả RDF. Từ khóa này xác định tài liệu này được biểu diễn dưới dạng RDF. Tiếp theo là phần khai báo XML namespace được sử dụng trong tài liệu, tùy vào nhu cầu và mục đích sử dụng mà ta có thể dùng các namespace khác nhau cho từng tài liệu. Dòng 4, 5, 6: mô tả những mệnh đề RDF. Để mô tả bất kỳ phát biểu nào dạng RDF/XML có thể dùng rdf:Description, và rdf:about , đây chính là subject của phát biểu. Thẻ bắt đầu rdf:Description trong dòng 4 cho biết bắt đầu mô tả về một resource, và tiếp tục định danh resource này dùng thuộc tính rdf:about để chỉ ra URI của subject resource. Dòng 5 cung cấp 1 phần tử thuộc tính, với Qname exterms:creation-date như là thẻ của nó. Nội dung của phần tử thuộc tính này là object của statement, có giá trị là kiểu plain literal “August 19, 1999 “. Dòng 7: cho biết kết thúc của thẻ rdf:RDF bắt đầu ở dòng 2 và cũng là thẻ kết thúc của tài liệu RDF 3.3. RDF Container [...]... vụ web ngữ nghĩa (Semantic Web Services); • Biểu diễn tri thức cho các dịch vụ web ngữ nghĩa; • Ngữ nghĩa cho sự ủy thác dịch vụ và kết hợp tri thức 8 Các ứng dụng của Web ngữ nghĩa WebNN cho phép các ứng dụng làm cầu nối giữa những nhu cầu của người sử dụng và các tài nguyên thông tin sẵn có Điều này sẽ thiết lập một cơ sở cho việc phát triển các ứng dụng Trong thời gian gần đây, các tiếp cận WebNN... RDF chứ thông tin vẫn chưa thể hiện gì về mặt ngữ nghĩa Bởi vậy, xây dựng RDFS là điều cần thiết để hình thành nên ngữ nghĩa cho thông tin, là cơ sở để xây dựng các công cụ tìm kiếm ngữ nghĩa RDFS và RDF có mối liên hệ tương đối gần gũi nên đôi lúc ta gọi ngôn ngữ này là RDF/RDFS RDFs: • Cho biết DL được mô tả trên RDF được diễn dịch như thế nào • Định nghĩa từ vựng cho RDF • Tổ chức từ vựng dưới dạng... trong lĩnh vực Web ngữ nghĩa 5 Ngôn ngữ Ontology 5.1 RDFschema RDF: mô tả các nguồn tài nguyên bằng các lớp, các thuộc tính và các giá trị, cung cấp tính liên thông giữa các ứng dụng Tuy nhiên, chúng ta cần phải định nghĩa các lớp và các thuộc tính trong các ứng dụng chuyên biệt Để làm được điều này, chúng ta sẽ phải sử dụng một phiên bản mở rộng của RDF, gọi là RDFS hay RDF Schema Ngôn ngữ RDF chỉ giúp... phục những hạn chế về kiểu dữ liệu trong các ngôn ngữ Ontology trước đó là RDF, RDFS DAML + OIL (gọi tắt là DAML) là ngôn ngữ đánh dấu cho các tài nguyên trên Web, có hỗ trợ suy luận Ngôn ngữ này được xây dựng có kế thừa từ các chuẩn của W3C như XML, RDF, RDFS, Một số điểm đáng chú ý của ngôn ngữ này là: • Cho phép giới hạn các kiểu dữ liệu được định nghĩa trong XML Schema hay bởi người dùng Trong DAML,... UMLS trong lĩnh vực mạng ngữ nghĩa, GO (Gene Ontology), WordNet (đại học Princeton) Bước 3, Liệt kê các thuật ngữ quan trọng trong Ontology: Đây là bước rất ích hữu, làm tiền đề cho hai bước tiếp theo là xây dựng cấu trúc lớp phân cấp và định nghĩa các thuộc tính cho lớp Công đoạn này bắt đầu bằng việc liệt kê tất cả các thuật ngữ xuất hiện trong miền quan tâm (có thể đồng nghĩa hoặc chồng nhau) như... các ứng dụng dựa trên ngữ nghĩa đầu tiên đã được cài đặt thành công và rất nhiều các ứng dụng nữa đang được phát triển Do miền ứng dụng rộng của WebNN, nên ta có thể có được rất nhiều các ca sử dụng của WebNN cho các lĩnh vực khác nhau Hầu hết các nhà nghiên cứu WebNN đều có chung một thoả thuận ngầm với nhau để tránh nhắc đến những điều thuộc về trí tuệ nhân tạo (TTNT) Dù rằng WebNN có thể rơi vào... tính desktop (semantic desktop) theo một cách có thể truy nhập dễ dàng và hiệu quả • Tích hợp các dịch vụ web ngữ nghĩa vào các ứng dụng thường được sử dụng (các trình thư điện tử, các trình duyệt web, ) để cung cấp nhiều hơn tính hoạt động liên thông trên web cũng như giữa các ứng dụng • Ứng dụng WebNN vào thương mại điện tử, đặc biệt là các nghiên cứu liên quan đến Quản lý tiến trình nghiệp vụ (Business... ngành và do đó chỉ sử dụng để lưu trữ các dạng sự kiện đặc thù hoặc trả lời cho những loại câu hỏi cụ thể Nếu định nghĩa của dạng quan hệ được chứa trong một 4.2 Vai trò cua ontogogy Với ý nghĩa và cấu trúc như trên, Ontology đã trở thành một công cụ quan trọng trong lĩnh vực Web ngữ nghĩa Có thể kể ra một số lợi ích của Ontology như: Để chia sẻ những hiểu hiểu biết chung về các khái niệm, cấu trúc... phép định nghĩa thuộc tính unique để xác định các đối tượng • Cho phép mô tả các quan hệ như hoán đổi và bắc cầu DAML sau đó tiếp tục trở thành nền tảng cho một ngôn ngữ Ontology khác là OWL DAML về cơ bản rất giống với OWL (ngoại trừ tên một số ít thuật ngữ, cú pháp được sửa đổi), tuy nhiên khả năng mô tả các ràng buộc kém hơn Theo thống kê, đã có khoảng 5 triệu phát biểu DAML từ hơn 20,000 Website... http://smiprotege.stanford.edu/repos/protege/owl/trunk Hiện tại, Protégé đã có phiên bản 3.4 Phiên bản Beta 4.0 đang được phát triển và thử nghiệm song song bởi sự hợp tác giữa CO-ODE (Cooperative Ontologies Programme) và đại học Stanford Các ưu điểm của Protégé là: • Hỗ trợ đầy đủ ba phiên bản của ngôn ngữ OWL là OWL-Full, OWL-Lite và OWL-DL • Nhờ sử dụng mô hình hướng đối tượng của ngôn ngữ Java, Protégé tỏ ra rất hiệu quả trong việc . chung thao tác chủ yếu là thao tác trên nội dung thấy được. Quan trọng là máy tính không hiểu được ngữ nghĩa của DL. 2. Kiến trúc của WebNN Trong đó: -Unicode và URI: cơ sở để xây dựng các tài liệu -XML+NS+XMLschema:. trên WebNN -Ontology vocabulary: Mô tả các quan hệ cũng như các khái niệm trong miền ứng dụng. -Logic: Cơ sở để chuẩn hóa các khái niệm cho WebNN -Proof và Trust: Là các ứng dụng cao cấp mà WebNN. lĩnh vực khoa học máy tính và có ý nghĩa khác xa so với nghĩa ban đầu của nó. Ontology được xem như là “linh hồn” của WebNN. Chúng giúp con người và máy có thể hợp tác, cùng nhau làm việc, giúp máy

Ngày đăng: 07/08/2014, 23:24

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w