1. Trang chủ
  2. » Luận Văn - Báo Cáo

Giới thiệu Ontology trong Semantic Web

21 438 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 227,85 KB

Nội dung

Giới thiệuĐể hiểu được nguyên tắc của Semantic Web và kỹ thuật biểu diễn dữ liệu quan trọng là biết về các khái niệm về giao tiếp của con người.Trong một cuộc trò chuyện, một người nói s

Trang 1

MỤC LỤC

Trang 2

LỜI NÓI ĐẦU

Chúng em xin chân thành cảm ơn PGS.TS Đỗ Văn Nhơn đã truyền đạt những

kiến thức quý báu từ những kinh nghiệm sống đến những vấn đề khoa học mới nhất trong bộ môn Biểu diễn tri thức và ứng dụng

Trong bài tiểu luận này, em xin trình bày các công nghệ biểu diễn tri thức trong Web ngữ nghĩa Web ngữ nghĩa là thế hệ Web mới, đang được phát triển và sẽ xuất hiện trong tương lai gần Hệ thống Web mới này sẽ dần thay thế Web hiện tại song không có nghĩa là hoàn toàn khác hệ thống Web hiện tại Web ngữ nghĩa được phát triển trên hệ thống Web hiện tại bằng cách bổ sung thêm ngữ nghĩa cho các tài nguyên Web mà máy tính có thể hiểu và tăng khả năng xử lý tự động

Dù đã cố gắng hết sức, song do trình độ còn hạn chế nên khó tránh khỏi những thiếu sót Rất mong nhận được sự thông cảm và góp ý của thầy cô và các bạn

Trang 3

1 Giới thiệu

Để hiểu được nguyên tắc của Semantic Web và kỹ thuật biểu diễn dữ liệu quan trọng là biết về các khái niệm về giao tiếp của con người.Trong một cuộc trò chuyện, một người nói sẽ gửi cú pháp, mà là một sự kết hợp của các ký hiệu ra lệnh như từ và dấu chấm câu, một hoặc nhiều kiểm toán viên đọc biểu lộ của một câu.Các kiểm toán viên nhận được những biểu tượng và cố gắng để hiểu ý nghĩa của chúng.Giải thích được hỗ trợ bởi một số yếu tố môi trường, ví dụ như các cuộc hội thoại trước đó, vị trí,

cử chỉ và biểu hiện trên khuôn mặt của người nói.Trong lý thuyết truyền thông biểu lộ trong những biểu tượng được gọi là ngữ nghĩa và giải thích được gọi là ngữ dụng.Bối cảnh bao gồm các chủ đề truyền thông cụ thể và làm thế nào nó có liên quan đến các thuật ngữ khác

Dạy một máy tính để hiểu dữ liệu là một chủ đề rất phức tạp của Trí tuệ nhân tạo Để kích hoạt các quá trình đàm thoại cho các máy chúng ta phải thích ứng với khái niệm của lý thuyết truyền thông bằng cách định nghĩa một cú pháp mà có thể đọc được tất cả các máy tính, làm cho kiến thức về đối tượng quan tâm có thể truy cập, và phát triển phần mềm đó là có khả năng phân giải và sử dụng những kiến thức đã được định nghĩa

2 Giới thiệu về Web ngữ nghĩa

2.1 Web 3.0

Web ngữ nghĩa (Semantic Web) còn được gọi là Web 3.0, đã được mô tả bởi Tim Berners-Lee 1 trong trang Web, trong đó máy tính có khả năng phân tích tất cả dữ liệu nội dung của nó, liên kết và giao tiếp giữa con người và máy tính Tim Berners-Lee hình dung ra các bộ máy giao tiếp trong nhau với hành vi thông minh

1 Tim Berners-Lee là giám đốc của công ty World Wide Web Consortium (W3C) và là người sáng lập World Wide Web

Trang 4

Nói một cách đơn giản, làm theo phương pháp của Semantic Web sẽ cho phép chúng ta lưu trữ kiến thức về nội dung web trong một hình thức có cấu trúc Một ví dụ minh họa được đưa ra dưới đây.

Trên một máy chủ của một trường đại học, một tài liệu có thể chứa thông tin về cách hệ thống cấp bậc đại học được tổ chức, ví dụ như phân loại trong trường đại học, hiệu trưởng, bộ phận, trưởng bộ phận, giảng viên và học sinh Một đại diện của mô hình này có thể là Đại học khoa học ứng dụng Salzburg, Tiến sĩ Erhard Busek, bộ phận quản lý Công nghệ thông tin và hệ thống, FH-Prof DI Dr Thomas Heistracher, DI Dietmar Glachs và Stephanie Stroka Hơn nữa, các phân loại có liên quan lẫn nhau Ví

dụ, một giáo viên giảng viên dạy một hoặc nhiều học sinh Vị từ Dạy hình thành một mối quan hệ giữa một giảng viên môn học và một đối tượng học sinh Người ta thường nói rằng một vị từ là một thuộc tính của chủ ngữ Các mối quan hệ đó cũng được tuân theo trong tài liệu Với định nghĩa các luật suy luận về một thuọc tính, nó cũng có thể

để xây dựng các kết nối mới, ví dụ như nếu sinh viên Stephanie Stroka nghiên cứu Công nghệ thông tin & Quản lý hệ thống và FH-Prof DI Dr Thomas Heistracher, người làm việc tại Đại học Khoa học ứng dụng Salzburg, là người đứng đầu bộ phận công nghệ thông tin và quản lý hệ thống, chúng ta có thể suy luận rằng Stephanie Stroka nghiên cứu tại Đại học Salzburg Kể từ khi thực hiện các chủ ngữ, vị từ và đối tượng trong Web ngữ nghĩa được định nghĩa là các định danh tài nguyên thống nhất (URI- Uniform Resource Identifiers), nó có thể so sánh các URI với các URI từ các tài liệu web ngữ nghĩa khác, để suy ra rằng các thực thể đều bằng nhau Do đó, sẽ có thể cho nguyên nhân mà Stephanie Stroka, người có trang web http://www.steffi.com, thực

sự tương đồng với sinh viên Stroka Stephanie, người học môn Công nghệ thông tin & Quản lý hệ thống quản lý tại trường Đại học Khoa học ứng dụng Salzburg

Hơn nữa, vì thế nó được gọi là các tác nhân phần mềm, là các ứng dụng tự động, khám phá và sửa đổi một môi trường nhất định (ví dụ như World Wide Web) có thể thu thập các dữ liệu ngữ nghĩa, suy luận về nó, xây dựng một mô hình mới không gian của thế giới, và do đó, có thể kết luận giao dịch hoặc để hiển thị nội dung yêu cầu

Trang 5

Web 3.0 là một phần mở rộng của Web hiện tại và ngữ nghĩa của nó được mã hóa vào các trang web mà làm cho chúng trong suốt trong sử dụng bình thường Một mặt, đây là một lợi thế cho người sử dụng bình thường, vì điều này không đòi hỏi phải học kiểu mới để làm quen với các trang web Mặt khác, nó cũng có thể là một bất lợi,

sẽ được trình bày trong chương tiếp theo

2.2 Các phản ứng nghi ngờ

Một yếu tố quan trọng về lý do tại sao Semantic Web vẫn không được phổ biến rộng rãi, đó là do rất nhiều công ty không nhìn thấy lợi ích của nó Họ cho rằng một khai báo từ khoá khác biệt được mã hóa thành các trang HTML (HyperText Markup Language) là đầy đủ Một mặt, họ không quan tâm đến người dùng web đến trang web của họ tìm kiếm một cái gì đó hoàn toàn khác nhau, mặt khác họ không biết rằng người dùng khác, những người sẽ là khách hàng tiềm năng, có thể không tìm thấy trang web của họ

Họ cũng cho rằng Lợi tức đầu tư (ROI – Return of Investment) không đủ hiệu quả, do đó, họ sợ chi tiền cho một công nghệ mà chưa từng được sử dụng và đạt được cái mà có thể chưa được chứng minh Đối với các công ty có chia sẻ kiến thức của họ đối với các chi nhánh phân phối, một tiêu chí lớn khác là sự riêng tư, bởi vì không có biện pháp phòng ngừa nhất định nào để ngăn cản việc đánh cắp dữ liệu kiến thức từ các tác nhân phần mềm hoặc con người

Web ngữ nghĩa được xây dựng trên ngôn ngữ eXtensible Markup Language (XML), nền tảng Resource Description Framework (RDF), Ontology và các luật web Đối phó với vấn đề an ninh, rõ ràng là, ngoài việc bảo mật trong các lớp bên dưới ứng dụng, chúng ta cần phải sử dụng bảo mật XML, bảo mật RDF, bảo mật Ontology và bảo mật các luật Web để đảm bảo sự riêng tư trong Web ngữ nghĩa

Để khắc phục những nghi ngờ đổi mới công ty, phải áp dụng công nghệ mới này

để khẳng định rằng sự hoài nghi là độc đoán Trong phần tiếp theo, chúng ta sẽ làm quen với một số lý do cho Web ngữ nghĩa

Trang 6

2.3 Lý do cho Semantic Web

Chúng ta có thêm nhiều thông tin trên Internet thì càng khó khăn hơn để tìm về hình thức của nội dung cụ thể Việc tìm kiếm đơn giản từ các từ khóa là không đủ nữa

là do khai báo từ khóa không chính xác, không đầy đủ và không rõ ràng đang tồn tại trong ngôn ngữ tự nhiên của chúng ta Ý nghĩa của Semantic Web là để mang lại cấu trúc trong sự hỗn loạn thông tin và để ngăn chặn tình trạng quá tải thông tin để nó sẽ trở thành hình thức của nội dung cụ thể

Ngoài ra, hệ thống Stovepipe, đó là hệ thống lỗi thời (legacy system) được sản xuất và phát triển để giải quyết một vấn đề cụ thể, có thể tạo thành từ các vấn đề trong môi trường phân tán Để sửa đổi và duy trì thông tin liên lạc được mã hóa cứng thường tốn thời gian, tốn kém và đôi khi không tốt Với việc thích nghi sử dụng ngôn ngữ biểu diễn tri thức (Knowledge representing), việc thay đổi và duy trì hệ thống trở nên khả thi

Tiềm năng thực hiện Semantic Web là một nền tảng trực tuyến đặc biệt cho việc quản lý kiến thức trong các tổ chức Nó trở thành có thể để tạo ra, cá nhân hóa, đại diện

và phân phối các kiến thức cho các chi nhánh kinh doanh đối với các nhu cầu cá nhân của họ

2.4 Sử dụng kỹ thuật Semantic Web

Trong hình 1, chúng ta thấy Semantic Web được phân lớp như thế nào Ở phía dưới có chỉ định hình thức mà thường được đại diện bởi một URI hoặc một chuỗi định danh tài nguyên quốc tế (IRI - InternationalizedResource Identifier)

Tiếp theo đó, một cú pháp và một cấu trúc phải được xác định XML, XMLs và RDF thường là các công nghệ được sử dụng Các Ontology là khái niệm cốt lõi của Biểu diễn tri thức trong Semantic Web RDFS và OWL là ngôn ngữ mà có thể sản xuất các mô hình như vậy

Trang 7

Lớp logic cho phép các phần mềm suy luận về các dữ liệu được biểu diễn, bao gồm các ontology, các truy vấn và các quy tắc.

Cơ chế bảo mật nên được sử dụng trên tất cả các lớp công nghệ

Hình 1: Một phiên bản trừu tượng của các lớp bánh Semantic Web

Để tạo ra một biểu diễn tri thức được hiện diện trực tuyến, chúng ta phải xây dựng một mô hình của thế giới không gian tương tự như những gì chúng ta đã thấy trong ví dụ về cấu trúc trường đại học Đơn giản hóa, chúng ta phải xây dựng các mối quan hệ giữa các thuật ngữ hoặc các lớp Khái niệm về xây dựng một mô hình khả thi này được giải thích trong chương sau

3 Ontology

3.1 Giới thiệu Ontology trong Semantic Web

Ý tưởng chung đằng sau các ontology là làm cho tri thức rõ ràng bằng cách diễn đạt các khái niệm và các mối quan hệ của chúng

Trang 8

Nói cách khác, ontology xác định các từ và nội dung phổ biến được sử dụng để

mô tả và biểu diễn một vùng tri thức hoặc tập hợp của thông tin về dữ liệu và dữ liệu

có liên quan thế nào Như vậy, ontology cung cấp các phương tiện cho việc thiết lập một cấu trúc có ngữ nghĩa Đề cập đến các lý thuyết về thông tin liên lạc, ontology sẽ đại diện cho bối cảnh các thuật ngữ

Trong Semantic Web, ontology là bán cấu trúc và đại diện cho một thế giới mở,

có nghĩa là mô hình có thể phát triển với các dữ liệu và một ontology không chứa tất cả các thực thể thế giới hiện thực Một mô hình ontology có thể sáp nhập với một mô hình ontology khác Như vậy, các ontology trong Semantic Web là từng phần và mô-đun hóa

Khi chúng ta nói về ontology, chúng ta phân biệt giữa sự phong phú ngữ nghĩa của các loại khác nhau Trong hình 2, chúng ta có thể nhìn thấy các loại phổ biến của các ontology, bắt đầu ở dưới cùng bên trái nơi mà ngữ nghĩa đơn giản và yếu, đi tiếp lên phía trên bên phải nơi mà ngữ nghĩa phức tạp hơn và dữ liệu được suy ra có logic

Hình 2: Hình phổ của OntologyCác phần tiếp theo sẽ giới thiệu về các loại hình cụ thể của Ontology

Trang 9

3.2 Phép phân loại tư duy

Phép phân loại (taxonomy) là một phương pháp để phân lớp hoặc phân loại một tập hợp các thuật ngữ trong một cấu trúc phân cấp Nói chung, đó là nghiên cứu về các nguyên tắc chung của việc phân lớp khoa học (scientific classification).Khi chúng ta lắp định nghĩa này với lĩnh vực công nghệ thông tin, chúng ta có thể nói rằng một phép phân loại là việc phân lớp của các đơn vị thông tin trong các hình thức của một hệ thống phân cấp, coi như là mối quan hệ của các đối tượng trong thế giới thực mà chúng biểu diễn

Một phép phân loại tư duy, nói chung, là ngữ nghĩa yếu, bởi vì nó không thể hiện ý nghĩa phong phú và không phân biệt giữa các mối quan hệ gộp lại và giữa các mối quan hệ khái quát hóa / chuyên môn hóa Một ví dụ về phân loại một phần được đưa ra trong hình 3

Hình 3: Một phép phân loại tư duy có quan hệ tập hợp và khái quát hóa/chuyên

môn hóa

Trang 10

3.3 Bộ từ điển đồng nghĩa

Bộ từ diển đồng nghĩa (Thesauri) định nghĩa mối quan hệ giữa các từ và cụm từ

có cấu trúc trong một taxonomy Một số ví dụ về các mối quan hệ sẽ là từ đồng nghĩa,

từ đồng âm, hẹp hơn và rộng hơn so với các mối quan hệ

Từ đồng âm mô tả hai hay nhiều từ âm giống nhau với ý nghĩa khác nhau, trong khi từ đồng nghĩa là những từ âm khác nhau với cùng một ý nghĩa Quan hệ là hẹp hơn

và rộng hơn so với mối quan hệ giữa cha mẹ và con một tiểu phân lớp classification), mà là hẹp hơn so với tuyên bố rằng chủ đề là cụ thể hơn so với các đối tượng và ngược lại cho là rộng hơn (xem hình 4)

(sub-Hình 4: Ví dụ về mối quan hệ trong từ điển đồng nghĩa

3.4 Mô hình khái niệm

Mô hình khái niệm phổ biến trong các cơ sở dữ liệu hoặc ứng dụng mô hình Các ngôn ngữ UML (Unified Modeling Language) là một mô hình khái niệm phổ biến trong công nghệ phần mềm Hình 5 cho thấy một ví dụ về một sơ đồ UML

Trang 11

Hình 5: Một ví dụ về mô hình lớp trong UML

3.5 Các lý thuyết logic

Các lý thuyết logic được xây dựng trên các tiên đề hoặc báo cáo được định nghĩa trong một cơ sở tri thức và các quy tắc suy luận cùng nhau được sử dụng để chứng minh định lý về miền Với bằng chứng này, nó có thể tạo ra tri thức mới

Một lợi ích thực tế của việc sử dụng các lý thuyết logic là không phải tất cả các mối quan hệ trong một ontology đã được định nghĩa Nói cách khác, với các quy tắc và

cơ sở tri thức đó có thể suy ra mối quan hệ mới Một ví dụ đã được đưa ra ở phần trên, kết luận suy ra rằng một sinh viên Stephanie Stroka học tại Đại học Khoa học ứng dụng Salzburg khi cô học bộ môn công nghệ thông tin & quản lý hệ thống, trong đó có FH-Prof DI Dr Thomas Heistracher là người đứng đầu bộ phận và khi FH-Prof DI Dr Thomas Heistracher làm việc tại Đại học khoa học ứng dụng Salzburg

Trang 12

Một lợi thế khác là chúng ta không cần phải xây dựng một ontology duy nhất, hoàn chỉnh, gần với thế giới, nhưng chúng ta có nhiều ontology không gian có thể được sáp nhập bằng cách suy luận rằng nếu các thành phần ontology đều như nhau Đây là một yêu cầu cơ bản cho các ontology trải rộng trên một mạng lưới lớn như World Wide Web.

Do thực tế rằng các trạng thái lý thuyết logic về tính chính xác của các tiên đề, các phần mềm có thể xử lý các giao dịch dựa trên các yêu cầu được định nghĩa trước của những người mua giao dịch Ví dụ, trong một tình huống đặt kỳ nghỉ, người mua

có mong muốn cụ thể về điểm đến, thời gian nghỉ, các chuyến bay, khách sạn, v v Một ứng dụng dựa trên lý thuyết logic có thể suy ra nếu một lời đề nghị kỳ nghỉ có hay không phù hợp với những ham muốn này

Trong lý thuyết logic, Semantic Web có thể được xây dựng bởi các phần mềm

mà có được tri thức từ siêu dữ liệu (meta-data) được lưu trữ trong các tài liệu biểu diễn tri thức web

4 Các kỹ thuật biểu diễn tri thức

4.1 Giới thiệu về Biểu diễn tri thức

Biểu diễn tri thức là một nhánh của trí tuệ nhân tạo, cung cấp truy cập vào một tập cấu trúc của thông tin và một tập hợp các quy tắc suy luận Thông tin và các quy tắc đó có thể được sử dụng cho lý luận tự động, ví dụ như với giúp đỡ của các tác nhân phần mềm

Trong phần này, chúng ta sẽ có một giới thiệu về các ngôn ngữ đánh dấu (markup language) được sử dụng để biểu diễn tri thức

Trang 13

4.2 Ngôn ngữ để biểu diễn tri thức

4.2.1 XML và XMLS

Như đã nói trong phần giới thiệu, chúng ta cần một cú pháp để trao đổi tin trong một tình huống giao tiếp Ngôn ngữ XML và XML validation document XML Schema (XMLS) được sử dụng để thêm cấu trúc tùy ý vào các tài liệu XML là một ngôn ngữ đánh dấu hoàn chỉnh, có thẻ mở và thẻ đóng, cho phép mọi người tạo ra các thẻ của riêng mà nó có thể bao quanh một phần nội dung, nhưng không ảnh hưởng tới cấu trúc

Trên Web XML thường được sử dụng để lưu trữ siêu dữ liệu, bởi vì nó là ứng dụng độc lập và có một hình thức con người có thể đọc được, nhưng để trao đổi các tài liệu XML giữa các hệ thống thì cả hai hệ thống phải biết các thẻ biểu thị những gì

XML không phải là một ngôn ngữ biểu diễn tri thức, nhưng cú pháp được sử dụng trong nhiều ngôn ngữ biểu diễn tri thức, ví dụ: RDF và OWL Do đó, quan trọng

là phải biết làm thế nào một tập tin XML được xây dựng

XMLS là một tài liệu mẫu (template) và xác minh tính hợp lệ (validation) các thành phần (element) và thuộc tính (attribute) hợp lệ của một tập tin XML

4.2.2 RDF và RDFS

Khung mô tả tài nguyên (RDF - Resource Description Framework) là một khuyến cáo của W3C từ tháng 2 năm 2004 cùng thay thế mô hình và cú pháp RDF (năm 1999 Khuyến nghị) và sơ đồ RDF (năm 2000 Khuyến nghị đề cử) Nó đã được phát triển bởi nhóm RDF Core Working như là một phần hoạt động của W3C Semantic Web

RDF được phát triển với động cơ để cung cấp siêu dữ liệu web và các mô hình thông tin mở, để có được thông tin mới bằng cách kết hợp dữ liệu từ một số ứng dụng

và cho phép tự động xử lý thông tin web bằng tác nhân phần mềm

Ngày đăng: 10/04/2015, 09:58

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w