Giới thiệu Ontology trong Semantic Web

21 438 0
Giới thiệu Ontology trong Semantic Web

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 MỤC LỤC 1 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 LỜI NÓI ĐẦU Chúng em xin chân thành cảm ơn PGS.TS. Đỗ Văn Nhơn đã truyền đạt những kiến thức quý báu từ những kinh nghiệm sống đến những vấn đề khoa học mới nhất trong bộ môn Biểu diễn tri thức và ứng dụng. Trong bài tiểu luận này, em xin trình bày các công nghệ biểu diễn tri thức trong Web ngữ nghĩa. Web ngữ nghĩa là thế hệ Web mới, đang được phát triển và sẽ xuất hiện trong tương lai gần. Hệ thống Web mới này sẽ dần thay thế Web hiện tại song không có nghĩa là hoàn toàn khác hệ thống Web hiện tại. Web ngữ nghĩa được phát triển trên hệ thống Web hiện tại bằng cách bổ sung thêm ngữ nghĩa cho các tài nguyên Web mà máy tính có thể hiểu và tăng khả năng xử lý tự động. Dù đã cố gắng hết sức, song do trình độ còn hạn chế nên khó tránh khỏi những thiếu sót. Rất mong nhận được sự thông cảm và góp ý của thầy cô và các bạn. 2 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 1. Giới thiệu Để hiểu được nguyên tắc của Semantic Web và kỹ thuật biểu diễn dữ liệu quan trọng là biết về các khái niệm về giao tiếp của con người.Trong một cuộc trò chuyện, một người nói sẽ gửi cú pháp, mà là một sự kết hợp của các ký hiệu ra lệnh như từ và dấu chấm câu, một hoặc nhiều kiểm toán viên đọc biểu lộ của một câu.Các kiểm toán viên nhận được những biểu tượng và cố gắng để hiểu ý nghĩa của chúng.Giải thích được hỗ trợ bởi một số yếu tố môi trường, ví dụ như các cuộc hội thoại trước đó, vị trí, cử chỉ và biểu hiện trên khuôn mặt của người nói.Trong lý thuyết truyền thông biểu lộ trong những biểu tượng được gọi là ngữ nghĩa và giải thích được gọi là ngữ dụng.Bối cảnh bao gồm các chủ đề truyền thông cụ thể và làm thế nào nó có liên quan đến các thuật ngữ khác. Dạy một máy tính để hiểu dữ liệu là một chủ đề rất phức tạp của Trí tuệ nhân tạo. Để kích hoạt các quá trình đàm thoại cho các máy chúng ta phải thích ứng với khái niệm của lý thuyết truyền thông bằng cách định nghĩa một cú pháp mà có thể đọc được tất cả các máy tính, làm cho kiến thức về đối tượng quan tâm có thể truy cập, và phát triển phần mềm đó là có khả năng phân giải và sử dụng những kiến thức đã được định nghĩa. 2. Giới thiệu về Web ngữ nghĩa 2.1. Web 3.0 Web ngữ nghĩa (Semantic Web) còn được gọi là Web 3.0, đã được mô tả bởi Tim Berners-Lee 1 trong trang Web, trong đó máy tính có khả năng phân tích tất cả dữ liệu nội dung của nó, liên kết và giao tiếp giữa con người và máy tính. Tim Berners- Lee hình dung ra các bộ máy giao tiếp trong nhau với hành vi thông minh. 1 Tim Berners-Lee là giám đốc của công ty World Wide Web Consortium (W3C) và là người sáng lập World Wide Web 3 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 Nói một cách đơn giản, làm theo phương pháp của Semantic Web sẽ cho phép chúng ta lưu trữ kiến thức về nội dung web trong một hình thức có cấu trúc. Một ví dụ minh họa được đưa ra dưới đây. Trên một máy chủ của một trường đại học, một tài liệu có thể chứa thông tin về cách hệ thống cấp bậc đại học được tổ chức, ví dụ như phân loại trong trường đại học, hiệu trưởng, bộ phận, trưởng bộ phận, giảng viên và học sinh. Một đại diện của mô hình này có thể là Đại học khoa học ứng dụng Salzburg, Tiến sĩ Erhard Busek, bộ phận quản lý Công nghệ thông tin và hệ thống, FH-Prof. DI Dr. Thomas Heistracher, DI. Dietmar Glachs và Stephanie Stroka. Hơn nữa, các phân loại có liên quan lẫn nhau. Ví dụ, một giáo viên giảng viên dạy một hoặc nhiều học sinh. Vị từ Dạy hình thành một mối quan hệ giữa một giảng viên môn học và một đối tượng học sinh. Người ta thường nói rằng một vị từ là một thuộc tính của chủ ngữ. Các mối quan hệ đó cũng được tuân theo trong tài liệu. Với định nghĩa các luật suy luận về một thuọc tính, nó cũng có thể để xây dựng các kết nối mới, ví dụ như nếu sinh viên Stephanie Stroka nghiên cứu Công nghệ thông tin & Quản lý hệ thống và FH-Prof. DI Dr. Thomas Heistracher, người làm việc tại Đại học Khoa học ứng dụng Salzburg, là người đứng đầu bộ phận công nghệ thông tin và quản lý hệ thống, chúng ta có thể suy luận rằng Stephanie Stroka nghiên cứu tại Đại học Salzburg. Kể từ khi thực hiện các chủ ngữ, vị từ và đối tượng trong Web ngữ nghĩa được định nghĩa là các định danh tài nguyên thống nhất (URI- Uniform Resource Identifiers), nó có thể so sánh các URI với các URI từ các tài liệu web ngữ nghĩa khác, để suy ra rằng các thực thể đều bằng nhau. Do đó, sẽ có thể cho nguyên nhân mà Stephanie Stroka, người có trang web http://www.steffi.com, thực sự tương đồng với sinh viên Stroka Stephanie, người học môn Công nghệ thông tin & Quản lý hệ thống quản lý tại trường Đại học Khoa học ứng dụng Salzburg. Hơn nữa, vì thế nó được gọi là các tác nhân phần mềm, là các ứng dụng tự động, khám phá và sửa đổi một môi trường nhất định (ví dụ như World Wide Web) có thể thu thập các dữ liệu ngữ nghĩa, suy luận về nó, xây dựng một mô hình mới không gian của thế giới, và do đó, có thể kết luận giao dịch hoặc để hiển thị nội dung yêu cầu. 4 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 Web 3.0 là một phần mở rộng của Web hiện tại và ngữ nghĩa của nó được mã hóa vào các trang web mà làm cho chúng trong suốt trong sử dụng bình thường. Một mặt, đây là một lợi thế cho người sử dụng bình thường, vì điều này không đòi hỏi phải học kiểu mới để làm quen với các trang web. Mặt khác, nó cũng có thể là một bất lợi, sẽ được trình bày trong chương tiếp theo. 2.2. Các phản ứng nghi ngờ Một yếu tố quan trọng về lý do tại sao Semantic Web vẫn không được phổ biến rộng rãi, đó là do rất nhiều công ty không nhìn thấy lợi ích của nó. Họ cho rằng một khai báo từ khoá khác biệt được mã hóa thành các trang HTML (HyperText Markup Language) là đầy đủ. Một mặt, họ không quan tâm đến người dùng web đến trang web của họ tìm kiếm một cái gì đó hoàn toàn khác nhau, mặt khác họ không biết rằng người dùng khác, những người sẽ là khách hàng tiềm năng, có thể không tìm thấy trang web của họ. Họ cũng cho rằng Lợi tức đầu tư (ROI – Return of Investment) không đủ hiệu quả, do đó, họ sợ chi tiền cho một công nghệ mà chưa từng được sử dụng và đạt được cái mà có thể chưa được chứng minh. Đối với các công ty có chia sẻ kiến thức của họ đối với các chi nhánh phân phối, một tiêu chí lớn khác là sự riêng tư, bởi vì không có biện pháp phòng ngừa nhất định nào để ngăn cản việc đánh cắp dữ liệu kiến thức từ các tác nhân phần mềm hoặc con người. Web ngữ nghĩa được xây dựng trên ngôn ngữ eXtensible Markup Language (XML), nền tảng Resource Description Framework (RDF), Ontology và các luật web. Đối phó với vấn đề an ninh, rõ ràng là, ngoài việc bảo mật trong các lớp bên dưới ứng dụng, chúng ta cần phải sử dụng bảo mật XML, bảo mật RDF, bảo mật Ontology và bảo mật các luật Web để đảm bảo sự riêng tư trong Web ngữ nghĩa Để khắc phục những nghi ngờ đổi mới công ty, phải áp dụng công nghệ mới này để khẳng định rằng sự hoài nghi là độc đoán. Trong phần tiếp theo, chúng ta sẽ làm quen với một số lý do cho Web ngữ nghĩa. 5 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 2.3. Lý do cho Semantic Web Chúng ta có thêm nhiều thông tin trên Internet thì càng khó khăn hơn để tìm về hình thức của nội dung cụ thể. Việc tìm kiếm đơn giản từ các từ khóa là không đủ nữa là do khai báo từ khóa không chính xác, không đầy đủ và không rõ ràng đang tồn tại trong ngôn ngữ tự nhiên của chúng ta. Ý nghĩa của Semantic Web là để mang lại cấu trúc trong sự hỗn loạn thông tin và để ngăn chặn tình trạng quá tải thông tin để nó sẽ trở thành hình thức của nội dung cụ thể. Ngoài ra, hệ thống Stovepipe, đó là hệ thống lỗi thời (legacy system) được sản xuất và phát triển để giải quyết một vấn đề cụ thể, có thể tạo thành từ các vấn đề trong môi trường phân tán. Để sửa đổi và duy trì thông tin liên lạc được mã hóa cứng thường tốn thời gian, tốn kém và đôi khi không tốt. Với việc thích nghi sử dụng ngôn ngữ biểu diễn tri thức (Knowledge representing), việc thay đổi và duy trì hệ thống trở nên khả thi. Tiềm năng thực hiện Semantic Web là một nền tảng trực tuyến đặc biệt cho việc quản lý kiến thức trong các tổ chức. Nó trở thành có thể để tạo ra, cá nhân hóa, đại diện và phân phối các kiến thức cho các chi nhánh kinh doanh đối với các nhu cầu cá nhân của họ. 2.4. Sử dụng kỹ thuật Semantic Web Trong hình 1, chúng ta thấy Semantic Web được phân lớp như thế nào. Ở phía dưới có chỉ định hình thức mà thường được đại diện bởi một URI hoặc một chuỗi định danh tài nguyên quốc tế (IRI - InternationalizedResource Identifier). Tiếp theo đó, một cú pháp và một cấu trúc phải được xác định. XML, XMLs và RDF thường là các công nghệ được sử dụng. Các Ontology là khái niệm cốt lõi của Biểu diễn tri thức trong Semantic Web. RDFS và OWL là ngôn ngữ mà có thể sản xuất các mô hình như vậy. 6 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 Lớp logic cho phép các phần mềm suy luận về các dữ liệu được biểu diễn, bao gồm các ontology, các truy vấn và các quy tắc. Cơ chế bảo mật nên được sử dụng trên tất cả các lớp công nghệ. Hình 1: Một phiên bản trừu tượng của các lớp bánh Semantic Web Để tạo ra một biểu diễn tri thức được hiện diện trực tuyến, chúng ta phải xây dựng một mô hình của thế giới không gian tương tự như những gì chúng ta đã thấy trong ví dụ về cấu trúc trường đại học. Đơn giản hóa, chúng ta phải xây dựng các mối quan hệ giữa các thuật ngữ hoặc các lớp. Khái niệm về xây dựng một mô hình khả thi này được giải thích trong chương sau. 3. Ontology 3.1. Giới thiệu Ontology trong Semantic Web Ý tưởng chung đằng sau các ontology là làm cho tri thức rõ ràng bằng cách diễn đạt các khái niệm và các mối quan hệ của chúng. 7 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 Nói cách khác, ontology xác định các từ và nội dung phổ biến được sử dụng để mô tả và biểu diễn một vùng tri thức hoặc tập hợp của thông tin về dữ liệu và dữ liệu có liên quan thế nào. Như vậy, ontology cung cấp các phương tiện cho việc thiết lập một cấu trúc có ngữ nghĩa. Đề cập đến các lý thuyết về thông tin liên lạc, ontology sẽ đại diện cho bối cảnh các thuật ngữ. Trong Semantic Web, ontology là bán cấu trúc và đại diện cho một thế giới mở, có nghĩa là mô hình có thể phát triển với các dữ liệu và một ontology không chứa tất cả các thực thể thế giới hiện thực. Một mô hình ontology có thể sáp nhập với một mô hình ontology khác. Như vậy, các ontology trong Semantic Web là từng phần và mô-đun hóa. Khi chúng ta nói về ontology, chúng ta phân biệt giữa sự phong phú ngữ nghĩa của các loại khác nhau. Trong hình 2, chúng ta có thể nhìn thấy các loại phổ biến của các ontology, bắt đầu ở dưới cùng bên trái nơi mà ngữ nghĩa đơn giản và yếu, đi tiếp lên phía trên bên phải nơi mà ngữ nghĩa phức tạp hơn và dữ liệu được suy ra có logic. Hình 2: Hình phổ của Ontology Các phần tiếp theo sẽ giới thiệu về các loại hình cụ thể của Ontology. 8 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 3.2. Phép phân loại tư duy Phép phân loại (taxonomy) là một phương pháp để phân lớp hoặc phân loại một tập hợp các thuật ngữ trong một cấu trúc phân cấp. Nói chung, đó là nghiên cứu về các nguyên tắc chung của việc phân lớp khoa học (scientific classification).Khi chúng ta lắp định nghĩa này với lĩnh vực công nghệ thông tin, chúng ta có thể nói rằng một phép phân loại là việc phân lớp của các đơn vị thông tin trong các hình thức của một hệ thống phân cấp, coi như là mối quan hệ của các đối tượng trong thế giới thực mà chúng biểu diễn. Một phép phân loại tư duy, nói chung, là ngữ nghĩa yếu, bởi vì nó không thể hiện ý nghĩa phong phú và không phân biệt giữa các mối quan hệ gộp lại và giữa các mối quan hệ khái quát hóa / chuyên môn hóa. Một ví dụ về phân loại một phần được đưa ra trong hình 3. Hình 3: Một phép phân loại tư duy có quan hệ tập hợp và khái quát hóa/chuyên môn hóa 9 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng Cao học CNTT khóa 6 3.3. Bộ từ điển đồng nghĩa Bộ từ diển đồng nghĩa (Thesauri) định nghĩa mối quan hệ giữa các từ và cụm từ có cấu trúc trong một taxonomy. Một số ví dụ về các mối quan hệ sẽ là từ đồng nghĩa, từ đồng âm, hẹp hơn và rộng hơn so với các mối quan hệ. Từ đồng âm mô tả hai hay nhiều từ âm giống nhau với ý nghĩa khác nhau, trong khi từ đồng nghĩa là những từ âm khác nhau với cùng một ý nghĩa. Quan hệ là hẹp hơn và rộng hơn so với mối quan hệ giữa cha mẹ và con một tiểu phân lớp (sub- classification), mà là hẹp hơn so với tuyên bố rằng chủ đề là cụ thể hơn so với các đối tượng và ngược lại cho là rộng hơn (xem hình 4). Hình 4: Ví dụ về mối quan hệ trong từ điển đồng nghĩa 3.4. Mô hình khái niệm Mô hình khái niệm phổ biến trong các cơ sở dữ liệu hoặc ứng dụng mô hình. Các ngôn ngữ UML (Unified Modeling Language) là một mô hình khái niệm phổ biến trong công nghệ phần mềm. Hình 5 cho thấy một ví dụ về một sơ đồ UML 10 [...]... logic có thể suy ra nếu một lời đề nghị kỳ nghỉ có hay không phù hợp với những ham muốn này Trong lý thuyết logic, Semantic Web có thể được xây dựng bởi các phần mềm mà có được tri thức từ siêu dữ liệu (meta-data) được lưu trữ trong các tài liệu biểu diễn tri thức web 4 Các kỹ thuật biểu diễn tri thức 4.1 Giới thiệu về Biểu diễn tri thức Biểu diễn tri thức là một nhánh của trí tuệ nhân tạo, cung cấp... với giúp đỡ của các tác nhân phần mềm Trong phần này, chúng ta sẽ có một giới thiệu về các ngôn ngữ đánh dấu (markup language) được sử dụng để biểu diễn tri thức 12 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng 6 Cao học CNTT khóa 4.2 Ngôn ngữ để biểu diễn tri thức 4.2.1 XML và XMLS Như đã nói trong phần giới thiệu, chúng ta cần một cú pháp để trao đổi tin trong một tình huống giao tiếp Ngôn ngữ... hoạt động của W3C Semantic Web RDF được phát triển với động cơ để cung cấp siêu dữ liệu web và các mô hình thông tin mở, để có được thông tin mới bằng cách kết hợp dữ liệu từ một số ứng dụng và cho phép tự động xử lý thông tin web bằng tác nhân phần mềm 13 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng 6 Cao học CNTT khóa RDF là lớp nền tảng của Semantic Web Các ngữ nghĩa được mã hóa trong bộ ba, mỗi... danh sách 4, chúng ta xác định một RDFS cho bộ ba “Henry làm việc tại công ty X” trong ví dụ RDF trước đây 4.2.3 OWL ... Bản đồ Ontology Trong phần header, ontology được định nghĩa, các phiên bản trước đã đề cập, các ontology OWL khác có thể được nhập vào, có thể được gán nhãn, ý kiến có thể được ghi nhận và thuộc tính chú thích khác có thể được xác định trước 16 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng 6 Cao học CNTT khóa Để sắp xếp các biểu tượng của thế giới thực, chúng ta phải khai báo các lớp học như trong. .. Môn Biểu diễn tri thức và ứng dụng 6 Cao học CNTT khóa TÀI LIỆU THAM KHẢO 1 Stephanie Stroka: Knowledge Representation Technologies in the Semantic Web Term paper for University of Applied Sciences (June 2008) 2 Semantic Web: http://en.wikipedia.org/wiki /Semantic_ web 3 de Bruijn, J.: RIF RDF and OWL Compatibility http://www.w3.org/2005/rules/wiki/SWC (06.06.2008) (2008) 21 ... biệt giữa các cá nhân được gọi là lập bản đồ ontology Với các đặc tính thuộc tính, hạn chế và OWL lập bản đồ 17 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng 6 Cao học CNTT khóa ontology cung cấp ngữ nghĩa phong phú và khả năng để suy ra kiến thức và tạo ra một thế giới thực thể bán hoàn tất Một ví dụ mã OWL của một ontology nhân viên có thể được nhìn thấy trong danh sách 7 (Phụ lục A) Với XML / S,... khả thi để biểu diễn dữ liệu, tạo lý do về chúng và quét dữ liệu quan tâm Tầm nhìn của Semantic Web cuối cùng sẽ cụ thể hóa 19 Bài thu hoạch: Môn Biểu diễn tri thức và ứng dụng 6 Cao học CNTT khóa 5 Kết luận và triển vọng Tóm lại, ta có thể nói rằng công nghệ biểu diễn tri thức là cốt lõi trong lĩnh vực Semantic Web Nếu không có khả năng để lưu trữ các siêu dữ liệu một cách có cấu trúc tương tự như... dữ liệu để suy ra thêm các quan hệ dữ liệu Điều này sẽ dẫn đến một trang web cho các tác nhân phần mềm mà có thể suy luận về dữ liệu được mô tả trên các trang web và do đó, việc xử lý giao dịch sẽ nhận được thoải mái hơn do suy luận tự động hóa Semantic Web sẽ được thực hiện và được sử dụng bởi các tổ chức sáng tạo chú trọng trong việc quản lý kiến thức tốt 20 Bài thu hoạch: Môn Biểu diễn tri thức... thesauri Hạn chế bản số là giới hạn 0 và 1 OWL DL, trong đó DL là viết tắt của Description Logic, hỗ trợ cho những người dùng cần sự diễn cảm tối đa trong khi cần duy trì tính toán toàn vẹn (tất cả các kết luận phải được đảm bảo để tính toán) và tính quyết định (tất cả các tính toán sẽ kết thúc trong khoảng thời gian hạn chế) Ngoài ra, thứ tự phần tử giữa các lớp không bị giới hạn 0 và 1 Không giống . được định nghĩa. 2. Giới thiệu về Web ngữ nghĩa 2.1. Web 3.0 Web ngữ nghĩa (Semantic Web) còn được gọi là Web 3.0, đã được mô tả bởi Tim Berners-Lee 1 trong trang Web, trong đó máy tính có. dựng một mô hình khả thi này được giải thích trong chương sau. 3. Ontology 3.1. Giới thiệu Ontology trong Semantic Web Ý tưởng chung đằng sau các ontology là làm cho tri thức rõ ràng bằng cách. thể thế giới hiện thực. Một mô hình ontology có thể sáp nhập với một mô hình ontology khác. Như vậy, các ontology trong Semantic Web là từng phần và mô-đun hóa. Khi chúng ta nói về ontology,

Ngày đăng: 10/04/2015, 09:58

Mục lục

    2. Giới thiệu về Web ngữ nghĩa

    2.2. Các phản ứng nghi ngờ

    2.3. Lý do cho Semantic Web

    2.4. Sử dụng kỹ thuật Semantic Web

    3.1. Giới thiệu Ontology trong Semantic Web

    3.2. Phép phân loại tư duy

    3.3. Bộ từ điển đồng nghĩa

    3.4. Mô hình khái niệm

    3.5. Các lý thuyết logic

    4. Các kỹ thuật biểu diễn tri thức

Tài liệu cùng người dùng

Tài liệu liên quan