Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 35 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
35
Dung lượng
619,13 KB
Nội dung
ĐẠI HỌC QUỐC GIA TP. HCM ĐẠI HỌC CÔNG NGHỆ THÔNG TIN ĐỒ ÁN MÔN HỌC BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG ĐỀ TÀI TÌM HIỂU VỀ SEMANTIC GRID Giảng viên: PGS.TS. Đỗ Văn Nhơn Học viên: Nguyễn Thường Kiệt - CH1301019 Tp. HCM, ngày 26 tháng 03 năm 2014 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng Mục Lục 2 2 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng I. Giới thiệu Grid ra đời nhằm hỗ trợ việc chia sẻ tài nguyên một cách an toàn, linh họat và có tổ chức . Cộng đồng Grid đã phát triển một kiến trúc chung cho các hệ thống Grid, gọi là OGSA (Kiến trúc Grid huớng dịch vụ mở). Kiến trúc này đã giải quyết nhu cầu chuẩn hóa Grid bằng cách định nghĩa một tập cách chức năng và hành vi của một hệ thống Grid. Một hệ thống Grid muốn họat động phải dựa trên sự am hiểu về các tài nguyên hiện có trong hệ thống, các khả năng, cách phối hợp và khai thác các tài nguyên đó. Hệ thống Grid và các ứng dụng hổ trợ Grid sẽ sử dụng các metadata dùng để mô tả thông tin của tài nguyên Grid một cách thông minh. Trong các hệ thống Grid hiện thời, các metadata này đuợc quản lý một cách rất phức tạp, không tuờng minh, nằm ẩn sâu trong thư viện mã của Grid. Điều này dẫn đến việc khó chia sẻ tài nguyên giữa các hệ thống Grid với nhau. Hệ thống Grid ngữ nghĩa ra đời nhằm cung cấp thông tin giàu ngữ nghĩa cho các tài nguyên của Grid, giúp xây dựng các dịch vụ Grid thông minh hơn và giúp việc chia sẻ tài nguyên giữa các hệ thống Grid trở nên dễ dàng . Gird ngữ nghĩa là sự mở rộng của Grid hiện tại trong đó thông tin và dịch vụ được cung cấp nghĩa được định nghĩa tốt ( well-defined meaning) thông qua các mô tả mà máy tính có thể xử lý được, cho phép chúng được sử dụng bởi con người và máy để con người và máy làm việc cộng tác với nhau Grid ngữ nghĩa chủ yếu dựa vào công nghệ Web ngữ nghĩa trước đó, đồng thời nó tuân thủ theo mô hình S-OGSA (mở rộng từ OGSA) để thiết kế các thành phần và ứng dụng ngữ nghĩa. Phần II sẽ trình bày công nghệ Web ngữ nghĩa, phần III trình bày mô hình S-OGSA và cuối cùng sẽ là một vài hiện thực của Grid ngữ nghĩa ở phần IV. 3 3 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng II. Web có ngữ nghĩa World Wide Web, gọi tắt là Web hay WWW, được phát minh và đưa vào sử dụng vào khoảng năm 1990,1991 bởi viện sĩ Viện Hàn lâm Anh Tim Berners-Lee. Từ đó đến nay nó đã phát triển một cách rộng khắp và trở thành một dịch vụ không thể thiếu trên Internet. Ban đầu nó đơn thuần chỉ là dịch vụ chia sẽ thông tin nhưng ngày nay nó dần dần tiến tới một kỹ nguyên mới với khái niệm Web 2.0, cho phép người dùng có thể sửa đổi thông tin trực tiếp mà không phải thông qua quyền quản trị, giúp cho con người trên mọi vùng lãnh thổ tiến lại gần nhau hơn. Tuy nhiên vấn đề của Web hiện tại là thông tin được biểu diễn dưới dạng văn bản thô mà chỉ con người mới có thể đọc hiểu được. Điều này thúc đẩy sự ra đời của ý tưởng Web có ngữ nghĩa (Semantic Web), một thế hệ mới của Web, mà theo Tim Berners-Lee nó là sự mở rộng của Web hiện tại mà trong đó thông tin được định nghĩa rõ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách hiệu quả hơn. Mục tiêu của Web có ngữ nghĩa là phát triển các chuẩn chung và công nghệ cho phép máy tính hiểu được nhiều hơn thông tin trên Web nhằm hổ trợ tốt hơn trong việc khám phá thông tin, tích hợp dữ liệu và tự động hóa các công việc. Phần tiếp theo sẽ trình bày các khái niệm và công nghệ liên quan đến Web có ngữ nghĩa. II.1. Siêu dữ liệu và vấn đề biểu diễn siêu dữ liệu Siêu dữ liệu trong ngữ cảnh của Web có ngữ nghĩa là các dữ liệu dùng để mô tả nội dung của trang Web, cho phép máy tính có thể hiểu và xử lý tự động được.Có thể nói siêu dữ liệu là khái niệm đầu tiên và quan trong nhất của Web có ngữ nghĩa. Một vấn đề được các nhà khoa học quan tâm nhất và cũng là nền tảng nhất của Web có ngữ nghĩa là làm thế nào để nhúng ngữ nghĩa vào các tài liệu web mà hiện nay được viết bằng ngôn ngữ HTML và chỉ có con người mới đọc hiểu được. Hơn nữa việc nhúng ngữ nghĩa này phải được thực hiện một cách tự động để có thể chuyển đổi hàng tỷ các tài liệu web đang có trên World Wide Web thành các trang web có ngữ nghĩa tương ứng. Đó là một thách thức rất lớn mà cho đến nay vẫn chưa thể thực hiện được. 4 4 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng Một thách thức khác liên quan đến vấn đề biểu diễn siêu dữ liệu là làm sao để người sử dụng chấp nhận một chuẩn công nghệ mới (ví dụ như RDF, RDFS, ) khi viết tài liệu web vì từ lâu họ đã quen với việc sử dụng HTML và các công cụ liên quan. II.2. Ontologies Trong ngữ cảnh của Web có ngữ nghĩa, Ontology được định nghĩa như là một mô hình dữ liệu biểu diễn một lĩnh vực nào đó, các khái niệm trong lĩnh vực và các mối quan hệ giữa chúng. Hiện nay, các ngôn ngữ ontology quan trọng nhất bao gồm: XML, XML Namespace, XML Schema, RDF, RDF Schema và OWL. II.2.1. XML XML (Extensible Markup Language) là ngôn ngữ đánh dấu mở rộng được phát triển dựa trên tính đơn giản, dễ sử dụng của ngôn ngữ HTML nhưng cho phép định nghĩa các thẻ (tab) theo nhu cầu sử dụng để mô tả các tài liệu có cấu trúc mà ngôn ngữ HTML không làm được. XML được thiết kế để cho phép máy tính có thể trao đổi tài liệu với nhau thông qua Web mà không làm mất đi ý nghĩa của dữ liệu. Một tài liệu XML bao gồm một tập các cặp thẻ (tab) được lồng vào nhau. Mỗi thẻ có một cặp các thuộc tính và giá trị. Ví dụ: <Students> <name>Nguyễn Thanh Vũ</name> <age>29</age> </ Students> Cấu trúc của một tài liệu XML: - Một tài liệu XML có thể được chia thành hai phần chính, mỗi phần có thể có các thành phần theo quy định khác nhau: 5 5 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng o Phần Prolog: chứa các khai báo cho tài liệu XML. Phần này có thể chứa các định đạng như: Các chỉ thị xử lý, định nghĩa kiểu cho tài liệu, chú thích, phiên bản đang sử dụng, cách thức mã hóa dữ liệu, báo cáo các chỉ thị xử lý cho ứng dụng.Ví dụ <?xml version=”1.0” encoding=”UTF-8” standalone=”no” ?> o Phần thân: chứa nội dung dữ liệu, bao gồm một hay nhiều phần tử, mỗi phần tử được chứa trong một cặp thẻ. Phần tử đầu tiên của tài liệu được gọi là phần tử gốc (root element). - Một tài liệu XML được coi là hợp khuôn dạng (well-form) nếu nó tuân thủ các quy tắc sau: o Các khai báo XML cần được đặt tại dòng đầu tiên của tài liệu, chẳng hạn như khai báo phiên bản hay các chỉ thị xử lý XML. o Mỗi tài liệu XML chỉ có một thành phần gốc (root) chứa mọi thành phần khác trong tài liệu. Các thành phần có thể đứng trước phần tử gốc là chú thích, chỉ thị xử lý và định nghĩa DTD (nếu khai báo ở phần khởi đầu của tài liệu). o Mỗi phần tử của tài liệu phải được nằm trong một cặp thẻ. Nếu là phần tử rỗng thì thẻ phải được kết thúc bằng "/>". Ví dụ: "<image/>" o Các thành phần trong tài liệu XML (khác thành phần gốc) đều nằm giữa cặp thẻ gốc và phải lồng nhau một cách hợp lý, tức là không có thành phần phủ, tập hợp thẻ này không được phép chồng lên thẻ kia, mỗi tập trong phải nằm trong tập hợp lớn hơn kế tiếp. o Các cặp thẻ phải được viết chính xác như nhau kể cả chữ hoa hay chữ thường. o Các giá trị của các thuộc tính đều phải nằm giữa hai ngoặc kép. Ví dụ: hide=true là không hợp lệ, mà phải là hide="true". 6 6 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng II.2.2. XML Namespace XML Namespace là một đặc tính quan trọng của XML. Nó cho phép giải quyết các vấn đề liên quan đến việc xung đột tên các phần tử. Chúng ta xem ví dụ dưới đây <?xml version="1.0"?> <BookOrder OrderNo="1234"> <OrderDate>2001-01-01</OrderDate> <Customer> <Title>Mr.</Title> <FirstName>Vũ</FirstName> <LastName>Nguyễn</LastName> </Customer> <Book> <Title>Grid computing</Title> <Author>Foster</Author> </Book> </BookOrder> Phần tử <Title> xuất hiện 2 lần trong tài liệu XML ở ví dụ trên ,lần thứ nhất nó ám chỉ danh hiệu (Mr, Mss, ) của một người, lần thứ hai nó ám chỉ tựa đề của một quyển sách. Đó là sự nhập nhằng về tên. W3C giải quyết sự nhập nhằng ấy bằng cách đưa ra khái niệm XML namespace. Một XML namespace, thông thường là một URI, xác định 7 7 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng duy nhất một tài nguyên trên Internet. Áp dụng XML namespace vào ví dụ ở trên, ta được: <?xml version="1.0"?> <BookOrder OrderNo="1234"> <OrderDate>2001-01-01</OrderDate> <Customer xmlns="http://www.northwindtraders.com/customer"> <Title>Mr.</Title> <FirstName>Vũ</FirstName> <LastName>Nguyễn</LastName> </Customer> <Book xmlns="http://www.northwindtraders.com/book"> <Title>Grid Computing</Title> <Author>Foster</Author> </Book> </BookOrder> Ta đã tránh được sự nhập nhằng về tên vì bên trong Customer thì dùng namespace http://www.northwindtraders.com/customer và bên trong Book thì dùng namespace http://www.northwindtraders.com/book. Một cách giải quyết khác là khai báo chữ viết tắt cho các namespaces ngay ở đầu tài liệu. Sau đó bên trong tài liệu ta sẽ prefix các Element cần xác nhận namespace bằng chữ viết tắt của namespace đó. Ví dụ như sau: 8 8 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng <?xml version="1.0"?> <BookOrder xmlns="http://www.northwindtraders.com/order" xmlns:cust="http://www.northwindtraders.com/customer" xmlns:book="http://www.northwindtraders.com/book" OrderNo="1234"> <OrderDate>2001-01-01</OrderDate> <cust:Customer> <cust:Title>Mr.</cust:Title> <cust:FirstName>Vũ</cust:FirstName> <cust:LastName>Nguyễn</cust:LastName> </cust:Customer> <book:Book> <book:Title> Grid Computing </book:Title> <book:Author>Foster</book:Author> </book:Book> </BookOrder> Trong tài liệu XML ở trên ta dùng 3 namespaces: http://www.northwindtraders.com/order (namespace mặc định), http://www.northwindtraders.com/customer (viết tắt là cust), http://www.northwindtraders.com/book (viết tắt là book). 9 9 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng Các phần tử không có prefix (tức là không có chữ tắt đứng trước) như BookOrder, OrderNo, và OrderDate, được coi như thuộc về namespace mặc định. II.2.3. XML Schema XML Schema là một ngôn ngữ được dùng để định nghĩa cấu trúc của một tài liệu XML như là phần tử nào xuất hiện trong tài liệu, quan hệ cha con giữa các phần tử, kiểu dữ liệu của các phần tử, XML Schema sử dụng cú pháp của ngôn ngữ XML và được xem như một sự thay thế cho DTD (Document Type Definition) đã lỗi thời và khó sử dụng. XML Schema mở đầu bằng khai báo theo chuẩn XML, tiếp theo dùng tiếp đầu ngữ xsd: để khai báo không gian tên XML Schema, theo cú pháp sau: <?xml version = “1.0” ?> <xsd:schema xmlns:xsd = http : // www.w3.org/1999/XMLSchema> ………… </xsd:schema> II.2.4. RDF Có thể nói rằng RDF (Resource Description Framework) chính là nền tảng và là linh hồn của Web có ngữ nghĩa. RDF là một ngôn ngữ được dùng để mô tả thông tin về những tài nguyên trên Web và mô tả ngữ nghĩa của những thộng tin ấy theo cách mà máy có thể hiểu được. RDF thích hợp trong những ứng dụng mà ở đó thông tin cần được xử lý bởi máy tính chứ không phải con người. RDF cung cấp một framework chung cho việc biểu diễn thông tin này vì thế nó có thể được trao đổi giữa các ứng dụng mà không làm mất đi ý nghĩa của thông tin. RDF mô tả tài nguyên trên Web thông qua URI (Uniform Resource Identifier). 10 10 [...]... (identity ) trong Grid, bao gồm các tài nguyên và các dịch vụ 19 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng - Các thực thể tri thức (K-Entities):đây là lọai thực thể đặc biệt có thể họat động với các dạng tri thức Các thực thể tri thức gồm : Ontologies, Rules, Cơ sở tri thức ,hay các mô tả dạng text của tri thức mà có thể chia sẻ đuợc Các dịch vụ tri thức là những dịch vụ có thể họat động và truy cập... dịch vụ cung cấp tri thức và nhóm dịch vụ cung cấp ràng buộc ngữ nghĩa Nhóm dịch vụ cung cấp tri thức (Knowledge provisioning services) gồm: các dịch vụ ontology chịu trách nhiệm lưu trữ ,truy xuất các mô hình tri thức ý niệm và các dịch vụ suy diễn chịu trách nhiệm tính suy diễn trên các mô hình tri thức này 21 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng Hình 7.Mô hình thông tin của Grid Ngữ Nghĩa... vụ ontology và suy diễn đễ suy diễn các dữ liệu mà chúng lưu trữ Các dịch vụ hiểu ngữ nghĩa Là nhóm các dịch vụ có thể khai thác các kỹ thuật xử lý tri thức để tạo cung cấp các chức năng Hiểu ngữ nghĩa tức là có khả năng sử dụng các ràng buộc ngữ nghĩa và hành động dựa trên các siêu dữ liệu và tri thức Một số ví dụ về các hành động theo ngữ nghĩa như : 22 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng... nhau và với các khái niệm trong OWL 30 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng IV.5 Các dịch vụ khái niệm IV.5.1 Dịch vụ bản thể học Quản lý các biểu thức khái niệm Dịch vụ này có môi trường phát tri n là OilEd, có bộ suy luận FaCT dung để suy ra các biểu thức khái niệm Có cơ chế so trùng không chính xác và cơ chế xếp hạng để tìm ra kết quả hữu hiệu nhất bằng cách suy luận thông qua các mô tả và. .. là một sự mở rộng từ RDF và RDFS Mục đích chính của OWL là đưa khả năng suy luận vào Web có ngữ nghĩa OLW có ba loại: OWL Lite, OWL DL và OWL Full Mỗi loại OWL sẽ có những đặc tính riêng và do đó sẽ phù hợp trong ngữ cảnh của một ứng dụng nào đó 15 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng 16 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng III Mô hình S-OGSA III.1 Kiến trúc Grid huớng dịch vụ mở (OGSA)... nguyên III.5 Kết luận và huớng phát tri n tuơng lai: -Những thách thức về mặt kỹ thuật :về mặt hiện thực lẫn lý thuyết -Hiệu suất xử lý ngữ nghĩa 24 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng -Tập hợp và quản lý nội dung ngữ nghĩa -Những thách thức liên quan đến các vấn đề pháp lý ,bảo mật ,tính riêng tư khi chia xẻ tài nguyên giữa các hệ thống Grid IV Một vài hiện thực của Grid ngữ nghĩa IV.1 Giới... ngữ định nghĩa workflow là WSFL subset , XScufl 26 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng - Khai phá workflow: là quá trình tìm kiếm những workflow đã được thực hiện - Tạo workflow: là quá trình tìm kiếm các lớp dịch vụ có liên quan, hoặc tạo ra chúng nếu không tìm thấy Hình sau là một ví dụ về workflow 27 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng IV.3.2 Các thành phần thiết kế thí nghiệm... năng của Grid ngữ nghĩa Theo nguyên lý thiết kế về tính đa dạng (diversity) , Grid Ngữ Nghĩa bao gồm một tập các dịch vụ các các cấp độ khác nhau về khả năng xử lý ngữ nghĩa Các dịch vụ ngữ nghĩa đuợc chia thành hai nhóm :nhóm dịch vụ cung cấp ngữ nghĩa (Semantic 20 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng Provisioning Services -SPS ) và nhóm dịch vụ hiểu ngữ nghĩa (Semantically Aware Grid Services... nguyên tri thức như các động cơ luật, bộ suy diễn tự động … -Các ràng buộc ngữ nghĩa (S-Bindings):là các thực thể dùng để biểu diễn sự kết hợp giữa một thực thể Grid thông thuờng (không có tính ngữ nghĩa ) với một hoặc nhiều thực thể Grid ngữ nghĩa -Các thực thể Grid Ngữ Nghĩa (SG-Entities):là các các ràng buộc ngữ nghĩa hay các thực thể tri thức Hình 6.Mối quan hệ giữa các thực thể grid thuờng và ngữ... các dịch vụ và workflow cũng như lưu trữ dữ liệu trong kho -Giúp xây dựng các workflow có ngữ nghĩa -Định hướng giữa dữ liệu và tri thức: liên kết các mục trong kho dữ liệu và ghi nhận nguồn gốc của các workflow 34 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng Tài liệu tham khảo: 1 A Semantic Web Primer – Grigoris Autoniou and Frank van Harmelan 2 An overview of S-OGSA: a Reference Semantic Grid Architecture . ÁN MÔN HỌC BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG ĐỀ TÀI TÌM HIỂU VỀ SEMANTIC GRID Giảng viên: PGS.TS. Đỗ Văn Nhơn Học viên: Nguyễn Thường Kiệt - CH1301019 Tp. HCM, ngày 26 tháng 03 năm 2014 ĐỒ ÁN MÔN. ứng dụng nào đó. 15 15 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng 16 16 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng III. Mô hình S-OGSA III.1. Kiến trúc Grid huớng dịch vụ mở (OGSA) OGSA. ngày 26 tháng 03 năm 2014 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng Mục Lục 2 2 ĐỒ ÁN MÔN HỌC: Biểu Diễn Tri Thức & Ứng Dụng I. Giới thiệu Grid ra đời nhằm hỗ trợ việc chia sẻ tài