TÌM HIỂU SEMANTIC WEB
TÌM HIỂU SEMANTIC WEB 1 MỤC LỤC A. ĐẶT VẤN ĐỀ 4 1. THẾ HỆ WEB 1.0 4 2. THẾ HỆ WEB 2.0 5 3. LÝ DO CẦN CÓ SEMANTIC WEB 6 B. SEMANTIC WEB 7 1. GIỚI THIỆU 7 2. KHÁI NIỆM SEMANTIC WEB 7 3. ƯU ĐIỂM CỦA SEMANTIC WEB 7 C. KIẾN TRÚC SEMANTIC WEB 9 1. MÔ HÌNH KIẾN TRÚC 9 2. CHI TIẾT CÁC LỚP 9 D. CÔNG NGHỆ SỬ DỤNG TRONG SEMANTIC WEB 18 1. RDF 18 1.1. GIỚI THIỆU RDF 18 1.2. KHÁI NIỆM RDF 19 1.3. BẢNG TÓM TẮT CÚ PHÁP RDF 30 2. ONTOLOGY 32 2.1. ONTOLOGY LÀ GÌ 32 2.2. VAI TRÒ CỦA ONTOLOGY 33 2.3. CÁC THÀNH PHẦN CỦA ONTOLOGY 34 2.4. OWL 34 E. KẾT LUẬN 39 F. TÀI LIỆU THAM KHẢO 40 TÌM HIỂU SEMANTIC WEB 2 DANH MỤC BẢNG HÌNH VẼ Hình 1 Tổng quan về web 1.0 Hình 2 Tổng quan về Web 2.0 Hình 3 Kiến trúc Semantic Web Hình 4 Mối quan hệ giữa các thành phần trong một bộ ba. Hình 5 Phát biểu RDF đơn giản Hình 6 Phát biểu của cùng 1 tài nguyên Hình 7 Các thông tin bổ sung cho thực thể Bảng 1 tóm tắt cú pháp RDF Bảng 2 Tóm tắt từ vựng trong RDF TÌM HIỂU SEMANTIC WEB 3 LỜI MỞ ĐẦU Web 2.0 đã đạt được những thành tựu rất đáng kể trong việc nâng cao tính tương tác cũng như đẩy nhanh tốc độxử lý đáp ứng yêu cầu của người dùng. Tuy nhiên trong xã hội thông tin đương đại, nhu cầu của người dùng không dừng lại ởviệc cải thiện tốc độ mà còn phải cải thiện chất lượng xửlý của trang web theo yêu cầu ngày càng nâng cao. Web 3.0 (Web Semantic) ra đời nhằm đáp ứng những yêu cầu về chất lượng đó. Với đặc điểm chính là nâng cao khả năng chia sẻ tài nguyên và tăng “sự hiểu biết” trong quá trình xử lý dữ liệu của máy tính. Web Semantic đã đi sâu vào phân tích và định hướng dữ liệu, đồng thời hỗ trợ phát triển ứng dụng Web Semantic trên nhiều lĩnh vực khác nhau. Một trong những lĩnh vực thế mạnh của Web Semantic là xử lý và tìm kiếm thông tin. Việc phân tích và định hướng nội dung lưu trữ cho phép chúng ta xây dựng những cơsở dữ liệu phục vụ tìm kiếm chính xác hơn, tinh gọn hơn. Tiểu luận sẽ trình bày những đặc điểm của Semantic Web qua những vấn đề chính như sau Chương 1: Trình bày nguyên nhân dẫn đến sự ra đời của Semantic Web Chương 2: Trình bày khái niệm Semantic Web cũng như những lợi ích mà nó mang lại Chương 3: Trình bày kiến trúc của Semantic Web và chức năng của từng thành phần Chương 4 và Chương 5: Giới thiệu hai thành phần quan trọng nhất của Semantic Web là RDF và Ontology TÌM HIỂU SEMANTIC WEB 4 A. ĐẶT VẤN ĐỀ 1. THẾ HỆ WEB 1.0 Thế hệ Web 1.0 ra đời năm 1997 bởi chính cha đẻ của World Wide Web (WWW) là Tim Berners-Lee. Năm 1989 Burners-Lee đưa ra ý niệm về một không gian siêu văn bản toàn cầu mà theo đó mỗi một thông tin hay nội dung, thường được gọi là trang web đều có thể tiếp cận thông qua một bộ nhận dạng chung duy nhất. Trang web và công cụ tìm kiếm đầu tiên ra đời năm 1990. Berners-Lee định nghĩa Web 1.0 là cấu trúc thông tin chỉ có thể để đọc, tương tự như một không gian để quảng bá những thông tin đến công chúng, và cả những bảng quảng cáo hàng hóa hay dịch vụ đến khách hàng. Với những tính năng ban đầu hạn chế như thế nhưng Web 1.0 đã tực sự tạo nên cơn sốt hình thành các công ty kinh doanh Internet. Trong thời kỳ Web 1.0, tất cả các sản phẩm và dịch vụ thông tin được phát triển, tổ chức theo nhu cầu của người dùng. Các nhà cung cấp chủ động xử lý các nguồn thông tin mình có và cung cấp cho người dùng bằng cách đưa thông tin lên website. Người dùng có thể truy cập tại bất kỳ thời điểm nào, không ngăn cản về mặt khoảng cách hay thời gian. Người dùng chỉ có quyền truy cập và khai thác thông tin đã dược dựng sẵn và sử dụng những thông tin đó. Các đặc tính của Web 1.0 có thể được tổng kết như sau: Trong Web 1.0, Webmaster là người chịu trách nhiệm quản lý nội dung và duy trì cập nhật cho người sử dụng Web 1.0 không hỗ trợ xuất bản thông tin rộng rãi Web 1.0 sử dụng ngôn ngữ đánh dấu siêu văn bản cơ bản (HTML) để xuất bản nội dung trên Internet Web 1.0 không hỗ trợ nội dung có thể đọc bởi máy. Chỉ người đọc Web có thể hiểu được nội dung Trong Web 1.0, các trang Web được thiết kế để phản ứng theo bản năng dựa trên điều kiện được lập trình Hình 1: Tổng quan về web 1.0 TÌM HIỂU SEMANTIC WEB 5 2. THẾ HỆ WEB 2.0 Web 2.0 (hay Web động) chính thức được định nghĩa bởi Dale Dougherty trong một cuộc hội thảo tổ chức năm 2004. Theo đó, 2.0 là thế hệ Web mới mà người sử dụng vừa có thể đọc các thông tin hay nội dung, vừa có thể viết hay bổ sung vào đó để tạo nên những thông tin hay nội dung mới. Nói cách khác, Web 2.0 là những trang Web có khả năng tương tác với cơ sở dữ liệu Đây là thứ cấu trúc hai chiều tạo nên sự giao tiếp hay tương tác giữa người lập ra trang Web và những người sử dụng, và giữa những người sử dụng với nhau. Ở đỉnh cao Web 2.0 là những trang mạng xã hội, điển hình như Facebook, My Space, Twitter hay Daily Motion… mà những người ưa thích cùng một chủ đề có thể tìm đến với nhau để trao đổi quan điểm, hình ảnh, đoạn phim hay bổ sung những ý tưởng và lời bình luận. Các đặc tính của Web 2.0 có thể tổng kết như sau: Kiến trúc hướng dịch vụ SOA là phần cơ bản trong Web 2.0 Web 2.0 là Web xã hội. Ứng dụng Web 2.0 hướng tới tương tác nhiều hơn với người sử dụng đầu cuối Trong thuật ngữ và chiến lược Web 2.0 thì “Web là môi trường mở” Trong Web 2.0, dữ liệu là động lực. Một trong những công nghệ quan trọng là AJAX, công nghệ này hỗ trợ sự phát triển kinh nghiệm của người sử dụng tiềm năng Tuy nhiên Web 2.0 vẫn còn tồn tại nhiều hạn chế như sau: Những thông tin trên Web chỉ có người hiểu, máy không hiểu được vì không có ngữ nghĩa Việc truy nhập tới hầu hết thông tin là miễn phí và phần mềm là mở, dẫn tới các dịch vụ phải đương đầu với các thách thức về lợi nhuận Thiếu các Web server thông minh để tránh hiện tượng tắc nghẽn nút cổ chai Các thách thức về an ninh và bảo mật do sự phơi bày thông tin cá nhân/tổ chức trên Web 2.0 Cung cấp các khả năng truy vấn chưa tốt: thiếu sự biểu diễn dữ liệu tổng quát Quá tải thông tin: quá tải thông tin phân tán với chất lượng không đáng tin cậy được xem là vấn đề nghiêm trọng Không có khả năng suy luận TÌM HIỂU SEMANTIC WEB 6 Hình 2: Tổng quan về Web 2.0 3. LÝ DO CẦN CÓ SEMANTIC WEB Thông thường chúng ta sử dụng Internet với ba mục đích chính: tìm kiếm, tích hợp và khai phá dữ liệu Web. Nhưng thực tế các hoạt động này sẽ cho ta thấy được những khó khăn của môi trường Internet hiện tại một cách rõ ràng nhất. Trước tiên hãy xem xét hoạt động tìm kiếm. Khi thực hiện tìm kiếm chúng ta luôn muốn có được những kết quả đúng nhất với yêu cầu mình đưa ra. Tuy nhiên Internet được xây dựng hoàn toàn nhằm mục đích để đọc và được hiển thị theo định hướng. Các trình duyệt Web, máy chủ Web và thậm chí cả các máy tìm kiếm cũng không thực sự phân biệt được các dự báo thời tiết từ các bài báo khoa học. Khi bạn gõ từ khóa để tìm kiếm, thì kết quả trả về sẽ bao gồm tất cả các trang Web, các tài liệu có chứa từ khóa đó, mặc dù có thể nó không cùng lĩnh vực với cái mà bạn muốn tìm. Nói cách khác máy tính chỉ có thể đưa ra cho người dùng thông tin, mà không đủ hiểu được thông tin để hiển thị dữ liệu thích hợp nhất với yêu cầu của người dùng. Hoạt động thứ hai là tích hợp (integration). Khi thực hiện một chuỗi các thao tác chúng ta nhận thấy rằng cần thiết phải có sự tự động hóa nhiều hơn. Ví dụ như khi chúng ta muốn đặt vé máy bay. Chúng ta sẽ muốn có một agent tự động tìm các chuyến bay phù hợp, truy vấn giá và cuối cùng đặt vé. Tuy nhiên để có thể tự động kết hợp và gọi các ứng dụng như vậy thì bước đầu tiên là phải khám phá chúng. Nhưng mặc dù các thành phần hay các ứng dụng cần thiết để tích hợp đều tồn tại trên Internet, nhưng Internet lại không được lập trình để ghi nhớ ý nghĩa của TÌM HIỂU SEMANTIC WEB 7 những thành phần này. Đối với Internet thì các thành phần này là tương đương nhau. Hoạt động cuối cùng là khai phá dữ liệu Web. Vấn đề với hoạt động này là nó có thể rất đắt vì mỗi ứng dụng khai phá dữ liệu Web đều được phát triển đặc biệt cho một bối cảnh ứng dụng cụ thể và rất khó để sử dụng lại bất cứ thứ gì. Ngoài ra khi ý nghĩa của yếu tố dữ liệu thay đổi thì agent cũng phải thay đổi theo bởi vì nó không thể tự động học được ý nghĩa của những yếu tố dữ liệu. Từ những vấn đề trên và những nhược điểm của Web 1.0, Web 2.0 dẫn tới sự cần thiết phải xây dựng một thế hệ Web mới, Web 3.0. Web 3.0 là một tập hợp các công nghệ bao gồm các trang web ngữ nghĩa, dữ liệu liên quan, xử lý ngôn ngữ tự nhiên, trí thông minh nhân tạo, … Với thế hệ mới, web đã có thể hiểu những gì bạn đang nghĩ. B. SEMANTIC WEB 1. GIỚI THIỆU Web ngữ nghĩa là sự mở rộng của Web hiện tại mà trong đó thông tin được định nghĩa rõ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách hiệu quả hơn. Mục tiêu cả Web ngữ nghĩa là để phát triển các chuẩn chung và công nghệ cho phép máy tính có thể hiểu được nhiều hơn thông tin trên Web, sao cho chúng có thể hỗ trợ tốt hơn việc khám phá thông tin, tích hợp dữ liệu (dữ liệu liên kết động), và tự động hóa các công việc. 2. KHÁI NIỆM SEMANTIC WEB Web ngữ nghĩa được phát triển bởi Tim-Berner Lee, cha đẻ của WWW, URIs, HTTP và HTMK. Theo ông, “Web ngữ nghĩa là sự mở rộng của Web hiện tại, cho phép người dùng có thể truy tìm, phổi hợp và sử dụng lại và trích lọc thông tin một cách dễ dàng và chính xác.” 3. ƯU ĐIỂM CỦA SEMANTIC WEB i. Máy có thể hiểu được thông tin trên Web Internet ngày nay dựa hoàn toàn vào nội dung. Web hiện hành chỉ cho con người đọng chứ không dành cho máy hiểu biết. Web sẽ cung cấp ý nghĩa cho máy hiểu. . Ví dụ như: • The Beatles là một ban nhạc nổi tiếng của Liverpool. • John Lennon là một thành viên của The Beatles. • Bản nhạc “Hey Dude” do nhóm The Beatles trình bày. Semantic Web là tất cả những gì về cách tạo một Web mà cả người và máy có thể hiểu. Người dùng máy tính sẽ vẫn có thông tin trình bày theo cách trước đây, nhưng đối với máy tính, Semantic Web là ánh sáng soi rọi vào màn đêm của Web hiện hành. TÌM HIỂU SEMANTIC WEB 8 ii. Thông tin được tìm kiếm nhanh chóng, chính xác hơn Với Semantic Web, việc tìm kiếm sẽ dễ dàng nếu mọi thứ được đặt trong ngữ cảnh. Ý tưởng chính yếu là toàn bộ ngữ cảnh mà người sử dụng được biết đến. Mục tiêu của Semantic Web là phát triển các tiêu chuẩn và kĩ thuật để giúp máy hiểu nhiều thông tin trên Web hơn, để chúng tìm ra các thông tin dồi dào hơn, tích hợp, duyệt dữ liệu, và tự động hóa các thao tác. Với Semantic Web, chúng ta không những nhận được những thông tin chính xác hơn khi tìm kiếm thông tin từ máy tính, mà máy tính còn có thể tích hợp thông tin từ nhiều nguồn khác nhau, biết so sánh các thông tin với nhau. iii. Dữ liệu liên kết động Với Semantic Web, chúng ta có thể kết hợp các thông tin đã được mô tả và giàu ngữ nghĩa với bất kì nguồn dữ liệu nào. Ví dụ, bằng cách thêm các metadata (dữ liệu về dữ liệu) cho các tài liệu khi tạo ra nó, chúng ta có thể tìm kiếm các tài liệu mà metadata cho biết tác giả là Eric Miller. Cũng thế, với metadata chúng ta có thể tìm kiếm chỉ những tài liệu thuộc loại tài liệu nghiên cứu. Với Semantic Web, chúng ta không chỉ cung cấp các URI cho tài liệu như đã làm trong quá khứ mà còn cho con người, các khái niệm, các mối liên hệ. Như trong ví dụ trên, bằng cách cung cấp những định danh duy nhất cho mỗi con người như vai trò của ‘tác giả’ và khái niệm ‘tài liệu nghiên cứu’, chúng ta đã làm rõ người ở đây là ai và mối quan hệ tương ứng của người này với một tài liệu nào đó. Ngoài ra, bằng cách làm rõ người mà chúng ta đang đề cập chúng ta có thể phân biệt những tài liệu của Eric Miller với những tài liệu của những người khác. Chúng ta cũng có thể kết hợp những thông tin đã được mô tả ở nhiều site khác nhau để biết thêm thông tin về người này ở những ngữ cảnh khác nhau ví dụ như vai trò của anh ta ra sao khi anh ta là tác giả, nhà quản lý, nhà phát triển… iv. Hỗ trợ công cụ tự động hóa Ngoài ra, chúng còn cung cấp các loại dịch vụ tự động từ nhiều vùng khác nhau: từ gia đình và các thư viện kĩ thuật số cho đến các dịch vụ kinh doanh điện tử và dịch vụ sức khỏe.v.v. Semantic Web còn cung cấp các phương tiện để thêm các thông tin chi tiết lên Web nhằm hỗ trợ sự tự động hóa cho các dịch vụ. TÌM HIỂU SEMANTIC WEB 9 C. KIẾN TRÚC SEMANTIC WEB 1. MÔ HÌNH KIẾN TRÚC Hình 3: Kiến trúc Semantic Web • Lớp Unicode + URI : nhằm bảo đảm việc sử dụng tập kí tự chuẩn quốc tế và cung cấp phương pháp để định danh các đôi tượng sử dụng trong Web ngữ nghĩa. • Lớp XML : được dùng như là lớp cú pháp • Lớp RDF: thể hiện lớp dữ liệu • Lớp ontology: dựa trên một sự thoả thuận hình thức chung, xác định ý nghĩa của dữ liệu • Lớp logic: cung cấp các quy luật cho phép suy luận thông minh • Lớp proof : hỗ trợ sự trao đổi của các “proof” trong sự truyền thông liên agent • Lớp trust: chữ ký điện tử và Web tin cậy 2. CHI TIẾT CÁC LỚP 2.1. URI (UNIFORM RESOURCE IDENTIFIER) Để nhận diện các mục trên trang Web chúng ta cũng dùng các bộ nhận dạng. Vì chúng ta dùng một hệ các bộ nhận dạng như nhau và vì mỗi mục được nhận dạng được xem như một tài nguyên (resource) nên chúng ta gọi các bộ nhận diện này là các “Uniform Resource Identifiers” hay gọi tắt là URI. Chúng ta có thể xem URI là bất kỳ vật gì, và vật đó có một URI có thể được diễn đạt trên Web: người, quyển sách bạn mua tuần trước, con ruồi bay vo ve quanh ta và bất kỳ thứ gì khác có thể nghĩ đến tất cả chúng đều có thể cổ một URI. TÌM HIỂU SEMANTIC WEB 10 URI là nền tảng của Web. Trong khi gần như mọi thành phần khác của Web có thể được thay thế nhưng URI thì không: nó giữ các thành phần của Web lại với nhau. Một dạng quen thuộc của URI: đó là URL (Uniíorm Resource Locator). Một URL là một địa chỉ cho phép ghé thăm một trang Web, ví dụ như: http://www.w3.org/Addressing/. Nếu click vào nó, có thể thấy rằng một URL sẽ bảo cho máy tính nơi để tìm thấy một tài nguyên nào đó (trong trường hợp này là địa chỉ trang Web của W3C). Không giông như hầu hết các dạng khác của URI, một URL là cả định danh (identiíy) và định vị (locate). Tương phản với một “mid:” URI. Một “mid:” URI nhận dạng một thông điệp email, nhưng nó không có khả năng định vị một bản sao của thông điệp. Vì Web thì quá lớn đôi với các tổ chức trong việc kiểm soát nó nên các URI được phân quyền. Không phải một người hay tể chức kiểm soát việc tạo ra chúng hay làm thế nào để chúng có thể được sử dụng. Trong khi một vài lược đồ URI (như http:) phụ thuộc vào các hệ tập trung (như DNS) thì các lược đồ khác (như ữeenet:) hoàn toàn được phân quyền. Điều này nghĩa là không cần sự cho phép của bất cứ người nào để tạo một URI. Kê’ cả việc có thể tạo URIs cho những vật mà không sở hữu. Trong khi khả năng linh động này làm cho các URI có “sức mạnh” nhưng nổ cũng mang lại một sô" vấn đề. Bởi vì mọi người đều có thể tạo một URI, cuối cùng chắc chắn chúng ta sẽ có nhiều URT biểu diễn cùng một vật nào đó. Tệ hơn là sẽ không có cách để thấy được là hai URĨ đề cập đến cùng tài nguyên. Vì thế chúng ta sẽ không bao giờ có thể nói một cách chính xác một URI đã cho có ý nghĩa gì. Nhưng có sự thoả hiệp là phải tạo ra nó nếu chúng ta tạo một thứ gì đó “to lớn” như Semantic Web. Một cách rèn luyện phổ biến để tạo URT là bắt đầu với một trang Web. Trang này mô tả đôi tượng được nhận dạng và giải thích rằng URL của trang là URI cho đôi tượng đó. Ví dụ muôn tạo một URT cho bản sao "Weaving the Web" của Tim Bemers-Lee. Trước tiên tạo một trang Web mô tả bản sao. Tiếp theo ghi nhận rằng trang mà URL cho trang đó dùng như URI cho bản sao quyển sách. Làm điều này, chúng ta đã kết hợp URI ( http://logicerror.com/myWeavingTheWeb) với bản sao "Weaving the Web". Việc tạo một URI chỉ làm đơn giản như vậy. Có thể ghi nhận rằng trong thể hiện này URI ( http://logicerror.com/mvWeavingTheWeb) đang thực hiện hai nhiệm vụ: nó biểu diễn cả quyển sách vật lý cũng như trang Web mô tả nó. Đây là một lĩnh vực thảo luận, gọi là Vấn đề trong nhận diện Semantic Web và nó là một điểm thảo luận cho người thực hiện Semantic Web. Đây là một thực tế quan trọng cần hiểu rõ. Một URI không phải là một tập các hướng dẫn chỉ cho máy tính làm thế nào để đến được một file nào đó trên Web (dù nó cũng có thể làm được điều này). Nó là một tên (name) cho một tài nguyên (resource) (một vật). Tài nguyên này có thể hoặc không thể truy cập được qua Internet. URI có thể hoặc không thể cung cấp cách cho máy tính lấy thêm thông tin về tài nguyên đó. Một URL là một kiểu của URI mà sẽ cung cấp cách để lấy thêm thông tin về tài nguyên, hoặc có thể là cách để tự truy lục tài nguyên và các phương pháp khác để cung cấp thông tin về các URT và những tài nguyên chúng nhận thấy là chưa phát triển. Cũng chính xác khi nói rằng các URI là một phần quan trọng của Semantic Web. Nhưng không nên cho rằng một URI có thể làm bất cứ gì để cung [...]... có sẵn qua Web of Trust 17 TÌM HIỂU VỀ SEMANTIC WEB D CÔNG NGHỆ SỬ DỤNG TRONG SEMANTIC WEB 1 RDF 1.1 GIỚI THIỆU RDF Hiện tại, một trang web được tạo ra bởi một nhà lập trình viên và đi kèm với một trình duyệt web để người dùng có thể xem trang web đó Các công cụ tìm kiếm thường lùng sục qua tất cả nội dung của các trang web và tạo một cơ sở dữ liệu để giúp cho người sử dụng có thể dễ dàng tìm kiếm một...TÌM HIỂU SEMANTIC WEB cấp một bộ nhận dạng cho một tài nguyên 2.2 LỚP XML (EXTENSIBLE MARKUP LANGUAGE) XML được thiết kế là một cách đơn giản để gởi các tài liệu qua Web Nó cho phép bất kỳ người nào thiết kế định dạng tài liệu của họ và sau đó viết một tài liệu theo định dạng đó Những định dạng tài liệu này có thể bao gồm định dạng để tăng cường ý nghĩa của nội dung tài liệu Định dạng... thức cũng như khả năng lập luận hiệu quả của logic mô tả để máy có thể hiểu được tài nguyên Web 2.2 VAI TRÒ CỦA ONTOLOGY Danh sách dưới đây sẽ phân tích vai trò của ontology trong ngữ cảnh ứng dụng Web có ngữ nghĩa - Chia sẻ sự hiểu biết chung giữa các ứng dụng và con người - Cho phép sử dụng lại tri thức 33 TÌM HIỂU VỀ SEMANTIC WEB - Đưa ra các giả thiết rõ ràng về miền - Phân tách tri thức lĩnh vực... cùng một lúc Để hoàn thiện ý tưởng về vấn đề trên, W3C đang tiếp tục mở rộng và chuẩn hoá ngôn ngữ RDF - là ngôn ngữ được thiết kế để hỗ trợ “siêu dữ liệu” trên web Về cơ bản, RDF là một tập hợp các nguyên tắc dành cho ngôn ngữ đánh dấu Nó cho phép sự chia sẻ giữa các ứng dụng để trao đổi thông tin sao cho các máy có thể 18 TÌM HIỂU VỀ SEMANTIC WEB hiểu được trên web và tự động nhấn mạnh vào quá trình... thông nhất (chủ 12 TÌM HIỂU SEMANTIC WEB ngữ, vị từ, bổ ngữ) và làm cho máy tính dễ hiểu hơn Mô hình dữ liệu RDF trừu tượng biểu diễn một đồ thị gán trực tiếp Mô hình trừu tượng này là sự tuần tự độc lập, mặc dù sự tuần tự chuẩn sử dụng XML Tổng quát mô hình dữ liệu RDF đưa ra các mô hình nguyên thủy có thể được mở rộng tuỳ theo nhu cầu khá thuận tiện RDF là phần cốt lõi của Semantic Web Thật tuyệt là... chính của nó (thực chất là vị trí trên mạng của nó) Tuy nhiên, điều 20 TÌM HIỂU VỀ SEMANTIC WEB quan trọng để có thể ghi nhận thông tin về những thứ mà không như những trang web, không có vị trí mạng hay URL Web cung cấp một mẫu định danh chung cho những mục đích này, được gọi là URI, URL là một loại đặc biệt của URI Tất cả URI đều chia sẻ thuộc tính mà những người khác hay những tổ chức khác có thể... một tài nguyên như thế nào Ví dụ, nếu tài nguyên ex:index.html được tạo bởi một sự hợp tác của mốt số những thành viên hội đồng ngoài John Smith, thì example.org có thể viết những phát biểu: ex:index.html dc:creator exstaff:85740 ex:index.html dc:creator exstaff:27354 25 TÌM HIỂU VỀ SEMANTIC WEB ex:index.html dc:creator exstaff:00816 Trong phát biểu đầu tiên, thay vì xác định người tạo trang web. .. những định dạng này có thể được xứ lý như những phát biểu RDF, cho phép RDF được dùng để tích hợp dữ liệu từ nhiều nguồn 29 TÌM HIỂU VỀ SEMANTIC WEB 1.3 BẢNG TÓM TẮT CÚ PHÁP RDF Tên lớp Chú thích rdfs:Resource Lớp tài nguyên, Tất cả những gì được mô tả bằng biểu thức RDF đều là tài nguyên rdfs:Literal Lớp những giá trị Literal, ví dụ: chuỗi kí tự và các số nguyên rdf:XMLLiteral Lớp các giá trị Literal... rdfs:Resource rdf:object Tân ngữ của phát biểu RDF rdfs:Statement rdfs:Resource Bảng 2: Tóm tắt từ vựng trong RDF 31 TÌM HIỂU VỀ SEMANTIC WEB 2 ONTOLOGY 2.1 ONTOLOGY LÀ GÌ Các ontology đóng vai trò then chốt trong việc cung cấp ngữ nghĩa mà máy có thể hiểu được cho các tài nguyên của Web ngữ nghĩa Ontology là một thuật ngữ mượn từ triết học nhằm chỉ khoa học mô tả các loại thực thể trong thế giới thực... dàng tìm kiếm một số trang web mà có chứa những từ hoặc cụm từ mà họ đang cần tìm kiếm Trái lại, trong nhiều trường hợp, người sử dụng vẫn phải phân loại các kết quả tìm kiếm để lấy được những thông tin cần thiết hoặc lùng sục thật kỹ một trang web nào đó để thu được một thông tin đặc biệt nào đó mà họ cần Các trang web hiện tại đều có thể đọc được trên máy nhưng máy lại không hiểu chúng Ông Tim Berners-Lee, . <http://aaronsw.com/> ỉs dcicreator of <http://logicerror.com /semanticWeb- long> . # The new waỵ: <http://logicerror.com /semanticWeb- long> ed:hasAuthor <http://aaronsw.com/>