Lý do phát triển web ngữ nghĩa:

Một phần của tài liệu Báo cáo kết thúc Dịch vụ web (Trang 28)

Web ngữ nghĩa là một thế hệ Web mới, đang được phát triển và sẽ xuất hiện trong tương lai gần. Hệ thống Web mới này sẽ thay thế hệ thống Web hiện tại song không có nghĩa là một hệ thống hoàn toàn khác hệ thống Web hiện tại. Web ngữ nghĩa được phát triển trên hệ thống Web hiện tại bằng cách bổ sung thêm ngữ nghĩa cho các tài nguyên Web mà máy có thể hiểu và tăng khả năng xử lý tự động.

World Wide Web (gọi tắt là Web) đã trở thành một kho tàng thông tin khổng lồ của nhân loại và một môi trường chuyển tải thông tin không thể thiếu được trong thời đại công nghệ thông tin ngày nay. Sự phổ biến và bùng nổ thông tin trên Web cũng đặt ra một thách thức mới là làm thế nào để khai thác được thông tin trên Web một cách hiệu quả, mà cụ thể là làm sao để máy tính có thể trợ giúp xử lý tự động được chúng. Muốn vậy, trước hết máy tính phải hiểu được thông tin trên các tài liệu Web, trong khi ở thế hệ Web hiện tại thông tin được biểu diễn dưới dạng chỉ con người mới đọc hiểu được.

Các chuyên gia dự đoán, bề nổi của web (surface web) chứa khoảng 1 đến 2 tỷ trang tài liệu trong khi, ở phần sâu của web thì chứa đến 550 tỷ trang tài liệu. Có khoảng 200.000 website có tầng thông tin sâu, khoảng hơn 1/2 số thông tin này nằm trong các cơ sở dữ liệu có chủ đề riêng biệt. Khoảng 95% thông tin trong các website có tầng thông tin sâu cho phép đa số người dùng có thể khai thác miễn phí. Nhưng hiện nay, hầu hết các công cụ tìm kiếm tài liệu trên web được coi là tìm kiếm hiệu quả cũng chủ yếu tìm kiếm được trên bề nổi của web. Trong khi ở tầng sâu của web chứa một khối lượng thông tin khổng lồ và thường rất có giá trị cho các nhà nghiên

thông tin tìm kiếm được không theo chủ đề mà chỉ là vấn đề tìm thoả theo từ khoá đơn thuần, kết quả tìm kiếm phải do con người chọn lại theo chủ đề mong muốn.

Chính những vấn đề này đã thúc đẩy sự ra đời của ý tưởng Web ngữ nghĩa (Semantic Web), một thế hệ mới của Web, mà chính cha đẻ của World Wide Web là Tim Berners- Lee đề xuất vào năm 1998. Web ngữ nghĩa là sự mở rộng của Web hiện tại mà trong đó thông tin được định nghĩa rõ ràng sao cho con người và máy tính có thể cùng làm việc với nhau một cách hiệu quả hơn. Mục tiêu của Web có ngữ nghĩa là để phát triển các chuẩn chung và công nghệ cho phép máy tính có thể hiểu được nhiều hơn thông tin trên Web, sao cho chúng có thể hỗ trợ tốt hơn việc khám phá thông tin, tích hợp dữ liệu, và tự động hóa các công việc.

Vi dụ: Khi tìm kiếm từ khóa “Viet Nam” trên trang web google.com nó sẽ cho ra

nhiều kết quả tìm kiếm khác nhau như: đất nước Việt Nam, hội phật giáo Việt Nam,… Còn khi tìm kiếm với trang web http://www.wolframalpha.com/ - một trang web tìm kiếm ngữ nghĩa thì kết quả chỉ có duy nhất là một đó là đất nước Việt Nam

Như vậy với Semantic Web, việc tìm kiếm sẽ trở nên dễ dàng và chính xác hơn. Mục tiêu của Semantic web là phát triển các tiêu chuẩn và kĩ thuật để giúp máy hiểu nhiều thông tin trên web hơn, để chúng ta tìm ra các thông tin dồi dào hơn, tích hợp duyệt dữ liệu và tự động hóa các thao tác .

Một phần của tài liệu Báo cáo kết thúc Dịch vụ web (Trang 28)

Tải bản đầy đủ (DOC)

(39 trang)
w