Mơ hình quan hệ giữa các nút và các cạnh

Một phần của tài liệu Nghiên cứu Web ngữ nghĩa và ứng dụng trong trợ giúp tìm kiếm văn bản nghiệp vụ hành chính (Trang 64 - 68)

Xuất phát từ việc đồ thị hoá nội dung của dữ liệu nên OwlDotNetApi đáp ứng được hầu hết tất cả các chuẩn mà W3C đưa ra. Tuy nhiên việc truy cập dữ liệu không thông qua câu lệnh truy vấn nên việc lập trình với thư viện này chưa thuận lợi về thời gian xử lý. OwlDotNetApi có hai phần chính là lớp chức năng và lớp giao tiếp.

Lớp chức năng của OwlDotNetApi có thể kể đến những chức năng phổ biến sau: OwlClass, OwlOntology, OwlXmlGenerator, OwlXmlParser,

InvalidOwlException, OwlDatatypeProperty...

Lớp giao tiếp của OwlDotNetApi có thể kể đến những interface thường được sử dụng sau: IowlXmlGenerator, IowlClass, IowlDatatypeProperty,

IowlOntologyProperty, IowlResource, IowlRestriction...

2.7.4 Hệ truy vấn SPARQL

SPARQL là một ngôn ngữ để truy cập thông tin từ các đồ thị RDF . SPARQL cung cấp các tính năng sau: trích thơng tin trong các dạng của URI, các nút trống hay giá trị nguyên thủy hoặc các kiểu được định nghĩa từ các giá trị nguyên thủy, trích thơng tin từ các đồ thị con và xây dựng một đồ thị RDF mới dựa trên thông tin trong đồ thị truy vấn.

2.7.4.1. Cú pháp của câu truy vấn:

Các giá trị được đặt trong dấu “<>” dùng để chỉ một định danh URI. Các giá trị được đặt trong dấu (“ ”) là các giá trị literal.

Biến trong ngơn ngữ truy vấn có giá trị tồn cục. Biến thường bắt đầu với kí tự “?” hay kí tự “$”. SPARQL cung cấp một cơ chế viết tắt. Tiếp đầu ngữ (prefix) có thể được định nghĩa và một QName sẽ cung cấp một dạng viết làm cho URI có thể ngắn gọn.

Sau đây là một cách viết tắt cho triple pattern: PREFIX dc: <http:purl.orgdcelements1.1>

Ta có thể sử dụng một cách viết tắt: PREFIX dc: <http:purl.orgdcelements1.1> PREFIX : <http:example.orgbook>

SELECT $title WHERE { :book1 dc:title $title }

2.7.4.2. Tạo một câu truy vấn đơn giản

Một câu truy vấn bao gồm 2 mệnh đề, mệnh đề SELECT và mệnh đề WHERE. Mệnh đề SELECT định danh các biến mà ứng dụng quan tâm và mệnh đề WHERE bao gồm các triple pattern. Một triple pattern là một RDF triple nhưng mỗi thành phần (subject, predicate hay object) đều có thể là một biến truy vấn. Một basic graph pattern là một tập các triple pattern.

Ngôn ngữ SPARQL dựa trên nền tảng so sánh các graph pattern. Graph pattern đơn giản nhất là các triple pattern. Một câu truy vấn có thể có hoặc khơng, một hay nhiều kết quả.

Ví dụ : Ta có một RDF triple sau:

<http:example.orgbookbook1 > <http:purl.orgdcelements1.1title> "SPARQL Tutorial" .

Câu truy vấn

SELECT ?title

WHERE{<http:example.orgbookbook1> <http:purl.orgdcelements1.1title> ?title }

Kết quả truy vấn

Title

"SPARQL Tutorial"

2.7.4.3. Blank node

Blank node có thể xuất hiện trong một mẫu truy vấn. Nó giữ vai trị như một biến, dù không được đề cập trong kết quả của câu truy vấn hay bất kỳ nơi nào ở trong graph pattern.

Blank node trong các câu truy vấn khác với với các blank node trong dữ liệu, do đó blank node trong một graph pattern không tương ứng với một blank node trong dữ liệu thơng qua một nhãn blank node.

Ví dụ

Dữ liệu:

@prefix foaf: <http:xmlns.comfoaf0.1> . _:a foaf:name "Chuong Nguyen" .

_:a foaf:mbox <mailto:nvchuong2.0> .

Truy vấn:

PREFIX foaf: <http:xmlns.comfoaf0.1> SELECT ?mbox WHERE

{ ?x foaf:name "Chuong Nguyen" . ?x foaf:mbox ?mbox }

Kết quả:

mbox mailto:nvchuong2.0

Truy vấn nhiều blank node Dữ liệu:

@prefix foaf: <http:xmlns.comfoaf0.1> . _:a foaf:name "Johnny Lee Outlaw" .

_:a foaf:mbox <mailtos:jlow@example.com> . _:b foaf:name "Peter Goodguy" .

_:b foaf:mbox <mailto:peter@example.org>.

Truy vấn:

PREFIX foaf: <http:xmlns.comfoaf0.1> SELECT ?name ?mbox

WHERE

{ ?x foaf:name ?name . ?x foaf:mbox ?mbox }

Kết quả

name mbox

"Johnny Lee Outlaw" <mailto:jlow@example.com> "Peter Goodguy" <mailto:peter@example.org>

2.7.5. Môi trường và thư viện phát triển ứng ụng cho semantic web

Web ngữ nghĩa được đánh giá và xây dựng mơ hình bởi tổ chức W3C. Tổ chức này muốn phát triển công nghệ này theo hướng chia sẻ phát triển. Tất cả

những quy tắc phát triển đều được công bố và mọi người có thể sử dụng mà khơng cần tính bản quyền. Điều này rất phù hợp với định hướng của mã nguồn mở và do vậy có rất nhiều cơng cụ hỗ trợ để phát triển ứng dụng web ngữ nghĩa.

2.8. ĐẶC TẢ HỆ THỐNG TÌM KIẾM VĂN BẢN HÀNH CHÍNH

2.8.1 Dự kiến chức năng của hệ thống

Chúng tơi kiến sẽ phát triển hệ thống tìm kiếm văn bản hành chính với các chức năng nổi bật sau :

- Hệ thống sẽ có kho dữ liệu về văn bản lớn nhất, đầy đủ nhất hành chính hiện nay.

- Hệ thống sẽ ứng dụng công nghệ web ngữ nghĩa, nhằm tạo điều kiện cho người sử dụng dễ dàng tìm kiếm với lượng thơng tin quá lớn.

- Hệ thống sẽ có chế độ học tập thơng minh, tự động thu thập thông tin từ nhiều nguồn khác nhau và tự động tổ chức dữ liệu.

- Hệ thống sẽ là diễn đàn tương tác thông minh giữa người dùng với nhau. Người sử dụng có thể thảo luận, trao đổi hoặc cung cấp thông tin qua lại với nhau.

2.8.2 Mô tả hệ thống

Cấu trúc của một máy tìm kiếm theo cơng nghệ web semantic, về cơ bản cũng có cấu trúc tương tự với một máy tìm kiếm thơng thường, bao gồm 2 thành phần chính là giao diện truy vấn và phần kiến trúc bên trong.

2.8.2.1. Giao diện truy vấn

- Cho phép người dùng nhập yêu cầu tìm kiếm. - Hiển thị kết quả tìm kiếm.

2.8.2.2. Phần kiến trúc bên trong

Đây là phần cốt lõi của máy tìm kiếm bao gồm các thành phần: phân tích u cầu, tìm kiếm kết quả cho u cầu, dữ liệu tìm kiếm, mạng ngữ nghĩa. Sự khác biệt trong cấu trúc của máy tìm kiếm ngữ nghĩa so với tìm kiếm thơng thường nằm ở phần kiến trúc bên trong, cụ thể ở 2 phần: phân tích câu hỏi và tập dữ liệu tìm kiếm.

Mơ hình được đề xuất trong luận văn cho ứng dụng tìm kiếm ngữ nghĩa như hình sau :

Một phần của tài liệu Nghiên cứu Web ngữ nghĩa và ứng dụng trong trợ giúp tìm kiếm văn bản nghiệp vụ hành chính (Trang 64 - 68)

Tải bản đầy đủ (DOC)

(92 trang)
w