luận văn xây dựng web ngữ nghĩa cho việc tra cứu thông tin web du lịch đồng bằng sông cửu long

Bên cạnh đó cùng với sự phát triển của công nghệ thông tin đặc biệt là Internet thì việc ứng dụng công nghệ thông tin để xây dựng website tra cứu thông tin về đu lịch là rất cần thiết đ

Các ngôn ngữ biểu diễn Ontology cho Web có ngữ nghĩa

Ontology đóng vai trò thiết yếu trong việc cung cấp tài nguyên có thể truy cập và xử lý tự động, bằng cách cung cấp một bộ từ vựng đánh dấu ngữ nghĩa cho Web ngữ nghĩa Tuy nhiên, để biểu diễn cho quá trình phát triển Web ngữ nghĩa, cần phải có một ngôn ngữ chuẩn để biểu diễn linh hoạt và đa dạng các tài nguyên Web.

Trong quá trình chuân hoá ngôn ngữ biểu điễn Ontology, một số ngôn ngữ được đề xuất với các khả năng biểu diễn tăng dần như: RDES, DAML+OIL, OWL,

và tiếp tục được mở rộng trong tương lai Các ngôn ngữ này có khả nắng biểu diễn tăng dần nhưng tương ứng là khả năng quyết định giảm dần (độ phức tạp tăng dần) Các ngôn ngữ biểu diễn Ontology được xây dựng phải cân bằng được khả năng biểu điễn và độ phức tạp tính toán Các ngôn ngữ này được xây dựng trên nền các chuẩn XML, RDE và thường sử dụng cơ sở lô-gíc mô tả để biểu diễn ngữ nghĩa và hỗ trợ lập luận.

Phát triển nâng cao Semantic Web - cceeerieerirere 19

Các công việc chuẩn hoá các ngôn ngữ biểu diễn dữ liệu XML, siêu đữ liệu

RDF hay ngôn ngữ biểu diễn Ontology là các công việc nền tảng, cơ sở tạo ra chuẩn chung cơ sở để phát triển hệ thông và các ứng dụng trên Web ngữ nghĩa Việc đưa các chuẩn đó thành các thê hiện, các sản phẩm của hệ thống Web ngữ nghĩa là công việc của SWAD SWAD thực hiện nghiên cứu và đưa ra các thể hiện của Web ngữ nghĩa trên công nghệ cơ sở và nó cũng bổ sung, hoàn thiện các công nghệ cơ sở này Nó chỉ ra các công nghệ Web ngữ nghĩa được sử dụng như thế nào? Mục tiêu cụ thể của SWAD là sử dụng các công nghệ, kỹ thuật và các công cụ hiện có của Web ngữ nghĩa để tạo ra các chương trình vượt xa hơn tầm hiện có, phát triển các thể hiện thực tiễn và cung cấp các công cụ và các chuẩn mới cho SW

CÔNG CỤ, MÔI TRƯỜNG, THƯ VIỆN VÀ NGÔN NGỮ <1 9 9098.9998948 669996 08009 00.09666999499980990000004989900400000000090000040000000894 20

Protégé - Công cụ xây dựng ontologyY .-. -ex+-eceeseeeser 20

Hiện nay có rất nhiều phần mềm hỗ trợ xây dựng ontology Một trong những phần mềm được sử dụng nhiều nhất là Protégé-OWL a Dac điểm của Protégé Đây là phần mềm miễn phí dùng để tạo ra các mô hình và các ứng dụng bằng cách sử dụng các ontology Protégé được phát triển bởi trường Đại hoc Stanford và Mark Musen Chức năng nỗi bật nhất của phần mềm này là cho phép người dùng sử dụng tạo ra các ontology để phát triển web ngữ nghĩa theo đúng chuẩn của ngôn ngit W3C OWL

Protégé có hai phiên bản OWL va API Phién ban trudc cua Protégé -OWL là Protégé-API mà nội dung có nền tảng từ OKBC (Open Knowledge Base Connectivity) OKBC là một ứng dụng lập trình giao tiếp thực hiện truy xuất dữ liệu thông minh [5]

Phiên bản Protégé -OWL phát triển đựa trên những gì đã có của phiên bản trước và nó mở rộng hơn rất nhiều so với phiên bản trước đây là chỉ cho phép xây dựng các lớp Protégé-OWL được phát triển dựa trên hai yêu cầu chính Đầu tiên là yêu cầu định nghĩa các đối tượng và quan h ệ tồn tại giữa chúng Sau đó là yêu c au xây dựng các đặc điểm kỹ thuật phục vụ ý tưởng chia sẻ théng tin

Các đối tượng xây dựng chính của Protégé là :

- Classes — tổ chức các quan hệ tham chiếu và các kiểu thực thi - Axioms — mô hình câu lệnh đúng

- Instances — các thể hiện, các thành phần của đối tượng - Domain — giới hạn của ontology

- Vocabulary — các lớp và khai báo b Protégé str dung giao dién dé hoa

Ngay tir phién ban Protégé API, thi phan mềm Protégé đã không chỉ cho phép tạo mô hình bằng cách thủ công (nhập bằng văn bản ) mà nó còn cho phép người sử dụng giao diện dé hoa dé phat triển Một trong những cơ sở của việc lập trình bằng giao diện đồ họa với Protégé là cơ chế tạo lớp _ nó cho phép người lập trình giao tiếp rõ ràng với những sự kiện thay đồi c Protégé phát triển để tích hợp các công cụ

Mục đích của Protégé là hỗ trợ người phát triển tạo ra được các ontology một cách dễ dàng nhất Ban đầu đó là vấn đề giao diện đồ họa _, tiếp nữa đó là những công cụ thêm vào để tạo ra các chức năng đặc biệt khác Protégé cung cấp một số điểm mở rộng nơi các nhà phát triển có thể chủ động thêm các thành phần mà ta thường gọi là plug-ins Những plug-ins sau thường được các nhà phát triển semantic web sir dung : Tab widget plug-ins, Slot widget plug-ins, Project plug-in, Resource action plug-in, Resource display plug-ins, ontology test plug-ins, Result panel plug- ins, Conditions widget extension plug-ins

Thư viện SemWeb

SemWeb lần đầu tiên được phát hành vào tháng sáu năm 2005 và đã được thử nghiệm gần đây hơn với những bộ lưu trữ hơn một tỉ bộ ba Các tính năng cốt lõi như đọc ghi dữ liệu XML với bộ ba RDF, liên tục lưu trữ đữ liệu với nền tảng

Các truy vấn SQL và SPARQL cơ bản đã được kiểm tra kỹ lưỡng Các chức năng bên ngoài như hoạt động RDFS hoặc hoạt động backware-chaining đã được sử dụng nhưng ít được thử nghiệm và không hoàn thiện Thư viện không có công cụ cụ thể dành riêng cho lược đồ OWL và nó hoạt động ở cấp bộ ba của RDF.

SemWeb được bản quyền hoá theo giấy phép GNU GPL Tuy nhiên trong

Phần mềm SemWeb thường dựa vào các thư viện bên ngoài như SPARQL, do đó phải tuân theo giấy phép của các phần mềm này.

- SemWeb rat dé triển khai SemWeb cung cắp mã nguồn mở và thư viện đã được dịch ra DLL Người ding có thể hiệu chỉnh mã nguồn đề sử dụng

- RDF / XML : Đọc và viết RDF/XML (bao gồm cả XMP) Máy đọc theo luồng, có nghĩa là toàn bộ tài liệu không bao giờ cần phải được nạp vào bộ nhớ

Việc phân tích cú pháp đáp ứng được tất cả các tiêu chuân của W3C

- Bộ ba : Đọc và viết NTriples, Turtle, va hau hét cdc ký hiệu bộ ba (trong tất cả các dòng vào khoảng 20.000 bảngiây) Xác Nhận của IRIS và XSD trong việc định đạng kiểu đữ liệu đơn giản trong file đọc (hoặc khi có yêu cầu)

- Dữ liệu được lưu trữ một cách liên tục theo nền tảng của SQL DB như SQL Server, MySQL, SQLite, va PostgreSQL Viée lu trit MySQL cé thể đạt mức một tỉ bộ ba

- Hỗ trợ lưu trữ liên tục như một hoạt động mở rộng để truy vẫn với nhiều điều công việc cùng một lúc thì sẽ nhanh hơn nhiều so với thực hiện một truy vấn đến từng vấn đề riêng

- 4-Tuples : Khai báo là bộ bốn, không phải ba Trường meta thứ tư có thé được sử dụng cho mục đích ứng dung cụ thể, như nguồn gốc lưu trữ, nhóm báo cáo, hoặc lưu trữ các công thức của bộ ba

- Truy vấn : Mô hình kế thừa đơn giản, kiểm tra và truy van SPARQL 6 bat kỳ nguồn đữ liệu nào bằng việc dịch các truy vấn thành SQL khi có yêu cầu Với một nguồn dữ liệu từ xa thì SPARQL cũng có thể truy vấn thông qua giao thức của máy chủ ASP.NET SPARQL

- Thêm truy vấn : Truy vấn d ữ liệu trên một ngu ồn riêng nào đó b ằng cách chạy bất kỳ truy vấn trên một dữ liệu ban đầu và cho phép thêm những nguồn đữ liệu mới bằng AddSource

- Khả năng mở rộng : Thực hiện lưu trữ đữ liệu mới liên tục hoặc bằng câu

Creating RDE statements is as simple as implementing an interface The following example creates some RDE statements and adds them to a memory store It then writes the statements out as XML/RDE to the console.

Entity computer = new Entity("http:example.orgcomputer");

Entity says = "http:example.orgsays";

Entity wants = "http:example.orgwants";

Entity description = new Entity("http:example.orgdescription"); store.Add(new Statement(computer, says, (Literal)"Hello world!")); store.Add(new Statement(computer, says, (Literal)"This is my demo Semweb!")); store.Add(new Statement(computer, wants, desire)); store.Add(new Statement(desire, description, (Literal)"to be human")); store.Add(new Statement(desire, RDF+"type",

(Entity)"http:example.orgDesire")); using (RdfWriter writer = new RdfXmlWriter(Console.Out)) { writer Namespaces AddNamespace("http:example.org”, "ex"); writer Write(store);

1.4.3 Giao diện lập trình ứng dụng OwiDotNetApi OwIDotNetApi là một giao diện lập trình ứng dụng với bộ phân tích cú pháp viết bằng C# theo công nghệ NET dựa trên phân tích cú pháp RDF Drive Hoan toàn phù hợp với đặc điểm kỹ thuật của W3C a Phiên bản

20.05.2005 — Phiên bản đầu tiên của bộ phân tích cú pháp OWL

17.06.2005 — Thêm vào một bộ phát sinh ở phần này

25.03.2006 — Xây dựng trang web để giới thiệu công cụ này b Chức năng

Mục tiêu của OwlDotNetApi là đọc ghi dữ liệu của XML dựa trên đồ thị với các cạnh tương ứng với thuộc tính liên kết và các đỉnh tương ứng với các nút hay còn gọi là các lớp

Hình 1.6 Mô hình quan hệ giữa các nút và các cạnh

Hệ truy vấn SPARQL :-555ccccterrrrrerrreerrreerrirrrierrie 25

SELECT ?mbox WHERE { 2x foaf:name "Chuong Nguyen"

?x foaf:mbox ?mbox } Két qua: mbox mailto:nvchuong2.0

Truy vấn nhiéu blank node Dữ liệu:

@prefix foaf: _:a foaf:name "Johnny Lee Outlaw" _:a foaf:mbox _:b foaf:name "Peter Goodguy"

_:b foaf:mbox

PREFIX foaf:

{ ?x foaf:name ?name 2x foaf:mbox ?mbox } Kết quả name mbox

"Johnny Lee Outlaw"

"Peter Goodguy” mailto:peter@example.org

ONTOLOGY .cnseĂĂ 5n A0 6890823008809006668900000009900099 27

Phân loại Ontology . ‹s< sen 30

31 lõi nhất được tổng kết theo hình như sau:

[ Fep-tevel Ontology |) Top-level Ontology ew

Hình 1.7 Minh họa phân loại Ontology - Top-lever Ontology (Ontology lép cao): Nhằm diễn tả những khái niệm tổng quan trừu tượng có thé duoc chia sé qua nhiều lĩnh vực và ứng dụng Nó mượn các ý niệm triết học mô tả những khái niệm lớp cao cho mọi vật về sự tồn tại của chúng như đối tượng vật chất hay đối tượng trừu tượng như là các ý niệm có đặc điểm chung về tri thức nhận thức thông thường về hiện tượng như thời gian, không gian, các tiến trình Do sự tổng quan đó, nó không sử dụng trực tiếp trong các ứng dụng mà thông qua các Ontology khác

- Domain Ontology và Tasl Onfology : Các loại Ontology này lấy tri thức từ trong những lĩnh vực xác định, như trong y khoa, địa lý hay tri thức về một tác vụ riêng biệt như sự chuẩn hóa hoặc sự cấu hình Về mặt ý tưởng thi Ontology loai nay thu hẹp hơn và xác định so với Top-level Ontology Sự khái niệm hóa trong một Domain Ontology là giữ các tác vụ độc lập khi những ý niệm trong một tác vụ Ontology được miêu tả không có tính chất rõ rệt với chỉ tiết cụ thể về một lĩnh vực

Sự phát triển của Domain Ontology được thực hiện nhiều ở các lĩnh vực: y học, đi truyền, địa lý, du lịch, thông tin môi trường Còn Task Ontology được thực hiện cho các tác vụ xây dựng, sắp xếp kế hoạch làm việc, giám sát trong một lĩnh vực khoa học, cơ sở tri thức máy tính dạy học,

- Application Ontology : Cung cấp một bộ từ vựng xác định được yêu cau dé mô tả sự ban hành các tác vụ chắc chắn trong một ngữ cảnh ứng dụng cụ thé Dac biét, nd st dung cd Domain Ontology va Task Ontology va m6 ta vai tro cua ching trong một tắc vụ cụ thé 7

OWL là một ngôn ngữ gần như XML dùng để mô tả các hệ cơ sở tri thức OWL là một ngôn ngữ đánh dấu dùng để xuất bản và chia sẻ đữ liệu trên Internet thông qua những mô hình dữ liệu gọi là “Ontology” Ontology mô tả một lĩnh vực

(Domain) và diễn tả những đối tượng trong lĩnh vực đó cùng những mối quan hệ giữa các đối tượng này OWL là phần mở rộng vẻ từ vựng của RDF và được kế thừa từ ngôn ngữ DAML+OIL Web Ontology — Dự án được hỗ trợ bởi W3C OWL biểu diễn ý nghĩa của các thuật ngữ trong các từ vựng và mối liên hệ giữa các thuật ngữ này để đảm bảo phù hợp với quá trình xử lý bởi các phần mềm

OWL được xem như là một kỹ thuật trọng yếu để cài đặt cho Web ngữ nghĩa trong tương lai OWL được thiết kế đặc biệt để cung cấp một cách thức thông dụng trong việc xử lý nội dung thông tin của Web Ngôn ngữ này được kỳ vọng rằng sẽ cho phép các hệ thống máy tính có thể đọc được thay thế cho con người Vì OWL được viết bởi XML, các thông tin OWL có thé dễ đàng trao đổi giữa các kiểu hệ thống máy tính khác nhau, sử dụng các hệ điều hành và các ngôn ngữ ứng dụng khác nhau Mục đích chính của OWL là sẽ cung cấp các chuẩn để tạo ra một nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và dé chia sẻ cũng như tái sử dụng đữ liệu trên Web OWL được phát triển bởi nó có nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDE và RDES và vì OWL ra đời sau các ngôn ngữ này, nó có khả năng biểu diễn các nội dung mà máy có thể biểu diễn được trên Web

Hién nay cé ba loai OWL: OWL Lite, OWL DL (Description Logic), va OWL

Full Các phiên bản này tách biệt về các tiện ích khác nhau, OWL Lite là phiên bản dễ hiểu nhất và phức tạp nhất là QWL Full [5]

Trong chuong nay ching ta tim hiểu về những hạn chế của web hiện tại dẫn đến sự ra đời của SW, tìm hiểu các công cụ xây dựng SW, tìm hiểu search và hệ hỏi-đáp Bên cạnh đó tìm hiểu cấu trúc của RDF, RDFS và cú pháp của ngôn ngữ

Truy vấn dữ liệu SPARQL cung cấp 33 ràng buộc để hỗ trợ phát triển các ứng dụng truy vấn thông qua ngôn ngữ này Các ràng buộc tìm kiếm và hệ thống hỏi đáp đóng vai trò quan trọng trong việc xây dựng các ứng dụng tra cứu hiệu quả.

Ngoài ra, đã nêu được định nghĩa Ontology và các thành phần quan trọng của Ontology, từ đó đề xuất phương pháp xây dựng Ontology.

CHUONG 2 TiM HIEU DU LICH DONG BANG SONG CUU LONG VA

GIAI PHAP XAY DUNG UNG DUNG TRA CUU THONG

2.1 TIM HIEU DU LICH ĐBSCL

Theo luật Du lịch Việt Nam năm 2005: Du lịch là các hoạt động có liên quan đến chuyến đi của con người ngoài nơi cư trú thường xuyên của mình nhằm đáp ứng nhu cầu tham quan, tìm hiểu, giải trí, nghỉ dưỡng trong một khoảng thời gian nhất định

2.1.2 Các loại hình du lịch ĐBSCL,

Du lịch tìm hiểu văn hóa

Du lịch tham quan miệt vườn, sông nước, du lịch cộng đồng Du lịch tham quan di tích lịch sử cách mạng

Du lịch lễ hội, tín ngưỡng

Du lịch thương mại, công vụ

Du lịch nghỉ dưỡng biển đảo 2.1.3 Tiềm năng du lịch ĐBSCL

Với tiềm năng phát triển du lịch ĐBSCL rất lớn, thu hút du khách trong nước và quốc tế cao Cho nên cần phải đây mạnh các chương trình xúc tiến và quảng bá du lịch sâu rộng nhằm quảng bá các hình ảnh du lịch ĐBSCL Cần sự quan tâm các cấp chính quyền, cụ thê Sở VH-TT&DL của 13 tỉnh ở khu vực ĐBSCL đưa ra các giải pháp, các chương trình xúc tiến và quảng bá một cách hiệu quả

2.1.4 Hiện trạng phát triển du lịch ĐBSCL

Theo báo cáo của Bộ VH-TT&DL trong năm 2013, du lịch ĐBSCL đã đón được 9,236 triệu lượt khách (trong đó lượng khách quốc tế đạt 1,222 triệu lượt

35 khách) Trong năm 2011, các tỉnh thành trong khu vực đã đón tiếp hơn 17,4 triệu lượt khách (trong đó có hơn 1,4 triệu lượt khách quốc tế) tăng 11,48% so với năm 2010

Khách quốc tế đến vùng ĐBSCL chủ yếu tập trung ở các tỉnh Tiền Giang, Vĩnh Long, Bến Tre, Cần Thơ, Kiên Giang Trong khi đó, khách nội địa đến ĐBSCL hằng năm tương đối thấp, tuy nhiên khách nội địa chỉ tập trung đông các dịp lễ hội như: Lễ hội vía bà chúa Xứ (An Giang), Lễ hội đua bò Bảy Núi (An Giang), Lễ hội

Ok Om Bok và đua ghe ngo Sóc Trăng, Lễ Chon Chnam Thmay (người Khmer) 2.1.5 Nhu cầu việc tra cứu thông tin du lịch ĐBSCL

Việc tra cứu các thông tin du lịch, các địa điểm, địa danh du lịch nổi tiếng ở ĐBSCL, các thông tin này chưa thật sự hấp dẫn, thu hút đối với du khách trong và ngoài nước, các sinh viên ở trường đại học, cao đẳng có đào tạo các chuyên ngành Du lịch, muốn tra cứu về du lịch sinh thái, tìm hiểu văn hóa, tham quan di tích lịch sử, lễ hội, tín ngưỡng Tuy nhiên nhu cầu tra cứu các thông tin du lịch ĐBSCL là rất lớn, mà các thông tin nằm rải rác khắc nơi, không tập trung cho nên việc tra cứu tìm kiếm tư liệu có liên quan rất khó khăn

2.1.6 Hiện trạng hệ thống phục vụ tra cứu thông du lịch ĐBSCL

Hiện nay, chưa có hệ thống chuyên biệt để phục vụ tra cứu thông tin du lịch ĐBSCL, cho nên việc tra cứu thông qua các trang website các Sở VH-TT&DL 12 tỉnh hoặc trang web Hiệp hội du lịch ĐBSCL hoặc Google Vì thế, việc tra cứu ở các website này thì bộc lộ những hạn chế nhất định vì có rất ít đường link liên kết các website khác và chỉ cung cấp thông tin chưa cung cấp tri thức có liên quan

2.2 PHÂN TÍCH KHẢ NĂNG ỨNG DỤNG CỦA SEMANTIC WEB

2.2.1 Đặt vấn đề a Đối tượng sử dụng Với luận văn này ta thấy đối tượng sử dụng r ất rộng lớn, có thể là tất cả du khách trên mọi miên, hoặc bất kì ai khác muốn quan tâm tìm hiểu về du lịch Đồng bằng sông Cửu Long

TÌM HIẾU DU LỊCH ĐBSCL - -s ° -°-°<<<° 34

Các loại hình du lịch ĐBSCLL +-+-+sestetrtrerreee 34

Du lịch tìm hiểu văn hóa

Du lịch tham quan miệt vườn, sông nước, du lịch cộng đồng Du lịch tham quan di tích lịch sử cách mạng

Du lịch lễ hội, tín ngưỡng

Du lịch thương mại, công vụ

Tiềm năng du lịch ĐBSCL :-55+ccsrerrrrrrrrrrrrrrrrrrie 34

Với tiềm năng phát triển du lịch ĐBSCL rất lớn, thu hút du khách trong nước và quốc tế cao Cho nên cần phải đây mạnh các chương trình xúc tiến và quảng bá du lịch sâu rộng nhằm quảng bá các hình ảnh du lịch ĐBSCL Cần sự quan tâm các cấp chính quyền, cụ thê Sở VH-TT&DL của 13 tỉnh ở khu vực ĐBSCL đưa ra các giải pháp, các chương trình xúc tiến và quảng bá một cách hiệu quả

2.1.4 Hiện trạng phát triển du lịch ĐBSCL

Theo báo cáo của Bộ VH-TT&DL trong năm 2013, du lịch ĐBSCL đã đón được 9,236 triệu lượt khách (trong đó lượng khách quốc tế đạt 1,222 triệu lượt

35 khách) Trong năm 2011, các tỉnh thành trong khu vực đã đón tiếp hơn 17,4 triệu lượt khách (trong đó có hơn 1,4 triệu lượt khách quốc tế) tăng 11,48% so với năm 2010

Khách quốc tế đến vùng ĐBSCL chủ yếu tập trung ở các tỉnh Tiền Giang, Vĩnh Long, Bến Tre, Cần Thơ, Kiên Giang Trong khi đó, khách nội địa đến ĐBSCL hằng năm tương đối thấp, tuy nhiên khách nội địa chỉ tập trung đông các dịp lễ hội như: Lễ hội vía bà chúa Xứ (An Giang), Lễ hội đua bò Bảy Núi (An Giang), Lễ hội

Ok Om Bok và đua ghe ngo Sóc Trăng, Lễ Chon Chnam Thmay (người Khmer) 2.1.5 Nhu cầu việc tra cứu thông tin du lịch ĐBSCL

Nhu cầu tìm kiếm thông tin du lịch về ĐBSCL rất cao, nhưng các thông tin này lại rải rác ở nhiều nơi, gây khó khăn cho việc tra cứu Hiện tại, các thông tin về du lịch ĐBSCL chưa thực sự hấp dẫn và thu hút du khách trong và ngoài nước, cũng như sinh viên chuyên ngành Du lịch đang có nhu cầu tìm hiểu về du lịch sinh thái, văn hóa, di tích lịch sử, lễ hội và tín ngưỡng.

2.1.6 Hiện trạng hệ thống phục vụ tra cứu thông du lịch ĐBSCL

Hệ thống mong muốn phát triển để cung cấp thông tin đầy đủ chính xác về thông tin du lịch Đồng bằng sông Cửu Long Dữ liệu của trang web sẽ được thu thập trên internet và có sự kiểm tra và hiệu chỉnh bởi các quản trị viên b Yêu cầu bài toán

“Xây dựng web ngữ nghĩa cho việc tra cứu thông tin web du lịch đồng bằng sông Cửu Long” gồm các yếu tố sau : địa điểm du lịch, các hoạt động du lịch, loại hình dịch vụ

Hệ thống được xây đựng trên nền web, gồm 2 chức năng chính:

- Quản lý thông tin (dành cho Admin): o Thêm, chỉnh sửa, xóa thông tin du lịch o_ Thu thập thông tin văn bản: tự động thu thập thông tin du lịch trên Internet (nằm trong các website) và tự nhập bằng tay

- Tìm kiếm thông tin du lịch: cung cấp công cụ tìm kiếm theo ngữ nghĩa để người sử dụng tìm kiếm một cách đơn giản nhất

Chức năng tìm kiếm phải đáp ứng hai yéuc 4u chính đó là tìm kiếm cơ b ản và tìm kiếm nâng cao Tìm kiếm cơ bản phải đưa ra được kết quả sát với từ khóa người dùng nhập vào Tìm kiếm nâng cao phải cung cấp được những dữ liệu liên quan thỏa mãn nhu cầu của người dùng

2.2.2 Phân tích vẫn đề a Vấn đề về dữ liệu

Nếu lập trình với web 2.0, đữ liệu được xây dựng trên các hệ quản trị cơ sở dữ liệu như MySQL, SQLServer, Thông tin được lưu trữ dưới dạng bảng, trong đó, mỗi hàng là một bộ không giới hạn về số lượng thành phân, không có sự đồng nhất, chính vì thế mà khả năng thay đổi như thêm, bớt các quan hệ là rất khó thực thi Web 2.0 hiện tại chỉ dành cho người đọc mà không dành cho máy hiểu Dữ liệu lưu trữ theo phương pháp truyền thống không có khả năng hiểu được ý nghĩa phía sau của các thông tin.

37 b Van dé vé tim kiém

Với các công cụ tìm kiếm thông thường, độ chính xác của kết quả tìm kiếm còn thấp, đòi hỏi người dùng phải tự sàng lọc để tìm thông tin chính xác hoặc trải qua nhiều bước tìm kiếm Quá trình tìm kiếm thường dựa trên sự so sánh từ khóa của người dùng với dữ liệu trong cơ sở dữ liệu, do đó người dùng cần sử dụng chính xác từ khóa để có được kết quả mong muốn.

Hiện nay, đa số các máy tìm kiếm đều cho phép người sử dụng có thể tạo các câu truy vẫn gồm các từ khóa tìm kiếm, tuy nhiên, phương pháp này gặp phải những van dé sau:

- Mỗi từ khóa có thể có một hay nhiều nghĩa tùy theo từng ngữ cảnh

- Bộ máy tìm kiếm không thẻ hiện mối quan hệ giữa các từ khóa với nhau

- Thông tin có cùng ý nghĩa với từ khóa nhưng không nằm trong kết quả trả về

Từ những khó khăn nêu trên, nhận thấy rằng, nếu chọn giải pháp xây dựng website này với công nghệ web 2.0 và cơ sở đữ liệu quan hệ thì rất khó Giải pháp đưa ra là sử dụng công nghệ semantic web để giải quyết bài toán hiệu quả hơn Với một website ứng dyng semantic web, con người có thé doc va hon thé, may tinh cũng có thể hiểu được thông tin

Semantic web lưu trữ dữ liệu dưới định dạng RDE, đòi hỏi các bảng phải được chia nhỏ theo đúng câu trúc bộ ba Sự lưu trữ này có ưu thế hơn so với lưu trữ đữ liệu truyền thống như:

Tổ chức đữ liệu đơn giản, đồng nhất nên thông tin được dễ dàng thêm bớt, chỉnh sửa

Cấu trúc bộ ba của RDF giúp cho thông tin dễ truy xuất bởi các hệ thống suy luận, tìm kiếm ngữ nghĩa Cũng nhờ vậy mà những bộ xử lí RDE có thể suy luận ra những thông tin mới không có trong hệ dữ liệu

Nhu cầu việc tra cứu thông tin du lịch ĐBSCL

Việc tra cứu các thông tin du lịch, các địa điểm, địa danh du lịch nổi tiếng ở ĐBSCL, các thông tin này chưa thật sự hấp dẫn, thu hút đối với du khách trong và ngoài nước, các sinh viên ở trường đại học, cao đẳng có đào tạo các chuyên ngành Du lịch, muốn tra cứu về du lịch sinh thái, tìm hiểu văn hóa, tham quan di tích lịch sử, lễ hội, tín ngưỡng Tuy nhiên nhu cầu tra cứu các thông tin du lịch ĐBSCL là rất lớn, mà các thông tin nằm rải rác khắc nơi, không tập trung cho nên việc tra cứu tìm kiếm tư liệu có liên quan rất khó khăn.

Hiện trạng hệ thống phục vụ tra cứu thông du lịch ĐBSCL

Hệ thống mong muốn phát triển để cung cấp thông tin đầy đủ chính xác về thông tin du lịch Đồng bằng sông Cửu Long Dữ liệu của trang web sẽ được thu thập trên internet và có sự kiểm tra và hiệu chỉnh bởi các quản trị viên b Yêu cầu bài toán

“Xây dựng web ngữ nghĩa cho việc tra cứu thông tin web du lịch đồng bằng sông Cửu Long” gồm các yếu tố sau : địa điểm du lịch, các hoạt động du lịch, loại hình dịch vụ

Hệ thống được xây đựng trên nền web, gồm 2 chức năng chính:

- Quản lý thông tin (dành cho Admin): o Thêm, chỉnh sửa, xóa thông tin du lịch o_ Thu thập thông tin văn bản: tự động thu thập thông tin du lịch trên Internet (nằm trong các website) và tự nhập bằng tay

- Tìm kiếm thông tin du lịch: cung cấp công cụ tìm kiếm theo ngữ nghĩa để người sử dụng tìm kiếm một cách đơn giản nhất

Chức năng tìm kiếm phải đáp ứng hai yéuc 4u chính đó là tìm kiếm cơ b ản và tìm kiếm nâng cao Tìm kiếm cơ bản phải đưa ra được kết quả sát với từ khóa người dùng nhập vào Tìm kiếm nâng cao phải cung cấp được những dữ liệu liên quan thỏa mãn nhu cầu của người dùng

2.2.2 Phân tích vẫn đề a Vấn đề về dữ liệu

Nếu lập trình với web 2.0, đữ liệu được xây dựng trên các hệ quản trị cơ sở dữ liệu như MySQL, SQLServer, Thông tin được lưu trữ dưới dạng bảng, trong đó, mỗi hàng là một bộ không giới hạn về số lượng thành phân, không có sự đồng nhất, chính vì thế mà khả năng thay đổi như thêm, bớt các quan hệ là rất khó thực thi Web 2.0 hiện tại chỉ dành cho người đọc mà không dành cho máy hiểu Dữ liệu lưu trữ theo phương pháp truyền thống không có khả năng hiểu được ý nghĩa phía sau của các thông tin.

37 b Van dé vé tim kiém

Với những hệ tìm kiếm truyền thống, độ chính xác của kết quả tìm kiếm không cao, người sử dụng cần phải tự mình chọn lọc tìm ra thông tin chính xác cần tìm hoặc phải qua rất nhiều bước tìm kiếm Việc tìm kiếm thường là so sánh từ khóa của người dùng với đữ liệu có sẵn trong CSDL, nên người dùng phải sử dụng chính xác từ khóa để có thể nhận được kết quả tìm kiếm mong muốn

Hiện nay, đa số các máy tìm kiếm đều cho phép người sử dụng có thể tạo các câu truy vẫn gồm các từ khóa tìm kiếm, tuy nhiên, phương pháp này gặp phải những van dé sau:

- Mỗi từ khóa có thể có một hay nhiều nghĩa tùy theo từng ngữ cảnh

- Bộ máy tìm kiếm không thẻ hiện mối quan hệ giữa các từ khóa với nhau

- Thông tin có cùng ý nghĩa với từ khóa nhưng không nằm trong kết quả trả về

Từ những khó khăn nêu trên, nhận thấy rằng, nếu chọn giải pháp xây dựng website này với công nghệ web 2.0 và cơ sở đữ liệu quan hệ thì rất khó Giải pháp đưa ra là sử dụng công nghệ semantic web để giải quyết bài toán hiệu quả hơn Với một website ứng dyng semantic web, con người có thé doc va hon thé, may tinh cũng có thể hiểu được thông tin

Semantic web lưu trữ dữ liệu dưới định dạng RDE, đòi hỏi các bảng phải được chia nhỏ theo đúng câu trúc bộ ba Sự lưu trữ này có ưu thế hơn so với lưu trữ đữ liệu truyền thống như:

Tổ chức đữ liệu đơn giản, đồng nhất nên thông tin được dễ dàng thêm bớt, chỉnh sửa

Cấu trúc bộ ba của RDF cho phép hệ thống suy luận và tìm kiếm ngữ nghĩa truy xuất thông tin một cách dễ dàng Đặc điểm này giúp bộ xử lý RDF có khả năng suy ra những thông tin mới không được đề cập trực tiếp trong tập dữ liệu.

Bên cạnh đó, semantic web với mô hình đữ liệu thông minh (lưu trữ dữ liệu dưới dang thông tin mà máy có thể hiểu được ) đã giúp việc tìm kiếm nhanh được nhanh hơn đồng thời hỗ trợ sử dụng truy xuất thông tin chất lượng hơn

Việc tìm kiếm, đánh giá, xử lí, tích hợp thông tin có thể tiễn hành một cách tự động Semantic web sẽ định nghĩa các khái niệm và bổ sung các quan hệ dưới dạng máy tính có thể hiểu được Máy tính có thể xác định một thực thể thuộc lớp hay thuộc tính cụ thể nào dựa trên ngữ cảnh chứa nó Có thẻ tích hợp thông tin từ nhiều nguồn khác nhau, biết so sánh các thông tin với nhau, kết hợp các thông tin đã được mô tả và giàu ngữ nghĩa với bất kì nguồn dữ liệu nào

Dựa vào các luật suy diễn trên cơ sở tri thức về các thực thể, máy tính có khả năng sinh ra những kết luận mới Ứng dụng semantic web có thê sẽ trả lời chính xác những câu hỏi dạng như: “chùa đơi ở Sóc Trăng ở đâu?”

Tiêu đề	Xây dựng web ngữ nghĩa cho việc tra cứu thông tin web du lịch Đồng bằng sông Cửu Long
Tác giả	Lý Quý Niệm
Người hướng dẫn	TS Nguyễn Thị Thanh Sang
Trường học	Trường Đại học Công nghệ TP. HCM
Chuyên ngành	Công nghệ thông tin
Thể loại	Luận văn Thạc sĩ
Năm xuất bản	2015
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	115
Dung lượng	3,4 MB