tìm hiểu áp dụng công nghệ web ngữ nghĩa vào xây dựng hệ thống cung cấp thông tin hướng ngữ cảnh trường đh quốc gia hà nộitìm hiểu áp dụng công nghệ web ngữ nghĩa vào xây dựng hệ thống cung cấp thông tin hướng ngữ cảnh trường đh quốc gia hà nộitìm hiểu áp dụng công nghệ web ngữ nghĩa vào xây dựng hệ thống cung cấp thông tin hướng ngữ cảnh trường đh quốc gia hà nội
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ LOAN TÌM HIỂU ÁP DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA VÀO XÂY DỰNG HỆ THỐNG CUNG CẤP THÔNG TIN HƯỚNG NGỮ CẢNH LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG THỊ LOAN TÌM HIỂU ÁP DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA VÀO XÂY DỰNG HỆ THỐNG CUNG CẤP THÔNG TIN HƯỚNG NGỮ CẢNH Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Cán bộ hướng dẫn: Ts.Vũ Thị Hồng Nhạn HÀ NỘI - 2014 LỜI CẢM ƠN Lời đầu tiên em xin bày tỏ lòng biết ơn sâu sắc đến cô giáo Vũ Thị Hồng Nhạn, người đã cung cấp tài liệu, hướng dẫn rất tận tình và đóng góp ý kiến cho em trong suốt quá trình làm luận văn và hoàn thành luận văn này. Em xin chân thành cám ơn các thầy cô giáo trong khoa Công nghệ thông tin, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội. Các thầy cô đã giảng dạy, chỉ dẫn và cung cấp cho em những kiến thức quý báu trong suốt thời gian học tập và nghiên cứu tại trường. Tôi xin trân trọng cảm ơn các bạn học viên cao học khóa K17 trường Đại học Công nghệ đã đoàn kết giúp đỡ và đồng hành cùng tôi trong chương trình học tại trường. Do trong quá trình nghiên cứu, tìm hiểu và thực nghiệm luận văn chắc chắn không thể tránh khỏi sai sót nhất định, rất mong nhận được sự góp ý của thầy cô giáo và các bạn. Em xin chân thành cảm ơn! Hà Nội, tháng 12 năm 2014 Hoàng Thị Loan 2 TÌM HIỂU ÁP DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA VÀO XÂY DỰNG HỆ THỐNG CUNG CẤP THÔNG TIN HƯỚNG NGỮ CẢNH Hoàng Thị Loan Khóa QH-2010-I/CQ ngành công nghệ thông tin Tóm tắt luận văn Ngày nay, với sự bùng nổ về mạng không dây, mạng internet, truyền thông, và các thiết bị phần cứng nhỏ gọn đã cho ra đời các thiết bị di động thông minh với nhiều tính năng hơn điện thoại thông thường chỉ có tính năng gọi nghe như trước kia. Với một thiết bị di động nói chung và điện thoại thông minh nói riêng con người có thể truy cập và nhận thông tin ở bất cứ thời điểm nào và bất cứ nơi đâu. Cùng với sự phát triển của các dịch vụ web thông thường, thì các dịch vụ dựa trên ngữ cảnh mà cụ thể là dựa trên vị trí (Location Base Service – LBS) đã và đang thu hút nhiều mối quan tâm của các nhà nghiên cứu và người dùng. Hệ thống cung cấp thông tin dựa trên ngữ cảnh thông thường được xây dựng dựa trên nhiều nguồn dữ liệu và thông tin khác nhau như bản đồ, các đối tượng tham chiếu địa lý, sự di chuyển của người dùng, thông tin về cá nhân người dùng và mối quan tâm của họ. Để biểu diễn nhiều loại dữ liệu phức tạp như vậy các nghiên cứu trước đây thường sử dụng mô hình dữ liệu đa chiều. Tuy nhiên sự nhập nhằng về ngữ nghĩa của thông tin dẫn tới cung cấp thông tin không chính xác cho người sử dụng là vấn đề vẫn còn tồn tại. Luận văn này tập trung xây dựng hệ thống cung cấp các dịch vụ thông tin dựa vào ngữ cảnh của người dùng. Trước hết, nghiên cứu khảo sát phân loại dữ liệu thu thập được từ nhiều nguồn thông tin với mục tiêu phân tách những loại dữ liệu sử dụng chung trong nhiều miền ứng dụng hay dịch vụ. Điều này giúp các dịch vụ có khả năng chia sẻ thông tin và đặc biệt dễ dàng tích hợp những dịch vụ mới trong tương lai một cách thuận tiện dễ dàng hơn. Để giải quyết sự nhập nhằng về ngữ nghĩa của thông tin, nghiên cứu sử dụng công nghệ Web Ngữ nghĩa và Ontology trong mô hình hóa dữ liệu. Hệ thống được triển khai theo kiến trúc client – server và có khả năng thực hiện cung cấp thông tin theo hai cơ chế, đó là đẩy (push) và kéo (pull). Các thuật toán cài đặt các thao tác tìm kiếm thông tin theo các điều kiện về vị trí, thời gian, cũng như vai trò và mối quan tâm của người dùng cũng được phân tích và cài đặt. Cuối cùng, một hệ thống thử nghiệm được xây dựng cho phép cung cấp hai dịch vụ là du lịch và giao thông trong khu vực thành phố Hà Nội. Hệ thống xây dựng cho điện thoại thông minh với hệ điều hành android và công cụ Protégé để biểu diễn thông tin và ngữ nghĩa. Kết quả của nghiên cứu hứa 3 hẹn cho sự ra đời của một hệ thống tích hợp và cung cấp nhiều loại dịch vụ dựa vào vị trí và ngữ cảnh của người dùng một cách tiện lợi và hiệu quả. Từ khóa: Cung cấp thông tin theo sự kiện và ngữ cảnh, truy vấn theo điều kiện không gian và thời gian, Web ngữ nghĩa và Ontology. 4 Lời cam đoan Tôi xin cam đoan luận văn này là do tôi tự nghiên cứu và viết dưới sự hướng dẫn của tiến sĩ Vũ Thị Hồng Nhạn, không có sự sao chép của người khác. Tất cả những tài liệu tham khảo tôi đã liệt kê rõ ở phần cuối của luận văn. Tôi cam kết những nội dung tham khảo nằm trong giới hạn cho phép theo quy chế của trường. Nếu sai sự thật, tôi xin hoàn toàn chịu trách nhiệm. Tác giả luận văn Hoàng Thị Loan 5 MỤC LỤC LỜI CẢM ƠN 1 Tóm tắt luận văn 2 Lời cam đoan 4 Chương 1 Giới thiệu 8 Chương 2 Khảo sát các hệ thống LBS và mô hình dữ liệu hiện có 11 2.2 Mô hình dữ liệu không gian - thời gian 12 2.3 Phân loại dữ liệu trong LBS 13 Chương 3 Web Ngữ nghĩa 16 3.1 Web Ngữ nghĩa 16 3.1.1 Khái niệm Web Ngữ nghĩa 16 3.1.2 Kiến trúc tầng của Semantic Web 17 3.1.2.1 URI 17 3.1.2.2 Unicode 18 3.1.2.3 XML và tên không gian tên miền XML 18 3.1.2.4 RDF và giản đồ RDF 18 3.1.2.5 Ontology 18 3.1.2.6 Tầng Logic, Proof, Trust và Digital Signature 19 3.2 OWL và Ontology 19 3.2.1 Khái niệm Ontology 19 3.2.2 Cấu trúc Ontology 20 3.2.3 OWL 22 3.3 Truy vấn trong Semantic Web 23 3.3.1 Giới thiệu về Cơ sở dữ liệu Graph 23 3.3.2 Truy vấn thông qua SPARQL 25 Chương 4 Thiết kế hệ thống 27 4.1 Kiến trúc hệ thống 27 4.1.1 Thiết bị di động 27 4.1.2 Server 28 4.2 Phân tích chức năng của hệ thống 29 4.2.1 Chức năng phía server 29 4.2.2 Chức năng phía client 33 4.3 Thiết kế cơ sở dữ liệu 34 4.3.1 Mô hình hóa cơ sở dữ liệu theo mô hình thực thể 35 4.3.1.1 Xác định các thực thể trong hệ thống 35 4.3.1.2 Xác định mối quan hệ giữa các thực thể 36 4.3.1.3 Sơ đồ quan hệ thực thể 37 4.3.2 Mô hình hóa cơ sở dữ liệu bằng các Ontology 38 4.3.2.1 Ontology dữ liệu Miền 38 4.3.2.2 Ontology dữ liệu Nội dung 41 6 4.3.2.3 Ontology dữ liệu Ứng dụng 47 4.4 Các thuật toán tìm kiếm thông tin 50 4.4.1 Thuật toán dự đoán vị trí tương lai 52 4.4.2 Thuật toán cung cấp thông tin dựa trên vị trí người dùng 52 4.4.3 Thuật toán cung cấp thông tin dựa trên vị trí và thời gian 53 4.4.4 Thuật toán cung cấp thông tin dựa trên profile 54 4.4.5 Thuật toán cung cấp thông tin dựa trên lịch sử người dùng 55 4.4.6 Thuật toán gợi ý sự kiện bên ngoài hệ thống 56 4.4.7 Thuật toán thông báo tình trạng ùn tắc giao thông 57 Chương 5 Cài đặt hệ thống thử nghiệm 58 5.1 Môi trường cài đặt 59 5.1.1 Phần server 59 5.1.2 Phần client 59 5.1.3 Kết nối giữa Client – Server 59 5.2 Dữ liệu đầu vào và các yêu cầu cơ bản 60 5.3 Các kết quả thực nghiệm 60 5.3.1 Quản lý Database phía server bằng Protégé. 61 5.3.2 Cung cấp thông tin dịch vụ du lịch theo cơ chế push 64 5.3.3 Cung cấp thông tin dịch vụ du lịch theo cơ chế pull 66 5.3.4 Cung cấp thông tin giao thông theo cơ chế push 67 5.3.5 Kết hợp hai dịch vụ thông tin du lịch và thông báo ùn tắc giao thông 67 5.4 So sánh với một số hệ thống cung cấp thông tin dựa trên vị trí hiện tại 68 Chương 6 Kết luận 69 TÀI LIỆU THAM KHẢO 70 7 DANH SÁCH CÁC HÌNH Hình 2.1 Phân loại dữ liệu trong LBS 14 Hình 3.1 Kiến trúc tầng của Web Ngữ nghĩa 17 Hình 3.2 Các loại Biểu đồ dữ liệu. 24 Hình 3.3 Mô hình Graph mô tả quan hệ giữa Bengie và Bonnie 24 Hình 4.1 Kiến trúc hệ thống 27 Hình 4.2 Sơ đồ phân rã chức năng phía Server 30 Hình 4.3 Cây chức năng phía client 33 Hình 4.4 Sơ đồ quan hệ thực thể ER 37 Hình 4.5 Hình dáng của reach trong không gian 39 Hình 4.5 Ontology dữ liệu Miền 40 Hình 4.6 Di chuyển của các đối tượng 42 Hình 4.7 Quan hệ của trajectory với môi trường và với trajectory khác 43 Hình 4.8 Giản đồ cơ sở dữ liệu của MOD 46 Hình 4.9 Trích đoạn Ontology Nội dung cho Dịch vụ du lịch 47 Hình 4.10 Trích đoạn Ontology Profile của người dùng 49 Hình 4.11 Ontology Dịch vụ cho LBS giao thông và du lịch 50 Hình 5.1 Kết nối giữa Client – Server 59 Hình 5.2 Ontology quản lý Người dùng 61 Hình 5.3 Ontology mô tả quan hệ giữa các class ở Dữ liệu Nội dung Du lịch 61 Hình 5.4 Ontology Nội dung Du lịch phân chia theo chủ đề 62 Hình 5.5 Ontology Nội dung về Giao thông 62 Hình 5.6 Cung cấp thông tin du lịch theo cơ chế push 64 Hình 5.7 Gợi ý sự kiện sắp xảy đến theo cơ chế push 65 Hình 5.8 Cung cấp thông tin theo cơ chế pull 66 Hình 5.9 Cung cấp thông tin về giao thông theo cơ chế Push 67 Hình 5.10 Kết quả thông báo cho kết hợp dịch vụ du lịch và giao thông 68 DANH SÁCH CÁC BẢNG Bảng 3.1 Ví dụ câu lệnh truy vấn Select của SPARQL 25 Bảng 4.1 Bảng ký hiệu 51 Bảng 4.2 Tóm tắt chức năng các hàm thường dùng 51 8 Chương 1 Giới thiệu Ngày càng có nhiều dịch vụ cung cấp thông tin cho các thiết bị di động hơn trong thời đại mà các thiết bị di động được gắn GPS hoặc kết nối mạng toàn cầu. Việc có quá nhiều dịch vụ và thông tin cũng gây không ít khó khăn cho người dùng các thiết bị di động để chọn lọc ra thông tin cần thiết. Vậy trước tiên chúng ta tìm hiểu xem thông tin nào là cần thiết với người dùng. Thông tin thì có thể là cần thiết với cá nhân này, nhưng lại không cần thiết với các nhân khác. Và thông tin có thể là cần thiết trong thời điểm này, nhưng lại không cần thiết ở thời điểm khác. Điều ấy cho thấy rằng, việc định nghĩa ra loại thông tin cần thiết với người sử dụng chỉ mang tính chất tương đối. Việc định nghĩa profile người dùng, phân loại thông tin, tổ chức lại thông tin sẽ đưa ra cho người dùng là một phần công việc cần phải làm để giúp hệ thống làm việc để tránh việc đưa ra thông tin không phù hợp với sự quan tâm của người sử dụng. Nghiên cứu phát triển hệ thống thông tin dựa trên vị trí đã phát triển từ lâu tuy nhiên hầu hết các hệ thống đều triển khai cho một loại dịch vụ cụ thể như hướng dẫn định hướng trong một vùng RegionGuide [2, hay hướng dẫn cho Bảo tàng MuseumGuide [5 [6 [7. Hệ thống RegionGuide đưa ra các thông báo cho khách du lịch về các điểm tham quan, khách sạn, chỗ ăn uống… trong một khu vực. Thông tin đa phương tiện có liên quan xuất hiện trên một bản đồ dựa trên giao diện người sử dụng các địa điểm yêu thích (Position Of Interest – POI) được tải về qua mạng điện thoại di động khi cần thiết. Các POI sau khi được phân loại dựa trên một hệ thống phân loại quốc gia về dịch vụ du lịch, được sử dụng như: chỗ ở, ăn uống hấp dẫn, hoạt động, sự kiện và thông tin du lịch hoạt động, sự kiện và thông tin. Tổng thể thiết kế của RegionGuide phản ánh kết quả của một cuộc khảo sát du lịch lớn đã được thực hiện để hiểu rõ hơn về hành vi của khách du lịch, vai trò du lịch, và các quyền lợi đặc biệt của khách du lịch và các chức năng nhiệm vụ mà hệ thống du lịch cần phải có. Với hệ thống MuseumGuide, ban đầu hệ thống được phát triển dựa trên ý tưởng để tiếp sức cho một bảo tàng nằm cạnh một nhà thờ cổ đại, cung cấp các thước phim sống động và bổ sung thông tin về các điểm tham quan trong bảo tàng. Bảo tàng này bao gồm bốn tòa nhà riêng biệt kèm theo một cái sân hình vuông ở giữa. Bao quanh các tòa nhà là các bức tường đá rất dày, bên trong tòa nhà chứa các đồ tác tạo lưu giữ các phần của lịch sử thành phố và giai thoại về cư dân của vùng này. Thiết kế của MuseumGuide mang tính kể chuyện nhằm mục đích giáo dục, đó là một trong những đề nghị của ngành du lịch góp phần vào giới thiệu văn hóa. Nội dung được tổ chức theo cấu trúc thứ bậc gồm ba cấp. Trang chào mừng hướng người sử dụng về phía các sự kiện lịch sử liên quan tới tòa nhà hoặc là các phòng cụ thể và các hiện vật cùng với các tòa nhà. Người sử dụng được giới thiệu các đoạn văn ngắn kết hợp hình ảnh và [...]... trên, luận văn được trình bày với bố cục như sau: Chương 1 Giới thiệu tổng quan về hệ thống cung cấp thông tin hướng ngữ cảnh và công nghệ Web Ngữ nghĩa Chương 2 Khảo sát một số hệ thống cung cấp thông tin dựa trên sự kiện hiện có, mô hình dữ liệu LBS Chương 3 Tìm hiểu kiến trúc, thành phần của Web Ngữ nghĩa, trong đó tập trung vào công nghệ Ontology và xây dựng truy vấn SPARQL cho Ontology Chương 4 Xây. .. 4 Xây dựng kiến trúc hệ thống cung cấp thông dựa trên ngữ cảnh, thiết kế ontology dữ liệu và xây dựng các thuật toán sử dụng để xây dựng hệ thống Chương 5 Triển khai hệ thống thử nghiệm cung cấp thông tin du lịch và giao thông cho khu vực Hà Nội Chương 6 Đánh giá quả thực nghiệm của luận văn và đưa ra các định hướng phát triển tiếp theo cho hệ thống trong tương lai 10 Chương 2 Khảo sát các hệ thống. .. một số hệ thống cung cấp thông tin dựa trên ngữ cảnh Sau đó là khảo sát mô hình dữ liệu cho đối tượng di động, phân loại dữ liệu sử dụng trong các hệ thống LBS nhằm đưa ra cách nhìn rõ hơn về cấu trúc hoạt động của hệ thống theo hướng Semantic hóa 2.1 Khảo sát một số mô hình cung cấp thông tin dựa trên ngữ cảnh Hiện nay, tồn tại một vài hệ thống cung cấp thông tin dựa trên vị trí và xử lý thông tin nhận... đặt Cuối cùng, một hệ thống thử nghiệm được xây dựng cho phép cung cấp hai dịch vụ là du lịch và giao thông trong khu vực thành phố Hà Nội Hệ thống xây dựng cho điện thoại thông minh với hệ điều hành android và công cụ Protégé để biểu diễn thông tin và ngữ nghĩa Kết quả của nghiên cứu hứa hẹn cho sự ra đời của một hệ thống tích hợp và cung cấp nhiều loại dịch vụ dựa vào vị trí và ngữ cảnh của người dùng... quan thông qua chuỗi sự kiện/vị trí Một hệ thống thông minh sẽ đưa ra danh sách các lựa chọn Các ứng dụng này thuộc vào chủ đề chung của tối ưu 9 hóa tổ hợp và vì vậy chi tiết các ứng dụng loại trên sẽ không được tập trung nghiên cứu trong luận văn này Luận văn này tập trung xây dựng hệ thống cung cấp các dịch vụ thông tin dựa vào ngữ cảnh của người dùng Để giải quyết sự nhập nhằng về ngữ nghĩa của thông. .. chức năng như ngôn ngữ truy vấn thông tin thông thường Sau đây là nội dung chi tiết của các vấn đề liên quan tới Web Ngữ nghĩa 3.1 Web Ngữ nghĩa 3.1.1 Khái niệm Web Ngữ nghĩa Web Ngữ nghĩa là một sự mở rộng của Web hiện tại mà trong đó thông tin được xử lý một cách tự động bằng máy tính, làm cho máy tính và con người có thể hợp tác với nhau”- Tim Berners-Lee Web Ngữ nghĩa (Semantic Web) có thể coi là... lọc thông tin hiệu quả hơn, hỗ trợ tốt hơn cho người sử dụng hệ thống Hệ thống Active Badges [11], Ultrasonic-based Bat [12] hay hệ thống Radar đều dựa trên công nghệ mạng không dây LAN Các hệ thống định vị cho các hoạt động ngoài trời có thể sử dụng mạng không dây di động hoặc GPS Chúng ta có thể thấy được cái nhìn bao quát về các hệ thống hướng ngữ cảnh trong [13] Trong nghiên cứu [14] tập trung vào. .. chuyển) được gửi đi tùy thuộc vào tầm quan trọng của nó với người sử dụng, trong đó tầm quan trọng này phụ thuộc vào khoảng cách không gian giữa các đối tượng và người sử dụng Hiện nay có rất nhiều các hệ thống thông báo sự kiện cho người dùng được cài đặt, ví dụ như SIFT [9] Một vài hệ thống thông báo sự kiện ENS áp dụng vào cung cấp thông tin ngữ cảnh cho du lịch, tập trung vào hỗ trợ lên kế hoạch du... dùng mà hệ thống có thể dự đoán được vị trí, hướng đường đi tương lai của người dùng trong khoảng thời gian t nào đó Nhờ áp dụng kỹ thuật này mà Server sẽ chủ động gửi thông tin luôn cập nhật và phù hợp với người dùng trong miền di chuyển, giảm thiểu độ trễ của thông tin tới người dùng của hệ thống Tìm kiếm thông tin: + Tìm kiếm dựa vào vị trí: là chức năng đơn giản nhất và cơ bản nhất mà hệ thống. .. thời gian hiện tại hệ thống phía server sẽ thông qua bộ lọc thông tin, để truy vấn tới thông tin profile và dữ liệu lịch sử người cụ thể Kết quả nhận được của giai đoạn này là lấy ra các loại thông tin mà người dùng quan tâm yêu thích Từ các loại thông tin yêu thích này, hệ thống sẽ tương tác với bộ tìm kiếm thông tin Các loại dữ liệu mà bộ tìm kiếm thông tin tìm kiếm nằm ở các cơ sở dữ liệu như sự kiện . HỌC CÔNG NGHỆ HOÀNG THỊ LOAN TÌM HIỂU ÁP DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA VÀO XÂY DỰNG HỆ THỐNG CUNG CẤP THÔNG TIN HƯỚNG NGỮ CẢNH LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG. Thị Loan 2 TÌM HIỂU ÁP DỤNG CÔNG NGHỆ WEB NGỮ NGHĨA VÀO XÂY DỰNG HỆ THỐNG CUNG CẤP THÔNG TIN HƯỚNG NGỮ CẢNH Hoàng Thị Loan Khóa QH-2010-I/CQ ngành công nghệ thông tin Tóm tắt luận. về hệ thống cung cấp thông tin hướng ngữ cảnh và công nghệ Web Ngữ nghĩa. Chương 2 Khảo sát một số hệ thống cung cấp thông tin dựa trên sự kiện hiện có, mô hình dữ liệu LBS. Chương 3 Tìm hiểu