Tích hợp dữ liệu vào Semantic web Tích hợp dữ liệu vào Semantic web Tích hợp dữ liệu vào Semantic web luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
bộ giáo dục đào tạo trường đại học bách khoa hµ néi o0o -NGUYễN CÔNG NHậT Nguyễn Công Nhật CÔNG NGHệ PHầN MềM TícH hợp liệu vào Semantic Web luận văn thạc sĩ khoa học 2006-2008 Hà Nội 2008 giáo dục đào tạo trường đại học bách khoa hà néi - Nguyễn Công Nhật TícH hợp liệu vào Semantic Web Chuyên ngành : Công Nghệ Phần Mềm luận văn th¹c sÜ KHOA HäC ngêi híng dÉn khoa häc : PSG TS Ngun Thanh Thđy Hµ Néi – 2008 LỜI CAM ĐOAN Tơi xin cam đoan để hồn thành luận văn, thân có q trình tìm hiểu học hỏi nghiêm túc Những trình bày luận văn kết trình học hỏi nghiên cứu với giúp đỡ hướng dẫn tận tình giáo viên hướng dẫn thầy cô giáo khoa Công nghệ Thông tin, Trường Đại học Bách khoa Hà Nội Luân văn không chép lại nội dung luận văn có MỤC LỤC LỜI CAM ĐOAN MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT DANG MỤC HÌNH VẼ CHƯƠNG I : GIỚI THIỆU SEMANTIC WEB 1.1 Worl wide web hạn chế 1.2 Sự đời Semantic Web .9 1.2.1 Semantic Web gì? 1.2.2 Semantic Web mang lại gì? 11 1.2.2.1 Máy hiểu thơng tin Web 11 1.2.2.2 Thông tin tìm kiếm nhanh chóng xác 11 1.2.2.3 Dữ liệu liên kết động 11 1.2.2.4 Hỗ trợ công cụ tự động hóa 12 1.2.3 Kiến trúc Semantic Web 12 1.2.3.1 Giới thiệu : 12 1.2.3.2 Vai trò lớp kiến trúc Semantic Web 14 1.2.3.2.1 Lớp định danh tài nguyên-URI 14 1.2.3.2.2 Lớp XML XML Schema 15 1.2.3.2.3 Lớp RDF - RDF Schema 17 1.2.3.2.4 Lớp Ontology .19 1.2.3.2.5 Lớp logic 19 1.2.3.2.6 Lớp Proof 20 CHƯƠNG II CÔNG NGHỆ XML 21 2.1 Giới thiệu 21 2.2 Mục tiêu đời lợi ích sử dụng XML 21 2.2.1 Mục tiêu đời XML 21 2.2.2 Lợi ích sử dụng XML 21 2.3 Một tài liệu XML thông dụng 25 2.4 Tạo lập tài liệu XML 26 2.5 Các thành phần tài liệu XML 27 2.6 Một tài liệu XML hợp lệ 28 2.6.1 DTD (Document Type Definition) 28 2.6.2 Lược đồ XML (Schema XML) 29 2.6.2.1 Định nghĩa lược đồ XML 29 2.6.2.2 Các kiểu liệu lược đồ XML 30 2.7 XPath 31 2.8 Đặc điểm XML 31 CHƯƠNG III TỔNG QUAN VỀ RDF 33 3.1 Giới thiệu 33 3.2 Các khái niệm dùng RDF 34 3.2.1 Namespace cách khai báo 37 3.2.2 Qualified name(QName) cách sử dụng 38 3.2.3 Mơ hình RDF ( RDF Model) 40 3.2.3.1 Bộ ba RDF ( RDF Tripple) 41 3.2.3.2 Đồ thị RDF ( RDF Graph) 41 3.2.3.3 Literal 42 3.2.4 Tripple cách sử dụng namespace 44 3.2.5 Kiểu liệu có cấu trúc Blank node 45 3.3 Cấu trúc RDF/XML 48 3.3.1 Cú pháp RDF/XML 48 3.3.2 RDF Container 51 3.3.2.1 Mô hình Container 51 3.3.2.2 Cú pháp Container 53 3.4 RDF Collection 54 3.5 RDF Schema .57 3.5.1 Giới thiệu 57 3.5.2 Định nghĩa class (lớp) 57 3.5.3 Định nghĩa property( thuộc tính) 60 3.5.3.1 Cách sử dụng rdfs:range 60 3.5.3.2 Cách sử dụng rdfs:domain 61 3.5.3.3 Ví dụ 61 3.6 Truy vấn liệu RDF 63 3.6.1 Tạo câu truy vấn đơn giản 63 3.6.2 Cú pháp câu truy vấn 64 3.6.3 Những dạng cú pháp khác 65 3.6.4 Ràng buộc liệu 68 3.6.5 Thêm vào kiểu Optional 68 3.6.6 Ràng buộc khối Optional 69 3.6.7 Nhiều khối Optional 70 3.6.8 Các phép toán điều kiện câu truy vấn 70 3.6.8.1 Phép hội 71 3.6.8.2 DISTINCT 71 3.6.8.3 ORDER BY 72 3.6.8.4 LIMIT 72 CHƯƠNG IV TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB 73 4.1 Giới thiệu 73 4.2 Mơ hình tích hợp liệu 73 4.2.1 Các ngôn ngữ Semantic Web 73 4.2.2 Mô hình 74 4.3 Chuyển liệu từ Relational Database sang XML 74 4.3.1 Giới thiệu 74 4.3.2 Phương thức chuyển đổi sỡ liệu quan hệ sang XML 75 4.3.2 Mơ hình hệ thống 82 4.3.3 Chuyển đổi lược đồ quan hệ sang lược đồ XML 83 4.3.3.1 Mơ hình lược đồ quan hệ 83 4.3.3.2 Chuyển đổi thành phần sở liệu quan hệ sang XML 84 4.4 Chuyển liệu từ sở liệu quan hệ sang RDF .88 4.4.1 Giới thiệu 88 4.4.2 Mô hình hệ thống 89 4.4.3 Chuyển đổi sở liệu quan hệ RDF 89 4.4.3.1 Phương pháp thực 89 4.4.3.2 Ví dụ 92 CHƯƠNG V KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 94 5.5 Kết luận .94 5.2 Kết đạt .94 5.3 Hướng phát triển đề tài 95 TÀI LIỆU THAM KHẢO 96 DANH MỤC CÁC TỪ VIẾT TẮT HTTP HTML XHTML RDF: Resource Description Framework FTP: File Transport Protocal XML URI: Uniform Resource Identifier URL: Unified Resource Locator OWL: Web Ontoloty Language WWW: World Wide Web DANG MỤC HÌNH VẼ Hình 1-1 Kiến trúc Semantic Web 13 Hình 3-1: Đồ thị biểu diễn ba 35 Hình 3-2: Đồ thị biểu diễn nhóm ba 36 Hình 3-3 Mối quan hệ thành phần triple 41 Hình 3-4 Mơ tả phát biểu đơn giản đồ thị 41 Hình 3-5 Biểu diễn nhiều phát biểu cho subject 42 Hình 3-6 Plain Literal biểu diễn cho tuổi Mr John 43 Hình 3-7 Kiểu Typed Literal biểu diễn cho tuổi Mr John 44 Hình 3-8 Tạo địa chỉ(address) cho Mr John 46 Hình 3-9 Sử dụng blank Node 47 Hình 3-10 Mơ tả bag container đơn giản 52 Hình 3-11 Mơ tả Alt container đơn giản 53 Hình 3-12 Mơ tả RDF : Collection 55 Hình 3-13 Khơng gian domain range thuộc tính 60 Hình 4.1 Mơ hình hệ thống tích hợp liệu 74 Hình 4.2 Mơ hình chuyển đổi sở liệu quan hệ sang XML 83 ABSTRACT TITLE: CONVERT RELATIONAL DATA INTO SEMANTIC WEB This thesis is devided into five chapters Chapter 1: Introduction about semantic web This chapter introduces generally about semantic web, gives out basic concepts as well as components of a Semantic Web structure It also points out the role of the components in a Semantic Web structure and gives out some basic uses of semantic web Chapter 2: Introduction about XML technology This chapter introduces generally about XML technology, points out the role and use of XML in practice, introduces establishing technology and data process in XML Chapter 3: Introduction about RDF This chapter inroduces generally about RDF, points out the role of RDF in Semantic Web and introduces technology to establish, process and query in RDF Chapter 5: Data convert into Semantic Web This chapter introduces data convert technology into Semantic Web, does research on methodologies to convert components of data relation unit into XML and RDF, immitates implementation system of the convert procedure Chapter 5: Conclusion and further developments Giving out conclusion of the thesis and some suggestions about further developments TÓM TẮT LUẬN VĂN TÊN ĐỀ TÀI LUẬN VĂN: “TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB” Luận văn chia làm chương Chương I: GIỚI THIỆU VỀ SEMANTIC WEB Chương giới thiệu tổng quan Semantic Web, đưa khái niệm thành phần kiến trúc Semantic Web, vai trò thành phần kiến trúc Semanitic Web đưa số ứng dụng lĩnh vực Semantic Web Chương II: GIỚI THIỆU CÔNG NGHỆ XML Chương giới thiệu tổng quan công nghệ XML, vai trò ứng dụng XML thực tế, giới thiệu kỹ thuật tạo lập xử lý liệu XML Chương III: GIỚI THIỆU VỀ RDF Chương giới thiệu tổng quan RDF, vai trò RDF kiến trúc Semantic Web đồng thời giới thiệu kỹ thuật tạo lập, xử lý thực truy vấn RDF Chương IV: TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB Chương giới thiệu kỹ thuật tích hợp liệu vào Semantic Web, nghiên cứu phương pháp chuyển đổi thành phần sở liệu quan hệ sang XML RDF, mô hệ thống thực trình chuyển đổi Chương V: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Đưa kết luận luận văn đồng thời đề xuất số hướng phát triển luận văn 83 XML Document Database connection Extract Data Relational Database to XML Transformation XML Schema RDB Schema Database connection Relational Database XML Editor Hình 4.2 Mơ hình hệ thống chuyển đổi sở liệu quan hệ sang XML 4.3.3 Chuyển đổi lược đồ quan hệ sang lược đồ XML 4.3.3.1 Mơ hình lược đồ quan hệ Một lược đồ quan hệ ràng buộc mặt liệu mối quan hệ bảng sở liệu Ta xét lược đồ quan hệ chứa ba bảng hình 4.3 đây, lược đồ quan hệ thuộc tính “Grade” tables “student” truy xuất thơng qua bảng lược đồ quan hệ “Student_Course” Hình 4.3 Mơ hình lược đồ quan hệ 84 4.3.3.2 Chuyển đổi thành phần sở liệu quan hệ sang XML Đầu vào cho hệ thống sở liệu quan hệ, hệ thống thực đọc thông tin cần thiết cở sở liệu chuyển thành phần cở sở liệu sang dạng XML tương ứng Quá trình chuyển đổi thành phần cở sở liệu sang dạng XML theo quy trình Database Database table Table column Data type Table data Table struct Relationship database XML Schema Complex type element Simple type element / attribute attribute / element type XML document XML schema XML document, schema Dữ liệu bảng Student File XML document tương ứng SV01 Nguyen Hoa A SV02 Tran Binh B SV03 Manh 85 Ha A SV04 Nguyen Nam B Cấu trúc bảng Student File XML schema tương ứng 86 Bảng lược đồ quan hệ File XML document tương ứng CourseStudent_Course Course CourseID Student_Course CourseId StudentStudent_Course Student StudentID Student_Course StudentId 87 File XML schema tương ứng 88 4.4 Chuyển liệu từ sở liệu quan hệ sang RDF 4.4.1 Giới thiệu Semantic web mở rộng web tại, theo thơng tin định dạng mặt khuôn dang ngữ nghĩa tốt Các thông tin biểu diễn thông qua RDF liên kết chúng tới ontologies chuyên dụng Việc thông tin mô tả mặt ngữ nghĩa cho phép liệu chia sẻ, biến đổi tích hợp từ nguồn khác ứng dụng sử dụng liệu ngữ cảnh khác Mặc dù thường gọi “ngôn ngữ”, RDF thực chất mơ hình liệu (data model) Nội dung ba objectattribute-value hay gọi mệnh đề RDF độc lập với miền ứng dụng, tức giả định trước miền ứng dụng đặc biệt đưa Nó hồn toàn tùy thuộc vào người dùng để định nghĩa từ vựng lược đồ ngôn ngữ gọi RDF Schema (RDFS) RDFS định nghĩa từ vựng sử dụng mơ hình liệu RDF Trong RDFS, định nghĩa từ vựng, loại thuộc tính dành cho loại đối tựơng giá trị mà chúng nhận, mô tả mối quan hệ đối tượng Hầu hết liệu có cấu trúc ngày lưu trữ sở liệu quan hệ sử dụng loại liệu ngữ cảnh ứng dụng định Vì ánh xạ loại liệu vào RDF trở thành định dạng liệu cho Semantic Web 89 Hình 4.4 Vai trị RDF xử lý truy vấn Web ngữ nghĩa 4.4.2 Mơ hình hệ thống Relational Database to RDF mapping Database connection RDF - Achiver Relational Database RDF File Hình 4.5 Mơ hình hệ thống chuyển đổi sở liệu quan hệ sang RDF 4.4.3 Chuyển đổi sở liệu quan hệ RDF 4.4.3.1 Phương pháp thực Các thành phần sở liệu quan hệ convert sang Semantic Web thơng qua cơng cụ hỗ trợ Semantic web Theo thành phần sở liệu biểu diễn công cụ tương ứng Semantic Web Các Trigers sở liệu biểu diễn thành luật (Rule), ràng buộc (Constraints) biểu diễn OWL, cấu trúc bảng biểu diễn RDFS kiểu quan hệ (dữ liệu bảng ) biểu diễn RDF 90 Chi tiết biểu diễn thành phần mô tả hình sau: Semantic Web Relation Database Trigers Rules Constraints OWL Table Definiton RDFS Relation Model RDF Hình 4.6 Mơ hình hệ thống chuyển đổi thành phần sở liệu quan hệ sang RDF Như thực chuyển đổi hai thành phần Database sang RDF a Chuyển đổi bảng (các kiểu quan hệ) sang RDF Ta xét bảng Student(name, age) xét T1: Student(Linda, 21) Đồ thị RDF tương ứng: Linda Age Name T1 21 Nội dung file RDF thu được: Linda 21 b Chuyển đổi cấu trúc bảng sang RDFS Ta xét cấu trúc bảng Student sau: Student(Name varchar(100), Age Integer), ta có lược đồ RDF tương ứng: • Tables rdfs:Class 91 • Columns rdf:Property – Table rdfs:Domain – Datatype rdfs:Range • Keys rdf:Property – Table rdfs:Domain – Referencing Table rdfs:Range Domain Name Student Domain Range Varchar(100) Age Range Integer Nội dung File RDFS tương ứng: Student 93 StudentID of Student FirstName of Student LastName of Student Grade of Student 94 CHƯƠNG V KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.5 Kết luận Ngày lượng thông tin lớn Internet, đồng thời số lượng người dùng Internet ngày nhiều làm cho việc tìm kiếm, trình bày trì thơng tin web ngày trở nên khó khăn Semantic Web đời đem lại bước phát triển cho hệ web Công nghệ Semantic Web giúp cho máy tính hiểu thơng tin Web Với công nghệ Semantic Web, liệu web định nghĩa liên kết theo cách mà máy tính hiểu khơng dùng cho mục đích hiển thị mà cịn sử dụng cho mục đích tự động, tích hợp tái sử dụng liệu qua ứng dụng khác Semantic Web mang lại nhiều thuận lợi vậy, để thật hiểu rõ nắm vững Semantic Web điều không dễ dàng Do vậy, mục tiêu đề tài luận văn gồm hai phần sau: Về phần bản: mục tiêu tìm hiểu, nghiên cứu Semantic Web bao gồm phần như: kiến trúc tầng Semantic Web, ngôn ngữ sử dụng Semantic Web, RDF tảng Semantic Web ngơn ngữ truy vấn RDF Về phần tích hợp liệu: mục tiêu đề xuất phương pháp chuyển đổi sở liệu quan hệ sang XML RDF 5.2 Kết đạt Qua trình nghiên cứu tìm hiểu lĩnh vực Semantic Web, luận văn đạt số kết sau: - Giới thiệu công nghệ Semantic Web, so sánh Semantic Web với Web thuận lợi mà Semantic Web mang lại - Giới thiệu kiến trúc Semantic Web vai trò lớp kiến trúc Semantic Web 95 - Tìm hiểu RDF, ngơn ngữ tảng giữ vai trị quan trọng kiến trúc Semantic Web bao gồm: lược đồ RDF dùng để mô tả tài nguyên dạng đồ thị, cú pháp RDF/XML dùng để tạo tài liệu RDF , RDF Schema dùng để định nghĩa lớp thuộc tính - Tìm hiểu ngơn ngữ truy vấn RDF ngôn ngữ SPARQL, cách tạo câu truy vấn việc truy vấn liệu tài liệu RDF - Nghiên cứu phương pháp Convert sở liệu sang XML RDF - Xây dựng chương trình Demo 5.3 Hướng phát triển đề tài Luận văn hoàn thành với số kết ban đầu đạt theo yêu cầu đặt Tuy nhiên, q trình thực đề tài xét thấy có nhiều vấn đề liên quan đến luận văn phát triển hồn thiện Luận văn phát triển theo hướng mô tả đầy đủ loại liệu bao gồm liệu có cấu trúc liệu phi cấu trúc cho công cụ hỗ trợ Semantic Web xử lý Vấn đề chuyển đổi loại liệu phi cấu trúc hệ thống thông tin địa lý (GIS), sở liệu hướng đối tượng đề tài có ý nghĩa lý thuyết thực tiễn 96 TÀI LIỆU THAM KHẢO [1] Berners-Lee, Tim (1998) Semantic Web Road map, URI:http://www.w3.org/DesignIssues/Semantic [2] Bray, Tim (1999) XML Namespaces by Example , URI:http://www.xml.com/pub/a/1999/01/namespaces.html [3] J.Petrini and T.Risch: Scalable Queries to RDF Views of Relational Databases http://user.it.uu.se/~udbl/sward/SWARD.pdf [4] RDF Resource Description Framework, URI:http://www.w3c.org/RDF/ [5] SWARD – Semantic Web Abridged relational Databases http://user.it.uu.se/~udbl/sward/ [6] Tom Barrett et al RDF Representation of Metadata for Semantic Integration of Corporate Information Resources WWW2002 (Hawaii, 2002) http://www.cs.rutgers.edu/~shklar/www11/final_submissions/paper3.pdf ... kiến trúc Semantic Web đồng thời giới thiệu kỹ thuật tạo lập, xử lý thực truy vấn RDF Chương IV: TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB Chương giới thiệu kỹ thuật tích hợp liệu vào Semantic Web, nghiên... VĂN: “TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB? ?? Luận văn chia làm chương Chương I: GIỚI THIỆU VỀ SEMANTIC WEB Chương giới thiệu tổng quan Semantic Web, đưa khái niệm thành phần kiến trúc Semantic Web, ... LIMIT 72 CHƯƠNG IV TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB 73 4.1 Giới thiệu 73 4.2 Mơ hình tích hợp liệu 73 4.2.1 Các ngôn ngữ Semantic Web 73 4.2.2 Mơ hình