Bài viết trình bày việc sử dụng ngôn ngữ định kiểu mở rộng XSL (Extensible Stylesheet Language) để biến đổi tài liệu XML thành tài liệu RDF như là một giải pháp hiệu quả để chuyển dữ liệu hiện có của các hệ thống thành dữ liệu RDF được sử dụng trong các hệ thống web ngữ nghĩa.
TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số (2019) MỘT PHƯƠNG PHÁP CHUYỂN ĐỔI TÀI LIỆU XML SANG TÀI LIỆU RDF SỬ DỤNG NGÔN NGỮ XSL Nguyễn Dũng*, Nguyễn Mậu Hân Khoa Công nghệ Thông tin, Trường Đại học Khoa học, ĐH Huế Email: nguyendung@hueuni.edu.vn * Ngày nhận bài: 23/10/2018; ngày hoàn thành phản biện: 01/3/2019; ngày duyệt đăng: 10/3/2019 TĨM TẮT Ngày nay, ngơn ngữ đánh dấu mở rộng XML(Extensible Markup Language) trở thành định dạng trao đổi liệu chấp nhận rộng rãi Cùng với việc gia tăng lượng Dữ liệu Liên kết (Linked Data), cách sử dụng Khung mô tả Tài nguyên RDF (Resource Description Framework), nhiều cơng cụ nhằm biến đổi tài liệu XML thành tài liệu RDF phát triển Trong báo này, sử dụng ngôn ngữ định kiểu mở rộng XSL (Extensible Stylesheet Language) để biến đổi tài liệu XML thành tài liệu RDF giải pháp hiệu để chuyển liệu có hệ thống thành liệu RDF sử dụng hệ thống web ngữ nghĩa Từ khóa: liệu liên kết, rdf, xml, xsl, web ngữ nghĩa GIỚI THIỆU XML qui luật cách chia tài liệu làm nhiều phần, đánh dấu ráp phần khác lại để dễ nhận diện chúng XML phát triển W3C (World Wide Web Consortium), nhóm cộng tác (working group) Jonh Bosak Sun Microsystem thành lập năm 1996, nhằm khắc phục hạn chế HTML (Hyper Text Markup Language, ngôn ngữ đánh dấu siêu văn bản, sở để trang Web sử dụng để hiển thị nội dung) XML cho phép chia sẻ sử dụng thông tin phân tán hệ thống khác hỗ trợ người dùng thông qua khả tạo nội dung động, phát triển ứng dụng tích hợp nhiều qui mơ khác XML giống HTML, hai ngơn ngữ có luật cú pháp, hai lưu trữ dạng tập tin văn với phần mở rộng html xml Tuy nhiên, tính linh hoạt XML cho phép tạo sử dụng tập thẻ, thuộc tính riêng để nhận biết phần tử cấu trúc nội dung tài liệu XML không đơn ngơn ngữ đánh dấu, mà cịn phương pháp định nội dung tài liệu, tương tự HTML định hình thức tài liệu Web Với HTML, người 13 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngôn ngữ XSL thiết kế đánh dấu văn bản, hình ảnh thành phần khác trang Web tập thẻ mà khơng liên quan tới ý nghĩa tài liệu; đoạn mã HTML nói lên cách hiển thị nội dung tài liệu qua trình duyệt XML khơng định hình thức mà cịn nội dung tài liệu Tóm lại, XML HTML ngôn ngữ đánh dấu XML thiết kế để mang lưu trữ liệu khơng phải để biểu diễn liệu Cịn HTML thiết kế để hiển thị liệu, tập trung vào cách liệu hiển thị Tuy nhiên, việc sử dụng định dạng XML để trao đổi liệu hệ thống phục vụ cho hệ thống Web 2.0, tức mối quan hệ ngữ nghĩa đối tượng chưa xét đến Các loại liệu dừng lại mức người hiểu xử lý Với mục đích biểu diễn liệu cho đồng thời máy tính người hiểu xử lý Web ngữ nghĩa, hay Web 3.0, đời Việc trao đổi thông tin Web ngữ nghĩa người ta dùng định dạng RDF Do việc chuyển đổi liệu từ hệ thống tại, theo định dạng XML, sang hệ thống Web ngữ nghĩa, theo định dạng RDF, nhu cầu thiết KHUNG MƠ TẢ TÀI NGUN WEB RDF Khung mơ tả tài nguyên Web RDF nhóm đặc tả tổ chức World Wide Web Consortium (W3C) thiết kế ngôn ngữ siêu liệu để biểu diễn liệu Web, đồng thời cung cấp mơ hình để mơ tả tạo mối quan hệ tài nguyên Theo mô tả hình đây, liệu Web ngữ nghĩa tổ chức dựa sở XML mơ hình hóa RDF Như RDF chọn chuẩn trao đổi liệu Web ngữ nghĩa Hình Kiến trúc phân tầng Web ngữ nghĩa 14 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số (2019) RDF định nghĩa nguồn tài nguyên (resource), sau gọi chủ thể (subject) đối tượng có khả xác định cách sử dụng định danh tài nguyên thống URI (Uniform Resource Identifier) Các nguồn tài ngun có thuộc tính (property) kèm, sau gọi vị từ (predicate) Các vị từ biểu diễn mối quan hệ chủ thể xác định URI Giá trị vị từ gọi đối tượng (object) tơi 〈 Như mơ hình liệu RDF tập ba (triple), sau chúng gọi tập phát biểu (statement) gồm thành phần: 〉, đó: - Chủ thể (Resource/Subject): tài nguyên mô tả Các tài nguyên xác định URI cụ thể - Vị từ (Property/Predicate): Thuộc tính tài nguyên hay chủ thể Các vị từ xác định URI - Đối tượng (Object): Giá trị vị từ Có thể giá trị (literal) chủ thể khác xác định URI Các phát biểu tài liệu RDF biểu diễn dạng đồ thị, gọi đồ thị RDF Có thể hình dung đồ thị RDF đơn giản sau: Hình Đồ thị RDF Trong đó: Hình oval đại diện cho chủ thể Mũi tên đại diện cho vị từ với nhãn định danh vị từ Hình chữ nhật đại diện cho giá trị vị từ literal Nếu giá trị vị từ chủ thể khác lại sử dụng hình oval Ngoài cách thể trên, tài liệu RDF sử dụng định dạng khác như: N3, N-Triples, Turtle, RDFa, JSON-LD, TriG RDF/XML nhằm để biểu diễn, trao đổi liên kết liệu Trong định dạng RDF/XML định dạng sử dụng phổ biến định nghĩa W3C để thể đồ thị RDF tài liệu XML Cú pháp RDF/XML sau: 15 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngôn ngữ XSL literal value Trong đó, dịng phần mơ tả tài liệu XML Theo sau phần mô tả thẻ gốc rdf:RDF Thuộc tính xmlns:rdf chứa khơng gian tên http://www.w3.org/1999/02/22rdf-syntax-ns# không gian chuẩn tổ chức W3C Không gian tên cho máy đọc hiểu rằng, nội dung bên tài liệu RDF thẻ rdf:RDF thuộc không gian tên Trong tài liệu RDF chứa nhiều phát biểu Để mô tả chủ đề phát biểu, sử dụng thẻ rdf:Description thuộc tính rdf:about chứa định danh URI chủ đề Nếu phát biểu có chủ đề, phát biểu sử dụng chung thẻ rdf:Description Cụ thể, cho tài liệu RDF/XML sau: Oxford Oxfordshire Wikipedia 10000 Tài liệu RDF/XML kết đồ thị RDF sau: 16 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số (2019) Hình Một ví dụ đồ thị RDF PHƯƠNG PHÁP CHUYỂN ĐỔI Khơng tính tổng quát, minh họa phương pháp chuyển đổi tài liệu XML đây: C LANGUAGE Giada De Laurentiis 2005 30.00 XQuery James McGovern Per Bothner 2003 49.99 17 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngơn ngữ XSL 3.1 Biến đổi thuộc tính Các thuộc tính thẻ tài liệu XML có tương ứng tự nhiên với ba tài liệu RDF Trong đó, thuộc tính XML tương ứng với thuộc tính RDF, thẻ chứa thuộc tính tương ứng với chủ thể (subject) giá trị thuộc tính tương ứng với đối tượng RDF Ví dụ: Xem xét thẻ Thẻ book có thuộc tính category, giá trị thuộc tính programing Do đó, có đồ thị RDF sau: Hình Minh họa chuyển đổi thuộc tính 3.2 Biến đổi giá trị văn thẻ Các giá trị văn thẻ XML biến đổi literal Các literal xem đối tượng phát biểu RDF Lúc có hai trường hợp xảy ra: Nếu thẻ chứa giá trị văn khơng có thuộc tính chủ thể literal thẻ cha thẻ chứa giá trị vị từ literal thẻ chứa giá trị văn Ví dụ: Xem xét thẻ 30.00 Thẻ có giá trị 30.00, khơng có thuộc tính thẻ cha book Do đó, có đồ thị RDF sau: Hình Minh họa chuyển đổi giá trị văn thẻ khơng có thuộc tính Nếu thẻ chứa giá trị văn có thuộc tính chủ thể literal thẻ chứa giá trị vị từ literal rdf:value Vi dụ: Xem xét thẻ C LANGUAGE Thẻ có thuộc tính lang (giá trị en) giá trị văn C LANGUAGE Do đó, có đồ thị RDF sau: Hình Minh họa chuyển đổi giá trị văn thẻ có thuộc tính 18 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số (2019) 3.3 Biến đổi thích Các thích XML giữ nguyên ba RDF Lúc phát biểu RDF, chúng biến đổi thành đối tượng, vị từ bổ sung cho là: xs:comment chủ thể nút cha chứa thích 3.4 Biến đổi thẻ XML Đối với thẻ khơng có thẻ con, tức thẻ chứa giá trị literal lúc quay lại trường hợp 3.2, tức biến đổi giá trị văn thẻ Đối với thẻ có danh sách thẻ lúc ta xem thẻ chủ thể lúc thẻ biến đổi theo hình thức đệ quy theo trường hợp nêu mục 3.1, 3.2, 3.3 3.4 3.5 Sử dụng ngôn ngữ XSL để biến đổi Áp dụng phương pháp biến đổi trên, sử dụng ngôn ngữ XSL để tiến hành biến đổi tài liệu XML cho sau: 19 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngôn ngữ XSL Và cuối nhận tài liệu kết RDF/XML sau biến đổi tài liệu XML ngôn ngữ XSL: 20 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số (2019) programing C LANGUAGE en 30.00 Giada De Laurentiis web XQuery en 49.99 James McGovern Per Bothner 21 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngôn ngữ XSL Đồng thời sau có kết trên, tiến hành kiểm chứng cách sử dụng công cụ Validator tổ chức W3C địa chỉ: https://www.w3.org/RDF/Validator/ nhận kết hoàn toàn xác KẾT LUẬN Trong báo này, thực việc chuyển đổi thành công liệu tài liệu XML sang tài liệu RDF theo định dạng RDF/XML Việc làm giúp cho việc chuyển đổi mơ hình liệu theo dạng truyền thống sang dạng liệu mà máy tính đọc cách nhanh chóng ngơn ngữ XSL, phục vụ cho tiến trình phát triển Web ngữ nghĩa Trong tương lai, cố gắng phát triển thuật toán cho phép chuyển đổi tài liệu XML có cấu trúc sang định dạng RDF cách tự động hóa, từ giảm thiểu thời gian công sức chuyển đổi TÀI LIỆU THAM KHẢO [1] [1] W3C Extensible Markup Language (XML) Website: http://www.w3.org/XML/ [2] [2] W3C Resource Description Framework (RDF) Website: http://www.w3.org/RDF/ [3] [3] Joe Fawcett, Liam R.E Quin, Danny Ayers (2012), Begin XML, Fifth edtition, John Wiley & Sons, Inc [4] [4] Jyun-Yao Huang, Christoph Lange, Sören Auer (2015) Streaming Transformation of XML to RDF using XPath-based Mappings, ResearchGate, Website: https://www.researchgate.net/publication/301377290 [5] [5] S Bischof (2012) Mapping between RDF and XML with XSPARQL, Journal on Data Semantics 1.3, pp 147–185, Website: http://dx.doi.org/10.1007/s13740-012-0008-7 22 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ, Trường Đại học Khoa học, ĐH Huế Tập 14, Số (2019) A METHOD FOR TRANSFORM XML DOCUMENTS TO RDF DOCUMENTS USING LANGUAGE XSL Nguyen Dung*, Nguyen Mau Han Faculty of Information Technology, University of Sciences, Hue University *Email: nguyendung@hueuni.edu.vn ABSTRACT Today, the Extensible Markup Language (XML) has become a widely accepted form of data exchange In addition to increasing the amount of Linked Data by using the Resource Description Framework (RDF), many tools for transforming an XML document into an RDF one have been developed In this article, we use Extensible Stylesheet Language (XSL) to transform XML documents into RDF documents as an effective solution to transfer existing data from systems to data RDF that is used in semantic web systems Keywords: linked data, RDF, semantic web, XML, XML Nguyễn Dũng sinh ngày 13/06/1988 Thừa Thiên Huế Năm 2010, ông tốt nghiệp cử nhân ngành Tin học năm 2013 ông tốt nghiệp thạc sĩ chuyên ngành Khoa học máy tính Trường Đại học Khoa học, ĐH Huế Hiện giảng viên Khoa Công nghệ Thông tin, Trường Đại học Khoa học, Đại học Huế Lĩnh vực nghiên cứu: giải thuật di truyền, ứng dụng di động, xml ứng dụng< Nguyễn Mậu Hân sinh năm 1957 Thừa thiên Huế Năm 1981, ông tốt nghiệp cử nhân toán trường Đại học Tổng hợp Huế Năm 1998 nhận thạc sĩ Khoa học máy tính Trường đại học Bách khoa Hà Nội Năm 2003, nhận tiến sĩ chuyên ngành Khoa học Máy tính Viện Công nghệ Thông tin Hà nội Hiện Phó Giáo sư, Giảng viên cao cấp Khoa Cơng nghệ Thông tin, Trường Đại học Khoa học, Đại học Huế Lĩnh vực nghiên cứu: Công nghệ phần mềm, Cơ sở liệu, Xử lý song song phân tán, tính tốn lưới 23 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngôn ngữ XSL 24 ... James McGovern< /rdf: li> Per Bothner< /rdf: li> < /rdf: Bag> 21 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngôn ngữ XSL < /rdf: Description>... 17 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngơn ngữ XSL 3.1 Biến đổi thuộc tính Các thuộc tính thẻ tài liệu XML có tương ứng tự nhiên với ba tài liệu RDF Trong... 19 Một phương pháp chuyển đổi tài liệu XML sang tài liệu RDFsử dụng ngôn ngữ XSL