Tích hợp các cơ sở dữ liệu XML

6 13 0
Tích hợp các cơ sở dữ liệu XML

Đang tải... (xem toàn văn)

Thông tin tài liệu

Nguồn thông tin phong phú và hữu ích hiện đang được lưu trữ trên hàng tỷ web site trên mạng. Trong khi một website truyền thống chỉ hỗ trợ cho biểu diễn thông tin, thì việc tìm kiếm một ngôn ngữ có cấu trúc để biểu diễn các thông tin trên trang Web đang được đầu tư nghiên cứu. Mời các bạn cùng tham khảo.

TẠP CHÍ KHOA HỌC, Đại học Huế, Số 22, 2004 TÍCH HỢP CÁC CƠ SỞ DỮ LIỆU XML Lê Thị Thu Thủy Trường Đại học Khoa học, Đại học Huế Đoàn Đại Dương Trường Đại học Sư phạm, Đại học Huế GIỚI THIỆU Nguồn thông tin phong phú hữu ích lưu trữ hàng tỷ web site mạng Trong website truyền thống hỗ trợ cho biểu diễn thơng tin, việc tìm kiếm ngơn ngữ có cấu trúc để biểu diễn thông tin trang Web đầu tư nghiên cứu XML1 (eXtensible Markup Language) xuất nhanh chóng trở thành chuẩn cho hệ web tương lai Nó tảng để hình thành lớp sở liệu (CSDL) mới: CSDL XML [3,8] Để hỗ trợ người sử dụng việc tìm sử dụng thơng tin, CSDL XML phân tán tích hợp, cung cấp biểu diễn từ CSDL XML khác tham gia vào hệ thống Một hệ thống CSDL XML tích hợp sinh lược đồ toàn cục (global schema) cho hệ thống Lược đồ thống hòa hợp lược đồ cục (local schema) nguồn liệu tham gia vào hệ thống Nó chìa khóa hỗ trợ cho tất tiến trình hệ thống sau Trên sở lược đồ tích hợp, tập ánh xạ đến nguồn cục tạo hỗ trợ cho việc xử lý câu truy vấn người sử dụng như: tách câu truy vấn, tích hợp liệu thô từ nguồn , giúp người sử dụng lấy thơng tin tích hợp cần thiết từ hệ thống, tiết kiệm thời gian công sức người sử dụng Nhiều hệ thống tích hợp xây dựng [2,4,6], nhiên hệ thống nhiều hạn chế giải xung đột lược đồ [5] tích hợp liệu [3,7] Để khắc phục hạn chế nghiên cứu trên, đưa khung làm việc (framework) tích hợp CSDL XML [3,7] Hệ thống vừa có khả tích hợp lược đồ vừa đưa định xử lý câu truy vấn người sử dụng Đây số hệ thống có chiến lược tích hợp n lược đồ cục lần (one shot strategy) [2] Nó giải xung đột bên lược đồ theo hướng thống Ngồi ra, hệ thống tách câu truy vấn người sử dụng lược đồ toàn cục thành truy vấn nguồn cục đồng thời Đây điểm so với hệ thống xây dựng [2,4,6] Một ưu điểm hệ thống liệu từ nguồn cục tích hợp trả http://www.w3.org/TR/REC-xml 45 thông tin thân thiện với người sử dụng Ngôn ngữ XDD (XML Declarative Description) [9] - ngôn ngữ mô tả khai báo XML - sử dụng làm tảng cho tất thành phần hệ thống Phần trình bày ngắn gọn tổng quan ngơn ngữ XDD Phần mô tả kiến trúc thành phần tạo nên hệ thống tích hợp CSDL XML Cuối cùng, phần kết luận viết TỔNG QUAN NGÔN NGỮ XDD XDD (XML Declarative Description) ngôn ngữ biểu diễn thông tin dựa vào khuôn dạng tài liệu XML Nó thực chất mở rộng khả biểu diễn phần tử XML cách sử dụng kết hợp với biến nhằm mơ tả tập thơng tin có liên quan với Một phần tử XML mở rộng gọi biểu thức XML (XML expresion) Bảng liệt kê loại biến sử dụng XDD Với quan điểm phần tử XML bình thường - không chứa biến - gọi biểu thức XML tảng (ground XML expresion) Một mô tả XDD tập mệnh đề XML với khuôn dạng sau: H  B1, , Bm, 1, , n m, n  0; H Bi (i=1, , m) biểu thức XML j (j=1, , n) ràng buộc XML (XML constraint) sử dụng để định nghĩa ràng buộc biểu thức XML Với khuôn dạng mệnh đề XML trên, H gọi phần đầu mệnh đề (Head); tập hợp {B1, , Bm, 1, , n} gọi phần thân mệnh đề (Body) Bảng 1: Kiểu biến XDD Tên biến Ký hiệu kiểu Biểu diễn Name-variables: biến tên $N Tên phần tử tên thuộc tính String-variables: biến chuỗi $S Chuỗi liệu Pair-variables: biến cặp "thuộc tính-giá trị" $P Dãy nhiều cặp "thuộc tính-giá trị" Expression-variables: biến biểu thức XML $E Dãy nhiều biểu thức XML Intermediate-variables: biến biểu thức trung gian $I Một phần biểu thức XML MƠ HÌNH HỆ THỐNG TÍCH HỢP CÁC CSDL XML Hệ thống đưa số hệ thống tích hợp có thành phần thiết kế để làm việc hài hịa với Trên XDD, tích hợp n lược đồ lúc [3] Lược đồ tích hợp đạt thống hài hòa lược đồ cục từ nguồn liệu khác Ngồi ra, hệ thống cịn có khả tách câu truy vấn thành truy vấn khớp với khuôn dạng cho lược đồ cục [7] Với hướng tiếp cận này, liệu rút trích từ nguồn tích hợp dễ dàng, cung cấp kết thân thiện cho người sử dụng Việc ứng dụng XDD làm cấu trúc 46 tảng hệ thống khiến thành phần hệ thống trở nên mềm dẻo việc tích hợp lược đồ xử lý tích hợp liệu 3.1 Câu truy vấn XDD: Một câu truy vấn [9] gồm ba phần: phần đầu (constructor), phần thân (pattern) ràng buộc (filters) câu truy vấn, tương ứng với ba phần mệnh đề XML So với câu truy vấn SQL truyền thống, contructor khuôn dạng liệu người sử dụng cần hiển thị, tương ứng mệnh đề SELECT; patern tương ứng với khuôn dạng liệu nơi cần lấy liệu, tương ứng với mệnh đề FROM filter đưa ràng buộc câu truy vấn, tương ứng với mệnh đề WHERE Trong trình thực truy vấn, pattern câu truy vấn khớp với phần tài liệu XML ràng buộc filter thoả mãn, kết câu truy vấn rút theo khuôn dạng contructor Dữ liệu truy vấn tài liệu khuôn dạng XML, gởi đến trung chuyển để tiếp tục trình tích hợp liệu 3.2 Bộ trung chuyển (Mediator): Mediator thành phần quan trọng hệ thống Nó bao gồm hai đơn vị: tích hợp lược đồ (schema integration) tích hợp liệu (data integraion) Bộ tích hợp lược đồ, có nhiệm vụ tích hợp tập lược đồ cục từ nguồn liệu khác cấu trúc, sinh lược đồ XML toàn cục tập ánh xạ Tập ánh xạ giúp hệ thống hiểu tương ứng đối tượng (tên trường, thuộc tính) lược đồ tích hợp lược đồ cục Trên XDD, ánh xạ tổ chức để sử dụng theo hai chiều với mục đích: - Tách câu truy vấn người sử dụng (trên cấu trúc lược đồ toàn cục) thành truy vấn phù hợp với cấu trúc lược đồ cục nguồn liệu liên quan; - Làm siêu liệu (metadata) Dựa vào thông tin từ siêu liệu, hệ thống chuyển đổi khn dạng liệu rút trích từ nguồn cục thành khuôn dạng chung hệ thống, kết xuất kết thân thiện với người sử dụng Cấu trúc ánh xạ hai chiều mô tả sau: $E:exp $E:exp1 $E:exp2 % % % % % % % % % Ánh xạ quy định tương ứng phần tử $E:exp lược đồ toàn cục với phần tử $E:exp1, $E:exp2 nguồn cục $S:source1 $S:source2 Hình 1: Cấu trúc ánh xạ Dựa XDD, cơng việc tích hợp lược đồ diễn đồng thời Nếu có n lược lược đồ tham gia vào hệ thống, chúng tích hợp, dung hòa mâu thuẫn đồng thời lúc để đưa lược đồ chung cuối Cần phải nhấn mạnh rằng, hệ thống tích hợp có khả tích hợp nhiều lược đồ đồng thời 47 tiến trình Hầu hết hệ thống phải tiến hành tích hợp cặp lược đồ phức tạp khả ngôn ngữ lập trình sử dụng Đối với hệ thống xây dựng, thành công diễn XDD lược đồ XML tham gia vào việc tích hợp xem biểu thức XML ($E:expression) luật tích hợp hệ thống, luật mệnh đề XML Trong q trình tích hợp hệ thống giải nhiều xung đột xảy lược đồ như: xung đột tên phần tử, xung đột cấu trúc phần tử, xung đột ràng buộc xung đột kiểu liệu Chi tiết loại xung đột cách thức giải xung đột chúng tơi trình bày chi tiết [3,7] Bộ tích hợp liệu tiến hành chuyển đổi khuôn dạng tất liệu trích rút từ nguồn cục cho phù hợp với lược đồ chung dựa vào thơng tin từ ánh xạ hai chiều Sau đó, tìm cách loại trừ mâu thuẫn bên liệu, kiểm tra loại bỏ liệu trùng lặp Cuối liệu trả cho người sử dụng qua giao diện hệ thống Thành phần quan trọng hệ thống, trung chuyển, thực chất tập luật XDD Việc gắn luật giúp thành phần hệ thống tự động suy diễn sinh kiện (fact) dựa tập luật kiện ban đầu Luật áp dụng đệ quy, chẳng hạn: phần thân luật gắn vào phần đầu luật khác để tiếp tục trình suy diễn, kết luật làm đầu vào luật khác Khi thực thi chương trình tập luật cài đặt ngơn ngữ lập trình XET [1], ngơn ngữ dựa lý thuyết XDD 3.3 Bộ xử lý truy vấn (Query handler): Đây thành phần giúp hệ thống tích hợp giao tiếp với người sử dụng Nó bao gồm ba thành phần chính: lập truy vấn (query formulation), tối ưu câu truy vấn (query optimization) tách câu truy vấn (query decomposition) $E:exp1 $E:content $E:exp2  $E:exp1 $E:content $E:exp2 $E:content $E:exp3 $E:content 48 % % % % % Luật rằng: truy vấn có chứa phần tử $N:tag1 ta thay phần tử $N:tag2 lược đồ cục $S:source tương ứng với % Khn dạng câu truy vấn % người sử dụng có chứa phần tử % $N:tag1 % % % % Ánh xạ ra: phần tử $N:tag1 lược đồ toàn cục tương ứng với phần tử $N:tag2 lược đồ cục $S:source $E:exp4 Hình 2: Một luật XDD dùng để tách câu truy vấn Bộ lập truy vấn giúp chuyển đổi câu truy vấn khuôn dạng người sử dụng thành câu truy vấn khn dạng XDD, ví dụ: chuyển truy vấn XQuery thành truy vấn khuôn dạng XDD Bộ tách truy vấn tách câu truy vấn sau tối ưu thành câu truy vấn Trong câu truy vấn người sử dụng có cấu trúc khuôn dạng lược đồ chung, câu truy vấn tách lại phù hợp với khuôn dạng lược đồ thành phần Với truy vấn này, hệ thống dễ dàng việc rút trích liệu trực tiếp từ nguồn cục Như đề cập trên, việc tách tiến hành hỗ trợ tập ánh xạ quy tắc suy diễn tập luật XDD đặc thù Một luật XDD cho việc tách câu truy vấn thể hình KẾT LUẬN Hệ thống tích hợp CSDL XML trình bày số hệ thống có khả tích hợp nhiều lược đồ đồng thời qua qui trình biến đổi Với điểm mạnh XDD việc mơ hình ứng dụng khn dạng XML, khung làm việc hệ thống hội đủ yêu cầu hệ thống tích hợp Tất thành phần hệ thống xây dựng XDD, tạo mềm dẻo trình xử lý chuyển đổi liệu chúng Hệ thống cung cấp cho người sử dụng liệu tích hợp khn dạng tài liệu XML chuẩn, thân thiện với người sử dụng, hữu ích việc trao đổi với ứng dụng XML khác Khung làm việc hệ thống cài đặt bước đầu thành công sử dụng ngơn ngữ lập trình XET, với CSDL XML phân tán mạng LAN Chúng dự định phát triển hệ thống để làm việc mơi trường internet, nơi CSDL phân tán mạng với mục đích thương mại Một ứng dụng điển hình nghiên cứu tương lai truy vấn thơng tin từ trang web XML tích hợp mạng chúng chia lược đồ chung TÀI LIỆU THAM KHẢO Anutariya, C., Wuwongse, V., and Wattanapailin, V An Equivalent-TransformationBased XML Rule Language Proceedings of the International Workshop on Rule Markup Languages for Business Rules in the Semantic Web, Sardinia, Italy (2002) Batini, C., Lenzerini, M., and Navathe, S B A Comparative Analysis of Methodologies for Database Schema Integration ACM Computing Surveys Vol 18, No (1986) 323 - 364 49 Duong, D D., and Wuwongse, V XML Databases Schema Integration Using XDD Proceedings of Advances in Web-Age Information Management Conference, China Lecture Notes in Computer Science, Springer Verlag, Vol 2762 (2003) 92 - 103 Gianolli, P., Mylopoulos, J A semantic approach to XML based data integration Proceedings of the 20th International Conference on Conceptual Modelling (ER), Yokohama, Japan (2001) Pluempitiwiriyawej, C., Hammer, J A Classification Scheme for Semantic and Schematic Heterogeneities in XML Data Sources Technical report TR00-004 University of Florida (2000) The MIX (Mediator of Information using XML) Available online: http://www.database.ucsd.edu/project/MIX (1999) Thuy, L T T., and Wuwongse, V Query Processing of Integrated XML Databases Proceedings of the 5th International Conference on Information Integration and Web-based Applications & Services, Jakarta, Indonesia (2003) 335 - 344 Wuwongse, V., Akama, K., Anutariya, C., and Nantajeewarawat, E A Data Model for XML Databases Journal of Intelligent Information Systems Vol 20, No 1, (2003) 63 - 80 Wuwongse, V., Anutariya, C., Akama, K., and Nantajeewarawat, E XML Declarative Description (XDD): A Language for the Semantic Web IEEE Intelligent Systems, Vol 16, No (2001) 54 - 65 INTEGRATION OF XML DATABASES Le Thi Thu Thuy College of Sciences, Hue University Doan Dai Duong, College of Pedagogy, Hue University SUMMARY XML database integration has been paid due attention to in the past few years, especially when XML is widely accepted as the new generation of the web However, the building of a framework that can resolve easily the conflicts between schemas and decompose query efficiently is still a great challenge The paper's purpose is to propose a new XML database integration framework, and to demonstrate the power of XDD theory in modeling user's query and system's components The framework can be extended to work with Web application metadata integration 50 ... biểu thức XML MƠ HÌNH HỆ THỐNG TÍCH HỢP CÁC CSDL XML Hệ thống đưa số hệ thống tích hợp có thành phần thiết kế để làm việc hài hịa với Trên XDD, tích hợp n lược đồ lúc [3] Lược đồ tích hợp đạt thống... hai đơn vị: tích hợp lược đồ (schema integration) tích hợp liệu (data integraion) Bộ tích hợp lược đồ, có nhiệm vụ tích hợp tập lược đồ cục từ nguồn liệu khác cấu trúc, sinh lược đồ XML toàn cục... phần tài liệu XML ràng buộc filter thoả mãn, kết câu truy vấn rút theo khuôn dạng contructor Dữ liệu truy vấn tài liệu khuôn dạng XML, gởi đến trung chuyển để tiếp tục q trình tích hợp liệu 3.2

Ngày đăng: 21/05/2021, 14:52

Mục lục

  • TẠP CHÍ KHOA HỌC, Đại học Huế, Số 22, 2004

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan