Kiến trúc đề xuất

Một phần của tài liệu Tổ chức xử lí tri thức đồng thời trên các cụm máy của máy tính hiệu năng cao (Trang 52)

Dựa tren cac phan tích ve ưng dụng cơ sờ dừ liệu, một kiên trúc hệ thống của cơ sở dữ liệu động được mô tả trong hình.

A . ũ . c m «#!*■ Giao diện người-máy Xử lí

thống kê dữ liệuHỏi

J] * *

Thể hiện

đổ hoa liệu, tri thứcMô tả dữ

Hỏi tri thức 7 T “ Quản tri Quản trị dữ liệu Quàn trị sự kiện, luật, hành động / / / ' / 3E — I--- Kĩ thuật phân tích dữ liệu Kĩ thuật khai phá dữ liệu ế 4.4__Toàn vẹn dữ liệu Cơ ché' lập luận

Tối ưu dữ liệu, lọc dữ liệu

--- T YM á y ^ M á y ^ 75---- » . • . t i i ---ĩ— Cơ sở dữ liệu sở tri thức chủ Cơ' k liệu Cơ s’

Hình. Kiến trúc cơ sờ dữ liệu động

Liên quan đến những khối chức năng mà kiến trúc đề xuất, có các đường truvền thône được kí hiệu bằng các đường nét đúp và các đường nét chấm chấm. Các đường truyền thông nét đúp thể hiện đường truyền thống trong các hệ quản trị dữ liệu hay tri thức. Qua thử nghiệm cài đặt các chức năng trong kiến trúc cơ sờ dữ liệu động, có một sổ lưu ý :

thứ nhât cho phép người dùng đặt câu hỏi theo giao diện hỏi dữ liệu, theo khuôn dạna Visual Basic. Hệ thống chuyển càu hỏi dừ liệu sang dạng vị từ, rồi thực hiện lập luận;

2. Xử lí tri thức theo đường chẩm chấm số 2, trực tiếp tới cơ sờ tri thức. Thực ra. có thẻ kết hợp cơ sờ này với cơ sở dữ liệu; hoặc tổ chức cơ sờ tri thức dưới dạng dữ liệu và dữ liệu meta trong cơ sở dữ liệu quan hệ. Việc xử lí tri thức theo đường nàv thực hiện nhờ ngôn ngừ Prolog. Có thể xem đó là phần chương trình Datalog, tạo nên cơ sờ dữ liệu suy diễn

3. Kĩ thuật phân tích dữ liệu hay khai phá dữ liệu, với các thuật toán về phân tích, thốns; kẻ, làm tinh, phát hiện tri thức, nhăm tăng thông tin cơ sở dữ liệu. Do vậy đường chấm chấm số 3 cho biết việc cập nhật dữ liệu một cách tự động nhờ việc tự kích hoạt các kĩ thuật này. Các hành động thực hiện kĩ thuật này được điều khiển nhờ cơ chế kích hoạt qui luật khi điều kiện thoả mãn;

4. Các điêu kiện toàn vẹn thường xuvên được hệ quản trị cơ sờ dữ liệu rà soát. Khi vi phạm điều kiện toàn vẹn, người dùng hay hệ thống cần cập nhật đữ liệu để cơ sờ dừ liệu bền vững. cỏns việc này thực hiện theo đường truyền thông số 4;

5. Cơ sờ dữ liệu được cập nhật, do người dùng, do điều kiện toàn vẹn hav do quá trình khai phá dữ liệu... đôi khi không cần thiết. Tuy kiến trúc chưa đề xuất giải pháp tối ưu dữ liệu như giải pháp trong [7, 8], một số kĩ thuật lọc lấy dữ liệu cần thiết hơn, hay lược bò những dữ liệu bổ sung mà không mang nhiều thông tin cần được nhúng trong hệ quản trị cơ sờ dữ liệu.

IV. Kết luận

Dù đã có một số cơ sờ dữ liệu suy diễn, dùng logic vị từ, cho phép xử lí tri thức, nhưng người ta vẫn nghiên cứu về mô hình cơ sờ dữ liệu suy diễn với mong muốn thu được mô hình dữ liệu hoàn chinh, lập luận với tri thức. Cơ sờ dữ liệu động xây dựng trên cơ sờ dữ liệu quan hệ, với các khía cạnh động về điều kiện toàn vẹn dữ liệu, một số qui tắc, sự kiện và lập ỉuận đon giản là phương án tạm thời.

Tài liệu tham khảo

[1], B. Yang et al., Deductive synthesis of workflows for e-science, IEEE inter. Symposium on cluster computing and the grid, p. 168- 175, 2005

[2], c. Lee., M. Chen, Progressive partition miner : an efficient algorithm for mining general temporal association rules, EEEE tran. on knowledge and data engineering, V. 15, N. 4,

1004-1017,2003

[3]. c. Zaniolo, H. Wang, Logic-based user-defined aggregates for the next generation of database systems, in “The logic programming paradigm : a 25 year perspective”, Ed. Springer, p. 401-426

[4], c. Zaniolo, Mining databases and data streams with query languages and rules, 14 p., 2005 [5]. D. Botzer, o. Etzion, Self-tuning of relationships among rule’s components in active

databases systems, IEEE tran. on knowledge and data engineering, V, 16, N. 3, p. 375­ 379,2004 '

[6]. J. D. Ưllman, Nguyên lí các hệ cơ sở dữ liệu và cơ sờ tri thức, T. 1, 2, 3. Ed. Thông kê, 2000

[7], Jiuyong Li, On Optimal rule discovery, IEEE tran. on knowledge and data engineering. Vol. 18, N. 4, 2006

[8]. Jiuyong Li, Robust Rule-based pred:c*:ion, IEEE tran. on knowledge and data engineering. Vol. 18, N. 8,2006

[9]. K. Sagonas, T. Swift, D. S. Warren, XSB as an efficient deductive database engine. Proc. of SIGMOD, p. 442- 453, 1994

[10]. M. Liu, Deductive database languages : problems and solutions, ACM computing surveys. V. 31, N. 1, p. 27-59, 1999

[11], M. Liu, Design and implementation of the ROL system, Journal of intelligent information systems, N. 14, p. 1-21, 2000

[12], Maja van der Velden, Knowledge facts, knowledge fiction, Journal of international Development, J. Wiley & son, 15 p., 2002

[13]. S. Ceri, Effective scheduling of detached rules in active databases, IEEE tran. on knowledge and data engineering, V. 15, N. 1, p. 2- 13, 2003

[14]. S. Flesca, S. Greco, Declarative semantics for active rules, 27 p., 2003

[15]. Sudermier A., Dietrich Suzannne W\, Shah V., An active database approach to integrating black-box software components, Arizona state University, 1998

[16]. Urban S. D. et al., An evaluation of distributed computing options for a rule-based approach to black-box software component integration, Proc. of 3rd int. workshop advanced issues of e-commerce and web-based information systems (WECWIS'01), 2001 [17]. Urban S. D. et al., Delta Abstractions : a technique for managing database states in runtime

debugging of active database rules, IEEE tran. on knowledge and data engineering. V. 15, N. 3, p. 597- 612, 2003

[18]. www. nwlink. com/~donclark/knowledge/knowledge. html, 2006

[19], Xindong Wu, Synthesizing High-frequency Rules from different data sources, IEEE tran. on knowledge and data engineering, V. 15, N. 2, p. 353- 367, 2003

[20]. Y. Law, H. Wang, C. Zaniolo, Query languages and data models for database sequences and data streams, Proc. of the 30,h VLDB conference, 12 p., 2004

End-user Interface for Active databases

Do TrungTuan

Abstract— E n d -u s e r fr ie n d s h ip in te r a c tiv e in te r fa c e fo r a deductive d ata b a s e p ro po ses fa c ilitie s to access to d a ta an d knowledge a c c u m u la te d in bases. A lo t o f k in d s o f lan g u ag es jllow users to q u e r y d a ta in th e e n v ir o n m e n t o f d a ta b a s e , an d certain lan g u ag es a llo w users to q u e r y k n o w le d g e a f te r knowledge e n g in e e rin g . A n a c tiv e d a ta b a s e is fo r c o m p le x ity o f data and k n o w le d g e , w it h m a n ip u la t in g o p e r a tio n . T h e p a p e r aims at a fo rm o rie n te d in t e r f a c e f o r a c tiv e d a ta b a s e s , in o r d e r to query both d a ta a n d k n o w le d g e .

Index T erm s— H C I ; A c t iv e D a ta b a s e ; F o r m ; Q u e r y

Một phần của tài liệu Tổ chức xử lí tri thức đồng thời trên các cụm máy của máy tính hiệu năng cao (Trang 52)

Tải bản đầy đủ (PDF)

(66 trang)