Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 320 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
320
Dung lượng
1,7 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM -Phạm văn Chung RÀNG BUỘC TOÀN VẸN VÀ TRÍCH YẾU THỜI GIAN TRONG CƠ SỞ DỮ LIỆU HƯỚNG THỜI GIAN VÀ ỨNG DỤNG LUẬN ÁN TIẾN SĨ KỸ THUẬT Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 TP.HCM - Năm 2008 ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HCM -Phạm văn Chung RÀNG BUỘC TOÀN VẸN VÀ TRÍCH YẾU THỜI GIAN TRONG CƠ SỞ DỮ LIỆU HƯỚNG THỜI GIAN VÀ ỨNG DỤNG LUẬN ÁN TIẾN SĨ KỸ THUẬT Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 NGƯỜI HƯỚNG DẪN KHOA HỌC 1- PGS.TS DƯƠNG TUẤN ANH 2- PGS TS TRẦN THÀNH TRAI Phản biện 1: PGS.TS Đồng thị Bích Thủy Phản biện 2: PGS TSKH Nguyễn Xuân Huy Phản biện 3: PGS TS Đỗ Phúc Bảo vệ luận án cấp Nhà nước ngày 25/6/2008 ĐH Bách khoa, ĐH Quốc gia Tp HCM TP.HCM - Năm 2008 LỜI CAM ĐOAN Tôi cam đoan nội dung luận án kết nghiên cứu riêng Tất ý tưởng tham khảo từ kết nghiên cứu công bố công trình khoa học nêu rõ luận án Những chương trình phần mềm cài đặt đóng góp luận án thực chưa công bố công trình khác Tác giả luận án Phạm văn Chung i LỜI CẢM ƠN Trân trọng cảm tạ quí thày Ban Lãnh đạo Khoa CNTT, chủ nhiệm môn sở liệu trường ĐHBK-TP.HCM động viên, hướng dẫn tạo điều kiện thuận lợi cho trình nghiên cứu thực luận án Xin tri ân PGS TS Dương Tuấn Anh, PGS TS Trần Thành Trai người Thày tận tình dẫn dắt suốt trình học hỏi, nghiên cứu khoa học, thực chuyên đề Đặc biệt Thày Dương Tuấn Anh truyền thụ cho nhiều kiến thức, phương pháp làm việc, nghiên cứu cho nghiên cứu sinh để tìm đóng góp luận án Xin cảm ơn GS TS Yual Shahar, M.D., Ph.D, Professor of Medicine and Computer Science Stanford Medical Informatics Medical School Office Building X215, 251 Campus Drive Stanford University Standford, CA 94305-5479, GS TS Hồ Tú Bảo, School of Knowledge Science, Japan Advanced Institute of Science and Technology, cung cấp tài liệu cho nhiều ý kiến qúi báu giúp hoàn thiện luận án Chân thành cảm ơn Ban Giám Đốc Bệnh viện Ung Bướu TP.HCM tiếp nhận, tạo điều kiện cho phép tìm hiểu liệu bệnh nhân bệnh ung thư, ThS BS Nguyễn Đức Bảo quí Bác sĩ Phòng Chỉ Đạo tuyến Bệnh viện hướng dẫn, giải thích cho thu thập liệu bệnh án, để thực ứng dụng luận án Trân Trọng NCS Phạm văn Chung ii DANH MỤC CHỮ VIẾT TẮT CSDL : sở liệu CSDLTG : sở liệu hướng thời gian CEA : CarcinoEmbryonic Antigen: chất đánh dấu sinh học tốt cho bệnh Ung thư đại trực tràng Câu PS: câu-có-khuôn-mẫu Hệ thống KBTA: hệ thống khung thức tổng quát KBTA KBTA : Knowledge-based temporal abstraction RBTV : ràng buộc toàn vẹn RBTVTG : tính toàn vẹn liệu ràng buộc theo thời gian TYTG : trích yếu thời gian iii MỤC LỤC MỞ ĐẦU Chương TỔNG QUAN ………………………………………………… 1.1 Phân tích, đánh giá số công trình trước …………………… 1.1.1 Mô hình liệu thời gian ……………………………………… 1.1.2 Ngôn ngữ truy vấn thời gian …………………………………… 1.1.3 Tính toàn vẹn liệu ràng buộc theo thời gian ……… 1.1.4 Trích yếu thời gian sở liệu thời gian …………… 12 1.2 Những vấn đề nghiên cứu luận án …………………………… 16 1.2.1 Mô hình liệu thời gian ngôn ngữ truy vấn thời gian … 16 1.2.2 Ràng buộc toàn vẹn thời gian ………………………………… 17 1.2.3 Trích yếu thời gian ………………………………………… … 18 1.3 Tổ chức luận án ………………………………………………… 19 Chương CƠ SỞ LÝ THUYẾT ……………………………………… 20 2.1 Một số thuật ngữ ……………………………………………………… 20 2.2 Thời gian hợp lệ mô hình liệu thời gian ………………… 22 2.3 Bảng liệu trạng thái, bảng liệu biến cố khoảng thời gian 22 2.4 Những phép toán khoảng thời gian …………………………… 23 2.4.1 Phép so sánh khoảng ………………………………………… 24 2.4.2 Phép hội (UNION) ……………………………………………… 26 2.4.3 Phép giao (INTERSECT) ……………………………………… 26 2.4.4 Phép trừ (MINUS) ……………………………………………… 26 2.4.5 Phép toán fold ………………………………………………… 26 2.4.6 Phép toán unfold ……………………………………………… 28 2.5 Sự chuẩn hoá thời gian ……………………………………………… 28 2.5.1 Tính chất đồng phụ thuộc thời gian …………………… 29 2.5.2 Sự chuẩn hoá thời gian ………………………………………… 31 2.6 Sự cần thiết chuẩn hoá thời gian ……………………………… 32 2.7 Vấn đề thời gian bất định CSDLTG ………………………… 33 2.7.1 Tính bất định …………………………………………………… 33 2.7.2 Mở rộng ngữ nghĩa …………………………………………… 34 2.8 Ngôn ngữ truy vấn thời gian ………………………………………… 36 2.8.1 Đại số quan hệ ………………………………………………… 36 2.8.2 Đại số quan hệ thời gian ……………………………………… 36 2.8.3 Chuyển đại số quanhệ thời gian thành đại số quan hệ …… 37 2.8.4 Tiểu ngôn ngữ truy vấn thời gian SubTSQL ………………… 37 2.9 Tóm tắt chương ……………………………………………………… 37 iv Chương TÍNH TOÀN VẸN CỦA DỮ LIỆU RÀNG BUỘC THEO 40 THỜI GIAN 3.1 Đồ thị chuyển trạng thái biểu thị RBTVTG …………………… 41 3.1.1 Định nghĩa (Đồ thị chuyển trạng thái ) …………………… 42 3.1.2 Định nghĩa (Thoả mãn nhãn cạnh đồ thị)……… 44 3.1.3 Định nghĩa (Dãy chuyển trạng thái) ……………………… 45 3.1.4 Định nghĩa (Ràng buộc theo thứ tự thời gian) …………… 45 3.1.5 Định nghĩa (Ràng buộc qui luật nghiệp vụ) ………… 46 3.1.6 Định nghĩa (Ràng buộc dãy chuyển trạng thái) …… 47 3.2 Xây dựng thủ tục kiểm tra RBTVTG ……………… ……… 47 3.2.1 Những trạng thái lặp lại dãy chuyển trạng thái … 49 3.2.2 Kiểm tra RBTVTG đồ thị chuyển trạng thái …………… 57 3.3 Xây dựng đồ thị chuyển trạng thái từ đặc tả ràng buộc toàn vẹn 57 3.3.1 Cú pháp ngữ nghĩa PS ………………………… 57 3.3.2 Đặc tả RBTVTG PS ………………………………… 60 3.3.3 Kiểm tra PS hợp lệ ………………………………………… 64 3.3.4 Chuyển đổi PS thành đồ thị chuyển trạng thái ………… 67 3.4 Cài đặt RBTVTG ………………………………………………… 69 3.4.1 RBTVTG qui luật nghiệp vụ ……………………………… 69 3.4.2 Đặc tả ràng buộc RB PS ……………………………… 70 3.4.3 Chuyển đổi PS thành đồ thị chuyển trạng thái …………… 70 3.4.4 Lược đồ sở liệu kiểm tra RBTVTG ……………… 72 3.5 Tầm quan trọng RBTVTG 72 3.6 Biện luận …………………………………………………………… 74 3.6.1 So sánh hướng tiếp cận luận án với hướng tiếp cận 74 Gertz 3.6.2 Đánh giá chi phí thực nghiệm ………………………… 76 3.7 Tóm tắt chương ……………………………………………………… 77 Chương TRÍCH YẾU THỜI GIAN TRONG CƠ SỞ DỮ LIỆU THỜI 79 GIAN 4.1 Những phương pháp suy diễn tri thức cần thiết ……… 80 4.1.1 Những phương pháp suy diễn chế…………………… 80 4.1.2 Những tri thức cần thiết cho trích yếu thời gian …………… 84 4.2 Cơ sở tri thức cho trích yếu thời gian ……………………………… 84 4.2.1 Một số tính chất luật suy diễn …………………………… 84 4.2.2 Tính an toàn (safe) luật ………………………………… 86 4.2.3 Luật suy diễn thời gian sở liệu thời gian ……… 87 4.2.4 Ngôn ngữ trích yếu thời gian TAR (Temporal-Abstraction Rules) 88 4.2.5 Luật TYTG theo chiều ngang dùng chế suy diễn thời 90 gian 4.2.6 Luật TYTG theo chiều dọc dùng chế trích yếu đồng thời 91 4.2.7 Luật TYTG theo nội suy thời gian dùng chế nội suy thời 92 gian v 4.2.8 Luật TYTG chế trích yếu thời gian ………… 93 4.3 Trích yếu thời gian đồ thị suy diễn …………………………… 94 4.3.1 Đồ thị suy diễn ………………………………………………… 94 4.3.2 Hướng tiếp cận trích yếu thời gian đồ thị suy diễn …… 97 4.3.3 Xây dựng thủ tục trích yếu thời gian đồ thị suy diễn … 99 4.4 Phân rã liệu theo thời gian để chuẩn bị TYTG ……………… 103 4.4.1 Thủ tục phân rã liệu ………………………………………… 104 4.4.2 Phân tích độ phức tạp giải thuật phân rã liệu ……… 104 4.4.3 Một ví dụ phân rã liệu ……………………………………… 105 4.5 Ứng dụng trích yếu thời gian ……………………………………… 108 4.5.1 Xây dựng luật suy diễn ứng dụng …………………… 109 4.5.2 Xây dựng đồ thị suy diễn ứng dụng ………………… 114 4.6 Cài đặt trích yếu thời gian ………………………………………… 114 4.6.1 Tổ chức sở liệu ………………………………………… 114 4.6.2 Tích hợp TYTG với quản lý liệu thời gian vào kiến 115 trúc đơn 4.6.3 Kiến trúc hệ thống TDM ………………………………… 116 4.6.4 Ví dụ câu truy vấn TYTG …………………………………… 119 4.7 Phân tích TYTG dựa vào thực nghiệm ……………………… 122 đa hợp, tạo thành nhiều thuộc tính, có thuộc tính có giá trị khoảng hay biến cố thời gian Ví dụ : Xét hai quan hệ Position Salary, hai quan hệ chứa thuộc tính empno khoá cũ , khoá như: Position(empno, pos, ts, te), khoá (empno, pos) Salary(empno, sal, ts, te), khoá (empno, ts) C) Một số ví dụ thiết kế Trong phần trình bày số ví dụ minh họa: thực chuyển đổi từ sơ đồ quan niệm ER có giải thời gian, thành quan hệ CSDLTG - 184 Ví dụ 1: Cơ sở liệu quản lý công việc giảng viên Quản lý công việc giảng viên bao gồm việc theo dõi hoạt động: giảng dạy, tham gia nghiên cứu, hướng dẫn luận văn cho sinh viên trường đại học Nó bao gồm kiểu thực thể TEACHER, THESIS, COURSE, RESEARCH-PROJECT, mối liên kết: supervise, teach, participate Sơ đồ ER thiết kế hình E1 THESIS TEACHER COURSE supervise teach RESEARCHPROJECT participate Hình E1: Sơ đồ ER, quản lý công việc giảng viên Những giải thời gian cho sơ đồ ER - RESEARCH-PROJECT: kiểu thực thể có thời gian sống - TEACH, PARTICIPATE, SUPERVISE: mối liên kết có thời gian hợp lệ - Position, Trainning, Publication, Working-exp: thuộc tính có thời gian hợp lệ kiểu thực thể TEACHER Những quan hệ chuyển từ sơ đồ ER TEACHER(empno, name, addr,….) COURSE(course_no, title, credits,…) RESEARCH_PROJECT(proj_no, proj_name, budget, time_start, time_end, chief) THESIS(thesisno, title, student,…) TEACHING(empno, course_no, ts, te) PARTICIPATION(empno, proj_no, role, ts, te) SUPERVISION(empno, thesisno, role, ts, te) TEACHER-POSTION(empno, pos, ts, te, result) TEACHER-TRAINING(empno, training_course, ts, te) TEACHER-PUBLICATION(empo, title, type, detail, timeofprint) - 185 WORKING-EXPERIENCE(empno, job-title, orgnization, ts, te) Chú ý: Khoá quan hệ thuộc tính gạch Ví dụ 2: Cơ sở liệu bệnh viện Cơ sở liệu bao gồm: quản lý điều trị (TREATMENT) thuốc (DRUG-MEDICATION), xét nghiệm (LAB-TEST) để định bệnh lần phải giải phẫu (SURGERY) bệnh nhân bệnh viện Sơ đồ quan niệm ER thiết kế hình E2 Những giải thời gian cho sơ đồ ER - TREATMENT, DRUG-MEDICATION, SURGERY: thực thể có thời gian sống PATIENT TREATMENT DRUGMEDICATION SURGERY LAB-TEST Hình E2: Sơ đồ ER quản lý điều trị bệnh - LAB_TEST: kiểu thực thể có thời gian biến cố - Bed: thuộc tính có thời gian hợp lệ kiểu thực thể TREATMENT Những quan hệ chuyển từ sơ đồ ER PATIENT(p-id, name, addr, sex, age,…) TREATMENT(file-no, p-id, disease, ts, te) DRUD-MEDICATION(file-no, drug, ts, te dosage,) SURGERY(file-no, op-name, op-room, ts, te) LAB-TEST(file-no, test-name, event-time,…) BED(file-no, bed-number, ts, te) - 186 CÔNG TRÌNH CỦA TÁC GIẢ 1) Phạm văn Chung, Dương Tuấn Anh, “A Query Sublanguage for Temporal Clinical Database Systems and its Implementation” Tạp chí Tin học Điều khiển học, tập 21, số 4, trang 293-300, năm 2005 2) Phạm văn Chung, Dương Tuấn Anh, “Generating Transition Graphs from Temporal Integrity Constraints expressed as Patterned Sentences”, kỷ yếu Hội thảo khoa học Quốc gia lần thứ II: Nghiên cứu ứng dụng công nghệ thông tin (FAIR 2005), TP.HCM, 23-24/9, 2005, trang 129-140 3) Phạm văn Chung, Dương Tuấn Anh, “Temporal Abstraction from Temporal Clinical Databases using Inference Graphs”, Proceedings of the International Symposium on Communications and Information Technologies 2006, 18-20 October 2006, Bangkok, Thailand, ISBN: 0-7803-9741-X for CD-ROM 4) Phạm Văn Chung, Dương Tuấn Anh, “ Tiền xử lý liệu có tính thời gian kiểm tra ràng buộc toàn vẹn thời gian”, kỷ yếu Hội thảo quốc gia lần thứ IX, Nhà xuất Khoa học kỹ thuật Hà nội, 2006 5) Phạm Xuân Khánh, Hà Minh Nhật, Phạm Văn Chung, “ Dùng mã nguồn mở để biên dịch câu truy vấn có yếu tố thời gian, thực thi Oracle từ C++”, kỷ yếu Hội thảo quốc gia lần thứ IX, Nhà xuất Khoa học kỹ thuật Hà nội, 2006 6) Phạm Văn Chung, Dương Tuấn Anh, “ Applying Temporal Abstraction in Clinical Databases”, IEEE, 5th International Conference, RIVF’07, Hà nội, 3/2007 7) Lê văn Quốc Anh, Phạm văn Chung, Dương Tuấn Anh, “Implementation of Valid-time Indeterminacy in Temporal Clinical Database”, Proceedings of ACOMP 2007 International Workshop on Advanced computing and Applications, HoChiMinh City, pp 8-14 A TÀI LIỆU THAM KHẢO [1] Allen J.F (1993), “Maintaining Knowledge about Temporal Intervals”, Communication of the ACM, 26(11), pp 832-843 [2] Artale A., Franconi E (1999), “Reasoning with enhanced Temporal EntityRelationship Models”, Knowledge Representation Meets Databases, pp 1-5 [3] Balaban M., Boaz D., Shahar Y (2003), “Analysis of Temporal Abstraction in Medical Databases”, Proceedings of the 10th International Workshop on Knowledge Representation meets Databases (KRDB 2003), Hamburg, Germany [4] Balaban M., Boaz D., Shahar Y (2003),”Applying Temporal Abstraction in Medical Information Systems”, Annals of Mathematics, Computing and Teleinformatics, 1(1), pp 56-64 [5] Baudinet M., Chomicki J., Wolper P (1993), “Temporal Deductive Databases, in Temporal Databases”, Theory, Design, And Implementation, A.U Tansel et al., (Eds.), Benjamin Cummings, pp.294-320 [6] Bellazzi R., Larizza C., Riva A (1997), “Temporal abstraction for preprocessing and interpreting diabetes monitoring time series”, In Proc Workshop on Intelligent data analysis in Medicine and Pharmacology (IDAMAP 97), pp 1-9 [7] Bellazzi R., Larizza C., Riva A.(1997), “Temporal abstraction for diabetes patients management ”, In Proc AIME-97, Artificial Intelligence in Medicine, pp 319-330 [8] Bellazzi R., Larizza C., Magni P., Montani S., Stefanelli M.(2000), “Intelligent analysis of clinical time series: an application in diabetes mellitus domain”, Artificial Intelligence in Medicine 20(1): pp 35-57 [9] Boaz D., Shahar Y., (2003), “IDAN: A Distributed Temporal-Abstraction Mediator for Medical Databases”, Proceedings of the 9th Conference on Artificial Intelligence in Medicine, Europe (AIME) ‘03, Protaras, Cyprus [10] Boaz D., Balaban M., Shahar Y (2003), “ A Temporal-Abstraction Rule Language for Medical Databases”, Proceedings of the workshop on Intelligent Data Analysis in Medicine and Pharmacology (IDAMAP) '03, Protaras Cyprus [11] Boaz D., Shahar Y (2005), “ A Framework for Distributed Mediation of Temporal-Abstraction Queries to Clinical Databases”, Artificial Intelligence in Medicine, 34(1): pp 3-24 [12] Böhlen M.H (1994), “Valid Time Integrity Constraints”, Technical Report TR 94-30, Department of Computer Science, Univ of Arizona B [13] Böhlen M.H., Snodgrass R.T., Soo M.D.(1996), “Coalescing in Temporal Databases”, Proc of 22nd Very Large DataBases Conference, Mumbai (Bombay), India [14] Böhlen M.H., Chomicki J., Snodgrass R.T., Toman D (1996), “Querying TSQL2 Databases with Temporal Logic”, Proceedings of Advances Database Technology, LNCS, 1057, Springer, pp 325-341 [15] Chen P.(1986), “ Entity-Relationship Modeling: Historical Events, Future Trends, and Lessons Learned”, available at: http://citeseer.ist.psu.edu/595690.html [16] Chomicki J., Niwi D (1993),"On the Feasibility of Checking Temporal Integrity Constraints", ACM SIGACT-SIGMOD-SIGART, sysmposium on Principles of Database System, Wasington D C., pp 202-213 [17] Chomicki J., Toman D (1994), “Implementing Temporal Integrity Constraints Using an Active DBMS”, In Proc RIDE'94 Active Database Systems, Houston, pp 87-95, 1994 [18] Chomicki J (1995), “Efficient checking of Temporal Integrity Constraints Using bounded History Encoding” , Computing and Information Sciences Kansas State University Manhattan, KS66506 [19] Chomicki J., Toman D (1997), “Temporal Logic in Information Systems”, BRICS Lecture Series, Dept of Computer Science, University of Aarhus, Denmark [20] Clemensen J., Larsen S B., Bardram J E., (2005), “Developing Pervasive – Health Moving Experts from Hospital to Home”, University of Aarhus Aabogade 42, DK-8200 Aarhus N, Denmark [21] Clifford J., Gadia S.(1993), “The Interval-Extented Relational model and its application to Valid-Time Databases”, In A.Tansel et al., (Eds), Temporal Databases : Theory design, and implementation, chapter 3, pp 67-91 [22] Codd E F (1979), “Extending the Database Relational Model to Capture More Meaning”, IBM Research Laboratory, ACM Transactions on Database Systems, Vol 4, No 4, pp 397-434 [23] Das A K., Tu S W., Purcell G.P., Musen M A (1992), “An Extended SQL for Temporal Data Management in Clinical Decision-Support Systems”, Proc of 16th Annual Symposium on Computer Applications in Medical Care, Baltimore, pp 128-132 [24] Date C J., Darwen H., Lorentzos N A (2003), “Temporal data and Relation Model”, Morgan Knaufmann, Publishers [25] Dyreson C.E., (1994),“Valid-time Indeterminacy”, Ph.D Dissertation, Department of Computer Science, University of Arizona C [26] Elmasri R., Wuu T.J (1993), “A Temporal Model and Query language for EER Databases”, In A Tansel et al., (Eds), Temporal Databases : Theory Design, and Implementation, Benjamin/Cummings Publishers, chapter 9, pp 212-229 [27] Elmasri R , Wuu G.T.J., Kouramajian V.(1993), “A Temporal Model and Query Language for EER Databases”, A.U.Tansel, (Ed), Benjamin Cummings, pp 212-229 [28] Gabbay D., McBrien P (1991), “Temporal Logic and Historical Databases”, Proceedings of 17th VLDB Conference, Barcelona, pp 423-430 [29] Gertz M., Lipeck U.W (1995), “Temporal Integrity Constraints in Temporal Databases”, Proceedings of the International Workshop on Temporal Databases, J Clifford, A Tuzhilin (Eds.), Springer-Verlag, Berlin, pp 77-92 [30] Gertz M., Lipeck U.W (1996), “Deriving Integrity Maintaining Triggers from Transition Graphs”, Proceedings 9th International Conference on Data Engineering, IEEE Computer Society Press, pp.22-29 [31] Gregersen H., Jensen C.S (1997), “Temporal Entity-Relationship Models – a Survey”, TIMECENTER Technical Report TR-3 [32] Gregersen H., Jensen C.S (1998), “Conceptual Modeling of Time-varying Information”, TIMECENTER Technical Report TR-35 [33] Horn W., Miksch S., Egghart G., Popow C., Paky F (1997), “Effective Data Validation of High-frequence Data: Time-Point, Time-Interval, and Trend- Base Methodes”, Computers in Biology and Medicine, 27(5) [34] Ho T.B., Nguyen D.D., Kawasaki S., Nguyen T.D.(2002), “Extracting Knowledge from Hepatitis Data with Temporal Abstraction”, IEEE Conference on Data Mining, Workshop on Active Mining, Maebashi, pp 9196 [35] Ho T.B., Le, S.Q., Tran, T.N., Takabayashi K.(2004), “Combining Temporal Abstraction and Data Mining to Study Hepatitis”, ECML/PKDD 2004 Workshop on Discovery Challenge, pp 155-167 [36] Jensen C S., Snodgrass R T., Soo M D (1995), “The TSQL2 Data Model”, The TSQL2 Temporal Query Language, pp 153 238 Kluwer Academic Publishers, Available at: http://citeseer.ist.psu.edu/jensen95tsql.html [37] Jensen C.S., (2001), “Introduction to Temporal Database Research”, Available at: http://infolab.usc.edu/csci599/Fall2001/paper/chapter1.pdf [38] Jensen C.S., Snodgrass R T (1995), “Semantics of Time-Varying attributes and Their Use for Temporal Database design”, LNCS 1021, pp 366-377, Springer-Verlag D [39] Jensen C.S., Snodgrass R T., Soo M D., (1995), “Extending Existing Dependency Theory to Temporal Databases”, chapter 29 [40] Kawasaki S., Nguyen T.D., Ho T.B (2003), “Temporal Abstraction for Longterm Changed Tests in Hepatitis Domain”, Journal of Advanced Computational Intelligence and Intelligent Informatics 7(3), pp 348-354 [41] Lavrač N ,Keravnou E., Zupan B (1997), “Intelligent Data Analysis in Medicine” , Intelligent Data Analysis in Medicine and Phamacology, pp 243- 260 [42] Lipeck U.W., Zhou H (1991), “Monitoring Dynamic Integrity Constraints on Finite State Sequences and Existence Intervals”, In: Proceedings of the 3rdInternational Workshop on Foundations of Models and Languages for Data and Objects, Aigen, pp 115-130 [43] Lipeck U.W (1994), “Transitional Monitoring of dynamic Integrity Constraints”, Bulletin of the Technical Committee on Data Engineering, Vol 17, No.1, (Special Issue on Data Constraint Management), IEEE Computer Society, pp 38-42 [44] Locke P., “Oracle Call Interface Programmer’s Guide”, Oracle Corporation, 1997 [45] Lorentzos N.A.(1993), “The Interval-extended Relational Model and its Application to Valid-time Databases”, in A.U Tansel et al (Eds.), Temporal Databases – Theory, Design and Implementation, Benjamin/Cummings Publishing, pp 65-91 [46] Marchetti-Spacecamela A., Pelaggi A and Sacca D (1987), “Worst-case Complexity Analysis of Methods for Logic Query Implementation”, Proc of 6th, ACM-SIGACT-SIGMOD-SIGART Symposium of Principles of Database Systems, San Diego, California, USA, pp 294-301 [47] Navathe S.B., Ahmed R (1993), “Temporal Extensions to Relational Model and SQL”, in A.U Tansel et al (Eds.), Temporal Databases – Theory, Design and Implementation, Benjamin/Cummings Publishing, pp 92-109 [48] Nguyen J.H., Shahar Y., Tu S.W., Das Amar K., Musen M.A.(1999), “Integration of Temporal Reasoning and Temporal Data Maintenance into a Reusable Database Mediator to Answer Abstract, Time-Oriented Queries: The Tzolkin System”, J Intelligent Information System 13(1-2), pp.121-145 [49] Niki P et al.(1994), “Toward an Infrastructure for Temporal databases”, Report of an Invitational ARPA/NSF Workshop [50] O’Connor M J., Tu S W., Mussen M A (1999), “Applying Temporal Joins to Clinical Databases” , Proc of the AMIA Annual Symposium, Washington, D.C., pp 335-339 E [51] O’Connor M J., Tu S W., Mussen M A (2000), “Representation of Temporal Indeterminacy in Clinical Databases”, Technical Report SMI-2001-10857, Standard University School of Medicine, Stanford [52] O’Connor M.J., Tu S.W., Mussen M.A (2002), “The Chronus II Temporal Database Mediator”, Technical Report SMI-2002-0941, Standard University School of Medicine, Stanford [53] Ozsoyoglu G., Snodgrass R.T (1995), “Temporal and Real-Time Databases: A Survey”, Knowledge and Data Engineering, vol 7, pp 513-532 [54] Rosenzweig B (2000), “Oracle Pl/SQL interactive workbook” , The Prentice Hall PTR Oracle Series, ISBN 0-13-015743-0 [55] Sarda N.L., “HSQL: A Historical Query Language”(1993), in A.U Tansel et al (Eds.), Temporal Databases – Theory, Design and Implementation, Benjamin/Cummings Publishing, pp 110-140 [56] Segev A., Shoshani A (1993), “A Temporal Data Model Based on Time Sequences”, A.e.a Tansel, (Eds), Benjamin Cummings, pp 248-270 [57] Shahar Y (1994), “A Knowledge-base methode for Temporal Abstraction of Clinical Data”, Ph.D thesis, Stanford Medical Informatics, Stanford University School of Medicine [58] Shahar Y (1997), “Timing is Everything: temporal Reasoning and Temporal Data Maintenance in Medicine”, Western Journal of Medicine 168, pp 105113 [59] Shahar Y (1995), “A framework for knowledge-base temporal abstraction”, Technical Report No KSL95-29 , Section on Medical Informatics, Stanford University School of Medicine [60] Shahar Y., Cheng C.(1998), “Ontology-Driven Visualization of Temporal Abstractions”, A temporal-abstraction system for patient monitoring, Computers and Biomedical Research 26, pp 255-273 [61] Shahar Y., Musen M.A (1996), “Knowledge-Based Temporal Abstraction in Clinical Domains”, Artificial Intelligence in Medicine 8(3), pp 267-298 [62] Slivinskas G (2001), “A Middleware Approach to Temporal Query Processing, Ph.D Dissertation, Aalborg University, Denmark, Available at: http://www.citeser.ist.psu.edu [63] Snodgrass R.T (Ed.) (1994), “An Evaluation of TSQL2”, Commentary, TSQL2 Design Committee [64] Snodgrass R.T., Jensen C.S (1996), “Adding Valid Time to SQL/Temporal”, ISO International Organization for Standardization F [65] Snodgrass R.T (2000), “Developing Time-Oriented Database Application in SQL”, Morgan Kaufmann Publishers 2000 [66] Steiner A (1998), “A Generalisation Approach to Temporal Data Models and their Implementations”, Diss ETH No.12434 – 1998 [67] Steiner A (1999), ”TimeDB 2.0”, Version Beta 4, a TimeConsult Product, Available at: http://www.TimeConsult.com [68] Suchen H., Jensen C S., Snodgrass R T (1995), “Valid-Time Selection and Projection”, The TSQL2 Temporal Query Language, pp 251-298 [69] Tansel A.U (1993), “A Generalize Relational Framework for Modeling Temporal Data”, A.U Tansel, (Ed), Benjamin Cummings, pp 183-201 [70] Thomas N., (2004), “A compact guide to LEX & YACC”, Availabe at: http://www.epaperpress.com [71] Torp K., Jensen C.S., Böhlen M (1997),“Layered Implementation of Temporal DBMS’s – Concepts and Techniques”, TIMECENTER, Technical Report, TR2, [72] Ullman J.D (1998), “Principles of Database and Knowledge-Base Systems”, volume I, chapter 3, Logic as a Database Model [73] Wuu G.T.J., Dayal U (1993), “A Uniform Model for Temporal and Versioned Object-Oriented Databases”, A.U Tansel, (Ed), Benjamin Cummings, pp 230-247 [74] Yu C.T., Meng W (1998), “Principles of Database Query Processing for Advanced Applications”, Publishher: Morgan Kaufmann Publishers: ISBN: 1558604340, chapter 7, Query Processing in Deductive Database Systems, pp.246-265 [75] Lê văn Quốc Anh, “Giải vấn đề thời gian bất định sở liệu hướng thời gian - ứng dụng vào sở liệu bênh viện”, Luận văn cao học, Khoa Công nghệ thông tin, ĐH Bách khoa, TP HCM, 6/2005 [76] Nguyễn Đức Bảo (2002), “Sử dụng trị số ngưỡng-giá trị CEA để chuẩn đoán sớm ung thư đại-trực tràng tái phát”, Nghiên cứu y học, TP.HCM, Tập 6, phụ số 4, trang 198-202 [77] Nguyễn Đức Bảo (2002), “ Nghiên cứu giá trị xét nghiệm CEA ung thư đại trực tràng”, Nghiên cứu y học, TP.HCM, Tập 6, phụ số G Document Outline 12 LuanAnTSKT - Copy CHƯƠNG 1.1 Phân tích, đánh giá số công trình trước 1.2 Những vấn đề nghiên cứu luận án 1.3 Tổ chức luận án 2.2 Thời gian hợp lệ mô hình liệu thời gian 2.3 Bảng liệu trạng thái, bảng liệu biến cố khoảng thời gian 2.4 Những phép toán khoảng thời gian 2.4.1 Phép so sánh khoảng 2.4.2 Phép hội (UNION) 2.4.3 Phép giao (INTERSECT) 2.4.4 Phép trừ (MINUS) 2.4.5 Phép toán fold 2.4.6 Phép toán (unfold) 2.5.1 Tính chất đồng phụ thuộc thời gian 2.5.2 Sự chuẩn hoá thời gian 4.4.1 Thủ tục phân rã liệu 4.4.2 Phân tích độ phức tạp giải thuật phân rã liệu 4.4.3 Một ví dụ phân rã liệu [...]... trong những bảng không có dữ liệu thời gian, và ứng dụng vào việc thực hiện những câu truy vấn thời gian trên nhiều bảng có yếu tố thời gian trong cơ sở dữ liệu bệnh viện Chronus phát triển để những câu truy vấn hỗ trợ được cho việc ra quyết định điều trị trong khoa y của trường đại học Stanford 1.1.3 Tính toàn vẹn của dữ liệu ràng buộc theo thời gian Tính toàn vẹn của dữ liệu ràng buộc theo thời gian, ... một cơ sở lý thuyết về nó, và trên cơ sở này có thể phát triển những ứng dụng Chúng tôi chọn đề tài “RÀNG BUỘC TOÀN VẸN VÀ TRÍCH YẾU THỜI GIAN TRONG CƠ SỞ DỮ LIỆU HƯỚNG THỜI GIAN VÀ ỨNG DỤNG” Chọn ứng dụng trên bệnh ung thư, vì đối với loại bệnh này, bệnh nhân cần được phát hiện sớm, chữa trị kịp thời và thời gian theo dõi điều trị bệnh là khá dài, thường là từ 5 năm trở nên kéo theo khối lượng dữ liệu. .. chỉ có thời gian giao tác (transaction-time), ý nghĩa thuật ngữ thời gian hợp lệ” và thời gian giao tác” được trình bày trong chương 2, mục 2.1” Có vài mô hình có cả thời gian hợp lệ và thời gian giao tác gọi là song thời gian (bitemporal) Trong [36] đã liệt kê những mô hình dữ liệu thời gian đã được đề xuất, như bảng 1.1.1a Ngoài vấn đề khác nhau về loại thời gian (thời gian hợp lệ, thời gian giao... để thực hiện được việc quản lý, thao tác, truy xuất, trích yếu thời gian trên những dữ liệu lịch sử của những đối tượng trong thế giới thực Cơ sở dữ liệu cho những dữ liệu lịch sử được gọi là cơ sở dữ liệu hướng thời gian (CSDLTG) Mô hình dữ liệu thời gian (temporal data model) đã được nhiều tác giả nghiên cứu từ hai mươi năm qua và đã có nhiều ứng dụng [37],[50] như: - Tài chính: kế toán, quản lý vốn... - Ngôn ngữ truy vấn thời gian (temporal query language) - Tính toàn vẹn của dữ liệu ràng buộc theo thời gian (temporal integrity constraint) - Trích yếu thời gian (temporal abstraction) trên CSDLTG 1.1.1 Mô hình dữ liệu thời gian Có khoảng hơn hai mươi mô hình dữ liệu thời gian đã được nghiên cứu đề xuất trong hơn mười lăm năm qua Hầu hết trong chúng là những mô hình chỉ có thời gian hợp lệ (valid-time)... Hướng tiếp cận của Gertz và Lipeck [29],[30] Gertz và Lipeck áp dụng phương pháp kiểm tra ràng buộc toàn vẹn trong cơ sở dữ liệu truyền thống, được trình bày trong [42],[43] Để đưa vào ngữ cảnh của cơ sở dữ liệu thời gian, các tác giả dùng logic thời gian (temporal logic) như một ngôn ngữ chỉ ra ràng buộc, và nhấn mạnh đến vấn đề: những công thức logic thời gian được chuyển đổi thành đồ thị chuyển trạng... mức cơ bản Thực tế đối tượng trong thế giới thực có chuyển trạng thái phức tạp, không chỉ theo một trình tự nhất định, hơn nữa qui luật chuyển trạng thái cũng có thể thay đổi theo thời gian 1.1.4 Trích yếu thời gian trên cơ sở dữ liệu thời gian Trích yếu thời gian (temporal abstraction) là rút trích những dữ liệu thô trong CSDLTG thành những dữ liệu ngắn, gọn có ý nghĩa hơn Công việc này rất có ích trong. .. cơ sở dữ liệu và cơ sở dữ liệu có n+ 1 trạng thái, tính từ chỉ số 0 đến n Ví dụ : Xem một ràng buộc: “không nhân viên (emp) nào được nhận làm việc lại, sau khi họ đã nghỉ việc” Ràng buộc (RB) được mô tả bằng PastTL như RB : ¬(∃x) (emp(x) ∧ ♦ (¬emp(x) ∧ •emp(x))) (■), (♦) và • A: là những kết nối thời gian, có nghĩa: luôn luôn trong quá khứ (always in past), một thời điểm nào trong quá khứ và thời gian. .. (attribute-value) 2) Nhãn thời gian đặt trên những bộ (tuples) Luận án dựa trên hai mô hình của Lorentoz [45] và của Navathe [47] như sau: • Mô hình của Lorentzos Mô hình của Lorentzos là mô hình chỉ có thời gian hợp lệ, ông mở rộng mô hình dữ liệu quan hệ để ứng dụng trong những CSDL có thời gian hợp lệ, nhãn thời gian được gán trên giá trị của thuộc tính, và dùng khoảng thời gian để ghi thời gian hợp lệ có... đựơc ghi trong hai cột Ts và Te của bảng Luong như trong bảng 1.1.1c Bảng 1.1.1c: Bảng Luong MANV BACLUONG Ts Te 52 18K 5 9 52 20K 10 20 1.1.2 Ngôn ngữ truy vấn thời gian Mỗi mô hình dữ liệu thời gian thường đưa ra một ngôn ngữ truy vấn thời gian để thao tác, truy vấn dữ liệu thời gian Đã có một số ngôn ngữ truy vấn được đề xuất và được nói đến trong [68] theo thứ tự thời gian như: Legol 2.0 năm 1979, ... sở lý thuyết nó, sở phát triển ứng dụng Chúng chọn đề tài “RÀNG BUỘC TOÀN VẸN VÀ TRÍCH YẾU THỜI GIAN TRONG CƠ SỞ DỮ LIỆU HƯỚNG THỜI GIAN VÀ ỨNG DỤNG” Chọn ứng dụng bệnh ung thư, loại bệnh này,... 1.1.3 Tính toàn vẹn liệu ràng buộc theo thời gian Tính toàn vẹn liệu ràng buộc theo thời gian, gọi tắt ràng buộc toàn vẹn thời gian (RBTVTG) phải đặt có thao tác cập nhật liệu thời gian Có số... văn Chung RÀNG BUỘC TOÀN VẸN VÀ TRÍCH YẾU THỜI GIAN TRONG CƠ SỞ DỮ LIỆU HƯỚNG THỜI GIAN VÀ ỨNG DỤNG LUẬN ÁN TIẾN SĨ KỸ THUẬT Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 NGƯỜI HƯỚNG DẪN