Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 120 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
120
Dung lượng
2,31 MB
Nội dung
- 1- MỤC LỤC HT TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU DANH MỤC CÁC BẢNG VÀ HÌNH VẼ TH MỞ ĐẦU UT CHƯƠNG 1: TỔNG QUAN VỀ CSDL VÀ CSDL THỜI GIAN UT 1.1- GIỚI THIỆU UT 1.2 NHẮC LẠI MỘT SỐ KHÁI NIỆM TRONG CSDL QUAN HỆ: UT 1.3- CƠ SỞ DỮ LIỆU CÓ YẾU TỐ THỜI GIAN UT 1.3.1- Dữ liệu thời gian số khái niệm bản: UT 1.3.2- Khái niệm Thời gian hợp thức Thời gian giao dịch: 11 UT 1.3.3- Các vấn đề thời gian hoá: 14 UT 1.3.3.1 - Bán thời gian hoá: 15 UT 1.3.3.1.1 - Các ràng buộc: 17 UT 1.3.3.1.2 - Truy vấn 17 UT 1.3.3.2 -Thời gian hóa tồn phần: 18 UT 1.3.3.2.1 – Ràng buộc 21 UT 1.3.3.2.2 – Truy vấn: 23 UT 1.4- BIỂU DIỄN YẾU TỐ THỜI GIAN TRONG CSDL THỜI GIAN 24 UT 1.4.1- Khoảng thời gian 24 UT 1.4.2- Các kiểu khoảng: 26 UT 1.4.2- Tốn tử vơ hƣớng khoảng: 29 UT 1.4.3- Các toán tử gộp nhập khoảng 31 UT 1.4.5- Ràng buộc khoảng 41 UT 1.4.6- Toán tử Update khoảng: 46 UT CHƯƠNG 2: THIẾT KẾ CƠ SỞ DỮ LIỆU THỜI GIAN 48 UT 2.1- QUÁ TRÌNH THIẾT KẾ 49 UT 2.1.1- Dƣ thừa liệu dị thƣờng cập nhật 51 UT 2.1.2- Chiều thời gian thiết kế logic 52 UT 2.2 KIỂU VÀ MODUL THỜI GIAN: 54 Cơ sở liệu thời gian UT - 2- TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU TU 2.2.1- Kiểu thời gian: 54 UT 2.2.2 - Module thời gian: 57 UT 2.3 PHỤ THUỘC HÀM THỜI GIAN: 59 UT 2.3.1 - Các tiên đề suy diễn cho TFDs: 61 UT 2.3.2 - Bao đóng tập thuộc tính: 68 UT 2.4 CHUẨN HOÁ THỜI GIAN: 70 UT 2.5 DẠNG CHUẨN BOYCE-CODD CÓ YẾU TỐ THỜI GIAN 79 UT 2.5.1 Tách lƣợc đồ module thời gian dạng TBCNF: 80 UT 2.6 BẢO TOÀN PHỤ THUỘC: 86 UT 2.7 DẠNG CHUẨN BA CÓ YẾU TỐ THỜI GIAN 88 UT 2.7.1 Tách lƣợc đồ module thời gian dạng T3NF: 89 UT CHƯƠNG 3: UT TU NGÔN NGỮ TRUY VẤN TSQL2 96 UT 3.1- GIỚI THIỆU 96 UT 3.2- MỘT SỐ TÍNH NĂNG CẦN THIẾT CỦA NGÔN NGỮ TSQL2: 97 UT 3.3- MỘT SỐ ĐẶC TẢ VỀ SỰ MỞ RỘNG CỦA TSQL2: 99 UT 3.4-VÍ DỤ MINH HOẠ 102 UT 3.4.1 - Lƣợc đồ cho CSDL thử nghiệm 102 UT 3.4.2 - Lƣợc đồ TSQL2 104 UT 3.4.3 - Cập nhật liệu thử nghiệm 106 UT 3.4.4 - Một số truy vấn: 110 UT MỘT SỐ HƯỚNG NGHIÊN CỨU TIẾP THEO 113 UT KẾT LUẬN 117 UT TÀI LIỆU THAM KHẢO 118 UT Cơ sở liệu thời gian - 3- DANH MỤC CÁC BẢNG VÀ HÌNH VẼ TU TU CHƢƠNG 1: TỔNG QUAN VỀ CSDL VÀ CSDL THỜI GIAN UT Bảng 1.1 CSDL Nhà cung cấp & Mặt hàng (Phiên dạng ảnh tại) UT TU Bảng 1.2 CSDL Nhà cung cấp & Mặt hàng (Phiên bán thời gian hoá với giá trị đơn giản) 15 UT TU Bảng 1.3 CSDL Nhà cung cấp & Mặt hàng (Phiên thời gian hố tồn phần thứ nhất, Sử dụng nhãn thời gian) 19 UT TU Bảng 1.4 CSDL Nhà cung cấp & Mặt hàng (Phiên thời gian hố tồn phần sau , Sử dụng khoảng) 25 UT TU TU TU TU TU TU TU TU TU TU TU TU CHƢƠNG 2: THIẾT KẾ CƠ SỞ DỮ LIỆU THỜI GIAN 48 UT Hình 2.1 Quá trình thiết kế CSDL 50 UT Hình 2.2: Ví dụ quan hệ khóa học 52 UT Hình 2.3 Phép tách tự nhiên 53 UT Hình 2.4: Thuật tốn tìm X + U PU UT TPU 69 UT Hình 2.5: Thuật tốn tách dạng chuẩn TBCNF 82 UT Hình 2.6 Hàm Raise 87 UT Hình 2.7 Thuật toán tách dạng chuẩn T3NF 93 UT CHƢƠNG 3: UT TU NGÔN NGỮ TRUY VẤN TSQL2 96 UT Bảng 3.1 - Nhanvien_Tbl 109 UT Bảng 3.2 - Kynang_Tbl 109 UT Bảng 3.3 - Phong_ban_Tbl 110 UT Cơ sở liệu thời gian - 4- MỞ ĐẦU Hầu hết ứng dụng kỹ thuật sở liệu (CSDL) tự nhiên mang yếu tố thời gian Ví dụ: ứng dụng tài nhƣ: quản lý đầu tƣ, kế toán, ngân hàng; ứng dụng lƣu trữ hồ sơ nhƣ: quản lý nhân sự, hồ sơ bệnh án, quản lý kiểm kê, kiểm toán; ứng dụng lập lịch ngành đƣờng sắt, hàng không, đặt chỗ khách sạn; ứng dụng khoa học nhƣ: dự báo thời tiết, thảm hoạ tự nhiên…v.v Tất ứng dụng dựa CSDL ghi lại liệu tham chiếu tới thời gian đƣợc gọi “CSDL có yếu tố thời gian” hay “CSDL thời gian” (Temporal Database) Với ứng dụng rộng rãi lĩnh vực đời sống, quản trị CSDL thời gian đƣợc xem lĩnh vực nghiên cứu đầy sức lôi cuốn, có hàng trăm nhà nghiên cứu với 2000 viết vấn đề suốt thập kỷ qua Việc xây dựng ứng dụng CSDL có yếu tố thời gian thành cơng mang ý nghĩa quan trọng thực tiễn Một CSDL thời gian phải phản ánh hay biểu diễn đƣợc cách chân thực nhất, xác liệu thời điểm Một hệ quản trị CSDL có yếu tố thời gian quản lý liệu tham chiếu tới thời gian (Time-referenced data), yếu tố thời gian gắn liền với thực thể CSDL Nói cách khơng chặt chẽ, sở liệu (CSDL) thời gian CSDL bao gồm liệu mang tính lịch sử thay liệu Một vài số nghiên cứu thừa nhận quan điểm cực đoan liệu CSDL đƣợc chèn (Insert), khơng xoá (Delete) đƣợc cập nhật (Update), trƣờng hợp CSDL bao gồm liệu mang tính lịch sử Ở thái cực khác CSDL dạng ảnh, bao gồm liệu liệu đƣợc xóa cập nhật kiện biểu diễn liệu khơng cịn (hay nói cách khác, CSDL dạng ảnh CSDL nhƣ cách hiểu thông thƣờng, CSDL biểu thị thời gian) Cơ sở liệu thời gian - 5- Trong trình lƣu trữ thao tác CSDL giá trị số thuộc tính ổn định theo thời gian, nhƣng với số thuộc tính khác giá trị chúng lại thay đổi theo thời gian Luận văn nghiên cứu, hệ thống lại khái niệm mơ hình liệu quan hệ có yếu tố thời gian kéo theo phép toán đại số, mở rộng phụ thuộc hàm dạng chuẩn có yếu tố thời gian Trong thực tế, gặp phải nhiều khó khăn quản trị CSDL thời gian mô hình liệu ngơn ngữ truy vấn thơng thƣờng (không mang yếu tố thời gian) Từ khái niệm sở CSDL thời gian, luận văn tập trung vào nghiên cứu trình bày cách giải số vấn đề liên quan nhƣ: Biểu diễn yếu tố thời gian CSDL Xây dựng mơ hình CSDL thời gian, thêm yếu tố thời gian vào ngơn ngữ truy vấn chuẩn hố lệnh truy vấn Thiết kế CSDL thời gian mức Logic Khái niệm Xử lý câu lệnh truy vấn, toán tử đại số, mục (index) CSDL thời gian Bản luận văn đƣợc chia thành bốn phần Phần thứ nhắc lại số khái niệm CSDL quan hệ, tập trung vào giới thiệu nét tổng quan CSDL thời gian, thuật ngữ nhƣ sở để tiếp cận với CSDL thời gian Trong phần thứ hai, luận văn sâu vào việc nghiên cứu cách xây dựng, thiết kế CSDL có yếu tố thời gian, vấn đề liên quan đến phụ thuộc hàm thời gian, dạng chuẩn thời gian thuật toán tách lƣợc đồ module thời gian dạng chuẩn Để có minh hoạ rõ nét cụ thể CSDL thời gian, phần ba giới thiệu ngắn ngôn ngữ truy vấn thời gian (TSQL2) thơng qua ví dụ cụ thể Phần cuối luận văn phần nhận xét, kết luận số hƣớng nghiên cứu Cơ sở liệu thời gian - 6- U CHƢƠNG : TỔNG QUAN VỀ CSDL VÀ CSDL THỜI GIAN U 1.1- GIỚI THIỆU Một CSDL tập hợp liệu có liên quan với chứa thơng tin tổ chức (nhƣ trƣờng đại học, ngân hàng, công ty, hay nhà máy…), đƣợc lƣu trữ thiết bị nhớ thứ cấp (nhƣ đĩa từ, đĩa quang học…) để đáp ứng nhu cầu khai thác thông tin nhiều ngƣời sử dụng với nhiều mục đích khác Do đó, trƣớc hết CSDL phản ánh đƣợc thông tin hoạt động tổ chức định, nghĩa biểu thị “góc” giới thực (tạm gọi giới nhỏ) Nhƣ CSDL phải phản ánh đƣợc cách trung thực thay đổi giới nhỏ đó, phải tập hợp thơng tin mang tính hệ thống khơng thể tập hợp liệu tuỳ tiện chứa thông tin rời rạc khơng có mối quan hệ với Thơng tin lƣu trữ CSDL đƣợc chia sẻ cho nhiều ngƣời sử dụng hay cho nhiều ứng dụng khác Từ cho thấy việc thiết kế, xây dựng CSDL phản ánh giới nhỏ cách khách quan, chân thực xác trở thành nhu cầu tất yếu Từ năm 80 kỷ hai mƣơi, hệ CSDL dựa mơ hình quan hệ đƣợc sử dụng cách rộng rãi tính đơn giản sở tốn học Tuy nhiên giống nhƣ hệ CSDL thông thƣờng, CSDL quan hệ biểu thị đƣợc liệu dạng tĩnh (dạng ảnh) với kiện thực thể tƣơng ứng Trong CSDL dạng ảnh, yếu tố thời gian ảnh thông thƣờng đƣợc xem thời điểm (nghĩa thời gian mà CSDL thực đƣợc xem xét Ngay yếu tố thời gian CSDL dạng ảnh diễn khác với “hiện tại”, điều khơng tạo khác biệt đáng kể đến cách quản lý sử dụng liệu Tuy nhiên, nhƣ thấy liệu CSDL thời gian đƣợc quản lý sử dụng khác hàng loạt phƣơng diện quan trọng so với cách đƣợc quản lý sử dụng CSDL dạng ảnh; điều đƣợc xem phần quan trọng đƣợc trình bày cụ thể sau phần nhắc lại số khái niệm CSDL quan hệ Cơ sở liệu thời gian - 7- 1.2 NHẮC LẠI MỘT SỐ KHÁI NIỆM TRONG CSDL QUAN HỆ: Mơ hình quan hệ biểu thị liệu CSDL nhƣ bảng giá trị gồm hàng cột Mỗi hàng bảng tập giá trị có liên quan đến nhau, giá trị biểu thị kiện tƣơng ứng với thực thể hay mối quan hệ giới thực [1] Miền (Domain): Một miền D tập hợp giá trị nguyên tố, hiểu theo nghĩa giá trị miền phân chia phạm vi mơ hình quan hệ Quan hệ (Relation): Một quan hệ tập thuộc tính tập tích Đềcác hay nhiều miền: Cho quan hệ r xác định tập thuộc tính Ω = {A , A ,…,A n } Khi B B B B B B r ⊆ Dom(A ) × Dom(A ) × … × Dom(A n ), Dom(A i ) miền B B B B B B B B thuộc tính A i , tập giá trị B B Lược đồ quan hệ (Relation schema): Một lƣợc đồ quan hệ R cặp có thứ tự R = , Ω tập hữu hạn thuộc tính quan hệ, F tập điều kiện thuộc tính (F cịn gọi tập ràng buộc tồn vẹn) Siêu khố lƣợc đồ quan hệ R tập hợp gồm hay nhiều thuộc tính lƣợc đồ R có tính chất xác định thể R Khoá lƣợc đồ quan hệ siêu khoá lƣợc đồ cho tập thực khơng siêu khố Khố ngồi lƣợc đồ quan hệ tập hợp gồm hay nhiều thuộc tính khố lƣợc đồ quan hệ khác Phụ thuộc hàm: Cho U tập thuộc tính R(U) lƣợc đồ quan hệ U Giả sử X, Y ⊆U Khi đó, Y đƣợc gọi phụ thuộc hàm vào X lƣợc đồ R(U), ký hiệu X Y, với quan hệ r lƣợc đồ R(U), với hai t , t ∈ r, mà t [X] = t [X] t [Y] = t [Y] B B B B Cơ sở liệu thời gian B B B B B B B B - 8- Bao đóng: Ta gọi bao đóng tập hợp phụ thuộc hàm F tập phụ thuộc hàm đƣợc suy diễn logic từ F ký thiệu F* Hay nói cách hình thức: F*= { X Y | F ⊨ (X Y) } Khoá: Giả sử U tập thuộc tính, R lƣợc đồ quan hệ U thỏa tập phụ thuộc hàm F, K tập U Ta nói K khoá R nếu: o (K U) ∈ F*, nghĩa với quan hệ r lƣợc đồ R, hai r K (r ∈ R) (t , t ∈ r) B B B B t [K] = t [K] t = t B B B B B B B B o Nếu K‟ tập thực K (K‟ U) ∉ F* Hệ tiên đề suy diễn Armstrong: o Phản xạ: Nếu Y ⊆ X X Y o Gia tăng: Nếu X Y với Z ⊆ U : XZ YZ o Bắc cầu: Nếu X Y Y Z X Z Phép tách với kết nối không thông tin: Phép tách R thành {R , B B R , ,R } đƣợc gọi tách không thông tin tập phụ thuộc hàm F, B B B B với quan hệ r R thoả mãn F, ta có r = r * r * * r k , B B B B B B r i = U i (r) (r i kết phép chiếu r U i ) B B B B B B B B Dạng chuẩn 3NF: Lƣợc đồ quan hệ R đƣợc gọi thuộc dạng chuẩn ba (3NF) thuộc dạng chuẩn thứ với X A R X phải siêu khố A phải thuộc tính khố Dạng chuẩn BCNF: Lƣợc đồ quan hệ R chuẩn hóa với tập phụ thuộc hàm F đƣợc gọi thuộc dạng chuẩn BCNF có X A lƣợc đồ R A ∉ X X chứa khố R (nói cách khác, X siêu khoá) Cơ sở liệu thời gian - 9- 1.3- CƠ SỞ DỮ LIỆU CÓ YẾU TỐ THỜI GIAN 1.3.1- Dữ liệu thời gian số khái niệm bản: Trƣớc bắt đầu xem xét tới mơ hình liệu thời gian ngơn ngữ truy vấn, nghiên cứu khái niệm độc lập với mơ hình liệu, gắn kết yếu tố thời gian với kiện, vấn đề cốt lõi quản lý liệu thời gian Trong chƣơng sử dụng CSDL đơn giản “Nhà cung cấp & Mặt hàng” để giải thích minh hoạ vấn đề liên quan đến CSDL thời gian Bảng 1.1 CSDL Nhà cung cấp & Mặt hàng (Phiên dạng ảnh tại) (Các thuộc tính khố ví dụ đƣợc in đậm gạch chân ) U S: TENCONGTY TRANGTHAI VinhTrinh 20 CMC 10 HaiAn 30 VinaComm 20 Hanel 30 S# S1 S2 S3 S4 S5 SP: S# S1 S1 S1 S1 S1 S1 S2 S2 S3 S4 S4 S4 U U P# P1 P2 P3 P4 P5 P6 P1 P2 P2 P2 P4 P5 U U Cơ sở liệu thời gian DIACHI HaNoi SaiGon SaiGon HaNoi DaNang U - 10 - U Chú ý: bảng S thể nhiện: “Nhà cung cấp có số hiệu S#, có tên U TENCONGTY, có tình trạng TRANGTHAI có trụ sở địa DIACHI”; bảng SP minh hoạ nhà cung cấp S# có khả cung ứng mặt hàng P# Tất nhiên CSDL CSDL dạng ảnh, số nhà cung cấp giá trị trạng thái S1 20 Một cách tƣơng phản, phiên mang yếu tố thời gian CSDL không giá trị trạng thái 20, mà cịn giá trị đƣợc thiết lập từ ngày tháng giá trị 15 từ ngày 5-04 đến 30-06 v.v Hiển nhiên, đặc điểm bật CSDL thời gian yếu tố thời gian Do số nghiên cứu CSDL thời gian có nhiều khảo cứu chất thời gian vài vấn đề sau đƣợc nghiên cứu thấu đáo: Liệu thời gian có điểm đầu điểm kết thúc? Thời gian liên tục hay xuất theo lượng rời rạc? Việc mô tả khái niệm quan trọng: “hiện tại” (now) tốt đến mức nào? Những vấn đề thú vị nhƣng khơng đơn thuộc khía cạnh CSDL, không sâu vào xem xét chƣơng Thay vào đó, ta đƣa giả định hợp lý chỗ thích hợp Cách tiếp cận cho phép ta tiếp cận mục đích ban đầu cách trực tiếp Tuy nhiên ta ý rằng, nghiên cứu thời gian dẫn tới số kết luận thú vị, nêu lên ý tƣởng phát triển liệu thời gian có ứng dụng nhiều lĩnh vực khác Xuyên suốt chƣơng này, ta sử dụng khóa thời gian, tốn tử thời gian, quan hệ thời gian, khái niệm không giới hạn liệu thời gian Sau ta tập trung vào vấn đề quan tâm quan trọng nhiều ý tƣởng nghiên cứu (nói cách khác, chƣơng chắt lọc phần hay (chất lƣợng) nghiên cứu thông qua vấn đề thuật ngữ vấn đề nhỏ khác) Dữ liệu thời gian [2]: (Temporal data) Nếu liệu cách biểu diễn mã hóa kiện, liệu thời gian biểu diễn mã hoá kiện Cơ sở liệu thời gian - 106 - Bảng Nhanvien_Tbl xác định tập thực thể NHANVIEN tập quan hệ NV_PB Thuộc tính ID_NV xác định nhân viên; thuộc tính Ho_ten khơng thay đổi theo thời gian, ta sử dụng thuộc tính đại diện (SURROGATE) để xác định nhân viên (không tồn giá trị nhân viên giống hệt nhau) Bảng Kynang_Tbl xác định tập quan hệ KYNANG_NV tập thực thể Ky_nang Giá trị thuộc tính ID_NV_KN Kynang_Tbl, ID_Truong_phong Phong_ban_Tbl, xác định nhân viên Cuối cùng, bảng Phong_ban_Tbl xác định tập quan hệ Truong_phong tập thực thể PHONGBAN 3.4.3- Cập nhật liệu thử nghiệm Ta cập nhật giá trị cho nhân viên nhƣ sau: U NV1: Lê Văn Hùng (Nam) sinh ngày 7/4/1975, làm việc phòng dự án từ ngày U 1/2/2000 đến ngày 31/1/2002, phòng kinh doanh từ ngày 4/2/2002 tới Từ ngày 4/2/2002 tới Hùng làm trƣởng phòng kinh doanh Lợi tức phòng kinh doanh 40% kể từ Hùng làm trƣởng phòng Lƣơng Hùng triệu từ ngày 1/2/2000 đến 31/12/2000, sau lên triệu từ 1/1/2001 đến 3/2/2002, từ 4/2/2002 đến có mức lƣơng triệu Lê Văn Hùng có kỹ lập trình C# từ ngày 1/2/2000, tiếng Anh C từ ngày 2/4/2001, lái xe B2 từ 25/9/2004 đến 25/9/2007 Những thông tin đƣợc cập nhật CSDL nhƣ sau INSERT INTO Nhanvien_Tbl VALUES (NEW, ’Lê Văn Hùng’, 20000000, ’M’, DATE ’7/4/1975’, ’Du an’) VALID PERIOD ’[1/2/2000 – 31/12/2000]’ ; Trong câu lệnh truy vấn trƣờng ID_VN trƣờng đại diện (surrogate) từ khố “NEW” tạo giá trị đại diện ngƣời dùng khơng nhìn thấy đƣợc giá trị Với mệnh đề VALID Cơ sở liệu thời gian PERIOD ’[1/2/2000 – - 107 - 31/12/2000]’ giá trị có thời gian hợp thức khoảng từ ngày 1/2/2000 đến 31/12/2000 UPDATE Nhanvien_Tbl SET Luong TO 3000000 VALID PERIOD ’[1/1/2001 - 3/2/2002]’ WHERE ID = (SELECT DISTINCT ID_NV FROM Nhanvien_Tbl WHERE Nhanvien_Tbl Ho_ten = ’Lê Văn Hùng’; INSERT INTO Nhanvien_Tbl SELECT (Nhanvien_Tbl.ID_NV, ’Lê Văn Hùng’, 50000000, ’M’,DATE ’7/4/1975’, ’Kinh doanh’) VALID PERIOD ’[4/2/2002 - now]’ FROM Nhanvien_Tbl WHERE Ho_ten = ’Lê Văn Hùng’; INSERT INTO Phong_ban_Tbl SELECT (’Kinh doanh’, 40, Nhanvien_Tbl.ID_NV) VALID PERIOD ’[4/2/2002 - now]’ FROM Nhanvien_Tbl WHERE Nhanvien_Tbl Ho_ten = ’Lê Văn Hùng’; INSERT INTO Kynang_Tbl SELECT (Nhanvien_Tbl.ID_NV, ’LapTrinhC#’) VALID PERIOD ’[1/2/2000 - now]’ FROM Nhanvien_Tbl WHERE Nhanvien_Tbl Ho_ten = ’Lê Văn Hùng’; INSERT INTO Kynang_Tbl SELECT (Nhanvien_Tbl.ID_NV, ’TiengAnh_C’) VALID PERIOD ’[2/4/2001 - now]’ FROM Nhanvien_Tbl WHERE Nhanvien_Tbl Ho_ten = ’Lê Văn Hùng’; INSERT INTO Kynang_Tbl SELECT (Nhanvien_Tbl.ID_NV, ’Laixe_B2’) VALID PERIOD ’[25/9/2004 – 25/9/2007]’ FROM Nhanvien_Tbl WHERE Nhanvien_Tbl Ho_ten = ’Lê Văn Hùng’; U Cơ sở liệu thời gian - 108 - NV2: Nguyễn Thị Mai (Nữ) sinh ngày 1/10/1972, làm việc phòng dự án (Duan) U trƣởng phòng từ ngày 1/2/2000 đến Lợi tức phòng dự án 20% từ ngày 1/2/2000 đến ngày 6/7/2002 sau 25% từ ngày 7/7/2002 đến 18/2/2004 22% từ ngày 19/2/2004 đến Lƣơng Mai 1,5 triệu từ ngày 1/2/2000 đến 31/12/2000, sau lên 2,5 triệu từ 1/1/2001 đến 31/12/2002, từ 1/1/2003 đến có mức lƣơng 4,5 triệu Nguyễn Thị Mai có khả quản lý từ 1/2/2000 đến Thông tin Nguyễn Thị Mai đƣợc cập nhật nhƣ sau: INSERT INTO Nhanvien_Tbl VALUES (NEW, 'Nguyễn Thị Mai’, 1500000, ’F’, DATE ’1/10/1972’, ’Du an’) VALID PERIOD ’[1/2/2000 – now]’ ; INSERT INTO Phong_ban_Tbl SELECT (’Du an’, 20, Nhanvien_Tbl.ID_NV) VALID PERIOD ’[1/2/2000 - now]’ FROM Nhanvien_Tbl WHERE Nhanvien_Tbl.Ho_ten = 'Nguyễn Thị Mai’; UPDATE Phong_ban_Tbl SET Loi_tuc TO 25 VALID PERIOD ’[7/7/2002 - 18/2/2004]’ WHERE Ten_PB = ’Du an’ ; UPDATE Phong_ban_Tbl SET Loi_tuc TO 22 VALID PERIOD ’[19/2/2004 - now]’ WHERE Ten_PB = ’Du an’ ; UPDATE Nhanvien_Tbl SET Luong TO 2500000 VALID PERIOD ’[1/1/2001 - 31/12/2002]’ WHERE ID_NV = (SELECT DISTINCT Nhanvien_Tbl.ID_NV FROM Nhanvien_Tbl WHERE Nhanvien_Tbl.Ho_ten = 'Nguyễn Thị Mai’); UPDATE Nhanvien_Tbl SET Luong TO 4500000 VALID PERIOD ’[1/1/2003 - now]’ Cơ sở liệu thời gian - 109 - WHERE ID_NV = (SELECT DISTINCT Nhanvien_Tbl.ID_NV FROM Nhanvien_Tbl WHERE Nhanvien_Tbl.Ho_ten = 'Nguyễn Thị Mai’); INSERT INTO Kynang_Tbl SELECT (Nhanvien_Tbl.ID_NV, ’Quan ly’) VALID PERIOD ’[1/2/2000 - now]’ FROM Nhanvien_Tbl WHERE Nhanvien_Tbl.Ho_ten = 'Nguyễn Thị Mai’); Vì ngƣời dùng khơng nhìn thấy trực tiếp giá trị trƣờng ID_NV nên ta giả sử có hai giá trị “LVH” “NTM” hai nhân viên “Lê Văn Hùng” “Nguyễn Thị Mai” Sau cập nhật thông tin ta có đƣợc bảng kết nhƣ sau: Bảng 3.1 - Nhanvien_Tbl ID_NV Ho_ten Luong Gioi_ Ngay_sinh Ten_PB_NV Valid-time tinh LVH Lê Văn Hùng 2000000 M 7/4/1975 Du an 1/2/2000-31/12/2000 LVH Lê Văn Hùng 3000000 M 7/4/1975 Du an 1/1/2001-3/2/2002 LVH Lê Văn Hùng 5000000 M 7/4/1975 Kinhdoanh 4/2/2002-now NTM Nguyễn Thị Mai 1500000 F 1/10/1972 Du an 1/2/2000–31/12/2000 NTM Nguyễn Thị Mai 2500000 F 1/10/1972 Du an 1/1/2001-31/12/2002 NTM Nguyễn Thị Mai 4500000 F 1/10/1972 Du an 1/1/2003 - now Bảng 3.2 - Kynang_Tbl ID_NV Ky_nang Valid-time LVH Lập trình C# 1/2/2000 - now LVH Tiếng Anh C 2/4/2001 - now LVH Lái xe B2 25/9/2004 - 25/9/2007 NTM Quản lý 1/2/2000 - now Cơ sở liệu thời gian - 110 - Bảng 3.3 - Phong_ban_Tbl Ten_PB Loi_tuc ID_Truong_phong Valid-time Kinh doanh 40% LVH 4/2/2002 - now Du an 20% NTM 1/2/2000 – 6/7/2002 Du an 25% NTM 7/7/2002 – 18/2/1004 Du an 22% NTM 19/2/2004 – now 3.4.4- Một số truy vấn: Sau tạo cập nhật đƣợc liệu cho bảng, ta xem xét số câu lệnh truy vấn đơn giản CSDL nhƣ sau: Truy vấn 3.1: Tìm số lợi tức phòng “Dự án” phịng có trƣởng phịng “Nguyễn Thị Mai” U TSQL2 QUERY: SELECT SNAPSHOT PB.Loi_tuc FROM Phong_ban_Tbl(Ten_PB, Loi_tuc, ID_Truong_phong) AS PB, Nhanvien_Tbl(ID_NV, Ho_ten) AS NV WHERE (PB.ID_Truong_phong = NV.ID_VN) AND (NV.Ho_ten = ’Nguyễn Thị Mai’) AND (PB.Ten_PB = ’Du an’) U Kết truy vấn TSQL2: {(20), (25), (22)} U Từ khoá SNAPSHOT cho dù truy vấn định nghĩa bảng thay đổi theo thời gian, kết cho bảng thơng thường dạng ảnh Truy vấn 3.2: Tìm thời điểm bắt đầu trƣởng phòng mà họ lãnh đạo phịng đƣợc năm U TSQL2 QUERY: SELECT BEGIN(VALID(D)) Cơ sở liệu thời gian - 111 - FROM Phong_ban_Tbl(ID_Truong_phong) (PERIOD) AS D WHERE CAST(VALID(D) AS INTERVAL YEAR) > INTERVAL ’5’ YEAR U Kết truy vấn TSQL2: {(1/2/2000)} U Từ khoá CAST chuyển đổi tập giá trị hợp thức D thành khoảng có kiểu năm Cơ sở liệu thời gian - 112 - Truy vấn 3.3 Chỉ khoảng thời gian lợi tức phòng dự án lớn 20% U U TSQL2 QUERY: SELECT VALID(D) FROM Phong_ban_Tbl(Ten_PB, Loi_tuc) AS D WHERE D.Loi_Tuc > 20 AND D.Ten_PB = ’Du an’ Kết truy vấn TSQL2: {([7/7/2002 – 18/2/1004]),([19/2/2004 – now])} U Cơ sở liệu thời gian - 113 - MỘT SỐ HƢỚNG NGHIÊN CỨU TIẾP THEO Mặc dù có hiểu biết sâu sắc kết quan trọng đƣợc cơng bố, nhiên cịn nhiều thách thức nghiên cứu CSDL thời gian, xem xét số vấn đề Thẳng thắn mà nói, chƣa có đƣợc quan tâm mức tới nhiều vấn đề cấp thiết, giảm thiểu tác hại xảy kết trƣớc Trong nhiều trƣờng hợp khái niệm nịng cốt có, nhƣng chƣa đƣợc áp dụng chƣa đƣợc cách ứng dụng sao, để đơn giản hoá tự động hố cơng việc quản lý liệu Ta thấy cần nâng cao nhận thức kế thừa số lĩnh vực CSDL thời gian Những nghiên cứu cần quan tâm đến thực hầu hết CSDL thực tế CSDL thời gian kế thừa ứng dụng chạy chúng thực tế ứng dụng CSDL thời gian kế thừa Ngƣợc lại hầu hết nghiên cứu từ trƣớc tới cho ứng dụng đƣợc thiết kế sử dụng mơ hình liệu thời gian mới, đƣợc triển khai sử dụng ngôn ngữ truy vấn thời gian mới, chạy DBMS thời gian chƣa tồn Trong khoảng thời gian ngắn đến trung hạn giả thiết phi thực tế Thật vậy, phần điều có nhu cầu hiển nhiên thị trƣờng nhƣng chƣa có DBMS quan hệ thời gian thƣơng mại trội Sự phát triển gần kiến trúc CSDL, bao gồm kiểu middleware khác nhau, thúc đẩy nhu cầu gia tăng nhận thức kiến trúc Cần thiết phải có nghiên cứu để cung cấp khái niệm phƣơng thức tiếp cận cho hãng thứ để triển khai thực hiệu công nghệ CSDL thời gian việc khai thác tối đa hạ tấng kiến trúc chức sẵn có đƣợc cung cấp DBMSs Kiến trúc DBMS thời gian kết cung cấp giải pháp thay tƣơng ứng với cấu trúc tích hợp chuẩn đƣợc giả định Tƣơng tự bƣớc cần thiết nghiên cứu nhằm khai thác tiện ích cải tiến hiệu suất sẵn có mới, ví dụ việc thực tốn tử đại số thời gian mục kiến trúc Điều cho thấy phƣơng thức tiếp cận cho ứng dụng kế thừa chuyển đổi trở thành nhu Cơ sở liệu thời gian - 114 - cầu lớn công nghệ thời gian chuyển từ nghiên cứu vào ứng dụng thực tiễn Cho dù có nghiên cứu việc thêm vào yếu tố thời gian cho ngôn ngữ đƣợc gọi hệ thứ IV mà chúng cách mạng hóa giao diện ngƣời dùng cho DBMS thƣơng mại có sẵn Cần thiết có nghiên cứu thêm để có đƣợc phƣơng thức biểu diễn liệu thời gian thống xác Ta thấy kết thiết kế mức khái niệm CSDL thời gian có khả áp dụng thực tiễn, nhƣng cần phải có nhiều nghiên cứu thêm Khi nhà thiết kế CSDL hiểu thấu đáo khái niệm CSDL thời gian, họ có khả thiết kế CSDL tốt sử dụng công cụ mơ hình sẵn có Một thách thức chủ yếu việc cung cấp mơ hình khái niệm hồn chỉnh với cơng cụ thiết kế kết hợp mà chúng bao gồm khía cạnh việc thiết kế CSDL thời gian; đánh giá kinh nghiệm ngƣời dùng thực cần thiết để đƣa nhìn chất Liên quan đến vấn đề hiệu (performance), cần thiết phải có thêm nghiên cứu kinh nghiệm để so sánh thực thi toán tử đại số thời gian đƣa phép thực hiệu Trong nghiên cứu thực thi ban đầu đƣợc tiến hành cho mục thời gian đƣợc đề xuất cách riêng biệt, có cố gắng để so sánh chúng kinh nghiệm Nhiều cơng việc cịn phải làm để khai thác mục thời gian phép toán đại số khác với phép chọn Sau cùng, có nghiên cứu cải tiến hợp lý hố mơ hình giá trị toán tử thời gian nghiên cứu phát triển quản trị thống kê CSDL Ví dụ, số yếu tố tập hợp (số lƣợng giá trị đặc biệt) thuộc tính hữu ích số yếu tố tập hợp trung bình thời điểm Một thống kê hữu dụng khác số lƣợng tồn lâu (long-lived), diện nguyên nhân thất bại vài kiến trúc mục (index structures) toán tử đại số thời gian Những CSDL chủ động (Active database), bao gồm quy tắc tƣơng ứng thay đổi CSDL kiện bên ngồi, đƣợc mở rộng để đƣa vào mơ tả lịch sử trƣớc (ví dụ: số nhiệt độ lị phản ứng hạt nhân chấp Cơ sở liệu thời gian - 115 - nhận đƣợc giảm; nhƣng số nhiệt độ dấu hiệu vấn đề tăng) Cho đến có tích hợp cấu trúc quy luật cấu trúc thời gian Lĩnh vực CSDL không gian thời gian (spatiotemporal databases) ngày trở nên quan trọng Việc cung cấp hỗ trợ gắn kèm cho yếu tố không gian thời gian tạo nên thuận tiện để quản lý đối tƣợng với phạm vi không gian vật lý thời gian, mở ứng dụng CSDL Ví dụ, nhiều “đối tƣợng chuyển động” nhƣ ôtô cho thuê đƣợc trang bị thiết bị GPS (định vị toàn cầu) hành trình chúng đƣợc lƣu trữ CSDL Sự tích hợp CSDL thời gian với CSDL không gian đặt thách thức Ví dụ, khơng có mục thực tốt sẵn có cho hành trình đối tƣợng chuyển động Khai phá liệu thời gian (Temporal data mining) lĩnh vực rộng lớn tƣơng đối mới, nhiên khai phá thực bắt đầu gần Khi việc rút kết hợp tĩnh (static associations) từ khối liệu mục tiêu quan trọng, cần có nhiều nỗ lực tập trung vào kết hợp mà lƣu trữ lại hoạt động thay đổi theo thời gian, nhƣ “Khi cổ phiếu A tăng, cổ phiếu B tăng vịng tuần sau đó” Sự tập trung gần nhà cung cấp, ngƣời sử dụng, nhà nghiên cứu xây dựng kho liệu (data warehousing) mang lại diện mạo cho CSDL thời gian W.H Inmon, ngƣời đƣợc coi cha đẻ kho liệu, coi thay đổi thời gian cấu phần tiêu biểu kho liệu, có trí chung kho liệu bao gồm nhiều năm liệu tham chiếu theo thời gian Với yếu tố thời gian, kho liệu nhân tố quan trọng sử dụng để cải tiến CSDL thời gian Nhƣng chúng đƣợc xem thiếu tích hợp Thực tế, vài thúc đẩy ban đầu cho mơ hình liệu ngôn ngữ truy vấn độc lập cho kho liệu nảy sinh từ việc thiếu hỗ trợ thời gian mơ hình quan hệ ngơn ngữ SQL Ta thấy rằng, việc tăng cƣờng hỗ trợ cho liệu tham chiếu theo thời gian SQL cho phép sử dụng nhiều Cơ sở liệu thời gian - 116 - CSDL quan hệ trực tiếp ứng dụng kho liệu Nếu khác biệt quan hệ lƣợc đồ hình giảm bớt, ngƣời dùng nhà phát triển khai thác tồn mơ hình liệu cho nghiệp vụ Ngƣợc lại, kiến trúc đặc biệt kho liệu tầm quan trọng việc hỗ trợ chức truy vấn cao cấp, ví dụ ứng dụng phân tích chuỗi thời gian xác định, dẫn đến thách thức cho nhà nghiên cứu CSDL thời gian Một lĩnh vực tích cực khác sản phẩm thƣơng mại chúng tách kiểu liệu chuỗi thời gian (time-series) (ví dụ: CSDL Informix, Oracle) Sự mở rộng hữu ích cho ứng dụng đƣợc thiết kế chuyên dụng, đặc biệt lĩnh vực tài chính, nhƣng khơng trọng vấn đề tổng qt biểu diễn dễ dàng ràng buộc thời gian, truy vấn, khai báo Một phƣơng thức tiếp cận tồn diện việc mở rộng ngơn ngữ truy vấn SQL sẵn có thành SQL/Temporal đƣợc xem thích đáng Đặc biệt, tính hƣớng đối tƣợng SQL3 trực giao quy mô lớn không bị ảnh hƣởng mở rộng thời gian Cơ sở liệu thời gian - 117 - KẾT LUẬN Với hầu hết ứng dụng thực tiễn có liên quan đến yếu tố thời gian, luận văn biểu diễn liệu có tính lịch sử sử dụng nhãn thời gian dẫn đến khó khăn lớn, đặc biệt tạo số ràng buộc truy vấn khó thực Trên sở lý thuyết CSDL quan hệ truyền thống, luận văn trình bày khái niệm mở rộng CSDL thời gian, phƣơng pháp biểu diễn yếu tố thời gian toán tử thực liên quan Trong nhiều ứng dụng thời gian, tồn ràng buộc liên quan đến thuộc tính hạt (granularities) Luận văn đề cập tới phụ thuộc hàm thời gian, kiểu ràng buộc thời gian tự nhiên Nhằm giảm thiểu đƣợc dƣ thừa liệu sinh từ phụ thuộc này, dạng chuẩn phép tách khơng thơng tin đƣợc trình bày nhằm cung cấp lý thuyết cho việc thiết kế CSDL mức logíc ứng dụng CSDL thời gian Một số thuật toán tách đƣợc giới thiệu xuất phát từ phép tách dạng chuẩn không thông tin Các dạng chuẩn thuật toán mở rộng thích đáng dạng chuẩn thuật tốn truyền thống; đó, liệu thuộc thời khắc kiểu thời gian dạng chuẩn thời gian thuật tốn quy dạng tƣơng đƣơng khơng có yếu tố thời gian Từ kết nghiên cứu cho thấy CSDL thời gian có khả ứng dụng đƣợc mơ hình quan hệ thời gian đặc biệt mơ hình dựa việc gán nhãn thời gian (tuple timestamping) Với triển vọng dài hạn, ta thấy CSDL thời gian giống nhƣ công nghệ quản trị CSDL lĩnh vực ứng dụng tiếp tục dẫn đến thách thức “có yếu tố thời gian” Do có mặt khắp nơi yếu tố thời gian tầm quan trọng với hầu nhƣ tồn ứng dụng quản trị CSDL, ta thấy nghiên cứu khía cạnh thời gian công nghệ quản trị CSDL cho lĩnh vực ứng dụng có tiếp tục phát triển tiến xa Cơ sở liệu thời gian - 118 - TÀI LIỆU THAM KHẢO A TÀI LIỆU THAM KHẢO TIẾNG VIỆT [1] Hồ Thuần & Hồ Cẩm Hà, (Tập I II, 2004,2005) "Các hệ Cơ sở liệuLý thuyết thực hành ", Nhà xuất Giáo dục, Hà Nội B TÀI LIỆU THAM KHẢO TIẾNG ANH [2] Advanced Database Technology and Design / Mario G.Piattini, Oscar Díaz, (Artech House computing library – Aug-2000) [3] Temporal Database Management / dr.techn thesis by Christian S Jensen, defended April 2000 C MỘT SỐ BÀI BÁO VÀ TÀI LIỆU THAM KHẢO KHÁC: [4] A Temporal Data Model for Multimedia Database Systems /Ilan Eini, Vera Goebel and Bjørn Skjellaug (June-1997) http://citeseer.ist.psu.edu/eini97temporal.html [5] CASE Tool Support for Temporal Database Design / Virginie Detienne, Jean-Luc Hainaut: Institut d’Informatique, University of Namurrue Grandgagnage, 21 - B-5000 Namur - Belgium tel: +32 81 724985 - fax: +32 81 724967 * Conceptual Modeling-Er 2001 ngày xuất 1-12-2001 Cơ sở liệu thời gian - 119 - [6] Logical Design for Temporal Databases with Multiple Granularities / X SEAN WANG George Mason University, Fairfax, VA CLAUDIO BETTINI University of Milan, Milan, Italy ALEXANDER BRODSKY and SUSHIL JAJODIA George Mason University, Fairfax, VA (ACM Transactions on Database Systems, Vol 22, No 2, June 1997, Pages 115–170) [7] Representing and reasoning about temporal granularities (2004) Carlo Combi (corresponding author) Department of Computer Science, University of Verona, Ca‟ Vignal strada le Grazie 15 I - 37134 Verona - VR - Italy phone: ++39 045 802 7985; fax: ++39 045 802 7068 E-mail: combi@sci.univr.it Massimo Franceschet Department of Sciences, University „G d‟Annunzio‟ of Pescara, Italy E-mail: francesc@sci.unich.it Adriano Peron Department of Physical Sciences, University „Federico II‟ of Napoli, Italy E-mail: peron@na.infn.it (http://citeseer.ist.psu.edu/combi04representing.html) HTU UTH [8] Temporal Data Management Christian S Jensen, Senior Member, IEEE, and Richard T Snodgrass, Senior Member, IEEE (IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, VOL 11, NO 1, JANUARY/FEBRUARY 1999) [9] Time in Database Systems Jan Chomicki Department of Comp Sci and Eng University at Buffalo, U.S.A chomicki@cse.buffalo.edu David Toman School of Computer Science University of Waterloo, Canada david@uwaterloo.ca Cơ sở liệu thời gian - 120 - (30th January 2004 - WorldScientific/ws-b9-75x6-50) [10] TSQL2 Language Specification (September, 1994) Richard T Snodgrass (chair) Ilsoo Ahn, Gad Ariav, Don Batory, James Clifford Curtis E Dyreson, Ramez Elmasri, Fabio Grandi Christian S Jensen, Wolfgang Käfer, Nick Kline, Krishna Kulkarni T Y Cliff Leung, Nikos Lorentzos, John F Roddick Arie Segev, Michael D Soo, Suryanarayana M Sripada Cơ sở liệu thời gian