truy vấn đơn giản trên CSDL này nhƣ sau:
Truy vấn 3.1: Tìm các chỉ số lợi tức của phòng “Dự án” khi phòng này có trƣởng phòng là “Nguyễn Thị Mai”
UTSQL2 QUERY:
SELECT SNAPSHOT PB.Loi_tuc
FROM Phong_ban_Tbl(Ten_PB, Loi_tuc, ID_Truong_phong) AS PB,
Nhanvien_Tbl(ID_NV, Ho_ten) AS NV WHERE (PB.ID_Truong_phong = NV.ID_VN) AND
(NV.Ho_ten = ’Nguyễn Thị Mai’) AND (PB.Ten_PB = ’Du an’)
UKết quả truy vấn TSQL2:U {(20), (25), (22)}
Từ khoá SNAPSHOT chỉ ra rằng cho dù truy vấn được định nghĩa trên một
bảng thay đổi theo thời gian, thì kết quả vẫn cho một bảng thông thường dạng
ảnh.
Truy vấn 3.2: Tìm những thời điểm bắt đầu của các trƣởng phòng mà họ đã lãnh đạo phòng đó ít nhất đƣợc 5 năm.
UTSQL2 QUERY:
FROM Phong_ban_Tbl(ID_Truong_phong) (PERIOD) AS D
WHERE CAST(VALID(D) AS INTERVAL YEAR) > INTERVAL ’5’ YEAR
UKết quả truy vấn TSQL2:U {(1/2/2000)}
Từ khoá CAST sẽ chuyển đổi tập giá trị hợp thức D thành các khoảng có kiểu
Truy vấn 3.3. Chỉ ra các khoảng thời gian nào lợi tức của phòng dự án lớn hơn 20%.
UTSQL2 QUERY:
SELECT VALID(D)
FROM Phong_ban_Tbl(Ten_PB, Loi_tuc) AS D WHERE D.Loi_Tuc > 20 AND D.Ten_PB = ’Du an’
UKết quả truy vấn TSQL2:U
MỘT SỐ HƢỚNG NGHIÊN CỨU TIẾP THEO
Mặc dù đã có những hiểu biết sâu sắc và các kết quả quan trọng đƣợc công bố, tuy nhiên vẫn còn rất nhiều thách thức nghiên cứu về CSDL thời gian, chúng ta sẽ xem xét một số vấn đề đó. Thẳng thắn mà nói, chúng ta vẫn chƣa có đƣợc sự quan tâm đúng mức tới rất nhiều các vấn đề cấp thiết, giảm thiểu những tác hại có thể xảy ra của các kết quả trƣớc đó. Trong nhiều trƣờng hợp các khái niệm nòng cốt hiện tại đã có, nhƣng vẫn chƣa đƣợc áp dụng hoặc chƣa đƣợc chỉ ra cách ứng dụng ra sao, để đơn giản hoá và tự động hoá công việc quản lý dữ liệu.
Ta thấy rằng cần nâng cao nhận thức kế thừa trong một số lĩnh vực về CSDL thời gian. Những nghiên cứu cần quan tâm đến thực tại là hầu hết các CSDL trên thực tế là các CSDL thời gian kế thừa và các ứng dụng chạy trên chúng thực tế cũng là các ứng dụng CSDL thời gian kế thừa. Ngƣợc lại hầu hết các nghiên cứu từ trƣớc tới nay đều cho rằng các ứng dụng sẽ đƣợc thiết kế sử dụng một mô hình dữ liệu thời gian mới, đƣợc triển khai sử dụng các ngôn ngữ truy vấn thời gian mới, và chạy trên các DBMS thời gian chƣa tồn tại. Trong khoảng thời gian ngắn đến trung hạn giả thiết này là phi thực tế. Thật vậy, một phần bởi vì điều đó và mặc dù đã có nhu cầu hiển nhiên trên thị trƣờng nhƣng vẫn chƣa có một DBMS quan hệ thời gian thƣơng mại nổi trội nào.
Sự phát triển gần đây về kiến trúc CSDL, bao gồm các kiểu middleware khác nhau, thúc đẩy nhu cầu gia tăng nhận thức kiến trúc. Cần thiết phải có những nghiên cứu để cung cấp những khái niệm và phƣơng thức tiếp cận cho các hãng thứ 3 để triển khai thực sự và hiệu quả công nghệ CSDL thời gian trong khi việc khai thác tối đa hạ tấng kiến trúc và chức năng sẵn có đã đƣợc cung cấp bởi các DBMSs. Kiến trúc DBMS thời gian kết quả sẽ cung cấp giải pháp thay thế khá tƣơng ứng với cấu trúc tích hợp chuẩn đã đƣợc giả định. Tƣơng tự bƣớc tiếp theo cần thiết nghiên cứu nhằm khai thác những tiện ích cải tiến hiệu suất sẵn có và mới, ví dụ việc thực hiện toán tử đại số thời gian và chỉ mục trong những kiến trúc này. Điều đó cho thấy những phƣơng thức tiếp cận cho các ứng dụng kế thừa chuyển đổi sẽ trở thành nhu
cầu rất lớn khi công nghệ thời gian chuyển từ nghiên cứu vào ứng dụng thực tiễn. Cho dù chỉ có rất ít những nghiên cứu về việc thêm vào yếu tố thời gian cho các ngôn ngữ đƣợc gọi là thế hệ thứ IV mà chúng đang cách mạng hóa giao diện ngƣời dùng cho các DBMS thƣơng mại có sẵn. Cần thiết có những nghiên cứu thêm để có đƣợc một phƣơng thức biểu diễn dữ liệu thời gian thống nhất và chính xác.
Ta thấy rằng các kết quả về thiết kế mức khái niệm của CSDL thời gian là có khả năng áp dụng trong thực tiễn, nhƣng vẫn cần phải có nhiều nghiên cứu thêm nữa. Khi các nhà thiết kế CSDL hiểu thấu đáo những khái niệm CSDL thời gian, họ sẽ có khả năng thiết kế các CSDL tốt hơn sử dụng các công cụ và mô hình sẵn có. Một thách thức chủ yếu là việc cung cấp các mô hình khái niệm hoàn chỉnh với các công cụ thiết kế kết hợp mà chúng bao gồm mọi khía cạnh của việc thiết kế một CSDL thời gian; sự đánh giá bằng kinh nghiệm của những ngƣời dùng thực sự là rất cần thiết để đƣa ra cái nhìn bản chất.
Liên quan đến vấn đề hiệu năng (performance), cần thiết phải có thêm các nghiên cứu kinh nghiệm để so sánh thực thi toán tử đại số thời gian và đƣa ra các phép thực hiện hiệu quả hơn. Trong khi những nghiên cứu thực thi ban đầu đƣợc tiến hành cho mỗi chỉ mục thời gian đƣợc đề xuất một cách riêng biệt, có rất ít cố gắng để so sánh chúng bằng kinh nghiệm. Nhiều công việc còn phải làm để khai thác các chỉ mục thời gian trong những phép toán đại số khác với phép chọn. Sau cùng, vẫn chỉ có rất ít các nghiên cứu về cải tiến và hợp lý hoá những mô hình giá trị của các toán tử thời gian hoặc nghiên cứu về phát triển và quản trị thống kê CSDL. Ví dụ, số các yếu tố tập hợp (số lƣợng các giá trị đặc biệt) của một thuộc tính là ít hữu ích hơn số các yếu tố tập hợp trung bình tại một thời điểm. Một thống kê hữu dụng khác là số lƣợng của các bộ tồn tại lâu (long-lived), sự hiện diện của nó là nguyên nhân thất bại của một vài kiến trúc chỉ mục (index structures) và các toán tử đại số thời gian.
Những CSDL chủ động (Active database), bao gồm các quy tắc tƣơng ứng những thay đổi về CSDL và các sự kiện bên ngoài, đƣợc mở rộng để đƣa vào mô tả lịch sử trƣớc đó (ví dụ: một chỉ số nhiệt độ trong lò phản ứng hạt nhân có thể chấp
nhận đƣợc nếu nó đang giảm; nhƣng cũng cùng chỉ số nhiệt độ đó có thể là dấu hiệu của vấn đề nếu nó đang tăng). Cho đến nay có rất ít sự tích hợp giữa các cấu trúc quy luật và những cấu trúc thời gian.
Lĩnh vực CSDL không gian thời gian (spatiotemporal databases) sẽ ngày càng trở nên quan trọng. Việc cung cấp hỗ trợ gắn kèm cho cả yếu tố không gian và thời gian tạo nên sự thuận tiện để quản lý các đối tƣợng với phạm vi trong không gian vật lý và thời gian, mở ra các ứng dụng CSDL mới. Ví dụ, rất nhiều “đối tƣợng chuyển động” nhƣ những ôtô cho thuê sẽ đƣợc trang bị các thiết bị GPS (định vị toàn cầu) và hành trình của chúng sẽ đƣợc lƣu trữ trong các CSDL. Sự tích hợp của các CSDL thời gian với những CSDL không gian đặt ra những thách thức mới. Ví dụ, không có chỉ mục nào thực sự tốt sẵn có cho những hành trình của các đối tƣợng chuyển động.
Khai phá dữ liệu thời gian (Temporal data mining) là một lĩnh vực rộng lớn tƣơng đối mới, tuy nhiên sự khai phá thực sự thì chỉ mới bắt đầu gần đây. Khi việc rút ra những kết hợp tĩnh (static associations) từ một khối dữ liệu là mục tiêu quan trọng, cần có nhiều nỗ lực tập trung vào các kết hợp mà nó lƣu trữ lại hoạt động thay đổi theo thời gian, nhƣ “Khi cổ phiếu A tăng, cổ phiếu B cũng sẽ tăng trong vòng 2 tuần sau đó”.
Sự tập trung khá gần đây của các nhà cung cấp, ngƣời sử dụng, và các nhà nghiên cứu về xây dựng kho dữ liệu (data warehousing) mang lại diện mạo mới cho CSDL thời gian. W.H. Inmon, ngƣời đƣợc coi là cha đẻ của kho dữ liệu, coi sự thay đổi thời gian là 1 trong 4 cấu phần tiêu biểu của một kho dữ liệu, và có sự nhất trí chung rằng một kho dữ liệu là sự bao gồm rất nhiều năm của dữ liệu tham chiếu theo thời gian. Với yếu tố thời gian, các kho dữ liệu do đó là những nhân tố quan trọng sử dụng để cải tiến trong các CSDL thời gian. Nhƣng chúng đƣợc xem là thiếu sự tích hợp. Thực tế, một vài sự thúc đẩy ban đầu cho một mô hình dữ liệu và một ngôn ngữ truy vấn độc lập cho kho dữ liệu nảy sinh từ việc thiếu sự hỗ trợ thời gian trong mô hình quan hệ và ngôn ngữ SQL. Ta thấy rằng, việc tăng cƣờng hỗ trợ cho dữ liệu tham chiếu theo thời gian trong SQL sẽ cho phép sử dụng nhiều hơn các
CSDL quan hệ trực tiếp trong các ứng dụng kho dữ liệu. Nếu sự khác biệt giữa quan hệ và lƣợc đồ hình sao có thể giảm bớt, thì ngƣời dùng và nhà phát triển có thể khai thác toàn bộ mô hình dữ liệu cho những nghiệp vụ của mình. Ngƣợc lại, kiến trúc đặc biệt của một kho dữ liệu và tầm quan trọng trong việc hỗ trợ chức năng truy vấn cao cấp, ví dụ ứng dụng phân tích chuỗi thời gian xác định, dẫn đến những thách thức mới cho các nhà nghiên cứu CSDL thời gian.
Một lĩnh vực tích cực khác của các sản phẩm thƣơng mại là chúng tách ra các kiểu dữ liệu chuỗi thời gian (time-series) (ví dụ: CSDL của Informix, Oracle). Sự mở rộng này là rất hữu ích cho các ứng dụng đƣợc thiết kế chuyên dụng, đặc biệt trong lĩnh vực tài chính, nhƣng không chú trọng vấn đề tổng quát về biểu diễn dễ dàng các ràng buộc thời gian, các truy vấn, và những khai báo. Một phƣơng thức tiếp cận toàn diện hơn bằng việc mở rộng ngôn ngữ truy vấn SQL sẵn có thành SQL/Temporal đƣợc xem là thích đáng hơn cả. Đặc biệt, các tính năng hƣớng đối tƣợng của SQL3 là trực giao trên quy mô lớn và không bị ảnh hƣởng bởi những mở rộng thời gian này.
KẾT LUẬN