Tìm hiểu luồng dữ liệu và báo cáo liên tục

Một phần của tài liệu Giải pháp hỗ trợ báo cáo trong hệ thống BI (Trang 50 - 51)

Các hệ thống quản trị cơ sở dữ liệu truyền thống (DBMS) được dành cho quản lý các tập dữ liệu (Data sets) có tính chất ít thay đổi về mặt giá trị theo thời gian. Tuy nhiên với những ứng dụng gần đây, các khái niệm luồng dữ liệu liên tục phù hợp hơn với khái niệm tập dữ liệu hiện tại. Bởi vì với những tập dữ liệu được lưu trữ chỉ phù hợp với dạng dữ liệu tĩnh được truy vấn lặp đi lặp lại và ít hoặc không thường xuyên thay đổi về mặt giá trị thông tin của nó. Trong khi đó luồng dữ liệu phù hợp hơn với dạng dữ liệu thay đổi thường xuyên (như chèn dữ liệu thường xuyên).

Ngày nay rất nhiều ứng dụng sinh ra những luồng dữ liệu như các phần mềm kiểm tra dữ liệu tài chính, các phần mềm theo dõi và đánh giá lưu lượng mạng, các trang Web có theo dõi tình trạng tham gia sử dụng của người dùng (số lần truy cập, số lần click chuột), các ứng dụng liên quan đến bộ cảm biến dữ liệu, các bản ghi chi tiết cuộc gọi trong viễn thông, … Tuy nhiên hiện nay các hệ thống cơ sở dữ liệu còn thiếu trang bị để có khả năng quản lý, lưu trữ hay xử lý truy vấn trong các luồng dữ liệu nên các ứng dụng phải xử lý các luồng dữ liệu lớn có xu hướng DBMS như một hệ thống lưu trữ ngoài hoặc không sử dụng. Hay nói cách khác, công việc xử lý luồng dữ liệu như một sự

bổ sung kết hợp với một hệ thống DBMS. Trong đề tài này tác giả tập trung nghiên cứu xử lý truy vấn liên tục cho các luồng dữ liệu liên tục.

Một truy vấn phạm vi (range query) tĩnh hoặc động được gọi là một truy vấn (phạm vi) liên tục nếu nó truy xuất liên tục các đối tượng chuyển động bên trong nó trong một khoảng thời gian như theo dõi các đối tượng chuyển động đang di chuyển trong một khu vực giao thông hoặc không gian. Nói cách khác, một truy vấn liên tục duy trì hoạt động trong một khoảng thời gian nhất định cho đến khi nó được chấm dứt bởi người sử dụng. Chúng ta có thể hiểu truy vấn liên tục là: “Các truy vấn được kích hoạt một lần và sau đó tiếp tục hoạt động để có kết quả liên tục theo thời gian” [5] (Ngược lại với các truy vấn truyền thống là các truy vấn này chỉ chạy một lần và kết thúc với các tập dữ liệu hiện tại).

Ví dụ: Trong quản lý lưu lượng mạng các truy vấn liên tục có thể được sử dụng để theo dõi trực tuyến các hành vi mạng để tìm ra điểm dị thường (như nghẽn liên kết ) và các nguyên nhân (như lỗi phần cứng, bị tấn công từ chối dịch vụ). Các truy vấn có thể được sử dụng để cân bằng tải hoặc các điều chỉnh hiệu suất mạng. Với các ứng dụng tài chính truy vấn liên tục có thể được sử dụng để theo dõi xu hướng và phát hiện các cơ hội để lướt sóng. Rõ ràng cả hai ứng dụng trên đều đòi hỏi quá trình xử lý dữ liệu phải nhanh, kịp thời đưa ra các thông số quan trọng để ra quyết định. Để đáp ứng đòi hỏi này ta cần sự hỗ trợ của truy vấn liên tục nhằm xử lý các luồng dữ liệu nhanh và có các câu trả lời trực tuyến kịp thời sẽ tốt hơn so với cách sử dụng truy vấn thông thường mỗi lần cần thông tin lại phải gọi một truy vấn.

Một phần của tài liệu Giải pháp hỗ trợ báo cáo trong hệ thống BI (Trang 50 - 51)