Dòng Dữ Liệu

Một phần của tài liệu giải pháp kho dữ liệu thời gian thực cho hệ thống siêu thị (Trang 45)

Cở sơ dữ liệu thời gian thực đòi hỏi xử lý nhanh hơn so với kho dữ liệu truyền thống đối với sự thay đổi của dữ liệu.Kho dữ liệu truyền thống thường tải dữ liệu vào một thời diểm cố định vào hàng đêm hoặc hàng tuần và không hỗ trợ dữ liệu thời gian thực, gần thực.Mô hình này không phù hợp với những dạng dữ liệu thường xuyên thay đổi và cập nhật vào hệ thống. Hình 2.5.2 mô tả sự khác biệt giữa mô hình dòng dữ liệu kho dữ liệu truyền thống và kho dữ liệu thời gian thực

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Hình 2.5.2 Dòng dữ liệu RTDW và DW

Sự giống và khác nhau giữa RTDW và DW

Giống nhau : Sự giống nhau giữa CTF ( RealTime ETL ) và ETL là cùng cách thức xử lý dữ liệu:

- Cập nhật dữ liệu từ nhiều nguồn ,Các hệ thống OLTP

- Thực hiện tính toán và sửa đổi dữ liệu cho phù hợp với kho dữ liệu - Xuất dữ liệu vào DW bao gồm : CSDL , file text, file văn bản, dữ liệu có cấu trúc

Khác nhau :

- CTF phải được thiết kế sao cho có thể nhận biết được những thông báo thay đổi từ dữ liệu nguồn để nhanh chóng cập nhật dữ liệu thay đổi đó

-CTF phải tính toán và sửa đổi dữ liệu nếu cần thiết một cách chính xác và nhanh nhất có thể để đáp ứng thời gian thực hoặc gần thực

- RTDW phải tính toán các dữ liệu tổng hợp, các sự kiện và các chiều dữ liệu để cập nhật vào DW hoặc các DataMart ( Kho dữ liệu con), OLAP ( dữ liệu khối ) để đáp ứng kịp thời tốc độ của dòng dữ liệu thay đổi liên tục ( JIM - phần kết hợp giữa RTDW và DW )

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Một phần của tài liệu giải pháp kho dữ liệu thời gian thực cho hệ thống siêu thị (Trang 45)