Cấu trúc hệ thống

Một phần của tài liệu giải pháp kho dữ liệu thời gian thực cho hệ thống siêu thị (Trang 49)

Trong phần này học viên mô tả và sử dụng dữ liệu được thu thập bởi các AP-các thiết bị truy cập mà cần trong khi sử dụng RTDW.

Đối với các nhu cầu công việc khác nhau đưa ra những yêu cầu khác nhau cho tần xuất làm mới dữ liệu, quá trình này có vai trò quan trọng để liên tục duy trì RTDW với dữ liệu được cập nhật mới nhất có thể, nhưng vẫn đảm bảo đó là dữ liệu chất lượng cao , ví dụ dữ liệu đi qua RTDW bởi môđun dòng ngay khi thực hiện dò và loại bỏ lỗi. Qua đó chúng ta có thể thấy thời gian cần để thu nhận, chuyển đổi và nạp dữ liệu vào kho đúng với right-time ( đúng thời gian ).Ví dụ dữ liệu không phải thời gian thực, nó bị từ chối đủ lâu để thực hiện làm sạch dữ liệu để đảm bảo chất lượng. Tuy nhiên do bản chất của báo cáo lỗi trong bảng dữ liệu kho dữ liệu thời gian thực chúng ta không thể đảm bảo các dữ liệu gần nhất được chèn có hiệu lực.Ngưỡng đó được gọi là Bouncethreshold được sử dụng để xác định chu kỳ thời gian tối thiểu theo dõi một thiết bị trong một vị trí để thiết bị đó không bị coi là thiết bị hỏng. Điều này nghĩa là dữ liệu phải cũ hơn Bouncethreshold để chúng ta có thể đảm bảo rằng dữ liệu đó có giá trị.

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Hình 3.1 : Kiến trúc Hệ thống

Đề xuất phƣơng án giảm thiểu rủi do

Giảm thiểu rủi do nhằm xác định và đánh giá các khu vực xảy ra sự cố và các vấn đề có thể xảy ra trong tương lai có nguy cơ ảnh hưởng cho sự hành công của một dự án kho dữ liệu. Kỹ thuật này cũng giúp xác định các biện pháp phòng ngừa để giảm nguy cơ xảy ra của những yếu tố này.

Một số nguyên nhân gây ra trục trặc khi tạo một : -Tính không đồng nhất của người dùng

Vì các RTDW được thiết kế để xử lý các trục trặc hoặc cơ hội thương mại cụ thể, nên các yêu cầu đối với kho dữ liệu sẽ do những người sử dụng hệ thống đề xuất ra. Vì có nhiều người sử dụng hệ thống, nên nhu cầu của họ thường bao gồm nhiều vấn đề cần lời giải đáp. Hệ thống kho dữ liệu phải đối mặt với một phạm vi rộng và không đồng nhất của người dùng. Các yêu cầu

Các AP OLTP Real time ETL RTDW Ứng dụng Lọc và Loại bỏ dữ liệu trùng : Bảo trì Bộ nhớ các Thiết bị kết nối Cấu hình thời gian khởi hành

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

về kho dữ liệu phải giải quyết các nhu cầu đó của những người dùng. Mặc dù đây là vấn đề của các RTDW lớn hơn, nhưng điều này không gây ra rủi ro đáng kể đối với trường hợp AP tại siêu thị, vì số lượng người sử dụng hệ thống còn rất hạn chế và tất cả họ đều tận dụng hệ thống để trích xuất các thông tin tương tự.

- Khả năng mở rộng và phát triển

Một hệ thống kho dữ liệu do người dùng kiểm soát thường phát triển nhanh cả về số người sử dụng và khối lượng dữ liệu. Giải pháp này bao gồm các hệ thống cơ sở dữ liệu và hệ thống Real time ETL có chức năng thực hiện các chuyển đổi. Một số giải pháp thậm chí sử dụng ước tính, thay vì các tính toán chính xác để giảm khối lượng công việc thông qua hệ thống, việc này có thể hữu ích trong trường hợp AP tại siêu thị. Ngoài ra, các giải pháp hỗ trợ loại bỏ các phần khác nhau trong chương trình song song nên được tiến hành thực hiện nếu có thể.

- Phát triển hệ thống

Kho dữ liệu là hệ thống mang tính bảo trì cao. Có rất nhiều yếu tố khác nhau có thể ảnh hưởng đến kho dữ liệu, ví dụ như thay đổi về sản phẩm, về siêu dữ liệu của khách hàng mới, thay đổi trong hệ thống sản xuất và những thay đổi tương tự. Do đó, hệ thống kho dữ liệu phải phát triển kèm theo những thay đổi của BI. Mặc dù, việc phát triển hệ thống đặt ra thách thức lớn cho tổ chức có các kho dữ liệu thời gian thực RTDW rộng lớn, nhưng RTDW thiết lập cho trường hợp AP tại siêu thị lại còn hạn chế.

Một phần của tài liệu giải pháp kho dữ liệu thời gian thực cho hệ thống siêu thị (Trang 49)