Công nghệ csdl sử dụng trong khai thác Kho dữ liệu

Một phần của tài liệu Báo cáo đề tài: Kho Dữ Liệu pptx (Trang 45 - 46)

VI. TẠO LẬP CÁC KHO DỮ LIỆU

e/ Nạp dữ liệu vào kho Việc tải dữ liệu vào kho dữ liệu có thể thực hiện:

7.5 Công nghệ csdl sử dụng trong khai thác Kho dữ liệu

So sánh giữa CSDL tác nghiệp với DW: có một vài sự khác nhau cơ bản giữa CSDL thiết kế cho nhu cầu tác nghiệp và kho dữ liệu. Sự khác nhau đó được thể hiện ở bảng dưới đây:

Đặc điểm Thông tin tác nghiệp Thông tin hỗ trợ quyết định Chức năng hoạt

động

Ghi chép các sự kiện, tính toán theo các công thức

Phục vụ tác nghiệp

Phân tích dữ liệu, khám phá thông tin.

Hỗ trợ điều hành, ra quyết định

Nguồn dữ liệu Nội bộ Bên trong lẫn bên ngoài

Phương pháp chỉ số B_tree Bitmap

Cập nhật Thường xuyên với các giao dịch nhỏ

Không sửa đổi dữ liệu

Tần suất thấp, khối lượng lớn Độ lớn cơ sở dữ

liệu

Cỡ GigaByte Cỡ GigaByte đến TeraByte Thời gian lưu trữ Ngắn, chủ yếu theo năm Mang tính lịch sử, lâu dài Khai thác Dự báo được, định kì

Theo các khuôn mẫu

Không xác định

Tính tổng hợp, phân tích cao Mặc dù CSDL tác nghiệp là nguồn cung cấp dữ liệu cho DW nhưng chúng vẫn còn thiếu những kiến trúc và chức năng cần thiết để phân tích dữ liệu hỗ trợ quyết định một cách dễ dàng và hiệu quả. Dữ liệu trong DW được hình thành từ dữ liệu đã ổn định của CSDL tác nghiệp trong khi đó dữ liệu của CSDL tác nghiệp sẽ được cập nhật mỗi khi có một giao dịch mới.

Một số phương pháp và công cụ phục vụ tốt cho việc tạo ra các hệ thống tác nghiệp nhưng lại không phù hợp với những yêu cầu khác nhau của DW. Hệ thống cơ sở dữ liệu xử lí các giao dịch trực tuyến truyền thống được thiết kế một cách đơn giản không phù hợp với những yêu cầu của phương pháp DW. Những dự án dùng phương pháp DW buộc phải lựa chọn giữa một mô hình dữ liệu và một sơ đồ

dữ liệu liên quan trực quan cho việc phân tích nhưng nghèo nàn về thể hiện. Một sơ

đồ-mô hình là cách thực hiện tốt hơn nhưng không phù hợp lắm cho việc phân tích. Khi phương pháp DW được tiếp tục phát triển thì những cách tiếp cận mới cho việc thiết kế sơ đồ dữ liệu phù hợp hơn với việc phân tích được hình thành và đó là điều cốt yếu dẫn đến thành công của phương pháp DW. Một sơ đồ được chấp nhận sử dụng rộng rãi cho phương pháp DW là sơ đồ hình sao (sẽ được trình bày dưới đây).

Mô hình dữ liệu thường được sử dụng cho hệ thông tin tác nghiệp là mô hình dữ liệu quan hệ. Mô hình này dựa trên các nguyên lí toán học và logic vị từ nên các hệ thống quản trị cơ sở dữ liệu quan hệ cung cấp những giải pháp mạnh cho một khối lượng phong phú các ứng dụng khoa học và thương mại. Xuất phát từ quan điểm này, một yếu tố quan trọng của vấn đề thiết kế cơ sở dữ liệu là dựa trên phát triển mô hình dữ liệu và sơ đồ cơ sở dữ liệu quan hệ để hệ quản trị cơ sở dữ liệu quan hệ (RDBMS) liên quan đạt được hiệu quả hoạt động lớn nhất.

Yêu cầu điển hình cho RDBMS hỗ trợ cho hệ thống tác nghiệp là trợ giúp có hiệu quả một số lượng lớn những yêu cầu đọc và ghi có thể xảy ra đồng thời. Việc định nghĩa sơ đồ dữ liệu thường tối đa dựa trên sự đồng thời và tối ưu những thao tác xoá, thay đổi, chèn thêm thông qua việc xác định các bảng quan hệ tương ứng với những yêu cầu tác nghiệp và nội dung lưu trữ được tối thiểu nhất cho việc truy nhập tới từng bản ghi riêng.

Một RDBMS cho DW điển hình cần xử lí những truy vấn lớn, phức tạp, đặc biệt và cần nhiều dữ liệu. Không chỉ có sự khác nhau đáng lưu ý về công nghệ trong việc những hệ thống này dùng các tài nguyên tính toán mà bản chất của những công việc được thực hiện đòi hỏi một cách tiếp cận khác tới việc xác định sơ đồ cơ sở dữ liệu.

Như vậy công nghệ cơ sở dữ liệu chính của DW là RDBMS, ta sẽ xem xét việc thiết kế sơ đồ dữ liệu khi gắn liền nó với công nghệ cơ sở dữ liệu quan hệ.

Trong kiến trúc tổng thể của kho dữ liệu, kho dữ liệu tác nghiệp và các chức năng quản lý, xử lý phân tích dữ liệu có thể tổ chức như sau:

- 46 -

DBMS MDDB

Một phần của tài liệu Báo cáo đề tài: Kho Dữ Liệu pptx (Trang 45 - 46)

Tải bản đầy đủ (DOC)

(64 trang)
w