Bảng chéo

Một phần của tài liệu bài giảng về cơ sở dữ liệu nâng cao (Trang 44 - 45)

Các kết quả của quá trình phân tích trực tuyến đưa ra thường không theo dạng bảng quan hệ, mà theo bảng hai chiều, được gọi là bảng chéo. Xét câu hỏi “Tìm tổng số rượu do những công ty rượu

cung cấp trên bảng dưới đây:

Ruou Ten CongTy Nam SoLuong

Lúa mới Hà Nội 1980 200

Vang Hà Nội 1995 350

Vang Huda Huế 1990 450

Lúa mới Hà Bắc 1990 320

Người ta xây dựng một bảngmới gọi là bảng chéođể thể hiện câu trả lời. Bảng chéo khác với

bảng quan hệ ở chỗ, số các cột phụ thuộc vào dữ liệu thực, tức là cấu trúc của bảng lẫný nghĩa của

các dòngđều phụ thuộc vào giá trị thực của dữ liệu. Do vậy bảng chéo không phải là quan hệ, mà chỉ là một báo cáo có hình thức như ma trận hai chiều. Ví dụ:

Lúa mới Vang Tổng

Hà Nội 200 350 550 Huda Huế 0 450 450

Hà Bắc 320 0 320 Tổng 520 800 1320

4.4.3. CSDL nhiều chiều

Quá trình xử lý phân tích trực tuyến có thể được đặt trong môi trường quan hệ, và quá trình này cònđược gọi là OLAP quan hệ viết tắt là ROLAP. Trong thực tế nhiều người nhận thấy có cách tiếp

cận tốt hơn, là OLAP nhiều chiều viết tắt là MOLAP.

MOLAP cần đến CSDL nhiều chiều. Việc lưu trữ nàyđược gọi là lưu trữ theo quanniệm. Để

hình dung thấy nhiều chiều, nhưng trong các hệ thống thực tế thì tổ chức vật lý của MOLAP rất gần

với tổ chức logic. Hệ quản trị CSDL trong trường hợp này được gọi là hệ quản trị CSDL nhiều

chiều. Các CSDL có thể được thể hiện trong bảng hai, ba chiều.

4.5. Khai phá dữ liệu

Khai phá dữ liệu, mục đích của nó là nhìn vào phânđáng quan tâm của dữ liệu, những phần được dùngđể thiết lập chiến lược kinh doanh hay để xácđịnh hành vi khác thường.

Đ/N. Khai phá dữ liệu. Khai phá dữ liệu là quá trình trích ra những thông tin dùng được, đúng và chưa biết trước từ CSDL lơn, rồi dùng thông tin nàyđể ra các quyết định.

Các công cụ khai phá dữ liệu dùng các kĩ thuật thống kêđối với khối lượng dữ liệu lớn để tìm ra những phần dữ liệu cần thiết. Các CSDL trong khai phá dữ liệu thường rất lớn, do vậy có xu hướng đơn giản hoá các thuật toán. Một số thuật ngữ dùng trong khai phá dữ liệu như “dân số” để chỉ các thao tác có thể thực hiện trong một bảng dữ liệu, “luật liên kết” để chỉ sự phụ thuộc giữa các dữ liệu

khi xét các giao tác… Luật liên kết được phát hiện doáp dụng các phép toán gộp phù hợp. Một số

Một phần của tài liệu bài giảng về cơ sở dữ liệu nâng cao (Trang 44 - 45)

Tải bản đầy đủ (PDF)

(45 trang)