Các kết quả của quá trình phân tích trực tuyến đưa ra thường không theo dạng bảng quan hệ, mà theo bảng hai chiều, được gọi là bảng chéo. Xét câu hỏi “Tìm tổng số rượu do những công ty rượu
cung cấp trên bảng dưới đây:
Ruou Ten CongTy Nam SoLuong
Lúa mới Hà Nội 1980 200
Vang Hà Nội 1995 350
Vang Huda Huế 1990 450
Lúa mới Hà Bắc 1990 320
Người ta xây dựng một bảngmới gọi là bảng chéođể thể hiện câu trả lời. Bảng chéo khác với
bảng quan hệ ở chỗ, số các cột phụ thuộc vào dữ liệu thực, tức là cấu trúc của bảng lẫný nghĩa của
các dòngđều phụ thuộc vào giá trị thực của dữ liệu. Do vậy bảng chéo không phải là quan hệ, mà chỉ là một báo cáo có hình thức như ma trận hai chiều. Ví dụ:
Lúa mới Vang Tổng
Hà Nội 200 350 550 Huda Huế 0 450 450
Hà Bắc 320 0 320 Tổng 520 800 1320
4.4.3. CSDL nhiều chiều
Quá trình xử lý phân tích trực tuyến có thể được đặt trong môi trường quan hệ, và quá trình này cònđược gọi là OLAP quan hệ viết tắt là ROLAP. Trong thực tế nhiều người nhận thấy có cách tiếp
cận tốt hơn, là OLAP nhiều chiều viết tắt là MOLAP.
MOLAP cần đến CSDL nhiều chiều. Việc lưu trữ nàyđược gọi là lưu trữ theo quanniệm. Để
hình dung thấy nhiều chiều, nhưng trong các hệ thống thực tế thì tổ chức vật lý của MOLAP rất gần
với tổ chức logic. Hệ quản trị CSDL trong trường hợp này được gọi là hệ quản trị CSDL nhiều
chiều. Các CSDL có thể được thể hiện trong bảng hai, ba chiều.
4.5. Khai phá dữ liệu
Khai phá dữ liệu, mục đích của nó là nhìn vào phânđáng quan tâm của dữ liệu, những phần được dùngđể thiết lập chiến lược kinh doanh hay để xácđịnh hành vi khác thường.
Đ/N. Khai phá dữ liệu. Khai phá dữ liệu là quá trình trích ra những thông tin dùng được, đúng và chưa biết trước từ CSDL lơn, rồi dùng thông tin nàyđể ra các quyết định.
Các công cụ khai phá dữ liệu dùng các kĩ thuật thống kêđối với khối lượng dữ liệu lớn để tìm ra những phần dữ liệu cần thiết. Các CSDL trong khai phá dữ liệu thường rất lớn, do vậy có xu hướng đơn giản hoá các thuật toán. Một số thuật ngữ dùng trong khai phá dữ liệu như “dân số” để chỉ các thao tác có thể thực hiện trong một bảng dữ liệu, “luật liên kết” để chỉ sự phụ thuộc giữa các dữ liệu
khi xét các giao tác… Luật liên kết được phát hiện doáp dụng các phép toán gộp phù hợp. Một số