Các phân bậc khái niệm cho phép được quản lý ở nhiều mức khác nhau của sự trừu xuất. Phân bậc khái niệm xác định một chuỗi sắp xếp tập các khái niệm từ mức thấp hơn đến mức cao hơn, tổng quát hơn. Ví dụ: các giá trị của vi_tri như Hà nội, Đà nẵng, Hồ Chí Minh... có thểđược xếp vào vùng mà các thành phố này thuộc vào. Các vùng này lại được xếp vào đất nước chứa vùng
đó...Hình 10 dưới đây mô tả Phân bậc khái niệm theo chiều vi_tri được mô tả
như trên.
Hình 9: Phân bậc khái niệm đối với chiều vi_tri.
Thế giới
Nga
Miền Bắc Miền Trung Miền Nam
Hà nội Đà nẵng HCM
Nhiều phân bậc khái niệm được ngầm định trong sơ đồ CSDL. Chẳng hạn
đối với chiều vị trí, giả sử rằng vị trí được mô tả bởi các thuộc tính như: so_nha, ten_pho, thanh_pho, ten_thi_xa, ten_vung, và ten_nuoc. Giả sử có quan hệ thứ tự toàn phần trên các thuộc tính này và khi đó sẽ hình thành phân bậc khái niệm, chẳng hạn: “so_nha<ten_pho<ten_thi_xa <thanh_pho<ten_vung<ten_nuoc”.
Nếu trên các thuộc tính của chiều chỉ tồn tại các quan hệ thứ tự từng phần, khi đó sẽ hình thành một cấu trúc dàn đối với các thuộc tính của chiều. Chẳng hạn so_nha< ten_pho<{thanh_pho; ten_thi_ xa}<ten_vung<ten_nuoc. Cấu trúc dàn này được minh hoạ trong hình 10 ở dưới.
Hình 10: Cấu trúc dàn của các thuộc tính đối với chiều vi_tri trong DW Bán hàng
Phân bậc khái niệm giữa các thuộc tính trong một CSDL được gọi là sơ đồ phân bậc. Phân bậc khái niệm cũng có thể được xác định bằng cách sử
dụng phương pháp rời rạc hoặc nhóm các giá trị đối với một chiều hoặc một thuộc tính cho trước. Nói chung là có nhiều phân bậc khái niệm đối với một thuộc tính hoặc một chiều cho trước. Điều đó phụ thuộc vào quan điểm của
Ten_nuoc
ten_thi_xa thanh_pho
Ten_pho
So_nha Ten_vung
người sử dụng. Các phân bậc khái niệm do người sử dụng hệ thống, chuyên gia xác định, nhưng cũng có thể được sinh ra một cách tựđộng dựa trên các phân tích thống kê của phân bố dữ liệu.
Kết luận
Trong chương 1 đã trình bày các vấn đề liên quan đến kho dữ liệu: Khái niệm kho dữ liệu (DW), bốn mục đích khi xây dựng kho dữ liệu, sáu đặc
điểm của kho dữ liệu.
Trong chương này cũng đưa ra mô hình của DW với khái niệm về khối dữ liệu, các mô hình 2-D, 3-D… biểu diễn cho dữ liệu 2 chiều, 3 chiều,… Cơ
sở dữ liệu nhiều chiều cũng được thể hiện bằng các sơ đồ: hình sao, bông tuyết, chòm sao sự kiện. Đây là cơ sở để biểu diễn dữ liệu trước khi phát hiện tri thức. Nó là tiền đề cho thuật toán phát hiện luật kết hợp ở chương sau. Các vấn đề về luật kết hợp sẽđược trình bày ở chương 2.
Cuối chương này cũng trình bày một loại kho DW là kho dữ liệu chủđề
gồm: kho dữ liệu chủ đềđộc lập và kho dữ liệu chủ đề phụ thuộc. Các thuộc tính chiều trong cơ sở dữ liệu có thể được thể hiện trong các mức của phân bậc khái niệm. Nói tóm lại, chương 1 cung cấp những khái niệm và các vấn
đề cơ bản làm tiền đề cho các chương tiếp sau.
Chương 2 PHÁT HIỆN LUẬT KẾT HỢP NHIỀU CHIỀU