Phân bậc khái niệm

Một phần của tài liệu Phát hiện luật kết hợp nhiều chiều mờ từ cơ sở dữ liệu định lượng (Trang 28)

Các phân bậc khái niệm cho phép được quản lý ở nhiều mức khác nhau của sự trừu xuất. Phân bậc khái niệm xác định một chuỗi sắp xếp tập các khái niệm từ mức thấp hơn đến mức cao hơn, tổng quát hơn. Ví dụ: các giá trị của vi_tri như Hà nội, Đà nẵng, Hồ Chí Minh... có thểđược xếp vào vùng mà các thành phố này thuộc vào. Các vùng này lại được xếp vào đất nước chứa vùng

đó...Hình 10 dưới đây mô tả Phân bậc khái niệm theo chiều vi_tri được mô tả

như trên.

Hình 9: Phân bậc khái niệm đối với chiều vi_tri.

Thế giới

Nga

Miền Bắc Miền Trung Miền Nam

Hà nội Đà nẵng HCM

Nhiều phân bậc khái niệm được ngầm định trong sơ đồ CSDL. Chẳng hạn

đối với chiều vị trí, giả sử rằng vị trí được mô tả bởi các thuộc tính như: so_nha, ten_pho, thanh_pho, ten_thi_xa, ten_vung, và ten_nuoc. Giả sử có quan hệ thứ tự toàn phần trên các thuộc tính này và khi đó sẽ hình thành phân bậc khái niệm, chẳng hạn: “so_nha<ten_pho<ten_thi_xa <thanh_pho<ten_vung<ten_nuoc”.

Nếu trên các thuộc tính của chiều chỉ tồn tại các quan hệ thứ tự từng phần, khi đó sẽ hình thành một cấu trúc dàn đối với các thuộc tính của chiều. Chẳng hạn so_nha< ten_pho<{thanh_pho; ten_thi_ xa}<ten_vung<ten_nuoc. Cấu trúc dàn này được minh hoạ trong hình 10 ở dưới.

Hình 10: Cấu trúc dàn của các thuộc tính đối với chiều vi_tri trong DW Bán hàng

Phân bậc khái niệm giữa các thuộc tính trong một CSDL được gọi là sơ đồ phân bậc. Phân bậc khái niệm cũng có thể được xác định bằng cách sử

dụng phương pháp rời rạc hoặc nhóm các giá trị đối với một chiều hoặc một thuộc tính cho trước. Nói chung là có nhiều phân bậc khái niệm đối với một thuộc tính hoặc một chiều cho trước. Điều đó phụ thuộc vào quan điểm của

Ten_nuoc

ten_thi_xa thanh_pho

Ten_pho

So_nha Ten_vung

người sử dụng. Các phân bậc khái niệm do người sử dụng hệ thống, chuyên gia xác định, nhưng cũng có thể được sinh ra một cách tựđộng dựa trên các phân tích thống kê của phân bố dữ liệu.

Kết lun

Trong chương 1 đã trình bày các vấn đề liên quan đến kho dữ liệu: Khái niệm kho dữ liệu (DW), bốn mục đích khi xây dựng kho dữ liệu, sáu đặc

điểm của kho dữ liệu.

Trong chương này cũng đưa ra mô hình của DW với khái niệm về khối dữ liệu, các mô hình 2-D, 3-D… biểu diễn cho dữ liệu 2 chiều, 3 chiều,… Cơ

sở dữ liệu nhiều chiều cũng được thể hiện bằng các sơ đồ: hình sao, bông tuyết, chòm sao sự kiện. Đây là cơ sở để biểu diễn dữ liệu trước khi phát hiện tri thức. Nó là tiền đề cho thuật toán phát hiện luật kết hợp ở chương sau. Các vấn đề về luật kết hợp sẽđược trình bày ở chương 2.

Cuối chương này cũng trình bày một loại kho DW là kho dữ liệu chủđề

gồm: kho dữ liệu chủ đềđộc lập và kho dữ liệu chủ đề phụ thuộc. Các thuộc tính chiều trong cơ sở dữ liệu có thể được thể hiện trong các mức của phân bậc khái niệm. Nói tóm lại, chương 1 cung cấp những khái niệm và các vấn

đề cơ bản làm tiền đề cho các chương tiếp sau.

Chương 2 PHÁT HIỆN LUẬT KẾT HỢP NHIỀU CHIỀU

Một phần của tài liệu Phát hiện luật kết hợp nhiều chiều mờ từ cơ sở dữ liệu định lượng (Trang 28)