3. Cây chuẩn tắc một chiều trên tập khóa K
2.1 Cây nhị phân n-chiều với thông tin chứa ở lá
Giả sử D là tập không rỗng các Documents nào đó và mỗi phần tử của nó ta gọi một thông tin, D được gọi là tập các thông tin. Các tập Ki(i=l, 2, ..., n) là
Trang 39
tập các phần tử mà trên đó thỏa mãn quan hệ so sánh ( x,y Ki : hoặc x y hoặc x < y). Không mất tính tổng quát ta xem K1 = K2 = ... = Kn = K là tập các số tự nhiên. Tích Decac K(n) = K x K x ... x K được gọi là tập khóa của cây nhị phân n-chiều và mỗi phần tử ln =(l1 , 12 ,..., ln) K(n) với li K là một khóa. Vậy mỗi một khóa là bộ gồm n số tự nhiên. Giả sử các kí hiệu [ ] < >, D K.
Định nghĩa 2.l (Định nghĩa đệ qui cây nhị phân n-chiều với thông tin chứa ở lá)
a. Mỗi phần tử d D gọi là một cây.
b. Nếu Tl, T2 là hai cây và k K thì dãy kí hiệu [i, k]<Tl,T2> cũng là một cây. Dạng đồ thị của cây [i, k] < Tl, T2> là: [i, k]
T1 T2
Ở đây [i, k] là đỉnh trong của cây, nó chứa k K và i là chỉ số khóa (1 i n). Tl
là cây con bên trái, T2 là cây con bên phải. Đỉnh ngoài hay còn gọi là lá chứa thông tin d D. Tập tất cả các cây định nghĩa như trên được kí hiệu qua TREE(N) và được gọi là tập các cây nhị phân n-chiều với thông tin chứa ở lá trên tập khóa K(n) (gọi tắt là cây nhị phân n-chiều).
Định nghĩa 2.2 (Định nghĩa hàm đánh giá hay hàm kết quả )
Ta kí hiệu " " (" ") để chỉ sự đồng nhất bằng nhau (không đồng nhất bằng nhau) giữa các cây nhị phân n-chiều.
Giả sử T là một cây nhị phân n-chiều và ln
=(l1, l2 , ...,ln) K(n).
Ta định nghĩa hàm f : TREE(N) xK(n) D theo định nghĩa đệ quy của cây như sau: a. Nếu T d D thì f(T , ln ) = f(d, ln ) = d với mọi ln K(n) b. Nếu T [i, k]<T1,T2> thì : f(T1,ln) nếu li k. f(T, ln ) = f(T2, ln) nếu li > k.
Định nghĩa 2.3 (Định nghĩa sự tương đương của 2 cây nhị phân n-chiều).
Giả sử Tl , T2 TREE(n). Ta nói Tl là tương đương với T2 trên K(n) ( kí hiệu Tl (K(n)) T2) khi và chỉ khi f(Tl , ln ) = f(T2, ln) Với mọi ln
K(n).