Định nghĩa 1: Một độ đo sự gần gũi giữa 2 đối tượng tùy ý x, y thuộc không gian X đối tượng là một ánh xạ d: XR (với R là đường thẳng thực) sao cho
i) d(x, y) 0 x, y và d(x, y) = 0 x = y ii) d(x, y) = d(y, x) x, y X
iii) d(x, y) d(x, z) + d(z, y) x, y, z X
Đối với việc giải bài toán phân lớp, chúng ta còn cần đến khái niệm quan hệ gần gũi giữa hai tập hợp. Ta có định nghĩa như sau:
Định nghĩa 2: Giả sử Gt, Gt' là hai tập hợp con tùy ý. Khi đó độ đo sự gần gũi giữa hai tập hợp Gt, Gt' được định nghĩa như sau:
' ' ' 1 ( , ) ( , ) i t j t t t i j x G x G t t S G G d x x n n Trong đó xi = xi1...xin, xj = xj1...xjm, nt = #Gt nt' = #Gt'
2.3.2. Bài toán
Giả sử G là một tập hợp hữu hạn và khác rỗng,
G={X1, X2,.., Xn} n2 trong đóXiRm, i1,2,..,n
Hãy phân hoạch G thành k tập con G1, G2, .. ,Gk. Nghĩa là hãy chia G thành k phần G1, G2, .. ,Gk thỏa mãn các điều kiện:
1) Gi ≠ i=1,2,..,k 2) Gi Gj = i≠j, i,j=1,2,..,k 3) Gi G k 1 i
sao cho tổn thất trong phân lớp là bé nhất. Ở đây có hai trường hợp xảy ra
i) Trường hợp số lớp k cho trước ii) Trường hợp số lớp k chưa biết Sau đây là lời giải bài toán 2.3.1
Về phương pháp giải bài toán này cho trường hợp số lớp k chưa biết chỉ khác với trường hợp đã biết số k là phải xác định số k. Sau khi đã xác định được số k thì hai trường hợp i) và ii) là như nhau.