Cơ sở lý thuyết

Một phần của tài liệu (LUẬN văn THẠC sĩ) nhận dạng văn bản một số ngôn ngữ la tinh (Trang 30 - 31)

Định nghĩa 1: Một độ đo sự gần gũi giữa 2 đối tượng tùy ý x, y thuộc không gian X đối tượng là một ánh xạ d: XR (với R là đường thẳng thực) sao cho

i) d(x, y)  0  x, y và d(x, y) = 0  x = y ii) d(x, y) = d(y, x)  x, y  X

iii) d(x, y)  d(x, z) + d(z, y)  x, y, z  X

Đối với việc giải bài toán phân lớp, chúng ta còn cần đến khái niệm quan hệ gần gũi giữa hai tập hợp. Ta có định nghĩa như sau:

Định nghĩa 2: Giả sử Gt, Gt' là hai tập hợp con tùy ý. Khi đó độ đo sự gần gũi giữa hai tập hợp Gt, Gt' được định nghĩa như sau:

' ' ' 1 ( , ) ( , ) i t j t t t i j x G x G t t S G G d x x n n      Trong đó xi = xi1...xin, xj = xj1...xjm, nt = #Gt nt' = #Gt'

2.3.2. Bài toán

Giả sử G là một tập hợp hữu hạn và khác rỗng,

G={X1, X2,.., Xn} n2 trong đóXiRm, i1,2,..,n

Hãy phân hoạch G thành k tập con G1, G2, .. ,Gk. Nghĩa là hãy chia G thành k phần G1, G2, .. ,Gk thỏa mãn các điều kiện:

1) Gi ≠  i=1,2,..,k 2) Gi Gj =  i≠j, i,j=1,2,..,k 3) Gi G k 1 i   

sao cho tổn thất trong phân lớp là bé nhất. Ở đây có hai trường hợp xảy ra

i) Trường hợp số lớp k cho trước ii) Trường hợp số lớp k chưa biết Sau đây là lời giải bài toán 2.3.1

Về phương pháp giải bài toán này cho trường hợp số lớp k chưa biết chỉ khác với trường hợp đã biết số k là phải xác định số k. Sau khi đã xác định được số k thì hai trường hợp i) và ii) là như nhau.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nhận dạng văn bản một số ngôn ngữ la tinh (Trang 30 - 31)

Tải bản đầy đủ (PDF)

(82 trang)