Bài toán đồ thị đẳng cấu

Một phần của tài liệu (LUẬN văn THẠC sĩ) bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Trang 29 - 32)

Một bài toán thường gặp trong khai phá đồ thị là bài toán tìm các đồ thị con (mẫu) cho trước. Nhưng sẽ có nhiều cách biểu diễn cho mỗi đồ thị (con), nên bài toán tìm các đồ thị con được giải quyết thông qua bài toán đồ thị đẳng cấu (graph

đồ thị con nào đó có một tính chất thì toàn bộ đồ thị cũng có tính chất đó. Chẳng hạn như một đồ thị là không phẳng nếu như nó chứa một đồ thị hai phía đầy đủ (complete bipartite graph ) hoặc nếu nó chứa đồ thị đầy đủ.

Sau đây là những khái niệm, tính chất cơ sở liên quan đến bài toán đồ thị đẳng cấu GI (graph isomorphism) [14, 16].

Chúng ta xét đồ thị đơn vô hướng với các đỉnh được gắn nhãn G = (V, E, N, L), trong đó

 V là tập các đỉnh, V = {v1, v2, ..., vn}

 E tập các cạnh là tập các cặp đỉnh phân biệt, không có thứ tự, |E| = m.

 Hàm gắn nhãn L : V  N, N – tập các số tự nhiên 1, 2, ..., n.

Trong đồ thị G, đường đi từ đỉnh u đến v là dãy các đỉnh phân biệt u = v1, v2, ..., vn = v sao cho (vi, vi+1)  E với i = 1, 2, ..., k-1. Nếu tồn tại đường đi nối v với u thì ta nói u và v liên thông theo đường đi có độ dài k-1. Đường đi từ u đến v ký hiệu là puv.

Định nghĩa 2.1. Cho trước cặp đỉnh (u, v) trong G, ta định nghĩa khoảng cách (distance) d(u,v) như sau:

d(u, v) = 0, nếu u = v,

d(u, v) = Đường đi ngắn nhất từ u đến v, nếu u và v liên thông, và d(u, v) = ∞, ngược lại.

Định nghĩa 2.2. Với mỗi cặp đỉnh (u, v) trong G, G\uv là đồ thị phụ thêm (collateral graph) được định nghĩa như sau:

 Nếu (u, v)  E, thì G\uv là đồ thị nhận được từ đồ thị G bằng cách loại bỏ cạnh nối v với u, trong khi vẫn bảo toàn các đỉnh. Trong trường hợp này ta sử dụng ký hiệu + để phân biệt hàm khoảng cách.

 Nếu (u, v)  E, thì G\uv = G. Trong trường hợp này ta sử dụng ký hiệu - để phân biệt hàm khoảng cách.

Định nghĩa 2.3. Đồ thị kết đôi Guv cho cặp đỉnh (u, v) trong G được định nghĩa như sau:

 w là đỉnh của Guv khi và chỉ khi w nằm trên đường đi ngắn nhất từ u đến v trong G\uv, và

 (w, x) là cạnh Guv nếu (w, x) cũng là cạnh của G.

Đối với mỗi cặp đỉnh (u, v) trong G, xác định một bộ dấu ((u, v)-sign), ký hiệu là suv, được xác định như sau:

suv = ± duv #nuv#muv

Trong đó:

 Dấu ở đầu là + nếu (u, v)  E, ngược lại là - khi (u, v)  E;

 duv là khoảng cách d(u, v) trong đồ thị thêm G\uv ;

 nuv là số các đỉnh trong đồ thị kết đôi Guv;

 muv là số các cạnh trong đồ thị kết đôi Guv;

Các bộ giá trị ± duv #nuv#muv được gọi là bộ dấu hiệu của ma trận dấu.

Định nghĩa 2.4. Ma trận dấu của đồ thị G, ký hiệu SG = (suv)u, v  V.

Lưu ý, đối với đồ thị đơn, vô hướng thì cả ma trận liền kề và ma trận dấu (sign matrix) là ma trận đối xứng.

Định nghĩa 2.5. Giả thiết tập tất các bộ dấu hiệu của ma trận dấu được xếp theo thứ tự từ điển thành s1, s2, ..., sr. Vector tần xuất dấu của đỉnh v  V là fv = (fv(1), fv(2), …, fv(r)), trong đó fv(k) là số lần xuất hiện dấu sk trên hàng v trong ma trận dấu.

Định nghĩa 2.6. Hai đỉnh của đồ thị G được gọi là tương đương với nhau nếu chúng có cùng vector tần xuất dấu.

Theo định nghĩa trên, tập các đỉnh của đồ thị sẽ phân hoạch thành các lớp tương đương. Từ đó suy ra, dạng chính tắc SG* của ma trận dấu SG được định nghĩa chính xác theo hoán vị của các đỉnh trong mỗi lớp tương đương.

Định nghĩa 2.7. Dạng chính tắc (canonical form) SG* là ma trận dấu được xếp lại các hàng, cột theo thứ tự từ điển của các vector tần xuất của dấu. Nếu hai đỉnh cùng lớp tương đương tức là có cùng vector tần xuất của dấu thì thứ tự không quan trọng, ta có thể thay đổi thứ tự.

Một phần của tài liệu (LUẬN văn THẠC sĩ) bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Trang 29 - 32)

Tải bản đầy đủ (PDF)

(66 trang)