Phƣơng pháp tiếp cận hƣớng đối tƣợng để khai phá FSMs. Xây dựng cấu trúc đồ thị con và xác định FSM
* Định nghĩa 3.1.Một đồ thị gán nhãn đƣợc mô tả bởi một bộ gồm bốn thành
phần G = (V,E,L,l) trong đó V: tập các đỉnh (các node) E⊆ V×V : tập các cạnh, chúng có thể có hƣớng hoặc vô hƣớng. L: tập các nhãn l: V ∪ E→L, l là hàm gán nhãn đến các đỉnh và các cạnh. * Độ hỗ trợ SubGraph:
Hình 3.2 gồm ba đồ thị đƣợc biểu diễn, các số 0,1,2 và 3 là những số gán cho mục tiêu của chƣơng trình, các nhãn A,B,C,D,E,F rất quan trọng trong thuật toán. nGraph là tổng số đồ thị trong tập dữ liệu và nSubGraph là số lần một
subGrap cụ thể suất hiện trong tập dữ liệu. Độ hỗ trợ “Sup” của một đồ thị con cụ thể đƣợc định nghĩa: Sup =nSubGraph÷nGraph
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Vấn đề đồ thị đẳng cấu cần đƣợc giải quyết trong khi đếm độ hỗ trợ của đồ thị con trong tập dữ liệu. Hai đồ thị là đẳng cấu nếu đỉnh và nhãn cạnh là nhƣ nhau và cùng hƣớng. Trong ví dụ đồ thị có hƣớng đƣợc giả định từ số đỉnh thấp đến số đỉnh cao hơn.
Ví dụ3.2. Nếu đếm số đồ thị con xuất hiện A-E-B trong ba đồ thị, thì kết quả là 3 nhƣng thực sự chỉ có hai đồ thị một bao gồm hai đồ thị con A-E-B phải đƣợc tính một lần vấn đề này đƣợc loại bỏ bằng cách tìm sự khác biệt giữa đồ thị con trên đồ thị.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/