Thuật toán α được WMP van der Aalst và cộng sự nghiên cứu và đề xuất năm 2004 [12]. Đây là một thuật toán khá đơn giản, ứng dụng đặc điểm của lưới WF, rằng trong nhiều lưới WF, hai hoạt động có sự kết nối với nhau nếu xác định được quan hệ nhân quả của chúng trong nhật kí sự kiện.
Đầu vào: Nhật kí sự kiện L với tập các hoạt động T.
Đầu ra: Lưới Petri α(L) mô hình hóa L với hai vị trí đầu, cuối được định nghĩa
như dưới đây:
Giải thích thuật toán:
Bước 1: Mọi bước chuyển của lưới đầu ra TL : mỗi hoạt động trong L tương ứng với một bước chuyển trong α(L)
Bước 2: Mọi bước chuyển được nối từ vị trí vào i (start): TI đó là các phần tử đầu tiên ở mỗi vết 〈t1, …, tn〉, …, 〈t’1, …, t’m〉
Bước 3: Mọi bước chuyển nối tới vị trí ra o (end): TO đó là các phần tử xuất hiện ở cuối mỗi vết 〈t1, …, tn〉, …, 〈t’1, …, t’m〉
Bước 4: Xác định mọi cặp tập song kết nối (A, B). mọi phần tử a∈A và mọi phần tử b∈B là quan hệ nhân quả (ví dụ a →L b), tất cả các phần tử trong A là độc lập với nhau (a1#La2), và tất cả các phần tử trong B là độc lập với nhau (b1#Lb2).
Hình 2.2: Ví dụ cặp tập song kết nối (A,B) [2]
Bước 5: Xác định mọi cặp tập song kết nối cực đại (A, B)
Song kết nối không cực đại
Song kết nối cực đại
Bảng 2.1: Bảng ví dụ về song kết nối cực đại và không cực đại [2]
Bước 6: Xác định tập các vị trí từ các cặp song kết nối cực đại, vị trí vào, vị trí ra
Hình 2.3: Vị trí p(A,B) kết nối các bước chuyển trong tập A và B [2]
Bước 7: Nối các cung Bước 8: Kết quả
Ví dụ:
Lưới Petri thu được:
Hình 2.4: Kết quả thuật toán α cho L5 [1]
Về cơ bản, thuật toán α quét qua nhật kí sự kiện để kiếm các mẫu cụ thể. Ví dụ, nếu hoạt động b được thi hành liền sau hoạt động a nhưng hoạt động a không bao giờ được thi hành liền sau b, thì ta xem là có một sự phụ thuộc nhân quả giữa a và b. Để phản ánh mối quan hệ phụ thuộc này, lưới Petri tương ứng sẽ có một vị trí nối a với b.
Hạn chế của thuật toán α
Thuật toán khai phá lớp nhật ký sự kiện lớn với giả định nhật ký sự kiện liên quan hoàn toàn với quan hệ thứ tự. Thuật toán có hạn chế ngay cả khi “liên quan hoàn toàn”. Sau đây là một vài hạn chế điển hình của thuật toán α.
1) Dư thừa:
Rất nhiều lưới WF khác nhau lại có hành vi như nhau
Hình 2.5: Ví dụ hạn chế dư thừa của thuật toán α [2]
Hai vị trí p1, p2 là thừa được gọi là “ẩn” , bị gỡ đi không ảnh hướng hành vi. 2) Chu trình ngắn
Thuật toán phát hiện chu trình độ dài 3 trở lên, có vấn đề với chu trình ngắn (độ dài 1 hoặc 2)
Hình 2.6: Ví dụ hạn chế chu trình bằng 1 của thuật toán α [2]
Mô hình phát hiện Bằng thuật toán α
Hình 2.7: Ví dụ hạn chế chu trình bằng 2 của thuật toán α [2]
3) Phụ thuộc không địa phương
Thuật toán chỉ xét quan hệ đi trước trực tiếp >L và cảm sinh trực tiếp. Ví dụ:
Hình 2.8: Ví dụ hạn chế phụ thuộc không địa phương của thuật toán α [2]
Mô hình thực sự: không phát hiện hai vị trí p1, p2.
Tóm lại thuật toán Alpha cung cấp một cách tiếp cận cơ bản cho bài toán phát hiện quá trình. Mặc dù còn nhiều hạn chế tuy nhiên là các tiếp cận tốt để minh họa những thành phần chính trong phát hiện quá trình. Ngày nay có nhiều thuật toán phát hiện quá trình tốt hơn, có thể khắc phục được nhiều hạn chế của thuật toán α. Ví dụ các biến thể α+, α++ hoặc những thuật toán có cách tiếp cận hoàn toàn khác như khai phá di truyền, khai phá dựa trên vùng,…
Mô hình phát hiện Bằng thuật toán α