Giới hạn của thuật toán Alpha

CHƯƠNG 2 MỘT SỐ THUẬT TOÁN KHAI PHÁ QUY TRÌNH

2.1. Thuật toán khai phá quy trình Alpha

2.1.4. Giới hạn của thuật toán Alpha

Trong phần này, luận văn chỉ xem xét thuật toán Alpha cơ bản để minh họa cho khái niệm khai phá quy trình. Thuật toán Alpha chỉ tập trung dành riêng cho quan điểm điều khiển luồng, không thể sử dụng để phân tích các quan điểm khác. Mặc dù vậy, thuật toán Alpha cơ bản vẫn không thể khám phá thành công đối với một số vấn đề thường gặp trong khai phá quy trình. Hai lớp vấn đề mà thuật toán Alpha cơ bản không giải quyết được đó là: (i) các vấn đề về logic và (ii) các vấn đề về kết quả từ các sự kiện ghi nhận bị lỗi, các sự kiện hiếm có không đúng với các trạng thái “bình thường” và các sự kiện không đầy đủ.

Z Y (b) X (e) X Y Z Z Y (c) X (a) X Y (d) X Y Z

a. Các vấn đề về logic

Lớp các mạng mà thuật toán Alpha có thể khai phá một cách chính xác. Trong phần này luận văn sẽ tập trung tìm hiểu về những hạn chế của thuật toán Alpha.

Các hoạt động ẩn

Một yêu cầu cơ bản của khai phá quy trình là mỗi sự kiện xảy ra phải được ghi lại trong bản ghi sự kiện. Rõ ràng thuật toán Alpha cơ bản không thể phát hiện ra những hoạt động không xuất hiện trong bản ghi sự kiện.

Các hoạt động trùng lặp

Vấn đề của các hoạt động trùng lặp đề cập đến tình huống một mô hình quy trình có nhiều hơn một nút cùng đề cập đến một hoạt động. Giả sử rằng trong bảng 1.2 hoạt động E được đổi tên thành B (như hình 2.3). Rõ ràng, bản ghi thay đổi có thể là kết quả của việc mô hình quy trình thay đổi. Tuy nhiên, sẽ rất khó khăn để xây dựng tự động một mô hình quy trình từ bảng 1.2 với hoạt động E được đổi tên thành hoạt động B bởi vì nó không thể phân biệt được “B” trong trường hợp 5 với “B” trong các trường hợp khác.

Hình 2.3: Một mô hình quy trình với các hoạt động trùng lặp.

Cấu trúc không tự do lựa chọn (cấu trúc phụ thuộc khoảng cách xa)

Các cấu trúc không tự do lựa chọn có thể được sử dụng để biểu diễn cho cấu trúc “lựa chọn có điều khiển” tức là vị trí mà ở đó sự lựa chọn giữa hai hoạt động không được xác định bên trong một số nút trong mô hình quy trình nhƣng có thể phụ thuộc vào sự lựa chọn được thực hiện trong các phần khác của mô hình quy trình. Rõ ràng, trạng thái không xác định vị trí như vậy sẽ gây khó khăn cho phương pháp khai phá quy trình chủ yếu dựa trên thông tin nhị phân (a>w b) như thuật toán Alpha.

B B

A D

Hình 2.4: Một mô hình quy trình với cấu trúc không tự do lựa chọn

Hình 2.4 mô tả một cấu trúc không tự do lựa chọn. Sau khi thực hiện hoạt động C thì có một sự lựa chọn giữa hoạt động D và E. Tuy nhiên, sự lựa chọn giữa D và E được điều khiển bởi hai hoạt động trước đó là A và B. Những cấu trúc như vậy khó để khai phá vì sự lựa chọn là không xác định được vị trí và thuật toán khai phá phải “ghi nhớ" các sự kiện được đó. Một cải tiến của thuật toán Alpha là Alpha ++ có thể đối phó được với các cấu trúc không tự do lựa chọn.

Mô hình với vòng lặp ngắn

Thuật toán Alpha không thể khai phá thành công những cấu trúc có vòng lặp ngắn, tức là các vòng lặp với độ dài là 1 hoặc 2 [11]. Đối với vòng lặp có độ dài 1, được minh họa bởi mô hình WF-net trong hình 2.5 (a), nó mô tả kết quả của việc áp dụng thuật toán Alpha cơ bản vào bản ghi sự kiện W1 = [(A, C)2, (A, B, C)3, (A, B, B, C)2, (A, B, B, B, B, C)1].

Kết quả mô hình không phải là một WF-net, bởi vì chuyển tiếp B không liên thông với phần còn lại của mô hình. Điều này không phù hợp với bản ghi sự kiện.. Bằng cách sử dụng một phiên bản cải tiến của thuật toán Alpha, chúng ta có thể khám phá ra mô hình WF- net như trong hình 2.5(b).

Hình 2.5: Mô hình quy trình có vòng lặp ngắn độ dài 1

Vấn đề với các vòng lặp có độ dài 2 được minh họa bởi mạng Petri như hình 2.7(a). Hình 2.6 (a) mô tả kết quả của việc áp dụng thuật toán Alpha cơ bản vào W2=

a. Mạng Workflow W1 có vòng lặp ngắn độ dài 1 khai phá không chính xác

b. Mạng Workflow W1 có vòng lặp ngắn độ dài 1 được khai phá chính xác

B A D C E a c b a c b

[(A, B, D)3, (A, B, C, B, D)2, (A, B, C, B, C, B, D)1]

a. Mạng Workflow W2 có vòng lặp ngắn

độ dài 2 khai phá không chính xác.

b. Mạng Workflow W2 có vòng lặp

ngắn độ dài 2 được khai phá chính xác Hình 2.6: Mô hình quy trình có vòng lặp ngắn độ dài 2

b. Sự kiện lỗi, sự kiện hiếm có và sự kiện không đầy đủ

Trong thực tế các bản ghi sự kiện hiếm khi đầy đủ và/hoặc không chứa lỗi. Vì thế, sẽ rất khó khăn để quyết định mối quan hệ giữa hai hoạt động A và B (thuộc một trong ba mối quan hệ cơ bản A→WB, A #W B, A ||W B). Ví dụ như mối quan hệ nhân quả được sử dụng trong thuật toán Alpha (A →W B) chỉ có hiệu lực khi và chỉ khi trong bản ghi sự kiện có lưu một vết A nối trực tiếp theo sau bởi B (tức là mối quan hệ A >w B có hiệu lực) và không lưu vết B nối trực tiếp theo A (tức là không có B >w A). Tuy nhiên, trong một trạng thái lỗi chỉ cần một trường hợp lưu vết sai cũng có thể làm đảo lộn hoàn toàn việc rút ra một kết luận đúng đắn. Thậm chí, nếu chúng ta có hàng ngàn vết sự kiện trong đó thể hiện A nối trực tiếp theo sau bởi B thì chỉ cần một vết sự kiện ghi lại không đúng rằng B >w A sẽ ngăn cản chúng ta đưa ra một kết luận đúng. Bởi vì thuật toán Alpha cơ bản không quan tâm đến tần suất xuất hiện thông tin. Vì lý do này, thuật toán khai phá quy trình Heuristic [2] được phát triển để khắc phục bản ghi sự kiện lỗi và không đầy đủ bằng cách sử dụng tần suất xuất hiện thông tin.

Bài toán kiểm tra phù hợp

Kiểm tra phù hợp theo trường hợp replay