Giới hạn của thuật toán Alpha

Một phần của tài liệu GHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH VÀ ỨNG DỤNG XÂY DỰNG QUY TRÌNH KIỂM ĐỊNH CHẤT LƯỢNG GIÁO DỤC TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG (Trang 42 - 45)

CHƯƠNG 2 MỘT SỐ THUẬT TOÁN KHAI PHÁ QUY TRÌNH

2.1.4.Giới hạn của thuật toán Alpha

2.1. Thuật toán khai phá quy trình Alpha

2.1.4.Giới hạn của thuật toán Alpha

Trong phần này, luận văn chỉ xem xét thuật toán Alpha cơ bản để minh họa cho khái niệm khai phá quy trình. Thuật toán Alpha chỉ tập trung dành riêng cho quan điểm điều khiển luồng, không thể sử dụng để phân tích các quan điểm khác. Mặc dù vậy, thuật toán Alpha cơ bản vẫn không thể khám phá thành công đối với một số vấn đề thường gặp trong khai phá quy trình. Hai lớp vấn đề mà thuật toán Alpha cơ bản không giải quyết được đó là: (i) các vấn đề về logic và (ii) các vấn đề về kết quả từ các sự kiện ghi nhận bị lỗi, các sự kiện hiếm có không đúng với các trạng thái “bình thường” và các sự kiện không đầy đủ.

Z Y (b) X (e) X Y Z Z Y (c) X (a) X Y (d) X Y Z

a. Các vấn đề về logic

Lớp các mạng mà thuật toán Alpha có thể khai phá một cách chính xác. Trong phần này luận văn sẽ tập trung tìm hiểu về những hạn chế của thuật toán Alpha.

Các hoạt động ẩn

Một yêu cầu cơ bản của khai phá quy trình là mỗi sự kiện xảy ra phải được ghi lại trong bản ghi sự kiện. Rõ ràng thuật toán Alpha cơ bản không thể phát hiện ra những hoạt động không xuất hiện trong bản ghi sự kiện.

Các hoạt động trùng lặp

Vấn đề của các hoạt động trùng lặp đề cập đến tình huống một mô hình quy trình có nhiều hơn một nút cùng đề cập đến một hoạt động. Giả sử rằng trong bảng 1.2 hoạt động E được đổi tên thành B (như hình 2.3). Rõ ràng, bản ghi thay đổi có thể là kết quả của việc mô hình quy trình thay đổi. Tuy nhiên, sẽ rất khó khăn để xây dựng tự động một mô hình quy trình từ bảng 1.2 với hoạt động E được đổi tên thành hoạt động B bởi vì nó không thể phân biệt được “B” trong trường hợp 5 với “B” trong các trường hợp khác.

Hình 2.3: Một mô hình quy trình với các hoạt động trùng lặp.

Cấu trúc không tự do lựa chọn (cấu trúc phụ thuộc khoảng cách xa)

Các cấu trúc không tự do lựa chọn có thể được sử dụng để biểu diễn cho cấu trúc “lựa chọn có điều khiển” tức là vị trí mà ở đó sự lựa chọn giữa hai hoạt động không được xác định bên trong một số nút trong mô hình quy trình nhƣng có thể phụ thuộc vào sự lựa chọn được thực hiện trong các phần khác của mô hình quy trình. Rõ ràng, trạng thái không xác định vị trí như vậy sẽ gây khó khăn cho phương pháp khai phá quy trình chủ yếu dựa trên thông tin nhị phân (a>w b) như thuật toán Alpha.

B B

A D

Hình 2.4: Một mô hình quy trình với cấu trúc không tự do lựa chọn

Hình 2.4 mô tả một cấu trúc không tự do lựa chọn. Sau khi thực hiện hoạt động C thì có một sự lựa chọn giữa hoạt động D và E. Tuy nhiên, sự lựa chọn giữa D và E được điều khiển bởi hai hoạt động trước đó là A và B. Những cấu trúc như vậy khó để khai phá vì sự lựa chọn là không xác định được vị trí và thuật toán khai phá phải “ghi nhớ" các sự kiện được đó. Một cải tiến của thuật toán Alpha là Alpha ++ có thể đối phó được với các cấu trúc không tự do lựa chọn.

Mô hình với vòng lặp ngắn

Thuật toán Alpha không thể khai phá thành công những cấu trúc có vòng lặp ngắn, tức là các vòng lặp với độ dài là 1 hoặc 2 [11]. Đối với vòng lặp có độ dài 1, được minh họa bởi mô hình WF-net trong hình 2.5 (a), nó mô tả kết quả của việc áp dụng thuật toán Alpha cơ bản vào bản ghi sự kiện W1 = [(A, C)2, (A, B, C)3, (A, B, B, C)2, (A, B, B, B, B, C)1].

Kết quả mô hình không phải là một WF-net, bởi vì chuyển tiếp B không liên thông với phần còn lại của mô hình. Điều này không phù hợp với bản ghi sự kiện.. Bằng cách sử dụng một phiên bản cải tiến của thuật toán Alpha, chúng ta có thể khám phá ra mô hình WF- net như trong hình 2.5(b).

Hình 2.5: Mô hình quy trình có vòng lặp ngắn độ dài 1

Vấn đề với các vòng lặp có độ dài 2 được minh họa bởi mạng Petri như hình 2.7(a). Hình 2.6 (a) mô tả kết quả của việc áp dụng thuật toán Alpha cơ bản vào W2=

a. Mạng Workflow W1 có vòng lặp ngắn độ dài 1 khai phá không chính xác

b. Mạng Workflow W1 có vòng lặp ngắn độ dài 1 được khai phá chính xác

B A D C E a c b a c b

[(A, B, D)3, (A, B, C, B, D)2, (A, B, C, B, C, B, D)1]

a. Mạng Workflow W2 có vòng lặp ngắn

độ dài 2 khai phá không chính xác.

b. Mạng Workflow W2 có vòng lặp

ngắn độ dài 2 được khai phá chính xác Hình 2.6: Mô hình quy trình có vòng lặp ngắn độ dài 2

b. Sự kiện lỗi, sự kiện hiếm có và sự kiện không đầy đủ

Trong thực tế các bản ghi sự kiện hiếm khi đầy đủ và/hoặc không chứa lỗi. Vì thế, sẽ rất khó khăn để quyết định mối quan hệ giữa hai hoạt động A và B (thuộc một trong ba mối quan hệ cơ bản A→WB, A #W B, A ||W B). Ví dụ như mối quan hệ nhân quả được sử dụng trong thuật toán Alpha (A →W B) chỉ có hiệu lực khi và chỉ khi trong bản ghi sự kiện có lưu một vết A nối trực tiếp theo sau bởi B (tức là mối quan hệ A >w B có hiệu lực) và không lưu vết B nối trực tiếp theo A (tức là không có B >w A). Tuy nhiên, trong một trạng thái lỗi chỉ cần một trường hợp lưu vết sai cũng có thể làm đảo lộn hoàn toàn việc rút ra một kết luận đúng đắn. Thậm chí, nếu chúng ta có hàng ngàn vết sự kiện trong đó thể hiện A nối trực tiếp theo sau bởi B thì chỉ cần một vết sự kiện ghi lại không đúng rằng B >w A sẽ ngăn cản chúng ta đưa ra một kết luận đúng. Bởi vì thuật toán Alpha cơ bản không quan tâm đến tần suất xuất hiện thông tin. Vì lý do này, thuật toán khai phá quy trình Heuristic [2] được phát triển để khắc phục bản ghi sự kiện lỗi và không đầy đủ bằng cách sử dụng tần suất xuất hiện thông tin.

(adsbygoogle = window.adsbygoogle || []).push({});

Một phần của tài liệu GHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH VÀ ỨNG DỤNG XÂY DỰNG QUY TRÌNH KIỂM ĐỊNH CHẤT LƯỢNG GIÁO DỤC TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG (Trang 42 - 45)