Khai phá quy trình bằng thuật toán Di truyền

Một phần của tài liệu GHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH VÀ ỨNG DỤNG XÂY DỰNG QUY TRÌNH KIỂM ĐỊNH CHẤT LƯỢNG GIÁO DỤC TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG (Trang 79 - 81)

6. Bố cục của luận văn

3.3.3.Khai phá quy trình bằng thuật toán Di truyền

Từ bản ghi sự kiện 3.2 , ta sử dụng thuật toán GPM với các tham số được mô tả trong hình hình 3.16.

Khi đó kết quả của quá trình khai phá là một tập quần thể (tương ứng mô hình). Đây là các cá thể được đưa ra sau quá trình khai phá, bao gồm cả các cá thể có độ phù hợp cao nhất và các cá thể có độ phù hợp thấp ở các thế hệ đầu tiên.

Đánh giá các thuật toán

Sau khi thực nghiệm các thuật toán Alpha, Heuristic và GPM với bản ghi sự kiện 3.2 không có sự kiện lỗi và tồn tại sự kiện lỗi. Tôi đi đến các nhận định sau:

Bảng 3.3: So sánh, đánh giá các thuật toán đã thực nghiệm

Thuật toán

Tiêu chí Alpha Heuristic mining

Genetic process mining (Di truyền) Thời gian thực

hiện

Nhanh Nhanh Chậm tùy thuộc vài thông số tùy chỉnh. Thông số càng cao thời gian thực hiện càng lâu Độ phù hợp của mô hình kết quả -Mô hình có được từ bản ghi tốt cho độ phù hợp cao. -Mô hình từ bản

ghi tồn tại lỗi có độ phù hợp bị sụt giảm nhiều

-Mô hình có được từ bản ghi tốt, không lỗi có độ phù hợp cao. -Độ phù hợp ở mô hình từ bản ghi có vết sự kiện lỗi bị giảm sút. -Mô hình từ bản ghi có hoạt động trùng lặp có đồ phù hợp thấp.

Các cá thể mô hình trong quần thể kết quả cho độ phù hợp cao.

Ưu điểm

-Phát hiện nhanh do thuật toán đơn giản.

-Bản ghi đầu vào tốt cho kết quả tốt.

-Thực hiện nhanh, không tốn nhiều thời gian do thuật toán không phức tạp.

-Phát hiện tốt trên các bản ghi không có lỗi và có vết sự kiện lỗi.

- Phát hiện tốt, cho kết quả phù hợp cao đối với cả bản ghi không bị lỗi và bản ghi có lỗi, sự kiện trùng lặp. - Cho phép tùy chỉnh

linh hoạt các thông số để đạt hiệu quả phát hiện quy trình cao nhất.

Khuyết điểm Xử lý các vết sự lỗi kiện không tốt dẫn đến mô hình kết quả có chất lượng thấp Xử lý sự kiện trùng lặp không tốt. Mô hình kết quả với bản ghi có lỗi có độ phù hợp bị giảm sút nhiều.

Thời gian thực hiện lâu do thuật toán phức tạp.

Theo bảng trên, ta có thể thấy rằng, thuật toán Alpha và HM thực hiện nhanh hơn rất nhiều so với thuật toán GPM. Nhưng xét về chất lượng của kết quả đầu ra - ở đây là độ phù hợp của mô hình kết quả - thì thuật toán GPM cho kết quả tốt nhất. Hai biểu đồ sau ở hình 3.17 thể hiện một cách trực quan nhận định trên:

Biểu đồ thời gian thực hiện của ba Biểu đồ độ phù hợp của mô hình thuật

toán (đơn vị: giây) kết quả ở ba trường hợp (đơn vị: %)

Hình 3.17: So sánh thời gian thực hiện và độ phù hợp của mô hình kết quả của ba thuật toán Alpha, HM, GPM

Nhìn vào hình 3.17 ta có thể thấy được, mặc dù tốn nhiều thời gian hơn nhưng thuật toán GPM đối phó tốt với các vấn đề sự kiện lỗi và hoạt động trùng lặp. Việc xây dựng khai phá một mô hình quy trình tùy thuộc vào nhu cầu thực tế và chất lượng của bản ghi sự kiện đầu vào. Nếu mô hình đơn giản, bản ghi sự kiện có chất lượng cao thì sử dụng thuật toán Alpha hoặc HM sẽ cho hiệu quả về thời gian và chất lượng cao hơn. Mặc khác, nếu mô hình tương đối phức tạp hơn và bản ghi sự kiện có chất lượng không cao, thuật toán GPM có thể trả về kết quả tối ưu hơn. Trong phần lớn trường hợp khai phá quy trình, độ phù hợp là chỉ tiêu được xem trọng hơn vì thời gian tiêu tốn cho khai phá không quá nhiều nhờ vào hiệu năng xử lý của các hệ thống thông tin hiện nay.

Một phần của tài liệu GHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH VÀ ỨNG DỤNG XÂY DỰNG QUY TRÌNH KIỂM ĐỊNH CHẤT LƯỢNG GIÁO DỤC TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG (Trang 79 - 81)