CHƯƠNG 2 MỘT SỐ THUẬT TOÁN KHAI PHÁ QUY TRÌNH
3.2. Công cụ khai phá quy trình ProM
3.2.2. Các chức năng của công cụ khai phá quy trình ProM
Như đã trình bày ở trên, ProM cung cấp nhiều chức năng nhờ vào các flug-in như: Khai phá, phân tích, nhập dữ liệu, xuất dữ liệu, chuyển đổi và lọc dữ liệu.
a. ProM phiên bản 5.2 được tích hợp gần 300 flugin (47 plug-in khai phá, 96 plug-in phân tích, 22 plug-in nhập dữ liệu vào, 45 plug-in xuất dữ liệu ra, 44 plug-in chuyển đổi và 32 plug-in lọc dữ liệu) cho phép người dùng khai phá quy trình trên máy tính cục bộ và cho phép người dùng tương tác trực tiếp. Việc cài đặt phiên bản này
Staffware Flower SAP InConcert Bản ghi XML Mạng Heuristic Aris Graph Format PNML TPN file … Mạng Heuristic Aris Graph Format NetMiner file Lọc dữ liệu Plugin nhập Plugin xuất Plugin khai phá Plugin phân tích Plugin chuyển đổi Công cụ hình dung Khung kết quả PNML TPN file DOT ….
cũng khá đơn giản do toàn bộ flugin đã được tích hợp. ProM 5.2 hỗ trợ nhiều loại dữ liệu đầu vào, khi người dùng chọn dữ liệu đầu vào, phần mềm sẽ hiển thị các tùy chọn có thể thao tác với dữ liệu đầu vào đó. Ví dụ khi thêm dữ liệu đầu vào (bản ghi sự kiện chẳng hạn). Các tùy chọn khai phá, phân tích, chuyển đổi sẽ được hiển thị như hình 3.2.
Hình 3.2: Các tùy chọn đối với dữ liệu đầu vào là bản ghi sự kiện
ProM 5.2 hỗ trợ rất nhiều thuật toán khai phá quy trình như FSM miner, Fuzzy miner, region miner, Social network miner, decision miner,… Với mỗi thuật toán, phần mềm sẽ yêu cầu người dùng nhập một số thông số (nếu có) tùy thuộc vào thuật toán. Ví dụ đối với thuật toán Heuristic Miner, người dùng cần xác định các ngưỡng phụ thuộc, ngưỡng tốt nhất. Với thuật toán GM, người dùng có thể tùy chỉnh các thông số về số lượng cá thể, số lượng thế hệ hoặc độ phù hợp mong muốn,… Đối với các thuật toán khác, người dùng cần nghiên cứu trước để nắm được thuật toán cũng như yêu cầu đầu vào và dữ liệu đầu ra để có thể sử dụng phần mềm một cách hiệu quả nhất.
Ví dụ, khi thêm dữ liệu đầu vào là bản ghi sự kiện, tùy chọn ta sử dụng là phát hiện quy trình bằng thuật toán khai phá quy trình di truyền. Khi chọn tùy chọn sử dụng thuật toán khai phá quy trình di truyền (Genetic agorithm flugin), chương trình sẽ hiển thị giao diện tùy chỉnh thông số như hình 3.3
Hình 3.3: Giao diện tùy chỉnh thông số cho thuật toán GA
Ví dụ tùy chỉnh số lượng cá thể bằng 100, số lượng thế hệ bằng 2, sau khi ta nhấn nút bắt đầu khai phá, thuật toán sẽ chạy và đưa ra kết quả như hình 3.4
Hình 3.4: Giao diện kết quả của thuật toán GA
Giao diện trực quan trên ProM phiên bản 5.2 cho phép người dùng sắp xếp, quan sát và làm việc tương đối hiệu quả. Thanh chuyển hướng nằm bên phải cho phép người dùng nắm được các đối tượng đang làm việc và thao tác trực tiếp với các đối tượng đó một cách nhanh chóng như hình 3.5.
Hình 3.5: Giao diện làm việc trên ProM 5.2
b. ProM phiên bản 6.5 được phát triển mới hơn ProM 5.2. Phiên bản này hỗ trợ rất nhiều plugin và cho phép người dùng tự cài đặt từng plugin thông qua chức năng quản lý gói plugin (ProM package manager, hình 3.6). Ở phiên bản này, sau khi cài đặt thì người dùng chưa có plugin nào cả. Trong lần khởi chạy đầu tiên, phần mềm sẽ cài đặt một gói plugin cơ bản là RunnerUpPackages. Gói plugin này chứa một số plugin cơ bản như các plugin liên quan đến mạng Petri, hệ thống chuyển tiếp, các plugin liên quan đến các thuật toán phát hiện quy trình như thuật toán Alpha, Heuristic, … các plugin kiểm tra phù hợp, các plugin liên quan đến BPMN, các plugin xử lý bản ghi sự kiện,… Người dùng có thể sử dụng ProM 6.5 cho các mục đích cơ bản. Khi có yêu cầu mà các plugin hiện tại chưa đáp ứng được, người dùng có thể tìm kiếm ở mục plugin chưa được cài đặt hoặc tìm hiểu thêm ở các nguồn thông tin khác.
c. Phiên bản ProM Lite 1.2 là phiên bản mới nhất của hiện nay, giao diện sử dụng ProM Lite 1.2 có sự khác biệt lớn so với ProM 5.2 và ProM 6.5. Giao diện trong ProM Lite 1.2 được chia làm ba không gian: Không gian làm việc (Workspace), hoạt động (Action) và khung nhìn (View).
Phần Workspace (hình 3.7) cho phép người dùng thêm dữ liệu đầu vào thông qua nút Import. Ở đây cũng hiển thị các đối tượng khác như mô hình, kết quả kiểm tra phù hợp,… ta cũng có thể sử dụng các đối tượng này như là dữ liệu đầu vào.
Hình 3.7: Không gian làm việc (workspace) trên ProM Lite 1.2
Khi dữ liệu đầu vào đã được nạp, ta có thể chọn dữ liệu đó (phần hiển thị màu xanh) và thao tác với các dữ liệu đó thông qua các tùy chọn nằm ở khung bên phải nhƣ: xem dữ liệu (cho phép xem dữ liệu theo nhiều cách khác nhau: hiển thị dưới dạng danh sách, lượt đồ, lượt đồ động, …) và sử dụng nguồn (Use resouce – chọn tùy chọn này sẽ chuyển qua không gian hoạt động ).
Không gian hoạt động Action (hình 3.8) cho phép người sử dụng chọn hoạt động muốn làm. Có thể là phát hiện quy trình, kiểm tra phù hợp, cải thiện quy trình hoặc lọc bản ghi,… Người dùng có thể tìm kiếm tên hoạt động hoặc plugin thông qua ô tìm kiếm và các tùy chọn tìm kiếm bên cạnh ô tìm kiếm. Khi chọn được một hoạt động muốn thực hiện, bên trái sẽ xuất hiện các loại dữ liệu đầu vào cần thiết, người dùng chỉ cần bấm và chọn từ ô chọn. Đối với một số hoạt động, người dùng chỉ cần tùy chỉnh một số thông số đơn giản là có thể nhận được kết quả ngay
Hình 3.8: Không gian hoạt động (Action) trên ProM Lite 1.2
Ví dụ, tùy chỉnh thông số đầu vào cho thuật toán Heuristic mining trong hình 3.9. Bên cạnh đó cũng có một số hoạt động phức tạp hơn, cần những tùy chỉnh phức tạp hơn. Muốn sử dụng hiệu quả các hoạt động phức tạp này cần có sự nghiên cứu kỹ lưỡng về hoạt động đó
Hình 3.9: Tùy chỉnh thông số đầu vào cho thuật toán Heuristic Miner.
Không gian hoạt động còn có nút các hoạt động (activity) cho phép người dùng xem các hoạt động đang diễn ra và tiến trình của các chúng .
động đã được thực hiện. Kết quả hoạt động có thể được phóng to đầy màn hình để xem chi tiết hoặc thu nhỏ để xem tổng quan các kết quả đã có.
Hình 3.10: Không gian khung nhìn (view) của ProM Lite 1.2
So Sánh, đánh giá các phiên bản của công cụ ProM
ProM đã trở thành chuẩn (không chính thức) cho khai phá quy trình. Tuy nhiên, số lượng lớn các plug-in và nhiều ứng dụng thực tế được tích hợp trong ProM 5.2 cũng cho thấy một số vấn đề. Chẳng hạn như, ProM 5.2 có thể khá khó hiểu đối với những người thiếu kinh nghiệm khi phải đối mặt với gần 300 plug-in khác nhau. Vì vậy, muốn sử dụng hiệu quả, người dùng cần có một số nghiên cứu cơ bản trước. Hơn nữa, trong ProM 5.2 (và các phiên bản trước đó) giao diện người dùng và kỹ thuật phân tích cơ bản là gắn liền chặt chẽ với nhau, tức là hầu hết các plug-in yêu cầu tương tác người dùng. Đặc biệt ProM 5.2 và các phiên bản trước đó, không thể chạy được từ xa cũng như không thể phân bổ việc thực hiện các plug-in trên nhiều máy tính.
ProM 6 có thể phân bổ việc thực hiện các plug-in trên nhiều máy tính. Điều này có thể được sử dụng để cải tiến hiệu năng (bằng cách sử dụng tính toán lưới) và đưa ProM trở thành như là một dịch vụ. Giao diện người sử dụng được thực hiện lại để có thể đương đầu với nhiều plug-in, bản ghi và các mô hình cùng một lúc. Song các thao tác sử dụng trên ProM 6 tương đối phức tạp hơn so với ProM 5, yêu cầu người dùng có những hiểu biết rõ về kỹ thuật cũng như thao tác trên ProM 6. Nhìn chung, cả ProM 5 và ProM 6 đều hỗ trợ đắc lực cho các nhu cầu khai phá quy trình. Tuy nhiên, có thể nói ProM 5 tương đối thích hợp cho nghiên cứu và sử dụng cơ bản hơn là ProM 6, và ngược lại, ProM 6 tương đối thích hợp cho khai phá chuyên nghiệp hơn là ProM 5.