CHƯƠNG 2 MỘT SỐ THUẬT TỐN KHAI PHÁ QUY TRÌNH
2.4. Kết luận chương 2
Trong chương này, luận văn đã giới thiệu chi tiết ba thuật toán thường được sử dụng trong khai phá quy trình nghiệp vụ. Trong đó thuật tốn Alpha có thể xem là thuật tốn khái phá quy trình đầu tiên và đơn giản nhất, do không quan tâm đến tần suất xuất hiện của các vết sự kiện nên nó chỉ có thể khai phá thành cơng các mơ hình gắn với mạng cấu trúc luồng cơng việc (SWF-net) có các phép tách nhập đơn giản mà không thể xử lý được các cấu trúc phức tạp như cấu trúc vòng lặp ngắn, cấu trúc phụ tḥc khoảng cách xa...Thuật tốn HM được xây dựng dựa trên ý tưởng của thuật toán Alpha nhưng có sử dụng tần suất xuất hiện của mợt vết sự kiện để xác định khả năng xảy ra của một “phụ thuộc quan hệ” giữa các hoạt động hay sự tồn tại của các vòng lặp và các cấu trúc khác. Chính vì vậy thuật tốn này có khả năng đối phó tốt hơn với các sự kiện lỗi, sự kiện ít xảy ra trong bản ghi sự kiện, v.v.
Tuy nhiên, thuật tốn khai phá quy trình Alpha và Heuristic là các thuật toán khai phá quy trình dựa trên hướng tiếp cận “cục bợ”, tức là xây dựng mơ hình từ mối quan hệ cục bợ giữa các hoạt đợng khác nhau. Vì vậy, các thuật tốn này không thể lấy được sự phụ tḥc trong các quy trình có cấu trúc phức tạp. Khác với hai thuật tốn đã được trình bày trước đó, thuật tốn GPM dựa trên hướng tiếp cận “tồn cục”, nó cố gắng xây dựng mơ hình quy trình theo ngun tắc của “phép tính tốn tiến hóa”, tức là cố gắng sửa đổi các mơ hình quy trình mợt cách lặp đi lặp lại để đạt đến đợ “hồn hảo” nhất có thể. Chính vì vậy GPM có khả năng đối phó được với các cấu trúc phụ tḥc khoảng cách xa và các quy trình có cấu trúc phức tạp. Tuy nhiên, cũng giống như các phương pháp tiếp cận dựa trên thuyết tiến hóa, khai phá quy trình di truyền cần đến chi phí nguồn tài ngun lớn trong q trình tính tốn. Do đó, khơng hiệu quả đối với các mơ hình và bản ghi sự kiện lớn. Tất cả các thuật tốn này đều được tích hợp trong cơng cụ khai phá quy trình ProM. Trong chương tiếp theo luận văn sẽ sử dụng công cụ này.
CHƯƠNG 3
ỨNG DỤNG KHAI PHÁ QUY TRÌNH THU THẬP CẬP NHẬT HỆ THỐNG MINH CHỨNG KIỂM ĐỊNH CHẤT LƯỢNG GIÁO DỤC TẠI
TRƯỜNG ĐẠI HỌC PHẠM VĂN ĐỒNG
Chương này của luận văn sẽ giới thiệu một cách tổng quan về cơng cụ khai phá quy trình ProM. Trên cơ sở đó, ứng dụng để khai phá quy trình quy trình cập nhật hệ thống minh chứng tại Trường Đại học Phạm Văn Đồng. Kết quả khai phá sẽ góp phần mơ tả và đánh giá cụ thể hơn ưu nhược điểm của các thuật toán đã trình bày trong chương hai.
3.1. Bài toán khai phá quy trình thu thập cập nhật hệ thống minh chứng Kiểm định chất lượng giáo dục tại trường Đại học Phạm Văn Đồng
Một trong những khó khăn lớn nhất của Kiểm định chất lượng giáo dục tại trường ĐH Phạm Văn Đồng là việc thu thập, sử dụng, quản lý minh chứng phục vụ công tác tự đánh giá. Nguyên nhân là do công tác lưu trữ chưa tốt, đặc biệt nhiều số liệu chưa được thống kê hợp lý, kết quả thu thập và xử lý minh chứng cịn mang tính liệt kê, tập hợp, sắp xếp chưa logic, không phản ánh rõ sự thay đổi của nhà trường và xu hướng phát triển trong thời gian tương lai. Quy trình thu thập cập nhật hệ thống minh chứng là quy trình được sử dụng trong tài liệu để minh họa các kỹ thuật khai phá quy trình.
Bắt đầu quy trình là Phịng Khảo thí - Đảm bảo chất lượng giáo dục (cụ thể là bộ phận kiểm định chuyên trách, chịu trách nhiệm thu thập, cập nhật văn bản/ hồ sơ minh chứng) xác định yêu cầu minh chứng, sau đó gửi cơng văn hướng dẫn thu thập minh chứng đến các đơn vị liên quan trong nhà trường. Phòng KT – ĐBCLGD thu thập minh chứng của các đơn vị cung cấp với nội dung phù hợp đúng theo u cầu. Phịng
KT – ĐBCLGD (bợ phận kiểm định) đọc kiểm tra minh chứng xác định mức độ tin
cậy, xác định các đoạn phù hợp để trích dẫn tiêu đề cho danh mục minh chứng, nếu văn bản xác định khơng đạt u cầu thì sẽ quyết định từ chối nhận và yêu cầu đơn vị
nộp lại; ngược lại nếu đã xác định đạt u cầu thì bước tiếp sẽ là hoạt đợng thẩm định minh chứng là nghiên cứu, xem xét văn bản có hệ thống các tài liệu dưới dạng văn bản viết: các quy định, kế hoạch, biên bản, báo cáo, hồ sơ, sổ sách, giáo trình, đề cương mơn học…, sắp xếp loại văn bản có các câu/phần/nội dung đáp ứng các yêu cầu nêu trong nợi hàm của từng tiêu chí, tiêu chuẩn và thực hiện cập nhật hệ thống minh chứng Kiểm định. Kết quả của hoạt đợng ra quyết định có thể bắt đầu lại yêu cầu
(văn bản nào chưa phù hợp nội dung, hết thời gian hiệu lực…), tức là thực hiện lại các
hoạt động kiểm tra, hoặc ra quyết định cập nhật văn bản vào hệ thống minh chứng kiểm định hay từ chối yêu cầu; quy trình kết thúc sau khi thực hiện quyết định cập
dụng quy trình này cũng như các bản ghi sự kiện liên quan đến mơ hình để mơ tả cụ thể hơn bản ghi sự kiện cũng như sử dụng các bản ghi này để mô tả và đánh giá các thuật tốn khai phá quy trình.
3.1.1. Đầu vào của bài tốn
Quy trình thu thập cập nhật hệ thống minh chứng mà luận văn đang xem xét khơng có mơ hình tiên nghiệm. Ta chỉ có bản ghi sự kiện của quy trình này. Như đã trình bày ở trên, bản ghi sự kiện của quy trình này gồm các hoạt đợng sau (bên cạnh các hoạt động ta sử dụng các chữ cái để ánh xạ đến các hoạt động này):
- Xác định yêu cầu minh chứng (Determine the requirement = A),
- Thu thập minh chứng (Collect = B),
- Kiểm tra minh chứng (Check = C),
- Thẩm định minh chứng (Expertise = D),
- Quyết định (decide = E),
- Bắt đầu lại yêu cầu (reinitiate request = F),
- Cập nhật hệ thống minh chứng (Update the system = G),
- Từ chối yêu cầu (reject request = H).
Bản ghi sự kiện được sử dụng là bảng ghi VFull được mô tả tại [1.1, tr. 10]. Bản ghi này chứa thông tin về mã trường hợp, mã sự kiện, tên hoạt đợng, nguồn lực, khơng có thơng tin về mốc thời gian và chi phí thực hiện. Ví dụ ở bảng 3.1 là một sự kiện trong trường hợp có mã là 8 số.
Bảng 3.1: Ví dụ chi tiết bảng ghi sự kiện VFull
Mã trường hợp Mã sự kiện Thuộc tính
Hoạt động Nguồn lực 1 19847301 Xác định yêu cầu MC Phòng KT-ĐBCLGD 1 19847302 Thu thập MC Phòng KT-ĐBCLGD 1 19847303 Kiểm tra MC Phòng KT-ĐBCLGD 1 19847304 Thẩm định MC Phòng KT-ĐBCLGD 1 19847305 Quyết định Phòng KT-ĐBCLGD 1 19847306 Cập nhật hệ thống MC Phòng KT-ĐBCLGD 2 19847321 Xác định yêu cầu MC Phòng KT-ĐBCLGD 2 19847322 Thu thập MC Phòng KT-ĐBCLGD 2 19847323 Kiểm tra MC Phòng KT-ĐBCLGD 2 19847324 Thẩm định MC Phòng KT-ĐBCLGD
Mã trường hợp Mã sự kiện Thuộc tính
Hoạt động Nguồn lực
2 19847325 Quyết định Phòng KT-ĐBCLGD
2 19847326 Bắt đầu lại yêu cầu Phòng KT-ĐBCLGD 2 19847327 Cập nhật hệ thống MC Phòng KT-ĐBCLGD 3 19847491 Xác định yêu cầu MC Phòng KT-ĐBCLGD 3 19847492 Thu thập MC Phòng KT-ĐBCLGD 3 19847493 Kiểm tra MC Phòng KT-ĐBCLGD 3 19847494 Thẩm định MC Phòng KT-ĐBCLGD 3 19847495 Ra quyết định Phòng KT-ĐBCLGD 3 19847496 Từ chối yêu cầu Phòng KT-ĐBCLGD 4 19848251 Xác định yêu cầu MC Phòng KT-ĐBCLGD
4 19848252 Thu thập MC Phòng KT-ĐBCLGD
4 19848253 Kiểm tra MC Phòng KT-ĐBCLGD
4 19848254 Quyết định Phòng KT-ĐBCLGD
4 19848255 Bắt đầu lại yêu cầu Phòng KT-ĐBCLGD 4 19848256 Cập nhật hệ thống MC Phòng KT-ĐBCLGD 5 19846941 Xác định yêu cầu MC Phòng KT-ĐBCLGD
5 19846942 Thu thập MC Phòng KT-ĐBCLGD
5 19846943 Kiểm tra MC Phòng KT-ĐBCLGD
5 19846944 Quyết định Phòng KT-ĐBCLGD
5 19846945 Từ chối yêu cầu Phòng KT-ĐBCLGD 6 19848831 Xác định yêu cầu MC Phòng KT-ĐBCLGD
6 19848832 Thu thập MC Phòng KT-ĐBCLGD
6 19848833 Quyết định Phòng KT-ĐBCLGD
6 19848834 Bắt đầu lại yêu cầu Phòng KT-ĐBCLGD 7 19848861 Xác định yêu cầu MC Phòng KT-ĐBCLGD
7 19848862 Thu thập MC Phòng KT-ĐBCLGD
7 19848863 Quyết định Phòng KT-ĐBCLGD
7 19848864 Từ chối yêu cầu Phòng KT-ĐBCLGD
Bản ghi được sử dụng có 1932 trường hợp phân phối trên 8 vết khác nhau.
Ví dụ, có 336 trường hợp theo vết σ1= (A, B, C, D, E, F, H, G), 252 trường hợp theo vết σ2 = (A, B, C, D, E, G), 168 trường hợp theo vết σ 8 = (A, B, E, H), cụ thể là:
Bảng 3.2: Bản ghi sự kiện Vfull Tần số Trường hợp Vết sự kiện 336 σ1 (A, B, C, D, E, F, H, G) 252 σ2 (A, B, C, D, E, G) 294 σ3 (A, B, C, D, E, F, G) 252 σ4 (A, B, C, D, E, H) 252 σ 5 (A, B, C, E, F, G) 210 σ 6 (A, B, C, E, H) 168 σ 7 (A, B, E, F) 168 σ 8 (A, B, E, H)
3.1.2. Đầu ra của bài tốn
Mục đích khai phá quy trình thu thập cập nhật hệ thống minh chứng KĐCLGD tại trường ĐH Phạm Văn Đồng là tìm ra được mơ hình của thu thập cập nhật hệ thống minh chứng KĐCLGD. Đầu ra là mợt mơ hình Petri net hoặc WF Net có đợ phù hợp cao nhất có thể.
3.1.3. Hướng giải quyết bài toán
Ta sử dụng các thuật tốn đã giới thiệu ở chương hai để tìm ra các mơ hình quy trình phù hợp nhất. Để khai phá hiệu quả, ta sử dụng bộ công cụ ProM để tiến hành khai phá. Bộ công cụ ProM cung cấp nhiều cơng cụ, thuật tốn để xử lý bản ghi, phát hiện quy trình, kiểm tra phù hợp cũng như cải thiện quy trình.
3.2. Cơng cụ khai phá quy trình ProM
3.2.1. Giới thiệu chung về cơng cụ khai phá quy trình ProM
Bợ công cụ ProM là một môi trường “plug-able” cho khai phá quy trình sử dụng MXML (nay được phát triển thành XES) như là một định dạng đầu vào. Mục đích của phiên bản đầu tiên là cung cấp một sự phổ biến cơ bản cho tất cả các kỹ thuật khai phá quy trình. Với cách này, nhiều người đã phát triển các thuật tốn khai phá quy trình mà khơng lo lắng gì về việc trích xuất dữ liệu, chuyển đổi dữ liệu và tải dữ liệu trong bản ghi sự kiện. Hơn thế nữa, đối với các loại mơ hình chuẩn như là mạng Petri, EPCS và mạng xã hội hiển thị mặc định được cung cấp bởi framework [7], [11]. Hình 3.1 cho chúng ta thấy tổng quan về khung ứng dụng ProM.
Giao diện người dùng
+
Tương tác người dùng
Hình 3.1: Tổng quan về khung ứng dụng ProM
Năm 2004, phiên bản đầy đủ đầu tiên của ProM (ProM 1.1) được đưa ra. Phiên bản này chứa 29 plug-in (6 plug-in khai phá, 7 plug-in phân tích, 4 plug-in nhập thơng tin vào, 9 plug-in xuất thông tin ra và 3 plug-in chuyển đổi). ProM 5.2 được đưa ra vào năm 2009, phiên bản này chứa 286 plug-in (47 plug-in khai phá, 96 plug-in phân tích, 22 plug-in nhập dữ liệu vào, 45 plug-in xuất dữ liệu ra, 44 plug-in chuyển đổi và 32 plug-in lọc dữ liệu). Theo thời gian nhiều plug-in hơn được thêm vào.
3.2.2. Các chức năng của công cụ khai phá quy trình ProM
Như đã trình bày ở trên, ProM cung cấp nhiều chức năng nhờ vào các flug-in như: Khai phá, phân tích, nhập dữ liệu, xuất dữ liệu, chuyển đổi và lọc dữ liệu.
a. ProM phiên bản 5.2 được tích hợp gần 300 flugin (47 plug-in khai phá, 96
plug-in phân tích, 22 plug-in nhập dữ liệu vào, 45 plug-in xuất dữ liệu ra, 44 plug-in chuyển đổi và 32 plug-in lọc dữ liệu) cho phép người dùng khai phá quy trình trên máy tính cục bợ và cho phép người dùng tương tác trực tiếp. Việc cài đặt phiên bản này
Staffware Flower SAP InConcert Bản ghi XML Mạng Heuristic Aris Graph Format PNML TPN file … Mạng Heuristic Aris Graph Format NetMiner file Lọc dữ liệu Plugin nhập Plugin xuất Plugin khai phá Plugin phân tích Plugin chuyển đổi Cơng cụ hình dung Khung kết quả PNML TPN file DOT ….
cũng khá đơn giản do tồn bợ flugin đã được tích hợp. ProM 5.2 hỗ trợ nhiều loại dữ liệu đầu vào, khi người dùng chọn dữ liệu đầu vào, phần mềm sẽ hiển thị các tùy chọn có thể thao tác với dữ liệu đầu vào đó. Ví dụ khi thêm dữ liệu đầu vào (bản ghi sự kiện chẳng hạn). Các tùy chọn khai phá, phân tích, chuyển đổi sẽ được hiển thị như hình 3.2.
Hình 3.2: Các tùy chọn đối với dữ liệu đầu vào là bản ghi sự kiện
ProM 5.2 hỗ trợ rất nhiều thuật toán khai phá quy trình như FSM miner, Fuzzy miner, region miner, Social network miner, decision miner,… Với mỗi thuật toán, phần mềm sẽ yêu cầu người dùng nhập mợt số thơng số (nếu có) tùy tḥc vào thuật tốn. Ví dụ đối với thuật toán Heuristic Miner, người dùng cần xác định các ngưỡng phụ thuộc, ngưỡng tốt nhất. Với thuật tốn GM, người dùng có thể tùy chỉnh các thông số về số lượng cá thể, số lượng thế hệ hoặc đợ phù hợp mong muốn,… Đối với các thuật tốn khác, người dùng cần nghiên cứu trước để nắm được thuật toán cũng như yêu cầu đầu vào và dữ liệu đầu ra để có thể sử dụng phần mềm mợt cách hiệu quả nhất.
Ví dụ, khi thêm dữ liệu đầu vào là bản ghi sự kiện, tùy chọn ta sử dụng là phát hiện quy trình bằng thuật tốn khai phá quy trình di truyền. Khi chọn tùy chọn sử dụng thuật toán khai phá quy trình di truyền (Genetic agorithm flugin), chương trình sẽ hiển thị giao diện tùy chỉnh thơng số như hình 3.3
Hình 3.3: Giao diện tùy chỉnh thơng số cho thuật tốn GA
Ví dụ tùy chỉnh số lượng cá thể bằng 100, số lượng thế hệ bằng 2, sau khi ta nhấn nút bắt đầu khai phá, thuật toán sẽ chạy và đưa ra kết quả như hình 3.4
Hình 3.4: Giao diện kết quả của thuật tốn GA
Giao diện trực quan trên ProM phiên bản 5.2 cho phép người dùng sắp xếp, quan sát và làm việc tương đối hiệu quả. Thanh chuyển hướng nằm bên phải cho phép người dùng nắm được các đối tượng đang làm việc và thao tác trực tiếp với các đối tượng đó mợt cách nhanh chóng như hình 3.5.
Hình 3.5: Giao diện làm việc trên ProM 5.2
b. ProM phiên bản 6.5 được phát triển mới hơn ProM 5.2. Phiên bản này hỗ trợ rất
nhiều plugin và cho phép người dùng tự cài đặt từng plugin thông qua chức năng quản lý gói plugin (ProM package manager, hình 3.6). Ở phiên bản này, sau khi cài đặt thì người dùng chưa có plugin nào cả. Trong lần khởi chạy đầu tiên, phần mềm sẽ cài đặt mợt gói plugin cơ bản là RunnerUpPackages. Gói plugin này chứa mợt số plugin cơ bản như các plugin liên quan đến mạng Petri, hệ thống chuyển tiếp, các plugin liên quan đến các thuật toán phát hiện quy trình như thuật toán Alpha, Heuristic, … các plugin kiểm tra phù hợp, các plugin liên quan đến BPMN, các plugin xử lý bản ghi sự kiện,… Người dùng có thể sử dụng ProM 6.5 cho các mục đích cơ bản. Khi có u cầu mà các plugin hiện tại chưa đáp ứng được, người dùng có thể tìm kiếm ở mục plugin chưa được cài đặt hoặc tìm hiểu thêm ở các nguồn thơng tin khác.
c. Phiên bản ProM Lite 1.2 là phiên bản mới nhất của hiện nay, giao diện sử dụng ProM Lite 1.2 có sự khác biệt lớn so với ProM 5.2 và ProM 6.5. Giao diện trong ProM Lite 1.2 được chia làm ba không gian: Không gian làm việc (Workspace), hoạt đợng (Action) và khung nhìn (View).
Phần Workspace (hình 3.7) cho phép người dùng thêm dữ liệu đầu vào thông qua nút Import. Ở đây cũng hiển thị các đối tượng khác như mơ hình, kết quả kiểm tra phù hợp,… ta cũng có thể sử dụng các đối tượng này như là dữ liệu đầu vào.
Hình 3.7: Khơng gian làm việc (workspace) trên ProM Lite 1.2
Khi dữ liệu đầu vào đã được nạp, ta có thể chọn dữ liệu đó (phần hiển thị màu