1. Trang chủ
  2. » Luận Văn - Báo Cáo

Thuật toán phát hiện quá trình nâng cao dựa trên khái niệm vùng trạng thái

12 279 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 2,45 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LƯU VĂN BA THUẬT TỐN PHÁT HIỆN Q TRÌNH NÂNG CAO DỰA TRÊN KHÁI NIỆM VÙNG TRẠNG THÁI LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Hà Nội – 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ LƯU VĂN BA THUẬT TỐN PHÁT HIỆN Q TRÌNH NÂNG CAO DỰA TRÊN KHÁI NIỆM VÙNG TRẠNG THÁI Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS HÀ QUANG THỤY Hà Nội – 2015 Lời cảm ơn Lời đầu tiên, tơi xin gửi lời cảm ơn lịng biết ơn sâu sắc tới PGS.TS Hà Quang Thụy tận tình hướng dẫn bảo tơi suốt trình nghiên cứu khoa học thực luận văn Tôi xin chân thành cảm ơn thầy, tận tình dạy bảo, hướng dẫn nghiên cứu tạo điều kiện thuận lợi cho suốt trình học tập nghiên cứu trường Tôi xin gửi lời cảm ơn đến anh chị, bạn phịng thí nghiệm cơng nghệ tri thức KT-Lab trường đại học Công Nghệ - Đại học quốc gia Hà Nội chia sẻ cho nhiều kiến thức chun mơn q trình tham gia sinh hoạt Luận văn thực khuôn khổ đề tài QG.15.22 “Phát triển kỹ thuât tiến tiến khai phá mẫu từ nhật ký kiện, xây dựng phần mềm khung ứng dụng thử nghiệm doanh nghiệp Việt Nam” Cuối cùng, xin gửi lời cám ơn vô hạn tới gia đình bạn bè, người ln bên cạnh, giúp đỡ động viên tơi q trình học tập suốt trình thực luận văn Tôi xin chân thành cảm ơn! Hà Nội, ngày 20 tháng 05 năm 2015 Học viên Lưu Văn Ba Lời cam đoan Tôi xin cam đoan nội dung trình bày luận văn tơi thực hướng dẫn PGS.TS Hà Quang Thụy Tất tài liệu tham khảo nghiên cứu liên quan có nguồn gốc rõ ràng danh mục tài liệu tham khảo luận văn Trong luận văn, khơng có việc chép tài liệu, cơng trình nghiên cứu người khác mà khơng rõ tài liệu tham khảo Hà Nội, ngày 20 tháng 05 năm 2015 Học viên Lưu Văn Ba MỤC LỤC Danh mục bảng Danh mục hình vẽ, đồ thị Mở đầu Chương GIỚI THIỆU VỀ KHAI PHÁ QUÁ TRÌNH 1.1 Tổng quan khai phá trình 1.1.1 Khai phá trình .6 1.1.2 Vị trí khai phá trình KHDL Big data 1.1.3 Mối liên hệ với khai phá liệu 1.2 Các toán khai phá trình 1.2.1 Phát trình 1.2.2 Kiểm tra độ phù hợp 1.2.3 Tăng cường mơ hình 1.3 Mơ hình hóa q trình 10 1.3.1 Nhật ký kiện (Event Logs) 10 1.3.2 Các loại mơ hình hóa trình 12 1.4 1.3.2.1 Lưới Petri (Petri Nets) 12 1.3.2.2 Hệ thống chuyển (Transition systems) .15 Tóm tắt chương 17 Chương PHÁT HIỆN QUÁ TRÌNH VÀ NHỮNG THÁCH THỨC 18 2.1 Bài tốn phát q trình .18 2.1.1 Phát biểu toán 18 2.1.2 Giới thiệu thuật toán Alpha .19 2.2 Chất lượng mơ hình kết .25 2.3 Các thách thức phát trình 26 2.4 Tóm tắt chương 27 Chương PHÁT HIỆN QUÁ TRÌNH DỰA TRÊN VÙNG TRẠNG THÁI 28 3.1 Giới thiệu phương pháp 28 3.2 Các bước thực 29 3.2.1 Tạo hệ thống chuyển từ nhật ký kiện 29 3.2.1.1 Biểu diễn trạng thái 29 3.2.1.2 Xây dựng hệ thống chuyển 32 3.2.2 3.3 Chuyển đổi từ hệ thống chuyển sang lưới Petri 34 3.2.2.1 Định nghĩa vùng 34 3.2.2.2 Lựa chọn vùng 36 3.2.2.3 Xây dựng lưới Petri sử dụng vùng 36 Nhận xét đánh giá 39 3.3.1 Ưu nhược điểm phương pháp 39 3.3.2 Giới thiệu số đề xuất mơ hình cải tiến .39 3.4 Tóm tắt chương 42 Chương THỰC NGHIỆM VÀ ĐÁNH GIÁ 44 4.1 Mô tả thực nghiệm 44 4.1.1 Công cụ: 44 4.1.2 Dữ liệu thực nghiệm: .44 4.1.3 Các bước thực hiện: 44 4.1.4 Tiến hành thực nghiệm: 44 4.2 Đánh giá kết luận 51 KẾT LUẬN VÀ ĐỊNH HƯỚNG NGHIÊN CỨU TIẾP 52 TÀI LIỆU THAM KHẢO 53 Danh mục bảng Bảng 1.1: Một phân đoạn nhật ký kiện cho yêu cầu bồi thường [1] 10 Bảng 2.1: Bảng ví dụ song kết nối cực đại không cực đại [2] 20 Bảng 3.1: Ví dụ cách biểu diễn trạng thái cho nhật ký kiện [1] .33 Bảng 3.2: Bảng ví dụ vùng vùng [2] .36 Danh mục hình vẽ, đồ thị Hình 1.1: Vị trí khai phá q trình khoa học liệu [2] Hình 1.2: Vai trị cầu nối khai phá trình [6] Hình 1.3: Các tốn khai phá q trình [2] Hình 1.4: Lưới Petri thành phần [1] 12 Hình 1.5: Ví dụ marking lưới Petri cho hệ thống đèn giao thơng [2] 13 Hình 1.6: Bước chuyển kích hoạt cháy [2] 14 Hình 1.7: Một hệ thống chuyển có trạng thái khởi đầu 15 trạng thái kết thúc[1] 15 Hình 2.1: Bài tốn phát q trình [1] .18 Hình 2.2: Ví dụ cặp tập song kết nối (A,B) [2] 20 Hình 2.3: Vị trí p(A,B) kết nối bước chuyển tập A B [2] 21 Hình 2.4: Kết thuật tốn α cho L5 [1] 22 Hình 2.5: Ví dụ hạn chế dư thừa thuật tốn α [2] 23 Hình 2.6: Ví dụ hạn chế chu trình thuật tốn α [2] .23 Hình 2.7: Ví dụ hạn chế chu trình thuật tốn α [2] .24 Hình 2.8: Ví dụ hạn chế phụ thuộc khơng địa phương thuật tốn α [2] 24 Hình 2.9: tiêu chí chất lượng cho mơ hình kết [1] .25 Hình 2.10: Ví dụ mơ hình khác cho nhật ký kiện [1] 26 Hình 3.1: Mơ hình phát trình dựa vùng trạng thái [2] 28 Hình 3.2: Ví dụ trạng thái vết [2] 29 Hình 3.3: Trạng thái vết thể qua thành phần past, future [2] 29 Hình 3.4: Các cách biểu diễn trạng thái vết theo mức độ trừu tượng [4] 31 Hình 3.5 : Vùng R tương ứng với vị trí pR [1] 34 Hình 3.6 : Chuyển đổi “hệ thống chuyển” thành “lưới Petri”[1] 37 Hình 3.7 Sử dụng Foldings phát trình dựa vùng [5] 40 Hình 3.8 : Tổng quan mơ hình phân chia kiểm tra độ phù hợp[6] 41 Hình 3.9 : Tổng quan mơ hình phân chia phát q trình [6] 42 Hình 4.1: Thơng tin nhật ký kiện L6 45 Hình 4.2: Mơ hình q trình L6 dựa thuật tốn Alpha 46 Hình 4.3: Hệ thống chuyển trạng thái L6 46 Hình 4.4: Mơ hình q trình L6 dựa vùng trạng thái 47 Hình 4.5: Thông tin nhật ký kiện L9 48 Hình 4.6: Mơ hình q trình L9 dựa thuật tốn Alpha 48 Hình 4.7: Hệ thống chuyển trạng thái L9 49 Hình 4.8: Mơ hình q trình L9 dựa vùng trạng thái 49 Hình 4.9: Thơng tin nhật ký kiện Hospital log 50 Mở đầu Ngày với việc phát triển khoa học công nghệ, đặc biệt lĩnh vực công nghệ thông tin liệu sinh từ hệ thống thông tin, thiết bị công nghệ, máy móc, Internet,…ngày bùng nổ số lượng tốc độ thay đổi, tính đa dạng từ nguồn khác dẫn đến thách thức không nhỏ ngành khoa học liệu Các kỹ thuật khai phá liệu (data mining) đã, đóng vai trị vơ quan trọng việc trích xuất tri thức từ liệu có từ tạo lợi canh tranh lớn kinh doanh Tuy nhiên kỹ thuật tập trung chủ yếu vào đặc tính liệu mà bỏ qua yếu tố vô quan trọng trình thay đổi liệu diễn nào? Để làm rõ vai trò quan trọng yếu tố trình (process) xem xét ví dụ điển hình hệ thống thông tin tổ chức kinh doanh nghiệp vụ Các hệ thống thông tin thường hỗ trợ khả ghi chép, tức lưu lại thực trình hoạt động tổ chức Loại liệu kiện ngày nhiều có mặt khắp nơi Trong đó, tổ chức, doanh nghiệp lên kế hoạch hoạt động mơ hình q trình xây dựng thủ công với nhiều hạn chế, hay xác định vấn đề trình hoạt động qua nhận định nắm bắt chủ quan, nhiều sai lệch thực tế Thông tin liệu kiện chi tiết, chân thực khách quan tổ chức cố gắng quan sát nắm bắt Nếu tổ chức tận dụng thông tin điều hỗ trợ nhiều cho trình kinh doanh Từ yếu tố trên, khai phá trình đời trở thành đề tài nóng nhiều nhà khoa học quan tâm nghiên cứu Phát trình ba tốn khai phá q trình với mục tiêu xây dựng mơ hình từ nhật ký kiện mà khơng sử dụng mơ hình hay thơng tin tiền nghiệm khác Có nhiều thuật tốn, phương pháp phát q trình khác Ví dụ: thuật tốn α, α+, α++, khai phá kinh nghiệm, khai phá di truyền, khai phá dựa vùng… Mỗi loại có điểm mạnh điểm yếu riêng Luận văn tập trung giới thiệu phương pháp phát trình nâng cao dựa vùng trạng thái Nâng cao hiểu với ý nghĩa thuật tốn đời sau, có nhiều ưu điểm thuật toán kinh điển ban đầu thuật toán α 53 TÀI LIỆU THAM KHẢO [1] W.M.P van der Aalst Process Mining: Discovery, Conformance and Enhancement of Business Processes Springer, 2011 [2] W.M.P van der Aalst Process Mining: Data science in Action course at https://class.coursera.org/procmin-002/lecture, 2015 [3] W.M.P van der Aalst, V Rubin, B.F van Dongen, E Kindler, C.W Günther “A Two-Step Approach using Transition Systems and Regions”, BPM Center Report BPM-06-30, 2006 [4] W.M.P van der Aalst, V Rubin, H.M.W Verbeek, B.F van Dongen, E Kindler, and C.W Günther “Process Mining: A Two-Step Approach to Balance Between Underfitting and Overfitting”, Software and Systems Modeling (SoSyM), Vol 9(1), pp 87-111, 2010 [5] Marc Solé, Josep Carmona Region-Based Foldings in Process Discovery, IEEE Trans Knowl Data Eng 25(1), pp 192-205, 2013 [6] W.M.P van der Aalst A General Divide and Conquer Approach for Process Mining In M Ganzha, L Maciaszek, and M Paprzycki, editors, Federated Conference on Computer Science and Information Systems (FedCSIS 2013), pp 1-10 IEEE Computer Society, 2013 [7] W.M.P van der Aalst “Decomposing Petri Nets for Process Mining: A Generic Approach” Distributed and Parallel Databases, 31(4): 471-507, 2013 [8] W.M.P van der Aalst “Decomposing Process Mining Problems Using Passages,” in Applications and Theory of Petri Nets 2012, ser Lecture Notes in Computer Science, S Haddad and L Pomello, Eds., vol 7347 Springer-Verlag, Berlin, pp 72–91, 2012 [9] J Munoz-Gama, J Carmona, and W.M.P van der Aalst, “Conformance Checking in the Large: Partitioning and Topology,” in International Conference on Business Process Management (BPM 2013), ser Lecture Notes in Computer Science, F Daniel, J Wang, and B Weber, Eds., vol 8094 Springer-Verlag, Berlin, pp 130–145, 2013 54 [10] Jorge Munoz-Gama, Josep Carmona, W.M P van der Aalst “Hierarchical Conformance Checking of Process Models Based on Event Logs,” in Applications and Theory of Petri Nets 2013, ser Lecture Notes in Computer Science, J Colom and J Desel, Eds., vol 7927 Springer-Verlag, Berlin, pp 291–310, 2013 [11] H Verbeek and W.M.P van der Aalst, “Decomposing Replay Problems: A Case Study,” BPM Center Report BPM-13-09, BPMcenter.org, 2013 [12] W.M.P van der Aalst, A Weijters, and L Maruster Workow mining: Discovering process models from event logs IEEE Transactions on Knowledge and Data Engineering, 16(9):1128–1142, 2004

Ngày đăng: 27/08/2016, 08:58

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN