1. Trang chủ
  2. » Thể loại khác

CÁC ĐỘ ĐO TRONG PHÂN CỤM VÀ ÁP DỤNG VÀO PHÁT HIỆN MÔ HÌNH TỔ CHỨC TRONG KHAI PHÁ QUÁ TRÌNH KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin

50 24 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Huy Thành CÁC ĐỘ ĐO TRONG PHÂN CỤM VÀ ÁP DỤNG VÀO PHÁT HIỆN MƠ HÌNH TỔ CHỨC TRONG KHAI PHÁ Q TRÌNH KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ thơng tin Hà Nội - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Huy Thành CÁC ĐỘ ĐO TRONG PHÂN CỤM VÀ ÁP DỤNG VÀO PHÁT HIỆN MÔ HÌNH TỔ CHỨC TRONG KHAI PHÁ Q TRÌNH KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ thông tin Cán hƣớng dẫn: PGS TS Hà Quang Thụy Cán đồng hƣớng dẫn: ThS Lê Hoàng Quỳnh Hà Nội - 2014 VIETNAM NATIONAL UNIVERSITY, HANOI UNIVERSITY OF ENGINEERING AND TECHNOLOGY Huy Thanh Pham EVALUATION MEASURES FOR CLUSTERING AND USING TO DISCOVER ORGANIZATIONAL MODEL IN PROCESS MINING Major: InformationTechnology Supervisor: Assoc Prof Quang Thuy Ha Co-Supervisor: Master Hoang Quynh Le HA NOI - 2014 LỜI CẢM ƠN Trước tiên, tơi xin bày tỏ lịng biết ơn chân thành sâu sắc tới Thầy giáo PGS TS Hà Quang Thụy ThS Lê Hoàng Quỳnh, người tận tình bảo, hướng dẫn, động viên giúp đỡ tơi suốt q trình thực đề tài khóa luận Tơi xin gửi lời cảm ơn sâu sắc tới thầy cô Khoa Công nghệ thông tin truyền đạt kiến thức quý báu cho suốt bốn năm vừa qua, kiến thức nhận giảng đường hành trang quan trọng giúp vững bước tương lai Tôi xin gửi lời cảm ơn tới thầy cô, anh chị, bạn em sinh viên phòng thí nghiệm KT-Sis lab giúp tơi nhiều việc hỗ trợ kiến thức chun mơn để hồn thành tốt nghiệp khóa luận Tơi gửi lời cảm ơn tới tập thể lớp K55CD K55CLC ủng hộ, khích lệ sát cánh bên suốt trình học tập rèn luyện trường Cuối cùng,tơi muốn gửi lời cảm ơn sâu sắc tới bạn bè, người thân đặc biệt cha mẹ em gái tôi, người ủng hộ đường lựa chọn, giúp đỡ động viên vượt qua khó khăn sống Tơi xin chân thành cảm ơn! Hà Nội, ngày 13 tháng 05 năm 2014 Sinh viên Phạm Huy Thành TÓM TẮT Theo W.M.P Van der Aalst, 2011 [10], khai phá trình năm gần lên lĩnh vực khoa học tập trung vào việc phân tích trình việc sử dụng liệu kiện Lĩnh vực thu hút quan tâm từ nhiều nhà khoa học giới Tuy nhiên hầu hết tiếp cận quan tâm tập trung vào việc phát khía cạnh luồng điều khiển mà bỏ qua số khía cạnh quan trọng khác bật khía cạnh tổ chức [9] Một toán quan trọng khai phá khía cạnh tổ chức tốn phát mơ hình tổ chức Dựa q trình tìm hiểu số nghiên cứu việc phát mơ hình tổ chức [4, 9, 10, 12], kết hợp với việc tìm hiểu số thuật tốn phân cụm quan trọng phương pháp đánh giá phân cụm [1, 2, 5, 6, 7, 8], khóa luận trình bày độ đo phân cụm việc áp dụng chúng vào tốn phát mơ hình tổ chức khai phá q trình Đồng thời, khóa luận đưa mơ hình giải tốn với số độ đo phân cụm đề cập tiến hành cài đặt thực nghiệm liệu mẫu từ ProM Kết thực nghiệm cho thấy mơ hình tổ chức ứng với giá trị K = phù hợp Khi giá trị độ đo Silhouette, Dunn, Modularity CPLw đạt giá trị tương ứng 0.84327, 1.90155, 0.01075 0.04619 Từ khóa: Khai phá q trình, phát mơ hình tổ chức, độ đo chất lượng phân cụm ABSTRACT According to W.M.P Van der Aalst, 2011 [10], process ming, recently, emerged as a new research field that focuses on the analysis of processes using event data This field are attracting attention of many scentists around the world How ever, most of these approach only focused on discovering event-control aspect and neglected some other important aspects, especially organizational aspect [9] One of important problem in organiztional aspect mining is discovering organizational model Based on learning some researches of discovering organizational structure [4, 9, 10, 12], associating knowledge about some important clustering algorithms and some clustering evaluation measures [1, 2, 5, 6, 7, 8], this thesis presents some clustering evaluation measures and using them to discover organiztional model in process mining Also, this thesis proposes solving problem model for some of mentioned measures and implements experience on sample data collection from ProM Experience result shows the organizational model which has value K = is the best In that case, the Silhouette, Dunn, Modularity and CPLw values are 0.84327, 1.90155, 0.01075 and 0.04619 respectively Key words: Process ming, organiztional model discovering, clustering evaluation measures LỜI CAM ĐOAN Tơi xin cam đoan mơ hình giải tốn phát mơ hình tổ chức áp dụng độ đo phân cụm, thực nghiệm áp dụng thuật toán K-medoids dựa độ đo phân cụm trình bày khóa luận thực dự hướng dẫn PGS TS Hà Quang Thụy ThS Lê Hoàng Quỳnh Tất báo, khóa luận, tài liệu, cơng cụ, phần mềm tác giả khác sử dụng khóa luận dẫn tường minh tác giả có danh sách tài liệu tham khảo Hà Nội, ngày 13 tháng 05 năm 2014 Sinh viên Phạm Huy Thành MỤC LỤC Chương BÀI TỐN PHÁT HIỆN MƠ HÌNH TỔ CHỨC TRONG KHAI PHÁ QUÁ TRÌNH 1.1 Giới thiệu chung khai phá trình 1.2 Nhật ký kiện 1.3 Các toán khai phá trình 1.4 Bài tốn phát mơ hình tổ chức 1.5 Tóm tắt chương Chương SỬ DỤNG CÁC ĐỘ ĐO ĐỂ ĐÁNH GIÁ CHẤT LƯỢNG PHÂN CỤM TRONG BÀI TỐN PHÁT HIỆN MƠ HÌNH TỔ CHỨC 2.1 Cấu trúc cộng đồng mạng lưới tổ chức 2.1.1 Khái niệm cấu trúc cộng đồng 2.1.2 Các độ đo khoảng cách mạng xã hội 10 2.1.3 Các cách tính khoảng cách tổ chức 10 2.2 Các thuật toán phân cụm phát mơ hình tổ chức 12 2.2.1 Thuật toán AHC 12 2.2.2 Thuật toán K-means 13 2.2.3 Thuật toán K-medoids (PAM) 14 2.3 Các độ đo chất lượng phân cụm 14 2.3.1 Độ đo bóng (Silhouette) 15 2.3.2 Độ đo Davies – Bouldin 16 2.3.3 Độ đo Dunn 16 2.3.4 Độ đo Modularity 17 2.3.5 Độ đo theo độ dài đường CPL ( Cluster Path Lengths) 17 2.4 Tóm tắt chương 22 Chương MƠ HÌNH GIẢI QUYẾT BÀI TỐN 23 3.1 Phát biểu tốn phát mơ hình mạng tổ chức từ nhật ký kiện 23 3.2 Mơ hình giải tốn 24 3.3 Phân tích mơ hình 24 3.3.1 Thu thập nhật ký kiện 24 3.3.2 Sử dụng thuật tốn K-medoids phát mơ hình tổ chức 26 3.4 Tóm tắt chương 27 Chương THỰC NGHIỆM VÀ ĐÁNH GIÁ 28 4.1 Mô tả thực nghiệm 28 4.1.1 Mô tả liệu 28 4.1.2 Các công cụ phần mềm sử dụng 29 4.1.3 Môi trường thực nghiệm ( Phần cứng hệ điều hành ) 30 4.1.4 Các module chương trình 30 4.2 Kết thực nghiệm đánh giá 31 4.2.1 Kết thực nghiệm 31 4.2.2 Đánh giá kết thực nghiệm 36 KẾT LUẬN VÀ ĐỊNH HƯỚNG NGHIÊN CỨU TIẾP THEO 38 DANH SÁCH HÌNH VẼ Hình 1 Ngữ cảnh khai phá trình Hình Ba tốn khai phá q trình dạng input output bao gồm: Phát trình (a), Kiểm tra phù hợp (b) Tăng cường mơ hình (c) Hình Một nhật ký kiện mơ hình q trình xây dựng từ dạng lưới Petri Hình Cấu trúc cộng đồng mạng xã hội Hình 2 Cách tính khoảng cách hai cụm theo single linkage 11 Hình Cách tính khoảng cách hai cụm theo complete linkage 11 Hình Cách tính khoảng cách hai cụm theo average linkage 12 Hình Ví dụ cụm A, B, C với số lượng cách liên kết bên khác 19 Hình Bài tốn phát mơ hình tổ chức dạng input output 23 Hình Mơ hình giải tốn phát mơ hình tổ chức sử dụng độ đo phân cụm 24 Hình 3 Meta-model chuẩn XES 25 Hình Một phần trích từ nhật ký kiện thực nghiệm 29 Hình Mơ hình mạng xã hội mơ tả quan hệ cá nhân 33 Hình Hình mơ tả module chương trình 31 Hình 4 Biểu đồ giá trị Silhouette 36 Hình Biểu đồ giá trị Dunn 36 Hình Biểu đồ giá trị Modularity 36 Hình Biểu đồ giá trị CPLw 36 Hình Kết mơ hình tổ chức ứng với K = 37 ...ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Huy Thành CÁC ĐỘ ĐO TRONG PHÂN CỤM VÀ ÁP DỤNG VÀO PHÁT HIỆN MƠ HÌNH TỔ CHỨC TRONG KHAI PHÁ Q TRÌNH KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH... đầu vào cho tốn khai phá q trình, bao gồm tốn phát mơ hình tổ chức Trong chương tiếp theo, khóa luận trình bày chi tiết độ đo phân cụm sử dụng chúng vào tốn phát mơ hình tổ chức Chƣơng SỬ DỤNG CÁC... tốn phân cụm quan trọng phương pháp đánh giá phân cụm [1, 2, 5, 6, 7, 8], khóa luận trình bày độ đo phân cụm việc áp dụng chúng vào tốn phát mơ hình tổ chức khai phá q trình Đồng thời, khóa luận

Ngày đăng: 06/01/2021, 07:10

Xem thêm: