1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn) khai phá đồ thị con phổ biến và ứng dụng

75 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

lu an i va n t to ng ĐẠI HỌC THÁI NGUYÊN hi ep TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG - w nl oa d lu an va ul nf oi lm HOÀNG VIỆT DŨNG nh at z z gm @ om l.c KHAI PHÁ ĐỒ THỊ CON PHỔ BIẾN VÀ ỨNG DỤNG an Lu n va ac th si Thái Nguyên, 2018 lu an ii va n t to ng LỜI CAM ĐOAN hi ep Tôi xin cam đoan số liệu kết nghiên cứu luận văn trung thực chưa sử dụng để bảo vệ luận văn học vị w nl Tôi xin cam đoan giúp đỡ cho việc thực luận văn oa d cảm ơn thơng tin trích dẫn luận văn rõ nguồn gốc lu an Hà Nội, tháng 05 năm 2018 va ul nf Tác giả oi lm nh at Hoàng Việt Dũng z z om l.c gm @ an Lu n va ac th si lu an iii va n t to ng LỜI CẢM ƠN hi ep Để hoàn thành luận văn, tơi nhận giúp đỡ tận tình, đóng w nl góp quý báu nhiều cá nhân tập thể oa d Trước hết, xin trân trọng cảm ơn Thầy giáo PGS.TS Nguyễn Long lu an Giang người nhiệt tình hướng dẫn, giúp đỡ tơi việc hồn thành luận va ul nf văn lm Tơi xin trân trọng cảm ơn góp ý chân thành Thầy, Cô giáo oi Viện Công nghệ thông tin, Các thầy giáo, cô giáo Trường Đại học Công nghệ nh at thông tin truyền thông - Đại học Thái Nguyên, tạo điều kiện thuận lợi cho z z tơi thực hồn thành đề tài @ gm Tôi xin cảm ơn đến gia đình, người thân, đồng nghiệp bạn bè Lu Một lần xin trân trọng cảm ơn ! om tài l.c động viên, giúp đỡ, tạo điều kiện thuận lợi cho trình thực đề an Hà Nội, tháng năm 2018 n va Tác giả ac th si Hoàng Việt Dũng lu an iv va n t to ng MỤC LỤC hi ep Trang phụ bìa LỜI CAM ĐOAN i w nl LỜI CẢM ƠN iii oa d MỤC LỤC iv lu an DANH MỤC CÁC TỪ VIẾT TẮT … …………………………………… vi va ul nf DANH MỤC BẢNG vii lm DANH MỤC HÌNH ixvii oi ĐẶT VẤN ĐỀ nh at 1.1 Sự cần thiết lựa chọn đề tài z 1.2 Mục tiêu nghiên cứu đề tài z @ gm Đối tượng phạm vi nghiên cứu l.c 2.1 Đối tượng om 2.2 Phạm vi nghiên cứu Lu Hướng nghiên cứu đề tài an Cấu trúc luận văn va n Chương TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU ĐỒ THỊ ac th 1.1 Tổng quan khai phá liệu đồ thị 1.1.2 Các khái niệm khai phá liệu 1.1.3 Các chức khai phá liệu 1.1.4 Các công cụ khai phá liệu 1.2 Quy trình khai phá liệu đồ thị 1.2.1 Hình thành định nghĩa tốn 1.2.2 Thu thập tiền xử lý liệu 1.2.3 Khai phá liệu rút tri thức 1.2.4 Phân tích kiểm định kết si 1.1.1 Tại cần khai phá liệu: lu an v va n t to ng 1.2.5 Sử dụng tri thức phát hi ep 1.3 Các toán khai phá liệu đồ thị 1.3.1 Khai phá luật kết hợp w nl 1.3.2 Phân lớp oa d 1.3.3 Phân cụm 10 lu an 1.3.4 Dự báo 11 va ul nf 1.3.5 Các mẫu 11 lm 1.3.6 Các định 12 oi 1.4 Các ứng dụng khai phá liệu đồ thị 13 nh at 1.4.1 Các lĩnh vực liên quan đến phát tri thức khai phá liệu 13 z 1.4.2 Ứng dụng khai phá liệu 13 z @ gm Chương CÁC PHƯƠNG PHÁP KHAI PHÁ ĐỒ THỊ CON 15 l.c PHỔ BIẾN 15 om 2.1 Các định nghĩa đồ thị phổ biến 15 Lu 2.1.1 Giới thiệu lý thuyết đồ thị 15 an 2.1.2 Khai phá liệu 19 va n 2.1.3 Một số phương pháp khai phá liệu 21 ac th 2.1.4 Khai phá đồ thị phổ biến 26 2.2.1 Thuật tốn Apriori để tìm tập phổ biến 27 2.2.2 Thuật toán FSG (Frequency SubGraph Mining) để phát cộng đồng mạng xã hội 34 2.3 Ứng dụng khai phá đồ thị phổ biến phát cộng đồng mạng xã hội 39 2.3.1 Cộng đồng mạng xã hội 39 2.3.2 Các phương pháp truyền thống 41 2.3.3 Các phương pháp áp dụng thuật toán phân chia: 43 si 2.2 Các phương pháp khai phá đồ thị phổ biến 27 lu an vi va n t to ng 2.3.4 Phát cộng đồng mạng xã hội 45 hi ep Chương THỬ NGHIỆM, ĐÁNH GIÁ KẾT QUẢ VỚI BÀI TOÁN PHÁT HIỆN CỘNG ĐỒNG MẠNG XÃ HỘI 50 w nl 3.1 Mô tả toán 50 oa d 3.2 Mơ hình giải toán 50 lu an 3.2.1 Mơ hình đồ thị thông tin 50 va ul nf 3.2.2 Hướng cạnh 50 lm 3.2.3 Trọng số cạnh 51 oi 3.2.4 Lựa chọn mơ hình cho tốn 51 nh at 3.3 Thử nghiệm, đánh giá mơ hình (thu thập liệu từ mạng xã hội, biểu diễn z liệu, cài đặt, thử nghiệm đánh giá kết quả) 51 z @ gm 3.3.1 Giới thiệu nhóm Facebook, phân tích nhóm Facebook 51 l.c 3.3.2 Phương pháp thu thập liệu từ nhóm Facebook 53 om 3.3.3 Thử nghiệm toán 54 an Lu 3.3.4 Thuật tốn 55 3.3.5 Demo toán 56 va n 3.3.6 Đánh giá 62 ac th KẾT LUẬN VÀ KHUYẾN NGHỊ 64 Khuyến nghị 64 TÀI LIỆU THAM KHẢO si Kết luận 64 lu an vii va n t to ng DANH MỤC CÁC TỪ VIẾT TẮT hi ep Ý nghĩa w Từ viết tắt nl Knowleadge Discovery in Database oa KDD Cơ sở liệu lu Công nghệ thong tin an CNTT d CSDL va On Line Analytical Processing FSG Frequency SubGraph Mining oi Cluster Overlap Newman-Girvan Algorithm nh Fast Network Community Algorithm at FNCA lm CONGA ul nf OLAP z z om l.c gm @ an Lu n va ac th si lu an viii va n t to ng DANH MỤC BẢNG hi ep Bảng 2.1 Biểu diễn giao dịch 30 w nl Bảng 2.2 Biểu diễn giao dịch 30 oa d Bảng 2.3 Biểu diễn giao dịch 31 lu an Bảng 2.4 Biểu diễn giao dịch 31 va ul nf Bảng 2.5 Biểu diễn giao dịch 31 lm Bảng 2.6 Biểu diễn giao dịch 32 oi Bảng 2.7 Kết cuối 32 nh at Bảng 3.1 Một dạng format (Ma trận thích (Like)) 54 z Bảng 3.2 Bảng người dùng sau giải mã 57 z @ om l.c gm Bảng 3.3 Mảng chuyển đổi 58 an Lu n va ac th si lu an ix va n t to ng DANH MỤC HÌNH hi ep Hình 1.1 Các bước khai phá liệu KDD w nl Hình 1.2 Quá trình khai phá liêu (khám phá tri thức) oa d Hình 1.3 Phân cụm 11 lu an Hình 1.4 Cây định 12 va Hình 2.1 Mơ tả mơ hình đồ thị 15 ul nf Hình 2.2 Các loại đồ thị 16 lm oi Hình 2.3 Đơn đồ thị vô hướng 16 nh Hình 2.4 Đa đồ thị vô hướng 17 at z Hình 2.5 Giả đồ thị vơ hướng 18 z Hình 2.6 Đơn đồ thị có hướng 18 @ gm Hình 2.7 Đa đồ thị có hướng 19 l.c Hình 2.8 Minh họa thuật tốn FSG 35 om Hình 2.9 Cộng đồng mạng xã hội đơn giản với cộng đồng 40 an Lu Hình 2.10 Phương pháp phân vùng đồ thị 41 Hình 2.11 Ví dụ phép phân chia đỉnh đồ thị 44 va n Hình 2.12 Một số ví dụ cộng đồng mạng xã hội 45 ac th Hình 2.13 Mơ hình mạng lưới cộng tác nhà khoa học 46 Hình 3.2 Quan hệ hai người mạng xã hội với trọng số 51 Hình 3.3 Hình ảnh nhóm Facebook 52 Hình 3.5 Ví dụ định dạng worksheet: bạn bè, thích, bình luận 59 Hình 3.6 Đồ thị sau xử lý 59 Hình 3.7 Bộ liệu sau xử lý 60 Hình 3.8 So sánh thuật tốn Light-FSG với thuật toán khác 60 Hình 3.9 Giao diện chương trình 61 Hình 3.10 Biểu diễn Mạng đồ thị 2D 61 Hình 3.11 Biểu diễn Mạng đồ thị 3D 62 si Hình 3.1 Liên kết hai đỉnh (người) mạng xã hội 50 lu an va n t to ng ĐẶT VẤN ĐỀ hi ep w 1.1 Sự cần thiết lựa chọn đề tài nl Trong năm gần đây, khai phá liệu liệu đồ thị chủ đề thu oa d hút quan tâm cộng đồng nghiên cứu khai phá liệu học máy lu an ứng dụng rộng rãi nhiều lĩnh vực như: phân tích liệu hóa học, va ul nf sinh học, phân tích mạng máy tính, phân tích mạng xã hội [4, 5, 6] Theo tìm lm hiểu tác giả, nghiên cứu liên quan đến khai phá liệu đồ thị thường oi tập trung vào toán như: liệt kê đếm (Enumeration and Counting), nh at phân lớp đồ thị (graph classification), phân cụm đồ thị (graph clustering), học z bán giám sát (semi-supervisedlearning), tóm tắt đồ thị (graph summarization), z gm @ khai phá đồ thị phổ biến (frequent graph mining)… l.c Khai phá đồ thị phổ biến hướng nghiên cứu sôi động năm om gần lĩnh vực khai phá liệu đồ thị Dựa tảng toán Lu khai phá luật kết hợp, khai phá đồ thị phổ biến nhằm tìm kiếm đồ thị an phổ biến (tương ứng với tập mục phổ biến) Các đồ thị phổ biến tảng va n để giải toán dự báo khơng gian liệu đồ thị có ứng rộng rãi ac th nhiều lĩnh vực khác đời sống Một số thuật tốn điển hình khai CMTMiner thực việc duyệt cạnh phổ biến xây dựng DFS để tìm đồ thị phổ biến.Trong đó, HSIGRAM, VSIGRAM hai thuật tốn xác định đồ thị phổ biến đồ thị lớn Như trình bày trên, lĩnh vực khai phá liệu đồ thị thu kết quan trọng lý thuyết có ứng dụng hiệu việc giải số toán thực tiễn.Một toán ứng dụng khai phá đồ thị phổ biến phát cộng đồng mạng xã hội si phá đồ thị phổ biến CMTMiner [7], HSIGRAM, VSIGRAM [8], Thuật toán lu an 52 va n t to ng hi ep w nl oa d lu an va ul nf oi lm nh at Hình 3.3 Hình ảnh nhóm Facebook z Phân tích Facebook group sử dụng API có sẵn Facebook z gm @ để thu thập thơng tin nhóm Thơng tin thu thập gồm có: thơng tin l.c người dùng (thành viên nhóm), tổng số viết mà người dùng đăng, om với viết thu thập kèm theo phản ứng với viết Phản ứng với Lu viết thu thập trạng thái “like”/ “share”/“comment” viết an Trạng thái like viết cho ta thấy phản ứng khách quan va n người đọc với viết Một người đọc tiếp cận với viết họ ac th biết thơng tin truyền tải viết đó, thông tin like viết họ khơng biết người viết viết Nhóm Facebook có nhiều thành viên quan tâm đến vấn đề cụ thể đó, họ tương tác với qua thơng tin từ viết đăng nhóm Qua phân tích trên, mơ hình cho cộng đồng ảo trừu tượng hóa thơng tin thành viên cộng đồng, viết thành viên phản ứng với viết si họ cần họ có suy nghĩ giống vậy, người đọc lu an 53 va n t to ng 3.3.2 Phương pháp thu thập liệu từ nhóm Facebook hi ep + Sử dụng Facebook API để thực gọi hàm truy xuất liệu: Phương pháp Facebook API có ưu điểm như: tương thích hồn w nl tồn với cấu trúc liệu Facebook, kết trả định dạng JSON tương oa d thích với hầu hết ngơn ngữ lập trình phổ biến Bộ SDK Facebook API lu an hỗ trợ nhiều ngơn ngữ lập trình Java, C#, PHP… Vì sản phẩm từ va ul nf Facebook phát triển nên việc thu thập liệu không gặp vấn đề với ajax lm Sử dụng XML-RPC: cài đặt RPC (Remote Procedure Call) oi giao thức HTTP, sử dụng XML để mã hoá trao đổi liệu nh at + Về mặt liệu: z Sử dụng định dạng liệu đơn giản: excel (xlsx, csv), json, có z l.c gm - Đơn giản, gọn @ số ưu điểm: om - Linh động, không cần phải định nghĩa cấu trúc liệu trước tiến an liệu khơng có cấu trúc Facebook Lu hành lưu trữ điều thể tính tương thích làm việc với dạng va n - Khả mở rộng tốt, khả cân tải cao, tích hợp công nghệ ac th quản lý liệu tốt kích thước thơng lượng trao đổi liệu tăng + Bạn bè (friend) + Thích (like): viết + Bình luận (comment) + Chia sẻ (share) Công cụ làm việc liệu CSV thu thập tệp Excel phải tuân theo điều định dạng sau si - Xây dựng ma trận quan hệ dựa tiêu chí sau: lu an 54 va n t to ng Bảng 3.1 Một dạng format (Ma trận thích (Like)) hi ep ID User2 … UserN 23 … 11 … 34 … … … … 28 … User1 w User1 nl oa User2 d an va UserN lu … ul nf oi lm - Hộp phải "ID" nh - ID yếu tố chuỗi số, phân tích cú at z pháp chuỗi, dù liệu đường chéo phải z User2 23 lần " gm @ - Trong ví dụ này, liệu hiểu "User1 thích viết om l.c - Bảng tính phải chứa worksheet Đầu tiên về: + Quan hệ nhị phân hai người dùng (Bạn bè hay không) Hộp phải an Lu Bất thứ trừ coi "1" ac th định dạng đề cập n va + Hai worksheet tiếp theo, có chứa ví dụ "Thích" "Bình luận" phải theo Lưu ý: tập liệu đọc Không có liệu sửa 3.3.3 Thử nghiệm tốn - Tìm kiếm cộng đồng liệu vấn đề đồ thị thường xuyên, việc sử dụng thuật toán phát triển Pattern, cụ thể Apriori FSG, đề xuất tốt trường hợp ngày Tuy nhiên, có số khác biệt nhỏ áp dụng cho toán này: - Trước hết, coi "cộng đồng" (tức hoàn chỉnh đồ thị con) có nhóm hai nhiều nút kết nối Bằng cách này, nút riêng lẻ khơng bao gồm thuật tốn, giảm thời gian thực thuật toán, si đổi lu an 55 va n t to ng cặp nút bao gồm C2 hi ep - Trước tiên xem xét sử dụng cạnh cá nhân, phù hợp với tốm Tuy nhiên, đồ thị hồn chỉnh khơng có hướng có hai cạnh w nl khơng thể; số cạnh n (n-1)/2, với n số lượng nút oa d - Do đó, tơi thực cách gắn trọng lượng cạnh, lu an (1 có mối quan hệ "hồn hảo" hai cá thể, có nghĩa khơng có mối va ul nf quan hệ không đại diện biểu đồ) Sau nhập ngưỡng nhận L2, C3 lm thu cách tìm tập Các ứng cử viên lựa chọn oi số nút kết nối cộng đồng, tránh để đọc toàn sở liệu nh at bước lặp lại z 3.3.4 Thuật toán z @ gm function subgraph(n){ l.c var eles = cy.nodes(); om var C = []; an Lu var C1 = []; var C2 = []; n va for (var i = 0; i < eles.size(); i++) { ac th var a = eles[i]; for (var j = i+1; j < eles.size(); j++) { if(edge(a.id(),eles[j].id())) if(cn(a).intersection(cn(eles[j])).size() >= n2) C1.push(cy.collection([a,eles[j]])); } } // at this point, C1 contains all couples that belong to a (n+)-graph si // nodes neighbourgs of a lu an 56 va n t to ng while(C1.length > 0){ hi ep C.push(C1); // foreach communities in C1 w nl oa for (var i = 0; i < C1.length; i++) { d // the current community lu an var com = C1[i] va ul nf // the "new" nodes to the community oi lm var set = cn(com) for (var j = 0; j < set.size(); j++) { nh && at if(inCommunity(com,set[j]) z z !C2.contains(com.union(set[j])) ){ @ om an Lu } l.c } } gm C2.push(com.union(set[j])); // at this point, C2 contains all k+2-communities n ac th C2 = []; va C1 = C2; console.log(C); return C; } 3.3.5 Demo toán Yêu cầu chung - Demo toán ứng dụng web, viết hoàn toàn HTML5, CSS3 JavaScript, với thư viện: + JQuery, để cải tiến tổng thể giảm mã si } lu an 57 va n t to ng +Cytoscape.js (js.cytoscape.org), để chuyển đổi đối tượng JavaScript hi ep thành biểu đồ, hiển thị thao tác đồ thị + Sheet.js Xslx.js (sheetjs.com), để đọc chuyển đổi phân tích cú w nl pháp nhị phân tệp Excel vào đối tượng JavaScript oa d - Tập tin test.js: chứa chức chính, khởi tạo đồ thị trình lu an nghe hành động cho giao diện va ul nf - Ứng dụng tối ưu hóa cho Google Chrome, kiểm tra lm đầy đủ trình duyệt IE Firefox Windows Linux Nó hỗ trợ oi Chrome, Edge, Firefox, Opera Safari Một số chức khơng có sẵn nh at Internet Explorer phiên cũ Safari z - Công cụ không cần máy chủ Bạn chạy đâu z @ gm miễn bạn sở hữu tất tệp l.c Thử nghiệm toán: om + Xử lý liệu: Lu - Tệp giải mã chuyển đổi từ nhị phân (.xls) sang chuỗi, sau an chuyển đổi thành chuỗi chuỗi Mỗi mục có chứa bảng tính, va n phân cách dấu phẩy giá trị Nếu liệu theo định dạng nêu ac th trên, chuỗi chia nhỏ chuyển đổi thành mảng si theo định dạng: Bảng 3.2 Bảng người dùng sau giải mã … UserN … 0.11 … 0.34 … … … … 0.11 0.34 … ID User1 User1 User2 0.24 … UserN User2 0.24 - `Nếu hai người dùng khơng phải bạn, số lượt thích nhận xét lu an 58 va n t to ng họ bị bỏ qua (0) Điểm số mảng thể trọng số mối hi ep quan hệ, đối xứng (trọng lượng tính lần, sau chép vào hộp đối xứng) Mỗi cặp người sử dụng, công thức tính tốn sau: w nl 𝑙𝑖𝑘𝑒𝑠 𝛼 𝑐𝑜𝑚 (1 − 𝛼) + max 𝐿𝑖𝑘𝑒𝑠 max 𝐶𝑜𝑚𝑠 oa d lu Cơng thức tính mối quan hệ “Like”, “Coms” an va Với maxLikes: Số cao thích "thích" mảng, ul nf maxComs: Số cao bình luận lm oi α: hệ số (bạn nhập gửi tệp Excel, để nh tăng giảm giá trị thích so với bình luận) at z - Cuối cùng, kết chuyển đổi thành mảng giống Apriori z gm @ Bảng 3.3 Mảng chuyển đổi User2 0.24 User1 UserN 0.11 User2 UserN 0.34 … … … om l.c User1 an Lu n va Và sẵn sàng để nhập vào đồ thị tạo thành "đồ thị con" si bình luận: ac th Đây định dạng liệu đầu vào đại cho bảng: bạn bè, thích, lu an 59 va n t to ng hi ep w nl oa d lu an va ul nf oi lm nh at z z om l.c gm @ Lu Hình 3.5 Ví dụ định dạng worksheet: bạn bè, thích, bình luận an Sau xử lý sơ liệu trang trước với tỷ lệ 0,7 thu đồ va n thị ac th si Hình 3.6 Đồ thị sau xử lý lu an 60 va n t to ng Và cuối cùng, áp dụng thuật toán Light-FSG thông qua chức đồ thị hi ep con, có liệu sau (hai cộng đồng cuối cùng): w nl oa d lu an va ul nf oi lm nh at Hình 3.7 Bộ liệu sau xử lý z z Lưu ý: số viết tắt Excel, ID @ om l.c gm So sánh thuật toán Light-FSG với thuật toán khác: an Lu n va ac th si Hình 3.8 So sánh thuật toán Light-FSG với thuật toán khác lu an 61 va n t to ng Giao diện chương trình: hi ep w nl oa d lu an va ul nf oi lm nh at z z om l.c gm @ Hình 3.9 Giao diện chương trình an Lu n va ac th si Hình 3.10 Biểu diễn Mạng đồ thị 2D lu an 62 va n t to ng hi ep w nl oa d lu an va ul nf oi lm nh at z z gm @ om 3.3.6 Đánh giá l.c Hình 3.11 Biểu diễn Mạng đồ thị 3D an Lu - Thứ nhất, lý thuyết đồ thị phức tạp, vấn đề clique NPComplete vấn đề, có nghĩa "dễ dàng" để xác minh giải pháp định va n cách mức Thời gian (ví dụ: "đồ thị thuộc đồ thị" hay ac th "là biểu đồ Clique "), là" khó "để tìm giải pháp cách - Với ý nghĩ đó, tơi cố gắng để thực giải pháp cạn kiệt, mà đánh giá đồ thị xác minh quan hệ hay khơng, lưu nó Hỗ trợ đủ cao Giải pháp hoàn tồn khơng tối ưu, hiểu biết Số kết hợp tăng lên theo cấp số nhân với số nút - Sau đó, tơi áp dụng thuật tốn tham lam, mà lựa chọn giải pháp tối ưu địa phương lần lặp để tìm tối ưu tồn cầu Trước hệ, chúng tơi Đảm bảo kết hợp thực biểu đồ Bằng cách này, đồ thị chứa đồ không tồn không đánh giá Giải si hiệu lu an 63 va n t to ng pháp tối ưu với vài nút với đồ thị mật độ thấp, thời gian hi ep thực có xu hướng phát triển thực nhanh với số nút nhiều Độ phức tạp tính tốn O(n3) Vì vậy, thực tốn với w nl oa thuật tốn FSG hồn tồn khơng khả thi hiệu với quy mơ tốn d đặt Do đó, tơi chuyển sang chọn thuật toán Light-FSG lựa lu an chọn tối ưu trường hợp số lý sau: va ul nf + Thời gian duyệt đồ thị FSG nhiều thời gian lm thuật tốn phải tìm duyệt tất đồ thị phải giống (tương tự) oi + Để thực thuật tốn FSG phải có hệ thống máy chủ mạnh để nh at tính tốn/tìm duyệt đồ thị thời gian ngắn z z om l.c gm @ an Lu n va ac th si lu an 64 va n t to ng KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN hi ep Kết luận Mạng xã hội toán phát cộng đồng mạng xã hội w nl vấn đề nhiều nhà nghiên cứu quan tâm thời đại Các oa d toán phát cộng đồng ứng dụng rộng rãi nhiều lĩnh vực đời lu an sống kinh tế, trị, xã hội, khoa học cơng nghệ, va ul nf Luận văn đưa tổng quan mạng xã hội toán phát cộng lm đồng mạng xã hội, hướng tiếp cận điển hình cho tốn oi phát cộng đồng Luận văn trọng trình bày chi tiết thuật toán Light at z z Hướng phát triển nh - FSG (Frequency SubGraph Mining) @ gm Hướng phát triển nghiên cứu luận văn mở rộng mơ hình om hợp như: l.c mạng xã hội, tính tốn trọng số bổ sung hướng cho đồ thị cho phù Lu - Đánh giá mức độ quan tâm cộng đồng mạng xã hội vấn an đề quan tâm Nhằm có định hướng phát triển sách, n va chiến lược, kế hoạch kinh doanh phù hợp… ac th - Đánh giá mức độ quan tâm cộng đồng mạng xã hội phim, - Đánh giá mức độ ảnh hưởng cá nhân, tổ chức, công ty si sản phẩm, dịch vụ Từ có chiến lược quảng cáo phù hợp lu an va n t to ng TÀI LIỆU THAM KHẢO hi ep Tài liệu tiếng việt Giang Thành Trung, “Một thuật toán khai phá đồ thị phổ biến w nl liệu đồ thị” oa d Hà Quang Thụy, Phan Xn Hiếu, Đồn Sơn, Nguyễn Trí Thành, lu an Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), Giáo trình khai phá liệu, va ul nf Nhà xuất Giáo dục lm GS.TS Trần Hữu Luyến, ThS Đặng Hoàng Ngân (7/2014), “Mạng xã hội: oi Khái niệm, đặc điểm, tính năng, áp lực ý nghĩa thực tiễn nghiên nh z z Tài liệu tiếng anh at cứu”, Tạp chí Tâm lý học - Số (184) @ patterns.J Comput Biol., 6(3/4):281–292, 1999 l.c gm A.Ben-Dor, R Shamir, and Z Yakhini Clustering gene expression om V Satuluri, S Parthasarathy Scalable Graph Clustering Using Stochastic 2009 an Lu Flows: Applications to Community Discovery, ACM KDD Conference, va n Viet Anh Nguyen, Learning from graph data by putting graph on the lattice, ac th Viện Công nghệ thông tin Closed and Maximal Frequent Subtrees, Proc Eighth Pacific Asia Conf Knowledge Discovery and Data Mining (PAKDD ’04), May 2004 M Kuramochi, G Karypis,Finding frequent patterns in a large sparsegraph Data Mining and Knowledge Discovery, 11(3): pp 243– 271, 2005 Jiyang Chen, Community Mining-Discovery Communities in Social Network, Thesis, University of Alberta, 2010 si Y Chi, Y Yang, Y Xia, and R.R Muntz, CMTreeMiner: Mining Both lu an va n t to ng 10 Santo Fortunato (2010), Community detection in graphs, Technical Report, hi ep Complex Networks and Systems Lagrange Laboratory, ISI Foundation, Torino, ITALY, arXiv:0906.0612v2 (2010) w nl oa 11 M Girvan, M E J Newman (2002) Community structure in social and d biological networks, Proc Natl Acad Sci., 99(12), 7821 (2002) lu an 12 Steve Gregory: An Algorithm to Find Overlapping Community Structure va oi lm Website ul nf in a Networks.PKDD 2007 13 http://www.mediative.com/network-analysis-seo/ nh at 14 https://www.facebook.com/ z z 15 http://tailieudientu.lrc.tnu.edu.vn/chi-tiet/mang-xa-hoi-khai-niem-dac- @ om l.c 44022.html gm diem-tinh-nang-ap-luc-va-y-nghia-trong-thuc-tien-va-nghien-cuu- an Lu n va ac th si

Ngày đăng: 24/07/2023, 09:23

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w