1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ công nghệ thông tin Nghiên cứu và phát triển thuật toán tìm phần tử chính yếu trong mạng xã hội và ứng dụng

84 728 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 84
Dung lượng 3,06 MB

Nội dung

B GIÁO DO I HC LC HNG     NH NGHIÊN CU VÀ PHÁT TRIN THUT TOÁN TÌM PHN T CHÍNH YU TRONG MNG XÃ HI VÀ NG DNG LU THÔNG TIN  B GIÁO DO I HC LC HNG     NH NGHIÊN CU VÀ PHÁT TRIN THUT TOÁN TÌM PHN T CHÍNH YU TRONG MNG XÃ HI VÀ NG DNG Chuyên ngành: Công ngh thông tin Mã s : 60.48.02.01 LU THÔNG TIN NG DN KHOA HC  PHÚC  L ng, ngoi tr các kt qu tham kho t các công trình khác và mt s lý thuyt trên internet   ngun tham kho trong luc trình bày trong lu này là do chính tôi thc hin ni dung nào ca lun c n ly bng cp  ng này hong khác. Ngày tháng   nh LI C Tôi xin gi ln Thy Cô, bng n tr tôi rt nhiu v kin th tinh thn trong quá trình tôi thc hin lu c bit c  cp và truyn dy cho tôi nhng kin thc rt hu dng, giúp tôi hoàn thi            pháp nghiên cu khoa hn nhng công vic c th trong lun   nh. TÓM T TÀI Lup trung nghiên cu mt v mà cng khoa h   tìm phn t chính yu (Key Player) trong mng xã hi. Bài toán tìm phn t chính yu là bài toán nh mt hoc mt nhóm các phn t  th mà nu m làm gãy các liên k th. Da vào bài     n nht   nh ca m  th có ng  a nó. Mng xã hi c xem là  th ng, các thc th trong mnh c th, mi quan h gia các thc th trong mng là các cnh c th. Bài t ra là xây dng thui ngn nh nh c th, kt hp v t nh thc th nào là quan trng và có tm ng ln nht ti các thc th khác trong mng xã hi. Lu tóm tt lý thuyt các khái nin mng xã hi, k thut phân tích mng, phn t chính yu  trong mng xã hi. Trên c  lu thit k và xây dng h th thc nghim thut gii tìm tp Key player trên các tp d liu thc t. DANH MC NHNG T VIT TT TRONG LU BFS : Breadth First Search CNTT : Công Ngh Thông Tin JUNG : Java Universal Network / Graph Framework MXH : Mng Xã Hi SNA : Social Network Analysis DANH MC HÌNH Hình 1.1: Mô t mng xã hi. 1 Hình 2. 1: Mô hình mng Xã hi (Social Network) 6 Hình 2.2: Mô hình mng xã hi Facebook. 7 Hình 2.3: Mô hình các thành viên ca mng Twitter. 8 Hình 2.4: Mô hình phân bit Follower và Friend trong mng Twitter 10 Hình 2. 5: Giao din chính ca mng Facebook 11 i truy cp Facebook trong 1 tun t n 04/08/2012 (ngun socialbakers.com) 11 Hình 2.7: Biu din tnh trong mô hình mng. 13 Hình 2.8: Din t  th  th ng 14 Hình 2.9: Ví d ng 15 Hình 2.10: Mô t các thành viên trong mng xã hi 18 Hình 2.11: Ví d m th gnh 19 Hình 2.12: M th g tìm Degree Centrality 20 Hình 2.13: M th gm 10  tìm Degree Centrality 21 Hình 2.14: Mô t v trí Betweenness Centrality 24 HÌnh 2.15: Mt mng xã h tính Betweenness Centrality 25 Hình 2.16: Tm ng c a trên trung gian 28 Hình 2.17: Hình minh ha ví d tìm Closeness centrality 34 Hình 2.18: Mô t m Closeness Centrality ca mng 31  a trên trung gian, s lân cn và tr  32 Hình 2.20: H s gom cm c th 35 Hình 2.21: Ví d mt Mng xã hi 41 Hình 2.22: Mô t v trí ca Key player trong mng 37 Hình 3.1: Cu trúc mng xã hi 42 Hình 3.2: Cách thc Duy. 49 c thc hi 53 Hình 4.2: Tp d lic x lý 53 Hình 4.3: Tp d liu dolpc x lý 54 Hình 4.4: Danh sách Tnh Karate 55 Hình 4.5: Danh sách Tp cnh Karate 55 Hình 4.6: Danh sách T 56 Hình 4.7: Danh Sách Tp Cnh Dolphins 56 Hình  th biu din tp d liu Karate 57  th biu din tp d liu Dolphins 57 Hình 4.10: Màn hình báo cáo kt qu 58   th thành ma trn k 60   th thành danh sách liên thuc 61   th thành danh sách lin k 62 Hình 4.14: Giao din np d liu. 63 Hình 4.15: Giao din V  th trc quan 64 Hình 4.16: Tính Degree Centrality 64 Hình 4.17: Tính Betweenness Centrlity 65 Hình 4.18 Tính Closeness Centrality 65 Hình 4.19: Hin th kt qu c 65 Hình 4.20: Mô t tp d liu thc nghim 69 Hình 4.21: Giao din kt qu cui cùng c 67 DANH MC BNG B nh sau khi tính toán 20 B  th gnh 21 Bng 2.3:   th 25 Bn nht ca tt c  th 26 B Closeness Centrality c th 29 Bng 2.6: M Closeness Centrality ca mng 36 Bng 3.1: Cách thc duy th bng Thut toán BFS 51 Bng 4.1: Cách th d li th bng Danh sách liên thuc. 61 Bng 4.2: Cách th d li th bng Danh sách liên k 62 MC LC * NG QUAN 1 1.1. Gii thi tài 2 1.2. Lý do ch tài 3 1.3. Mc tiêu c tài 3 1.4. Phm vi nghiên cu c tài 4  LÝ THUYT 6 2.1. Tng quan v mng xã hi 6 2.2. Các Mng Xã hi thông dng hin nay. 7 2.2.1. Mng xã hi Twitter 7 2.2.2. Mng xã hi Facebook 10 2.3. Các khái nin trong vic t chc mng xã hi 12 2.3.1. Tnh 13 2.3.2. Tp cnh 14 2.4. n nht trong mng 15 2.5. K thut phân tích mng xã hi (Social Network Analysis  SNA) 15 2.5.1. Bi cnh 15 2.5.2. ng dng thc t 16 2.6.  ng 17 2.6.1.  c - Degree Centrality 18 2.6.2.  a trên trung gian 22 2.6.3.   ln cn - Closeness Centrality 28 2.6.4.  a trên tr  32 2.6.5. H s gom cm trong mng  Clustering Coefficient 32 2.7. Phn t chính yu 35 N T CHÍNH YU TRONG MXH 39 3.1. Gii thiu 39 3.2. Bài toán tìm phn t chính yu trong mng xã hi. 39 3.2.1. Phát biu bài toán 39 3.2.2. ng dng ca bài toán tìm phn t chính yu. 41 3.2.3. Thut gii tìm phn t chính yu. 42 a. Thut gii tìm Degree Centrality. 42 b. Thut gii tìm Betweenness Centrality. 44 c. Thut gii tìm Closeness Centrality 47 [...]... hội để từ -4- đó áp dụng cho nhiều lĩnh vực khác nhau Mục tiêu chính yếu của luận văn này là: - Nghiên cứu về mạng xã hội (Social Network) - Tìm hiểu về Key player trong mạng xã hội - Tìm hiểu về các loại độ đo Centrality trong mạng xã hội - Tìm hiểu về kỹ thuật phân tích mạng xã hội - Nghiên cứu và phát triển thuật toán xác định tập các phần tử chính yếu trong mạng xã hội dựa vào các độ đo Centrality... tài Trong phân tích mạng xã hội, bài toán tìm phần tử chính yếu (Key Player) là một trong những bài toán quan trọng để giải quyết nhiều vấn đề liên quan trong xã hội nói chung và ngành Công nghệ thông tin nói riêng Các doanh nghiệp áp dụng bài toán này để phân tích và cải thiện mối liên lạc truyền thông bên trong tổ chức và mạng lưới khách hàng cũng như các đối tác Phân tích và tìm ra những phần tử chính. .. những thông tin tuyển sinh,… Trong các website mạng xã hội như Facebook, việc sử dụng các thành phần cơ bản của phân tích mạng xã hội để xây dụng chức năng nhận diện và giới thiệu kết bạn tiềm năng dựa trên liên kết friends to friends 1.3 Mục tiêu của đề tài Qua quá trình tìm hiểu về mạng xã hội, luận văn này đề cập tới cách thức tìm các phần tử chính yếu, quan trọng (key players) trong mạng xã hội để... phương pháp "phân tích mạng xã hội" (Social Network Analysis SNA) đã được nghiên cứu và ứng dụng ngày càng nhiều hơn trong các nghiên cứu xã hội học nói riêng và khoa học xã hội nói chung Tại Việt Nam, phương pháp phân tích mạng xã hội còn khá mới mẻ, do đó việc ứng dụng phương pháp phân tích này còn khá hạn chế Đi kèm với phân tích nói trên là bài toán xác định phần tử chính yếu (Key player) hay còn... đi ngắn nhất trong mạng liên kết các websites  Thử nghiệm, phân tích và đánh giá giải thuật trên bộ dữ liệu thực tế Cụ thể, đề tài thực hiện các nội dung sau:  Nghiên cứu các mô hình mạng xã hội truyền thông  Tìm hiểu các phương pháp phân tích mạng xã hội  Tìm hiểu một số phần mềm phân tích mạng xã hội  Tìm hiểu thuật toán tìm đường đi ngắn nhất trong đồ thị (có hướng và vô hướng) và các loại độ... trong xã hội học hiện đại Nó cũng đạt được một lượng đáng kể trong nhân chủng học, sinh học, nghiên cứu truyền thông, kinh tế, địa lý, khoa học thông tin, nghiên cứu tổ chức, tâm lý xã hội và đã trở thành một chủ đề phổ biến của đầu cơ và nghiên cứu 2.5.2 Ứng dụng thực tế - Phân tích mạng xã hội – SNA - được ứng dụng trong nhiều lĩnh vực khác nhau:  Các doanh nghiệp sử dụng SNA để phân tích và cải thiện... Mạng tham khảo các bài báo trên Internet o Mạng liên kết các trang web (web link) - Hiện thực thuật toán tìm Key players bằng chương trình minh họa 1.4 Phạm vi nghiên cứu của đề tài Đề tài tập trung vào tìm hiểu và nghiên cứu các vấn đề sau:  Tìm hiểu về mạng xã hội và các vấn đề liên quan  Triển khai xây dựng chương trình thực nghiệm, xây dựng ứng dụng và tối ưu hoá một giải thuật cho bài toán tìm. .. phương pháp phân tích mạng xã hội – SNA để nghiên cứu các trang Web, lưu lượng truyền thông trên internet, mức độ phổ biến thông tin, … -2- 1.1 Giới thiệu đề tài Phân tích mạng xã hội (Social Network Analysis – SNA) hiện đang là một trong các chủ đề được quan tâm nghiên cứu Phân tích mạng xã hội bao gồm việc nghiên cứu các quan hệ, kết nối, mẫu truyền thông và hành vi giữa các nhóm xã hội khác nhau… Các... trong mạng xã hội Phần tử chính yếu là các phần tử trong mạng được xem là quan trọng xét theo một điều kiện nào đó Có thể nói rằng, key player là những node có khả năng điều khiển luồng thông tin, là những node nổi bật nhất và có tầm ảnh hưởng đến các node khác trong mạng xã hội Độ đo Centrality là đơn vị đo lường xác định các mối liên kết của một đỉnh trong đồ thị Thông qua Centrality, ta có thể phát. .. thực thể khác trong mạng xã hội Các vấn đề liên quan được đặt ra như: -3-  Các khái niệm về mạng xã hội như: Actor, Node, Point, Agent, Tie, Link, Edge, Clique,  Cấu trúc dữ liệu đặc trưng của mạng xã hội được tổ chức như thế nào?  Bài toán tìm đường đi ngắn nhất đi qua các đỉnh của một đồ thị có hướng  Độ đo Centrality trong mạng xã hội và các kỹ thuật phân tích mạng xã hội dựa vào các độ đo Centrality . ch tài Trong phân tích mng xã hi, bài toán tìm phn t chính yu (Key Player) là mt trong nhng bài toán quan tr gii quyt nhiu v liên quan trong xã hi nói chung và ngành. thc thut toán tìm Key players ba. 1.4. Phm vi nghiên cu c tài  tài tp trung vào tìm hiu và nghiên cu các v sau:  Tìm hiu v mng xã hi và các v. cm trong mng  Clustering Coefficient 32 2.7. Phn t chính yu 35 N T CHÍNH YU TRONG MXH 39 3.1. Gii thiu 39 3.2. Bài toán tìm phn t chính yu trong mng xã

Ngày đăng: 25/11/2014, 10:57

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w