Bài toán tìm Tâm và Bán kính

Một phần của tài liệu PHÂN TÍCH MẠNG XÃ HỘI DÙNG CÔNG NGHỆ WAVE VÀ ỨNG DỤNG TÌM KEY PLAYER (Trang 50)

Một khái niệm quan trọng khác trong đồ thị là tâm của đồ thị. Tâm của đồ thị là một node mà khoảng cách lớn nhất từ node đó tới một node khác bất kì trong đồ thị là nhỏ nhất. Bán kính là độ dài khoảng cách từ tâm tới node xa nhất trong đồ thị.

Hình 5 10

Ví dụ như với đồ thị Hình 5 10 tâm của đồ thị là B và bán kính của đồ thị là khoảng cách từ B tới node xa nhất là 2. A không thể là tâm vì khoảng cách từ A tới node xa nhất – node H - là 3, lớn hơn khoảng cách từ B tới H

Thuật toán: Để tìm node có khoảng cách tới một node bất kì trong đồ thị là ngắn nhất so với các node khác, với tất cả các node trong đồ thị, ta tìm khoảng cách xa nhất từ node đó tới các node còn lại trong đồ thị. Trong các khoảng cách tìm được, node nào có khoảng cách ngắn nhất chính là tâm của đồ thị.

Ta có thể sử dụng kết quả tìm cây đường đi ngắn nhất của bài toán tìm đường kính trong đồ ở phần 5.3, bán kính cần tìm chính là giá Dmax nhỏ nhất được lưu trong cơ sở dữ liệu.

CHƯƠNG 4: XÁC ĐỊNH KEY PLAYER TRONG MẠNG XÃ HỘI 4.1 Đặt vấn đề

Mạng xã hội với khả năng kết nối, chia sẻ thông tin một cách dễ dàng, mạng xã hội dần trở thành một kho kiến thức khổng lồ. Và từ đây, nhu cầu tìm kiếm, phân tích lượng thông tin khổng lồ trong rất nhiều mạng xã hội đang tồn tại và phát triển trở nên cần thiết hơn bao giờ hết. Việc tìm kiếm trở nên dễ dàng hơn; song nếu một nhà đầu tư, doanh nghiệp muốn quảng bá sản phẩm của mình thì xu hướng của họ sẽ như thế nào, chiến lược nào mà họ ứng dụng.

4.2 Giải quyết vấn đề

Xuất phát từ yêu cầu đó việc tìm ra phần tử chốt trong một mạng xã hội cụ thể sớm được các nhà nghiên cứu tham gia để tạo ra các công cụ hỗ trợ như: NodeXL. Phân tích thông tin để từ đó chọn ra được đối tượng, địa điểm nồng cốt cho nhu cầu truyền tải thông tin, cũng như quảng bá sản phẩm của một số lượng doanh nghiệp, nhà đầu tư, cá nhân,… là một cách tối ưu cho vấn đề này.

Xác định key player: Trong mô hình mạng trên, nút 10 là trung tâm nhất theo mức độ trung tâm. Tuy nhiên, các nút 3 và 5 sẽ cùng nhau kết hợp và kết nối nhiều nút hơn. Ngoài ra, mối quan hệ ràng buộc giữa chúng là rất quan trọng. Nút 3 và 5 cùng là 'chìa khóa' để mạng lưới này hơn nút 10.

Làm thế nào để xác định key player (các nút trung tâm trong mạng)??

Degree centrality: Bậc của nút là tổng số đường vào và ra của nút (đồ thị có hướng); trong một đồ thị vô hướng thì đường vào và ra là giống nhau, thường được sử dụng làm thước đo mức độ của một nút trong sự kết nối và do đó cũng ảnh hưởng mức độ phổ biến.

Việc tìm ra các nút trung tâm đối với việc truyền bá thông tin và ảnh hưởng đến những người khác trong cùng nhóm là rất hữu ích.

Nút 3 và 5 có bậc cao nhất

Đường đi và đường đi ngắn nhất: Đường đi ngắn nhất giữa hai nút là con đường kết nối hai nút với khoảng cách ngắn nhất của các cạnh.

Trong ví dụ trên, giữa các nút 1 và 4 có hai con đường ngắn nhất có độ dài 2: {1,2,4} và {1,3,4}

Đường đi dài giữa hai nút 1 và 4 là {1,2,3,4}, {1,3,2,4}, {1,2,5,3,4} và {1,3,5,2, 4} (dài nhất đường dẫn).

Con đường ngắn hơn là cần thiết khi tốc độ của thông tin liên lạc, trao đổi thông tin diễn ra nhanh chóng.

Cho biết các nút có nhiều khả năng nằm trên con đường thông tin liên lạc giữa các nút khác. Ngoài ra hữu ích trong việc xác định các điểm mà mạng sẽ tan rã (nút 3 hoặc 5 sẽ biến mất thì mạng sẽ tan rã)

Chiều dài trung bình của tất cả các đường đi ngắn nhất từ một nút đến tất cả các nút khác trong mạng (tức là có bao nhiêu bước nhảy trung bình phải mất để đạt được tất cả các nút khác)

Đây là một biện pháp tiếp cận, tức là nó sẽ mất bao lâu để đạt được các nút khác từ một nút khởi đầu, hữu ích trong trường hợp tốc độ phổ biến thông tin là mối quan tâm chính. Giá trị thấp hơn là tốt hơn khi có cao hơn tốc độ mong muốn.

Eigenvector centrality: Xu hướng véc tơ trung tâm của một nút là tỷ lệ thuận với tất cả các nút trực tiếp kết nối với nó. Điều này cũng tương tự như cách Google xếp hạng các trang web liên kết từ cao được liên kết đến các trang tính. Hữu ích trong việc xác định những người được kết nối với các nút được kết nối nhất.

Xác định key player: Trong mô hình mạng trên, nút 10 là trung tâm nhất theo mức độ trung tâm. Tuy nhiên, các nút 3 và 5 sẽ cùng nhau kết hợp và kết nối nhiều nút hơn. Ngoài ra, mối quan hệ ràng buộc giữa chúng là rất quan trọng. Nút 3 và 5 cùng là 'chìa khóa' để mạng lưới này hơn nút 10.

Reciprocity (degree of): Tỷ lệ số lượng các mối quan hệ đó đáp lại (tức là có một lợi thế trong cả hai chiều) trong tổng số các mối quan hệ trong mạng. Nơi hai đỉnh được cho là liên quan nếu có ít nhất một cạnh giữa chúng. Một chỉ số hữu ích của mức độ phụ thuộc lẫn nhau và trao đổi trong một mạng có liên quan đến sự gắn kết xã hội và có ý nghĩa trong đồ thị chỉ đạo.

Density:

Densityis của mạng tỷ lệ số lượng của các cạnh trong mạng trên tổng số của các cạnh có thể có giữa tất cả các cặp của các nút (n (n-1) / 2), n là số đỉnh một đồ thị (mạng vô hướng), trong mạng ví dụ mật độ quyền = 6/5 = 0,83. Đây là một biện pháp phổ biến làm thế nào cũng kết nối mạng (nói cách khác, làm thế nào chặt chẽ đan nó là) một mạng lưới kết nối hoàn hảo được gọi là một cliqueand có mật độ = 1. Một đồ thị có hướng sẽ có một nửa mật độ tương đương với vô hướng của nó, bởi vì có hai lần như nhiều cạnh có thể, tức là n (n-1). Mật độ rất hữu ích trong so sánh các mạng với nhau, hoặc làm tương tự cho các vùng khác nhau trong một mạng duy nhất.

Clustering: Hệ số phân nhóm của một nút là mật độ của vùng lân cận của nó (tức là mạng chỉ có duy nhất nút và tất cả các nút khác với nó). Ví dụ, nút 1 bên phải có một giá trị là 1, vì các nút láng giềng là 2 và 3 và các nút 1, 2 và 3 là hoàn toàn được kết nối (tức là nó là một "bè lũ”). Hệ số phân nhóm cho toàn bộ một mạng lưới là mức trung bình của tất cả các hệ số cho các nút của nó.

Average and longest distance: Con đường ngắn nhất dài nhất (khoảng cách) giữa bất kỳ hai nút trong mạng được gọi là đường kính của mạng lưới. Đường kính của các mạng lưới bên phải là 3, mà là một biện pháp hữu ích của mạng (như trái ngược với chỉ nhìn vào tổng số các đỉnh hoặc cạnh). Nó cũng cho thấy bao lâu để tiếp cận bất kỳ nút nào trong mạng.

Small Worlds:

Một worldis nhỏ một mạng trông gần như ngẫu nhiên, nhưng cuộc triển lãm một hệ số phân nhóm đáng kể cao (các nút có xu hướng cụm địa phương) và chiều dài đường dẫn trung bình (các nút có thể đạt được trong một vài bước tương đối ngắn) Nó là một cấu trúc rất phổ biến trong các mạng xã hội bởi vì bắc cầu trong quan hệ xã hội mạnh mẽ và khả năng của mối quan hệ yếu để đạt được trên các cụm (xem trang tiếp theo ...)

Mạng sẽ có nhiều cụm nhưng cũng có nhiều cầu giữa các cụm giúp rút ngắn khoảng cách trung bình giữa các nút

Sử dụng các bước được nêu trong các trang sau để hình dung và phân tích mạng riêng của bạn:

• Hãy suy nghĩ về các điểm chủ chốt trong mạng của bạn, các loại quan hệ mà bạn duy trì với họ, xác định bất kỳ cụm hoặc cộng đồng trong mạng của bạn.

•Mục tiêu: thực hành SNA với dữ liệu thực tế!

4.3 Giải bài toán tìm key player trên mạng xã hội

Cho đồ thị sau: • Ma trận kề (adjacency matrix): V1 V2 V3 V4 V5 V6 V7 V1 1 1 0 0 0 0 V2 1 1 0 1 0 0 V3 1 1 1 1 0 0 V4 0 0 1 0 0 0 V5 0 1 1 0 1 1 V6 0 0 0 0 1 0 V7 0 0 0 0 1 0

Tính degree, betweenness centrality , closeness centrality của từng nút trong đồ thị trên

- Tính degree centrality

• Công thức:

Trong đó:

n là số đỉnh của đồ thị

deg(v) các link trực tiếp của đỉnh v

• Áp dụng trong đồ thị G trên ta có

Đỉnh Degree centrality

V2 V3 V4 V5 V6 V7 - Tính betweenness centrality • Công thức: Trong đó:

σst là tổng số đường đi ngắn nhất từ đỉnh s tới đỉnh t

σst(v) là số đường đi ngắn nhất từ đỉnh s tới đỉnh t qua đỉnh v.

• Áp dụng: Đỉn

h Betweenness centrality V1

V3

V4

V5

V6 V7

Tính closeness centrality (A* search algorithm )

+Công thức:

Trong đó: là số bước đi từ đỉnh v tới đỉnh t

+Áp dụng: Đỉn closeness centrality

h V1 V2 V3 V4 V5 (tính tương tự như v1) V6 (tính tương tự như v1) V7 (tính tương tự như v1) Tính Clustering Coefficient (Hệ số cụm) Tính hệ số cụm cho từng nút + Công thức: + Áp dụng: Đỉn h Clustering Coefficient V1

V2 V3 V4 V5 V6 V7

Công thức tính hệ số cụm cho toàn mạng:

Tìm key player:

4.4 Chương trình

Một số giao diện chính chương trình:

Hình 4 6. Giao diện xử lý ma trận và tìm key player

Hình 4 7. Giao diện tính About của chương trình

KẾT LUẬN

Bài thu hoạch đã trình bày tổng quan về công nghệ WAVE và ứng dụng của công nghệ này vào các bài toán phân tích mạng xã hội. Trình bày những hiểu biết về công nghệ WAVE như sự hình thành, các tính chất, đặc điểm, các điểm mạnh của công nghệ WAVE so với các công nghệ hiện thời và ứng dụng của nó vào việc giải quyết các bài toán cụ thể. Trên cơ sở đó, tiến hành tạo dựng mạng tri thức trong WAVE tương ứng với các thông tin về đối tượng và quan hệ giữa các đối tượng thu thập được. Em tin tưởng rằng đây sẽ là cơ sở cho việc phát triển các ứng dụng lớn hơn nhằm hỗ trợ tối đa cho việc phân tích, định hình thông tin đang tồn tại trên các mạng xã hội hiện nay. Từ đó giúp giải quyết rất nhiều các bài toán nghiên cứu ứng dụng đang được đưa ra để phân tích về các hoạt động của con người dựa trên việc mô phỏng hoạt động ấy trên mạng xã hội.

Qua đây, bài thu hoạch cũng đưa ra vấn đề tìm key player trong mạng xã hội và xây dựng chương trình mô phỏng tìm key player cho mạng xã hội(mô hình bằng đồ thị).

TÀI LIỆU THAM KHẢO

[1] Slides bài giảng Cơ sở dữ liệu nâng cao của Thầy, PGS.TS. Đỗ Phúc. [2] Stephen P. Borgatti, “Indentifying sets of key players in a social network”,

2006.

[3] Borst, P.M., H.-T Goetz, P. S. Sapaty, and W. Xorn, “Paralled Knowledge Processing in Open Networks,” Proc. International Conference and Exhibition “High-Performance Computing in Networks” (HPCN Europe ‘94), Munich, Germany, April 1994.

[4] Corbin M. J., and P. S. Sapaty, “Distributed Object-Based Simulation in Wave,” J. Simul. Pract. Theory, Vol. 3, No.3, pp. 157-181, 1995.

[5] Livatharas, C., “Integration of Heterogeneous Databases Using WAVE,” M.Sc. Project Report, Department of Electrical Engineering, University of Surrey. Surrey, England, August 1995.

[6] Sapaty, P.S., “The Wave-0 Language as a Framework of Navigational Structures for Knowledge Bases Using Semantic Networks,” Proc. USSR Academy of Sciences: Technical Cybernetics, No. 5, 1986 (in Russian). [7] Varbanov, S. and P. S. Sapaty, “An Information System Based on the Wave

Navigation Techniques,” Abstr. International Conference, AIMSA’86, Varna, Bulgaria, 1986. [8] http://en.wikipedia.org/wiki/Social_network_analysis_software [9] http://en.wikipedia.org/wiki/Social_networking_service [10] http://www.everyday-wisdom.com/social-networking.html [11] http://www.oracle.com/technology/products/berkeley-db/index.html [12] http://www.whatissocialnetworking.com/

Một phần của tài liệu PHÂN TÍCH MẠNG XÃ HỘI DÙNG CÔNG NGHỆ WAVE VÀ ỨNG DỤNG TÌM KEY PLAYER (Trang 50)