Lý thuyết đồ thị và phân tích mạng xã hội

Một phần của tài liệu Kỹ thuật, công cụ phân tích mạng xã hội và thử nghiệm ứng dụng trong phân tích số liệu viễn thông (Trang 30 - 35)

Phân tích mạng xã hội có thể được khám phá và được trình bày bởi hai phương pháp khác nhau: Khoa học xã hội và khoa học toán học.

Khoa học toán học miêu tả và trình bày Phân tích mạng xã hội dựa trên lý thuyết đồ thị. Các khái niệm và độ đo liên quan tới phân tích mạng xã hội đến từ lý thuyết đồ thị. Một ưu điểm lớn nhất của lý thuyết đồ thị là các công thức toán học có thể được áp dụng để tính toán và được áp dụng trong các bài toán kinh doanh.

Các đồ thị có thể được xem xét là các cấu trúc toán học được sử dụng mô hình hóa các cặp quan hệ giữa các đối tượng khác nhau. Các đồ thị sẽ gồm tập các đỉnh hoặc các nút và tập các cạnh hoặc các liên kết (kết nối cặp các đỉnh hoặc các nút). Về cơ bản, việc miêu tả bằng đồ thị giống với miêu tả bằng khoa học xã hội, nhưng miêu tả bằng đồ thị sử dụng các công thức toán học. Dựa trên các công thức, có thể hoàn thành các thuật toán và do vậy áp dụng phân tích mạng xã hội cho các

23

bài toàn thực tế. Khoa học xã hội thường chỉ phù hợp với các mạng nhỏ, số lượng các nút và các liên kết hợp lý. Tuy nhiên, với các bài toán kinh doanh trong vài lĩnh vực công nghiệp như viễn thông, ngân hàng, và các công ty thẻ, mạng xã hội có thể là lớn, có số lượng các nút và các liên kết thực sự lớn. Ví dụ, công ty viễn thông trung bình có mười triệu khách hàng, một mạng thông thường có thể đạt được mười triệu các nút với một tỷ liên kết. Do vậy, dựa trên các phương pháp toán học, các thuật toán hiệu quả được hướng tới giải quyết các vấn đề kinh doanh trong các lĩnh vực công nghiệp trên.

Một đồ thị có thể là vô hướng hoặc có hướng. Các liên kết vô hướng nghĩa là không phân biệt giữa hai đỉnh được liên kết bởi mỗi cạnh; nói theo cách khác, không có hướng gắn với liên kết kết nối hai nút với nhau. Nút A liên quan tới nút B theo cách giống nhau với nút B liên quan tới nút A. Khái niệm này được hiểu đầy đủ khi xem xét về mối quan hệ như sau: Andre là người bạn của Bruno theo cách giống với Bruno là người bạn của Andre. Không có sự khác nhau giữa các liên kết kết nối các nút. Các liên kết có hướng nghĩa rằng có một sự chỉ dẫn trong mối quan hệ kết nối giữa hai nút phân biệt. Trong trường hợp này, nút A có thể liên quan tới nút B theo cách khác với nút B liên quan tới nút A. Trong viễn thông, các đồ thị truyền thông luôn luôn là có hướng: Nút A gọi tới nút B hoặc nút B gọi tới nút A. Tương tự, nếu Andre gọi tới Bruno 100 lần và Bruno gọi tới Andre chỉ mới 10 lần, sự khác biệt này sẽ là rõ ràng trong mạng xã hội. Cách để tạo ra rõ ràng trên bằng cách là thiết lập hướng cho các liên kết. Có hai phương pháp mà có thể biểu diễn trường hợp trên.

- Phương pháp thứ nhất là tạo ra một trăm liên kết (các mũi tên) từ Andre tới Bruno và thêm mười liên kết (các mũi tên) từ Bruno tới Andre.

24

Hình 2.2: Mô tả thiết lập kết nối bằng số lượng các đường kết nối

- Phương pháp thứ hai là tạo ra một liên kết (mũi tên) từ Andre tới Bruno và liên kết khác (mũi tên) từ Bruno tới Andre. Trong trường hợp này, liên kết từ Andre tới Bruno sẽ dầy gấp 10 lần so với liên kết từ Bruno tới Andre.

Hình 2.3: Mô tả thiết lập kết nối thể hiện bằng độ dầy của liên kết

Một trong những người đầu tiên sử dụng lý thuyết đồ thị là Leonhard Euler vào năm 1736, khi đó ông đã đề xuất giải pháp cho bài toán về bẩy cây cầu của Königsberg, được trình bày trong quyển sách của tác giả Barabási [2]. Hình 2.4 trình bày câu hỏi của bẩy cây cầu, một bài toán lịch sử trong toán học. Vì nhiều thành phố ở Châu Âu phát triển gần các dòng sông, Königsberg đã thiết lập các cạnh cùng nhau của Pregel River. Các thành phố gồm có hai đảo lớn được kết nối với đất liền bởi bẩy cây cầu. Bài toán đã được công thức hóa để tìm một cách để đi qua mỗi cây cầu chỉ một lần.

Euler đã đưa ra một đặc điểm quan trọng trong bài toán đặc biệt trên đó là sự liên tục của các cây cầu được đi qua. Do vậy, chúng ta có thể loại bỏ thứ hạng của các đặc điểm ngoại trừ danh sách các cây cầu kết nối hai vùng đất liền. Bài toán này là nền tảng của lý thuyết đồ thị. Ngoại suy khái niệm này tới phân tích mạng xã hội, mỗi vùng đất là một nút, và mỗi cây cầu là một liên kết. Cấu trúc toán học được gắn

A B A B 100 ... 10 ...

25

tới bài toán này được biết như là một đồ thị, và trong lĩnh vực khoa học xã hội, các thành phần cấu thành một mạng.

Hình 2.4: Bài toán bẩy cây cầu của Königsberg

Trong bài toán này, chỉ thông tin kết nối là thích hợp. Đồ thị có thể được biểu diễn theo các hình thức khác nhau ngoài việc thay đổi các kết nối giữa các cặp nút. Sự có mặt hoặc sự thiếu vắng một liên kết giữa một cặp các nút đại diện mọi thứ trong phân tích mạng xã hội. Các liên kết được xem xét khi thực hiện tính toán các độ đo mạng cá nhân cho các nút. Ví dụ, cấp độ của một nút là số lượng các nút liên quan tới nó. Các nút liên quan được thiết lập bởi liên kết giữa nút đang xét và một nút liên quan. Khi đó cấp độ độ đo của nút đang xét được tính toán bằng cách đếm số lượng các liên kết. Phân tích mạng xã hội nghiên cứu mối quan hệ bên trong các nút, và mối quan hệ được định nghĩa theo hoàn cảnh của các liên kết.

Quay trở lại bài toán bẩy cây cầu, Euler đã quan sát rằng, mỗi khi người đi bộ nhận một liên kết và đi tới một đỉnh bởi một cây cầu, người đi bộ rời đỉnh này bởi một cây cầu. Trong thực tế, khi đi bộ qua thành phố, số lần một người đi bộ đi vào một cây cầu bằng số lần người đi bộ này rời một cây cầu.

Trong toán học, Euler nói rằng tồn tại một đường đi trong một đồ thị phụ thuộc vào các bậc của các nút. Bậc của một nút là số lượng các liên kết mà nút có,

26

không quan trọng liên kết là đi tới nút hoặc đi ra từ nút. Quan trọng là số lượng các liên kết mà gắn tới nút. Khi đó, bằng sự quan sát của Euler, điều kiện cần thiết cho việc đi bộ qua các cây cầu đó là đồ thị được liên thông và có hai nút hoặc không có nút nào có bậc là lẻ.

Hình 2.5: Chu trình Euler cho bài toán bẩy cây cầu

Một phát biểu khác cho bài toán cây cầu đó là tìm một đường đi mà qua tất cả các cây cầu và, điểm xuất phát và điểm kết thúc giống nhau. Đường đi này được biết là Chu trình Euler. Đường đi này chỉ tồn tại nếu đồ thị là liên thông và không có nút nào có bậc lẻ. Nếu Chu trình này đi qua bẩy cây cầu chỉ một lần thì Chu trình Euler được gọi là Đường đi Euler. Hình 2.5 trình bày bài toán bẩy cây cầu.

Ngày nay, lý thuyết đồ thị được sử dụng thường xuyên cho việc tìm các cộng đồng trong các mạng. Các thuật toán phát hiện cộng đồng đã được tăng dần mỗi ngày, làm cho các thuật toán có thể đáp ứng các bài toán kinh doanh và các bài toán thực tế hơn. Các thuật toán không chỉ phát hiện các mạng nhỏ, các cộng đồng, hoặc các đồ thị con, mà còn phát hiện các cấu trúc của các mạng phân cấp, chu trình... Có thể áp dụng phân tích mạng xã hội cho nhiều loại bài toán khác nhau như bán hàng và tăng tốc độ bán hàng trong kinh doanh... Bằng việc hiểu các cộng đồng nhỏ và

27

các cấu trúc của chúng, có thể hiểu được hành vi của cộng đồng (mạng) và cũng là cách các mạng lan truyền theo thời gian, thậm chí cho phép vài dự đoán.

Các kiểu ứng dụng thực tế của phân tích mạng xã hội ngày càng tăng. Phân tích mạng xã hội sẽ có thể hướng tới ngày càng nhiều loại bài toán trong tương lai bằng cách sử dụng phương pháp luận này. Các loại công nghiệp khác nhau, các quy mô khác nhau sẽ có thể là đích của các bài toán kinh doanh, đặc biệt là những bài toán liên quan tới các mối quan hệ và hành vi, bằng cách sử dụng kỹ thuật phân tích mạng xã hội.

Có hai phương pháp khác nhau cho việc sử dụng phân tích mạng xã hội trong viễn thông.

- Phương pháp đầu tiên là sử dụng phân tích mạng xã hội cho sự khuấy động, trong đó bao gồm việc xác định các khách hàng có ảnh hưởng nhất, khách hàng này có thể dẫn dắt khách hàng khác rời khỏi công ty.

- Phương pháp thứ hai là sử dụng phân tích mạng xã hội cho việc mua hàng, xác định lại một lần nữa những khách hàng có khả năng dẫn dắt các khách hàng khác mua các sản phẩm tương tự trong tương lai. Những khách hàng có ảnh hưởng này được xác định dựa trên các mối quan hệ bên trong mạng xã hội. Các độ đo mạng liên quan đến bậc, khoảng cách và đường đi sẽ định nghĩa khả năng là người có ảnh hưởng và mức độ ảnh hưởng của họ tác động đến các khách hàng khác. (adsbygoogle = window.adsbygoogle || []).push({});

Một phần của tài liệu Kỹ thuật, công cụ phân tích mạng xã hội và thử nghiệm ứng dụng trong phân tích số liệu viễn thông (Trang 30 - 35)