Một số độ đo trung tâm điển hình trên đồ thị- 123docz.net

5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

2.10 Một số độ đo trung tâm điển hình trên đồ thị

Trong đồ thị G ở hình 2.10 này, đỉnh j có CD[j] = 7 là độ trung tâm cao nhất trong G. Tương tự, độ trung tâm gần CC[i] = 0,461538, độ trung tâm trung gian BC[h] = 176 cũng là lớn nhất. Ngoài ra, độ trung tâm vector riêng tại đỉnh d cũng đạt giá trị lớn nhất xd = 0,4647 trong số các đỉnh còn lại trong đồ thị này.

Trong thực tế, các độ đo trung tâm này có thể có các biến thể khác với cách cài đặt sử dụng giải thuật khác nhau [79].

Trong luận án này, với mục tiêu đặt ra, chúng tôi sẽ chú trọng đến việc nâng cao hiệu năng thi hành các phép tốn đồng thời và tính một số độ đo trung tâm đối với các đồ thị có quy mơ lớn cả về số đỉnh lẫn số cạnh (lớn hơn triệu đỉnh/cạnh). Hiển nhiên, các phương thức nâng cao hiệu năng của chúng tôi cũng phải đảm bảo hoàn toàn áp dụng được với các đồ thị quy mơ trung bình và nhỏ. Ý tưởng chính trong việc nâng cao hiệu năng này một phần được dựa trên phương pháp thi hành song song. Như đã trình bày ở mục 1.2, để giải quyết các thách thức liên quan đến phân tích đồ thị quy mơ lớn, tất cả các cách tiếp cận hiện nay đều sử dụng phương pháp tính tốn song song. Từ đó, phần lý thuyết liên quan đến tính tốn song song sẽ được trình bày sơ lược trong mục 2.4 dưới đây.

2.3.3 Mật độ đồ thị

Định nghĩa 2.24. Độ đo mật độ (density) được định nghĩa dựa trên độ đo số cạnh của đồ thị trên tổng số cạnh tối đa có thể có đối với tập đỉnh của đồ thị đó [109]. Cơng thức tính mật độ đồ thị D được định nghĩa như sau:

D= 2|E|

|V|(|V| −1) (2.5)

với G là đồ thị đơn vô hướng. Trong trường hợp G là đồ thị đơn có hướng, D được tính như sau:

D= |E|

|V|(|V| −1) (2.6)

Như vậy, với đồ thị đầy đủ vơ hướng thì D = 1và với một số trường hợp đặc biệt, mật độ đồ thị có thể có giá trị lớn hơn 1, chẳng hạn với đồ thị có vịng lặp tại các đỉnh (solving

loops). Mật độ đồ thị cho phép chúng ta phân biệt được đồ thị dày (dense graph) và đồ thị thưa (sparse graph) tương ứng với giá trị D tiệm cận giá trị 1 hay khi có giá trị rất nhỏ.

2.3.4 Phân cụm đồ thị

Định nghĩa 2.25. Phân cụm đồ thị (graph clustering) là quá trình phân chia đồ thị thành nhiều nhóm mà mỗi đỉnh trong nhóm có độ tương tự (chẳng hạn độ trung tâm gần) lớn hơn so với các đỉnh ở nhóm khác [93].

Để phục vụ cho bài toán phân cụm đồ thị, hệ số phân cụm (Clustering Coefficient) đã được đề xuất [94]. Đây là độ đo mức độ mà các đỉnh trong đồ thị có xu hướng nhóm lại được với nhau. Thực tế đối với các đồ thị mạng xã hội, các thành viên thường hình thành các nhóm liên kết tương đối chặt với nhau với các quan hệ xã hội thơng thường. Từ đó, hệ số phân cụm cho phép đánh giá mức độ hình thành nhóm của một số các đỉnh trong đồ thị.

2.4 Tính tốn song song

Định nghĩa 2.26. Tính tốn song song (parallel computing) là kiểu tính tốn trong đó nhiều phép tính (hoặc việc thi hành nhiều tiến trình) được tiến hành một cách đồng thời dựa trên nguyên tắc những bài tốn lớn đều có thể chia thành nhiều bài tốn nhỏ hơn có thể tiến hành đồng thời [42].

Tính tốn song song đã được sử dụng rộng rãi từ nhiều năm qua với mục tiêu rút ngắn thời gian thi hành của các bài tốn cần tính tốn nhanh [4]. Có nhiều hình thức thể hiện của tính tốn song song: (i) song song mức bit, (ii) mức lệnh trong CPU, (iii) mức dữ liệu, hay (iv) mức tác vụ [1]. Hiện nay, tính tốn song song đã trở thành một dạng thức (paradigm) thống trị trong lĩnh vực kiến trúc máy tính dưới dạng các bộ vi xử lý đa nhân (multi-core) [102]. Hầu hết các máy tính hiện nay đều có nhiều nhân và các hệ điều hành khai thác hạ tầng tính tốn trên các máy tính đó đều vừa được xây dựng dựa trên các phương pháp tính tốn song song, vừa cung cấp các thư viện cho phép triển khai được các phép tính đồng thời. Các phép tốn khi được triển khai theo mơ hình tính tốn song song thường được gọi các các phép toán tương tranh [5]. Việc thi hành các phép tốn tương tranh nói chung cần phải có phương pháp phối hợp giữa các phép tốn đó để việc thao tác với những vùng dữ liệu chung hay sử dụng các kết quả lẫn nhau được tiến hành một cách nhất quán, đảm bảo sự tin cậy của kết quả tính tốn [3]. Việc các hệ thống máy tính ngày nay đều hỗ trợ khả năng đa nhiệm, đa người dùng chính là dựa vào những thành quả của việc giải quyết các bài tốn tương tranh và khai thác được thế mạnh tính tốn song song trên các bộ vi xử lý hiện đại.

Việc đánh giá hiệu năng của các mơ hình tính tốn song song hiện nay thường sử dụng luật Amdahl (Amdahl’s Law) [3]. Amdahl cho rằng hệ số tăng tốc của một chương trình song song được xác lập dựa vào tỷ lệ mã (code) P của chương trình đó được song song hố:

SpeedU p= 1

1−P (2.7)

Từ đó, nếu khơng có phần nào trong chương trình được song song, hệ số tăng tốcSpeedU p= 1. Nếu tất cả mã của chương trình được song song hố thì SpeedU p = ∞. Tuy nhiên đây

chỉ là trường hợp phi thực tế vì khơng tồn tại chương trình nào mà tất cả mã đều song song được.

Khi xét thêm số lượng CPU tham gia vào tính tốn song song, hệ số này được xác định bằng biểu thức sau:

SpeedU p= 1

S+NP (2.8)

trong đó, P là tỷ lệ mã song song, N là số lượng CPU và S là tỷ lệ mã tuần tự. Tương quan của các tham số này được minh hoạ cụ thể như hình sau:

Một số độ đo trung tâm điển hình trên đồ thị

Lược đồ tổ chức luận án

Một số kiểu đồ thị cơ bản