Bài viết đưa ra một cách tiếp cận tổng quát, đề xuất một mô hình đồ thị ngẫu nhiên khái quát, sử dụng tiếp cận “thêm liên kết ngẫu nhiên vào một đồ thị cơ sở” nói trên. Chúng tôi khảo sát mô hình này và cho thấy nhiều mô hình TGN và thiết kế tô-pô cụ thể đã có có thể coi là trường hợp riêng của mô hình phổ quát này.
Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-1, Số 11 (31), tháng 6/2014 Về điều kiện đủ cho đồ thị ngẫu nhiên đường kính nhỏ, giúp phân tích mạng giới nhỏ Analyzing Small-Worlds: A Sufficient Condition for Obtaining Small Diameter in A New Random Graph Model Nguyễn Khanh Văn Abstract: Network structures and graphs that feature the Small-World property have drawn a strong interest from the research community in two perspectives: 1) The Small-world effect is a popular phenomenon amongst several real-world complex networks; 2) Small-world graphs are considered very useful tools to model real-world complex networks as well as to design new topologies for certain applications in computer networks We propose to study a new general random graph model that can be used to analyze the small-world effect (such an approach is already widely used) Our main result is to construct a general sufficient condition for this graph model to have logarithmic diameter, i.e O(logn) for n as the number of the vertices This result can help to assess and analyze several new graphs model for small-worlds Keyword: Small-world networks, routing, random graphs, network design diameter, I GIỚI THIỆU Tính chất thế-giới-nhỏ (TGN) đặc trưng tương đối phổ quát nhiều cấu trúc mạng phức tạp quan sát nhiều mặt khoa học đời sống, mạng xã hội, mạng sinh học, mạng lưới cung cấp điện, hay mạng liên kết vật lý Internet Sự biểu lộ TGN mô tả hai yếu tố: 1) có đường kính đồ thị nhỏ (thường đa thức lo-ga-rit kích thước mạng) 2) xu hướng tạo cộng đồng (clustering) Hiện tượng TGN lần đề cập giới khoa học qua cơng trình Milgram mạng xã hội dựa thí nghiệm chuyển thư giới thiệu để xác lập chuỗi quen biết [18] Watt Strogatz thức đặt móng cho địa hạt nghiên cứu [22], thu hút quan tâm từ nhiều giới khác nhau, toán học vật lý (nghiên cứu cấu trúc chung), xã hội học (các mạng xã hội, ví dụ mạng quan hệ diễn viên, quan hệ đồng tác giả, quan hệ qua Facebook), sinh học (các mạng sinh học) nhà tin học (Internet dạng mạng máy tính cấu trúc tơ-pơ liên kết) Kleinberg đưa mơ hình khác [10], phát triển từ mơ hình Watt-Strogatz, đem lại cách nhìn cho tượng này, đậm nét ý nghĩa thuật tốn (định tuyến tìm kiếm thơng tin) Các mơ hình TGN nói dựa vào tiếp cận Đó việc tạo tô-pô mạng ngẫu nhiên thông qua việc cải biến đồ thị sở ban đầu cách thêm vào (hay thay bằng) mối liên kết ngẫu nhiên (random link) Thông thường đồ thị sở đơn giản, lưới chiều nhiều chiều (ring, grid,…), liên kết ngẫu nhiên tuân theo phân phối xác suất tương đối đơn giản Trong mơ hình WattStrogatz, phân phối ngẫu nhiên đồng (uniform random) cịn mơ hình Kleinberg, phân bố có tính tới yếu tố khoảng cách địa lý, mô tả chi tiết phần II báo Rất nhiều mơ hình thiết kế mạng ứng dụng tính chất TGN sử dụng tiếp cận Tuy nhiên cịn nghiên cứu đề cấp mơ hình mang tính tổng qt theo tiếp cận nói đưa điều kiện tổng qt để -83 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT đảm báo cho đường kính nhỏ, điều kiện tiên tính TGN Trong báo này, đưa cách tiếp cận tổng qt, đề xuất mơ hình đồ thị ngẫu nhiên khái quát, sử dụng tiếp cận “thêm liên kết ngẫu nhiên vào đồ thị sở” nói Chúng tơi khảo sát mơ hình cho thấy nhiều mơ hình TGN thiết kế tơ-pơ cụ thể có coi trường hợp riêng mơ hình phổ qt Mặt khác, đóng góp chúng tơi đề xuất điều kiện đủ tổng quát đảm bảo tính chất đường kinh nhỏ bậc lo-ga-rit kích thước mạng Định lý tổng quát cho phép khảo sát hiệu đường kính loạt mạng TGN biết, qua thể cơng cụ hữu ích cho việc phân tích đồ thị TGN mới, đồng thời giúp xây dựng thiết kế tô-pô TGN cho nhiều mơ hình mạng thực tế Trong nhiều trường hợp ta chứng minh đường kính đồ thị O(logn) nhanh gọn nhiều so với cách làm biết trước Sau để thuận tiện, chữ viết tắt ĐTNN thay cho “đồ thị ngẫu nhiên” LKNN thay cho “liên kết ngẫu nhiên” dùng báo II TỔNG QUAN VỀ MƠ HÌNH THẾ GIỚI NHỎ VÀ NGHIÊN CỨU LIÊN QUAN Trong mục chúng tơi xin giới thiệu số mơ hình TGN kết nghiên cứu quan trọng liên quan Watts Strogatz đặt tảng cho khái niệm mạng TGN sở [22] Trong mơ hình WattsStrogatz, đồ thị sở tập nút vòng tròn (ring lattice, tức lưới chiều), mà nút có cạnh nối đến k nút láng giềng gần (trên ring này) với tham số k cho trước Sau với cạnh (u,v) đồ thị sở, với xác suất β (tham số cho trước), thay LKNN (u,w) mà w chọn theo ngẫu nhiên đồng nhất, tránh để xảy liên kết vòng đúp Với β số dương 4, đồ thị trở thành “thê-giới-lớn” có đường kính θ(nc), với c số dương) Trong [7,8], tác giả tổng qt hóa mơ hình Kleinberg với việc sử dụng đồ thị sở tùy ý để khảo sát tính “searchability” dạng khái qt Bài tốn xây dựng đường tối ưu mà viếng thăm số nút hạn chế giải [9] Bên cạnh hai thuộc tính TGN (về đường kính hệ số tương hỗ), nhiều mạng phức hợp giới thực cịn thể thuộc tính phổ qt khác phân bố bậc đỉnh không đều, mà trái lại theo hàm lũy thừa Tính chất phổ quát thường gọi Luật Lũy thừa (power law), địa hạt quan tâm nghiên cứu đa ngành Trong số nhiều mơ hình nghiên cứu, chúng tơi ý đến mơ hình quan trọng Chung-Lu chia sẻ nhiều điểm chung với dạng mơ hình giới nhỏ quan tâm báo [3,4] Mơ hình Chung-Lu, ký hiệu G(w), có đồ thị sở tập n đỉnh mà gắn với vec-tơ trọng số w=(w1, w2, …, wn) thể chuỗi giá trị bậc đỉnh chờ đợi đồ thị thu (“sequence of expected -84 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-1, Số 11 (31), tháng 6/2014 degrees”) Các LKNN sinh độc lập cho cặp đỉnh ui uj với xác suất ~ wiwj Các tác giả sử dụng mơ hình để nghiên cứu thành cơng vài dạng đồ thị giới thực đồ thị liên kết vật lý Internet, mà luật Lũy thừa quan sát thấy Sử dụng mơ hình tác giả cho thấy tính chất TGN, tức đường kính nhỏ, thể đồ thị liên kết Internet kiện đủ để đạt đường kính đồ thị logarit), có nghĩa hướng tới đóng góp vào lý thuyết thành hình TGN Ý tưởng khái quát, đồng thời khác biệt báo với cơng trình trước, nằm việc đưa mơ thức khái qt hóa mô tả chi tiết mục III.2 Khảo sát cho thấy tính phổ biến mơ thức xây dựng mơ hình qua kết hợp đồ thị sở giàu liên kết cục với phân phối liên kết ngẫu nhiên đó, mà phản ánh yếu tố địa lý (mơ hình Kleinberg) Điều đặc biệt phù hợp với đồ thị liên kết vật lý Internet Yook cộng quan sát thấy qui luật liên kết vật lý Internet có xu hướng phổ biến với khoảng cách ngắn [23] Tính “distance bias” quan sát nghiên cứu chiến thuật tìm đường địa lý (“geographic routing”) mạng xã hội [14] Trong báo tiếng Luật Lũy thừa Falousos el al [6] đề cập nhiều yếu tố địa lý việc hình thành mạng Internet III.1 Định nghĩa khái niệm sở Các mơ hình TGN đem lại nhiều ứng dụng lý thú nhiều tốn thiết kế tơ pơ mạng đa dạng Ứng dụng mơ hình TGN Kleinberg tạo nên số kiến trúc mạng đồng đẳng có hiệu cận tối ưu [15,16] Việc sử dụng LKNN theo mẫu hình TGN đem lại tiếp cận thiết kế mạng liên kết cho siêu máy tính hay trung tâm liệu cỡ lớn đại So với tiếp cận truyền thống hơn, tiếp cận cho phép giảm thiểu độ trễ truyền tin [12], nâng cao khả mở rộng mạng mềm dẻo (scalability) [21], hay tối ưu chi phí cáp truyền tin [20] ĐTNN truyền thống Erdőse Rényi đặt móng [5]; kết quan trọng hệ thống hóa trình bày lại sách chun khảo Bollobas [2] Bài báo thừa kế tiếp cận nghiên cứu chung TGN phát triển từ lâu chúng tơi [17,19,20] Bài báo nói kết sâu theo hướng tổng qt hóa, nhằm tìm đến tri thức chung TGN (tức đề xuất điều III MƠ HÌNH ĐỒ THỊ NGẪU NHIÊN ĐỀ XUẤT Định nghĩa 3.1 Gọi H(V, w, E) đồ thị sở vơ hướng có tập đỉnh V với trọng số xác định vec-tơ w={wu, u∈V} với tập cạnh E (mà cách cạnh gọi liên kết cục bộ) Gọi τ họ phân phối xác suất {τ = τu, u∈V} mà phân phối xác định tập đỉnh V, tức ứng với đỉnh u∈V có hàm xác suất τu(v) xác định cho v∈V Với cặp (H,τ) cho trước, mạng ngẫu nhiênNAN (H, τ) đồ thị phát triển từ sở H theo cách sau: với đỉnh u∈V ta thêm vào wu liên kết ngẫu nhiên (cũng gọi liên kết tầm xa), từ đỉnh u tới đỉnh v∈V chọn với xác suất τu(v) (NAN viết tắt theo tên tiếng Anh: Node-based Augmented Networks) Chúng sử dụng số khái niệm ký pháp liên quan sau Ký pháp G= NAN (H, τ) cho biết đồ thị ngẫu nhiên G sinh từ mơ hình phát triển NAN theo định nghĩa Để tiện ta dùng ký hiệu v←V để đỉnh v chọn ngẫu nhiên từ tập đỉnh V theo phân phối τ, ký hiệu v theo ngẫu nhiên đồng V chọn Với tập S⊆V, trọng số S, ký hiệu wS, tổng trọng số đỉnh S, Σu∈Swu Với số k>0, đồ thị sở H gọi k-heavy đỉnh V có trọng số k Ví dụ 3.1 Mạng giới nhỏ Kleiberg [13], dạng vô hướng, coi tạo NAN (H, τ) H đồ thị lưới (grid) n×n với đỉnh có -85 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-1, Số 11 (31), tháng 6/2014 trọng số 1; τ phân phối nghịch-bình phương: τu(v)∼d-2(u,v) Khoảng cách d(u,v) độ dài đường ngắn để từ u đến v đồ thị lưới H Bổ đề 3.1 Với số α>1 dương β0,c’>0, ∀n>c’: 0≤f(n)≤ e-cn (1) Với hàm g(n) cho ta viết f(n)=eNeg(g(n)), nếu: ∃c>0,c’>0, ∀x>c’: 0≤f(n)≤ e-cg(n) (2) Ngoài ra, ta ký hiệu eNP(n) cho lớp eNeg(g(n)) g(n) đa thức n Ta ký hiệu xác suất kiện E Pr[E] Sự kiện E(n) gọi xảy với xác suất lớn, ký hiệu VHP, Pr[E(n)] = 1-eNeg(n) với n tiến vô Đồng thời nói E(n) xảy với xác suất VHP(f) Pr[E(n)] = 1-eNeg(f(n)) Một biến ngẫu nhiên X=X(n) gọi có xu khơng thua Y=Y(n), ký hiệu X≥xtY với a>0, Pr[X0 Bên cạnh tính phát tán để thu đường kính nhỏ, đương nhiên ta cần có lượng LKNN đủ lớn, hay xác mật độ LKNN đủ lớn Định nghĩa 3.5 Đồ thị H(V, w, E) ξ-nặng đỉnh u có trọng số wu≥ξ Với điều kiện khái quát đề xuất trên, xin đưa kết báo Định lý Xét ĐTNN G=NAN (H,τ) với H đồ thị liên thông Giả sử tồn số dương λ,µ,ν mà 1>µ>ν cho H λ-nặng cịn τ (µ,ν)-pt Thế G có đường kính O(logn) với xác suất 1-o(n-2) III.3 Ý nghĩa ứng dụng kết Định lý khái niệm đề xuất liên quan đưa tiếp cận để phân tích đánh giá đường kính đồ thị mạng TGN Xin đưa số ví dụ ứng dụng cụ thể Dễ thấy mơ hình Watts-Strogatz coi thể NAN (H, τ), τ phân phối ngẫu nhiên đồng nhất, tức τu(v1)= τu(v2) ∀ v1≠u,v2≠u: v1≠v2; từ dễ thấy đồ thị thỏa mãn (µ,ν)-pt ∀ µ,ν∈[0,1) Vì theo định lý 1, mơ hình Watts-Strogatz với tham số β>0 có đường kính đồ thị O(logn) Tập V-1, Số 11 (31), tháng 6/2014 dễ thấy đồ thị (µ,ξ)-giãn với số µ,ξ∈[0,1) thỏa mãn µ+ξ0,∀C⊂V: mãn (µ,ν)-pt ∀µ,ν∈(0,1) Vì theo định lý 1, mơ hình Kleinberg với α=2 có đường kính đồ thị O(logn) Ta có chứng minh kết tương tự với mơ hình TGN khác Kleinberg, đồ thị sở thay lưới [10] Ta thử đánh giá khái quát đường kính đồ thị liên kết vật lý Internet (theo cấp router theo cấp AS, tức hệ thống tự trị) theo tiếp cận sử dụng mơ hình NAN (H, τ) Falousos et al quan sát thấy với bán kính R đủ nhỏ, lân cận bán kính R (khoảng cách địa lý) chứa số nút mạng tỉ lệ với Rα; α biến đổi theo vùng α≈1 [6] Mặt khác khoảng cách tương đối xa, xu hướng kết nối quan sát có xác suất tỷ lệ nghịch với lũy thừa bậc β khoảng cách địa lý, β biến đổi nằm khoảng (1,2) [23,6] Vậy ta mơ đồ thị Internet NAN (H,τ) với H lưới xấp xỉ chiều, τ thỏa τu(v)∼d-β (u,v) Tính tốn cho thấy đồ thị thỏa mãn (µ,ν)-pt có 1>µ>ν>β−1 (thỏa mãn β∈(1,2)) Vậy đường kính đồ thị mạng O(logn) Trên nêu khảo sát ngắn gọn số mơ hình TGN khác nhau, với tiếp cận ứng dụng mơ hình NAN (H, τ) Cịn có nhiều hướng tiếp cận khác, điều kiện hạn chế dung lượng báo không nêu đây, khảo sát mơ hình Kleinberg tổng qt (α bất kỳ) hay đồ thị mô luật lũy thừa (chúng công bố kết báo cáo nghiên cứu tương lai) Có thể nói, đóng góp báo cung cấp cơng cụ mơ hình lý thuyết để phân tích đồ thị TGN giới nghiên cứu quan tâm trước Tuy Ở ta đề cập mơ hình Kleinberg (α=2) thể NAN (H, τ) với τ tuân theo luật tỷ lệ nghịch bình phương Khảo sát mơ hình này, Bên cạnh đó, ý ∀µ∈(0,1) ∃ξ>0 để đồ thị (µ,ξ)giãn µ>>ξ -87 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT nhiên kết mang tính lý thuyết mang lại ý nghĩa thực tiễn thơng thường hiểu biết sâu sắc mơ hình TGN đem lại tư tưởng thiết kế mới; ví dụ số thiết kế mạng đồng đẳng (P2P) có ảnh hưởng mơ hình TGN [15,16] Thật vậy, điểm qua mục II, cơng trình khác thiết kế mạng liên kết (ứng dụng cho siêu máy tính trung tâm liệu đại) [20] ứng dụng ý tưởng mơ hình TGN; chúng tơi thiết kế liên kết xa (được gọi shortcut) theo cách mơ LKNN mơ hình TGN tổng qt (có tính “giãn” “phát tán”) nhằm đạt đường kính đồ thị logarit Để thấy rõ ý nghĩa thực tiễn xin tham khảo chi tiết [20] III.4 Ý tưởng cấu trúc chứng minh định lý Để chứng minh định lý 1, trước hết khảo sát trường hợp đơn giản bản, phân phối τ phân phối đồng (mỗi đỉnh v có hội để thu hút LKNN từ đỉnh u) Đây tốn có tầm quan trọng tính độc lập định có liên hệ chặt chẽ với đồ thị ngẫu nhiên truyền thống (Erdos-Renyi) Sau sử dụng kết khảo sát toán (được phát biểu thành định lý mục IV) làm sở để chứng minh định lý Tập V-1, Số 11 (31), tháng 6/2014 Ý tưởng là, sử dụng tính (µ,ν)-pt, ta phân rã V thành tập đỉnh rời nhau, tập có nµ đỉnh, cho đường kính đồ thị nội tạo thành từ tập đỉnh O(logn) Vì vậy, khơng tính tổng qt, ta thu giảm tốn thành xét siêu đồ thị mà siêu đỉnh đại diện cho tập đỉnh nói (có n1-µ siêu đỉnh) minh họa Hình Tiếp sử dụng Định lý để chứng minh siêu đồ thị có đường kính O(1), tức suy đpcm (điều phải chứng minh)! IV KHẢO SÁT TRƯỜNG HỢP τ LÀ PHÂN PHỐI ĐỒNG NHẤT Trong mục này, ta khảo sát đường kính ĐTNN theo mơ hình NAN (H,τ) τ phân phối đồng nhất; có nghĩa tạo LKNN cho đỉnh u theo τ, ta chọn đích v theo luật chọn ngẫu nhiên đồng (uniform random) từ tập đỉnh V\{u} Mơ hình trường hợp NAN (H, τ=uniform) định nghĩa lại sau Mơ hình đồ thị ngẫu nhiên J - Định nghĩa 4.1 Một đồ thị ngẫu nhiên J(n,Z) sinh theo mơ hình J, ký hiệu J=J(n,Z), đồ thị có n đỉnh cạnh tạo sau: từ đỉnh u đồ thị, độc lập sinh Z cạnh nối tới đỉnh v V Rõ ràng J(n,Z) NAN (H, τ=uniform) với H đồ thị gốc có n đỉnh (khơng cạnh) với trọng số Z; dễ thấy, kỳ vọng bậc đỉnh 2Z Mơ hình gần gũi với mơ hình đồ thị ngẫu nhiên truyền thống Erdős–Rényi, ký hiệu G(n, p) cạnh tạo ngẫu nhiên với xác suất p cho cặp đỉnh (trong số n đỉnh cho trước) Nếu chọn p=Z/2n, đồ thị sinh từ mơ hình phiên giống nhau, nhiên có chút khác biệt: có phụ thuộc phần sinh cạnh J(n,Z) Vì vậy, Hình Minh họa thu giảm siêu đồ thị mà tồn đường dẫn độ dài O(1) cặp đỉnh bậc đỉnh J Z, cịn G bậc đỉnh nhỏ, chí dù với xác suất nhỏ -88 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Định lý sau kết mục Tập V-1, Số 11 (31), tháng 6/2014 Định lý Xét đồ thị ngẫu nhiên J= J (n,Z) phân biệt v1, v2,…, vm từ V\{u} tạo m cạnh nối (u, vi) Z=Z(n) thỏa mãn có số nguyên dương d để Zd/n Zd+1/(nlogn) ∞, n ∞ Thế diam(J)≤d+4 với VHP(Z) So sánh I với J Sự khác biệt I cạnh sinh ngẫu nhiên cạnh đơn (nghĩa khơng thể có nhiều cạnh nối đỉnh đó) Để chứng minh định lý 2, ta thơng qua kết Mơ hình đồ thị ngẫu nhiên H - Định nghĩa 4.3 Một đồ thị ngẫu nhiên I(n,p) sinh theo mơ hình gần tương tự đường kính đồ thị G(n, p) Bổ đề 4.2 Xét đồ thị ngẫu nhiên theo mơ hình H, ký hiệu H= H (n,p), đồ thị có n đỉnh từ đỉnh u, ta tạo ngẫu nhiên cạnh nối với đỉnh v khác với xác suất p Erdős–Rényi G= G(n,Z) thỏa mãn có So sánh H với G Sự khác biệt tương đối nhỏ Đây kết cổ điển mô hình truyền thống (có thể tham khảo [2]) số nguyên dương d để (np)d+1/(nlogn) ∞ Thế VHP(np) d (np) /n diam(G)=d+4 với Ví dụ để điều kiện thỏa mãn chọn logn (tức np= logn) Thậm chí cho p= Bollobas cịn cung cấp kết mạnh hơn: diam(G) tập trung quanh hai giá trị d d+1 với d số hay hàm tăng chậm theo n Việc sử dụng kỹ thuật kỹ thuật cổ điển (như dùng [1] để chứng minh bổ đề 4.2) để chứng minh định lý thực khó phức tạp Vì vậy, chúng tơi phát triển phương pháp riêng, dựa vào bổ đề 4.2, thông qua ý tưởng so sánh đường kính đồ thị theo mơ hình gần tương tự Như phân tích trên, ta thấy mơ hình J(n,Z) G(n,Z) gần tương tự Mối liên hệ đường kính đồ thị dạng mơ hình khảo sát xây dựng thơng qua việc so sánh đường kính đồ thị mơ hình trung gian, đem lại chuyển biến khác biệt nhỏ mơ hình J G Sau chúng tơi giới thiệu mơ hình trung gian H I Lưu ý mô hình đồ thị mà ta xét (G, H, I J ) vơ hướng Mơ hình ĐTNN I - Định nghĩa 4.2 Một đồ thị ngẫu nhiên I(n,m) sinh theo mơ hình I, ký hiệu I= I(n,m), đồ thị có n đỉnh với đỉnh u∈V(I) ta chọn ngẫu nhiên tập hợp mp Chứng minh định lý Ý tưởng chứng minh sau Với n Z cho trước, ta chọn p= xét việc sinh đồ thị ngẫu nhiên G= G(n,p= ), H= H (n,p) I= I(n,m= ) Ở ta chọn p m, để cho mật độ cạnh sinh dày dần lên dãy G, H, I J Do ta chứng minh diam(G) ≥xt diam(H) ≥xt diam(I) ≥xt diam(J) Do suy điều phải chứng minh nhờ sử dụng bổ đề 4.2 Để chứng minh chuỗi bất đẳng thức xác suất đưởng kính trên, đề xuất kỹ thuật so sánh dựa quan sát riêng sau Để chứng minh diam(X) ≥xtdiam(Y) với X Y đồ thị dạng trên, đưa khái niệm quan hệ đồ thị ngẫu nhiên X Y, ký hiệu X 〉 Y, sau Ta nói X 〉 Y tồn q trình ngẫu nhiên có giai đoạn: giai đoạn với xuất phát đồ thị rỗng có n đỉnh ta thêm dần vào số cạnh ngẫu nhiên, kết thúc giai đoạn ta thu thể X; giai đoạn ta tiếp tục thêm vào số cạnh ngẫu nhiên khác song song với việc tỉa bỏ số cạnh kiểu suy biến vịng (nguồn đích một), cuối ta thu thể Y Nói cách khác, q trình ngẫu nhiên nói sinh dần LKNN thể qua mã -89 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-1, Số 11 (31), tháng 6/2014 chương trình M gồm phần M1 M2, ta viết M=M1||M2, cho M sinh Y M1 sinh X Những cạnh suy biến vòng song song (thêm vào trùng lặp với LKNN có) ta coi khơng đáng quan tâm I(n,m= ) biết Sau bước chứng Mở rộng khái niệm, ta nói X 〉e Y tồn trình ngẫu nhiên bổ sung dần LKNN khơng suy biến vịng, gồm giai đoạn, thể dạng mã chương trình M=M1||M2, mà với xác suất 1-eNeg(n) M1 sinh X cịn M sinh Y Tương tự, ta nói X 〉e(f(n)) Y với xác suất nói 1eNeg(f(n)) (ngay sau phần định nghĩa H), ta coi H Từ ta có quan sát hiển nhiên Quan sát RG-A Nếu X〉〉Y hay X〉〉eY diam(X) ≥xt diam(Y) Quan sát hiển nhiên thuộc tính bất biến đường kính đồ thị: Nếu X đồ thị đồ thị Y diam (X)≥diam (Y) Quan sát RG-B Giả sử H=(V,W,E) đồ thị sở có vector trọng số W Xét phân phối LKNN τ τ’ H Giả sử τ có xu τ’ nghĩa với cặp đỉnh phân biệt u,v ∈V τu(v) ≤ τ’u(v) Thế với hai ĐTNN sinh từ sở H X= NAN (H, τ) Y= NAN (H, τ’) ta có X〉〉Y Để minh chứng cho quan sát này, ta xây dựng q trình ngẫu nhiên với mã M=M1||M2 sau Với đỉnh u, M1sẽ thực sinh thêm Wu liên kết ngẫu nhiên theo phân phối τ, tức tạo thể X Đoạn mã M2 thực việc sau: với cạnh vịng (đỉnh nguồn đích một) sinh M1 ta xem xét thay LKNN từ u tới đỉnh v khác với xác suất τ’ ( ) τ ( ) τ ( ) Dễ thấy M trình sinh dần LKNN cuối sinh thể Y Vậy suy X〉〉Y Theo quan sát RG-A, rõ ràng chứng minh định lý chứng minh G 〉 H 〉e I 〉e J với G= G(n,p= ), H= H (n,p) I= minh cụ thể Chứng minh G〉〉H hiển nhiên thông qua quan sát RG-B theo so sánh G H ta nói sinh G(n,2p-p2) bổ sung thêm số cạnh song song không đáng quan tâm Giờ ta chứng tỏ H 〉e I Ta xây dựng trình ngẫu nhiên M=M1||M2 sau Trước hết sinh H, M1 cho đỉnh u sinh LKNN nối với v≠u với xác suất p Ta gọi Ru biến ngẫu nhiên đếm số liên kết sinh đỉnh u Sau M2 thực kiểm tra với node u Ru ≤m= sinh thêm mu=(m- ) liên kết từ u: chọn ngẫu nhiên tập mu đỉnh từ V’, tập đỉnh v mà chọn ứng với u M1 trên, nối u đến tập mu đỉnh Với đỉnh u Ru tổng n-1 biến ngẫu nhiên Bec-nu-li đồng với xác suất p, nên theo bổ đề 3.1, ta có Ru ≤1,5np= m= với VHP Hãy gọi E kiện Ru ≤m với đỉnh u, tức M=M1||M2 sinh thể Y Rõ ràng Pr[ ! ] ≤n*Pr[Ru>m] = n*eNeg(n) eNeg(n) Vì với VHP ta có M=M1||M2 sinh thể Y Tức là, H 〉e I Ta cịn cần chứng minh I 〉eN J Ta sử dùng kỹ thuật tương tự Tuy nhiên để giản lược trình bày, chất thấy ta cần đánh giá xác suất kiện Eu sau: J, đỉnh u sinh Z liên kết ngẫu nhiên (độc lập) từ u, ta gọi Eu kiện mà u tạo m= liên kết phân biệt Ta cần chứng tỏ E, kiện mà Eu xảy với u, xảy với VHP Xét việc u sinh LKNN thứ k, 1≤k≤Z Xác suất để LKNN “mới”, tức khác biệt với k-1 lần trước ≥ 1- (k1)/(n-1) ≥ 1- (Z-1)/(n-1) Dễ thấy với n đủ lớn (vì Z/n 0) ta có xác suất ≥0,9 Do Ru, số LKNN tạo u, chặn tổng Z biến -90 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT ngẫu nhiên Bec-nu-li độc lập đồng với xác suất thành công 0,9 Theo bổ đề 3.1, ta có Pr[Ru ≥ m= ] VHP(Z) Tức 1-Pr[Eu] = eNeg(Z) Vì E khơng xảy cần có đỉnh u mà Eu không xảy ra, nên 1-Pr[E] ≤ n*(1- Pr[Eu]) = n* eNeg(Z) = eNeg(Z), n/Zd Tức E xảy với VHP (Z) Vậy, G 〉 H 〉e I 〉e J, theo bổ đề 4.2 ta có diam(J)≤d+4 với VHP(Z) , tức đpcm V ĐỊNH LÝ ĐIỀU KIỆN ĐỦ XÁC LẬP ĐƯỜNG KÍNH ĐỒ THỊ NHỎ Tromg mục xây dựng chứng minh cho định lý Để tiện theo dõi xin nhắc lại phát biểu sau Định lý Xét ĐTNN G=NAN (H,τ) với H đồ thị liên thông Giả sử tồn số dương λ,µ,ν mà 1>µ>ν cho H λ-nặng cịn τ (µ,ν)-pt Thế G có đường kính O(logn) với VHP Tập V-1, Số 11 (31), tháng 6/2014 nằm đồ thị Gi liên thơng ∀i,diam(Gi)≤p, với p>0 số ngun Thế thì, diam(G)≤p*q với q=diam(GH) Để đảm bảo tính liên tục, chúng tơi để chứng minh bổ đề 5.1 phụ lục Trong hai định nghĩa đây, ta lấy sở xét đồ thị liên thông G(V,E) khái niệm khoảng cách d(u,v) độ dài đường dẫn ngắn đỉnh cho trước u v Định nghĩa 5.2 Với số tự nhiên δ ta gọi δ lưới tập đỉnh U={u1, u2, …, ut} cho khoảng cách đỉnh U > δ đồng thời V=∪ti=1,tGui (δ) Một δ-lưới xây dựng theo nguyên tắc tham lam đơn giản sau: Lấy u1 ∈V sau với k=1,2,3, … lấy uk+1 từ V-∪ki=1,kGui (δ) chừng mà tập khác rỗng Dễ kiểm tra thấy cách xây dựng thỏa mãn định nghĩa 5.2 Để chứng minh, trước hết đưa số khái niệm bổ đề hỗ trợ sau Định nghĩa 5.3 Xét 2δ-lưới gọi U={u1, u2, …, ut} Ta xét phân hoạch H={V1,V2,…,Vt}, V.1 Các khái niệm kết hỗ trợ V=∪ti=1,tVi xây dựng theo cách sau: với đỉnh v∈V, tìm i∈1 t cho khoảng cách d(ui, v) nhỏ đưa v vào tập Vi Ta gọi phân hoạch U-dựa Xét đồ thị G(V,E) liên thông Giả sử U tập đỉnh V, ta ký hiệu GU đồ thị G mà thu cách lấy từ G đỉnh thuộc U cạnh chúng Ta gọi lân cận đỉnh u với bán kính k G, ký hiệu Gu(k) hay Guk, tập tất đỉnh v mà tồn đường dẫn từ u tới v G với độ dài ≤k Định nghĩa 5.1 Xét đồ thị G(V,E) phân hoạch tập đỉnh V thành tập rời nhau: H={V1,V2,…,Vk}, V=∪ki=1,kVi Ta gọi GH siêu đồ thị thu từ G cách thu giảm GVi thành Với H, phân hoạch U-dựa trên, khoảng cách đỉnh U ≥2δ suy tất lân cận Gui(δ) rời Dễ thấy Gui (δ)⊆Vi Vì từ bổ đề 5.1, ta suy kết hiển nhiên sau Bổ đề 5.2 Xét ĐTNN G=NAN (H,τ) với H đồ thị liên thông, U 2δ-lưới H phân hoạch Udựa (theo định nghĩa 5.2, 5.3) Ta có: siêu đỉnh; xác hơn, GH có k đỉnh GH1, GH2, H H i) ∀j=1,t:Guj (δ)⊆Vj; ii) diam(G) ≤2δ * diam(GH) H …, G k, cho với 1≤i≠j≤k, G i G j tồn H cạnh tồn cạnh (u,v)∈E mà u∈G i H v∈G j Bổ đề 5.1 Giả sử với đồ thị liên thơng G(V,E) có tồn phân hoạch tập đỉnh V thành tập rời nhau: H={V1,V2,…,Vk}, V=∪ki=1,kVi cho Vi Bổ đề 5.2 cho thấy ý tưởng việc chứng minh định lý 1: ta cần xây dựng lưới U thích hợp phân hoạch H (với tập đỉnh đủ lớn) để chuyển tốn tìm đường kính GH (mà ta áp dụng định lý 2) Bổ đề sau -91 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT cách xây dựng tập đỉnh đủ lớn lận cận với bán kinh O(logn) Bổ đề 5.3 Xét ĐTNN G=NAN (H,τ) với H đồ thị liên thông λ-nặng, τ (µ,ξ)-giãn với µ,ξ thuộc (0,1) cho λ∗ξ>1 Vậy tồn số C>0 lân cận Gu(k) tâm u∈V bán kính k=Clogn có kích thước ≥nµ với xác suất 1o(n-2), tức là: ∃C>0:Pr[∀u∈V, k=Clogn: |Gu(k)| ≥nµ]=1-o(n-2) (5) (Thực ta bỏ bớt điều kiện λ∗ξ>1, chứng minh dài không thực cần thiết.) Chứng minh bổ đề 5.3 Với đỉnh u∈V ta gọi Rτ(u) tập gồm đỉnh v mà (u,v) LKNN G ‘được sinh’ u theo phân phối τ Tất nhiên |Rτ(u)| phụ thuộc không vượt trọng số wu Với đỉnh u cho trước, ta xét chuỗi lân cận {Si} xây dựng theo cách sau: - - S0= ∅ S1= Hu(clogn), tức lân cận u bán kính clogn đồ thị sở H; c>0 số đủ lớn mà ta chọn sau Với i=1,2,3,…, Si+1= Si ∪ Ti, Ti = ∪v∈ViRτ(v) Để cho tiện, ta ‘tưởng tượng’ đỉnh v có wv hạt giống LKNN sinh dần sau: từ Si sinh Si+1 dùng hạt giống chưa dùng, tức thuộc vào Si-Si-1, để tạo LKNN cho Si+1 Bây ta chứng minh là: |Si|(1+α) với xác suất 1-o(n-4), α số tùy ý ∈(1, λξ) Ta đánh giá Pr[|T|/|S|> α] Nếu |Si∪T|< nµ τ (µ,ξ)-giãn ta thấy xác suất để hạt giống S sinh LKNN đến đỉnh (vi) khơng nằm Si∪T ξ Tổng số hạt giống đỉnh S wS=∑v∈Swv; ta chặn |T| tổng wS biến Becnuli độc lập đồng có xác suất thành công (=1) ξ Mặt khác wS≥λ|S|; ta chọn α: 1< α < λξ theo bổ đề 3.1, ta có |T| ≥ α|S| với VHP(c’|S|ξ) với số c’ Vậy chọn c>4/(c’ξ) ta có: |S|≥clogn Pr[|T|/|S|> α]= 1-o(n-4) Do dễ thấy, chừng |Sj|1, ta ln có với xác suất 1-o(n-3) thì: |Sj|≥|S1|(1+α+α2+ + αj−1) =|S1|(αj-1)/(α+1) Do với j=(µ/log α)logn+1, Pr[|Sj|≥nµ]= 1-o(n-3) - ta có Dễ thấy đỉnh Sj đến từ u đường dẫn với tối đa clogn+j cạnh; ý đỉnh S1 kết nối từ u với tối đa clogn cạnh đồ thị sở H Tức ta chọn C=c+(µ/log α)+1 Pr[|Gu(Clogn)| ≥nµ]= 1-o(n-3) Suy với C=c+(µ/log α)+1 ta có: Pr[∀u∈V, k=Clogn: |Gu(k)| ≥nµ]=1-o(n-2), đpcm! Bây ta có đủ kết chuẩn bị cần thiết để chứng minh trực tiếp định lý1 V.2 Chứng Minh Định lý Trước hết, ý tưởng cụ thể chứng minh sau: A) Đưa phân hoạch tập đỉnh V thành tập rời nhau: H={V1,V2,…,Vm}, V=∪mi=1,mVi cho tập Vi có kích thước xấp xỉ ≥nµ/2, đồng thời Vi ⊆V’i mà GV’i có đường kính O(logn) Ta sử dụng bổ đề 5.2 5.3 Ta mô tả chi tiết trình sinh dần Si+1 từ Si sau đây: - Tập V-1, Số 11 (31), tháng 6/2014 Đặt S= Si-Si-1 , T=∅ Với đỉnh v∈S, ta sinh vi=Rτ(v) với i=1 wv, vi∉ Si∪T ta thêm vào T: T= T∪{vi} Sau sử dụng hết ‘hạt giống’ S, ta thu Si+1=Si∪T B) Chứng minh siêu đồ thị GH có đường kính O(1) Từ kết hợp với kết A) theo bổ đề 5.1, đường kính G O(logn) -92 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Để thực B), ta vận dụng lại kỹ thuật so sánh mơ hình ĐTNN mục V Cụ thể ta chứng minh J 〉e(nc) K 〉 GH,với số c>0 đó, J= J(m,Z) mơ tả chi tiết phần sau, cịn K= K(m,z,p) theo mơ hình ĐTNN mở rộng khoảng (nµ/2, nµ) Nhờ ta thu phân hoạch H={V1,V2,…,Vm} mà tập đỉnh có kích thước nằm khoảng (nµ/2, nµ) Các tập đỉnh nằm lân cận có bán kính Clogn G Tức H thỏa mãn: mơ hình J(n,Z) định nghĩa Nhờ - ta có diam (GH ) = O(diam (J)) = O(1) Mơ hình đồ thị ngẫu nhiên K Một ĐTNN K(n,m) Sau chứng minh cụ thể định lý Trước hết, ý giả thiết định nghĩa 5.1 chưa cho phép ta dùng bổ đề 5.3, nơi mà ta cần thêm điều kiện λ∗ξ>1 Tuy nhiên ta bổ sung giả thiết vào mà không làm yếu định lý lý sau Bổ đề 5.2 rằng, ta có diam(G)= O(diam(GH)) đó: U 2δ-lưới với δ>0 đường kính O(1) Trước hết ta chứng tỏ K〉〉GH K=K(m,z,p) với z= λnµ/2 p= nµ−ν−1/2 Hai đồ thị thuộc mơ hình NAN; ta ký hiệu GH = NAN(S1, τ1) K== NAN(S2,τ2), đồ thị sở S1 S2 có kích thước m (phân hoạch H có m thành phần) Tuy nhiên ta có quan sát: - Trọng số đỉnh S1 cao đỉnh S2: wVi =∑v∈Viwv ≥λ∗|Vi| ≥ λnµ/2=z - mãn điều kiện λ∗ξ>1 Bởi siêu đỉnh GH gom “hạt giống” (sinh LKNN) từ đỉnh nội thuộc từ đồ thị G, tức đồ thị GH tối thiểu Theo bổ đề 5.3, tồn số C>0 với xác suất 1-o(n-2), lân cận Gu(k) tâm u∈V bán kính k=Clogn có kích thước ≥nµ Gọi U 2k-lưới H’={V’1,V’2,…,V’t} phân hoạch U-dựa (theo định nghĩa 5.2, 5.3) Với tập đỉnh V’i ta lại chia nhỏ thành tập đỉnh nhỏ cho kích thước chúng nằm (6) Bây ta chứng minh siêu đồ thị GH có số H phân hoạch U-dựa (theo định nghĩa 5.2, 5.3); mặt khác ta chọn số δ đủ lớn để đỉnh GH đủ nặng thỏa δλ−nặng Tức ta cần chứng minh định lý với đồ thị GH thỏa mãn λ∗ξ>1 Do đó, tiện khơng tính tổng qt ta đưa giả thiết λ∗ξ>1 cho đồ thị G ban đầu Tức ta dùng bổ đề 5.3 với đồ thị G Nói rộng ta ln giả thiết số λ đủ lớn tùy ý Phủ kín V, nghĩa là: V=∪mi=1,mVi Các Vi có kích thước ∈(nµ/2, nµ) Các Vi thuộc lân cận GV’i mà có đường kính O(logn) sinh theo mơ hình K, ký hiệu K= K(m,z,p), đồ thị có m đỉnh với đỉnh u∈V(K) ta độc lập tạo z LKNN, chúng chọn đến đỉnh v≠u với xác suất p quay lại u với xác suất 1-(m-1)p Tập V-1, Số 11 (31), tháng 6/2014 (7) Phân phối τ2 K có xu τ1 GH: tính (µ,ν)-pt giả thiết G sức hút siêu đỉnh GH (bao gơm ≥ nµ/2 đỉnh V) ≥ (nµ/2)/nν *n−1 = nµ−ν−1/2= p (8) Vì theo quan sát RG-B (mục IV), ta có K〉〉GH (9) Bây ta chứng tỏ J 〉e(nµ−ν) K với J=J(m,Z) Z=zmp/2 Điều chứng minh dễ dàng kỹ thuật sử dụng mục V Trước hết lưu ý thể K tạo sau: với đỉnh u∈S2 ta tiến hành z thí nghiệm Becnuli độc lập với xác suất thành cơng (m1)p, thành cơng chọn v V\{u} tạo liên kết (u,v) Như số LKNN sinh u tổng z biến ngẫu nhiên Becnuli đồng với xác suất thành công (m-1)p Do ta thiết kế chương trình M1||M2 để sinh K sau Trong M1 ta thực việc tạo thể J, tức với đỉnh u, tạo Z -93 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT LKNN đến đỉnh vi đó: vi V\{u} (các đỉnh vi chọn trùng lặp) Trong M2 ta thực lấy mẫu z biến ngẫu nhiên Becnuli đồng lấy tổng z chúng, z>Z ta sinh thêm (z-Z) LKNN từ u đến đỉnh vi đó: vi V\{u} Sử dụng bổ đề 3.1, dễ thấy PBAD=Pr[z≤Z]=eNeg(zmp) = eNeg(nµ−ν) (10) Vì ta có z= λnµ/2, p= nµ−ν−1/2 dễ thấy có n1≤m≤2n1-µ µ Cũng dễ thấy: Pr[với đỉnh u: z>Z] ≥1-m*PBAD = 1- n1-µ *eNeg(nµ−ν) = 1- eNeg(nµ−ν) (11) Do ta có: J 〉e(nµ−ν) K (12) Bây ta cần chứng minh nốt diam(J)=O(1) Nhắc lại J=J(m,Z) Z=zmp/2, nêu z= λnµ/2 p= nµ−ν−1/2 n1-µ≤ m ≤2n1-µ Suy Z= O(nµ−ν) Vậy chọn ∆ ∆+1 # ∆=min"# ν − Z /m Z /(mlogm) định lý 2, ta có: , # % (# ν) rõ ràng ∞, n ∞ Thế theo diam(J)≤ ∆+4 với VHP(Z) (13) Kết hợp (9), (12), (13) ta có diam(G )≤ ∆+4 với H VHP(Z+nµ−ν) tức với VHP(nµ−ν) Điều kết hợp với (6) theo bổ đề 5.1 ta suy đường kính đồ thị G=NAN (H,τ) (∆+4)Clogn, -2 O(logn), với xác suất (1-o(n ))* (1-O(e -2 với xác suất (1-o(n )) e -nµ−ν -nµ−ν tức dụ minh họa ngắn gọn cho ứng dụng tiếp cận mà chưa sâu phân tích ví dụ phức tạp Tuy nhiên, nhận thấy tiếp cận đầy triển vọng, vì, số kết biết đường kính đồ thị trước nhiều tác giả chứng minh phức tạp báo riêng rẽ chứng minh lại giản dị cách tiếp cận Vì xem kết có ý nghĩa đáng kể cho trình chung xây dựng lý thuyết mơ hình mạng dựa sở ĐTNN Trong tương lai hy vọng tiếp tục phát triển thành công tiếp cận để đề xuất khảo sát thêm nhiều dạng mô hình mạng phức tạp, xuất phát từ thực tế, chúng tơi có kết ban đầu (sẽ cơng bố sau) việc mơ hình hóa đồ thị luật Lũy thừa vài dạng mô hình đồ thị mạng vật lý Internet mà yếu tố địa lý đóng góp vai trị chủ đạo hình thành LỜI CẢM ƠN Chúng tơi xin cảm ơn đồng tác giả [5,21,18] đóng góp nhiều ý kiến gợi ý PHỤ LỤC Bất đẳng thức Chernoff Chúng sử dụng phát biểu sau lấy từ nguồn [1] Giả sử X1, X2, … Xn biến ngẫu nhiên Becnuli độc lập với E[Xi]=pi Đặt X= ∑ ( ' , p= ∑ ( ) q=1-p Thế với 0