Tínhcấpthiết củaluậnán
Trong kỷ nguyên Internet, thế giới chứng kiến sự bùng nổ về số lượng ngườidùng và lưu lượng trao đổi thông tin trên mạng Điều này có được là do sự pháttriểnvƣợtbậccủacôngnghệtrêncáclĩnhvựcnh ƣphầncứng,phầnmềmvàkếtnối(truyền thông) Ngày nay, người dùng cuối có thể sử dụng rất nhiều loại phươngtiện hay thiết bị nhƣ điện thoại thông minh, máy tính xách tay, tivi để kết nối mạngInternet bằng công nghệ truyền thông tốc độ cao (mạng cáp quang hoặc mạng wifi4G, 5G), thông qua các ứng dụng hết sức đa dạng, thực hiện mọi hoạt động trênmạng(chiasẻthôngtin,làmviệctươngtác ).
Qua các số liệu thống kê và dự báo đƣợc công bố bởi các tổ chức uy tín nhƣtổchứcLiênminhviễnthôngquốctếITU(Inte rnationalTelecommunicationUnion), tổ chức phi lợi nhuận hỗ trợ cơ sở hạ tầng của Internet toàn cầu ISC(Internet Systems Consortium) và công ty hàng đầu thế giới về công nghệ thông tinvà kết nối mạng Cisco, cho thấy các thông tin liên quan đến hoạt động và phát triểncủahệ phân tán nhƣsau:
Số lƣ ợ n gn gƣ ờ id ù n gI n te rn et ( Đ ơn vị : T ỷ )
NgườidùngInter net:Thếgiớihiệncó4,66 tỷngườidùngInternet,v àtừnăm2012đếnnay,tốcđộn gườidùng luôntăngrấtnhanhquatừngn ăm,đƣợctrình
Dung lượng trao đổi trên Internet:Dung lƣợng trao đổi trên mạng
Internetmỗi tháng là rất lớn, năm 2021 là 267 exabytes và dự kiến năm 2022 sẽ lên đến 333exabytes,đƣợc trìnhbàynhƣtrongHình2.
Thiết bị đầu cuối kết nối Internet:Nhiều loại thiết bị đầu cuối có thể giúpngười dùng kết nối mạng, trong đó thiết bị cầm tay như điện thoại thông minh luônchiếmđasốvàpháttriểnnhanh cótỷlệlớn, dựbáo năm2022sẽlà50%,đƣợctrìnhbàynhƣ trong Hình3.
D un g lƣ ợn g tr ao đ ổi t rê n In te rn et ( Đ ơn vị :E xa by te s )
Hình4.Mạng khôngdâykếtnốiInternetgiai đoạntừ2018đến2023[3]
Công nghệ không dây kết nối mạng:Các mạng không dây tốc độ cao nhƣ4G, 5G ngày càng đƣợc các thiết bị sử dụng rộng rãi, phổ biến để kết nối mạng.Chẳng hạn, dự báo đến nay 2023, mạng 4G sẽ chiếm 46,0% và mạng 5G sẽ chiếm10,6%trên tổngsốcác kếtnối,đƣợctrìnhbàynhƣtrongHình4.
Cùng với những thành tựu của Công nghệ Thông tin (CNTT) nhƣ trình bày ởtrên,cácứngdụngphântánđãrađờivàpháttriểnnhanhchóngđƣợcxemnhƣlàsựtất yếu, luôn nhận đƣợc sự quan tâm rất lớn của giới chuyên gia trong lĩnh vựcCNTT, các tập đoàn công nghệ phát triển sản phẩm CNTT Những ứng dụng nàycho phép sử dụng, kế thừa cơ sở hạ tầng sẵn có, đƣợc xây dựng trên nhiều nền tảng,côngnghệkhácnhau;khaithác,vậnhànhtốiđavàhiệuquảcáctàinguyêntừmọivịt ríđịalý,đểtaọra môitrườnglàmviệcmở,chiasẻvàtươngtác[4][5][6].
Mạng ngang hàng (Peer – To – Peer, viết tắt P2P) [7] [8] có nhiều ƣu điểm,tính năng vƣợt trội về tính phân tán cố hữu, quản lý cácđiểm(sau đây gọi lànút)vào/ra hệ thống, cácnútkhông thuần nhất về khả năng (tốc độ xử lý, bộ nhớ, băngthông sử dụng), phân chia tài nguyên một cách phù hợp và cho phép khả năng mởrộng hệ thống Vì thế, hiện nay mạng P2P là công nghệ phổ biến, một phần khôngthể thiếu trong cách mạng Internet, nền tảng quan trọng để phát triển các ứng dụngphân tán như phân phối tập tin [9] [10], hệ thống lưu trữ dữ liệu phân tán
[11], điệntoánđá m m â y [12],c ô n g ng hệ c h u ỗ i – k h ố i [ 1 3 ] [ 1 4 ]( s a u đ â y gọic h u n g là ứ n g
Internet video 184 Web, email, and data Online gaming File sharing
3 7 4 7 7 7 11 7 dụng trên mạng P2P) Trong giai đoạn từ 2017 đến 2021, các ứng dụng phân phốitập tin sử dụng 7 Exabytes dung lƣợng trao đổi và luôn là một trong số các ứngdụng sử dụng nhiều nhất trên mạng Internet, đƣợc trình bày nhƣ trong Hình 5.Những ứng dụng phân phối tập tin phổ biến nhất hiện nay nhƣ Utorrent [15],Bittorrent[16] chophépngườidùngcóthểphânphốidữliệunhanhchóngvàhiệuquả; người dùng có thể tự do kết nối với những người khác mà không cần phải biếtvềcácmáytínhkháchoặc cáchthứcmạnghoạt động.
Các ứng dụng phân tán thường có quy mô lớn về địa lý và số lượng lớnngười dùng, cần đáp ứng các yêu cầu đa dạng, phức tạp về dữ liệu; đồng thời cácứng dụng này cũng phải triệt để phát huy ưu thế của môi trường phân tán và côngnghệ nhằm mang lại hiệu quả tối đa Chính vì vậy, chúng không thể sử dụng dữ liệutập trung mà phải lưu trữ phân tán Nghĩa là, một đối tượng dữ liệu sẽ được lưu trữtại nhiềunúttrong mạng P2P và đƣợc thực hiện bằng kỹ thuật nhân bản (trình bày ởphần sau), gọi là hệ thống dữ liệu chia sẻ, nhằm đáp ứng yêu cầu và hiệu quả nhấtcho các ứng dụng phân tán nhƣ: sự tin cậy cao, khả năng mở rộng, chịu lỗi, khôiphục, sẵn sàng đáp ứng dữ liệu và cân bằng tải Trong nghiên cứu của luận án làđốivớihệthốngdữliệuchiasẻđƣợcxâydựngtrênmạngP2P,vìthếkhitrìnhbày,
D un gl ƣ ợn gt ra ođ ổi tr ên In te r n e t( Đ ơn vị : E xa by te s ) hai thuật ngữ nhất quán dữ liệu chia sẻ và nhất quán dữ liệu trong mạng P2P có ýnghĩatươngđươngnhau. Đối với kỹ thuật nhân bản, bên cạnh những ƣu điểm nhƣ trên, mỗi bản saođƣợc thực thi, xử lý bởi các tiến trình hoàn toàn độc lập, tự trị và không thuần nhất,sẽ đặt ra những vấn đề khó khăn, phức tạp [17] [18] về an ninh an toàn, chi phí lưutrữ, thao tác ghi dữ liệu chậm, thời gian ngừng hệ thống trong khi tạo bản sao mới,yêu cầu đảm bảo tính nhất quán dữ liệu Tính nhất quán dữ liệu phụ thuộc vào môhình nhất quán dữ liệu, trong đó quy định cơ chế thực thi của các tiến trình (các thaotácđọc/ghi)trêndữliệuchiasẻ.Đảmbảotínhnhấtquándữliệuđểcáctiếntrì nhcục bộ (đọc/ghi) trả về kết quả chính xác, tin cậy, đáp ứng tốt các yêu cầu từ phíangườidùng, dođóđâylàyêucầuvôcùngquantrọngvàcầnthiết[19][20].
Ngay từ rất sớm, bài toán đảm bảo tính nhất quán dữ liệu chia sẻ đã đƣợcquan tâm nghiên cứu Tuy nhiên, qua nghiên cứu nhận thấy rằng, các đề xuất cóphạm vi giải quyết hiệu quả hẹp hoặc khó đáp ứng đƣợc cho các hệ thống dữ liệuchia sẻ ngày này, do môi trường phân tán và yêu cầu ngày càng trở nên đa dạng,phức tạp [19] [20] Cụ thể những vấn đề còn tồn tại hoặc cần xem xét trong nghiêncứunhƣ sau:
- Giải pháp chỉ đảm bảo tính nhất quán dữ liệu hạn chế, chẳng hạn nhƣ nhấtquán theo thời gian, nhất quán xác suất, nhất quán ngẫu nhiên và nhất quán yếu ;chủ yếu triển khai thực hiện cho các hệ thống dữ liệu chia sẻ tương đối nhỏ (ítnút)và tĩnh (tốc độnútvào/ra hệ thống, tốc độnútthực hiện cập nhật nhỏ) nhƣ hệ thốngdữliệuchiasẻgồmcócácnútlàtrungtâmdữ liệu(DataCenter).
- Giảiphápcònhạnchế,khótriểnkhaiđƣợcchocáchệthốngdữliệuchiasẻnh ƣhiệnnày,donhữngvấnđềngàycàngphứctạp,khókhăn từcácnguyênnhânkháchquan,chủquan, cụthể nhƣsau:
+ Hệ thống dữ liệu chia sẻ có thể đƣợc xây dựng trên nhiều nền tảng hạtầng khác nhau, có quy mô lớn về đia lý, số lƣợngnúttham gia và dữ liệu chia sẻ;các thiết bị kết nối đầu cuối trở nên đa dạng, phương thức kết nối tốc độ cao và tùybiến Đặc biệt trong bối cảnh phát triển nhanh chóng của khoa học công nghệ nhƣhiệnnay,thì điềunàysẽngàycàngtrởnênphứctạp.
+Hệthốngdữliệuchiasẻbaogồmcácnútcóyêucầuthựcthiởmứcđộtự trị cao và không thuần nhất về khả năng củanút, tốc độnútvào/ra hệ thống, tốcđộnútthựchiệncậpnhật.
+ Hệ thống dữ liệu chiasẻ sẽ cóy ê u c ầ u đ ả m b ả o t í n h n h ấ t q u á n k h á c nhauvàđadạng,chẳnghạnnhưmôhìnhnhấtquán,phươngthứcđảmbảotính nhấtquán và yêu cầu về hiệu quả độ trễ cập nhật, số lƣợng thông điệp hay băng thông sửdụng
Do đó, đảm bảotính nhất quándữ liệuchia sẻ trong mạng P2P vẫnl u ô n l à bài toán khó khăn, thách thức chủ yếu và còn rất cần thiết tiếp tục nghiên cứu vàphát triển Vì vậy, nghiên cứu sinh đã lựa chọn đề tài“Nâng cao hiệu quả một số kỹthuật đảm bảo tính nhất quán dữ liệu trong mạng P2P”,để thực hiện nghiên cứutrongnộidungluậnán.
Mụctiêunghiên cứucủaluận án
Mục tiêu chính của luận án nhằm nghiên cứu và đề xuất các giải pháp kỹthuật đảm bảo tính nhất quán dữ liệu chia sẻ, nhằm làm cơ sở ứng dụng cho các hệthống dữ liệu chia sẻ, từ đó để phát triển các ứng dụng phân tán trong tình hình hiệnnay.Mộtsố mụctiêucụthể củaluậnánnhƣsau:
- Nghiên cứu và đưa ra được những vấn đề về lý thuyết tương đối hoànchỉnhcủabàitoánđảmbảotínhnhấtquándữliệu chiasẻ trongmạngP2P.
- Nghiên cứu, đề xuất một số giải pháp có hiệu quả giải quyết bài toán đảmbảo tính nhất quán dữ liệu trong mạng P2P cụ thể (môi trường phân tán và yêu cầuđảmbảotínhnhấtquándữ liệu).
Đốitƣợngvàphạmvinghiêncứucủaluậnán
Xác định mục tiêu nghiên cứu và các giải pháp đối với bài toán đảm bảo tínhnhất quán dữ liệu trong mạng P2P nhƣ trên, luận án tập trung vào những đối tƣợngnghiêncứunhƣsau:
- Mạng P2P, trong đó nghiên cứu sâu về mạngPastryvà hệ phân tán xâydựngtrênmạng P2P.
- Phát biểu và phân tích bài toán đảm bảo tính nhất quán dữ liệu trong mạngP2P, gồm có: mô hình nhất quán phù hợp, môi trường phân tán, yêu cầu của hệthốngvàảnhhưởngcủanhữngvấnđề nàyđếnbàitoánnghiêncứutrongluậnán.
- Giải pháp đảm bảo tính nhất quán dữ liệu trong mạng P2P (sau đây có thểgọi là lƣợc đồ đảm bảot í n h n h ấ t q u á n ) , t r o n g đ ó p h â n r ã t h à n h h a i l ớ p b à i t o á n , gồm có: Giải pháp xây dựng, duy trì cấu trúc cập nhật và phương thức lan truyềncậpnhậtđảmbảo tínhnhấtquándữ liệu.
- Nghiên cứu bài toán cung cấp tài nguyên cho các máy ảo đƣợc tạo ra bởicác máy vật lý không thuần nhất, nhằm ứng dụng trong các lƣợc đồ đảm bảo tínhnhấtquán sử dụngmáyảocậpnhật.
- Phương pháp đánh giá hiệu quả của các giải pháp đảm bảo tính nhất quándữliệu dựatrênnhữngthamsốđầu vàocủa hệthốngdữ liệuchiasẻ.
Phạmvinghiêncứu: Để triển khai các giải pháp đảm bảo tính nhất quán dữ liệu đƣợc luận án đềxuất, các vấn đề nghiên cứu nêu trên đƣợc luận án tập trung giải quyết trong phạmvigiớihạnnhƣ sau:
- Cácnúthoạt động bình thường, sử dụng cơ chế giao tiếp bằng phươngpháptruyềnthôngđiệp.
- Cácnútkhông thuần nhất về tốc độ xử lý, khả năng lưu trữ và băng thôngsử dụng, tốc độnútthực hiện cập nhật, tốc độnútvào/ra hệ thống Các tham số nàycủanútđƣợcsinhbởicáchàmphânphốingẫunhiên.
- Các giải pháp đề xuất có hiệu quả đối với các hệ thống dữ liệu chia sẻ thỏamãnđiềukiện cụthể.
Phươngphápnghiêncứu
-Phương pháp nghiên cứu lý thuyết: Nghiên cứu tài liệu liên quan đến hệthống phân tán, hệ thống dữ liệu chia sẻ của các ứng dụng trên mạng P2P, kỹ thuậtnhânbảndữliệuvàyêucầuđảmbảotínhnhấtquándữliệucủacáchệthống dữliệu chia sẻ Khảo sát, phân tích và đánh giá các lƣợc đồ đảm bảo tính nhất quán dữliệu trong các hệ thống dữ liệu chia sẻ để phát hiện những vấn đề còn hạn chế Từđó, luận án đề xuất cách tiếp cận giải quyết, cải tiến và nâng cao hiệu quả lƣợc đồđảmbảotính nhấtquándữ liệutrongmạngP2P.
-Phương pháp thực nghiệm: Trên cơ sở các giải pháp đề xuất, luận án tiếnhành các thực nghiệm bằng các công cụ mô phỏng Kết quả trình bày trong luận ánlà kết quả trung bình của nhiều lần thử nghiệm Đồng thời, luận án thực hiện phântích, so sánh và đánh giá những kết quả thu đƣợc để chứng minh tính hiệu quả củacácgiải phápđềxuất.
Ýnghĩakhoahọcvàthựctiễncủaluậnán
Các kết quả nghiên cứu của luận án có ý nghĩa khoa học và thực tiễn đƣợcthểhiệnnhƣsau: Ýnghĩakhoahọc
Luận án đã đề xuất các giải pháp về xây dựng cấu trúc và phương thức lantruyền nội dung cập nhật nhằm đảm bảo tính nhất quán dữ liệu chia sẻ trong mạngP2P(môhìnhtuyếntính),vớimục tiêugiảiquyết hiệuqủacaobàitoánđả mbảotính nhất quán dữ liệu (mức độ đảm bảo tính nhất quán trong mô hình tuyến tính, tỷlệ cập nhật thành công và độ trễ cập nhật) trong một số hệ thống dữ liệu chia sẻ cụthể (quy mô, tốc độnútvào/ ra hệ thống, tốc độnútthực hiện cập nhật) Các kết quảđƣợc kiểm chứng và công bố trên các tạp chí, hội nghị trong nước và quốc tế cóphảnbiệnđộclập,cụthểluậnáncócácđềxuất mớinhƣsau:
-Đề xuất thuật toánID_LINKvề giải pháp xây dựng và duy trì cấu trúc cậpnhật, trong đó nâng cao hiệu quả truyền thông giữa cácnút, với mục tiêu đạt đượchiệuquảtốiưuvềđộtrễcậpnhậtđốivớicáchệthốngkémổnđịnhdotốcđộnút vào/rahệthốnglớn(Bàibáosố4).
- Đề xuất giải pháp linh hoạt trong cập nhật và hoán đổi liên kết của cácnútnhằm giải phóng bộ nhớ đệm giúp phòng tránh tắc nghẽn, từ đó nâng cao hiệu quảlan truyền cập nhật Giải pháp có hiệu quả cao về độ trễ cập nhật nhƣng đồng thờivẫn đạt đƣợc hiệu quả cân bằng giữa các tham số nhƣ: mức độ đảm bảo tính nhấtquán,tỷlệcậpnhậtthànhcôngvàđộtrễcậpnhật (Bàibáosố 1,2).
- Đề xuất thuật toánOptRepvề giải pháp nhân bản dựa vào ngƣỡng tốc độyêucầu cậpnhậtcủanútđểtốiưuchiphíđảmbảotínhnhấtquándữliệu.Giảiphápcó hiệu quả cao về độ trễ cập nhật và đồng thời cải thiện đáng kể hiệu quả về tỷ lệcậpnhật thành công(Bàibáosố3).
- Đề xuất thuật toánAllResVmvề giải pháp phòng tránh bế tắc trong cungcấp tài nguyên cho máy ảo xây dựng trên nền tảng mạng P2P Giải quyết đƣợc bàitoán này nhằm làm cơ sở nâng cao hiệu quả các lƣợc đồ đảm bảo tính nhất quán dữliệusử dụngmáyảocậpnhật (Bàibáosố5,6). Ýnghĩathựctiễn
- Cài đặt các giải pháp đƣợc đề xuất và tiến hành thực nghiệm mô phỏngbằng công cụ Oversim [21], Open Stack [22] ; luận án đã thực hiện phân tích vàđánh giá hiệu quả đạt đƣợc của giải pháp đề xuất so sánh với các nghiên cứu củaNakashima[23] vàYi[24].
- Các giải pháp và thuật toán đề xuất có hiệu quả cao về một số tiêu chí nhấtđịnh trong các hệ thống dữ liệu chia sẻ cụ thể Do vậy, các đề xuất của luận án có ýnghĩa thực tiễn quan trọng, thời sự trong việc góp phần phát triển các hệ thống dữliệuchiasẻvà ứngdụngtrênmạngP2P.
Cấutrúcluậnán
HỆTHỐNGDỮLIỆUCHIASẺPHÂNTÁNTRONGMẠNG P2P
Hệ phân tán là tập hợp các máy tính độc lập, tự trị, có thể làm việc tương tácvà đồng thời; đƣợc kết nối mạng và dữ liệu để đáp ứng thống nhất và toàn vẹn cácdịchvụtheoyêucầu.Địnhnghĩa tổngquátcủa mộthệphântán nhƣsau: Định nghĩa 1.1[25].Một hệ phân tán là một bộS = (C,, I), vớiClà tậpcáccấuhìnhcủahệthống,làmộtquanhệnhịphântrênC vàIlàtậpcáccấuhì nhbanđầu.
Với,C,kýhiệuđể chỉhệthốngcóthểchuyểntừcấuhìnhsangcấuhình. Trong hệ phân tán, truyền thông được thực hiện bằng phương pháp truyềnthông điệp qua mạng viễn thông và việc đồng bộ thời gian vật lý cho toàn bộ đốitƣợng,tiếntrìnhtrênhệphântánlàkhông khảthi.
Trong Hình 1.1 dưới đây mô tả bốn thực thể [4] kết hợp chặt chẽ với nhautạothànhhệphântán.
Tuy nhiên, chúng ta cũng có thể xem hệ phân tán là sự gắn bó chặt chẽ giữahai thành phần là hệ thống mạng và ứng dụng phân tán Quy mô của hệ phân tánđƣợc xem xét dựa vào quy mô của mạng và phạm vi hỗ trợ ứng dụng Vì thế, hệphântánquymôlớn(HPTQML)cóthể đƣợcthểhiệnnhƣsau:
Hệ HPTQML = Mạng Internet + ứng dụng phân tán Trong ngữ cảnh nghiêncứucủaluậnán thìhệp h â n tánđƣợchiểunhƣsau[4][25][26]:
- Phân bố trongphạm viđịa lý rộnglớn nhƣtrên bìnhdiện nhiều vùng,quốcgia,quốctế.
Kết nối người sử dụng với tài nguyên:Các nguồn tài nguyên có thể là đốitượng dữ liệu, phần cứng Hệ phân tán cho phép người dùng chia sẻ nguồn tàinguyên với nhau mà không phụ thuộc vào yếu tố địa lý Đây là một đặc tính cơ bảncủa hệ phân tán, cơ sở cho những đặc tính khác Tùy thuộc vào yêu cầu cụ thể, đặctrưngnàysẽảnhhưởng đếnkiếntrúccủahệphântán.
Trongsuốt:Khảnăng chedấutínhrờirạcvềhệthốngđốivớingười sửdụngcuối,trong đócó8dạngtrongsuốtnhƣsau:
Trongsuốtditrú,địnhvị:Chedấukhảnăngdichuyểntừnơinày sangnơikháccủa tàinguyên.
Trongs u ố t b ả n s a o : C h ed ấ u c á c b ả n s a o đ ƣ ợ c h ệ t h ố n g t ạ o r a v à đ ặ t chúngtạicácvị tríkhác nhau.
Trongs u ố t v ề t ư ơ n g t r a n h : C h ed ấ u v i ệ c c á c t i ế n t r ì n h c ó t h ể t h ự c h i ệ n đồngthời trêncùngmộtđốitƣợngdữ liệu.
Trongsuốtvềlỗi:Hệthốngcócácgiảiphápvềkhôiphục,khắcphụcsựcố, vìthếkhihệphântángặplỗithìngườidùngcũngkhôngthểphát hiệnra.
Trongsuốttruycậpnhanh:Cáctiếntrìnhcầntruycậpnhanhvàhiệuquảnhất (vềthờigianvàchiphí)đếncáctàinguyên,dữ liệucủa hệthống.
Mở:Khả năng bổ sung thêm các dịch vụ mới mà không làm ảnh hưởng đếncác dịch vụ đã có; cung cấp các dịch vụ theo các quy tắc chuẩn mô tả cú pháp vàngữ nghĩa của dịch vụ đó Trong hệ phân tán, các dịch vụ thường đặc tả bằng ngônngữ đặc tả giao diện (Interface Definition Language - IDL), cho phép các dịch vụkhác nhau cùng triển khai, nếu các giao diện của hệ phân tán đƣợc đặc tả đầy đủ vàđúngđắn.Tínhmởcủahệphântáncóhaivấnđềquantrọnglàliêntác(Interroperability)v àchuyểnmang(portability).
Liên tác:Các cài đặt của các hệ thống hoặc thành phần hệ thống từ các nhàsảnxuấtkhácnhaucóthểlàmviệcvớinhauthôngqualiêntác.
Chuyển mang:Một ứng dụng đƣợc phát triển cho hệ phân tánAcó thểđƣợctriểnkhaiứngdụngtrênmộthệphântánB,màkhôngcầnthayđổigìkhác, vớiđiềukiệnBđƣợc càiđặtcùng giaodiệnnhƣA.
Co dãn:Hệ phân tán đƣợc gọi là có tính co dãn, nếu nó có thể thích nghiđược với những sự thay đổi quy mô của hệ thống mà không ảnh hưởng đáng kể tớihiệu năng hoặc độ phức tạp, như tăng (hay giảm) số lượng người dùng và bổ sungtàinguyên.Tínhcodãnthểhiệntrênbakhíacạnh:
Khả năng khôi phục, chịu lỗi:Khả năng chịu lỗi hay khái niệm có thể tin cậyđƣợccủahệthống,gồmcácyêucầu:
Tin cậy:hệthốngcóthểhoạt động tốttrongthờigiandàimàkhôngbịgián đoạn.
Tươngtranh:Hệphântáncónhiềungườidùng,tươngtác,xửlýđộclậptrên cùng một đối tƣợng dữ liệu, cho nên đòi hỏi hệ thống xử lý cập nhật đồng thời, đâyđược gọi là trường hợp tương tranh trong cập nhật dữ liệu [27] Hệ phân tán giảiquyết yêu cầu này để nâng cao hiệu quả, đồng thời nhằm đáp ứng đƣợc các yêu cầukhácnhư:tínhtrongsuốt,kếtnốingườidùngvàtàinguyên c) Hiệuquảcủahệphântán
Chip h í t h ấ p : H ệp h â n t á n c h o p h é p s ử d ụ n g c h u n g c á c t à i n g u y ê n q u a n nút nút nút nút nút trọng,nênsẽgiảmđƣợcđángkểchiphí,thờigian.
Hiệu năng cao:Hệ thống phân tán sử dụng tổng hợp khả năng của tất cả cácthành viên tham gia Do đó, hệ thống có thể đạt đƣợc hiệu năng vƣợt ngoài tầm củacác máy tính xử lý trung tâm Thậm chí, do giới hạn về công nghệ và chi phí, trongnhiềutrườnghợpviệcsửdụngcácmáytínhtrungtâmlàkhôngthểthựchiệnđược.
Bên cạnh những ƣu điểm nêu trên, hệ phân tán cũng có những hạn chế, khókhănnhƣ sau:
Thành phần mới:Mạng chịu giới hạn về hiệu năng, khả năng tính toán, giớihạn của các thuật toán phân tán Hơn nữa các thực thể rời khỏi mạng có thể làm mấtdữ liệu, làm sai bảng định tuyến trong một thời gian nhất định, dẫn đến việc thựchiệntruyvấnmấtnhiềuthờigianhơn hoặccóthểthiếuchínhxác.
Bảo mật:Hệ thống dễ bị xâm phạm hơn do dữ liệu phân tán và bao gồmnhiềuthànhphầnkhôngthuầnnhất. Độ phức tạp của phần mềm:Phát triển các phần mềm phân tánl u ô n p h ứ c tạp,khókhăn hơnsovớiphầnmềmtruyềnthống.
Dữliệu 1 Hàmbăm nút nút nút
CGF743MN GH87NKK0 24DS76KM
(overlay), đƣợc hình thành bởi các liên kết logic (có thểd o n h i ề u l i ê n k ế t v ậ t l ý ) trên nền tảng mạng vật lý sẵn có Trong mạng P2P không có khái niệm máy trạm vàmáy chủ, tất cả các máy tham gia đều bình đẳng và đƣợc gọi lànút(Hình 1.2).Mạng P2P hoạt động dựa vào khả năng của tất cả cácnúttham gia, mọinútthànhviên đều đóng góp tài nguyên củanútđó, bao gồm băng thông, khả năng lưu trữ vàtínhtoán Dođó,khicàngcónhiềunútthamgiamạngthìkhảnăngtổngthểcủah ệthốngmạngcànglớn. b) Phânloại mạngP2P
Theo hình thái (topology), mạng P2P đƣợc phân thành hai loại cơ bản là P2PkhôngcócấutrúcvàP2Pcócấutrúc[8][28],cụthểnhƣsau:
P2P không có cấu trúc (phi cấu trúc):Núttrong mạng P2P đƣợc thiết lậpngẫu nhiên (không có quy luật), giữanútvà dữ liệu không có bất kì mối tương quannào.Nútmới sẽ lấy các liên kết có sẵn của cácnútkhác đang ở trong mạng, sau đónútnày dần thêm vào các liên kết mới Mộts ố m ạ n g P 2 P k h ô n g c ó c ấ u t r ú c p h ổ biếnhiệnnaynhƣNapster[29],Gnutella[30].
P2Pcócấutrúc:Nútliênkếttrongmạngtheohìnhtháiquyđịnhsẵn,giữa nútvàdữliệucómốiliênkếtchặtchẽ.MạngP2Pcócấutrúcsửdụngbảngbăm
HàmbămDữliệu 2 phân tán [31] (viết tắt làDHT) để cung cấp giải pháp về quản lýnútvà tìm kiếm dữliệu hiệu quả dựa trên khóa Trong đó, cặp (khóa, dữ liệu) là bản ghi trongDHTđược lưu trữ phân tán trên nhiềunút Bất cứnútnào trong hệ thống cũng có thể lấyđược giá trị tương ứng với khóa (Hình 1.3) Một số mạng P2P có cấu trúc phổ biếnhiệnnaynhƣPastry[32],Tapestry[33],CAN[34]. c) ĐặctrưngcủamạngP2P
Mạngtùybiến(Ad- hoc):Trạngtháicủamạnglàđộng,dokếtnốigiữacácnútmạng luôn có thể thay đổi theo thời gian, tùy thuộc vào tốc độnútvào/ra hệthống Cácnútgiao tiếp với nhau mà không cần sự hỗ trợ của một thiết bị trung tâmnào Mỗinúthoạt động vừa nhƣ mộtmáy chủvừa nhƣ mộtthiết bị định tuyến(sẵnsàng chuyển tiếp dữ liệu cho cácnútkhác) Dựa trên tình trạng kết nối của mạng, hệthốngsẽquyếtđịnhnútnàothựchiệnchuyểntiếpdữliệu.
Giớihạnvề khảnă ng và đ ộổ n định: N ú t trongm ạ n g P 2P là k h ô n g thuầ nnhất và rất khác so với máy chủ về giới hạn khả năng tính toán, bộ nhớ, băng thôngvàsự ổnđịnh(nútvào/rahệthốngdochủđộnghoặcbịlỗi).
ĐẢMBẢOTÍNHNHẤTQUÁNDỮ LIỆUTRONGMẠNGP2P
Thuật ngữ “nhất quán” (consistencytrong tiếng Anh) có nguồn gốc Latin là“consistere”, có nghĩa là “standing together” hoặc “stopping together” Khi xem xétdưới góc độ nhất quán dữ liệu, trạng thái nhất quán đòi hỏi mối liên hệ, ràng buộccần thực thi giữa các tiến trình trên dữ liệuchia sẻ, nhằm thỏam ã n m ộ t m ô h ì n h nhất quán nào đó (nhƣ trình bày dưới đây) theo yêu cầu của hệ thống dữ liệu chiasẻ.Trongđó,tínhnhấtquándữliệuđƣợcxemxétvàxácđịnhdựatrênbathamsố:
- Thời gian cho phép với độ trễ lan truyền cập nhật (sau đây sẽ gọi là độ trễcậpnhật).
Mỗi mô hình nhất quán thực thi các điều kiện khác nhau (trình bày dưới đây)và chỉ có các thao cập nhật trên dữ liệu chia sẻ mới ảnh hưởng đến tính nhất quándữliệu.
Hiện nay có hai mô hình nhất quán dữ liệu [40], gồm có: mô hình lấy dữ liệulàm trung tâm vàmô hình lấy người dùng làm trung tâm Trongm ô h ì n h t h ứ n h ấ t thì các thao tác của người dùng trên dữ liệu chia sẻ được sắp xếp theo mô hình duynhất Điều này trái ngược với mô hình thứ hai, khi mỗi người dùng đƣợc yêu cầumột mô hình nhất quán cụ thể Mỗinútkhác nhau sẽ nhìn thấy các thao tác theonhững trật tự khác nhau Luận án có hướng tiếp cận nghiên cứu mô hình lấy dữ liệulàm trung tâm, gồm có các mô hình nhất quán dữ liệu đã đƣợc đề xuất sắp xếp từmạnh đến yếu và chỉ ra nhƣ trong Bảng 1.4 Một mô hình nhất quán đƣợc coi làmạnhhơnsovớimôhìnhnhấtquánkhácnếunóđápứngtấtcảcácđiềukiệncủamô hình đó và nhiều điều kiện khác nữa Mô hình nhất quán mạnh trong hầu hếttrườnghợpsẽlàmgiảmhiệunăng,khảnăngsẵnsàngcủadữliệu;vàđòihỏichiphícao về bộ nhớ, băng thông và thông điệp truyền thông Ngƣợc lại, mô hình nhấtquán yếu giải quyết những vấn đề trên, tuy nhiên nó có thể không đảm bảo tính nhấtquándữ liệutheoyêucầucủaứngdụng.
Chặt(Strict) Tuyếntính(Linearizability) Tuầntự(Sequential)
Mô hình nhất quán chặt: Quy định sau khi thao tác ghi trên dữ liệu chia sẻ đãhoàn thành thì bất kỳ thao tác đọc dữ liệu nào cũng sẽ đƣợc trả về kết quả là giá trịghi dữ liệu gần nhất Nhƣ vậy, người dùng sẽ luôn nhận những bản sao mới nhất.Đây là mô hình nhất quán cao nhất trong các mô hình và là mô hình nhất quán lýtưởng Tuy nhiên, trong thực tế nó rất khó thực hiện, đặc biệt là đối với cách ệ thốngdữ liệuchiasẻxâydựngtrênmạngP2P.
Mô hình nhất quán tuyến tính: Quy định một độ lệch nhất định giữa các bảnsao, nếu một phiên bản mới đƣợc cập nhật mà độ lệch chƣa đạt tới giá trị quy địnhthì giữa bản sao đó và các bản sao khác vẫn đƣợc coi là nhất quán Độ lệch giữa cácbảnsaocóthểđƣợcxácđịnh nhƣsau:
Mô hình nhất quán tuần tự: Quy định một trật tự thao tác trên dữ liệu mà mọitiến trình phải tuân thủ Trong đó “Kết quả giống nhau của bất kì thao tác nào, nếucácthaotáccủatấtcảcáctiếntrìnhtrêndữliệuđượcthựchiệnmộtcáchtuầntựv à các thao tác của mỗi tiến trình xuất hiện trong chuỗi thao tác này phải theo thứtự đã được chỉ ra trong chương trình của nó” Khi các tiến trình chạy đồng thời trêncác máy nhau, thì cho phép sự đan xen của các thao tác, nhƣng tất cả các tiến trìnhđềuphảinhậnbiếtvàthựcthi sựđanxencủacácthaotác(Hình1.6).
Hình1.6.Đảmbảo mô hìnhnhất quántuầntự
Môhìnhnhấtquánnhânquả:Quyđịnhđốivớicácthaotácghicóquanhệ nhân quả với nhau (Hình 1.7), cụ thể là “Các thao tác ghi có quan hệ nhân quả tiềmnăng phải được nhìn thấy bởi tất cả các tiến trình theo cùng một trật tự, còn cácthao tác ghi đồng thời có thể được nhận biết theo thứ tự khác nhau trên những máykhác nhau” Hai thao tác ghi đƣợc coi là có quan hệ nhân quả với nhau nếu việcthựchiệnmộtthaotáccókhảnănggâyảnhhưởngđếndữliệuđượcghibởithaotáckia,cụthể chúngthỏamãnmộttrongnhữngđiềukiệnsau:
- Thao tác đọc có mối quan hệ nhân quả đối với thao tác ghi cung cấp dữ liệuchonó.
- Thao tác ghi có mối quan hệ nhân quả với một thao tác đọc xảy ra trước nótrongcùngmộttiếntrình.
- Nếucácthaotáckhôngcóquanhệnhânquảvớinhauthìchúngđƣợccoilàxảy ra đồng thời. Các thao tác đọc đồng thời có thể đƣợc thực hiện theo trật tự bấtkì,miễnlàchúngtuântheotrìnhtựcủachươngtrình.
MôhìnhnhấtquánPRAM:Quyđịnhthaotácghi củ a m ộ t tiếntrìnhđƣợc nh ậnvàthựcthibởicáctiếntrìnhkháctheo đúng trậttựmànóthựchiện.Tuynhiên
Bản sao (X) Bản sao (X) Bản sao (X)
Môhìnhnhấtquányếu:Sửdụngcácbiếnđồngbộđểlantruyềnthaotácghiđếnvàđit ừ một máyvàothờiđiểmthíchhợp (Hình1.9),nhƣsau:
W (X )1 0 W (X )1 5 R (X )? tiến trình𝑃 it r ê nXtrả về giá trịv, ký hiệu𝑤𝑃 i(X)𝑣, thao tác đọc của tiến trình𝑃itrênXtrảvề giátrịu,ký hiệu𝑟 𝑃i (X)𝑢 Mỗitiến trình có thểt h ự c h i ệ n c h u ỗ i c á c thao tácđọc hoặc ghitrên dữ liệu chia sẻ< 𝑂 1, 𝑂2, 𝑂3… 𝑂𝑚> Trong đó, chỉ cóthaotácghilàmthayđổigiátrịcủadữliệuchiasẻX.Chẳnghạn,giátrịtrảvềcủa các thao tác𝑤 𝑃 (X)1và𝑤𝑃(X)1l ầ n lƣợt là 10 và 15 Do hệ phânợ t l à 1 0 v à 1 5 D o h ệ p h â n t á n k h ô n g c óđồng hồ toàn cục và do vấn đề về độ trễ truyền thông, cho nên nếu không có nhữngquy ƣớc, ràng buộcđối với việc thực thi củacác tiến trìnhtrêndữl i ệ u c h i a s ẻ t h ì các tiến trình có thể thực thi theo các cách khác nhau, dẫn đến không xác định đượcgiátrịtrảvề của một thaotácđọcnàođó,cụthểcónhữngtrườnghợpsau:
1 Giá trị trả về của thao tác đọc dữ liệuXcủa mỗi tiến trình𝑃icó thể là mộttrongsốcác giátrị ghitrêndữliệuXmàcáctiếntrìnhthựchiệntrước đó.
2 Giá trị trả về của thao tác đọc dữ liệuXcủa các tiến trình sẽ khác nhau,tứclàxảyratrườnghợp𝑟 𝑃i (X)𝑢và𝑟 𝑃𝑙 (X)𝑣.
Chính vì vậy, hệ thống dữ liệu chia sẻ cần có quy ƣớc, quy định chặt chẽtrong việc thực hiện các thao tác đọc/ghi của các tiến trình trênd ữ l i ệ u c h i a s ẻ , nhằm xác định chính xác, tin cậy giá trị trả về của một tiến trình nào đó Trong đó,quy ƣớc, quy định cần thống nhất tuân theo một mô hình nhất quán dữ liệu nhấtđịnh.Điềunàychínhlàđảmbảotínhnhấtquándữ liệuchiasẻX.
Với tiếp cận giải quyết bài toán đảm bảo tính nhất quán dữ liệu trong mạngP2P,cáclượcđồcầnxemxétnhữngthamsốquantrọngcủamôitrườngphântánvàhệthốn gnhƣsau:
-Nútkhông thuần nhất về khả năng xử lý, tốc độnútvào/ra hệ thống và tốcđộnútthựchiệncậpnhật.
- Quy mô của hệ thống dữ liệu chia sẻ gồm có số lƣợngnúttham gia và sốlượng đối tượng dữ liệu chia sẻ Lưu ý là các hệ thống này luôn nhằm phục vụ chonhiềuđốitƣợngdữliệuchiasẻnhƣ âmthanh,hìnhảnh,video,sách,báochí
Mô hình nhất quán dữ liệu: Thông thường, hệ thống dữ liệu chia sẻ thườngcó quy mô lớn, phức tạp do được xây dựng trên mạng P2P và cần đáp ứng nhữngyêu cầu cao từ phía người dùng, cho nên việc áp dụng các mô hình nhất quán mạnhcho hệ thống này là không khả thi và cần thiết Thực tế, tùy thuộc hệ thống dữ liệuchia sẻ để lựa chọn một mô hình nhất quán phù hợp nhằm tối ƣu hóa các chi phí.Hiện nay, trong các nghiên cứu cũng nhƣ triển khai xây dựng hệ thống trên mạngP2P,thìmôhìnhnhấtquántuyếntínhlàlựachọnphùhợp,phổbiến.
Tính sẵn sàng của dữ liệu cập nhật:Cácnúthoàn toàn độc lập và tự trị, cóthể thực hiện cập nhật trên bản sao cục bộ để tạo ra bản sao mới Trong nhiều ứngdụng P2P, cácnútcó thể yêu cầu sử dụng tối đa các bản sao đƣợc tạo ra Vì vậy,tính sẵn sàng của dữ liệu cập nhật là đại lƣợng đƣợc biểu thị bằng tỷ lệ bản sao đãđƣợc cập nhật cho tất cả cácnúttrên tổng số bản sao đƣợc sinh ra (sau đây gọi là tỷlệcậpnhậtthànhcông)cóýnghĩaquantrọngvàcầnthiết. Độ trễ cập nhật:Thời gian trung bình lan truyền cập nhật cho cácnút saotrong hệ thống Độ trễ càng nhỏ chứng tỏ hiệu quả của lƣợc đồ đảm bảo tính nhấtquándữ liệucàngcao.
GIẢIPHÁPĐẢMBẢOTÍNHNHẤTQUÁNDỮLIỆUTRONGMẠNGP
Từ nội dung trình bày ở trên, để đảm bảo tính nhất quán dữ liệu trong mạngP2P theo mô hình đề ra, đòi hỏi khinútthực hiện thao tác cập nhật trên dữ liệu chiasẻ, thì bản sao mới cần đƣợc lan truyền tới cácnút saokhác trong hệ thống, nhằmlàm mới dữ liệu chia sẻ (thực hiện cập nhật) Do vậy, các lớp giảip h á p đ ả m b ả o tính nhất quán dữ liệu trong mạng P2P đƣợc phân rã thành các bài toán về phươngthức lan truyền, phương thức truyền thông và phương thức cập nhật như trình bàydướiđây.
Phương thức lan truyền cập nhật tới cácnút saotrong hệ thống được thựchiệntheomộttrongnhữngcáchthứcnhƣ sau: Đẩy cập nhật (Push):Bản sao đƣợc đẩy cho cácnút saokhác trong hệ thốngmà cácnút saođó không cần có yêu cầu Phương thức này được sử dụng cho cácứngdụngđểđạtđƣợc mức độnhấtquáncao.
Kéo cập nhật (Pull):Khinútcó yêu cầu cập nhật, nó thực hiện thao tác kéobản sao mới Trường hợpnútmới liên kết vào cấu trúc cập nhật và yêu cầu có bảnsaođểlàmviệc,cũngsử dụngphươngthứcPull.
Lai(Hybrid):Sửdụngcơchếphùhợpđểchuyểnđổiqualạigiữahaiphươngthức Push và
Pull, chẳng hạn như thực hiện phương thức cập nhật Push vào mộtthời gian hoặc trường hợp nhất định, ngoài những trường hợp đó,nútsẽ sử dụngphươngthức Pull.
Unicast: Nútgửi bản sao lần lượt tới mỗinút(Hình 1.11) Phương thức nàytiêu tốn nhiều băng thông, tăng độ trễ tại cácnútnhận cập nhật, đồng thời tốn nhiềuthờigian xửlýcủanútgửi,dođóảnh hưởngđếnkhảnăngmởrộng.
Broadcast:Nútgửibảnsaotớitoànbộcácnútsaokhác(Hình1.12).Phươngthức này kém hiệu quả, do nhữngnútkhông có yêu cầu cập nhật cũng đƣợc nhận,nênsẽtốnchiphíbăngthôngvàcáctàinguyênkhác.
Multicast:Một hoặc nhiềunútgửi bản sao tới cácnút sao(Hình 1.13).
Mỗinútchỉ gửi một bản bản sao ra bên ngoài mạng, khi bản sao tới các bộ định tuyến cóhỗ trợ Multicast, chúng sẽ tiếp tụcđ ƣ ợ c n h â n b ả n v à g ử i t ớ i c á c nútnhận trongcùng miền Phương thức này sẽ giảm lưu lượng, giảm tải cho mạng, nhưng khôngkhả thi trên mọi nền tảng mạng sẵn có Trong đó, để thiết lập cơ sở hạ tầng choMulticastđòihỏi khảnăngđịnhtuyến,bảotrì vàbàitoánđịnhtuyếntrênliênmiền.
1 2 i i+1 N-1 N chỉ lan truyền các thông điệp điều khiển cho cácnút saokhác trong hệ thống. Cácnútnhận đƣợc thông điệp biết cần thực hiện nhƣ thế nào để cập nhật cho bản saocục bộ mà nó đang sử dụng Phương thức này tốn rất ít chi phí về băng thông, vàthời gian Tuy nhiên, trong nhiều trường hợp, các thao tác điều khiển cập nhật rấtphức tạp, đòi hỏi năng lực xử lý của hệ thống rất cao, cho nên phương thức nàykhông khả thi trong cácứng dụng trênmạngP2P Chính vì vậy,p h ƣ ơ n g t h ứ c n à y rất ít đƣợc nghiên cứu, triển khai Các nghiên cứu trong các công bố [41] [42] [43]đềxuấtgiảiphápnhƣtrênchocáchệthốngổnđịnhvàcóítyêucầu cậpnhật. b) Gửithông báocậpnhật
Nútthực hiện cập nhật sau đó gửi thông báo về sự cập nhật mới cho cácnútsao,theo một trong những phương thức nhưRandom walk[44],Flooding[45],Rumor Spreading[46], chuỗi logic [47], trong đó có gán thời gian có hiệu lực củabản sao làTTE(Time-To-Expire).Nútnhận đƣợc thông báo biết đƣợc bản sao đangsử dụng còn hiệu lực hay không Do vậy, cácnútnày sẽ thực hiện kéo bản cập nhậtmớivề(thaotácPull)đểđảmbảotínhnhấtquándữliệu.
Hình 1.14m i n h h ọ a c h u ỗ i l i ê n k ế t l o g i c c ủ a c á c nút, mỗinútcó thông tincủaq nútkề về mỗi hướng Khi mộtnút saocập nhật, nó trước tiên gửi thông báo(gọi là thông điệp khai khoáng thông báo cập nhật mới) choq nútkề.Sau khi xácđịnh đượcnútxa nhất về mỗi hướng hiện đangonline,nútnày sẽ gửi nội dung cậpnhật.Nútkhai khoáng xa nhất nhận cập nhật (cờ gán bit 1) và thực hiện cập nhậttương tự cho cácnútở xa hơn, trong khi cácnútkhác chỉ nhận cập nhật (cờ gán bit0) (Hình 1.15) Trong kết quả mô phỏng, lan truyền thông báo trong cấu trúc chuỗilogic có thể giúp giảm 70% chi phí về số lƣợng thông điệp so với sử dụng phươngthứcRumorSpreading. i-q i-1 i i+1 i+q-2 i+q-1 i+q i+q+1
Phương thức gửi thông báo như trên trong lược đồ đảm bảo tính nhất quándữ liệu thường áp dụng cho hệ thống chỉ cónútchính được thực hiện cập nhật trênbản sao; chúng không thể đảm bảo tất cả cácnút saođều nhận đƣợc cập nhật, chonên các giải pháp chỉ đảm bảo tính nhất quán theo xác suất, ngẫu nhiên Hơn nữa,các phương thức này có sự dư thừa khi lan truyền thông báo sẽ làm tăng chi phí vềsốlƣợngthôngđiệpsử dụng.
Tuy nhiên, những giải pháp theo hướng tiếp cận này có ưu điểm sử dụng ítbăng thông, hiệu quả khi hệ thống có tỉ lệ lớn các thao tác đọc so với thao tác ghi.Đặc biệt, nó phù hợp với các ứng dụng trên mạng P2P không có cấu trúc, do nhữngnguyênnhânnhƣsau:
- Giảipháps ử dụngít bă ng th ôn g, hiệuq uảk hi hệ thốngcót ỉ lệl ớ n của thaotácđọcsovớithaotácghi.
- Giải pháp không yêu cầunútchính biết vị trí của cácnút sao, do đó có khảnănggiảiquyếtđƣợcnhữngvấnđềkhókhănkhinútvào/rahệthống.
- Mỗinút saotự động xác định tính hợp lệ và thực hiện kiểm tra, cập nhậtbằng cách gửi yêu cầu tới cácnútsở hữu đối tƣợng hoặc cácnútcó bản sao hợp lệkhác Điều này phù hợp với bản chất, đặc trƣng của mạng P2P nhƣ mỗi bản sao sẽphục vụ cho bất kỳ bản sao khác trong việc duy trì tính nhất quán, giúp giảm tải chocácnútsởhữuđốitƣợngdữliệu,từđóphòngtránhtắcnghẽnvàcânbằngtải.
-MứcđộnhấtquánmạnhhayyếuphụthuộcđộlớncủaTTE,trongđóTTE có giá trị càng lớn thì mức độ nhất quán càng yếu và ngược lại, nên phương thứcnhƣtrêncóthểđápứngđƣợcyêucầucủanhiềuứngdụngkhácnhau. c) Gửinộidungbản saocậpnhật
Nútthực hiện cập nhật và thực hiện lan truyền nội dung bản sao mới cho tấtcả cácnút saokhác trong hệ thống để thực hiện cập nhật nhằm đảm bảo tính nhấtquándữ liệu.
Theo hướng tiếp cận này, một số nghiên cứu đề xuất sử dụng máy chủ tậptrung và một bản sao chính để thực hiện cập nhật, nhằm đảm bảo tính nhất quán dữliệu Cách thức là, máy chủ lưu thông tin tất cả cácnút sao, chỉ có máy chủ đƣợcthực hiện cập nhật trên bản sao chính và lan truyền bản sao cập nhật (sau đây gọi làlan truyền cập nhật) cho cácnút sao Giải pháp thực hiện đơn giản, tuy nhiên chỉ cóhiệu quả khi cácnúttương đối ổn định, số lượng nhỏnút saovà cácnút saothựchiện ít thao tác cập nhật Trong khi đó, do giới hạn về năng lực xử lý của máy chủhoặcdokhảnăng cácnútbịlỗi nêngiảiphápcónhƣợcđiểmvề khảnăng mởrộnghệthống,khảnăngkhôiphụcvàchịulỗi.Nghiêncứutrongcáccôngbố[47] [48]
[49] [50] thực hiện dựa trên ý tưởng nêu trên, chủ yếu nhằm mục đích đảm bảo tínhnhấtquándữ liệuchocáctrungtâmdữ liệulớn.
Nhiều nghiên cứu trong các công bố [23] [51] [52] [53] đề xuất giải pháp tổchức dữ liệu chia sẻ trong cấu trúc cây, nhằm thực hiện cập nhật trong cấu trúc này,để giải quyết hiệu quả bài toán đảm bảo tính nhất quán dữ liệu Các giải pháp đã đềxuất chứng tỏ tính hiệu quả trong giải quyết những vấn đề khó khăn, phức tạp như:môitrườngđộng,tươngtáccao,nútkhôngthuầnnhất;yêucầucủahệthốngvềmứcđộ nhất quán dữ liệu, chi phí, Đặc biệt, giải pháp có thể xử lý hiệu quả trường hợpxảy ra tương tranh khi cácnútthực hiện cập nhật dữ liệu đồng thời Tuy nhiên, quanghiên cứu nhận thấy rằng, các giải pháp theo hướng tiếp cận này vẫn còn tồn tạinhữnghạnchế, vàcầnthiếttiếptụccảitiến,cụthểnhƣsau:
-Phương thức xây dựng cây cập nhật: Các giải pháp đề xuất xây dựng câycậpnhậttheotrìnhtựthờigiannútvàohệthống,nêncácnútliênkếtvớinhaucó thểcáchrấtxavềvậtlýhoặclogic,làmtăngđộtrễcậpnhật,sốlƣợngthôngđiệpvàbăngthôngs ửdụng(traođổithôngđiệphoặclantruyềncậpnhật); xâydựngcâycập nhật dựa vào tính toán khả năng củanút(độ ổn định, tốc độ xử lý…) sẽ rất khókhăn, tốn nhiều chi phí, đặc biệt khi tốc độnútvào/ra hệ thống lớn; cây cập nhật“động” chỉ thể hiện hiệu quả khi tốc độnútyêu cầu cập nhật nhỏ do hệ thống khôngtốnchiphíduytrìcấutrúccây.
KẾTLUẬNCHƯƠNG1
Chương 1 của luận án trình bày một cách có hệ thống “Tổng quan về đảmbảo tính nhất quán dữ liệu trong mạng P2P” Trong đó, luận án đã phát biểu, phântích bài toán nghiên cứu; khảo sát, phân tích và đánh giá các hướng tiếp cận và cáccông trình liên quan về lƣợc đồ đảm bảo tính nhất quán dữ liệu trong mạngP2P Từnhững nghiên cứu đó, luận án đã chỉ ra những ƣu điểm, tồn tại cần tiếp tục pháttriển,cảitiếnhơnđốivớibàitoánnghiêncứu.
Chương2 GIẢI PHÁP CẬP NHẬT NỘI DUNG ĐẢM BẢO TÍNH NHẤT
Trọng tâm của chương 2 trình bày cơ sở chương trình, thuật toán thực thiphân tán; lược đồ đảm đảm bảo tính nhất quán dữ liệu trong mạng P2P, trong đótrình bày các giải pháp về cấu trúc và phương thức lan truyền nội dung cập nhật.Tiếp theo, luận án biểu diễn mô hình lan truyền cập nhật; trình bày, biểu diễn toánhọc các tham số đầu vào và tham số đánh giá hiệu quả đối với các lược đồ. Cuốichương, luận án trình bày và các thiết lập về mạng Pastry trong mô phỏng, đồngthờigiớithiệu ngônngữlậptrìnhthuậttoán,công cụmôphỏng thựcnghiệm.
Kết quả nghiên cứu trong chương 2 của luận án đã được công bố tại côngtrình[1]trongDanhmụccôngtrìnhnghiêncứucủatácgiả.
CHƯƠNGTRÌNHPHÂNTÁN,KHÔNGTHUẦNNHẤT
Trong mục này, luận án trình bày lý thuyết về chương trình và thuật toánphântán;môitrườngphântánvàcácthamsốkhôngthuầnnhấtcủahệthốn gdữliệu chia sẻ trong mạng P2P Đây là những nội dung quan trọng làm cơ sở cho việcđề xuất các giải pháp và để lập trình thuật toán hay tiến hành các thực nghiệm môphỏngnhằm sosánh,đánhgiácácgiảiphápđềxuất.
Chươngt r ì n h p h â n t á n b a o g ồ m t ậ p c á c t i ế n t r ì n h k h ô n g đ ồ n g b ộ𝑝 {𝑝1, 𝑝2, … , 𝑝𝑛}và𝑠i(1i𝑛)l à t r ạ n g t h á i c ủ a t i ế n t r ì n h 𝑝i Tập tất cả các trạngtháicủamỗitiếntrìnhtạimộtthờiđiểmgọilà mộtcấuhìnhcủahệthống,đƣợcbiểudiễnb ở i m ộ t v e c t o r c ó d ạ n g𝛾 = ( 𝑠 1,𝑠2,
…, 𝑠𝑛).Đ ị n h n g h ĩ a c ủ a c h ƣ ơ n g t r ì n h p h â n tánnhƣ sau: Định nghĩa2 1[25].M ộ t t h ự c t h i t r o n g h ệ t h ố n g p h â n t á n=( , , ) l àdãytốiđại=(𝛾,𝛾 1 …)với𝛾i𝛾i1,i =,1…và𝛾,𝛾i.
𝑝 𝑝 𝑝 mạng truyền thông Mỗi tiến trình có thể chạy dưới sự điều khiển của các bộ xử lýkhác nhau Các tiến trình có thể thực thi không đồng bộ, tự động, một cách ngẫunhiên Khi đã gửi thông điệp lên đường truyền, tiến trình sẽ không kiểm soát thôngđiệp đó Tiến trình gửi thông điệp không nhất thiết phải chờ đợi kết quả gửi thôngđiệp Trạng thái toàn cục của hệ thống phân tán bao gồm một tập hợp trạng thái củacác tiến trình và trạng thái kênh truyền Trạng thái của tiến trình đƣợc đặc trƣng bởitrạng thái của bộ nhớ cục bộ Trạng thái một kênh truyền đƣợc đặc trƣng bởi cácdãy thông điệp truyền trong kênh Hai nội dung quan trọng trong chương trình phântánlàtruyềnthôngphântánvàthuậttoánphântánđượctrìnhbàycụthểdướiđây.
Các mô hình mạng truyền thông phân tán thường được tham chiếu bao gồmvào trước ra trước (FIFO), không theo thứ tự vào trước ra trước (Non - FIFO) vàmô hình quan hệ thứ tự trước sau Trong mô hình (FIFO), các kênh hoạt động nhưhàng đợi, theo đó thông điệp vào trước ra trước Trong mô hình (Non - FIFO), cácsự kiện hoạt động theo thứ tự ngẫu nhiên, theo đó tiến trình gửi sẽ bổ sung thêmthông điệp và tiến trình nhận sẽ loại bỏ thông điệp từ kênh Mô hình quan hệ thứ tựtrướcsau t hỏ am ã n k h i đápứn gt í n h chấtv ớ i haith ô n g đ i ệp𝑚ijv à 𝑚𝑘j,nế u
𝑠 𝑛 (𝑚ij) → 𝑠 𝑛 (𝑚𝑘j)thì𝑟 (𝑚ij) → 𝑟 (𝑚𝑘j) Tính chất này đảm bảo rằngcácthôngđiệpcócùngmộtđích,sẽđượcphânphốiđảmbảonếugửitrướcsẽđượcnhậntr ước.Môhìnhquanhệtrướcsaurấthữuíchtrongviệcpháttriểncácthuậttoán phân tán Mối quan hệ này có thể đơn giản hóa khi thiết kế các thuật toán phântán, đảm bảo sự đồng bộ trong xây dựng hệ thống Ví dụ, trong ứng dụng trên mạngP2Pcónhiềubảnsao, thìviệccậpnhậtphảituânthủthứtựtrướcsau nhằmđảmbảotínhnhấtquándữliệu.
2.1.1.2 Thuậttoánphântán Địnhn g h ĩ a 2 2 [ 2 5 ] T h u ậ t t o á n c ụ c b ộ c ủ a m ộ t t i ế n t r ì n hp l à m ộ t b ộ (𝑍 𝑝 ,𝐼 𝑝,→ i ,→ 𝑠 ,→ 𝑟 ),với𝑍 𝑝 ,𝐼 𝑝l ầ nlƣợtlàtậpcáctrạngtháivàtrạngtháiban đầu,
𝑝 𝑝 𝑝 điệp).Mốiquanhệnhịphân→ 𝑝 đểƣợt là 10 và 15 Do hệ phânợcđịnhnghĩabởi:
𝑝 𝑝 chuyểntrạngtháivàgửithôngđiệp,→ 𝑟 chuyểntrạngtháivànhậnthôngđiệp. Định nghĩa 2.3[25] Một thuật toán phân tán trên𝑃 = {𝑝1, 𝑝2, … , 𝑝𝑛}là tậpcác thuậttoán cụcbộcủa các𝑝 i ,1i𝑛. Định nghĩa 2.4[25] Một sự dịch chuyển cấu hình theo phương thức truyềnthôngt i n k h ô n g đ ồ n g b ộ d ự a t r ê n m ộ t t h u ậ t t o á n p h â n t á n , l à m ộ t b ộ (𝑍𝑝,𝐼 𝑝,→ i ,→ 𝑠 ,→ 𝑟 ), trong đó:
S.Cáccặp( 𝑐 , 𝑑)∈ → i để ƣợt là 10 và 15 Do hệ phân ợ c gọilà cácsựkiệnnộibộcủap,và(𝑐,𝑚,𝑑)∈ → 𝑠 𝖴→ 𝑟
𝑝 𝑝 Địnhnghĩa2.5[25].Mộtsựdịchchuyểncấuhìnhtheophươngthứctruyền thôngtinđồngbộdựatrênmộtthuậttoánphântán,làmộtbộ(𝑍𝑝,𝐼 𝑝,→ i ,→ 𝑠 ,→ 𝑟 ), trongđó:
Các tham số của hệ thống dữ liệu chia sẻ (trình bày trong chương 1) có ảnhhưởng quan trọng tới hướng tiếp cận nhằm tìm ra các giải pháp phù hợp cho mỗi hệthống cụ thể và hiệu quả của các lƣợc đồ đảm bảo tính nhất quán dữ liệu Vì vậy,trong mục này, luận án biểu diễn công thức toán học của các tham số đó để làm cơsở cho việc nghiên cứu và thực hiện mô phỏng thực nghiệm đối với các giải phápđƣợcđềxuất.
Núttrong các hệ thống dữ liệu chia sẻ hoàn toàn tự trị và không thuần nhấtđặt ra nhiều vấn đề khó khăn, phức tạp cho các lƣợc đồ đảm bảo tính nhất quán dữliệu.
Sự không thuần nhất củanútđƣợc biểu diễn bởi các hàm phân phối xác suấtnhưtrìnhbàydướiđây. a) Khảnăng củanút Đại lƣợngXPbiểu thị cho khả năng củanút(tốc độ xử lý, bộ nhớ ) thỏamãn là biến ngẫu nhiên trong phân phốiPareto[54] Phân phốiParetođƣợc đặctrưngbởihaigiátrịchotrước,gồmcóthamsốtỷlệ𝑚làgiátrịdươngnhỏnhấtcủa
XPvàthamsốhìnhdạng(sốdương)đượcgọilàchỉsốđuôi.Khiđó,xácsuấtđạilượngXPlớnh ơnmộtgiátrịnàođóđƣợcbiểudiễnbởihàmnhƣsau:
Hình2.1.BiểudiễnphânphốiPareto b) Tốcđộnútvào/rahệthống,tốcđộnútthựchiệncậpnhật Đặc trƣng nổi bật nhất của mạng P2P là kém ổn định do tốc độnútvào/ra hệthống cao và không xác định (nútchủ động hoặc bị lỗi); tốc độnútthực hiện cậpnhậttrêncácbảnsaocụcbộ.ĐạilƣợngXPbiểuthịchomỗisựkiệnnàythỏamãnlà biến ngẫu nhiên của phân phốiPoisson[55], với tham số𝛼là số nguyên dươngthể hiện số lần xuất hiện trung bình của đại lƣợngXPtrong một khoảng thời gian Γchotrước.HàmxácsuấtbiểudiễnchođạilượngXPnhưsau:
Tốc độnútvào/ra hệ thống tương ứng với tỷ lệ thời giannúttham gia tronghệ thống và tốc độnútthực hiện cập nhật tương ứng với số lầnnútthực hiện cậpnhật trên độ dài thời gian tiến hành thực nghiệm Do vậy, trong trình bày của luậnán,sẽsửdụngtỷlệnàyđểchỉtốcđộnútvào/rahệthốngvàđạilƣợngtổngsốlầnđãt hựchiệncậpnhậtcủatấtcả cácnútđểchỉtốcđộnútthựchiệncậpnhật.
Quy mô hệ thống dữ liệu chia sẻ đƣợc biểu thị bởi hai tham số, gồm có: sốlƣợngnúttham gia và số lƣợng đối tƣợng dữ liệu chia sẻ trong hệ thống Đặc biệt,do tốc độnútvào/ra hệ thống không xác định nên các giá trị này sẽ liên tục biến đổi.Khi quy mô của hệ thống thay đổi, nhất là trong trường hợp các tham số này giatăng thì bài toán đảm bảo tính nhất quán càng trở nên khó khăn, phức tạp hơn Sốlƣợngnúttham gia và số lƣợng đối tƣợng dữ liệu chia sẻ trong hệ thống là đạilƣợngthỏamãnphân phốiZipf[56],cócôngthứcnhƣsau:
LƢỢCĐỒCẬPNHẬTNỘIDUNGĐẢMBẢOTÍNHNHẤTQUÁND ỮLIỆUCHIASẺTRONGMẠNGP2P
Khinútmuốn có dữ liệu chia sẻ, trước tiên nó cần liên kết vào cấu trúc câycập nhật Mỗi lƣợc đồ sẽ có giải pháp xây dựng cây cập nhật khác nhau, trong đó cóhaihướngtiếpcậnnhưsau:
Cây cập nhật tĩnh: Cấu trúc cập nhật của mỗi dữ liệu chia sẻ đƣợc xây dựngcốđịnhtrênmạngP2P,nhằmlantruyềnnộidung cậpnhật.
Cây cập nhật động: Cấu trúc cập nhật của mỗi dữ liệu chia sẻ chỉ đƣợc xâydựng khi mộtnútnào đó thực hiện cập nhật, nhằm lan truyền nội dung cập nhật vàcấutrúccậpnhật sẽbịhủybỏ khicậpnhậtđãhoànthành.
Hình 2.4.Minh họa cây nhị phân cập nhậtLượcđồtổngquanđượcthựchiệngồmcóhaibướcnhưsau:
Bước1 :Vớim ỗ i dữliệuchiasẻX,lƣợcđồsẽxâydựngc ấ u trúccâycập nhậtd-aryphíatrênmạngP2P,kýhiệulà𝑇K.
Cây𝑇 K bao gồm hữu hạnnúttrong hệ thống hoặc chỉ gồm cácnút sao. Trongđó,nútchính của khóa sẽ đƣợc chọn lànútgốc của cây𝑇Kv à t r ê n t ậ p h ợ p c á cnútcó một quan hệ phân cấp gọi là quan hệ "cha - con" Câyd-arylà cây mà mỗinútcótối đad nútcon,dđƣợc gọi là bậc củanút Giả sử cóN núttham gia, nhƣ vậy chiềucaocủacây𝑇Klà=𝑁.Hình2.4làminh họachocâynhịphâncậpnhật.
Bước 2: Cácnútcó thể thực hiện cập nhật trên bản sao cục bộ theo nhu cầusử dụng, nhƣng đồng thờinútnày cần gửi nội dung bản sao mới tớinútgốc để lantruyềncậpnhậtchocácnútphíadưới.
Trong phần sau đây, luận án trình bày và phân tích các giải pháp trong thựchiệnđốivớimỗi bướccụthểnêutrên.
Yivà các cộng sự đề xuất giải pháp xây dựng cây cập nhật theo thứ tự thờigian đến và cân bằng số lƣợng cácnúttrong mỗi cây con Trong đó,nútchính củakhóasẽlànútgốccủacâycậpnhật.Mỗinútsửdụng2biếncụcbộ,gồmcó𝐶ℎi𝑙𝑑𝑃 là tập cácnútcon củaPvà𝐶𝑜𝑢𝑛𝑡𝑃là số l ợng cácƣợt là 10 và 15 Do hệ phân núttrong cây con củaP Giả sửnút P(có thể lànútđơn lẻ hoặc cây con) muốn liên kết vào cây cập nhật, nếu nó lànútmới, trước tiên khởi tạo các biến cục bộ𝐶ℎi𝑙𝑑𝑃: ={ } , 𝐶 𝑜 𝑢 𝑛 𝑡 𝑃1 Đồng thờinút Pgửi thông điệp𝑟𝑒𝑞𝑢𝑒𝑠𝑡_j𝑜i𝑛(𝑃, 𝐶ℎi𝑙𝑑𝑃, 𝐶𝑜𝑢𝑛𝑡𝑃)tớinútgốc để yêu cầu liênkết vào cây cập nhật Nếunútgốc chƣa có đủnútcon,nút Psẽ đƣợc liên kết làmnútconcủanútgốctạivịtrícònthiếu.Ngƣợclại,nútgốcgửithôngđiệptớinútconQcó𝐶𝑜𝑢 𝑛𝑡nhỏ nhất trong sốnútcon.Nút Qnhận được thông điệp và thực hiệntương tự cho đến khi tìm đƣợcnútcha củanút𝑃 Mã giả của thuật toán trên đƣợctrìnhbàynhƣ dướiđây. Đầuvào:Nút𝐾nhậnthôngđiệp𝑟𝑒𝑞𝑢𝑒𝑠𝑡_j𝑜i𝑛(𝑃, 𝐶ℎi𝑙𝑑𝑃,𝐶𝑜𝑢𝑛𝑡𝑃). Đầura:Nútchacủa𝑃hoặctiếptụcgửi𝑟𝑒𝑞𝑢𝑒𝑠𝑡_j𝑜i𝑛(𝑃, 𝐶ℎi𝑙𝑑𝑃,𝐶𝑜𝑢𝑛𝑡𝑃).
Nakashimavà các cộng sự đề xuất thuật toán xây dựng cây cập nhật theo xácsuấtnútmới có thông tin củanútgốc Thuật toán thực hiện tương tự thuật toán xâydựngc â y c ậ p n h ậ t c ủ aY i n h ƣt r ì n h b à y ở t r ê n T u y n h i ê n , t h ô n g đ i ệ p
𝑟𝑒𝑞𝑢𝑒𝑠𝑡_j𝑜i𝑛(𝑃, 𝐶ℎi𝑙𝑑𝑃, 𝐶𝑜𝑢𝑛𝑡𝑃)củanútmớiPcó yêu cầu liên kết vào cây cậpnhậtlàcóthểkhônggửitớinútgốc màsẽgửitớinútmà nóbiết,cụthểnhƣsau:
- Nếunút Pbiết đƣợc địa chỉIP nútgốc của cây cậy nhật𝑇K,thìnútgốcđƣợcchọnlànútyvới xácsuấtbằng1.
Không gian định danh 4 bít
-Ngƣợclại,nútgốcsẽl ànútYv ớ ixácsuấtp vànútgửicậpnhậtchoP đƣợcchọnlànútYvớixácsuất1−𝑝.
𝑟𝑒𝑞𝑢𝑒𝑠𝑡_j𝑜i𝑛(𝑃, 𝐶ℎi𝑙𝑑𝑃, 𝐶𝑜𝑢𝑛𝑡𝑃), tuy nhiên nó khôngđạt đƣợc hiệu quảvềc â y cân bằng Hơn nữa, trong cả hai phương thức xây dựng cây cập nhật củaYivàNakashima, có nhƣợc điểm là cácnútliên kết với nhau (quan hệcha –con) nhƣngcó thể xa nhau về mặt logic, làm tăng chi phí truyền thông giữa cácnút.
Chẳng hạntrong mạngPastrythì chi phí truyền thông giữa hainútbất kỳ luôn là𝑙𝑜𝑔 𝑁(bước).Điều này dẫn đến tăng độ trễ cập nhật, số lượng băng thông và thông điệp để đảmbảotínhnhấtquándữ liệu.
Chenvà các cộng sự [57] đề xuất thuật toán xây dựng cây cập nhật sử dụngnútđại diện Mỗinútđƣợc định danh duy nhất trong vùng không gian định danh𝑛bit (chẳng hạn bằng cách băm ịa chỉđể IPcủanútđó) Dựa vào định danh của mỗinút,t h u ậ t t o á n p h â n c h i a l i ê n t i ế p t ấ t c ả c á cn ú t t r o n gm ạ n g P 2 P t h à n h c á c p h â n vùng bằng nhau.Nútchính của khóa lànútgốc của cây cập nhật, cácnútcon lànútđại diện cho mỗi phân vùng Thuật toán sử dụng vector lưu thông tin về vị trí cácnút saotrong cây con của nó và chỉnútlá chứa bản sao Hình 2.5 minh họa cây nhịphâncậpnhậtđƣợcxâydựngtheothuậttoántrên.
Trong giải pháp củaChen, cácnútkhông chứa bản sao cũng tham gia cấutrúc cây cập nhật, dẫn đến quy mô của cây sẽ rất lớn, cácnútcó thể dễ trở nên quátảidophảixử lýnhiềuyêucầu.
Shenvà các cộng sự [51] đề xuất thuật toán xây dựng cây cập nhật theokhoảng cách mạng Giả sử trong không gian mạng Internet cómmốc.
… , 𝑑𝑚)t h à n hm ộ t s ố nguyên dương, gọi là sốHilbert(ký hiệu1) Khi đó, cácnútcó1chênh lệch càngnhỏ, sẽ càng gần nhau trong mạng Internet.Nútgốc của cây cập nhật lànútcó1ởchính giữa trong tập1của cácnút Mỗinút(không phải lànútlá) códcon với1gần với1của nó; theo chiều ngang, cácnútcùng cấp có giá trị1theo thứ tự tăngdần.TrongphươngthứcxâydựngcâycậpnhậtcủaShen,cácnútgần nhauvềđịalýsẽ liên kết gần nhau về mặt logic trong cấu trúc cây cập nhật Tuy nhiên, giải pháptốn nhiều chi phí để tính toán, xác định khoảng cách mạng của cácnút Do vậy đốivớihệthống cótốcđộnútvào/ralớnsẽkhônghiệuquả.
Nútcó tốc độ vào/ra hệ thống không xác định, nguyên nhân do nhu cầu thamgia hệ thống khác nhau của cácnútvà những yếu tố đặc trƣng của mạng P2P. Vìthế, các lƣợc đồ đảm bảo tính nhất quán dữ liệu cần có các giải pháp xử lý vấn đềnày nhằm duy trì cấu trúc cập nhật Khi tốc độ này càng lớn thì việc duy trì cấu trúccâycậpnhậtcàngkhókhăn,phứctạpvàđòihỏi chi phícao.
Thông thường, mỗinútcần lưu thông tin củanútcha và cácnúttổ tiên củanó.Nútsửdụngthôngđiệptraođổithườngxuyênvớinútchađểpháthiệnsựrờibỏcấu trúc củanútcha Khinútcha rời bỏ, mỗinútcon cần độc lập phát hiện ra điềunàyvàtìmcáchliênkếttrởlạicấutrúccâycậpnhậtdựavàothôngtinmànócó.
Khinútgốcnhậncậpnhậtmới,nósẽgửicậpnhậtđóchocácnútconvàcác nútconthựchiệncácthaotáclặplạitươngtự,chotớikhitấtcảcácnútnhậnđược cậpnhật.Môhìnhtổngquátvềlantruyềncậpnhậttrongcấutrúccây đãđƣợctrìnhbàytrongcôngbố[24]vàđểthựchiện tínhtoáncócácgiảthiếtnhƣsau:
1i < 𝐿 , trong đó𝑀0lànútgốc và𝑀l ànútlá Độ trễ cập nhật từ một lớp tới lớpliền kề phía dưới là thời gian lớn nhất lan truyền cập nhật của một cặpnútcha-controng hai lớp đó Ký hiệu𝑙 l à ộ t r ễ c ậ p n h ậ t t ừ m ứ cđể 𝑙và mức𝑙 + 1 Nhƣ vậy, độtrễcậpnhậtlàmộtphânphốitheo cấpsốnhântheo mô hìnhhàngđợi (Hình2.6).
� 1 ốiđể vớiđộtrễcậpnhậttừnútgốctớinútlá,vớibộnhớđệmcókíchthước𝐿*𝑘,tốc độcậpnhậtcủacácnútgửiđếnnútgốclà
𝜆,thời gianphục vụ là− 1(Hình 2.7).
Nhưđềcậptrongchương1,trongbàitoánnghiêncứuvàcủacáchệthốngdữliệuchiasẻ,cób athamsốcóýnghĩaquantrọngtrongứngdụngthựctiễn,baogồm:môhìnhnhấtquán,tínhsẵnsàn gcủadữliệuchiasẻvàđộtrễcậpnhật.Phầnnày,luậnántrìnhbàybiểuthứctoánhọcbiểudiễnchobat hamsốnêutrên,cụthểnhƣsau: a) Môhìnhnhấtquán dữliệu–mứcđộnhất quán
Cáclƣợcđồsử dụngcấu trúccâylan truyềncập nhậtđảmbảotính nhấtquán dữ liệu theo mô hình tuyến tính, kích thước bộ nhớ đệm (giá trị củak) là độ lệch tốiđa giữa các bản sao cho phép theo quy ƣớc, biểu thị mức độ nhất quán trong môhình nhất quán tuyến tính (sau đây gọi là mức độ nhất quán) Tùy theo yêu cầu củaứngdụngmàcáclƣợc đồcóthểxácđịnhgiátrịkphùhợp. b) Tínhsẵnsàngcủadữliệuchiasẻhaytỷlệcập nhậtthànhcông
Ký hiệu𝜋 𝑛 là xác suất có𝑛cập nhật trong hàng đợi Theo lý thuyết hàng đợihữuhạnM/M/1 tacó:
Cập nhật bị từ chối khi bộ nhớ đệm củanútgốc đầy Điều này xảy ra là do cómộtnútphía dưới𝑀𝑙có bộ nhớ ệm ầy Nh vậy, cácđể để ượt là 10 và 15 Do hệ phân nútdọc theo liên kết từnútgốc tới𝑃𝑙cũng có bộ nhớđệm đầy Giả sử ký hiệu chuỗi này là𝑀0, 𝑀1,
… , 𝑀𝑙 Khibộ nhớ đệm củanút𝑀𝑙đểƣợt là 10 và 15 Do hệ phânợc giải phóng (không còn ầy), thì cậpđể nhật sẽ đểƣợt là 10 và 15 Do hệ phânợc gửiđồng thờinhƣsau:𝑀 0 →𝑀1,𝑀1→𝑀2,…,𝑀𝑙−1→𝑀𝑙.
Từ công thức biểu diễn toán học của các tham số đánh giá hiệu quả lƣợc đồđảm bảo tính nhất quán dữ liệu trong mạng P2P nhƣ trên, chúng ta đƣa ra một sốnhậnxét,đánhgiáquantrọngnhưtrìnhbàydướiđây.
MÔPHỎNGTHỰCNGHIỆM
Trong luận án, các giải pháp và thuật toán đề xuất đƣợc triển khai tại tầngứngdụngxâydựngtrênmạngPastrycócấutrúc (Hình2.8).
MạngPastryđƣợc đề xuất bởiRowstronvà các cộng sự vào năm 2001, làmạng nền khá nổi tiếng để phát triển các ứng dụng [59] Một số nội dung giới thiệuvà thiết lập tham số của mạngPastryliên quan tớiminh họa, lậpt r ì n h c á c t h u ậ t toán,giảiphápvàthựcnghiệmmôphỏngnhƣsau:
Hình2.9.Sắpxếpcácnútvàkhóatrongkhônggian định danh128bit Định danh mỗinút𝑀𝑖và ối t ợng dữ liệu chia sẻđể ƣợt là 10 và 15 Do hệ phân 𝑋𝑗lần l ợt là𝐼𝐷ƣợt là 10 và 15 Do hệ phân 𝑀 𝑖,
𝐼𝐷𝑋 𝑗 trong cơ số2 𝑏 (blà tham số cấu hình, thông thường là 2 hoặc 4, trong luận án𝑏
=4),hàmbămphântánđốivớiđịachỉIPcủanútvàtêndữliệu𝑋𝑗.Địnhdanhcủanút vàkhóađƣợcsắpxếp,bốtrítrêncùngmộtvùngkhônggianđịnhdanh128bitlà[0,
2 128 − 1](𝐼𝐷𝑀 𝑖, 𝐼𝐷𝑋 𝑗 ∈ [0, 2 128− 1]) (Hình 2.9) Hàm trừu tƣợng𝜎(𝑘𝑙, 𝑘𝑚)xác ịnhđể khoảng cách từ khóa𝑘𝑙đểến khóa𝑘𝑚, để phân hoạch mỗinútchịu tráchnhiệmchomộtvùngkhônggiankhóabằngnhau.Nhƣminhhọatronghình2.9,nút
𝑀2chịu trách nhiệm cho các khóa𝑘1(t ơng ứng ối t ợng dữ liệu𝑋ƣợt là 10 và 15 Do hệ phân để ƣợt là 10 và 15 Do hệ phân 1) và khóa𝑘2(t ơng ứng ối t ợng dữ liệuƣợt là 10 và 15 Do hệ phân để ƣợt là 10 và 15 Do hệ phân 𝑋2);nút𝑀3chịu trách nhiệm cho các khóa𝑘3(t ơngƣợt là 10 và 15 Do hệ phân ứng đối tƣợng dữ liệu𝑋3);nút𝑀4chịu trách nhiệm cho các khóa𝑘4(t ơngƣợt là 10 và 15 Do hệ phân ứng đểốitƣợngdữliệu𝑋4);vànút𝑀𝑖chịutráchnhiệmchocáckhóa𝑘𝑗(t ơngƣợt là 10 và 15 Do hệ phân ứngđốitƣợngdữ liệu𝑋𝑗).
Mạng gồm cácnútcó khả năng khác nhau đƣợc sinh ngẫu nhiên bởi phânphốiPareto;nútcóbảngđịnhtuyếngồm10hàng, mỗi hàngcó15(2 𝑏 −1)th ựcthể; 32 (tương ứng là2 * 2 𝑏 )nútlá (nútgần về logic), 32 (tương ứng là2 * 2 𝑏 )nútláng giềng (nútgần về vật lý) Hình 2.10 là ví dụ minh họa bảng định tuyến của mộtnút,trongđóthamsốcấuhình𝑏 =2,kíchthướcgồmcó8hàng,mỗihàngcó3t hựcthể,8nútlávà 8nútlánggiềng.
Cácnúttrao đổi thông điệp với nhau dựa vào bảng định tuyến Giả sử mạngcó𝑁n ú ttham gia, nhƣ vậy chi phí truyền thông điệp (trong thực hiện xây dựng,duy trì cấu trúc ) hoặc gửi bản sao cập nhật (sau đây gọi chung là chi phí truyềnthông)giữa2nútbất kỳtrong mạngPastrylà𝑙𝑜𝑔2 𝑏𝑁 (b ớc).ƣợt là 10 và 15 Do hệ phân
10233001 10233000 10233230 10233232 tập hợp lại thành những thành phần hay những mô hình lớn hơn bằng ngôn ngữ bậccao NED, trong ứng dụng mã nguồn mở OMNeT++ 4.2.2 (Objective ModularNetwork Testbed in C++) Những chương trình này được thực hiện mô phỏng trênứng dụng nguồnmởOverSim (Hình 2.11),đ ƣ ợ c p h á t t r i ể n b ở i
V i ệ n V i ễ n t h ô n g , Đại học Karlsruhe, Đức OverSim cho phép giả lập nhiều mạng P2P (Pastry, Chord,Tapestry ), hạ tầng bên dưới (INET, Simple,
SingleHost) và các phương thứctruyềnthông.
Bên cạnh đó, luận án sử dụng phần mềm mã nguồn mở Open Stack, đƣợcphát triển trên nền tảng công nghệ điện toán đám mây, để mô phỏng thuật toánphòngtránhbếtắctrongcungcấptàinguyênchomáyảo,đềxuấttrong mục3.4.
Dữ liệu chia sẻ trong thực nghiệm đƣợc chọn ngẫu nhiên từ tập hợp dữ liệuđã thực hiện chia sẻ trên ứng dụng BitTorrent từ ngày 28 tháng 10 đến ngày 9 tháng12năm2008 [60].
Luận án đã tiến hành các thực nghiệm trên máy tính Intel CoreTMi3-2350MCPU(2.3GHz,và4GBRAM).
KẾTLUẬNCHƯƠNG2
Trong chương 2, luận án đã trình bày cơ sở của các hệ thống phân tán,cácgiải pháp xây dựng và duy trì cấu trúc cập nhật; phương thức lan truyền cập nhậttrong các lƣợc đồ đảm bảo tính nhất quán dữ liệu; trình bày và biểu diễn công thứctoán học của các tham số đánh giá hiệu quả Trên cơ sở đó, luận án có những nhậnxét, đánh giá Đây là những nội dung cơ sở để luận án trình bày những đề xuất, cảitiếntrongchương3.
MỘT SỐ GIẢI PHÁP ĐỀ XUẤT NÂNG CAO HIỆU QUẢ CẬP
Trong chương 3, luận án trình bày các đề xuất nâng cao hiệu quả lược đồđảm bảo tính nhất quán dữ liệu, cụ thể gồm có: Giải pháp về phương thức xây dựngvà duy trì cấu trúc cập nhật, trong đó nâng cao hiệu quả truyền thông giữa các nútđể giải quyết bài toán tốc độ nút vào/ra hệ thống lớn; giải pháp về phương thức cậpnhật linh hoạt trong cấu trúc cập nhật mà mỗi nút có bộ nhớ đệm và giải pháp hoánđổi liên kết các nút để phòng tránh tắc nghẽn; thuật toán nhân bản cho một nút dựavào ngưỡng tốc độ yêu cầu cập nhật nhằm tối ưu chi phí đảm bảo tính nhất quán dữliệu. Cuối chương, luận án trình bày thuật toán phòng tránh bế tắc trong cung cấptài nguyên cho máy ảo xây dựng trên mạng P2P, làm cơ sở cải tiến cho các lược đồđảmbảotính nhấtquándữliệusửdụngmáyảocậpnhật.
Các kết quả trình bày trong chương này đã được công bố trong các bài báo[1][2][3][4][5][6]trongDanh mụccáccông trìnhnghiêncứucủatácgiả.
GIẢIP H Á P X Â Y D Ự N G CẤ U T R Ú C C Ậ P N H Ậ T H I Ệ U Q U Ả Đ Ố IVỚICÁCHỆTHỐNGKÉMỔNĐỊNH
Trong mục này, luận án trình bày một giải pháp đề xuất về phương thức xâydựng và duy trì cấu trúc cập nhật, trong đó nâng cao hiệu quả truyền thông giữa cácnút, do đó lƣợc đồ đạt đƣợc hiệu qủa cao về độ trễ cập nhật, đặc biệt khi tốc độnútvào/rahệthốnglớn (trong cáchệthốngdữ liệuchiasẻ trênmạngP2Pkémổn định).
Các hệ thống dữ liệu chia sẻ trên mạng P2P kém ổn định do tốc độnútvào/rahệ thống lớn và không xác định Điều này ảnh hưởng quan trọng đến hiệu quả củacác lược đồ đảm bảo tính nhất quán dữ liệu và không cho phép chúng ta lựa chọnnhững mô hình nhất quán mạnh hay sử dụng những giải pháp kỹ thuật tối ƣu, nhƣnghiên cứu công bố số [1] trong danh mục công trình của tác giả Bởi vì,nhữngtrườnghợpđóluônđòihỏinútcósựổnđịnhvàthôngtincủatấtcácnúttronghệ
� thống.Trongcáclƣợc đồđảmbảotínhnhấtquándữliệu,tốcđộnútvào/rahệthốnglớn sẽ làm tăng chi phí xây dựng và duy trì cấu trúc cập nhật, trong đó phải kể đếnthời gian mà hệ thống phải dừng để xử lý việcnútvào/ra hệ thống nên không thểthực hiện lan truyền nội dung cậpnhật, làm tăngđộ trễ cập nhật.H ơ n n ữ a , t h e o công thức 2.10, thì độ trễ cập nhật phụ thuộc hiệu quả truyền thông giữa cácnút.Tuy nhiên, như phân tích ở chương 2, các giải pháp đã đề xuất còn tồn tại hạn chếtrong xây dựng cấu trúc cây cập nhật và tối ƣu truyền thông giữa cácnút, dẫn đếnhiệu quả chƣa cao về độ trễ cập nhật, đặc biệt khi tốc độnútvào/ra hệ thống lớnthườngdẫnđếnđộtrễcậpnhậttăngđộtbiến(chẳnghạnnhưgiảiphápdoNakashimađề xuất) Vì vậy, luận án đã đề xuất một giải pháp mới cải tiến chonhữngvấnđề, hạnchế nêutrênnhằmđạtđƣợchiệuquảcaovềđộtrễcậpnhật.
ThuậttoánID_LINKxâydựngcâycậpnhậttĩnhd-ary(mỗinútcótốiđad nútcon),chỉgồmcócácnútsaocủadữliệuchiasẻXthựchiệnnhƣsau:
Nút Mbất kỳ và đối tƣợng dữ liệuXsẽ đƣợc định danh bởi hàm băm đối vớiđịa chỉIPcủanútvà tên dữ liệuX, lần lƣợt là𝐼𝐷 𝑀 và𝐼𝐷K Khi đó,nútvào hệ thốngđầu tiên sẽ đƣợc chọn lànútgốc của cây cập nhật, ký hiệu lànút R.Nút Rđƣợc coilà chịu trách nhiệm cho toàn bộ không gian định danh của tất cả cácnút, nên với bấtkỳnútM,taluôncó𝐼𝐷𝑀∈ [0,2 128 -1].KhônggianđịnhdanhcủanútMchịutrách nhiệmđƣợcký hiệulà𝑤 𝑠 𝑀v à 𝑤 𝑠 1 , 𝑤𝑠 2 , …,𝑤𝑠 𝑑 l à kýhiệudph ầnphânchialiên
𝑀 𝑀 𝑀 tiếpbằngnhautrongkhônggianđịnhdanh𝑤𝑠 𝑀.Nútconđƣợcđánhsốthứtựtừt ráiqua phải,trongđó𝑁 i l à k ýhiệunútconcủanútMtạivị tríthứi(Hình 3.1).
Giả sửnút Mlànútcần liên kết vào trong cấu trúc cây cập nhật, nó sẽ gửithông điệp𝑟𝑒𝑞𝑢𝑒𝑠𝑡_j𝑜i𝑛(𝑀, 𝐼𝐷 𝑀 )t ớ inút gốc Rthông qua cấu trúc mạng phủPastry,y ê u c ầ u đ ƣ ợ c l i ê n k ế t v à o c â y c ậ p n h ậ t N ú t R k i ể mt r a𝐼 𝐷 𝑀∈ 𝑤𝑠 i , v ớ i i=̅1̅̅,̅𝑑̅.Nếun út R chƣacónútconch ịu tr ách n h i ệmchok hô nggianđ ịnhd an h
𝑅 𝑅 tương tự Yêu cầu củanút Mkết thúc khi tìm đượcnút Kthỏa mãn𝐼𝐷𝑀∈ 𝑤𝑠 i v ànút Kchƣa cónútcon𝑁 i Khi ó,để nút Mđƣợc chọn lànútcon củanút Ktại vị tríthứi,k ý h i ệ u𝑁 i vàn ó c h ị u t r á n h n h i ệ m c h o v ù n g k h ô n g g i a n đ ị n h d a n h l à
Thuậttoán3.1: I D _ L I N K 𝑑−𝑟 𝐶 𝑜 𝑛 𝑠 𝑡 𝑟 𝑢 𝑐 𝑡 i 𝑜 𝑛 Đầuvào:Nút Knhận đƣợc thông điệp𝑟𝑒𝑞𝑢𝑒𝑠𝑡_j𝑜i𝑛(𝑀, 𝐼𝐷𝑀) Đầura:Nútchacủanút M
1 𝐼𝐷𝑀∈ 𝑤𝑠 i / / 𝐼𝐷𝑀thuộc vùng không gian ịnhđể danhthứitrong𝑤𝑠𝐾
Hình 3.2 minh họa cácnútđƣợc đánh số lần lƣợt là 1,2,3, ,7 theo thứ tựtheo thời giannútvào cấu trúc cây cập nhật và sắp xếp của chúng trong không gianđịnh danh Hình 3.3 minh họa kết quả xây dựng cây cập nhật2-Arytheo thuật toánID_LINK,cụthểthựchiệntừngbướcnhưsau:
Ban đầu,nút 0đƣợc chọn lànútgốc Tiếp theo,nút 0nhận đƣợc yêu cầu củanút
1.Nút 0kiểm tra𝐼𝐷1∈ 𝑤𝑠 2 vànút 0chƣa cónútcon nào đƣợc chỉ định để chịutrách nhiệm trong vùng định danh𝑤𝑠 2 Do vậynút 1liên kết làmnútcon bên phảicủanút0vàw s1➟w s 2 Tiếptheonút0nhậnđƣợc yê u cầucủanú t 2.Nút0 kiểmtr a𝐼𝐷2∈ 𝑤𝑠 1 v ànút 0cũng chƣa cónútcon nào đƣợc chỉ định chịu trách nhiệmchov ù n g k h ô n g g i a n đ ị n h d a n h𝑤 𝑠 1 V ì t h ến ú t 0 c h ọ n n ú t 2 l à m n ú t c o nb ê n t r á i củanút 0vàws2➟ ws 1 Tiếp theonút 0nhận đƣợc yêu cầu củanút 3.Nút
0kiểmtra𝐼 𝐷 3∈ 𝑤 𝑠 1 T u y n h i ê nn ú t 2 đ ãđ ƣ ợ c c h ỉ đ ị n h c h ị u t r á c h n h i ệ m c h o v ù n g đ ị n h danh𝑤𝑠 1 ,dovậynút0gửiyêucầuchonút2.Nút2kiểmtra𝐼𝐷3∈𝑤𝑠 2 v ànút2
0 2 chƣacónútconnàođƣợcchỉđịnhchịu tráchnhiệm cho vùng định khônggian định danh𝑤 𝑠 2 N ú t 3 s ẽđ ƣ ợ c l i ê n k ế t l à mn ú t c o nb ê n p h ả i c ủ an ú t 2 v à𝑤 𝑠 3➟𝑤 𝑠 2
Hình3.3.Minh họa kếtquảxâydựng câycậpnhậtcủathuậttoánID_LINK
Khi tốc độnútvào/ra hệ thống lớn thì yêu cầu duy trì cây cập nhật là hết sứckhó khăn và ảnh hưởng quan trọng đến hiệu quả các lược đồ đảm bảo tính nhấtquán dữ liệu Trong đề xuất mới, mỗinútgiữ thông tin củanútcha,nútông (có thểcập nhật những thông tin này đồng thời với khi lan truyền bản sao mới) và trao đổithông điệp thường xuyên với nhau để phát hiện sự rời bỏ cấu trúc (chẳng hạn nhƣsau một số lƣợng nhất định thông điệp gửi đi mà không có sự phản hồi nào thì chorằngnútđã rời bỏ) Khi có sự thay đổi, cácnútcó liên quan sẽ đƣợc truyền tham sốlà vùng không gian định danh mới mà nó chịu trách nhiệm hoặc thay đổinútconchịutráchnhiệm.Cóhaitrườnghợpnútrờibỏcấutrúcnhưtrìnhbàydướiđây.
Nút chủ động:Nếunút Mlànútlá rời bỏ, nó chỉ cần gửi thông điệp chonútcha của nó, chẳng hạn lànút K Khi đó,nút Kbiết đƣợc vùng định danhw𝑠𝑀hiệnkhông cónútcon nào chịu trách nhiệm để có thể bổ sungnútmới vào vị trí đó Nếunút
Mlànúttrong thìnút Msẽ thực hiện chọn mộtnútlá trong cây con để thay thếchochínhnó.
Nút bị lỗi:Nếunút Mlànútlá bị lỗi,nútcha sẽ phát hiện ra sự rời bỏ hệthốngc ủ an ú t M t h ô n gq u a v i ệ c t r a o đ ổ i t h ô n g đ i ệ p T r o n g t r ƣ ờ n g h ợ p n à y , h ệ thống thực hiện tương tự như trên Nếunút Mlànúttrong, khi đó mỗinútcon củanútMsẽđộclậppháthiệnrađiềunày vàchúngphảigửithôngđiệptớinútôngvới i
1 những nội dung yêu cầu liên kết trở lại và đề xuấtnútthay thế (nútlá trong của mỗicây con).Nútông lựa chọn mộtnúttrong số cácnútđƣợc đề xuất để thay thế chonútvừarờibỏ.Trườnghợpnútgốcbịlỗithìmạngphủsẽchịutráchnhiệmđểtìmran útmớithaythế.
Bổ đề 1: Chi phí truyền thông giữanút𝑀𝑙vànút𝑀𝑙+1trong cây cập nhật tốiđalà⌈ 𝑁 ⌉b ớc.ƣợt là 10 và 15 Do hệ phân
DohệthốngcóNnútvàchúngđƣợcsắpxếptrongtoànbộkhônggianđịnhdanh.Do đó,trongmỗiphânvùngkhônggianđịnhdanhtạimứcisẽcótrungbình là| 𝑁 |nút.Docácnútgầnnhautrongkhônggianđịnhdanh,2 𝑏 −1làsốnúttrong
𝑑 mỗi cột,nênthông tintrongbảngđịnh tuyếncủamỗinútcótốiđa⌈ 𝑁
IDcủanhữngnútnày,bắtđầutừhàngđầutiên.Chínhvìthế,theothuậttoánđịnh tuyếntrongmạngPastry,thì⌈ 𝑁 ⌉c h ín hlàsốbướctốiđatrongtruyềnthông
𝑑 nút𝑀ivànút𝑀𝑙+1trong câycậpnhật tốiđa là⌈ 𝑁
⌉b ớc.ƣợt là 10 và 15 Do hệ phân
𝑀𝑙,trongđósẽgồmcótổngchiphíđểthựchiệngửicậpnhậttừnút𝑀0tớinút𝑀1 , từn ú t𝑀1t ớ in ú t𝑀 2 , ,𝑀𝑙t ớ in ú t𝑀𝑙+1 D ov ậ y , t a c ó𝑐 𝑜 𝑠 𝑡 𝑀0 đƣợcbiểudiễn bằngcôngthứcnhƣsau:
Giả sử𝑝𝑙làxácsuấtnútsẽliênkếtvàocâycậpnhậttạimứcl,khiđóchiphí nútliênkếtvàocâycậpnhậtsẽlà𝑐 𝑜 𝑠 𝑡 𝑀0 Nhƣvậy,chiphínútliênkếtvàocây
𝑙 cậpnhậttạivịtrínàođósẽcóchiphíkýhiệulà𝑐𝑜𝑠𝑡 j𝑜i𝑛để ƣợt là 10 và 15 Do hệ phânợ cbiểudiễnbởicôngthứcsau:
Nlàsốlƣợngnútcủa câycậpnhật,dlàbậc củanút,𝐿=𝑙𝑜𝑔𝑑𝑁là chiềucaocủacâycậpnhật(0 cost_propagation L𝑚 thìn ú t𝐾 𝑙k h ô n g y ê u c ầ u t h ự c h i ệ n n h â n
K l K l bản,ngƣợclạinút𝐾𝑙g ử iyêucầunhânbảnchonút𝐿𝑚v àgiátrị𝑛 𝐾𝑙 đểƣợt là 10 và 15 Do hệ phânợcgọilà ngƣỡngtốcđộ yêucầucậpnhậtcủanút𝐾𝑙.
Trong triển khai thực nghiệm đối với đề xuất này, luận án đã kế thừa kết quảnghiêncứucủacôngbố[4]trongdanhmụccáccôngtrìnhnghiêncứucủatácgiả.
Tham số của hệ thống dữ liệu chia sẻ và mô phỏng: Độ dài mỗi mô phỏng10.000s; số lƣợng đối tƣợng dữ liệu chia sẻ trong hệ thống từ10 2 đểến10 4 và theophân phốiZipf; tốc độnútthực hiện cập nhật, tốc độnútvào/ra hệ thống theo phânphốiPoissonvà có giá trị mặc định lần lƣợt là 100 và 0,25; số lƣợngnúttham giahệthốngtheophânphốiZipfvàcógiátrịmặcđịnhlà5000;khoảngthờigianГ 200scậpnhậtcácgiátrị𝑛 𝑅0 v à 𝑛 𝐾𝑙 ;bậccủanút𝑑.Kếtquảchỉratrongcác
𝑢𝑑 𝑟𝑢 số lƣợngnúttrong hệ thống dữ liệu chia sẻ Vì vậy, luận án xây dựng các kịch bảnnhằm đánh giá ảnh hưởng của hai tham số này đối với hiệu quả của thuật toán đềxuấtvềđộtrễcậpnhậtvàtỷlệcậpnhậtthành công,cụthểnhƣsau:
3.3.3.1 Hiệuquả đốivới độtrễcậpnhật a) Ảnhhưởngsốlượng nút đốivớiđộtrễcậpnhật Để đánh giá ảnh hưởng của số lượngnúttrong hệ thống dữ liệu chia sẻ đốivớihiệuquảcủathuậttoánđềxuấtvềđộtrễcậpnhật,luậnánxâydựngcáckịch bản mô phỏng việc gia tăng số lƣợngnúttrong hệ thống, lần lƣợt là: 200; 400; 600;800;1000.
Kết quả tổng hợp trong Bảng 3.9 và so sánh trong Hình 3.18 chỉ ra, khi sốlƣợngnúttronghệthốngdữliệuchiasẻtăng,thuậttoánđềxuấtcóhiệuquảtốtvề
13 14.5 15 16 độtrễcậpnhật,cụthểtrườnghợpsốlượngnúttănglên1000thìđộtrễcậpnhậtcủathuật toán đề xuất,NakashimavàYilần lƣợt là 16s; 18,5s và 40,5s Thuật toán đềxuất có hiệu quả tốt hơn khá rõ so với giải pháp củaNakashimavà đặc biệt là so vớigiải pháp củaYi Ngoài nguyên nhân giải pháp đề xuất có hiệu quả hơn về phươngthức xây dựng cấu trúc cập nhật và hiệu quả truyền thống giữa cácnút, còn có hainguyên nhân khác nhƣ sau: Thứ nhất, giải pháp đề xuất chỉ thực hiện cập nhật chocácnútcó yêu cầu nên cũng giảm số lƣợngnútcần cập nhật, từ đó giảm độ trễ cậpnhậttrungbìnhsovớigiảiphápcủaNakashimavàYicầngửicậpnhậtchotất cảcácnút; thứ hai, khi số lƣợngnúttăng thì tốc độ yêu cầu cập nhật của mỗinútsẽtăng,lúc đógiảiphápđềxuấtsẽpháthuyhiệuquả.
Sốlƣợng nút tronghệthống Độtrễ cậpnhật(s)
Hình 3.18.So sánh giải pháp đề xuất với giải pháp củaNakashima,Yivề ảnhhưởngsốlượngnútđốivớiđộtrễcậpnhật Độtrễcậpnhật(s) b) Ảnhhưởngcủatốcđộnútvào/rahệthống Để đánh giá ảnh hưởng của tốc độnútvào/ra hệ thống đối với hiệu quả củathuật toán đề xuất về độ trễ cập nhật, luận án xây dựng các kịch bản mô phỏng tốcđộnútvào/rahệthốngkhácnhau,lầnlƣợtlà: 0;0,1;0,2; 0,3;0,4;0,5.
Khi tốc độnútvào/ra hệ thống tăng, giải pháp củaN a k a s h i m a v à Yitốnnhiều thời gian để xây dựng lại cây cập nhật do phương thức xây dựng và duy trìcấutrúccậpnhậtkémhiệuquả(nhƣtrìnhbàyởtrên).TronggiảiphápcủaNakashima, khi cây cập nhật đang đƣợc xây dựng donútvào/ra hệ thống thì lantruyền cập nhật sẽ không thực hiện được, cho nên ảnh hưởng rất lớn đến độ trễ cậpnhật Đối với giải pháp củaYithì còn cần xử lý phức tạp việc tìm liên kết phù hợpchonútvà thực hiện truyền các bản cập nhật trong bộ nhớ đệm Do vậy, khi tốc độnútvào/ra hệ thống lớn thì hai giải pháp này có độ trễ cập nhật tăng đột biến Trongkhi đó, giải pháp đề xuất có hiệu quả hơn về phương thức xây dựng và duy trì cấutrúccậpnhật,cũngnhƣt r u y ề n thônggiữa cácnút.Kếtquảtổnghợptr on g
3.10 và so sánh trong Hình 3.19 chỉ ra, giải pháp đề xuất có độ trễ cập nhật luôn tốthơn so với đề xuất củaNakashimavàYi Đồng thời giải pháp có độ trễ cập nhật ổnđịnh, thậm chí là tốt ngay cả khi tốc độnútvào/ra hệ thống là 0,5 (rất lớn) thì độ trễcậpnhậtcủa giảiphápđềxuất,NakashimavàYilầnlƣợtlà29s;48s và45,5s.
Bảng3.10.Kếtquảmôphỏngảnhhưởngtốcđộnútvào/ rahệthốngđốivớiđộtrễcậpnhậtcủa giảipháp đề xuấtvà giảipháp củaNakashima,Yi
Tốcđộ nút vào/rahệthống Độtrễ cậpnhật(s)
Tốcđộ nútvào/ra hệ thống Hình 3.19.So sánh giải pháp đề xuất với giải pháp củaNakashima,Yivề ảnhhưởngtốcđộnútvào/rahệthống đốivớiđộtrễcậpnhật
Trong các kịch bản mô phỏng nêu trên chỉ ra, giải pháp đề xuất luôn có hiệuquảvềđộtrễcậpnhậttốthơnsovớigiảiphápcủaNakashimavàYi,đặcbiệtkh icác tham số của hệ thống tăng cao Trong thực nghiệm sau đây nhằm chứng minhrằng, giải pháp đề xuất không những đạt đƣợc hiệu quả rất cao về độ trễ cập nhật,mà còn cải thiện đáng kể hiệu quả về tỷ lệ cập nhật thành công so với các giải pháptronghướngtiếpcận màmỗinútkhôngcóbộ nhớđệm(Nakashima).
Luận án xây dựng các kịch bản mô phỏng tốc độnútthực hiện cập nhật khácnhau,lầnlƣợt là:20;40;60;80;100;120;140;160;180;200.
Kết quả tổng hợp trong Bảng 3.11 và so sánh trong Hình 3.20 chỉ ra, giảipháp củaYicó tỷ lệ cập nhật thành công luôn xấp xỉ trên 90% (tuy nhiên độ trễ cậpnhật là lớn nhất nhƣ trong kết quả nêu trên) Giải pháp đề xuất có tỷ lệ cập nhậtthành công cao hơn củaNakashima(cả hai không sử dụng bộ nhớ đệm) và khi tốcđộnútthực hiện cập nhật lớn thì kết quả càng rõ (9,5% so với 5,5% trong trườnghợp tốc độ cập nhật là 200) Kết quả này là rõ ràng, bởi vì giải pháp đề xuất luôn cóđộtrễcậpnhậtnhỏhơnvàgiữ ổnđịnh. Độtrễcậpnhật(s)
Bảng3.11.Kếtquảmôphỏngảnhhưởngtốcđộnútthựchiệncậpnhậtđốivớitỷlệcậpnhậtthà nhcôngcủagiảipháp đềxuất vàgiải phápcủaNakashima,Yi
Tốc độ nút thực hiệncậpnhật Tỷlệcậpnhậtthànhcông (%)
Hình 3.20.So sánh giải pháp đề xuất với giải pháp củaNakashima,Yivề ảnhhưởngtốcđộnútthực hiệncậpnhậtđốivớitỷlệcậpnhậtthànhcông
Trong mục này, luận án đã trình bày thuật toán nhân bản dựa vào ngƣỡng tốcđộyêucầucậpnhậtcủanútnhằmtốiưuchiphílantruyềncậpnhậttrongđảmbảo
Tỷlệcậpnhậtthành công(%) tính nhất quán dữ liệu Giải pháp đề xuất luôn có hiệu quả rất tốt về độ trễ cập nhật,nhất là khi số lƣợngnúttham gia hệ thống và tốc độnútvào/ra hệ thống gia tăng rấtlớn.C hẳ n g hạ nk hi tố cđ ộn ú t và o/ rahệt hố ng là 0, 5 t h ì đ ộ tr ễ c ậ p nhậ t c ủ a gi ải pháp đề xuất chỉ là 29s so với 48s và 45,5s lần lƣợt củaNakashimavàYi Bên cạnhđó, giải pháp đề xuất cũng đã cải tiến đáng kể tỷ lệ cập nhật thành công so với giảipháp củaNakashima,đặc biệt khi tốc độnútthực hiện cập nhật lớn thì kết quả rất rõ(9,5%sovới5,5%trongtrườnghợptốcđộcậpnhậtlà200).
GIẢIPHÁPNÂNGCAOHIỆUQUẢSỬDỤNGMÁYẢOCẬPNHẬT
Hướng tiếp cận mới sử dụng máy ảo thực hiện cập nhật nhằm đảm bảo tínhnhất quán dữ liệu có thể giải quyết những khó khăn cố hữu của của các lƣợc đồ vàmáy vật lý (nút) Trong mục này, luận án trình bày thuật toánc ả i t i ế n p h ò n g t r á n h bế tắc trong cung cấp tài nguyên cho máy ảo để nâng cao hiệu các lƣợc đồ đảm bảotínhnhấtquándữ liệusử dụngmáyảocậpnhật.
Nội dung nghiên cứu này đƣợc công bố trong các công trình của tác giả số[5]và[6].
Nút(máy vật lý-PM) trong mạng P2P không thuần nhất và có khả năng hạnchế.Vìthế,các lƣợcđồđảmbảotínhnhấtquándữliệu luôntồntạinhữngkhókhănmang tính chất cố hữu nhƣ: Tình trạngnúttrở nên quá tải do các yêu cầu vƣợt quákhả năng củanúthay tốc độnútvào/ra hệ thống không xác định, khả năng xảy ratình trạng tắc nghẽn, bế tắc hoặc mất cân bằng tải Những điều này làm giảm hiệuquả của các lƣợc đồ đảm bảo tính nhất quán dữ liệu Các giải pháp ảo hóa dựa trênOpen Stack là hướng tiếp cận mới, có tiềm năng lớn để khắc phục những hạn chếnêu trên.Wangvà các cộng sự trong nghiên cứu [61] đề xuất sử dụng máy ảo đểthực hiện cập nhật, đồng bộ các thao tác cập nhật và thực hiện lan truyền cập nhật,nhằm đảm bảo tính nhất quán dữ liệu Tuy nhiên, hiệu quả thực thi của các máy ảophụ thuộc vào việc cung cấp tài nguyên (CPU,
RAM, HDD) cho nó Điều này cónghĩa là việc giải quyết hiệu quả bài toán cung cấp tài nguyên cho máy ảo dựa trêntổng tài nguyên của cácnútsẵn có sẽ góp phần nâng cao hiệu quả của các lƣợc đồđảmbảotínhnhấtquándữliệu(trongđósửdụngmáyảocậpnhật).Trongkhiđó,
VM VM VM VM nghiêncứucủaWangvàcáccộngsựchưađềcậpđếnbàitoántốiưutrongcungcấptàinguyêncho cácmáyảo.
Trong lƣợc đồ đảm bảo tính nhất quán dữ liệu sử dụng máy ảo cập nhật, cácmáy ảo đƣợc xây dựng và cung cấp tài nguyên dựa trên tập hợp cácnút(máy vật lý)trong mạng P2P, tương ứng mô hình phân tánM VM-out-of-N PM[62] [63] (Hình3.21),Mmáy ảo đƣợc cƣ trú tạiNmáy vật lý Máy ảo có thể cùng một lúc sử dụngcáctài nguyên ởnhiềuhơnmộtmáyvậtlý.
Hình3.21.MôhìnhphântánMVM-out-of-NPM
Hiện nay, các giải pháp cung cấp tài nguyên cho máy ảo đƣợc thực hiện tạilớphạtầngdịchvụ(IaaS),cáctrungtâmdữliệu Nghiêncứutrongcáccôngb ố
[62] [63] [64] [65] đã xây dựng hàm mục tiêu𝐹𝑡cần tối u trong cung cấpƣợt là 10 và 15 Do hệ phân tàinguyên cho máy ảo của mô hìnhM VM-out-of-N PM Hàm mục tiêu𝐹𝑡đểƣợt là 10 và 15 Do hệ phânợc biểudiễnnhƣ sau:
M:Sốlƣợngcácmáyảo𝑉𝑀cƣợt là 10 và 15 Do hệ phântrútạimộtnút.N:Sốlƣợ ng cácnúttronghệthống
𝐸i𝑡:T ổ n gcác ng uồ nt ài ng uyê n(CPUh o ặ ccá c tà in gu yên khá c) cu ng c ấ p chocácmáyảo.
Tuy nhiên, những nghiên cứu nhƣ trên chỉ đề cập về giải pháp tối ƣu hóahàm𝐹𝑡cho các máy ảo đểƣợt là 10 và 15 Do hệ phânợc xây dựng trên nền tảng là các trung tâm dữ liệu, trongđógồmcóhệthốngmáyvậtlýổnđịnh,hiệunăngcao.
Luận án đề xuất thuật toán tối ƣu hóa hàm𝐹𝑡bằng h ớng tiếp cậnƣợt là 10 và 15 Do hệ phân phòngtránh bế tắc trong cung cấp tài nguyên cho máy ảo xây dựng trên mạng P2P,tại lớphạ tầng dịch vụIaaS Cụ thể, luận án đề xuất thuật toán về xây dựng hệ thống máyảo trong thực hiện cập nhật và thuật toán về phòng tránh bế tắc trong cung cấp tàinguyên nhằm nâng cao hiệu quả sử dụng máy ảo cập nhật trong lƣợc đồ đảm bảotínhnhấtquándữ liệu.
Mã giả của thuật toánBuilVmxây dựng hệ thống máy ảo đƣợc trình bày nhưdướiđây.
6 If(𝑉𝑀i[j]=0)gửiyêucầu(𝑉𝑀i,i)tới𝑃𝑀je n dfor
Thuật toánAllResVmphòng tránh bế tắc trong cung cấp tài nguyên cho máyảocậpnhậtxâydựngtrêncácnúttronghệthốngP2Pthựchiệnnhƣsau:
Thuật toán sử dụng đồ thị tranh chấpWait – For – Graph(WFG) để giảiquyết bài toán phòng tránh bế tắc đối với cung cấp tài nguyên cho máy ảo, trong đóxácsuấtlấyđƣợcmộtđồthịngẫunhiênvới𝐺 = ( 𝑉 , 𝐿),|𝑉|= 𝑛 và|𝐿| = 𝑙 là :
2−l (3.10) Để xác định khả năng phân phối tất cả các máy ảo vào cácnútđúng thời gianyêu cầu, bắt đầu tại thời điểm𝑡và kéo dàigiây, thuật toán sẽ sắp xếp cácnúttheocácbướcsau:
Bước 1 : Trước tiên, ưu tiênnútnào có ít hợp đồng đang chạy nhanh nhất tạithời điểm𝑡 Bởi vì mộtnútcó hiệu suất cao cần đƣợc phân bổ nhiều hợp đồng hơnsovớinútcóhiệusuấtthấphơn.
Bước 2 : Nếu tiêu chuẩn trong các hợp đồngb ằ n g n h a u , s a u đ ó t h ủ t ụ c s o sánhsẽdựavàosố lƣợngtàinguyênrảnh tạithờiđiểm𝑡.
Bước 3 : Cuối cùng, ƣu tiên chonútcó tài nguyên rỗi ổn định nhất.
Nhữngnútđƣợc cho là ổn định nếu nó luôn có số lƣợngVMnhất định đƣợc phân phối tạimọithờiđiểm.
Bước 4 : Thực hiện việc cập nhật thông tin trạng thái của cácnútthông quaviệcgửithôngđiệp theođịnhtuyếnmạngP2P.
Bước 5: Khi cácnútđã đƣợc sắp xếp tạo ra đƣợc một danh sách các tàinguyênổnđịnh,luậnántiếpcậnsửdụngthuậttoánthamlamđểphânphốitấtcả cácVM.
Thuậttoán3.7:AllResVm Đầuvào: j ( 𝑃 ) * , j ( 𝑅 𝑀 ) *, j ( 𝐷 𝐷 ) * đểcấppháttàinguyênchoi i i i Đầura: (𝑃 ) + 1
6 For mỗi𝑉𝑀j∈ 𝐽iSe ndpermission(i,j)tới𝑃𝑀jEndfor
16 While(ready.isfree()=true)dojob.delete(𝑡 i )
Luận án trình bày kết quả các thử nghiệm mô phỏng thuật toánAllResVmvớiphần mềmOpenStack, gồmcácbước nhưsau:
Bước 1 : Thiết lập thành côngphầnmềm Open Stack vàt h i ế t l ậ p k ế t n ố i mạngvàmạngảo.
Bước 2 : Tạo bộ định tuyến logic, trong đó giao diện bên ngoài kết nối vớimạngcôngcộngvàgiaodiệnbêntrongkếtnốivớimạngnộibộ.
Thựcnghiệmápdụng phươngthứcgửithông báoyêucầutàinguyênvớikhảnăngc ủ a m á y v ậ t l ý t r o n g c á c t r ƣ ờ n g h ợ p k h ả n ă n g c ủ aC P U c h ot r ƣ ớ c l àP =
{10%, 20%, ,100%} (Hình 3.22); yêu cầu cung cấp tài nguyên cho 100 ca hợpđồng.VM NOSRlà trường hợp không tạo đượcVMvà tạm treo/chờ phục hồi hoặcVM SRlà không tạo đƣợcVMcó sử dụng tạm treo/chờ phục hồi Kết quả tổng hợptrong Bảng 3.12 và so sánh trong Hình 3.23 chỉ ra, với khả năng củaCPUlà
100%thì kết quả khác biệt lớn về tỷ lệ hiệu quả cung cấp và tạo thành công của máy ảo,trong đó thành công là 60,6% và thất bại chỉ là 25%; đồng thời tỷ lệ này cũng luônrất cao với khả năng cho trước củaCPUlà từ 60% trở lên Trong các trường hợpkhả năng củaCPUlà từ 10% cho tới 30% thì tỷ lệ tạo thành công chênh lệch khôngnhiều,nhƣngkhảnăngthànhcôngcaohơnsovớikhảnăngkhôngthànhcông.
VM NOSR VM SR Can create VM Improved
Bảng 3.12 Tổng hợp kết quả mô phỏng của thuật toánAllResVmvà thuật toán thamlamvớicáckhảnăng khácnhaucủabộxử lýP
Trong mục này, luận án đã trình bày thuật toánAllResVmphòng tránh bế tắctrong cung cấp tài nguyên cho máy ảo cập nhật và tiến hành thử nghiệm trong môitrường phân tán P2P và ảo hóa Open Stack Đề xuất mới đã mang lại kết quả tíchcực khi so sánh giữa hiệu quả cung cấp (khả năng củaCPUcho trước) và tạo thànhcôngcủa máyảo.Nhƣvậy,chúngtathấyrằngviệcápdụngcácgiảiphápmáyảo sẽmanglạihiệunăngtối ƣuchocáctàinguyênphân tán.
KẾTLUẬNCHƯƠNG3
Trong chương 3, luận án trình bày các giải pháp cải tiến hiệu quả kỹ thuật đểđảm bảo tính nhất quán dữ liệu chia sẻ trong mạng P2P, cụ thể bao gồm: Thuật toánID_LINKthực hiện xây dựng cấu trúc cập nhật hiệu quả trong các hệ thống dữ liệuchia sẻ kém ổn định do tốc độnútvào/ra hệ thống lớn; phương thức linh hoạt trongcập nhật và hoán đổi liên kết cácnútnhằm phòng tránh tắc nghẽn, từ đó nâng caohiệu quả lan truyền cập nhật trong cấu trúc cập nhật mà mỗinútsử dụng bộ nhớđệm, do đó đề xuất có hiệu quả không những về độ trễ cập nhật mà vẫn đảm bảohiệu quả cân bằng các tham số khác; thuật toán nhân bản chonútdựa vào ngƣỡngtốc độ yêu cầu cập nhật đếnnútđó nhằm tối ƣu chi phí đảm bảo tính nhất quán dữliệu, vì thế giải pháp có hiệu quả về độ trễ cập nhật và cải thiện đáng kể hiệu quả vềtỷ lệ cập nhật thành công; thuật toán phòng tránh bế tắc trong cung cấp tài nguyêncho hệ thống máy ảo xây dựng trên mạng P2P làm cơ sở ứng dụng cho giải pháp sửdụng máy ảo cập nhật Hiệu quả đạt đƣợc của các giải pháp đề xuất nhƣ trình bày ởtrênđãđƣợcchỉrathôngquacáckếtquảcủathựcnghiệmmôphỏng.
Luận án nghiên cứu các giải pháp đảm bảo tính nhất quán dữ liệu chia sẻtrong mạng P2P Trên cơ sở đó, luận án đã có các đề xuất cải tiến đối với lƣợc đồđảmbảotínhnhấtquándữliệu,cụthểnhƣ sau: a) Đề xuất thuật toánI D _ L I N Kxây dựng cấu trúc cây lan truyền cậpn h ậ t , có hiệu quả về độ trễ cập nhật đối với các hệ thống dữ liệu chia sẻ kém ổn định dotốc độnútvào/ra hệ thống lớn Giải pháp đề xuất luôn có hiệu quả tốt hơn về độ trễcập nhật so với giải pháp củaNakashimavà khi tốc độnútvào/ra hệ thống lớn hơn0,3thìđộtrễ cậpnhậtổnđịnh màkhôngtăngđộtbiến. b) Đề xuất giải pháp linh hoạt trong cập nhật và hoán đổi liên kết cácnútnhằm phòng tránh tắc nghẽn lan truyền cập nhật trong cấu trúc mà mỗinútsử dụngbộ nhớ đệm Do đó, đề xuất có hiệu quả không những về độ trễ cập nhật mà vẫnđảm bảo hiệu quả cân bằng các tham số khác Cụ thể, giải pháp đề xuất có hiệu quảtốthơnvềđộtrễcậpnhậtsovớiNakashimatrongcáctrườnghợpnhư:sốlượngnúttrong hệ thống dữ liệu chia sẻ nhỏ hơn 300, tốc độnútvào/ra hệ thống lớn hơn 0,45và tốc độnútthực hiện cập nhật lớn hơn 160 Hơn nữa, giải pháp đề xuất vẫn đạtđƣợc hiệu quả cân bằng giữa các tham số, cụ thể có tỷ lệ cập nhật thành công luôntrên90%,trongkhigiảiphápcủaNakashimacótỷlệloại bỏcậpnhậtxấpxỉ100%. c) Đề xuất thuật toánOptRepthực hiện nhân bản chonútdựa vào ngƣỡngtốc độ yêu cầu cập nhật củanútnhằm tối ƣu chi phí đảm bảo tính nhất quán dữ liệu.Mộtnútsẽ đƣợc nhân bản khi tốc độ yêu cầu cập nhật tớinútđó đủ lớn - gọi bằngngưỡng, xác định bằng tính toán, so sánh hiệu quả (thời gian, số bước phải thựchiện) giữa nhân bản chonútđó để đáp ứng cho các yêu cầu cập nhật hoặc khôngnhânbản.Giảiphápđềxuấtluôncóhiệuquảrấttốtvềđộtrễcậpnhật,nhấtlàkhi số lƣợngnúttham giah ệ t h ố n g v à t ố c đ ộnútvào/ra hệ thống gia tăng rất lớn.Chẳng hạn khi tốc độnútvào/ra hệ thống là 0,5 thì độ trễ cập nhật của giải pháp đềxuất chỉ là 29s so với 48s và 45,5s lần lƣợt củaNakashimavàYi Bên cạnh đó, giảiphápđềxuấtcũngđãcảithiệnđángkểtỷlệcậpnhậtthànhcôngsovớigiảipháp củaNakashima, đặc biệt khi tốc độnútthực hiện cập nhật lớn thì kết quả rất rõ(9,5%sovới5,5%trongtrườnghợpsốlượngcậpnhậtlà200). d) ĐềxuấtthuậttoánAllResVmphòngtránhbếtắctrongcungcấpt à i nguyên cho máy ảo xây dựng trên mạng P2P nhằm nâng cao hiệu quả các lƣợc đồđảm bảo tính nhất quán dữ liệu sử dụng máy ảo cập nhật Giải pháp có tỷ lệ tạođượcVMrất cao khi khả năng cho trước củaCPU60% trở lên; khi khả năng củaCPUlà từ 10% cho tới 30% thì khả năng tạo thành côfng chênh lệch không nhiều,nhƣngcókhảnăngthànhcôngcaohơnnhiềusovớikhảnăngkhôngthànhcông.
Trên cơ sở các kết quả nghiên cứu đạt được của luận án, một số hướng nghiêncứumởrộng vàpháttriểntiếptheocóthểthựchiệnnhƣsau: a) Ngoài phương thức lan truyền cập nhật để đảm bảo tính nhất quán dữ liệucủa hệ thống dữ liệu chia sẻ, còn có hai phương thức khác là lan truyền thông báovà lan truyền các thao tác điều khiển cập nhật Mỗi phương thức có những ưu điểmđể có thể áp dụng cho các hệ thống chia sẻ dữ liệu có tính chất đặc thù Vì vậy,hướng nghiên cứu mở rộng của luận án là sẽ tiếp tục phát triển đối với hai trườnghợptrên. b) Đề xuất lƣợc đồ đảm bảo tính nhất quán dữ liệu có hiệu quả, tối ƣu về sốlƣợng thông điệp, băng thông sử dụng và các tài nguyên khác nhằm ứng dụng trongtrườnghợptàinguyên hạnchếcủa hệthốngvàngườidùngcuối.
[1] Nguyễn Hồng Minh, Lê Văn Sơn, Nguyễn Xuân Huy, "Một thuật toán hiệu quả đảmbảonhấtquándữliệutrongmôitrườngphântántrênmạngphủP2Pcócấutrúc",Kỷyếu Hội thảo Quốc gia lần thứ XVIII “Một số vấn đề chọn lọc của Công nghệ thôngtin và Truyền thông”, NXB Khoa học và Kĩ thuật, Hà Nội, ISBN 978-604-67-0645-8,Trang191-196,2016.
[2] Nguyễn Hồng Minh, Nguyễn Xuân Huy, "Giải pháp hiệu quả Đảm bảo nhất quán dữliệu chia sẻ phân tán trên nền tảng P2P có cấu trúc”,Chuyên san "Các công trìnhnghiên cứu, phát triển và ứng dụng Công nghệ thông tin và Truyền thông",Bộ thôngtinvàtruyềnthông,ISSN1859-3526,tậpV-1,số17(37),Trang22-30,6/2017.
[3] HongMinhNguyen,XuanHuyNguyen,HaHuyCuongNguyen,“Onaconstruction and a highly effective update method for consistency in structured p2psystems”,International Journal of Computer Science and Network Security, ISSN1738-7906,Vol.17,No.9,pp.151-158,9/2017.
[4] Nguyễn Hồng Minh, Lê Văn Sơn, “Một giải pháp hiệu quả xây dựng và duy trì câylan truyền cập nhật đảm bảo nhất quán dữ liệu”,Kỷ yếu Hội nghị Khoa học
Côngnghệ Quốc gia lần thứ 10 “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin”,Nhà xuất bản Khoa học tự nhiên và Công nghệ, Hà Nội,ISBN: 978-604-913- 614-6,Trang488-494,2017.
[5] Nguyen Ha Huy Cuong, Hong Minh Nguyen, and Trung Son Doan, "The Method ofMaintainingDataConsistencyinAllocatingResourcesfortheP 2 P N e t w o r k Mod el",Context-Aware Systems and Applications, and Nature of Computation andCommunication,Springer,Cham,pp.155-165,2017.
[6] Hong Minh Nguyen,Van Doan Thang, Le Dac Nhuong, NguyenH a H u y
C u o n g , and Nguyen Xuan Huy, "Open Stack: Resources Allocation for Distributed
VirtualMachinePeertoPeer",FrontiersinIntelligentComputing:T h e o r y a n d Appli cations Advances in Intelligent Systems and Computing, Springer,Singapore,vol1013,pp.341-349,2020.
[1] https://www.statista.com/forecasts/1146844/internet-users-in-the-world
[2] https://www.statista.com/statistics/267202/global-data-volume-of-consumer-ip- traffic/[Online,truy cập02/04/2021].
[3] https://www.cisco.com/c/en/us/solutions/collateral/executive-perspectives/annual- internet-report/white-paper-c11-741490.html[Online,truycập02/04/2021].
[5] Van Steen, Maarten, and Andrew S Tanenbaum,"Distributed systems",Leiden,TheNetherlands:MaartenvanSteen,2017.
[7] Buford,John,HeatherYu,andEngKeongLua,“P2Pnetworkinga n d applications”,Mo rganKaufmann,2009.
[8] Malatras, Apostolos, "State-of-the-art survey on P2P overlay networks in pervasivecomputing environments",Journal of Network and Computer Applications, vol 55pp.1-23,2015.
[9] https://xtendedview.com/internet/best-p2p-file-sharing-programs/5684/
[10] Vimal, S., and S K Srivatsa, "A file sharing system in peer-to-peer network by anearness-sensible method",International Journal of Reasoning-based
[11] GARCÍA-RODRÍGUEZ, Gerardo; DE ASÍS LÓPEZ-FUENTES, Francisco,
“AStorage Service based on P2P Cloud System”,Research in Computing Science,
[12] Samreen, S N., Khatri-Valmik, N., Salve, S.M., & Khan, M.P. N," I n t r o d u c t i o n tocloudcomputing",InternationalResearchJournalofEngine eringandTechnology,12,pp.785-788,2018.
UnderlYing Peer-to-Peer Network of Ethereum Blockchain",IEEE Transactions onNetworkScienceandEngineering,2021.
[14] Hao, W., Zeng, J., Dai, X., Xiao, J., Hua, Q.,Chen, H.,"BlockP2P: Enabling fastblockchain broadcast with scalable peer-to-peer network topology",InternationalConference on Green, Pervasive, and Cloud Computing,
[15] https://www.utorrent.com/[Online,truycập 6/01/2021]
[16] https://www.bittorrent.com/[Online,truycập 6/01/2021]
[17] Pirjade,S.,Burghate,R.R.,Ghogare,P.G.,Ghotkule,A.,andJatade,J,"Maximizingp2pf ileaccessavailabilityinmobileadhocnetworksthoughreplication for efficient file sharing",2nd International Conference on
[18] Abdollahi Nami, A., and L Rajabion, "Data replication techniques in the mobile adhoc networks: A systematic and comprehensive review", International Journal ofPervasiveComputingandCommunications,15.3-4,pp.174-198,2019.
" A b r i e f survey on replica consistency in cloud environments",Journal of Internet ServicesandApplications,11.1,pp.1-13,2020.
[20] Aldin, H N S., Deldari, H., Moattar, M H., & Ghods, M R, "Consistency modelsindistributedsystems:Asurveyondefinitions,disciplines,challengesandapplic ations",arXivpreprintarXiv:1902.03305,2019.
[21] BAUMGART,Ingmar;HEEP,Bernhard;KRAUSE,Stephan,“OverSim:A flexible overlay network simulation framework”,IEEE global internet symposium,IEEE,pp.79-84,2007.
[22] https://www.openstack.org/[Online,truycập9/6/2015]
[23] NAKASHIMA,Taishi;FUJITA,Satoshi,“Tree-basedconsistencymaintenancescheme for peer-to-peer file sharing systems”,2013 First International
[24] HU,Yi;BHUYAN,LaxmiN.;FENG,Min,“Maintainingdataconsistency instructured P2P systems”,IEEE Transactions on Parallel and Distributed
[25] GAONKAR,Dattatraya,“Distributedgeneration”,BoD–BooksonDemand,2010.
[26] Buford,John,HeatherYu,andEngKeongLua,“P2Pnetworkinga n d applications”,Mo rganKaufmann,2009.
[27] Nikolakopoulos,Y.,Gidenstam,A.,Papatriantafilou,M.,andTsigas,P,"Aconsistency framework for iteration operations in concurrent data structures",IEEEInternationalParallel andDistributedProcessingSymposium, pp.239- 248,2015.
[28] Lua,E.K.,Crowcroft,J.,Pias,M.,Sharma,R.,&Lim,S,"Asurveyandcomparisonofpeer- to-peeroverlaynetworkschemes",IEEECommunicationsSurveys&Tutorials,7.2, pp.72-93 2005.
[29] https://us.napter.com/[Online,truycập5/8/2019]
[30] Taylor I.J., Harrison A.B, “Gnutella”,From P2P and Grids to Services on the
Web,ComputerCommunicationsandNetworks,Springer,London,pp.181-196.2009.
[31] https://www.cs.cmu.edu›~dga ›lectures›16-dht[Online,truycập4/4/2015]
[32] ROWSTRON, Antony; DRUSCHEL, Peter, “Pastry: Scalable, decentralized objectlocation,androutingforlarge-scalepeer-to-peersystems”,I F I P / A C M International
Conference on Distributed Systems Platforms and Open DistributedProcessing.Springer,Berlin,Heidelberg,pp.329-350,2001.
[33] BenY.Zhao,JohnD.Kubiatowicz,AnthonyD.Joseph,“Tapestry:Aninfrastructureforf ault-tolerantwide-arealocationandrouting”,techreport,University ofCaliforniaatBerkeley,ACM,2001.
[34] Davis, R I., Burns, A., Bril, R J., & Lukkien, J J, “Controller Area Network(CAN) schedulability analysis: Refuted, revisited and revised”,Real-Time
[35] Pourebrahimi,B.,Bertels,K.,&Vassiliadis,S,"AsurveyofPeer-to-
PeerNetworks",Proceedings of the 16th annual workshop on Circuits, Systems andSignalProcessing,2005.
[36] Bandara, HMN Dilum, and Anura P Jayasumana, "Collaborative applications overpeer-to-peersystems–challengesandsolutions",Peer-to-
[37] Mohammadi,B.,andNavimipour,N.J,"Datar e p l i c a t i o n m e c h a n i s m s i n t h e peer‐to‐ peern e t w o r k s , "I n t e r n a t i o n a l J o u r n a l o f C o m m u n i c a t i o n S y s t e m s,
[38] Spaho, E., Barolli, A., Xhafa, F., and Barolli, L, "P2P data replication: Techniquesandapplications",Modelingandprocessingfornext-generationbig- datatechnologies,Springer,Cham,pp.145-166,2015.
[39] RAHMANI,Moufida;BENCHAIBA,“Acomparativestudyofr e p l i c a t i o n sche mesforstructuredp2pnetworks”,Proceedingsofthe9thInternationalConferenceonInt ernet andWebApplications andServices,pp.147-158,2014.
[40] Kalpakis,https://dokumen.tips/documents/consistency-and-replication-
5693cbf237ba0.html[Online,truycập9/11/2018]
[41] CHENG,Liangfeng;HU, Yuchong; LEE,Patrick PC, “Coupling decentralizedkey- value stores with erasure coding”,Proceedings of the ACM Symposium onCloudComputing,pp.377-389,2019.
[42] Chen, Y L., Mu, S., Li, J., Huang, C., Li, J., Ogus, A., & Phillips, D,
“Giza:Erasure coding objects across global data centers”,{USENIX} Annual TechnicalConference({USENIX}{ATC} 17,pp.539-551,2017.
[43] Li, Y., Zhou, J., Wang, W., &Chen, Y, “RE-store: Reliable and efficient KV- storewith erasure coding and replication”,IEEE International Conference on
[44] Saghiri, Ali Mohammad, M Daliri Khomami, and Mohammad Reza Meybodi,"Random walk algorithms: Definitions, weaknesses, and learning automata-basedapproach",Intelligent Random Walk: An Approach Based on
Learning Automata,Springer, Cham,52,pp.1-7,2019.
[45] VU,Huy;TEWARI,Hitesh,“AnEfficientPeer-to-PeerBitcoinProtocolwithProbabilistic
Flooding”,International Conference for Emerging Technologies inComputing,Springer,Cham,pp.29-45,2019.
[46] Dong, Suyalatu, and Yong-Chang Huang, "A class of rumor spreading models withpopulationdynamics",CommunicationsinTheoreticalPhysics,70(6),795,2018.
[47] WANG Z., Das, S K., Kumar, M., & Shen, H, “An efficient update propagationalgorithmforP2Psystems”,ComputerCommunications,30(5),pp.1106- 1115,2007.
[48] Zhang,B , Wang, X.,& H u a n g , M , " A d a t a r e p l i c a c o n s i s t e n c y m a i n t e n a n c e schemeforcloudstorageunderhealthcareIoTenvironment",FutureCommunication,Inform ationandComputerScience:Proceedingsofthe2014International Conference on Future Communication, Information and ComputerScience(FCICS2014),Beijing,China,2015.
[49] Guler,Berkin,andOznurOzkasap,"Analysisofcheckpointingalgorithmsforprimary-backup replication",IEEE Symposium on Computers and Communications(ISCC),pp.64-69,2017.
[50] Li,Jun,andMengshuHou,"PMSTCOM:ANovelReplicationConsistencyMaintenanc e Strategy in Cloud Storage System."3rd International Conference onBigData
[51] Li, C., Wang, C., Tang, H., & Luo, Y, "Scalable and dynamic replica consistencymaintenance for edge-cloud system",Future Generation Computer
[52] SHEN, HaiYing; LIU, Guoxin; CHANDLER, Harrison, “Swarm intelligence basedfilereplicationandconsistencymaintenanceinstructuredP2Pfilesharingsystems”,IEEET ransactionsonComputers,64(10),pp.2953-2967,2015.
[53] Islam, Md Ashfakul, and Susan V Vrbsky, "Transaction management with tree- based consistency in cloud databases",International Journal of Cloud
[54] Qi, Xiaogang, Min Qiang, and Lifang Liu, "A balanced strategy to improve datainvulnerabilityinstructuredP2Psystem",Peer-to-
[55] B C Arnold, "Pareto distribution,"Wiley StatsRef: Statistics Reference
[56] Da Silva, R V., Gomes-Silva, F., Ramos, M W A., & Cordeiro, G M,
[57] Yang, Yue, and Jianwen Zhu, "Write skew and zipf distribution: Evidence andimplications",ACMtransactionsonStorage(TOS),pp.1-19,2016.
[58] CHEN,Xin,ShansiRenandHainingWang,“SCOPE:Scalableconsistencymaintenance i n s t r u c t u r e d P 2 P s y s t e m s ” ,P r o c e e d i n g s I E E E 2 4 t h A n n u a l