Bài viết đề xuất một chính sách lưu trữ dữ liệu tại các node trong mạng CCN dựa vào xác suất khả năng lưu trữ của tất cả các node và thứ tự của node. Thông qua mô phỏng, đánh giá các tiêu chí về tỉ lệ tìm thấy dữ liệu và khoảng cách trung bình từ người dùng đến node tìm thấy dữ liệu là đạt kết quả tốt hơn chính sách lưu trữ LCE và LCD.
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XI Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 09-10/8/2018 DOI: 10.15625/vap.2018.00036 MỘT CHÍNH SÁCH LƯU TRỮ DỮ LIỆU TRONG MẠNG HƯỚNG NỘI DUNG Lê Phong Dũ1,2, Lê Tuấn Anh3, Nguyễn Đức Thái4 Trường Đại học Lạc Hồng Trường Thực hành Sư Phạm, Trường Đại học Trà Vinh Trường Đại học Thủ Dầu Một Trường Đại học Bách Khoa, Đại học Quốc gia TP.HCM TÓM TẮT: CCN (Content Centric Networking) xem cấu trúc mạng Internet tương lai, liệu chuyển từ mơ hình host - to - host sang mơ hình truyền liệu dựa tên nội dung Mỗi node mạng CCN có nhớ để lưu trữ lại liệu mạng, liệu lưu trữ định sách lưu trữ, dung lượng nhớ node CCN giới hạn, sách lưu trữ sách thay liệu node CCN cần có nghiên cứu cải tiến Đã có nhiều giải pháp đề xuất nhằm cao hiệu suất mạng CCN Trong báo này, chúng tơi đề xuất sách lưu trữ liệu node mạng CCN dựa vào xác suất khả lưu trữ tất node thứ tự node Thông qua mơ phỏng, chúng tơi đánh giá tiêu chí tỉ lệ tìm thấy liệu khoảng cách trung bình từ người dùng đến node tìm thấy liệu đạt kết tốt sách lưu trữ LCE LCD Từ khóa: CCN, Caching I GIỚI THIỆU Internet phát triển nhanh dịch vụ, liệu trao đổi ngày lớn, xu hướng tiếp tục tăng theo thời gian Theo thống kê Cisco VNI [1] số lượng IP toàn cầu tăng gấp lần năm năm qua, tốc độ tăng trung bình 21 % từ năm 2016-2021 Nhu cầu người dùng sử dụng ngày nhiều dịch vụ truy cập lượng liệu ngày lớn, đặt nhiều thách thức mạng như: băng thông yêu cầu ngày cao, thời gian truyền liệu có độ trễ lớn chiếm dụng đường truyền lâu người dùng truy cập đến máy chủ cách xa vị trí người dùng, độ tin cậy, khả mở rộng tính bảo mật liệu, Việc cải tiến TCP/IP yêu cầu cấp thiết, cần đề xuất giải pháp nhằm nâng cao hiệu sử dụng hiệu suất mạng Xu hướng kết nối hướng đến tiếp nhận phổ biến liệu nhiều nơi, nghĩa mơ hình kết nối Internet tập trung vào liệu, không quan tâm nhiều đến vị trí vật lý mà liệu lưu trữ Để phù hợp với xu ngày thay kiến trúc mạng TCP/IP, có nhiều nghiên cứu mơ hình kết nối dựa vào tên liệu đề xuất, Content Centric Networking hay mạng CCN đề xuất PARC (Palo Alto Research Center) xem mạng Internet tương lai, thích hợp cho dịch vụ cung cấp liệu mà điển hình đáng kể video tăng lên 81 % đến 2021 tổng số liệu [1] yêu cầu mạng Mỗi node mạng CCN có nhớ dùng để lưu liệu định lưu trữ liệu, liệu thay sách thay nhớ đầy Các gói tin liệu sau qua node mạng lưu lại node nhằm tái sử dụng lại gói tin liệu để đáp ứng cho người dùng khác có nhu cầu tương tự Lưu trữ liệu mạng đặc điểm CCN, liệu phân thành chunk [2], chunk xác định tên để nhận chuyển tiếp gói tin sử dụng thay cho địa ch IP Mỗi node mạng CCN gồm ba cấu tr c liệu ch nh [2]: Content Store (CS) nhớ lưu trữ liệu, tương tự nhớ đệm định tuyến IP, chức cốt lõi CCN; Forwarding Information Base (FIB) chứa danh sách định tuyến liệu, dùng để chuyển tiếp gói tin tin liệu đến nguồn liệu để so khớp; Pending Interest Table (PIT) lưu vết gói tin chờ phục vụ, nghĩa gửi yêu cầu qua mạng chờ phản hồi Có hai gói tin CCN, Interest gói tin yêu cầu liệu từ ph a người dùng Data mang liệu yêu cầu Nguồn giữ Data nhận Interest có tên liệu yêu cầu tự động gửi Data cho người dùng theo chế lưu vết đường Interest CCN Khi gói tin Interest đến node, tìm kiếm CS, có tồn gói tin nhớ gửi Data cho người dùng đồng thời hủy bỏ gói Interest Nếu khơng tìm thấy liệu có CS, node tìm danh sách gói Interest chờ phục vụ PIT Nếu có danh sách chờ phục vụ Interest bị hủy khơng gửi đến node kế tiếp, ghi nhớ Interface gửi yêu cầu vào PIT Nếu Interest khơng có danh sách chờ phục vụ, node ghi lại thông tin vào bảng cần phục vụ PIT, dị tìm Interface bảng FIB để chuyển tiếp gói Interest Lưu trữ liệu mạng đặc điểm CCN, có nhiều liệu lưu trữ trung gian node mạng Bất k node c ng trở thành server trả lời yêu cầu người dùng, điều giảm khả t t nghẽn mạng, hạn chế truy cập liệu server ch nh, thời gian phục vụ yêu cầu người dùng cải thiện đáng kể Lê Phong D , Lê Tuấn Anh, Nguyễn Đức Thái 269 Hình Cơ chế định tuyến-chuyển tiếp gói tin CCN node [2] Trong báo này, ch ng đề xuất ch nh sách lưu trữ liệu node mạng CCN dựa vào xác suất khả lưu trữ tất node thứ tự node Cấu trúc báo gồm: Phần I giới thiệu tổng quan; phần II trình bày nghiên cứu liên quan; ch nh sách lưu trữ đề xuất trình bày phần III; phần IV nội dung tham số mô phỏng; đánh giá kết mô trình bày phần V; phần kết luận trình bày phần VI II CÁC NGHIÊN CỨU LIÊN QUAN Lưu trữ mạng chủ đề mới, có nhiều nghiên cứu liên quan đến ch nh sách lưu trữ liệu sách thay liệu Thực tế, với khối liệu mạng ln có độ phổ biến định (theo thời gian), khối liệu ch sử dụng lần (trong khoản thời gian đủ dài định) thường chiếm đến 45 % yêu cầu chiếm đến 75 % tổng số khối liệu mạng [7], khối liệu có độ phổ biến thấp Phần 25 % lại khối liệu yêu cầu để sử dụng nhiều lần, tức có độ phổ biến cao Đối với CCN, node có khơng gian nhớ khác nên việc thiết kế thuật toán tốt tiết kiệm sử dụng hiệu tài nguyên mạng Có nhiều ch nh sách lưu trữ đề xuất để lưu trữ liệu node Lưu trữ liệu node giúp giảm sử dụng băng thông, hạn chế truy cập liệu server gốc, hạn chế t c nghẽn mạng Thuật toán LCE [3], [8] thuật toán định nghĩa mặc định cho mạng CCN Dữ liệu lưu trữ tất node qua Kết nội dung liệu lưu trữ phổ biến mạng, gần với yêu cầu người dùng Vấn đề LCE ch nh thường xuyên thay liệu, ch nh sách lưu trữ LCE không xét đến độ phổ biến liệu lưu trữ Một hạn chế khác LCE liệu mạng trùng lặp nhiều node mạng lân cận Trong thuật toán LCD [4], [8] lưu trữ nội dung liệu node mức i-1, tìm thấy liệu node thứ i LCD giải trùng lặp liệu c ng tiết kiệm không gian nhớ, liệu phổ biến dần chyển node biên mạng gần với người dùng, liệu phổ biến ngược lại Một dạng khác LCD thuật toán MCD [4], [8] c ng đề xuất, thuật toán này, lưu liệu node thứ i-1 liệu node thứ i, nơi tìm thấy liệu bị xóa Một đề xuất khác thuật toán dựa vào xác suất Prob cache [6], [8], node lưu trữ liệu với xác suất p không lưu với xác suất 1-p Khi xác suất 1, thực thuật toán LCE Thuật toán giải vấn đề khó khăn LCE LCD gặp phải Một đề xuất khác lưu trữ liệu dựa vào liệu phổ biến mạng [10] Mỗi node mạng CCN đếm liệu yêu cầu qua node Mỗi liệu yêu cầu qua node danh sách chứa tên liệu yêu cầu biến chứa giá trị tương ứng tên liệu tạo Khi không tìm thấy liệu CS giá trị tên liệu yêu cầu tăng lên 1, liệu tiếp tục chuyển đến node Khi tìm thấy liệu, liệu trả lưu trữ node có giá trị giá trị ngưỡng k Tuy nhiên liệu phổ biến giảm sau lần khởi tạo lại giá trị Lưu trữ mạng CCN tồn hai dạng on-path off-path, ch nh sách lưu trữ LCE, LCD, MCD lưu trữ dạng on-path, nghĩa liệu lưu trữ đường chuyển ph a người dùng; khí off-path phải tính tốn tối ưu cho việc thay liệu node Ch nh sách lưu trữ liệu off-path đạt hiệu mạng tốt onpath, nhiên tốn thời gian phức tạp tính tốn Để lưu trữ liệu node hiệu quả, sách thay nội dung liệu đóng vai trị quan trọng nhớ lưu trữ node có không gian nhớ khác nhau, giới hạn dung lượng, lưu trữ tất thông tin, 270 MỘT CHÍNH SÁCH LƯU TRỮ DỮ LIỆU TRONG MẠNG HƯỚNG NỘI DUNG cần có sách loại bỏ liệu khơng cịn phù hợp để lưu thêm liệu Một số ch nh sách sử dụng để thay liệu Least Recently Used (LRU) [5], Least Frequently Used (LFU) [7], Random (Rand) [7] hay First In First Out (FIFO) III CHÍNH SÁCH LƯU TRỮ DỮ LIỆU DỰA TRÊN XÁC SUẤT Để giải hạn chế sách lưu trữ liệu CCN hạn chế việc thay liệu liên tục node, ch ng đề xuất sách lưu trữ liệu node dựa vào xác suất khả lưu trữ tất node thứ tự node, ch ng đặt tên PCCN Mỗi node CCN có dung lượng nhớ lưu trữ giới hạn định Khi yêu cầu nội dung liệu, người dùng gửi gói Interest, nội dung liệu phù hợp phản hồi yêu cầu cách trả lời gói Data Trong gói Interest sử dụng mảng lưu trữ dung lượng nhớ node thứ i qua mảng lưu thứ tự node từ người dùng đến node tìm thấy nội dung Khi gặp node chứa nội dung liệu, tính tổng dung lượng nhớ tất node đường mà gói tin Interest qua Khi đó, thứ tự vị trí node qua đảo theo chiều ngược lại Tại thời điểm gói Data gửi liệu ph a người dùng, xác suất node thứ i mà gói Interest qua theo cơng thức: () đó, dung lượng nhớ node thứ i, tổng dung lượng tất node, h giá trị vị trị node thứ i đảo ngược Dữ liệu lưu node thứ i có xác suất thấp Hình Thuật tốn PCCN Hình Ví dụ mơ hình PCCN Giả sử User yêu cầu nội dung d1, gói Interest qua node 1, 3, tìm thấy nội dung liệu d1 theo yêu cầu node thứ 5, mảng lưu dung lượng nhớ node 1, 3, mảng lưu thứ tự node đường node 1=1, node 3= 2, node =3 Đến node thứ tìm thấy nội dung liệu d1, tổng dung lượng tất Lê Phong D , Lê Tuấn Anh, Nguyễn Đức Thái 271 node 1, 3, đồng thời đảo ngược mảng tứ tự, tức node 4=1, node 3=2, node 1=3 Xác suất node t nh sau: ( ) , ( ) , ( ) Dữ liệu lưu tạo node có xác suất thấp IV THAM SỐ MƠ PHỎNG Để đánh giá thuật tốn đề xuất, chúng tơi tiến hành mơ thuật tốn đề xuất ngơn ngữ lập trình C++ Mạng CCN đề xuất phù hợp với mơ hình mạng tự mơ hình mạng phân cấp, chúng tơi sử dụng mơ hình mạng tự Abilene [11] có 11 node, nhớ lưu trữ node cấp phát ngẫu nhiên mạng Phân phối liệu sử dụng phân phối Zipf [9] với giá trị α 0,9 Bên cạnh đó, CCN sử dụng sách thay nội dung node không gian lưu trữ node không đủ để lưu liệu CCN đề xuất nhiều sách thay nội dung như Least Recently Used (LRU) [5], Least Frequently Used (LFU) [7], Random (Rand) [8] hay First In First Out (FIFO) Trong báo này, chúng tơi sử dụng sách thay liệu LRU, sách thay liệu lưu trữ node sử dụng nhiều, sử dụng hàng đợi s p xếp liệu theo trình tự thời gian lần truy cập trước Khi khơng gian nhớ node đầy, thuật tốn xóa liệu sau thêm liệu vào đầu hàng đợi Bảng 1: tham số mô Tham số Mơ hình mạng Phân phối nội dung Zipf Thuật toán lưu trữ nội dung liệu node Thuật toán thay nội dung Số chunk Giá trị Abilene 0,9 LCE, LCD, PCCN LRU 103 V ĐÁNH GIÁ KẾT QUẢ CỦA THUẬT TOÁN PCCN Trong phần này, trình bày kết mơ dựa tham số bảng Ch ng đánh giá thuật tốn PCCN thơng qua tiêu chí xác suất tìm thấy liệu khoảng cách trung bình từ người dùng yêu cầu đến node tìm thấy liệu Giá trị xác suất tìm thấy liệu (P hit) để làm tham số so sánh Xác suất tìm thấy liệu tính cơng thức: n hiti p _ hit i n i , n missi hiti i đó, hiti số Interest gửi mạng CCN tìm thấy liệu node thứ i, missi số Interest người dùng khơng tìm thấy nội dung liệu node thứ i, n tổng số node mạng CCN Kết mơ hình cho thấy thuật tốn PCCN xác suất tìm thấy nội dung cao ch nh sách lưu trữ LCE LCD PCCN đạt t lệ cao LCE % % so với LCD Thuật tốn PCCN có xu hướng lưu trữ liệu node dần node biên nhiều so với node bên mạng, gần với người dùng Hình T lệ tìm thấy liệu LCE, LCD PCCN MỘT CHÍNH SÁCH LƯU TRỮ DỮ LIỆU TRONG MẠNG HƯỚNG NỘI DUNG 272 Trong trường hợp xác định khoảng cách trung bình từ người dùng đến node tìm thấy liệu mơ hình cho thấy khoảng cách trung bình số node tìm thấy liệu PCCN ng n LCE LCD, nội dung phổ biến gần với người dùng hơn, nội dung phổ biến lưu trữ node bên mạng Hình Số node trung bình tìm thấy liệu VI KẾT LUẬN Trong báo này, ch ng tơi đề xuất thuật tốn PCCN, ch nh sách lưu trữ liệu node mạng CCN Thuật tốn chúng tơi cải tiến đạt kết tốt sách lưu trữ LCE LCD CCN, giải trùng lặp liệu c ng tiết kiệm không gian nhớ node cách tính xác suất kết mô cho thấy đạt kết tốt tìm thấy nội dung liệu, liệu phổ biến có xu hướng lưu lưu trữ node gần đến người dùng VII TÀI LIỆU THAM KHẢO [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] Cisco visual networking index: forecast and methodology: 2016-2021, 9/2017 V Jacobson, D K Smelters, D Thornton, M F Plass, N H Briggs, R L Braynard “Networking named content” ACM CoNEXT, Rome, Italy, December 2009 G Carofiglio, V Gehlen, and D Perino “Experimental evaluation of memory management in content-centric networking” IEEE ICC, 2011, pp 1-6 K Cho, M Lee, K Park, T T Kwon, Y Choi, and S Pack “Wave: Popularity-based and collaborative innetwork caching for contentoriented networks” IEEE INFOCOM WKSHPS, 2012, pp 316-321 D He, W K Chai, and G Pavlou “Leveraging in-network caching for efficient content delivery in contentcentric network” Proc of London Communication Symposium 2011 Psaras, Ioannis, Wei Koong Chai, and George Pavlou “Probabilistic in-network caching for information-centric networks” Proceedings of the second edition of the ICN workshop on Information-centric networking ACM, 2012 N Laoutaris, S Syntila, and I Stavrakakis “Meta Algorithms for Hierarchical Web Caches” IEEE ICPCC, 2004 N Laoutaris, H Che, and I Stavrakakis “The LCD interconnection of LRU caches and its analysis” Performance Evaluation, 63(7), 2006 L Breslau and et al “Web caching and zipf like distributions: Evidence and implications” in In INFOCOM, 1999, pp 126-134 Le Phong Du, Le Tuan Anh, Nguyen Duc Thai “Lưu trữ liệu mạng hướng nội dung dựa vào liệu phổ biến” Kỷ yếu hội thảo Fair 2017 ccnSim homepage http://www.infres.enst.fr/~drossi/ccnSim, 04/2017 A CACHING POLICY IN CONTENT CENTRIC NETWORKING Le Phong Du, Le Tuan Anh, Nguyen Duc Thai ABSTRACT: Content Centric Networking (CCN) is considered as the future Internet structure which data is transferred from the host-to-host model to the content-based transmission model Each node in CCN network has a memory to store the data in the network, The storage data is determined by the caching policies, The memory capacity of the CCN node is limited, so the caching policies and replacement policies on each node need to be researched and improved There are many solutions proposed to improve the efficiency of CCN In this paper, we propose a policy of caching data at nodes in an CCN based on the storage probabilities of all nodes and the order of nodes Through simulation, we evaluated the cache hit ratio and average distance from users to node finding the data to achieve better results than LCE and LCD caching policies Từ khóa: CCN, Caching ... lưu trữ node có khơng gian nhớ khác nhau, giới hạn dung lượng, lưu trữ tất thông tin, 270 MỘT CHÍNH SÁCH LƯU TRỮ DỮ LIỆU TRONG MẠNG HƯỚNG NỘI DUNG cần có sách loại bỏ liệu khơng cịn phù hợp để lưu. .. xu hướng lưu trữ liệu node dần node biên nhiều so với node bên mạng, gần với người dùng Hình T lệ tìm thấy liệu LCE, LCD PCCN MỘT CHÍNH SÁCH LƯU TRỮ DỮ LIỆU TRONG MẠNG HƯỚNG NỘI DUNG 272 Trong. .. nghĩa mặc định cho mạng CCN Dữ liệu lưu trữ tất node qua Kết nội dung liệu lưu trữ phổ biến mạng, gần với yêu cầu người dùng Vấn đề LCE ch nh thường xuyên thay liệu, ch nh sách lưu trữ LCE không xét