Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 42 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
42
Dung lượng
716,77 KB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Trần Văn Chung TỐI ƯU HÓA BACKUP DỮ LIỆU TRONG MẠNG NGANG HÀNG CĨ CẤU TRÚC KHỐ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ Thơng tin Cán hướng dẫn: ThS Nguyễn Đình Nghĩa Đồng hướng dẫn : ThS Đào Minh Thư HÀ NỘI - 2010 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com LỜI CẢM ƠN Em xin chân thành cảm ơn thầy cô giáo trường Đại học Công nghệ Đại học Quốc gia Hà Nội tận tình giúp đỡ truyền đạt kiến thức cho em suốt năm học qua để em có đủ kiến thức hồn thành khóa luận Đặc biệt, em xin gửi lời cảm ơn sâu sắc tới thầy Nguyễn Hồi Sơn, Nguyễn Đình Nghĩa cô Đào Minh Thư – người nhiệt tình giúp đỡ, định hướng động viên em q trình nghiên cứu hồn thành khóa luận Em xin cảm ơn nhiệt tình chia sẻ kinh nghiệm, đóng góp ý kiến nhóm nghiên cứu thầy Nguyễn Hoài Sơn hướng dẫn, anh chị cao học Mặc dù cố gắng hoàn thành khóa luận này, xong khóa luận khó tránh khỏi thiếu sót, kính mong q thầy tận tình bảo giúp em Một lần em xin cảm ơn tất người Hà Nội, tháng năm 2010 Sinh viên Trần Văn Chung LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Tóm tắt Khóa luận trình bày giải pháp tối ưu hóa chế backup liệu mạng ngang hàng có cấu trúc Giải pháp tập trung giải vấn đề dung lượng bị tăng lên nhiều việc backup khả phục hồi liệu có nút rời mạng Tiêu chí đánh giá tỉ lệ dung lượng liệu sau mạng thực thi nhiều lần backup so với dung lượng ban đầu mạng khả phục hồi liệu mạng Giải pháp thử nghiệm chương trình mô với môi trường mạng ảo Kết cho thấy, giải pháp tối ưu đem lại hiệu với việc tỉ lệ dung lượng liệu mạng sau thực thi backup so với dung lượng liệu ban đầu không lớn việc phục hồi liệu có nút rời mạng tốt Theo đó, hiệu mạng ứng dụng nâng lên LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Mục lục Mở đầu Chương Tổng quan 1.1 Tổng quan việc backup liệu .3 1.1.1 Giải thuật phân tán thông tin IDA .4 1.2 Mạng ngang hàng .6 1.2.1 Định nghĩa 1.2.2 Ưu điểm nhược điểm mạng ngang hàng 1.2.3 Mạng ngang hàng khơng có cấu trúc 1.2.4 Mạng ngang hàng có cấu trúc (Structured) 1.2.5 Chord 11 1.3 Backup liệu mạng ngang hàng 15 1.3.1 Sự cần thiết việc backup liệu mạng ngang hàng 15 1.3.2 Một số giải pháp backup liệu mạng ngang hàng 15 Chương Tối ưu hóa backup liệu mạng ngang hàng có cấu trúc 17 2.1 Vấn đề cần giải .17 2.2 Ý tưởng 18 2.3 Giải pháp 18 2.3.1 Backup liệu 19 2.3.2 Khôi phục liệu 20 2.4 Đánh giá giải pháp 23 Chương Mô đánh giá 24 3.1 Chương trình mơ 24 3.1.1 Dữ liệu .24 3.1.2 Các đối tượng 25 3.1.3 Thực thi .27 3.2 Kết đánh giá 30 3.2.1 Khả tồn liệu .30 3.2.2 Sự vào nút mạng .31 3.2.3 Bảo mật .32 Chương Kết luận 33 4.1 Kết luận 33 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 4.2 Hướng phát triển đề tài .33 Tài liệu tham khảo 35 Phụ lục A .36 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Danh mục hình ảnh Hình 1: Giải thuật phân tán thơng tin IDA .5 Hình : Mơ hình mạng ngang hàng .6 Hình : Mơ hình máy khách , máy chủ Hình : Cơ chế bảng băm phân tán DHT 10 Hình :Mạng ngang hàng Chord 11 Hình : Mạng Chord có nút 13 Hình : Lưu trữ khóa mạng Chord .14 Hình : Cơ chế backup liệu – phân chia mảnh backup tồn mạng .19 Hình : Tỉ lệ liệu phục hồi 31 Hình 10 : Độ vào nút churn ảnh hưởng đến tỉ lệ liệu phục hồi 32 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Mở đầu Việc backup liệu điều cần có hệ thống , đặc biệt hệ thống lưu trữ,các hệ thống có hệ thống mạng.Ngày Internet ngày phát triển , trao đổi thông tin nhiều , việc lưu trữ liệu lại trở nên cần thiết.Do khóa luận hướng tới nghiên cứu sâu chế backup liệu hệ thống lưu trữ , hệ thống mạng Trong năm gần đây, công nghệ ngang hàng (peer-to-peer - P2P) hay mạng ngang hàng trở nên phổ biến nghiên cứu lĩnh vực Internet So với mơ hình mạng khác, mạng ngang hàng có nhiều ưu điểm khả mở rộng, không tồn điểm chết, khả hệ thống tỉ lệ với số lượng máy tham gia, Tất đặc điểm tạo lên công nghệ P2P ứng dụng ngang hàng liên quan Nhiều ứng dụng lớn xây dựng mạng ngang hàng FreeNet, Napster, Gnutella, BitTorrent, eMule Trong loại mạng ngang hàng , mạng ngang hang có cấu trúc sử dụng cách phổ biến ưu điểm Mạng ngang hàng có cấu trúc sử dụng giải thuật DHT (Distributed Hash Table – bảng băm phân tán) tạo nên mạng phủ (overlay) mạng liên kết vật lý Giải thuật định nghĩa liên kết nút mạng mạng phủ theo cấu trúc cụ thể, đồng thời xác định chặt chẽ nút mạng chịu trách nhiệm phần liệu chia sẻ mạng Mỗi nút kết nối với tập nút khác gọi tập nút láng giềng Chord giao thức mạng ngang hàng có cấu trúc với khơng gian địa chiều dạng vòng Mạng ngang hàng cấu trúc Chord thể nhiều ưu điểm khả mở rộng, cân tải, định tuyến, Giống giao thức mạng có cấu trúc khác, nút Chord xây dựng bảng định tuyến giúp cho việc tìm kiếm thơng tin giảm từ O(N) với N số lượng tối đa nút mạng, xuống O(log2N) Trong mạng ngang hàng có cấu trúc nói chung Chord nói riêng, việc backup liệu thực thông qua giải pháp lưu liệu đơn giản sử dụng liệu cần backup lưu nút gần nút chứa liệu cần backup.Cơ chế chưa có khả khơi phục lại mảnh backup bị trình tham gia rời nút mạng LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Khóa luận đề xuất phương pháp để giải hai vấn đề nêu xảy với mạng ngang hàng có cấu trúc nói chung cấu trúc Chord nói riêng Bằng việc sử dụng thuật tốn mã hóa IDAs(Information Dispersal Algorithms) liệu ban đầu mã hóa phân chia thằng m mảnh cần n mảnh có khả khơi phục lại liệu ban đầu Sau m mảnh phân chia mạng cách hợp lí Với giải pháp , có thêm chế để khôi phục lại mảnh backup liệu nút chứa chúng rời khỏi mạng, liệu ban đầu mã hóa liệu có tính bảo mật Để đánh giá hiệu giải pháp đề xuất, khóa luận xây dựng chương trình mơ giả lập mạng Internet đo thời gian trễ truyền thông báo nút mạng Chord Các kết thử nghiệm chứng minh cho khả giải pháp đề xuất việc giảm tăng dung lượng liệu cần backup mạng sử dụng tài nguyên mạng hợp lí Khóa luận chia thành bốn chương: Chương 1: Giới thiệu tổng quan backup liệu tổng quan mạng ngang hàng Chương 2: Đề xuất giải pháp tối ưu hóa việc backup liệu mạng ngang hàng có cấu trúc , ưu nhược điểm giải pháp Chương 3: Xây dựng chương trình mơ phỏng, bước thực thi chương trình đánh giá từ kết đạt Chương 4: Kết luận, vấn đề nảy sinh hướng LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chương Tổng quan Mạng ngang hàng (mạng đồng đẳng, peer-to-peer, P2P) hay công nghệ ngang hàng trở thành thuật ngữ phổ biến công nghệ thơng tin nói chung lĩnh vực Internet nói riêng Các ứng dụng mạng ngang hàng xuất ngày nhiều, thu hút đông đảo người dùng máy tính Rất nhiều cơng ty, ứng dụng với cơng nghệ ngang hàng trở lên tiếng, đông đảo cư dân mạng sử dụng như: Usenet, Freenet, Napster, Gnutella, BitTorrent… Trong điều kiện Internet ngày phát triển, lượng thông tin truyền tải chia sẻ ngàng lớn, mơ hình client server bộc lộ nhiều hạn chế băng thơng sức mạnh tính tốn , mạng ngang hàng với nhiều ưu điểm bật có thêm nhiều hội để phát triển Do mạng ngang hàng tham gia rời nút đặc điểm dẫn đến mát liệu Backup liệu việc cần có tất hệ thống lưu trữ thông tin, đặc biệt mạng ngang hàng,.Backup liệu nhằm lưu lại liệu thời điểm , mà hệ thống xảy cố gây mát liệu liệu mát phục hồi cách sử dụng liệu việc backup trước sinh Dữ liệu hệ thống phục hồi thời điểm trước việc backup thực Chương này, khóa luận giới thiệu việc backup liệu mạng ngang hàng, 1.1 Tổng quan việc backup liệu Định nghĩa Backup liệu hay trình backup liệu trình tạo liệu , bổ sung sử dụng để khơi phục lại gốc sau liệu bị Những liệu bổ sung gọi backup Các backup sử dụng với hai mục đích Đầu tiên phục hồi lại sau liệu bị hỏng hóc.Thứ hai phục hồi số nhỏ file sau chúng bị xóa bị hỏng Việc mát liệu phổ biến , sáu mươi sáu phần trăm số người sử dụng Internet bị mát liệu LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Các backup sau sinh gửi tới nơi thiết bị để lưu trữ Các thiết bị ổ cứng máy tính mình, đĩa CDROM, DVD thiết bị , hệ thống lưu trữ khác Trước backup gửi đến nơi lưu trữ , backup xử lí.Nhiều kỹ thuật khác phát triển để tối ưu hóa q trình backup.Các thao tác xử lí cung cấp nhiều lợi ích bao gồm cải thiện tốc độ backup , tốc độ phục hồi,bảo mật liệu … Một số kỹ thuật : • Nén (Compression) • Sao lại(Duplication) • Mã hóa(Encryption) • … Một số cách mã hóa sử dụng giải thuật IDAs(Information Dispersal Algorithms) 1.1.1 Giải thuật phân tán thông tin IDA LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com khoảng định danh tính mảnh backup mảnh back up Khôi phục lại mảnh backup Việc khôi phục mảnh backup tiến hành theo bước sau : - Tìm lấy n mảnh backup khác mạng (với n mảnh backup phục hồi liệu mã hóa giải thuật phân tán thông tin IDA trên) Các mảnh backup lưu nút nằm khoảng định nhanh [mini , maxi ) Chúng ta cần tìm n mảnh backup khác - Sau tìm n mảnh backup , dùng giải thuật phân tán thông tin IDA để khôi phục lại liệu ban đầu Sau hồi phục lại liệu ban đầu , lại tiếp tục dung giải thuật IDA để phân chia liệu ban đầu , sau chọn lấy mảnh backup i lưu trữ vào nút nằm khoảng định danh [mini ,maxi ) - Nút chọn có định danh tương đối idi , tính theo cơng thức : idi = {id +( (2^ADDR_SPACE)/m)*i} %(2^ADDR_SPACE) id : định danh liệu ADDR_SPACE : số bit vòng Chord m : số mảnh backup / số nút chứa mảnh backup i : mảnh backup i : m - Dựa vào idi , ta tìm nút lưu mảnh backup thứ i vào nút Sau bước phục hồi lại mảnh backup nút rời 22 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 2.4 Đánh giá giải pháp Giải pháp trọng vào vấn đề bảo mật liệu , cách phân bố liệu , mã hóa liệu nhằm tận dụng tài nguyên mạng Giải pháp hiệu nhiều mặt song có nhiều hạn chế Ưu điểm - Dữ liệu mã hóa nên có khả bảo mật cao - Khi sử dụng giải thuật phân tán thông tin IDA , mảnh backup có dung lượng dung lượng tập tin liệu ban đầu chia cho n (số mảnh backup cần thiết để khơi phục lại liệu ban đầu).Cho nên lượng tài nguyên cần thiết để lưu trữ nút nhỏ so với phương tạo Nhược điểm - So với phương pháp tạo trực tiếp việc khơi phục lại mảnh backup tốn thời gian Phương pháp tạo cần lấy phục hồi , phương pháp phải tìm kiếm đủ n mảnh sau phục hồi lại liệu ban đầu , lại mã hóa phân chia liệu , lấy mảnh backup liệu để lưu trữ lại 23 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chương Mô đánh giá Để thấy hiệu giải pháp xem xét giải pháp tốt đến mức nào, cần có số thống kê, thể tồn liệu mạng sau trình vào nút Về bản, thử nghiệm kết mạng thực đánh giá tốt nhất, xác Nhưng điều kiện để có mơ hình mạng thực dành cho việc đánh giá khó nên mơ cách lựa chọn đắn Chương trình bày chương trình mơ phỏng, bước để thực chương trình mơ phỏng, chạy thử, thống kê kết đánh giá Vì mơ khác xa so với thực tế nên mục đích chương đưa đánh giá sơ bộ, tổng quát 3.1 Chương trình mơ Chương trình mơ gồm gồm hai phần liệu thực thi Phần liệu bao gồm loại liệu phần mã nguồn chương trình tạo chúng Thực thi phần mơ tả hoạt động mạng ngang hàng Chord thực công việc backup liệu Chương trình tham khảo từ chương trình mơ khóa luận tốt nghiệp sinh viên Đặng Ngọc Bền – khoa Cộng nghệ thông tin – đại học Cơng nghệ với đề tài“Tối ưu hóa topology cho mạng ngang hàng có cấu trúc Chord” 3.1.1 Dữ liệu Chương trình mơ sử dụng nhiều loại liệu Có liệu sử dụng q trình khởi tạo, có liệu đọc sử dùng từ bắt đầu chương trình đến kết thúc Phần nói đến ý nghĩa tệp liệu, cấu trúc tệp chi hóa phụ lục A, việc tạo tệp liệu trình bày chi tiết phần thực thi Thông tin miền Thông tin miền bao gồm số lượng miền, thời gian trễ liên miền Giá trị thời gian trễ liên miền nằm khoảng cố định đưa sinh liệu Cần định khoảng để lấy ngẫu nhiên, kết thu phải tương đối phù hợp 24 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Thông tin nút Dữ liệu cung cấp xem có tối đa nút tham gia mạng, nút thuộc miền Đây giá trị cố định tồn chương trình mơ Thông tin vào (churn) Đây liệu để mô vào ra, không ổn định nút Tại mốc thời gian mô phỏng, liệu cung cấp thông tin nút tham gia hay rời thời gian trễ nội vùng nút Dữ liệu ban đầu mạng Dữ liệu để mô tồn liệu thật Dữ liệu liệu mã hóa giải thuật phân tán thơng tin IDA Dữ liệu lưu dạng thông tin đơn giản gồm có - Định danh liệu , tạo từ việc băm tên tập tin liệu , định danh có độ dài độ dài vòng Chord - Độ lớn liệu 3.1.2 Các đối tượng Chương trình mơ tương tác đối tượng Để hình dung q trình mơ làm gì, xem xét đối tượng chức chúng Trong chương trình này, đối tượng chủ yếu dùng để lưu trữ liệu • Areas Đối tượng lưu trữ thông tin miền, tệp chứa miền, thao tác với liệu miền Quan trọng phương thức lấy thời gian trễ liên miền • NodeLocation Lưu thơng tin vị trí nút, xác nút thuộc miền Cùng với Areas hai đối tượng lưu thông tin để tạo lên topo mạng mơ • FingerEntry Thể liên kết (entry) bảng định tuyến Thuộc tính idSuccessor với ý nghĩa định danh successor khóa mục tiêu entry xét Khi định tuyến quan tâm đến thuộc tính • Node 25 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Mô tả thông tin nút mạng với tên, miền mà nút thuộc về, thời gian trễ nội miền, định danh vịng khơng gian địa Chord, định danh successor predeccessor, cuối bảng định tuyến có kiểu FingerEntry Các thao tác với thuộc tính nút Phương thức đáng chủ ý nextNode() Trong trình truy vấn, nút giao cho yêu cầu chứa khóa tài liệu cần tìm kiếm Nhiệm vụ nút phải thơng báo trở lại nút quản lý khóa cần tìm (nắm giữ tài liệu có) chuyển tiếp yêu cầu sang nút khác, nút gần với câu trả lời Quá trình chuyển tiếp dựa chủ yếu vào bảng định tuyến, hàm nextNode() trả lại định danh nút chuyển tiếp • Network Đây coi đối tượng chính, chương trình mơ Đối tượng lưu trữ thơng tin tạo lên topo mạng mô phỏng, tạo cấu trúc Chord từ mạng mơ q trình churn nút, đồng thời mô tả lại hoạt động truy vấn liệu Chord Một số phương thức birth(), death(): Thực hiên có nút tham gia hay rời khỏi mạng fixFingerTables(): Cập nhật bảng định tuyến tất nút mạng Hàm thực sau có loạt trình vào nút làm cho bảng định tuyến trở lên lỗi thời findSuccessor(): Tìm successor nút backupAll() : Thực việc Backup liệu Divide(id_data) : phân bố mảnh backup liệu có định danh id_data Restore(id_data ) : khơi phục lại mảnh backup liệu có định danh id_data Giải pháp tối ưu hóa thể hai phương thức Divide(id_data) Restore(id_data) • InputGenerator Đối tượng chứa phương thức để tạo tệp liệu mô tả phần Dữ liệu chương trình vận hành gồm bốn tệp, tương 26 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com đương có bốn phương thức tạo tệp riêng Các liệu miền, liệu nút truy vấn sinh theo phân bố cách ngẫu nhiên với giá trị giới hạn tham số mô tả lời gọi phương thức Riêng liệu độ bất ổn (churn) sinh theo luật phân bố Pareto [10] Đây luật phân bố phổ biển đắn nhiều lĩnh vực • Distribution [6] Đây đối tượng cho phép sinh giá trị theo luật phân bố Pareto nêu Sau khởi tạo số đặc trưng cho loại phân bố này, đối tượng cho phép sinh giá trị theo luật phương thức next() • Thư viện hash [12] Một thư viện nhỏ chứa hàm băm sha-1 Thư viện mã nguồn mở với hai hàm băm tiêu biểu sha md5 Riêng sha, thư viện cung cấp nhiều hàm, yêu cầu số lượng bit kết (160, 256, 512,…) Do nhu cầu sử dụng nhỏ nên chương trinhg mô thêm hàm băm sha với số lượng bit kết 160 Thư viện sử dụng dễ dàng với API phương thức mơ tả đơn giản • Các hàm tốn học Khá nhiều hàm liên quan đến toán học số Những hàm cần thiết, phục vụ hầu hết q trình tính tốn chương trình Đáng kể hàm băm hash() Đầu vào hàm tên nút, đầu định danh 32 bit Chương trình mơ sử dụng khơng gian định danh 32 bit nhu cầu cần 32 bit trích từ bit giá trị băm có từ thư viện hashlib++ [12] với 160 bit độ dài 3.1.3 Thực thi Quá trình thực thi chia thành hai phần riêng biệt: phần thứ gồm : sinh liệu mô hoạt động Chord đơn giản , phần thứ hai thực giải pháp backup liệu đề Sinh liệu đơn giản tạo tệp với liệu bên cách ngẫu nhiên tuân theo điều 27 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com kiện luật phân bố riêng Mô hoạt động Chord thực theo mốc thời gian Theo đó, mốc thời gian, số nút tham gia vào mạng số rời (churn), chương trình thực vào cho nút, ổn định mạng Sau mạng ổn định , chương trình thực trình backup liệu theo giải pháp đề trên.Quá trình backup mô việc phân bố mảnh backup liệu tới nút mạng khôi phục lại mảnh backup có nút chứa mảnh backup liệu rời mạng, liệu ban đầu coi mã hóa Sinh liệu Về ngun tắc, lần thực thi chương trình, vừa sinh liệu, mô hoạt động Chord sau từ liệu vừa sinh , Nhưng để đánh giá hiệu giải pháp , nên dùng lại liệu sinh từ lần trước để tiện so sánh Quá trình sinh liệu cần đảm bảo số yêu cầu Những yêu cầu giúp cho liệu sinh đắn tiệm cận với giá trị mạng thực tế • Thơng tin miền Số lượng miền định trước, đủ lớn để tạo tính phân tán, khơng q lớn làm cho mạng mơ trở lên vụn, khó khăn cho việc lưu trữ Theo thử nghiệm, số lượng vùng nên nhỏ 128 Sinh ngẫu nhiên giá trị thời gian trễ liên miền cặp miền khoảng 50-250 Thời gian trễ mạng thực tế thường hay nằm khoảng điều kiện mạng bình thường Đơn vị tính độ trễ quy định ms (milisecond) • Thơng tin nút Số lượng nút tối đa định trước Sinh ngẫu nhiên định danh vùng cho nút Quá trình ngẫu nhiên phân bố nút vào miền • Q trình churn Sử dụng luật phân bố Pareto để sinh tên nút có kiện, thời điểm xảy kiện Luật phân bố sử dụng rộng dãi lĩnh vự kinh tế, công nghệ Độ trễ nội miền sinh ngẫu nhiên theo phân bố (ngẫu nhiên) với giá trị nhỏ Trong chương trình, giới hạn độ trễ đoạn [1, 30] 28 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Thực thi mô Mục tiêu cuối phần mô giá trị thời gian trễ Để có giá trị này, cần thực bước sau: - Khởi tạo đối tượng Network theo tham số đưa bao gồm tên tệp input, output - Khởi tạo hai đối tượng để lưu thông tin miền nút, đọc thơng tin từ tệp input đưa vào hệ thống - Thực trình lặp theo mốc thời gian, đọc thông tin độ bất ổn, cập nhật thay đổi trạng thái nút cấu trúc mạng - Cập nhật lại bảng định tuyến (fingerTable) cho tất nút - Thêm liệu vào nút có định danh với định danh tạo việc băm tên liệu - Tiến hành việc backup liệu mạng , việc gồm hai trình phân bố mảnh backup liệu có nút tham gia khôi phục lại mảnh backup liệu có nút rời mạng - Sau bước cập nhật độ bất ổn, đọc truy vấn mốc thời gian, thực truy vấn ghi nhận thời gian truy vấn theo định dạng cụ thể cho thuận tiện cho việc thông kê sau Quá trình tối ưu việc backup liệu thể qua ba trình , thứ dùng giải thuật phân tán thơng tin IDA để mã hóa liệu phân chia thành m mảnh backup , thứ hai phân bố mảnh backup vào nút mạng có định danh tính tốn dựa vào định danh liệu , thứ ba trình phục hồi lại mảnh backup liệu có rời nút chứa mảnh backup liệu mạng Trong ba trình , chương trình mơ thực thi hai trình sau , liệu cần backup đầu vào liệu mã hóa giải thuật phân tán thơng tin IDA Hai q trình sau mô hai phương thức Divide(id_data) hàm Restore(id_data) • Divide(id_data) Phương thức cho phép phân bố mảnh backup tập tin liệu xuất mạng có nút tham gia vào mạng.Phương thức kiểm tra xem liệu có định danh id_data có phải liệu thêm vào mạng hay khơng , liệu phương thức tìm nút có định danh tính tốn dựa vào id_data , sau phân chia 29 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com mảnh backup liệu vào nút đó.Dữ liệu cũ liệu nút chứa mảnh backup liệu ,dữ liệu liệu nút có chứa m mảnh backup liệu • Restore(id_data) Phương thức cho phép tìm kiếm mảnh backup liệu có định danh id_data, tìm thấy có mảnh backup i mát phương thức thực việc tìm kiếm n mảnh backup khác liệu có định danh id_data tồn mạng để khơi phục lại mảnh backup i Sau lưu lại mảnh backup i dựa vào định danh liệu khoảng định danh nút chứa mảnh backup lúc trước rời khỏi mạng 3.2 Kết đánh giá Phần trình bày kết mô đạt Trước tiên, cần đánh giá hiệu trình tối ưu backup liệu 3.2.1 Khả tồn liệu Chương trình chạy nhiều lần với tập tin liệu sở mạng vào nút cố định ,giải thuật phân tán thông tin IDA chia liệu thành m = 10 mảnh cần n= mảnh phục hồi liệu , sau thời gian round hàm backupALL() gọi round có khoảng hai mươi lăm phần trăm nút rời mạng Chúng ta thay đổi liệu tập tin liệu cần backup có mạng , từ tính tốn phần trăm số lượng file tồn Kết thể đồ thị : 30 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 90 80 70 60 50 Series1 40 30 20 10 0 200 400 600 800 1000 1200 Hình : Tỉ lệ liệu phục hồi Hình , đồ thị có trục hồnh phần trăm liệu phục hồi sau chương trình mơ thực thi xong, trục tung số lượng liệu có ban đầu Từ đồ thị ta thấy , với 1000 tập tin liệu ban đầu sau chạy xong chương trình mơ số tập tin liệu phục hồi đạt 65%.Với tỉ lệ vào nút mạng hai mươi lăm phần trăm kết chương trình mơ tốt 3.2.2 Sự vào nút mạng Tiếp theo xem xét tới việc ,thời gian hai lần backup có ảnh hưởng tới khả phục hồi liệu.Cũng giống , liệu tầng mạng Chord sở vào nút không thay đổi , giải thuật phân tán thông tin IDA chia liệu thành m = 10 mảnh cần n= mảnh phục hồi liệu , số lượng liệu cố định 100 tập tin , thay đổi thời gian hai lần gọi hàm backupALL() Khi tăng thời gian hai lần gọi hàm backupALL() tăng số lượng vào nút mạng,giảm tỉ lệ giảm số lượng nút vào mạng Phía kết thu 31 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 80 70 60 50 Series1 40 30 20 10 0 10 12 Hình 10 : Độ vào nút (churn) ảnh hưởng đến tỉ lệ liệu phục hồi Trong đồ thị trên(Hình 10) , trục tung thời gian hai lần backup ,trục hoành tỉ lệ liệu cịn phục hồi chương trình mơ thực thi xong.Từ đồ thị ta thấy , thời gian hai lần backup ngắn số lượng tập tin có khả phục hồi lớn.Tuy thời gian hai lần backup cao giải pháp có khả phục hồi tương đối cao Qua thí nghiệm cho thấy việc tính tốn độ vào nút thời gian hai lần thực thi backup liệu quan trọng , điều ảnh hưởng đến tỉ lệ liệu phục hồi 3.2.3 Bảo mật Trước phân chia vào nút mạng , liệu đầu vào qua việc sử dụng giải thuật phân tán thơng tin IDA mã hóa thành mảnh backup liệu có tính bảo mật Nếu muốn lấy liệu ban đầu cần phải có giải mã giải thuật IDA với khóa phù hợp.Dữ liệu có tính bảo mật cao 32 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chương Kết luận 4.1 Kết luận Khóa luận đưa nhìn tổng quan backup liệu , mạng ngang hàng , mạng ngang hàng có cấu trúc mạng ngang hàng Chord Sau , khóa luận nói đến vấn đề backup liệu mạng ngang hàng có cấu trúc Khóa luận đưa số giải pháp có việc backup liệu mạng ngang hàng có cấu trúc, giải pháp có mặt manh mặt yếu Dựa vào số yêu cầu đưa , khóa luận đưa giải pháp nhằm tối ưu hóa việc backup liệu Giải pháp tối ưu hóa gồm có hai phần : thứ sử dụng giải thuật phân tán thơng tin IDA để mã hóa liệu , phân chia liệu thành m mảnh backup, thứ hai phân bố m mảnh backup liệu vào nút mạng có định danh tính tốn theo định danh liệu , sau phục hồi lại mảnh backup có mát vào nút mạng Giải pháp có ưu điểm giải pháp tạo liệu có tính bảo mật cao , tổng dung lượng m mảnh backup nhỏ so với phương pháp tạo m sao,do tài ngun mạng cần để lưu trữ Để đánh giá hiệu giải pháp mới, khóa luận xây dựng chương trình, mơ lại mạng liên kết vật lý, xây dựng mạng ngang hàng có cấu trúc Chord mạng vật lý ảo đó, việc thực giải pháp backup liệu Kết phép thử cho thấy, phương pháp tối ưu có làm tăng khả tồn liệu mạng, đồng thời tăng tính bảo mật liệu 4.2 Hướng phát triển đề tài Kết chương trình mơ cho thấy tiềm giải pháp lớn Tuy nhiên chương trình mơ mạng ảo , muốn đánh giá hiệu suất thực tế cần phải thử nghiệm mạng thực tế Vì thế, thời gian tới, hướng tiếp đề tài khóa luận thực thi giải pháp tối ưu mạng Internet Khi thực nghiệm mạng thực tế, có nhiều vấn đề nảy sinh : 33 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com - mạng thực tế có q trình lưu liệu tới nút rõ ràng cần phải có giao thức lấy liệu cách hợp lí - Có mát gói tin , việc thiết kế giao thức giao tiếp giao thức truyền liệu phải thật hợp lí - mạng thực tế nút tiến hành backup đồng thời lúc , nút có đồng thời nhiều q trình giao tiếp, truyền liệu Như vậy, vấn đề tồn khơng phải nhỏ Và để có kết xác, giải pháp tối ưu có ý nghĩa thực sự, làm sở xây dựng ứng dụng, cần thời gian cố gắng nhiều nhóm làm khóa luận 34 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Tài liệu tham khảo Tiếng Việt [1] Đặng Ngọc Bền Tối ưu hóa topology cho mạng ngang hàng có cấu trúc Chord [2] Wikipedia http://vi.wikipedia.org/wiki/ Mạng_đồng_đẳng English [3] Designing a DHT for low latency and high throughput Frank Dabek, Jinyang Li, Emil Sit, James Robertson, M Frans Kaashoek, Robert Morris Proceedings of the 1st conference on Symposium on Networked Systems Design and Implementation (2004) [4] Ion Stoica, Robert Morris, David Karger, M Frans Kaashoek, Hari Balakrishnan Chord: A scalable peer-to-peer lookup service for internet applications In Proceedings of the 2001 Conference on Applications, Technologies, Architectures, and Protocols For Computer Communications (San Diego, California, United States) SIGCOMM ‘01 ACM, New York, NY, 149-160 2001 35 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Phụ lục A A.1 Định dạng liệu Thông tin miền - Dòng chứa số nguyên n số lượng miền - n*(n+1)/2 dòng tiếp theo, dịng có cú pháp a b l Trong đó, a b định danh miền, l thời gian trễ liên miền hai miền a b 32 171 161 Thông tin nút - Dòng đầu số nguyên N số lượng nút tối đa - N dịng sau, dịng có cấu trúc a s Trong đó, a số nút, s định danh miền mà nút thuộc 4096 18 30 Thông tin vào (churn) Gồm nhiều dịng, dịng có cấu trúc t c a l Trong đó, t nhãn thời gian, thời điểm xảy kiện; c loại kiện, ‘b’ nút tham gia, ‘d’ nút rời khỏi mạng, giá trị ‘q’ trình churn kết thúc; a số nút; l thời gian trễ nội vùng nút 00000 b 996 00000 b 998 25 00001 b 1003 1 1678 3427259639 36 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... quan backup liệu , mạng ngang hàng , mạng ngang hàng có cấu trúc mạng ngang hàng Chord Sau , khóa luận nói đến vấn đề backup liệu mạng ngang hàng có cấu trúc Khóa luận đưa số giải pháp có việc backup. .. tối ưu hóa việc backup liệu mạng ngang hàng có cấu trúc, mạng Chord nhằm giúp việc backup liệu đạt hiệu tốt 2.1 Vấn đề cần giải Cơ chế backup liệu nhằm đem lại cho mạng ngang hàng có cấu trúc. .. lưu trữ thông tin khác , mạng ngang hàng xảy tượng mát liệu Dữ liệu bị mát q trình truyền thơng lưu trữ Ngồi đặc điểm cấu trúc mạng ngang hàng gây nên Mạng ngang hàng nói chung mạng ngang hàng