Mối tương quan giữa các yếu tố kỹ thuật của công nghệ Deduplication

Một phần của tài liệu (LUẬN văn THẠC sĩ) phát triển tính năng loại bỏ dữ liệu trùng lặp (data deduplication) cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm HMailServer (Trang 28 - 29)

Theo Hình 2.1, có thể phân lớp các yếu tố kỹ thuật như sau:

- Kiểu ứng dụng (Point of Application): Source và Target

- Thời điểm (Time of Application):Inline và Post-Process

- Mức độ chi tiết (Granularity): File và Sub-File level

- Thuật toán (Algorithm): Fixed-size blocks và variable length data

segments

2.1.1. Source và Target Deduplication

Kỹ thuật Data Deduplication được lựa chọn thực hiện theo một trong hai cách: thực hiện bởi các phần mềm chạy trên máy tính (tại nguồn – Source Deduplication)

hoặc thực hiện tại các thiết bị lưu trữ dữ liệu cần sao lưu (tại đích – Target Deduplication).

2.1.1.1. Source Deduplication

Trong trường hợp Source Deduplication, các bản sao dữ liệu trùng lặp sẽ được loại bỏ trước khi được gửi đến hệ thống sao lưu. Ưu điểm của kỹ thuật này là giảm được băng thông và thời gian cần thiết cho việc sao lưu dữ liệu. Tuy nhiên, nhược điểm là tiêu thụ nhiều tài nguyên của bộ xử lý tại nguồn dữ liệu ban đầu và sẽ khó khăn để tích hợp với các hệ thống hoặc ứng dụng đã có sẵn. Kỹ thuật Source Deduplication sử dụng phần mềm được cài đặt trên máy tính để loại bỏ dữ liệu trùng lặp. [1],[5],[16]

Lauren Whitehouse, một nhà phân tích cao cấp của Enterprise Strategy Group, đã nhận xét rằng kỹ thuật Source Deduplication là rất thích hợp cho việc sao lưu các dữ liệu từ xa và nhỏ. Ngoài ra, ông Whitehouse cũng cho rằng môi trường ảo hóa là trường hợp hiệu quả cho việc sử dụng Source Deduplication vì một lượng lớn các dữ liệu dư thừa trong các tập tin đĩa cứng của máy ảo. Tuy nhiên, nếu có nhiều máy ảo cùng được chia sẻ tài nguyên từ một máy vật lý thì việc chạy nhiều tính toán hàm băm (hash) tại cùng một thời điểm có thể dẫn đến quá tải cho các tài nguyên của máy chủ vật lý. [5]

Một phần của tài liệu (LUẬN văn THẠC sĩ) phát triển tính năng loại bỏ dữ liệu trùng lặp (data deduplication) cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm HMailServer (Trang 28 - 29)

Tải bản đầy đủ (PDF)

(77 trang)