3.4. So sánh kết quả thực nghiệm
Bằng việc triển khai tính năng Data Deduplication dựa trên các tệp đính kèm, chúng ta có thể thấy hMailServer sẽ tiết kiệm được không gian lưu trữ đáng kể cho máy chủ email Server.
Dung lượng tệp đính kèm trong email (1) Số lượng người nhận trong email gửi đi (2)
Dung lượng đĩa cứng dùng lưu trữ khi hMailServer chưa có tính năng deduplication (3)
Dung lượng đĩa cứng dùng lưu trữ khi hMailServer được tính hợp tính năng deduplication (4) Dung lượng cần để lưu trữ (4) giảm so với (3) 1 MB 1 1 MB 1 MB 0 % 1 MB 10 10 MB 1 MB 90 % 10 MB 1 10 MB 10 MB 0 % 10 MB 10 100 MB 10 MB 90 % 10 MB 50 500 MB 10 MB 98 % X (MB) Y X * Y (MB) X (MB) (1 – 1/Y) %
Như tính toán gần đúng ở bảng trên, dung lượng đĩa cứng trên máy chủ hMailServer dùng để lưu trữ sẽ tiết kiệm được (1-1/Y) % so với thông thường. Trong đó, Y là số lượng người nhận trong email gửi đi. Nếu số lượng người nhận càng lớn thì càng tiết kiệm không gian lưu trữ dữ liệu so với thông thường.
Việc tiết kiệm không giảm lưu trữ cho máy chủ sẽ giúp cho bất kỳ một tổ chức nào khi triển khai hệ thống email có thể tiết kiệm nhiều chi phí từ việc đầu tư thiết bị phần cứng, trang bị hạ tầng vật lý như thiết bị điện, không gian đặt thiết bị. Ngoài ra, việc vận hành, bảo trì, sao lưu hệ thống cũng được cải thiện do lượng dữ liệu truyền đi trên mạng được giảm thiểu đáng kể.
Như vậy, việc ứng dụng thành công kỹ thuật Data Deduplication trong hệ thống hMailServer nói riêng và các hệ thống lưu trữ dữ liệu nói chung chắc chắn sẽ đem lại một lợi ích to lớn cho người dùng và các nhà cung cấp dịch vụ. Tùy theo từng ứng dụng cụ thể trong thực tế mà chúng ta có thể lựa chọn các công nghệ phù hợp nhất để triển khai nhằm đem lại hiệu quả tối đa về chi phí và tăng hiệu năng hoạt động của hệ thống.
Luận văn đã thực hiện được các nội dung chính:
- Nắm được tổng quan về kỹ thuật Data Deduplication, tổng quan về email và mỗi tương quan giữa email với Data Deduplication.
- Các phương thức xử lý Data Deduplication nói chung và đề xuất giải pháp cho việc xử lý dữ liệu trùng lặp trong hệ thống email.
- Trình bày tổng quan về máy chủ hMailServer và mở rộng tính năng Data Deduplication cho hệ thống hMailServer.
- Đánh giá ở mức cơ bản về hiệu quả của kỹ thuật Data Deduplication khi triển khai cho hệ thống hMailServer so với hệ thống khi hoạt động thông thường. Tuy nhiên, do khả năng tìm hiểu và kiến thức của bản thân có hạn nên bên cạnh những kết quả đạt được, luận văn vẫn còn có những mặt hạn chế nhất định:
- Kịch bản triển khai hiện chỉ xử lý được dữ liệu dư thừa ở mức cơ bản nhất, chưa xử lý được mọi vấn đề về chống trùng lặp dữ liệu trong hệ thống hMailServer.
- Trong trường hợp sử dụng máy chủ email không phải phần mềm hMailServer, cần phải có sự phân tích kỹ lưỡng để có được giải pháp chống trùng lặp dữ liệu phù hợp với mỗi máy chủ email. Kịch bản triển khai trong luận văn cho máy chủ hMailServer không thể áp dụng đồng nhất cho tất cả các máy chủ email khác.
