b. Định nghĩa về Hadoop
2.4. Triển khai cài đặt hệ thống lưu trữ đám mây với HDFS
Trong phạm vi khuông khổ luận văn chỉ tập trung vào việc kiểm thử khả năng triển khai một hệ thống đám mây lưu trữ trong thực tế. Đám mây lưu trữ được triển khai sử dụng các công nghệ:
- Hệ điều hành: sử dụng mã nguồn mở CentOS 6.5
- Phiên bản Hadoop: bản mới nhất, phiên bản Hadoop 2.7
- Sử dụng công nghệ máy ảo VMWare Workstation, với các thông số máy ảo cho việc triển khai CentOS:
41
Hình CII.IV – 1. Máy ảo HDFS
o RAM: 2GB
o Hard disk: 40 GB
o Processors: 4
Sau khi tiến hành cài đặt HDFS lên CentOS 6 và cấu hình hệ thống cho phép truy cập từ internet, ta được kết quả:
42
Hình CII.IV – 2. Giao diện HDFS
Nhận xét: việc triển khai HDFS đã đáp ứng yêu cầu về một hệ thống lưu trữ đám mây, tuy nhiên cần có những công cụ đắc lực để hỗ trợ người dùng trong việc thao tác dữ liệu cũng như tối ưu dung lượng lưu trữ trên hệ thống máy chủ.
Để tăng tính tối ưu dụng lượng khi đưa dữ liệu lên kho lưu trữ đám mây: dữ liệu cần được nén lại.
Để tăng cường khả năng bảo mật dữ liệu, xây dựng hướng lưu trữ cá nhân hóa (phục vụ cho các cá nhân, tập thể …) hệ thống xây dựng cơ chế mã hóa dữ liệu trên kho lưu trữ với các từ khóa do người dùng tự nhập vào để mã háo.
43
Hình CII.IV – 3. Mô hình xây dựng phần mềm Client tương tác HDFS
Trong các chương tiếp theo, tôi sẽ trình bầy về các giải pháp cho việc nén và mã hóa dữ liệu trước khi đưa lên đám mây lưu trữ.
44 CHƯƠNG 3. TỔNG QUAN VỀ MÃ HÓA DỮ LIỆU