b. Một số dịch vụ đám mây lưu trữ hiện nay
2.1.2. Lựa chọn giải pháp công nghệ
Để kho dữ liệu theo mô hình lưu trữ đám mây có thể đáp ứng mục tiêu dễ sử dụng rộng rãi, lưu trữ lượng dữ liệu lớn trong thời gian lâu dài, tiết kiệm kinh phí và khả năng chịu lỗi … tôi đề xuất việc sử dụng Hadoop – HDFS cho việc xây dựng hệ thống máy chủ để triển khai Lưu trữ đám mây, với các lợi điểm:
- Tiết kiệm kinh phí bản quyền khi được triển khai trên hệ điều hành Linux như Ubuntu, CentOS …
- Hadoop – HDFS là một mã nguồn mở uy tín trên thế giới, đã được sự ủng hộ cũng như sử dụng của Yahoo, Google, IBM …
- Tiết kiệm chi phí hạ tầng phần cứng, vì:
o Khả năng chịu lỗi trên cụm máy chủ khi phát sinh các vấn đề về hệ điều hành, lỗi phần cứng …
o Hadoop – HDFS có thể triên khai trên một cụm các máy có cấu hình thấp,c có thể tận dụng các máy để bàn cũ đã qua sử dụng … điều này đáp ứng yêu cầu và hiện trạng thực tế tại nhiều địa phương, cơ quan, trường học … ở nước ta hiện nay.
o Khả năng mở rộng lớn: Khả năng mở rộng lên tới hơn 4000 máy; Như vậy, thay vì triển khai các máy chủ với giá thành cao, ta có thể triển khai tận
31 dụng hàng trăm tới hàng nghìn các máy có cấu hình thấp (thậm chí là cụm các máy bàn đã qua sử dụng …)
- Đáp ứng lượng truy cập lớn: phân tải truy cập dữ liệu lên các máy trong cluster. Trong chương này tôi sẽ đi vào giới thiệu tổng quan về Hadoop Distributed File System và việc triển khai HDFS xây dựng kho lưu trữ dữ liệu.