Công ty cổ phần Viễn thông Fpt (Fpt Telecom) là một trong 3 công ty cung cấp dịch vụ Internet (ISP) lớn nhất Việt Nam. Hệ thống nội bộ cung cấp dịch vụ và quản lý bên trong Fpt Telecom rất phức tạp và trải dài từ Hà Nội vào Thành phố Hồ Chí Minh. Số lượng các máy chủ đang hoạt động cho các hệ thống này lên tới hàng nghìn máy và tiếp tục gia tăng liên tục theo suốt sự phát triển dịch vụ của công ty. Sự tăng trưởng liên tục gây ra một áp lực vô cùng lớn đến hạ tầng công nghệ của công ty đặc biệt là trong việc quản lý tài nguyên tính toán khi mà nhu cầu tính toán tăng nhanh hơn việc đầu tư bổ sung tài nguyên. Bên cạnh đó là các khó khăn trong việc quản lý một số lượng máy tính vật lý và thiết bị lưu trữ lớn đến hàng nghìn máy trong điều kiện chi phí đầu tư và vận hành luôn được chủ trương tiết kiệm một cách tối đa.
Từ năm 2010, để tiết kiệm chi phí đầu tư mua phần cứng và tăng năng suất phát triển của toàn hệ thống, trung tâm Nghiên cứu phát triển (RAD), Công ty Fpt Telecom đã quyết định xây dựng và triển khai một hệ thống Private cloud dựa trên nền tảng công nghệ OpenNebula nhằm giải quyết những bài toán đặt ra trong việc quản lý tài nguyên tính toán. Trong vòng 3 năm hoạt động (2010-2013) hệ thống đã đáp ứng được phần nào đó nhu cầu về cấp phát tài nguyên tính toán trong nội bộ của trung tâm và các đơn vị kĩ thuật khác.
Một vài con số về qui mô hệ thống Cloud chạy Private cloud (còn gọi là Cloud “cũ”):
- Bao gồm 12 máy chủ vật lý, 3 máy chủ Firewall và 1 Gateway.
- Hiện tại đang có 126 máy chủ ảo (VMs) trong đó có 71 máy chủ đang hoạt động cho các dịch vụ chính của công ty.
- Số lượng dịch vụ đang hoạt động trên nền tảng này chiếm hơn 50% tổng số dịch vụ của toàn bộ trung tâm RAD.
Tuy nhiên, hệ thống này gặp phải rất nhiều hạn chế được chia thành 2 nhóm chính là hạn chế về mặt kĩ thuật và hạn chế về mặt quản lý.
a. Các hạn chế về mặt kĩ thuật
- Hệ thống do không được đo đạc và giám sát kịp chặt chẽ nên không được mở rộng kịp thời. Hệ thống đã bắt đầu có dấu hiệu quá tải.
- Hệ thống chưa được tích hợp sâu vào hạ tầng mạng sẵn có của Fpt Telecom nhằm tận dụng các tính năng có sẵn hạ tầng mạng của một công ty viễn thông. Nguyên nhân là do hạn chế của bản thân giải pháp OpenNebula đang sử dụng - Việc vận hành hệ thống chưa được tự động hóa, các quá trình vận hành hàng ngày vẫn phải thực hiện thủ công.
- Hệ thống chưa khai thác được các công nghệ về mặt ảo hóa mà các giải pháp ảo hóa KVM hay VMWare đem lại.
b. Các hạn chế về qui trình quản lý
Hệ thống Cloud “cũ” không có các qui trình tiêu chuẩn về mặt giám sát và vận hành hệ thống dẫn tới rất nhiều khó khăn trong việc quản lý và vận hành hệ thống.
- Thiếu các qui trình liên quan đến hướng dẫn vận hành, quản lý, giám sát hệ thống và xử lý sự cố. Việc vận hành hệ thống được thực hiện dựa trên kinh nghiệm của người giám sát. Chính vì vậy mỗi khi có nhân sự vào ra khỏi hệ thống là việc cung cấp dịch vụ trở nên rất khó khăn.
- Thiếu các qui trình liên quan đến đảm bảo an toàn, an ninh thông tin hệ thống. Một số các sự cố liên quan đến bảo mật đã xảy ra trong quá trình vận hành hệ thống.
- Thiếu các qui trình liên quan đến quản lý thay đổi. Việc thay đổi không được phê duyệt và ghi nhận, dẫn tới rất khó theo dõi và kiểm soát các thay đổi trong suốt quá trình vận hành của hệ thống tạo nên rất nhiều điểm “đen” trên hệ thống rất khó quản lý đặc biệt là khi có sự cố xảy ra. Rất nhiều trường hợp sự cố xảy ra do việc thay đổi cấu hình hệ thống mà không được báo trước
- Không có các dự báo hoặc lập kế hoạch chuẩn bị mở rộng tài nguyên. Chính vì điều này dẫn tới việc đầu tư và mở rộng hệ thống không đồng nhất, sau một thời gian vận hành hệ thống trở nên chắp vá.
- Các công cụ quản lý tài nguyên còn nghèo nàn.
- Không có mô hình quản lý dịch vụ. Các nhóm vận hành cũng không có tư duy về cung cấp dịch vụ. Chính vì vậy dẫn tới dịch vụ được cung cấp rất tùy tiện, không có cam kết về chất lượng dịch vụ hay xử lý yêu cầu, sự cố.
Chính vì vậy đầu năm 2014, công ty Fpt Telecom đã quyết định triển khai dự án xây dựng hệ thống Private cloud mới dựa trên nền tảng công nghệ OpenStack đồng thời áp dụng ITIL vào quản lý hệ thống Private cloud nhằm giải quyết các bài toán vừa được nêu ra. Chuyển đổi từ mô hình phục vụ đơn thuần sang mô hình cung cấp theo dịch vụ có cam kết chất lượng.