b, Phương thức hoạt động
2.5.1. Kiến trúc trung tâm dữ liệu
- Các thiết kế trung tâm dữ liệu được các cơng ty giữ bí mật rất cẩn thận vì nó thường cung cấp lợi thế cạnh tranh quan trọng cho các cơng ty điện tốn đám mây hàng
đầu. Chi
phí cho mạng trung trâm dữ liệu rất lớn cỡ khoảng chục triệu đến trăm triệu USD. Trong
đó khoảng 45% có thể là do chính vật chủ (cần được thay thế 3-4 năm một lần);
25% đến
cấu trúc cơ sở hạ tầng, bao gồm máy biến áp, hệ thống cung cấp điện liên tục
(UPS), máy
phát điện khi mất điện trong thời gian dài và hệ thống làm mát; 15% cho chi phí
điện cho
việc rút điện; và 15% cho mạng, bao gồm cả thiết bị mạngbộ chuyển mạch, bộ định tuyến
+ Lưu lượng giữa các máy bên trong.
- Để xử lý các luồng giữa các máy khách bên ngoài với máy chủ nội bộ, mạng trung
tâm dữ liệu bao gồm một hoặc nhiều bộ định tuyến biên giới, kết nối mạng trung
tâm dữ
liệu với Internet công cộng. Do đó, mạng trung tâm dữ liệu kết nối các giá đỡ với
nhau và
kết nối các giá đỡ với các bộ định tuyến biên giới. Hình 2.6.1 cho thấy một ví dụ về mạng
trung tâm dữ liệu.
* Cân bằng tải:
- Một trung tâm dữ liệu lớn thường sẽ có một số bộ cân bằng tải, mỗi bộ dành cho
một
tập hợp các ứng dụng đám mây cụ thể. Bộ cân bằng tải như vậy đơi khi được gọi là “cơng
tắc lớp 4” vì nó đưa ra quyết định dựa trên số cổng đích (lớp 4) cũng như địa chỉ IP đích
trong gói. Khi nhận được yêu cầu cho một ứng dụng cụ thể, bộ cân bằng tải sẽ
chuyển tiếp
nó đ ến một trong các chủ xử lý ứng dụng (Một máy chủ sau đó có thể gọi các dịch vụ
của các máy chủ khác để giúp xử lý yêu cầu).
- Bộ cân bằng tải cung cấp một chức năng giống như NAT, dịch địa chỉ IP bên ngồi
cơng khai sang liên Địa chỉ IP của máy chủ lưu trữ thích hợp, và sau đó dịch ngược
lại cho
các gói đi theo hướng ngược lại trở lại máy khách. Điều này ngăn không cho máy khách
liên hệ trực tiếp với máy chủ, điều này có lợi ích bảo mật là ẩn cấu trúc mạng nội
bộ và
ngăn máy khách tương tác trực tiếp với máy chủ.
* Kiến trúc phân cấp:
- Để mở rộng quy mô hàng chục đến hàng trăm hàng nghìn máy chủ, một trung tâm
dữ
+ Ở trên cùng của hệ thống phân cấp, bộ định tuyến biên giới kết nối với bộ định tuyến truy cập (có thể có nhiều bộ định tuyến)
+ Bên dưới mỗi bộ định tuyến truy cập, có ba cấp cơng tắc. Mỗi bộ định tuyến truy cập kết nối với một công tắc cấp cao nhất và mỗi công tắc cấp cao nhất kết nối với nhiều công tắc cấp hai và một bộ cân bằng tải.
+ Mỗi công tắc bậc hai lần lượt kết nối với nhiều giá đỡ thông qua các công tắc TOR
của các giá đỡ (công tắc bậc ba).
+ Tất cả các liên kết thường sử dụng Ethernet cho các giao thức lớp liên kết và lớp vật lý, với sự kết hợp của cáp đồng và cáp quang. Với thiết kế phân cấp như vậy, có thể mở
- Mạng trung tâm dữ liệu đang phát triển nhanh chóng, với xu hướng được thúc đẩy bởi giảm chi phí, ảo hóa, hạn chế vật lý, mơ-đun và tùy chỉnh.
* Giảm chi phí:
- Để giảm chi phí của các trung tâm dữ liệu, đồng thời cải thiện độ trễ và hiệu suất thông lượng của chúng, cũng như dễ dàng mở rộng và triển khai, các gã khổng lồ
trên đám
mây Internet đang liên tục triển khai các thiết kế mạng trung tâm dữ liệu mới.
Hình 2.31
- Hình 2.31 minh họa một trong những xu hướng quan trọng nhất trong mạng trung
tâm dữ liệu - sự xuất hiện của mạng phân cấp, phân cấp kết nối các máy chủ trung
tâm dữ
liệu. Cấu trúc phân cấp này về có nhiệm vụ giống như một công tắc thanh ngang
lớn ho
phép bất kỳ máy chủ nào trong trung tâm dữ liệu giao tiếp với bất kỳ máy chủ nào khác.
* Kiểm soát và quản lý SDN tập trung:
- Trung tâm dữ liệu được quản lý bởi một tổ chức duy nhất, có lẽ là một số nhà khai thác trung tâm dữ liệu lớn nhất bao gồm như Google, Microsoft và Facebook...
đang áp
dụng khái niệm kiểm soát tập trung về mặt logic giống như SDN.
- Kiến trúc của chúng cũng phản ánh sự tách biệt rõ ràng giữa mặt phẳng dữ liệu (bao gồm các cơng tắc hàng hóa tương đối đơn giản) và mặt phẳng điều khiển dựa trên phần
mềm
vật lý. Việc tách này cũng cho phép di chuyển liền mạch các máy ảo giữa các máy
chủ vật
chuyển
động của các máy ảo trong khi duy trì kết nối mạng hoạt động trên các máy chủ. . Vì tất cảcác mạng trung tâm dữ liệu đều được quản lý bởi một cơ quan quản trị duy
nhất, một giải
pháp hữu ích cho vấn đề là coi tồn bộ mạng trung tâm dữ liệu như một mạng đơn, phang,
lớp 2.
- Để mô phỏng hiệu ứng của việc tất cả các máy chủ kết nối với một công tắc “duy
nhất”, cơ chế ARP được sửa đổi để sử dụng hệ thống truy vấn kiểu DNS thay vì chương
trình phát sóng và thư mục duy trì ánh xạ địa chỉ IP được gán cho một máy ảo và
vật lý
chuyển đổi máy ảo hiện đang được kết nối với mạng trung tâm dữ liệu.
* Ràng buộc vật lý:
- Mạng trung tâm dữ liệu hoạt động trong mơi trường khơngchỉ có dung lượng rất cao
(liên kết 40 Gbps và 100 Gbps hiện đã trở nên phổ biến) mà cịn có độ trễ cực kỳ thấp
(micro giây). Do đó, kích thước bộ đệm là các giao thức kiểm soát tắc nghẽn và nhỏ như
TCP và các biến thể của nó khơng mở rộng quy mơ tốt trong các trung tâm dữ liệu
- Trong trung tâm dữ liệu, các giao thức kiểm soát tắc nghẽn phải phản ứng nhanh và hoạt động ở chế độ tổn thất cực kỳ thấp, vì thời gian chờ và khơi phục tổn thất có
thể dẫn
đến việc cực kỳ kém hiệu quả.
* Mơ-đun và tùy chỉnh phần cứng:
- Một xu hướng chính khác là sử dụng các trung tâm dữ liệu mô-đun dựa trên Container
(MDC). Trong MDC, một nhà máy xây dựng, trong một container vận chuyển tiêu chuẩn
dài 12 mét, một "trung tâm dữ liệu mini" và vận chuyển container đến vị trí trung
tâm dữ
liệu. Mỗi container có đến vài nghìn host, xếp thành hàng chục giá đỡ, xếp san sát nhau
Một khi một container đúc sẵn được triển khai tại trung tâm dữ liệu, nó thường khó bảo trì.
- Do đó, mỗi vùng chứa được thiết kế để giảm hiệu suất một cách dễ dàng: khi các
thành phần (máy chủ và thiết bị chuyển mạch) bị lỗi theo thời gian, vùng chứa tiếp
tục hoạt
động nhưng với hiệu suất bị suy giảm. Khi nhiều thành phần bị lỗi và hiệu suất
giảm xuống
dưới ngưỡng, toàn bộ vùng chứa sẽ bị loại bỏ và thay thế bằng một hộp mới.
- Một xu hướng quan trọng khác là các nhà cung cấp đám mây lớn đang ngày càng
xây
dựng hoặc tùy chỉnh mọi thứ có trong trung tâm dữ liệu của họ, bao gồm bộ điều
hợp mạng,
bộ định tuyến chuyển mạch, TOR, phần mềm và giao thức mạng. ột xu hướng khác, do
Amazon tiên phong, là cải thiện độ tin cậy với "vùng khả dụng", về cơ bản tái tạo
các trung
tâm dữ liệu riêng biệt trong các tòa nhà lân cận khác nhau. Bằng cách đặt các tịa
nhà gần
đó (cách nhau vài km), dữ liệu chuyển đổi có thể được đồng bộ hóa giữa các trung
tâm dữ
liệu trong cùng một vùng khả dụng đồng thời cung cấp khả năng chịu lỗi [Amazon 2014].
Giao thức nào có liên quan đến việc đáp ứng ngay cả yêu cầu đơn giản nhất: tải xuống một trang Web. Hình 2.32 minh họa cài đặt: một sinh viên, Bob, kết nối máy tính xách tay với Ethernet switch của trường và tải xuống một trang Web (giả sử trang chủ của www.google.com). Như chúng ta đã biết hiện nay, có rất nhiều điều đang diễn ra "bí mật" để đáp ứng yêu cầu tưởng chừng đơn giản này.
Hình 2.32: Vịng đời của một u cầu trang web: Cấu hình mạng và các hoạt động