CHƯƠNG 3 : CƠ SỞ LÝ THUYẾT
3.1 Tổng quan về Content Delivery Network
3.1.1 Khái niệm
Trong mơ hình mạng truyền thống, tất cả yêu cầu từ người dùng sẽ được phục vụ bởi một máy chủ hay một data center của nhà cung cấp nội dung. Khi nhu cầu, số lượng người dùng trở nên ngày càng lớn, kiến trúc truyền thống và cơ sở hạ tầng mạng khó có thể đem lại chất lượng dịch vụ tốt và ổn định. Mơ hình mạng CDN ra đời nhằm phục vụ cho nhu cầu này. Doanh nghiệp sử dụng dịch vụ CDN để giảm traffic nội mạng, giảm độ trễ của dịch vụ, tăng tính ổn định và cải thiện trải nghiệm của người dùng. Khi người dùng yêu cầu một nội dung, thay vì yêu cầu này sẽ được gửi từ một máy chủ của nhà cung cấp, nó sẽ được gửi từ các replica server của hệ thống
CDN. Nội dung sẽ được cache trong một hay nhiều replica servers của CDN.
3.1.2 Các đối tượng chính
Có 4 đối tượng chính trong một mơ hình kinh doanh của hệ thống CDN gồm: Người dùng cuối: Người sử dụng dịch vụ từ nhà cung cấp nội dung. Họ
thường sẽ trả tiền theo tháng để truy cập internet hay các dịch vụ OTT, VoD,... Một trong những mục tiêu tiên quyết khi nghiên cứu hệ thống CDN là cải thiện trải nghiệm ở người dùng cuối.
Nhà cung cấp nội dung: cung cấp dịch vụ cho khách hàng mà không cần phải
thông qua các giao dịch, hợp đồng phức tạp với nhà mạng ISP. Hơn thế nữa, họ thường khơng muốn tốn nhiều chi phí cho cơ sở hạ tầng, gia tăng chất lượng dịch vụ và duy trì tính độc quyền với khách hàng.
Nhà cung cấp dịch vụ CDN: cung cấp cơ sở hạ tầng CDN (máy chủ và có thể
cả hạ tầng mạng) và có những hợp đồng ràng buộc về chất lượng với nhà cung cấp nội dung.
Nhà mạng ISP: chủ yếu nhận tiền từ người dùng cuối và có thể cả từ nhà cung
cấp dịch vụ CDN. Họ muốn duy trì và cân bằng chi phí cơ sở hạ tầng và chất lượng mạng để có thể cạnh tranh với các nhà mạng khác.
3.1.3 Phân loại
Tùy thuộc vào cách triển khai và mơ hình kinh doanh, các hệ thống CDN được phân loại thành ba nhóm chính:
Hệ thống CDN truyền thống: Hình 1 minh họa cho mơ hình CDN truyền
thống. Trong mơ hình mạng CDN này, các replica server của hệ thống CDN sẽ đặt tại một hay nhiều trung tâm dữ liệu. Mỗi trung tâm dữ liệu Point-of-Present (PoP) sẽ kết nối trực tiếp với routers thuộc nhà mạng ISP. Mỗi PoP sẽ phục vụ cho một khu vực “district” nhỏ gồm một cụm nhỏ các người dùng cuối. Các request trong một “district” chỉ được phục vụ bởi 1 PoP riêng thuộc “district” đó. Nhà cung cấp nội dung sẽ thuê và trả tiền cho nhà cung cấp dịch vụ CDN để cải thiện dịch vụ của họ. Hợp đồng giữa 2 bên thường sẽ có những cam kết về chất lượng dịch vụ tối thiểu.
Hình 1: Mơ hình CDN truyền thống
Hệ thống cloud CDN: Hiện này, có rất nhiều nền tảng lớn cung cấp dịch vụ
cloud CDN nổi tiếng như Akamai, CloudFront, Google Cloud, Amazon AWS,... Các nhà cung cấp nội dung sẽ thuê dịch vụ cloud từ các nền tảng này để phục vụ cho nhu cầu của họ. Tùy thuộc vào chính sách của các cơng ty cung cấp nền tảng CDN mà họ sẽ có các cách tính chi phí khác nhau. Những mục chi phí thường được tính khi cung cấp dịch vụ CDN của các nền tảng là số lượng máy, dung lượng lưu trữ của mỗi máy, lưu lượng traffic,... Cách tính chi phí cho những mục này thường sẽ khác nhau cho từng khu vực. Trong mơ hình này, mỗi “region” sẽ gồm nhiều “district”. Các “region” sẽ được phục vụ bởi các data center trong khu vực của nhà cung cấp dịch vụ cloud. Hình 2 minh họa mơ hình cloud CDN.
Hình 2: Mơ hình cloud CDN
Hệ thống Telco CDN: Khi nhà cung cấp dịch vụ CDN sở hữu hoặc có thể chia
sẻ cơ sở hạ tầng mạng của nhà mạng ISP, hệ thống CDN có thể được triển khai ngay trên cơ sở hạ tầng này. Hình 3 mơ tả mơ hình Telco CDN. Trong mơ hình này, các replica server có thể kết nối trực tiếp với các routers của nhà mạng
ISP. Việc tận dụng cơ sở hạ tầng của nhà mạng ISP giúp giảm chi phí đầu tư, tăng hiệu quả của hệ thống CDN.
3.1.4 Các bài toán con trong chiến lược caching của hệ thống CDN:
Chiến lược caching của một hệ thống CDN có thể được chia thành ba bài toán con nhỏ hơn như sau:
Bài toán eviction: Là bài toán xác định khi nào và nội dung gì trong cache sẽ
được xóa.
Bài toán admission: Là bài toán xác định nội dung nào sẽ được cache. Thông
thường nhà cung cấp nội dung nếu muốn hệ thống CDN cache một nội dung, họ sẽ thêm vào 1 trường trong phần header của gói tin chứa nội dung để đánh dấu việc cache gói tin đó. Luận văn này khơng đề cập đến chiến lược admission trong mơi trường thí nghiệm nghĩa là các replica servers sẽ cache tất cả nội
dung mới.
Chiến lược định tuyến gói tin: Là bài tốn xác định khi một nội dung khơng
có trong một replica servers thì server đó nên chuyển hướng u cầu đó đến server nào kế tiếp.