2.3.1 Tổng quan
Hệ thống phõn phối bao gồm một tập cỏc phần tử mạng thực hiện chung một quỏ trỡnh phõn phối nội dung của cỏc nhà cung cấp nội dung từ server gốc tới một hoặc nhiều server sao lưu và phõn phỏt nội dung từ cỏc server sao lưu tới cỏc client trong một mạng CDN. Quỏ trỡnh phõn phối cú thể xảy ra cả khi server sao lưu khụng nhận được yờu cầu từ cỏc client, quỏ trỡnh này được gọi là tỡm nạp trước, hoặc cú thể xảy ra khi server sao lưu nhận được yờu cầu của client mà khụng lưu giữ nội dung được yờu cầu đú, gọi là tỡm nạp theo yờu cầu.
Ngoài ra, hệ thống phõn phối truyền cả cỏc bỏo hiệu nội dung, đú là cỏc bản tin chỉ thị mục của nội dung. Vớ dụ, bỏo hiệu nội dung chỉ thị bằng server gốc cú phiờn bản mới về một số phần của nội dung.
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
Hỡnh 2.7 Quỏ trỡnh phõn phối nội dung
Hỡnh 2.8 Quỏ trỡnh phõn phỏt nội dung
Quỏ trỡnh phõn phối nội dung thực hiện di chuyển nội dung của cỏc nhà cung cấp nội dung từ server gốc của nú tới một hoặc nhiều server sao lưu (hỡnh 2.7). Cần chỳ ý rằng quỏ trỡnh phõn phối nội dung khỏc với phõn phỏt nội dung. Phõn
Computer Computer Computer CN Computer Computer Computer Computer Computer CN Server gốc CN Server gốc Mạng nội dung Server sao lưu Phõn phỏt
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
phỏt nội dung là quỏ trỡnh chuyển nội dung của cỏc nhà cung cấp nội dung tới cỏc client như trong hỡnh 2.8.
Hỡnh 2.9. Mụ tả cỏc bước phõn phối nội dung trong một mạng CDN và phõn phối giữa cỏc mạng CDN ngang cấp. Sau đõy là cỏc bước thực hiện phõn phối.
Bước 1: Server gốc cho phộp cỏc CDN ngang cấp phõn phối nội dung của nú và đặt nội dung vào hệ thống phõn phối ngang cấp của một trong cỏc CDN, ở sơ đồ là CDN2. Tồn tại hai cỏch đặt nội dung:
• Đẩy nội dung xuống trước: Nội dung, sẽ được sử dụng trong cỏc CDN, được đẩy xuống một cỏch tớch cực.
• Kộo nội dung theo yờu cầu: Nội dung được kộo theo yờu cầu từ OS khi cú một đệm bị lỗi tại server sao lưu tại cựng thời gian đối tượng
được yờu cầu.
Bước 4: Hệ thống phõn phối ngang cấp di chuyển nội dung giữa cỏc CDN ngang cấp. Nú cũng cung cấp thụng tin về cỏc vị trớ nơi mà nội dung cú mặt tới hệ
thống định tuyến ngang cấp. Hệ thống định tuyến ngang cấp thụng bỏo thụng tin này tới cỏc mạng CDN ngang cấp.
Bước 2(5): Hệ thống phõn phối ngang cấp truyền nội dung tới hệ thống phõn phối.
Bước 3(6): Hệ thống phõn phối sẽ phõn phối nội dung giữa cỏc server sao lưu trong cựng một mạng CDN.
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
Hỡnh 2.9 Phõn phối nội dung trong một mạng CDN và giữa cỏc mạng CDN ngang cấp
Cú hai phương phỏp để phõn phối nội dung tới cỏc server sao lưu đú là: sử
dụng mạng riờng ảo hoặc sử dụng mạng Internet cụng cộng
2.3.2 Mạng riờng ảo
Cỏch tốt nhất để phõn phối nội dung từ server gốc đến cỏc server sao lưu là qua một mạng riờng ảo vỡ: (i) băng thụng trong mạng riờng ảo được đảm bảo, và (ii) dung lượng mạng chỉ phục vụ lưu lượng CDN mà khụng phải chia sẻ với cỏc lưu lượng khỏc. Mạng riờng ảo cú thểđược tạo nền mạng thụng tin cụng cộng hay qua kết nối vệ tinh.
Dựng kờnh thuờ riờng để kết nối server gốc và cỏc server sao lưu là điều tốt nhất nếu khụng tớnh đến khớa cạnh giỏ thành. Kờnh thuờ riờng đảm bảo băng thụng và trễ của kết nối dành riờng tốt hơn nếu sử dụng mạng thụng tin cụng cộng (như
Internet). Kờnh thuờ riờng ở đõy cú thể là cỏc đường thuờ riờng hoặc cỏc kờnh VPN và được ISP đảm bảo về tốc độđường truyền.
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
Hệ thống phõn phối nội dung qua vệ tinh (CSDS - Content Satelite Distribution System) đó nổi lờn như là cỏc kỹ thuật tỡm nạp vào cỏc bộ nhớ đệm cỏc thụng tin mà client yờu cầu. Trong hệ thống CSDS, cỏc proxy tham gia vào hệ
thống CSDS bỏo cỏo một cỏch định kỳ tới trạm trung tõm về cỏc yờu cầu mà chỳng nhận được từ cỏc client. Sau đú, trạm trung tõm xử lý thụng tin này và lựa chọn cỏc trang web để sau đú đẩy qua quảng bỏ vệ tinh tới tất cả hoặc một số cỏc proxy. Kết quả là cỏc trang web sẽ định vị trong bộ nhớđệm nội bộ, và sẽ khụng cần được tỡm nạp nữa.
Hỡnh 2.10 Phõn phối dữ liệu vệ tinh
Hỡnh 2.10 đưa ra hoạt động phõn phối qua vệ tinh, bao gồm một tập P cỏc proxy caches, và một trạm trung tõm. Cỏc proxy tham gia vào hệ thống CSDC này bỏo cỏo theo chu kỳ tới trạm trung tõm về cỏc yờu cầu mà chỳng nhận được từ cỏc client nội bộ của nú. Trạm trung tõm xử lý thụng tin đú và sử dụng nú để dựđoỏn những trang web nào sẽ được cỏc proxy cache khỏc yờu cầu trong hệ thống trong tương lai gần. Sau đú trạm trung tõm lựa chọn một tập cỏc trang web, thường là lấy từ mạng lưới mặt đất, và sau đú "đẩy" cỏc trang web đú qua liờn kết phỏt quảng bỏ vệ tinh tới tất cả, hoặc một số cỏc proxy trong hệ thống CSDS. Kết quả
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
là, trang web sẽ định vị trong bộ nhớ đệm nội bộ, và sẽ khụng cần tỡm nạp qua mạng mặt đất nội bộ nữa.
Ưu điểm của việc phỏt quảng bỏ dữ liệu qua hệ thống phõn phối qua vệ tinh CSDS là khi dữ liệu được yờu cầu tại bất kỳ proxy nào trong hệ thống CSDS, dữ
liệu đú là khả dụng trong tất cả cỏc bộ nhớđệm. Do đú, trễđối với người sử dụng giảm đi và tiết kiệm được chi phớ băng tần (giả sử rằng chi phớ cho phỏt quảng bỏ một trang web tới K đớch là rẻ hơn việc nhận nú trờn mạng mặt đất K lần). Tuy nhiờn, ưu điểm đú cũn phụ thuộc vào việc liệu trang web đú cú thực sự cần tại proxy nhận hay khụng. Trong trường hợp mà trang web đú khụng cần thiết, thỡ khụng đạt được ưu điểm núi trờn. Thực tế, lại cú một số nhược điểm đối với hệ
thống CSDS, do trang web khụng mong muốn làm hỏng bộ nhớđệm bằng cỏch đo
đẩy tất cả cỏc trang web hiện tại đang định cư trong bộ nhớ đú, và làm cho trang web khỏc (cú thể proxy đú cần) bị xoỏ bỏ khỏi bộ nhớ đệm đú. Do vậy, việc phỏt quảng bỏ cỏc trang web qua hệ thống CSDS khụng phải luụn luụn cú lợi.
Tương tự như vậy, lợi ớch đối với một proxy tham gia vào hệ thống CSDS cú thể biến đổi, phụ thuộc vào cỏc đặc tớnh qua lại của cỏc proxy trong hệ thống. Để
chứng tỏđiều này, xem xột hai proxy A và B, cựng trong hệ thống CSDS. Nếu cỏc proxy này cựng quan tõm đến cỏc trang web giống nhau thỡ cú khả năng là chỳng sẽ được lợi từ hệ thống CSDS. Mặc khỏc, cỏc proxy A và B định vị trong hai nước khỏc nhau, khi đú sự quan tõm chớnh là trong cỏc trang web ngụn ngữ bản xứ của họ. Trong trường hợp này cỏc trang web được yờu cầu bởi cỏc proxy là tỏch biệt tốt, và sử dụng hệ thống CSDS sẽ chỉ làm cho hai proxy làm hỏng lẫn nhau.
Hệ thống phõn phối qua vệ tinh cú thể được cấu hỡnh như sau: Mỗi proxy lưu giữ cỏc đối tượng vào bộ nhớđệm là phụ thuộc vào cỏc yờu cầu nội bộ, được bởi những người sử dụng của proxy đú tạo ra. Vào lỳc nhận được một yờu cầu nội bộ
proxy sẽ kiểm tra xem liệu dữ liệu được yờu cầu cú trong bộ nhớđệm của nú kiểm tra, nếu cú nú sẽ gửi trả lại dữ liệu yờu cầu tới người sử dụng. Nếu dữ liệu được yờu cầu khụng cú trong bộ nhớ đệm nội bộ, proxy sẽ phải lấy dữ liệu đú từ mạng mặt đất, và sẽ thụng bỏo với trạm trung tõm rằng dữ liệu đú được yờu cầu và
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
khụng tỡm thấy. Sau đú, trạm trung tõm sẽ quyết định xem liệu cú thể thu nhận dữ
liệu từ mạng mặt đất khụng và phỏt quảng bỏ nú tới tất cả cỏc proxy trong hệ
thống qua liờn kết vệ tinh. Vào lỳc nhận dữ liệu từ liờn kết vệ tinh, proxy cú thể
lựa chọn hoặc là lưu giữ nú trong bộ nhớ đệm hoặc là xoỏ bỏ nú. Khụng phải tất cả cỏc proxy đều phải chất nhận tất cả dữ liệu phỏt quảng bỏ và đẩy chỳng vào bộ
nhớ đệm, cú thể thực hiện tỏch tập cỏc proxy thành một số tập con. Chỳng ta sẽ định nghĩa cỏc tập con proxy, mỗi tập con cựng quan tõm đến cỏc lớp dữ liệu giống nhau, nghĩa là chỉ những phần của mỗi lớp dữ liệu, khởi tạo tạo mỗi tập con , được phỏt quảng bỏ. Hầu hết cỏc phõn tớch của chỳng ta đều hội tụ vào một tập con proxy, nhưng được cấu trỳc theo cỏch mà cú thể xử lý nhiều tập con proxy. Mục đớch trong cỏc phana tớch là để kiểm tra cấp phỏt quảng bỏ một số trang web hoặc một lớp trong trang web (vớ dụ như tất cả cỏc trang web của xyz.com) sẽảnh hưởng đến sự thực thi của cỏc bộ nhớđệm riờng biệt. Cỏc phộp phõn tớch này tạo ra một hàm của cỏc tham số của lớp cỏc trang web, nú hỗ trợ việc quyết định trang web nào (hoặc lớp cỏc trang web nào) sẽ được phỏt quảng bỏ và trang web nào khụng được phỏt quảng bỏ.
Hai mụ hỡnh được sử dụng để phõn tớch cỏc hệ thống đệm là mụ hỡnh tham khảo Inter (IRM - Iter Reference Model). ưu điểm của chỳng là trong việc bắt giữ
cỏc vị trớ tham chiếu của cỏc yờu cầu, và cỏc tần số liờn quan của chỳng, đõy đều là cỏc thuộc tớnh quan trọng đối với tạo kiểu đệm.
2.3.3 Mạng Internet cụng cộng
Theo phương phỏp này, CDN thiết lập và duy trỡ một mạng phõn phối hỡnh cõy hoặc một mạng xếp chồng qua cơ sở hạ tầng mạng Internet hiện cú và phõn phối nội dung từ server gốc tới cỏc server sao lưu qua mạng phõn phối nội dung từ
server gốc tới cỏc server sao lưu qua mạng phõn phối cõy hay mạng xếp chồng. Lợi ớch của phương phỏp này là giỏ thành rẻ hơn nhiều so với mạng riờng ảo nếu tốc độ kết nối giữa cỏc điểm trong mạng CDN được tối ưu hoỏ một cỏch hợp lý.
Việc tối ưu hoỏ kết nối giữa cỏc điểm CDN cú thểđược thực hiện bằng cỏch sử
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
thường. Cỏc giao thức này thường nằm trờn lớp chuyển tải (transport layer) vỡ lớp chuyển tài là lớp thấp nhất cú thể tạo kết nối trong suốt giữa 2 điểm đầu cuối. ở
đõy, chỳng ta chỉ xem xột giao thức chuyển tải cho mạng Internet là TCP. Ngoài ra, cụng nghệ multicast cũng cú thể được sử dụng để làm cho quỏ trỡnh phõn phối nội dung giữa server gốc và server sao lưu sử dụng ớt tài nguyờn mạng hơn.
2.3.3.1 Tối ưu húa giao thức TCP/IP
Một số phương phỏp tối ưu hoỏ giao thức TCP là: (i) dựng chung một kết nối TCP cho nhiều kết nối tốc độ thấp, (ii) tạo nhiều kết nối TCP song song cho một kết nối tốc độ cao, và (iii) sửa đổi phương thức điều khiển tắc nghẽn.
Nếu dữ liệu trao đổi giữa cỏc điểm CDN khụng nhiều và khụng thường xuyờn thỡ cú thể gộp cỏc dữ liệu này để gửi qua cựng một kết nối TCP vỡ như vậy cú thể loại bỏ thời gian tạo kết nối TCP. Sử dụng chung kết nối TCP cũng đồng nghĩa với việc ứng dụng chạy tại cỏc điểm CDN phải sử dụng chung một cơ chế
ghộp thụng tin.
Nếu dữ liệu trao đổi giữa cỏc điểm CDN rất lớn thỡ thời gian tạo kết nối khụng cũn là vấn đề nữa. Tốc độ trao đổi dữ liệu bị hạn chế bởi giới hạn tốc độ
của cơ chếđiều khiển nghẽn và điều khiển luồng của TCP. Bằng cỏch tạo ra nhiều kết nối TCP song song, tốc độ truyền hiệu dụng giữa 2 điểm sẽ tăng lờn rất nhiều so với một kết nối TCP duy nhất. Hai điều cần chỳ ý khi sử dụng kết nối TCP song song là (i) những kết nối TCP song song khụng được gõy tắc nghẽn trờn
đường truyền, và (ii) nếu tất cả ứng dụng đều sử dụng kết nối TCP song song thỡ mạng sẽ hoạt động rất kộm hiệu quả.
Cơ chế điều khiển tắc nghẽn của TCP thường giảm tốc độ truyền mỗi khi cú mất mỏt gúi tin. Giao thức đặc biệt cho CDN cú thể giảm tốc độ truyền ớt hơn hoặc khụng giảm để tăng tốc độ truyền dữ liệu giữa cỏc điểm CDN (cỏc lưu lượng khỏc sẽ chịu ảnh hưởng tiờu cực nếu tắc nghẽn xảy ra). Tuy nhiờn, cơ chế này chỉ hoạt
động nếu khụng cú quỏ nhiều điểm sử dụng cơ chế này. Nếu cú quỏ nhiều, toàn bộ
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
sử dụng cơ chế này là ta sẽ phải sửa lại phần lừi của hệ điều hành để cú thể thay
đổi hoạt động của TCP.
2.3.3.2 Đa hướng (Multicast)
Trong nhiều trường hợp, việc phõn phối nội dung giữa cỏc điểm CDN yờu cầu quảng bỏ cựng một nội dung từ server gốc đến cỏc server thay thế. Mỗi khi nội dung trong phần đệm của server thay thếđó hết hạn, hya khi cần tiến hành sao lưu nội dung thường kỳ, một lượng lớp thụng tin sẽđược truyền từ server gốc đến cỏc server thay thế. Ngoài ra, cỏc server thay thế cũng cần gửi truy vấn (để tỡm một tệp dữ liệu nào đú) tới cỏc server thay thế khỏc,. Túm lại, một phần lớn thụng tin trao đổi giữa cỏc điểm CDN là những thụng tin quảng bỏ. CDN cú thể sử dụng cụng nghệ multicast để thực hiện việc "quảng bỏ" này hiệu quả hơn so với sử dụng nhiều kết nối điểm - điểm (unicast).
Multicast là một phương thức chuyển tải đặc biệt nhằm giỳp cho việc chuyển tải cựng một thụng tin từ một điểm đến đồng thời nhiều điểm khỏc nhau. Cỏc điểm nhận tin (nhúm multicast) được xỏc định bằng một địa chỉ multicast (địa chỉ lớp D) duy nhất. Nỳt gửi tin gửi thụng tin đến địa chỉ multicast này. Cỏc nỳt nhận tin phải "gia nhập" nhúm multicast trước khi cú thể nhận được thụng tin. Cỏc bộđịnh tuyến cú nhiệm vụ chuyển thụng tin từ nỳt gửi đến cỏc nỳt nhận tin. Thụng thường, đường truyền tin từ nỳt gửi đến cỏc nỳt nhận cú dạng hỡnh cõy cú gốc là nỳt gửi tin và toà đến cỏc nỳt nhận tin. Bộ định tuyến tại cỏc điểm rẽ nhỏnh trờn cõy cú nhiệm vụ sao thụng tin thành nhiều bản và gửi tới cỏc nhỏnh cõy đến cỏc nỳt nhận tin. Nỳt gửi tin khụng cần thiết bất kỳ thụng tin gỡ về cỏc nỳt nhận tin.
Thành phần cơ bản của cụng nghệ multicast là : (i) giao thức IGMP (Internet Group Management Protocol), (ii) giao thức định tuyến (routing protocol) và (iii) phương thức chuyển gúi tin tại bộ định tuyến (forwarding scheme). Giao thức IGMP được cỏc host cần nhận tin sử dụng để thụng bỏo với router nội vựng gia nhập một nhúm multicast - bộ định tuyến nội vựng sẽ nhận tin gửi tới nhúm multicast và chuyển thụng tin tới cỏc host này. Giao thức định tuyến được sử dụng bởi cỏc bộ định tuyến đa hướng (multicast router) để thiết lập bảng định tuyến
NGUYỄN ĐĂNG THẾ CNTT 2008-2010 TèM HIỂU VỀ CDN
multicast tại cỏc bộđịnh tuyến. Phương thức chuyển gúi tin sử dụng thụng tin trờn bảng định tuyến để thực hiện việc gửi tin tại cỏc bộ định tuyến nhằm trỏnh hiện tượng gửi tin theo vũng trũn. Cỏc giao thức định tuyến thụng dụng là DVMRP (Distance Vector multicast Routing Protoco), Mospe (multicast Open shortest Path First) và PIM (Protocol Independent Multicast).