Chương 2. SO SÁNH, ĐÁNH GIÁ PHƯƠNG PHÁP ƯỚC TÍNH BĂNG THÔNG TRONG MẠNG IP
2.2 ĐO DUNG LƯỢNG ĐẦU CUỐI – ĐẦU CUỐI BẰNG KỸ THUẬT CẶP GểI / CHUỖI GểI (PACKET PAIR/ PACKET TRAIN)
2.2.3 Khảo sát một số công cụ đo dựa trên kỹ thuật cặp gói/chuỗi gói
Một số công cụ đo dung lượng hoặc băng thông khả dụng của một đường mạng đầu cuối-đến-đầu cuối dựa trên kỹ thuật cặp gói/chuỗi gói được phát triển liên tục.
Điểm khác nhau cơ bản giữa các công cụ đo này là kỹ thuật lọc nhằm loại bỏ các kết quả đo không chính xác. Mà nguyên nhân chủ yếu là do tác động của các gói tin CT đến các gói dò của cặp gói/chuỗi gói.
2.2.3.1. Bprobe
Bprobe là công cụ đo băng thông cổ chai được Carter và Crovella đề xuất [3].
Bprobe gửi đi các cặp gói ICMP ECHO từ nguồn đến đích và đo thời gian đến của các gói tin phản hồi. Quá trình này được lặp lại nhiều lần (nhiều pha) với kích thước các gói dò thay đổi. Việc tăng kích thước gói dò được tính toán với hệ số luân phiên là 150% và 250% nhằm đảm bảo không có kích thước hai gói bội số nguyên lẫn nhau. Ví dụ khi tăng gấp đôi kích thước gói dò, băng thông đánh giá được khi có một gói CT kích thước x xen vào giữa hai gói dò kích thước y sẽ bằng với băng thông đo được khi xen hai gói CT kích thước x vào giữa các gói dò kích thước 2y.
Rừ ràng điều này dễ dàng dẫn đến kết quả đo sai. Như vậy việc gửi nhiều lần cỏc gòi dò với kích thước thay đổi (tăng luân phiên 150% và 250%) làm giảm xác suất các kết quả đo không chính xác. Bprobe cũng đưa ra nhận xét rằng các gói dò với kích thước lớn bao giờ cũng cho kết quả đo tốt hơn so với gói dò kích thước nhỏ.
Số lượng các kết quả đo
Tập kết quả đo 1
Tập kết quả đo 2
Hợp (tập 1, tập 2)
Giao (tập 1, tập 2)
Hình 2.6: Phương pháp lọc giao và hợp
5 4 3 2 1
5 4 3 2 1
5 4 3 2 1
5 4 3 2 1
(3,1) (3,1) (2,1) (7,2) (1,1) (3,1) (1,1)
Băng thông
Gửi đi các cặp gói dò có kích thước thay đổi nhiều pha dẫn đến các kết quả đo thì có tương quan với nhau, các kết quả đo sai thì không tương quan. Ví dụ các gói dò được gửi đi 2 pha, pha thứ nhất kích thước gói là p1, pha thứ hai kích thước gói là p2. Các gói CT đều có kích thước là x. Các kết quả đo được tạo ra bởi các chuỗi gói p1-x-p1 và p2-x-p2 sẽ nhỏ hơn dung lượng thực nhưng điều quan trọng là hai kết quả đo này khác nhau. Mặt khác các chuỗi p1-p1 và p2-p2 sẽ tạo ra các kết quả đo đúng. Các kết quả đo sai không tương quan với nhau và chúng cũng không tương quan với kết quả đo đúng. Thuộc tính này sẽ được khai thác trong phương pháp lọc giao và hợp của Bprobe. Phương pháp lọc giao (intersection) sẽ tìm các phần chồng lên nhau (overlap)của các khoảng kết quả đo và thực hiện phép giao với ý tưởng là chúng ta muốn tìm kết quả đo mà nó xuất hiện ở tất cả các pha. Phép giao đầu tiên được thực hiện giữa các kết quả đo nhận được từ gói dò có kích thước lớn nhất với các kết quả đo từ gói dò kích thước nhỏ hơn. Phương pháp lọc hợp thực hiện phép hợp các khoảng kết quả đo chồng lên nhau để chọn một khoảng đo với điều kiện khoảng đo này có chứa các khoảng (chưa thực hiện phép hợp) tạo nên nó.
Hình 2.6 là một ví dụ về phương pháp lọc giao và hợp. Hai hàng trên là các biểu đồ biểu diễn hai tập kết quả đo của hai pha. Trục hoành biểu diễn các khoảng băng thông cổ chai được đo (tăng lên từ trái sang phải) và trục tung biểu diễn số kết quả đo của mỗi khoảng. Hai hàng dưới biểu diễn các biểu đồ nhận được sau khi thực hiện phương pháp lọc giao hoặc hợp. Đôi với lọc hợp, chiều cao của cột biểu đồ kí hiệu là h và số tập kết quả đo tham gia trong phép hợp là s; chúng được biểu diễn tại mỗi khoảng kết quả đo: (h,s). Trên ví dụ hình 2.6 thì khoảng thứ tư có tổng cộng 7 kết quả và nó cũng là khoảng duy nhất xuất xứ từ 2 tập kết quả đo. Điểm giữa của khoảng này là kết quả của việc đánh giá băng thông cổ chai.
2.2.3.2 Nettimer
Công cụ Nettimer có thể hoặc để đo dung lượng từng hop dựa trên kỹ thuật đo VPS hoặc dùng để đo dung lượng đầu cuối-đến-đầu cuối dựa trên kỹ thuật cặp gói.
Chúng ta khảo sát Nettimer dựa trên kỹ thuật cặp gói.
Nettimer sử dụng thuật toán ước lượng mật độ Kernel hay còn gọi là bộ lọc Kernel để loại bỏ các mẫu kết quả đo không chính xác. Phương pháp này nhằm gán cho các mẫu kết quả đo chính xác với mức độ ưu tiên cao, các mẫu kém chính xác với mức độ ưu tiên thấp.
Hàm kernel được định nghĩa với thuộc tính: K t dt( ) 1
+∞
−∞
∫ =
Như vậy mật độ tại một mẫu đo x nhận được tại đầu thu:
1
( ) 1
.
n
i i
d x K x x
n = c x
−
= ∑ ÷
Với c là hệ số độ rộng kernel, n là số lượng các điểm bên trong c.x của x, xi là điểm thứ i. Hệ số c càng lớn thì các mẫu kết quả đo càng chính xác nhưng việc tính toán rất phức tạp. Hệ số c được lấy bằng 0.10.
Hàm Kernel được sử dụng là: 1 0
1 0
x x
y x x
+ ≤
= − >
Hàm này có thuộc tính là nó gán trọng số cao hơn cho các mẫu kết quả đo gần với các điểm mà tại đó chúng ta muốn đánh giá mật độ.
Hình 2.7 phân biệt giữa các dạng mẫu kết quả đo chỉ ra các mẫu nào sẽ được giữ lại, mẫu nào sẽ loại bỏ. Trường hợp A chỉ ra trường hợp lý tưởng của mô hình cặp gói: các gói tin được gửi đi đủ nhanh để xếp hàng tại link cổ chai và không có xếp hàng tại các tuyến sau tuyến cổ chai. Trong trường hợp này băng thông cổ chai bằng với băng thông đo được ở phía thu và chúng ta không cần thiết thực hiện việc lọc. Trường hợp B, giữa hai gói dò xuất hiện một hay nhiều gói của CT, làm cho khoảng cách giữa hai gói dò tăng lên so với khoảng cách thực gây ra bởi tuyến cổ chai. Trong trường hợp này, băng thông đo được ở phía thu nhỏ hơn băng thông cổ chai vì vậy chúng ta cần lọc bỏ kết quả này. Trường hợp C, một hay nhiều gói tin CT xếp hàng trước gói dò thứ nhất sau link cổ chai, làm cho khoảng cách giữa hai gói dò bị thu hẹp hơn so với khoảng cách gây ra bởi link cổ chai. Trong trường hợp này, băng thông phía thu đo được lớn hơn băng thông cổ chai vì vậy kết quả này cũng cần phải được lọc bỏ. Trường hợp D, phía phát không gửi hai gói dò đủ gần
nhau vì vậy chúng không xếp hàng tại link cổ chai. Trong trường hợp này, băng thông đo được ở phía thu nhỏ hơn băng thông cổ chai vì vậy các mẫu đo này cũng cần được lọc bỏ.
Để tránh trường hợp D, kỹ thuật đo cặp gói thường gửi đi các gói dò kích thước lớn với khoảng cách giữa hai gói dò rất nhỏ.
Tương tự như công cụ Bprobe, để loại bỏ tác động trong B và C, chúng ta sử dụng một nhận xét là mẫu kết quả đo bị tác động bởi CT có xu hướng không tương quan lẫn nhau trong khi đó các mẫu đo trong trường hợp A (không bị tác động bởi CT) thì tương quan lẫn nhau mạnh mẽ. Nguyên nhân là chúng ta giả thiết rằng các gói CT có kích thước ngẫu nhiên và chúng đến các link dọc theo path một cách ngẫu nhiên.
Nhận xét thứ hai là thuật toán cặp gói không thể đo băng thông cao hơn băng thông mà tại đó các gói dò được gửi đi. Đây là tính chất cơ bản của thuật toán cặp gói bất chấp kỹ thuật lọc được thực hiện như thế nào. Băng thông tại đó đầu phát gửi hai gói dò được gọi là băng thông tiềm năng bởi vì băng thông đo được không thể cao hơn nó [7]. Khi đầu phát gửi các gói dò kích thước nhỏ hoặc chậm, hoặc cả hai thì dẫn đến các kết quả đo sai: băng thông đo được có giá trị cao hơn băng thông tiềm năng. Kết quả này tương tự như trường hợp C.
Hình 2.7 Các trường hợp thay đổi khoảng lệch giữa các gói dò của cặp gói Lưu lượng cạnh tranh
Lưu lượng cạnh tranh
Hình 2.8 là một ví dụ chỉ ra phương pháp lọc bỏ các mẫu kết quả đo sai bằng bộ lọc kernel và hai nhận xét trên. Các mẫu đo được biểu diễn trên đồ thị với băng thông tiềm năng – trục x, băng thông đo được - trục y. Dựa vào nhận xét 2, chúng ta có thể loại bỏ các mẫu đo nằm trên đường y = x (trường hợp C). Các mẫu còn lại được làm phẳng phân bố và chọn lấy những điểm có mật độ cao nhất bằng công cụ lọc.
Các mẫu kết quả đo nằm trên đường y = x cho đến khi có một vài mẫu x = b.
Các mẫu này có băng thông tiềm năng xấp xỉ bằng băng thông đo được và các gói dò của các mẫu đo này không xếp hàng tại link cổ chai. Sau b thì các mẫu chạy dọc theo đường y=b. Các mẫu này có băng thông tiềm năng cao hơn băng thông đo được, các gói dò của các mẫu đo này xếp hàng tại link cổ chai. Giá trị b là băng thông thực.
2.2.3.3 Pathrate
Pathrate là công cụ đánh giá dung lượng đầu cuối – đầu cuối được phát triển bởi các tác giả Moore, Ramanathan, Dovrolis [4]. Công cụ này sử dụng nhiều cặp gói để tìm ra phân bố băng thông đa mode của kết quả đo. Bằng cách thay đổi cỡ gói dò, nó làm giảm bớt cường độ của các mode hình thành do CT. Pathrate xác định
Hình 2.8: Các mẫu kết quả đo được biểu diễn bằng giá trị băng thông đo được theo băng thông tiềm năng. Các mẫu nằm trên đường y=x được lọc bỏ
Băng thông tiềm năng (Potential bandwidth)
Băng thông đo được
x = b y = b
x = y
Mẫu kết quả đo
các mode cục bộ trong phân bố băng thông cặp gói, sau đó chọn mode cục bộ tương ứng với băng thông của path.
So với hai công cụ đo vừa được trình bày, [4] đặc biệt tập trung vào việc phân tích tác động của CT, của kích thước gói dò đến kết quả đo.
Tác động của CT đến các gói dò cặp gói:
Để tổng quát ta viết lại (2.1): ∆ =i max(γi−1,∆i−1) (2.5) Khảo sát một đường mạng bao gồm các link có dung lượng lần lượt
{ 0, ,...,1 H}
P= C C C . Hai gói dò có kích thước là L được gửi back-to-back từ nút nguồn đến nút đích trên đường mạng. Khi cặp gói đến đích, phía thu đo khoảng dịch ∆H rồi ước lượng băng thông b L= ∆H . Do ∆H thay đổi, nếu chúng ta lặp lại phép đo này nhiều lần thì các giá trị b có dạng như một phân bố β.
Đầu tiên, giả thiết rằng không có lưu lượng khác trên đường mạng. Từ (2.5) tìm được khoảng dịch ∆H tại đầu thu khi một cặp gói dò đã đi qua từng link của một
path như sau: H i= 0...H i mini 0...H{ }i n n
L L L
maxγ C C C γ
=
∆ = = = = = (2.6)
Với Cn và γn tương ứng là dung lượng và trễ truyền của narrow link. Như vậy khi không có CT thì các ước lượng băng thông bằng dung lượng. (b=C).
γ1i -1 2 t
∆ i -1
d i1 d γi
i 2
1 2
∆ i t Hop i-1
Hop i
1 2 t
∆ i -1 d i1 d i2
∆ i t
1 2
Hình 2.9: Hai trường hợp trong phương trình (2.7)
γi -1 γi -1 γi -1
γi γi
Khi
có mặt CT trên đường mạng, các gói dò sẽ chịu thêm trễ hàng đợi do CT. Gọi di1là trễ hàng đợi của gói thứ nhất tại hop i, di2là trễ hàng đợi gói dò thứ hai tại hop i sau khi gói dò thứ nhất đã được truyền xong trên link đó. Khoảng lệch sau hop i là:
( )
2 1
i 1
2 1
1
i i i i
i
i i i
d if d
d d otherwise
γ γ −
−
+ + ≥ ∆
∆ = ∆ + − (2.7)
Lưu ý rằng khi γi +di1< ∆i−1 và di2 <di1, khoảng lệch từ hop i-1 đến hop i giảm (∆ < ∆i i−1). Điều này có thể làm cho khoảng lệch tại đầu thu thấp hơn khoảng lệch tại narrow link (∆ <H L Cn), khi có các hop thêm vào phía sau narrow link. Những tuyến như vậy được gọi là tuyến post-narrow. Như vậy dung lượng của một path không thể ước lượng một cách đơn giản từ giá trị khoảng lệch nhỏ nhất đo được
(hoặc từ giá trị đo băng thông lớn nhất) bởi vì khoảng lệch nhỏ nhất đó có thể bắt nguồn từ một tuyến sau narrow link.
Để làm rừ những phõn tớch trờn, đặc biệt là cỏc thuộc tớnh của phõn bố β, chúng ta sử dụng các kết quả mô phỏng bằng công cụ Network Simulator [4]. Hình 2.10a chỉ ra các gói CT đi qua đường mạng như các gói dò, trường hợp này được gọi là CT theo đường mạng (path persistent cross traffic). Hình 2.10b biễu diễn các gói CT chỉ tác động đến các gói dò theo từng hop, trường hợp này gọi là CT theo từng hop (one-hop persistent cross traffic). Trong phần kế tiếp, chúng ta chỉ trình bày kết quả khảo sát sự tác động của CT theo từng hop.
Trước tiên, chúng ta khảo sát tác động của CT lên phân bố β của kỹ thuật cặp gói. Hình 2.11 chỉ ra biểu đồ của β của một đường mạng
{100,75,55, 40,60,80}
P= (tất cả dung lượng ở đơn vị Mbps), độ rộng của cột biểu đồ là 2Mbps. Dung lượng của đường mạng là C=40Mbps, trong khi các link post- narrow có dung lượng 60 và 80 Mbp tương ứng. Trong hình 2.10a tất cả các link có CT chiếm 20%, 2.10b CT chiếm 80%. Khi CT chiếm ít (u=20%) thì giá trị dung lượng 40Mbps chiếm đa số trong phân bố β và tạo nên kiểu dung lượng (Capacity Mode). Trong trường hợp này Capacity Mode (CM) là mode toàn cục (global mode) của phân bố. Do sự giao thoa giữa các gói CT và cặp gói dò làm cho ∆ităng lên, điều này dẫn đến sự xuất hiện các giá trị đánh giá băng thông thấp hơn CM, các giá trị này được gọi dải khoảng lệch dung lượng - phụ (Sub - Capacity Dispersion Range-SCDR). Ví dụ trong hình 2.11a, SCDR nằm giữa 10 và 40Mbps. Nguyên nhân một vài mode cục bộ xuất hiện trong SCDR sẽ được thảo luận sau.
Các giá trị ước lượng cao hơn CM xuất hiện tại các link sau narrow link khi gói dò thứ nhất trễ nhiều hơn gói thứ hai. Các giá trị này được hiểu là các mode của dung lượng các tuyến sau tuyến hẹp (Post Narrow Capacity Mode - PNCM). Lưu ý rằng PNCM ở 60Mbps là dung lượng của link chỉ nằm sau narrow link. Mode cục bộ này hình thành khi gói dò thứ nhất bị trễ đủ lâu để gói dò thứ hai được phục vụ back-to-back tại tuyến đó.
Trong trường hợp CT cao (u=80%), xác suất các gói CT giao thoa với các gói dò tăng lên, và CM không còn là mode toàn cục của phân bố β (hình 2.11b). Thay vì thế, mode toàn cục nằm ở SCDR, chiếm ưu thế trong các phép đo băng thông.
Hình 2.11a:Biểu đồ của phân bố β trong trường hợp CT thấp
Số lượng các lần đo
Băng thông (Mbps)
360
40 80 120 160 200 240 280
00 10 20 30 40 50 60 70 80
Capacity Mode (CM)
Post Narrow Capacity mode
(PNCM) u = 20%
P = { 100, 75, 55, 40, 60, 80}, L = Lc = 1500B 320
Sub Cabacity Dispersion Range (SCDR)
Hình 2.11b:Biểu đồ của phân bố β trong trường hợp CT cao
Số lượng các lần đo
Băng thông (Mbps)
160
20 40 60 80 100 120 140
00 10 20 30 40 50 60 70 80
SCDR
CM
PNCM u = 80%
P = { 100, 75, 55, 40, 60, 80}, L = Lc = 1500B
Tóm lại:Khi đường mạng mang ít CT, CM chiếm ưu thế và do đó việc đo được thực hiện dễ dàng. Trong trường hợp CT cao, SCDR chiếm ưu thế và CM chỉ là mode cục bộ. Sự xuất hiện của PNCM trong các phép đo này không đáng kể.
Hình 2.12 chỉ ra tác động của kích thước gói dò đến phân bố β, kích thước của CT Lc cố định là 1500 byte (hình 2.12a) và khi nó thay đổi trong dải [40,1500] byte (hình 2.12b). Trong trường hợp đầu kích thước gói dò L cũng là 1500 byte, trong khi ở trường hợp thứ hai L là 770 byte, có nghĩa là giá trị trung bình của dải [40,1500] byte.
Khi kích thước gói CT thay đổi trong dải [40,1500] byte (hình 2.12b), dẫn đến khoảng lệch khó dự đoán hơn vì sự giao thoa của một gói CT với cặp gói dò có thể tạo ra một dải các giá trị khoảng dịch, phụ thuộc vào kích thước gói CT Lc. Dẫu vậy CM và một vài giá trị của PNCM vẫn được phân biệt trong phân bố β.
Như vậy, chúng ta thấy rằng phân bố cặp gói β như các mode cục bộ, trong đó có một vài mode thấp hơn dung lượng (SCDR), một vài mode cao hơn dung lượng và chỉ có một là ở mode dung lượng. Vấn đề đặt ra là phát hiện mode cục bộ nào là
Hình 2.12a:Phân bố β trong trường hợp kích thước gói CT cố định
Số lượng các lần đo
Băng thông (Mbps)
160
20 40 60 80 100 120 140
0 0 10 20 30 40 50 60 70 80
SCDR CM
PNCMs P = { 100, 75, 55, 40, 60, 80}, L = Lc = 1500B
Fixed CT packet size Lc=1500byte
Hình 2.12b:Phân bố β trong trường hợp kích thước gói CT thay đổi từ 40 byte đến 1500 byte
Băng thông (Mbps)
120
80 90 100
10 40 60
0 0 10 20 30 40 50 60 70 80
P = { 100, 75, 55, 40, 60, 80}, u=50%. L=770B Variable CT packet size: Lc uniform in [40, 1500]B
20 30 50 70
SCDR
CM
PNCM
mode dung lượng. Chúng ta sẽ thảo luận vấn đề này sau khi khảo sát tác động của CT đến chuỗi gói dò.
Tác động của CT lên chuỗi gói
Trong kỹ thuật chuỗi gói đầu thu sẽ đánh giá băng thông theo phương trình (2.4): ( ) ( 1)
( )
N L
b N N
= −
∆ . Các giá trị băng thông này có dạng một phân bố theo chuỗi gói N: β( )N . Khi không có CT, băng thông đánh giá bằng với dung lượng C, như trong trường hợp gói đôi. Tham khảo một số kết quả đo ở hình 2.10 a, b, c, d chỉ ra chỉ ra tác động của N đến phân bố băng thông β( )N ; với bốn giá trị tăng dần của N trong trường hợp đường mạng mô phỏng
{100,75,55, 40,60,80}
P= với CT chiếm 80% trên tất cả các link. Từ việc xem xét các biểu đồ, rút ra những nhận xét:
• Thứ nhất khi N tăng, CM và PNCM trở nên yếu đi, cho đến khi chúng mất hẳn và SCDR chiếm ưu thế trong phân bố β( )N . Có nghĩa là khi N tăng, hầu hết các chuỗi gói dò đều chịu thêm khoảng lệch do các gói CT. Nói cách khác, giá trị tốt nhất của N để tạo ra mode dung lượng mạnh mẽ là N=2, tức là sử dụng các cặp gói.
• Thứ hai là khi N tăng, β( )N trở nên mode duy nhất. Vì thế, khi N đủ lớn, khoảng lệch của chuỗi gói không được xác định bằng các kịch bản giao thoa CT riêng biệt, như giao thoa bởi gói CT đơn kích thước x tại một link y nhưng lại được xác định bằng tổng các byte CT giao thoa với chuỗi gói dò.
• Thứ ba là dải của phân bố, mà nó liên quan với sự thay đổi các phép đo, giảm khi N tăng.
• Thứ tư là khi N đủ lớn và β( )N là mode duy nhất, trung tâm của mode này độc lập với N. Chúng ta gọi trung tâm của mode duy nhất này là tốc độ khoảng dịch tiệm cận ADR (Asympotic Dispersion Rate) R.