Kỹ thuật điều khiển tắc nghẽn FATE

Kỹ thuật thiết kế lƣu lƣợng nhanh (FATE) đƣợc đề xuất để điều khiển tắc nghẽn trong một mạng MLPS. LER (bộ định tuyến cạnh nhãn) vào và LSR lõi phản hồi thông tin thu đƣợc từ mạng về các luồng bị mất gói đáng kể, bằng cách thực hiện gần đúng hoạt động sửa lỗi, nghĩa là, định tuyến lƣu lƣợng khỏi LSR bị tắc nghẽn tới luồng xuống hoặc luồng lên sử dụng các LSR. [6]

FATE cung cấp một cơ cấu hoạt động nhanh quan trọng. Nó cho phép những LSP riêng biệt đƣợc xắp xếp lại một cách linh hoạt tới những bộ đệm QoS cung cấp một lớp dịch vụ cao hơn dọc theo một đƣờng dẫn đã đƣợc chỉ định trong việc đối phó với tình huống tăc nghẽn trong thời gian ngắn.

Theo đó cơ cấu lập lịch đang tồn tại WFQ (Weighted fair queuing-hàng đợi công bằng có gia trọng) cung cấp một số lƣợng bộ đệm cho những luồng lƣu lƣợng với sự ràng buộc QoS khác nhau. Lƣợng thời gian mà ngƣời lập lịch dành cho mỗi bộ đệm là phụ thuộc vào giới hạn xác xuất tổn thất đã đƣợc định trƣớc cho QoS của bộ đệm đó và tận dụng sự dự phòng hiện tại của nó. [6]

33 platinum gold silver bronze Hình 17: Cấu hình bộ đệm [6] 2.2.2. Kỹ thuật chọn đƣờng cơ sở

Đây là một giải thuật và khung thực hiện chức năng chọn đƣờng bảo đảm băng thông cho các luồng, ý tƣởng chính của giải thuật là sử dụng “Mô tả sơ lƣợc lƣu lƣợng” của mạng đang tồn tại bởi phép đo hoặc sự thoả thuận mức dịch vụ (SLA), nhƣ một sự dự báo trƣớc của phân phối lƣu lƣợng tƣơng lai. Giải thuật này có hai bƣớc thực hiện: Bƣớc xử lý trƣớc; Bƣớc chọn đƣờng trực tuyến.

Giải thuật sử dụng “Mô tả lƣu lƣợng” trong bƣớc xử lý trƣớc (tính toán trƣớc đa luồng) để xác định sự định vị băng thông nhất định trên những mối liên kết của mạng. Thực hiện từng bƣớc của giải thuật chọn đƣờng sau đó yêu cầu sử dụng một “đƣờng dẫn ngắn nhất“ với thông tin bổ xung do bƣớc xử lý trƣớc đƣa ra. Bƣớc đa xử lý trƣớc cho phép giải thuật trực tuyến thực tập điều khiển thu nạp bởi việc loại bỏ yêu cầu nào đó do những hiệu ứng khoá, chặn, kết khối trong mạng.

2.2.3. Kỹ thuật chọn lọc đƣờng dẫn dựa trên sự đảm bảo băng thông

Giới thiệu một sự đánh giá có hệ thống bốn giải thuật chọn đƣờng mà yêu cầu tradeoffs khác nhau giữa giới hạn đếm bƣớc nhảy đƣờng dẫn và cân bằng tải mạng.

Bốn giải thuật chọn đƣờng nhƣ sau [7,8]:

- Đƣờng dẫn rộng nhất - ngắn nhất: Một đƣờng dẫn với số bƣớc nhảy ngắn tối thiểu giữa tất cả các đƣờng dẫn khả thi. Nếu có vài đƣờng dẫn nhƣ vậy, thì đƣờng dẫn có khả năng dự trữ bandwidth đƣợc lựa chọn.

cả các đƣờng dẫn khả thi. Nếu có vài đƣờng dẫn nhƣ vậy thì đƣờng dẫn với số bƣớc nhảy ngắn tối thiểu đƣợc lựa chọn.

- Đƣờng dẫn khoảng cách ngắn nhất: Một đƣờng dẫn khả thi với khoảng cách ngắn nhất.

- Chọn đƣờng thay thế: n đếm số bƣớc nhảy ngắn của một đƣờng dẫn, bƣớc nhảy ngắn tối thiểu khi nào mạng nhàn rỗi. Một đƣờng dẫn thay thế động là một đƣờng dẫn rộng nhất - ngắn nhất với không hơn n+1 bƣớc nhảy ngắn.

Những kết quả từ sự mô phỏng cho thấy rằng một giải thuật chọn đƣờng dựa trên sự đếm bƣớc nhảy ngắn giới hạn đƣợc ƣu tiên thực hiện tốt hơn khi mạng tải lớn, trong khi giải thuật giữ cân bằng tải mạng ƣu tiên thực hiện tốt hơn khi mạng tải nhỏ.

2.3. Bảo vệ và khôi phục đƣờng trong MPLS 2.3.1. Sự cần thiết của bảo vệ và khôi phục đƣờng 2.3.1. Sự cần thiết của bảo vệ và khôi phục đƣờng

Nguyên nhân xảy ra sự cố trong mạng có thể đến từ nhiều nguyên nhân khác nhau: đƣờng truyền dẫn bị đứt, hiệu năng của các nút mạng bị quá tải, tài nguyên mạng không đủ dẫn đến tác nghẽn,… Những nguyên nhân này dẫn đến chất lƣợng mạng giảm sút do tình trạng mất gói và các hậu quả khác đi kèm có thể gây ảnh hƣởng tới một vùng hoặc toàn bộ mạng. Sự cố mạng có thể gom nhóm thành 2 loại:

 Sự cố liên kết đƣờng truyền  Sự cố thiết bị.

Với mạng thông thƣờng, để khắc phục các sự cố này đều sử dụng các định tuyến IGP để thích nghi và khắc phục sự cố mạng sau khi gặp sự cố. Khoảng thời gian từ lúc bắt đầu phát hiện sự cố đến khi sự cố đƣợc khắc phục hoàn toàn gọi là đƣợc gọi là quá trình hội tụ. Thời gian hội tụ này càng thấp thì số lƣợng gói tin mất đi trong khi gặp sự cố là càng ít. Do đó, tỷ lệ mất gói là một tham số quan trọng trong việc đánh giá chất lƣợng, năng lực mạng. Trên thực tế, các giao thức định tuyến IDP đã bộc lộ một số nhƣợc điểm sau:

 Khi một liên kết bị đứt dẫn đến tắc nghẽn nội bộ tại một số khu vực. Tuy nhiên các khu vực khác trong mạng lại không đƣợc sử dụng, do đó dẫn đến tình trạng lãng phí tài nguyên mạng.

 Thời gian hội tụ khá lớn đối với Topo mạng phức tạp, trong thời gian hội tụ mất gói xảy ra.

 Nếu cấu hình giảm thời gian hội tụ xuống thấp thì có thể làm cho mạng quá nhạy cảm với các sự cố nhỏ nhƣ tình trạng liên kết bị “flapping” (tình trạng liên kết bị up/down liên tục). Khi hiện tƣợng này xảy ra, các thuật toán định tuyến dạng Link-State nhƣ OSPF/IS-IS, thuật toán SPF sẽ đƣợc tiến hành. Do đó nếu hiện tƣợng flapping kéo dài thì sẽ rất ảnh hƣởng đến hiệu năng của các nút, từ đó dẫn đến tình trạng mất ổn định mạng

Trong mạng MPLS, giao thức định tuyến nội miền là cần thiết. Do đó sẽ rất tồi tệ nếu để hiện tƣợng này xảy ra. Khi gặp một sự cố, nếu không có các cơ chế bảo vệ khôi phục đƣờng thì toàn mạng sẽ thực thi những thao tác sau để tiến hành khôi phục:

1. Khi một kết nối trên đƣờng truyền gặp sự cố, các LSP thông thƣờng tƣơng ứng với liên kết có sự cố sẽ bị hủy, thuật toán SPF sẽ phải thi hành lại để tính toán lại các bảng định tuyến, giao thức LDP thực hiện gắn nhãn lại cho các LSP mới.

2. Các LSP ràng buộc với liên kết gặp sự cố cũng sẽ bị hủy, các router biên ngõ vào (Headend-LSR) có các LSP ràng buộc bị hủy phải thi hành lại thuật toán CSPF để tính toán đƣờng LSP ràng buộc mới.

3. CR-LDP/RSVP-TE phải thực hiện thiết lập và báo hiệu LSP ràng buộc mới

4. Headend-LSR phải thực thi phƣơng thức ghép lƣu lƣợng của trung kế lƣu lƣợng lên LSP ràng buộc mới (thi hành SPF nếu sử dụng Autoroute Announce)

Các thao tác làm việc nhƣ trên sẽ dẫn đến thời gian hội tụ trong miền MPLS lớn hơn thời gian hội tụ trong mạng IP truyền thống. Do đó các cơ chế bảo vệ, khôi phục trong MPLS là rất cần thiết để đảm bảo chất lƣợng cũng nhƣ độ tin cậy của mạng mà trong đó tham số tỷ lệ mất gói ở mức tối thiểu đƣợc ƣu tiên cao nhất.

Các cơ chế bảo vệ và khôi phục xuất hiện nhằm khắc phục hoặc giảm thiểu sự ảnh hƣởng xấu của các sự cố lên toàn mạng MPLS. Cũng nhờ các cơ chế này mà chất lƣợng mạng cũng nhƣ độ tin cậy của MPLS đƣợc nâng cao hơn. Nhƣ ta đã biết, các gói tin khi đi vào miền MPLS sẽ đƣợc gãn nhãn và chuyển đi trong các đƣờng dẫn LSP, khi có sự cố xảy ra tại các nút và liêt kết của một LSP thì LSP đó sẽ không thể tiếp tục

chuyển tiếp gói tin đến đích bình thƣơng. Do đó, nguyên tắc đặt ra cơ bản cho các cơ chế bảo vệ, khôi phục là phải tức thì thay đổi/chuyển hƣớng lƣu lƣợng sang một LSP có ràng buộc khác để đảm bảo chất lƣợng dịch vụ của mạng cũng nhƣ độ chính xác của thông tin truyền đi. Một số khái niệm đƣợc nhắc đến trong phần này nhƣ sau:

- Đƣờng làm việc: Là đƣờng LSP truyền các gói tin (đã gán nhãn) trƣớc khi xảy ra sự cố mạng. Các cơ chế bảo vệ sinh ra để bảo vệ cho đƣờng này.

- Đƣờng khôi phục: Là đƣờng LSP đƣợc tái định tuyến sau khi xảy ra sự cố mạng, đƣợc thiết lập để bảo vệ cho đƣờng làm việc.

- PSL (Path Switch LSR): Là LSR đứng trƣớc vị trí lỗi trên đƣờng làm việc chịu trách nhiệm chuyển mạch hoặc tái tạo lƣu lƣợng sang đƣờng khôi phục.

- PML (Path merge LSR): Là LSR chịu trách nhiệm nhận lƣu lƣợng trên đƣờng khôi phục và sẽ: tái hợp nhất lƣu lƣợng trở về đƣờng làm việc, hoặc chuyển lƣu lƣợng ra khỏi miền MPLS nếu bản thân nó là đích.

- POR (Point of Repair): POR là một LSR chịu trách nhiệm sửa chữa một LSR, nó có thể là một PSL hoặc PML tùy ý theo cơ chế khôi phục nào đƣợc dùng. - FIS (Fault Indication Signal): Là bản tin chỉ thị có một lỗi xảy ra trên đƣờng

làm việc đã sửa chữa xong. FRS đƣợc chuyển tiếp cho tới khi nó đến đƣợc một LSR đảm nhận việc trả lại đƣờng nguyên thủy.

2.3.2. Phân loại các cơ chế bảo vệ khôi phục

2.3.2.1. Sửa chữa toàn mạng và sửa chữa cục bộ

Sửa chữa toàn mạng là cơ chế bảo vệ hoạt động khi sự cố xảy ra ở bất kì vị trí nào trên đƣờng làm việc. Trong cơ chế sửa chữa toàn mạng, router ngõ vào đƣợc thiết lập là điểm sửa chữa (POR). Ở các mạng lớn, điểm xảy ra lỗi thƣờng cách xa với router biên ngõ vào. Khi sự cố xảy ra, nút mạng xảy ra sự cố sẽ thông báo lại cho router ngõ vào bằng một tin hiệu báo hiệu FIS. Router ngõ vào nhận đƣợc tín hiệu này, sẽ tiến hành chuyển đƣờng làm việc sang đƣờng bảo vệ. Việc khôi phục đƣờng là end-to-end, trong đó đƣờng làm việc và đƣờng bảo vệ tách rời nhau (disjoint) hoàn toàn.

Việc xử lý sự cố bằng sửa chữa toàn mạng thƣờng mất khá nhiều thời gian, do tín hiệu FIS phải truyền ngƣợc lại router ngõ vào, do đó cơ chế sửa chữa cục bộ đƣợc nghĩ ra.

Sửa chữa cục bộ là cơ chế bảo vệ mà việc xử lý sự cố đƣợc thực hiện ngay tại nút phát hiện sự cố. Thƣờng thì nút này sẽ nằm ngay cạnh phía trƣớc nút xảy ra sự cố. Nút này sẽ đóng vai trò PSL thực hiện thao tác khôi phục. Sửa chữa cục bộ có thể đƣợc thực hiện theo các cách sau:

- Khôi phục liên kết: Để bảo vệ khôi phục liên kết trên đƣờng làm việc. Nếu một lỗi xảy ra trên liên kết này đƣợc khôi phục sẽ nối liền PSL và PML ở hai đầu liên kết lỗi. Đƣờng khôi phục và đƣờng làm việc tách rời nhau đối với liên kết đƣợc bảo vệ.

- Khôi phục nút: Để bảo vệ nút trên đƣờng làm việc. Đƣờng khôi phục và đƣờng làm việc phải tách rời với nút đƣợc bảo vệ, hoặc PLM là egress-LSP.

2.3.2.2. Tái định tuyến và chuyển mạch bảo vệ

Đối với khôi phục bằng tái định tuyến (re-router), đƣờng khôi phục đƣợc thiết lập theo yêu cầu sau khi đã xảy ra sự cố. Khi phát hiện sự cố trên đƣờng làm việc, một LSR đứng trƣớc vị trí lỗi có vai trò là POR mới bắt đầu báo hiệu một đƣờng khôi phục đi vòng qua điểm lỗi và mối (merge) vào một nút nào đó nằm sau điểm lỗi trên đƣờng làm việc. Đƣờng khôi phục này có thể đƣợc tính toán sẵn trƣớc hoặc tính toán sau khi phát hiện sự cố. Khi đƣờng khôi phục đƣợc thiết lập xong, PSL bắt đầu chuyển lƣu lƣợng trên đƣờng này.

Trong chuyển mạch bảo vệ thì đƣờng khôi phục đƣợc tính toán và thiết lập trƣớc khi xảy ra sự cố trên đƣờng làm việc. PLS đƣợc cấu hình để chuyển mạch lƣu lƣợng sang đƣờng khôi phục ngay khi nó biết có lỗi trên đƣờng làm việc (trực tiếp phát hiện lỗi hoặc nhờ nhận đƣợc FIS). Vì đƣờng khôi phục đã thiết lập trƣớc nên chuyển mạch bảo vệ nhanh hơn so với khôi phục bằng tái định tuyến.

2.3.3. Cơ chế bảo vệ và khôi phục đƣờng trong điều khiển lƣu lƣợng MPLS

2.3.3.1. Cơ chế Makam

Đây là cơ chế bảo vệ và khôi phục đơn giản nhất theo phƣờng thức bảo vệ toàn cục. Đƣờng khôi phục cho LSP đƣợc thiết lập sẵn từ ngõ vào đến ngõ ra. Đƣờng làm việc và khôi phục đƣợc thiết lập tách rời nhau cả về liên kết và nút. Khi một nút bất kì phát hiện lỗi ở trên đƣờng làm việc, tín hiệu FIS đƣợc dùng để chuyển thông báo lỗi

ngƣợc về router ngõ vào ingress-LSR (PSL). Router biên này sẽ thực hiện chuyển mạch lƣu lƣợng sang đƣờng khôi phục. Mô hình này hỗ trợ cả các đƣờng khôi phục thiết lập sẵn (chuyển mạch bảo vệ) và đƣờng khôi phục thiết lập động (tái định tuyến).

MIỀN MPLS R0 R9 LSR8 LSR7 Egress-LER Tailend-LSR (PML) LSR6 LSR5 LSR4 LSR3 LSR2 LSR1 Ingress-LER Headend-LSR(PSL) Đường khôi phục Đường làm việc FIS Hình 18: Mô hình Makam

Với cách hoạt động này, chỉ cần một đƣờng dự phòng cho mọi sự cố trên đƣờng làm việc và chỉ cần một LSR có chức năng làm PSL. Tuy nhiên mô hình này có khoảng thời gian trễ do tín hiệu FIS truyền ngƣợc về tới PSL, trong thời gian này lƣu lƣợng trên đƣờng làm việc bị mất.

2.3.3.2. Cơ chế Haskin

Mô hình Haskin (Reverse Backup) khắc phục đƣợc nhƣợc điểm mất gói ở mô hình Makam. Ngay khi một LSR phát hiện sự cố trên đƣờng làm việc, nó chuyển hƣớng lƣu lƣợng đến trên đƣờng làm việc sang một đƣờng dự phòng đảo đi ngƣợc về PSL. Khi quay trở về đến PSL, lƣu lƣợng đƣợc chuyển sang đƣờng khôi phục toàn cục. Đƣờng dự phòng đảo và đƣờng khôi phục phải thiết lập sẵn nên cách này tốn kém tài nguyên.

Một cải tiến khác cho phép PSL chuyển trực tiếp lƣu lƣợng sang đƣờng khôi phục toàn cục ngay khi nó thấy đƣờng dự phòng đảo đƣợc dùng. Các gói đầu tiên trong phần lƣu lƣợng đƣợc đảo chiều có tác dụng nhƣ tín hiệu FIS. Cách này tối ƣu hơn vì đƣờng đi của lƣu lƣợng đƣợc bảo vệ ngắn hơn. Tuy nhiên trong thời gian đầu, lƣu lƣợng mới chuyển đi trên đƣờng khôi phục sẽ trộn lẫn với phần lƣu lƣợng đƣợc đảo chiều làm thay đổi thứ tự gói ban đầu.

39 MIỀN MPLS R0 R9 LSR8 LSR7 Egress-LER Tailend-LSR (PML) LSR6 LSR5 LSR4 LSR3 LSR2 LSR1 Ingress-LER

Headend-LSR(PSL) Đường khôi phục

Đường làm việc

Đường dự phòng đảo

Hình 19: Mô hình Haskin

2.3.3.3. Cơ chế Shortest-Dynamic

Đây là cơ chế bảo vệ khôi phục theo kiểu sửa chữa cục bộ, tái định tuyến khôi phục dạng. Trong mô hình này chỉ có đƣờng làm việc đƣợc thiết lập. Khi một nút phát hiện sự cố liên kết thì nó phải tính toán rồi báo hiệu thiết lập đƣờng hầm.

MIỀN MPLS R0 R9 LSR8 LSR7 Egress-LER Tailend-LSR LSR6 PML LSR4 PSL LSR2 LSR1 Ingress-LER Headend-LSR Đường khôi phục Đường làm việc Hình 20: Mô hình Shortest-Dynamic

LSP ngắn nhất đi từ nó đến nút ở phía bên kia liên kết sự cố và sau đó chuyển mạch lƣu lƣợng (bằng cách xếp chồng nhãn để “luồn” đƣờng làm việc chui qua đƣờng hầm tránh lỗi này).

2.3.3.4. Cơ chế Simple-Dynamic

Cơ chế Shortest-Dynamic cũng là một cơ chế cục bộ, tái định tuyến. Nút phát hiện sự cố liên kết sẽ đóng vai trò tái định tuyến và chuyển hƣớng các gói tin. Sự khác

nhau giữa cơ chế này với Shortest-Dynamic là nút cuối cùng của đƣờng làm việc phải là PML. Sau đó, đƣờng khôi phục sẽ là từ nút phát hiện sự cố đến nút PML. Trong trƣờng hợp này không tính toán trƣớc đƣờng LSP khôi phục.

MIỀN MPLS R0 R9 LSR8 PML Egress-LER Tailend-LSR LSR6 LSR5 LSR4 PSL LSR2 LSR1 Ingress-LER Headend-LSR Đường khôi phục Đường làm việc Hình 21: Mô hình Simple-Dynamic

2.4. Giải thuật cân bằng tải của Riikka Suisitaival

Trong luận văn này, tác giả cũng xin trình bày thêm về thuật toán cân bằng tải của Riikka Susitaival. Thuật toán đƣợc kiểm nghiệm tính hiệu quả từ thực tế sử dụng [2].

Giải thuật cân bằng tải của Riikka Suisitaival

Mô phỏng theo cơ chế Makam