Tính khả dụng

Một phần của tài liệu Đặc trưng hóa luồng lưu lượng và ứng dụng trong an ninh mạng đồ án tốt nghiệp khoa đào tạo chất lượng cao ngành công nghệ thông tin (Trang 29 - 36)

1.1 .Khái niệm luồng lưu lượng

1.2. Các thông số của luồng lưu lượng

1.2.3.3. Tính khả dụng

Để mô tả đầy đủ lớp hiệu suất này, chúng ta thêm tính khả dụng vào độ tin cậy và khả năng bảo trì. Tính khả dụng (cịn được gọi là tính sẵn sàng hoạt động) là mối quan hệ giữa tần suất của các lỗi nghiêm trọng theo nhiệm vụ và thời gian khôi phục dịch vụ. Đây được định nghĩa là thời gian trung bình giữa các lần hỏng hóc quan trọng (hoặc thời gian trung bình giữa các lần hỏng hóc) chia cho tổng thời gian trung bình để sửa chữa và thời gian trung bình giữa các lần hỏng hóc quan trọng hoặc thời gian trung bình giữa các lần hỏng hóc. Các mối quan hệ này được thể hiện trong phương trình sau, trong đó A là tính khả dụng.

Một số cân nhắc quan trọng trong việc đánh giá tính khả dụng thường bị bỏ qua. Trước hết, tính khả dụng khơng nhất thiết phản ánh phần trăm thời gian hệ thống hoạt động; bảo trì theo lịch trình khơng được tính đến trong tính tốn này, chỉ bảo trì đột xuất. Điều này rất quan trọng bởi vì bảo trì theo lịch trình khơng phạt hệ thống vì nó có thể được thực hiện khi các thành phần không cần thiết để thực hiện nhiệm vụ. Mối quan tâm thực sự của chúng ta là tính chất bất ngờ của các lỗi hệ thống, được phản ánh ở tính khả dụng.

Phân tích tính khả dụng của mạng cung cấp cho chúng ta khả năng lập lịch bảo trì phịng ngừa và thay thế các thành phần thường xuyên hỏng hóc ở khoảng thời gian cao hơn tỷ lệ hỏng hóc, do đó tăng độ tin cậy của hệ thống tổng thể. Một cách khác để cải thiện tính khả dụng là giảm MTTR, thơng qua sự đa dạng hoặc khả năng thay thế nhanh chóng. Một số cách để đạt được sự đa dạng bao gồm cài đặt khả năng chuyển đổi tự động cho các thành phần quan trọng để chúng tự động chuyển sang đơn vị dự phòng trong mili-giây sau khi phát hiện lỗi; tuy nhiên, chuyển đổi tự động là một tính năng đắt tiền để thêm vào các hệ thống này. Nếu áp lực khôi phục dịch vụ khơng đảm bảo mức chi phí này, các giải pháp thay thế nhanh chóng có thể cải thiện đáng kể MTTR so với các quy trình sửa chữa và khắc phục sự cố truyền thống: các phụ tùng bị nóng có thể được chuyển đổi thủ cơng giúp đẩy nhanh q trình khơi phục dịch vụ, cũng như việc chuẩn bị trước các thành phần dự phịng gần với vị trí của thành phần quan trọng.

Các thước đo khác về tính khả dụng bao gồm thời gian hoạt động, thời gian chết, tỷ lệ lỗi và mất mát.

Thời gian hoạt động và thời gian ngừng hoạt động

Một thước đo phổ biến về tính khả dụng được thể hiện bằng phần trăm thời gian hoạt động hoặc thời gian ngừng hoạt động. Ví dụ: yêu cầu đề xuất (RFP) từ một khách hàng tiềm năng có thể nêu thời gian hoạt động bắt buộc là 99,999% (thường được gọi là "năm chín"), nhưng điều đó thực sự có nghĩa là gì?

Các thuật ngữ thời gian hoạt động và thời gian ngừng hoạt động thực sự có nghĩa là gì? Khi tính khả dụng được biểu thị dưới dạng phần trăm thời gian hoạt động hoặc thời gian ngừng hoạt động, nó được đo lường mỗi tuần, tháng hoặc năm, dựa trên tổng lượng thời gian cho khoảng thời gian đó. Thời gian hoạt động là khi hệ thống (ứng dụng, thiết bị, mạng) có sẵn cho người dùng (trong trường hợp này, người dùng cũng có thể là một ứng dụng hoặc thiết bị). Bằng cách có sẵn, chúng ta muốn nói đến phạm vi từ việc có

kết nối cơ bản đến thực sự có thể chạy các ứng dụng trên mạng. Điều này được mơ tả như thế nào trong phân tích u cầu rất quan trọng đối với cách nó sẽ được đo lường và xác minh. Tương tự như vậy, thời gian ngừng hoạt động có thể bao gồm từ việc khơng thể kết nối qua mạng, đến việc có kết nối nhưng với tỷ lệ tổn thất đủ cao (hoặc lưu lượng đủ thấp) khiến các ứng dụng khơng hoạt động bình thường. Bảng 1.3 cho thấy một tỷ lệ phần trăm khả dụng thường được sử dụng (theo phần trăm thời gian hoạt động), nằm trong khoảng từ 99% đến 99,999%.

Bảng 1.3 Thời gian hoạt động được đo lường qua các khoảng thời gian khác nhau % Thời gian % Thời gian

hoạt động

Lượng thời gian ngừng hoạt động trên mỗi khoảng thời gian

Năm Tháng Tuần Ngày

99% 87,6 giờ 7,3 giờ 1,68 giờ 14,4 phút

99,9% 8,76 giờ 44 phút 10 phút 1,4 phút

99,99% 53 phút 4,4 phút 1 phút 8,6 giây

99,999% 5,3 phút 26,3 giây 6 giây 0,86 giây

Một cách khác để xem tính khả dụng là khoảng thời gian ngừng hoạt động có thể được chấp nhận cho mỗi khoảng thời gian. Phạm vi được hiển thị trong Bảng 1.3 – 99% đến 99.999% – bao gồm phần lớn các yêu cầu về thời gian hoạt động được yêu cầu. Ở mức thấp nhất của phạm vi này, 99% cho phép hệ thống ngừng hoạt động khá ít thời gian (hơn 87 giờ/năm). Điều này có thể được chấp nhận đối với các thử nghiệm hoặc nguyên mẫu hệ thống nhưng không thể chấp nhận được đối với hầu hết các hệ thống hoạt động. Khi các nhà cung cấp dịch vụ thương mại cung cấp thời gian hoạt động ở mức thấp nhất của phạm vi này, điều này phải được tính vào tính khả dụng tổng thể của mạng.

Mức thời gian hoạt động là 99,99% gần với mức độ hoạt động của hầu hết các hệ thống. Ở cấp độ này, thời gian ngừng hoạt động 1 phút được phép mỗi tuần, tương đương với một vài lần tạm dừng mỗi tuần hoặc một lần gián đoạn nhỏ mỗi tháng (trong đó tạm thời là một sự kiện mạng tồn tại trong thời gian ngắn [theo thứ tự giây], chẳng hạn như lưu lượng truy cập được định tuyến lại hoặc một khoảng thời gian tắc nghẽn). Nhiều mạng từng có yêu cầu thời gian hoạt động dưới 99,99% hiện đang dựa vào mạng nhiều hơn và đang sửa đổi yêu cầu thời gian hoạt động lên 99,99% hoặc cao hơn.

Ở mức 99,999%, hầu hết các hệ thống bắt đầu đẩy giới hạn hoạt động của chúng. Mức hiệu suất này, chỉ ra rằng mạng được tin cậy nhiều (ví dụ: đối với các ứng dụng quan trọng), sẽ tác động đến kiến trúc và thiết kế mạng trong một số lĩnh vực.

Cuối cùng, thời gian hoạt động vượt quá 99,999% tiếp cận với rìa hiệu suất hiện tại, nơi nỗ lực và chi phí để hỗ trợ mức thời gian hoạt động cao như vậy có thể tăng vọt. Thậm chí có một số ứng dụng khơng thể chịu được bất kỳ thời gian chết nào trong phiên. Đối với những loại ứng dụng này, thời gian hoạt động là 100% khi đang trong phiên. Ví dụ về một ứng dụng như vậy là điều khiển từ xa một sự kiện (ví dụ: lái xe, thực hiện một hoạt động), trong đó thời gian ngừng hoạt động có thể dẫn đến mất phương tiện hoặc có thể mất mạng (một trong những tiêu chí cho nhiệm vụ quan trọng ứng dụng). Tuy nhiên, trong những trường hợp như thế này, thời điểm sẵn có cao thường được biết trước rất nhiều (đã lên lịch) và có thể được lên kế hoạch.

Tại thời điểm này, chúng ta cần lưu ý rằng nhiều sự cố hệ thống diễn ra trong thời gian rất ngắn và có thể khơng ảnh hưởng đến người dùng hoặc ứng dụng của họ. Trong một số trường hợp, người dùng thậm chí có thể khơng biết rằng sự cố đã tồn tại, vì sự cố ngừng hoạt động có thể chỉ đơn thuần là một ứng dụng tạm dừng. Tuy nhiên, các sự kiện như vậy là một phần của ước tính độ tin cậy, đặc biệt là trong các mạng có giới hạn nghiêm ngặt về độ tin cậy. Do đó, mặc dù thời gian ngừng hoạt động 10 phút hàng tuần (hoặc 99,9% thời gian hoạt động) sẽ đáng chú ý (ví dụ: phiên ứng dụng giảm) nếu nó xảy ra cùng một lúc, nó thực sự có thể là sự lặp lại của một khoảng tầm 15 giây, mỗi thời gian trong số đó dẫn đến ứng dụng bị đình trệ trong vài giây.

Với thơng tin này và bảng ước tính thời gian hoạt động trước đó, chúng ta có thể đưa ra ngưỡng chung cho thời gian hoạt động. Ngưỡng chung cho thời gian hoạt động, dựa trên kinh nghiệm thực tế là 99,99%. Khi áp dụng ngưỡng chung này, các yêu cầu về thời gian hoạt động nhỏ hơn 99,99% được coi là hiệu suất thấp và các yêu cầu về thời gian hoạt động lớn hơn hoặc bằng 99,99% được coi là hiệu suất cao. Hãy nhớ rằng ngưỡng chung này được sử dụng trong trường hợp khơng có bất kỳ ngưỡng mơi trường cụ thể nào có thể được phát triển cho mạng của chúng ta.

Đo thời gian hoạt động

Đây là một trong những vấn đề lớn nhất đối với yêu cầu về phần trăm thời gian hoạt động hoặc thời gian ngừng hoạt động: làm thế nào nó có thể được định cấu hình, đo lường hoặc xác minh?

Về việc đo lường thời gian hoạt động, câu hỏi này có thể được đặt ra trong ba phần: khi nào thì nên đo (tần suất), nên đo ở đâu và nên đo như thế nào (số liệu dịch vụ)? Trước tiên, hãy xem xét tần suất đo lường. Một vấn đề với việc thể hiện thời gian hoạt động chỉ dưới dạng phần trăm là nó khơng bao gồm yếu tố thời gian. Ví dụ: hãy xem xét yêu cầu về thời gian hoạt động 99,99%. Nếu khơng có ́u tố thời gian, điều đó có thể có nghĩa là thời gian ngừng hoạt động là 53 phút mỗi năm, 4,4 phút mỗi tháng hoặc 1 phút mỗi t̀n. Nếu khơng nêu ́u tố thời gian, có thể có một lần ngừng hoạt động lên đến 53 phút. Miễn là đó là lần ngừng hoạt động duy nhất trong năm, yêu cầu về tính khả dụng này có thể được đáp ứng. Một số mạng có thể chịu được thời gian ngừng hoạt động tích lũy là 53 phút mỗi năm nhưng không thể xử lý một thời gian ngừng hoạt động ở mức độ đó. Có một sự khác biệt lớn giữa một lần mất điện lớn và một số lần mất điện nhỏ hơn.

Việc nêu một yếu tố thời gian (tần suất) cùng với thời gian hoạt động làm cho yêu cầu đó có giá trị hơn. Đối với các mạng không thể chịu được sự cố mất điện lớn nhưng có thể chịu được một số sự cố nhỏ, thời gian hoạt động 99,99% được đo hàng tuần có thể có ý nghĩa hơn thời gian hoạt động đơn thuần là 99,99%. Bằng cách nêu rõ "được đo lường hàng tuần", chúng ta đang bắt buộc yêu cầu rằng thời gian ngừng hoạt động không được lớn hơn tổng số 1 phút mỗi tuần.

Tiếp theo, hãy xem xét vị trí cần đo thời gian hoạt động. Việc nêu rõ thời gian hoạt động được đo ở đâu cũng quan trọng như việc nêu tần suất của nó. Nếu khơng có gì được nói về nơi nó được đo lường, giả định là thời gian ngừng hoạt động ở bất kỳ đâu trong mạng được tính vào thời gian hoạt động tổng thể. Đối với một số mạng, điều này có thể xảy ra và như vậy phải được nêu rõ ràng như một yêu cầu. Tuy nhiên, đối với nhiều mạng, thời gian hoạt động sẽ hiệu quả hơn khi nó được áp dụng có chọn lọc cho các phần của mạng. Ví dụ: thời gian hoạt động của máy chủ hoặc thiết bị chuyên dụng có thể quan trọng hơn thời gian hoạt động chung trên tồn mạng. Nếu đúng như vậy, nó nên được đưa vào như một phần của yêu cầu về hiệu suất.

Hình 1.10 là một ví dụ mà thời gian hoạt động sẽ áp dụng ở mọi nơi trong mạng. Việc mất dịch vụ đối với bất kỳ thiết bị nào trong tình huống này sẽ được tính vào thời gian hoạt động tổng thể. Trong Hình 1.11, thời gian hoạt động đã được tinh chỉnh để chỉ áp dụng giữa mỗi mạng LAN người dùng và mạng LAN máy chủ. Trong ví dụ này, nếu dịch vụ bị mất giữa các mạng LAN của người dùng, nó sẽ khơng được tính vào u cầu thời gian hoạt động tổng thể.

Hình 1.10 Thời gian hoạt động được đo ở mọi nơi

Hình 1.11 Thời gian hoạt động được đo có chọn lọc

Trong hai ví dụ của chúng ta, cho thấy sự đánh đổi giữa việc có thể áp dụng thời gian hoạt động ở mọi nơi và việc áp dụng thời gian hoạt động chính xác và dễ đạt được hơn. Tuy nhiên, có thể áp dụng cả hai vào cùng một mạng. Chúng ta có thể áp dụng một tiêu chuẩn ở mọi nơi trong mạng và có một tiêu chuẩn khác được áp dụng có chọn lọc.

Thơng thường, thời gian hoạt động được đo từ đầu đến cuối, giữa các thiết bị của người dùng (thiết bị tính tốn chung) hoặc giữa các thiết bị mạng (bộ định tuyến, bộ chuyển mạch hoặc các trạm giám sát/an ninh mạng). Ví dụ, nó có thể được đo từ đầu đến cuối, tại các giao diện bộ định tuyến, nơi các bộ định tuyến được phân tách bởi nhiều mạng. Các điểm đo bao gồm giao diện LAN/WAN, các điểm vào/ra của bộ định tuyến và tại các trạm giám sát được phân bổ trong toàn mạng. Việc xác định vị trí để đo thời gian hoạt động là đặc biệt quan trọng khi các nhà cung cấp dịch vụ được cố định vào hệ thống hoặc khi các dịch vụ được phân định giữa các khu vực được xác định rõ ràng của mạng.

Cuối cùng, cách chúng ta đo lường thời gian hoạt động cũng rất quan trọng. Như chúng ta trình bày sau trong phần này, nó có thể được đo dưới dạng thiếu khả năng kết nối hoặc tỷ lệ mất mát (tỷ lệ lỗi bit, tỷ lệ mất ơ, khung hoặc gói). Phương pháp chúng ta sử dụng để đo thời gian hoạt động ảnh hưởng đến cách nó có thể được định cấu hình trong các thiết bị mạng, cũng như cách nó có thể được xác minh.

Khi phát triển các yêu cầu của chúng ta về thời gian hoạt động, hãy nhớ rằng một số thời gian ngừng hoạt động trên mạng cần được lên lịch để thực hiện các thay đổi đối với mạng, nâng cấp phần cứng và phần mềm hoặc để chạy thử nghiệm. Thời gian ngừng hoạt động theo lịch trình để bảo trì khơng được tính vào thời gian hoạt động tổng thể của mạng và lượng thời gian ngừng hoạt động theo kế hoạch (tần suất và thời lượng) phải được đưa vào yêu cầu hiệu suất của chúng ta.

Thật vậy, với những cách mà chúng ta chỉ định vị trí, thời gian và cách đo thời gian hoạt động, chúng ta thực sự có thể có nhiều yêu cầu về thời gian hoạt động trong mạng. Ví dụ: có thể có một u cầu chung trên toàn bộ mạng, được đo ở mọi nơi và một yêu cầu khác, hiệu suất cao hơn, chỉ được đo giữa các thiết bị quan trọng trong mạng.

Do đó, yêu cầu về thời gian hoạt động có thể trơng giống như sau (xem thời gian hoạt động của mạng trong Hình 1.10 và 1.11):

• Thời gian hoạt động 99,99%, được đo hàng tuần, được đo ở mọi giao diện bộ định tuyến và thiết bị người dùng trong mạng.

• Thời gian hoạt động 99,999%, được đo hàng tuần, để truy cập vào mạng máy chủ, được đo tại giao diện bộ định tuyến tại máy chủ, tại NIC máy chủ. Ứng dụng ping cũng sẽ được sử dụng để kiểm tra kết nối giữa mỗi mạng LAN của người dùng và mạng LAN của máy chủ.

• Lưu ý rằng các yêu cầu này không áp dụng cho các khoảng thời gian ngừng hoạt động theo lịch trình để bảo trì.

Một phần của tài liệu Đặc trưng hóa luồng lưu lượng và ứng dụng trong an ninh mạng đồ án tốt nghiệp khoa đào tạo chất lượng cao ngành công nghệ thông tin (Trang 29 - 36)

Tải bản đầy đủ (PDF)

(135 trang)