thể kết nối qua mạng, đến việc có kết nối nhưng với tỷ lệ tổn thất đủ cao (hoặc lưu lượng đủ thấp) khiến các ứng dụng khơng hoạt động bình thường. Bảng 1.3 cho thấy một tỷ lệ phần trăm khả dụng thường được sử dụng (theo phần trăm thời gian hoạt động), nằm trong khoảng từ 99% đến 99,999%.
Bảng 1.3 Thời gian hoạt động được đo lường qua các khoảng thời gian khác nhau % Thời gian % Thời gian
hoạt động
Lượng thời gian ngừng hoạt động trên mỗi khoảng thời gian
Năm Tháng Tuần Ngày
99% 87,6 giờ 7,3 giờ 1,68 giờ 14,4 phút
99,9% 8,76 giờ 44 phút 10 phút 1,4 phút
99,99% 53 phút 4,4 phút 1 phút 8,6 giây
99,999% 5,3 phút 26,3 giây 6 giây 0,86 giây
Một cách khác để xem tính khả dụng là khoảng thời gian ngừng hoạt động có thể được chấp nhận cho mỗi khoảng thời gian. Phạm vi được hiển thị trong Bảng 1.3 – 99% đến 99.999% – bao gồm phần lớn các yêu cầu về thời gian hoạt động được yêu cầu. Ở mức thấp nhất của phạm vi này, 99% cho phép hệ thống ngừng hoạt động khá ít thời gian (hơn 87 giờ/năm). Điều này có thể được chấp nhận đối với các thử nghiệm hoặc nguyên mẫu hệ thống nhưng không thể chấp nhận được đối với hầu hết các hệ thống hoạt động. Khi các nhà cung cấp dịch vụ thương mại cung cấp thời gian hoạt động ở mức thấp nhất của phạm vi này, điều này phải được tính vào tính khả dụng tổng thể của mạng.
Mức thời gian hoạt động là 99,99% gần với mức độ hoạt động của hầu hết các hệ thống. Ở cấp độ này, thời gian ngừng hoạt động 1 phút được phép mỗi tuần, tương đương với một vài lần tạm dừng mỗi tuần hoặc một lần gián đoạn nhỏ mỗi tháng (trong đó tạm thời là một sự kiện mạng tồn tại trong thời gian ngắn [theo thứ tự giây], chẳng hạn như lưu lượng truy cập được định tuyến lại hoặc một khoảng thời gian tắc nghẽn). Nhiều mạng từng có yêu cầu thời gian hoạt động dưới 99,99% hiện đang dựa vào mạng nhiều hơn và đang sửa đổi yêu cầu thời gian hoạt động lên 99,99% hoặc cao hơn.
Ở mức 99,999%, hầu hết các hệ thống bắt đầu đẩy giới hạn hoạt động của chúng. Mức hiệu suất này, chỉ ra rằng mạng được tin cậy nhiều (ví dụ: đối với các ứng dụng quan trọng), sẽ tác động đến kiến trúc và thiết kế mạng trong một số lĩnh vực.
Cuối cùng, thời gian hoạt động vượt quá 99,999% tiếp cận với rìa hiệu suất hiện tại, nơi nỗ lực và chi phí để hỗ trợ mức thời gian hoạt động cao như vậy có thể tăng vọt. Thậm chí có một số ứng dụng khơng thể chịu được bất kỳ thời gian chết nào trong phiên. Đối với những loại ứng dụng này, thời gian hoạt động là 100% khi đang trong phiên. Ví dụ về một ứng dụng như vậy là điều khiển từ xa một sự kiện (ví dụ: lái xe, thực hiện một hoạt động), trong đó thời gian ngừng hoạt động có thể dẫn đến mất phương tiện hoặc có thể mất mạng (một trong những tiêu chí cho nhiệm vụ quan trọng ứng dụng). Tuy nhiên, trong những trường hợp như thế này, thời điểm sẵn có cao thường được biết trước rất nhiều (đã lên lịch) và có thể được lên kế hoạch.
Tại thời điểm này, chúng ta cần lưu ý rằng nhiều sự cố hệ thống diễn ra trong thời gian rất ngắn và có thể khơng ảnh hưởng đến người dùng hoặc ứng dụng của họ. Trong một số trường hợp, người dùng thậm chí có thể khơng biết rằng sự cố đã tồn tại, vì sự cố ngừng hoạt động có thể chỉ đơn thuần là một ứng dụng tạm dừng. Tuy nhiên, các sự kiện như vậy là một phần của ước tính độ tin cậy, đặc biệt là trong các mạng có giới hạn nghiêm ngặt về độ tin cậy. Do đó, mặc dù thời gian ngừng hoạt động 10 phút hàng tuần (hoặc 99,9% thời gian hoạt động) sẽ đáng chú ý (ví dụ: phiên ứng dụng giảm) nếu nó xảy ra cùng một lúc, nó thực sự có thể là sự lặp lại của một khoảng tầm 15 giây, mỗi thời gian trong số đó dẫn đến ứng dụng bị đình trệ trong vài giây.
Với thơng tin này và bảng ước tính thời gian hoạt động trước đó, chúng ta có thể đưa ra ngưỡng chung cho thời gian hoạt động. Ngưỡng chung cho thời gian hoạt động, dựa trên kinh nghiệm thực tế là 99,99%. Khi áp dụng ngưỡng chung này, các yêu cầu về thời gian hoạt động nhỏ hơn 99,99% được coi là hiệu suất thấp và các yêu cầu về thời gian hoạt động lớn hơn hoặc bằng 99,99% được coi là hiệu suất cao. Hãy nhớ rằng ngưỡng chung này được sử dụng trong trường hợp khơng có bất kỳ ngưỡng mơi trường cụ thể nào có thể được phát triển cho mạng của chúng ta.
Đo thời gian hoạt động
Đây là một trong những vấn đề lớn nhất đối với yêu cầu về phần trăm thời gian hoạt động hoặc thời gian ngừng hoạt động: làm thế nào nó có thể được định cấu hình, đo lường hoặc xác minh?
Về việc đo lường thời gian hoạt động, câu hỏi này có thể được đặt ra trong ba phần: khi nào thì nên đo (tần suất), nên đo ở đâu và nên đo như thế nào (số liệu dịch vụ)? Trước tiên, hãy xem xét tần suất đo lường. Một vấn đề với việc thể hiện thời gian hoạt động chỉ dưới dạng phần trăm là nó khơng bao gồm yếu tố thời gian. Ví dụ: hãy xem xét yêu cầu về thời gian hoạt động 99,99%. Nếu khơng có ́u tố thời gian, điều đó có thể có nghĩa là thời gian ngừng hoạt động là 53 phút mỗi năm, 4,4 phút mỗi tháng hoặc 1 phút mỗi tuần. Nếu khơng nêu ́u tố thời gian, có thể có một lần ngừng hoạt động lên đến 53 phút. Miễn là đó là lần ngừng hoạt động duy nhất trong năm, u cầu về tính khả dụng này có thể được đáp ứng. Một số mạng có thể chịu được thời gian ngừng hoạt động tích lũy là 53 phút mỗi năm nhưng không thể xử lý một thời gian ngừng hoạt động ở mức độ đó. Có một sự khác biệt lớn giữa một lần mất điện lớn và một số lần mất điện nhỏ hơn.
Việc nêu một yếu tố thời gian (tần suất) cùng với thời gian hoạt động làm cho yêu cầu đó có giá trị hơn. Đối với các mạng không thể chịu được sự cố mất điện lớn nhưng có thể chịu được một số sự cố nhỏ, thời gian hoạt động 99,99% được đo hàng tuần có thể có ý nghĩa hơn thời gian hoạt động đơn thuần là 99,99%. Bằng cách nêu rõ "được đo lường hàng tuần", chúng ta đang bắt buộc yêu cầu rằng thời gian ngừng hoạt động không được lớn hơn tổng số 1 phút mỗi tuần.
Tiếp theo, hãy xem xét vị trí cần đo thời gian hoạt động. Việc nêu rõ thời gian hoạt động được đo ở đâu cũng quan trọng như việc nêu tần suất của nó. Nếu khơng có gì được nói về nơi nó được đo lường, giả định là thời gian ngừng hoạt động ở bất kỳ đâu trong mạng được tính vào thời gian hoạt động tổng thể. Đối với một số mạng, điều này có thể xảy ra và như vậy phải được nêu rõ ràng như một yêu cầu. Tuy nhiên, đối với nhiều mạng, thời gian hoạt động sẽ hiệu quả hơn khi nó được áp dụng có chọn lọc cho các phần của mạng. Ví dụ: thời gian hoạt động của máy chủ hoặc thiết bị chuyên dụng có thể quan trọng hơn thời gian hoạt động chung trên tồn mạng. Nếu đúng như vậy, nó nên được đưa vào như một phần của yêu cầu về hiệu suất.
Hình 1.10 là một ví dụ mà thời gian hoạt động sẽ áp dụng ở mọi nơi trong mạng. Việc mất dịch vụ đối với bất kỳ thiết bị nào trong tình huống này sẽ được tính vào thời gian hoạt động tổng thể. Trong Hình 1.11, thời gian hoạt động đã được tinh chỉnh để chỉ áp dụng giữa mỗi mạng LAN người dùng và mạng LAN máy chủ. Trong ví dụ này, nếu dịch vụ bị mất giữa các mạng LAN của người dùng, nó sẽ khơng được tính vào yêu cầu thời gian hoạt động tổng thể.
Hình 1.10 Thời gian hoạt động được đo ở mọi nơi
Hình 1.11 Thời gian hoạt động được đo có chọn lọc
Trong hai ví dụ của chúng ta, cho thấy sự đánh đổi giữa việc có thể áp dụng thời gian hoạt động ở mọi nơi và việc áp dụng thời gian hoạt động chính xác và dễ đạt được hơn. Tuy nhiên, có thể áp dụng cả hai vào cùng một mạng. Chúng ta có thể áp dụng một tiêu chuẩn ở mọi nơi trong mạng và có một tiêu chuẩn khác được áp dụng có chọn lọc.
Thơng thường, thời gian hoạt động được đo từ đầu đến cuối, giữa các thiết bị của người dùng (thiết bị tính tốn chung) hoặc giữa các thiết bị mạng (bộ định tuyến, bộ chuyển mạch hoặc các trạm giám sát/an ninh mạng). Ví dụ, nó có thể được đo từ đầu đến cuối, tại các giao diện bộ định tuyến, nơi các bộ định tuyến được phân tách bởi nhiều mạng. Các điểm đo bao gồm giao diện LAN/WAN, các điểm vào/ra của bộ định tuyến và tại các trạm giám sát được phân bổ trong toàn mạng. Việc xác định vị trí để đo thời gian hoạt động là đặc biệt quan trọng khi các nhà cung cấp dịch vụ được cố định vào hệ thống hoặc khi các dịch vụ được phân định giữa các khu vực được xác định rõ ràng của mạng.
Cuối cùng, cách chúng ta đo lường thời gian hoạt động cũng rất quan trọng. Như chúng ta trình bày sau trong phần này, nó có thể được đo dưới dạng thiếu khả năng kết nối hoặc tỷ lệ mất mát (tỷ lệ lỗi bit, tỷ lệ mất ơ, khung hoặc gói). Phương pháp chúng ta sử dụng để đo thời gian hoạt động ảnh hưởng đến cách nó có thể được định cấu hình trong các thiết bị mạng, cũng như cách nó có thể được xác minh.
Khi phát triển các yêu cầu của chúng ta về thời gian hoạt động, hãy nhớ rằng một số thời gian ngừng hoạt động trên mạng cần được lên lịch để thực hiện các thay đổi đối với mạng, nâng cấp phần cứng và phần mềm hoặc để chạy thử nghiệm. Thời gian ngừng hoạt động theo lịch trình để bảo trì khơng được tính vào thời gian hoạt động tổng thể của mạng và lượng thời gian ngừng hoạt động theo kế hoạch (tần suất và thời lượng) phải được đưa vào yêu cầu hiệu suất của chúng ta.
Thật vậy, với những cách mà chúng ta chỉ định vị trí, thời gian và cách đo thời gian hoạt động, chúng ta thực sự có thể có nhiều yêu cầu về thời gian hoạt động trong mạng. Ví dụ: có thể có một u cầu chung trên toàn bộ mạng, được đo ở mọi nơi và một yêu cầu khác, hiệu suất cao hơn, chỉ được đo giữa các thiết bị quan trọng trong mạng.
Do đó, yêu cầu về thời gian hoạt động có thể trơng giống như sau (xem thời gian hoạt động của mạng trong Hình 1.10 và 1.11):
• Thời gian hoạt động 99,99%, được đo hàng tuần, được đo ở mọi giao diện bộ định tuyến và thiết bị người dùng trong mạng.
• Thời gian hoạt động 99,999%, được đo hàng tuần, để truy cập vào mạng máy chủ, được đo tại giao diện bộ định tuyến tại máy chủ, tại NIC máy chủ. Ứng dụng ping cũng sẽ được sử dụng để kiểm tra kết nối giữa mỗi mạng LAN của người dùng và mạng LAN của máy chủ.
• Lưu ý rằng các yêu cầu này không áp dụng cho các khoảng thời gian ngừng hoạt động theo lịch trình để bảo trì.
1.2.3.4. Ngưỡng và giới hạn
Các yêu cầu RMA có thể bao gồm các mơ tả về ngưỡng và/hoặc giới hạn. Các yêu cầu RMA được thu thập và/hoặc xuất đi cho từng ứng dụng trong mạng của chúng ta từ các cuộc thảo luận với người dùng từng ứng dụng, cũng như từ tài liệu về các ứng dụng và thử nghiệm các ứng dụng trên mạng hiện có hoặc trên mạng thử nghiệm. Từ các yêu cầu, chúng ta thường có thể xác định các ngưỡng (hoặc giới hạn) theo môi trường cụ thể trên từng ứng dụng bằng cách vẽ biểu đồ các mức hiệu suất của ứng dụng. Từ đó, chúng ta có thể xác định yếu tố nào tạo nên RMA hiệu suất thấp và hiệu suất cao cho mạng của mình. Trong trường hợp khơng có các ngưỡng dành riêng cho mơi trường, chúng ta có thể sử dụng các ngưỡng chung được trình bày trong phần này.
Ngoài ra, hãy kiểm tra các đảm bảo RMA (nếu có) cho các dịch vụ và/hoặc cơng nghệ tồn tại trong mạng hiện tại hoặc có khả năng nằm trong mạng được quy hoạch. Ví dụ: dịch vụ dữ liệu đa kênh chuyển mạch của Pacific Bell (SMDS) có tính khả dụng đã nêu, về thời gian trung bình giữa các lần ngừng dịch vụ hoặc lớn hơn hoặc bằng 3500 giờ, với thời gian khơi phục trung bình ít hơn hoặc bằng 3,5 giờ. Mặt khác, đặc điểm kỹ thuật Bellcore cho SMDS yêu cầu tính khả dụng là 99,9%. Từ các phần trước đó của chúng ta, chúng ta có thể thấy rằng cả hai thơng số kỹ thuật này đều mơ tả các đặc tính khả dụng tương tự, với đặc điểm kỹ thuật MTBCF/MTTR cụ thể hơn.
Một số kỹ thuật ước tính mà chúng ta đã sử dụng yêu cầu kiến thức về công nghệ và/hoặc dịch vụ nào tồn tại hoặc được lên kế hoạch cho hệ thống. Vì tại thời điểm này trong q trình, chúng ta thực sự khơng biết chúng ta sẽ sử dụng công nghệ và/hoặc dịch vụ nào cho mạng của mình (vì chúng được xác định trong quy trình kiến trúc và thiết kế), những kỹ thuật này có thể được sử dụng trên các cơng nghệ và/hoặc dịch vụ nằm trong mạng hiện tại hoặc trên một tập hợp các công nghệ và/hoặc dịch vụ được đề xuất cho mạng được lập kế hoạch của chúng ta. Sau này trong quá trình kiến trúc và thiết kế, khi chúng ta đã chọn cơng nghệ và/hoặc dịch vụ cho mạng của mình, chúng ta có thể áp dụng thông tin thu thập được ở đây cho từng cơng nghệ/dịch vụ đó.
Một ví dụ về ngưỡng chung cho RMA là cho thời gian hoạt động. Người dùng thường mong đợi hệ thống hoạt động gần 100% thời gian nhất có thể. Thời gian hoạt động có thể đạt gần 100%, trong vịng một phần mười, phần trăm hoặc đơi khi là phần
nghìn phần trăm, nhưng phải đánh đổi độ phức tạp và chi phí của hệ thống. Đầu phần này, chúng ta đã mô tả ngưỡng chung cho thời gian hoạt động, dựa trên kinh nghiệm và quan sát là 99,99%. Nói chung, các yêu cầu về thời gian hoạt động lớn hơn hoặc bằng 99,99% được coi là hiệu suất cao, những yêu cầu nhỏ hơn 99,99% là hiệu suất thấp. Các ngưỡng này được thể hiện trong Hình 1.12.
Hình 1.12 Ngưỡng giữa thời gian hoạt động hiệu suất thấp và cao
Lưu ý rằng bất kỳ ngưỡng môi trường cụ thể nào được phát triển cho mạng của chúng ta sẽ thay thế các ngưỡng chung này.
Tỷ lệ lỗi hoặc mất mát được sử dụng như một phép đo thời gian hoạt động. Ví dụ, đối với yêu cầu về thời gian hoạt động là 99,99%, có thể sử dụng gói hoặc tế bào để đo hiệu suất này. Đối với nhiều ứng dụng, kinh nghiệm cho thấy rằng mất gói 2% là đủ để mất các phiên ứng dụng. Đây có thể được coi là thời gian chết và trên thực tế là một phép đo và xác minh thời gian hoạt động thực tế hơn so với việc tập trung vào đồ thị.
Nếu chúng ta đang sử dụng ngưỡng mất mát 2% và đo mức mất gói trong mạng, thì nó được tính là thời gian chết khi mất gói lớn hơn 2%. Đối với 99,99% được đo hàng tuần, mạng có thể bị mất gói từ 2% trở lên trong 1 phút mỗi tuần (xem Phần 1.2.3.3).
Ngoài các ngưỡng trên, đảm bảo hiệu suất và dịch vụ cũng nên được liệt kê là yêu cầu ứng dụng. Xác định các yêu cầu về thời gian hoạt động là một quá trình lặp đi lặp lại. Khi người dùng, thiết bị, ứng dụng và mạng phát triển, các yêu cầu của họ sẽ cần được điều chỉnh.
1.2.4. Bao hiệu suất
Các yêu cầu về hiệu suất có thể được kết hợp để mơ tả một phạm vi hiệu suất cho hệ thống. Bao hiệu suất là sự kết hợp của hai hoặc nhiều yêu cầu hiệu suất, với các ngưỡng