Các biện pháp để nângcao độtincậy củahệthống

Một phần của tài liệu Nghiên cứu bài toán tính độ tin cậy của hệ thống thông qua cấu trúc của hệ thống (Trang 25 - 26)

Vì mọi hƣ hỏng đều có nguồn gốc là các lỗi gây trở ngại đến hoạt động của hệ thống ta phải lựa chọn và phối hợp nhiều giải pháp bảo vệ chống lỗi. Các giải pháp có thể là:

- Ngăn trở các lỗi có thể xuất hiện trong hệ thống bằng cách sử dụng các hệ thống tiêu chuẩn hóa, việc này có tác dụng giảm các lỗi do thiết kế hệ thống.

- Chọn các linh kiện có độ tin cậy cao, cải thiện điều kiện làm việc của chúng nhƣ tản nhiệt, tránh nhiễu điện từ, bảo vệ chống dao động điện áp nguồn.

- Sử dụng các phần cứng và phần mềm quen thuộc đối với ngƣời sử dụng sẽ giảm đƣợc các lỗi tƣơng tác.

- Loại trừ các lỗi bằng cách phát hiện và sửa lỗi sớm, trƣớc khi các lỗi có thể gây ra sai lệch.

- Chấp nhận lỗi trong hệ thống bằng có chế dự phòng (redundancy).

- Hệ thống có dự phòng cho phép tồn tại các lỗi bằng cơ chế sống chung với lỗi, có khả năng che chắn các lỗi. Việc dự phòng có thể chỉ tác động lên một bộ phận hệ thống hoặc dự phòng toàn bộ. Nhiều nhà chế tạo theo phƣơng pháp dự phòng bộ phận vì nó kinh tế hơn.

Sau khi đã nhận dạng các chức năng dễ mắc lỗi trong hệ thống bằng cách nghiên cứu xác suất hƣ hỏng của từng bộ phận ta tạo nên các hệ con có dự phòng. Ví dụ đối với server là có hai nguồn cấp, đĩa gƣơng… Giải pháp này đƣợc dự kiến trong thiết kế hệ thống, tuy nhiên trong quá trình làm việc có thể sau vài năm hệ thống không còn đủ khả năng che chắn lỗi cho các hệ con. Ví dụ một nguồn hƣ hỏng do quá điện áp làm nguồn dự phòng mắc song song với nó cũng bị ảnh hƣởng. Nguồn dự phòng này có thể chỉ che chắn đƣợc 9 trong 10 lỗi có thể xảy ra.

Dự phòng có thể là bậc n, nghĩa là số hệ con có thể lớn hơn 1. Dự phòng đơn giản nhất là dự phòng kép nghĩa là có hai hệ con đƣợc điều khiển để thay thế cho nhau. Một hệ có dự phòng có thể bao gồm các hệ con giống nhau gọi là hệ đồng nhất (homogeneous redundancy) hoặc không đồng nhất (heterogeneous

redundancy). Các hệ con có thể làm việc đồng bộ hoặc không đồng bộ. Vậy câu hỏi đặt ra là dự phòng có thể làm hệ thống tin cậy với thời gian vô hạn đƣợc không ? Cho dù áp dụng mọi biện pháp dự phòng vẫn có khả năng đến một lúc nào đấy hệ thống của chúng ta hoạt động không tin cậy. Lý do có rất nhiều nhƣng chắc chắn là thời gian làm việc tin cậy của hệ thống kéo dài thêm rất nhiều.=>Chiến lược bảo dưỡng thích hợp.

Việc bảo dƣỡng và thay thế các bộ phận hƣ hỏng phải đƣợc tiến hành theo phƣơng hƣớng nâng cao độ tin cậy bằng cách không bảo dƣỡng tràn lan mà tập trung vào những bộ phận hay hƣ hỏng. Đảm bảo sửa chữa khắc phục lỗi trong thời gian ngắn nhất bằng cách huy động vật tƣ, nhân lực thích hợp.

Một phần của tài liệu Nghiên cứu bài toán tính độ tin cậy của hệ thống thông qua cấu trúc của hệ thống (Trang 25 - 26)