3 CHƯƠNG : TRIỂN KHAI GIẢI PHÁP GIÁM SÁT MẠNG DOANH NGHIỆP MÃ NGUỒN MỞ OBSERVIUM
3.4.4 Cảnh báo sự cố
a) Cảnh báo trạng thái của Devices bị Down hay Up
Hình 3.37 Cảnh báo Device Down
Có thể thấy thiết bị nào đang bị Down hiển thị cảnh báo, cũng như trạng thái của các thiết bị khác.
b) Cảnh báo % CPU sử dụng vượt quá 90%
Hình 3.38 Cảnh báo CPU vượt quá 90%
Thiết lập cảnh báo đối với CPU là rất quan trọng, các tác vụ nặng có thể gây ra hiện tượng giật lag hoặc nặng hơn là server bị sập đột. Hay là CPU không thể đáp ứng được nhu cầu khi luôn hoạt động ở tần suất cao làm giảm tuổi thọ cũng như hiệu xuất của CPU.
c) Cảnh báo dung lượng sử dụng của Disk vượt quá 90%
Hình 3.39 Cảnh báo dung lượng vượt quá 90%
Khi dung lượng ổ đĩa vượt quá 90%, người quản trị cần có giải pháp nâng cấp hoặc dọn dẹp, trước khi người dùng phàn nàn về dữ liệu của họ
d) Cảnh báo nhiệt độ vượt ngưỡng cho phép
Hình 3.40 Cảnh báo nhiệt độ
Kiểm tra trạng thái của các cảm biến nhiệt độ của thiết bị, tránh sự cố đáng tiếc xảy ra khi nhiệt độ quá cao gây hư hỏng vĩnh viễn thiết bị.
e) Cảnh báo lưu lượng mạng vượt quá 85%
Với những đơn vị yêu cầu độ trễ thấp việc lưu lượng mạng vượt quá 85% sẽ ảnh hưởng đến công việc, người quản trị sẽ cần có phương án nâng cấp hoặc thiết lập các giải pháp phù hợp cho lưu lượng mạng.
f) Giám sát các cổng mạng đã được mở nhưng không hoạt động
Hình 3.42 Cảnh báo Port mở nhưng không sử dụng
Việc các Router và Switch đã được kết nối với dây mạng, nhưng không hoạt động sẽ được cảnh báo và theo dõi để người quản trị có thể khắc phục sự cố một cách nhanh nhất khi số lượng port quá nhiều.
Hình 3.43 Cảnh báo Online qua Telegram
Trong hình có thể thấy thời gian cảnh báo được đưa ra đối với cảnh báo Memory vượt quá 80%. Các thông số cần quan tâm phần message gửi về bao gồm:
− Entity: loại cảnh báo và thời gian − Metrics: số liệu cảnh báo
− Device: thiết bị
− Location: vị trí thiết bị
− Device Uptime: Trạng thái thiết bị
3.5 Kết luận chương 3
Triển khai hệ thống giám sát mã nguồn mở Observium theo mô hình tập trung các thành phần của Observium triển khai trên cùng một Server giúp việc vận hành nhanh chóng chính xác và hiệu quả, giảm được số lượng server vật lý. Bên cạnh đó việc theo dõi các thông tin của thiết bị giúp người quản trị nâng cao khả năng quản lý, giảm thời gian tìm kiếm thủ công, xử lý sự cố nhanh hơn.
KẾT LUẬN
1. Kết quả đạt được
Nghiên cứu, tìm hiểu xây dựng hệ thống giám sát mạng dựa trên phần mềm nguồn mở Observium.
Đồ án thực hiện thành công mô hình giám sát mạng sử dụng phần mềm Observium đáp ứng được cơ bản yêu cầu quản trị mạng của hệ thống bao gồm:
− Quản lý được dữ liệu quan trọng, và các thông tin cơ bản của các thiết bị trong hệ thống kịp thời chính xác.
− Xây dựng thành công cơ chế cảnh báo online và hiển thị cảnh báo trên màn hình tiện ích quan trọng cho việc quản trị.
2. Hạn Chế
− Khi triển khai trên cùng một server ảo hóa như vậy số lượng server vật lý sẽ giảm đi nhưng khi server vậy lý gặp sự cố tắt đột ngột thì server giám sát sẽ không còn hoạt động.
− Phát hiện các cảnh báo giả, dẫn đến việc cảnh báo đúng và cảnh báo giả xuất hiện cùng nhau.
3. Hướng phát triển tiếp theo
Người quản trị cần trau dồi kỹ năng và kiến thức về quản trị mạng, mạng máy tính về cách thức tổ chức, xây dựng hệ thống giám sát cũng như quy hoạch hệ thống. Nghiên cứu và phát triển trên Raspberry Pi như một giải pháp tiết kiệm năng lượng và giám sát các thiết bị IOT.