1. Trang chủ
  2. » Công Nghệ Thông Tin

Đánh giá hiện trạng và đề xuất triển khai nagios

9 467 3

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Hệ thống cảnh báo giám sát được chia làm 2 phần: Giám sát hệ thống hạ tầng: Đường truyền, thiết bị, máy chủ, OS … Giám sát ứng dụng dịch vụ và Database Giám sát phần hạ tầng hiện nay đang dùng 2 công cụ là Solarwinds Orion (Network Performance Monitor) và Paessler PRTG Network Monitor – cả hai đều là phiên bản crack. Giám sát phần ứng dụng dịch vụ hiện nay được thực hiện thủ công, dùng các công cụ đơn giản như định kỳ mở log file kiểm tra nội dung, sử dụng web tra cứu để kiểm tra giao dịch lỗi, kiểm tra các cổng kết nối bằng cách truy cập vào (ping, telnet),… Database thì chưa có giám sát chi tiết các thông số hoạt động. Nhóm vận hành định kỳ thực hiện các thao tác kiểm tra với tất cả các ứng dụng dịch vụ hết khoảng 30 phút. Và việc xác định vấn đề dựa vào kiến thức, kinh nghiệm cá nhân. Cách thực hiện như vậy chứa đựng nhiều sai sót, rủi ro và bất cập như phát hiện thụ động sự cố, phức tạp trong việc xác định vấn đề. Khi có sự cố thì quá trình kiểm tra bị dừng lại không kiểm tra được tiếp vì phải xử lý sự cố đó. Hiện nay cũng không có báo cáo chất lượng dịch vụ định kỳ.

Cho sống đơn giản CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 ĐÁNH GIÁ HỆ THỐNG GIÁM SÁT NAGIOS Hiện trạng hệ thống giám sát & cảnh báo Hệ thống cảnh báo giám sát chia làm phần: - Giám sát hệ thống hạ tầng: Đường truyền, thiết bị, máy chủ, OS … - Giám sát ứng dụng dịch vụ Database Giám sát phần hạ tầng dùng công cụ Solarwinds Orion (Network Performance Monitor) Paessler PRTG Network Monitor – hai phiên crack Giám sát phần ứng dụng dịch vụ thực thủ công, dùng công cụ đơn giản định kỳ mở log file kiểm tra nội dung, sử dụng web tra cứu để kiểm tra giao dịch lỗi, kiểm tra cổng kết nối cách truy cập vào (ping, telnet),… Database chưa có giám sát chi tiết thông số hoạt động Nhóm vận hành định thao tác kiểm tra với tất ứng dụng dịch vụ hết khoảng 30 phút Và việc xác định vấn đề dựa vào kiến thức, kinh nghiệm cá nhân Cách chứa đựng nhiều sai sót, rủi ro bất cập phát thụ động cố, phức tạp việc xác định vấn đề Khi có cố trình kiểm tra bị dừng lại không kiểm tra tiếp phải xử lý cố Hiện báo cáo chất lượng dịch vụ định kỳ Đánh giá số giải pháp giám sát a Monit Monit không đơn giản công cụ giám sát máy chủ bạn, hỗ trợ xử lý cố cách định nghĩa trước cách xử lý trường hợp định Ví dụ, máy chủ database bạn bị crashes, Monit tự động khởi động lại dịch vụ database hành động cách thức xử lý mong muốn b Ganglia Phần mềm Ganglia kiểm tra việc hoạt động cụm cluster có tốt hay không, đưa kết overview cụm cluster c Munin Phần mềm Munin giám sát tham số liên quan đến hiệu hệ thống, đặc biệt hiển thị dạng đồ thị Dữ liệu đồ thị hiển thị dạng thống kê theo ngày, tuần, tháng, năm Công cụ giám sát tài nguyên hệ thống memory, disk space, CPU ứng dụng MySQL, Apache, Squid d Cacti Cho sống đơn giản e f g h i CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 Phần mềm Cacti có nhiều điểm giống với Munin Điểm khác chỗ Cacti cho phép định dạng lại liệu đồ thị xem liệu đoạn thời gian tùy ý Trong Munin, liệu đồ thị hiển thị dạng theo ngày, tuần, tháng, năm Cacti đưa tổng hợp liệu dạng gần nhất, gần nhất, tháng gần nhất, … chọn zoom vào vùng liệu đồ thị muốn xem Nagios Nagios xem phần mềm “tiêu chuẩn” việc giám sát hạ tầng CNTT Nagios “khó” việc cài đặt cấu hình, nhiên nhiều tính mà phần mềm khác có được, kể phần mềm thương mại tiếng dành cho quản trị viên Nagios hỗ trợ giám sát nhiều host, service khác lúc gởi cảnh báo thông qua email, SMS Giống Monit, cấu hình để tự động đưa hành động đáp ứng (được định nghĩa trước) với cố xảy Zabbix Zabbix công cụ có khả giám sát hiệu máy chủ, ứng dụng web, CSDL, thiết bị mạng Zabbix thiết kế linh động cho nhiều môi trường khác nhau, từ nhỏ đến lớn Zabbix hoàn toàn phiên thương mại Observium Observium hỗ trợ tự động phát thiết bị mạng hệ thống, tìm kiếm thiết bị bạn quan tâm muốn giám sát Tính so sánh với việc cách phần mềm/phần cứng wifi laptop tìm tín hiệu wifi xung quanh Observium cung cấp đồ thị chi tiết, cài đặt song song với Nagios Zenoss Zenoss phiên nguồn mở miễn phí công cụ giám sát máy chủ thương mại Zenoss Enterprise, viết ngôn ngữ Python Công cụ hỗ trợ định dạng plugin Nagios, nhiều plugins Nagios sử dụng Zenoss Một điểm mạnh Zenoss đầy đủ tính giao diện người dùng quản trị đơn giản Collectd Collectd phần mềm tương tự Munin Cacti chỗ liệu thu thập hiển thị dạng đồ thị Phần mềm thiết kế tiêu hao tài nguyên, đặc biệt hữu hiệu cho hệ thống low-end hệ thống nhúng (embedded systems) Nó thu thập liệu 10s mà không làm trở ngại đến việc xử lý tiến trình xử lý máy chủ Các extension phần mềm viết C, Perl, Java Cho sống đơn giản j CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 Argus Argus tập trung vào việc giám sát thiết bị mạng, hỗ trợ Ipv4 Ipv6 Phần mềm có quy trình cảnh báo thú vị: sau cảnh báo mà cố không giải khoảng thời gian định (ví dụ network administrator nhà), cảnh báo gởi đến cho người khác Đánh giá hệ thống Nagios Không giống nhiều công cụ giám sát khác, Nagios không bao gồm chế nội để kiểm tra tình trạng máy chủ dịch vụ mạng Thay vào đó, Nagios dựa chương trình bên (gọi plugin) để làm tất công việc Các plugin chương trình viết C/C++, Perl, Ruby, Python, PHP, C#, Java dạng shell scripts hay biên dịch file thực thi Như tuỳ theo việc cần giám sát đối tượng ta viết plugin để thực thu thập thông tin Hiện tham khảo cộng đồng mã nguồn mở hàng trăm ngàn người phát triển hỗ trợ plugin cho Nagios Có khả kết hợp với nhiều công cụ khác để thực giải pháp tổng thể như: - Giải pháp phòng chống công xâm nhập an ninh mạng triển khai Nagios ipTables - Giải pháp phát ngăn chặn giao dịch giả mạo - Giải pháp tự động chuyển dịch vụ sang hệ thống dự phòng hệ thống lỗi - … Nagios nhiều tổ chức tài ngân hàng sử dụng, đơn vị có hệ thống CNTT lớn Liên tục từ năm 2006 đến 2014 Nagios diễn đàn, tạp chí CNTT lớn (LinuxQuestions.org, LinuxJournal.com, SourceForge.net, InfoWorld.com, InformationWeek.com ) bình Figure 1: Nguồn http://www.nagios.com/awards/ chọn Ứng dụng giám sát năm, Ứng dụng giám sát tốt Cho sống đơn giản CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 Đề xuất triển khai hệ thống Nagios Được đạo BĐH Khối sau thời gian tháng nghiên cứu triển khai thử nghiệm số Server ứng dụng thực tế, Tôi đánh giá hệ thống Nagios hoàn toàn đáp ứng nhu cầu giám sát cảnh báo hệ thống ứng dụng, dịch vụ công ty với ưu điểm như: Cách thức giám sát đa dạng đáp ứng hầu hết nhu cầu Cơ chế xác định vấn đề tốt: State, State type, Flapping Cơ chế cảnh báo thông minh: Contact; Timeperiod; Schedule Downtime; Response; Escalation - cảnh báo theo cấp độ; Parent; Dependencies Tuỳ biến plugin để giám sát loại ứng dụng dịch vụ kể ứng dụng private Như với việc triển khai Nagios để giám sát cảnh báo hoạt động hệ thống ứng dụng dịch vụ mang lại lợi ích: Phát cố sớm Xác định vấn đề cách nhanh Báo cáo giám sát chất lượng định kỳ Kế hoạch triển khai Bước đầu triển khai giám sát ứng dụng dịch vụ Database - Giám sát Log file ứng dụng: Telcos, Banks o Counter số lượng giao dịch (thành công, không thành công, timeout) theo phút: thể theo biểu đồ realtime, phát số lượng giao dịch thay đổi tăng/giảm đột biến đưa cảnh báo o Phát log bất thường kết nối, lỗi dịch vụ o Template đăng ký giám sát & cảnh báo mẫu (cuối file) - Giám sát file CDR o Giám sát việc xuất file CDR sang Telco, cảnh báo có bất thường o Template đăng ký giám sát & cảnh báo mẫu (cuối file) - Giám sát cổng dịch vụ đối tác cung cấp cho VNPAY o Kiểm tra URL WebService/API để đảm bảo URL response o Kiểm tra port TCP để đảm bảo khả dịch vụ đối tác hoạt động o Kịp thời nhận biết thông báo đối tác xử lý - Giám sát Database o Giám sát thông số hoạt động Database: Connected User, Connection Time, Session Usage, Datafiles I/O traffic, Tablespace, Sql Runtime… cảnh báo vượt ngưỡng xác định Cho sống đơn giản - CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 o Template đăng ký giám sát & cảnh báo mẫu (cuối file) Đưa báo cáo định kỳ chất lượng dịch vụ (SLA) o Availability – Mức độ sẵn sàng dịch vụ o Báo cáo SLA o Capacity Planning o Báo cáo trạng thái dịch vụ 24h qua o Thống kê cảnh báo 24h qua Một số biểu đồ thực tế Các biểu đồ realtime show hình TV để theo dõi Figure 2: Dashboard Cho sống đơn giản CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 Figure 3: Biểu đồ realtime giao dịch Topup Figure 4: Biểu đồ realtime giao dịch VinaphoneTopup successed/failed Cho sống đơn giản CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 Figure 5: Biểu đồ phát dấu hiệu warning log file Figure 6: Số lượng mail gửi/nhận server mail vnpay Cho sống đơn giản CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 Figure 7: Biểu đồ nhiệt độ phòng máy Figure 8: Điện áp Vào/Ra UPS Cho sống đơn giản CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VN-VNPAY Toà nhà 22 Phố Láng Hạ, Quận Đống Đa, TP Hà Nội Điện thoại: (04)776 4668 Fax: (04) 776 4666 TEMPLATE MẪU Giám sát & cảnh báo ứng dụng (Logfile) STT 10 11 12 13 Tên HOST OS Tên dịch vụ Đối tác Logfile Cổng kết nối đối tác Mẫu log giao dịch thành công x Mẫu log gdịch không thành công y Mẫu log lỗi dịch vụ z Contacts Mô tả IP or Hostname Hệ điều hành Tên đối tác kết nối Đường dẫn log file local URL TCP(IP:Port) Cảnh báo số giao dịch thành công < x Cảnh báo số giao dịch không thành công > y Cảnh báo số lỗi > z Contact nhận cảnh bảo (email;mobile) TEMPLATE MẪU Giám sát & cảnh báo gửi file CDR STT Tên HOST OS Tên Telco Thư mục Outbox t1 Thư mục Archive t1 Contacts Mô tả IP or Hostname Hệ điều hành Thư mục file CDR chờ gửi Cảnh báo thời gian từ xuất file đến hiên > t1 Thư mục lưu trữ file CDR Số lượng file t1 phút phải có; cảnh báo it Contact nhận cảnh bảo (email;mobile) TEMPLATE MẪU Giám sát & cảnh báo Database STT Tên HOST OS Database Username/password Instance/ServiceName Contacts Mô tả IP or Hostname Hệ điều hành Oracle; MsSQL;… Tài khoản để giám sát DB Contact nhận cảnh bảo (email;mobile)

Ngày đăng: 09/05/2016, 11:10

Xem thêm: Đánh giá hiện trạng và đề xuất triển khai nagios

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN