6. Nội dung luận văn:
3.1. Lựa chọn mô hình thử nghiệm bằng phần mềm giám sát Nagios core
3.1.1. Giới thiệu tổng quát hệ thống theo dõi mạng Nagios
Nagios là một công cụ để giám sát hệ thống. Điều này có nghĩa là nó liên tục kiểm tra trạng thái của máy và dịch vụ khác nhau trên các máy. Mục đích chính của hệ thống giám sát là để phát hiện và báo cáo về bất kỳ hệ thống không hoạt động, càng sớm càng tốt, do đó, ta nhận thức đƣợc vấn đề trƣớc khi ngƣời dùng sử dụng.
Nagios không thực hiện bất kỳ kiểm tra máy chủ hoặc các dịch vụ nào trên của máy chủ Nagios. Nó sử dụng plugin để thực hiện việc kiểm tra thực tế. Điều này làm cho nó có tính linh hoạt cao, và là giải pháp hiệu quả cho việc thực hiện và kiểm tra dịch vụ.
Đối tƣợng giám sát của Nagios đƣợc chia thành hai loại: host và dịch vụ. Host là các máy vật lý (máy chủ, bộ định tuyến, máy trạm, máy in và vv), trong khi dịch vụ là những chức năng cụ thể, ví dụ, một máy chủ web (một quá trình xử lý http) có thể đƣợc định nghĩa nhƣ là một dịch vụ đƣợc giám sát. Mỗi dịch vụ có liên quan đến một máy chủ là dịch vụ đang chạy trên đó. Ngoài ra, cả hai máy và dịch vụ có thể đƣợc nhóm lại thành các nhóm dịch cho phù hợp.
Nagios có hai ƣu điểm lớn khi nói đến quá trình giám sát, thay vì theo dõi các giá trị, nó chỉ sử dụng bốn mức độ để mô tả tình trạng: OK, WARNING, CRITICAL, và UNKNOW. Các mô tả tình trạng của các đối tƣợng đƣợc giám sát cho phép ngƣời quản trị quyết giải quyết hay bỏ qua các vấn đề trên hệ thống mà không tốn nhiều thời gian. Đây chính là điều Nagios làm. Nếu ta đang theo dõi một giá trị số nhƣ số lƣợng không gian đĩa và tải CPU, ta có thể định nghĩa ngƣỡng những giá trị để đƣợc cảnh báo khi cần thiết.
Một thuận tiện khác của Nagios là các báo cáo về trạng thái của các dịch vụ đang hoạt động. Báo cáo này cung cấp một cái nhìn tổng quan tốt về tình trạng cơ sở hạ tầng. Nagios cũng cung cấp các báo cáo tƣơng tự cho các nhóm máy
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ chủ và các nhóm dịch vụ, cảnh báo khi bất kỳ dịch vụ quan trọng hoặc cơ sở dữ liệu server ngƣng hoạt động. Báo cáo này cũng có thể giúp xác định độ ƣu tiên của các vấn đề nhƣ vấn đề nào cần đƣợc giải quyết trƣớc.
Nagios thực hiện tất cả các kiểm tra của mình bằng cách sử dụng plugins. Đây là những thành phần bên ngoài mà Nagios qua đó lấy đƣợc thông tin về những gì cần đƣợc kiểm tra và cung cấp các cảnh báo cho ngƣời quản trị. Plugins có trách nhiệm thực hiện các kiểm tra và phân tích kết quả. Các đầu ra từ một kiểm tra đó là một trạng thái (OK, WARNING, CRITICAL, hoặc UNKNOW) và các văn bản bổ sung cung cấp thông tin về các dịch vụ cụ thể. Văn bản này chủ yếu dành cho các quản trị viên hệ thống để có thể đọc một trạng thái chi tiết của một dịch vụ.
Nagios không chỉ cung cấp một hệ thống cốt lõi để theo dõi, mà còn cung cấp một tập các plugins tiêu chuẩn trong một gói riêng biệt (xem http://nagiosplugins.org/ để biết thêm chi tiết). Những plugin này cho phép kiểm tra các dịch vụ đang chạy trên hệ thống. Ngoài ra nếu ta muốn thực thi một kiểm tra đặc biệt, ta có thể tạo một plugin riêng cho mình.
3.1.2. Các chức năng cơ bản
Các chức năng của Nagios rất linh hoạt, nó có thể đƣợc cấu hình để theo dõi cơ sở hạ tầng CNTT theo cách ta muốn. Nó cũng có một cơ chế để tự động phản ứng với các vấn đề, và một hệ thống cảnh báo mạnh. Tất cả điều này đƣợc dựa trên một hệ thống định nghĩa các đối tƣợng rõ ràng:
Commands: đƣợc định nghĩa về cách Nagios cần thực hiện các loại kiểm
tra, chúng là một lớp trừu tƣợng cho phép ta nhóm các hoạt động tƣơng tự lại với nhau.
Time-periods: là ngày và thời gian kéo dài mà trong đó một hoạt động nên
hay không nên đƣợc thực hiện, ví dụ: Thứ hai đến thứ sáu 9:00-17:00.
Contacts và Contact groups: là những ngƣời cần đƣợc cảnh báo, cùng với
thông tin về cách thức và thời gian họ cần đƣợc cảnh báo. Contacts có thể đƣợc nhóm lại thành Contact groups.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
Host: là những máy vật lý, cùng với thông tin về việc ai sẽ đƣợc liên lạc, làm thế nào kiểm tra phải đƣợc thực hiện, và khi nào. Host có thể đƣợc nhóm lại thành các Host group, mỗi host có thể là một thành viên của nhiều Host group.
Services: là các chức năng khác nhau hoặc các tài nguyên cần đƣợc giám
sát, cùng với thông tin về những ngƣời cần đƣợc liên lạc, làm thế nào kiểm tra phải đƣợc thực hiện, và khi nào. Service có thể đƣợc nhóm lại thành các service group, mỗi service có thể là một thành viên của nhiều service group.
Host và service escalation: định nghĩa khoảng thời gian đƣợc chỉ ra mà sau
đó ngƣời phụ nên đƣợc cảnh báo của các sự kiện nào đó - ví dụ một máy chủ quan trọng là ngƣng hoạt hơn 4 giờ nên cảnh báo cho quản trị viên để họ bắt đầu theo dõi các vấn đề.
Một tiện ích quan trọng ta sẽ đạt đƣợc bằng cách sử dụng Nagios là một hệ thống phụ thuộc. Đối với các quản trị viên, rõ ràng là nếu router bị hỏng, tất cả các máy truy cập thông qua nó sẽ thất bại. Nagios cho phép ta định nghĩa phụ thuộc giữa các máy để hình thành cấu trúc liên kết mạng lƣới thực tế. Ví dụ, nếu một switch, cho kết nối ta với một bộ định tuyến ngƣng hoạt động, Nagios sẽ không thực hiện bất kỳ kiểm tra trên router hoặc trên các máy tính phụ thuộc vào router.
Điều này đƣợc minh họa trong ví dụ sau đây:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ Ta cũng có thể định nghĩa rằng một dịch vụ phụ thuộc vào một dịch vụ khác, hoặc trên cùng một máy chủ hoặc trên các máy chủ khác nhau. Nếu một trong các dịch vụ là ngƣng hoạt động, một kiểm tra cho một dịch vụ mà phụ thuộc vào nó sẽ không đƣợc thực hiện. Ví dụ, đối với mạng nội bộ của ứng dụng công ty hoạt động tốt, cả hai máy chủ web cơ bản và cơ sở dữ liệu một máy chủ đều hoạt động. Vì vậy, nếu một dịch vụ cơ sở dữ liệu không hoạt động, Nagios sẽ không thực hiện kiểm tra các ứng dụng. Máy chủ cơ sở dữ liệu có thể là trên cùng một máy hoạt khác máy.Trong một trƣờng hợp nhƣ vậy, nếu máy bị hỏng hoặc không thể truy cập, cảnh báo cho tất cả các dịch vụ phụ thuộc vào các dịch vụ cơ sở dữ liệu sẽ không đƣợc gửi.
Nagios cũng cung cấp cơ chế để lên lịch cho kế hoạch ngƣng hoạt động vì một vài lý do nào đó nhƣ bảo trì hoặc nâng cấp hệ thống. Ta có thể lên lịch cho một máy chủ cụ thể hoặc dịch vụ dự kiến không có sẵn. Điều này sẽ ngăn chặn Nagios thông báo cho ngƣời đƣợc cấu hình cần gửi cảnh báo về các vấn đề liên quan đến đối tƣợng này. Nagios cũng có thể thông báo cho mọi ngƣời kế hoạch ngƣơng hoạt động một cách tự động. Điều này chủ yếu đƣợc sử dụng khi bảo trì cơ sở hạ tầng IT và hệ thống cũng nhƣ dịch vụ ngƣng hoạt động trong một thời gian dài.
* Tóm lại:
Nagios hoạt động bằng cách kiểm tra xem một máy chủ hoặc dịch vụ có hoạt động tốt không và lƣu trữ trạng thái của nó. Bởi vì trạng thái của một dịch vụ chỉ là một trong bốn giá trị OK, WARNING, CRITICAL, UNKNOW. Điều quan trọng là nó thực sự xác định đƣợc tình trạng hiện tại. Để tránh phát hiện tạm thời và ngẫu nhiên vấn đề, Nagios sử dụng trạng thái tạm thời và cố định mô tả tình trạng hiện tại của một máy chủ lƣu trữ hoặc dịch vụ.
Có nhiều lợi ích khi sử dụng hệ thống giám sát. Nó đảm bảo rằng các dịch vụ đang làm việc một cách chính xác. Nó giúp phát hiện các vấn đề trƣớc và đảm bảo rằng những ngƣời thích hợp sẽ đƣợc cảnh báo khi có sự cồ xảy ra. Đảm bảo rằng tất cả các dịch vụ hoạt động tốt là điều cần thiết. Trong trƣờng hợp xảy
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ các vấn đề, hệ thống sẽ giúp đỡ trong việc đƣa ra một bức tranh rõ ràng về những gì đang làm việc, và những gì không. Nagios là một ứng dụng rất mạnh cho việc giám sát tài nguyên. Nó phù hợp với cả các hệ thống lớn và nhỏ. Nó có thể giúp tổ chức duy trì chất lƣợng dịch vụ cao hơn. Nagios cũng giúp trong việc xác định nguyên nhân gốc rễ của vấn đề. Nó bao gồm cơ chế rất linh hoạt để theo dõi và thông báo về cơ sở hạ tầng. Nagios là một công cụ cực kỳ mạnh mẽ nhƣ nó có thể đƣợc cấu hình theo bất kỳ cách nào ta muốn. Hơn nữa nó cũng có thể đƣợc mở rộng để nếu có nhu cầu.
3.2. Xây dựng hệ thống dựa trên mã nguồn mở Nagios 3.2.1. Mô hình triển khai
Với mục đích quản lý các dịch vụ của bệnh viện, quản lý các máy trạm
tại Khoa phòng , máy làm việc của nhân viên. Đây là hệ thống đang trong giai đoạn trình ban Giám đốc bệnh viện nên hệ thống thử nghiệm đƣợc cài thử nghiệm trên máy ảo. Mô hình thử nghiệm gồm có:
+ Máy chủ giám sát dịch vụ mạng cài ubuntu server, cài nagios để giám sát các dịch vụ.
+ Máy chủ chạy dịch vụ web,dịch vụ ftp trên ubuntu server. + Máy client xp.
3.2.1.1 Mục đích hệ thống thử nghiệm.
- Giám sát các dịch vụ phục vụ công tác của Bệnh viện.
- Giám sát các thiết bị đầu cuối phục vụ khoa phòng chức năng.
Bƣớc đầu giám sát dịch mạng, máy trạm phục vụ công tác điều hành hệ thống Bệnh viện tiến tới phục vụ nâng cấp hệ thống mạng bệnh viện khi đó nagios còn dùng để giám sát lƣu lƣợng mạng, giám sát máy in, giám sát router…
3.2.1.2. Yêu cầu hệ thống
- Máy chủ ubuntu 12.04 cài nagios theo dõi hệ thống mạng. - Máy chủ ubuntu 12.04 chạy dịch vụ http, ftp.
- Máy client chạy window xp. - Máy in có địa chỉ Ip.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
3.2.1.3. Kịch bản thử nghiệm
- Giám sát dịch vụ mạng: * Giám sát dịch vụ web http
- Trên hệ điều hành window(IIS) - Trên hệ điều hành linux(Apache) * Giám sát dịch vụ file ftp
* Giám sát hệ quản trị cơ sở dữ liệu mysql... - Giám sát các thiết bị đầu cuối:
* Máy chạy hệ điều hành window - Theo dõi dung lƣợng ổ cứng - Ser đang logon ...
* Máy chủ chạy hệ điều hành linux
- Theo dõi dung lƣợng ổ cứng; User đang logon ... * Theo dõi máy in mạng
- Cảnh báo từ hệ thống qua mail và âm thanh khi có sự cố mạng xẩy ra - Tổng hợp, lƣu giữ và báo cáo định kỳ về tình trạng hoạt động của hệ thống
3.2.2. Cài đặt mô hình thử nghiệm 3.2.2.1. Mô hình thử nghiệm 3.2.2.1. Mô hình thử nghiệm
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ Phần này cung cấp những hƣớng dẫn cơ bản về cách cài đặt mã nguồn Nagios trên Debian/Ubuntu..
Nagios và các plugin đƣợc đặt trong thƣ mục /usr/local/nagios.
Giao diện web Nagios đƣợc truy cập qua địa chỉ http://localhost/nagios/
Hình 3.3 – Giao diện Map của hệ thống
3.2.2.2. Kết quả thử nghiệm
a. Thống kê tình trạng hoạt động của một số host
Học viên đã cài đặt trên hệ thống mạng của Bệnh viện Điều dƣỡng và Phục hồi chức năng tỉnh Phú Thọ
Hình ảnh dƣới đây thể hiện hoạt động của hệ thống gồm: - Máy chủ ubuntu 12.04 cài nagios version 3.2.3
- Máy client chạy window xp:
+Máy bachup data phần mềm quản lý bệnh viện(PMTBVPHCN) +Máy tính các khoa phòng:Khoa Khám bệnh,…
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ Hình 3.4– Hoạt động của hệ thống giám sát ngày 17/9/2013
b. Giám sát thiết bị đầu cuối
Thống kê tình trạng hoạt động của máy chủ và thiết bị đầu cuối. Hệ thống giám sát cung cấp thông tin về máy chủ, máy trạm có hoạt động hay không.
Hình 3.5 – Thông tin các dịch vụ trong hệ thống Status (Trạng thái)
- Ok (màu xanh) : hoạt động ổn định
- CRITICAL, WARNING (màu đỏ): giám sát việc sử dụng
CPU,Memory,HDD,... và đƣa ra cảnh báo CRITICAL nếu tải CPU là 90%, hoặc cảnh báo WARNING nếu tải CPU là 80% trong vòng 5 phút.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ Last check :thời gian kiểm tra gần nhất
Duration: thời gian hoạt động
Status Information: Thông tin trạng thái CPU load, Memory use,... c. Báo cáo dịch vụ host trong khoảng thời gian
Hình 3.6 – Hệ thống hiển thị máy tính đang bật
- Giám sát các đặc điểm máy chủ:
Hình 3.7 – Các đặc điểm đƣợc giám sát của máy chủ Giám sát:
+ Trạng thái máy bật tắt,
+ Current Users:Có bao nhiêu user + Lệnh ping: % packet loss,RTA + Swap Usage: % free
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/ Hình chụp một số cảnh báo đƣợc đƣa ra và đƣợc ghi lại trong tệp log. Cảnh báo OK lag ghi nhận dịch vụ trở lại hoạt động. Cảnh báo hình chấm than là dịch vụ ngừng hoạt động
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
KẾT LUẬN VÀ ĐỀ NGHỊ 1. Kết luận
Sau một thời gian thực hiện, em đã hoàn thành luận văn và đạt đƣợc một số kết quả nhất định.Trong luận văn này, em đã cố gắng trình bày những kiến thức cơ bản về quản trị mạng và giám sát mạng trong kiến trúc quản trị mạng SNMP. Luận văn tập trung chủ yếu vào các vấn đề: Tổng quan về quản trị mạng và giám sát mạng, quản trị mạng và giám sát mạng dựa trên giao thức SNMP. Từ đó tiến hành xây dựng hệ thống giám sát mạng thử nghiệm dựa trên mã nguồn mở.
Đề tài đã nghiên cứu, triển khai và hoàn thành những vấn đề sau:
Lý thuyết: Về vấn đề quản trị và giám sát: đề tài đi sâu phân tích về kiến trúc
quản trị mạng và giám sát mạng; Về giao thức quản lý mạng: đề tài đã trình bày rất kỹ về giao thức quản lý mạng đơn giản (Simple Network Management Protocol) bao gồm: khái niệm giao thức quản lý mạng, các thành phần trong giao thức quản lý mạng, và cách hoạt động của giao thức quản lý mạng. Vai trò của giao thức SNMP trong việc quản trị mạng từ xa.
Thực nghiệm: Đề tài đƣa ra mô hình triển khai và trình bày toàn bộ các bƣớc
cấu hình các hệ thống giám sát theo mô hình triển khai đã đề ra.
Những kết quả đạt đƣợc
- Có các kiến thức về giám sát hệ thống, các giao thức quản lý mạng.
- Triển khai thành công mô hình giám sát hệ thống tại Bệnh viện nơi em đang công tác..
2. Đề nghị
- Tích hợp các giải pháp giám sát khác vào hệ thống giám sát Nagios đã có sẵn nhằm tối ƣu hóa hệ thống này.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/
TÀI LIỆU THAM KHẢO Tiếng Việt
[1] Giáo trình hệ thống mạng máy tính CCNA, Nhà xuất bản LĐXH, 2004.
[2] Nguyễn Tiến Ban (2009), Bài giảng Quản lý mạng viễn thông, Học viện Công nghệ Bƣu chính viễn thông.