Nghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPTNghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPT
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG –––––––––––––––––––––––––––––––––––––––
Trang 2Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS Vũ Tuấn Lâm
Phản biện 1:
Phản biện 2:
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông Vào lúc: ……… giờ ……… ngày ……… tháng ……… năm ………
Có thể tìm hiểu luận văn tại:
– Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3Việc giám sát cho phép người quản lý phát hiện kịp thời các bất thường trong thời gian thực của hệ thống Việc điều khiển giúp người quản lý xử lý kịp thời các vấn đề phát sinh, tránh để lan rộng ra hệ thống Việc báo cáo không chỉ để người quản lý và những người liên quan nắm được tình trạng hệ thống theo ngày, tuần, tháng, quý, năm, mà có thể dự kiến, phòng ngừa, cải tiến, nâng cấp hệ thống nhằm đáp ứng nhu cầu thực tế
Vì những lẽ đó, kết hợp với tình hình thực tế công việc của bản thân, học viên xin
chọn đề tài “Nghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại Tập
đoàn VNPT”
Luận văn gồm 3 chương
Chương 1: Tổng Quan Về Các Hệ Thống Giám Sát Mạng Và Ứng Dụng
Trong chương 1, học viên sẽ trình bày kết quả nghiên cứu của học viên về giao thức quản lý mạng SNMP Bên cạnh đó, học viên cũng sẽ giới thiệu về các phần mềm quản lý và giám sát hệ thống thông dụng và đang được áp dụng tại nơi học viên đang công tác
Chương 2: Phân Tích, Đánh Giá Hiện Trạng Hệ Thống Giám Sát Quản Trị Mạng Và Ứng Dụng Tại Tập Đoàn VNPT
Trong chương 2, học viên sẽ trình bày hiện trạng hệ thống tại Tập đoàn VNPT, giới thiệu về các hệ thống đang được áp dụng tại đây, cũng như phân tích ưu, nhược điểm và các vấn đề cần cải thiện
Chương 3: Xây Dựng Hệ Thống Giám Sát Quản Trị Mạng Và Ứng Dụng Tại Tập Đoàn VNPT
Trong chương này, học viên sẽ trình bày về các hệ thống quản trị cơ sở dữ liệu tại Tập đoàn VNPT; giới thiệu về hệ thống giám sát ứng dụng cơ sở dữ liệu bằng Oracle Cloud
Trang 4Contro, cũng như báo cáo các kết quả đạt được trong tiến trình xây nghiên cứu, xây dựng hệ thống tại Tập đoàn VNPT
2 Tổng quan về vấn đề nghiên cứu:
Hiện nay, tại Việt Nam, việc nghiên cứu ứng dụng phần mềm Oracle Cloud Control còn rất hạn chế Trong khi đó, các phần mềm PRTG, Nagios và Cacti được sử dụng phổ biến hơn Còn lại, trên thế giới, việc nghiên cứu ứng dụng phần mềm Oracle Cloud Control đã và đang được thực hiện rộng rãi, với nhiều tài liệu, sách báo có chất lượng chuyên môn và hàm lượng kiến thức cao, phục vụ thiết thực cho việc học tập, nghiên cứu và áp dụng vào công việc của học viên
– Nghiên cứu, vận hành tốt các hệ thống giám sát PRTG, Nagios và Cacti
– Có phương án cải tiến, nâng cao chất lượng hoạt động giám sát hệ thống dịch vụ tại Tập đoàn VNPT
– Nghiên cứu, xây dựng thành công hệ thống giám sát mạng và ứng dụng cơ sở dữ liệu bằng phần mềm Oracle Cloud Control
4 Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu:
– Các hệ thống giám sát quản trị mạng và ứng dụng PRTG, Nagios, Cacti
– Hệ thống giám sát mạng và ứng dụng cơ sở dữ Oracle Cloud Control
Phạm vi nghiên cứu:
– Tập đoàn VNPT, nơi học viên đang công tác
5 Phương pháp nghiên cứu:
Trang 5– Trao đổi, thảo luận với giảng viên hướng dẫn, bạn học, đồng nghiệp và những người
có kiến thức về các vấn đề liên quan
Về mặt thực tiễn:
– Cài đặt phần mềm trên các hệ thống máy tính trong môi trường thử nghiệm dưới dạng các bài lab, máy ảo, máy test
– Cài đặt các phần mềm trong môi trường thực tế
– Đưa vào sử dụng khi đáp ứng được yêu cầu và nhiệm vụ
– Tiến hành quản trị, theo dõi, giám sát, điều khiển, báo cáo trên các hệ thống đã cài đặt – Đào tạo, chuyển giao công nghệ
Trang 6Chương 1 – TỔNG QUAN VỀ CÁC HỆ THỐNG GIÁM SÁT MẠNG
VÀ ỨNG DỤNG
1.1 Giao thức giám sát mạng SNMP
1.1.1 Giám sát thiết bị mạng
Để đảm bảo tính ổn định của các hệ thống mạng thì việc giám sát thường xuyên tài nguyên, trạng thái của thiết bị mạng là nhu cầu thiết yếu Để giải quyết nhu cầu đó, 3 bài toán thường được gặp trong thực tế là:
– Bài toán thứ nhất: Giám sát tài nguyên máy chủ
– Bài toán thứ hai: Giám sát lưu lượng trên các port của switch, router
– Bài toán thứ ba: Hệ thống tự động cảnh báo sự cố tức thời
Điểm chung trong cả 3 bài toán đó là việc chúng ta cùng lúc phải giám sát một lượng lớn các tham số, trên một tập lớn các chủng loại thiết bị và hãng sản xuất Đồng thời, bên cạnh việc định kỳ giám sát các tham số của thiết bị, chúng ta cũng cần có các cơ chế nhận cảnh báo chủ động từ thiết bị để đảm bảo xử lý kịp thời các sự cố của hệ thống Giao thức SNMP được thiết kế để có thể giải quyết cả 3 bài toán nêu trên
1.1.2 Hai phương thức giám sát Poll và Alert
Trước khi tìm hiểu SNMP, chúng ta cần hiểu về hai phương thức giám sát “Poll” và
“Alert” Đây là 2 phương thức cơ bản của các kỹ thuật giám sát hệ thống, nhiều phần mềm
và giao thức được xây dựng dựa trên 2 phương thức này, trong đó có SNMP [2]
– Phương thức Poll
Nguyên tắc hoạt động: Trung tâm giám sát (manager) sẽ thường xuyên hỏi thông tin của thiết bị cần giám sát (device) Nếu Manager không hỏi thì Device không trả lời, nếu Manager hỏi thì Device phải trả lời Bằng cách hỏi thường xuyên, Manager sẽ luôn cập nhật được thông tin mới nhất từ Device
– Phương thức Alert:
Nguyên tắc hoạt động: Mỗi khi trong Device xảy ra một sự kiện (event) nào đó thì Device sẽ tự động gửi thông báo cho Manager, gọi là Alert Manager không hỏi thông tin định kỳ từ Device
– So sánh phương thức Poll và Alert
Trang 7Hai phương thức Poll và Alert là hoàn toàn khác nhau về cơ chế Một ứng dụng giám sát có thể sử dụng Poll hoặc Alert, hoặc cả hai, tùy vào yêu cầu cụ thể trong thực tế Bảng 1.1 dưới đây sẽ cho chúng ta thấy ưu nhược điểm của 2 phương thức Ký hiệu so sánh: (+) Ưu điểm, (–) Nhược điểm
Bảng 1.1: So sánh Poll và Alert
(+) Có thể chủ động lấy những thông tin
cần thiết từ các đối tượng mình quan
tâm, không cần lấy những thông tin
không cần thiết từ những nguồn không
quan tâm
(–) Tất cả những event xảy ra đều được gửi về Manager Manager phải có cơ chế lọc những event cần thiết, hoặc Device phải thiết lập được cơ chế chỉ gửi những event cần thiết
(+) Có thể lập bảng trạng thái tất cả các
thông tin của Device sau khi poll qua
một lượt các thông tin đó VD Device có
một port down và Manager được khởi
động sau đó, thì Manager sẽ biết được
port đang down sau khi poll qua một
lượt tất cả các port
(–) Nếu không có event gì xảy ra thì Manager không biết được trạng thái của Device VD Device có một port down và Manager được khởi động sau đó, thì Manager sẽ không thể biết được port đang down
(+) Trong trường hợp đường truyền giữa
Manager và Device xảy ra gián đoạn và
Device có sự thay đổi, thì Manager sẽ
không thể cập nhật Tuy nhiên khi
đường truyền thông suốt trở lại thì
Manager sẽ cập nhật được thông tin mới
nhất do nó luôn luôn poll định kỳ
(–) Khi đường truyền gián đoạn và Device có sự thay đổi thì nó vẫn gửi Alert cho Manager, nhưng Alert này sẽ không thể đến được Manager Sau đó mặc dù đường truyền có thông suốt trở lại thì Manager vẫn không thể biết được những gì đã xảy ra
(+) Chỉ cần cài đặt tại Manager để trỏ
đến tất cả các Device Có thể dễ dàng
thay đổi một Manager khác
(–) Phải cài đặt tại từng Device để trỏ đến Manager Khi thay đổi Manager thì phải cài đặt lại trên tất cả Device để trỏ
về Manager mới
Trang 8(–) Nếu tần suất poll thấp, thời gian chờ
giữa 2 chu kỳ poll (polling interval) dài
sẽ làm Manager chậm cập nhật các thay
đổi của Device Nghĩa là nếu thông tin
Device đã thay đổi nhưng vẫn chưa đến
lượt poll kế tiếp thì Manager vẫn giữ
những thông tin cũ
(+) Ngay khi có sự kiện xảy ra thì Device sẽ gửi Alert đến Manager, do đó Manager luôn luôn có thông tin mới nhất tức thời
1.1.3 Giới thiệu giao thức SNMP
SNMP là một giao thức, do đó nó có những quy định riêng mà các thành phần trong mạng phải tuân theo Một thiết bị hiểu được và hoạt động tuân theo giao thức SNMP được gọi là “hỗ trợ SNMP” (SNMP supported) hoặc “tương thích SNMP” (SNMP compatible)
SNMP dùng để quản lý, nghĩa là có thể theo dõi, có thể lấy thông tin, có thể được thông báo, và có thể tác động để hệ thống hoạt động như ý muốn
1.1.4 Các khái niệm nền tảng của SNMP
Theo RFC1157 2, kiến trúc của SNMP bao gồm 2 thành phần: các trạm quản lý mạng
và các thành phần mạng Thành phần mạng là các thiết bị, máy tính, hoặc phần mềm tương thích SNMP và được quản lý bởi Trạm Quản lý
Ngoài ra còn có khái niệm SNMP agent SNMP agent là một tiến trình (process) chạy trên thành phần mạng, có nhiệm vụ cung cấp thông tin của thành phần cho trạm, nhờ đó trạm
có thể quản lý được thành phần
1.1.5 Các phương thức của SNMP
Giao thức SNMPv1 có 5 phương thức hoạt động, tương ứng với 5 loại bản tin như sau: GetRequest, GetNextRequest, SetRequest, GetResponse và Trap
1.1.6 Các cơ chế bảo mật cho SNMP
Một Trạm Quản lý SNMP có thể quản lý/giám sát nhiều thành phần SNMP, thông qua hoạt động gửi request và nhận trap Tuy nhiên một thành phần SNMP có thể được cấu hình
để chỉ cho phép các Trạm Quản lý SNMP nào đó được phép quản lý/giám sát mình Các cơ chế bảo mật này gồm có: community string, view và SNMP access control list
1.1.7 Cấu trúc bản tin SNMP
SNMP chạy trên nền UDP Cấu trúc của một bản tin SNMP bao gồm: version, community và data Phần Data trong bản tin SNMP gọi là PDU (Protocol Data Unit)
Trang 9SNMPv1 có 5 phương thức hoạt động tương ứng 5 loại PDU Tuy nhiên chỉ có 2 loại định dạng bản tin là PDU và Trap–PDU; trong đó các bản tin Get, GetNext, Set, GetResponse có cùng định dạng là PDU, còn bản tin Trap có định dạng là Trap–PDU
1.2 Giới thiệu một số phần mềm giám sát phổ biến
1.2.1 PRTG
PRTG Network Monitor là một ứng dụng giám sát mạng mạnh mẽ cho các hệ thống dựa trên Windows Nó phù hợp cho các mạng nhỏ, vừa và lớn và có khả năng giám sát mạng LAN, WAN, WLAN và VPN Chúng ta cũng có thể giám sát các máy chủ web, thư và tệp thực, ảo, hệ thống Linux, máy khách Windows, bộ định tuyến và nhiều tính năng khác [6]
1.2.2 Nagios
Nagios Core, phiên bản mã nguồn mở của nền tảng giám sát Nagios, là một tiêu chuẩn công nghiệp để giám sát mạng được lưu trữ trên các hệ thống kiểu Unix, chẳng hạn như GNU / Linux hoặc BSD Nó thường được sử dụng bởi các quản trị viên mạng và hệ thống để kiểm tra kết nối giữa các máy chủ và đảm bảo rằng các dịch vụ mạng đang chạy như mong đợi [6]
1.2.3 Cacti
Cacti là một ứng dụng đo đạc và vẽ biểu đồ nguồn mở Phiên bản đầu tiên của Cacti được phát hành vào ngày 23 tháng 9 năm 2001, và cung cấp một giao diện hoàn chỉnh dựa trên web cho công cụ RRD, hệ thống ghi dữ liệu và vẽ biểu đồ hiệu năng cao được tạo ra bởi Tobias Oetker, hai năm trước đó [4]
1.3 Ưu nhược điểm của các phần mềm giám sát phổ biến
Phần mềm PRTG: Là phần mềm giám sát mạng chuyên nghiệp, với tính năng giám sát mạnh mẽ Tuy nhiên, PRTG là phần mềm trả phí, các chức năng đối với bản thử nghiệm giới hạn Ngoài ra, client chỉ hỗ trợ trên hệ điều hành windows, không linh hoạt như các phần mềm nguồn mở khác
Phần mềm Nagios: Chức năng chính của Nagios là giám sát tình trạng hoạt động của các máy chủ, sau đó được phát triển thêm các plugin để giám sát mạng lưới Bởi vậy ưu điểm của Nagios là làm việc tốt với các cảnh báo không đồng bộ từ hệ thống, SNMP trap Tuy nhiên các tính năng về thống kê lưu lượng mạng lưới không thực sự tốt, cần phải cài thêm các gói từ bên thứ 3
Phần mềm Cacti: Cacti được phát triển từ phần mềm MRTG dùng để đo lường lưu lượng qua các interface của thiết bị mạng, và sau đó được mở rộng để đo lường, thống kê, vẽ
Trang 10biểu đồ các tham số nhận về từ giao thức SNMP Bởi vậy, ưu điểm của Cacti là hỗ trợ việc tạo các biểu đồ, báo cáo một cách dễ dàng Tuy nhiên, nhược điểm là không hỗ trợ nhiều các tính năng phát hiện sự cố mạng, nhận các báo cáo không đồng bộ từ SNMP trap và không có các công cụ để tự vẽ bản đồ mạng lưới
Trong công tác giám sát công nghệ thông tin, có 2 phương pháp giám sát là Hỏi/Trả lời (Poll) và tự động thông báo khi xảy ra sự kiện (Alert) Để giám sát tốt chúng ta cần kết hợp cả 2 kỹ thuật này SNMP là giao thức quản lý mạng TCP/IP, được thiết kế để có thể mở rộng thêm các chức năng và độc lập kiến trúc của các thiết bị
Các phần mềm giám sát PRTG Network Monitor, Nagios Core, Cacti là những ứng dụng giám sát mạng mạnh mẽ cho các hệ thống dựa trên Windows/ Linux Nó phù hợp cho các mạng nhỏ, vừa và lớn và có khả năng giám sát mạng LAN, WAN, WLAN và VPN Chúng
ta cũng có thể giám sát các máy chủ web, thư và tệp thực, ảo, hệ thống máy chủ Windows/Linux, máy khách, bộ định tuyến và nhiều tính năng khác Hiểu được cơ chế hoạt động và cách quản lý chúng thành công là một nhiệm vụ quan trọng cho quản trị viên hệ thống
Từ các kết quả được trình nghiên cứu phần tổng quan, học viên sẽ phân tích đánh giá hiện trạng hệ thống giám sát quản trị mạng và ứng dụng của Tập đoàn VNPT trong chương 2
Trang 11Chương 2 – PHÂN TÍCH, ĐÁNH GIÁ HIỆN TRẠNG HỆ THỐNG GIÁM SÁT QUẢN TRỊ MẠNG VÀ ỨNG DỤNG TẠI TẬP ĐOÀN VNPT
2.1 Hiện trạng hệ thống giám sát quản trị mạng và ứng dụng tại Tập đoàn VNPT
2.1.1 Mô hình hệ thống
– Mô hình hệ thống tại IDC Tòa nhà Internet:
Hình 2.1: Mô hình hệ thống tại IDC Tòa nhà Internet
– Mô hình hệ thống tại IDC Nam Thăng Long:
Hình 2.2: Mô hình hệ thống tại IDC Nam Thăng Long
Trang 122.1.2 Các hệ thống giám sát đang được sử dụng
Để giám sát hệ thống mạng trong hai IDC nêu trên, nhiều hệ thống giám sát được sử dụng song song để tận dụng tối đa chức năng và thế mạnh của từng phần mềm giám sát Các phần mềm giám sát hiện tại được sử dụng trong hệ thống mạng:
– Hệ thống giám sát CACTI: Giám sát lưu lượng mạng, tài nguyên thiết bị mạng CACTI là phần mềm mở, hỗ trợ người quản trị các chức năng quản lý hệ thống mạnh mẽ, bao gồm vẽ, thiết kế sơ đồ hệ thống và theo dõi lưu lượng thông qua biểu đồ thời gian thực
Hình 2.3: Hệ thống giám sát lưu lượng bằng Cacti áp dụng cho hệ thống mạng tại IDC Tòa
Trang 13Hình 2.4: Hệ thống giám sát sử dụng PRTG tại Tòa nhà Internet
– Hệ thống giám sát Nagios: Giám sát log cảnh báo ứng dụng Cho phép người quản trị theo dõi tình trạng các Host, các Service chạy trên các Host
Hình 2.5: Hệ thống giám sát Nagios tại Tòa nhà Internet
– Hệ thống giám sát Oracle Enterprise Manager 11g: Giám sát, quản trị cơ sở dữ liệu mạnh mẽ, có thể theo dõi, phân tích hiệu năng xử lý của hệ thống đối với từng câu lệnh truy vấn Từ đó, người quản trị, phát triển hệ thống có thể đưa ra phương án tối ưu cho hệ thống
Trang 14Hình 2.6: Hệ thống theo dõi DB bằng Oracle Enterprise Manager 11g
2.2 Phân tích ưu, nhược điểm và các vấn đề cần cải thiện
2.2.1 Ưu điểm
Thứ nhất, các hệ thống đang hoạt động tương đổi ổn định với độ sẵn sàng 99%, bao quát được số lượng lớn các dịch vụ, đảm bảo cho việc quản lý, giám sát, cũng như báo cáo tình trạng hệ thống dịch vụ phần mềm của Tập đoàn VNPT được thông suốt
Thứ hai, các hệ thống giám sát đang được ứng dụng tại Tập đoàn VNPT đa phần là các phần mềm mã nguồn mở với cộng đồng hỗ trợ đông đảo, nhiệt tình, do đó chi phí cho việc xây dựng, áp dụng, bảo trì, nâng cấp các hệ thống được giữ ở mức hợp lý
2.2.2 Nhược điểm
Thứ nhất, các hệ thống còn phân tán với nhiều giải pháp khác nhau, dẫn đến việc quản
lý trở nên phức tạp hơn so với một hệ thống tập trung
Thứ hai, hệ thống giám sát cơ sở dữ liệu hiện mới chỉ phục vụ cho một hệ thống duy nhất, dẫn tới yêu cầu bức thiết cần có một giải pháp quản trị cơ sở dữ liệu tập trung
2.2.3 Các phương án cải thiện
Đối với nhược điểm thứ nhất, cần có giải pháp quản trị tập trung, đây cũng là một đề tài nghiên cứu triển vọng cho học viên trong quá trình học tập, công tác sau này
Còn với nhược điểm thứ hai, cũng là nội dung chính của luận văn này, học viên sẽ đề xuất, xây dựng, cài đặt và quản trị một hệ thống giám sát cơ sở dữ liệu tập trung với giải pháp
sử dụng phần mềm Oracle Cloud Control 12c
2.3 Kết luận chương 2