1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Kỹ thuật điện tử: Thiết kế và xây dựng hệ thống giám sát phân tích cảnh báo chủ động cho ISP

124 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • CHƯƠNG 1: MỞ ĐẦU (14)
    • 1.1. Đặt Vấn Đề (14)
    • 1.2. Đối Tƣợng Và Phạm Vi Nghiên Cứu (15)
    • 1.3. Tóm Tắt Nội Dung (16)
  • CHƯƠNG 2: TỔNG QUAN VỀ GIÁM SÁT HỆ THỐNG ISP (18)
    • 2.1. Phân chia thành phần của mạng ISP (18)
    • 2.2. Bộ phận giám sát (NOC) và chức năng (19)
    • 2.3. Các thông số cần giám sát trong mạng dịch vụ (ISP) và các công cụ giám sát (20)
  • CHƯƠNG 3: CÁC GIAO THỨC VÀ CÔNG CỤ GIÁM SÁT (23)
    • 3.1. Giao thức phục vụ giám sát (23)
      • 3.1.1. Giao thức SNMP (23)
      • 3.1.2. Syslog & Analyzer [3] (23)
      • 3.1.3. Giao thức telnet: [2] (24)
      • 3.1.4. Giao thức SSH [4] (25)
      • 3.1.5. Phương thức giám sát dịch vụ (25)
    • 3.2. Các phần mềm giám sát (27)
      • 3.2.1. Cacti & weather map (27)
      • 3.2.2. Nagios (28)
      • 3.2.3. SolarWind (29)
      • 3.2.4. MRTG - Multi Router Traffic Graphic (30)
      • 3.2.5. NTOP (30)
      • 3.2.6. Syslog (30)
    • 3.3. Giám sát chất lƣợng dịch vụ (31)
      • 3.3.1. Nhu cầu về QoS (31)
      • 3.3.2. Mô hình QoS (32)
      • 3.3.3. Giám sát chất lƣợng dịch vụ (34)
    • 3.4. Các phương thức cảnh báo (35)
      • 3.4.1. Các loại cảnh báo thường dùng (35)
      • 3.4.2. Giới thiệu Pushnote Pushbullet (35)
  • CHƯƠNG 4: XÂY DỰNG HỆ THỐNG GIÁM SÁT, PHÂN TÍCH, CẢNH BÁO CHỦ ĐỘNG CHO ISP (16)
    • 4.1. Mô tả hệ thống giám sát mới (37)
      • 4.1.1. Cấu trúc và thiết kế chung (37)
      • 4.1.2. Tính năng phân tích (39)
      • 4.1.3. Tính năng hỗ trợ xử lý sự cố (39)
      • 4.1.4. Các phương thức cảnh báo (40)
      • 4.1.5. Tóm tắt các tính năng của phần mềm (41)
    • 4.2. Các Sensor và giải thuật xử lý (42)
      • 4.2.1. Sensor giám sát và module phân tích thiết bị và cổng vật lý (42)
      • 4.2.2. Sensor và module quản lý cấu hình thiết bị, so sánh, phân tích (45)
      • 4.2.3. Sensor giám sát người quản trị đang đăng nhập trên hệ thống (48)
      • 4.2.4. Sensor giám sát QoS (51)
      • 4.2.5. Sensor giám sát luồng IPTV multicast (53)
      • 4.2.6. Sensor giám sát BGP session (56)
      • 4.2.7. Sensor giám sát các dịch vụ VPN/MPLS (layer 2 and Layer 3) (60)
      • 4.2.8. Giao diện quản trị hệ thống giám sát mới (62)
  • CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN (17)
    • 5.1. Đánh giá kết quả thực hiện (67)
    • 5.2. Các vấn đề đã giải quyết (68)
    • 5.3. Hướng phát triển (69)
  • PHỤ LỤC (17)
    • 6.1. Cơ sở dữ liệu cho hệ thống giám sát (70)
      • 6.1.1. Hệ thống giám sát mới (70)
      • 6.1.2. Database hệ thống syslog (70)
      • 6.1.3. Database hệ thống snmptrap (71)
    • 6.2. Hướng dẫn cài đặt (71)
      • 6.2.1. Cài đặt syslog server (71)
      • 6.2.2. Cài đặt syslogtrap server (74)
      • 6.2.3. Cài đặt các công cụ hỗ trợ phần mềm giám sát (74)
      • 6.2.4. Cài đặt webserver, php,mysql (74)
    • 6.3. Các đoạn mã lập trình quan trọng (78)
      • 6.3.1. Module giám sát, phân tích tình trạng thiết bị và cổng vật lý (78)
      • 6.3.2. Module quản lý cấu hình thiết bị, so sánh và phân tích thay đổi cấu hình 70 6.3.3. Module quản lý người quản trị đang đăng nhập trên hệ thống (83)
      • 6.3.4. Module giám sát QoS (97)
      • 6.3.5. Module giám sát luồng IPTV multicast (101)
      • 6.3.6. Module giám sát BGP session peering (108)
      • 6.3.7. Module giám sát các dịch vụ VPN/MPLS (layer 2 and Layer 3) (111)
      • 6.3.8. Giao diện quản trị hệ thống giám sát mới (111)
  • TÀI LIỆU THAM KHẢO (17)

Nội dung

Các nhu cầu như: giám sát chất lượng dịch vụ, giám sát các luồng VPN/MPLS, các luồng IPTV Multicast, phân tích nguyên nhân, hỗ trợ xứ lý sự cố, … là những nhu cầu bức thiết hiện nay.. Hệ

TỔNG QUAN VỀ GIÁM SÁT HỆ THỐNG ISP

Phân chia thành phần của mạng ISP

Mạng của các nhà cung cấp dịch vụ có thể phân làm 3 lớp:

- Lớp 1: mạng ngoại vi hay còn gọi là tầng truy nhập (broadband hay access)

Lớp này là lớp kết nối các khách hàng vào hệ thống mạng của ISP Nó đƣợc thiết lập dựa trên chủ yếu là các hạ tầng sẵn có của 1 loại hình dịch vụ khác để cung cấp dịch vụ Internet Nhƣ mạng điện thoại (cáp đồng) hoặc mạng cáp đồng trục cho mạng truyền hình cáp Ở Việt Nam, các công nghệ ở lớp truy nhập phổ biến là ADSL bằng hệ thống thiết bị DSLAM, hoặc DOCSIS bằng hệ thống CMTS Ngày nay, công nghệ mới nhất của lớp truy nhập là mạng cáp quang (Fiber) hoạt động dựa trên cáp quang, cho tín hiệu ổn định, ít nhiễu và băng thông lớn Các thiết bị đầu cuối thường được dùng tại nhà khách hàng nhƣ ADSL modem, Cable modem, bộ chuyển đổi quang điện (media converter)

- Lớp 2: tạm gọi là mạng chuyển mạch hay mạng lõi (core) của nhà cung cấp Ở lớp này, dữ liệu của người dùng được định tuyến đi qua mạng của nhà cung cấp Lớp này đƣợc xây dựng băng những thiết bị chuyên dụng, có khả năng xử lý tốc độc rất cao, lưu lượng cực lớn, cung cấp cho nhiều dịch vụ nhƣ Internet, IPTV, thoại, VPN, datacenter,… Hiện nay, các ISP đều xây dựng hệ thống trên nền tảng công nghệ chuyển mạch nhãn, vốn cung cấp khả năng chuyển mạch mềm dẽo và linh hoạt, giúp nhà cung cấp khai thác đƣợc dịch vụ đa dạng, sử dụng hạ tầng hiệu quả

- Lớp 3: gồm các router đóng vai trò là cổng Internet trong nước và quốc tế

Mọi dữ liệu của người dùng đều được chuyển qua các Router này Lớp này chịu trách nhiệm kết nối mạng của nhà cung cấp với các nhà cung cấp khác và phần còn lại của thế giới

- Ngoài ra: để cung cấp dịch vụ Internet, các ISP cũng phải có hệ thống server hỗ trợ việc cung cấp dịch vụ nhƣ: DHCP, LDAP, TACACS, hệ thống NSM, database server, Accouting System, Helpdesk system, NOC (Network

Operator Center) Sơ đồ mô tả hệ thống mạng của nhà cung cấp dịch vụ:

Hình 2.1: Mô hình mạng của ISP

Bộ phận giám sát (NOC) và chức năng

Để vận hành hệ thống cung cấp dịch vụ, các ISP đều duy trì đội ngũ trực 24/7, nhằm phát hiện các sự cố xảy ra trên hệ thống Phối hợp các bên liên quan để tiến hành xử lý sự cố một cách nhanh nhất, khôi phục dịch vụ và giảm thiểu thiệt hại

Bộ phận giám sát căn cứ vào các công cụ giám sát nhƣ phần mềm giám sát, cảnh báo, email, tin nhắn để xác định sự cố Từ đó phần tích nguyên nhân và xử lý sự cố

Các công cụ giám sát thường dùng trong việc giám sát dịch vụ của các ISP:

- NMS: Nagios, WhatsUp Gold, HP OpenView, solarwind

Ngoài hoạt động giám sát, các ISP cần thông kê có sự cố, cũng nhƣ đánh giá tính khả dụng của hệ thống thông qua nhiều thông số nhƣ: thời gian khả dụng của thiết bị, băng thông khả dụng, hiệu năng hoạt động, throughput đi qua thiết bị,…

Các biện pháp cảnh báo về sự cố được thực hiện đa dạng qua email, SMS, điện thoại Để quản lý sự cố hiệu quả, các nhà cung cấp dịch vụ internet (ISP) thường sử dụng phần mềm quản lý ticket, giúp theo dõi sự cố từ lúc phát hiện cho đến khi giải quyết xong Ngoài ra, các phần mềm helpdesk được tích hợp khả năng quản lý ticket để tiếp nhận sự cố và hỗ trợ quản lý sự cố toàn diện.

Chi tiết hơn về các thành phần trong hệ thống giám sát, tham khảo tài liệu số [11].

Các thông số cần giám sát trong mạng dịch vụ (ISP) và các công cụ giám sát

Trong hệ thống có rất nhiều thiết bị, ISP phải dùng các công cụ giám sát để theo dõi hoạt động của các thiết bị Theo nhu cầu thực tế, một ISP giám sát đầy đủ hệ thống của mình phải thực hiện giám sát các thông số sau:

1) Trạng thái hoạt động thiết bị, CPU, RAM, nhiệt độ, up/down, nguồn điện,…

2) Trạng thái hoạt động của các cổng vật lý, tuyến quang

3) Lưu lượng các cổng đấu nối Internet quốc tế, trong nước

4) Lưu đồ traffic (weathermap) đi qua hệ thống

Hình 2.2: Công cụ weather map cho phép xem các luồng traffic đi qua hệ thống

5) Các cổng Internet Quốc tế, trao đổi định tuyến thông qua giao thức BGP

6) Các dịch vụ mà ISP truyền trong mạng (VPN, IPTV, VOIP,…)

7) Tình trạng hoạt động của các dịch vụ mà ISP đang cung cấp (Ví dụ: IPTV, VPN, VOIP)

8) Chất lƣợng dịch vụ: thông qua các hiện tƣợng nghẽn, rớt gói tin khi truyền dẫn qua mạng Core

9) Người quản trị thao tác thay đổi cấu hình thiết bị hệ thống và sự ảnh hướng lên các dịch vụ hiện có

Hình 2.3: Phần mềm giám sát cacti, thế mạnh về graph và lưu đồ

Hình 2.4: Phần mềm giám sát solarwind, thế mạnh về độ tin cậy và tức thời Để giám sát các thông số trên, ISP cần sử dụng các công cụ giám sát hệ thống Tuy nhiên không phải phần mềm nào cũng đáp ứng đủ các tính năng nêu trên Các tính năng từ 1) đến 4) có thể dùng các công cụ giám sát nhƣ Cacti, Solarwind để theo dõi Tuy nhiên, tính năng từ 5) đến mục 9) hiện nay không có phần mềm nào đáp ứng

Thông thường, bộ phận quản trị phải theo dõi kết hợp với các dữ liệu log phát sinh trong quá trình hoạt động của thiết bị để phát hiện sự cố Hoặc khi sự cố xảy ra mới kết nối đến thiết bị để kiểm tra Vì vậy, việc xử lý là hết sức thụ động.

CÁC GIAO THỨC VÀ CÔNG CỤ GIÁM SÁT

Giao thức phục vụ giám sát

SNMP (Simple Network Management Protocol) là một giao thức quản lý mạng cho phép một chương trình quản lý giao tiếp, cấu hình, hoặc điều khiển thiết bị ở xa có hỗ trợ SNMP agent Ý tưởng cơ bản của SNMP là có một chương trình (hay một agent) hoạt động trên hệ thống ở xa mà ta có thể giao tiếp đƣợc qua mạng

Agent này có thể giám sát hệ thống và thu thập thông tin Manager (trên máy quản lý) gởi các bản tin tới agent ở xa để yêu cầu thông tin hoặc thực thi một nhiệm vụ

SNMP là một giao thức vẫn đang phát triển và có nhiều phiên bản khác nhau

Phiên bản đầu tiên SNMPv1 vẫn đƣợc sử dụng rộng rãi, và các phiên bản sau phải tương thích với phiên bản này

Phiên bản thứ hai có nhiều biến thể SNMPv2 Classic đƣợc thay thế bởi SNMPv2 community-based (hay SNMPv2c), hai phiên bản an toàn hơn đó là SNMPv2u và SNMPv2* Phiên bản SNMPv3 giải quyết đƣợc vấn đề khác nhau giữa SNMPv2u và SNMPv2* , đang đƣợc sử dụng ngày càng phổ biến

SNMP dùng chuỗi community để kiểm soát việc truy cập Để truy cập tới thiết bị, ta phải đƣa ra chuỗi community, điều này giống nhƣ là mật khẩu (password) Sự khác biệt chính là cách dùng chuỗi này: chuỗi community giống nhau sẽ đƣợc chia sẻ bởi một nhóm hoặc một tập hợp thiết bị, mục đích là tạo một nhóm thiết bị hơn là cung cấp bảo mật

Trong quá trình hoạt động của các thiết bị, nhiều tập tin ghi log đƣợc phát sinh và ghi lại diễn tả tất cả trạng thái động theo thời gian, nhằm phục vụ việc khắc phục sự cố về sau

Giao thức Syslog giúp tập trung ghi log từ nhiều thiết bị, giảm thiểu khó khăn trong việc phân tích lỗi từng thiết bị Các thông điệp được gửi đến một máy chủ tập trung, sau đó được phân loại và lưu trữ vào cơ sở dữ liệu hoặc tệp để hỗ trợ phân tích.

Dựa trên những thông tin lưu trữ, các phương pháp phân tích log đã được áp dụng nhằm giúp người quản trị phân tích sự cố một cách hiệu quả và chính xác hơn

Syslog hoạt động trên giao thức TCP, port 514 Tính năng chính của syslog là:

Giao thức TCP đảm bảo truyền nhật ký một cách tin cậy bằng cách ngăn chặn tình trạng mất tin nhắn, không giống như giao thức UDP có thể gây mất dữ liệu Syslog thường tránh sử dụng UDP để duy trì tính toàn vẹn của dữ liệu.

• Log an toàn (secure) dùng TLS (Transport Layer Security)

• Lưu giữ log message trong database (MySQL, Oracle, PostgreSQL,

SQLite) cho phép dễ dàng tìm kiếm và tương tác với các ứng dụng phân tích log

• Hỗ trợ Ipv4 và Ipv6

TELNET (viết tắt của TErminaL NETwork) là một giao thức mạng (network protocol) đƣợc dùng trên các kết nối với Internet hoặc các kết nối tại mạng máy tính cục bộ LAN Tài liệu của IETF, STD 8, (còn đƣợc gọi là RFC 854 và RFC 855) có nói rằng:

Mục đích của giao thức TELNET là cung cấp một phương tiện truyền thông chung chung, có tính lưỡng truyền, dùng độ rộng 8 bit, định hướng byte

TELNET thường được dùng để cung cấp những phiên giao dịch đăng nhập, giữa các máy trên mạng Internet, dùng dòng lệnh có tính định hướng người dùng

Tên của nó có nguồn gốc từ hai chữ tiếng Anh "telephone network" (mạng điện thoại), vì chương trình phần mềm được thiết kế, tạo cảm giác như một thiết bị cuối đƣợc gắn vào một máy tính khác Đối với sự mở rộng của giao thức, chữ "telnet" còn ám chỉ đến một chương trình ứng dụng, phần người dùng của giao thức - hay còn gọi là trình khách (clients) Trong bao nhiêu năm qua, TELNET vốn đƣợc cài đặt sẵn trong hầu hết các hệ điều hành Unix, song với sự tiến triển gần đây của mình, SSH (Secure Shell) trở nên một giao thức có ƣu thế hơn trong việc truy cập từ xa, cho các máy dùng hệ điều hành có nền tảng là Unix SSH cũng đƣợc cài đặt sẵn cho hầu hết các loại máy vi tính Trên rất nhiều hệ thống, chương trình ứng dụng "telnet" còn được dùng trong những phiên giao dịch tương tác TCP ở dạng sơ đẳng (interactive raw-TCP sessions), và còn đƣợc dùng để thông nối với những dịch vụ trên các máy chủ POP3 (email)

Thông qua giao thức telnet, người quản trị có thể giao tiếp với thiết bị từ xa, từ đó lấy đƣợc những thông tin cần thiết phục vụ việc quản trị thiết bị

Giao thức SSH (Secure Shell) đóng vai trò quan trọng trong việc thiết lập kết nối mạng an toàn, hoạt động ở lớp trên của mô hình TCP/IP để cung cấp tính bảo mật cao cho quá trình truyền tải dữ liệu.

Các công cụ SSH (như là OpenSSH, ) cung cấp cho người dùng cách thức để thiết lập kết nối mạng đƣợc mã hoá để tạo một kênh kết nối riêng tƣ Hơn nữa tính năng tunneling của các công cụ này cho phép chuyển tải các giao vận theo các giao thức khác Do vậy có thể thấy khi xây dựng một hệ thống mạng dựa trên SSH, chúng ta sẽ có một hệ thống mạng riêng ảo VPN đơn giản

Cũng giống với giao thức telnet, ssh cho phép người quản trị giao tiếp với thiết bị từ xa, nhƣng theo 1 cách an toàn hơn Từ đó, có thể xem đƣợc nhiều thông tin liên quan đến hoạt động của thiết bị, giúp cho việc phân tích hoạt động chính xác hơn

3.1.5 Phương thức giám sát dịch vụ:

Trong trường hợp đặc thù mà giao thức SNMP và syslog không đủ để theo dõi hiệu quả thiết bị hoặc dịch vụ, phương pháp giám sát lập trình cung cấp giải pháp tối ưu.

Các phần mềm giám sát

Để quản lý và giám sát hệ thống mạng, hiện nay đã có rất nhiều phần mềm thương mại có bản quyền và cả những chương trình mã nguồn mở, được xếp thành các nhóm chức năng nhƣ sau:

 Giám sát dịch vụ mạng: Nagios, Zenoss

 Giám sát performance: Cacti, SolarWind, WhatsUp, MRTG

 Giám sát lưu lượng và log hệ thống: Ntop, Syslog Dưới đây là sơ lược qua một số tính năng chính của các chương trình này:

Là công cụ giám sát mã nguồn mở dựa trên nền web, hoạt động trên Unix/Linux

Cacti kết hợp khả năng lưu trữ dữ liệu của RRDTool và khả năng đồ họa, cho phép quản lý hiệu quả quyền truy cập người dùng Giao diện thân thiện dễ sử dụng giúp Cacti phù hợp với cả những hệ thống mạng lớn với hàng trăm thiết bị Cacti cung cấp thông tin chi tiết về trạng thái mạng, tình trạng sử dụng CPU, bộ nhớ và băng thông Đặc biệt, hệ thống plugin của Cacti cho phép người dùng tùy biến mở rộng thêm nhiều tính năng cần thiết, giúp Cacti trở thành công cụ giám sát mạnh mẽ và linh hoạt.

Hình 3.1: Phần mềm giám sát Cacti

Ngoài ra, hệ thống cacti còn cho phép vẽ lưu đồ hệ thống tương ứng với lưu lượng đi qua các cổng vật lý:

Hình 3.2: Plugin weather map của cacti, cho phép xem lưu đồ lưu lượng qua các cổng vậl tý

Là chương trình mã nguồn mở, trên nền Unix/Linux, dùng giám sát host và dịch vụ mạng, có hỗ trợ cấu hình theo kiểu file hay các template sẵn có Với ƣu điểm là hệ thống plugin: ngoài một số plugin có sẵn, cho phép tự định nghĩa thêm plugin để mở rộng thêm tính năng cần thiết Nagios lên kế hoạch thực thi tốt và hỗ trợ thực thi song song Hiệu suất xử lý dữ liệu cao, giao diện web thân thiện

Solarwind là một phần mềm thương mại, dùng giám sát hiệu năng, quản lý lỗi, độ sẵn sàng của mạng

Với các tính năng cơ bản nhƣ:

 Giám sát hiệu năng mạng nhƣ việc sử dụng băng thông, mất gói, độ trễ, truyền gói tin bị lỗi, loại bỏ gói và chất lƣợng dịch vụ cho các thiết bị có hỗ trợ SNMP

 Giám sát không gian ổ đĩa, tỷ lệ sử dụng CPU, sử dụng bộ nhớ của thiết bị mạng

 Quản lý việc giám sát hiệu năng chi tiết, việc phân tích các thành phần mạng

 Quản lý chi tiết thành phần mạng nhƣ trạng thái, địa chỉ IP, loại thiết bị

 Network map: cho phép tạo sơ đồ mạng nhanh chóng và dễ dàng, chỉ đơn giản là kéo thả

Hình 3.3: Phần mềm giám sát Solarwind

3.2.4 MRTG - Multi Router Traffic Graphic

MRTG là một tool mã nguồn mở, gồm các script viết bằng ngôn ngữ Perl, hoạt động trên Unix/Linux, Windowns, dùng SNMP để thu thập các thông tin cần thiết từ các thiết bị mạng như router, switch, lưu dữ liệu nhận được dùng RRD tool và hiển thị ở dạng đồ họa ở dạng web một cách trực quan MRTG đƣợc dùng để giám sát tất cả các thông số mà SNMP có thể hỗ trợ nhƣ tải hệ thống, băng thông…

Là một tool mã nguồn mở được dùng giám sát và đo lưu lượng mạng đơn giản và hoàn toàn miễn phí, hỗ trợ nhiều hoạt động quản lý bao gồm lên kế hoạch và tối ƣu mạng, phát hiện các tấn công mạng đơn giản Đo đạc lưu lượng bao gồm việc thống kê lưu lượng vào/ra của các host trong mạng, các giao thức hiện đang hoạt động

Tất cả các packet trong mạng được giữ lại với thông tin sender/receiver tương ứng

Hình 3.4: Phần mềm giám sát NTOP

Syslog là ứng dụng mã nguồn mở linh hoạt, cung cấp giải pháp ghi log hệ thống đáng tin cậy, tập trung.

 Truyền log tin cậy: việc truyền log dùng giao thức TCP đảm bảo các message không bị mất

 Log an toàn dùng TLS (Transport Layer Security)

 Lưu giữ log message trong database (MySQL, Oracle, PostgreSQL, SQLite) cho phép dễ dàng tìm kiếm và tương tác với các ứng dụng phân tích log

 Hỗ trợ Ipv4 và Ipv6

Giám sát chất lƣợng dịch vụ

Theo cách truyền thống, khi nhu cầu về băng thông của hệ thống mạng tăng lên, hiện tượng nghẽn mạng có thể xảy ra Để giải quyết hiện tượng này chúng ta thường tăng băng thông kết nối hoặc dùng thiết bị phần cứng khác thay thế Tuy nhiên băng thông mạng không phải là vô tận và ta cũng không thể thay thế liên tục các thiết bị phần cứng Nhƣợc điểm của cách này là không chỉ ra đƣợc cách thức để ƣu tiên một loại traffic này so với một loại traffic khác

Dựa trên tài nguyên mạng và hệ thống hiện có, ta phải bảo đảm chất lƣợng dịch vụ cho người sử dụng mạng Cung cấp chất lượng dịch vụ mạng – QoS thực chất là cung cấp các dịch vụ chuyển tiếp khác nhau cho các lưu lượng mạng khác nhau

QoS là các kỹ thuật xử lý lưu lượng trong mạng truyền số liệu sử dụng bộ giao thức

IP (Internet Protocol) đƣợc dùng để bảo vệ, ƣu tiên một số traffic quan trọng hoặc các traffic đòi hỏi xử lý nhanh về thời gian (voice, video…) QoS sẽ mô tả cách thức gói tin đƣợc chuyển mạch nhƣ thế nào Nếu không có QoS, các router hoặc switch chỉ đơn thuần quyết định là một gói tin có đƣợc chuyển đi hay không một cách tuần tự và không có ƣu tiên

Các tham số đánh giá chất lƣợng dịch vụ mạng:

 Tỷ lệ mất gói: tham số này cho biết tỷ lệ phần trăm số gói tin bị mất trên tổng số toàn bộ số gói tin phía gửi đã chuyển vào mạng cho phía nhận

 Độ trễ gói: tham số này cho biết khoảng thời gian gói tin đƣợc chuyển từ đầu gửi đến đầu nhận

 Độ biến thiên trễ (jitter): tham số này cho biết sự dao động về độ lớn của độ trễ gói, các packets không đến đúng nhƣ thời gian dự định Các dữ liệu dạng audio sẽ bị ảnh hưởng nhiều bởi vấn đề này

 Khả năng đáp ứng của dịch vụ: tham số này cho biết xác suất sử dụng thành công dịch vụ

Có 3 mô hình QoS cơ bản đƣợc sử dụng trong mạng IP:

- Mô hình nổ lực tối đa – Best-effort delivery - Mô hình dịch vụ tích hợp – Integrated Services model (IntServe) - Mô hình dịch vụ phân biệt – Differentiated Services model (DiffServe) a) Mô hình nỗ lực tối đa – Best-effort delivery Một network chỉ đơn thuần chuyển tiếp những gói tin mà nó nhận đƣợc không có áp dụng một QoS nào Các Switch và Router chỉ cố gắng hết sức để chuyển các gói tin đi mà không bận tâm đến kiểu của traffic hay độ ƣu tiên của dịch vụ Cấu trúc này tuân theo quy tắc FIFO (First In First Out) b) Mô hình dịch vụ tích hợp – IntServe Ý tưởng của mô hình IntServe như sau, ứng dụng tại nút gửi dữ liệu thông báo yêu cầu đến tất cả các nút mạng trên đường đi từ nút gửi đến nút nhận Tùy thuộc lƣợng băng thông khả dụng, các nút có thể chấp nhận hoặc từ chối yêu cầu

Nếu được chấp thuận, yêu cầu được gửi tới toàn bộ các nút, chúng sẽ dành riêng lượng băng thông đã yêu cầu cho ứng dụng Từ đó, quá trình truyền dữ liệu được bắt đầu Chất lượng dịch vụ thường được nhà cung cấp và khách hàng thoả thuận trước, do đó cấu trúc này có thể đảm bảo chất lượng dịch vụ cho từng luồng lưu lượng.

Trung tâm của mô hình IntServe là cơ chế dự trữ tài nguyên Để báo hiệu dự trữ tài nguyên, mô hình IntServe thường sử dụng giao thức dự trữ tài nguyên

(Resource ReserVation Protocol hay RSVP) Đây là giao thức điều khiển Internet đƣợc thiết kế để cài đặt chất lƣợng dịch vụ trên mạng IP Nhƣng nó cũng không nhất thiết phải sử dụng với mô hình IntServe Trong giao thức này: khi một nút nào đó gửi dữ liệu, nó gửi một bản tin qua các nút trung gian tới nút nhận, bản tin này chứa đặc điểm lưu lượng sẽ gửi, đặc điểm của các nút mạng trên đường đi Nút nhận sau khi nhận được thông điệp, căn cứ vào đặc điểm lưu lượng và đặc điểm đường đi, sẽ gửi lại một thông điệp để đăng ký tài nguyên tại các nút trung gian trên đường đi đó Nếu việc đăng ký thành công, nút gửi bắt đầu truyền dữ liệu Nếu không, thông điệp đi đến nút gửi sẽ báo lỗi

Mô hình IntServe đòi hỏi các bộ định tuyến trong mạng phải có khả năng dự trữ tài nguyên cho các luồng lưu lượng khác nhau do đó bộ định tuyến phải lưu và xử lý thông tin trạng thái của từng luồng Yêu cầu này khiến cho tính khả mở của mô hình không cao bởi vì những mạng máy tính lớn, số luồng lưu lượng có thể lên tới hàng trăm nghìn, tốn nhiều dung lƣợng dự trữ và năng lực xử lý Vì vậy mô hình dữ trữ tài nguyên chỉ thích hợp cho những mạng nhỏ với ít luồng lưu lượng c) Mô hình dịch vụ phân biệt – DiffServe Do tồn tại của mô hình IntServe về tính khả mở, mô hình DiffServe đã đƣợc phát triển nhằm cung cấp một cơ chế chất lƣợng dịch vụ đơn giản, khả dụng, độ tin cậy cao Ý tưởng của mô hình DiffServe khá đơn giản, các luồng lưu lượng đi vào mạng đƣợc điều chỉnh, định dạng tại các bộ định tuyến ở biên mạng và cũng tại đây các luồng đƣợc phân vào một số lớp nhất định Các nút mạng trung gian sẽ xử lý gói tin theo các cách khác nhau tùy theo lớp mà gói tin thuộc vào và mức ƣu tiên tương đối của gói tin trong lớp cho đến khi gói tin ra khỏi mạng, qua đó cung cấp các dịch vụ khác nhau cho các luồng lưu lượng khác nhau Ƣu điểm của mô hình DiffServe là đơn giản vì nó không xử lý từng luồng mà xử lý tập hợp các luồng do đó phù hợp với những mạng xương sống, nơi có nhiều luồng lưu lượng đi qua Tuy nhiên, mô hình này không có đảm bảo tuyệt đối về chất lƣợng dịch vụ nhƣ mô hình IntServe

Từ ưu nhược điểm và đặc điểm của hai mô hình IntServe và DiffServe, người ta đưa ra phương pháp kết hợp hai mô hình trên để cung cấp chất lượng dịch vụ cho mạng trong đó mô hình DiffServe được sử dụng ở mạng đường trục (backbone), mô hình IntServe đƣợc sử dụng trong mạng truy nhập (access)

Ngoài các phương pháp trên, người ta còn sử dụng công nghệ chuyển mạch nhãn đa giao thức (MPLS) kết hợp với kỹ thuật kiểm soát lưu lượng để cung cấp chất lượng dịch vụ Tuy nhiên, luận văn này sẽ không đề cập đến phương án này.

3.3.3 Giám sát chất lƣợng dịch vụ:

Hệ thống truyền dẫn mạng Core của nhà cung cấp phục vụ cho rất nhiều dịch vụ

Tại đơn vị, hệ thống mạng Core đƣợc thiết lập để phục vụ cho các luồng dịch vụ truyền hình, Internet, thuê kênh riêng VPN, truyền VoIP,…

Do tính nhạy cảm của các dịch vụ, cần có cơ chế giám sát QoS cho các dịch vụ này khi truyền qua mạng Core

Theo các mô hình kiểm soát QoS, SCTV sử dụng kỹ thuật Diffserve cho truyền dẫn trong mạng Core

Theo quy hoạch, các dịch vụ khi đi vào mạng core sẽ đƣợc phân lớp thành các 8 hàng đợi (queue) tương ứng với tính ưu tiên quy định trước

Bảng 1: Ví dụ về phân lớp hàng đợi trong mô hình Diffserve mạng Core ISP

Số hiệu queue Định danh Dịch vụ hoạt động Đặc điểm

Giao thức định tuyến trong mạng Không rớt gói, ƣu tiên cao nhất, gói tin được đi trước

6 Expect- forwarding Truyền dịch vụ VOIP Độ trễ thấp, có thể rớt gói, jitter thấp

5 H2 Cho dịch vụ IPTV Tỷ lệ rớt gói < 10^-6, băng thông lớn

2 Assured- forwarding Dịch vụ VPN Đảm bảo băng thông, không quy định tỷ lệ rớt gói

0 BestEffort Dịch vụ truyền data thông thường như Internet, … Không cam kết bất cứu tính chất dịch vụ nào

Tuy nhiên không thể giám sát hết tất cả các đặc tính của hàng đợi Để đơn giản trong giám sát, hệ thống giám sát trong luận văn chỉ giám sát tình trạng rớt gói tại các hàng đợi Từ đó có cảnh báo thích hợp cho bộ phận quản trị tiếp tục xử lý sự cố

Chi tiết về phương thức thực hiện được trình bày trong phần xây dựng phần mềm và các sensor (chương 4).

XÂY DỰNG HỆ THỐNG GIÁM SÁT, PHÂN TÍCH, CẢNH BÁO CHỦ ĐỘNG CHO ISP

Mô tả hệ thống giám sát mới

a) Tận dụng hệ thống hiện có Luận văn tận dụng của 2 hệ thống giám sát Solarwind và Cacti để giảm tải cho các thiết bị, tránh trường hợp quét snmp quá nhiều lên thiết bị:

- Phần mềm giám sát solarwind có ƣu điểm về khả năng giám sát thiết bị, cổng vật lý, cập nhật thông tin thiết bị nhanh và chính xác Database xây dựng trên nền MSSQL

- Phần mềm cacti có ưu thế về đồ thị, giám sát traffic, vẽ lưu đồ Database xây dựng trên nền MYSQL

Hệ thống giám sát tích hợp kết hợp dữ liệu từ hai hệ thống hiện có và bổ sung thêm các chức năng nâng cao Ngoài việc tận dụng cơ sở dữ liệu của các hệ thống này, hệ thống sẽ thiết lập cơ sở dữ liệu riêng biệt trên nền tảng MYSQL để phục vụ cho mục đích phân tích, giám sát và cảnh báo.

Thành phần Syslog Server và Snmptrap Server cũng đƣợc xây dựng với cơ sở dữ liệu riêng Syslog Server và Snmptrap Server là căn cứ cho các tính năng giám sát mới cũng nhƣ giải thuật phân tích sự cố và hỗ trợ khắc phục c) Các sensor, moduel giám sát, phân tích Để thực hiện việc giám sát, hệ thống đƣợc thiết kế các Sensor giám sát thực thi các tính năng sau:

- Quản lý cấu hình thiết bị, sao lưu dự phòng: qua giao thức telnet/ssh, ftp, tftp sao lưu cấu hình, kiểm tra, so sánh thay đổi trước và sau Khi có thay đổi cấu hình, sensor sẽ ghi nhận vào hệ thống và báo cáo người quản trị

Các thay đổi của người quản trị ảnh hưởng đến hệ thống (ví dụ: cân tải các hướng peering) cũng được giám sát bằng module này

- Giám sát người quản trị đăng nhập vào thiết bị Làm cơ sở cho phân tích các sự cố do thao tác của người quản trị

- Sensor giám sát dịch vụ truyền IPTV multicast qua hệ thống CORE

- Sensor giám sát các luồng dịch vụ VPN/MPLS, VPLS

- Sensor giám sát chất lƣợng dịch vụ thông qua giám sát rớt gói tin trên đường truyền vật lý

- Sensor giám sát đấu nối peering (BGP session) với các ISP khác

Hệ thống này tận dụng các cảm biến để giám sát hoạt động của thiết bị và tình trạng cổng vật lý Nhờ đó, hệ thống có thể hỗ trợ phân tích và khắc phục sự cố, đưa ra các cảnh báo kịp thời, đảm bảo hệ thống hoạt động trơn tru và ngăn ngừa các sự cố nghiêm trọng.

Ngoài ra, phần mềm còn có dashboard tập trung các thông tin sự cố, cảnh báo dạng âm thanh Giúp bộ phận quản trị dễ dàng nhận biết sự cố Để bộ phận giám sát có đủ thông tin, chủ động khắc phục sự cố, cần xây dựng bộ phận phân tích các sự cố, giúp xác định nguyên nhân Đồng thời đi kèm các thông tin liên hệ cần cho việc khắc phục sự cố như email, điện thoại của người – đơn vị liên quan

Hệ thống sẽ căn cứ vào loại sự cố và mức nghiêm trọng để gởi cảnh báo Việc xác định tính quan trọng của sự cố đƣợc phân loại trong việc lập trình

Phương thức cảnh báo được chọn là email, tin nhắn (SMS) và âm thanh qua giao diện dashboard (WEB UI: giao diện web), pushnote

Các thành phần trong hệ thống giám sát và sự tương tác:

User loggin Giám sát IPTV BGP session Web UI

Script SNMP TELNET/SSH Read/write run run run run run

Hình 4.1: Sơ đồ các khối phần mềm gồm các khối Sensor giám sát và các khối xử lý

Hoạt động của hệ thống mạng ISP thường xảy ra rất nhiều sự cố Tùy vào tầm quan trọng và mức ảnh hưởng của sự cố mà cần hay không cần phân tích

Việc thực hiện phân tích sự cố và tìm nguyên nhân dựa trên những kịch bản định sẵn Chỉ một số sự cố quan trọng, gây ảnh hưởng lớn đến hệ thống mới được phân tích nhƣ:

- BGP session peering với các ISP khác - Thiết bị mất kết nối (mất nguồn – node down) - Quản lý chất lƣợng dịch vụ, rớt gói tin trên kênh truyền

- Thao tác thay đổi cấu hình thiết bị của người quản trị Cảnh báo khi cân tải các hướng peering với ISP khác

4.1.3 Tính năng hỗ trợ xử lý sự cố

Theo các kịch bản định trước, phân mềm giám sát sẽ có những hướng dẫn cho bộ phận giám sát xử lý sự cố

Các sự cố nhƣ sẽ đƣợc hỗ trợ xử lý nhƣ:

- BGP session peering với các ISP khác - Thiết bị mất kết nối (mất nguồn – node down) - Quản lý chất lƣợng dịch vụ, rớt gói tin trên kênh truyền

- Thao tác thay đổi cấu hình thiết bị của người quản trị

- Sự cố các luồng dịch vụ IPTV, VPLS, VPN/MPLS

Phân mềm sẽ hướng dẫn bộ phận trực liên hệ các bên liên quan để xử lý Bao gồm các thông tin nhƣ đơn vị phụ trách, số điện thoại, email

4.1.4 Các phương thức cảnh báo

Hệ thống sử dụng các phương thức cảnh báo sau:

- Thông qua Email - Thông qua SMS - Dạng gởi thông điệp pushnote Pushbullet đa nền tảng

Hình 4.2: Cảnh báo dạng pushnote của pushbullet

Hình 4.3: Cảnh báo dạng email cho nhóm quản trị, bộ phận giám sát

Hình 4.4: Cảnh báo dạng dashboard có âm thanh và dạng pushnote của pushbullet trên desktop

Hình 4.5: Cảnh báo bằng SMS

4.1.5 Tóm tắt các tính năng của phần mềm:

STT Tính năng Sensor và phương thức thực hiện

1 Thiết bị down/up, cổng vật lý down/up

Thông qua việc đọc và phân loại sự cố trên Solarwind database Sự cố liên quan đến node và cổng vật lý sẽ đƣợc ghi nhận và phân tích email, SMS với node up/down

Email, SMS, âm thanh, pushbullet với interface up/down

Cho biết thông tin liên hệ đơn vị quản lý

STT Tính năng Sensor và phương thức thực hiện

2 Quản lý cấu hình thiết bị, sao lưu, so sánh và gởi báo cáo

Qua giao thức telnet/ssh vào thiết bị, dùng lệnh yêu cầu gởi file config về ftp, tftp server Sao lưu, so sánh các thay đổi và gởi báo cáo cho người quản trị email cho nhóm quản trị hệ thống và ghi log

3 Giám sát người quản trị thao tác trên thiết bị

Sử dụng kỹ thuật snmp kết hợp với script giám sát lƣợng session kết nối vào thiết bị

Khi số session#0, phần mềm kết nối thiết bị để thu thập thông tin và phân tích

Không cảnh báo, chỉ ghi log vào database, phục vụ việc phân tích sự cố

4 Giám sát chất lƣợng dịch vụ

Giám sát rớt gói tin trên các hàng đợi, dựa trên mô hình QoS Diffserve, từ đó cảnh báo cho nhóm quả trị hệ thống email, SMS, âm thanh, pushbullet

5 Giám sát dịch vụ IPTV

Sử dụng phương thức SNMP, kết hợp với script, giám sát trên thiết bị có luồng IPTV đi qua không email, SMS, âm thanh, pushbullet

6 Giám sát chất lƣợng dịch vụ cho các luồng dịch vụ VPN/MPLS, VPLS, IPTV

SNMP, syslog, kết hợp với script, giám sát trên thiết bị có luồng dịch vụ

Phân tích nguyên nhân sự cố theo kịch bản Thường do nghẽn cỗ chai ở 1 tuyến nào đó email, SMS, âm thanh, pushbullet không Có

Ngày đăng: 24/09/2024, 05:15