2.2. TỰ ĐỘNG HOÁ VIỆC THU THẬP THÔNG TIN
2.2.7. Biểu thức chính quy
Cơng nghệ biểu thức chính quy (Regular Expression - Regex) là sử dụng các mẫu (pattern) thay vì các chuỗi cụ thể được sử dụng tìm/thay thế (find/replace). Là một cơng cụ cực mạnh cho xử lí chuỗi trong PHP, javascript… Việc tích hợp cơng nghệ này vào hệ thống thông minh sẽ là giải pháp cho việc thu thập thơng tin tự động dựa trên việc log/file có cấu trúc từ phần tử mạng đã được thu thập tự động, các cú pháp cơ bản của biểu thức chính quy theo Bảng 2.3.
Bảng 2.3. Các cú pháp cơ bản của biểu thức chính quy
STT Ký
hiệu Ý nghĩa Ví dụ Mơ tả
1 ^ Bắt đầu của chuỗi ^B Lấy kí tự B đầu tiên trong chuỗi
2 $ Kết thúc của chuỗi X$ chỉ nếu kí tự cuối cùng trong chuỗi là X
3 . Bất kì kí tự nào trừ kí tự xuống
24
4 * Kí tự trước có thể lặp lại 0 hoặc
nhiểu lần ra*t rt,rat,raat,raaat
5 + Kí tự trước có thể lặp lại 1 hoặc
nhiểu lần ra+t
rat,raat,raaat (khơng có rt)
6 ? Kí tự trước có thể lặp lại 0 hoặc 1
lần ra?t rt và rat only
7 \s Bất kì kí tự khoảng trắng \sa [space]a, \ta, \na 8 \S Bất kì kí tự nào không phải là
khoảng trắng \SF
aF, rF, cF, (khơng có \tf)
9 \b Đánh dấu chuỗi ranh giới của từ
cần lấy Ion\b
Tất cả từ kết thúc bởi Ion
10 \B Lược bỏ ranh giới của từ cần lấy \BX\B Bất kì kí tự X ở giữa của 1 từ
Việc sử dụng regex lấy một thơng tin được mơ tả trong Hình 2.14 và Hình 2.15.
Hình 2.14. Sử dụng regex lấy dữ liệu
Dùng chuỗi Max Output Power(0.1dBm) = \s\S+, biểu thức này sẽ cho ta giá trị = 460 là giá trị mong muốn lấy ra.
25
Kiểm tra lại trên trang regex 101.com để xác nhận kết quả.
Hình 2.15. Kiểm tra trên trang regex