III. Mảng nhiều chiều (Multi-Dimensional Arrays)
Tìm kiếm và thay thế trong xâu với Regular Expression
Ở bài trước, chúng ta đã xem xét qua một số hàm thường gặp khi xử lý xâu trong PHP. Để tìm kiếm trong xâu, ta có thể dùng strpos() hoặc substr(), nhưng với những hàm này ta chỉ có thể tìm kiếm một cách hết sức hạn chế. Hãy thử tưởng tượng, nếu bạn muốn kiểm tra xem 1 xâu có phải là một địa chỉ IP, hay một địa chỉ email đúng đắn hay ko, sẽ phải sử dụng rất nhiều câu lệnh if.
Trong những trường hợp như thế này, ta sẽ sử dụng Regular Expression. Regular Expression, viết tắt là RegEx, có rất nhiều định nghĩa. Đây là một trong số các định nghĩa đơn giản nhất:
Regular Expression là một cách thức thể hiện dữ liệu dưới dạng các ký tựđại diện. Nó được
dùng trong các thuật toán tìm kiếm, thay thế xâu.
Đây là ví dụ về một RegEx dùng để kiểm tra xem một xâu có phải là địa chỉ IP đúng đắn hay ko:
Code:
([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})
Nhìn thì có vẻ rất phức tạp chứ thực ra RegEx trên rất đơn giản và dễ hiểu một khi bạn đã nắm được cách sử dụng.
Ta sẽ quay trở lại ví dụ trên sau khi đã học được một số điều cần thiết. Giờ hãy dành thời gian vào việc tìm hiểu cú pháp, cách viết 1 RegEx:
1.RegEx CÓ phân biệt ký tự hoa - thường. (case sensitive)
Ví dụ ta có một xâu như sau:
Code:
Hello, UDS
2. Mọi ký tự trong RegEx đều ứng với một ký tự trong xâu cần kiểm tra, kể cả ký tự trắng (dấu cách, dấu tab, dấu xuống dòng). (dấu cách, dấu tab, dấu xuống dòng).
Ví dụ với xâu:
Code:
Hello, UDS
Thì Hello, UDS sẽ phù hợp còn Hello, UDS ko.