Cách sử dụng Agrep

Một phần của tài liệu Một họ thuật toán sánh mẫu Wu-Manber và thực nghiệm (Trang 45)

Đây là một công cụ không thể thiếu trong quá trình tìm kiếm văn bản. Có ba tính năng quan trọng nhất của agrep không được hỗ trợ bởi gia đình grep là:

a) Khả năng tìm kiếm các mẫu gần đúng

b) Agrep ghi theo định hướng chứ không phải là chỉ dòng theo định hướng một bản ghi được mặc định, nhưng nó có thểđược người dùng xác định.

c) Đa mẫu với các truy vấn logic AND (hoặc OR) Ngoài ra còn có các tùy chọn thông thường như sau:

-# find matches with at most # errors tìm thấy những đối sánh với ít nhất lỗi # -c output the number of matched records đưa ra số lượng mẫu phù hợp

-d define record delimiter xác định những mẫu có dấu phân cách -e for use when pattern begins with - sử dụng khi mẫu bắt đầu với dấu - -f Name of file containing patterns tên của những tệp có chứa mẫu phù hợp -h do not display file names không hiển thị tên tệp

-I case-insensitive search; ISO <> ASCII tìm kiếm những trường hợp không nhạy cảm; ISO <> ASCII

-i# Digits-match-digits, letters-letters số-so sánh-số; ký tự-ký tự

-k treat pattern literally - no meta-characters xử lý mẫu theo đúng nghĩa đen, không có ký tự meta -

-l output the names of files that contain a match đưa ra tên tệp có chứa 1 đối sánh -n output record prefixed by line number đưa ra số lượng tiền tố bằng số dòng -p supersequence search tìm kiếm siêu tuần tự

-r recurse subdirectories (UNIX style) thư mục con -t for use when delimiter is at the end of

records

sử dụng khi dấu phân cách ở cuối cùng của bản ghi

-v output those records without matches đưa ra những bản ghi không có chứa so sánh -w pattern has to match as a word: "win" will

not match "wind"

sánh mẫu kiểu như “win” chứ không phải “wind”

-x pattern must match a whole line mẫu phải đối sánh với toàn bộ 1 dòng -y suppresses the prompt when used with ngăn chặn dấu nhắc khi sử dụng với -A always output filenames luôn đưa ra tên tệp

-B find best match to the pattern tìm mẫu phù hợp tốt nhất

-Dk deletion cost is k chi phí xóa bỏ là k

-Ik insertion cost is k chi phí chèn là k -Sk substitution cost is k chi phí thay thế là k

-ia ISO chars mapped to lower ASCII ký tự ISO ánh xạ tới ASCII -i0 case-sensitive search tìm kiếm trường hợp nhạy cảm -CP 850|437 set codepage thiết lập bảng mã

-[012345V] version / verbose more phiên bản/ tiết 1) Ví dụ 1

- ta có hai file đưa ra so sánh với nội dung như sau + file: nguon.txt có nội dung

+ file dich.txt có nội dung

2) ví dụ 2

- đối sánh 2 tập tin WM.cpp và WM.h với tùy chọn –i#

3) Ví dụ 3

- ta có file des.vb dung lượng 61kb. Thực hiện với tùy chọn –v (tức là đưa ra những bản ghi không có chứa sánh mẫu) với file thammades.vb dung lượng 56kb ta tìm được 1753 bản ghi không chứa đối sánh

Một phần của tài liệu Một họ thuật toán sánh mẫu Wu-Manber và thực nghiệm (Trang 45)