CHƯƠNG 3 : THỰC NGHIỆM
3.3. Cách sử dụng Agrep
Đây là một cơng cụ khơng thể thiếu trong quá trình tìm kiếm văn bản. Cĩ ba tính năng quan trọng nhất của agrep khơng được hỗ trợ bởi gia đình grep là:
a) Khả năng tìm kiếm các mẫu gần đúng
b) Agrep ghi theo định hướng chứ khơng phải là chỉ dịng theo định hướng một bản ghi được mặc định, nhưng nĩ cĩ thểđược người dùng xác định.
c) Đa mẫu với các truy vấn logic AND (hoặc OR) Ngồi ra cịn cĩ các tùy chọn thơng thường như sau:
-# find matches with at most # errors tìm thấy những đối sánh với ít nhất lỗi # -c output the number of matched records đưa ra số lượng mẫu phù hợp
-d define record delimiter xác định những mẫu cĩ dấu phân cách -e for use when pattern begins with - sử dụng khi mẫu bắt đầu với dấu - -f Name of file containing patterns tên của những tệp cĩ chứa mẫu phù hợp -h do not display file names khơng hiển thị tên tệp
-I case-insensitive search; ISO <> ASCII tìm kiếm những trường hợp khơng nhạy cảm; ISO <> ASCII
-i# Digits-match-digits, letters-letters số-so sánh-số; ký tự-ký tự
-k treat pattern literally - no meta-characters xử lý mẫu theo đúng nghĩa đen, khơng cĩ ký tự meta -
-l output the names of files that contain a match đưa ra tên tệp cĩ chứa 1 đối sánh -n output record prefixed by line number đưa ra số lượng tiền tố bằng số dịng -p supersequence search tìm kiếm siêu tuần tự
-r recurse subdirectories (UNIX style) thư mục con -t for use when delimiter is at the end of
records
sử dụng khi dấu phân cách ở cuối cùng của bản ghi
-v output those records without matches đưa ra những bản ghi khơng cĩ chứa so sánh -w pattern has to match as a word: "win" will
not match "wind"
sánh mẫu kiểu như “win” chứ khơng phải “wind”
-x pattern must match a whole line mẫu phải đối sánh với tồn bộ 1 dịng -y suppresses the prompt when used with ngăn chặn dấu nhắc khi sử dụng với -A always output filenames luơn đưa ra tên tệp
-B find best match to the pattern tìm mẫu phù hợp tốt nhất
-Dk deletion cost is k chi phí xĩa bỏ là k
-Ik insertion cost is k chi phí chèn là k -Sk substitution cost is k chi phí thay thế là k
-ia ISO chars mapped to lower ASCII ký tự ISO ánh xạ tới ASCII -i0 case-sensitive search tìm kiếm trường hợp nhạy cảm -CP 850|437 set codepage thiết lập bảng mã
-[012345V] version / verbose more phiên bản/ tiết 1) Ví dụ 1
- ta cĩ hai file đưa ra so sánh với nội dung như sau + file: nguon.txt cĩ nội dung
+ file dich.txt cĩ nội dung
2) ví dụ 2
- đối sánh 2 tập tin WM.cpp và WM.h với tùy chọn –i#
3) Ví dụ 3
- ta cĩ file des.vb dung lượng 61kb. Thực hiện với tùy chọn –v (tức là đưa ra những bản ghi khơng cĩ chứa sánh mẫu) với file thammades.vb dung lượng 56kb ta tìm được 1753 bản ghi khơng chứa đối sánh