Theo quan điểm của một nhà kĩ thuật thì tiêu đề của một trang được miêu tả như một dạng văn bản dưới dạng html. Tiêu đề được đưa ra trên đầu của mỗi trình duyệt ,và được chỉ ra trong hình 2.1. Theo Google, intitle sẽ tìm ra thuật ngữ trong tiêu đề của mỗi thông điệp được đề cập.
Hình 2.1: Tiêu đề của trang web
Cú pháp “intitle:” giúp Google giới hạn kết quả t́ìm kiếm về những trang có chứa từ đó trong tiêu đề. Ví dụ, xét truy vấn intitle:“index of” “backup files” trong hình
29
Hình 2.2: Cú pháp intitle
Google sẽ trả cho ta kết quả là những trang có chứa index of trong tiêu đề và
backup files ở đâu đó trong trang.
Tương tự, nếu ta muốn truy vấn nhiều hơn một từ trong tiêu đề của trang th́ì ta có thể dùng “allintitle:” thay cho “intitle” để có kết quả là những trang có chứa tất cả những từ đó trong tiêu đề. Ví dụ như dùng truy vấn allintitle:”indexof “”backup files” cũng giống như việc ta sử dụng truy vấn intitle:”indexof” intitle:” backupfiles” .Hình 2.3 cho ta thấy sự khác biết khi sử dụng Alintitle.
30
Hình 2.3: So sánh kết quả allintitle
2.1.2.Inurl và Allinurl: Tìm kiếm từ khóa trong URL
Cú pháp “inurl:” giới hạn kết quả t́m kiếm về những địa chỉ URL có chứa từ khóa t́ìm kiếm. Xét truy vấn inurl: admin index trong hình 2.4
Hình 2.4: Tìm kiếm với inurl
Trong ví dụ trên thì google sẽ đưa ra kết quả là những trang có từ admin
trong URL và từ index sẽ xuất hiện ở đâu đó trong trang. Tương tự, nếu ta muốn truy vấn nhiều hơn một từ trong URL th́ì ta có thể dùng “allinurl:” thay cho
“inurl” để được kết quả là những URL chứa tất cả những từ khóa t́ìm kiếm. Ví dụ: xét truy vấn allinurl:admin indextrong hình 2.5
31
Hình 2.5: So sánh kết quả với allinurl
Trong ví dụ này thì google sẽ trả ta kết quả là những trang có từ admin index trong URL.
2.1.3. Filetype: Tìm kiếm các file với định dạng cho trước.
Cú pháp “filetype:” giới hạn Google chỉ t́ìm kiếm những files trên internet có phần mở rộng riêng biệt (doc, pdf hay ppt v.v...). File mở rộng là một phần của URL. Có nhiều loại file mở rộng khác nhau bảng 1cho ta thấy các file chính được
hệ thống tìm kiếm google đưa ra theo link
32
Hình 2.6: Một số loại tập tin phổ biến và phần mở rộng trong hệ thống tìm kiếm Google
Hình 2.6 không liệt kê được tất cả các loại file, theo trang http://filext.org thì có đến hơn một ngàn loại file mở rộng. Hình 2.7 sẽ cho ta thấy top 25 file phổ biến nhất được tìm trên web, chúng được xếp sắp xếp thứ tự thông qua số lượng hit của mỗi loại file.
33
2.1.4. Allintext: Tìm kiếm một chuỗi các từ trong một trang.
Cú pháp “intext:” t́ìm kiếm các từ trong một website riêng biệt. Nó phớt lờ các liên kết hoặc URL và tiêu đề của trang.
Ví dụ: “intext:exploits” (không có ngoặc kép) sẽ cho kết quả là những liên kết đến những trang web có từ khóa t́m kiếm là "exploits" trong các trang của nó.
2.1.5. Site: Giới hạn tìm kiếm trong một trang cụ thể
Cú pháp “site:” giới hạn Google chỉ truy vấn những từ khóa xác định trong một site hoặc tên miền riêng biệt. Ví dụ xét truy vấn site:blackhat.com trong hình 2.8 để rõ hơn về chức năng của cú pháp này.
Hình 2.8: Cú pháp Site
Hãy chú ý hơn đến 2 kết quả đầu tiên là www.blackhat.com và
www.blackhat.com/latestintel. Cả 2 server đều kết thúc với đuôi blackhat.com và đây là kết quả hợp lệ cho truy vấn của chúng ta.
Giống như các truy vấn nâng cao khác, site còn có thể sử dụng trong nhiều trường hợp thú vị khác, xét truy vấn site:f trong hình 2.9 để thấy điều này.
34
Hình 2.9: Cú pháp nâng cao với Site
Trông rất gần với kết quả của truy vấn và ta có thể nhận thấy rằng kết quả đầu tiên cho 1 URL trông có chút gì đó rất kì quặc. Thẳng thắn mà nói thì kết quả này là rất kì cục.Truy vấn site:f không bao giờ trả cho ta 1 kết quả hợp lệ bởi vì không tồn tại miền nào tên là f.
2.1.6 .Link: Tìm kiếm các liên kết tới một trang.
35
web chỉ định. Ví dụ : xét truy vấn link:www.defcon.org trong hình 2.10:
Hình 2.10: Cú pháp Link
chuỗi “link: www.defcon.org” sẽ liệt kê những trang web có liên kết trỏ đến trang chủ defcon. Chú ý không có khoảng trống giữa "link:" và URL của trang Web
2.1.7. Cache: Cho thấy phiên bản của một trang web
Truy vấn “cache:” sẽ cho kết quả là phiên bản của trang Web mà mà Google đă lưu lại. Ví dụ:“cache:www.hackingspirits.com” sẽ cho ra trang đă lưu lại bởi Google tại một thời điểm nào đó dưới dạng hình ảnh. Nhớ rằng không có khoảng trống giữa "cache:" và URL của trang web.
Nếu bao gồm những từ khác trong truy vấn, Google sẽ điểm sáng những từ này trong văn bản(nếu có) đă được lưu lại.
Ví dụ: “cache:www.hackingspirits.com guest” sẽ cho ra văn bản đă được lưu lại có từ "guest" được điểm sáng.
2.1.8. Info: Đưa ra thông tin tổng quát về hệ thống Google.
Cú pháp [info:] không chỉ cho ta những thông tin tổng quát về hệ thống tìm kiếm Google mà còn cung cấp cho ta những link liên kết đến hệ thống tìm kiếm của
36
Google .Trong hình 2.11 các thông số hợp lệ của URL và một miền tên được kết hợp với cú pháp info, ta sẽ nhận được những hàm tương tự gồm một tên miền hay một URL tương ứng như truy vấn của ta
Hình 2.11: Cú pháp info
2.1.9. Related: Đưa ra những trang tương tự như trang chỉ định.
Cú pháp “related:” sẽ liệt kê các trang Web "tương tự" với trang Web chỉ định. Ví dụ trong hình 2.12 với truy vấn related:actvn.edu.vn để thấy rõ điều này.
37
Hình 2.12: Cú pháp Related
Trong ví dụ trên ta dễ dàng nhận thấy hệ thống đưa ra những kết quả là những link có tương tự với URL hay hostname tuy không hoàn toàn giống với trang chỉ định đã đưa.
2.1.10. Define: Đưa ra định nghĩa của một thuật ngữ.
Truy vấn define trả lại cho ta kết quả là định nghĩa của một từ. Xét truy vấn
38
Hình 2.13: Cú pháp define
Chú ý rằng truy vấn define không được sử dụng với một cụm từ hay một tổ hợp thuật ngữ.
2.1.11. Phonebook: Tìm kiếm danh bạ điện thoại.
Truy vấn phonebook tìm kiếm danh bạ điện thoại của doanh nhân và dân cư. Có 3 truy vân có thể sử dụng cho tìm kiếm phonebook đó là : rphonebook, bphonebook và phonebook, các truy vấn này lần lượt giúp ta tìm kiến danh bạ của doanh nhân, của dân cư và cả 2.
39
Hình 2.14: Cú pháp Phonebook
Kết quả mà hệ thống đưa ra là danh sách các doanh nhân và người dân có tên là John Daling ở New York.
Để có được quyền truy cập vào danh sách đó, hãy thử với truy vấn bphonebook. Truy vấn này không phải lúc nào làm việc cũng như mong đợi nhưng với một vài truy vấn cụ thể như bphonebook:Món ngon hà nội trong hình 2.15 thì hệ thống lại làm việc rất tốt, hệ thống giúp ta tiếp cận với một danh sách các địa chỉ và số điện thoại tương ứng với tên và địa chỉ mà ta đưa ra.
40
Hình 2.15: Cú pháp Bphonebook
2.1.12. Daterange: Tìm kiếm trong các trang được đăng tải công khai với một trong một nào đó.
Cú pháp daterange tương đối trừu tượng nhưng nếu thật sự hiểu được nó thì nó rất hữu ích và đáng giá.Ta có thể sử dụng cú pháp này để xác định các trang được google chỉ ra với một dãy ngày xác định.daterange: hạn chế tìm kiếm của ta trong một ngày cụ thể hoặc trong phạm vi nhiều ngày mà trang web được đưa vào danh mục. Ta nên nhớ rằng tìm kiếm không bị giới hạn khi trang web được tạo ra mà khi nó được đưa vào danh mục bởi Google. Do đó một trang web được tạo ra vào ngày 2 tháng 2 và không được đưa vào danh mục bởi Google cho tới tận ngày 11 tháng 4 có thể được tìm thấy với cú pháp daterange: tìm ngày 11 tháng 4. Cũng nên nhớ rằng Google đưa lại các trang web vào danh mục Ví dụ, Google đưa vào danh mục một trang web vào ngày 1 tháng 6. Google đưa trang web đó vào danh mục lại vào ngày 13 tháng 8, nhưng nội dung trang web không hề thay đổi. Ngày dùng cho mục đích tìm kiếm với daterange: vẫn là ngày 1 tháng 6.Hãy lưu ý rằng
daterange: hoạt động với lịch Julian, không phải với lịch Greogry (lịch mà chúng ta vẫn dùng mỗi ngày). Có bộ chuyển đổi lịch Greogry/Julian trực tuyến, ví dụ ngày 11 tháng 9 năm 2001 thì sẽ được chuyển sang lịch Julian với thuật ngữ là 2452164
41
nên để tìm kiếm trang được google đăng lên google vào ngày 11 tháng 9 năm 2001 cùng với từ osama bin laden thì ta phải thực hiện truy vấn daterange:2452164- 2452164“osama bin laden”.
2.1.13. Inanchor: Tìm ra các chữ trong một liên kết của trang web
Cú pháp inanchor và cú pháp link được coi như là một đôi ta trong tìm kiếm,cú pháp inanchor giúp tìm ra những mẩu neo liên kết, hoặc các từ ngữ có trong link.
2.1.14. Numrange: Tìm kiếm một con số.
Cú pháp numrange yêu cầu hai biến số, một số nhỏ và một số lớn, được tách biệt bởi dấu gạch ngang.Cú pháp này rất có hiệu lực nên cực kì nguy hiểm khi bị các hacker sử dụng với mục đích xấu xa.Đúng như tên gọi, numrange có thể sử dụng để tìm kiếm các con số trong một phạm vi.Ví dụ, để xác định vị trí ô 12345 một truy vấn như numrange:12344-12346 sẽ làm việc rất tốt.Khi tìm kiếm số điện thoại , google sẽ bỏ qua các ký tự như dấu tiền tệ và dấu phẩy điều này giúp cho công việc tìm kiếm dễ dàng hơn.Sẽ tốt hơn nếu sử dụng phiên bản rút gọn của cú pháp này, ta chỉ cần đưa ra hai số trong một truy vấn,được ngăn cách bởi 2 dấu chấm. Ví dụ truy vấn 12344..12346 tương tự truy vấn trên.Khi đó cú pháp
numrange không còn là phần tử thuộc truy vấn nữa.
Truy vấn này có thể được sử dụng với các truy vấn khác cùng với các điều kiện tìm kiếm.
2.1.15. Author: Tìm kiếm các tài liệu theo tên tác giả
Cú pháp author cho phép ta tìm kiếm thông tin, tài liệu theo từng tác giả đưa ra.Xét truy vấn author:Quách Tuấn Ngọc, hệ thống tìm kiếm sẽ đưa ra các bài viết bởi bất kì tác giả nào với first, mid hay last name có từ Quách Tuấn Ngọc, như trong hình 2.16
42
Hình 2.16: Cú pháp Author
Kết quả đưa ra có thể là Lý Minh Tuấn, Kim Ngọc Tuấn, hay Nguyễn Minh Tiến. Điều này làm cho ta cân nhăc liệu những cái tên đó có phải là tên thật không? Trong hầu hết các trường hợp thì không có tên thật sự.
Cú pháp author cũng khá là khó hiểu khi sử dụng vì nó không giải thích các thông số của nó một cách chính xác giống như các cú pháp khác. Một vài tìm kiếm đơn giản như là author:Quách Tuấn Ngọc or author:quachtuanngoc@gmail.com
thì có thể tạm chấp nhận được, nhưng mọi thứ sẽ trở vô nghĩa khi chúng ta cố gắng tìm kiếm vơi tên được đưa ra dưới dạng cụm từ. Xét truy vấn author:”Tống Đình Quỳ” trong hình 2.17
43
Hình 2.17: Cú pháp author: “Tống Đình Quỳ”
Nhưng nếu sử dụng truy vấn author:Tống Đình Quỳ thì ta lại nhận được kết quả như mong đợi, hình 2.18
Hình 2.18: Cú pháp author:Tống Đình Quỳ
Cú pháp author có thể sử dụng với các nhóm cú pháp hợp lệ hay với các thuật ngữ tìm kiếm.
44
2.1.16. Group: Tìm kiếm nhóm các tiêu đề
Cú pháp này cho phép ta tìm kiếm tiêu đề của các bài viết trong Google Groups qua các thuật ngữ tìm kiếm. Cú pháp này chỉ làm việc trong Google Group.Đây là một trong những cú pháp rất phù hợp khi làm việc với các kí tự. Ví dụ để tìm kiếm các nhóm kết thúc trong forsale ta có truy vấn group:*forsale , cú pháp này làm việc rất tốt. Trong một vài trường hợp Google tìm thấy các thuật ngữ tìm kiếm của ta không nằm trong tên thật sự của nhóm mà chỉ thấy trong các từ khóa miêu tả nhóm. Xét ví dụ trong hình 2.19, truy vấn group:at7a , tuy không phải tất cả các nhóm được trả lại chứa từ at7a nhưng tất cả đều liên quan đến chủ đề at7a.
Hình 2.19: Cú pháp Group
Cú pháp group không cho ta kết quả như mong đợi khi ta kết hợp với các cú pháp khác, nếu ta nhận được một kết quả kì quặc khi kết hợp cú pháp group khi đó hãy thử dùng một và cú pháp khác như intitle.
2.1.17. Insubject
Cú pháp insubject có tác dụng giống như cú pháp intitle và trả lại kết quả giống nhau. Ví dụ khi dùng intitle:dragon và insubject:dragon thì số lượng kết quả
45
trả lại là hoàn toàn giống nhau.Sở dĩ chúng giống nhau như vậy là do chủ đề của mỗi group chính là tiêu đề của bài được đăng.
Cũng giống như các cú pháp khác, insubject có thể được sử dụng kết hợp với các cú pháp khác và với các thuật ngữ tìm kiếm.
2.1.18. Msgid: Xác định vị trí một Group Post thông qua Message ID
Cú pháp msgid hiển thị một thông báo cụ thể trong Google Groups. Cú pháp này chỉ lấy một đối số, một nhóm các tin nhắn định dạng. Một tin nhắn định dạng (message ID) là một chuỗi duy nhất để nhận dạng loại thông tin . Định dạng là một cái gì đó tương tự như xxx@yyy.com. Định dạng đó sẽ thay đổi nếu ta in ra, khi đó thì msgid sẽ bị phá vỡ, và được thay thế bởi các tham số URL như as_msgid, bây giờ có thể truy cập thông qua các trang tìm kiếm nâng cao tại http://groups.google.com/advanced_search.
Để xem các message ID ta phải xem các định dạng bản gốc của các bài đã đăng. Xem hình 18 khi cần xem một bài nào đó ta chỉ cần click vào Show Option tiếp theo chọn Show original link, ta sẽ được đưa đến một trang liệt kê toàn bộ nội dung của bài viết trong nhóm, hình 2.20
46
Hình 2.20: Một dạng điển hình của Group Message
47
Message ID của thông báo (IUpug.102004$wl.92198@text.news.blueyonder.co.uk) có thể được dùng trong dạng tìm kiếm nâng cao với tham số as_msgid hoặc là với truy vấn msgid
Khi hoạt động thì cú pháp msgid không kết hợp với các cú pháp và thuật ngữ tìm kiếm.
2.1.19: Stocks : Tìm kiếm thông tin về cổ phiếu.
Cú pháp stocks cho phép ta tìm kiềm thông tin về thị trường chứng khoán của một công ty cụ thể nào đó.Để sử dụng cú pháp này ta phải thuộc các từ viết tắt hợp lệ của cổ phiếu đó. Nếu ta cung cấp một mã biểu tượng cổ phiếu hợp lệ thì ta sẽ được trả lại là một màn hình để ta tiếp tục tìm kiếm đúng với mã biểu tượng như trong hình 2.22
Hình 2.22: Cú pháp Stock
Cú pháp stocks không thể sử dụng khi kết hợp với các cú pháp và thuật ngữ tìm kiếm.