Khái quát vài nét về máy tìm kiếm Gigablast

Một phần của tài liệu Tìm kiếm thông tin trên mạng Internet: Hướng dẫn thực hành - Phần 2 (Trang 69)

CHƯƠNG 6 MÁY TÌM KIẾM AOL

7.2. Khái quát vài nét về máy tìm kiếm Gigablast

7.2.1. Sự hình thành và tìm kiếm mặc định của máy tìm kiếm Gigablast

Gigablast bắt đầu như một máy tìm kiếm web độc lập nhỏ có trụ sở tại New Mexico. Nó được thành lập vào năm 2000 bởi Matt Wells, trước đây là của Infoseek.Năm 2015, nó tuyên bố đã lập chỉ mục hơn 12 tỷ trang web và nhận được hàng tỷ truy vấn mỗi tháng. Mã nguồn của máy tìm kiếm được viết bằng ngơn ngữ lập trình C và C ++. Nó được phát hành dưới dạng phần mềm nguồn mở theo Giấy phép Apache phiên bản 2, vào tháng 7 năm 2013.

Hình 7.8: Giao diện trang chủ của Gigablast

Gigablast đã cung cấp kết quả tìm kiếm cho các cơng ty khác như Ixquick, Clusty, Zuula, Snap, và Blingo. Năm 2003, phóng viên của tờ New York Times, Lee Dembart đã nói rằng "Gigablast có những người theo đuổi", nhưng cho rằng kết quả tìm kiếm của Google hồn thiện hơn.Gigablast hỗ trợ các tìm kiếm chuyên biệt khác nhau và các tốn tử đại số Boolean. Nó cũng hỗ trợ một tính năng liên quan đến khái niệm được gọi là Giga Bits và một tính năng tìm kiếm blog.

Khác với Google, Gigablast là máy tìm kiếm mặc định OR. Với mặc định tìm kiếm này, Gigablast sẽ cho kết quả với từng từ có trong cụm từ tìm kiếm. Ví dụ ta tìm kiếm cụm từ Microsoft Office 2016 enterprise thì kết quả tìm kiếm sẽ trả về ở mỗi kết quả có một hoặc một vài từ trong cụm từ tìm kiếm chứ khơng bắt buộc có tất cả như Google. Kết quả tìm kiếm được hiển thị như sau:

Hình 7.9: Tìm kiếm chứng minh Gigablast được mặc định OR

7.2.2. Các toán tử và từ bổ nghĩa cơ bản của máy tìm kiếm Gigablast

a. Tốn tử -

Toán tử - được sử dụng để loại trừ từ khóa trong kết quả tìm kiếm của Gigablast. Tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn như sau:

<từ khóa tìm kiếm> -<từ khóa loại bỏ>

Ví dụ: người dùng muốn tìm kiếm các kết quả liên quan đến Apple nhưng loại bỏ kết quả liên quan đến iphone, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn: Apple –iphone. Kết quả tìm kiếm được hiển thị như sau:

Hình 7.10: Tìm kiếm với tốn tử - trên Gigablast

b. Từ bổ nghĩa AND và NOT (AND NOT)

+ Từ bổ nghĩa AND được sử dụng khi ta muốn tìm kiếm đồng thời 2 từ khóa khác nhau và mỗi kết quả tìm kiếm được trả về đều phải có hai từ khóa này. Tại hộp Search của máy tìm kiếm Gigablast, người dùng nhập vào truy vấn như sau:

<từ khóa 1> AND <từ khóa 2>

Ví dụ: người dùng muốn tìm kiếm đồng thời thông tin về Sony và HTC, taị hộp Search của máy tìm kiếm Gigablast, người dùng nhập vào truy vấn sau đây:

Sony AND HTC.

Hình 7.12: Tìm kiếm với từ bổ nghĩa AND trên Gigablast

+ Từ bổ nghĩa NOT hoặc AND NOT được sử dụng với nghĩa tương tự, khi người dùng muốn máy tìm kiếm loại bỏ thông tin không cần thiết trong kết quả tìm kiếm. Tại hộp Search của máy tìm kiếm Gibablast, người dùng nhập vào truy vấn sau đây:

<từ khóa tìm kiếm> AND NOT <từ khóa loại bỏ>

Ví dụ: người dùng muốn tìm kiếm các kết quả liên quan đến từ khóa Android nhưng loại bỏ kết quả liên quan đến Google, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn:

Android AND NOT Google.

Hình 7.11: Tìm kiếm với từ bổ nghĩa AND NOT trên Gigablast

c. Dấu nháy kép “ ”

Tốn từ này được sử dụng khi muốn tìm kiếm chính xác một cụm từ nào đó. Taị hộp Search của máy tìm kiếm Gigablast, người dùng nhập vào truy vấn như sau: “từ khóa tìm kiếm”.

Ví dụ: người dùng muốn tìm kiếm cụm từ “thương mại điện tử”, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn: “thương

mại điện tử”.

Kết quả tìm kiếm được hiển thị như sau:

7.2.3. Các cú pháp đặc biệt của máy tìm kiếm Gigablast

a. Cú pháp suburl

Cú pháp này dùng để tìm kiếm các từ tìm kiếm hoặc mệnh đề tìm kiếm trong các URL của các site. Tại hộp Search của máy tìm kiếm Gigablast, người dùng nhập vào truy vấn như sau:

suburl:<từ khóa tìm kiếm>

Ví dụ: người dùng muốn tìm kiếm từ khóa e-commerce trong url của các site, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn:

suburl:e-retailing

Kết quả tìm kiếm được hiển thị như sau:

Hình 7.14: Tìm kiếm với cú pháp suburl trên Gigablast

b. Cú pháp site

Cú pháp này dùng để tìm kiếm từ khóa hoặc mệnh đề tìm kiếm trong một site xác định hoặc trong một tên miền cấp cao. Tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn như sau:

Ví dụ: người dùng muốn tìm kiếm cụm từ e-commerce trong các site có tên miền edu, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn: e-commerce site:edu. Kết quả tìm kiếm được hiển thị như sau:

Hình 7.15: Tìm kiếm với cú pháp site trên Gigablast

c. Cú pháp url

Cú pháp này dùng để tìm kiếm tồn bộ các thơng tin về một URL. Tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn như sau:

url:<tên miền muốn tìm>

Ví dụ: người dùng muốn tìm kiếm thông tin về url của trang msn.com, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn:

url:https://www.msn.com

Hình 7.16: Kết quả tìm kiếm sử dụng cú pháp url trên Gigablast

d. Cú pháp intitle

Cú pháp này dùng để tìm kiếm các từ tìm kiếm hoặc mệnh đề tìm kiếm trong các tiêu đề của các site. Tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn như sau:

intitle:<từ khóa tìm kiếm>

Ví dụ: người dùng muốn tìm kiếm cụm từ big data trong tiêu đề của các site, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn:

intitle:big data

Hình 7.17: Tìm kiếm với cú pháp intitle trên Gigablast

e. Cú pháp IP

Cú pháp này dùng để tìm kiếm các từ khóa hoặc mệnh đề tìm kiếm từ một địa chỉ IP xác định. Tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn như sau:

<từ khóa> ip:<địa chỉ IP>

Ví dụ: người dùng muốn tìm kiếm từ khóa e-commerce từ địa chỉ IP 31.13.95.36, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn:

e-commerce IP:31.13.95.36

Kết quả tìm kiếm được hiển thị như sau:

f. Cú pháp link

Cú pháp này dùng để tìm kiếm các trang được liên kết tới một URL xác định. Tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn như sau:

link:<địa chỉ URL của website>

Ví dụ: người dùng muốn tìm kiếm các trang được liên kết tới trang amazon.com, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn:

link:https://www.amazon.com

Kết quả tìm kiếm được hiển thị như sau:

Hình 7.19: Tìm kiếm với cú pháp link trên Gigablast

g. Cú pháp filetype

Cú pháp này dùng để tìm kiếm các định dạng của văn bản trong các trang Web, bao gồm các kiểu: doc, xls, ppt, pdf, txt, ps (Postscript)… Tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn như sau:

<từ khóa tìm kiếm> filetype:<định dạng>

Ví dụ: người dùng muốn tìm kiếm văn bản về e-commerce dưới định dạng file là PowerPoint, tại hộp Search của máy tìm kiếm, người dùng nhập vào truy vấn:

e-commerce filetype:ppt

Kết quả tìm kiếm như sau:

Hình 7.20: Tìm kiếm với cú pháp filetype trên Gigablast 7.3. Kỹ thuật tăng tốc trình duyệt

7.3.1. Tắt scripting

Để tắt được scripting, ta chọn Tools – Internet Options, chọn Security, sau đó chọn Custom Options. Quan sát các danh sách và chọn scripting. Chuyển tất cả các mục này tới tùy chọn Disable hoặc ít nhất là Prompt.

Ví dụ về tắt Scripting trên trình duyệt IE

7.3.2. Tắt java

Đa số những trình duyệt sẽ có một tùy chọn để tắt Java, trừ những trình duyệt chỉ có văn bản như Lynx và phiên bản không Java của Opera. Ở đây tác giả sẽ hướng dẫn tắt Java trên trình duyệt Chrome:

- Nhập chrome://plugins vào thanh địa chỉ rồi bấm Enter. Trên trang xuất hiện hiển thị danh sách các plugin đã được cài đặt vào trong trình duyệt, ta kéo thanh cuộn ở bên phải, tìm đến plugin có tên là Java có dịng chữ bên dưới là Next Generation Java Plug-in, rồi bấm vào liên kết Vơ hiệu hóa (hoặc Disable) bên cạnh.

Ví dụ về tắt Java trên trình duyệt Chrome:

Hình 7.22: Tắt Java trên trình duyệt Chrome

7.3.3. Tắt tự động nhắc mật khẩu

Tắt những tùy chọn tự động nhớ những mật khẩu (Auto-remember Passwords) sao cho khơng một ai sử dụng trình duyệt của các người dùng sau người dùng có thể đăng nhập tới những website mà người dùng vừa đăng nhập.

Hình 7.23: Tắt tự động nhắc mật khẩu trên trình duyệt IE

7.3.4. Tắt popup

Các trình chặn Pop-up này vẫn cịn được sử dụng ở một số site. Một vài trình duyệt và toolbars đưa ra cho người dùng lựa chọn để chỉ mở các cửa sổ Pop-up mà người dùng chỉ rõ- chúng được sử dụng hợp pháp trên nhiều site.

Ví dụ về tắt Popup trên trình duyệt IE:

7.3.5. Tắt plugins

Với Java bị vơ hiệu hóa, các chương trình Java khơng thể khởi động, và với ActiveX bị vơ hiệu hóa, người dùng thường khơng thấy phim Flash. Khi đã tắt những Plugin này, dễ dàng nhận thấy sự tăng tốc độ duyệt và tìm kiếm lên rất nhiều.

Ví dụ về tắt Plugins trên trình duyệt IE

Hình 7.25: Tắt plugins trên trình duyệt IE

7.3.6. Tắt các hình ảnh

Việc lướt Web tới một site nào đó có q nhiều các hình ảnh sẽ khiến cho mất rất nhiều thời gian, do đó để tăng tốc độ của trình duyệt, sử dụng một số các công cụ hoặc phương pháp để tắt bớt các hình ảnh.

BÀI TẬP CHƯƠNG 7

Hãy sử dụng máy tìm kiếm Gigablast để thực hiện các tìm kiếm sau:

1. Tìm kiếm về “điện thoại thơng minh” nhưng bỏ qua thương hiệu NOKIA

2. Tìm kiếm tài liệu dưới dạng file WORD về “cách mạng công nghiệp 4.0”

3. Tìm kiếm “social media marketing” trong website của các tổ chức. 4. Tìm kiếm thơng tin về “thị trường thương mại điện tử” trong tiêu đề các website thuộc lĩnh vực giáo dục.

5. Tìm kiếm các trang được liên kết tới địa chỉ url của website www.walmart.com.

6. Tìm kiếm thơng tin về website www.amazon.com

7. Tìm kiếm từ khóa “mạng xã hội” trong url của các website của cơ quan chính phủ.

8. Tìm kiếm chính xác, đúng thứ tự cụm từ Cách mạng cơng nghiệp lần thứ 4

9. Tìm kiếm về điện thoại thơng minh nhưng ưu tiên kết quả tìm kiếm về điện thoại Android

10. Tìm kiếm thơng tin về Google nhưng bỏ qua từ khóa “máy tìm kiếm”.

11. Tìm kiếm thơng tin về “characteristics of AI” với định dạng văn bản là pdf.

12. Tìm kiếm thơng tin về “protect consumers in e-retailing” trong tiêu đề của các trang web.

13. Tìm kiếm thơng tin về “blockchain workshop” trong tiêu đề các bài viết đăng trên các site của các tổ chức.

14. Tìm kiếm thơng tin về “mobile commerce” trong địa chỉ URL của các trang thuộc site: emarketer.com

15. Tìm kiếm thơng tin về “Big data” trong địa chỉ URL của các trang web của các tổ chức với định dạng tài liệu tìm được là pdf.

Hãy sử dụng máy tìm kiếm ODP để tìm kiếm những thơng tin sau đây:

1. Tìm kiếm thơng tin về các cơng ty sau đây: amazon; walmart; ebay; etoys.

2. Tìm kiếm các từ khóa sau đây: artificial intelligent; e-strategy trong sự mô tả của các site.

3. Tìm kiếm thơng tin sau đây: market of B2C; B2B marketing trong tiêu đề của các trang web.

4. Tìm kiếm các thơng tin về các từ nối với các từ khóa sau đây: mobile; marketing; securities.

5. Tìm kiếm các thơng tin về Thanh tốn điện tử nhưng loại trừ thơng tin về Thanh toán di động.

DANH MỤC CÁC THUẬT NGỮ

AOL là một cổng thông tin web và nhà cung cấp dịch vụ tìm kiếm trực

tuyến có trụ sở tại thành phố New York. 145 - 169

Bing (trước đây là Live Search, Windows Live Search và MSN Search) là bộ máy tìm kiếm web (được quảng cáo là một bộ máy "ra quyết định", đại diện cho công nghệ tìm kiếm hiện nay của Microsoft. 118 - 143

Cổng thông tin là một website cung cấp các nội dung thơng tin và dịch

vụ tiện ích cho người dùng, thường có máy tìm kiếm của riêng mình và được tổ chức theo thứ bậc. 13

Máy tìm kiếm trên Internet (Internet search engine) là các website đặc

biệt, được thiết kế để giúp mọi người tìm kiếm thơng tin được lưu trên

các site khác nhau. 14 -21

Cú pháp Cache (còn gọi là cú pháp bộ nhớ đệm) cho phép cung cấp một

bức tranh về một trang web trông như thế nào từ lần cuối cùng Google chỉ số hóa trang web này. 35 - 36

Cú pháp contains được sử dụng để tìm kiếm các trang web chứa đựng bài hát với định dạng loại file theo yêu cầu. 129

Cú pháp daterange cho phép người dùng tìm kiếm những thơng tin

hoặc chủ đề nào đó theo yêu cầu trên các trang web đã được chỉ số hóa bởi Google trong một phạm vi ngày tháng nhất định. 37 - 41

Cú pháp Employee là cú pháp được dùng để tìm kiếm những người

dùng đang làm việc ở một công ty hoặc một tổ chức nào đó. 58

Cú pháp Event named là cú pháp được sử dụng để tìm kiếm sự kiện theo tên. Cú pháp này giúp tìm kiếm những sự kiện đã, đang và sẽ diễn ra trong thời gian tới. 59

Cú pháp Favorite interests of là cú pháp được dùng để tìm kiếm sở

thích (Interests) của một ai đó hoặc của một nhóm người nào đó có đặc điểm chung. 72

Cú pháp feed và hasfeed được sử dụng để tìm kiếm các trang web có chứa RSS feed theo một từ khóa hoặc một chủ đề cụ thể. 132

Cú pháp filetype được sử dụng để tìm kiếm các thơng tin, các văn bản,

tài liệu theo yêu cầu định dạng cho trước. 41 – 42, 128 – 129

Cú pháp Games played by là cú pháp này được dùng để tìm kiếm

những trị chơi (Games) được u thích bởi một ai đó hoặc của một nhóm người nào đó có đặc điểm chung. 76

Cú pháp Group named là cú pháp này được sử dụng để tìm kiếm những

nhóm người dùng theo tên. 60

Cú pháp Groups joined by là cú pháp được dùng để tìm kiếm những

Group được tham gia bởi một ai đó hoặc của một nhóm người nào đó có đặc điểm chung. 73

Cú pháp inanchor chun tìm kiếm các từ khóa truy vấn của người

dùng trong các liên kết mấu neo (link anchor) của trang Web. 34 - 35

Cú pháp info cung cấp thơng tin nào đó về một địa chỉ site được xác định trước, bao gồm một danh sách hiện thời cho URL đó nếu có, một link tới bộ đệm của trang, một link tới các trang khác tương tự nó, cuối cùng là một link tới những trang chứa đựng URL như văn bản text. 37

Cú pháp intext chỉ tìm kiếm từ khóa truy vấn của người dùng trong nội

dung văn bản mà bỏ qua các tiêu đề, hoặc địa chỉ web cũng như các link.

32 - 33

Cú pháp intitle và tùy chọn tìm kiếm bổ sung allintitle được sử dụng để

tìm kiếm những thơng tin, chủ đề nằm trong tiêu đề của các trang Web. 30, 97-98, 153-154, 183

Cú pháp inurl và tùy chọn tìm kiếm bổ sung allinurl được sử dụng để tìm kiếm các từ khóa xác định trước về một lĩnh vực hoặc chủ đề cụ thể mà những từ khóa này nằm trong đường dẫn URL của các trang Web. 31, 95-96, 155

Cú pháp ip được sử dụng để tìm kiếm các trang web hoặc từ khóa về

Một phần của tài liệu Tìm kiếm thông tin trên mạng Internet: Hướng dẫn thực hành - Phần 2 (Trang 69)

Tải bản đầy đủ (PDF)

(97 trang)