1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu về công nghệ search engine

41 555 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 41
Dung lượng 594,09 KB

Nội dung

KHOA CÔNG NGHỆ THÔNG TIN – TRƯỜNG ĐẠI HỌC HẢI PHÒNG MỤC LỤC KHOA CÔNG NGHỆ THÔNG TIN – TRƯỜNG ĐẠI HỌC HẢI PHÒNG DANH MỤC HÌNH VẼ VÀ BẢNG BIỂU SỐ HIỆU Hìn h 1.1 Hìn h 1.2 Hìn h 1.3 Hìn h 1.4 Hìn h 1.5 Hìn h 2.1 Bả ng 2.1 Bả ng 3.1 Bả ng 3.2 Bả ng 3.3 Hìn h 3.1 Hìn h 3.2 Hìn h 3.3 Hìn h 3.4 Hìn h 3.5 Hìn h 3.6 Hìn h 3.7 MÔ TẢ Giao diện Archie Veronica dễ dàng tìm kiếm không gian Gopher Yahoo Search bao gồm nhiều tính Giao diện Google Sơ đồ hệ thống Search Engine Netnam Lưu đồ xử lý cho hệ thống lập mục Các từ khóa giúp tối ưu câu truy vấn Minh họa cho bảng keywords Minh họa cho bảng users Minh họa cho web Giao diện Chức add url Giao diện kết Quản lý quảng cáo Kết sau add quảng cáo Chức quản lý top từ khóa Chức xóa kết KHOA CÔNG NGHỆ THÔNG TIN – TRƯỜNG ĐẠI HỌC HẢI PHÒNG Hìn h 3.8 Hìn h 3.9 Hìn h 3.10 Thay đổi tiêu đề Nhập trang cách thủ công Chức đổi mật DANH MỤC CÁC TỪ VIẾT TẮT TỪ VIẾT TẲT Ý NGHĨA TỪ ĐẦY ĐỦ CSDL Cơ sở liệu DNS Domain Name System FTP File Transfer Protocol HTTP IP MOMspi der PT RBSE HyperText Protocol Internet Protocol Multi-Owner Maintenance spider Giao thức truyền tập tin Giao thức truyền tải siêu văn Giao thức liên mạng Spider chuyên phát liên hết hỏng Phương thức Repository Software Engineering SE Search Engine TP Thành phần URL Transfer Hệ thống tên miền Uniform Locator Based Tên loại spider đa Công cụ tìm kiếm Resource Địa trang web KHOA CÔNG NGHỆ THÔNG TIN – TRƯỜNG ĐẠI HỌC HẢI PHÒNG LỜI CẢM ƠN Em xin chân thành cảm ơn giúp đỡ nhiệt tình thầy cô giáo khoa CNTT trường ĐHHP đặc biệt cô Nguyễn Thị Như, người nhiệt tình hướng dẫn, giúp đỡ em suốt trình thực hành tìm hiểu đề tài Trong trình làm đề tài cố gắng tránh khỏi thiếu sót Rất mong nhận ý kiến giúp đỡ thầy cô hội đồng Hải Phòng, tháng năm 2016 KHOA CÔNG NGHỆ THÔNG TIN – TRƯỜNG ĐẠI HỌC HẢI PHÒNG LỜI MỞ ĐẦU Tìm kiếm trở thành điều cần thiết cho hầu hết tất người người ai, ngành nghề nhu cầu cá nhân Nhưng nói đến công cụ tìm kiếm, có người dùng lựa chọn Người dùng luôn tìm công cụ tìm kiếm an toàn nhanh chóng mà tạo kết thành công theo truy vấn tìm kiếm họ trang Xung quanh vấn đề có nhiều nguyên nhân quan trọng thông hiểu người công cụ tìm kiếm mạng – Search Engine – chưa đạt đến mức giao tiếp tốt với Nếu ta hiểu cách thức search engine tổ chức thông tin, thực thi câu truy vấn đặc trưng ngôn ngữ mà search engine tiếp cận ta tối ưu hoá hội nhận thông tin hữu ích Ngày nay, Search Engine trở thành phần thiếu sống, không ngừng cải thiện số lượng chất lượng kết tìm kiếm Sự phát triển Search Engine gắn liền với phát triển công nghệ thông tin toàn cầu Chính vậy, đồ án em tập trung nghiên cứu tìm hiểu công cụ Search Engine để có nhìn rõ nét kỹ thuật, phát triển ứng dụng chúng Đồng thời em xây dựng ứng dụng tìm kiếm đơn giản với số kỹ thuật tìm hiểu Cấu trúc đồ án trình bày sau: KHOA CÔNG NGHỆ THÔNG TIN – TRƯỜNG ĐẠI HỌC HẢI PHÒNG • Chương Trình bày khái niệm tổng quan Search Engine, lịch sử phát triển số ứng dụng giới Việt Nam • Chương Trình bày thành phần Search Engine với cách thức hoạt động chúng sao, với chiến thuật thu thập liệu, phương thức chiến lược tìm kiếm • Chương Xây dựng Search Engine đơn giản với sở liệu chức nâng cao khác Tìm hiểu công nghệ Search Engine Chương I: Tổng quan Search Engine CHƯƠNG I: TỔNG QUAN VỀ SEARCH ENGINE I Định nghĩa Search Engine Search Engine gì? Search Engine máy tìm kiếm Internet, hệ thống thông minh lập trình nâng cấp nhằm tìm kiếm kết lập mục cho website Ngày Search Engine không ngừng phát triển cho phù hợp với nhu cầu tìm kiếm thông tin website toàn cầu người dùng, chúng dựa từ khóa tìm kiếm người dùng từ phân tích sở liệu siêu lớn trả lại danh sách kết phù hợp Các Search Engine tiếng kể đến như: Google, Yahoo, Bing v…v Lịch sử phát triển số Search Engine giới Vào năm 1990 Archie - công cụ tìm kiếm đời Alan Emtage, tên ban đầu thực chất ‘Archives’ sau lại rút ngắn thành Archie Archie công cụ tìm kiếm cho trang truyền tập tin theo giao thức FTP phổ biến khắp giới, đời Archie đánh dấu kỷ nguyên Internet trở thành phần thiếu người dùng Internet Sinh viên: Phạm Thành Lộc – CNTT K13 Tìm hiểu công nghệ Search Engine Chương I: Tổng quan Search Engine Hình 1.1: Giao diện Archie Hình 1.2: Veronica dễ dàng tìm kiếm không gian Gopher Vào ngày 1/3/1995, máy tìm kiếm Yahoo đời thuốc sở hữu Yahoo Tính đến năm 2015, Yahoo Search công cụ tìm kiếm lớn thứ Mỹ với 12,8% lượng người dùng, đứng sau Google 64,5% Bing 19,8% Yahoo cung cấp cho người tìm kiếm nhiều tính tìm kiếm hình ảnh, video, địa điểm v.v nên nhanh chóng trở thành trang tìm kiếm thiết yếu vào thời điểm Hình 1.3: Yahoo Search bao gồm nhiều tính Sinh viên: Phạm Thành Lộc – CNTT K13 Tìm hiểu công nghệ Search Engine Chương I: Tổng quan Search Engine Google Search , thường gọi Web Search Google Google , công cụ tìm kiếm web thuộc sở hữu Google Inc Ra đời vào năm 1997, công cụ tìm kiếm sử dụng nhiều mạng toàn cầu Các thuật toán Google liên tục đổi cho phù hợp với nhu cầu tại, mà công cụ tìm kiếm sử dụng nhiều thời điểm vượt qua tất search engine khác Yahoo, Bing, v…v Hình 1.4: Giao diện Google Meta Search Engine 3.1 Meta Search Engine gì? Meta Search Engine hay gọi máy tìm kiếm liên hợp Một máy tìm kiếm thông thường bao gồm thành phần : spider, lập mục Index, tìm kiếm thông tin, nhiên Meta Search Engine không bao gồm thành phần Thay vào đó, với câu truy vấn người dùng, máy tìm kiếm liên hợp chuyển đến Sinh viên: Phạm Thành Lộc – CNTT K13 Tìm hiểu công nghệ Search Engine Chương I: Tổng quan Search Engine máy tìm kiếm khác (tạm gọi máy tìm kiếm nguồn) Google, Yahoo sau xử lí kết trả từ máy tìm kiếm trước đưa kết cho người dùng Meta Search Engine kể đến MetaCrawler mắt vào năm 1995 thực vài ngàn lượt truy cập ngày 3.2 Ưu nhược điểm Meta Search Engine Ưu điểm: • Không tốn tài nguyên cho việc thu thập lưu trữ trang web Thay vào meta search engine chủ yếu tập trung vào phát triển thuật toán xử lí kết từ máy tìm kiếm khác để tránh việc trùng lặp kết • Giúp tăng hội cho người dùng tìm thông tin họ cần, đặc biệt thông tin chuyên biệt Nhược điểm • Tốc độ thường chậm phải chờ kết trả từ máy tìm kiếm khác Nếu máy tìm kiếm liên hợp gửi câu truy vấn đến nhiều máy tìm kiếm, tốc độ chậm • Khả tìm kiếm nâng cao máy tìm kiếm thông thường khác bị hạn chế • Kết trả Meta Search Engine chưa tốt kết máy tìm kiếm (ví dụ Google) II Nguyên lý hoạt động Search Engine Search engine điều khiển spider thu thập thông tin mạng thông qua siêu liên kết (hyperlink) Khi spider phát site mới, gửi tài liệu (web page) cho server để tạo sở liệu mục phục vụ cho nhu cầu tìm kiếm thông tin Sinh viên: Phạm Thành Lộc – CNTT K13 10 Tìm hiểu công nghệ Search Engine Chương II: TP PT hoạt động SE nhiều hơn, cho dù ta có tay công cụ lướt web tuyệt vời đến đâu duyệt hết Tuy nhiên, với trợ giúp Search Engine, ta chí xác định vị trí từ cần tìm trang web khắp nơi giới Các phương thức tìm kiếm 2.1 Tìm theo từ khoá - Keyword searching Đây phương pháp áp dụng với hầu hết search engine Trừ tác giả trang web xác định từ khóa cho tài liệu mình, ngược lại điều phụ thuộc vào search engine Như search engine tự chọn đánh mục cho từ mà chúng cho quan trọng giúp phân biệt tài liệu khác Các từ đề cập phần II chương II từ lặp lại nhiều lần ý Một số site lập mục cho tất từ có trang web, số khác chọn số đoạn văn Các hệ thống đánh mục toàn văn (full-text indexing systems) đếm số lần xuất từ tài liệu ngoại trừ từ stopword Có công cụ tìm kiếm phân biệt chữ hoa lẫn chữ thường 2.2 Những khó khăn tìm theo từ khoá Search engine thường gặp rắc rối với từ đồng âm khác nghĩa (ví dụ hard cider, hard stone, a hard exam, hard drive) từ có biến thể khác có tiền tố hậu tố big, bigger, student, students … Bên cạnh search engine trả tài liệu chứa từ đồng nghĩa với từ câu truy vấn 2.3 Tìm theo ngữ nghĩa - Concept-based searching Excite tiếng với chiến thuật tìm theo ngữ nghĩa chiến thuật không sử dụng Không giống hệ thống tìm theo từ khoá, hệ thống tìm theo ngữ nghĩa ‘đoán’ ý muốn người dùng thông qua câu chữ Tìm theo ngữ nghĩa hoạt động dựa hình thức gom nhóm tài liệu, phức tạp dựa vào Sinh viên: Phạm Thành Lộc – CNTT K13 27 Tìm hiểu công nghệ Search Engine Chương II: TP PT hoạt động SE ngôn ngữ học, thuyết trí tuệ nhân tạo Excite tiếp cận dựa vào phương pháp tính toán cách đếm số lần xuất từ quan trọng Khi nhiều từ cụm từ có nghĩa đặt gần tài liệu Excite cho chúng ám chủ đề Ví dụ, từ ‘heart’ đứng gần từ ‘attack’ (cơn đau tim), ‘blood’ (sự sống), ‘stroke‘ (sự say nắng), search engine xếp trang chứa từ vào chủ đề y học sức khoẻ Ngược lại, từ ‘heart‘ đứng gần từ ‘flowers’, ‘candy’, … search engine xếp trang chứa từ vào chủ đề trữ tình Các chiến lược tìm kiếm Mọi người nhận xét web nơi mà ta có thông tin chủ đề Nhưng kết cuối thường lãng phí thời gian cho URL vô ích Do đến lúc ta nghĩ đến chiến lược tìm kiếm Ta khởi đầu với đống thông tin chủ đề rộng ? Hoặc ta hình dung cụ thể cần tìm ? Hay ta muốn tìm địa ? Nếu phạm vi quan tâm ta rộng, ta nên xem xét thư mục web (web directory) Nếu sau ta thu hẹp phạm vi cần tìm, xem xét việc lựa chọn công cụ tìm kiếm thích hợp 3.1 Tìm thông tin với thư mục chủ đề Giống tìm sách thư viện, cân nhắc tìm theo tác giả, tiêu đề, chủ đề, ta thường chọn chủ đề để bao quát vùng thông tin rộng Ví dụ : ta muốn tạo trang chủ (home page) cách viết file HTML nào, chí chưa tạo file ảnh, cách đẩy trang lên mạng Tóm lại ta cần thông tin cho chủ đề rộng - xuất trang web (web publishing) Sinh viên: Phạm Thành Lộc – CNTT K13 28 Tìm hiểu công nghệ Search Engine Chương II: TP PT hoạt động SE Khi hoàn toàn xác định cần tìm ta nên thư mục web thư mục Yahoo Google,…vì thư mục web tập trung nhiều vào chủ đề quan tâm công cụ tìm kiếm Gần web site thường kết hợp thư mục web công cụ tìm với Ví dụ ta sử dụng Google để tìm thông tin kết nằm thư mục web Google, Google cung cấp cho ta liên kết dẫn vào thư mục 3.2 Thông tin với công cụ tìm kiếm Một số công cụ tìm kiếm gặp rắc rối với liệu đầu vào người dùng Ví dụ : từ chứa ký tự đặc biệt C++ , từ chứa stopword to be or not to be Xét ví dụ khác rõ ràng Giả sử ta người thích tiểu thuyết trinh thám muốn tìm trang nói tác giả yêu thích Nếu đơn giản nhập vào từ ‘mystery‘ ‘writer’, phần lớn search engine trả liên kết dẫn đến trang chứa từ Như có khả hàng trăm, chí hàng ngàn URL không mong muốn Tuy nhiên ta nhập vào cụm từ, kết khả quan 3.3 Tối ưu câu truy vấn Rất nhiều search engine áp dụng toán tử Boolean (Boolean operators) định vị trí (proximai locators) để tối ưu câu truy vấn Đó từ khoá sau: STT Từ khóa Ý nghĩa AND / phép toán + Mọi từ câu truy vấn phải có tài liệu OR Tài liệu chứa từ cần tìm Sinh viên: Phạm Thành Lộc – CNTT K13 29 Tìm hiểu công nghệ Search Engine Chương II: TP PT hoạt động SE NOT / phép toán - Tài liệu không chứa [các] từ sau từ khoá NEAR Các từ cần tìm cách ký tự tài liệu FOLLOWED BY / ADJ Các từ cần tìm phải đứng cạnh tài liệu Bảng 2.1: Các từ khóa giúp tối ưu câu truy vấn 3.4 Truy vấn ví dụ Một điểm đáng kích lệ search engine truy vấn ví dụ Sau liệt kê loạt tài liệu cho thoả yêu cầu người dùng, search engine ‘gợi ý‘ vài site có liên quan đến chủ đề ta quan tâm Nếu ta theo sau liên kết này, có kết khả quan! Sinh viên: Phạm Thành Lộc – CNTT K13 30 Tìm hiểu công nghệ Search Engine Chương III: Demo ứng dụng CHƯƠNG III: DEMO ỨNG DỤNG I Thiết kế sở liệu Các bảng sở liệu chức năng: - Bảng “keywords” id keyword count graphic music game … … … Bảng 3.1: Minh họa cho bảng keywords Bảng keywords giúp quản lý từ khóa mà người dùng tìm kiếm, đếm số từ khóa tìm kiếm lần từ xếp vào danh sách top từ khóa tìm nhiều giao diện chương trình Ngoài bảng giúp quản trị biết người dùng tìm kiếm từ biết từ khóa phổ biến để cải thiện kết tìm kiếm tốt Sinh viên: Phạm Thành Lộc – CNTT K13 31 Tìm hiểu công nghệ Search Engine Bảng “users” - id Chương III: Demo ứng dụng username password Tên đăng nhập Mật Ad1 Ad2 Ad3 Quảng cáo Quảng cáo Quảng cáo title Tiêu đề Bảng 3.2: Minh họa cho bảng users Bảng users quản lý tài khoản admin, đăng nhập admin quản lý phần nâng cao quảng cáo, thay đổi tiêu đề trang web….( đề cập thêm phần dưới) - id Bảng “web” url title description Sinh viên: Phạm Thành Lộc – CNTT K13 body author date 32 Tìm hiểu công nghệ Search Engine Chương III: Demo ứng dụng http://ttvnol.com Trái tim Diễn đàn trái Trái tim Việt Zamba E- 20 May 2016 Việt Nam tim Việt Nam Nam Online commerce Online – Trang chủ diễn Group Diễn đàn… đàn www.soft- Soft- Online http://www.softhelp.forum.st … Soft- 14 Mar 2012 Help™ help.forum.st Help™Welcome Soft-Help™ To Soft-Help … … … … Bảng 3.3: Minh họa cho bảng web Bảng web lưu giữ thông tin website sở liệu phục vụ cho việc tìm kiếm người dùng II Giao diện chức Giao diện chương trình Sinh viên: Phạm Thành Lộc – CNTT K13 33 Tìm hiểu công nghệ Search Engine Chương III: Demo ứng dụng Hình 3.1: Giao diện Giao diện bao gồm phần: - Add url: click vào button Add url xuất giao diện sau Hình 3.2: Chức add url Sinh viên: Phạm Thành Lộc – CNTT K13 34 Tìm hiểu công nghệ Search Engine Chương III: Demo ứng dụng Khi nhập url vào form ấn nút Submit, chương trình tự động thu thập thông tin url title, description, body, author, sau add vào bảng web sở liệu Form bên thu thập liên kết mở rộng url nhập, nhiên trình thu thập thời gian - Form tìm kiếm: người dùng nhập từ khóa muốn tìm sau bầm nút Search để kết Kết lấy bảng web sở liệu Hình 3.3: Giao diện kết Sinh viên: Phạm Thành Lộc – CNTT K13 35 Tìm hiểu công nghệ Search Engine - Chương III: Demo ứng dụng Top 15 Searches: top 15 từ khóa tìm kiếm nhiều nhất, số xếp dựa vào thống kê bảng keywords Chức mở rộng admin 2.1 Quản lý quảng cáo Hình 3.4: Quản lý quảng cáo Sử dụng câu lệnh html để chèn quảng cáo vào page Ví dụ ta sử dụng câu lên sau cho ô Ad Unit #1: Ta thu kết sau: Sinh viên: Phạm Thành Lộc – CNTT K13 36 Tìm hiểu công nghệ Search Engine Chương III: Demo ứng dụng Hình 3.5: Kết sau add quảng cáo 2.2 Quản lý Top 15 Searches Hình 3.6: Chức quản lý top từ khóa Admin loại bỏ từ khóa khỏi top 15 từ tìm kiếm nhiều với click vào đấu x sau từ khóa Sinh viên: Phạm Thành Lộc – CNTT K13 37 Tìm hiểu công nghệ Search Engine Chương III: Demo ứng dụng 2.3 Xóa kết Hình 3.7: Chức xóa kết Admin xóa kết tìm kiếm nhập ID kết vào form nhấn nút Remove entry 2.4 Thay đổi tiêu đề trang Hình 3.8: Thay đổi tiêu đề 2.5 Nhập trang cách thủ công Sinh viên: Phạm Thành Lộc – CNTT K13 38 Tìm hiểu công nghệ Search Engine Chương III: Demo ứng dụng Hình 3.9: Nhập trang cách thủ công Với việc nhập vào Title, Url, Description Admin đưa vào sở liệu kết theo ý 2.6 Đổi mật Giúp Admin thay đổi mật lần đăng nhập Hình 3.10: Chức đổi mật Sinh viên: Phạm Thành Lộc – CNTT K13 39 KẾT LUẬN Đề tài trình bày sở lý thuyết nguyên lý vận hành hệ thống search engine Lịch sử phát triển đời số search engine tiếng giới Tìm hiểu hoạt động, thống kê số đặc trưng cách sử dụng số search engine thông dụng giới Việt Nam Tìm hiểu thành phần nguyên lý hoạt động phận cấu thành search engine Tìm hiểu vấn đề đặc trưng hệ thống thu thập thông tin hoạt động môi trường mạng Đề xuất vài giải pháp xử lý khó khăn webspider Xây dựng Search Engine đơn giản Sinh viên: Phạm Thành Lộc – CNTT K13 40 DANH MỤC TÀI LIỆU THAM KHẢO I Luận văn, luận án Lê Thúy Ngọc, Đỗ Mỹ Nhung Luận văn cử nhân tin học Luận văn Tìm hiểu công nghệ Search Engine xây dựng ứng dụng minh họa cho Search Engine Tiếng Viết GVHD: Nguyễn Thị Diễm Tiên Đoàn Hữu Quang Vinh Luận văn cử nhân tin học Xây dựng công cụ hỗ trợ trình tiền xử lý chô hệ thống Search Engine GVHD: Huỳnh Thụy Bảo Trân II Sách Gerard Salton, Michael J.McGill Introduction to Modern Information Retrieval C.J van Rijsbergen Information Retrieval Department of Computing Science University of Glasgow III Website - www.searchenginehistory.com - seoin24h.blogspot.com - baodatviet.vn Sinh viên: Phạm Thành Lộc – CNTT K13 41 [...]... vật lý của hệ thống khi chúng gặp sự cố bất ngờ Sinh viên: Phạm Thành Lộc – CNTT K13 12 Tìm hiểu về công nghệ Search Engine Chương I: Tổng quan về Search Engine Hình 1.5: Sơ đồ hệ thống Search Engine của Netnam Sinh viên: Phạm Thành Lộc – CNTT K13 13 Tìm hiểu về công nghệ Search Engine Chương I: Tổng quan về Search Engine Hệ thống được chia thành ba tầng chính, gồm tầng Thu thập thông tin, Nhận dạng.. .Tìm hiểu về công nghệ Search Engine Chương I: Tổng quan về Search Engine Bởi vì thông tin trên mạng luôn thay đổi nên spider phải liên tục cập nhật các site cũ Mật độ cập nhật phụ thuộc vào từng hệ thống search engine Khi search engine nhận câu truy vấn từ user, nó sẽ tiến hành phân tích, tìm trong cơ sở dữ liệu chỉ mục & trả về những tài liệu thoả yêu cầu III Search Engine ngày nay... thay đổi đáng kể cách tìm kiếm bằng cách ngay lập tức cung cấp kết quả dựa trên những ký tự mà Sinh viên: Phạm Thành Lộc – CNTT K13 11 Tìm hiểu về công nghệ Search Engine Chương I: Tổng quan về Search Engine người dùng gõ vào Bạn sẽ thu được kết quả ngay khi gõ mà không cần nhấn enter IV Một số search engine thông dụng ở Việt Nam 1 Netnam Là một đơn vị thuộc viện hàn lâm - Viện Công nghệ Thông tin, Netnam... - 4 bộ mã tiếng Việt Sinh viên: Phạm Thành Lộc – CNTT K13 15 Tìm hiểu về công nghệ Search Engine Chương II: TP và PT hoạt động của SE CHƯƠNG II: THÀNH PHẦN VÀ PHƯƠNG THỨC HOẠT ĐỘNG CỦA SEARCH ENGINE Một Search Engine bao gồm 3 thành phần cơ bản, đó là: Bộ thu thập thông tin – Spider, Bộ lập chủ mục – Index, Bộ tìm kiếm thông tin – Search Engine I Bộ thu thập thông tin - Spider 1 Bộ thu thập thông tin... lượt truy cập mỗi ngày Sinh viên: Phạm Thành Lộc – CNTT K13 14 Tìm hiểu về công nghệ Search Engine Chương I: Tổng quan về Search Engine Ngoài việc hỗ trợ thông tin hướng dẫn sử dụng rõ ràng, Vinaseek còn hướng dẫn cả việc thiết kế trang web để tạo được form tìm kiếm của Vinaseek trên những website khác Song song đó, Vinaseek cũng là search engine duy nhất hỗ trợ nhiều bộ mã tiếng Việt nhất (10 bộ mã),... CNTT K13 28 Tìm hiểu về công nghệ Search Engine Chương II: TP và PT hoạt động của SE Khi hoàn toàn xác định mình cần tìm những gì ta nên bắt đầu từ một thư mục web như thư mục của Yahoo hoặc Google,…vì thư mục web tập trung nhiều vào chủ đề đang được quan tâm hơn là một công cụ tìm kiếm Gần đây các web site thường kết hợp thư mục web và các công cụ tìm với nhau Ví dụ nếu ta sử dụng Google để tìm thông... việc tìm kiếm của người dùng II Giao diện và chức năng 1 Giao diện chính của chương trình Sinh viên: Phạm Thành Lộc – CNTT K13 33 Tìm hiểu về công nghệ Search Engine Chương III: Demo ứng dụng Hình 3.1: Giao diện chính Giao diện chính bao gồm các phần: - Add url: khi click vào button Add url sẽ xuất hiện giao diện sau Hình 3.2: Chức năng add url Sinh viên: Phạm Thành Lộc – CNTT K13 34 Tìm hiểu về công nghệ. .. dùng tìm kiếm, nó đếm số từ khóa được tìm kiếm bao nhiêu lần từ đó sắp xếp vào danh sách top những từ khóa được tìm nhiều nhất trong giao diện chính của chương trình Ngoài ra bảng này còn giúp quản trị biết được người dùng tìm kiếm những gì từ đó biết được những từ khóa gì đang phổ biến để cải thiện kết quả tìm kiếm tốt hơn Sinh viên: Phạm Thành Lộc – CNTT K13 31 Tìm hiểu về công nghệ Search Engine. .. dụ Một điểm đáng kích lệ nữa của search engine là truy vấn bằng ví dụ Sau khi liệt kê một loạt các tài liệu được cho là thoả yêu cầu người dùng, search engine còn ‘gợi ý‘ một vài site có liên quan đến chủ đề ta đang quan tâm Nếu có thể ta hãy theo sau các liên kết này, biết đâu sẽ có kết quả khả quan! Sinh viên: Phạm Thành Lộc – CNTT K13 30 Tìm hiểu về công nghệ Search Engine Chương III: Demo ứng dụng... vấn phải có trong tài liệu 2 OR Tài liệu chứa ít nhất một từ cần tìm Sinh viên: Phạm Thành Lộc – CNTT K13 29 Tìm hiểu về công nghệ Search Engine Chương II: TP và PT hoạt động của SE 3 NOT / phép toán - Tài liệu không chứa [các] từ sau từ khoá 4 NEAR Các từ cần tìm cách nhau bao nhiêu ký tự trong tài liệu 5 FOLLOWED BY / ADJ Các từ cần tìm phải đứng cạnh nhau trong tài liệu Bảng 2.1: Các từ khóa giúp

Ngày đăng: 04/06/2016, 10:58

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w