So sánh giữa thuật toán breadth-first và naive best-first

Một phần của tài liệu Luận văn:Tìm hiểu về trình thu thập web và xây dựng trang web tổng hợp thông tin doc (Trang 31 - 33)

chính xác trung bình (b) Theo độ thu hồi mục tiêu trung bình

25

Chương 2. XÂY DỰNG WEBSITE TỔNG HỢP THÔNG TIN

Trong chương này chúng ta sẽ từng bước hiện thực hóa việc xây dựng website tổng hợp thông tin. Phần đầu chương sẽ tìm hiểu về các kiến thức nền tảng và các công nghệ liên quan, ở phần tiếp theo là các đánh giá phân tích và các giải pháp nhằm nâng cao hiệu suất của trình thu thập, phần cuối chương là việc hiện thực hóa ứng dụng thơng qua việc xây dựng hệ thống cơ sở dữ liệu và thiết kế giao diện website.

2.1. CÁC KIẾN THỨC NỀN TẢNG

2.1.1. Mạng toàn cầu

Mạng toàn cầu (world wide web [8], gọi tắt là web hoặc www) là một không gian thơng tin tồn cầu mà mọi người có thể truy nhập (đọc và viết) qua các máy tính nối với mạng Internet. Thuật ngữ này thường được hiểu nhầm là từ đồng nghĩa với chính thuật ngữ Internet. Nhưng Web thực ra chỉ là một trong các dịch vụ chạy trên Internet, chẳng hạn như dịch vụ thư điện tử. Web được phát minh và đưa vào sử dụng vào

khoảng năm 1990, 1991 bởi viện sĩ Viện Hàn lâm Anh Tim Berners-Lee và Robert Cailliau (Bỉ) tại CERN, Geneva, Switzerland.

Các tài liệu trên world wide web được lưu trữ trong một hệ thống siêu văn bản (hypertext), đặt tại các máy tính trong mạng Internet. Người dùng phải sử dụng một

chương trình được gọi là trình duyệt web (web browser) để xem siêu văn bản. Chương trình này sẽ nhận thơng tin tại ô địa chỉ do người sử dụng yêu cầu (thông tin trong ô

địa chỉ được gọi là tên miền (domain name)), rồi sau đó chương trình sẽ tự động gửi

thông tin đến máy chủ (web server) và hiển thị trên màn hình máy tính của người xem. Người dùng có thể theo các liên kết siêu văn bản trên mỗi trang web để nối với các tài liệu khác hoặc gửi thông tin phản hồi theo máy chủ trong một quá trình tương tác. Hoạt động truy tìm theo các siêu liên kết thường được gọi là duyệt web.

Q trình này cho phép người dùng có thể lướt các trang web để lấy thông tin. Tuy nhiên độ chính xác và chứng thực của thơng tin không được đảm bảo.

26

Một phần của tài liệu Luận văn:Tìm hiểu về trình thu thập web và xây dựng trang web tổng hợp thông tin doc (Trang 31 - 33)