Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
1,48 MB
Nội dung
Chương 2 : TÌM TIN TRÊN INTERNET 2.1. Một số khái niệm và thuật ngữ : Khái niệm internet : – Ngày 24/10/1995 Hội đồng Mạng liên bang Mỹ (The U.S Federal Networking Council) thông qua định nghĩa : “Internet là một hệ thống thông tin toàn cầu mà nó : + Được kết nối với nhau một cách logic thông qua một hệ thống địa chỉ IP duy nhất toàn cầu hoặc dựa trên những giao thức mở rộng hoặc tương thích của IP. + Có khả năng hỗ trợ chương trình truyền thông sử dụng giao thức TCP/IP (còn gọi là giao thức điều khiển truyền dẫn / giao thức internet) hoặc các giao thức tương thích hoặc mở rộng. + Cung cấp, sử dụng hoặc làm cho các dịch vụ cấp cao nằm trên tầng truyền thông hoặc các hạ tầng liên quan có thể truy cập được một cách công cộng hoặc cá nhân.” Khái niệm internet (tiếp theo): – Nghị định 55/2001/CP-NĐ của Chính phủ ngày 23/8/2001 về hoạt động internet đã định nghĩa “Internet là một hệ thống thông tin được kết nối với nhau bởi giao thức truyền thông internet (IP) và sử dụng một hệ thống địa chỉ thống nhất trên phạm vi toàn cầu để cung cấp các dịch vụ và ứng dụng khác nhau cho người sử dụng”. Internet sử dụng bộ giao thức truyền thông TCP/IP làm chuẩn truyền thông của toàn cầu. Khi mạng cục bộ (mạng LAN) sử dụng công nghệ của internet trong hoạt động của mạng thì được gọi là mạng intranet. Khái niệm World Wide Web : World Wide Web là một hệ thống các máy chủ internet cung cấp khả năng truy cập các tài liệu được biểu diễn bằng HTML, cho phép liên kết các tài liệu, các file hình ảnh, âm thanh,… Lưu ý : không phải tất cả các máy chủ trên internet đều là thành phần của World Wide Web. Sự khác biệt giữa internet và World Wide Web : Internet là nền tảng để xây dựng WWW; WWW là một phương thức chia sẻ thông tin được xây dựng dựa trên internet; WWW chỉ là một trong những phương thức để phổ biến thông tin trên internet. Internet có các dịch vụ khác như Email, Telnet, FTP,… Một số thuật ngữ liên quan : – TCP/IP (Transmission Control Protocol/Internet Protocol) : là tập hợp các giao thức cho phép truyền dữ liệu giữa các máy tính trên internet. – IP address : là địa chỉ chính thức và duy nhất cho một máy tính trên mạng internet. Địa chỉ IP là địa chỉ dạng số gồm có 4 nhóm số cách nhau bằng dấu chấm. Một số thuật ngữ liên quan (tiếp tục) : – Domain name (tên miền) : + Địa chỉ tên miền được sử dụng để xác định một máy tính kết nối internet. + Tên miền bao gồm một số cụm ký tự và phân cách nhau bằng dấu chấm. Mỗi một tên miền có đuôi xác định miền cấp cao (top level domain) mà nó thuộc về. Tên miền cấp cao gồm hai phần : phần xác định quốc gia và phần xác định lĩnh vực hoạt động hoặc loại hình của tổ chức. Miền cấp cao nhất là cấp quốc gia. – Các ký hiệu của một số miền cấp cao về lĩnh vực hoạt động : “.com” : commercial enterprise “.edu” : educational institution “.gov” : government egency “.mil” : military installation “.net” : network “.org” : nonprofit organization Một số thuật ngữ liên quan (tiếp tục) : – URL (Uniform Resource Locator) : là địa chỉ toàn cầu của các tài liệu hoặc các nguồn thông tin trên WWW. Cấu trúc của URL : cấu trúc tổng quát là “giao thức://địa chỉ máy chủ/đường dẫn/tên file” + Phần thứ nhất của URL xác định giao thức tải dữ liệu; + Phần thứ 2 xác định địa chỉ IP hoặc tên miền của máy chủ lưu nguồn thông tin; + Đường dẫn thông báo đường dẫn đến thư mục lưu tập tin; + Tên file : khi không có tên file thì trình duyệt web sẽ sử dụng một tên mặc định do máy chủ web cụ thể quy định. Một số thuật ngữ liên quan (tiếp tục) : – Hypertext (siêu văn bản) : là một cách biểu diễn thông tin dạng số cho phép các file và các thành phần dữ liệu liên quan có thể liên kết với nhau. – HTML (Hypertext Markup Language – ngôn ngữ đánh dấu siêu văn bản) : là ngôn ngữ máy tính được sử dụng để tạo tài liệu siêu văn bản. – HTTP (Hypertext Transfer Protocol) : là giao thức truyền thông được sử dụng trong phần mềm trình duyệt web để tạo kết nối giữa một máy khách và một máy chủ web ở xa. – Hyperlink (siêu liên kết) : + Là một kết nối trực tiếp trong một tài liệu siêu văn bản đến địa chỉ internet của tài liệu khác hoặc file khác. + Có thể hiển thị ở dạng văn bản hoặc hình ảnh và được kích hoạt bằng cách bấm chuột. Một số thuật ngữ liên quan (tiếp tục) : – Web page : + Trang web là một tài liệu được soạn thảo với HTML, là một phần của một nhóm tài liệu siêu văn bản hoặc các tài nguyên có sẵn trên WWW. Các trang web có thể chứa các siêu liên kết đến các vị trí khác trong cùng một tài liệu, hoặc đến các tài liệu khác trong cùng một website hoặc ở các website khác. Các trang web cũng có thể chứa các biểu mẫu, hình ảnh, âm thanh,… + Các trang web được cài đặt trên máy chủ web và có thể truy cập được qua mạng internet nhờ trình duyệt web. Một số thuật ngữ liên quan (tiếp tục) : – Web server : máy chủ web là một hệ thống cung cấp khả năng truy cập qua mạng internet đến các nguồn và các dịch vụ trên web để trả lời các yêu cầu từ các máy khách được cài đặt trình duyệt web. – Website : một website là một tập hợp các dịch vụ mạng, chủ yếu là các tài liệu HTML được liên kết với nhau và tồn tại trên web tại một máy chủ cụ thể. Việc khai khác một website thường bắt đầu với trang chủ - là nơi cung cấp nhiều thông tin hơn về website. 2.2. Sử dụng trình duyệt Internet Explorer : Chức năng cơ bản của Internet Explorer : – Mở website : “file → new → window” – Lưu một trang web : “file → save as → đánh tên file vào File name và chọn File type (web page, complete)” – Lưu hình ảnh : “Right click vào hình ảnh → chọn Save picture as → đặt tên file → chọn file type (JPEG hoặc Bitmap) → chọn nơi lưu → click Save”. – Lưu địa chỉ website trong favorites : “chọn Favorites → Add to favorites → chọn tên lưu → chọn New folder → chọn Creat in” [...]... thông tin chi tiết/ đặc trưng (các chủ đề được mô tả bằng các thuật ngữ đặc trưng) +Cần có nhiều liên kết nhưng không quan tâm lắm về chất lượng +Tìm kiếm một cách toàn diện –Một số công cụ tìm kiếm : +Alta Vista – www.altavista.com +Google – www.google.com +Ask.com – www.ask.com 2.4 Kỹ thuật tìm tin trên web (theo từ khóa) Chiến lược tìm tin : +Xác định yêu cầu tin: Mức độ đầy đủ : số lượng thông tin. .. hoặc một ngôn ngữ cụ thể 2.5 Đánh giá thông tin trên internet : –Vì sao phải đánh giá thông tin trên internet : +Web là một “phương tiện tự xuất bản” không phải là một “ấn phẩm được đánh giá” +Web không phải là một thư viện và chất lượng các web khác nhau +Không có một tổ chức nào chịu trách nhiệm về tính chính xác của thông tin trên internet 2.5 Đánh giá thông tin trên internet (tiếp theo): –Tiêu chí... danh bạ web : +Khi bắt đầu tìm kiếm trên web Để xác định các từ cần tìm Tìm thông tin cơ bản về một chuyên đề +Để tìm một cách tổng quát Lướt qua các chủ đề để xem một cách tổng quát +Để tìm các chủ đề khó xác định bằng một số ít từ khóa Các danh bạ web phù hợp với việc tìm thông tin về một chủ đề chung hơn là các thông tin chi tiết, đặc trưng 2.3.1 Danh bạ web (tiếp theo) : –Điểm mạnh của các danh... cập nhật cao hơn danh bạ chủ đề +Mức độ bao quát cao hơn và kết quả tìm kiếm thường đầy đủ hơn so với danh bạ web +Có thể tìm thông tin rất đặc trưng +Thân thiện với người sử dụng –Nhược điểm của công cụ tìm kiếm : +Kết quả tìm tin có độ chính xác không cao +Kết quả tìm tin nhiều khi quá lớn, gây khó khăn cho việc lựa chọn kết quả thích hợp Để giải quyết vấn đề này các công cụ tìm kiếm thường cung cấp... giả trang web? Là trang web cá nhân? +Xem URL để tìm manh mối +Thông tin cá nhân của tác giả +Thông tin về nhà tài trợ web +Xem URL để đoán tổ chức sở hữu trang web +Domain name? (.edu, gov, com, org) +Xem các liên kết “About us”, “Philosophy”, “Background”,… +Tổ chức tài trợ có thích hợp với đề tài của trang web? 2.5 Đánh giá thông tin trên internet (tiếp theo): –Tiêu chí đánh giá tính khách quan +Mục... +Mức độ thích hợp của kết quả tìm thường cao hơn so với tìm trên các công cụ tìm kiếm –Nhược điểm của các danh bạ web : +Mức độ bao quát không cao dẫn đến kết quả tìm tin thường ít hơn so với công cụ tìm kiếm +Chậm cập nhật +Chất lượng thông tin không đồng đều +Mỗi danh bạ sử dụng một hệ thống phân loại riêng nên khó khăn cho người sử dụng +Một số danh bạ không chọn lọc các website khi đưa vào danh bạ... – www.ask.com 2.4 Kỹ thuật tìm tin trên web (theo từ khóa) Chiến lược tìm tin : +Xác định yêu cầu tin: Mức độ đầy đủ : số lượng thông tin yêu cầu Mức độ thông tin : thường thức, khoa học Xác định các khái niệm/nội dung chính của yêu cầu tin +Xác định từ khóa/thuật ngữ tìm và các từ đồng nghĩa +Chọn công cụ tìm thích hợp +Sử dụng các biểu thức tìm thích hợp Các toán tử tìm : Logic bool là phương... giá thông tin trên internet (tiếp theo): –Tiêu chí đánh giá nội dung : +Tính chính xác : Danh sách tài liệu tham khảo/trích dẫn Liên kết đến các nguồn tải liệu khác về cùng một đề tài Được các site có uy tín liên kết “URL investigator” (alltheweb) Link search (google, Alta vista) +Dễ dàng sử dụng Cấu trúc chặt chẽ và cách viết rõ ràng Các liên kết được cập nhật 2.5 Đánh giá thông tin trên internet... vào thanh địa chỉ của Home page” +Xem/cài đặt History : chọn History trên toolbar → click Tools → Internet options → General tab → đánh số ngày vào ô Days to keep pages in history 2.3 Các công cụ tìm tin : 2.3.1 Danh bạ web : –Danh bạ web là một bảng tra về các website được tổ chức một cách hệ thống – Đặc điểm : +Sắp xếp theo chủ đề (theo cấu trúc cấp bậc); Sử dụng một cách hiệu quả các siêu liên kết,... rõ ràng Các liên kết được cập nhật 2.5 Đánh giá thông tin trên internet (tiếp theo): –Tiêu chí đánh giá : mức độ bao quát/phạm vi +Website có bao quát vấn đề quan tâm +Website có phù hợp với yêu cầu tin +Nội dung website có sát với mục đích/mục tiêu của website –Tiêu chí đánh giá : tính cập nhật +Thời gian website được tập lập +Thời gian được cập nhật lần cuối +Mức độ cập nhật có phù hợp với mục đích . www.ask.com 2.4. Kỹ thuật tìm tin trên web (theo từ khóa) Chiến lược tìm tin : + Xác định yêu cầu tin: Mức độ đầy đủ : số lượng thông tin yêu cầu Mức độ thông tin : thường thức, khoa học Xác. bạ web + Có thể tìm thông tin rất đặc trưng + Thân thiện với người sử dụng – Nhược điểm của công cụ tìm kiếm : + Kết quả tìm tin có độ chính xác không cao + Kết quả tìm tin nhiều khi quá lớn, gây. xác định bằng một số ít từ khóa. Các danh bạ web phù hợp với việc tìm thông tin về một chủ đề chung hơn là các thông tin chi tiết, đặc trưng. 2.3.1. Danh bạ web (tiếp theo) : – Điểm mạnh của