Internet tìm kiếm thơng tin Internet Internet tìm kiếm thơng tin Internet Internet: giới phức tạp Internet chữ viết tắt “INTer NETwork”, nghĩa mạng lưới liên kết với thông qua giao thức (cách thức giao tiếp) gọi TCP/IP (Transmision Control Protocol/Internet Protocol) Một kiểu hệ thống mạng phổ biến World Wide Web (Mạng lưới tồn cầu), kết nối hàng trăm triệu máy tính chủ (server-computer) với toàn giới Ngoài ra, Internet cịn có nhiều cơng cụ ứng dụng khác Các ứng dụng Internet Thư điện tử (Tiếng Anh: e-mail) Ứng dụng cho phép gửi nhanh chóng thơng điệp cho hay nhiều người khác có kết nối vào Internet khắp giới Người nhận trích đoạn nội dung thư nhận được, trả lời, đính kèm tài liệu khác (tập tin, hình ảnh, nhạc, ) gửi tất cho nhiều người Để gửi thư điện tử, người gửi người nhận cần có địa điện tử, thường theo cấu trúc: tên@têntổchức.tênmiền Có nhiều nhà cung cấp dịch vụ thư điện tử miễn phí (và thu lợi nhuận hình thức khác) Yahoo, Gmail, Lycos, Ví dụ: địa aline2006@yahoo.com aline2006 = tên, yahoo = tên tổ chức, com = tên miền Các danh sách thư điện tử (Tiếng Anh: mailing-list) Đây danh sách dùng cho nhóm đối tượng định (thường đăng kí miễn phí), để chuyển thông tin theo chủ đề phù hợp với đối tượng theo kiểu thư điện tử Thường có loại danh sách sau: • Danh sách thảo luận (phổ biến nhất): tập hợp thành viên liên quan chủ đề, thảo luận với chủ đề qua thư điện tử Danh sách thường có người phụ trách việc thêm/bớt thành viên, lọc thông tin thư trao đổi cần thiết • Các ấn định kì tin điện tử: thành viên danh sách định kì (hàng tuần, hàng tháng, ) nhận thư người quản lí danh sách soạn thảo, thành viên trao đổi, thảo luận với Các diễn đàn thảo luận (Tiếng Anh: newsgroups) Các diễn đàn tập hợp nhóm thảo luận nhiều đề tài khác nhau, thông thường tham gia không cần phải đăng kí Internet: giới phức tạp Các diễn đàn chia theo nhiều lĩnh vực lớn như: tin học phần mềm (.comp), nghiên cứu khoa học (.sci), kinh doanh (.biz), tham khảo tài liệu (.doc), giải trí (.rec), xã hội (.soc), Các lĩnh vực lại chia thành nhiều chủ đề chủ đề phụ với nội dung cụ thể hơn, thường có tên quốc gia kèm trước địa Cấu trúc chung địa diễn đàn thảo luận sau: news://quốcgia.lĩnhvực.chủđề.chủđềphụ Ví dụ: đăng kí làm thành viên Google Groups, bạn có nhiều khả tham gia nhiều nhóm thảo luận chuyên đề khác Tuy tập hợp viết bàn chủ đề riêng biệt giống danh sách thảo luận, diễn đàn thảo luận hoạt động theo cách thức khác: viết không phổ biến cho người qua thư điện tử mà tập trung máy chủ (server) cần phải kết nối vào xem Tập hợp máy tính trao đổi viết dạng gọi Usenet Tuy nhiên, diễn đàn Mạng (Web forum, xuất từ năm 2000) thay chiếm ưu Hội thoại trực tuyến (Tiếng Anh: chat) Mạng lưới toàn cầu (Tiếng Anh: World Wide Web) Đây ứng dụng phổ biến Internet, phát triển với tốc độ nhanh kể từ đời vào năm 1989 Trung tâm Nghiên cứu Hạt nhân châu Âu (ECNR) có trụ sở Geneva, với tác giả Tim Berners-Lee (tên đầy đủ Timothy John Berners-Lee, sinh ngày 08 tháng năm 1955 Luân Đôn, Anh) Một nguyên nhân giúp cho Mạng (Web) phát triển nhanh thuận tiện cho người dùng với hệ thống đa phương tiện (multimedia) cho phép hiển thị trang nhiều màu sắc, có chèn hình ảnh, biểu đồ, tư liệu âm hay video, kĩ thuật siêu văn (hypertext) cho phép người dùng dễ dàng di chuyển từ trang qua trang khác cách nhấp chuột lên đường siêu liên kết (hyperlink) Các trang nằm điểm mạng (website), máy chủ hay quốc gia khác, nên người dùng vượt qua khoảng cách rộng chớp mắt Một nét đặc trưng Mạng người dùng vừa người tiêu dùng vừa nhà cung cấp thông tin Viết trang mạng (webpage) đơn giản, cần phần mềm phổ biến đủ, có nhiều nhà cung cấp dịch vụ kí gửi điểm mạng miễn phí hay giá rẻ Các điểm mạng Mạng thường bao gồm nhiều tập tin viết ngôn ngữ đánh dấu siêu văn HTML (Hypertext Markup Language), đọc thơng qua Internet tìm kiếm thơng tin Internet trình duyệt mạng (web browser) Netscape, Internet Explorer, Mozilla Firefox, Opera, Mỗi tập tin gọi trang mạng, kích thước khơng cố định theo kiểu khổ giấy A4 thông thường Mỗi trang có phần chữ chủ yếu, đường liên kết siêu văn (hypertext link) hướng đến trang khác hay tài liệu có định dạng khác (hình ảnh, âm thanh, ) Phân loại thơng tin đăng Mạng Nhiều người có xu hướng cho “người ta tìm thấy tất Mạng” Tuy nhiên, cần nói xác “người ta tìm thấy đủ thứ Mạng”: ấn báo chí; luận văn tốt nghiệp; trang giới thiệu công sở, quan, doanh nghiệp; trang viết cảm xúc cá nhân; nhật kí chia sẻ Mạng; diễn đàn trao đổi vấn đề trời đất, từ nghiêm túc đến giải trí, thư giãn, Một nguyên tắc thiết yếu Internet, phải hậu kiểm thơng tin tìm thấy Bất viết thứ để đưa lên Internet, người dùng Internet phải có phận kiểm sốt thơng tin thu nhận thơng qua việc xác định độ tin cậy nguồn cung cấp, phải phân biệt thông tin thơng tin sai lệch, nhiều trường hợp có thông tin sai lệch phổ biến cách không chủ ý Xác định nguồn cung cấp thông tin cách đơn giản để đánh giá tính phù hợp thơng tin Để làm điều đó, cần biết phân loại nguồn thơng tin Internet Các ngân hàng liệu Trong nguồn thông tin Internet, ngân hàng liệu cung cấp lượng thơng tin phong phú vào bậc Có thể liệt kê: • Các thơng tin tham khảo dạng tóm tắt tạp chí chuyên ngành, hội nghị, báo cáo, luận án lĩnh vực khoa học kĩ thuật, y học, khoa học xã hội nhân văn, • Toàn văn 10.000 ấn bao gồm nhật báo, tuần báo, tạp chí định kì, tất lĩnh vực • Các thơng tin kinh tế dạng tồn văn hay tóm tắt, có mục (index) phân loại chi tiết để giúp tìm kiếm có hiệu • Các thơng tin tham khảo có mục phân loại hay toàn văn sáng chế thương hiệu đăng kí nước phát triển • Các danh bạ doanh nghiệp hầu hết quốc gia Các ngân hàng liệu tuỳ loại mà truy cập miễn phí phải đăng kí thuê bao sử dụng Internet: giới phức tạp Các điểm mạng công sở (trường học, quyền, ) Các phịng thí nghiệm trường đại học Đây nhà tiên phong Internet Các phịng thí nghiệm lớn thường có điểm mạng với nhiều nội dung phong phú, bao gồm ngân hàng liệu khoa học, tài liệu tham khảo, báo cáo nghiên cứu, Các trường đại học đa số có điểm mạng riêng, nội dung có khác biệt lớn: số trường dừng lại việc giới thiệu chương trình giảng dạy, sở vật chất, số trường khác lại đưa thêm nhiều dịch vụ hỗ trợ nguồn tài nguyên, tài liệu tham khảo, giảng, kết nghiên cứu sinh viên, Các quan nhà nước Ở nhiều nước, quan nhà nước có điểm mạng riêng nguồn cung cấp thông tin thay thế: số liệu thống kê thức, văn pháp luật, chủ trương – sách nhà nước, báo cáo, tin tức thời sự, Các thư viện Các thư viện lớn thường có ngân hàng liệu thư mục tài liệu lưu trữ thư viện Các ngân hàng liệu đưa lên Mạng giúp người đọc tra cứu dễ dàng thông tin cần thiết trình tìm kiếm tài liệu tham khảo Các điểm mạng thương mại Khi Internet đời, công ti sản xuất kinh doanh nhanh chóng nhận lợi ích kinh tế khổng lồ mà hệ thống mang lại, cho đời điểm mạng giới thiệu hoạt động sản phẩm Hệ thống điểm mạng thương mại tạo phương thức cạnh tranh mới, khơng mà cịn giúp kiểm soát hoạt động kinh doanh diễn ngành, lĩnh vực thị trường Trên điểm mạng cung cấp thơng tin lịch sử hình thành cơng ti, danh mục sản phẩm, thơng tin tài (báo cáo thường niên, báo cáo tài ), thơng tin cổ đơng, thơng cáo báo chí, Ngồi ra, có nhiều cơng ti nhắm đến mục đích trở thành tiêu điểm lĩnh vực ngành nghề cách tạo dựng nguồn tài nguyên thông tin vô phong phú như: tin tức thời ngành, danh bạ điểm mạng lĩnh vực, phân tích thị trường, Các trang cá nhân Như nói, đưa thơng tin lên Internet Và Mạng có hàng trăm ngàn điểm mạng cá nhân với nội dung chất lượng khác nhau: tự giới thiệu chân dung; đăng hình ảnh kỷ niệm cá nhân, gia đình; chia sẻ sở thích, kinh nghiệm thú vui giải trí, vấn đề quan tâm; sưu tầm địa hay; v.v Internet tìm kiếm thơng tin Internet Đối với thông tin trang mạng cá nhân cung cấp, cần phải kiểm tra kĩ lưỡng nguồn gốc xác định độ tin cậy chúng Có nhiều người dùng mạng làm việc nghiêm túc, tập hợp nhiều nguồn thơng tin có giá trị, tìm kiếm thơng tin Mạng điểm xuất phát tốt để rút ngắn thời gian đào sâu trình tìm kiếm Vấn đề phải xác định độ tin cậy trang đáng tin cậy, trang khơng có giá trị cao biển thơng tin Mạng Cách xác định nguồn liệu Cách xác định nguồn liệu thông qua địa mạng (Uniform Resource Locator – viết tắt URL – nghĩa Yếu tố định vị Tài nguyên Đồng dạng) Địa mạng tài liệu xác định rõ thuộc kiểu dịch vụ Mạng vị trí máy chủ Cấu trúc tổng quát địa mạng sau: http://www.tênđiểmmạng.phânloạitênmiền/tênthưmục/têntậptin Trong đó, thành phần địa mạng bao gồm: • http:// - viết tắt Hypertext Transfer Protocol - : xác định kiểu giao thức dùng để truyền thông tin Mạng Thông thường giao thức mặc định trình duyệt mạng, khơng cần nhập thành phần vào địa trình duyệt mà chúng mở trang mạng cần đến • www.tênđiểmmạng.phânloạitênmiền: tồn phần gọi tên miền ( domain name), riêng người chủ điểm mạng đăng kí cho phù hợp với nội dung, mục đích, lĩnh vực truyền thơng tin (nhưng có nhiều trường hợp khơng kiểm sốt lạm dụng) Tên miền bao gồm thành phần: www: phần cho phép xác định địa Mạng (Web) Nhiều trường hợp khơng bắt buộc phải có phần địa mạng • tênđiểmmạng: người chủ điểm mạng đăng kí Tên thể tên cơng ti, trường học, cơng sở, hội nhóm, nhóm sở thích, lĩnh vực, chuyên môn, Tên thông thường không mang dấu, khơng có khoảng trắng số kí tự đặc biệt Hiện có số nhóm vận động sử dụng tên điểm mạng có dấu, chưa hưởng ứng rộng rãi • • phânloạitênmiền: có nhiều cấp phân loại tên miền, cấp cách dấu chấm, cấp cao đứng phía sau Cấp phân loại tên miền cao tên miền cấp (Top Level Domain) Tên miền cấp có hai loại tên miền cấp chung (generic Top Level Domain, viết tắt gTLD) để lĩnh vực hoạt động tên miền cấp mã quốc gia Internet: giới phức tạp (country codes Top Level Domain, viết tắt ccTLD) để giới hạn địa lí Tên miền loại gTLD có số loại phổ biến sau: gTLD Ý nghĩa Đối tượng đăng kí aero Hàng không Các đối tượng thuộc ngành hàng không biz Kinh doanh Tất (trừ số trường hợp đặc biệt) com Thương mại Tất edu Giáo dục Các trường đại học, cao đẳng gov Chính phủ Các quan nhà nước Hoa Kì info Thơng tin Tất int Quốc tế Các tổ chức thành lập thông qua hiệp ước quốc tế name Tên họ Cá nhân, dành cho pháp nhân bảo vệ thương hiệu net Mạng lưới Tất mil Quân Các quan quân Hoa Kì museum Bảo tàng Các viện bảo tàng đáp ứng yêu cầu Hội đồng Viện bảo tàng Quốc tế (ICOM) org Tổ chức, liên minh Tất pro Chuyên nghiệp gia nghề Các luật sư, bác sĩ hay chuyên gia nghề nghiệp khác Các gTLD InterNIC quản lí điều phối, tạo có yêu cầu phù hợp Một số gTLD com, biz, info, net, org tạo với mục đích ban đầu dành riêng cho lĩnh vực hoạt động tương ứng, có tượng lạm dụng hay nhiều, nội dung thông tin điểm mạng không phù hợp với lĩnh vực đăng kí, có nhằm mục đích che mắt, đánh lừa người dùng mạng Tên miền loại ccTLD bao gồm chữ cái, viết tắt tên quốc gia: us (Hoa Kì), uk (Vương quốc Anh), fr (Pháp), ca (Canada), (Việt Nam), cn (Trung Quốc), jp (Nhật Bản), kr (Hàn Quốc), Tên miền quốc gia quốc gia quản lí, cấp cho điểm mạng muốn thể “thuộc quốc gia đó” Các tên miền cấp cấp ccTLD quốc gia định nghĩa quản lí, tên chủ điểm mạng (công ti, công sở, pháp nhân) lĩnh vực hoạt động (.com/.co cho thương mại, edu/.ac cho giáo dục, net cho mạng lưới, org cho tổ chức, ) Mỗi chủ sở hữu tên miền có quyền tạo tên miền cấp dưới, địa mạng đứng trước cấp thấp phần đăng kí tên miền thức Ví dụ: Trường Đại học Khoa học Tự nhiên TP.HCM có tên miền cấp hcmuns (hcmuns.edu.vn), có quyền cấp tên miền cấp cho Khoa Công nghệ Thông tin fit (fit.hcmuns.edu.vn) Internet tìm kiếm thơng tin Internet Mỗi điểm mạng có trang chủ để tiếp đón người dùng mạng, thường có thông tin giới thiệu tổng quát đường siêu liên kết đến phần nội dung, tài liệu khác bên điểm mạng Trang thường đặt tên index default hay home Khi nhập tên miền điểm mạng vào ô địa trình duyệt mạng, trình duyệt tự động tìm đến trang chủ • Thư mục: điểm mạng thường chia thành nhiều thư mục cấp thư mục khác cấp thư mục gốc nhằm giúp việc xếp, quản lí tài liệu trang mạng cách khoa học, trật tự gọn gàng Các thư mục thành phần địa mạng, thơng thường khơng dùng kí tự có dấu, khoảng trắng hay kí tự đặc biệt nhằm tránh cố truy cập thơng qua trình duyệt mạng • Tập tin: trang mạng thể dạng tập tin Ngôn ngữ phổ biến để tạo tập tin trang mạng HTML Thông qua trình duyệt mạng, mở trang mạng cách nhấp chuột vào đường siêu liên kết dẫn xác đến tập tin trang đó, gõ trực tiếp địa đầy đủ trang (bao gồm thư mục, thư mục phần mở rộng tập tin) Với hiểu biết tên miền, người dùng mạng xác định nguồn gốc nhiều thơng tin, tài liệu tìm Thơng thường, ngồi yếu tố chun mơn, tên miền rõ ràng nguồn gốc thơng tin cung cấp có độ xác thực cao, tên miền tổ chức, quan có tính pháp lí cao độ tin cậy thơng tin bên cao ... hợp nhiều nguồn thông tin có giá trị, tìm kiếm thơng tin Mạng điểm xuất phát tốt để rút ngắn thời gian đào sâu trình tìm kiếm Vấn đề phải xác định độ tin cậy trang đáng tin cậy, vơ vàn trang khơng... phân loại nguồn thơng tin Internet Các ngân hàng liệu Trong nguồn thông tin Internet, ngân hàng liệu cung cấp lượng thông tin phong phú vào bậc Có thể liệt kê: • Các thơng tin tham khảo dạng tóm... (Hypertext Markup Language), đọc thông qua Internet tìm kiếm thơng tin Internet trình duyệt mạng (web browser) Netscape, Internet Explorer, Mozilla Firefox, Opera, Mỗi tập tin gọi trang mạng, kích thước