5. Lịch sử nghiên cứu
2.4.1.4. Thao tác tìm kiếm, lưu trữ
Nhấp chuột vào ô Find phía trên bên góc trái màn hình, bên dưới là một loạt danh sách những đề mục đổ xuống, chọn lựa mục nào ta click chuột vào mục đó. Còn nếu muốn chính xác và nhanh chóng hơn, ta gõ trực tiếp từ khóa vào trong ô Find, nhấn Enter, nội dung cần tìm kiếm sẽ được hiển thị trong khung bên phải.
Thông tin liên quan được mở ra bằng các siêu liên kết (Hyperlink) có màu khác với những dòng text khác, nhấn vào đó ta sẽ mở ra một lĩnh vực khác có liên quan đến từ khóa được chèn siêu liên kết.
Muốn sao chép nội dung ( chữ viết, hình ảnh, bản đồ v.v…), ta nhấp phím phải chuột để có trình đơn phụ, chọn lệnh Copy ( hay Ctrl+C ). Sau đó mở chương trình ứng dụng khác như MS-Word hay Paint, ACDSee, Photoshop…,
Muốn in thông tin, nhấp phím phải, chọn Print ( Ctrl +P )…
2.4.2. International Network :
2.4.2.1. Khái niệm cơ bản :
Internet - cũng được biết với tên gọi Net - là mạng máy tính lớn nhất thế giới, hoặc chính xác hơn là mạng của các mạng, tức bao gồm nhiều mạng máy tính được nối lại với nhau. Một số mạng máy tính bao gồm một máy tính trung tâm (cịn gọi là máy chủ) và nhiều máy khác (cịn gọi là máy khách hay trạm làm việc) nối vào nĩ. Các mạng khác, kể cả Internet, cĩ quy mơ lớn hơn, bao gồm nhiều máy chủ, cho phép bất kỳ một máy tính nào trong mạng cĩ thể kết nối với một máy khác để trao đổi thơng tin. Một khi đã được kết nối Internet, máy tính của chúng ta sẽ là một trong số hàng chục triệu thành viên của mạng khổng lồ này.
Về thực chất, Internet là cơng nghệ thơng tin liên lạc mới cĩ tác động sâu sắc vào xã hội chúng ta, là một phương tiện cần thiết cho phép chúng ta liên lạc, trao đổi thơng tin ở một phạm vi gần như khơng giới hạn, đưa chúng ta vào một thế giới cĩ tầm nhìn cực rộng và ta hầu như cĩ thể làm mọi thứ với Net, từ đọc báo, viết thư, xem bản tin, giải trí, đến tra cứu - tìm kiếm thơng tin v.v… Nĩi chung, Net là một kho thơng tin khổng lồ mà chỉ cần ngồi một chỗ là ta cĩ thể làm mọi việc.
Chúng ta cũng cần tìm hiểu sơ qua về khái niệm World Wide Web. Cĩ thể nĩi,
đây là khái niệm mà người dùng Internet quan tâm nhiều nhất hiện nay. Người ta viết tắt là www hay gọi ngắn gọn là Web. Web là một cơng cụ, hay đúng hơn là dịch vụ của Internet. Khác với các dịch vụ trước đây của Net, Web chứa thơng tin bao gồm văn bản, hình ảnh, âm thanh và thậm chí cả video clip được kết hợp với nhau. Web cho phép ta bước vào mọi ngõ ngách trên Net, là những điểm chứa cơ sở dữ liệu gọi là website.
World Wide Web xuất hiện bởi nhu cầu của các viện và trường đại học và ngày nay Web đã biến thành nơi chứa thơng tin multimedia, giải trí và liên lạc. Tốc độ phát triển của Web nhanh hơn bất cứ phương tiện nào cĩ từ trước tới nay. Với người dùng Internet, Web cĩ sức hấp dẫn bởi nhiều lý do. Trước hết, nĩ cho phép hiển thị thơng tin truy tìm theo chế độ đồ họa, hơn hẳn những dịng text buồn tẻ của Internet trước đây hoặc những trang sách dài ngoằng lê thê rặt những chữ là chữ. World Wide Web cịn được coi như một xa lộ thơng tin tốt nhất. Với những cơng nghệ tiên tiến đang được triển khai, chúng ta sẽ cĩ được âm thanh, hình ảnh chất lượng cao từ Web. Tuy nhiên, điều đáng nĩi nhất khi đề cập về Web là khả năng bao trùm rộng lớn mang tính tồn cầu của nĩ. Trên Web, thơng tin của chúng ta cĩ thể đến với tất cả mọi người.
Người ta cũng thường nhắc tới thuật ngữ “truy xuất dữ liệu”. Những từ này cĩ nghĩa là gì ? Nhiều máy chủ (Web Server) trên Internet chứa các tập tin cĩ thể truy xuất tự do. Đây là những thư viện catalog, sách, tạp chí, hình ảnh số hố và vơ số
phần mềm máy tính, từ trị chơi đến hệ điều hành. Các Web server được nối với nhau trên Internet, mỗi server cĩ địa chỉ riêng, được gọi là URL (Uniform Resource Locator), bắt đầu bằng mã: http://... Ví dụ URL cho trang Yahoo là http://www.yahoo.com. URL được trình bày ở hộp địa chỉ phía trên màn hình, là đường dẫn trên Internet để định rõ ràng trang Web.
Cĩ hai đặc thù của trang Web tạo ra tính độc đáo của chúng là giữa các trang Web cĩ tác động qua lại và chúng cĩ thể sử dụng Multimedia được sử dụng để miêu tả các file text, video, hoạt họa, audio, được kết hợp thể hiện thơng tin. Những trang Web là tương tác với nhau bởi vì người xem và người sử dụng cĩ thể gửi thơng tin hoặc lệnh tới chỗ Web điều khiển chạy những ứng dụng trên Web Server.
2.4.2.1. Cách tìm thơng tin trên mạng Internet qua các trang web tìm kiếm - Search Engine :
Điểm yếu của Internet là người dùng thường gặp rất nhiều khĩ khăn khi tìm kiếm thơng tin, bởi Net giống như một kho lưu trữ cực kì rộng lớn mà lại khơng được sắp xếp theo một cấu trúc trật tự thống nhất nào. Chính vì vậy người ta đã và đang tìm cách đơn giản hố quá trình tìm kiếm thơng tin trên Internet bằng việc tạo ra nhiều cơng cụ hỗ trợ khác nhau. Đĩ chính là lí do của sự ra đời những website chuyên làm nhiệm vụ tìm thơng tin trên mạng. Bằng cơng cụ tìm kiếm (Search Engine) đặc biệt của mình, các site này dùng kỹ thuật quét liên tục trên Internet và các chỉ mục của website để lấy thơng tin.
Các cơng cụ tìm kiếm thơng tin này hoạt động như thế nào ? Chúng tìm kiếm dựa trên cơ sở dữ liệu các địa chỉ URL, văn bản và các mơ tả mà chúng ta nhập vào. Mỗi khi tìm kiếm thơng tin là chúng tìm kiếm trong cơ sở dữ liệu cĩ sẵn đĩ chứ khơng phải tìm trực tiếp trên các trang Web. Điều này cũng tương tự như khi vào thư viện ta sẽ tìm kiếm sách báo thơng qua bảng liệt kê mơ tả, chứ khơng trực tiếp vào kho mà bới tung hết lên vì như vậy vơ cùng vất vả, lại kém hiệu quả.
Tổng quát, các site tra cứu cĩ 2 cách cho người sử dụng truy tìm thơng tin là tìm kiếm theo danh mục chủ đề và tìm kiếm theo từ khố.
* Chọn theo danh mục chủ đề mà site đĩ phân loại : chúng ta sử dụng cách này khi muốn tìm thơng tin một cách tổng quát. Trong từng chủ đề lớn sẽ cĩ phân loại chi tiết hơn theo kiểu chia nhỏ dần, chẳng hạn chọn mục Khoa học, chúng ta sẽ được liệt kê các chủ đề nhỏ hơn như vật lý, hĩa học, sinh học v.v... Ta chỉ việc tiếp tục lựa chọn để cuối cùng cĩ địa chỉ và nội dung cụ thể của từng site mà hệ thống tìm được để chúng ta liên kết đến .
* Chọn lựa bằng cách khai báo từ khĩa vào khung tìm kiếm : cách này được sử dụng khi ta muốn tìm kiếm thơng tin chi tiết và cụ thể, chẳng hạn muốn tìm thơng tin về Trái Đất, ta cĩ thể gõ trực tiếp tên đối tượng tìm kiếm vào hộp chọn (sử dụng tiếng Anh “Earth” hay gõ trực tiếp tiếng Việt “Trái Đất” bằng trình Unikey hay
Vietkey) rồi nhấn vào chữ Search hoặc Go, hệ thống tìm kiếm của site này sẽ dị tìm thơng tin tương ứng và liệt kê, mơ tả nội dung các trang cĩ chứa từ này.
Để tìm kiếm một cách cụ thể thì ta nên tìm theo từ khố. Tuy nhiên, cách tìm kiếm theo danh mục chủ đề cũng giúp cho người sử dụng bước đầu xác định được “chợ thơng tin” trên mạng cĩ những sản phẩm hàng hố gì để rộng đường “mua sắm”. Ngồi ra, ta cũng cĩ thể sử nhiều cơng cụ tìm kiếm cùng một lúc. Khi đĩ, chỉ cần đưa ra một câu hỏi tìm kiếm thơng tin thì hệ thống sẽ tự động chuyển câu hỏi này tới nhiều cơng cụ tìm kiếm khác. Sau đĩ, hệ thống thu thập kết quả tìm kiếm của các cơng cụ này và trả về cho người dùng.
Sau đây tơi xin giới thiệu những site thơng dụng cĩ chức năng hỗ trợ tìm kiếm. Mỗi site đều cĩ cơ sở dữ liệu khổng lồ các website và các dịch vụ thơng tin trực tuyến, đây thực sự là những cơng cụ tìm kiếm hữu hiệu nhất trên Internet.
2.4.2.2. Các trang web dò tìm :
http://google.com : Google là trang web tìm kiếm thơng dụng và được ưa thích nhất hiện nay.
Được thành lập vào ngày 7-9-1998, chỉ trong một thời gian ngắn Google đã trở thành trang web tìm kiếm thơng tin được ưa chuộng nhất. Hằng ngày cĩ khoảng 200 triệu lượt người dùng Google để tìm thơng tin; cịn Google đã sắp xếp làm bản chỉ mục cho 3 tỉ trang web - một con số khổng lồ.
Vượt qua rào cản ngơn ngữ, Google đã đưa ra hàng chục trang với hàng chục thứ tiếng khác nhau, trong đĩ cĩ cả tiếng Việt.
Ngồi lý do hiệu quả, thành cơng của Google cịn nhờ vào quan niệm rạch rịi của những người sáng lập : xem phục vụ người sử dụng là mục tiêu quan trọng nhất. Khơng nghi ngờ gì nữa, Google là trang web tìm kiếm cĩ hình thức đơn giản nhất và cũng là nhanh nhất hiện nay.
Yahoo cũng là một trong những site được nhiều người sử dụng nhất với thư viện khổng lồ gồm hơn 700.000 web site được phân loại theo tiêu đề. Khi truy cập
theo địa chỉ http://www.yahoo.com, trang tìm kiếm của Yahoo sẽ hiện ra với cách tổ chức thơng tin dạng cây theo từng chủ đề rất tiện dụng. Ngồi ra, trang này cũng chứa địa chỉ của một số site khác mà qua đĩ ta cĩ thể nhờ chúng tìm tiếp thơng tin chuyên biệt. Tiêu đề phân loại rất phong phú và đa dạng, danh sách các website tìm thấy được liệt kê khá rõ ràng kèm theo mơ tả về nội dung của chúng...
AltaVista ( www.altavista.digital.com ) : Tuy cĩ giao diện đơn giản hơn so với các site tìm kiếm khác nhưng AltaVista thực sự là một "chuyên gia " truy tìm thơng tin. Địa chỉ tìm kiếm này chứa khá đầy đủ thơng tin và bao gồm hàng triệu trang web trong cơ sở dữ liệu, với hình thức tìm kiếm trực tiếp theo từ khố thơng qua giao diện đơn giản Simple Query hoặc Advanced Query để tìm nhanh hơn. Tuy bề ngồi khiêm tốn, màu sắc đơn giản, AltaVista cĩ khả năng quét rất đáng nể - đến 30 triệu trang web. Đĩ chính là lý do vì sao trang này được người ta ưa chuộng.
HotBot ( www.hotbot.com ) : Cĩ thể cung cấp chỉ mục đến 54 triệu trang web, các newsgroup…Cơng cụ tìm kiếm của HotBot khá hiệu quả, tìm kiếm dễ dàng . Một tiện lợi khác là dù tìm kiếm thơng tin theo đề tài hay khai báo từ khĩa đều cĩ giao diện hiển thị dễ chịu cho người dùng. Một số ứng dụng tiện ích kèm theo là HotBot cho phép tinh lọc thơng tin bằng cách hạn chế trong phạm vi địa lý, theo domain name ( .com, .edu, .org, .gov, ...) , hạn chế thời gian tin xuất hiện trên mạng .
LookSmart ( www.looksmart.com ) : Theo quảng cáo, LookSmart cĩ thể truy tìm được 20.000 chủ đề khi tìm thơng tin. Tất cả các thơng tin tìm được đều
được mơ tả nội dung rõ ràng và chi tiết, vì vậy giao diện của LookSmart cĩ vẻ thân thiện hơn so với Yahoo , tuy cơ sở dữ liệu của LookSmart cĩ kém hơn .
Excite ( www.excite.com ): Nếu muốn tìm thơng tin tổng quát theo dạng chủ đề thì khơng nên đến site này. Với chỉ hơn 10 chủ đề chính ở trang homepage quả thật Excite khá nghèo nàn về mặt trình diễn thơng tin nhưng nếu chúng ta chọn lựa thơng tin theo từ khĩa thì nội dung chấp nhận được với phân loại kết quả theo từng loại bài báo, hay trang web, liệt kê số lượng thơng tin tìm thấy. Qua địa chỉ này, ta cĩ thể tìm những văn bản phù hợp với từ khố, thậm chí cĩ thể gõ vào cả câu hỏi để tìm câu trả lời.
Alltheweb http://alltheweb.com là website cĩ các cơ sở dữ liệu khổng lồ về các địa chỉ web, hình ảnh, video clip, âm thanh MP3...
http://www.lycos.com : hiện nay Lycos cung cấp tìm kiếm miễn phí đến database hơn 25 triệu URL. Các chương trình thu thập thơng tin của Lycos thường xuyên quét trên Internet để tìm những website mới. Với tính năng tìm kiếm các chuyên mục phổ thơng, trang web này cĩ thể giúp người tìm định trước số lượng các địa chỉ hiện ra trên màn hình trong mỗi lần tìm.
Cịn một số địa chỉ khác cũng cĩ thể trợ giúp chúng ta tìm kiếm thơng tin.
http://www.magellan.com/ http://metacrawler.com/ http://www.webcrawler.com http://www.infospace.com http://www.ask.com www.msn.com www.infoseek.com (www.go.com)
www.highway61.com :
Các trang web tìm kiếm bằng tiếng Việt :
www.panvn.com (www.panvietnam.com)
Là hệ thống tìm kiếm thơng tin dựa trên hệ NetNam Search Engine v3.0, PanVietnam cĩ khả năng thu thập tư liệu từ nhiều nguồn khác nhau, như các trang web, tệp dữ liệu...
Tại http://www.panvietnam.com/, người sử dụng chỉ cần nhập từ hoặc cụm từ tìm kiếm, PanVietNam sẽ tìm trong 2.000 website để cung cấp một danh sách kết quả. Danh sách này cĩ thể lên tới 15 triệu trang tài liệu dưới dạng HTML, và trang nào liên quan nhiều nhất với thơng tin cần tìm kiếm sẽ được xuất hiện đầu tiên.
Hệ thống này hỗ trợ tiếng Việt với ba bộ mã chính: Unicode, TCVN và VNI. Nĩ cũng được trang bị những cơng nghệ mới nhất trong tìm kiếm thơng tin gồm các giải thuật lập chỉ mục cơ sở dữ liệu, xử lý song song, lọc bỏ tạp nhiễu và trùng lặp, cơ chế trả lời kết quả thơng minh. Số lượng tài liệu được tìm kiếm khơng hạn chế.
www.google.com.vn
Ngoài ra trong Yahoo ta cũng có thể sử dụng font Unicode gõ tiếng Việt ( bằng trình Unikey hay Vietkey) và tìm thông tin trực tiếp bằng tiếng Việt.
Tuy nhiên cũng cần lưu ý rằng việc truy cập vào các địa chỉ tìm kiếm nêu trên chỉ mới là bước đầu của cơng việc tìm kiếm. Bước tiếp theo và cũng là bước quan trọng nhất, ta phải biết đưa ra nội dung đặc trưng cho thơng tin (cịn gọi là các từ khố) để site nhận diện và tìm kiếm đúng với những tốn tử thích hợp.
2.4.2.3. Thao tác tìm kiếm, lưu trữ
Internet là nơi chứa đựng thơng tin rất lớn của cả thế giới về mọi lĩnh vực của đời sống. Do đĩ để tìm kiếm những thơng tin cần thiết cho việc học tập và nghiên cứu với thời gian ngắn nhất là một điều khĩ trong điều kiện hiện nay - khi tốc độ đường truyền của chúng ta quá chậm mà cước phí truy cập lại quá cao so với thu nhập của đại bộ phận người sử dụng. Nếu khơng nắm vững các nguyên tắc cơ bản cũng như cĩ một định hướng rõ ràng về hướng tìm kiếm của mình bằng các cơng cụ tìm kiếm thì người sử dụng rất dễ lạc trong khối lượng thơng tin đồ sộ của Internet, hoặc là chỉ tìm thấy những thơng tin khơng cần thiết.
Tìm kiếm thông tin dưới dạng chữ viết :
Cách thơng dụng và dễ dàng nhất là truy cập vào các trang tìm kiếm chuyên dụng như trên rồi tra cứu theo chủ đề (Subject) hay từ khĩa (Keyword), hay sử dụng các điểm kết nối trực tiếp đã cĩ sẵn theo từng ngành hay một chủ đề. Từ đĩ ta tìm ra các Website cĩ chứa các thơng tin mình cần. Thường cách tìm này cho chúng ta một diện tìm rộng nhưng thơng tin quá nhiều, và cĩ rất nhiều nguồn khác nhau, cĩ thể là từ một bài báo cáo, một chuyên đề nghiên cứu hay một bài giảng của một vị giáo sư
nào đĩ, cũng cĩ khi là một cuốn sách và thơng tin trình diễn cũng dưới nhiều dạng như HTML, PowerPoint, Image...
Ta cĩ thể tìm thơng tin bằng ngoại ngữ (tiếng Anh chẳng hạn) .
Tìm kiếm hình ảnh
Chọn mục Pictures hay Images của các trang tìm kiếm, gõ từ khóa và chọn hình ảnh cần tìm, click để mở hình ảnh, chọn Save As … đưa đường dẫn và Save.