Sử dụng internet để cung cấp tài liệu cho học tập, nghiên cứu

Một phần của tài liệu Phát triển kiến thức thông tin cho sinh viên trường Đại học Hà Nội (Trang 42)

6. Cấu trúc của đề tài

3.1.1.2Sử dụng internet để cung cấp tài liệu cho học tập, nghiên cứu

Mạng Internet mang lại rất nhiều tiện ích hữu dụng cho ngƣời sử dụng, một trong các tiện ích phổ thông của Internet là hệ thống thƣ điện tử (email), trò chuyện trực tuyến (chat), máy truy tìm dữ liệu (search engine), các dịch vụ thƣơng mãi và chuyển ngân, và các dịch vụ về y tế giáo dục nhƣ là chữa bệnh từ xa hoặc tổ chức các lớp học ảo. Với một khối lƣợng thông tin và dịch vụ khổng lồ trên Internet, việc sử dụng internet từ xa còn có thể giúp con ngƣời có khả năng:

- Truy cập các nguồn thông tin trực tuyến phục vụ mục đích nghiên cứu, học tập;

- Nhận dạng các nguồn thông tin nhằm hỗ trợ cho các môn học, khoa học nhƣ: các bài báo toàn văn chuyên ngành, tài liệu chính phủ, sách điện tử và nhiều nguồn thông tin có chất lƣợng khác. Truy cập các nguồn thông tin trực tuyến phục vụ mục đích nghiên cứu, học tập;

- Trao đổi với chuyên gia hoặc các tác giả của nguồn thông tin, tƣ liệu liên quan tới nhiều lĩnh vực nghiên cứu;

- Gặp gỡ, trao đổi trực tiếp với các nhà nghiên cứu về những chủ đề cơ bản, phổ biến;

- Thiết kế và công bố kết quả nghiên cứu của mình lên trang web. 3.1.1.3 So sánh nguồn tài liệu in và tài liệu điện tử.

Tài liệu in còn gọi là tài liệu truyền thống và tài liệu điện tử con gọi là tài liệu số có những ƣu và nhƣợc điểm nhất định. Để quyết định, khi nào sử dụng loại tài liệu nào thì tốt hơn, thật không hề đơn giản. Để xác định loại hình tài liệu nào mang lại giá trị cho bài nghiên cứu của mình, bạn cần:

- Khái quát những điều quan trọng nhất về sự khác nhau giữa tài liệu in và tài liệu số nhƣng cần lƣu ý rằng có rất nhiều nguồn thông tin dƣới dạng in và nguồn thông tin dạng tài số và không phải lúc nào áp dụng, tham khảo chúng cũng phù hợp và hiệu quả;

- Nguồn thông tin in và thông tin số có thể mang lại những nội dung thông tin khác nhau, chất lƣợng khác nhau nhƣng cũng có thể mang lại nội dung, chất lƣợng thông tin giống nhau, ví dụ: chúng ta có thể tìm thấy tác phẩm “Mật mã Devince” của tác giả Dan Brown trên internet song cũng có thể tìm thấy tác phẩm này dƣới dạng in trong thƣ viện. Chúng ta nên sử dụng loại hình tài liệu nào? Câu trả lời phụ thuộc vào bạn sẽ sử dụng thông tin đó nhƣ thế nào?

- Lựa chọn nguồn thông tin phụ thuộc vào những yêu cầu của vấn đề nghiên cứu và mỗi vấn đề nghiên cứu đều có yêu cầu khác nhau.

Bảng 3.1: So sánh sự khác nhau giữa tài liệu in và tài liệu số[15, tr.35]

Tài liệu in

- Không thể thay đổi trừ khi đƣợc tái bản ở lần mới hơn.

- Chỉ bao gồm văn bản và hình ảnh. - Không cho ngƣời dùng can thiệp vào nội dung và hình thức tài liệu.

- Quá trình sản xuất tốn nhiều chi phí nên giá thành cao.

- Chỉ có một số ngƣời có thể phổ biến và xuất bản nhƣ:ngƣời biên tập, cán bộ thƣ viện.

Tài liệu số

- Có thể sửa chữa, thay đổi.

- Có thể bao gồm đa phƣơng tiện. - Ngƣời sử dụng có thể can thiệp vào nội dung và hình thức tài liệu.

- Giá thành giảm hơn so với tài liệu in ấn.

- Cho phép mọi ngƣời dùng có thể phổ biến, xuất bản thông tin.

3.1.1.4 Một số tính chất ảnh hƣởng tới quyết định của ngƣời dùng tin khi sử dụng tài liệu.

* Tính chất đúng lúc, kịp thời.

Trong một số trƣờng hợp cụ thể, Internet có thể cung cấp nguồn thông tin cập nhật hơn so với tài liệu truyền thống. Ví dụ nhƣ hầu hết các tên báo, tạp chí

chuyên ngành nổi tiếng đều có trên internet và chúng ta có thể lƣu trữ, tìm kiếm cả những số, bài báo, tập đã cũ.

* Vấn đề bản quyền

Tài liệu in ấn, đặc biệt là những tài liệu trong thƣ viện trƣờng học thƣờng đƣợc sinh viên tham khảo cho việc phát triển dự án và bài nghiên cứu của mình chủ yếu là các tạp chí chuyên ngành và các tài liệu là sách học thuật. Trong những trƣờng hợp cụ thể khác, internet có thể cung cấp nguồn tài liệu đáng tin cậy hơn là nguồn tài liệu trong thƣ viện, ví dụ: bạn cũng có thể tìm kiếm một bản sao của tác phẩm văn học lãng mạn trên internet.

* Những yêu cầu của môn học

Giáo viên có thể yêu cầu tất cả hoặc một số trƣờng hợp cụ thể các tài liệu nghiên cứu, tham khảo của bạn phải là sách mang tính học thuật hoặc các bài báo chuyên ngành. Khi đó, bạn có thể sử dụng các dịch vụ trực tuyến để tìm kiếm thông tin trực tuyến hoặc những nguồn thông tin cụ thể trong thƣ viện.

* Khả năng truy cập

Nếu nhƣ tất cả chúng ta ai cũng có thể sử dụng thƣ viện với hàng ngàn, hàng triệu bài báo chuyên ngành và nguồn tài liệu truyền thống phong phú, đa dạng thì đây là một sự lựa chọn tuyệt vời nhất, song thực tế không phải ai cũng có may mắn đó, vì vậy tài liệu trên internet trở nên quan trọng hơn bao giờ hết trong việc thực hiện quá trình nghiên cứu. (adsbygoogle = window.adsbygoogle || []).push({});

* Độ đáng tin cậy của tài liệu

Tính chất đáng tin cậy của tài liệu phụ thuộc vào việc đánh giá nguồn tài liệu điện tử và tài liệu truyền thống mà bạn đã sử dụng, lựa chọn nguồn tài liệu phù hợp cho dù là tài liệu truyền thống hay tài liệu điện tử.

3.1.2 Đánh giá, sử dụng hiệu quả nguồn thông tin trên internet.

Sự phát triển của công nghệ thông tin và truyền thông đã tạo nên làn sóng bùng nổ thông tin. Với khối lƣợng thông tin khổng lồ, con ngƣời có thể dễ dàng tiếp cận song để sử dụng thông tin đó một cách hiệu quả và có chọn lọc thì không phải ai cũng làm đƣợc, đặc biệt là đối với những nhà nghiên cứu khoa học, học sinh, sinh

viên và giáo viên. Họ là những ngƣời thƣờng xuyên tiếp xúc với thông tin, tài liệu. Vậy để sử dụng thông tin một cách hiệu quả nhất, chúng ta cần có những kỹ năng đánh giá thông tin. Kinh nghiệm cho thấy, trả lời cho những câu hỏi dƣới đây sẽ làm cho việc đánh giá nguồn thông tin trên internet trở nên dễ dàng hơn [15, tr.40].

- Ai là tác giả? Họ có phải là ngƣời có chuyên môn trong lĩnh vực tài liệu đề cập hay không?

- Địa chỉ và email của tác giả có đƣợc cung cấp tại trang web hay không? - Xác nhận về chuyên môn, tính học thuật của tác giả có đƣợc cung cấp hay không?

- Ai là ngƣời chịu trách nhiệm về nguồn tin đó? Trƣờng đại học hay tổ chức? cơ quan kinh doanh… hay thậm chí là cá nhân nào?

- Tính khách quan của tài liệu có đƣợc thể hiện hay không? Mục tiêu, mục đích của tài liệu đó là gì? Đối tƣợng sử dụng của tài liệu đó là ai?

- Tác giả đã thể hiện những quan điểm gì? Và có nêu ví dụ để minh chứng hay không?

- Tác giả có trích dẫn đầy đủ và đúng cách đến những nguồn tài liệu tham khảo mà tài liệu đó sử dụng?

- Tài liệu đó có thƣờng xuyên đƣợc cập nhật hay không? Có cung cấp thông tin hay đƣờng dẫn (link) cung cấp thông tin cập nhật?

- Nguồn thông tin có rõ ràng, dễ hiểu cả về nội dung và hình thức hay không? Hình thức có đẹp, thân thiện với ngƣời dùng?

- Tài liệu có đƣợc công nhận bởi những ngƣời có chuyên môn hay không? Ví dụ nhƣ nguồn tài liệu có trong “top” 500 web hay không?

3.1.3 Các công cụ tìm kiếm thông tin trên internet

3.1.3.1 Máy tìm kiếm thông tin (Search engines) * Các bộ phận cấu thành máy tìm kiếm: * Các bộ phận cấu thành máy tìm kiếm:

- Bộ thu thập thông tin (Robot): Robot là một chƣơng trình tự động duyệt qua các cấu trúc siêu liên kết để thu thập tài liệu. Về bản chất robot chỉ là một chƣơng trình duyệt và thu thập thông tin từ các site theo đúng giao thức web.

- Bộ lập chỉ mục – Index

Hệ thống lập chỉ mục hay còn gọi là hệ thống phân tích và xử lý dữ liệu, thực hiện việc phân tích, trích chọn những thông tin cần thiết (thƣờng là các từ đơn, từ ghép, cụm từ quan trọng) từ những dữ liệu mà robot thu thập đƣợc và tổ chức thành cơ sở dữ liệu riêng để có thể tìm kiếm trên đó một cách nhanh chóng, hiệu quả. Hệ thống chỉ mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất hiện ở trang nào, địa chỉ nào.

- Bộ tìm kiếm thông tin – Search Engine

Bộ tìm kiếm thông tin (Search engine) là cụm từ dùng chỉ toàn bộ hệ thống bao gồm bộ thu thập thông tin, bộ lập chỉ mục & bộ tìm kiếm thông tin. Các thành phần này hoạt động liên tục từ lúc khởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu nhƣng độc lập với nhau về mặt hoạt động. Bộ tìm kiếm thông tin tƣơng tác với ngƣời sử dụng thông qua giao diện web, có nhiệm vụ tiếp nhận và trả về những tài liệu thoả yêu cầu của ngƣời dùng.

Ngoài chiến lƣợc tìm chính xác theo từ khoá, các bộ tìm kiếm thông tin còn có chức năng sửa lỗi chính tả, tìm cả những hình thức biến đổi khác nhau của một từ. Ví dụ: search engine sẽ tìm những từ nhƣ “speaker”, “speaking”, “spoke” khi ngƣời dùng nhập vào từ “speak”.

Bộ tìm kiếm thông tin điều khiển robot thu thập thông tin trên mạng thông qua các siêu liên kết (hyperlink ). Khi robot phát hiện ra một trang web mới, nó gửi tài liệu (web page) về cho máy chủ (server) chính để tạo cơ sở dữ liệu chỉ mục phục vụ cho nhu cầu tìm kiếm thông tin.

Bởi vì thông tin trên mạng luôn thay đổi nên robots phải liên tục cập nhật các trang web cũ. Mật độ cập nhật phụ thuộc vào từng hệ thống máy tìm kiếm. Khi search engine nhận câu truy vấn từ ngƣời dùng, nó sẽ tiến hành phân tích, tìm trong cơ sở dữ liệu chỉ mục & trả về những tài liệu thoả mãn yêu cầu.

* Ƣu và nhƣợc điểm của Search Engine:

- Ƣu điểm: Tìm kiếm một tài liệu cụ thể, các chủ đề khó phân loại. - Nhƣợc điểm: Không cho phép khái quát về một chủ đề nhất định.

* Một số máy tìm kiếm thông dụng Google: http://www.google.com http://www.books.google.com http://www.scholar.google.com Yahoo: http://www.yahoo.com Altheweb: http://www.altheweb.com Altavista: http://www.altavista.com Ask: http://www.ask.com

* Một số máy tìm kiếm thông dụng của Việt Nam Xa Lộ: www.xalo.vn Tìm nhanh www.timnhanh.com Monava www.monava.vn Tìm kiếm nhạc, video www.baamboo.com http://mp3.zing.vn http://7sac.com

3.1.3.2 Máy tìm kiếm liên thông (meta-search engines)

Máy tìm kiếm liên thông (MTKLT) khác với máy tìm kiếm thông thƣờng ở chỗ với mỗi yêu cầu tìm của ngƣời dùng, máy tìm kiếm liên thông sẽ chuyển nó đến các máy tìm kiếm khác nhƣ: Google, Yahoo và sau đó xử lí kết quả và trả về từ các máy tìm kiếm này trƣớc khi đƣa ra kết quả cho ngƣời dùng. (adsbygoogle = window.adsbygoogle || []).push({});

- Ƣu điểm: Máy tìm kiếm liên thông không phải tốn tài nguyên cho việc thu thập và lƣu trữ các trang web. Thay vào đó MTKLT chủ yếu tập trung vào phát triển các thuật toán xử lí kết quả từ các máy tìm kiếm khác. Các thuật toán xử lí thông thƣờng gồm có gom cụm (clustering) để loại bỏ trùng lặp, và phân tích ngữ nghĩa để có thể cho kết quả gần với yêu cầu của ngƣời dùng nhất. Số lƣợng các trang web trên Internet rất lớn, một máy tìm kiếm không thể thu thập và xử lí toàn bộ. Do đó, việc sử dụng kết quả tìm kiếm từ nhiều nguồn dữ liệu của các máy tìm

kiếm khác nhau, MTKLT giúp tăng cơ hội cho ngƣời dùng tìm đƣợc thông tin họ cần, đặc biệt là các thông tin chuyên biệt.

- Nhƣợc điểm: Thứ nhất, tốc độ của các MTKLT thƣờng chậm vì phải chờ kết quả trả về từ các máy tìm kiếm khác. Nếu một máy tìm kiếm liên thông gửi câu truy vấn đến càng nhiều máy tìm kiếm, tốc độ càng chậm;

Thứ hai, khả năng tìm kiếm nâng cao nhƣ các máy tìm kiếm thông thƣờng khác bị hạn chế. Các toán tử tìm kiếm AND, OR và tìm kiếm theo cụm từ có thể không đƣợc hỗ trợ. Hơn nữa, việc diễn dịch câu truy vấn ban đầu của ngƣời dùng cho phù hợp với cú pháp qui định của các máy tìm kiếm khác nhau có thể làm mất đi tính chính xác;

Thứ ba, kết quả trả về của MTKLT chƣa chắc tốt hơn kết quả của một máy tìm kiếm (ví dụ Google). Vì: các máy tìm kiếm lớn đều đã có thuật toán rất phức tạp và hiệu quả để tối ƣu hóa kết quả tìm kiếm; thứ hai MTKLT chỉ đƣợc biết một phần dữ liệu của các máy tìm kiếm nó truy vấn tới thông qua kết quả trả về mà thôi.

Thứ tƣ, việc gửi câu truy vấn đến các máy tìm kiếm khác phải chịu hai sự hạn chế: thứ nhất là kết quả trả về cho mỗi lần truy vấn ít (ví dụ Google chỉ cho phép tối đa 32 kết quả).

* Một số máy tìm kiếm liên thông - Máy tìm kiếm Dogpile

Dogpile là sản phẩm của InfoSpace. Đặc điểm của Dogpile là khả năng phân loại rất tốt các link trả tiền và không trả tiền, đồng thời công nghệ IntelliFind rất hiệu quả trong việc xử lí các kết quả trả về để cho kết quả phù hợp với ngƣời dùng.

http://www.dogpile.com

- Máy tìm kiếm Clusty:

Hình 3.2: Trang chủ của máy tìm kiếm Clusty.

Clusty là sản phẩm của Vivisimo. Đặc điểm nổi bật của các sản phẩm khác của Vivisimo là thuật toán gom cụm các kết quả tìm kiếm. Với các nhóm đƣợc gom lại, ngƣời dùng có thể có đƣợc cái nhìn rộng hơn về các chủ đề mà họ đang tìm kiếm.

http://www.clusty.com

- Máy tìm kiếm KartOO

Đặc điểm nổi bật của KartOO so với các máy tìm kiếm liên hợp khác là khả năng cung cấp kết quả dƣới dạng giao diện hình ảnh trực quan.

http://www.kartoo.com

- Các máy tìm kiếm liên thông khác nhƣ: Surfwax, Ixquick, Metacrawler, Mama, Excite…

3.1.3.3 Cổng thông tin (Gate way)

Cổng thông tin cung cấp thông tin chuyên biệt về một lĩnh vực cụ thể. Cổng thông tin do con ngƣời tập hợp thông tin, biên soạn và sắp xếp theo những thứ tự nhất định. Thông tin tại cổng thông tin đã đƣợc thẩm định, đánh giá bởi các nhà chuyên môn.

Một số cổng thông tin thông dụng:

- Yahoo directory :Danh mục theo chủ đề các trang web do con ngƣời tạo ra. Bao gồm nhiều chủ đề: Văn hoá, giáo dục, kinh tế, giải trí…

http://www.dir.yahoo.com

- ELDIS: Cổng thông tin phát triển, cung cấp các thông tin về phát triển theo từng chủ đề.

http://www.eldis.or

- Thƣ viện ảo (VLIB): Thƣ viện ảo do Tim Berners-Lee xây dựng và đƣợc các tình nguyện viên là các chuyên gia trong nhiều lĩnh vực quản lý. Thông tin đƣợc sắp xếp theo vần chữ cái, theo chủ đề.

http://www.vlib.org

- Cổng thông tin khoa học xã hội (SOSIG): Cung cấp các nguồn thông tin có chất lƣợng về khoa học xã hội theo từng chủ đề.

http://www.sosig.ac.uk

3.1.3.4 Cơ sở dữ liệu chuyên ngành (Database)

Các cơ sở dữ liệu chuyên ngành này robot/máy tìm không thể truy cập đƣợc mà con ngƣời cần có những kỹ năng nhất định thì mới tiếp cận đƣợc thông tin cần thiết. Cơ sở dữ liệu chuyên ngành này còn đƣợc gọi là các “web ẩn”. (adsbygoogle = window.adsbygoogle || []).push({});

Để tìm kiếm các web ẩn này, ngƣời tìm tin sử dụng các máy tìm nhƣ google, yahoo…nhập từ khoá cần tìm và chữ “database”.

Ví dụ tìm tài liệu về luật ta có thuật ngữ tìm sau: “laws database”.

Một số website cung cấp đƣờng dẫn tới các cơ sở dữ liệu chuyên ngành có giá trị:

Một phần của tài liệu Phát triển kiến thức thông tin cho sinh viên trường Đại học Hà Nội (Trang 42)