- Tựđặt câu hỏi để làm rõ yêu cầu của mình. Ví dụ:
+ Tôi muốn biết thông tin về thư viện số
+ Tôi cần các thông tin về phần mềm
- Biến yêu cầu của mình thành một câu hoàn chỉnh. Ví dụ:
+ Phần mềm thư viện số
- Phân chia yêu cầu thành những khái niệm nhỏ
+ Khái niệm 1: “Phần mềm”
+ Khái niệm 2: “thư viện số”
Bước 2: Diễn đạt lệnh tìm kiếm
Cú pháp của lệnh tìm là cách thức chúng ta sử dụng để liên kết các khái niệm một cách phù hợp cho lệnh tìm. Các công cụ tìm kiếm khác nhau trong việc liên kết các thuật ngữ tìm kiếm.
Sử dụng các phép toán, các toán tử lôgíc. VD: “Phần mềm” AND “thư viện số”
Một số cách thu hẹp phạm vi tìm kiếm khác: - Giới hạn theo định dạng file (.pdf, .doc,...).
- Giới hạn theo ngôn ngữ (Tiếng Anh, tiếng Pháp...).
- Giới hạn theo từng loại địa chỉ web (Ví dụ chỉ tìm các tài liệu từ các trang web có đuôi .edu).
- Giới hạn theo địa điểm xuất hiện của từ tìm kiếm (ở tên tài liệu hoặc trong nội dung).
- Tìm tranh ảnh hoặc bản đồ.
Bước 3: Phân nhóm yêu cầu thông tin
- Phân loại yêu cầu tìm tin: tìm chính xác hay tìm tương đối... - So sánh nhu cầu tìm tin với các tính năng của máy tìm kiếm:
Ví dụ một hay một vài thuật ngữ có nhiều nghĩa trong nhiều ngữ cảnh khác nhau (“phần mềm” OR “software”) AND (“thư viện số” OR “Digital library”).
Bước 4: Chọn công cụ tìm kiếm phù hợp
- Chọn công cụ tìm kiếm phù hợp với thông tin mà bạn cần. - Xem xét cách thức làm việc của từng công cụ tìm và diễn đạt
lại lệnh tìm để có thể khai thác tối đa các chức năng của công cụ tìm đó.
- Cố gắng thực hiện việc tìm kiếm trên nhiều công cụ tìm kiếm khác nhau. Nếu các kết quả tìm từ công cụ tìm kiếm chưa thỏa mãn nhu cầu tin của bạn, hãy sử dụng nhiều công cụ khác nhau để tìm kiếm vì không một công cụ tìm kiếm nào có thể bao quát toàn bộ các trang web đang hiện hữu trên Internet. - Xem các kết quả tìm và sử dụng các thuật ngữđược sử dụng
Bước 5: Tìm lời khuyên từ một người
- Nếu bạn không thể tìm được các thông tin bằng các công cụ tìm kiếm, hãy tìm sự giúp đỡ từ những người có kinh nghiệm: hỏi tác giả của tài liệu, gửi câu hỏi qua email và trợ giúp trực tiếp từ Thư viện Quốc hội Mỹ ...
5 bước tìm kiếm trên đây là một cách hữu hiệu để tìm kiếm trên Internet và trong nhiều trường hợp bạn có thể tìm ra rất nhiều tài liệu. Tuy nhiên độ tin cậy của tài liệu tìm được trên mạng cần được xem xét cẩn thận, vì vậy trong quá trình tìm tin bạn cần phải thực hiện những công việc tiếp theo sau đây:
Bước 6: Nếu bước đầu chưa thành công - hãy thử lại
- Để trở thành một người tìm tin có kỹ năng, bạn sẽ phải luôn xem xét lại các bước mình đã tiến hành trong quá trình tìm kiếm và tìm những cách khác nhau, diễn đạt lại lệnh tìm kiếm, sử dụng các toán tử tìm kiếm khác, hoặc thậm chí xem xét lại nhu cầu thông tin của mình. Bạn sẽ trở nên thành thạo với việc sử dụng các công cụ tìm kiếm.
Bước 7: Đánh giá kết quả tìm
- Internet là một kho thông tin phong phú nhưng không được kiểm soát, do đó cần phải đánh giá chất lượng và độ chính xác của bất cứ thông tin nào tìm được trên Internet.
- Một số tiêu chí đánh giá:
+ Nguồn tác giả (tác giả có nổi tiếng trong lĩnh vực này không? Tác giả có được những tác giả khác hay những người, cơ quan đáng tin cậy đề cập đến hay không? Tài liệu có đề cập đến thông tin của tác giả hay không?...)
+ Nơi phát hành (có tên bất kỳ tổ chức nào trong văn bản bạn đọc không? Liệu tổ chức đó có tiếng trong lĩnh vực bạn nghiên cứu không? Bạn có thể xác định được mối quan hệ giữa tác giả với nơi phát hành/máy chủ không? Trang Web đó là của cá nhân hay tổ chức? ...)
+ Trích dẫn và nội dung của tài liệu.
+ Độ chính xác của thông tin (phương pháp được trình bày trong tài liệu có phù hợp với chủ đề không? Dữ liệu được sử dụng có thể xác định được độ chính xác không? ...).
+ Tính thời sự của thông tin (ngày cập nhật cuối cùng...).
2. CSDL TRỰC TUYẾN THƯƠNG MẠI
Bao gồm những CSDL về bài tạp chí, tài liệu hội nghị, báo cáo khoa học, luận án tiến sỹ, sách điện tử,…và cả bằng sáng chế.
Hiện nay có nhiều CSDL thương mại được nhiều cơ sở lớn và tập đoàn liên quốc gia trên thế giới cung cấp với giá thành tương đối cao.
Có một số tổ chức vận động nhiều thư viện trên thế giới cùng mua để giá thành được hạ xuống, chẳng hạn như PERIT.
Đối với các thư viện ở Việt Nam thường sử dụng hình thức mua quyền sử dụng trong một thời gian giới hạn.
Một số CSDL trực tuyến thương mại:
- Springer Ebooks: Là bộ sưu tập sách điện tử chuyên ngành với rất nhiều đầu sách đã đoạt giải Nobel với những TÍNH NĂNG VƯỢT TRỘI.
Tính năng cho thư viện:
+ Hơn 3000 đầu sách điện tử và các tài liệu tham khảo hàng năm.
+ Đặt mua một lần sở hữu dài hạn theo hình thức Ownership Business Model.
+ Không giới hạn người sử dụng đồng thời.
+ Được nhóm thành 12 bộ sưu tập chủ đề thuận tiện cho tìm kiếm.
+ Tích hợp hoàn toàn với mục lục thư viện.
+ Sẵn có bản ghi MARC 21.
Tính năng cho các nhà nghiên cứu
+ Kết nối trực tiếp với hơn 10.000 đầu tài liệu và 3000 đầu sách nghiên cứu mới bổ sung hàng năm.
+ Dữ liệu có liên kết: Kết nối liền mạch giữa sách điện tử với Tạp chí điện tử cũng như tài liệu tham chiếu trên cùng một giao diện tìm kiếm SpingerLINK.
+ Các chức năng tìm kiếm và tìm lướt đơn giản và thân thiện. Có thể tìm kiếm theo từng chương, dễ dàng xác định nội dung cần thiết. + Các tính năng hỗ trợđịnh hướng tìm kiếm bao gồm cả từ điển và thesauri. - Tạp chí điện tử toàn văn Science Direct Subject Collection: Science Direct là một dịch vụ chuyển giao hơn 1800 tạp chí điện tử toàn văn có chỉ số ảnh hưởng khoa học cao với gần 6 triệu bài
báo về các lĩnh vực và chủđề khoa học, công nghệ khác nhau, được công bố bởi các nhà khoa học, nhà nghiên cứu hàng đầu trên thế giới. Science Direct có các phương án lựa chọn cấp phép tối ưu, từ phương thức cơ bản là truy cập trực tiếp vào nguồn dữ liệu tới việc hỗ trợ khách hàng cùng chia sẻ một nguồn dữ liệu (Consortium hoặc Share Programs). Hình thức cấp phép căn bản của Science Direct là thu phí hàng năm đối với các truy cập điện tử dựa trên việc xác định phần trăm giá trị của phí tiếp cận bản in.
- Tạp chí điện tử SpringerLINK: SpringerLINK là nguồn dữ liệu điện tử hàng đầu của NBX Springer dành cho các nhà nghiên cứu trong hầu hết các lĩnh vực khoa học tự nhiên và công
nghệ. SpringerLINK hiện có trên 1200 tạp chí toàn văn có giá trị khoa học cao của các chuyên ngành:
+ Y tế và sức khỏe cộng đồng (Medicine & Public Health + Khoa học cuộc sống (Life science) + Hóa học (Chemistry) + Toán (Mathematics) + Vật lý (Physics)
+ Kinh tế và khoa học quản lý (Economics & Management Science)
+ Khoa học máy tính (Computer science)
+ Cơ khí (Egineering)
+ Tâm lý học (Psychology)
+ Khoa học thư viện Nga (Russian Library of Science)
Lưu ý: Trên đây chỉ là một số CSDL điện tử ví dụ, ngoài ra còn rất nhiều các CSDL điện tử thương mại khác như: Ebrary, EBSCO, CRC, IEEE, ACM ... Việc đặt mua các CSDL điện tử phụ thuộc vào kinh phí cũng như nhu cầu khai thác khác nhau của các thư viện.
3. SỐ HÓA NGUỒN TIN NỘI SINH 3.1. Khái niệm số hóa
Thuật ngữ số hóa (Digitization) được sử dụng để chỉ quá trình chuyển đổi thông tin trong các đối tượng thực sang dạng điện tử. Trong xã hội, đối tượng thực phổ biến chứa thông tin bao gồm các dạng tài liệu, văn bản, tranh vẽ, bản đồ, băng hình, băng ghi âm... Kết quả của việc số hóa các đối tượng nguồn
tin thực sựđược chuyển sang dạng điện tử. Như vậy, số hóa được coi là một phương thức tạo lập tài nguyên thông tin điện tử.
Tài nguyên thông tin điện tử có thể được định nghĩa khái quát là tập hợp có tổ chức những bộ sưu tập thông tin kiến thức của các đối tượng số (digitized objects) hoặc đã được số hóa, được lưu trữ theo các công nghệđặc biệt mà có thể truy cập, chia sẻ, khai thác theo các giao thức và thủ tục tiêu chuẩn xác định trong môi trường điện tử. Với các ưu điểm vốn có, tài nguyên thông tin sốđóng vai trò rất lớn trong hoạt động thông tin, cụ thể trong việc:
- Kiểm soát tài nguyên thông tin.
- Bảo vệ an toàn và lâu dài các tài liệu gốc (điều này đặc biệt có ý nghĩa khi số hóa các tài liệu có giá trị quý, hiếm như các chứng cứ của lịch sử, là di sản văn hóa...).
- Nâng cao năng lực khai thác thông tin của người dùng tin. - Thúc đẩy mở rộng việc chia sẻ thông tin trong Hệ thống thông
tin Quốc gia.
Tuy nhiên trong bất cứ hệ thống thông tin nào, điều quan trọng không phải hệ thống đó có bao nhiêu thông tin mà giá trị của hệ thống thể hiện ở chỗ chúng quản trịđược những loại thông tin gì và tổ chức khai thác các thông tin đó như thế nào mới là yếu tố quan trọng.
3.2. Chính sách và kế hoạch số hóa
Có sáu nguyên tắc được xác định nhằm chọn tài liệu để số hóa hướng đến việc phát triển sưu tập thư viện số:
- Tính hữu dụng: Hữu dụng là lý do cơ bản trước tất cả mọi quyết định phát triển sưu tập. Tài liệu có tần suất sử dụng cao (như giáo trình, tài liệu tham khảo mà các giáo viên thường yêu cầu tất cả sinh viên tìm đọc);
- Nhu cầu nội bộ: Sưu tập nội bộđược xây dựng để phục vụ nhu cầu nội bộ và chi phí cho tài nguyên nội bộ phải được thuyết minh vì lợi ích nội bộ - chẳng hạn như đối với thư viện đại học, yêu cầu học tập, giảng dạy và nghiên cứu là ưu tiên;
- Tài liệu mới: Mặc dù sưu tập cũ mang tính lịch sử là cần thiết cho nghiên cứu, nhưng tài liệu mới vẫn ưu tiên hơn;
- Tài liệu liên quan đến bản gốc: Những tài liệu mà người muốn tìm hiểu không thể tiếp cận được bản gốc (ví dụ các văn bản viết tay - "manuscript" của các nhà thơ, nhà văn, các nhà chính trị, hoặc các bản tuyên ngôn có chữ ký của các lãnh tụ như bản tuyên ngôn độc lập của Hoa Kỳ hiện có tại Thư viện Quốc hội Hoa Kỳ, vv.). Trên thực tế, còn có rất nhiều thể loại viết tay trên những chất liệu khác nhau. Việc số hoá các bản viết tay đó tạo điều kiện tiếp cận thuận lợi hơn cho các nhà nghiên cứu;
- Tài liệu quý hiếm: Tài liệu quý hiếm, lâu năm, độc giả không thể trực tiếp sử dụng, dễ hư hỏng - chẳng hạn như tài liệu chữ Nôm trên giấy bổi;
- Chuyển đổi nhận thức: Ngày càng có nhiều thông tin chuyển sang dạng số. Tài liệu giúp người sử dụng chuyển đổi nhận thức để làm quen việc sử dụng dạng thông tin này là ưu tiên. Chúng ta cần phải cân nhắc mức độưu tiên đối với những nguyên tắc trên trong việc chọn tài liệu để số hóa.
Trong điều kiện hiện tại, việc phát triển tài nguyên thông tin số có thể nhìn nhận theo ba mức như kịch bản sau:
- Số hóa toàn phần (fully digital resourcés).
- Song song tồn tại tài liệu và nguồn lực số hóa (parrallel resources).
- Số hóa hồi cố (Retrospective digitization).
Hiện nay phần lớn các cơ quan Thông tin - thư viện chuyên nghiệp đều xây dựng các nguồn tài nguyên số từ các nguồn tài liệu và các ấn phẩm. Như vậy trên thực tế nguồn tin số hóa được tạo lập vẫn song song tồn tại cùng với các tài nguyên thông tin hiện hữu trên giấy. Việc số hóa các tài liệu là công việc tốn kém, đòi hỏi nhiều kinh phí, lao động và trang thiết bị và phí chuyển đổi về tổ chức. Do vậy,
việc xây dựng và phát triển kho tài nguyên số không thể làm tràn lan mà phải có chọn lọc, trọng tâm, trọng điểm.
Tùy theo các điều kiện cụ thể, các đơn vị thông tin phải có các nghiên cứu cần thiết như: loại tài liệu nào cần số hóa, khối lượng, quy mô, phương thức lựa chọn... để lập kế hoạch sao cho phù hợp.
Khi xây dựng tài nguyên số, từ quan điểm lợi ích của người dùng tin và từ quan điểm pháp luật tránh rơi vào vi phạm lỗi bản quyền, cần đặc biệt chú ý tới việc xây dựng các bộ sưu tập. Một bộ sưu tập thường bao gồm nhiều tài liệu dưới nhiều dạng thức khác nhau: văn bản, hình ảnh, âm thanh. Ví dụ: Một bộ sưu tập về đề tài “1000 năm Thăng Long - Đông Đô - Hà Nội” sẽ bao gồm những tài liệu dạng văn bản về lịch sử, văn hóa, phong tục...; tài liệu dạng hình ảnh về các điểm di tích, các mẫu trang phục, các lễ hội...; tài liệu âm thanh về những điệu nhạc, bài hát, làn dân ca... Một sưu tập thông tin số như vậy phải qua một quá trình hình thành để tạo nên những cấu trúc hỗ trợ cho việc truy tìm và có thể xuất bản, đưa ra trên các phương tiện khác nhau trên mạng Internet, trên CD-ROM, trong các CSDL...
Xây dựng tài nguyên số bằng phương thức trên có nghĩa là tổ chức lại thông tin, biến chúng trở thành nguồn lực, làm cho các thông tin đó trở nên phổ biến hơn đối với đông đảo người dùng tin mà chỉ với các ấn phẩm truyền thống rất khó, nếu như không muốn nói là không thể thực hiện. Tuy nhiên, vấn đề phổ biến thông tin trong môi trường số hóa có mặt pháp lý, mà những người tham gia cần phải am hiểu các điều khoản của Luật Xuất bản, Sở hữu trí tuệ, Quy định bảo mật, Pháp lệnh lưu trữ ... để hành động đúng, để không rơi vào lỗi vi phạm pháp luật.
3.3. Thiết bị số hóa
Một trong số các thiết bị số hóa thông dụng là máy quét. Các máy quét rất đa dạng về giá cả, hình dạng và kích thước. Chúng có giá từ 100USD cho các máy quét hình phẳng cho đến 50.000USD cho các máy quét công nghiệp cỡ lớn của các nhà sản xuất như Bell & Howell. Rất nhiều website cung cấp đa dạng máy quét. Để tìm
những website này, bạn chỉ cần dùng từ khóa “scanners” vào Google, Altavista hoặc Yahoo.
Kết quả của một trang tài liệu được quét là một tập tin máy tính mà thông thường ởđịnh dạng TIFF hoặc Bitmap. Định dạng nén TIFF phiên bản 4 là dạng tốt nhất. Trung bình một trang được nén và được chuyển thành định dạng này chỉ chiếm khoảng 50Kb, trong khi ởđịnh dạng Bitmap không nén sẽ là 2Mb.
Các máy quét hình phẳng giá thấp
Các loại máy quét hình phẳng là rẻ nhất và được sử dụng nhiều nhất. Thuộc nhiều hãng khác nhau: HP, Agfa, Acer v.v., giá từ 100USD đến 300USD. Chúng đều có thể quét hình trắng đen hay màu. Do chi phí thấp nên có thể trang bị cho mỗi máy tính một máy quét riêng.
Điểm bất lợi của những máy quét này là cho ra những hình ảnh của trang tài liệu ở mức trung bình,
tỉ lệ quét thấp, không bền trong những môi trường ẩm thấp và khá dễ hư. Chúng ta phải quét từng trang một. Mỗi trang phải được định vị cẩn