Thư viện điện tử - Nguyên lý và các nội dung cơ bản: Phần 1

112 8 0
Thư viện điện tử - Nguyên lý và các nội dung cơ bản: Phần 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tài liệu Thư viện điện tử - Nguyên lý và các nội dung cơ bản: Phần 1 trình bày tổng quan về thư viện điện tử, vai trò, đặc tính, lợi ích của thư viện điện tử, các chức năng và dịch vụ của thư viện điện tử, các thành phần cấu tạo nên thư viện điện tử, sưu tầm và khai thác thông tin số,... Mời các bạn cùng tham khảo để nắm nội dung chi tiết.

CHƯƠNG TỔNG QUAN VỀ THƯ VIỆN ĐIỆN TỬ TS NGUYỄN HUY CHƯƠNG NGUYÊN LÝ VÀ NỘI DUNG   CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ   NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI MỤC LỤC   MỤC LỤC  CHƯƠNG 1: TỔNG QUAN VỀ THƯ VIỆN ĐIỆN TỬ I KHÁI NIỆM THƯ VIỆN ĐIỆN TỬ, HƯ VIỆN SỐ, THƯ VIỆN ẢO 1.1 Thư viện điện tử 1.2 Thư viện số 1.3 Thư viện ảo 12 II VAI TRÒ, ĐẶC TÍNH, LỢI ÍCH CỦA THƯ VIỆN ĐIỆN TỬ 13 2.1 Vai trò thư viện điện tử 13 2.2 Đặc tính thư viện điện tử 13 2.3 Lợi ích thư viện điện tử .14 III CÁC CHỨC NĂNG VÀ DỊCH VỤ CỦA THƯ VIỆN ĐIỆN TỬ 15 3.1 Các chức 15 3.2 Các dịch vụ 15 IV CÁC NGUYÊN TẮC VÀ MỘT SỐ VẤN ĐỀ KHI XÂY DỰNG THƯ VIỆN ĐIỆN TỬ 16 4.1 Các nguyên tắc .16 4.2 Một số vấn đề xây dựng thư viện điện tử 17 V TÌNH HÌNH PHÁT TRIỂN THƯ VIỆN ĐIỆN TỬ TRÊN THẾ GIỚI 19 VI TÌNH HÌNH PHÁT TRIỂN THƯ VIỆN ĐIỆN TỬ Ở VIỆT NAM 20 6.1 Chính sách phát triển thư viện điện tử Việt Nam 20 6.2 Xây dựng thư viện điện tử trường đại học 21 6.3 Thư viện điện tử đào tạo từ xa 22 T NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ CHƯƠNG 2: CÁC THÀNH PHẦN CẤU TẠO NÊN THƯ VIỆN ĐIỆN TỬ 27 I NGƯỜI SỬ DỤNG VÀ DỊCH VỤ THƯ VIỆN ĐIỆN TỬ 28 1.1 Người sử dụng thư viện điện tử 28 1.2 Dịch vụ thư viện điện tử 29 II VỐN TÀI LIỆU SỐ 30 2.1 Các đối tượng số 30 2.2 Siêu liệu 32 2.2.1 Khái niệm 32 2.2.2 Vai trò 34 2.2.3 Các chuẩn siêu liệu phổ biến 35 III CÁN BỘ THƯ VIỆN ĐIỆN TỬ 45 3.1 Nội dung công việc chủ yếu 45 3.2 Cách thức phục vụ .46 IV HẠ TẦNG KỸ THUẬT 46 4.1 Phần cứng 46 4.1.1 Hệ thống thiết bị mạng 47 4.1.2 Hệ thống máy chủ .48 4.1.3 Hệ thống máy trạm 50 4.1.4 Các thiết bị ngoại vi 52 4.1.5 Thiết bị mã vạch, từ 53 4.1.6 Thiết bị an ninh thư viện .55 4.1.7 Hệ thống RFID 58 4.1.8 Hệ thống lưu trữ liệu 70 4.2 Phần mềm ứng dụng 74 4.2.1 Yêu cầu công nghệ tảng 75 4.2.2 Yêu cầu chuẩn thư viện 76 MỤC LỤC 4.2.3 Yêu cầu chức phần mềm 76 CHƯƠNG 3: SƯU TẦM VÀ KHAI THÁC THÔNG TIN SỐ 89 I THÔNG TIN TRÊN INTERNET 89 1.1 Cơng cụ tìm kiếm (Search Engine) .90 1.2 Tài nguyên điện tử .95 1.3 Chiến lược tìm kiếm thơng tin 96 II CSDL TRỰC TUYẾN THƯƠNG MẠI 99 III SỐ HÓA NGUỒN TIN NỘI SINH 101 3.1 Khái niệm số hóa .101 3.2 Chính sách kế hoạch số hóa 102 3.3 Thiết bị số hóa 104 3.4 Nhận dạng ký tự quang học: OCR 108 IV HỆ THỐNG PHÁT HIỆN VÀ TÌM KIẾM TẬP TRUNG 109 CHƯƠNG 4: BỘ SƯU TẬP VÀ BIÊN MỤC TÀI LIỆU SỐ 113 I CÁC KHÁI NIỆM 113 II Ý NGHĨA VÀ NHU CẦU 115 III MỘT SỐ BỘ SƯU TẬP MẪU 117 3.1 Các sưu tập theo loại hình xuất 117 3.2 Các sưu tập theo dạng lưu trữ tài liệu 118 IV SỬ DỤNG CÁC BỘ SƯU TẬP 122 V CÔNG CỤ XÂY DỰNG BỘ SƯU TẬP 122 VI BIÊN MỤC TÀI LIỆU SỐ 127 6.1 Biên mục Analog .127 6.2 Biên mục Digital 128 T NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ 6.3 Chuyển đổi MARC sang Dublin Core 128 CHƯƠNG 5: CÁC VẤN ĐỀ VỀ BẢN QUYỀN VÀ SỞ HỮU TRÍ TUỆ 131 I MỘT SỐ KHÁI NIỆM VỀ SỞ HỮU TRÍ TUỆ 131 II CÁC VẤN ĐỀ VỀ BẢN QUYỀN 138 CHƯƠNG 6: XÂY DỰNG KẾ HOẠCH VÀ CHÍNH SÁCH PHÁT TRIỂN TVĐT 141 I XÁC ĐỊNH CHÍNH SÁCH PHÁT TRIỂN TVĐT 141 1.1 Cấu trúc TVĐT 141 1.2 Hạ tầng sở kỹ thuật .142 1.3 Kho tư liệu số hóa 143 1.4 Các vấn đề bảo quản, khai thác quyền 143 II XÂY DỰNG KẾ HOẠCH PHÁT TRIỂN NGUỒN TIN ĐIỆN TỬ 143 III XÂY DỰNG KẾ HOẠCH TÀI CHÍNH 146 TÀI LIỆU THAM KHẢO 149 CHƯƠNG TỔNG QUAN VỀ THƯ VIỆN ĐIỆN TỬ Chương TỔNG QUAN VỀ THƯ VIỆN ĐIỆN TỬ  1. KHÁI NIỆM THƯ VIỆN ĐIỆN TỬ, THƯ VIỆN SỐ, THƯ VIỆN ẢO  1.1. Thư viện điện tử  Thư viện điện tử khái niệm chưa định nghĩa thống nhiều tranh luận, dùng lẫn lộn đồng nghĩa với khái niệm "Thư viện không biên giới", "Thư viện nối mạng", "Thư viện số", "Thư viện ảo", "Thư viện tin học hoá", "Thư viện đa phương tiện", "Thư viện lơgích", "Thư viện văn phịng", Thuật ngữ "thư viện điện tử" (electronic library) dùng theo nghĩa tổng quát cho loại hình thư viện tin học hố tồn số dịch vụ Thư viện điện tử coi nơi người sử dụng tới để thực công việc mà họ thường làm với thư viện truyền thống, điện tử hoá Theo tiến sĩ Ching-chih Chen, người có sáng kiến tổ chức loạt hội nghị quốc tế công nghệ thông tin (NIT) mười năm gần (từ 1987) khơng có tiêu chuẩn cố định, thức cho thư viện điện tử Người ta sử dụng khái niệm tự do, tuỳ tiện Theo quan điểm Collier (1995) thư viện điện tử định nghĩa môi trường gồm tài liệu dạng điện tử, cấu trúc nhằm cung cấp lượng thông tin lớn thông qua máy tính mạng viễn thơng quốc tế Theo quan điểm Phillip Barker (1997) cho rằng: Trong thư viện điện tử có sử dụng rộng rãi máy tính phương tiện hỗ NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ trợ khác (bảng tra trực tiếp, tìm văn đầy đủ, lưu biểu ghi tự động hoá, định máy tính,…) Tác giả nhấn mạnh đặc trưng thư viện điện tử sử dụng phổ biến phương tiện điện tử lưu trữ, tìm kiếm cung cấp thư viện điện tử Theo ông thư viện điện tử, ấn phẩm điện tử tồn sách truyền thống Theo quan điểm Sylvie Tellier (1997) ơng đưa định nghĩa thư viện điện tử sau: Thư viện điện tử thư viện có sử dụng hệ thống máy vi tính hệ thống phụ kiện để lưu trữ, xử lý, cung cấp dịch vụ thông tin cho người sử dụng Theo cách hiểu thư viện điện tử có sử dụng máy tính việc quản lý, lưu trữ phục vụ tìm kiếm thơng tin Tuy ý kiến chưa hồn tồn thống nhất, tựu chung lại, ta nhận dạng số đặc điểm thư viện điện tử lý tưởng sau: - Thư viện phải có vốn tư liệu điện tử (là tư liệu lưu trữ dạng số cho truy nhập thiết bị xử lý liệu) - Phải tin học hố, phải có hệ quản trị thư viện tích hợp (bổ sung, biên mục, quản trị xuất phẩm định kỳ, kiểm soát lưu thông tư liệu, tổ chức mục lục truy nhập cơng cộng trực tuyến, ); phải nối mạng (ít mạng cục bộ) - Phải cung cấp tạo điều kiện cho người dùng sử dụng dịch vụ điện tử (yêu cầu gia hạn mượn qua mạng, tìm tin sở liệu, truy nhập khai thác nguồn tin chỗ nguồn tin nơi khác, ) Thư viện điện tử đời kết hợp tác chuyên gia thư viện, xuất bản, nhà khoa học công nghệ hướng mục tiêu tiếp cận tới đầy đủ thông tin, nơi lúc Nói tóm lại, thư viện điện tử phải sử dụng phương tiện điện tử thu thập, lưu trữ, xử lý, tìm kiếm phổ biến thơng tin CHƯƠNG TỔNG QUAN VỀ THƯ VIỆN ĐIỆN TỬ Hình 1.1: Mơ hình thư viện điện tử 1.2. Thư viện số  Có ý kiến cho rằng, thư viện số bước tiến xa thư viện điện tử hay nói cách khác, thư viện điện tử cấp cao, cho phép đọc thơng tin tồn văn sau số hoá hầu hết tư liệu, đặc biệt tư liệu dạng đồ hoạ (như tranh ảnh, đồ, ) đa phương tiện (multimedia) nói chung Tác giả Philip Baker phân biệt thư viện điện tử thư viện số theo kiểu khác Ông cho thư viện điện tử lưu trữ phục vụ ấn phẩm (tài liệu in ấn truyền thống) lẫn tư liệu điện tử (tư liệu số hố), thư viện số lưu trữ tư liệu điện tử mà Một thư viện điện tử có thiên hướng sử dụng linh hoạt phổ biến nguồn tin điện tử đồng thời tham gia vào việc tạo nguồn tin Các thư viện số có nhiều định nghĩa khác nhiều cơng trình nghiên cứu với quan điểm khác Thư viện số theo quan điểm Liên đoàn Thư viện số Thế giới (DLF – Digital Library Federation): Thư viện số tổ chức cung cấp nguồn lực - tài nguyên, bao gồm chuyên gia để lựa chọn, 10 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ cấu trúc, cung cấp khả truy cập tới nguồn tri thức, phân phối, bảo đảm tính vẹn tồn tính lâu dài sưu tập số cộng đồng tập hợp cộng đồng người dùng tin xác định ln sử dụng cách nhanh chóng, kịp thời kinh tế Theo quan điểm Liên hiệp Thư viện số Mỹ (American Digital Feder) thì: Thư viện số quan, tổ chức có nguồn lực, kể nguồn nhân lực chun mơn hố để lựa chọn cấu trúc, diễn giải, phổ biến, bảo quản toàn vẹn, đảm bảo ổn định thời gian dài sưu tập cơng trình số hố mà có dạng sẵn sàng để sử dụng cách kinh tế cho hay số cộng đồng định Theo Michael Lesk (1997): Thư viện số sưu tập thơng tin số hố có tổ chức Được xây dựng cách cấu trúc thu thập thông tin công việc mà thư viện truyền thống ln phải làm máy tính có nhiệm vụ trình bày thơng tin số đó,… Một thư viện số thực tạo nguyên tắc quản lý yếu tố cấu thành thư viện phương thức tổ chức thư viện Theo Borgman (1999): Các thư viện số xây dựng, lựa chọn tổ chức cho cộng đồng người dùng tin chúng có khả thoả mãn nhu cầu tin cung cấp ích lợi cho cộng đồng Chúng phận cấu thành lên cộng đồng mà cá nhân nhóm tương tác với nhau, sử dụng liệu, thông tin, tài nguyên hệ thống tri thức Ở định nghĩa này, chúng phát triển mức cao tích hợp tổ chức thông tin dạng vật lý, nơi mà tài nguyên thông tin lựa chọn, thu thập, tổ chức, bảo quản truy cập để phục vụ cho cộng đồng người dùng tin Những tổ chức thông tin gồm thư viện, viện bảo tàng, quan lưu trữ trường học Nhưng thư viện số lại phát triển vươn tới phục vụ cộng đồng khác bao gồm lớp học, cơng sở, văn phịng, phịng thí nghiệm, gia đình, khu vực cộng cộng Theo Ian Written (2003): Thư viện số tập hợp sưu tập thông tin đối tượng số số hố có tổ chức tập trung Tập trung theo đề tài hay chủ đề có tổ chức để thông tin 98 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ Bước 5: Tìm lời khuyên từ người - Nếu bạn tìm thơng tin cơng cụ tìm kiếm, tìm giúp đỡ từ người có kinh nghiệm: hỏi tác giả tài liệu, gửi câu hỏi qua email trợ giúp trực tiếp từ Thư viện Quốc hội Mỹ bước tìm kiếm cách hữu hiệu để tìm kiếm Internet nhiều trường hợp bạn tìm nhiều tài liệu Tuy nhiên độ tin cậy tài liệu tìm mạng cần xem xét cẩn thận, trình tìm tin bạn cần phải thực công việc sau đây: Bước 6: Nếu bước đầu chưa thành công - thử lại - Để trở thành người tìm tin có kỹ năng, bạn phải ln xem xét lại bước tiến hành trình tìm kiếm tìm cách khác nhau, diễn đạt lại lệnh tìm kiếm, sử dụng tốn tử tìm kiếm khác, chí xem xét lại nhu cầu thơng tin Bạn trở nên thành thạo với việc sử dụng cơng cụ tìm kiếm Bước 7: Đánh giá kết tìm - Internet kho thông tin phong phú không kiểm sốt, cần phải đánh giá chất lượng độ xác thơng tin tìm Internet - Một số tiêu chí đánh giá: + + + Nguồn tác giả (tác giả có tiếng lĩnh vực khơng? Tác giả có tác giả khác hay người, quan đáng tin cậy đề cập đến hay khơng? Tài liệu có đề cập đến thông tin tác giả hay không? ) Nơi phát hành (có tên tổ chức văn bạn đọc không? Liệu tổ chức có tiếng lĩnh vực bạn nghiên cứu khơng? Bạn xác định mối quan hệ tác giả với nơi phát hành/máy chủ không? Trang Web cá nhân hay tổ chức? ) Quan điểm tác giả CHƯƠNG SƯU TẦM VÀ KHAI THÁC THÔNG TIN SỐ + + + 99 Trích dẫn nội dung tài liệu Độ xác thơng tin (phương pháp trình bày tài liệu có phù hợp với chủ đề khơng? Dữ liệu sử dụng xác định độ xác khơng? ) Tính thời thơng tin (ngày cập nhật cuối ) CSDL TRỰC TUYẾN THƯƠNG MẠI  Bao gồm CSDL tạp chí, tài liệu hội nghị, báo cáo khoa học, luận án tiến sỹ, sách điện tử,…và sáng chế Hiện có nhiều CSDL thương mại nhiều sở lớn tập đoàn liên quốc gia giới cung cấp với giá thành tương đối cao Có số tổ chức vận động nhiều thư viện giới mua để giá thành hạ xuống, chẳng hạn PERIT Đối với thư viện Việt Nam thường sử dụng hình thức mua quyền sử dụng thời gian giới hạn Một số CSDL trực tuyến thương mại: - Springer Ebooks: Là sưu tập sách điện tử chuyên ngành với nhiều đầu sách đoạt giải Nobel với TÍNH NĂNG VƯỢT TRỘI Tính cho thư viện: + + + + Hơn 3000 đầu sách điện tử tài liệu tham khảo hàng năm Đặt mua lần sở hữu dài hạn theo hình thức Ownership Business Model Không giới hạn người sử dụng đồng thời Được nhóm thành 12 sưu tập chủ đề thuận tiện cho tìm kiếm + Tích hợp hồn tồn với mục lục thư viện + Sẵn có ghi MARC 21 + Dữ liệu thống kế hữu dụng 100 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ Tính cho nhà nghiên cứu + + + + Kết nối trực tiếp với 10.000 đầu tài liệu 3000 đầu sách nghiên cứu bổ sung hàng năm Dữ liệu có liên kết: Kết nối liền mạch sách điện tử với Tạp chí điện tử tài liệu tham chiếu giao diện tìm kiếm SpingerLINK Các chức tìm kiếm tìm lướt đơn giản thân thiện Có thể tìm kiếm theo chương, dễ dàng xác định nội dung cần thiết Các tính hỗ trợ định hướng tìm kiếm bao gồm từ điển thesauri - Tạp chí điện tử tồn văn Science Direct Subject Collection: Science Direct dịch vụ chuyển giao 1800 tạp chí điện tử tồn văn có số ảnh hưởng khoa học cao với gần triệu báo lĩnh vực chủ đề khoa học, công nghệ khác nhau, công bố nhà khoa học, nhà nghiên cứu hàng đầu giới Science Direct có phương án lựa chọn cấp phép tối ưu, từ phương thức truy cập trực tiếp vào nguồn liệu tới việc hỗ trợ khách hàng chia sẻ nguồn liệu (Consortium Share Programs) Hình thức cấp phép Science Direct thu phí hàng năm truy cập điện tử dựa việc xác định phần trăm giá trị phí tiếp cận in - Tạp chí điện tử SpringerLINK: SpringerLINK nguồn liệu điện tử hàng đầu NBX Springer dành cho nhà nghiên cứu hầu hết lĩnh vực khoa học tự nhiên công CHƯƠNG SƯU TẦM VÀ KHAI THÁC THƠNG TIN SỐ 101 nghệ SpringerLINK có 1200 tạp chí tồn văn có giá trị khoa học cao chuyên ngành: + + Y tế sức khỏe cộng đồng (Medicine & Public Health Khoa học sống (Life science) + Hóa học (Chemistry) + Toán (Mathematics) + Vật lý (Physics) + Kinh tế khoa học quản lý (Economics & Management Science) + Khoa học máy tính (Computer science) + Cơ khí (Egineering) + Tâm lý học (Psychology) + Khoa học thư viện Nga (Russian Library of Science) Lưu ý: Trên số CSDL điện tử ví dụ, ngồi cịn nhiều CSDL điện tử thương mại khác như: Ebrary, EBSCO, CRC, IEEE, ACM Việc đặt mua CSDL điện tử phụ thuộc vào kinh phí nhu cầu khai thác khác thư viện SỐ HĨA NGUỒN TIN NỘI SINH  3.1 Khái niệm số hóa  Thuật ngữ số hóa (Digitization) sử dụng để q trình chuyển đổi thơng tin đối tượng thực sang dạng điện tử Trong xã hội, đối tượng thực phổ biến chứa thông tin bao gồm dạng tài liệu, văn bản, tranh vẽ, đồ, băng hình, băng ghi âm Kết việc số hóa đối tượng nguồn 102 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ tin thực chuyển sang dạng điện tử Như vậy, số hóa coi phương thức tạo lập tài nguyên thông tin điện tử Tài nguyên thơng tin điện tử định nghĩa khái quát tập hợp có tổ chức sưu tập thông tin kiến thức đối tượng số (digitized objects) số hóa, lưu trữ theo cơng nghệ đặc biệt mà truy cập, chia sẻ, khai thác theo giao thức thủ tục tiêu chuẩn xác định môi trường điện tử Với ưu điểm vốn có, tài ngun thơng tin số đóng vai trị lớn hoạt động thơng tin, cụ thể việc: - Kiểm sốt tài ngun thơng tin - Bảo vệ an tồn lâu dài tài liệu gốc (điều đặc biệt có ý nghĩa số hóa tài liệu có giá trị quý, chứng lịch sử, di sản văn hóa ) - Nâng cao lực khai thác thông tin người dùng tin - Thúc đẩy mở rộng việc chia sẻ thông tin Hệ thống thông tin Quốc gia Tuy nhiên hệ thống thông tin nào, điều quan trọng hệ thống có thơng tin mà giá trị hệ thống thể chỗ chúng quản trị loại thơng tin tổ chức khai thác thơng tin yếu tố quan trọng 3.2 Chính sách và kế hoạch số hóa  Có sáu nguyên tắc xác định nhằm chọn tài liệu để số hóa hướng đến việc phát triển sưu tập thư viện số: - Tính hữu dụng: Hữu dụng lý trước tất định phát triển sưu tập Tài liệu có tần suất sử dụng cao (như giáo trình, tài liệu tham khảo mà giáo viên thường yêu cầu tất sinh viên tìm đọc); - Nhu cầu nội bộ: Sưu tập nội xây dựng để phục vụ nhu cầu nội chi phí cho tài nguyên nội phải thuyết minh lợi ích nội - chẳng hạn thư viện đại học, yêu cầu học tập, giảng dạy nghiên cứu ưu tiên; CHƯƠNG SƯU TẦM VÀ KHAI THÁC THÔNG TIN SỐ 103 - Tài liệu mới: Mặc dù sưu tập cũ mang tính lịch sử cần thiết cho nghiên cứu, tài liệu ưu tiên hơn; - Tài liệu liên quan đến gốc: Những tài liệu mà người muốn tìm hiểu khơng thể tiếp cận gốc (ví dụ văn viết tay - "manuscript" nhà thơ, nhà văn, nhà trị, tun ngơn có chữ ký lãnh tụ tuyên ngôn độc lập Hoa Kỳ có Thư viện Quốc hội Hoa Kỳ, vv.) Trên thực tế, cịn có nhiều thể loại viết tay chất liệu khác Việc số hoá viết tay tạo điều kiện tiếp cận thuận lợi cho nhà nghiên cứu; - Tài liệu quý hiếm: Tài liệu quý hiếm, lâu năm, độc giả trực tiếp sử dụng, dễ hư hỏng - chẳng hạn tài liệu chữ Nôm giấy bổi; - Chuyển đổi nhận thức: Ngày có nhiều thông tin chuyển sang dạng số Tài liệu giúp người sử dụng chuyển đổi nhận thức để làm quen việc sử dụng dạng thông tin ưu tiên Chúng ta cần phải cân nhắc mức độ ưu tiên nguyên tắc việc chọn tài liệu để số hóa Trong điều kiện tại, việc phát triển tài ngun thơng tin số nhìn nhận theo ba mức kịch sau: - Số hóa toàn phần (fully digital resourcés) - Song song tồn tài liệu nguồn lực số hóa (parrallel resources) - Số hóa hồi cố (Retrospective digitization) Hiện phần lớn quan Thông tin - thư viện chuyên nghiệp xây dựng nguồn tài nguyên số từ nguồn tài liệu ấn phẩm Như thực tế nguồn tin số hóa tạo lập song song tồn với tài nguyên thông tin hữu giấy Việc số hóa tài liệu cơng việc tốn kém, địi hỏi nhiều kinh phí, lao động trang thiết bị phí chuyển đổi tổ chức Do vậy, 104 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ việc xây dựng phát triển kho tài nguyên số làm tràn lan mà phải có chọn lọc, trọng tâm, trọng điểm Tùy theo điều kiện cụ thể, đơn vị thơng tin phải có nghiên cứu cần thiết như: loại tài liệu cần số hóa, khối lượng, quy mô, phương thức lựa chọn để lập kế hoạch cho phù hợp Khi xây dựng tài nguyên số, từ quan điểm lợi ích người dùng tin từ quan điểm pháp luật tránh rơi vào vi phạm lỗi quyền, cần đặc biệt ý tới việc xây dựng sưu tập Một sưu tập thường bao gồm nhiều tài liệu nhiều dạng thức khác nhau: văn bản, hình ảnh, âm Ví dụ: Một sưu tập đề tài “1000 năm Thăng Long - Đông Đô - Hà Nội” bao gồm tài liệu dạng văn lịch sử, văn hóa, phong tục ; tài liệu dạng hình ảnh điểm di tích, mẫu trang phục, lễ hội ; tài liệu âm điệu nhạc, hát, dân ca Một sưu tập thông tin số phải qua trình hình thành để tạo nên cấu trúc hỗ trợ cho việc truy tìm xuất bản, đưa phương tiện khác mạng Internet, CD-ROM, CSDL Xây dựng tài nguyên số phương thức có nghĩa tổ chức lại thông tin, biến chúng trở thành nguồn lực, làm cho thơng tin trở nên phổ biến đông đảo người dùng tin mà với ấn phẩm truyền thống khó, khơng muốn nói khơng thể thực Tuy nhiên, vấn đề phổ biến thông tin môi trường số hóa có mặt pháp lý, mà người tham gia cần phải am hiểu điều khoản Luật Xuất bản, Sở hữu trí tuệ, Quy định bảo mật, Pháp lệnh lưu trữ để hành động đúng, để khơng rơi vào lỗi vi phạm pháp luật 3.3  Thiết bị số hóa  Một số thiết bị số hóa thơng dụng máy quét Các máy quét đa dạng giá cả, hình dạng kích thước Chúng có giá từ 100USD cho máy quét hình phẳng 50.000USD cho máy quét công nghiệp cỡ lớn nhà sản xuất Bell & Howell Rất nhiều website cung cấp đa dạng máy quét Để tìm CHƯƠNG SƯU TẦM VÀ KHAI THÁC THÔNG TIN SỐ 105 website này, bạn cần dùng từ khóa “scanners” vào Google, Altavista Yahoo Kết trang tài liệu quét tập tin máy tính mà thông thường định dạng TIFF Bitmap Định dạng nén TIFF phiên dạng tốt Trung bình trang nén chuyển thành định dạng chiếm khoảng 50Kb, định dạng Bitmap không nén 2Mb Các máy quét hình phẳng giá thấp Các loại máy quét hình phẳng rẻ sử dụng nhiều Thuộc nhiều hãng khác nhau: HP, Agfa, Acer v.v., giá từ 100USD đến 300USD Chúng qt hình trắng đen hay màu Do chi phí thấp nên trang bị cho máy tính máy quét riêng Điểm bất lợi máy quét cho hình ảnh trang tài liệu mức trung bình, tỉ lệ qt thấp, khơng bền môi trường ẩm thấp dễ hư Chúng ta phải quét trang Mỗi trang phải định vị cẩn thận theo lề bảng quét Hiệu suất máy quét Mặc dù nhà sản xuất khẳng định trang tài liệu quét vòng chưa tới phút thực tế cho thấy khó thể đạt tới mức 12 trang tiếng Tiến trình quét thường làm ì ạch máy tính gắn kết Do máy quét hữu dụng cho công việc nhỏ (số lượng trang cần quét ít- từ 200 đến 400 trang tháng cách thường xuyên) công việc xảy lần từ 1.000 đến 2.000 trang Máy quét cấp thấp có ngăn để giấy Các máy quét thường có giá từ 500USD 1.200USD Có thể quét từ 10 đến 50 trang tài liệu lần Vì người điều khiển khơng cần có mặt liên tục máy quét Điều làm gia tăng số lượng trang đến 150- 200 trang/ngày Những loại máy quét có tuổi thọ cao hơn, thường khoảng từ 30.000 đến 50.000 trang 106 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ Điểm bất lợi chúng thời điểm quét mặt tài liệu - ngăn để trang tài liệu phải đảo lại để quét mặt sau tài liệu Và điều gây vấn đề ngăn để giấy thường gặp trục trặc đôi lúc làm kẹt giấy Những loại hữu ích cho cơng việc qt từ 1.500 đến 3.000 trang/tháng Các máy quét màu, để qt hình màu thiết ta phải có máy quét màu Nhưng nói chung, chưa đến 5% ấn phẩm chứa màu cộng với bìa tài liệu Vì máy quét hình phẳng giá thành thấp kể thường đáp ứng nhu cầu Chúng ta nên chọn máy quét có độ phân giải lên đến 600dpi Các máy quét mặt chuyên nghiệp Các máy quét chuyên nghiệp máy tốt đáng tin cậy, có khả xử lý số lượng lớn trang tài liệu- từ 2.000 đến 10.000 trang/ngày Chúng có hệ thống khay để giấy tự động, xử lý nhóm gồm từ 50 đến 200 trang Các máy quét tốt nhanh thuộc dạng quét mặt tài liệu lúc Các máy qt u cầu máy tính kết nối với phải mạnh có dung lượng ổ cứng 10 -20Gb, giá từ 5.000 - 50.000USD Chẳng hạn như: - Máy quét Cannon DR-6020 giá khoảng 5.000USD, quét mặt tài liệu 2000 trang/ngày tuổi thọ từ 600.000 - 800.000 trang Các máy quét nhãn hiệu Bell&Howell Fujitsu, giá từ 10.000 - 500.00USD, có tuổi thọ đến hàng triệu trang - Các máy quét phích nhỏ có giá từ 15.000USD loại bán tự động 80.000USD loại tự động hồn tồn Máy số hóa sách đóng tập Hiện thị trường xuất máy số hóa sách chuyên dụng Tuy nhiên giá thành đắt lên đến hàng trăm nghìn USD, CHƯƠNG SƯU TẦM VÀ KHAI THÁC THÔNG TIN SỐ 107 phù hợp với đơn vị có khối lượng tài liệu cần số hóa nhiều, đơn vị cung cấp dịch vụ số hóa chuyên nghiệp Một số ưu điểm hệ thống thiết bị là: - Tư gáy sách không bị ép thẳng: cho phép việc chụp sách tự động không phá huỷ giảm tối thiểu việc dãn căng gáy sách căng trang giấy lật giở - Sức căng lật giở trang tối thiểu hóa - Tư trang đặt phẳng: Hai kẹp đặt mép trang gần gáy sách tự động nhẹ nhàng trợ giúp làm phẳng trang giấy sau trang lật giở Những kẹp tạo lực ép nhẹ vào trang giấy mà không tạo sức căng gáy sách Những kẹp dễ điều chỉnh theo loại kích cỡ sách khác chạm vào mép giấy với tiếp xúc hướng xuống - Khả lật giở trang tự động: Kỹ thuật hút chân không kỹ thuật cánh tay robot nằm bên phần điều khiển thực lặp đi, lặp lại chức kiểu mức độ Đầu hút nhấc trang sách diện rộng để giở trang cách nhẹ nhàng, không nhấc giở phía góc trang Cánh tay robot lật giở trang đặn lực đẩy Việc lật giở trang tay thời gian dài dẫn đến tình trạng người vận hành lật giở khơng tay, gây rách giấy hư hỏng khác - Sao chụp tự động suất cao: Có khả chụp tự động lên đến hàng nghìn trang/giờ - Kỹ thuật chụp lấy trang sách: Hệ thống sử dụng máy ảnh kỹ thuật số quét quang 108 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ Các chương trình quét Mỗi máy quét có phần mềm riêng cài đặt máy tính để điều khiển máy quét Một số máy qt có card cài đặt vào máy tính để tăng tốc độ quét 3.4  Nhận dạng ký tự quang học: OCR  Nhận dạng ký tự hay cịn gọi hệ thống OCR làm cơng việc chuyển thể hình ảnh quét thành văn Đầu vào hình ảnh kỹ thuật số định dạng TIFF Bitmap, tốt ảnh có chất lượng cao Đầu văn trang web, định dạng RTF, PDF, Word HTML Sau bước để chuyển thể tài liệu giấy tờ thành dạng kỹ thuật số: Hình 3.1: Các bước chuyển đổi tài liệu giấy thành dạng điện tử - Chụp, cân chỉnh trang, nâng cao chất lượng hình ảnh, làm trắng tự động theo khối liệu (định dạng ảnh TIFF JPG) - Chuyển sang định dạng PDF ảnh tĩnh thêm bookmark cho tài liệu - Xử lý nhận dạng ký tự quang học (OCR): Chuyển tài liệu từ dạng ảnh sang PDF Word tìm kiếm tồn văn CHƯƠNG SƯU TẦM VÀ KHAI THÁC THÔNG TIN SỐ 109 - Biên mục siêu liệu: Siêu liệu mô tả (theo chuẩn Dublin Core), siêu liệu cấu trúc, siêu liệu kỹ thuật Tuân theo bước này, bạn kiểm tra chất lượng tập tin kết lưu chúng định dạng thích hợp Trên thị trường có nhiều chương trình nhận dạng kí tự tốt với giá từ 100USD đến 400USD, chẳng hạn như: - Read-Iris (http://www.readiris.com) - Omnipage (http://www.omnipage.com) - Fine-Reader (http://www.finereader.com) - VNDOCR (http://www.vndocr.com) Tất thông tin bao gồm nhà phân phối địa phương tìm thấy website nhà sản xuất Để tự thực công việc quét tài liệu cần có máy qt, phần mềm nhận dạng kí tự đảm bảo chất lượng Do cần phải định lựa chọn tự quét hay bàn giao cho đối tác thực việc quét HỆ THỐNG PHÁT HIỆN VÀ TÌM KIẾM TẬP TRUNG  Hệ thống phát tìm kiếm tập trung ứng dụng phát tìm kiếm nguồn tin: thương mại, nội sinh nguồn truy cập mở khác thư viện giao diện tìm kiếm Tài liệu tìm trong: - Mục lục thư viện (Cơ sở liệu thư mục) - Kho tài nguyên số nội sinh (Digital Repository) 110 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ - Các nguồn tài nguyên bên khác: sở liệu thư mục thư viện khác, kho liệu số bên ngoài, truy cập mở (Open access: sách điện tử, giảng điện tử, tạp chí điện tử mở ), sở liệu trực tuyến nhà xuất hàng đầu giới Các hệ thống phát tìm kiếm tập trung phổ biến thị trường có: WorldCat Local, Primo, Summon, Encore, EBSCO Discovery Service, SirsiDynix Enterprise, VuFind (giải pháp phần mềm mã nguồn mở) Một số điểm chung hệ thống phát tìm kiếm tập trung: - Đối tượng tìm kiếm: Tất nguồn tài nguyên bên bên thư viện mà hệ thống phép kết nối tới - Giao diện tìm kiếm: Mặc định tìm kiếm (giống Google), có giao diện tìm kiếm nâng cao (nếu cần) - Hiển thị kết tìm kiếm: + + + Kết tìm kiếm hiển thị theo mức độ phù hợp Kết tìm kiếm lọc theo nhóm, tiêu chí khác nhau: theo định dạng, theo sưu tập, theo địa điểm, theo ngôn ngữ, theo năm xuất Đưa gợi ý liên quan đến từ khóa tìm kiếm - Quản lý truy cập bạn đọc: Hỗ trợ tính SSO (Single sign-on) - Khai thác tài nguyên: + + Tích hợp với hệ thống thư viện điện tử tích hợp để thực giao dịch mượn/trả tài liệu Kết nối xem toàn văn tài liệu số (nếu phép) CHƯƠNG SƯU TẦM VÀ KHAI THÁC THƠNG TIN SỐ Hình 3.2: Mơ hình hệ thống phát tìm kiếm tập trung 111 112 NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ ... CỦA THƯ VIỆN ĐIỆN TỬ 13 2 .1 Vai trò thư viện điện tử 13 2.2 Đặc tính thư viện điện tử 13 2.3 Lợi ích thư viện điện tử .14 III CÁC CHỨC NĂNG VÀ DỊCH VỤ CỦA THƯ VIỆN ĐIỆN TỬ... viện điện tử - xác nhận định nghĩa khoa học xác đáng thư viện điện tử có đặc tính sau: 14 NGUN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ - Thư viện điện tử quan, tổ chức “ảo” mạng - Thư viện điện. .. dựng thư viện điện tử trường đại học 21 6.3 Thư viện điện tử đào tạo từ xa 22 T NGUYÊN LÝ VÀ NỘI DUNG CƠ BẢN CỦA THƯ VIỆN ĐIỆN TỬ CHƯƠNG 2: CÁC THÀNH PHẦN CẤU TẠO NÊN THƯ VIỆN ĐIỆN TỬ

Ngày đăng: 12/05/2021, 18:41

Tài liệu cùng người dùng

Tài liệu liên quan