XÂY DỰNG THƯ VIỆN SỐ VÀ MỘT SỐ THÁCH THỨC TRONG LƯU TRỮ - BẢO QUẢN TÀI LIỆU SỐ Lê Bá Lâm* Tóm tắt: Thư viện số gì? Các định nghĩa thư viện số; Thư viện số, Thư viện ảo, Thư viện điện tử, thư viện số? Những vấn đề xây dựng thư viện số; Phân tích thách thức việc lưu trữ bảo quản kho tài liệu số thư viện Từ khóa: Thư viện số; Lưu trữ số; Bảo quản số Mở đầu Cuộc cách mạng công nghệ thông tin làm thay đổi thư viện từ truyền thống sang đại Việc phát minh đĩa CD-ROM vào năm 1980 bước ngoặt số hóa thơng tin 20 năm qua với phát triển mạnh mẽ Internet công nghệ số dễ dàng cho phép người tạo số lượng tài nguyên thông tin số vô lớn mà trước khơng thể tưởng tượng Do thư viện, nguồn tài liệu số tăng lên nhanh chóng từ tài liệu số (born-digital materials) cơng tác số hóa (digitization) dẫn tới suy nghĩ cần phải xây dựng thư viện số, tổ chức lưu trữ, bảo quản để phục vụ tìm kiếm sử dụng lâu dài Thư viện số đời, phát triển nhiều thách thức đặt với quan thông tin – thư viện Đối với số người thư viện số đơn giản tin học hóa thư viện truyền thống Nhưng thực tế để triển khai hệ thống Thư viện số phải có hạ tầng công nghệ thông tin chuyên dụng khâu nghiệp vụ chuyên môn thu thập, tổ chức, phân loại, xây dựng sưu tập, vấn đề quyền, sách truy cập phương pháp tiếp cận bảo quản lâu dài để sử dụng tương lai ứng dụng đọc, xem tài liệu thay đổi mà nguồn tài liệu khơng bị ảnh hưởng hay phục hồi đối tượng số xảy nguy cơ, cố Định nghĩa Thư viện số Theo Larson định nghĩa “Thư viện số thư viện ảo toàn cầu – hàng ngàn thư viện điện tử nối mạng với nhau”[1] Thư viện số trình bày sưu tập tài liệu số cho phép người dùng tin truy cập địa điểm thời gian Một nhóm làm việc quan hạ tầng công nghệ thông tin phủ Mỹ cho “Thư viện số hệ thống cung cấp cho người dùng truy cập đến tri thức, thông tin kho tài liệu số” Liên đồn thư viện số Mỹ định nghĩa “Thư viện số tổ chức cung cấp tài nguyên thông tin, bao gồm nhân viên để hướng dẫn truy cập, tạo lập, phân phối, đảm bảo tính tồn vẹn ổn định lâu dài theo thời gian sưu tập số” [2] Nói chung để định nghĩa thư viện số tập hợp yếu tố: Các sưu tập số đối tượng thông tin; dịch vụ hỗ trợ sử dụng; tổ chức bảo quản tài liệu * Phó Giám đốc, Trung tâm Thơng tin – Thư viện, Đại học Quốc gia Hà Nội số Mục tiêu cải thiện tiếp cận tài liệu nhanh chóng, nhiều người lúc, tiết kiệm chi phí, bảo quản tài liệu lâu dài với hỗ trợ công nghệ thông tin Xây dựng thư viện số Một vấn đề lớn xây dựng thư viện số xây dựng sưu tập số Mơ hình hệ thống liên kết hệ thống mạng, phần cứng, phần mềm Phần cứng hệ thống mạng, máy chủ, lưu trữ, máy tính, máy quét; Phần mềm giúp tổ chức sưu tập, hiển thị, trình bày nội dung với phần mềm số hóa để chụp tài liệu, chỉnh sửa hình ảnh, nhận dạng kí tự, Một số điểm quan trọng xây dựng thư viện số sau: a) Bộ sưu tập số: Để có tài liệu số xây dựng thành sưu tập, thông thường lấy từ nguồn thân tài liệu xuất số; tài liệu số hóa từ cứng tài liệu số thư viện sưu tập b) Truy cập bên ngồi thơng qua hợp đồng, thỏa thuận với nhà xuất sách điện tử, tạp chí điện tử, sở liệu Elsevier, Springer, đối tác đến trang web c) Lựa chọn tài liệu để số hóa: Lựa chọn tài liệu để số hóa vấn đề quan trọng công tác số hóa tài liệu Thơng thường tài liệu nội sinh tính đến nhiều vấn đề liên quan khẳng định giá trị học thuật đơn vị, vấn đề quyền, Các đơn vị thường đưa tiêu chí xếp theo thứ tự ưu tiên Tài liệu chọn phải thỏa mãn tiêu chí tiêu chí đầu + Tiêu chí – Truy cập Là tài liệu sử dụng nhiều tài liệu có giá trị giá trị trị, giá trị nghiên cứu giảng dạy, giá trị tài giá trị văn hóa xã hội hay truyền thống Những tài liệu đơn xếp tiêu chí + Tiêu chí – Bảo quản Là tài liệu dễ hỏng, dễ phân hủy, khó bảo quản + Tiêu chí – Cộng đồng Là tài liệu phục vụ cho kiện, chương trình nghiên cứu trọng điểm hay triển lãm xây dựng thương hiệu ĐHQGHN + Tiêu chí – Tài liệu có tiềm phát triển Là tài liệu có kinh phí từ dự án, tương lai đầu tư, bổ sung số hóa theo yêu cầu lãnh đạo hay nhà tài trợ + Tiêu chí – Cam kết thư viện Thư viện có cam kết từ trước số hóa sưu tập cụ thể d) Hạ tầng công nghệ thông tin: Đây nội dung quan trọng nội dung đưa gồm hạ tầng phần cứng phần mềm Hạ tầng phần cứng phần mềm bắt buộc, nhiên số đơn vị lựa chọn thuê phần trọn gói nhà cung cấp dịch vụ, nội dung xu hướng thư viện giới hay áp dụng tiết kiệm chi phí đầu tư ban đầu, vận hành quản trị Các phần mềm thường đóng gói, thư viện giới thiệu tính xem demo, vào sử dụng thực tế nảy sinh nhiều bất cập mà kỳ vọng ban đầu thư viện cho phần mềm lại không đáp ứng e) Nhân lực triển khai quản trị: Để triển khai xây dựng cần có đội ngũ nhân lực đào tạo để xử lý tài liệu, áp dụng vấn đề quyền, bảo mật, vận hành cung cấp dịch vụ sau hoàn thành sửa chữa cập nhật thông tin Những ưu điểm hạn chế thư viện số Ưu điểm: - Không hạn chế ranh giới vật lý: Người dùng tin truy cập đâu, cần thiết bị có kết nối Internet - Không hạn chế thời gian truy cập: Người dùng tin truy cập vào thời gian (24/7) - Nhiều truy cập lúc: Các tổ chức cá nhân truy cập lúc tới thư viện, tới đối tượng thông tin - Truy vấn thông tin: Người sử dụng sử dụng thuật ngữ để tìm kiếm khai thác thơng tin (từ, cụm từ, nhan đề, tác giả, chủ đề, ) toàn thư viện số kết hợp lệnh tìm với để tìm kiếm xác qua hỗ trợ giao diện phần mềm - Không gian bảo quản lưu trữ: Tài liệu số cho phép lưu trữ gọn nhẹ bảo quản lâu dài không cần nhiều không gian lưu trữ vật lý - Bổ sung thơng tin: Hình ảnh tài liệu số hóa làm rõ nhờ cơng nghệ chỉnh lý hình ảnh thêm bớt hướng dẫn, nhận xét dễ dàng Hạn chế:[3] - Người dùng phải cấp quyền truy cập thư viện yêu cầu Những vấn đề liên quan đến bảo quản số Các thỏa thuận liên quan đến vấn đề quyền tài liệu Nhiều sách truy cập cho đối tượng khác Làm để thiết kế giao diện tối ưu cho nhiều đối tượng người dùng Lựa chọn phần mềm phù hợp vấn đề khó khăn Tổ chức thông tin phù hợp Đào tạo, phát triển trì Một số thách thức lưu trữ - bảo quản tài liệu số Để bảo quản kho tài liệu số đa số phần mềm phát triển dựa mơ hình Hệ thống thông tin lưu trữ mở OAIS (Open Archival Information System) Các nghiên cứu rằng, mơ hình đảm bảo chức hệ thống bảo quản số là: Thu thập; Lưu trữ; Quản lý liệu; Quản trị; Bảo quản; Truy cập Mơ hình OAIS giúp hiểu rõ quy trình cơng việc cần thiết cho hệ thống lưu trữ số số thuật ngữ đề cập gói thơng tin đăng ký SIP (Submission Information Package), gói thơng tin lưu trữ AIP (Archival Information Package), gói thơng tin phổ biến DIP (Dissemination Information Package), Thách thức I: Xác định ý nghĩa việc xây dựng, bảo quản thư viện số để tổ chức, quy hoạch mạch lạc đối tượng số điều kiện số lượng phát triển nhanh chóng Xác định mục tiêu cuối lưu trữ, bảo quản toàn vẹn nội dung cho phép truy cập lâu dài theo thời gian Các vấn đề đặt là: Khôi phục thảm họa: Xác định rủi ro thiên tai, chủ quan người cách phục hồi tài liệu từ rủi ro, việc áp dụng cho không tài liệu số mà tài liệu giấy, vật lý Sao lưu liệu: Các tài liệu cần phải lưu thành nhiều phải đặt địa điểm vật lý khác Đảm bảo công cụ lưu trữ tốt: Các thiết bị lưu trữ khác có thời hạn sử dụng định có rủi ro định theo thời gian Khi xảy cố phá hủy liệu, tính tồn vẹn Trong nghiên cứu gần tập đoàn PrestoPRIME (một dự án tài trợ Liên minh châu Âu việc bảo quản nội dung nghe nhìn), 35 rủi ro lưu trữ tài liệu số ghi nhận Lên kế hoạch bảo quản: Thường xuyên lên kế hoạch bảo quản, chuyển đổi định dạng cần thiết để phù hợp với chương trình đọc dịch Một hiệp hội Dịch vụ kỹ thuật sưu tập thư viện (ALCTS) có định nghĩa bảo quản số, có ý là: “kết hợp sách, chiến lược hành động để đảm bảo truy cập nội dung, không phụ thuộc vào công nghệ thay đổi” Định nghĩa xác định việc bảo quản tài liệu số trình lâu dài, bền bỉ khó khăn phải đối diện với nhiều nguy Người ta xác định chủ đề bảo quản số là: - Thu thập: Thu thập tài liệu đưa vào hệ thống Lưu trữ: Đảm bảo toàn vẹn tài liệu (các files) Bảo quản: Tích cực phát rủi ro, lưu thường xun Thách thức II: Mơ hình liệu Làm để triển khai thực tế tốt Tạo mơ hình liệu để lưu trữ, bảo quản tài liệu số có nhiệm vụ thách thức: Hỗ trợ cấu trúc siêu liệu để bảo quản lâu dài Hỗ trợ nhiều định dạng liệu mơ hình Hỗ trợ nhiều tổ chức thư viện, bảo tàng, trung tâm lưu trữ Phù hợp với chuẩn quốc tế chuẩn mở Một hệ thống bảo quản liệu số việc lưu trữ số tất nhiên lưu trữ hệ thống mơ tả siêu liệu biên mục Thông thường hệ thống sử dụng chuẩn biên mục DublinCore Thách thức III: Cơ sở hạ tầng cơng nghệ Các đơn vị thường có sở hạ tầng (phần cứng, phần mềm), cho quản lý sưu tập số đơn giản phần mềm thư viện trước nảy sinh vấn đề: - Thứ nhất: Muốn tạm thời giữ lại chưa thay hồn tồn - Thứ hai: Hệ thống phải tích hợp với hệ thống cũ liệu cũ phải chuyển đổi Thách thức IV: Hệ thống phải đáp ứng cho phép can thiệp ứng dụng phát triển khác Một hệ thống bảo quản số xây dựng, lập trình mơi trường, cơng cụ lập trình cụ thể Những thách thức mà đối mặt hệ thống không bị độc quyền nhà cung cấp trước Một số trường hợp cần đến ứng dụng thứ để đáp ứng yêu cầu đơn vị mà không bị lệ thuộc vào phần mềm Kết luận Tóm lại để xây dựng thư viện số chuẩn, chia sẻ phục vụ thông tin dễ dàng, đáp ứng đa dạng đối tượng sử dụng, đảm bảo vấn đề quyền, vấn đề riêng thư viện bảo quản, lưu trữ số lâu dài, sử dụng tương lai khó khăn đòi hỏi khởi đầu phải chuyên nghiệp từ nhà tư vấn đến lãnh đạo đơn vị chun viên Ngồi kinh phí đầu tư hạ tầng ban đầu, phát triển tài nguyên thông tin, vận hành, trì vấn đề đặt cho thư viện Và cuối thách thức để xây dựng thư viện số, hệ thống lưu trữ bảo quản số tổng kết lại là: Xác định yêu cầu ban đầu; Xây dựng mơ hình liệu thích hợp; Xác định định dạng liệu; Tích hợp hệ thống với hạ tầng có; Đảm bảo an tồn lâu dài cho hệ thống liệu TÀI LIỆU THAM KHẢO Rane, M.Y., Digital libraries: A Practical approach 2015 2(1): p 142-150 Kiểm, C.M., Thư viện số: Định nghĩa vấn đề Tạp chí Thơng tin Tư liệu, 2000(Số 3): p 5-12 Mishra, R.K., Digital Libraries: Definitions, Issues and Challenger Innovare Journal of Education, 2016 4(3): p 1-3 ... Âu việc bảo quản nội dung nghe nhìn), 35 rủi ro lưu trữ tài liệu số ghi nhận Lên kế hoạch bảo quản: Thường xuyên lên kế hoạch bảo quản, chuyển đổi định dạng cần thiết để phù hợp với chương trình... Rane, M.Y., Digital libraries: A Practical approach 201 5 2(1): p 142-150 Kiểm, C.M., Thư viện số: Định nghĩa vấn đề Tạp chí Thơng tin Tư liệu, 200 0(Số 3): p 5-12 Mishra, R.K., Digital Libraries:... có kết nối Internet - Khơng hạn chế thời gian truy cập: Người dùng tin truy cập vào thời gian (24/ 7) - Nhiều truy cập lúc: Các tổ chức cá nhân truy cập lúc tới thư viện, tới đối tượng thông tin