Những vấn đề trong xây dựng một thư viện số; Phân tích những thách thức trong việc lưu trữ và bảo quản kho tài liệu số của các thư viện.. Do vậy trong các thư viện, nguồn tài liệu số cũn
Trang 1XÂY DỰNG THƯ VIỆN SỐ VÀ MỘT SỐ THÁCH THỨC TRONG LƯU TRỮ - BẢO QUẢN TÀI LIỆU SỐ
Lê Bá Lâm *
Tóm tắt: Thư viện số là gì? Các định nghĩa về thư viện số; Thư viện số, Thư viện ảo,
Thư viện điện tử, đều là thư viện số? Những vấn đề trong xây dựng một thư viện số; Phân tích những thách thức trong việc lưu trữ và bảo quản kho tài liệu số của các thư viện
Từ khóa: Thư viện số; Lưu trữ số; Bảo quản số
Mở đầu
Cuộc cách mạng về công nghệ thông tin đã làm thay đổi các thư viện từ truyền thống sang hiện đại Việc phát minh ra đĩa CD-ROM vào năm 1980 là một bước ngoặt trong số hóa thông tin và hơn 20 năm qua cùng với sự phát triển mạnh mẽ của Internet và công nghệ số đã dễ dàng cho phép con người tạo ra số lượng tài nguyên thông tin số vô cùng lớn mà trước đó chúng ta không thể tưởng tượng được Do vậy trong các thư viện, nguồn tài liệu số cũng tăng lên nhanh chóng từ tài liệu số (born-digital materials) và công tác số hóa (digitization) dẫn tới suy nghĩ cần phải xây dựng thư viện số, tổ chức lưu trữ, bảo quản để phục vụ tìm kiếm sử dụng lâu dài và thế là Thư viện số ra đời, phát triển cùng rất nhiều những thách thức đặt ra với các cơ quan thông tin – thư viện
Đối với một số người thì thư viện số chỉ đơn giản là tin học hóa thư viện truyền thống Nhưng trong thực tế thì để triển khai một hệ thống Thư viện số là phải có một hạ tầng công nghệ thông tin chuyên dụng cùng các khâu nghiệp vụ chuyên môn như thu thập, tổ chức, phân loại, xây dựng các bộ sưu tập, các vấn đề bản quyền, chính sách truy cập và các phương pháp tiếp cận cũng như bảo quản lâu dài để sử dụng được trong tương lai khi các ứng dụng đọc, xem tài liệu có thể thay đổi mà nguồn tài liệu không bị ảnh hưởng gì hay phục hồi các đối tượng số khi xảy ra nguy cơ, sự cố
Định nghĩa Thư viện số
Theo Larson định nghĩa “Thư viện số là thư viện ảo toàn cầu – hàng ngàn thư viện điện
tử nối mạng với nhau”[1] Thư viện số trình bày các bộ sưu tập tài liệu số và cho phép người dùng tin truy cập tại bất kỳ địa điểm và thời gian nào
Một nhóm làm việc trong cơ quan hạ tầng công nghệ thông tin của chính phủ Mỹ cho rằng “Thư viện số là một hệ thống cung cấp cho người dùng truy cập đến tri thức, thông tin trong các kho tài liệu số”
Liên đoàn thư viện số Mỹ thì định nghĩa “Thư viện số là một tổ chức cung cấp tài nguyên thông tin, bao gồm cả các nhân viên để hướng dẫn truy cập, tạo lập, phân phối, đảm bảo tính toàn vẹn và ổn định lâu dài theo thời gian của các bộ sưu tập số” [2]
Nói chung để định nghĩa thư viện số thì nó là một tập hợp các yếu tố: Các bộ sưu tập số của các đối tượng thông tin; các dịch vụ hỗ trợ sử dụng; tổ chức và bảo quản các tài liệu
* Phó Giám đốc, Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
Trang 2số Mục tiêu chính là cải thiện tiếp cận tài liệu nhanh chóng, nhiều người cùng lúc, tiết kiệm chi phí, bảo quản tài liệu lâu dài với sự hỗ trợ của công nghệ thông tin
Xây dựng thư viện số
Một trong những vấn đề lớn nhất trong xây dựng thư viện số là xây dựng các bộ sưu tập
số Mô hình của nó chính là một hệ thống liên kết giữa hệ thống mạng, phần cứng, phần mềm Phần cứng ở đây là hệ thống mạng, máy chủ, bộ lưu trữ, máy tính, máy quét; Phần mềm sẽ giúp tổ chức các bộ sưu tập, hiển thị, trình bày nội dung cùng với các phần mềm
số hóa để chụp tài liệu, chỉnh sửa hình ảnh, nhận dạng kí tự,
Một số điểm quan trọng khi xây dựng một thư viện số như sau:
a) Bộ sưu tập số: Để có tài liệu số xây dựng thành các bộ sưu tập, thông thường lấy
từ 3 nguồn là bản thân tài liệu xuất bản số; tài liệu số hóa từ bản cứng và tài liệu số thư viện sưu tập được
b) Truy cập ra bên ngoài thông qua các hợp đồng, thỏa thuận với các nhà xuất bản sách điện tử, tạp chí điện tử, cơ sở dữ liệu như Elsevier, Springer, hoặc các đối tác hoặc đến các trang web
c) Lựa chọn tài liệu để số hóa: Lựa chọn tài liệu để số hóa cũng là một vấn đề quan trọng trong công tác số hóa tài liệu Thông thường tài liệu nội sinh sẽ được tính đến vì nhiều vấn đề liên quan như khẳng định giá trị học thuật của đơn vị, vấn đề bản quyền, Các đơn vị thường đưa ra 5 tiêu chí và xếp theo thứ tự ưu tiên Tài liệu được chọn phải thỏa mãn 3 tiêu chí hoặc ít nhất là 2 tiêu chí đầu
+ Tiêu chí 1 – Truy cập Là tài liệu được sử dụng nhiều hoặc tài liệu có giá trị như giá trị chính trị, giá trị nghiên cứu giảng dạy, giá trị tài chính và giá trị văn hóa xã hội hay truyền thống Những tài liệu đơn bản hoặc hiếm cũng được xếp trong tiêu chí này
+ Tiêu chí 2 – Bảo quản Là những tài liệu dễ hỏng, dễ phân hủy, khó bảo quản + Tiêu chí 3 – Cộng đồng Là những tài liệu phục vụ cho các sự kiện, các chương trình nghiên cứu trọng điểm hay các triển lãm và xây dựng thương hiệu ĐHQGHN
+ Tiêu chí 4 – Tài liệu có tiềm năng phát triển Là những tài liệu có kinh phí từ dự
án, tương lai được đầu tư, bổ sung hoặc số hóa theo yêu cầu của lãnh đạo hay nhà tài trợ
+ Tiêu chí 5 – Cam kết của thư viện Thư viện có thể có một cam kết từ trước khi
số hóa một bộ sưu tập cụ thể
d) Hạ tầng công nghệ thông tin: Đây là một trong những nội dung quan trọng trong các nội dung đưa ra gồm hạ tầng phần cứng và phần mềm Hạ tầng phần cứng và phần mềm là bắt buộc, tuy nhiên một số đơn vị có thể lựa chọn thuê một phần hoặc trọn gói bởi các nhà cung cấp dịch vụ, nội dung này là xu hướng các thư viện trên thế giới hay áp dụng sẽ tiết kiệm chi phí đầu tư ban đầu, cũng như vận hành và quản trị Các phần mềm thường đã đóng gói, thư viện chỉ được giới thiệu các tính năng và xem demo, khi đi vào
sử dụng thực tế mới nảy sinh nhiều bất cập mà những kỳ vọng ban đầu của thư viện cho phần mềm lại không đáp ứng được
e) Nhân lực triển khai và quản trị: Để triển khai xây dựng cần có một đội ngũ nhân lực được đào tạo bài bản để xử lý tài liệu, áp dụng các vấn đề bản quyền, bảo mật, vận hành và cung cấp dịch vụ sau khi hoàn thành cũng như sửa chữa cập nhật thông tin
Trang 3Những ưu điểm và hạn chế của thư viện số
Ưu điểm:
- Không hạn chế bởi ranh giới vật lý: Người dùng tin có thể truy cập ở bất cứ đâu, chỉ cần thiết bị có kết nối Internet
- Không hạn chế thời gian truy cập: Người dùng tin có thể truy cập vào bất kỳ thời gian nào (24/7)
- Nhiều truy cập cùng lúc: Các tổ chức và cá nhân có thể truy cập cùng lúc tới thư viện, tới cùng một đối tượng thông tin
- Truy vấn thông tin: Người sử dụng có thể sử dụng thuật ngữ bất kỳ để tìm kiếm và khai thác thông tin (từ, cụm từ, nhan đề, tác giả, chủ đề, ) trong toàn bộ thư viện số và
có thể kết hợp các lệnh tìm với nhau để tìm kiếm chính xác qua sự hỗ trợ của giao diện phần mềm
- Không gian bảo quản và lưu trữ: Tài liệu số cho phép lưu trữ gọn nhẹ và bảo quản lâu dài và không cần nhiều không gian như lưu trữ vật lý
- Bổ sung thông tin: Hình ảnh tài liệu số hóa có thể được làm rõ hơn nhờ công nghệ chỉnh lý hình ảnh hoặc thêm bớt các hướng dẫn, nhận xét dễ dàng
Hạn chế:[3]
- Người dùng phải được cấp quyền truy cập nếu thư viện yêu cầu
- Những vấn đề liên quan đến bảo quản số
- Các thỏa thuận liên quan đến vấn đề bản quyền tài liệu
- Nhiều chính sách truy cập cho các đối tượng khác nhau
- Làm sao để thiết kế giao diện tối ưu cho nhiều đối tượng người dùng
- Lựa chọn được phần mềm phù hợp là vấn đề rất khó khăn
- Tổ chức thông tin phù hợp
- Đào tạo, phát triển và duy trì
Một số thách thức trong lưu trữ - bảo quản tài liệu số
Để bảo quản một kho tài liệu số thì hiện nay đa số các phần mềm được phát triển dựa trên mô hình Hệ thống thông tin lưu trữ mở OAIS (Open Archival Information System) Các nghiên cứu chỉ ra rằng, mô hình này đảm bảo 6 chức năng của một hệ thống bảo quản số là: Thu thập; Lưu trữ; Quản lý dữ liệu; Quản trị; Bảo quản; Truy cập Mô hình OAIS giúp hiểu rõ hơn các quy trình công việc cần thiết cho hệ thống lưu trữ số cũng như một số thuật ngữ đã đề cập như gói thông tin đăng ký SIP (Submission Information Package), gói thông tin lưu trữ AIP (Archival Information Package), gói thông tin phổ biến DIP (Dissemination Information Package),
Thách thức I: Xác định ý nghĩa của việc xây dựng, bảo quản thư viện số và làm sao
để tổ chức, quy hoạch mạch lạc đối với các đối tượng số trong điều kiện số lượng phát triển nhanh chóng
Xác định mục tiêu cuối cùng là lưu trữ, bảo quản toàn vẹn về nội dung và cho phép truy cập lâu dài theo thời gian Các vấn đề đặt ra ở đây là:
Trang 4Khôi phục thảm họa: Xác định các rủi ro thiên tai, chủ quan của con người và
cách phục hồi tài liệu từ những rủi ro, việc này áp dụng cho không chỉ các tài liệu số mà cũng như tài liệu giấy, vật lý
Sao lưu dữ liệu: Các tài liệu cần phải được sao lưu thành nhiều bản và phải đặt ở
các địa điểm vật lý khác nhau
Đảm bảo các công cụ lưu trữ luôn tốt: Các thiết bị lưu trữ khác nhau đều có thời
hạn sử dụng nhất định và đều có những rủi ro nhất định theo thời gian Khi xảy ra sự cố đều có thể phá hủy dữ liệu, mất tính toàn vẹn Trong một nghiên cứu gần đây của tập đoàn PrestoPRIME (một dự án được tài trợ bởi Liên minh châu Âu về việc bảo quản nội dung nghe nhìn), hơn 35 rủi ro về lưu trữ tài liệu số đã được ghi nhận
Lên kế hoạch bảo quản: Thường xuyên lên kế hoạch bảo quản, chuyển đổi định
dạng khi cần thiết để phù hợp với các chương trình đọc dịch mới
Một hiệp hội về Dịch vụ kỹ thuật và các bộ sưu tập thư viện (ALCTS) có định nghĩa về bảo quản số, trong đó có một ý là: “kết hợp các chính sách, chiến lược và hành động để đảm bảo luôn truy cập được nội dung, không phụ thuộc vào công nghệ thay đổi” Định nghĩa này xác định việc bảo quản tài liệu số là một quá trình lâu dài, bền bỉ và khó khăn khi phải đối diện với nhiều nguy cơ
Người ta xác định 3 chủ đề chính trong bảo quản số là:
- Thu thập: Thu thập tài liệu và đưa vào hệ thống
- Lưu trữ: Đảm bảo sự toàn vẹn của tài liệu (các files)
- Bảo quản: Tích cực phát hiện rủi ro, sao lưu thường xuyên
Thách thức II: Mô hình dữ liệu Làm sao để triển khai thực tế tốt nhất
Tạo một mô hình dữ liệu để lưu trữ, bảo quản tài liệu số có các nhiệm vụ và thách thức:
Hỗ trợ cấu trúc và siêu dữ liệu để bảo quản lâu dài
Hỗ trợ nhiều định dạng và dữ liệu trong cùng một mô hình
Hỗ trợ được nhiều tổ chức như thư viện, bảo tàng, trung tâm lưu trữ
Phù hợp với các chuẩn quốc tế và chuẩn mở
Một hệ thống bảo quản dữ liệu số ngoài việc lưu trữ số tất nhiên còn lưu trữ hệ thống mô
tả siêu dữ liệu biên mục Thông thường các hệ thống này sử dụng chuẩn biên mục DublinCore
Thách thức III: Cơ sở hạ tầng và công nghệ
Các đơn vị thường đã có một cơ sở hạ tầng (phần cứng, phần mềm), có thể là cho quản lý các bộ sưu tập số đơn giản hoặc các phần mềm thư viện trước đó và khi đó nảy sinh 2 vấn đề:
- Thứ nhất: Muốn tạm thời giữ lại và chưa thay thế hoàn toàn
- Thứ hai: Hệ thống phải tích hợp được với hệ thống cũ và dữ liệu cũ phải được chuyển đổi
Thách thức IV: Hệ thống phải đáp ứng hoặc cho phép can thiệp bởi các ứng dụng phát triển khác
Trang 5Một hệ thống bảo quản số được xây dựng, lập trình trong một môi trường, công cụ lập trình cụ thể Những thách thức mà chúng ta đối mặt là hệ thống không bị độc quyền bởi nhà cung cấp trước Một số trường hợp chúng ta cần đến ứng dụng thứ 3 để có thể đáp ứng được yêu cầu mới của đơn vị mà không bị lệ thuộc vào phần mềm
Kết luận
Tóm lại để xây dựng được một thư viện số đúng chuẩn, chia sẻ và phục vụ thông tin dễ dàng, đáp ứng được đa dạng đối tượng sử dụng, đảm bảo vấn đề bản quyền, những vấn
đề riêng của thư viện đó và bảo quản, lưu trữ số được lâu dài, sử dụng được trong tương lai là hết sức khó khăn đòi hỏi sự khởi đầu phải hết sức chuyên nghiệp từ nhà tư vấn đến lãnh đạo đơn vị và các chuyên viên Ngoài ra kinh phí đầu tư hạ tầng ban đầu, phát triển tài nguyên thông tin, vận hành, duy trì là những vấn đề đặt ra cho các thư viện Và cuối cùng những thách thức chính để xây dựng một thư viện số, hệ thống lưu trữ và bảo quản
số có thể tổng kết lại là: Xác định yêu cầu ban đầu; Xây dựng mô hình dữ liệu thích hợp; Xác định các định dạng dữ liệu; Tích hợp hệ thống với hạ tầng hiện có; Đảm bảo an toàn
và lâu dài cho hệ thống dữ liệu
TÀI LIỆU THAM KHẢO
1 Rane, M.Y., Digital libraries: A Practical approach 2015 2(1): p 142-150
2 Kiểm, C.M., Thư viện số: Định nghĩa và vấn đề Tạp chí Thông tin và Tư liệu,
2000(Số 3): p 5-12
3 Mishra, R.K., Digital Libraries: Definitions, Issues and Challenger Innovare
Journal of Education, 2016 4(3): p 1-3