1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bảo quản số trong các thư viện và cơ quan lưu trữ

10 6 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Bài viết giới thiệu về bảo quản số- vấn đề đang được quan tâm trong các thư viện và cơ quan lưu trữ; phân tích, minh họa mô hình Hệ thống thông tin lưu trữ mở (The Open Archival Information System- OAIS) và các yếu tố Quản lý - Công nghệ - Nội dung để xây dựng thành công một dự án bảo quản số, đồng thời nêu những thách thức và chiến lược trong bảo quản số.

NGHIÊN CỨU - TRAO ĐỔI BẢO QUẢN SỐ TRONG CÁC THƯ VIỆN VÀ CƠ QUAN LƯU TRỮ ThS Lê Bá Lâm Trung tâm Thư viện Tri thức số, ĐHQG Hà Nội Tóm tắt: Bài báo giới thiệu bảo quản số- vấn đề quan tâm thư viện quan lưu trữ; phân tích, minh họa mơ hình Hệ thống thơng tin lưu trữ mở (The Open Archival Information System- OAIS) yếu tố Quản lý - Công nghệ - Nội dung để xây dựng thành công dự án bảo quản số, đồng thời nêu thách thức chiến lược bảo quản số Từ khóa: Bảo quản số; đối tượng số; sưu tập số; thư viện số; lưu trữ số; mơ hình OAIS DIGITAL PRESERVATION IN LIBRARIES AND ARCHIVING AGENCIES Abstract: This article introduces digital preservation is the issue which is concerned in libraries and archives; Analysis, illustration The Open Archival Information System (OAIS) models and elements about Management-Technology-Content for successfully built a digital preservation project and finish article presents challenges and strategies in digital preservation Keywords: Digital preservation; digital objects; digital collections; digital Library; digital archives; OAIS models GIỚI THIỆU Bảo quản, lưu trữ số (sau gọi tắt Bảo quản số) lĩnh vực, chủ đề không nghiên cứu thực tiễn thư viện quan lưu trữ, gần đây, vấn đề nhà nghiên cứu đặc biệt quan tâm nhiều kết nghiên cứu đưa nhằm giúp dự án bảo quản số thực tế đạt hiệu cao Bảo quản số tập trung vào chiến lược, sách, cơng nghệ liệu nhằm đảm bảo đối tượng sưu tập số ln sẵn sàng cho việc tìm kiếm, truy cập sử dụng tương lai Bảo quản số đảm bảo an ninh, an toàn cho tài liệu sinh định dạng số tài liệu dạng truyền thống chuyển đổi số thông qua q trình số hóa Theo Thư viện Quốc hội Mỹ, bảo quản số “các hoạt động quản lý nội dung số giúp đảm bảo, khả truy cập liên tục vào đối tượng số” [Library of Congress, 2013] Corrado & Moulaison (2014) cho rằng, bảo quản số vấn đề phức tạp kỹ thuật, xã hội, kinh tế tổ chức Tính phức tạp thư viện bắt nguồn từ thực tế đan xen vào q trình tạo, sử 12 THÔNG TIN VÀ TƯ LIỆU - 2/2022 dụng trì sưu tập tài liệu số Tính bền vững tài liệu số phụ thuộc vào việc quản lý, phòng rủi ro bảo quản, sách tổ chức, cam kết thể chế sở hạ tầng kỹ thuật Tại Hội thảo Annual Conference, Washington, D.C., June 24, 2007, American Library Association’s (2007) đưa định nghĩa: Bảo quản số kết hợp sách, chiến lược hành động để đảm bảo tính chân thực, xác nội dung thông tin qua thời gian, bất chấp thay đổi, lỗi thời công nghệ Bảo quản số áp dụng chung cho tài liệu số nguyên gốc (born digital materials) tài liệu số hóa (digitalized materials) kết q trình số hóa Như thấy rằng, phát biểu, nhận định định nghĩa đưa khẳng định bảo quản số loạt hoạt động từ quản lý đến công nghệ triển khai xây dựng nội dung số cho sưu tập số, giúp cho việc truy cập vào đối tượng số thường xuyên, liên tục lâu dài cho dù công nghệ phát triển, thay đổi hàng ngày, hàng làm cho thứ trở nên nhanh chóng bị lỗi thời NGHIÊN CỨU - TRAO ĐỔI SỰ NHANH CHÓNG LỖI THỜI CỦA CƠNG NGHỆ Tài liệu giấy, tác phẩm nghệ thuật cho phép người dùng tin đọc, sử dụng thông tin nhiều năm, nhiều kỷ chí thiên niên kỷ Với mục tiêu chuyển định dạng số để lưu giữ, bảo quản lâu dài chưa hẳn tác phẩm, cơng trình n tâm sử dụng mãi khơng có quan tâm công tác bảo quản số tốc độ thay đổi cơng nghệ nhanh chóng, tài liệu không truy cập sau vài năm tạo Khi thông tin tạo kỹ thuật số công nghệ phát triển, định dạng cũ trở nên lỗi thời, nội dung tài liệu khơng truy cập sử dụng phần mềm, ứng dụng hỏng hóc lưu trữ Hình Các thiết bị lưu trữ thơng tin theo thời gian (Nguồn: https://slidetodoc.com/digital-asset-management-systems-and-digitalpreservation-euan/) Ví dụ, Việt Nam, người viết cơng trình khoa học vào đầu năm 1990 phần mềm Bked, VietStar, ứng dụng xử lý văn phổ biến thời kỳ Họ lưu trữ cơng trình đĩa mềm muốn tham khảo lại khơng cịn ổ đĩa để đọc Và tại, giả sử cịn ổ đĩa phần cứng để lấy file tài liệu file tình trạng truy xuất điều khơng đảm bảo chắn file tài liệu mở đọc bình thường khơng cịn sử dụng phần mềm tạo file Tại thời điểm này, định dạng phổ biến cho lưu trữ PDF, PDF/A tiêu chuẩn quốc tế (ISO) ISO 19005-1 thiết kế cho lưu trữ lâu dài, tài liệu dạng văn số hóa thường lưu định dạng 30-40 năm liệu tình trạng khơng đọc định dạng PDF có xảy với file Bked, VietStar nêu trên? CÁC YẾU TỐ CHÍNH TRONG BẢO QUẢN SỐ Để bắt đầu dự án chương trình đó, có khó khăn, đâu, bước kết thúc nào, đặc biệt vấn đề phải lựa chọn công nghệ phù hợp dự án bảo quản số tổ chức Tuy nhiên, thách thức bảo quản số vấn đề vượt qua có tâm ủng hộ tuyệt đối từ nhà quản lý người triển khai trực tiếp Các tài liệu in ấn, thảo vật tồn nhiều năm mà khơng bị hỏng hóc đáng kể, tốn thêm nhiều chi phí để bảo quản, đối tượng số không hẳn Các đối tượng số nằm sưu tập, kho lưu trữ mà khơng bảo quản, chăm sóc thường xun yếu tố cơng nghệ lạc hậu, hỏng hóc phận lưu trữ, phần cứng phần mềm khác,… THÔNG TIN VÀ TƯ LIỆU - 2/2022 13 NGHIÊN CỨU - TRAO ĐỔI Các nhà nghiên cứu bảo quản số đưa nhiều quan điểm khác tựu chung thống yếu tố chính, định bảo quản số coi ghế ba chân, là: Quản lý, Cơng nghệ Nội dung Hình Các yếu tố định bảo quản tri thức số [Kenney & McGovern, 2003] Quan điểm thống yếu tố: Quản lý, Công nghệ Nội dung chân ghế cho thấy tầm quan trọng yếu tố Các yếu tố phụ thuộc lẫn nhau, có mối quan hệ mật thiết với tách rời 2.1 Yếu tố quản lý Vấn đề bảo quản số đề cập, Quản lý Các khía cạnh quản lý bao gồm lập kế hoạch, chuẩn bị nguồn lực tài chính, nhân sự, lựa chọn công nghệ chuẩn bị nội dung vấn đề sách hay giám sát triển khai,… 2.1.1 Lập kế hoạch thiết lập sách Kế hoạch sách văn thức có tính pháp lý tổ chức phê duyệt trước đưa vào triển khai dự án bảo quản tri thức số Văn sở quan trọng để thực bước, cơng việc theo nội dung vạch Những phịng ban, cá nhân giao nhiệm vụ vào kế hoạch để làm việc với nhóm, bên liên quan theo lộ trình kế hoạch để đến đích Các sách lựa chọn nội dung, phân quyền truy cập sử dụng cho đối tượng hay tổ chức, trách nhiệm cán người dùng tin, hướng dẫn,… Một kế hoạch mẫu cho bảo quản số bao gồm hạng mục Christoph Becker cộng đưa [Becker & cộng sự, 2009]: 14 THÔNG TIN VÀ TƯ LIỆU - 2/2022 Nhận diện kế hoạch, tạo điều kiện thuận lợi cho người tiếp cận Các nguyên tắc xây dựng Bối cảnh xây dựng Mô tả sưu tập đối tượng số Các yêu cầu việc bảo quản tri thức số Các kinh nghiệm minh chứng Tài Vai trò trách nhiệm cá nhân Kế hoạch triển khai Mặc dù tất chương trình, kế hoạch bảo quản số phải đảm bảo hay tuân thủ nội dung trên, với mức độ chi tiết đó, cung cấp cho nhà quản lý xây dựng kế hoạch bảo quản số đầy đủ, chu đáo hỗ trợ việc định đắn Becker cộng xác định năm vấn đề tác động đến việc lập kế hoạch mới, là: (1) Nhu cầu xây dựng sưu tập mới, (2) Thay đổi sưu tập, (3) Thay đổi môi trường lưu trữ bảo quản, (4) Thay đổi mục tiêu (5) Đánh giá định kỳ [Becker & cộng sự, 2009] Trong vấn đề đánh giá định kỳ vấn đề cần thiết quan trọng Nó đánh giá hiệu sử dụng, cơng nghệ đầu tư có cịn ổn định cho phép trì, mức độ phát triển đối tượng số sưu tập,… Các vấn đề ảnh hưởng lớn đến việc định nhà quản lý có tiếp tục trì, cho tồn hay đầu tư nguồn lực để tiếp tục phát triển Nếu khơng có đánh giá định kỳ nhà quản lý nắm vận hành hiệu đầu tư cho dự án, không nắm tình trạng vấn đề 2.1.2 Quyết sách công nghệ Những sách công nghệ quan tâm để đảm bảo cho hệ thống bảo quản lâu dài, nâng cao tính sẵn sàng phục vụ người dùng, đặc biệt bối cảnh công nghệ phần cứng, phần mềm thay đổi nhanh chóng 2.1.3 Câu hỏi quyền Khi xây dựng kế hoạch, vấn đề đặc biệt quan trọng cần lưu ý, vấn đề quyền tài liệu Nó dạng tài sản thuộc sở hữu trí tuệ Thường tài liệu văn hình ảnh nội dung có quyền Tài liệu sinh NGHIÊN CỨU - TRAO ĐỔI từ đầu định dạng số (Born Digital) hay từ cơng tác số hóa (Digitization) phải giải vấn đề quyền Có thể quyền tác giả hay tác giả nhượng quyền cho nhà xuất Một vấn đề hiểu, phiên số hóa tài sản trí tuệ khác với loại tài sản khác chúng chia sẻ mà gốc cịn ngun vẹn 2.1.4 Các nguồn lực Đó vấn đề nguồn nhân lực, nguồn tài chính,… Nguồn nhân lực cần có trình độ, kỹ cần thiết để vận hành hệ thống bảo quản số đòi hỏi nhiều cấp độ đa dạng chuyên môn Đầu tiên đội ngũ công nghệ thông tin (IT) để vận hành hệ thống, tiếp đến cán chuyên môn thư viện để mô tả, biên mục, tổ chức xây dựng sưu tập Các đối tượng số bảo quản tốt mà khơng tổ chức tốt, khơng có mơ tả siêu liệu hạn chế tìm kiếm, truy xuất thơng tin để sử dụng 2.1.5 Khả tiếp cận tính bền vững Cùng với yếu tố khả tiếp cận cộng đồng tính bền vững cần tính tới quản lý Một dự án bảo quản tri thức số có hiệu hay khơng phải nhiều người biết đến nhiều người sử dụng tốt (trừ dự án liên quan đến an ninh hay quốc phịng) Làm tốt vấn đề này, ngồi việc mang lại danh tiếng cho tổ chức, thể trách nhiệm quốc gia, cịn mang lại nguồn lực tài chính, giúp trì hệ thống bền vững, mở rộng kho lưu trữ, nâng cấp hạ tầng công nghệ bổ sung đối tượng số có giá trị vào sưu tập từ tài nguyên cộng đồng đóng góp,… 2.2 Yếu tố cơng nghệ Bảo quản số phụ thuộc tất vào công nghệ, nhiên khơng thể thực mà khơng có hạ tầng công nghệ phần cứng, phần mềm, lưu trữ, đường truyền, hệ thống mạng hay vấn đề liên quan đến bảo mật,… The Open Archival Information System (OAIS - Hệ thống thông tin lưu trữ mở) mơ hình đại, tin cậy xem tiêu chuẩn cho kho bảo quản số Mơ hình OAIS mô tả cách bảo quản đối tượng số từ thu thập đến đăng tải, quản lý, xử lý phục vụ người dùng OAIS áp dụng cho nhiều trường hợp bảo quản số khác nhau, nên khơng bắt buộc tổ chức có dự án phải tn thủ nghiêm ngặt quy trình mơ hình mà mềm dẻo để áp dụng sử dụng Mơ hình OAIS tiêu chuẩn quốc tế (ISO), tiêu chuẩn ISO 14721 OAIS phát triển CCSDS (Consultative Committee for Space Data Systems) vào ngày 04/4/1994 SIP (Submission Information Package) gói thơng tin đưa vào, SIP chứa đối tượng số siêu liệu; AIP (Archival Information Package) gói lưu trữ thơng tin; PDI (Preservation Description Information) thông tin mô tả đối tượng bảo quản Nhìn vào Hình nhận thấy chức tác động lẫn OAIS là: (1) Đầu vào (Ingest), (2) Kho lưu trữ (Archival storage), (3) Quản lý liệu (Data management), (4) Quản trị (Administration), (5) Kế hoạch bảo quản (Preservation Planning) (6) Truy cập (Access) Hình Mơ hình Hệ thống thông tin lưu trữ mở OAIS [CCSDS, 2012] THÔNG TIN VÀ TƯ LIỆU - 2/2022 15 NGHIÊN CỨU - TRAO ĐỔI Bảng Các chức mơ hình OAIS [Corrado & Moulaison, 2014] Chức Đầu vào Diễn giải Chức đầu vào cung cấp dịch vụ chức cho phép đưa đối tượng kỹ thuật số vào hệ thống Nó chấp nhận gói thơng tin SIP Một gói thơng tin SIP thường bao gồm thông tin nội dung thông tin mô tả (PDI) Kho lưu trữ Chức kho lưu trữ cung cấp dịch vụ chức liên quan đến lưu trữ, bảo trì truy xuất gói thơng tin lưu trữ (AIPs) Kho lưu trữ giúp đặt AIPs trạng thái lưu trữ vĩnh viễn, khôi phục thảm họa, kiểm tra lỗi cung cấp AIPs cho thực thể truy cập Quản lý liệu Chức quản lý liệu cung cấp dịch vụ liên quan đến trì, truy cập quản trị siêu liệu Các chức bao gồm trì sơ đồ chế độ xem, thực cập nhật sở liệu thực truy vấn tạo báo cáo dựa truy vấn quản lý liệu Quản trị Chức quản trị cung cấp dịch vụ chức hỗ trợ hoạt động tổng thể hệ thống Các chức quản trị bao gồm việc xem xét, kiểm tra đầu vào để đảm bảo chúng đáp ứng yêu cầu kho lưu trữ, tiêu chuẩn trì quản lý cấu hình phần cứng phần mềm hệ thống Kế hoạch bảo quản Chức lập kế hoạch bảo quản cung cấp dịch vụ chức giám sát môi trường hoạt động hệ thống OAIS, cung cấp khuyến cáo để đảm bảo thông tin lưu trữ OAIS truy cập dài hạn, hệ thống công nghệ ban đầu trở nên lỗi thời Các chức bao gồm đề xuất thông tin lưu trữ, cập nhật, di chuyển, báo cáo phân tích rủi ro giám sát thay đổi công nghệ thay đổi yêu cầu dịch vụ Truy cập Chức truy cập cung cấp dịch vụ chức hỗ trợ người dùng cuối Người sử dụng thông tin, bao gồm khả xác định tồn tại, mô tả, vị trí tính khả dụng thơng tin lưu trữ OAIS, cho phép người sử dụng yêu cầu nhận sản phẩm thông tin đưa phản hồi cho người dùng Khi dự án bảo quản số xác định chun gia thẩm định mơ hình cơng nghệ, khả vận hành đảm bảo tính trì ổn định, nghĩa thiết kế cho phép nội dung khơng thay đổi (sự tồn vẹn đối tượng số) thuận lợi cho việc truy cập (các hệ thống truy xuất thông tin) Một hệ thống thiết kế hợp lý để bảo quản tri thức số cần giải số vấn đề [Gorman & Dorne, 2009]: Sự toàn vẹn đối tượng số; Đảm bảo nội dung truy cập phù hợp với công nghệ; Truy xuất thông tin; Siêu liệu phục vụ cho truy cập bảo quản số; Hệ thống lưu trữ; Sự chuyển đổi hệ phần cứng phần mềm để đảm bảo khả truy cập liên tục Các vấn đề công nghệ nêu đặt ra, xem xét cẩn trọng giải tốt dự án bảo quản tri thức số chắn đạt kết tốt mang lại hiệu phục vụ to lớn 16 THÔNG TIN VÀ TƯ LIỆU - 2/2022 2.2.1 Lựa chọn phần mềm Phần mềm ứng dụng thiết kế để quản trị bảo quản số Những đơn vị có tiềm lực cơng nghệ nhân lực thiết kế riêng cho hệ thống bảo quản, số khác lựa chọn sản phẩm phần mềm thương mại mã nguồn mở Hiện nay, có nhiều phần mềm thương mại dành cho bảo quản số phát triển mạnh mẽ công ty hoạt động lĩnh vực thư viện số như: Ex Libris (Rosetta), OCLC (Content DM), Tinh Vân (Bookworm), Hiện đại (Kipos),… Một số sản phẩm bảo quản, lưu trữ số cịn phát triển cơng ty chuyên sản suất thiết bị số hóa giải pháp Nainuwa Treventus Các sản phẩm nguồn mở DAITSS (Dark Archive in the Sunshine State) ứng dụng mã nguồn mở phát triển Trung tâm tự động hóa thư viện Florida (FCLA) với tài trợ Viện Bảo tàng Dịch vụ NGHIÊN CỨU - TRAO ĐỔI thư viện (IMLS) hay Archivematica (https:// ww.archivematica.org/en/) hệ thống mã nguồn mở thiết kế để bảo quản số với tiêu chuẩn Không giống số hệ thống bảo quản tri thức số khác có giao diện cho người sử dụng, Rosetta (http://www exlibrisgroup.com/category/RosettaOverview) không bao gồm giao diện tìm kiếm cho người dùng cuối, thay vào đó, sử dụng giao thức mở (OAI-PMH) ứng dụng khám phá (Discovery) thu thập siêu liệu trình bày Tinh Vân Hiện đại công ty nước phát triển tính bảo quản phục vụ tài liệu số tích hợp với sản phẩm quản trị thư viện truyền thống Ứng dụng Bookworm Tinh Vân mở rộng sử dụng mượn/đọc sách điện tử thiết bị di động nhằm mang lại tiện ích cho người sử dụng phần đảm bảo tính bảo mật cho tài liệu số Ứng dụng Kipos công ty Hiện đại tách liệu số trang áp dụng tiêu chuẩn truyền mã hóa siêu liệu METS Các phần mềm, ứng dụng mã nguồn mở khác cho bảo quản tri thức số kể đến Greenstone (https://www.greenstone org), CDS-Invenio (https://inveniosoftware org), Dspace (http://www.dspace.org/), Eprints (http:// www.eprints.org/), Fedora (http:// fedorarepository.org/) MyCore (https://www mycore.com) Việc xây dựng quản lý kho lưu trữ tổ chức đòi hỏi đầu tư đáng kể nguồn lực tài cho hạ tầng công nghệ, nhân chuyên môn, đó, số tổ chức định giảm chi phí cách tham gia vào chương trình hợp tác thuê (sử dụng dịch vụ phần mềm) cho dự án họ HathiTrust (http://www.hathitrust.org/) công bố vào năm 2008, sáng kiến hợp tác thư viện nghiên cứu để bảo quản tài liệu số văn hóa Mục tiêu ban đầu cung cấp tảng cho bảo quản, lưu trữ khối lượng lớn tài liệu số hóa dự án Google Book Open Content Alliance (OCA) Christenson (2011) nhận định “trái tim HathiTrust kho lưu trữ số dùng chung vận hành hợp tác thư viện nghiên cứu” Hiện có 60 thành viên HathiTrust thuộc tổ chức tồn giới MetaArchive (http://www.metaarchive.org/) cơng bố vào năm 2003 kho lưu trữ số cộng đồng MetaArchive “mạng lưu trữ kỹ thuật số phân tán cộng đồng sở hữu điều hành cộng đồng” [Walters & Skinner, 2010] Các thành viên MetaArchive đóng phí thành viên, có đơn vị cử nhân viên góp trang thiết bị MetaArchive phát triển Đại học Stanford, có 50 thành viên đến từ 13 bang quốc gia Dịch vụ lưu trữ trực tuyến (hosting) phát triển, dự án tham gia phải đóng phí trì dịch vụ Chi phí tính thường dựa vào số lượng đối tượng số và/hoặc dung lượng tính terabyte sưu tập Sử dụng dịch vụ này, tổ chức lo vấn đề hạ tầng công nghệ quản trị, lưu kho lưu trữ Các tổ chức chuẩn bị đối tượng số, chăm sóc người dùng phát triển sưu tập OCLC DigitalArchive, DuraCloud dịch vụ đánh giá cao tin cậy OCLC DigitalArchive (http://www.oclc.org/ digital-archive.en.html) giải pháp lưu trữ dành cho dự án muốn sử dụng dịch vụ trực tuyến Phần mềm CONTENTdm phần mềm mà OCLC sử dụng cho giải pháp DuraCloud (http://www.duracloud.org/) dịch vụ lưu trữ trực tuyến, cung cấp DuraSpace, tổ chức phi lợi nhuận thành lập vào năm 2009 DSpace Foundation Fedora Commons DuraCloud sử dụng phần mềm mã nguồn mở Dspace để triển khai dịch vụ Ngoài dịch vụ lưu trữ đối tượng số trên, DuraCloud cung cấp dịch vụ khác truy cập, chuyển đổi chia sẻ liệu 2.2.2 Lựa chọn phần cứng Cấu hình, số lượng, chủng loại máy chủ, lưu trữ thành phần khác hệ thống phụ thuộc vào kích thước sưu tập tính tốn phát triển tương lai Nhiều hệ thống bảo quản tri thức số có hệ điều hành dựa GNU/Linux- UNIX Windows Server phần cứng cần phải tương thích với yêu cầu hệ điều hành Một yếu tố quan trọng hệ thống hạ tầng cơng nghệ vận hành phải quan tâm đến hệ thống lưu Những dự án lớn có hệ thống lưu, phục hồi đặt địa THÔNG TIN VÀ TƯ LIỆU - 2/2022 17 NGHIÊN CỨU - TRAO ĐỔI điểm khác, khoảng cách đủ để bảo đảm thiên tai, hỏa hoạn xảy địa điểm khơng thể tác động đến Việc tính tốn dung lượng hệ thống lưu trữ phụ thuộc vào định để đối tượng số hay định dạng đối tượng số định đến dung lượng kho chứa Ví dụ, tài liệu số hóa bước định dạng ảnh, hồn tồn sử dụng, bảo quản liệu bước nhận dạng ký tự chuyển đến định dạng PDF/A Vậy, định lưu giữ hay sử dụng tài liệu nhận dạng ký tự vấn đề cần tính tốn tất nhiên lưu giữ phải tốn thêm nhớ, đòi hỏi phần cứng lưu trữ có dung lượng lớn 2.2.3 Siêu liệu Siêu liệu yếu tố quan trọng giúp cho lưu trữ truy xuất thông tin đến đối tượng số thuận lợi Siêu liệu gọi chìa khóa để khai thác hiệu hệ thống bảo quản tri thức số Mô tả hay chi tiết phụ thuộc vào quy định sách tổ chức 2.2.4 Định dạng tài liệu Cơ quan đăng ký định dạng số toàn cầu The Global Digital Format Registry (GDFR) xác định hai loại định dạng riêng biệt là: định dạng nội dung định dạng vật lý Ví dụ, định dạng nội dung ảnh JPEG (Joint Photographic Experts Group) TIFF (Tagged Image File Format) định dạng vật lý ISO 966: 1988 hay biết Compact Disc File System (CDFS) sử dụng đĩa CD-ROM Lựa chọn định dạng file dự án bảo quản tri thức số tùy theo nhu cầu đặc tính lưu trữ bảo quản chức nhiệm vụ đơn vị khác nhà quản lý chuyên gia lựa chọn định dạng file có tính mở tính phổ biến cao Tính mở có nghĩa định dạng không phụ thuộc quyền, pháp lý sử dụng tính phổ biến mức độ định dạng sử dụng rộng rãi, phổ thông Các công cụ, phần mềm/ứng dụng quản trị đối tượng số thường vào tính mở, tính phổ biến để xây dựng phát triển 18 THÔNG TIN VÀ TƯ LIỆU - 2/2022 Khi đánh giá định dạng file để đưa vào bảo quản tri thức số phải xem xét yếu tố Nếu file PDF định dạng đối tượng số khác nhúng vào khơng lưu giữ đầy đủ định dạng gốc Ưu điểm file PDF hiển thị giống môi trường làm việc khác nhau, làm cho định dạng ngày trở nên phổ biến lý người thích PDF/A, phiên PDF chuyên dụng thiết kế để bảo quản tri thức số lâu dài PDF định dạng Adobe, tiêu chuẩn quốc tế (International Organization for Standardization-ISO) Một số ưu điểm khác định dạng PDF là: Nội dung trình bày đa dạng với khả bảo mật tốt; Có thể in thiết bị mà giữ nguyên định dạng; Hỗ trợ hầu hết loại thiết bị di động; PDF thường có kích thước nhỏ khiến cho việc di chuyển, chia sẻ dễ dàng Các định dạng văn khác thường sử dụng RTF (Rich Text Format), Ngôn ngữ đánh dấu eXtensible Markup Language (XML) Ngôn ngữ đánh dấu siêu văn Hypertext Markup Language (HTML) Đối với loại bảng tính, định dạng CommaSeparated Values (CSV) OpenDocument Spreadsheets (ODS) ưa thích sử dụng nhiều mang tính mở thay sử dụng định dạng XLS, XLSX Microsoft Đối với tài liệu ảnh, định dạng thường sử dụng TIFF JPEG TIFF dạng chưa nén nên kích thước thường lớn JPEG, số lượng ứng dụng mã nguồn mở để xem định dạng JPEG chưa phát triển nhiều Một số định dạng khác ảnh số Portable Network Graphics (PNG) Scalable Vector Graphic (SVG) quan tâm đưa vào tiêu chuẩn bảo quản Tài liệu dạng âm video dạng đối tượng số cần bảo quản Thuộc tính loại hình tài liệu mang đến nhiều thách thức cho dự án bảo quản tri thức số Ví dụ, file video có phần ghi âm riêng, có video xuất thêm phụ đề chèn vào sau Vì khơng có khuyến cáo cho chuẩn cụ thể tài liệu có định dạng nên dự án phải tự định xem định dạng tối ưu cho tổ chức NGHIÊN CỨU - TRAO ĐỔI họ Định dạng Audio Layer III thường gọi MP3 nhiều người biết đến sử dụng, chuyên gia, họ lại không ưu tiên đưa vào bảo quản sử dụng cơng nghệ nén liệu, làm nhiều chất lượng gốc Định dạng Broadcast Wave Format (BWF) Waveform Audio Format (WAV) hai định dạng thường sử dụng để bảo quản Một số dự án lựa chọn định dạng Free Lossless Audio Codec (FLAC) cho kho lưu trữ họ Các định dạng video AVI/MP4 định dạng nhắc đến nhiều đưa vào lưu trữ, bảo quản tri thức số Cơ quan phụ trách Thư viện Lưu trữ Canada đưa tiêu chí đánh giá định dạng file để đưa vào lưu trữ, bảo quản tri thức số (Library and Archives Canada), phần giúp cho nhà quản lý công nghệ lựa chọn định dạng tài liệu cho dự án như: Tính cơng khai, minh bạch; Tính phổ biến; Tính ổn định tương thích; Sự phụ thuộc khả tương tác với phần cứng, phần mềm; Tính chuẩn hóa 2.3 Yếu tố nội dung Nội dung yếu tố thứ ghế ba chân bảo quản số Đây gọi yếu tố trọng tâm sách, kế hoạch quản lý cơng nghệ có tốt đến đâu mà khơng có nội dung thiếu yếu tố định Thu thập, tổ chức nội dung để lưu giữ thường liên quan đến lĩnh vực tổ chức Nội dung đối tượng số để bảo quản trước mắt tài liệu mà tổ chức sở hữu, chẳng hạn sưu tập tài liệu nội sinh thư viện, quan lưu trữ hay tài liệu có từ quan hệ hợp tác sưu tầm tổ chức 2.3.1 Nội dung để người dùng sử dụng hợp pháp Cung cấp nội dung sử dụng mục tiêu việc trì hệ thống bảo quản tri thức số Bất kể nội dung đối tượng số bảo quản vấn đề quyền tài liệu cần đưa lên hàng đầu Các nhà quản lý phải giải để đảm bảo quyền sở hữu trí tuệ tác giả, nhà xuất cấp phép, đảm bảo yêu cầu mặt pháp lý để thực bước cần thiết để triển khai dự án 2.3.2 Phát triển nội dung Phát triển nội dung số tương tự phát triển nội dung, sưu tập tài liệu in thư viện, quan lưu trữ hay bảo tàng, nghĩa hoạt động làm gia tăng có lọc Để có nội dung tốt, quan, tổ chức, đơn vị có phận thẩm định, giám tuyển chất lượng tài liệu để bổ sung vào sưu tập Website IBM Big data có đăng tải thông tin: “90% liệu giới ngày tạo hai năm qua”, thư viện, quan lưu trữ khơng thể sưu tầm tất mà phải có chọn lọc - Các sưu tập ban đầu Đa số tổ chức bắt đầu vào chương trình bảo quản tri thức số có sẵn đối tượng số để từ vào nội dung, chủ đề, thuộc tính, định dạng,… để xây dựng sưu tập ban đầu Các đối tượng số tạo từ cơng tác số hóa hay chuyển đổi định dạng Đối với thư viện đại học, đối tượng số ban đầu khóa luận, luận văn, luận án hay kỷ yếu hội nghị hội thảo Một số đơn vị có xuất tạp chí, nguồn tài liệu số đưa vào lưu trữ, bảo quản ban đầu để phục vụ lâu dài Kiểm kê, phân loại, chuyển định dạng tài liệu (ví dụ, từ word sang pdf) công việc phải triển khai để xây dựng sưu tập ban đầu - Phát triển sưu tập Sự phối hợp với thành viên tổ chức, mở rộng quan hệ hợp tác, tăng cường sưu tầm hay tiếp nhận trao đổi, tặng biếu tăng cường đội ngũ cộng tác viên biện pháp gia tăng nguồn nội dung để mở rộng, có thêm chủ đề để xây dựng sưu tập Việc phối hợp thường xuyên với nhà xuất để nhận thông tin, mua quyền sử dụng đối tượng số phương án mà dự án bảo quản tri thức số thường áp dụng Một nguồn tài liệu có giá trị khác từ cá nhân địa phương, họ có tay tài liệu quý có nhu cầu bảo tồn khơng có kinh phí cơng nghệ, thỏa thuận tổ chức đối tượng để đạt mục đích thỏa mãn phía lựa chọn khơng thể tốt Có thể đặt tên giải pháp “Đơi bên có lợi” THƠNG TIN VÀ TƯ LIỆU - 2/2022 19 NGHIÊN CỨU - TRAO ĐỔI Sử dụng nội lực để số hóa nguồn nội dung tổ chức phương án gia tăng đối tượng số sưu tập hữu hiệu Khó khăn cơng tác thỏa thuận để đạt đồng ý cá nhân tổ chức NHỮNG THÁCH THỨC VÀ CHIẾN LƯỢC TRONG BẢO QUẢN TRI THỨC SỐ 3.1 Thách thức Không giống tài liệu truyền thống, mà nội dung vật mang tin tách rời, đối tượng số lại không gắn với phương tiện lưu trữ cố định Nội dung mã hóa byte, bit dạng chép từ lưu trữ sang lưu trữ khác truyền tải qua mạng Việc không gắn liền đối tượng số với vật mang tin cố định dễ dẫn đến bị thay đổi, hư hỏng chí bị phá hủy hồn tồn mơ tả siêu liệu tách biệt hẳn với nội dung đối tượng số gây khó khăn cho việc xác định nguồn gốc hay quyền đối tượng số Do siêu liệu tách biệt với đối tượng số nên đối tượng số (có thể có nhiều sao) đồng thời có nhiều siêu liệu khác nên việc xác định xác kho lưu trữ khác kho lưu trữ thách thức Brown (2013) mối đe dọa đối tượng số: - Sự mát đối tượng liệu yếu tố vật lý mã hóa thông tin - Sự mát đối tượng thông tin yếu tố xác thực thông tin Một thách thức khác xác định đối tượng số đối tượng dùng để đưa vào bảo quản Thông tin số linh hoạt dễ thay đổi Thibodeau (2012) mơ tả “đa hình thái”, đa hình thái kết tác động: Thay đổi thiết bị lưu trữ; Xác định ranh giới đối tượng số; Mối quan hệ phức tạp đối tượng liệu lưu trữ hệ thống đối tượng trình bày cho người dùng thông qua hệ thống trực tuyến; Xử lý liệu máy tính kết xuất, truyền tải thơng tin Như vậy, có nhiều thách thức đặt dự án bảo quản tri thức số, có 20 THƠNG TIN VÀ TƯ LIỆU - 2/2022 yếu tố khách quan chủ quan; rủi ro công nghệ người Để giảm thiểu rủi ro đó, kế hoạch phải lập chi tiết, cẩn thận thường xuyên kiểm tra, đặc biệt hệ thống lưu, phục hồi dự phòng phải vận hành tốt định kỳ theo lịch định 3.2 Chiến lược Khơng có quy chuẩn chiến lược bảo quản tri thức số cho học tập Cách tiếp cận tốt có lẽ kết hợp lựa chọn phù hợp với tổ chức tùy thuộc vào thay đổi mơi trường cơng nghệ loại hình đối tượng số cần bảo quản Các chiến lược bảo quản nhằm giải rủi ro bao gồm: - Sao lưu sở liệu, đơn giản gọi “tạo sở liệu”, đề cập đến việc tạo nhiều đối tượng Biện pháp chiến lược bảo quản lâu dài mà biện pháp phòng ngừa, bảo vệ liệu khỏi lỗi yếu tố vật lý [DPM Tutorial, 2003-15] - Làm tươi liệu (Refresh) để giảm thiểu lỗi thời thiết bị Có thể hiểu thay lưu trữ, thay phần cứng - Chuẩn hóa định dạng đối tượng số hình thức thay đổi định dạng thực thu thập nhập để đưa vào kho lưu trữ Mục tiêu chuẩn hóa chuyển đổi liệu thành định dạng mở quán để giảm thiểu số lượng định dạng quản lý kho lưu trữ - Mô chiến lược để chống lại lỗi thời cơng nghệ Thay chuyển đổi đối tượng số sang định dạng mới, mô giữ đối tượng số dạng ban đầu, tái tạo lại chức tảng lỗi thời, phần lớn thông qua việc sử dụng phần mềm mô Mô thường sử dụng việc bảo quản trị chơi áp dụng để bảo quản đối tượng đa phương tiện bảo quản tri thức số KẾT LUẬN Với nội dung đây, thấy tầm quan trọng bảo quản số nhằm trì tài nguyên thông tin tri thức số lâu dài bền vững Việc bảo quản số không đơn thường xuyên lưu phục hồi liệu NGHIÊN CỨU - TRAO ĐỔI đối tượng số bị hỏng hóc trang thiết bị, hạ tầng cơng nghệ chủ quan người mà bảo quản số chuỗi công việc chuyên nghiệp từ quản lý, lập kế hoạch, tài chính, sách, lựa chọn công nghệ, xây dựng phát triển đối tượng số để đưa vào sưu tập cho người sử dụng,… Một yếu tố khác thiếu thường xuyên xem xét, đánh giá hiệu kho bảo quản số, qua nhà lãnh đạo, quản lý có sách phù hợp để trì, nâng cao chất lượng đảm bảo an toàn, an ninh hệ thống nhằm mục tiêu bảo quản số tốt lâu dài TÀI LIỆU THAM KHẢO American Library Association’s (ALA), 2007 Annual Conference, Washington, D.C., June 24, 2007 Available from: https:// www.ala.org/alcts/resources/preser v/ defdigpres0408 Becker et al., 2009 Systematic planning for digital preservation: evaluating potential strategies and building preservation plans International Journal on Digital Libraries volume 10, pages133-157, 2009 Brown, A., 2013 Practical Digital Preservation: A How-To Guide for Organizations of Any Size Neal-Schuman, Chicago Candela, L., Castelli, D., Pagano, P., Thano, C., Ioannidis, Y., Koutrika, G., and Schuldt, H., 2007 Setting the foundations of digital libraries: the DELOS manifesto D-Lib Mag., 13 (3), Available from: http://www.dlib org/dlib/march07/castelli/03castelli.html Christenson, H., 2011 HathiTrust: a research library at web scale Lib.Res Tech Serv 55 (2), 93-102 CCSDS: Consultative Committee for Space Data Systems, 2012 Reference Model for an Open Archival Information System (OAIS) Washington, DC: CCSDS Available from: http://public.ccsds.org/publications/ archive/650x0m2.pdf Corrado, E.M., Moulaison, H.L., 2014 Digital Preservation for Libraries, Archives, and Museums Rowman & Littlefield, Lanham, MA DPM Tutorial, 2003-15 Digital Preservation Management Cornell University Library Available from: http:// www.dpworkshop org/ Gorman, G.E Dorne D.G., 2009 Bảo quản tài liệu số đào tạo quản trị thông tin bối cảnh châu Á Đại hội cán thư viện nước Đông Nam Á lần thứ XIV (CONSAL XIV), Hà Nội, 21-23 tháng 2009 (Lê Thùy Dương dịch) 10 Kenney, A.R., McGovern, N.Y., 2003 The five organizational stages of digital preservation In: Hodges, P., Bonn, M., Sandler, M., Wilkin, J.P (Eds.), Digital Libraries: A Vision for the Twenty-First Century, A Festschrift to Honor Wendy Lougee The University of Michigan Scholarly Monograph Series Available from: http://quod lib.umich.edu/s/spobooks/ bbv9812.0001.001/ digital-libraries-avision-for-the-21st-century 11 Library and Archives Canada, “Library and Archives Canada, Local Digital Format Registry (LDFR) File Format Guidelines for Preservation and Long-term Access Version 1.0,” accessed April 23, 2013, http:// www.collectionscanada.gc.ca/obj/012018/ f2/012018-2200-e pdf 12 Library of Congress, 2013 “Formats, Evaluation Factors, and Relationships,” last modified March 20, 2013, http://www digitalpreser vation.gov/for mats/intro/ format_eval_rel shtml 13 Thibodeau, K., 2012 Wrestling with shaper-shifters: perspectives on preserving memory in the digital age In: Proceedings of the Memory of the World in the Digital Age: Digitization and Preservation, pp 1523 Available from: http://www.ciscra.org/ docs/UNESCO_MOW2012_Proceedings_ FINAL_ENG_Compressed.pdf 14 Walters, T.O., Skinner, K., 2010 Economics, sustainability, and the cooperative model in digital preservation Lib Hi Tech 28 (2), 259-272 (Ngày Tòa soạn nhận bài: 12-11-2021; Ngày phản biện đánh giá: 06-01-2022; Ngày chấp nhận đăng: 15-3-2022) THÔNG TIN VÀ TƯ LIỆU - 2/2022 21 ... kho lưu trữ họ Các định dạng video AVI/MP4 định dạng nhắc đến nhiều đưa vào lưu trữ, bảo quản tri thức số Cơ quan phụ trách Thư viện Lưu trữ Canada đưa tiêu chí đánh giá định dạng file để đưa vào... mô tả (PDI) Kho lưu trữ Chức kho lưu trữ cung cấp dịch vụ chức liên quan đến lưu trữ, bảo trì truy xuất gói thơng tin lưu trữ (AIPs) Kho lưu trữ giúp đặt AIPs trạng thái lưu trữ vĩnh viễn, khôi... năm qua”, thư viện, quan lưu trữ khơng thể sưu tầm tất mà phải có chọn lọc - Các sưu tập ban đầu Đa số tổ chức bắt đầu vào chương trình bảo quản tri thức số có sẵn đối tượng số để từ vào nội dung,

Ngày đăng: 06/07/2022, 17:12

HÌNH ẢNH LIÊN QUAN

Từ khóa: Bảo quản số; đối tượng số; bộ sưu tập số; thư viện số; lưu trữ số; mô hình OAIS - Bảo quản số trong các thư viện và cơ quan lưu trữ
kh óa: Bảo quản số; đối tượng số; bộ sưu tập số; thư viện số; lưu trữ số; mô hình OAIS (Trang 1)
Hình 1. Các thiết bị lưu trữ thông tin theo thời gian - Bảo quản số trong các thư viện và cơ quan lưu trữ
Hình 1. Các thiết bị lưu trữ thông tin theo thời gian (Trang 2)
Hình 2. Các yếu tố quyết định trong bảo quản tri thức số [Kenney & McGovern, 2003] - Bảo quản số trong các thư viện và cơ quan lưu trữ
Hình 2. Các yếu tố quyết định trong bảo quản tri thức số [Kenney & McGovern, 2003] (Trang 3)
Nhìn vào Hình 3 có thể nhận thấy 6 chức năng  cơ  bản  tác  động  lẫn  nhau  trong  OAIS  là:  (1)  Đầu  vào  (Ingest),  (2)  Kho  lưu  trữ  (Archival  storage),  (3)  Quản  lý  dữ  liệu  (Data  management), (4) Quản trị (Administration), (5)  Kế hoạch bả - Bảo quản số trong các thư viện và cơ quan lưu trữ
h ìn vào Hình 3 có thể nhận thấy 6 chức năng cơ bản tác động lẫn nhau trong OAIS là: (1) Đầu vào (Ingest), (2) Kho lưu trữ (Archival storage), (3) Quản lý dữ liệu (Data management), (4) Quản trị (Administration), (5) Kế hoạch bả (Trang 4)

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w