Mục tiêu của số hóa các tài liệu quý hiếm ở Thư viện Vatican là hỗ trợ truy cập mở tới các di sản của nhân loại. Số lượng các tài liệu quý hiếm được dự kiến số hóa là 80.000 thủ bản (codex) từ thời kỳ Trung Cổ đến giai đoạn chủ nghĩa nhân văn trong thời kỳ Phục Hưng.
NHÌN RA THẾ GIỚI THƯ VIỆN VATICAN VÀ DỰ ÁN BẢO TỒN BỘ SƯU TẬP CỔ QUÝ HIẾM Trần Thị Kiều Nga Viện Thông tin Khoa học xã hội Lịch sử nguồn tư liệu cổ, quý, Thư viện Vatican 1.1 Lịch sử Thư viện Vatican Thư viện Tòa thánh Vatican, thường gọi Thư viện Vatican, thành lập năm 1475 xem số thư viện cổ xưa giới Trước đó, năm 1451, giáo hồng Nicholas V thành lập thư viện riêng với số tài liệu ban đầu gồm 350 tiếng Hy Lạp, tiếng Hebrew tiếng Latin cổ Đến năm 1455, thư viện có 1.200 tài liệu, có 400 tiếng Hy Lạp cổ đại Cũng năm đó, Giáo hồng Nicholas V Việc tiếp tục sưu tầm tích lũy tư liệu bị gián đoạn Giáo hồng Sixtus đệ IV tiếp tục cơng việc người tiền nhiệm Năm 1475, ngài thức thành lập Thư viện Tòa thánh Vatican với tên ban đầu Thư viện Palatine Giáo hoàng Sixtus đệ IV cử Batolomeo Platina, nhà văn thiên văn học tiếng thời kỳ Phục Hưng người Italia, làm quản thủ thư viện Công việc Batolomeo tiến hành lập danh mục toàn tài liệu thư viện Trong năm 1475, ơng hồn thành danh mục với 3.500 thủ bản, bao gồm tài liệu chép tay, tài liệu thuộc nhiều lĩnh vực khác Vào thời điểm giờ, sưu tập xem sưu tập lớn Châu Âu Tiếp sau đó, Giáo hồng Julius II cho mở rộng thêm nhà Thư viện tiếp tục phát triển thư viện Năm 1587, Giáo hoàng Situs đệ V định kiến trúc sư Domenico Fontana xây nhà cho thư viện, đặt Thánh đường Vatican Toà nhà sử dụng ngày Thư viện Vatican Trong suốt thời kỳ Chấn hưng Công giáo, Thư viện Vatican giới hạn việc khai thác tài liệu lập danh mục sách cấm, đặc biệt người theo đạo Tin Lành Đến năm 1883, Giáo hoàng Leo XIII vị, lệnh cấm chấm dứt Thư viện mở cửa phục vụ đại trà 1.2 Bộ sưu tập Thư viện Vatican Bộ sưu tập Thư viện Vatican xem sưu tập cổ, quý giới Bộ sưu tập có khoảng 75.000 chép tay tôn giáo; 1,1 triệu sách in; 8.500 sách incunabula, 330.000 tài liệu khác gồm microfilm tiếng La Mã, Hy Lạp, tiếng Hebrew, tiếng Ethiopia loại huân chương, huy chương tiền đồng qua đời giáo hoàng, tác phẩm nghệ thuật Phần lớn tài liệu số chép tay Mỗi năm Thư viện bổ sung khoảng 6.000 tài liệu thông qua việc tặng thừa kế bổ sung theo diện mua, sưu tầm, biếu, tặng Những tài liệu lâu đời có niên đại từ kỷ thứ Tài liệu cổ tiếng thư viện Bộ luật Codex Vaticanus Graecus 1209 Kinh thánh Năm 1623, Thư viện Giáo hoàng nhận 3.500 chép tay quà cảm ơn Công tước xứ Bavaria Nội dung sưu tập bao gồm kinh thánh, sưu tập viết luật lệ phép tắc tôn giáo sách tục khác Tổng số mét giá để xếp tài liệu Thư viện Vatican có chiều dài 42km Hằng năm, Thư viện Vatican có 200 học giả tiếp cận tài liệu trực tiếp có từ 4.000-5.000 học giả tới khai thác tài liệu thông qua hoạt động hợp tác, nghiên cứu THÔNG TIN VÀ TƯ LIỆU - 5/2017 37 NHÌN RA THẾ GIỚI Dự án số hóa tư liệu quý Thư viện Vatican Mục tiêu số hóa tài liệu quý Thư viện Vatican hỗ trợ truy cập mở tới di sản nhân loại Số lượng tài liệu quý dự kiến số hóa 80.000 thủ (codex) từ thời kỳ Trung Cổ đến giai đoạn chủ nghĩa nhân văn thời kỳ Phục Hưng Tiêu chí để lựa chọn tài liệu ưu tiên số hóa sau: - Tinh xảo, dễ hỏng, có nguy thơng tin; - Quan trọng quý hiếm; - Lựa chọn theo dự án tài trợ; - Theo nhu cầu học giả Các nhà thư viện Thư viện Vatican nhiều năm để phân loại thủ theo tiêu chí Bên cạnh đó, nhiều tài liệu sưu tập dát thêm vàng bạc nên chúng bị phá hủy ánh sáng đèn qt Vì thế, việc số hóa phải thực thành quy trình chuyên biệt có điều chỉnh ánh sáng cách cụ thể tài liệu Thêm nữa, thiết bị quét phải điều chỉnh theo đòi hỏi nhà lưu trữ Vatican, tài liệu đánh giá tình trạng lưu giữ cẩn trọng trước sau số hóa Ngồi tiêu chí lựa chọn tài liệu, tiêu chí công nghệ quan trọng không Việc thiết lập dự án số hóa dựa tiêu chuẩn mở siêu liệu APIs (Application Programming Interface Set), loại giao diện để phần mềm hệ điều hành kết nối làm việc tương thích, cho phép sưu tập số hóa tương tác với Thêm vào đó, việc lựa chọn IIIF (International Image Interoperability Framework), thực chất gồm APIs kết hợp, đưa vào sử 38 THÔNG TIN VÀ TƯ LIỆU - 5/2017 dụng nhằm mục đích sau: - Giúp học giả truy cập tới tài liệu dạng ảnh cách đồng đa dạng; - Xác định giao diện chương trình ứng dụng thơng thường dùng để hỗ trợ tương tác lưu trữ ảnh; - Phát triển sâu vào công nghệ chia sẻ tài liệu như: kinh nghiệm người dùng tin giới việc xem ảnh, thao tác ảnh, thích ảnh, so sánh ảnh Năm 2012, sau q trình tìm hiểu, đánh giá lựa chọn, xây dựng quy trình, dự án số hóa Thư viện Vatican thức bắt đầu Dự án số hóa tư liệu quý thực sở hợp tác Thư viện Vatican Thư viện Bodleian, số thư viện cổ Châu Âu thuộc Đại học Oxford Dự án Quỹ Polonsky, có trụ sở London, tài trợ Dự án tập trung vào ba nhóm tài liệu chính: thảo tiếng Hê-bơ-rơ, thảo Hy Lạp, tài liệu in thời kỳ ban đầu (inculabula) Các nhóm tài liệu chọn tầm quan trọng học thuật chúng độ dài sưu tập hai thư viện Dự án kéo dài bốn năm với kết số hóa 1,5 triệu trang tài liệu lựa chọn Vào ngày 20/3/2014, Giáo hoàng long trọng tuyên bố Dự án số hóa tiếp nối dự án thực ký kết Vaticant với tập đồn NTT Data Cooporation, Nhật Bản Theo đó, tập đoàn NTT tài trợ cho Dự án kỹ thuật viên thiết bị trị giá khoảng 18 triệu Euro Đáng ý, Dự án số hóa lên tới 79.000 tài liệu giai đoạn Dự án kéo dài năm Các tài liệu số hóa lưu trữ ba máy chủ, máy chủ có dung lượng lên tới Petabyte (1 triệu tỷ bytes) Các máy chủ tập đoàn Dell EMC cung cấp NHÌN RA THẾ GIỚI Một số ứng dụng cơng nghệ số hóa Do quy mơ mục tiêu nhà quản thủ Thư viện Vatican nên ứng dụng công nghệ cho Dự án số hóa lựa chọn kỹ Thư viện số Vatican chia thành sáu mục lục sau: Mục lục tài liệu viết tay, Mục lục tài liệu lưu trữ, Mục lục sách in nói chung, Mục lục tài liệu Incunabula, Mục lục tài liệu đồ họa, Mục lục tiền đúc huy chương Các mục lục tương tác với biểu ghi theo định dạng MARC 21, EAD (Encoded Archival Description) TEI-P5 (Text Encoding Initiative_Part 5), siêu liệu dành riêng cho thủ chữ Ả Rập Vatican Do đó, việc tìm kiếm hệ thống quản trị phổ biến cho tài liệu Thư viện Vatican phức tạp, có liên kết nhiều dạng siêu liệu Hệ thống dịch vụ lưu trữ số dành cho thư viện bảo tàng AMLAD tập đoàn NTT, Nhật Bản Thư viện Vatican lựa chọn hệ thống cho phép lưu trữ phổ biến sách in, tài liệu viết tay, tài liệu đa phương tiện có giá trị chuyên biệt cho tổ chức thư viện, phòng trưng bày, trung tâm lưu trữ, bảo tàng AMLAD lưu trữ siêu liệu theo kiểu sơ đồ hóa riêng hệ thống, kết nối siêu liệu khác lại với Ví dụ như, AMLAD liên kết “Tên sách” từ tài khoản Library Books với “Chủ đề” từ tài khoản Archives Đồng thời AMLAD cho phép người dùng tin tìm kiếm xác thơng tin lưu trữ nhiều định dạng khác có liên quan tới thơng qua chế tìm kiếm chéo Thậm chí AMLAD cho phép người dùng tin tìm kiếm tập tin nhiều định dạng khác theo kiểu thủ cơng Thêm vào đó, việc sử dụng cơng nghệ Watermark, cơng nghệ mã hóa kiểm soát quyền tài liệu số, giúp ngăn chặn người dùng tin thao tác sai mục đích việc chép ảnh giới hạn sử dụng AMLAD hỗ trợ cho việc sử dụng giao diện thiết bị hiển thị khác điện thoại thơng minh, máy tính bảng, máy tính cá nhân, xem phim ảnh có JPEG 2000 Hệ thống sử dụng ứng dụng đọc tài liệu số giúp người dùng tin xem, đọc tài liệu tài liệu thông thường AMLAD cung cấp cho người dùng tin nhiều phương pháp tìm kiếm thơng tin khác tìm theo từ khóa, tìm theo phân loại, tìm theo tài liệu cụ thể, tìm theo định hướng xác định dạng câu hỏi “What you mean?” Cuối cùng, AMLAD tương thích với tiêu chuẩn quốc tế lưu trữ tài liệu như: tiêu chuẩn Hệ thống thông tin lưu trữ mở (OAISOpen Archival Information System), mơ hình tham chiếu (ISO 14721:2012) hệ thống thông tin lưu trữ mở, chuẩn siêu liệu Dublin Core, chuẩn truyền dẫn mã hóa siêu liệu (METs-Metadata Encoding and Transmision Standard), giản đồ mô tả thư mục đối tượng siêu liệu cho tiêu chuẩn truyền dẫn mã hóa siêu liệu (MODs- Metadata Objects Description Schema) dựa XML vốn Thư viện Quốc hội Mỹ phát triển từ năm 2002, chuẩn mô tả tài liệu lưu trữ (EAD) cú pháp XML dành cho việc lưu trợ giúp tìm kiếm thơng tin Hội Lưu trữ Mỹ phát triển Ngoài ra, AMLAD hỗ trợ giao thức kết nối chuẩn như: OAI-PMH (Opening Archive Initiative Protocol for Metadata Harvesting) SRU/SRW (Search/Retrieve via URL- Search/ Retrieve Web service) Nhờ tiện lợi khả tạo tương thích rộng kể mà hệ thống AMLAD tập đoàn NTT lựa chọn sử dụng cho việc tìm kiếm, lưu trữ phổ biến thông tin sở liệu số thư viện Vatican Thư viện số Vatican sử dụng định dạng FITS (Flexible Image Transport System) số hóa ảnh tài liệu có ảnh FITS THƠNG TIN VÀ TƯ LIỆU - 5/2017 39 NHÌN RA THẾ GIỚI hệ thống định dạng dùng cho việc truyền dẫn hình ảnh linh hoạt Cơ quan hàng không vũ trụ Mỹ (NASA) phát triển cho ảnh thiên văn họ Đây lần đầu tiên, FITS sử dụng cho số hóa lưu trữ thủ Hiện nay, FITS NASA phát triển tới phiên (version) 3.0 Một file FITS tạo nên từ biểu ghi dung lượng 2880 - bytes, gọi khối FITS Khối FITS phân chia thành phần phần tiêu đề phần liệu Đặc trưng định dạng FITS lưu trữ siêu liệu ảnh theo tiêu đề mã ASCII (American Standard Code for Information Interchange_II/Bộ mã ký tự) Điều giúp cho người dùng tin kiểm tra tiêu đề theo nguồn Mỗi file FITS bao gồm một tiêu đề có gắn thẻ ảnh theo dạng mã ASCII chứa đựng cặp từ khóa/giá trị nằm xen kẽ liệu Các cặp từ khóa/giá trị cung cấp thơng tin kích cỡ, nguồn gốc, tọa độ, định dạng hệ nhị phân, lịch sử liệu đó, nhiều từ khóa lúc dùng cho FITS So với định dạng file khác, ví dụ so với định dạng TIFF, FITS không bị giới hạn cho việc đọc tập tin theo kích thước loại số liệu văn lưu: Số nguyên số thực, 32 64 bit, hình ảnh xử lý ma trận hai chiều màu sắc mã hóa ảnh xem giá trị ma trận Mặt khác, chương trình xử lý ảnh GIMP, Photoshop, XnView IrfanView đọc hình ảnh FITS đơn giản, thường khơng thể giải thích bảng phức tạp Trong dự án số hóa Thư viện Vatican, việc chọn tệp FITS định dạng để bảo quản lâu dài cho thấy FITS lựa chọn khơng dành cho cơng chúng đọc mà cịn dành cho lưu trữ liệu Vì hai CSDL trực tuyến thư viện Vatican CSDL Thủ CSDL Tài liệu lưu trữ có 40 THƠNG TIN VÀ TƯ LIỆU - 5/2017 mối liên kết phức tạp siêu liệu khác nên chúng quản lý theo hai khổ mẫu liệu TEI-P5 EAD theo cú pháp XML Tuy hai sưu tập liệu chuyên biệt chúng lại sử dụng ứng dụng InforMA InforMA tên ứng dụng thiết lập công ty phần mềm AG Đức, cung cấp hỗ trợ toàn diện cho CSDL theo XML, lưu trữ nội dung theo XML, cung cấp khả xử lý hồi cố dựa tiêu chuẩn XQuery (XML Query) Xpath (XML Path), tiêu chuẩn ngôn ngữ cho nội dung đa phương tiện có cấu trúc khơng có cấu trúc, tương thích với Microsoft Office sản phẩm dựa WedDAV (Webbased Distributed Authoring and VersioningMột dạng giao thức môi trường World Wide Web) Những đặc trưng InforMA phần mềm mang tên Tamino hỗ trợ, phần mềm công ty phần mềm AG Đức cung cấp Một ứng dụng khác sử dụng Dự án V-Smart/Iguana Ứng dụng này, bao gồm hai ứng dụng kết hợp với có tên V-smart Iguana, giúp người dùng tin tham vấn khả tìm kiếm thông tin sử dụng thông tin CSDL tích hợp chung Cấu trúc cơng nghệ ứng dụng dựa giao thức OAIPMH yếu tố ký tự dành cho truy xuất liệu (từ InforMA) tới nhập liệu XML (tới V-Smart) Từ biểu ghi thư mục, V-Link (bộ giải URL mở) tìm kiếm truy cập tới nguồn tin hồi cố kết tìm có liên quan Ứng dụng hỗ trợ cho URIs (Uniform Resource Identifier Set/Chuỗi ký tự dùng để định danh tên, tài ngun Internet) có liên quan tới giao diện trình bày Web tài liệu inculabula số hóa Trong hai CSDL thư mục trực tuyến số 06 thư mục CSDL trực tuyến dự án số hóa thư viện Vatican sử dụng dạng mã NHÌN RA THẾ GIỚI hóa chuyên biệt (CSDL thư mục thủ sử dụng TEI-P5 CSDL thư mục tài liệu lưu trữ sử dụng EAD) bốn CSDL thư mục trực tuyến lại sử dụng khổ mẫu MARC 21 Phần mô tả thủ xác định yếu tố chuyên biệt để cung cấp thông tin mô tả tài liệu chép tay TEI-P5 phát triển nhằm thỏa mãn yêu cầu nhà thư mục học học giả liên quan tới thủ Châu Âu theo phong cách truyền thống Hiện nay, TEI-P5 mở rộng dành cho loại tài liệu khác bao gồm tài liệu khắc thạch TEI-P5 cung cấp khung thống xác định ngôn ngữ đánh dấu, cách đơn giản để tổ chức nguồn tin văn có cấu trúc Một biểu ghi TEI-P5 bao gồm thông tin sau: Yếu tố mô tả thủ bản, Yếu tố cấp độ nhóm, Định danh tài liệu, Đề mục thủ bản, nội dung thông tin thủ bản, yếu tố mô tả vật lý, Lịch sử tài liệu, Thông tin thêm, Các phần thủ bản, Mảnh thủ bản, Phân đoạn mô tả tài liệu Các thông tin viết theo cú pháp XML EAD chuẩn khổ mẫu mô tả tài liệu lưu trữ yếu tố thơng tin mã hóa theo cú pháp XML EAD Hội Lưu trữ Mỹ đưa Phiên version 1.0 năm 1998 Hiện EAD phát triển thành phiên EAD3 EAD xem số tiêu chuẩn siêu liệu cho tài liệu lưu trữ Một biểu ghi theo chuẩn EAD3 bao gồm 165 yếu tố thông tin đưa vào so với phiên ban đầu có 146 yếu tố thông tin Các yếu tố dùng để mơ tả chung tồn tài liệu mã hóa bảng kê theo nhiều cấp độ khác Các yếu tố xếp theo tiêu chuẩn nội dung DACs (Tiêu chuẩn nội dung Hiệp hội Lưu trữ Mỹ đưa ra), ISAD(G) (Tiêu chuẩn mô tả lưu trữ quốc tế Hiệp hội lưu trữ quốc tế đưa ra) theo tiêu chuẩn cấu trúc thông tin khác MARC, Dublin Core nhằm làm tăng tính linh hoạt tương tác liệu EAD phiên viết dạng cú pháp DTD, phiên EAD3 viết theo dạng cú pháp XML DTD Tóm lại, với ứng dụng cơng nghệ thơng tin đại nhất, quy mô dự án vô lớn với quý có giá trị khoa học cao thủ bản, dự án thư viện Vatican dự án số hóa tài liệu mong chờ giới Với quy mô dự án này, nhà quản thủ thư viện Vatican đường bảo tồn phát huy thủ quý có hiệu tối ưu _ TÀI LIỆU THAM KHẢO Bridging between Cutural Heritage Institutions: 9th Italian Research Conference, IRCDL 2013, Rome/Italia, January 31 - February 1, 2013: Revise Selected Papers, Edition Springers, 2013, 200 p Encoding Archival Description Tag Library https://www2.archivists.org/sites/all/files/TagLibrary-VersionEAD3.pdf Truy cập ngày 14/06/2017 It FITS the Cultural Heritage h t t p : / / w w w u n e s c o o r g / f i l e a d m i n / M U L TIMEDIA/HQ/CI/CI/pdf/mow/VC_Michetti_ Manoni_28_C_1110.pdf Truy cập ngày 14/06/2017 TEI-P5 : Guidelines for electronic Text Encoding and Interchande http://www.tei-c.org/release/doc/tei-p5-doc/en/ html/MS.html Truy cập ngày 15/06/2017 The tech behind digitizing the Vatican Library : Open access for all | #EMCWorld https://siliconangle.com/blog/2014/05/23/thetech-behind-digitizing-the-vatican-library-open-access-for-all-emcworld/ Truy cập ngày 14/06/2017 THÔNG TIN VÀ TƯ LIỆU - 5/2017 41 ... tìm hiểu, đánh giá lựa chọn, xây dựng quy trình, dự án số hóa Thư viện Vatican thức bắt đầu Dự án số hóa tư liệu quý thực sở hợp tác Thư viện Vatican Thư viện Bodleian, số thư viện cổ Châu Âu... nhất, quy mô dự án vô lớn với quý có giá trị khoa học cao thủ bản, dự án thư viện Vatican dự án số hóa tài liệu mong chờ giới Với quy mô dự án này, nhà quản thủ thư viện Vatican đường bảo tồn phát... độ dài sưu tập hai thư viện Dự án kéo dài bốn năm với kết số hóa 1,5 triệu trang tài liệu lựa chọn Vào ngày 20/3/2014, Giáo hồng long trọng tun bố Dự án số hóa tiếp nối dự án thực ký kết Vaticant