6. Bố cục của Khóa luận
3.2.1. Khái quát về METS
Lược đồ METS (Metadata Encoding and Transmission Standard) là
một chuẩn đối với siêu dữ liệu mô tả mã hóa, mang tính quản trị và có cấu trúc, dùng cho tài liệu thư viện số. METS được hiển thị sử dụng ngôn ngữ XML. METS ra đời từ dự án MOA2 (Making of America II) của trường đại học California tại Berkeley. Một trong những kết quả của dự án này là MOA2 DTD dựa trên SGML cho các đối tượng thư viện số, thích hợp cho việc kết hợp giữa văn bản và hình ảnh. MOA2 DTD không cho phép làm việc với các siêu dữ liệu kỹ thuật và siêu dữ liệu mô tả. Điều đó là không phù hợp với các công việc số hóa mà một thư viện số cần phải làm. Việc đưa ra một ngôn ngữ chuẩn XML để mã hóa các đối tượng thư viện số là việc làm cần thiết. Các thành viên của Liên đoàn Thư viện số đã quyết định nghiên cứu đưa ra một định dạng mới, đó là METS XML. METS được duy trì và phát triển bởi Văn phòng phát triển mạng và tiêu chuẩn MARC của Thư viện Quốc hội Mỹ. Hiện tại, METS đang được phát triển như một sáng kiến của Liên đoàn Thư viện số.
Việc duy trì bộ sưu tập số đòi hỏi cũng phải duy trì siêu dữ liệu về các tài liệu số này. Siêu dữ liệu cần thiết cho việc quản trị và sử dụng hiệu quả tài liệu số khác biệt và mở rộng hơn nhiều đối với siêu dữ liệu dùng để quản lý bộ sưu tập tài liệu in ấn. Đối với một cuốn sách in, nếu thư viện có sai sót
vào các trang không liên kết được, hoặc giả nếu thư viện có sai sót trong việc ghi chú việc xuất bản cuốn sách thì các nhà nghiên cứu cũng không phải sẽ không thể đánh giá đúng giá trị của nó. Nhưng sẽ không như vậy đối với phiên bản số hóa cũng của cuốn sách này. Không có siêu dữ liệu cấu trúc, không có hình ảnh, file văn bản kèm theo, tài liệu số sẽ ít được sử dụng; và không có siêu dữ liệu kỹ thuật về quá trình số hóa, các nhà nghiên cứu sẽ không thể chắc chắn được mức độ phản ánh chính xác tài liệu gốc của bản số hóa. Về mục đích quản trị, một thư viện phải có truy nhập tới các siêu dữ liệu kỹ thuật để theo dõi và làm mới (refresh) định kỳ, di trú dữ liệu, đảm bảo tính lâu dài cho các nguồn thông tin giá trị.
Với vai trò của các siêu dữ liệu kỹ thuật, cấu trúc, và quản trị trong thao tác số hóa dựa trên hình ảnh và văn bản, METS ngày càng có ưu thế trong việc sử dụng để lưu trữ, trao đổi và phổ biến thông tin. Dựa trên mục đích sử dụng, một tài liệu METS có thể được sử dụng với vai trò là:
- gói thông tin đệ trình (Submission Information Package - SIP) - gói thông tin lưu trữ (Archival Information Package - AIP)
- gói thông tin phổ biến (Dissemination Information Package - DIP) nằm trong Mô hình tham khảo hệ thống thông tin lưu trữ mở - Open Archival
Information System (OAIS) Reference Model.
Một tài liệu METS gồm có 7 phần chính:
Đầu tài liệu (METS Header): Đầu tài liệu chứa các siêu dữ liệu mô tả chính bản thân tài liệu METS đó, gồm những thông tin như: người tạo lập, người chỉnh sửa…
Siêu dữ liệu mô tả (Descriptive Metadata): Vùng siêu dữ liệu mô tả có thể chỉ ra siêu dữ liệu mô tả bên ngoài tới tài liệu METS, hoặc siêu dữ liệu mô tả gắn bên trong tài liệu, hoặc cả hai.
Siêu dữ liệu quản trị (Administrative Metadata): Vùng siêu dữ liệu
quản trị cung cấp thông tin về cách thức file dữ liệu được tạo ra và lưu trữ, quyền sở hữu trí tuệ, siêu dữ liệu về tài liệu gốc mà từ đó thư viện số thực hiện số hóa, và thông tin về các file dữ liệu có trong đối tượng tài liệu số. Cũng như siêu dữ liệu mô tả, siêu dữ liệu quản trị có thể từ bên ngoài hoặc gắn bên trong tài liệu METS.
Vùng dữ liệu (File section): Vùng dữ liệu liệt kê tất cả các file có
trong nội dung tài liệu. Các phần tử <file> có thể được nhóm trong các phần tử <fileGrp>, cung cấp cho việc chia nhỏ các file.
Bản đồ cấu trúc (Structural Map): Bản đồ cấu trúc là phần trọng tâm của một tài liệu METS. Nó vạch ra cấu trúc thứ bậc cho đối tượng số, và liên kết các phần tử của cấu trúc đó tới các file nội dung và các siêu dữ liệu gắn liền với từng phần tử.
Liên kết cấu trúc (Structural Links): Vùng liên kết cấu trúc của METS cho phép người tạo lập ghi lại sự tồn tại của các siêu liên kết giữa các nút (node) trong sơ đồ thứ bậc của Bản đồ cấu trúc. Đây là giá trị đặc biệt trong việc sử dụng METS để lưu trữ các website.
Thuộc tính (Behavior): Vùng thuộc tính dùng để kết hợp các thuộc
tính có thể thực hiện được với nội dung đối tượng METS. Mỗi thuộc tính trong vùng thuộc tính có một phần tử định nghĩa giao diện mô tả tóm tắt định nghĩa của tập hợp thuộc tính trong vùng thuộc tính cụ thể. Dưới đây là giải thích chi tiết hơn cho từng thành phần và quan hệ liên đới giữa chúng.