6. Bố cục của Khóa luận
3.2.2. Các thành phần của METS
3.2.2.1. Đầu tài liệu (METS header):
Phần tử METS header cho phép ghi lại siêu dữ liệu mô tả tối thiểu về tài liệu METS. Siêu dữ liệu này bao gồm: ngày tạo lập tài liệu METS, ngày
chỉnh sửa cuối cùng, và trạng thái của tài liệu. Ta có thể ghi thêm tên của những người khác có đóng vai trò trách nhiệm đối với tài liệu METS, ghi cụ thể vai trò của họ. Cuối cùng, có thể ghi vào các thông tin nhận diện cho tài liệu METS.
Ví dụ về đầu tài liệu (METS header):
<metsHdr CREATEDATE="2003-07-04T15:00:00" RECORDSTATUS="Complete"> <agent ROLE="CREATOR" TYPE="INDIVIDUAL">
<name>Jerome McDonough</name> </agent>
<agent ROLE="ARCHIVIST" TYPE="INDIVIDUAL"> <name>Ann Butler</name>
</agent> </metsHdr>
Ví dụ trên chứa 2 thuộc tính trong phần tử <metsHdr>, CREATEDATE chỉ ra ngày tạo lập biểu ghi và RECORDSTATUS chỉ ra trạng thái biểu ghi. Thông tin trách nhiệm gồm có hai người, người tạo lập biểu ghi và người lưu trữ tài liệu gốc. Thuộc tính ROLE (vai trò tác giả) và TYPE (loại tác giả cá nhân hay tập thể) trong phần tử <agent> sử dụng thuật ngữ có kiểm soát. Các giá trị cho phép đối với thuộc tính ROLE gồm có: ARCHIVIST (người lưu trữ), CREATOR (người tạo lập), CUSTODIAN (người quản lý tài liệu), DISSEMINATOR (người phổ biến), EDITOR (người hiệu đính), IPOWNER (người sở hữu công nghệ), và OTHER (các vai trò khác). Các giá trị cho phép đối với thuộc tính TYPE gồm có: INDIVIDUAL (cá nhân), ORGANIZATION (tổ chức), và OTHER.
3.2.2.2. Siêu dữ liệu mô tả (Descriptive Metadata):
Vùng siêu dữ liệu mô tả trong tài liệu METS chứa một hoặc nhiều phần tử <dmdSec> (Descriptive Metadata Section). Mỗi phần tử <dmdSec> có thể có một chỉ chỗ tới siêu dữ liệu bên ngoài (phần tử <mdRef>), siêu dữ liệu gắn bên trong (phần tử <mdWrap>), hoặc cả hai.
Siêu dữ liệu mô tả bên ngoài (mdRef):
Một phần tử <mdRef> cung cấp một URI sử dụng để lấy siêu dữ liệu từ bên ngoài. Ví dụ:
<dmdSec ID="dmd001">
<mdRef LOCTYPE="URN" MIMETYPE="application/xml" MDTYPE="EAD" LABEL="Berol Collection Finding Aid">urn:x-nyu:fales1735</mdRef> </dmdSec>
Phần tử <mdRef> ở trên chứa 4 thuộc tính:
- Thuộc tính LOCTYPE chỉ ra loại định vị tài nguyên chứa trong nội dung của phần tử. Các giá trị hợp lệ cho LOCTYPE gồm có: URN, URL, PURL, HANDLE, DOI, và OTHER.
- Thuộc tính MIMETYPE cho phép xác định loại MIME cho siêu dữ liệu mô tả bên ngoài.
- Thuộc tính MDTYPE cho phép xác định dạng siêu dữ liệu được tham chiếu đến. Giá trị hợp lệ cho MDTYPE gồm có: MARC, MODS, EAD, VRA (VRA Core), DC (Dublin Core), NISOIMG, LC-AV, TEIHDR (TEI Header), DDI, FGDC, và OTHER.
- Thuộc tính LABEL cung cấp kỹ thuật cho việc mô tả siêu dữ liệu này cho người xem tài liệu.
Siêu dữ liệu mô tả bên trong (mdWrap):
Một phần tử <mdWrap> cung cấp khuôn khổ của siêu dữ liệu gắn bên trong tài liệu METS. Siêu dữ liệu như vậy có thể ở một trong hai dạng: 1. siêu dữ liệu mã hóa theo XML, với mã XML định danh nó bằng một không gian tên khác với không gian tên của tài liệu METS, hoặc 2. dạng văn bản tùy ý bất kỳ đặt trong phần tử <binData> thuộc phần tử <mdWrap>. Ví dụ:
<dmdSec ID="dmd002">
<mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin Core Metadata"> <xmlData>
<dc:title>Alice's Adventures in Wonderland</dc:title> <dc:creator>Lewis Carroll</dc:creator>
<dc:date>between 1872 and 1890</dc:date>
<dc:publisher>McCloughlin Brothers</dc:publisher> <dc:type>text</dc:type> </xmlData> </mdWrap> </dmdSec> <dmdSec ID="dmd003">
<mdWrap MIMETYPE="application/marc" MDTYPE="MARC" LABEL="OPAC Record"> <binData>MDI0ODdjam0gIDIyMDA1ODkgYSA0NU0wMDAxMDA...(etc.)
</binData> </mdWrap> </dmdSec>
Một lưu ý đó là phần tử <dmdSec> phải có một thuộc tính ID. Thuộc tính này cung cấp một tên duy nhất cho mỗi phần tử <dmdSec> có thể được sử dụng trong bản đồ cấu trúc để liên kết một phần chia nhỏ theo cấu trúc thứ bậc tới một phần tử <dmdSec> cụ thể. Việc này cho phép các vùng cụ thể của siêu dữ liệu mô tả được liên kết tới các phần cụ thể của đối tượng số.
3.2.2.3. Siêu dữ liệu quản trị (Administrative Metadata):
Các phần tử <amdSec> chứa siêu dữ liệu quản trị gắn với các file của đối tượng thư viện số, cũng như gắn với tài liệu gốc được sử dụng để tạo nên đối tượng số. Có 4 định dạng chính của siêu dữ liệu quản trị cung cấp trong tài liệu METS:
- Siêu dữ liệu kỹ thuật (phần tử <techMD>): thông tin về việc tạo lập file, định dạng, đặc điểm sử dụng.
- Siêu dữ liệu nguồn (phần tử <sourceMD>): nguồn mà từ đó đối tượng số nhận được thông tin.
- Siêu dữ liệu nguồn tài nguyên số (phần tử <digiprovMD>): thông tin về mối quan hệ nguồn/đích giữa các file, về việc di trú hoặc chuyển hóa giữa tài liệu số hóa ban đầu với phiên bản hiện có của nó như một đối tượng của thư viện số.
Từng loại trong số 4 phần tử kể trên có thể xuất hiện một hoặc nhiều lần trong tài liệu METS.
Các phần tử <techMD>, <rightsMD>, <sourceMD>, và <digiprovMD> có mô hình nội dung tương tự như <dmdSec>: chúng có thể chứa một phần tử <mdRef> chỉ tới siêu dữ liệu quản trị bên ngoài, một phần tử <mdWrap> sử dụng khi gắn siêu dữ liệu quản trị bên trong tài liệu METS, hoặc cả hai. Các phần tử này có thể xuất hiện đa dạng trong tài liệu METS, và tất cả chúng phải có thuộc tính ID để các phần tử khác trong tài liệu có thể liên kết tới các phần tử phụ thuộc phần tử <amdSec>.
Một ví dụ về <techMD>:
<techMD ID="AMD001">
<mdWrap MIMETYPE="text/xml" MDTYPE="NISOIMG" LABEL="NISO Img. Data"> <xmlData> <niso:MIMEtype>image/tiff</niso:MIMEtype> <niso:Compression>LZW</niso:Compression> <niso:PhotometricInterpretation>8</niso:PhotometricInterpretation> <niso:Orientation>1</niso:Orientation> <niso:ScanningAgency>NYU Press</niso:ScanningAgency> </xmlData> </mdWrap> </techMD>
Phần tử <fileSec>chứa một hoặc nhiều phần tử <fileGrp> dùng để nhóm các file có liên quan với nhau. <fileGrp> liệt kê tất cả các file hợp thành phiên bản điện tử của đối tượng thư viện số.
Xem xét ví dụ dưới đây về vùng dữ liệu gồm có 3 phiên bản khác nhau: một bản sao mã hóa TEI, một file âm thanh định dạng WAV, và một file âm thanh định dạng MP3:
<fileSec>
<fileGrp ID="VERS1">
<file ID="FILE001" MIMETYPE="application/xml" SIZE="257537" CREATED="2001-06-10"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.xml</FLocat>
</file> </fileGrp>
<fileGrp ID="VERS2">
<file ID="FILE002" MIMETYPE="audio/wav" SIZE="64232836" CREATED="2001-05-17" GROUPID="AUDIO1">
<FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.wav</FLocat> </file>
</fileGrp>
<fileGrp ID="VERS3" VERSDATE="2001-05-18">
<file ID="FILE003" MIMETYPE="audio/mpeg" SIZE="8238866" CREATED="2001-05-18" GROUPID="AUDIO1">
<FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.mp3</FLocat> </file>
</fileGrp> </fileSec>
Trong trường hợp này, phần tử <fileSec> chứa 3 phần tử <fileGrp> trực thuộc, mỗi phần tử dành cho một phiên bản khác nhau của đối tượng số.
Thuộc tính GROUPID xuất hiện với các giá trị giống nhau ở hai phần tử <file> âm thanh, điều này chỉ ra rằng hai file này, dù thuộc các phiên bản khác nhau của đối tượng số, cùng chứa một thông tin cơ bản.
Các phần tử <file> đều có một thuộc tính ID riêng biệt. Thuộc tính này cung cấp một tên duy nhất cho tập tin này để có thể tham chiếu đến từ các phần khác của tài liệu.
Các phần tử <file> có thể chứa một phần tử <Fcontent> thay vì <Flocat>. Phần tử <Fcontent> được sử dụng để gắn nội dung thực tế của file vào tài liệu METS, nội dung file khi đó phải ở định dạng XML hoặc mã hóa theo Base64.
3.2.2.5. Bản đồ cấu trúc (Structural Map):
Bản đồ cấu trúc của tài liệu METS xác định một cấu trúc thứ bậc của đối tượng số hiển thị cho người sử dụng. Phần tử <structMap> mã hóa cấu trúc thứ bậc này thành một loạt phần tử phần tử <div>. Mỗi phần tử <div> mang thông tin thuộc tính chỉ rõ kiểu phân chia, và cũng chứa nhiều phần tử chỉ chỗ METS <mptr> và chỉ chỗ file <fptr> để xác định nội dung tương ứng với phần tử <div> đó.
Ví dụ đơn giản về bản đồ cấu trúc: <structMap TYPE="logical">
<div ID="div1" LABEL="Oral History: Mayor Abraham Beame" TYPE="oral history">
<div ID="div1.1" LABEL="Interviewer Introduction" ORDER="1">
<fptr FILEID="FILE001">
<area FILEID="FILE001" BEGIN="INTVWBG" END="INTVWND" BETYPE="IDREF" />
</fptr>
<fptr FILEID="FILE002">
<area FILEID="FILE002" BEGIN="00:00:00" END="00:01:47" BETYPE="TIME" />
</fptr>
<fptr FILEID="FILE003">
</fptr> </div>
<div ID="div1.2" LABEL="Family History" ORDER="2"> <fptr FILEID="FILE001">
<area FILEID="FILE001" BEGIN="FHBG" END="FHND" BETYPE="IDREF" />
</fptr>
<fptr FILEID="FILE002">
<area FILEID="FILE002" BEGIN="00:01:48"END="00:06:17" BETYPE="TIME" />
</fptr>
<fptr FILEID="FILE003">
<area FILEID="FILE003" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" />
</fptr> </div>
<div ID="div1.3" LABEL="Introduction to Teachers' Union" ORDER="3">
<fptr FILEID="FILE001">
<area FILEID="FILE001" BEGIN="TUBG" END="TUND" BETYPE="IDREF" />
</fptr>
<fptr FILEID="FILE002">
<area FILEID="FILE002" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" />
</fptr>
<fptr FILEID="FILE003">
<area FILEID="FILE003" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" />
</fptr> </div> </div> </structMap>
Bản đồ cấu trúc này cho thấy ta có một tài liệu về lịch sử truyền miệng bao gồm 3 phần nhỏ hơn: phần giới thiệu mở đầu bởi người phỏng vấn, một
vài thông tin lịch sử gia đình từ Mayor Beame, và một cuộc thảo luận về việc ông có liên quan đến liên đoàn giáo viên của New York. Từng phần nhỏ này được liên kết tới 3 file. Phần tử phụ <area> sử dụng trong mỗi phần tử <fptr> để chỉ ra rằng phần chia nhỏ này tương ứng với chỉ một thành phần trong file liên kết và định ra chính xác thành phần đó. Ví dụ, phần chia nhỏ đầu tiên (Interviewer introduction) được liên kết tới file XML “FILE001” đặt giữa hai thẻ với giá trị thuộc tính ID là “INTVWBG” và “INTVWND”. Nó cũng được liên kết tới 2 file âm thanh khác, trong trường hợp này điểm bắt đầu và kết thúc của tài liệu liên kết được định ra bằng giá trị mã thời gian theo dạng HH:MM:SS (giờ:phút:giây).
3.2.2.6. Liên kết cấu trúc (Structural Links):
Vùng liên kết cấu trúc là thành phần đơn giản nhất trong số các thành phần chính của METS, chỉ chứa một phần tử đơn <smLink> (phần tử này có thể lặp lại nhiều lần). Vùng này cho phép ghi lại các siêu liên kết giữa các phần trong bản đồ cấu trúc, thường là phần tử <div>. Sẽ rất thuận lợi khi sử dụng METS để lưu trữ các trang web và để lưu trữ các biểu ghi của cấu trúc siêu liên kết.
Ví dụ về tài liệu METS cho một trang web có chứa một hình ảnh được liên kết tới một trang khác:
<div ID="P1" TYPE="page" LABEL="Page 1"> <fptr FILEID="HTMLF1"/>
<div ID="IMG1" TYPE="image" LABEL="Image Hyperlink to Page 2"> <fptr FILEID="JPGF1"/>
</div>
<div ID="P2" TYPE="page" LABEL="Page 2"> <fptr FILEID="HTMLF2"/>
</div>
Vùng thuộc tính được sử dụng để kết hợp các thuộc tính với nội dung trong đối tượng METS. Vùng này chứa một hoặc nhiều phần tử <behavior>, mỗi phần tử có một phần tử định nghĩa giao diện biểu thị định nghĩa tóm tắt cho cả bộ thuộc tính được trình bày trong một vùng thuộc tính cụ thể.
Phần tử <behavior> cũng có một phần tử <mechanism> dùng để chỉ chỗ tới một tập hợp mã để thực hiện thuộc tính được xác định tóm tắt trong phần định nghĩa giao diện.
Ví dụ về vùng thuộc tính:
<METS:behavior ID="DISS1.1" STRUCTID="S1.1" BTYPE="uva-bdef:stdImage" CREATED="2002-05-25T08:32:00" LABEL="UVA Std Image Disseminator" GROUPID="DISS1" ADMID="AUDREC1">
<METS:interfaceDef LABEL="UVA Standard Image Behavior Definition" LOCTYPE="URN" xlink:href="uva-bdef:stdImage"/>
<METS:mechanism LABEL="A NEW AND IMPROVED Image Mechanism" LOCTYPE="URN" xlink:href="uva-bmech:BETTER-imageMech"/>
</METS:behavior>
Tóm lại, lược đồ METS cung cấp một cơ chế linh hoạt cho siêu dữ
liệu về đối tượng thư viện số mang tính mô tả mã hóa cao, tính quản trị và có cấu trúc, đồng thời cũng giúp trình bày các liên kết phức tạp giữa các dạng khác nhau của siêu dữ liệu. Từ đó, nó cung cấp một chuẩn hữu ích cho việc trao đổi các tài liệu số giữa các kho dữ liệu. Thêm vào đó, METS còn cung cấp khả năng kết hợp các đối tượng số với các dịch vụ liên quan. Trên đây là khái quát những đặc điểm chính về lược đồ này, quá trình thực nghiệm sử dụng nó là cần thiết để có thể hiểu được một cách sâu sắc và đầy đủ về các khả năng METS đạt được.