- Giúp kiểm tra sự tồn tại của đối tượng thông tin - Mô tả ngôn ngữ, vị trí …của thông tin Một biểu ghi trong Metadata siêu dữ liệu bao gồm một hệ thống các thành tố hay còn gọi là các y
Trang 1I TỔNG QUAN VỀ METADATA & DUBLIN CORE 2
I.1 METADATA (Siêu dữ liệu) 2
I.2 DUBLIN CORE 4
Lịch sử: 4
Đặc điểm của Dublin Core 4
Thuộc tính của Dublin Core 5
Ý nghĩa của Dublin Core trong thư viện số 5
Các yếu tố của Dublin Core 5
II SỬ DỤNG DUBLIN CORE 9
II.1 CÁC QUY TẮC SỬ DỤNG 9
II.2 CÚ PHÁP CỦA DUBLIN CORE 9
II.3 ỨNG DỤNG CỦA DUBLIN CORE 10
B HƯỚNG DẪN THỰC HÀNH BIÊN MỤC SIÊU DỮ LIỆU DUBLIN CORE VỚI PHẦN MỀM TÍCH HỢP LIBOL 11
I Luồng nghiệp vụ 11
II Tài liệu được đưa vào cơ sở dữ liệu 12
2.1 Tạo hệ thống thư mục quản lý file dữ liệu 12
2.2 Tải dữ liệu từ máy trạm lên máy chủ 14
2.3 Xử lý tài liệu số 15
2.4 Thực hành biên mục theo DUBLIN CORE 21
Trang 2A LÝ THUYẾT
I TỔNG QUAN VỀ METADATA & DUBLIN CORE
I.1 METADATA (Siêu dữ liệu)
Khái niệm: Là dữ liệu về dữ liệu (data about data) hay dữ liệu có cấu trúc về
dữ liệu, bao gồm những yếu tố mô tả về đối tượng thông tin (sách, trang web, bang nhạc…)
Có thể định nghĩa: “Siêu dữ liệu là dữ liệu đi kèm với đối tượng thông tin và nó cho phép những người sử dụng tiềm năng có thể biết trước sự tồn tại cũng như đặc điểm của đối tượng thông tin này” (Dempsey và Heery, 1997).
Mục đích của Siêu dữ liệu:
- Hỗ trợ phát triển nguồn tin
- Hỗ trợ người dùng tin đánh giá thông tin mà không phải truy cập trực tiếp đến thông tin
- Giúp kiểm tra sự tồn tại của đối tượng thông tin
- Mô tả ngôn ngữ, vị trí …của thông tin
Một biểu ghi trong Metadata (siêu dữ liệu) bao gồm một hệ thống các thành
tố hay còn gọi là các yếu tố cần thiết để mô tả nguồn tin
Phân loại:
+ Trong thư viện truyền thống, siêu dữ liệu chủ yếu là các dạng mô tả hình thức và nội dung của tài liệu có trong kho thư viện, chính là các phiếu mô tả trong hộp phích, trong các cơ
sở dữ liệu thư mục – Nằm tách rời với đối tượng thông tin
+ Trong thư viện điện tử, siêu dữ liệu đã phát triển ở mức độ cao hơn với khái niệm rộng hơn, phát triển thành 5 loại siêu dữ liệu:
1 Siêu dữ liệu hành chính (Administrative)
2 Siêu dữ liệu mô tả (Desriptive)
3 Siêu dữ liệu bảo quản (Preservation)
4 Siêu dữ liệu sử dụng (Use)
5 Siêu dữ liệu kỹ thuật (Technical)
Trang 3-Thông tin bổ sung-Bản quyền và thông tin tái bản-Tài liệu về yêu cầu truy cập hợp pháp-Thông tin định vị
-Các tiêu chí số hóa-Thông tin kiểm tra của hệ thống quản lý
2.SDL mô
tả
Được dùng để mô tả hay nhận dạng các tài nguyên thông tin
-Các biểu ghi thư mục-Các hỗ trợ tìm kiếm-Định chỉ số chuyên biệt-Chú giải của người sử dụng
3.SDL bảo
quản
Các thông tin liên quan đến quản lý việc bảo quản các tài nguyên thông tin
-Các tài liệu về tình trạng, điều kiện vật lý của tài nguyên thông tin
-Các tài liệu về công tác bảo quản các phiên bản thông tin dưới dạng vật lý và số VD: làm mới DL; Di trú dữ liệu
4.SDL Kỹ
thuật
Các thông tin liên quan đến cách thức hoạt động của hệ thống cũng như siêu dữ liệu
-Thông tin về phần cứng và phần mềm-Thông tin số hóa.VD: khổ mẫu; tỷ lệ nén; độ nén; qui trình phân bố thông tin
-Thông tin về thời gian phản hồi của hệ thống-Dữ liệu về tính xác thực
-Thông tin về tái sử dụng nội dung và các phiên bản đa phương tiện
Trang 4I.2 DUBLIN CORE
Lịch sử:
Sở dĩ được đặt tên như vậy vì tại hội thảo đầu tiên bàn về thiết kế siêu dữ liệu tại Dublin, bang Ohio, Hoa Kỳ, năm 1992 nhằm tăng cường khả năng phát hiện nguồn tin trên www, đặc biệt đối tượng thông tin dạng mã hóa HTML
Chuẩn Dublin Core là chuẩn dùng để mô tả dữ liệu trong các Metadata (siêu dữ liệu) nhằm khai thác các tài liệu trong thư viện và trên các Web size thông qua mạng Internet Khác với MARC, SDL Dublin Core được thiết kế đơn giản hơn, với 15 yếu tố mô tả (15 metadata elements) nhằm không những mô tả loại hình đối tượng thông tin trong Thư viện mà cả trong viện bảo tàng, triển lãm nghệ thuật , tin học, mã hóa văn bản và các lĩnh vực khác có liên quan,…ngôn ngữ ban đầu là tiếng Anh
Tháng 9/2001, SDL Dublin Core được công nhận là tiêu chuẩn của Mỹ có mã số ANSI/NISO Z39.50-2001
Đặc điểm của Dublin Core
- Đơn giản trong tạo lập và bảo trì: Được thiết kế nhằm phục vụ những người không
chuyên, dễ sử dụng và rẻ nhưng hiệu quả mang lại lớn
- Ngữ nghĩa thông dụng, dễ hiểu và phổ biến: Khắc phục những khó khăn trong việc hiển thị các thuật ngữ
Ví dụ: Yếu tố “Tác giả” (Creator) được gán cho người tạo lập, nhà soạn nhạc, đạo diễn trong vai trò là tác giả chính Điều này giúp cho khi người tìm tin muốn tìm thông tin theo một tác giả cụ thể nào đó, nếu đồng ý chọn yếu tố “Tác giả - Creator” là yếu tố mô tả hợp lý Với diện bao quát rộng như vậy, nếu càng khái quát, tập hợp yếu tố mô tả này sẽ tăng cường được sự có mặt và truy cập của mọi loại hình nguồn tin, cả theo qui tắc và bất quy tắc.
- Phạm vi quốc tế: Phiên bản đầu tiên bằng tiếng Anh, tháng 11/1999, đã có
phiên bản của hơn 20 thứ tiếng khác như: Phần Lan, Nauy, Thái Lan, Nhật Bản, Pháp, Đức,
Bồ Đào Nha, Hy Lạp, Inđônêsia, Tây Ban Nha Tổ chức W3C (World Wide Web Consotium) phát triển chuẩn Dublin Core trên nền tảng kết hợp đa ngôn ngữ, sử dụng công nghệ (RDF: Resource Description FrameWork: khung mô tả tài nguyên thông tin), phục vụ cho môi trường tài nguyên thông tin điện tử mang tính chất đa văn hóa và đa ngôn ngữ
- Khả năng phát triển rộng: Với cơ chế mở, chuẩn Dulin Core có thể được mở rộng bởi các chuyên gia bằng việc gắn kết thêm các yếu tố mở rộng Khả năng này còn được thực hiện một cách đơn giản thông qua việc kết nối nhiều CSDL khác nhau thông qua mạng Internet
Trang 5Thuộc tính của Dublin Core
Mỗi một phần tử (Yếu tố mô tả) của Dublin Core được xác định bởi 10 thuộc tính theo tiêu chuẩn mô tả yếu tố dữ liệu điện tử ISO/IEC 11179 như sau:
1 Name (Tên): Tên nhãn gắn cho từng yếu tố mô tả
2 Identifier (Định danh): Tên xác định thống nhất gắn cho yếu tố mô tả
3 Version (Phiên bản): Phiên bản của yếu tố mô tả
4 Registration Authority (Thẩm quyền đăng ký): Thực thể có thẩm quyền đăng ký các phần tử mô tả
5 Language (Ngôn ngữ): Ngôn ngữ yếu tố mô tả được sử dụng
6 Definition (Định nghĩa): Trình bày rõ ràng khái niệm và bản chất của phần tử
7 Obligation (Bắt buộc): Chỉ ra khả năng có hay không thường xuyên xuất hiện phần
tử (Bao gồm cả giá trị)
8 Datatype (Kiểu dữ liệu): Chỉ ra loại dữ liệu trình bày giá trị của phần tử
9 Maximum Occurrence (Tần xuất xuất hiện tối đa): Chỉ ra những tần xuất lặp của phần tử
10 Comment (Chú thích): Lưu ý về ứng dụng của phần tử
Ý nghĩa của Dublin Core trong thư viện số
- Là một phương thức mô tả nguồn thông tin, đặc biệt là nguồn thông tin điện tử một cách hiệu quả Dublin Core càng đặc biệt phát huy tác dụng khi được sử dụng để mô tả tư liệu điện tử vốn khó xác định được loại hình và nội dung các yếu tố cần thể hiện
- Thay thế cho các dạng thức trình bày thông tin trước đây như MARC do sự đơn giản trong cấu trúc mà người sử dụng có thể tự thiết kế theo yêu cầu của riêng mình
- Cung cấp cho người sử dụng một phương án tiếp cận thông dụng thông qua các giao diện quen thuộc như web
- Tạo cho người cán bộ thư viện sự thuận tiện trong công tác khi không còn phải gò bó trong các trường, các yếu tố vốn dĩ đã rất đa dạng và phức tạp
Các yếu tố của Dublin Core
Dublin Core gồm có 15 yếu tố, trong từng trường hợp cụ thể, các yếu tố của chuẩn siêu dữ liệu Dublin Core đều không nhất thiết bắt buộc phải có đầy đủ và có thể lặp
Trang 6 Phân loại các yếu tố
Chủ đề (Subject) Tác giả phụ (Contributor) Mô tả vật lý (Description)
giả hoặc nxb đặt cho tài liệu
Báo cáo kết quả công tác Quí I/2007
chính về nội dung trí tuệ của nguồn tin
Đoàn Văn Cương
thể hiện bằng từ vựng có kiểm soát gồm tiêu đề đề mục, số phân loại, …
Công tác Ban quản lý
dự án
4 Description Phần thể hiện nội dung của nguồn
thông tin bao gồm cả tóm tắt của tư liệu văn bản hoặc nội dung của tư liệu nghe nhìn
lập, xuất bản hay ban hành, công bố tư liệu
Trung tâm Khoa học và Công nghệ Quốc gia
góp về mặt trí tuệ cho tư liệu nhưng không phải là tác giả chính
lập, xuất bản hay công bố tư liệu
Trang 7Updated - Ngày cập nhật văn bản
dung tư liệu
Báo cáo
liệu như kích cỡ, thời lượng,…Định dạng cũng còn được dùng để chỉ rõ phần mềm và phần cứng cần thiết để
sử dụng tư liệu
hiện tính đơn nhất của tư liệu
URLs và URNs, DOI, ISBD, ISSN
(số hiệu của văn bản), yếu tố này có thể bao gồm siêu dữ liệu về nguồn thông tin thứ hai nhằm khai thác tư liệu hiện hành
24/BQLDA BC
‘En’: Tiếng Anh
‘Fr’: Tiếng Pháp
những mối quan hệ của nó với tư liệu hiện hành Yếu tố này thể hiện những kết nối giữa những nguồn tư liệu có liên quan
Thường trực UBKH Sở Khoa học Công nghệ
14 Coverage Những đặc tính về không gian (Tên
địa danh hoặc tương đương với địa lý) và/hoặc thời gian của tư liệu (ngày tháng hoặc khoảng thời gian), qui mô, phạm vi quyền hạn của nguồn tài liệu
Toanvan.pdf
nguồn tài nguyên
Văn bản đã được ký nhận, có thể ban hành
Các yếu tố mở rộng
Thực tế sử dụng Dublin Core cho thấy mỗi yếu tố cơ bản còn gộp chứa trong nó một
Trang 8Vài thành tố phụ nhằm diễn đạt chi tiết hơn nội dung chính yếu tố đó Các thành tố phụ được coi là các yếu tố mở rộng và được thể hiện thông qua những khung mã hóa cụ thể Ví dụ khi thể hiện nội dung của một tài liệu, người ta cung cấp một vài cách tiếp cận khác nhau như qua
ký hiệu phân loại, tiêu đề đề mục, từ khóa
Tác giả phụ
Có giá trị (Valid)
Có hiệu lực (Available)Xuất bản (Issued)Hiệu đính (Modified)
Bảng thời kỳ của DCĐịnh dạng ngày tháng của W3C
Dublin Core
(Extent)Vật mang tin (Medium)
IMT loại tư liệu
Bao quát
Quyền
SO SÁNH SỰ TƯƠNG ỨNG CÁC YẾU TỐ THƯ MỤC GIỮA DUBLIN CORE
VÀ MỘT SỐ TRƯỜNG CỦA MARC 21 YẾU TỐ THƯ MỤC PHẦN TỬ MARC 21 YẾU TỐ DUBLIN CORE
Trang 9• Sử dụng khung mô tả nguồn (RDF – Resource Description Framework): RDF là một khuôn mẫu trao đổi và thể hiện thông tin trong môi trường Web Ngoài ra, RDF còn được coi là khung chuyển đổi giúp nhận biết nội dung các yếu tố cho dù chúng ở trong nhiều loại CSDL khác nhau.
• Hồ sơ áp dụng: Trên lý thuyết, tất cả 15 trường đều mang thuộc tính lựa chọn và lặp lại Tuy nhiên, mức độ tối thiểu theo khuyến cáo của các tổ chức có liên quan bao gồm các yếu tố như: Nhan đề, Tác giả, Ngày tháng, Mô tả, Ngôn ngữ Tùy theo mức độ chi tiết được đòi hỏi trong việc mô tả dữ liệu, người ta cũng có thể nhập thêm một số yếu
tố bổ trợ từ các Metadata khác Trong trường hợp đó, thuật ngữ sử dụng để mô tả cần được định nghĩa một cách chặt chẽ
II.2 CÚ PHÁP CỦA DUBLIN CORE
Ứng với cú pháp của mỗi dạng thức tài liệu như HTML, các yếu tố Dublin Core có các
bộ quy tắc cú pháp tương ứng Trong tài liệu HTML, các yếu tố Dublin Core được đặt trong
Trang 10<meta name= “….” Content= “….”>
Trong đó: meta: là thẻ meta
Name: là yếu tố siêu dữ liệuContent: là giá trị của yếu tố đó, đó chính là siêu dữ liệu của yếu tố đó
VÍ DỤ VỀ THẺ META NHƯ SAU:
<meta name=“DC.Title” content=“Bộ tài nguyên môi trường”>
<meta name=“DC.Publisher” content=“Phạm Thành An”>
Trong đó: Tên yếu tố Dublin Core như Title, Creator được bổ sung tiền tố “DC” vào trước và đưa vào thuộc tính name của thẻ <meta>
Ví dụ thẻ DC meta trong trang WEB của Trường Đại học Quốc gia Hà Nội
II.3 ỨNG DỤNG CỦA DUBLIN CORE
Siêu dữ liệu Dublin Core có thể tạo ra bằng hai cách:
+ Ngay từ khi tài nguyên được tạo lập hoặc trong quá trình cập nhật tài nguyên theo những nguyên tắc cú pháp nhất định
+ Được bổ sung vào tài nguyên nhờ những chương trình phần mềm tự động.Không những siêu dữ liệu được nhúng ngay trong tài nguyên dạng HTML, XML, RDF…mà chúng còn được đưa vào các cơ sở dữ liệu hoặc chỉ mục như Oracle, Alta Vista, OCLC, SiteSeach…nhằm cung cấp khả năng tìm kiếm tài liệu điện tử
Hoạt động của các chương trình thu thập và tạo siêu dữ liệu Dublin Core
Một số dịch vụ như “thu” một trang Web và tự động tạo siêu dữ liệu Dublin Core tương ứng cho trang Web đó, dưới hình thức các thẻ <meta> của ngôn ngữ HTML hoặc RDF/XML, thích hợp để nhúng vào đoạn đầu của mỗi trang Web (ứng với cặp thẻ <head>…
</head/>)
Qui trình sử dụng những dịch vụ này theo các bước sau:
Bước1: Nhập vào địa chỉ trang chủ của dịch vụ (chẳng hạn
Trang 11Phân hệ Sưu tập số có khả năng:
• Lưu giữ các file điện tử với số lượng lớn, khả năng cập nhật dữ liệu nhanh chóng và
dễ dàng đảm bảo dữ liệu chính xác, phục vụ tra tìm một cách hiệu quả
• Quản lý các tài khoản và xử lý các yêu cầu bạn đọc về tài liệu điện tử một cách nhanh chóng
• Quản lý tài liệu điện tử trên cả hai loại hình : có thu phí và không thu phí
I Luồng nghiệp vụ
Trang 12
II Tài liệu được đưa vào cơ sở dữ liệu
2.1 Tạo hệ thống thư mục quản lý file dữ liệu
Máy chủ lưu dữ liệu điện tử trong một thư mục Libolebook, người dùng có vai trò tổ chức và quản lý dữ liệu có thể tạo lập hệ thống thư mục để lưu trữ tài liệu một cách khoa học và thuận tiện
Các bước tạo lập hệ thống thư mục
1 Truy nhập menu Tài nguyên số hóa, chọn thư mục gốc lưu dữ liệu (Ví dụ
Libolebook)
2 Nhấp chọn chức năng Tạo thư mục con nhập tên thư mục con cần tạo
Trang 13• Đổi tên thư mục
1 Truy nhập menu Tài nguyên số hóa, chọn thư mục cần đổi tên
2 Nhấp chọn chức năng Đổi tên thư mục nhập tên mới của thư mục
3 Nhấn OK
Trang 14• Xóa thư mục
1 Truy nhập menu Tài nguyên số hóa, chọn thư mục cần xóa
2 Nhấn nút chức năng , hệ thống hiển thị thông báo việc khẳng định xóa thư mục Nhấn OK để xóa thư mục đã chọn, nhấn Cancel nếu không xóa
• Nhập khẩu từ file System
Từ máy chạm có thư mục, coppy đường dẫn thư mục vào cửa sổ hiện ra Lấy toàn bộ các file
dữ liệu đó tải lên Server
Chú ý: Chức năng này chỉ được thao tác khi đang ngồi trực tiếp trên máy chủ
• Đồng bộ với file System
Coppy trực tiếp hệ thống tài liệu điện tử lên Server, lúc này trong Server sẽ hiển thị tổng số file, chọn Đồng bộ với file System, cơ sở dữ liệu đó sẽ được quản lý toàn bộ trong hệ thống
2.2 Tải dữ liệu từ máy trạm lên máy chủ
Các bước đưa các file dữ liệu điện tử từ máy trạm lên cơ sở dữ liệu máy chủ:
1 Truy nhập menu Tài nguyên số hóa, chọn chức năng Dữ liệu điện tử, giao diện hiển
thị như sau:
2 Nhấp chọn thư mục đích sẽ lưu file, nhấn chuột trái chọn chức năng Tải lên file
Trang 15- Nhấn Browse để duyệt và xác định file dữ liệu trên máy trạm cần tải
- Tick một trong hai lựa chọn:
+ Giữ nguyên tên tệp nhập khẩu + Ghi đè lên tệp hiện thời (hệ thống sẽ sinh tên tệp mới )
- Nhấn nút Nhập khẩu, hệ thống sẽ thông báo các file đã được nhập
khẩu
2.3 Xử lý tài liệu số
Sau khi đã đưa các tài liệu số vào quản lý trong các thư mục nội dung, hệ thống hỗ trợ thực hiện các thao tác xử lý các tài liệu bao gồm:
- Biên mục tài liệu theo chuẩn biên mục Dublincore
- Gắn kèm/ bỏ gắn biểu ghi thư mục với tệp dữ liệu số
- Quy định cấp độ mật cho tài liệu số
- Chuyên đề của tài liệu: Tài liệu điện tử
- Đổi trạng thái dữ liệu: đang xử lý, chờ duyệt, khai thác
- Quy định dữ liệu thu phí hay miễn phí
Biên mục tài liệu theo chuẩn Dublincore
Các thao tác biên mục tài liệu:
1 Tại giao diện hiển thị danh sách các tệp dữ liệu số, tick chọn dữ liệu cần biên mục
Trang 162 Nhấn nút chức năng Biên mục, cửa sổ các trường biên mục hiển thị Nhập thông tin vào mẫu biên mục Dublincore
Hình 1: Giao diện biên mục theo dublincore
+ Tại mỗi trường nhập liệu, người dùng có thể sử dụng các nút chức năng:
|< Chuyển đến giá trị đầu tiên >| Di chuyển đến giá trị bản ghi
trước
< Di chuyển đến giá trị bản ghi trước > Chuyển đến giá trị cuối cùng
>* Tạo mới bản ghi giá trị thông tin x Xóa bản ghi thông tin hiện thời
Theo chuẩn biên mục Dublincore, có tổng cộng 15 trường dữ liệu biên mục
a Nhan đề (Title): Tên của nguồn thông tin thường do tác giả hoặc nhà xuất bản
đặt cho tài liệu