1. Trang chủ
  2. » Thể loại khác

Hieu va su dung Dublin Core

9 52 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

BẢN TIN LIÊN HIỆP THƯ VIỆN THÁNG 3/2003 HIỂU VÀ SỬ DỤNG DUBLIN CORE PHẠM MINH QUÂN Phòng Tài nguyên thông tin Thư viện ĐH Khoa học Tự nhiên, ĐHQG TP HCM W X I TỔNG QUAN VỀ METADATA VÀ DUBLIN CORE 1.1 METADATA Metadata liệu liệu hay gọi siêu liệu, thông tin chuyển tải ý nghĩa thông tin khác Metadata bao gồm tập hợp phần tử thiết yếu để mô tả nguồn thông tin Một biểu ghi Metadata bao gồm hệ thống thành tố hay gọi yếu tố cần thiết để mô tả nguồn thông tin Siêu liệu Metadata thư viện - hệ thống mục lục thư viện - bao gồm tập hợp biểu ghi với yếu tố mô tả sách hay tài liệu thư viện như: tác giả, nhan đề, xuất bản, đề mục, ký hiệu xếp giá Mối liên hệ nguồn thơng tin biểu ghi Metadata dạng độc lập: tương tự phiếu mô tả mục lục truyền thống dạng kết hợp tương tự phần biên mục tiền xuất CIP (Cataloguing In Publication), phần tử Metadata thể thân tài liệu nguồn thông tin Siêu liệu Metadata có hai chức chính: • Cung cấp phương tiện khai thác sở liệu có sẵn, • Thể nội dung, chất lượng đặc điểm CSDL thuận tiện sử dụng CSDL 1.2 DUBLIN CORE Chuẩn Dublin Core chuẩn dùng để mô tả liệu Metadata nhằm khai thác tài liệu thư viện web site thông qua mạng Internet Chuẩn Dublin Core bao gồm 15 yếu tố thiết lập từ hội thảo mang tầm cỡ quốc tế mang ý nghĩa kết hợp ngành khoa học: thư viện, tin học, bảo tàng, mã hoá văn lĩnh vực khác có liên quan ¾ Đặc điểm Dublin Core: - Đơn giản tạo lập bảo trì: thiết kế nhằm phục vụ người không chuyên; dễ sử dụng rẻ mang lại hiệu lớn 28 BẢN TIN LIÊN HIỆP THƯ VIỆN - - - ¾ THÁNG 3/2003 Ngữ nghĩa thơng dụng: khắc phục khó khăn việc hiển thị thuật ngữ Vd.: yếu tố (Creator) gán cho người tạo lập, nhà soạn nhạc, đạo diễn, vai trò tác giả Phạm vi quốc tế: tháng 11 - 1999, có phiên 20 thứ tiếng: Phần Lan, Na Uy, Thái Lan, Nhật, Pháp, Đức, Hy Lạp, Indonesia, Tây Ban Nha Tổ chức WWW phát triển Chuẩn Dublin Core tảng kết hợp đa ngôn ngữ, phục vụ cho môi trường tài nguyên thông tin điện tử mang tính chất đa văn hố đa ngơn ngữ Khả mở rộng: với chế mở, Chuẩn Dublin Core mở rộng chuyên gia việc gắn kết thêm yếu tố mở rộng Khả thực cách đơn giản thông qua việc kết nối nhiều CSDL khác thông qua mạng Internet Ý nghĩa Dublin Core Thư viện số - Là phương thức mô tả nguồn thông tin, đặc biệt nguồn thông tin điện tử cách có hiệu Dublin Core đặc biệt phát huy tác dụng sử dụng để mơ tả tư liệu điện tử vốn khó xác định loại hình nội dung yếu tố cần thể - Thay cho dạng thức trình bày thơng tin trước MARC đơn giản cấu trúc mà người sử dụng tự thiết kế theo yêu cầu riêng - Cung cấp cho người sử dụng phương án tiếp cận thông dụng thông qua giao diện quen thuộc Web - Tạo cho người cán thư viện thuận tiện cơng tác khơng phải gò bó trường, yếu tố đa dạng phức tạp 1.3 CÁC YẾU TỐ CỦA DUBLIN CORE: ¾ Phân loại yếu tố: NỘI DUNG SỞ HỮU TRÍ TUỆ THUYẾT MINH Nhan đề Tác giả Ngày tháng Đề mục Tác giả phụ Mô tả vật lý Mô tả Xuất Định danh Loại hình Bản quyền Ngơn ngữ Nguồn gốc Liên kết Nơi chứa 29 BẢN TIN LIÊN HIỆP THƯ VIỆN THÁNG 3/2003 ¾ Các yếu tố bản: Các yếu tố Dublin Core mang thuộc tính lựa chọn lặp lại Mỗi yếu tố có giới hạn hạn định, thuộc tính nhằm diễn giải xác ý nghĩa yếu tố Nhan đề (Title): Tên nguồn thông tin thường tác giả nhà xuất đặt cho tài liệu Tác giả (Creator): Người quan chịu tránh nhiệm nội dung trí tuệ nguồn thông tin Đề mục (Subject): Chủ đề nguồn thơng tin thể từ vựng có kiểm soát gồm tiêu đề đề mục, số phân loại, Mô tả (Description): Phần thể nội dung nguồn thơng tin bao gồm phần tóm tắt tư liệu văn nội dung tư liệu nghe nhìn Xuất (Publisher): Cơ quan, tổ chức chịu trách nhiệm tạo lập, xuất nguồn thông tin định dạng thực Tác giả phụ (Contributor): Cá nhân hay tổ chức có đóng góp mặt trí tuệ cho tư liệu khơng phải tác giả Ngày tháng (Date): ngày tháng có liên quan đến việc tạo lập, xuất hay công bố tư liệu Loại hình (Type): hình thức vật chứa nội dung tư liệu Mô tả vật lý (Format): Định dạng vật lý kích thước tư liệu kích cỡ, thời lượng, Định dạng dùng để rõ phần mềm phần cứng cần thiết để sử dụng tư liệu 10 Định danh tư liệu (Identifier): Là dãy ký tự số nhằm thể tính đơn tư liệu như: URLs URNs, ISBN, ISSN, 11 Nguồn gốc (Source): Nguồn gốc mà tư liệu tạo thành, yếu tố bao gồm siêu liệu nguồn thông tin thứ hai nhằm khai thác tư liệu hành 12 Ngôn ngữ (Language): Ngôn ngữ nội dung tư liệu, thành lập theo quy tắc RFC 1766 13 Liên kết (Relation): Một định danh cho nguồn thứ hai mối quan hệ với tư liệu hành Yếu tố thể kết nối nguồn tư liệu có liên quan 14 Nơi chứa (Coverage): Những đặc tính khơng gian và/hoặc thời gian tư liệu Không gian nơi chứa vùng sử dụng địa danh toạ độ Đặc tính thời gian yếu tố khoảng thời gian mà tư liệu đề cập tới thường sử dụng tên thời kỳ thời kỳ Đồ đá 15 Bản quyền (Rights): Thơng tin tình trạng quyền, kết nối tới thơng tin tình trạng quyền dịch vụ cung cấp thông tin quyền cho tư liệu ¾ Các yếu tố mở rộng: Thực tế sử dụng Dublin Core cho thấy yếu tố gộp chứa vài thành tố phụ nhằm diễn đạt chi tiết nội dung yếu tố Các thành tố phụ coi yếu tố mở rộng thể thơng qua khung mã hố cụ thể Ví dụ thể nội dung tài liệu, người ta 30 BẢN TIN LIÊN HIỆP THƯ VIỆN THÁNG 3/2003 cung cấp vài cách tiếp cận khác qua ký hiệu phân loại, tiêu đề đề mục, từ khoá YẾU TỐ YẾU TỐ MỞ RỘNG Nhan đề Nhan đề thay KHUNG MÃ HOÁ Tác giả LCSH, MeSH; DDC, LCC, UDC Đề mục Mô tả Mục lục (Table of Contents) Tóm tắt (Abstract) Xuất Tác giả phụ Ngày tháng Tạo lập (Created) Có giá trị (Valid) Có hiệu lực (Available) Xuất (Issued) Hiệu đính (Modified) Thuật ngữ loại hình Dublin Core Loại tài liệu Mô tả vật lý Bảng thời kỳ DC Định dạng ngày tháng W3C Kích thước thời lượng (Extent) Vật mang tin (Medium) IMT loại tư liệu Định danh URI Uniform Resource Identifier Nguồn gốc URI Uniform Resource Identifier Ngôn ngữ ISO 639-2 RFC 1766 Liên kết Nơi chứa Bản quyền 31 BẢN TIN LIÊN HIỆP THƯ VIỆN ¾ THÁNG 3/2003 So sánh đối chiếu với yếu tố mô tả AACR2 MARC DC AACR2 MARC Nhan đề Nhan đề 245$a Tác giả Tác giả 100, 245$c Đề mục Điểm truy cập khác 050, 082, 650 Mô tả Phụ nội dung, yếu tố bổ sung nhan đề 245$b Xuất Nơi nhà xuất 260$a, 260$b Tác giả phụ Tác giả liên quan Ngày Năm xuất Loại tài liệu Phụ hình thức Mơ tả vật lý Mơ tả vật lý 260$c 300 Định danh Nguồn gốc Ngôn ngữ Liên kết Phụ Nơi chứa Bản quyền II SỬ DỤNG DUBLIN CORE 2.1 CÁC QUY TẮC SỬ DỤNG ¾ Kiểm sốt từ vựng: Từ vựng sử dụng mô tả biểu ghi Dublin Core phải từ vựng có kiểm soát, lựa chọn từ hệ thống tiêu đề đề mục LCSH, MeSH nhằm mục đích kiểm sốt tính qn hệ CSDL hỗ trợ việc tìm kiếm, biên mục tự động 32 BẢN TIN LIÊN HIỆP THƯ VIỆN THÁNG 3/2003 ¾ Sử dụng Khung mô tả nguồn (RDF - Resource Description Framework): RDF khuôn mẫu trao đổi thể thông tin mơi trường Web Ngồi ra, RDF coi khung chuyển đổi giúp nhận biết nội dung yếu tố cho dù chúng nhiều loại CSDL khác ¾ Hồ sơ áp dụng: Trên lý thuyết, tất 15 trường mang thuộc tính lựa chọn lặp lại Tuy nhiên, mức độ tối thiểu theo khuyến cáo tổ chức có liên quan bao gồm yếu tố như: Nhan đề, Tác giả, Ngày tháng, Mô tả, Ngôn ngữ Tùy theo mức độ chi tiết đòi hỏi việc mơ tả liệu, người ta nhập thêm số yếu tố bổ trợ từ Metadata khác Trong trường hợp đó, thuật ngữ sử dụng để mơ tả cần định nghĩa cách chặt chẽ 2.2 SỬ DỤNG VỚI NGƠN NGỮ HTML HTML có thẻ (tag) để trình bày liệu Do đó, siêu liệu nhúng văn chúng phải đặt vùng thẻ văn nhằm giúp cho hệ thống tìm kiếm mục tự động nhận biết tìm giá trị phần mơ tả tài liệu * Ví d ụ: ? Mating Habits of the Northern Hairy Nosed Wombat Northern Hairy Nosed Wombats

The Northern Hairy Nosed Wombat is an animal native to Australia

? Giống văn Web thông thường, HTML Metadata có đặc điểm: ƒ Thuận tiện cho việc tìm kiếm xuất liệu cách tự động với trình duyệt ƒ Mỗi yếu tố bắt đầu "" ƒ Ngữ pháp bao gồm thành tố: TÊN (NAME) NỘI DUNG (CONTENT) Sử dụng cú pháp HTML: ƒ Mỗi yếu tố bao gồm phần: NAME CONTENT, * Ví dụ: ƒ Bất kỳ yếu tố lặp lại bỏ qua Trong trường hợp lặp lại, giá trị lặp thể thành dòng riêng biệt bao gồm chung phân cách dấu chấm phẩy (;), 33 BẢN TIN LIÊN HIỆP THƯ VIỆN THÁNG 3/2003 * Ví dụ 1: * Ví dụ 2: Tuy nhiên trình thực hiện, yếu tố lặp khuyến cáo liệt kê thành dòng cho yếu tố ƒ Quy ước cho việc nhúng Dublin Core Metadata HTML nhằm xác định tập trung yếu tố quy định sử dụng tiền tố "DC." để khai báo thể sau: META NAME="DC.Creator" META NAME="DC.Title" Không sử dụng: "DC.CREATOR" "DC.creator" "dc.Title" Trong trường hợp không sử dụng mã ASCII (các chương trình nhập liệu, file nguồn sử dụng ngơn ngữ không thuộc hệ Latin Trung Quốc, Nhật, Nga, Ả Rập,.) sử dụng quy ước phần thân văn 2.3 SỬ DỤNG VỚI NGÔN NGỮ XML Việc sử dụng Dublin Core XML kết phát triển ứng dụng CNTT công tác thư viện XML cho phép người sử dụng tự thiết kế khn dạng trình bày theo yêu cầu Tất cần thiết việc khai báo yếu tố file định nghĩa loại hình liệu (.DTD - Data Type Definition) file thể liệu File định nghĩa loại hình liệu DTD chứa giá trị khai báo hay nói cách khác, nơi khai báo định nghĩa loại hình liệu yếu tố Dublin Core cần thể Định nghĩa yếu tố bắt đầu dấu ! đặt dấu ngoặc nhọn < kết thúc dấu ngoặc nhọn > * Ví dụ: 34 BẢN TIN LIÊN HIỆP THƯ VIỆN THÁNG 3/2003 File thể liệu trình bày nội dung yếu tố phần mô tả file XML nằm vùng Trong trường hợp có giá trị lặp, giá trị yếu tố trình bày lặp lại giống phần trình bày với HTML.Các yếu tố Dublin Core trình bày đă khai báo file DTD thể sau: giá trị * Ví dụ: text En Richard, John E. Resource and environmental economics London : 1995

Ngày đăng: 15/12/2017, 17:08

TỪ KHÓA LIÊN QUAN

w