Tài liệu số và một số chuẩn mô tả tài liệu số

13 17 0
Tài liệu số và một số chuẩn mô tả tài liệu số

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TÀI LIỆU SỐ VÀ MỘT SỐ CHUẨN MÔ TẢ TÀI LIỆU SỐ ThS Đinh Thúy Quỳnh* ThS Hoàng Thúy Phương ** Tóm tắt: Ngày nay, phát triển khoa học công nghệ mở hướng mới, đầy triển vọng cho việc lưu trữ, xử lý thông tin quan thông tin thư viện Việc sử dụng kỹ thuật số để biểu diễn thông tin dẫn đến xuất loại hình tài liệu mới, tài liệu số Với nhiều ưu điểm trội, nguồn tài liệu góp phần làm thay đổi chất hoạt động thông tin – thư viện Tuy nhiên, để xây dựng thư viện số hay xa việc chia sẻ, khai thác thông tin thư viện nước giới bên cạnh yêu cầu sở vật chất, hệ thống mạng, nguồn lực thông tin, đội ngũ cán bộ,….các quan thông tin thư viện cần phải áp dụng chuẩn nghiệp vụ tiên tiến phù hợp với điều kiện thực tế Bài viết giới thiệu khái niệm, vai trò số chuẩn mô tả cho tài liệu số Từ khóa: Tài liệu số; Mơ tả tài liệu số Tổng quan vấn đề nghiên cứu mục tiêu nghiên cứu 1.1 Tổng quan vấn đề nghiên cứu Tài liệu số nói chung chuẩn mơ tả tài liệu số nói riêng vấn đề nhiều nhà thư viện học thông tin học quan tâm Nhiều tài liệu, báo, tạp chí nước đề cập đến vấn đề góc độ khác biên mục, chuẩn hóa, chia sẻ, khai thác, ứng dụng,… Đặc biệt, số hội thảo xoay quanh chủ đề tổ chức Hội thảo “MARC 21” tổ chức Thành phố Hồ Chí Minh năm 2000, Hội thảo “Xây dựng khổ mẫu MARC Việt Nam” tổ chức Trung tâm Thông tin Khoa học Công nghệ Quốc gia năm 2001, Hội nghị quốc tế “Thư viện Việt Nam hội nhập phát triển” tổ chức Thành phố Hồ Chí Minh vào ngày 28 – 30/8/2006, Hội nghị Quốc tế “Thư viện số châu Á” tổ chức Hà Nội tháng 12/2007, Hội thảo “Phổ biến kiến thức áp dụng tiêu chuẩn, chuẩn hoá nghiệp vụ cho hội viên hoạt động thư viện Việt Nam” tổ chức ngày 27/11/2015 Thư viện Quốc gia Việt Nam,… 1.2 Mục tiêu nghiên cứu Bài viết nhấn mạnh tầm quan trọng tài liệu số giới thiệu số chuẩn mô tả tài liệu số nhằm góp phần giúp thư viện so sánh, đánh giá lựa chọn chuẩn phù hợp xây dựng thư viện số Phương pháp nghiên cứu * Khoa Thư viện – Thông tin, Trường Đại học Văn hóa Hà Nội Trung tâm Thơng tin-Thư viện, Trường Đại học Kinh tế Quốc dân ** Bài viết sử dụng phương pháp tổng hợp, phân tích tư liệu; phương pháp quan sát, đối chiếu, so sánh Kết nghiên cứu 3.1 Vai trò tài liệu số hoạt động thông tin – thư viện Tài liệu số gì? Cho đến nay, có khơng định nghĩa tài liệu số đưa Điểm chung định nghĩa cho rằng: tài liệu số tài liệu mà thông tin chứa đựng biểu diễn dạng mã nhị phân, tức mã gồm hai số Nói cách khác, thơng tin tài liệu, phần hay toàn nội dung tài liệu chuyển thành bit thông tin liệu lưu trữ, khai thác máy vi tính, với hỗ trợ hay vài thiết bị chuyên dụng, phần mềm ứng dụng hệ thống mạng máy tính Tài liệu tạo lập trực tiếp từ máy vi tính, lưu trữ thành tệp liệu (file), với định dạng khác như: doc, exe, jpg…, tài liệu có nội dung kết q trình số hố loại hình tài liệu khác: giấy, ảnh, phim… tài liệu số Như vậy, tài liệu số vật mang tin mà thơng tin tạo lập phương pháp dùng tín hiệu số hình thành trình hoạt động quan, tổ chức, cá nhân Với cách hiểu đó, coi nguồn tài liệu số tập hợp có tổ chức sưu tập thông tin số thông tin tài liệu số hố Tài liệu số có đặc trưng mật độ thông tin lớn; cập nhật nhanh chóng, có khả truy cập theo nhiều dấu hiệu khác nhau, nhiều người dùng thời điểm mà không bị giới hạn thời gian hay vị trí địa lý; lưu trữ theo nhiều định dạng khác nhau,… Chính đặc trưng làm cho nguồn tài liệu số ngày giữ vai trò quan trọng hoạt động giao lưu thơng tin nói chung hoạt động thơng tin – thư viện nói riêng Chúng ta kể đến vai trị là: - Tài liệu số “hạt nhân” Thư viện số Thư viện số kho thơng tin số hố, cấu trúc để dễ dàng truy cập thông qua mạng máy tính hay mạng viễn thơng Số hố tài liệu xây dựng sưu tập số lựa chọn tối ưu để bảo tồn lâu dài tài liệu gốc quý hiếm, ngăn chặn rủi ro, huỷ hoại thời gian, thiên tai… Đối với hoạt động đào tạo học tập trường đại học, sưu tập số góp phần phục vụ hiệu cho công đổi nâng cao chất lượng đào tạo, đặc biệt đào tạo theo tín chỉ, đào tạo trực tuyến… Ngồi ra, nhờ đó, việc “học tập suốt đời” (long-life study) khuyến khích người học tham khảo tài liệu đâu, thời gian thuận tiện với họ Phần cốt lõi Thư viện số kho tài liệu số hay tập hợp sưu tập số Vì vậy, việc phát triển kho tài liệu số công việc quan trọng hàng đầu xây dựng Thư viện số - Tài liệu số sở hình thành phát triển ngành xuất điện tử Tài liệu số đời góp phần làm thay đổi diện mạo ngành xuất với hàng loạt sản phẩm tung thị trường với tên gọi loại hình Ấn phẩm điện tử hay Xuất phẩm điện tử Ý tưởng xuất điện tử ông Vanner Bush đưa hội thảo khoa học Viện Công nghệ Massachusertte (Mỹ) vào năm 1945 Sau lâu, có bùng nổ hàng loạt sản phẩm kỹ thuật số lợi kỹ thuật phủ nhận Năm 1991, sách điện tử chào đời Mỹ Từ năm 1998, sách điện tử xuất dạng đĩa tải xuống máy tính cá nhân từ Internet Các loại hình xuất phẩm điện tử có thị trường sách điện tử (EBook) báo, tạp chí điện tử (E-Journal) - Tài liệu số sở hình thành phát triển ngành công nghiệp nội dung số Sự phát triển có tính chất bùng nổ nguồn tài liệu số năm gần dẫn đến hình thành khái niệm “nội dung số” kéo theo đời ngành công nghiệp nội dung số Các sản phẩm chứa đựng nội dung số, tham gia thị trường, làm hình thành nên ngành công nghiệp nội dung số (CNNDS) Theo quan điểm Bộ Bưu chính- Viễn thơng Việt Nam: CNNDS ngành thiết kế, sản xuất, xuất bản, lưu trữ, phân phối, phát hành sản phẩm nội dung số dịch vụ liên quan Tập hợp hoạt động liên quan đến số hố thơng tin quy mơ lớn, có sản phẩm hồn chỉnh có khả đem lại lợi nhuận gọi ngành CNNDS Nguyên vật liệu đầu vào ngành CNNDS thông tin sản phẩm đầu thông tin Nhưng thông tin đầu CSDL, thơng tin có cấu trúc, có nội dung cụ thể cung cấp cho đối tượng cụ thể nhằm phục vụ cho hay số hoạt động kinh tế - xã hội định 3.2 Một số chuẩn mô tả tài liệu số MARC (MAchine Readable Cataloging - Biên mục đọc máy) MARC khổ mẫu cho phép máy tính lưu trữ truy xuất thông tin Mục lục tin học hoá bao gồm biểu ghi theo khổ mẫu MARC Nó có nghĩa người biên mục cần mã hố định nhãn thông tin biểu ghi Khổ mẫu MARC cấu trúc dành riêng cho liệu thư mục đưa vào máy tính Nét độc đáo đưa phương pháp mã hố rộng rãi dựa sở phân tích sâu sắc yếu tố thư mục Một biểu ghi thư mục thể khổ mẫu gồm phần: cấu trúc, nội dung mã Cấu trúc mã hoá đặc điểm khổ mẫu nói riêng, cịn nội dung hình thành từ yếu tố liệu thư mục xác định quy tắc biên mục Biểu ghi tập hợp trường, trường chứa đựng đơn vị thông tin biểu ghi Một trường chia thành nhiều trường Các nhãn trường mã số gồm số dùng để nhận dạng trường, trường kết thúc dấu kết thúc trường Trước trường có dấu phân định trường Việc tiếp cận tới trường thực trực tiếp nhờ danh sách ghi nhãn trường, độ dài địa Các nhãn trường có chữ số cho phép tạo 999 vùng thoả mãn nhu cầu nhận dạng tư liệu Các nhãn xác định liệu theo mức độ: chất (như tên người) chức (như tác giả chính) Mỗi trường có số để nói trường hợp xử lý đặt biệt (như rõ thêm nội dung trường hay quan hệ trường với trường khác ) Người ta sử dụng mã trường cố định nhằm nêu rõ hình thức nội dung tư liệu (ngơn ngữ, nước, luận án ) tạo điều kiện xếp dễ dàng Các trường giúp phân biệt yếu tố với yếu tố phụ (như tên riêng tác giả, phụ đề ) Cấu trúc biểu ghi tạo nhiều khả xếp, chọn lọc, đánh số, in ấn, tìm tin hiệu đính Cấu trúc khổ mẫu MARC 21 cấu trúc biểu ghi, bao gồm phần sau: - Đầu biểu (Leader): trường liệu đặc biệt có độ dài cố định chứa thơng tin trình xử lý biểu ghi - Danh mục (Directory): phần tiếp sau phần thông tin đầu biểu, dẫn trường liệu có biểu ghi - Các trường liệu (gồm hai nhóm trường kiểm sốt trường liệu): trường liệu có biểu ghi chứa liệu mô tả Các trường liệu trường có độ dài biến động (Variable Fields) Với cấu trúc này, khổ mẫu MARC tạo nhiều khả cho máy tính lựa chọn xếp liệu thư mục: - Cho phép người sử dụng dễ dàng truy cập tới biểu ghi - In thông báo sách mới, ấn phẩm thư mục, mục lục dạng thức khác nhau, nhãn gáy sách - Trao đổi liệu thư mục với thư viện khác nước giới Khổ mẫu MARC có ý nghĩa quan trọng biên mục tự động Vì phần mềm tư liệu phần mềm quản trị thư viện cần phải xây dựng tuân theo chuẩn khổ mẫu MARC Tính ưu việt tiêu chuẩn MARC: - Khổ mẫu tích hợp, độ dài trường liệu thay đổi, trường lặp tổ chức điểm truy cập - Cấu trúc khổ mẫu MARC cấu trúc biểu ghi, triển khai ứng dụng tiêu chuẩn quốc tế ISO 2709 - Khổ mẫu trao đổi thông tin (Format for lnformation Exchange) tiêu chuẩn tương đương Hoa Kỳ ANSI/NISO Z39.2 - Trao đổi thông tin thư mục (Bibliographic lnformation lnterchange) Hiện nay, MARC phát huy ảnh hưởng hoạt động thư viện bao gồm: chọn lọc, đặt mua, biên mục, tìm tin, biên soạn xuất thư mục, Khổ mẫu phục vụ đắc lực cho việc nối mạng truy cập thông tin trực tuyến Dublin Core Dublin Core lược đồ yếu tố siêu liệu phổ biến nhiều người biết đến Bộ yếu tố hình thành lần vào năm 1995 Sáng kiến yếu tố siêu liệu Dublin Core (Dublin Core Metadata Element Initiative) Tập hợp yếu tố siêu liệu gọi “cốt lõi” (core) thiết kế đơn giản bao gồm 15 yếu tố mơ tả cốt lõi (trong MARC 21 có 200 trường nhiều trường con) Tháng 9/2001, yếu tố siêu liệu Dublin Core ban hành thành tiêu chuẩn Mỹ, gọi tiêu chuẩn “The Dublin Core Metadata Element Set” ANSI/NISO Z39.85-2001 Bộ yếu tố siêu liệu Dublin Core thiết kế chủ yếu cho mục đích mơ tả bao gồm 15 yếu tố sau: STT Các yếu tố DC Mô tả Nhan đề tài liệu Nhan đề (Title) Tác giả tài liệu, bao gồm tác giả cá nhân Tác giả (Creator) tác giả tập thể Chủ đề tài liệu đề cập dùng để phân loại tài liệu Có Chủ đề (Subject) thể thể từ, cụm từ/(Khung chủ đề), số phân loại/ (Khung phân loại) Tóm tắt, mơ tả nội dung tài liệu Có thể bao gồm Tóm tắt (Description) tóm tắt, thích, mục lục, đoạn văn để làm rõ nội dung Nhà xuất bản, nơi ban hành tài liệu tên cá Nhà xuất (Publisher) nhân, tên quan, tổ chức, dịch vụ Tên người tham gia cộng tác đóng góp Tác giả phụ vào nội dung tài liệu, cá nhân, tổ chức (Contributor) Ngày, tháng ban hành tài liệu Có thể dùng chuẩn Ngày tháng (Date) ISO 8601 (http://www.w3.org/TR/NOTE-datetime) Mô tả chất tài liệu Dùng thuật ngữ mô Loại (kiểu) (Type) tả phạm trù kiểu: trang chủ, báo, báo cáo, từ điển Mơ tả trình bày vật lý tài liệu, bao Khổ mẫu (Format) gồm; vật mang tin, kích cỡ độ dài, kiểu liệu (.doc, html, jpg, xls, phần mềm ) Các thông tin định danh tài liệu, nguồn tham chiếu đến, chuỗi ký tự để định vị tài nguyên: 10 Định danh (Identifier) URL, URN (Uniform Resource Name), ISBN, ISSN, SICI (Serial Item & Contribution Identifier) Các thông tin xuất xứ tài liệu, tham chiếu đến nguồn mà tài liệu mơ tả trích ra/tạo ra, 11 Nguồn (Resource) nguồn là: đường dẫn (URL), URN, ISBN, ISSN 12 13 14 15 Các thông tin ngơn ngữ, mơ tả ngơn ngữ tài liệu: Có thể sử dụng chuẩn ISO 639 để mơ tả Ngôn ngữ (Language) ngôn ngữ cho tài liệu Mô tả thông tin liên quan đến tài liệu khác có Liên kết (Relation) thể dùng đường dẫn (URL), URN, ISBN, ISSN Các thông tin liên quan đến phạm vi, quy mô Diện bao quát mức độ bao quát tài liệu Phạm vi (Coverage) địa điểm, không gian thời gian, tọa độ Các thông tin liên quan đến quyền tài liệu Bản quyền (Right) Mục đích Dublin Core cung cấp phần tử liệu đơn giản cho việc mô tả tài liệu đối tượng khác Internet Tức tài liệu Internet có mơ tả thư tịch riêng chúng chúng có phần tử liệu mã hóa cho phần thơng tin tác giả, nhan đề, ngày tháng Theo tiêu chuẩn này, tài liệu tìm theo tên tác giả nhan đề Trên Internet, Dublin Core sử dụng ngày nhiều, Dublin Core trở thành siêu liệu mô tả tài liệu cho nhiều ứng dụng dựa Web Dublin Core cung cấp phần tử dễ dàng nhúng vào nhiều ứng dụng Web khác Dublin Core sử dụng nhiều cộng đồng văn hóa khác làm tăng tính mở cộng đồng muốn trao đổi chia sẻ tài nguyên cho Dublin Core có ưu điểm sau: - Đơn giản tạo lập bảo trì: thiết kế nhằm phục vụ người không chuyên; dễ sử dụng rẻ mang lại hiệu lớn - Ngữ nghĩa thơng dụng: khắc phục khó khăn việc hiển thị thuật ngữ VD: yếu tố (Creator) gán cho người tạo lập, nhà soạn nhạc, đạo diễn, vai trị tác giả - Phạm vi quốc tế: tháng 11 - 1999, có phiên 20 thứ tiếng: Phần Lan, Na Uy, Thái Lan, Nhật, Pháp, Đức, Hy Lạp, Indonesia, Tây Ban Nha Tổ chức WWW phát triển Chuẩn Dublin core tảng kết hợp đa ngôn ngữ, phục vụ cho mơi trường tài ngun thơng tin điện tử mang tính chất đa văn hố đa ngơn ngữ - Khả mở rộng: với chế mở, Chuẩn Dublin core mở rộng chuyên gia việc gắn kết thêm yếu tố mở rộng Khả thực cách đơn giản thông qua việc kết nối nhiều CSDL khác thông qua mạng Internet METS (Metadata Encoding and Transmission Standard - Tiêu chuẩn mã hóa truyền siêu liệu) Trong lĩnh vực thư viện số, đa dạng siêu liệu lớn nhiều Các chương trình phát triển thư viện số ln cần có số tiêu chuẩn mở rộng, đặc biệt cho việc mơ tả siêu liệu cho xác gần gũi Một chuẩn chung coi khung framework cho siêu liệu METS METS hoạt động tảng mà tiêu chuẩn trước tiêu chuẩn tương lai tích hợp cách logic có cấu trúc METS tiêu chuẩn thiết kế để mã hóa loại siêu liệu cho việc mơ tả hồn chỉnh đối tượng thư viện số Đó văn bản, hình ảnh tĩnh, video, âm hay loại tài liệu phức tạp khác môi trường VRML Cho đến gần đây, chưa có phương pháp chuẩn hóa cho việc mã hóa siêu liệu cho đối tượng thư viện số, dự án thư viện số thường có xu hướng hoạt động theo cách riêng họ, họ thường sử dụng phần mềm định dạng liệu mà đội dự án họ quen làm Khi số lượng dự án tăng lên cần thiết phải có tiêu chuẩn cho siêu liệu trở nên cấp thiết Và nhu cầu dẫn đến hình thành nên METS Liên đoàn thư viện số đưa loại siêu liệu cần thiết cho việc mơ tả đối tượng thư viện số Siêu liệu mô tả (Descriptive metadata), Siêu liệu quản trị (Administrative metadata), Siêu liệu cấu trúc (Structural) Chuẩn tổng hợp tất loại hình siêu liệu: siêu liệu mô tả, quản trị cấu trúc METS thiết kế cách chi tiết cho việc mô tả liệu ảnh văn lược đồ XML Schema Các tài liệu METS có phần yếu tố liên quan hầu hết đến đối tượng số, ngồi có khả mô tả đối tượng xác định bao gồm việc tham chiếu đến metadata mở rộng theo định dạng chuẩn hóa Cấu trúc METS: bao gồm thành phần sau: STT Thành phần Mô tả Đầu mục METS Bao gồm metadata thân tài liệu METS (METS Header) file như: tác giả, người tạo, ngày tháng, sản phẩm , trạng thái ; Siêu liệu mơ tả có nhiều trường hợp metadata mô tả (Descriptive Metadata) đối tượng TVS, xem xét metadata tài liệu METS bên hai Siêu liệu quản trị Cung cấp thông tin file tạo, lưu trữ, (Administrative quyền sở hữu trí tuệ, thơng tin tài ngun Metadata) tất nằm ngồi tài liệu; File tóm tắt (File Danh sách tất file gồm nội dung thực cho Inventory) đối tượng TVS; Sơ đồ cấu trúc Là thành phần tài liệu METS Cấu trúc (Structural Map) tóm tắt cấu trúc phân cấp cho đối tượng liên kết thành phần cấu trúc tới file nội dung; trúc Cho phép người tạo nội dung ghi lại liên kết nút cấu trúc logic structural map Trạng thái (Behaviors) Là ghi hoạt động phần mềm để truy nhập đối tượng METS thành phần Mỗi hoạt động có giao diện mơ tả tóm tắt hoạt động cho phiên hoạt động định Để có tồn lợi ích việc trao đổi siêu liệu cần có phải có loại chuẩn hóa: chuẩn hóa siêu liệu vật chứa (giống định dạng MARC lĩnh vực thư viện truyền thống), việc chuẩn hóa nội dung chứa vật chứa (cũng giống quy tắc biên mục hoạt động thư viện truyền thống) Định dạng METS cung cấp định dạng thứ nhất, tiêu chuẩn linh hoạt dùng để lưu trữ siêu liệu đa dạng kết hợp với đối tượng số dạng mà chia sẻ, tra cứu chéo, trao đổi, tìm kiếm dùng cho mục đích duyệt qua trình diễn Những ưu điểm METS: - Nó có khả lưu trữ mạnh mẽ, người đọc được, ln có khả trao đổi với ứng dụng tương thích XML - METS thiết kế cách rõ ràng rành mạch cho nhiều loại siêu liệu mà áp dụng cho đối tượng thư viện số METS có cấu trúc chặt chẽ dễ dàng tự động tạo từ ứng dụng khác (như CSDL quan hệ) - METS có khả cung cấp cho người sử dụng lựa chọn: nhúng trực tiếp siêu liệu vào cấu trúc tham chiếu tới siêu liệu lưu trữ từ bên Điều giúp cho METS có linh hoạt lớn dễ dàng việc chuyển đổi siêu liệu cũ - METS thiết kế để có khả sẵn sàng mở rộng yêu cầu cộng đồng thư viện số đưa kết hợp cách nhanh chóng theo quy trình xử lý đơn giản Vì METS có khả phát triển để trợ giúp cho thay đổi tương lai hoạt động thư viện số Tuy nhiên linh hoạt METS tạo số khó khăn cho việc ứng dụng METS cách rộng rãi: Nếu nội dung siêu liệu chưa chuẩn hóa vật chứa siêu liệu khơng có nhiều giá trị Trong thư viện truyền thống, MARC hỗ trợ quy tắc biên mục Anh –Mỹ, quy tắc cung cấp dẫn cho nội dung biểu ghi thư mục Và METS không phản ánh nội dung siêu liệu lưu trữ METS, điều khác với MARC làm siêu liệu MARC Ban biên tập METS cố gắng giải vấn đề cách đưa giản đồ mở rộng Liên kết cấu (Structural Links) sử dụng với METS Đó lược đồ XML bên ngồi đơn giản, mã hóa siêu liệu phổ biến Dublin Core, có khả liên kết với giản đồ METS kỹ thuật sử dụng XML phổ biến gọi Phần mở rộng Tuy nhiên, giống METS, nhiều trường hợp giản đồ vật chứa siêu liệu Ở số khía cạnh linh hoạt METS điểm yếu METS: Nó phần giải pháp giải vấn đề chuẩn hóa siêu liệu thư viện số MODS (Metadata Object Description Schema - Tiêu chuẩn mô tả đối tượng siêu liệu) Trong môi trường nối kết mạng mà siêu liệu mơ tả chuyển tiếp qua nhiều hệ thống gắn liền vào với nhiều loại siêu liệu khác, biểu ghi MARC phù hợp cho mục đích Tuy nhiên, MARC biểu ghi XML Bên cạnh đó, biểu ghi MARC lớn chi tiết hệ thống cần việc sử dụng thẻ số mã trường làm cho người khó hiểu khơng đào tạo đầy đủ Bởi vậy, người ta cần phiên MARC nhẹ nhàng đơn giản mà chấp nhận phần tử liệu từ biểu ghi MARC chuyển chúng vào khổ mẫu XML dễ dàng Vì tiêu chuẩn MODS đời để giải vân đề MODS sử dụng thẻ mà người ta dễ dàng hiểu để thay cho thẻ chữ số mã trường MARC (ví dụ: “Nhan đề” (“title”) thay cho “245”) Nó bỏ qua phần lớn phần tử liệu trường cố định, ngoại trừ mã khổ mẫu có tính vật lý (của mã 007) nhiều mã dành cho thể loại (của mã 008) Nó giới thiệu số cách thực hành hiệu mẻ MODS định nghĩa cấu trúc gọi “Tên” (“Name”) đại diện nhiều trường bao gồm trường để chứa đựng thông tin tên cá nhân, công ty cho tên hội nghị Cấu trúc sử dụng tên xuất hiện, mục liệu chính, phụ chủ đề MODS cung cấp 19 thành tố mức đỉnh cho việc mô tả đối tượng 64 thành tố mức Các thành tố dựa khía cạnh thư mục tiêu đề, tên người tạo người xây dựng, số lượng phân loại chủ đề, gồm thành phần thuộc lĩnh vực mô tả vật lý, thông tin giới hạn truy cập, thể loại MODS bao gồm chế cho phép mở rộng tập thành tố thơng qua việc trao đổi thông tin với tài liệu XML khác dựa cấu trúc nó; cho phép lưu lại đối tượng liên quan để tương tác theo cách Ngồi ra, cịn có khả dễ dàng việc điều khiển tính xác thực, mơ tả chi tiết theo mức mà cung cấp MODS xây dựng mà xu hướng khác mơ tả siêu liệu khơng có thống nhất: làm tương thích vấn đề Dublin Core cách cung cấp tập thành tố đa dạng cho phép mở rộng thêm cần Cũng ứng dụng XML, có khả hoạt động độc lập khơng ràng buộc với gói phần mềm Các cơng cụ viết chuyển đổi qua lại sang ghi MARCXML MODS sử dụng cho lượng lớn dạng tài liệu khác từ sách tới tài liệu đa phương tiện, lựa chọn phần lớn dự án thư viện số Nó sử dụng rộng rãi phần giới Thư viện số Khi sử dụng chung với chuẩn khác METS, làm tăng cường khả liên kết đầy đủ chiến lược tích hợp metadata làm tăng truy cập tài liệu số toàn cầu Tuy nhiên MODS trình phát triển hồn thiện, nên hạn chế tiềm ẩn xảy Cấu trúc MODS: gồm 19 thành tố sau: STT Thành phần Mơ tả Thơng tin nhan đề Là yếu tố bắt buộc, yếu tố gồm yếu tố con, (TitleInfo) số title, thành phần bắt buộc title sử dụng để ghi lại tiêu đề cho item yếu tố ngang cấp ghi vào thành phần tiêu đề phụ phần đối tượng để ghi tiêu đề chi tiết khác tiêu đề Tên (Name) Yếu tố tương đương với trường Tác giả (Creator) Tác giả phụ (Contributor) Dublin Core, name sử dụng để lưu tên người tổ chức có khả tạo nội dung tài liệu ghi lại người tạo nên tài liệu (như người mô tả người in) Thông tin gốc Là yếu tố gộp khác, mang thơng tin tổng hợp có (OriginInfo) nguồn gốc phổ biến biểu ghi Các yếu tố lưu lại ngày tạo cập nhật tài liệu (trong trường hợp tài liệu không phổ biến thảo) lưu vết tài liệu gốc Mô tả vật lý Là yếu tố gộp bao gồm yếu tố khác (PhysicalDescription) cho phép mô tả cách tính chất vật lý đối tượng Các tính chất liên quan đến tài nguyên điện tử: chúng bao gồm internetMediaType, thành phần ghi lại định dạng liệu mơ tả (thường có định dạng theo chuẩn MIME "text/html"), reformattingQuality (về độ phân giải số màu) tài liệu scan, digitalOrigin ghi lại xem đối tượng số hóa đối tượng định dạng lại theo thiết bị khác Hầu hết phương tiện truyền thống lưu lại thông tin tương đối theo phương thức hạn 10 10 11 12 13 14 15 chế, chủ yếu có yếu tố extent ghi lại số trang, yếu tố note ghi lại thơng tin khơng cấu trúc đặc tính vật lý đối tượng Chủ đề (Subject) Là yếu tố gộp sử dụng để mô tả đề mục item theo quy tắc phân loại Yếu tố hierarchicalGeographic dùng để định nghĩa phân cấp thuật ngữ địa lý , cho phép duyệt từ nhiều nơi (như phạm vi lục địa), từ nhiều địa điểm xác định (như thành phố) Yếu tố khác cartographics, cho phép lưu lại chi tiết theo tọa độ địa lý theo phạm vi đồ Tài liệu liên quan Đây yếu tố hữu ích ngữ cảnh (RelatedItem) sưu tập tài liệu có số mối liên hệ với (như sưu tập báo tuần san số hóa), relatedItem cho phép item liên quan nhúng theo thẻ có liên quan tài liệu MODS đầy đủ Thuộc tính type xác định hình thức mối quan hệ Yếu tố mang chức Relation (trong Dublin Core, có khả mềm dẻo cách sử dụng Mở rộng (Extension) Mặc dù MODS cung cấp tập yếu tố mở rộng Dublin Core, khơng thể làm thỏa mãn tất yêu cầu metadata cho đối tượng Trong trường hợp đó, cung cấp chế để dễ dàng mở rộng tập yếu tố cách cho phép ghi lại metadata lược đồ có khả thay đổi gắn vào tài liệu MODS record Thuộc tính nguồn Là kiểu đối tượng ghi như: văn bản, đa (TypeOfResource) phương tiện, đồ Các quy định sử dụng lấy từ danh sách riêng Thể loại (Genre) Là quy định đặc biệt typeOfResource, yếu tố cho phép quy định phân loại chi tiết để mô tả cho item Ngôn ngữ Ghi lại ngôn ngữ mô tả item (Language) Tóm tắt (Abstract) Mơ tả nội dung tóm tắt item liên kết tới định dạng tương tự Mục lục Liệt kê nội dung tài liệu ghi lại cách (TableOfContents) rõ ràng cung cấp liên kết tới danh sách Người sử dụng mục Quy định đối tượng người sử dụng (ví dụ vị tiêu (TargetAudience) thành niên, niên) cho tài liệu Ghi (Note) Là yếu tố ghi lại thông tin cần lưu ý Phân loại Số phân loại tài nguyên theo lược đồ (Classification) thơng qua ví Tiêu đề thư viện quốc hội Mỹ phân loại số thập phân Dewey 11 Số mã phù hợp với lược đồ thông qua số ISBN ISS 17 Vị trí (Location) Ghi lại vị trí vật lý tài liệu, bao gồm kho lưu trữ số giá item 18 Hạn chế truy cập Thông tin việc truy cập item bị hạn chế nào, (AccessRestriction) bao gồm thông tin quyền 19 Thông tin biểu ghi Một yếu tố gộp thông tin tạo ghi MODS bao (RecordInfo) gồm ngày tạo, số điều khiển Mặc dù sinh từ MARC21 chi tiết nhiều tiêu chuẩn Dublin Core, MODS lại quy tắc biên mục MARC21 Tương tự Dublin Core, khơng có nhiều trường phụ thuộc tất trường lặp lại MODS chứa đựng nhiều giá trị từ MARC, xong có nhiều điểm khác với MARC21: Khơng có khái niệm “dẫn mục chính” (“main entry”) “dẫn mục phụ” (“added entry”), tất tác giả đơn giản “tác giả”; biểu ghi có nhiều nhan đề mà khơng có “nhan đề chính” (“main title”) Khi biểu ghi MARC21 biên dịch tới MODS, người ta có biểu ghi XML mang dấu ấn MARC Biểu ghi MODS tạo từ siêu liệu thư tịch mà không khởi đầu từ mục lục thư viện, ví dụ trích dẫn báo, thường sử dụng cở sở liệu có trộn lẫn mục lục thư viện liệu biên mục khác 16 Định danh (Identifier) Kết luận Như vậy, thấy, giới có nhiều chuẩn mơ tả liệu khác Chẳng hạn chuẩn biên mục tự động máy tính MARC Dublin Core quy định cấu cấu trúc liệu cho biểu ghi sở liệu hệ thống thơng tin cụ thể, MARC quy định 200 trường mơ tả liệu cịn Dublin Core chuẩn đời sau quy định 15 trường rút gọn, đơn giản, phù hợp với tài liệu mơi trường Internet nay, cịn tài nguyên số phát triển mở rộng liệu đa phương tiện chuẩn METS MODS phát triển ứng dụng,…Do vậy, tùy nhu cầu sử dụng quy mô thư viện mà đưa định việc lựa chọn chuẩn mô tả cho phù hợp TÀI LIỆU THAM KHẢO Tiếng Việt Nguyễn Tiến Đức (2005), “Xây dựng thư viện điện tử vấn đề số hoá tài liệu Việt Nam”, Thông tin Tư liệu, (2) Nguyễn Minh Hiệp (2004), “Thế giới Thư viện số”, Thư viện – Công nghệ thông tin, (4), tr – 13 Khổ mẫu MARC 21 cho ỉìệu thư mục (2005), Trung tâm Thông tin Khoa học Công nghệ Quốc gia, Hà Nội Cao Minh Kiểm (2000), “Thư viện số: Định nghĩa vấn đề”, Thông tin Tư liệu, (3), tr – 11 Tiếng Anh 12 Linda Cantara (2005), METS: The Metadata Encoding and Transmission Standard , truy cập ngày 25/11/2016, địa trang web: http://www.columbia.edu/cu/libraries/inside/units/bibcontrol/osmc/cantara.pdf Stuart L Weibel (2000), The Dublin Core Metadata Initiative Mission, Current Activities, and Future Directions”, truy cập ngày 25/11/2016, địa trang web: http://www.dlib.org/dlib/december00/weibel/12weibel.html H Witten, D Bainbridge (2002), How to Build a Digital Library, Elsevier Science Inc., NY http://www.loc.gov/standards http://dublincore.org/ 13 ... rằng: tài liệu số tài liệu mà thông tin chứa đựng biểu diễn dạng mã nhị phân, tức mã gồm hai số Nói cách khác, thơng tin tài liệu, phần hay toàn nội dung tài liệu chuyển thành bit thông tin liệu. .. tích tư liệu; phương pháp quan sát, đối chiếu, so sánh Kết nghiên cứu 3.1 Vai trò tài liệu số hoạt động thông tin – thư viện Tài liệu số gì? Cho đến nay, có khơng định nghĩa tài liệu số đưa Điểm... liệu có nội dung kết q trình số hố loại hình tài liệu khác: giấy, ảnh, phim… tài liệu số Như vậy, tài liệu số vật mang tin mà thơng tin tạo lập phương pháp dùng tín hiệu số hình thành trình hoạt

Ngày đăng: 18/03/2021, 13:30

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan