Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 133 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
133
Dung lượng
1,1 MB
Nội dung
PHD DO QUANG VINH Email: dqvinh@live.com HANOI - 2013 BÀI GIẢNG THƯ VIỆN SỐ TS ĐỖ QUANG VINH Email: dqvinh@live.com HÀ NỘI - 2013 NỘI DUNG I TỔNG QUAN VỀ THƯ VIỆN SỐ DL II MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL III CHỈ MỤC TÀI LIỆU IV TÌM KIẾM THÔNG TIN V CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐ VI THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE V CÁC CHUẨN SỬ DỤNG TRONG DL 5.1 Chuẩn trình bày ASCII, Unicode, SGML, HTML, XML, GIF, JPG, TIF, PNP a ASCII − American Standard Code for Information Exchange − Tiêu chuẩn Việt Nam: TCVN 5712-1993 − Văn có ký tự, lệnh trình bày (plain text file) Văn ký tự ASCII khả trình bày công thức toán học hoá học − Thường phải nhập thủ công vào CSDL − Ưu điểm: + Tìm kiếm theo toàn văn + Tìm kiếm nhanh + Dữ liệu có kích thước tệp nhỏ, dễ truyền mạng − Nhược điểm: + Hình thức đơn giản + Không bảo toàn nguyên dạng trang + Không hỗ trợ đa ngôn ngữ (255 ký tự) b UNICODE − Dùng cho văn − Tiêu chuẩn Việt Nam: TCVN 6909-2001 − Hỗ trợ đa ngôn ngữ: 16 triệu mã ký tự − Vẫn chương trình hỗ trợ UNICODE c NGÔN NGỮ ĐÁNH DẤU Tài liệu số – Ngày nhiều – Chuẩn đa dạng: Chuẩn độc quyền: DOC MS; PDF Adobe Chuẩn mở: SGML Chuẩn độc quyền – Phụ thuộc phần mềm – Phụ thuộc phát triển công ty – Đòi hỏi quyền Sự phát triển tài liệu số dẫn đến nhu cầu chuẩn mở Sự phát triển tài liệu số đặt yêu cầu mới: chuẩn liệu không độc quyền Có tính mở Không phụ thuộc phần mềm, tảng máy tính (Platform independent) Ngôn ngữ đánh dấu (Markup Language) Sử dụng cặp thẻ đánh dấu: bao gồm thẻ mở thẻ đóng: – Hiện nay: SGML, HTML XML Ngôn ngữ đánh dấu tổng quát chuẩn SGML Standard Generalized Markup Language SGML cách thức trình bày tài liệu số mã đánh dấu Là tiêu chuẩn ISO 8879 (Information processing Text and office systems - Standard Generalized Markup Language) Là chuẩn không độc quyền để soạn thảo tài liệu số có cấu trúc Sử dụng nhãn (thẻ) để đánh dấu gán ý nghĩa cho liệu Thí dụ: Đây nhan đề tài liệu Có thể tự phát triển khổ mẫu riêng, cần tuân thủ nguyên tắc Cấu trúc tài liệu SGML Gồm phần – Phần 1: Phần thông báo (Statement) – Phần 2: Định nghĩa phần tử tài liệu – DTD - Document Type Definition Thông báo mô hình logic tài liệu (có kiểu yếu tố nào, thẻ mô tả gì, ) – Phần 3: Nội dung tài liệu Định nghĩa phần tử liệu (DTD) DTD Document Type Definition DTD xác định khối thông tin hợp lệ tài liệu SGML DTD xác định cấu trúc tài liệu thông qua danh mục yếu tố thuộc tính 10 − Vì METS ứng dụng XML nên METS thực nhiều sản phẩm phần mềm có tương thích XML Có nhiều phần mềm sẵn có thực chức đa số miễn phí mã nguồn mở − Nhiều dự án khác tạo nhiều công cụ hỗ trợ quản trị tài liệu METS, đáng ý công cụ METS Java dự án Sáng kiến thư viện số, trường đại học Harvard Đây gói phần mềm cho phép tài liệu METS tạo nhiều nhà cung cấp tự động tích hợp vào kho lưu trữ thống 119 Đánh giá − Dù giai đoạn đầu, song METS xây dựng tốt số tiêu chuẩn cho DL tương lai coi tiêu chuẩn trì cho đối tượng DL Vì thiết kế nên METS kết hợp siêu liệu cho ảnh động, ảnh tĩnh, văn bản, âm thanh, Hầu hết dự án METS thực kho tài liệu ảnh tĩnh số dự án sử dụng phần văn tra cứu phần bổ sung cho file ảnh Ví dụ: + DL Oxford cấp quyền truy cập tích hợp đến hai loại tài liệu số Các kho tài liệu âm video số lượng hầu hết kho lớn thông báo dự định sử dụng METS tảng để phát triển siêu liệu tương lai 120 + Dự án bảo tồn tài liệu nghe nhìn gốc thư viện quốc hội Mỹ, dự án năm thiết kế kho lữu trữ hình ảnh động âm thanh, sử dụng METS giản đồ siêu liệu Một phần dự án đưa giản đồ mở rộng cho loại tài liệu số khác Điều làm cho việc áp dụng METS dễ dàng nhiều cung cấp thành phần thiết kế tốt cho loại siêu liệu dễ dàng gắn kết vào cấu trúc tổng thể − Tuy METS đưa cấu trúc chặt chẽ để lưu trữ siêu liệu, không phản ánh nội dung siêu liệu METS trở thành chuẩn quan trọng việc xây dựng kho số 121 − Trở ngại lớn cho việc sử dụng thành công METS việc dự án DL thường tạo giải pháp riêng giải vấn nội dung siêu liệu sử dụng điểm mạnh METS để mở rộng khả tra cứu chéo siêu liệu − Tuy nhiên, linh hoạt METS điểm yếu METS: phần giải pháp giải toán chuẩn hóa siêu liệu DL Việc cộng đồng DL chấp nhận sử dụng METS hỗ trợ sử dụng đầy đủ cần thiết việc phát triển cao cần thiết với dự án bảo quản nguồn tài liệu nghe nhìn gốc kể hướng cộng đồng đến chuẩn hóa tốt nội dung Khi hai hướng phát triển áp dụng hoàn toàn ta có tiêu chuẩn thực cho siêu liệu đối tượng DL 122 5.4 Giao thức tìm kiếm liên thư viện Z39.50 − Z39.50 giao thức Client/Server cho việc tìm kiếm lưu trữ thông tin từ CSDL lưu trữ xa; kết hợp tiêu chuẩn ANSI/NISO Z39.50 tiêu chuẩn ISO 23950 − Giao thức Z39.50 thư viện quốc hội Mỹ áp dụng Z39.50 sử dụng rộng rãi môi trường thư viện thường kết hợp thực hệ thống thư viện tích hợp phần mềm tham chiếu thư mục cá nhân − Giao thức Z39.50 thực thi vào năm 1970, bổ sung với phiên 1988, 1992, 1995 Các phiên cung cấp tính bao gồm: tìm kiếm, lưu trữ, xếp duyệt 123 − Cú pháp giao thức Z39.50 cho phép thực nhiều truy vấn phức tạp − Z39.50 công nghệ phát triển trước Web đời, nên hoàn toàn độc lập với phần mềm tìm kiếm Cách thức hoạt động giao thức Z39.50 − Z39.50 cung cấp ngôn ngữ chung cho hai hoạt động: lựa chọn thông tin dựa số tiêu chuẩn phục hồi thông tin Z39.50 tiêu chuẩn hóa cách thức giao tiếp client server phối hợp hoạt động có nhiều hệ thống máy tính, công cụ tìm kiếm CSDL khác − Z39.50 giao thức tầng ứng dụng theo mô hình tham chiếu OSI Giao thức hỗ trợ truy vấn giao tiếp tương tác trực tiếp với chương trình máy tính lưu trữ client server Hiện nay, Z39.50 sử dụng rộng rãi môi trường Internet theo giao thức TCP/IP 124 − Kiến trúc Client/Server phân tán định rõ ràng giao tiếp thu hồi thông tin Phần mềm NSD (client) độc lập với phần mềm quản lý thông tin thực tìm kiếm trả kết (server) Z39.50 không trọng vào giao diện NSD, đề cập chi tiết kỹ thuật thủ tục giao thức thuộc Z39.50 client (Z39.50 “origin”) như: khởi tạo truy vấn phục hồi thông tin cách thức truy vấn từ server, chi tiết kỹ thuật thủ tục giao thức thuộc Z39.50 server (Z39.50 "target") như: khả thực thi kết định dạng kết trả cho client − Thực tế, người ta không gọi mô hình Client/Server mà Origin/Target (gốc/đích) mạng DL, máy chủ coi máy khách máy chủ hệ thống khác 125 Mô hình kiến trúc chung Z39.50 126 − Origin phần tương tác client, thường “trong suốt” với NSD có khả truy cập đồng thời nhiều target khác Chức chuyển truy vấn sang định dạng chuẩn Z39.50; kết nối gửi truy vấn tới hệ thống lưu trữ CSDL; mô tả lại báo cáo, kết trả cho người tìm kiếm; đó: NSD không tương tác trực tiếp tới hệ thống đích Target đóng vai trò origin, có chức thời dịch truy vấn Z39.50 để tìm kiếm CSDL, nhận kết tìm kiếm trả cho origin − Cổng giao tiếp origin target chương trình có giao diện Một giao diện hoạt động có truy vấn từ origin tới target Một giao diện để xử lý giao tiếp phía client như: HTTP, Telnet, Z39.50, … 127 Cổng giao tiếp dựa môi trường Web 128 − Một chuỗi thông điệp client server thiết lập trình kết nối, khởi tạo phiên Z39.50 điều chỉnh thứ tự phiên hoạt động Sau đó, thứ tự thiết lập client truy vấn Z39.50 client thông dịch truy vấn sang dạng tiêu chuẩn hóa truyền cho Z39.50 server Server tìm kiếm CSDL trả kết Sau đó, Client truy vấn yêu cầu báo cáo từ tập kết bổ sung thêm truy vấn tới Server − Mỗi CSDL lưu trữ thông tin server Các báo cáo CSDL có cấu trúc thành phần liệu khác Mục tiêu Z39.50 hỗ trợ giao tiếp máy tính theo chuẩn sách hiểu hỗ trợ truyền liệu hệ thống độc lập cấu trúc, nội dung định dạng liệu hệ thống riêng biệt 129 Tìm kiếm CSDL − Khi tìm kiếm CSDL, truy vấn xác định điều kiện tìm kiếm Các truy vấn bao gồm dạng thuộc tính khác Ví dụ: + Nếu NSD tìm kiếm tên tác giả thuộc tính "use" xác định điều kiện tìm kiếm "author" + Nếu NSD tìm kiếm tất sách xuất vào ngày xác định thuộc tính "use" xác định điều kiện tìm kiếm "date of publication" thuộc tính "relation" xác định NSD muốn ngày xuất "greater than" ngày xác định 130 − ANSI/NISO Z39.50 liệt kê tất dạng thuộc tính giá trị tập hợp thuộc tính đăng ký Tập thuộc tính nhận dạng tiêu chuẩn hóa cho phép NSD sở chung cho giao tiếp hệ thống − Sau Server tìm kiếm CSDL, Server đưa tập kết phù hợp với điều kiện truy vấn Các client yêu cầu server trả lại ghi từ tập kết tìm kiếm bổ sung chi tiết 131 TÀI LIỆU THAM KHẢO Đỗ Quang Vinh (2009), Thư viện số - Chỉ mục Tìm kiếm, Nxb Đại học Quốc gia Hà Nội Cao Minh Kiểm (2006), MARC 21 rút gọn cho liệu thư mục, Trung tâm thông tin KHCNQG Arms W.Y (2003), Digital Libraries, MIT Press, Cambridge Lesk M (2005), Understanding Digital Libraries, 2nd Edition, Morgan Kaufmann, San Francisco Witten I.H., Bainbridge D (2003), How to Build a Digital Library, Morgan Kaufmann, San Francisco UNESCO Institute for Information Technologies in Education (2005), Digital Libraries in Education, Moscow 132 KẾT THÚC ! TRÂN TRỌNG CÁM ƠN ! 133