BAI GIANG TVS 11 PHD DO QUANG VINHPHD DO QUANG VINH Email Email dqvinh@live comdqvinh@live com HANOI 2013HANOI 2013 mailto dqvinh@live com 22 BÀI GI NG TH VI N SẢ Ư Ệ Ố TS Đ QUANG VINHỖ Email dqvi[.]
PHD. DO QUANG VINH Email: dqvinh@live.com HANOI 2013 BÀI GIẢNG THƯ VIỆN SỐ TS. Đ Ỗ QUANG VINH Email: dqvinh@live.com HÀ NỘI 2013 NỘI DUNG I TỔNG QUAN VỀ THƯ VIỆN SỐ DL II MƠ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL III CHỈ MỤC TÀI LIỆU IV TÌM KIẾM THƠNG TIN V CÁC CHUẨN SỬ DỤNG TRONG THƯ VIỆN SỐ VI THỰC HÀNH HỆ PHẦN MỀM THƯ VIỆN SỐ GREENSTONE V CÁC CHUẨN SỬ DỤNG TRONG DL 5.1. Chuẩn trình bày ASCII, Unicode, SGML, HTML, XML, GIF, JPG, TIF, PNP a ASCII American Standard Code for Information Exchange Tiêu chuẩn Việt Nam: TCVN 57121993 Văn bản chỉ có ký tự, khơng có lệnh trình bày (plain text file). Văn bản bằng ký tự ASCII khơng có khả năng trình bày các cơng thức tốn học và hố học Thường phải được nhập thủ cơng vào CSDL Ưu điểm: + Tìm kiếm được theo tồn văn + Tìm kiếm nhanh + Dữ liệu có kích thước tệp nhỏ, dễ truyền trên mạng Nhược điểm: + Hình thức đơn giản + Khơng bảo tồn được ngun dạng của trang + Khơng hỗ trợ đa ngơn ngữ (255 ký tự) b UNICODE Dùng cho văn bản Tiêu chuẩn Việt Nam: TCVN 69092001 Hỗ trợ đa ngơn ngữ: 16 triệu mã ký tự Vẫn cịn ít chương trình hỗ trợ UNICODE c NGƠN NGỮ ĐÁNH DẤU Tài liệu số – Ngày càng nhiều – Chuẩn đa dạng: Chuẩn độc quyền: DOC của MS; PDF của Adobe Chuẩn mở: SGML Chuẩn độc quyền – Phụ thuộc phần mềm – Phụ thuộc sự phát triển của cơng ty – Địi hỏi bản quyền Sự phát triển tài liệu số dẫn đến nhu cầu về chuẩn mở Sự phát triển của tài liệu số đã đặt ra u cầu mới: chuẩn dữ liệu khơng độc quyền Có tính mở Khơng phụ thuộc phần mềm, nền tảng máy tính (Platform independent) Ngơn ngữ đánh dấu (Markup Language) Sử dụng các cặp thẻ đánh dấu: bao gồm thẻ mở và thẻ đóng: – và Hiện nay: SGML, HTML và XML Ngơn ngữ đánh dấu tổng qt chuẩn SGML Standard Generalized Markup Language SGML là cách thức trình bày tài liệu số bằng các mã đánh dấu Là tiêu chuẩn ISO 8879 (Information processingText and office systems Standard Generalized Markup Language) Là một chuẩn khơng độc quyền để soạn thảo tài liệu số có cấu trúc Sử dụng các nhãn (thẻ) để đánh dấu và gán ý nghĩa cho dữ liệu. Thí dụ: Đây là nhan đề tài liệu Có thể tự phát triển khổ mẫu riêng, chỉ cần tuân thủ nguyên tắc Cấu trúc tài liệu SGML Gồm 3 phần – Phần 1: Phần thơng báo (Statement) – Phần 2: Định nghĩa phần tử tài liệu – DTD Document Type Definition Thơng báo mơ hình logic của tài liệu (có các kiểu yếu tố nào, thẻ mơ tả là gì, ) – Phần 3: Nội dung tài liệu Định nghĩa phần tử dữ liệu (DTD) DTD Document Type Definition DTD xác định các khối thơng tin hợp lệ của một tài liệu SGML DTD xác định cấu trúc của tài liệu thơng qua một danh mục các yếu tố và thuộc tính 10