Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 74 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
74
Dung lượng
2,91 MB
Nội dung
Lời nói đầu Ngày nay với sự phát triển không ngừng của nền tin học thế giới, đã thúc đẩy quá trình tin học hoá ngày càng được ứng dụng rộng rãi trên mọi lĩnh vực. Công nghệ thông tin đóng vai trị quan trọng, là nhân tố quyết định sự tồn tại và phát triển của xã hội. Tin học làm giảm lao động bằng sức lực, tiết kiệm thời gian, thuận tiện hơn cho công việc của con người. đặc biệt là thu hẹp khoảng cách không gian giữa con người với con người và môi trường xung quanh. Từ hàng ngàn năm nay, thư viện luôn là nơi lưu trữ tri thức của nhân loại. Với nhu cầu học tập ngày càng cao trong khi khả năng cung cấp tài liệu của thư viện có một số hạn chế. Việc áp dụng công nghệ thông tin vào lĩnh vực thư viện đem lại nhiều lợi ích cho người đọc,cung cấp tài nguyên tri thức dưới dạng các văn bản điện tử giúp người đọc dễ dàng tra cứu và sử dụng.Việc xây dựng thư viện số đòi hỏi rất nhiều công sức do yêu cầu khắt khe trong nghiệp vụ thư viện, do đó nhiều thư viện đã tận dụng các phần mềm mã nguồn mở và điều chỉnh cho phù hợp với mục đích của mình. Do còn nhiều hạn chế về mặt thời gian cũng như kiến thức và kinh nghiệm nên không thể tránh khỏi nhiều sai sót, em rất mong được sự đóng góp ý kiến của thầy cô để em hoàn thành đề tài này. Sinh viên thực hiện: Trần Văn Hiếu 1 Mục lục Lời nói đầu 1 Mục lục 2 Bảng các từ viết tắt 4 Danh mục hình vẽ 5 CHƯƠNG 1: TỔNG QUAN VỀ THƯ VIỆN SỐ 6 1.1. Giới thiệu 6 1.2. Các chuẩn trong thư viện số 6 1.2.1 Biên mục Analog 6 1.2.2 Biên mục digital 7 1.2.2.1 Vai trò c a MARCủ 7 1.2.2.2 Dublin Core 8 1.2.2.3 Nhóm Dublin Core Metadata 9 1.2.2.4 So sánh 2 chu n biên m c MARC v Dublin Coreẩ ụ à 13 1.2.2.5 Chuy n i hai chu n biên m cể đổ ẩ ụ 14 1.3.Sự phát triển của thư viện số hiện nay trên thế giới và ở ViệtNam 16 1.3.1 Giới thiệu chung 16 1.3.2 Loại hình tài liệu 19 1.3.3 Dạng lưu trữ tài liệu 22 CHƯƠNG 2: XÂY DỰNG THƯ VIỆN SỐ 26 2.1. Sơ lược về phần mềm thư viện số 26 2.1.1 Triển vọng 27 2.1.2 Công nghệ và cơ sở hạ tầng 31 2.1.3 Dự án thư viện số 34 2.1.4 Phạm vi của Hệ thống Thư viện Số 35 2.1.5 Hướng dẫn hệ thốn 37 2.2. Các thành phần yêu cầu đối với một hệ thống thư viện số 38 2.2.1 Các máy chủ nhập liệu và xuất bản 39 2.2.2 Các máy chủ đăng ký 40 2.2.3 Các máy chủ tham chiếu, đánh danh mục và biên mục 41 2.2.4 Các máy chủ dữ liệu 42 2.2.5 Máy chủ tính toán và thống kê 43 2.2.6 Máy chủ tính phí 44 2.2.7 Máy chủ chuyển đổi mô tả 44 2.2.8 Hệ thống thư viện cá nhân 47 2.3. Một số phần mềm nguồn mở thư viện số tiêu biểu 47 2.3.1 Phần mềm xây dựng bộ sưu tập Greenstone 47 2.3.2 Phần mềm gặt hái metadata: dlbox 48 2.3.3 Phần mềm truy hồi và quản lý thông tin: SiteSearch 48 2.3.4 Phần mềm chuyển đối MARCDublin Core và Dublin Core-MARC: MarcEdit 49 2.3.5 Biên mục Phần mềm thư viện số DSpace (DSpace Cataloguing) 49 CHƯƠNG 3: XÂY DỰNG BỘ SƯU TẬP THƯ VIỆN SỐ VỚI GREENSTON 51 3.1. Giới thiệu về Greenston 51 3.2 Cách cài đặt Greenstone: 54 3.2.1 Trên Window 54 3.2.2 Trên Linux 55 3.3 Sử dụng phần mềm thư viện số Greenstone để tạo một bộ sưu tậ 56 2 3.3.1 Bộ sưu tập thông ti 56 p 58 3.3.2 Nguyên tắc chọn tài liệu để số 58 bản 63 3.3.3 Tạ và x uất bản bộ s 63 3 Bảng các từ viết tắt STT Từ viết tắt Diễn giải 1 ANSI American National Standard Institute 2 CANMARC Canada MARC 3 CNTT Công nghệ thông tin 4 DC Dublin Core 5 DLS Digital Library System 6 HTTP Hyper Text Transfer Protocol 7 IE Internet Explorer 8 IFLA International Federation of Library Associations 9 ISO International Standard Organization 10 JRE Java Runtime Environment 11 JSE Java Standard Edition 12 MARC MAchine-Readable Cataloging 13 NGO Non-Governmental Organization 14 OAI Open Archives Initative 15 OAI Open Archives Initative 16 OCR Optical Character Recognition 17 SGML GreenStone Markup Language 18 TV Thư viện 19 UNESCO United Nation Educational Scientific and Cultural Organization 20 UNIMARC Chuẩn MARC được công nhận bởi IFLA 21 USMARC MARC oF United States 22 WRLC Washington Research Library Consortium 23 WRLC Washington Research Library Consortium 24 XML Extensible Markup Language 4 Danh mục hình vẽ Hình 1 : Trang giới thiệu bộ sư tập của trường đại học Waitak 18 Hình2 19 Hình 3 : Danh mục tạp chí của nhà xuất bản IIS 20 Hình 4 : Bộ sưu tập Argu 21 Hình5 22 Hình 6 : Thư viện nhạ 23 Hình7 25 Hình 8 : Hệ thống thư viện s 36 Hình9 38 Hình10 55 Hình 11 : Quá trình xây dựng bộ sưu 58 H12 : Cửa sổ ứng dụn 64 Hình13 65 Hình 14 : Chọn chuẩn biên mụ 65 Hình15 67 Hình 16 : Xác định phân loạ 67 Hình17 68 Hình 18 : Xây bộ sưu tậ 69 Hình19 69 Hình 20 : Trang chủ bộ sưu tập được hiển th 70 Hình21 71 Hình 22 : Duyệt bộ sưu tập theo tác gi 71 Hình23 72 Hình 24 : Tìm kiếm trong bộ sưu tậ 72 Hình 25 : Xuất bản bộ sưu tập ra CD-RO 73 5 CHƯƠNG 1: TỔNG QUAN VỀ THƯ VIỆN SỐ 1.1. Giới thiệu Một thư viện số là Một thư viện trong đó những tập hợp được cất giữ trong những khuôn dạng số (ngược với bản in, dạng thu nhỏ hay phương tiện truyền thông khác) và có thể tiếp cận bởi những máy tính.Nội dung số được có thể cất giữ địa phương, hay được truy nhập từ xa qua những mạng máy tính. Một thư viện số là Một hệ thống tìm tin kiểu thông tin Thư viện số là tập hợp những bộ sưu tập thông tin của các đối tượng số hoặc đã được số hóa có tổ chức và tập trung. Tập trung theo đề tài hay chủ đề và có tổ chức để thông tin dễ truy cập và lưu trữ theo những tiêu chuẩn chuyên biệt cung cấp hai khả năng chính: • Phương thức truy cập, chọn lọc, hiển thị tài nguyên số (dành cho người sử dụng); • Phương thức xây dựng, tổ chức và lưu hành (dành cho cán bộ thư viện). 1.2. Các chuẩn trong thư viện số Giới thiệu về chuẩn biên mục analog,digital.Vai trò của các chuẩn MARC,Dublin Core và việc chuyển đổi MARC-Dublin Core và Dublin Core MARC: 1.2.1 Biên mục Analog • Trong thư viện truyền thống, người ta biên mục để tạo nên những biểu ghi thư tịch nhằm xây dựng hệ thống tra cứu qua mục lục phiếu. Biểu ghi thư tịch hay mục lục phiếu miêu tả lý lịch của tài liệu: nhan đề, tác giả, đề mục, xuất bản, vv… Khi sử dụng máy tính, biểu ghi thư tịch này được biểu thị bằng một dạng thức máy đọc được (MARC). Cách biên mục này chỉ thể hiện được dạng thư tịch tức lý lịch chứ không có toàn văn và đa phương tiện, được gọi là biên mục theo dạng liên liến (analog). • Phiếu mục lục và kho sách tách rời nhau. 6 • Biểu ghi thư tịch MARC nhằm trao đổi dữ liệu qua máy tính hay trên mạng máy tính . 1.2.2 Biên mục digital • Trong môi trường số, dữ liệu được đóng gói bằng ngôn ngữ XML. Cách biên mục phải thay đổi qua môi trường Web, nghĩa là các dữ liệu thư tịch phải được đóng gói, người ta gọi là biên mục theo dạng kỹ thuật số (digital). Các biểu ghi thư tịch trở thành siêu dữ liệu thư tịch – metadata. Vậy Metadata chính là phiếu mục lục miêu tả lý lịch tài liệu được phát sinh tự động trong môi trường số. • Metadata gắn liền với nội dung văn bản • MARC chuyển đổi thành MARC-XML • Chuẩn Dublin Core đáp ứng yêu cầu tổ chức tài nguyên số 1.2.2.1 Vai trò của MARC Việc sử dụng máy tính trong hoạt động thư viện đã làm thay đổi rộng lớn công tác biên mục. Ban đầu thay vì Thư viện Quốc hội Hoa Kỳ cung cấp phiếu mục lục cho các thư viện thì khi sử dụng máy tính họ chỉ cung cấp các biểu ghi trên băng từ, các thư viện nhận băng từ, download dữ liệu, và tự in thành phiếu mục lục. Việc sử dụng máy tính như thế đòi hỏi phát sinh ra một chuẩn thư tịch mà máy tính đọc được, chuẩn này ban đầu được gọi là MARC I về sau cải tiến thành MARC II, rồi USMARC. Công việc trao đổi biểu ghi như thế này thật là thuận tiện cho việc in phiếu mục lục và về sau khi việc ứng dụng tin học phát triển, hệ thống mục lục trực tuyến thay thế hệ thống phiếu mục lục, chuẩn MARC tỏ ra rất phù hợp. Các quốc gia trên thế giới theo chân Hoa Kỳ phát minh ra hàng loạt MARC quốc gia. Về sau khi vấn đề xuất bản mang tính toàn cầu, có yêu cầu cần thống nhất chuẩn MARC cho nên UNIMARC của IFLA ra đời, tuy nhiên Hoa Kỳ, quốc gia có nguồn tài nguyên thông tin đồ sộ và hệ thống xuất bản bao trùm thế giới đã không chấp nhận UNIMARC do đó các quốc gia nói 7 tiếng Anh khác dần dần bỏ MARC quốc gia để sử dụng USMARC. Để mang tính toàn cầu, USMARC kết hợp với CANMARC của Canada tạo nên MARC 21. 1.2.2.2 Dublin Core • Dublin Core là một tập hợp những thành phần metadata được thiết kế đặc biệt cho việc sử dụng không chuyên. Được dựng chủ yếu cho việc mô tả tài liệu điện tử. Đây là kết quả của một sự hợp tác nhiều người căng xây dựng. Dublin là tên của thành phố ở Bang Ohio, Hoa Kỳ, nơi cuộc họp đầu tiên được tổ chức vào năm 1995. Từ đó đến nay đã có 12 lần hội nghị quốc tế tổ chức tại Anh, Úc, Phần Lan, Đức, Canađa, Nhật, Trung Quốc và Hoa Kỳ để hoàn thiện. Dublin Core được Tổ chức Chuẩn Quốc gia Hoa Kỳ - ANSI phê chuẩn vào năm 2001. • Dublin Core chỉ bao gồm 15 thành phần. Như cái tên "core - nòng cốt" đã hàm ý rằng Dublin Core là một tập hợp những thành phần nòng cốt, ngoài ra còn có thể tăng thêm những thành phần phụ cho mục đích riêng. Hơn nữa, những thành phần hiện hữu có thể được cải tiến xuyên qua việc sử dụng. Tất cả thành phần này đều có thể lập lại khi cần thíết. • Dublin Core dựng thuật ngữ tài nguyên để bao gồm tranh ảnh, hình ảnh động, hoạt hình, đồ hoạ, ngay cả sản phẩm thực tế ảo cũng như tài liệu toàn văn. 15 thành phần của Dublin Core Nhan đề: Tên được đặt cho tài nguyên của tác giả hay nhà xuất bản Tác giả: Người hay tổ chức có trách nhiệm đầu tiên về nội dung trí tuệ của tài nguyên Chủ đề:Đề tài của tài nguyên Mô tả :Mô tả nguyên văn nội dung của tài nguyên Xuất bản:Thực thể có trách nhiệm làm cho tài nguyên có hiệu lực sử dụng 8 Cộng tác viên:Người hay tổ chức (khác tác giả) có trách nhiệm đóng góp có ý nghĩa vào nội dung trí tuệ của tài nguyên Năm: Năm tài nguyên được sáng tác hay có hiệu lực sử dụng Loại: Bản chất hay thể loại của nội dung tài nguyên Dạng thức: Hình thức vật lý hay kỷ thuật số của tài nguyên Xác nhận: Tham chiếu rõ ràng xác nhận tính duy nhất của tài nguyên trong phạm vi ngữ cảnh đã cho Nguồn: Tham chiếu một tài nguyên thứ hai mà từ đó tài nguyên trình bày đã trích dẫn Ngôn ngữ: Ngôn ngữ của nội dung tài nguyên Quan hệ: Tham chiếu một tài nguyên có liên quan, và bản chất của mối quan hệ Sự kiện: Đặc tính nơi chốn và thời gian liên quan đến nội dung tài nguyên Bản quyền: Thông tin về tình trạng bản quyền 1.2.2.3 Nhóm Dublin Core Metadata Những thành phần của Dublin Core chia làm 3 nhóm: 1. Nội dung: Nhan đề, Chủ đề, Mô tả, Nguồn, Ngôn ngữ, Quan hệ (với tài nguyên khác), Sự kiện; 2. Sở hữu trí tuệ: Tác giả, Xuất bản, Cộng tác viên, Bản quyền; 3. Thuyết minh: Năm, Loại, Dạng thức, Xác nhận Minh họa Dublin Core Metadata (cho 15 thành phần của Dublin Core) Thành phần: Nhan đề - Title Tên: Title Định nghĩa: Tên được đặt cho tài nguyên Ví dụ: <meta name = “DC.Title” content = “Tổng quan khoa học thông tin và thư viện”> 9 <meta name = “DC.Title” content = “Bản tin Thư viện Cao học, Số 2, 2003”> Thành phần: Chủ đề - Subject Tên: Đề mục và từ khóa Định nghĩa: Đề tài của nội dung tài nguyên Ví dụ: <meta name = “DC. Subject” content = “Thư viện học”> <meta name = “DC.Subject” scheme = “DDC” content = “020”> Thành phần: Mô tả - Description Tên: Description Định nghĩa: Bản mô tả nội dung tài nguyên Ví dụ: <meta name = “DC.Description” lang = “en” content = “Our database management system is SQL”> Thành phần: Nguồn - Source Tên: Source Định nghĩa: Tham khảo đến một tài nguyên từ đó tài liệu được trình bày dẫn xuất Ví dụ: <meta name = “DC. Source” content = “http://www.glib.hcmuns.edu.vn/bantin.pdf”> 10 [...]... Hình7 : Thư viện ảnh và sá 25 CHƯƠNG 2: XÂY DỰNG THƯ VIỆN SỐ Nội dung: Đề cập đến các thành phần yêu cầu đối với một hệ thống thư viện số Các lựa chọn cho việc xây dựng thư viện số ( phát triển từ đầu, phát triển từ phần mềm mã nguồn mở hay sử dụng các phần mềm thư ng mại) Đưa ra lựa chọn 2.1 Sơ lược về phần mềm thư viện số Phần này mô tả một kiến trúc mở cho sự phát triển của một hệ thống thư viện số. Đã... sự trích dẫn tới những nhà nghiên cứu của họ Những người đang hành nghề khoa học thư viện, như nhiều người khác giải quyết những số lượng của thông tin,quay về những phương pháp trên nền máy tính cho sự giúp đỡ .Thư viện của đại hội,nhóm những thư viện nghiên cứu ở Stanford ,thư viện quốc gia của y khoa và trung tâm thư viện máy tính trực tuyến,Inc., cùng gặp nhau trong một dự án để trao đổi thông tin... thông tin điện tử,các siêu dữ liệu thư tịch chuyển đổi đều có giá trị như nhau o Một phần mềm quản lý thư viện trong tương lai sẽ xuất ra cả 2 dạng thức MARC và Dublin Core.Việc nhập vào MARC hay Dublin Core không gây trở ngại gì cho kết xuất đó;cho dù việc nhập vào là do bản thân thư viện hay trao đổi dữ liệu với các thư viện khác 1.3.Sự phát triển của thư viện số hiện nay trên thế giới và ở ViệtNam... 33 2.1.3 Dự án thư viện số Dự án thư viện số là một nỗ lực có cơ sở rộng rãi để đạt được sự phát triển nhất quán Của Của chúng tôi tài nguyên thông tin quốc gia Sự tồn tại của một kiến trúc mở cho Thư viện Số Những hệ thống sẽ cung cấp cấu trúc cần thiết để phát triển sự truy nhập tới thông tin hiện hữu nhanh tài nguyên và để tạo ra tài nguyên thông tin mới; ý định nào đó là quần chúng ,thư ng mại ý định... thiếu sót Nếu chúng ta biết sử dụng tích hợp một số các modul khác của phần mềm thư viện với Greenstone thì sẽ mở ra một khả năng quản lý tốt các loại hình tài liệu của thư viện Greenstone là một phần mềm mã nguồn mở, nên nhiều thư viện đã phát triển và sử dụng Greentone theo nhiều cách thức khác nhau cả về giao diện lẫn nội dung quản lý tài liệu thư viện: The Lehigh University Librararies, Pennsylvania,... nghiệp chủ yếu để sử dụng trong thư viện truyền thống Chuẩn Dublin Core chủ trương đơn giản hóa để có thể áp dụng rộng rãi cho tài liệu thư viện số đối với những người không cần được huấn luyện biên mục thư viện Hai chuẩn này không những chú ý đến giá trị đặc thù của mình mà còn lưu tâm đến những triết lý căn bản đối nghịch nhau một cách tuyệt đối 13 Chuẩn MARC được Thư viện Quốc hội Hoa Kỳ phát triển... chung Phần mềm mã nguồn mở thư viện số Greenstone được phát triển và phân phối với sự tham gia của UNESCO và Human Info NGO Phần mềm nguồn mở này được cung cấp trên http://greenstone.org/ Vào đầu năm 2004 Thư viện ĐH Khoa học Tự Nhiên cùng với Integrated e-Solutions, Ltd., Việt Nam phát triển phiên bản tiếng Việt và đưa vào sử dụng cũng như giới thiệu rộng rãi đến các thư viện tại Việt Nam Đây là một... việc xây dựng các sưu tập số hóa mở ra khả năng tổ chức tốt các nguồn thông tin điện tử trên Internet Hiện nay, với các công cụ tìm kiếm (Search Engines) trên Internet chúng ta dễ dàng tìm đến các địa chỉ của các thư viện sử dụng Greenstone, hay các tài liệu nói về Greenstone Khả năng của Greenstone hơn hẳn các phần mềm khác về quản lý các tài liệu đa phương tiện… mà các phần mềm khác của thư viện. .. kho của vật chất thì cũng được đạt được Sự hợp nhất Của Số hóa âm thanh, ghi hay tổng hợp giọng nói và độ phân tích cao những chuỗi viđêô vào trong những tài liệu được cất giữ trong Thư viện Số 30 làm cho khả dĩ kết hợp là đa số những mẫu dạng truyền thống của sự công bố thông tin vào trong một khuôn dạng số chung Sự chuyển đổi ra những dạng chữ số và vào trong phương tiện truyền thông truyền thống hơn... vụ việc trao đổi biểu ghi mục lục giữa các thư viện MARC được giảng dạy khá kỹ lưỡng trong những chương trình đào tạo thư viện học trên thế giới Chúng ta khá quen thuộc với biểu ghi MARC khi tiếp xúc với mục lục trực tuyến ở thư viện đại học Chuẩn Dublin Core là một tập hợp những thành phần metadata được thiết kế đặc biệt cho việc sử dụng không chuyên Được dựng chủ yếu cho việc mô tả tài liệu điện . bản thân thư viện hay trao đổi dữ liệu với các thư viện khác. 1.3.Sự phát triển của thư viện số hiện nay trên thế giới và ở ViệtNam 1.3.1 Giới thiệu chung Phần mềm mã nguồn mở thư viện số Greenstone. ra CD-RO 73 5 CHƯƠNG 1: TỔNG QUAN VỀ THƯ VIỆN SỐ 1.1. Giới thiệu Một thư viện số là Một thư viện trong đó những tập hợp được cất giữ trong những khuôn dạng số (ngược với bản in, dạng thu nhỏ hay. 26 2.1. Sơ lược về phần mềm thư viện số 26 2.1.1 Triển vọng 27 2.1.2 Công nghệ và cơ sở hạ tầng 31 2.1.3 Dự án thư viện số 34 2.1.4 Phạm vi của Hệ thống Thư viện Số 35 2.1.5 Hướng dẫn hệ thốn