BÀI GIẢNG THÝ VIỆN SỐ NỘI DUNG TỔNG QUAN VỀ THÝ VIỆN SỐ DL MÔ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL CHỈ MỤC TÀI LIỆU TÌM KIẾM THÔNG TIN CÁC CHUẨN SỬ DỤNG TRONG THÝ VIỆN SỐ THỰC HÀNH HỆ PHẦN MỀM THÝ VIỆN SỐ GREENSTONE
BÀI GIẢNG THÝ VIỆN SỐ NỘI DUNG TỔNG QUAN VỀ THÝ VIỆN SỐ DL MƠ HÌNH HÌNH THỨC CHO THƯ VIỆN SỐ DL CHỈ MỤC TÀI LIỆU TÌM KIẾM THƠNG TIN CÁC CHUẨN SỬ DỤNG TRONG THÝ VIỆN SỐ THỰC HÀNH HỆ PHẦN MỀM THÝ VIỆN SỐ GREENSTONE VI THỰC HÀNH Hệ phần mềm thý viện số Greenstone Greenstone Digital Library Software Giới thiệu Greenstone Cài đặt Greenstone Xây dựng CSDL (bộ sýu tập) Ghi CSDL CD/DVD 6.1 Giới thiệu Greenstone – Greenstone thý viện số – Greenstone phần mềm dùng để xây dựng, phát hành truy cập tới sýu tập số thý viện số – Greenstone cung cấp phýõng pháp để tổ chức xuất thông tin mạng nội bộ, Internet hay CD-ROM Greenstone phần mềm mã nguồn mở, sử dụng tự miễn phí Tuân theo GNU General Public License Website: http://www.greenstone.org Quá trình phát triển Kết Dự án Thý viện số New Zealand trýờng Đại học Waikato, NZ Đýợc triển khai phân phối với hợp tác hai tổ chức UNESCO Human Info NGO Mục đích Hỗ trợ tổ chức nhý trýờng đại học, viện nghiên cứu, trung tâm thơng tin, tổ chức phủ, phi phủ, phi lợi nhuận tạo loại thơng tin đýợc truy cập trực tuyến Ứng dụng Tạo lập, tổ chức quản trị thông tin sýu tập số: – Xây dựng kho tài liệu phục vụ nghiên cứu, học tập – Đóng gói thơng tin theo chun đề phục vụ dịch vụ cung cấp thông tin chọn lọc (SDI) – Lýu trữ quản lý công văn, tài liệu nội – Xây dựng sýu tập bảo tàng, trung tâm lýu trữ Đýợc sử dụng rộng rãi nhiều quốc gia giới: Hoa Kỳ, Australia, New Zealand, Nga Sử dụng rộng rãi trýờng đại học: University of Chicago, Lehigh University, Đại học Quốc gia TP.HCM Đýợc dịch hõn 40 ngôn ngữ: Anh, Nga, Pháp, Tây Ban Nha, Trung Quốc, Ả rập … có tiếng Việt Website sử dụng Greenstone • Association of Indian Labour Historians, Delhi • Auburn University, Alabama • California University at Riverside • Chicago University Library • Detroit Public Library • Gresham College, London • Hawaiian Electronic Library • Illinois Wesleyan University • Indian Institute of Management • Kyrgyz Republic National Library • LeHigh University, Pennsylvania • Mari El Republic, Russia • National Centre for Science Information, Bangalore, India • Netherlands Institute for Scientific Information Services • New York Botanical Garden • Peking University Digital Library • Philippine Research Education and Government Information Network • Secretary of Human Rights of Argentina • Slavonski Brod Public Library, Slovenia • State Library of Tasmania • Stuttgart University of Applied Sciences • Texas A&M University Center for the Study of Digital Libraries • University of Illinois • University of North Carolina ibiblio project • Vietnam National University • Vimercate Public Library, Milan, Italy • Washington Research Library Consortium • Welsh Books Council Tính – u cầu phần mềm – Giao diện – Hỗ trợ đa ngôn ngữ – Quy mô sýu tập – Khả týõng thích chuẩn – Khả tìm kiếm – Hỗ trợ đa phýõng tiện – Khả phát hành sýu tập – Tùy biến sýu tập Yêu cầu phần mềm – Hệ điều hành: WINDOWS, LINUX – Máy chủ Apache Web Server, IIS – Trình duyệt Internet Explorer, hay FireFox Giao diện Greenstone cung cấp khả truy cập rộng rãi vào sýu tập thơng qua giao diện trình duyệt Web chuẩn Greenstone cung cấp giao diện thủ thý (GLI) cho phép thu thập, chỉnh sửa tạo sýu tập số Hỗ trợ đa ngôn ngữ Greenstone hỗ trợ nhiều ngôn ngữ khác nhau: – ngôn ngữ chính: Anh, Pháp, Nga, Tây Ban Nha – Các ngơn ngữ hoàn chỉnh: Trung, Việt, Ba Lan, Bồ Đào Nha, Thái Lan, v.v… – Một số ngôn ngữ đýợc biên dịch Unicode đýợc dùng để hỗ trợ chuyển đổi ngơn ngữ Có thể tạo mục cho ngôn ngữ khác Quy mô sýu tập Các sýu tập chứa hàng nghìn đến hàng triệu tài liệu Thời gian tạo sýu tập tùy thuộc vào quy mơ, kích thýớc sýu tập, kéo dài từ vài phút đến vài ngày Có thể nén sýu tập để giảm kích thýớc tệp tin văn mục Khả týõng thích chuẩn Sử dụng metadata: Tạo điểm truy cập từ metadata Có thể gán metadata cho tài liệu phần tài liệu Týõng thích Z39.50 hỗ trợ việc truy cập máy chủ bên Ngýời dùng bên ngồi truy cập vào Greenstone thơng qua giao thức Z39.50 Khả tìm kiếm Tìm kiếm tồn văn linh hoạt Có thể tìm theo điểm truy cập (trường) Ví dụ: tác giả, chủ đề, ngày tháng, v.v… Duyệt theo danh mục tác giả, nhan đề tài liệu, đề mục, ngày tháng Duyệt theo cấu trúc phân cấp Hỗ trợ đa phýõng tiện Hỗ trợ nhiều định dạng tệp tin: doc, pdf, html, xml Hỗ trợ nhiều loại hình tài liệu khác nhau: văn bản, hình ảnh, âm thanh, video Có khả tạo sýu tập theo loại hình xuất bản: tạp chí điện tử, e-book Khả phát hành sýu tập Bộ sýu tập số đýợc phát hành mạng nội bộ, Internet xuất đĩa CD-ROM tự khởi động cài đặt Quá trình phát hành sýu tập đõn giản thuận tiện Tùy biến sýu tập Greenstone phần mềm mã nguồn mở cho phép ngýời dùng tự chỉnh sửa chýõng trình cho phù hợp với nhu cầu sử dụng Có thể tùy biến giao diện, cấu hình thuộc tính sýu tập 6.2 Cài đặt Tải chýõng trình Greenstone Truy cập vào địa chỉ: http://www.greenstone.org http://www.nzdl.org Nháy chuột vào mục Download Yêu cầu hệ thống Máy tính Pentium IV RAM tối thiểu 512 MB Hệ điều hành: Windows XP , WIN7, WIN8 Phần mềm Microsoft Word Phần mềm Acrobat Reader Bộ Font tiếng Việt: Unikey Vietkey Phần mềm JAVA Greenstone chạy Java Platform, Platform, tải từ địa chỉ: http://www.microsoft.com Cần thiết cài đặt Java trýớc cài đặt Greenstone Cài đặt JAVA – Nháy chuột vào biểu tượng chương trình: J2re-1_4_2_07-windows-i586-p exe – Khi chương trình thơng báo InstallShield Wizard với Licence Agreement chọn YES – Chương trình cho phép lựa chọn Setup Type: lựa chọn TYPICAL – Nháy chuột vào NEXT để cài đặt – Chương trình tự động thực Chọn ngôn ngữ hiển thị: Anh – Pháp – Nga – Trung – Đức – Tây ban nha – Arập Chọn thý mục cài đặt, sau nháy Next Cấu trúc thý mục Greenstone Chýõng trình thơng thýờng đýợc cài đặt vào thý mục sau: C:\Users\DOVINH\greenstone\ Đây thý mục Home CSDL Có thể vào xem thý mục CSDL trình duyệt Windows Explorer FireFox Cấu trúc CSDL (Bộ sýu tập) Các thý mục chýõng trình Thý mục gốc: chứa tệp chýõng trình tệp cấu hình thý mục _uninst: chứa chýõng trình uninstall.exe bin: chứa Java scripts cgi-bin: chứa Perl scripts Collect: chứa sýu tập etc: chứa tệp cấu hình (main.cfg) gli: chứa chýõng trình GLI images: chứa ảnh chýõng trình macro: chứa macro chýõng trình mappings: file mã chữ Perllib: thý viện ngôn ngữ perl temp: tệp tạm thời, tệp liệu đýợc xuất Thý mục sýu tập Các sýu tập (CSDL) đýợc lýu thý mục collect Mỗi sýu tập thý mục Trong thý mục sýu tập có nhiều thý mục con: – archieves: lýu tệp CSDL – etc: tệp cấu hình CSDL – index: tệp mục – import: chứa tệp tin nhập vào – building: thý mục để xây dựng sýu tập – metadata: chứa cấu trúc siêu liệu – images: ảnh CSDL – macro: chứa macro sýu tập Tệp tin cấu hình hệ thống Tên tệp: main.cfg Là tệp văn (txt) Ký hiệu #: thơng báo, làm tác động thuộc tính ghi dịng Thiết lập tiếng Việt cho chýõng trình có giao diện tiếng Việt Mở tệp tin cấu hình main.cfg thý mục C:\Users\DOVINH\Greenstone\etc Notepad/ Wordpad Sửa lại dòng lệnh thành cgiarg shortname=l argdefault=en cgiarg shortname=l argdefault=vi Tệp cấu hình CSDL (bộ sýu tập) Tên tệp: collect.cfg Ghi thông số liên quan đến sýu tập: – chứa thơng tin cấu hình – Plugin – Thơng số tạo lập mục – Các phân lớp duyệt xem (Classifier) – Format – Khởi động chýõng trình Giao diện thủ thý (GLI) Phần mềm Greenstone cung cấp giao diện thủ thý (Greenstone Librarian Interface - GLI) để giúp tạo sýu tập cho thý viện số – Giao diện thân thiện ngýời dùng – Tạo sýu tập nhanh chóng, dễ dàng Giao diện thủ thý (GLI) Các chức cõ GLI Tải xuống (Download ): tải tài liệu từ Internet để đýa vào cõ sở liệu (Download): Thu thập (Gather ): Lựa chọn tập hợp tài liệu đýa vào cõ sở liệu (Gather): Nhập Siêu liệu (Enrich ): Gán siêu liệu (metadata) mô tả cho tài liệu (Enrich): có cõ sở liệu, để phục vụ cho việc tìm kiếm tài liệu Thiết kế (Design ): Thiết lập tham biến cõ sở liệu (tạo mục cho (Design): trýờng, thiết lập thuộc tính duyệt sýu tập) Tạo lập (Create ): Tạo sýu tập (Create): Định dạng (Format ): Thiết lập thuộc tính trình bày sýu tập (Format): website Khởi động giao diện thủ thý (GLI) Start\ All Programs\ Greenstone-3.05\ Greenstone Librarian Interface (GLI) Chọn ngôn ngữ giao diện GLI Chọn ngôn ngữ giao diện GLI Chọn File\Chọn Preferences … \General Interface Language: chọn English - Tiếng Anh Vietnamese - Tiếng Việt Font Chọn Apply: xuất thông báo: Chọn OK 6.3 Xây dựng cõ sở liệu (bộ sýu tập) − Chọn File\ New… New… − Nhập tên sýu tập vào Collection title (thí (thí dụ: ISIS) − Nhập mô tả sýu tập vào ô Description of content (thông tin chung cõ sở liệu đýợc xây dựng) − Chọn kiểu sýu tập: Base this collection on New Collection − Nháy OK để tạo lập sýu tập Thu thập − Chọn Gather − Chọn tài liệu đýa vào sýu tập Chọn tài liệu đýa vào sýu tập Documents in Greenstone Collections: Collections: Các tài liệu có sẵn sýu tập khác máy tính Files Localspace (Vùng làm việc cục bộ): Chọn tài liệu từ thý mục máy tính Home Folder (DOVINH) (Thý mục chủ): Thý mục tài liệu ngýời sử dụng máy tính Download Files (Các tệp đýợc tải xuống): Các tệp tin tải xuống từ Internet để đýa vào sýu tập (CSDL) Chọn thý mục tài liệu cần đýa vào sýu tập (CSDL) Sử dụng kỹ thuật drag – drop (kéo thả) để copy tài liệu từ cửa sổ Workspace (vùng làm việc) bên trái sang cửa sổ Collection (bộ sýu tập) bên phải Chọn tài liệu đýa vào sýu tập Tạo lập CSDL (bộ sýu tập) − Chọn Create − Nháy chuột vào Build Collection − Xem kết nháy chuột vào Preview Collection Chuẩn bị tài liệu trýớc đýa vào CSDL - tệp DOC Chú ý: − Phải chuẩn bị trýớc tất tài liệu trýớc đýa vào sýu tập − Đối với tệp DOC, gán tiêu đề (title) tài liệu vào phần thuộc tính: Files\ Properties\ Summary\ ghi vào mục Title Chuẩn bị tài liệu trýớc đýa vào CSDL - tệp HTML Chú ý: + Đối với tệp HTML: đýa nhan đề vào thẻ + Cách thực hiện: – Mở tệp tin trình duyệt IE – Chọn View\Source điền/sửa nội dung thẻ vùng – Lýu lại – Kiểm tra: dùng lệnh Refresh để duyệt lại trang HTML Nhan đề (Title) trình duyệt xuất nội dung chỉnh sửa Bổ sung Siêu liệu cho sýu tập Siêu liệu Metadata − Thý viện truyền thống: Mô tả thý mục (ISBD, AACR2, MARC, ) − Thý viện số DL: Siêu liệu metadata − Dữ liệu liệu − Bao gồm yếu tố mô tả đặc trýng cho tài liệu số − Dublin Core, TEI, METS, MODS, EAD Siêu liệu Greenstone Siêu liệu Greenstone Australian Government Locator Service Metadata Development Library Subset Example Metadata Dublin Core Metadata Element Set Extracted Greenstone Metadata Exploded Greenstone Metadata 1.0 Greenstone Metadata Set NewZealand Government Locator Service Metadata Qualified Dublin Core Metadata Element Set RFC 1807 Metadata Element Set Extracted Greenstone Metadata Tự động nhập siêu liệu nhúng sẵn tài liệu Ex.Encoding - Bộ mã ký tự văn Ex.Language - Ngôn ngữ Ex.Source - Nguồn tài liệu Ex.Title - Nhan đề tài liệu Dublin Core Metadata Set 15 yếu tố mô tả dc.Title - Nhan đề tài liệu dc.Creator - Ngýời tạo tài liệu Dc.Subject - Chủ đề tài liệu Dc.Description - Mô tả tài liệu Dc.Publisher - Thông tin nhà xuất Dc.Contributor - Thông tin ngýời đóng góp vào tài liệu Dc.Date - Ngày tài liệu đýợc tạo phát hành Dc.Type - Loại tài liệu Dc.Format - Định dạng tệp tin Dc.Identifier - Ký hiệu nhận dạng tài liệu Dc.Source - Nguồn tài liệu Dc.Language - Ngôn ngữ tài liệu Dc.Relation - Thông tin nguồn tài liệu tham khảo Dc.Coverage - Phạm vi tài liệu (địa lý, thời gian) Dc.Rights - Thơng tin quyền sở hữu trí tuệ, quyền, quyền tác giả, quyền liên quan khác Tạo siêu liệu Chọn File\New, hộp thoại xuất Nhập siêu liệu cho tài liệu Mục đích: – Mơ tả tài liệu – Tạo điểm truy cập phục vụ cho tìm kiếm – Cho phép duyệt tài liệu theo đề mục, tác giả, v.v… Chọn tài liệu tiến hành nhập thông tin vào trýờng týõng ứng Siêu liệu tự động lýu vào CSDL Nháy kép chuột vào tài liệu để xem nội dung tài liệu Thiết kế Design Chọn Design GLI-Design − Document Plugins: Chýõng trình nhúng − Search Indexes: Chỉ mục Tìm tin − Partition Indexes: Chỉ mục phân đoạn − Browsing classifiers: Bộ phân lớp Duyệt CSDL GLI Design - Document Plugins − Plugin chýõng trình đýợc dùng trình xây dựng sýu tập − Nhiều dạng tài liệu khác nhau: word, pdf, img, html, … cần plugin để chuyển dạng thống XML − Tùy thuộc nguồn tài liệu, cần plugin týõng ứng − Mỗi plugin đýợc sử dụng để xử lý nhiệm vụ Ví dụ: + HTMLPlug - xử lý tệp tin HTML; + ImagePlug - xử lý hình ảnh; + PDFPlug - xử lý tệp tin Acrobat; … − Có thể thêm, bớt tùy biến plugin GLI Design - Search Indexes − Có thể tạo mục cho trýờng mơ tả − Để tạo mục mới, nháy nút New Index, sau chọn trýờng mơ tả để tạo mục Chọn Add Index − Để chỉnh sửa mục, chọn Edit Index − Để xóa mục, chọn Remove Index − Chọn Select All để tự động tạo mục cho trýờng GLI Design - Partition Indexes − Đýợc sử dụng để tạo mục theo phần, thông qua lọc đýợc xác định sẵn, chẳng hạn nhý ngơn ngữ − Chỉ có giao diện dành cho chuyên gia (Expert) GLI Design - Browsing Classifiers − Thiết lập chế độ duyệt sýu tập, ví dụ: theo nhan đề, tác giả, đề mục, cụm từ, … − Để tạo chế độ duyệt, chọn chế độ từ hộp Select Classifier to add, sau chọn Add Classifier GLI Design - Browsing Classifiers − AZCompactList: Duyệt tên tài liệu xếp theo vần chữ A – Z dýới dạng thu gọn − AZCompactSectionList: Duyệt theo phần tài liệu, xếp theo vần chữ − AZList: týõng tự AZCompactList nhýng dýới dạng đầy đủ − Collage: Hiển thị sýu tập ảnh − DateList: Sắp xếp tài liệu theo thứ tự ngày tháng − HTML: Liên kết tới trang web − Hierarchy: Sắp xếp tài liệu sýu tập dýới dạng hệ thống thứ bậc theo hình thức định (ví dụ: theo chủ đề) − List: Sắp xếp tài liệu theo trật tự đõn giản − Phind: Sắp xếp tài liệu theo cụm từ có tài liệu theo hình thức hệ thống thứ bậc − SectionList: Týõng tự List nhýng xếp tới phần tài liệu Định dạng GLI-Format - Chọn Format GLI-Format − General: Phần chung − Search: Tìm kiếm − Format Features: Đặc tính định dạng − Translate Text: Dịch văn − Cross Collection Search: Tìm kiếm liên CSDL − Collection Specific Macros: Macro riêng sýu tập − Depositor Metadata: Bộ lýu chiểu siêu liệu GLI Format - General GLI Format - General − Cung cấp thông tin chung sýu tập − Creator’s email: thý điện tử ngýời tạo sýu tập − Maintainer’s email: thý điện tử ngýời bảo trì sýu tập − Collection Title: Tên sýu tập − Collection folder: Thý mục chứa sýu tập (không thay đổi đýợc) − URL to “about page” icon: đýờng liên kết tới trang chủ sýu tập − URL to “home page” icon: đýờng liên kết tới trang chủ Greenstone − Collection Description: Mơ tả tóm tắt sýu tập GLI Format - Search − Item in search menu: Hiển thị trýờng đýợc tạo mục để phục vụ việc tìm kiếm − Display text: Tên mục thực đõn (menu) giao diện ngýời dùng GLI Format - Format Features Tùy biến giao diện sýu tập GLI Format - Cross-Collection Search − Cung cấp khả tìm kiếm đồng thời nhiều sýu tập khác − Đánh dấu vào sýu tập muốn tìm kiếm − Chỉ có khả tìm kiếm mục mà sýu tập có chung GLI Format - Translation Text − Chuyển đổi ngôn ngữ số phần giao diện sýu tập − Chọn phần cần dịch từ hộp Features − Chọn ngữ ngôn biên dịch từ hộp Language of Translation − Nhập từ/cụm từ đýợc dịch vào ô Translated text − Chọn Add translation 6.4 Ghi cõ sở liệu CD/DVD − Chọn File\Write CD/DVD Image Hộp thoại xuất Khai báo thông tin: – CD/DVD name: tên đĩa CD-ROM – Chọn CSDL cần ghi lên đĩa – Chọn lệnh Write CD/DVD Image, xuất thông báo Thý mục chứa CSDL C:\Users\DOVINH\Greenstone\tmp\exported_GreenstoneCSDL Dùng chýõng trình ghi CD/DVD để lýu CSDL lên đĩa CD/DVD Đặc điểm CSDL CD/DVD − Chứa đủ phần mềm CSDL − Có thể cài đặt phần mềm CSDL sang máy tính khác để sử dụng − Có thể tra cứu CSDL để CD/DVD − Chỉ có khả sử dụng, khơng có khả chỉnh sửa CSDL Cài đặt CSDL đĩa CD/DVD sang máy tính khác Thực SETUP.EXE thý mục chứa tệp tin cài đặt CSDL đĩa CD/DVD Hộp thoại xuất hiện, chọn ổ đĩa thý mục cài đặt Nháy OK để chýõng trình tự động cài đặt Bài tập Làm quen với số sýu tập Greenstone - Tìm theo từ, cụm từ - Sử dụng tốn tử tìm kiếm - Duyệt theo chủ đề Bài tập Thảo luận cấu trúc Bộ sýu tập cho nhóm − Gồm sýu tập Cấu trúc sýu tập, loại tệp sýu tập − Phân công ngýời chịu trách nhiệm sýu tập Thống cách chọn tài liệu định chủ đề cho sýu tập − Lịch thực Bài tập − Cài đặt Greenstone − Cài đặt Ngôn ngữ Bài tập − Xây dựng sýu tập gồm trang HTML Býớc 1: Khởi động chýõng trình GLI Býớc 2: Tạo sýu tập File\New Býớc 3: Gather Chọn thý mục chứa tệp HTML để làm sýu tập Býớc 4: Build sýu tập − Mục đích: - Làm quen với công cụ Gather & Create - Vào Enrich, kiểm tra khả extract Greenstone - Tìm kiếm sau sýu tập đýợc tạo Bài tập Tạo sýu tập với tệp Word PDF − Býớc 1: Tạo sýu tập với GLI: đặt tên sýu tập, mô tả sýu tập , … − Býớc 2: Thu thập Gather tài liệu cần làm sýu tập − Býớc 3: Create\Build sýu tập Xem khả Extract Greenstone loại tệp PDF, tìm kiếm nhận xét Bài tập Biên mục theo 15 trýờng Dublin Core tài liệu sau: - Sách - Bài trích từ báo - Chýõng/ đoạn sách - File ảnh - Tài liệu web Bài tập Mỗi sinh viên thực sýu tập theo phân cơng Các býớc: • Chọn tài liệu cần tạo sýu tập • Chuẩn bị thơng tin biên mục (Dublin Core) cho tài liệu • Tạo sýu tập (Gather, Enrich, Build) Bài tập Sinh viên thực tập điều chỉnh Search Indexes cho sýu tập Bài tập − Sinh viên tạo thêm cấu trúc duyệt tài liệu (browse) cho sýu tập − Tạo lập lại kiểm tra Bài tập 10 − Sinh viên tạo hình cho tiêu đề sýu tập cách dùng Paint − Sinh viên tự chuẩn bị nội dung thơng tin mơ tả cho sýu tập (cùng nhóm thống nội dung) − Điều chỉnh giao diện trang chủ sýu tập ... CD/DVD 6.1 Giới thiệu Greenstone – Greenstone thý viện số – Greenstone phần mềm dùng để xây dựng, phát hành truy cập tới sýu tập số thý viện số – Greenstone cung cấp phýõng pháp để tổ chức xuất... liệu Metadata − Thý viện truyền thống: Mô tả thý mục (ISBD, AACR2, MARC, ) − Thý viện số DL: Siêu liệu metadata − Dữ liệu liệu − Bao gồm yếu tố mô tả đặc trýng cho tài liệu số − Dublin Core, TEI,... Kết Dự án Thý viện số New Zealand trýờng Đại học Waikato, NZ Đýợc triển khai phân phối với hợp tác hai tổ chức UNESCO Human Info NGO Mục đích Hỗ trợ tổ chức nhý trýờng đại học, viện nghiên