THƯ VIỆN ĐIỆN TỬ GREENSTONE HƯỚNG DẪN SỬ DỤNG

35 486 0
THƯ VIỆN ĐIỆN TỬ GREENSTONE HƯỚNG DẪN SỬ DỤNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

THƯ VIỆN ĐIỆN TỬ GREENSTONE HƯỚNG DẪN SỬ DỤNG Tác giả: Lan H.Witten Stefan Boddie Khoa Công Nghệ Thông Tin trường Đại học Waikato, New Zealand Greenstone phần mềm hỗ trợ việc xây dựng phân phối sưu tập Thư viện số Nó cung cấp phương thức việc tổ chức xuất thông tin Internet CD-ROM Greenstone kết dự án Thư viện số trường đại học Waikato, NewZealand (New Zealand Digital Library Project), triển khai phân phối với hợp tác hai tổ chức UNESCO Human Info NGO Đây phần mềm có mã nguồn mở địa http://greenstone.com , mục GNU General Public License Chúng muốn đảm bảo phần mềm đáp ứng tốt nhu cầu bạn Vì vậy, có vấn đề liên quan đến phần mềm này, đề nghị bạn liên lạc với greenstone.@cs.waikato.ac.nz Greenstone gsdl-2.39 Tháng năm 2003 Hướng dẫn sử dụng: Tài liệu hướng dẫn chi tiết cách sử dụng Greenstone để truy cập xây dựng sưu tập Thư viện số Phần 1: Trình bày tổng quát về tính phần mềm Phần 2: Hướng dẫn sử dụng sưu tập Greenstone Giao diện dễ sử dụng – Cách học Greenstone nhanh thực hành – Trong phần bao gồm thông tin hướng dẫn trực tuyến cho mot sưu tập bình thường Phần 3: Hướng dẫn bạn tự xây dựng sưu tập Thư viện công cụ Greenstone Collector Công cụ bao gồm trang Web hướng dẫn bạn bước xây dựng sưu tập Phần 4: Giới thiệu tính Quản lí, cho phép người quản lí hệ thống theo dõi diễn tiến công việc kiểm soát người làm công việc thiết kế sưu tập Phần phụ lục: Liệt kê tính phần mềm Greenstone cung cấp bảng giải thuật ngữ sử dụng toàn tài liệu Các tập tài liệu Bộ phần mềm Greenstone Bộ phần mềm bao gồm tập tài liệu: • Hướng dẫn cài đặt • Hướng dẫn sử dụng • Hướng dẫn phát triển • Từ tài liệu giấy đưa lên sưu tập Những thành viên tham gia dự án phần mềm Greenstone Greenstone hợp tác nhiều người Rodger McNab Stefan Boddie hai nhân vật chủ yếu việc thiết kế phát triển phần mềm Ngoài có đóng góp tác giả sau: David Bainbridge, George Buchanan, Hong chen, Elke Duncker, Carl Gutwin, Geoff Holmes, John McPherson, Craig Nevill-Manning, Gordon Paynter, Bernhard Pfahringe, Todd Reed, Bill Rogers Stuart Yeates Những thành viên khác dự án Thư viện số tham gia phần Thiết kế hệ thống là: Mark Apperley, Sally Jo Cunningham, Steve Jones, Te Taka Keegan, Michel Loots, Malika Mahoui Lloyd Smith Chúng chân thành cảm ơn thấ góp sức vào việc xây dựng MG, GDBM, WGET, WV, PDF2HTML, PERL phiên TỔNG QUAN VỀ GREENSTONE 1.1 Các tài liệu 1.2 Tìm kiếm thông tin 1.3 Định dạng liệu 1.4 Các tài liệu Đa phương tiện Đa ngôn ngữ 1.5 Chức phân phối phần mềm SỬ DỤNG BỘ PHẦN MỀM GREENSTONE 2.1 Cài đặt phần mềm CD-ROM 2.2 Tìm kiếm thông tin 2.3 Thay đổi thuộc tính 14 TẬP HỢP CÁC TÀI LIỆU 17 3.1 Logging in 17 3.2 Cấu trúc Dialog 18 3.3 Thu thập thông tin 19 3.4 Dữ liệu nguồn 20 3.5 Cấu hình Bộ sưu tập 24 3.6 Xây dựng Bộ sưu tập 25 3.7 Trình bày sưu tập 26 3.8 Làm việc với sưu tập tồn 26 3.9 Định dạng tài liệu 27 Chức quản trị 30 4.1 File cấu hình 33 4.2 Logs 33 4.3 Quản lý người dùng 34 4.4 Thông số kỹ thuật 34 TỔNG QUAN VỀ GREENSTONE Greenstone hệ thống hoàn chỉnh dùng đê xây dựng trình bày sưu tập gồm có hàng ngàn, hàng triệu tài liệu chữ, hình ảnh, băng tiếng hay băng hình 1.1 Các tài liệu Một Thư viện số thông thường xây dựng phần mềm Greenstone chứa nhiều sưu tập, xếp riêng lẻ thông qua giống bật, trì dễ dàng Ngoài tài liệu bổ sung tự động tái tạo lại Có nhiều cách để tìm kiếm thông tin sưu tập Greenstone Ví dụ, bạn tìm từ khoá (là từ xuất đoạn văn hay phần tài liệu cần tìm) Bạn trình duyệt tài liệu theo tiêu đề cách nhấp chuột vào sách Bạn trình duyệt tài liệu theo chủ đề Các chủ đề xếp theo dạng kệ sách, bạn cần nhấp chuột vào kệ sách để tìm sách Nhiều tài liệu có Bảng mục lục: Bạn nhấp chuột vào chương thư mục nhỏ để mở xem, để mở rộng bảng mục lục, hay mở toàn tài liệu cửa sổ trình duyệt bạn (Giúp ích cho việc in ấn) Trang web Thư viện số New Zealand (nzdl.org) cung cấp nhiều sưu tập mẫu Trên trang đầu sưu tập trình bày mục đích sử dụng hình trang bìa sách, dẫn cách xếp tài liệu Hầu hết sưu tập truy cập hai cách: Tìm kiếm trình duyệt Khi tìm kiếm, phần mềm Greenstone tìm toàn nội dung tất văn sưu tập Trong hầu hết sưu tập, người sử dụng chọn sử dụng mục xây dựng từ phần khác tài liệu Một số sưu tập có mục tất tài liệu, mục đoạn, mục tựa sách Có thể tìm mục theo từ hay cụm từ khóa Bằng cách này, bạn tìm tất văn có chứa từ khóa (các từ khoá phân bố rải rác văn bản), tất đoạn văn có chứa từ (các từ phải xuất đoạn văn), tất sưu tập có tiêu đề chứa từ (các từ phải xuất tựa văn bản) Còn có mục khác, ví dụ mục theo phần hay theo đề mục nhỏ Trong trình trình duyệt, người sử dụng ngiên cứu danh mục tác giả, danh mục tiêu đề, danh mục ngày, cấu trúc phân loại theo lớp, v.v… Các sưu tập khác có cách trình duyệt khác 1.2 Tìm kiếm thông tin Phần mềm Greenstone xây dựng mục toàn phần theo nội dung văn - nghĩa mục giúp bạn tìm kiếm theo từ toàn nội dung tài liệu Chỉ mục dùng để tìm kiếm theo từ khoá, hay cụm từ, kết xếp theo thứ tự dựa phù hợp câu truy vấn Trong hầu hết tài liệu, liệu mô tả Tác giả, Tiêu đề, ngày tháng, từ khoá, v.v kèm với tài liệu Dữ liệu gọi liệu khóa (metadata) Nhiều sưu tập chứa mục nội dung số loại liệu khoá Ví dụ, số sưu tập, người dùng tìm kiếm dựa mục Tên tài liệu Người dùng trình duyệt cách trực tiếp dựa danh mục cấu trúc phân lớp thiết lập từ liệu khoá có liên quan đến tài liệu sưu tập Dữ liệu khoá liệu thô cuả việc tìm kiếm Nó phải trực tiếp cung cấp tự động rút từ tài liệu Các sưu tập khác có tính tìm kiếm trình duyệt khác Chỉ mục tìm kiếm trình duyệt thiết lập trình xây dựng sưu tập dựa thông tin tập tin cấu hình Greenstone tự động tạo mục từ tài liệu tập tin hỗ trở: Không trình phải làm tay Nếu tài liệu có định dạng, chúng tự động xếp vào chung sưu tập Trên thực tế, nhiều sưu tập, việc tiến hành trình kích hoạt thường xuyên để theo dõi tài liệu mới, cập nhập lại mục - Tất thực cách tự động 1.3 Định dạng liệu Tài liệu nguồn có nhiều dạng khác nhau, chuyển sang định dạng chuẩn XML để sử dụng plugins Các plugins phân phát với Greenstone để hỗ trợ văn thô, HTML, WORD, PDF, Usenet E-mail Còn plugins khác viết cho kiểu liệu khác (để sử dụng chúng, bạn cần phải đọc phần Hướng dẫn phát triển Phần mềm Greenstone) Để xây dựng cấu trúc trình duyệt từ liệu khóa, ta tương tự sử dụng cách phân loại theo lớp Các phân loại tạo mục trình duyệt khác nhau: liệt kê dạng cuộn, dạng mẫu tự Alphabet, dạng ngày tháng, hay dạng cấu trúc lớp tùy ý Một lần nữa, lập trình viên Greenstone tạo cấu trúc trình duyệt 1.4 Các tài liệu Đa phương tiện Đa ngôn ngữ Bộ sưu tập chứa chữ, hình ảnh tĩnh, hình ảnh động, âm Những tài liệu không thuộc dạng chữ liên kết với tài liệu dạng chữ hay tài liệu mô tả dạng chữ (ví dụ thích hình ảnh) để hỗ trợ việc tìm kiếm trình duyệt nội dung Unicode, phông chữ chuẩn Thế giới dùng để trình bày nội dung tài liệu, sử dụng Greenstone Điều cho phép ngôn ngữ xử lý trình bày theo kiểu thống Các sưu tập được xây dựng có chứa kiểu chữ Ả rập, Trung Quốc, Anh, Pháp, Mäori Tây Ban Nha Chương trình tự động nhận ngôn ngữ mẫu sưu tập giao diện trình bày theo ngôn ngữ sẵn có 1.5 Chức phân phối phần mềm Các sưu tập truy cập thông qua Internet, dạng ấn phẩm, đĩa CD-ROM tự cài đặt Chương trình nén sử dụng để nén nội dung tài liệu mục Một giao thức Corba hổ trợ cho sưu tập phân phối giao diện truy vấn Thư viện số New Zealand(nzdl.org) cung cấp sưu tập mẫu bao gồm: Tập tài liệu lịch sử, thông tin người phát triển, báo cáo kỹ thuật tiểu sử, tác phẩm văn học tạp chí Là phần mềm mã nguồn mở, Greenstone dễ mở rộng hưởng lợi từ modules truy cập nội dung, quản lý sở liệu, lấy nội dung từ loại dịnh dạng khác cho phép GNU Chỉ với hợp tác quốc tế phần mềm trở thành phần mềm hoàn thiện, dáp ứng yêu cầu ngày đa dạng phong phú người sử dụng SỬ DỤNG BỘ PHẦN MỀM GREENSTONE Bộ phần mềm Greenstone thiết kế với chứa dễ sử dụng Bộ sưu tập Web hay CD-ROM có giao diện Việc cài đặt phần mềm Greenstone từ CD-ROM hoàn toàn dễ dàng tích hợp với hệ điều hành Windows hay Linux Việc cài đặt tiến hành qua chương trình cài đặt chuẩn tập tin binary dịch trước Một sưu tập cài đặt để sử dụng máy tính cài máy tính kết nối vào mạng, phần mềm tự động cho phép tất máy mạng truy cập sưu tập Phần mô tả cách cài đặt phần mềm CD-ROM Sau xem xét đến tính tìm kiếm trình duyệt sưu tập Greenstone mẫu, chương trình “Demo” cung cấp với phần mềm Những sưu tập khác có tính tương tự Nếu sử dụng cái, bạn sử dụng khác Phần dẫn dùng trang Thuộc tính.để thay đổi giao diện theo ý muốn 2.1 Cài đặt phần mềm CD-ROM Bản thân phần mềm Thư viện số Greenstone từ CD-ROM, bạn hay người quản lý hệ thống có lẽ cài đặt chương trình vào hệ thống mình, dựa theo phần Hướng dẫn cài đặt Nếu cài đặt rồi, bạn nên bỏ qua phần Một số sưu tập Greenstone đến từ CD-ROM có sẵn chương trình để chạy sưu tập Khi sử dụng, bạn cần để vào ổ đĩa CD-ROM máy tính dùng Windows Thông thường, (nếu chức tự động “Autorun” kích hoạt máy bạn), cửa sổ xuất mời bạn cài đặt phần mềm Nếu chức tự động (Nếu sử dụng hệ điều hành Windows bạn nhấp chuột vào biểu tượng My computer Desktop) chương trình cài đặt xuất hiện, sau double-click vào đó, tìm file setup.exe nhấp chuột vào trình cài đặt tiến hành bạn hướng dẫn bước, trình cài đặt chương trình xuất câu hỏi hầu hết câu trả lời ” yes” Khi trình cài đặt hoàn thành, bạn tìm thấy Thư viện phần Programs với tên chương trình cài đặt (“Development Library” hay “United Nations University”) Khi chương trình cài đặt, chức “Autorun” kích hoạt, Thư viện tự động khởi động để CD-ROM vào ổ 2.2 Tìm kiếm thông tin Để sử dụng phần mềm này, cách dễ chạy thử chương trình Dừng lo ngại - bạn chẳng làm hỏng chương trình đâu Hãy tự nhấp chuột vào Thư viện: hầu hết hình ảnh chương trình Nếu giữ yên chỏ chuột phía một hình đó, thông thường có thông báo nhỏ báo với bạn chương trình hoạt động Hãy thử nghiệm cách chọn từ quen thuộc “the” “and” để tìm kiếm Hệ thống Thư viện số Greenstone tập hợp từ nhiều tài liệu riêng lẻ, ví dụ tài liệu kĩ thuật tin học, tác phẩm học , Các tài liệu Tổ chức Lương thực Nông nghiệp Liên Hiệp Quốc (FAOs), tạp chí chuyên đề v.v Thư viện số có trang chủ cho phép bạn truy cập Thêm vào đó, sưu tập có trang thông tin riêng nhằm cung cấp cho bạn thông tin cách xếp quản lý tài liệu Để quay trở lại trang Thông tin này, bạn cần nhấp chuột vào biểu tượng “collection” góc bên trái cạnh trang tìm kiếm trình duyệt Hình trình bày phần “demo” phần nhỏ tập tài liệu “Development Library collection”, dùng ví dụ để mô tả cách tìm kiếm thông tin khác (Nếu không tìm thấy chương trình Demo bạn sử dụng chương trình Development Library, chúng tương tự nhau) Trước tiên phải kích hoạt chương trình cách nhấp chuột chuột vào biểu tượng Có nhiều biểu tượng xuất dòng đầu hầu hết trang; Bảng trình bày ý nghĩa biểu tượng Hình 1: Sử dụng chương trình Demo Các phía “search subjects titles a-z organization how to ” công cụ trình duyệt tìm kiếm, nút bên phải nút tìm kiếm, nút lại điều kiện tìm kiếm khác ứng với tài liệu khác Cách tìm kiếm thông tin Bảng trình bày cách tìm kiếm thông tin phần Demo Bạn tìm kiếm từ khóa mà xuất phần nội dung tài liệu từ trang “tìm kiếm” Phần giống trang “about” trình bày hình (ngoại trừ việc không chứa phần About this collection) Trang tìm kiếm có thể truy xuất từ trang khác cách nhấn nút search) Bạn truy cập tên xuất theo chủ đề (Publications by subject) cách nhấn nút subjects Sau bảng danh mục chủ đề ra, trình bày theo dạng kệ sách, mở rộng cách nhấp chuột vào mục Bạn truy cập Danh sách liệt kê How to cách nhấn nút How to Phần bảng danh mục gợi ý câu hỏi “How to” Xem Hình (PV) Bảng Trình bày ý nghĩa biểu tượng (icons) dòng đầu trang Phần đưa bạn đến trang “about” Phần dẫn bạn quay trang chủ, nơi mà bạn chọn lại tài liệu cần tìm Phần giúp bạn tìm hiểu nội dung đọc Phần cho phép bạn chọn lựa giao diện hộp hội thoại tìm kiếm theo ý muốn sử dụng phần chọn suốt thời gian tìm kiếm Bảng Trình bày ý nghĩa biểu tượng (icons) tìm kiếm Tìm kiếm từ khóa Truy cập sách xuất theo Chủ đề Truy cập sách xuất theo Tên sách Truy cập sách xuất theo Tên Tổ chức giới Truy cập sách xuất theo bảng trợ giúp “how to” Cách đọc hiểu tài liệu Trong phần Demo, bạn biết sách cần tìm nhờ vào ảnh bìa sách (Hình 2) Bên cạnh ảnh bìa bảng mục lục: Khi bạn truy cập đến phần phần in đậm, trường hợp phần Introduction and summary – Phần Bảng mở rộng, bạn nhấp chuột vào thư mục để đóng mở chúng Nhấp chuột vào biểu tượng mở sách để đóng sách ngược lại Phần bên nội dung phần hành (“The international demand for tropical butterflies…Trong phần ví dụ, nội dung trình bày hình minh họa) Khi đọc đến dòng cuối bạn sang phần để đọc trở đầu trang Phía hình có nút Nút detach có tác dụng mở cửa sổ (rất tiện mở nhiều sách lúc để đọc so sánh) Nếu bạn đọc sách tìm nút “Search” mục search tô sáng, nút no highlighting ẩn Nút expand text mở rộng toàn nội dung thư mục hành toàn nội dung sách hành Nút expand contents mở rộng toàn nội dung mục lục để bạn thấy tên tất chương mục nhỏ Trong số tập tài liệu, phần nội dung không cần phải trình bày theo cấu trúc phân cấp Với trường hợp bảng mục lục bạn xem phần nội dung tài liệu - xuất phần nội dung Một số trường Hình 4d (Tiếp theo) Nếu bạn chọn cấu trúc mặc định, sưu tập chứa tài liệu dạng HTML (Là file có đuôi chấm htm, html), tài liệu dạng văn túy (Những file có đuôi txt, text), Dạng Word (.doc), Dạng PDF (.pdf), or dạng E-mail (.email) Những thông tin định dạng loại tài liệu khác, bạn tham khảo phần 3.9 Còn bạn xây dựng dựa cấu trúc sưu tập có, file phải có định dạng hoàn toàn giống file sưu tập có Lưu ý số sưu tập có file nguồn không thuộc dạng chuẩn, số sưu tập khác sử dụng metadata, xác định file hổ trợ Nếu liệu nguồn bạn thiếu thông tin số tính trình duyệt hoạt động sai Nếu bạn chạy chương trình Demo collection nút subjects, organization, how to không hoạt động Co hộp xây dựng để đường dẫn đến liệu nguồn Nếu bạn cần thêm hộp hội thoại để ghi thêm đường dẫn nhấp chuột vào nút “more sources.” Có ba loại đường dẫn: • Tên thư mục hệ thống chủ (server) Greenstone (Bắt đầu với “file://”) • Địa bắt đầu với http:// file download từ trang web • Địa bắt đầu vớI ftp:// file download sử dụng thuộc tính ẩn FTP Nếu bạn sử dụng file:// hay ftp:// để xác định file, file download Nếu bạn sử dụng http://, điều tùy thuộc vào việc URL trang web thông thường để để sử dụng, danh sách file Nếu trang trang tải - tải tất trang liên kết từ trang – Tất thư mục thư mục chúng trang URL Nếu sử dụng file:// ftp:// để dẫn dến thư mục, cho đường dẫn http:// URL dẫn đến danh sách file, tất danh mục danh mục chứa tải sưu tập Bạn đưa nhiều đường dẫn (Hình 4d) Một sưu tập chứa tài liệu lấy từ hệ thống file nội điều khiển trang web nhân trình xây dựng Khi bạn nhấp chuột vào nút configure collection để chuyển sang trang kế tiếp, Chức Collector kiểm tra tất nguồn liệu đầu vào mà bạn đến đường dẫn Việc kiểm tra vài giây vài phút, đến nhiều đường dẫn Nếu đường dẫn định không hợp lệ trang web tương tự hình 4e trình bày, đường dẫn không hợp lệ đánh dấu x (Trong hình hai đường dẫn) Các đường dẫn không hợp lệ vì: Hình (Tiếp theo) • • • Các file, trang FPT, URL không tồn Bạn cần phải kết nối vào ISP trước Bạn cố truy cập vào Internet mà không qua firewall Ở trường hợp cuối khó hiểu Thông thường truy cập vào mạng bạn phải nhập username password bạn kết nối thẳng vào mạng mà không cần nhập username password, URL thông báo không hợp lệ Rất trang trình bày trang truy xuất từ mạng nội Nhưng collector lại không nhìn thấy Trong trường hợp - Hình 4f, collector giới thiệu trang mà bạn tải Hình 4f 3.5 Cấu hình Bộ sưu tập (Hình f) Cấu trúc cách trình bày tất sưu tập xác định file cấu hình đặc biệt (hình trên) Người dùng phân quyền sử dụng trang để sữa đổi cấu hình, trình có liên quan trực tiếp đến giai đoạn cuối Lưu ý bước hoàn toàn bỏ qua Hình (g) Trong phần ví dụ chúng ta, người dùng tạo thay đổi nhỏ để mặc định file cấu hình bao gồm flag file_is_url với file đính kèm HTTP Flag tạo metadata URL chèn vào tài liệu dựa quy ước tên file chọn trình theo dõi Metadata sử dụng sưu tập cho phép người đọc tham khảo nguồn liệu gốc nội 3.6 Xây dựng Bộ sưu tập Hình 4g cho thấy giai đoạn xây dựng sưu tập Cho đến lúc công việc ghi vào tập tin tạm Quá trình xây dựng sưu tập nơi công việc thật diễn Trong trình xây dựng danh mục tìm kiếm trình duyệt xây dựng theo dẫn file cấu hình sưu tập Quá trình xây dựng khoảng từ vài phút đến hàng giờ, tùy thuộc vào kích cở sưu tập tốc độ máy tính Một số sưu tập có kích thước lớn ngày xây dựng xong Khi bạn đạt đến giai đoạn này, năm giây lần, dòng trạng thái dòng cuối trang hình cho biết trình hoạt động diễn Ví dụ, tin nhắn hình hình 4f cho biết tên liệu lấy từ tập tin nguồn Thông báo xuất mà tập tin nguồn URL nhập vào không tồn tại, có tồn mà plugin, có plugin không tìm file liên kết, chẳng hạn file đặt tài liệu HTML Mục đích bạn giữ cho cửa sổ mở, bạn theo dõi trình hoạt động Bất lỗi làm gián đoạn trình lưu lại Bạn dừng trình xây dựng lúc cách nhấp chuột vào nút Dừng xây dựng - Hình 4g Nếu bạn rời khỏi trang web mà không nhấn vào nút trình tiếp diễn sưu tập cài đặt sau trình xây dựng sưu tập cũ hoàn thành 3.7 Trình bày sưu tập Khi sưu tập xây dựng cài đặt xong, dãy nút phía hình 4b, xuất phía Hình 4g, với nút view collection kích hoạt để liên kết người dùng với sưu tập xây dựng thành công Cuối cùng, có chức gửi E-mail đến địa liên lạc sưu tập đến người quản trị hệ thống sưu tập tạo (hoặc sữa đổi) Điều cho phép người có trách nhiệm kiểm tra có thay đổi, theo dõi việc xảy với hệ thống Các điều kiện mặc định không hoạt động chỉnh cho kích hoạt thay đổi file cấu hình main.cfg (xem phần Greenstone Digital Library Developer’s Guide Phần 4) 3.8 Làm việc với sưu tập tồn Khi bạn sử dụng chức collector bạn phải xác định bạn muốn tạo sưu tập hoàn toàn hay làm việc với sưu tập tồn tại, thêm hay xoá sưu tập Bằng cách tạo cấu trúc tìm kiếm trình duyệt tự động, việc thêm thông tin vào sưu tập tồn Greenstone diễn dễ dàng Bởi liên kết nhập vào tay, tài liệu có dạng, hệ thống tự nhận biết trộn vào chung với sưu tập có Để làm việc với sưu tập có sẵn, trước tiên bạn phải chọn sưu tập từ danh mục sưu tập cung cấp Một số sưu tập đánh dấu sữa đổi không xuất danh mục liệt kê Với sưu tập, bạn • • • • Thêm liệu tái tạo lại sưu tập Chỉnh sữa file cấu hình sưu tập Xóa toàn bộ sưu tập Truy xuất sưu tập CD-ROM Thêm liệu Tất file bạn định thêm vào sưu tập, bạn phải chưa tồn sưu tập, không sưu tập chứa hai file giống hệt Các file nhận dạng đường dẫn đầy đủ, trang web hay địa web tuyệt đối Bạn phải xác định rõ thư mục hay file bạn xây dựng sưu tập Nếu thêm liệu vào sưu tập mà số nguyên nhân làm cho trình không thực được, sưu tập cũ chưa thể thay đổi Chỉnh sữa file cấu hình Những người sử dụng thành thạo chỉnh sửa tập tin cấu hình sưu tập, họ làm xây dựng sưu tập Phần giải thích rõ cách cài đặt cấu hình Xoá sưu tập Bạn thông báo để xác nhận xem có thật muốn xoá sưu tập không Một xoá Greenstone hồi phục lại Truy xuất sưu tập Bạn xuất sưu tập dĩa CD-ROM tự dộng cài đặt sử dụng Greenston dành cho Windows Vì phần mềm thương mại để tạo CDs tự cài đặt tốn kém, công cụ bao gồm phần cài đặt riêng Khi bạn truy xuất sưu tập, hộp hội thoại thông báo cho bạn biết tên thư mục xuất đến Toàn nội dung thư mục ghi lên CDROM công cụ ghi chép CD-writing thông thường Vì cấu hình Windows đa dạng, Greenstone khó kiểm tra sửa lỗi cho tất trường hợp Nếu bạn bị lỗi bạn có phần mềm thương mại dùng để cài đặt( ví dụ InstallShield), bạn sử dụng để tạo đĩa CD-ROMs từ thông tin mà sưu tập cung cấp Thư mục truy xuất đến đề cập phía chứa file liên quan đến trình cài đặt thư mục chứa toàn phần mềm sưu tập Bạn xóa bốn file sử dụng InstallShield để tạo ảnh CD-ROM dùng việc cài đặt thư mục tạo biểu tượng dẫn đến chương trình gsdl\server.exe 3.9 Định dạng tài liệu xây dựng sưu tập, phần mềm Greenstone xử lý định dạng khác tài liệu gốc dùng plugin viết riêng cho dạng tài liệu Các plugin ghi rõ file cấu hình sưu tập Nói chung phần mềm Greenstone sử dụng tên file để quy định thuộc tính tài liệu ví dụ foo.txt quy định file văn bản, foo.html dạng file HTML, foo.doc dạng file Word Đây bảng tóm tắt file đính kèm (plugins) có sẵn dùng để định dạng tài liệu Để biết thêm chi tiết plugins plugins khác thông dụng hơn, bạn tham khảo phần tài liệu tên Greenstone DigitalLibrary Developer’s Guide TEXTPlug (*.txt, *.text) TEXTPlug dạng file văn tuý Nó thêm tiêu đề vào phần metadata dựa dòng đầu file HTMLPlug (*.htm, *.html; also shtml, shm, asp, php, cgi) HTMLPlug xử lý file HTML Nó tách title metadata dựa phần đuôi ; metadata khác trình bày cách sử dụng cú pháp metatag HTML tách Plugin cung cầp nhiều chọn lựa khác nhau, tham khảo thêm tài liệu Greenstone Digital Library Developer’s Guide WORDPlug (*.doc) WORDPlug lấy tài liệu dạng Microsoft Word Có nhiều tài liệu dạng Word khác chương trình Microsoft gặp trục trặc chuyển đổi Greenstone sử dụng chương trình độc lập để chuyển đổi file dạng Word sang dạng HTML Đối với số tài liệu thuộc phiên trước đó, hệ thống phải sử dụng đến thuật toán phân tích giản đơn để tìm tất chuỗi ký tự file nguồn PDFPlug (*.pdf) PDFPlug nhận tài liệu dạng PDF (Adobe’s Portable Document Format) Giống WORDPlug, sử dụng chương trình độc lập, trường hợp chương trình pdftohtml để chuyển đổi file dạng PDF sang dạng HTML Đối với WORDPlug, theo mặc định sưu tập trình bày file tương tự dạng HTML, người dùng nhấp chuột vào biểu tượng document; nhiên chuỗi ký tự định dạng file cấu hình sưu tập có điều chỉnh phép người dùng truy cập vào file gốc PDF (các bạn nên sửu dụng cách nbày) Giống trên, cần thay tag … … Chương trình pdftohtml có lỗi số file PDF Chuyện xãy mà trình chuyển đổi diễn thời gian dài, thường xuất thông báo lỗi liên quan đến trình chuyển đổi hình Nếu có xãy lỗi, giải pháp loại bỏ tài liệu bị lỗi khỏi sưu tập Thêm vào đó, PDFPlug không xử lí tập tin PDF bị mã hóa PSPlug (*.ps) PSPlug lấy tài liệu dạng PostScript Nó làm việc tốt chương trình ps2ascii Linux cài đặt sẵn Chương trình có sẵn hầu hết cài đặt Linux, Windows Nếu chương trình sẵn, PSPlug phải dùng đến thuật toán phân tích văn đơn giản EMAILPlug (*.email) EMAILPlug xử lí tập tin chứa E-mail, xử lí định dạng email thông thường dùng Netscape, Eudora, and Unix Mỗi tài liệu nguồn kiểm tra xem có chứa nhiều email khác gộp chung lại hay không, có, phần nội dung email dược xử lí Plugin thu thập metadata Subject, To, From, Date Tuy nhien, plugin chưa xử lí email mã hóa dạng MIME Trên lí thuyết thực tế, dạng mã hóa lạ so với dạng khác ZIPPlug (.gz, z, tgz, taz, bz, zip, tar) Plugin ZIPPlug xử lý file dạng nén lưu trữ: gzip (.gz, z, tgz, taz), bzip (.bz), zip (.zip jar), tar (.tar) Nó giải nén chương trình gunzip, bunzip, unzip, tar theo chuẩn Linux utilities ZIPPlug không hoạt động hệ điều hành Windows CHỨC NĂNG QUẢN TRỊ Các phần mềm Greenstone có tính quản trị Để sử dụng tính này, bạn nhấp chuột vào mục administration trang Trang trình bày thông tin sưu tập hệ thống Lưu ý rằng, có số sưu tập có tính cá nhân không trình bày “home page” mang tên riêng tên đầy đủ, trang công cộng mà không trình bày không chạy, nhấp chuột vào bảng tóm tắt sưu tập (cột - Hình 5) cho ta biết số thông tin sưu tập lấy từ file cấu hình sưu tập từ cấu trúc khác bên sưu tập Nếu sưu tập có tính công cộng hoạt động được, nhấp chuột vào cột fullname (cột thứ – Hình 5) bạn có thông tin chi tiết sưu tập cần tìm Bộ sưu tập mà xâydựng phần 3.2–3.6 có tên wohiex, tên đầy đủ Women’s History Excerpt, dòng cuối hình Hình trình bày thông tin chi tiết sưu tập nhấp chuột vào cột fullname Phần cho biết thông tin file cấu hình kích thước sưu tập (khoảng 1000 tài liệu, triêu từ, chiếm 6Mb) Phần kế chứa thông tin nội liên quan đến giao thức liên lạc đến sưu tập Ví dụ với chức filter options dùng cho “QueryFilter” trình bày hộp tùy chọn giá trị dùng truy vấn đến sưu tập Chức quản trị trình bày thông tin trình cài đặt cho phép sữa đổi Nó giúp cho trình kiểm tra lỗi nhanh chóng dễ dàng việc ghi lại lổi máy Nó phân quyền cho người dùng để xho phép người khác xây dựng tiếp sưu tập thêm thông tin vào sưu tập sẵn có Tất tính truy cập trực tiếp từ danh mục liệt kê bên trái hình Hình Tính quản trị Greenstone Hình 6:Thông tin sưu tập Women’s History Excerpt 4.1 File cấu hình Có hai file cấu hình điều khiển hoạt động Greenstone file định vị gsdlsite.cfg file cấu hình main.cfg File gsdlsite.cfg dùng để định vị trí phần mềm Greenstone cài đặt Nó thiết kế để tách riêng với phần khác Ví dụ tên thư mục cài đặt phần mềm , địa trang web hệ thống tính fastcgi hệ thống có sử dụng hay không Các liệu file mô tả Greenstone Digital Library Installation Guide File main.cfg chứa thông tin chung cho tất sưu tập Greenstone, bao gồm địa E-mail người bảo trì hệ thống, trang trạng thái collector có kích hoạt hay không, danh mục người dùng có lưu trữ hay không, chứa “cookies” có dùng để xác định người dùng hay không 4.2 Logs Có ba loại log: user log, error log giá trị ban đầu Hai danh mục cuối liên quan đến người bảo trì phần mềm Mọi hoạt động người dùng – Bất truy cập vào trang ghi lại phần mềm Greenstone, không ghi lại tên người sử dụng Quá trình đăng nhập được kích hoạt hay không kích hoạt tùy viết dòng lệnh sau: logcgiargs true usecookies true Trong file hệ thống chính, hai chọn lựa mặc định sai (false) trình đăng nhập cho phép trừ người quản trị mạng đặt lại thuộc tính Dòng logcgiargs dòng định trình logging kích họat hay không Bởi trình xây dựng usecookies mã khoá nhận dạng đánh dấu cho người dùng, hoạt động người dùng theo dõi thông qua file log Mỗi dòng mẫu tin người dùng truy cập trang web – Ngay trang tạo để duyệt file log! Nó có chứa địa IP máy người dùng, (b) Thời gian ngoặc vuông, (c) tham số CGI ngoặc đơn, (d) tên lọai trình duyệt web (Nestcape gọi “Mozilla”) Đây dòng mẫu, cắt giải cho lệnh người dùng: /fast-cgi-bin/niupepalibrary (a) its-www1.massey.ac.nz (b) [Thu Dec 07 23:47:00 NZDT 2000] (c) (a=p, b=0, bcp=, beu=, c=niupepa, cc=, ccp=0, ccs=0, cl=, cm=, cq2=, d=, e=, er=, f=0, fc=1, gc=0, gg=text, gt=0, h=, h2=, hl=1, hp=, il=l, j=, j2=, k=1, ky=, l=en, m=50, n=, n2=, o=20, p=home, pw=, q=, q2=, r=1, s=0, sp=frameset, t=1, ua=, uan=, ug=, uma=listusers, umc=, umnpw1=, umnpw2=, umpw=, umug=, umun=, umus=, un=, us=invalid, v=0, w=w, x=0, z=130.123.128.4-950647871) (d) “Mozilla/4.08 [en] (Win95; I ;Nav)” Đối số CGI, “z”, mã nhận dạng “cookie” phát sinh trình duyệt người dùng: Nó bao gồm số IP người dùng theo dõi dựa thời gian họ truy cập vào Thư viện số lần dầu File log usage.txt thay thư mục etc cấu trúc file Thư viện Greenstone (xem The Greenstone Digital Library Developer’s Guide) Khi trình logging kích hoạt, hành động người dùng ghi ghi lại Tuy nhiên 100 dòng cuối file log hiển thị link usage Hình 4.3 Quản lý người dùng Greenstone sử dụng chế dộ bảo mật để kiểm soát việc sử dụng số tính Hiện chức dùng để kiểm sóat người phép sử dụng Collector số chức quản lý Đối với sưu tập đặc biệt, vbạn yêu cầu xác định người dùng trước cung cấp thông tin cho họ - ví dụ như, tài liệu bảo vệ cho cá nhân, có password sử dụng chúng (Tuy nhiên, sưu tập hành sử dụng chức này) Việc xác định người dùng thực việc xác định Tên (user name) mật (password) hình 4a Từ trang administration, bạn liệt kê, thêm bớt người sử dụng Khả dĩ nhiên phải quản lý: người có quyền quản lí thêm tên người dùng mới, nhóm khác với quyền khác Hiện có nhóm như: “administrator” “colbuilder” Thành viên nhóm phép thêm hay di chuyển người dùng Nhóm thứ hai phép truy cập theo tính kể để xây dựng sưu tập xoá sưu tập tồn Khi phần mềm Greenstone cài đặt, người dùng gọi admin thuộc hai nhóm Password cho người sử dụng thiết lập suốt trình cài đặt Người dùng tạo tên password cho người dùng thuộc nhóm colbuilder, nhóm có khả cho phép người dùng khác xây dựng sưu tập Thông tin người dùng lưu vào hai sở liệu để cấu trúc file Greenstone (xem the Greenstone Digital Library Developer’s Guide) 4.4 Thông số kỹ thuật Các liên kết phía dòng thông số kỹ thuật cho biết thêm thông số cài đặt chương trình Các liên kết chung cho phép truy cập đến thông số kỹ thuật, bao gồm thư mục mà thông tin lưu trữ Bảng danh mục protocol ứng với loại protocol có khả hoạt động, thông tin sưu tập cung cấp protocol Cuối cùng, mã giao diện người dùng gọi “receptionist” dùng actions để kết nối với nhu cầu người dùng Những hành động tương ứng với đối số CGI gắn nhãn a Ví dụ: a=status receptionist gọi cho lên trang trạng thái (status page) Một đề mục danh mục cho phép truy cập vào danh mục vào hành động hổ trợ file hệ thống, dẫn khác để đối số liên quan đến hoạt động xãy

Ngày đăng: 03/12/2016, 00:48