1. Trang chủ
  2. » Công Nghệ Thông Tin

TÌM HIỂU NGUỒN MỞ GREENSTONE VÀ ỨNG DỤNG - 1 docx

19 368 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 19
Dung lượng 472,38 KB

Nội dung

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ PHẦN MỀM NGUYỄN THÀNH QUY – LÊ HOÀNG NGỌC QUỲNH TÌM HIỂU NGUỒN MỞ GREENSTONE VÀ ỨNG DỤNG KHOÁ LUẬN CỬ NHÂN TIN HỌC TP. HCM, 2005 TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ PHẦN MỀM SINH VIÊN THỰC HIỆN NGUYỄN THÀNH QUY 0112195 LÊ HOÀNG NGỌC QUỲNH 0112471 TÌM HIỂU NGUỒN MỞ GREENSTONE VÀ ỨNG DỤNG KHOÁ LUẬN CỬ NHÂN TIN HỌC GIÁO VIÊN HƯỚNG DẪN ThS. NGUYỄN THỊ BÍCH NIÊN KHOÁ 2001 – 2005 i NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Thành phố Hồ Chí Minh, ngày tháng 07 năm 2005 Giáo viên hướng dẫn ii NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Thành phố Hồ Chí Minh, ngày tháng 07 năm 2005 Giáo viên phản biện iii LỜI CẢM ƠN Chúng em xin chân thành cảm ơn Khoa Công nghệ Thông tin, Thư viện Cao học Đại học Khoa học Tự nhiên Thành phố Hồ Chí Minh đã tạo điều kiện thuận lợi cho chúng em hoàn thành đề tài Tốt nghiệp này. Chúng em xin chân thành cảm ơn Th.S Nguyễn Thị Bích đã rất tận tình hướng dẫn, chỉ bảo chúng em trong suốt thời gian thực hiện đề tài vừa qua. Chúng em cũng xin chân thành cảm ơn tất cả các Thầy, các Cô trong Khoa đã tận tình giả ng dạy, trang bị cho chúng em những kiến thức cần thiết, quý báu trong những năm tháng học tập tại Trường. Xin cảm ơn Thầy Trần Minh Triết, Thầy Nguyễn Đình Khương cũng như Thầy Cô và các anh chị trong Phòng SeLab đã tạo điều kiện giúp đỡ chúng em thực hiện đề tài. Qua đây, chúng tôi cũng muốn bày tỏ lòng biết ơn của mình đến các giáo sư Đại học Waikato, New Zealand, đặc biệt là giáo sư I.H.Witten và giảng viên Katherine Don. Xin cảm ơn sự giúp đỡ chân thành của bạn bè khắp thế giới. Xin cảm ơn sự giúp đỡ của các bạn, những người luôn bên cạnh và giúp đỡ chúng tôi. Và cuối cùng, chúng con xin tỏ lòng biết ơn sâu sắc đến ông bà, bố mẹ, và cả gia đình đã nuôi dưỡng, giáo dục và luôn động viên để chúng con có ngày hôm nay. Mặc dù chúng em đã cố gắng hoàn thành Luận văn với tất cả sự nỗ lực c ủa bản thân, nhưng chắc chắn Luận văn vẫn không thể tránh khỏi những thiếu sót nhất định, kính mong nhận được sự cảm thông và chỉ bảo tận tình của Quý Thầy Cô và các bạn. TP. HCM, tháng 7 năm 2005 Nhóm sinh viên thực hiện Thành Quy & Ngọc Quỳnh iv MỞ ĐẦU Sống trong kỷ nguyên của sự bùng nổ thông tin như hiện nay, một vấn đề quan trọng đặt ra là làm sao quản lý thông tin hiệu quả, khoa học nhất, để có thể tìm ra một vài thông tin hữu ích trong hàng ngàn, hàng triệu thông tin nhanh chóng, chính xác. Chúng ta đều biết, cách quản lý tài liệu truyền thống chủ yếu trên giấy có những hạn chế nhất định, không chỉ tốn kém không gian lưu trữ, mà còn chiếm nhiều thời gian khi muốn tìm kiếm thông tin. Ngoài ra còn khó bảo quả n trong thời gian lâu dài dưới những điều kiện xấu, dễ hư hỏng, mất mát. Chưa kể việc khai thác sản xuất giấy làm ảnh hưởng tới môi trường sinh thái. Máy tính ra đời, giúp giải quyết rất nhiều vấn đề liên quan đến việc quản lý thông tin. Hình thức lưu trữ tài liệu dưới dạng điện tử ngày càng thông dụng hơn. Thử làm một ví dụ nhỏ để so sánh giữ a hình thức lưu trữ trên giấy với trên máy tính, ở dạng điện tử. Mỗi hình thức lưu trữ có những ưu khuyết điểm riêng nhưng ở đây chỉ so sánh về không gian lưu trữ, và thời gian tìm kiếm, truy xuất thông tin, mà không tính đến những yếu tố khác. Đơn vị dung lượng lưu trữ phổ biến hiện nay là Gigabyte. Một cuốn sách 200 trang lưu trên đĩa cần khoảng 1 megabyte. Như vậ y một gigabyte có thể lưu trữ khoảng một ngàn cuốn sách điện tử. Trong khi đó, để lưu trữ một ngàn cuốn sách giấy truyền thống cần một kệ sách đầy từ sàn cho đến trần nhà, chưa kể tiền mặt bằng, tiền in ấn, phát hành! Khi mà yêu cầu thông tin đòi hỏi nhanh chóng, chính xác, tài liệu điện tử càng thể hiện những khả năng ưu việt củ a mình. Cảm thấy rất tâm đắc với những hệ thống quản lý dữ liệu như vậy, chúng em đã chọn đề tài “Tìm hiểu nguồn mở Greenstone và Ứng dụng” để làm đề tài Tốt nghiệp, với mong muốn hiểu thêm về cách quản lý thông tin, từ đó mong muốn đóng góp phần nào vào việc xây dựng thư viện điện tử cho Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên, Thành phố Hồ Chí Minh. v NỘI DUNG Nội dung Luận văn được tổ chức thành 9 chương: Chương 1 – Tổng quan. Giới thiệu về thư viện điện tử và Greenstone. Trong chương này sẽ trình bày lý do và các mục tiêu khi thực hiện đề tài. Chương 2 – Các khái niệm cơ bản trong Greenstone. Mục đích của chương này là giải thích, làm sáng rõ những khái niệm quan trọng trong Greenstone. Chương 3 – Xây dựng bộ sưu tập. Tìm hiểu các quá trình thực thi của Greenstone để tạo nên một bộ sưu tập hoàn chỉnh. Chương 4 – Hiệu chỉnh giao diện của Greenstone. Khai thác khả năng tuỳ biến cao của Greenstone để thay đổi giao diện cho phù hợp với yêu cầu thực tế. Chương 5 – Hệ thống Web Greenstone. Đi sâu vào những khái niệm nâng cao của hệ thống Greenstone, tập trung vào phần xử lý trên web của hệ thống. Chương 6 – Xây dựng ứng dụng. Xây dựng thư vi ện số ITDL cho Khoa. Trong chương này sẽ xác định yêu cầu thực tế, xác định hai mô-đun chính của hệ thống: ITLib và ITLibWeb. Chương 7 – ITLib – Mô-đun xử lý offline. Chương này phân tích thiết kế hệ thống ITLib với chức năng chính là tạo các bộ sưu tập. Chương 8 – ITLibWeb – Mô-đun xử lý online. Chương này sẽ phân tích, thiết kế hệ thống ITLibWeb với giao diện web, tạo thư viện số, giúp người dùng sử d ụng các bộ sưu tập cũng như các chức năng, nghiệp vụ thư viện khác. Chương 9 – Đánh giá và hướng phát triển. Chương cuối cùng của đề tài, tổng hợp lại về Greenstone, đánh giá lại hệ thống thư viện điện tử ITDL và nêu những hướng phát triển hệ thống trong tương lai. Ngoài ra, các phần Phụ lục ở cuối Luận văn còn mở rộng các khía c ạnh liên quan đến thư viện số, các thành phần cấu thành nên Greenstone (MG, GDBM…) và các mô-đun hỗ trợ Greenstone. vi MỤC LỤC LỜI CẢM ƠN iii MỞ ĐẦU iv MỤC LỤC vi DANH SÁCH HÌNH xi DANH SÁCH BẢNG xiv PHẦN 1. TÌM HIỀU NGUỒN MỞ GREENSTONE 1 CHƯƠNG 1. TỔNG QUAN 2 1.1. Thư viện và thư viện số 3 1.1.1. Giới thiệu 3 1.1.2. Thư viện số 3 1.2. Thư viện số Greenstone 4 1.2.1. Giới thiệu 4 1.2.2. Tính năng 5 1.3. Mục đích của đề tài 6 CHƯƠNG 2. CÁC KHÁI NIỆM CƠ BẢN 7 2.1. Tài liệu 8 2.2. Bộ sưu tập 8 2.3. Tìm kiếm 8 2.4. Duyệt tài liệu 8 2.5. Metadata 10 2.6. Biên mục 11 2.7. Plugin 11 2.7.1. Giới thiệu 11 2.7.2. Danh sách các plugin 12 2.7.3. Các plugin xử lý tài liệu độc quyền 13 2.7.4. Gán thông tin metadata từ một tập tin mô tả 14 2.7.5. Chia cấu trúc tài liệu nguồn 16 2.8. Classifier 22 2.8.1. Giới thiệu 22 2.8.2. Phân loại 23 2.9. Định dạng cách hiển thị tài liệu 25 2.9.1. Giới thiệu 25 2.9.2. Định dạng danh sách tài liệu 25 2.9.3. Định dạng các thành phần của trang web hiển thị tài liệu 28 CHƯƠNG 3. XÂY DỰNG BỘ SƯU TẬP 30 3.1. Giới thiệu 31 3.2. Chương trình mkcol.pl 33 3.3. Chương trình import.pl 33 3.4. Chương trình buildcol.pl 35 3.5. Cấu trúc thư mục của Greenstone 37 3.6. Cấu trúc thư mục của một bộ sưu tập 38 3.7. Cấu trúc tài liệu theo định dạng XML 39 vii 3.8. Tập tin cấu hình bộ sưu tập 42 CHƯƠNG 4. HIỆU CHỈNH GIAO DIỆN GREENSTONE 45 4.1. Giới thiệu 46 4.2. Ảnh tiêu đề bộ sưu tập 48 4.3. Các nút duyệt trang 48 4.3.1. Cách hiển thị 48 4.3.2. Vị trí đặt các ảnh 51 4.4. Ảnh tiêu đề trang 52 4.5. Các nút duyệt tài liệu 53 4.5.1. Giới thiệu 53 4.5.2. Vị trí đặt các ảnh 53 4.5.3. Thêm nút mới 54 4.5.3.1. Tạo một nút mới dựa vào nút đã có 55 4.5.3.2. Tạo macro mới cho một nút 55 4.5.4. Xóa nút duyệt tài liệu 56 4.5.5. Thay đổi nút duyệt tài liệu 56 4.6. Hiển thị văn bản 56 4.6.1. Hiển thị loại CL list 56 4.6.2. Hiển thị nội dung 57 4.7. Override các macro 58 4.8. Thêm một trang mới 60 4.9. Hiển thị các bộ sưu tập 61 4.10. Macro chuẩn 62 4.11. Lưu ý 63 CHƯƠNG 5. HỆ THỐNG WEB GREENSTONE 64 5.1. Giới thiệu 65 5.2. Tổng quan về cơ chế xử lý 65 5.3. Chi tiết về cơ chế xử lý 67 5.4. Mã nguồn 69 5.4.1. Các lớp và hàm cơ bản 70 5.4.2. Collection server 70 5.4.3. Receptionist 72 PHẦN 2. XÂY DỰNG ỨNG DỤNG 75 CHƯƠNG 6. XÂY DỰNG ỨNG DỤNG 76 6.1. Tổng quan 77 6.1.1. Phát biểu bài toán 77 6.1.2. Giới thiệu về ITDL (IT Digital Library) 77 6.2. Đối tượng sử dụng hệ thống 78 6.3. Các chức năng chính 78 6.3.1. Cung cấp thông tin luận văn 78 6.3.2. Chuẩn hoá tài liệu 78 6.3.3. Xây dựng bộ sưu tập 78 6.3.3.1. Xây dựng bộ sưu tập Luận văn 79 6.3.3.2. Xây dựng bộ sưu tập Sách 79 6.3.3.3. Xây dựng bộ sưu tập Tổng quát 79 viii 6.3.4. Tra cứu tài liệu 79 CHƯƠNG 7. ITLIBWEB 80 7.1. Xác định yêu cầu 81 7.1.1. Giới thiệu 81 7.1.2. Bảng chú giải 81 7.1.2.1. ITLib 81 7.1.2.2. Greenstone 82 7.1.2.3. Thanh vien Khoa (Thành viên Khoa) 82 7.1.3. Đặc tả bổ sung 82 7.1.3.1. Phạm vi 82 7.1.3.2. Tài liệu tham khảo 82 7.1.3.3. Chức năng 82 7.1.3.4. Tính khả dụng 82 7.1.3.5. Tính ổn định 83 7.1.3.6. Sự hỗ trợ 83 7.1.3.7. Tính bảo mật: 83 7.1.3.8. Các ràng buộc thiết kế 83 7.1.4. Mô hình Use Case 83 7.1.4.1. Mô hình 83 7.1.4.2. Danh sách các Actor 85 7.1.4.3. Danh sách các Use Case 85 7.1.4.4. Đặc tả các Use case chính 86 7.2. Phân tích các Use case chính 90 7.2.1. Use case “Dang nhap” (Đăng nhập) 90 7.2.1.1. Lược đồ tuần tự 90 7.2.1.2. Lược đồ cộng tác 92 7.2.1.3. VOPC 93 7.2.2. Use case “Nhap luan van” (Nhập luận văn) 94 7.2.2.1. Lược đồ tuần tự 94 7.2.2.2. Lược đồ cộng tác 97 7.2.2.3. VOPC 99 7.2.3. Use case “Tra cuu” (Tra cứu) 100 7.2.3.1. Lược đồ tuần tự 100 7.2.3.2. Lược đồ cộng tác 100 7.2.3.3. VOPC 102 7.2.4. Use case “Xem luan van” (Xem thông tin luận văn) 102 7.2.4.1. Lược đồ tuần tự 102 7.2.4.2. Lược đồ cộng tác 103 7.2.4.3. VOPC 104 7.3. Thiết kế 105 7.3.1. Lược đồ lớp tổng quát của hệ thống 105 7.3.2. Chi tiết một số lớp chính 107 7.3.2.1. Lớp đối tượng dùng chung 107 7.3.2.2. Lớp boundary 107 7.3.2.3. Lớp control 108 [...]... cầu 11 6 8 .1. 1 Giới thiệu 11 6 8 .1. 2 Bảng chú giải 11 6 8 .1. 2 .1 Bộ sưu tập 11 6 8 .1. 2.2 Thủ thư 11 6 8 .1. 2.3 Quản trị hệ thống .11 7 8 .1. 2.4 ITLibWeb 11 7 8 .1. 3 Đặc tả bổ sung 11 7 8 .1. 3 .1 Phạm vi 11 7 8 .1. 3.2 Tài liệu tham khảo .11 7 8 .1. 3.3 Chức năng 11 7 8 .1. 3.4 Tính khả dụng 11 7 8 .1. 3.5 Tính ổn... .11 7 8 .1. 3.6 Hiệu suất 11 8 8 .1. 3.7 Sự hỗ trợ 11 8 8 .1. 3.8 Tính bảo mật 11 8 8 .1. 3.9 Các ràng buộc thiết kế .11 8 8 .1. 4 Mô hình Use Case 11 8 8 .1. 4 .1 Lược đồ chính của mô hình Use case 11 8 8 .1. 4.2 Danh sách Actor 11 9 8 .1. 4.3 Danh sách Use case 11 9 8 .1. 4.4 Đặc tả các Use case chính 11 9 8.2 Phân tích các Use case chính 12 7... 10 9 7.3.3 Thiết kế dữ liệu 11 0 7.3.3 .1 Mô hình dữ liệu 11 0 7.3.3.2 Danh sách các bảng dữ liệu .11 0 7.3.4 Thiết kế giao diện một số trang web chính .11 1 7.4 Cài đặt .11 3 7.4 .1 Công cụ và môi trường phát triển hệ thống 11 3 7.4.2 Mô hình cài đặt 11 4 7.4.2 .1 Mô hình 11 4 7.4.2.2 Diễn giải 11 4 CHƯƠNG 8 ITLib 11 5 8 .1 Xác... Trang chủ 11 1 Hình 7.37 - Trang chức năng của thành viên 11 1 Hình 7.38 - Trang nhập thông tin luận văn .11 2 Hình 7.39 - Trang xem thông tin luận văn 11 2 Hình 7.40 - Trang tra cứu tài liệu 11 3 Hình 7 .1 - Mô hình cài đặt .11 4 Hình 8 .1 - Lược đồ Use case 11 8 Hình 8.2 - “Chuẩn hóa tài liệu” : dòng sự kiện chính 12 7 Hình 8.3 - “Chuẩn hóa Tài... .13 7 Hình 8 .12 - Các lớp boundary 13 8 Hình 8 .13 - Các lớp control 13 9 Hình 8 .14 - Các lớp entity 14 0 Hình 8 .15 - Mô hình dữ liệu 14 1 Hình 8 .16 - Màn hình chuẩn hoá tài liệu 14 3 Hình 8 .17 - Màn hình thu thập dữ liệu 14 3 Hình 8 .18 - Màn hình quản lý thông tin BST 14 4 xii Hình Hình Hình Hình Hình 8 .19 - Màn hình xây dựng bộ sưu tập 14 4... kiện chính 12 8 Hình 8.4 - “Chuẩn hóa Tài liệu” : VOPC 12 8 Hình 8.5 - Luồng phụ “Tạo mới bộ sưu tập” 12 9 Hình 8.6 - Luồng phụ Mở bộ sưu tập” 13 0 Hình 8.7 - Luồng phụ “Xoá bộ sưu tập” 13 1 Hình 8.8 - Luồng phụ “Tạo mới bộ sưu tập” 13 2 Hình 8.9 - Luồng phụ Mở bộ sưu tập” 13 3 Hình 8 .10 - Luồng phụ “Xoá bộ sưu tập” 13 4 Hình 8 .11 - Sơ đồ lớp đối tượng... thống 10 6 Hình 7.27 - Lớp ThesisInfo 10 7 Hình 7.28 - Lớp UserInfo 10 7 Hình 7.29 - Lớp InputThesisInfo 10 8 Hình 7.30 - Lớp Login 10 8 Hình 7. 31 - Lớp ThesisController 10 8 Hình 7.32 - Lớp UserController 10 9 Hình 7.33 - Lớp ThesisEntity 10 9 Hình 7.34 - Lớp UserEntity 10 9 Hình 7.35 – Mô hình dữ liệu 11 0 Hình 7.36... 10 1 Hình 7 .19 - “Tra cứu” : dòng sự kiện khác .10 1 Hình 7.20 - “Tra cuu” : VOPC 10 2 Hình 7. 21 - “Xem luận văn” : dòng sự kiện chính 10 2 Hình 7.22 - “Xem luận văn” : dòng sự kiện khác 10 3 Hình 7.23 - “Xem luận văn” : dòng sự kiện chính 10 3 Hình 7.24 - “Xem luận văn” : dòng sự kiện khác 10 4 Hình 7.25 - “Xem luận văn” : VOPC 10 4 Hình 7.26 - Lược đồ... lệ 97 Hình 7 .11 - Thêm thông tin luận văn 98 Hình 7 .12 - Cập nhật thông tin luận văn 98 Hình 7 .13 - Thông tin nhập không hợp lệ .98 Hình 7 .14 - Thông tin cập nhật không hợp lệ 99 xi Hình 7 .15 - “Nhập luận văn” : VOPC .99 Hình 7 .16 - “Tra cứu” : dòng sự kiện chính 10 0 Hình 7 .17 - “Tra cứu” : dòng sự kiện khác .10 0 Hình 7 .18 - “Tra cứu” : dòng... 12 7 8.2 .1 Use case “Chuan hoa Tai lieu” 12 7 8.2 .1. 1 Lược đồ tuần tự 12 7 8.2 .1. 2 Lược đồ cộng tác .12 7 8.2 .1. 3 VOPC .12 8 8.2.2 Use case “QL BST Luan van” 12 9 8.2.2 .1 Lược đồ tuần tự 12 9 8.2.2.2 Lược đồ cộng tác .13 1 8.2.2.3 VOPC .13 5 8.3 Thiết kế 13 6 8.3 .1 Sơ đồ lớp đối tượng của hệ thống .13 7 8.3.2 Chi tiết . cầu 11 6 8 .1. 1. Giới thiệu 11 6 8 .1. 2. Bảng chú giải 11 6 8 .1. 2 .1. Bộ sưu tập 11 6 8 .1. 2.2. Thủ thư 11 6 8 .1. 2.3. Quản trị hệ thống 11 7 8 .1. 2.4. ITLibWeb 11 7 8 .1. 3. Đặc tả bổ sung 11 7 8 .1. 3 .1. . vi 11 7 8 .1. 3.2. Tài liệu tham khảo 11 7 8 .1. 3.3. Chức năng 11 7 8 .1. 3.4. Tính khả dụng 11 7 8 .1. 3.5. Tính ổn định 11 7 8 .1. 3.6. Hiệu suất 11 8 8 .1. 3.7. Sự hỗ trợ 11 8 8 .1. 3.8. Tính bảo mật 11 8. PHẦN 1. TÌM HIỀU NGUỒN MỞ GREENSTONE 1 CHƯƠNG 1. TỔNG QUAN 2 1. 1. Thư viện và thư viện số 3 1. 1 .1. Giới thiệu 3 1. 1.2. Thư viện số 3 1. 2. Thư viện số Greenstone 4 1. 2 .1. Giới thiệu 4 1. 2.2.

Ngày đăng: 30/07/2014, 20:20

TỪ KHÓA LIÊN QUAN