Đặc điểm của Dspace

Một phần của tài liệu Tìm hiểu phần mềm thư viện số và ứng dụng xây dựng thư viện số ở thư viện tạ quang bửu (Trang 47)

4. Phạm vi nghiên cứu

2.3Đặc điểm của Dspace

2.3.1 Mô hình đối tượng trong Dspace

Hầu hết các phần mềm đều thực hiện các chức năng quan trọng là khả năng sử dụng của nó, để hiểu toàn bộ phần mềm thì cần thiết phải xem xét các chức năng của phần mềm đó và kiểm nghiệm sơ qua hoạt động của nó. Dspace cũng vậy, từ khâu duyệt tính năng lƣu trữ của Dspace, ngƣời dùng cũng có thể cảm nhận đƣợc cấu trúc của một thƣ viện số, trong khi thực chất tổ chức và tính năng của nó bị ẩn đi đối với ngƣời dùng. Nói cách khác, những ngƣời quản trị Dspace có thể thấy đƣợc cấu trúc của cơ bản của Dspace mà không cần quan tâm có bao nhiêu giao diện quản trị dựa trên web đƣợc thiếp lập

Dspace lƣu trữ nội dung số, thƣờng là các đối tƣợng số, vì thế mà phần quan trọng nhất toàn bộ mô hình đối tƣợng của hệ thống Dspace chính là bản thân các đối tƣợng, thƣờng đƣợc gọi là các “Items”. Các Items đƣợc tổ chức phân cấp trong đó các Items tƣơng đồng đƣợc nhóm lại và đƣợc đặt trong các bộ sƣu tập với nội dung tƣơng ứng. Tổ chức nội dung ở mức cao nhất đó là các Communities. Mỗi Items đƣợc lƣu trong các kho trữ của Dspace đƣợc tạo bởi một bundle do đó một đối tƣợng số có thể lƣu trữ nhiều file khi cần. Các Bitstreams tuân theo các định dạng bitstreams để hệ thống có thể hiểu và Dspace thực thi theo nhiều cách khác nhau với nhiều dạng đối tƣợng nhƣ: ảnh có thể hiển thị khi duyệt hệ thống nhƣng file .exe thì không. Mô hình đối tƣợng trong Dspace đƣợc mô tả nhƣ hình 3.

Mô hình dữ liệu của Dspace là đa lớp với cấu trúc dựa trên mô hình thƣ viện: - Mô hình Dspace đƣợc chia thành nhiều communities: phòng thí nghiệm, trung tâm nghiên cứu hoặc phòng ban.

- Communities bao gồm các bộ sƣu tập, một bộ sƣu tập có thể có ở một hoặc nhiều community.

- Một items có thể trong một hoặc nhiều collection.

- Items lại đƣợc phân nhỏ thành các bundles, một bundles đƣợc tạo thành từ một hoặc nhiều các bitstreams.

- Bitstreams là phần nội dung dạng các HTML files và images đăng trên web và đƣợc tổ chức thành các bundles. Handles đƣợc chỉ định cho các communities, collections, và items. Bundles và bitstreams không đƣợc chỉ định một Handles.

2.3.2 Kiến trúc của Dspace

DSpace đƣợc xây dựng theo mô hình 3 tầng khá giống với mô hình MVC cụ thể gồm:

Application Layer: Tầng ứng dụng gồm các giao diện tƣơng tác với ngƣời dùng: giao diện web, nhập và xuất tài liệu…

Bussiness Logic Layer: Tầng xử lý gồm các gói xử lý theo từng chức năng: tìm kiếm, quản lý ngƣời dùng, quản lý dòng công việc, xác thực ngƣời dùng …

Storage Layer: Tầng lƣu trữ gồm kết nối và cơ sở dữ liệu để lƣu trữ tập tin.

2.3.3 Tiến trình của Dspace

Dspace là một phần mềm nhằm lƣu trữ các nội dung số, trong hệ thống đặc tính quan trọng nhất là cách thức đƣa dữ liệu vào hệ thống nhƣ thế nào. Có hai cách thức để thực hiện điều đó. Giao diện ngƣời dùng dựa trên web có thể cho phép ngƣời dùng cập nhật các item cho các bộ sƣu tập miễn là họ có quyền đăng nhập vào hệ thống. Khi ngƣời dùng đã thực hiện công việc này, họ tiến hành một loạt các công việc có khả năng cấu hình, tại đó họ có thể cập nhật nội dung và mô tả cho các item đó. Luồng công việc đƣợc mô tả nhƣ hình 5.

Nhƣ một sự lựa chọn, những ngƣời quản trị Dspace có thể thực hiện các chức năng xuất/nhập một số lƣợng lớn nội dung cho hệ thống. Items Importer là công cụ dòng lệnh dữ liệu hình thành bundled của hệ thống và cho phép ngƣời dùng nhập các bộ sƣu tập vào trong hệ thống.

Công cụ Item Importer sử dụng các định dạng lƣu trữ đơn giản của Dspace, là cấu trúc thƣ mục đơn giản có thể lƣu trữ các item cho việc nhập vào trong hệ thống. Một thƣ mục lƣu trữ các mức đỉnh bao gồm các thƣ mục đƣợc đặt tên duy nhất, mỗi thƣ mục bao gồm tất cả những gì cần thiết cho việc nhập một item đơn. Mỗi thƣ mục con chứa 2 file ngoài nội dung thực đƣợc xuất. Một file không thể thiếu là “dubin_core.xml” là một file dạng XML chứa các yếu tố Dublin Core tối thiểu và nội dung văn bản có chứa các bản ghi metadata, tên tác giả, tiêu đề,…Một file nội dung có chứa tên file của mỗi file có trong đối tƣợng số. Khi cấu trúc này đƣợc đặt vào đúng vị trí, công cụ Item Importer có thể chạy đơn giản và tất cả nội dung sẽ đƣợc cập nhật vào trong kho lƣu trữ. Công cụ cung cấp một file ánh xạ sau khi chạy, file này bao gồm chi tiết tất cả các item đã đƣợc xuất vào và vị trí mới của chúng trong hệ thống. Về lâu dài, flie này sẽ có ích trong việc xuất hoặc di chuyển nhóm các nội dung đã đƣợc nhập vào.

2.3.4 Dspace Workflow

Dspace là một trong những hệ thống lƣu trữ nội dung mở đầu tiên thực sự thành công trong việc giải quyết các yêu cầu khác nhau khi phải lƣu trữ các dạng, đối tƣợng sƣu tập khác nhau. Hệ thống workflow của Dspace là một phần quan trọng trong kiến trúc cuả Dspace, nó cho phép cập nhật, xử lý và thêm nội dung để duy trì sự tồn tại của bộ sƣu tập. Mô hình Dspace là mô hình Epeople trong đó ngƣời sử dụng đƣợc đăng ký vào hệ thống để thực hiện các tác vụ riêng với hệ thống Dspace. Đệ trình điển hình đầu tiên mà hệ thống hỏi ngƣời dùng là 2 câu hỏi về lịch sử cập nhật của item và số lƣợng các file trong việc đệ trình đó.

Dspace workflow đƣợc thiết kế để đơn giản hóa tiến trình xử lý và tập hợp các thông tin liên quan đến dữ liệu đƣợc đƣa lên. Dữ liệu theo một các form trực tuyến gồm: title, author,…

Khi hoàn thành metadata đƣợc ghi trong Dspace Workflow Manager ghi các thông tin cho các bảng dữ liệu liên quan và copy các bitstream vào các file

hệ thống. Một bộ xử lý duy nhất Handle đƣợc xác định cho mỗi tiến trình để duy trì mối liên hệ giữa bitstream(s) và metadata.

Workflow của bộ sƣu tập có thế tóm gọn trong 3 bƣớc. Với mỗi bộ sƣu tập có một nhóm ngƣời thực (e-person) hiện từng bƣớc liên quan tƣơng ứng; nếu không có nhóm nào cho một bƣớc xác định thì bƣớc đó sẽ bị bỏ qua. Nếu bộ sƣu tập không có các nhóm e-person liên quan tới bất kỳ một bƣớc nào thì việc đệ trình bộ sƣu tập đó sẽ đƣợc cập nhật thẳng vào kho lƣu trữ chính.

Nói cách khác, chuỗi công việc đó là: Bộ sƣu tập nhận một đệ trình. Nếu bộ sƣu tập có một nhóm đƣợc chỉ định cho bƣớc 1, bƣớc này sẽ đƣợc gọi và thông báo cho nhóm biết. Trái lại, bƣớc 1 sẽ bị bỏ qua. Tƣơng tự, các bƣớc 2, 3 đƣợc thực hiện nếu bộ sƣu tập có các nhóm đƣợc chỉ định trực tiếp với các bƣớc đó.

Khi một bƣớc đƣợc gọi, tác vụ thực hiện bƣớc này trong workflow sẽ đƣợc đặt trong „khối tác vụ‟-‟task pool‟ của nhóm tƣơng ứng. Một thành viên của nhóm sẽ nhận tác vụ đó trong khối và nó sẽ bị xóa trong task pool, để tránh việc các thành viên khác trong nhóm có thể thực hiện cùnn một tác vụ.

Thành viên trong nhóm có thể nhận tác vụ và thực hiện một trong các bƣớc sau:

B1: Có thể chấp nhận hoặc từ chối việc đệ trình

B2: Có thể chỉnh sửa metadata đƣợc ngƣời dùng cung cấp khi đệ trình nhƣng không thể thay đổi file đệ trình. Có thể chấp nhận hoặc từ chối việc đệ trình. B3: Có thể chỉnh sửa metadata đƣợc ngƣời dùng cung cấp khi đệ trình nhƣng không thể thay đổi file đệ trình. Có thể chấp nhận hoặc từ chối việc đệ trình, Sau đó phải cam kết lƣu trữ và có thể không thể từ chối việc đệ trình.

Khi đệ trình bị từ chối, nguyên nhân sẽ đƣợc gửi qua mail cho ngƣời đệ trình và đƣợc thông báo trên trang My Dspace ngƣời đệ trình. Nếu đệ trình đƣợc chấp nhận thì nó sẽ thực hiện các bƣớc tiếp theo trong worrkflow.

2.3.5 Quản lí người dùng trong DSpace

Nhóm ngƣời dùng (Group) đại diện cho các ngƣời dùng có cùng quyền hạn. Trong DSpace ngƣời dùng đƣợc chia ra thành 3 nhóm chính: (adsbygoogle = window.adsbygoogle || []).push({});

Anonymous: (ngƣời dùng vô danh) nếu chƣa đăng nhập thì tất cả những ngƣời dùng của Dspace đƣợc xem là ngƣời dùng vô danh. Nhóm này đƣợc phép xem những tài liệu công khai cho tất cả mọi ngƣời.

Normal users: (ngƣời dùng bình thƣờng) là những ngƣời sau khi đăng đăng nhập đƣợc phép đăng tải tài liệu lên bộ sƣu tập, đƣợc quyền xem những tài liệu công khai cho tất cả mọi ngƣời, ngoài ra còn đƣợc quyền quản lí một số bộ sƣu tập hoặc xem một số bộ sƣu tập bị giới hạn.

Administrators: những ngƣời dùng có quyền truy cập vào tất cả các chức năng trên tất cả các bộ sƣu tập, các mục trong DSpace.

Lƣu ý:

- Một ngƣời dùng có thể là thành viên của nhiều nhóm.

- Một nhóm – A - có thể là thành viên của một nhóm khác - B, khi đó quyền hạn của nhóm A sẽ là quyền hạn của nhóm A và kế thừa quyền của nhóm B.

- Ngoài ra khi tạo một bộ sƣu tập hệ thống sẽ tự động tạo nhóm quản lí trên bộ sƣu tập đó.

- Ngƣời dùng (User) trong DSpace đƣợc gọi là E-Person, trở thành thành viên của Dspace theo 2 cách:

+ Ngƣời quản trị tạo tài khoản đăng nhập cho thành viên.

+ Ngƣời dùng tự đăng ký và xác nhận thông tin qua tài khoản email đã đăng ký. Quyền hạn của ngƣời dùng trong Dspace:

- READ: có thể đọc file.

- WRITE: có thể thay đổi file. Trên bó (Bundle)

- ADD: có thể thêm nhiều tập tin vào bó. - REMOVE: xoá tập tin ra khỏi bó. Trên mục (Item)

- READ: có thể xem mục. - WRITE: có thể thay đổi mục.

- ADD/REMOVE: có thể thêm hoặc xóa các tập tin. Trên bộ sƣu tập (Collection)

- ADD/REMOVE: có thể thêm hoặc xóa các tập tin khỏi bộ sƣu tập DEFAULT_ITEM_READ: các mục có thuộc tính đọc.

- DEFAULT_BITSTREAM_READ: các tập tin đƣợc phép đọc.

- COLLECTION_ADMIN: có thể thay đổi, rút trích hoặc ánh xạ các mục vào bộ sƣu tập.

2.3.6 Quản lí tài liệu trong DSpace

Trong Dspace tài liệu đƣợc quản lí theo từng bộ sƣu tập (Collecttion) hoặc cộng đồng (Communication)

Cộng đồng (Communities): Có thể là trƣờng học, phòng ban, hoặc các trung tâm. Mỗi Cộng đồng cóthể bao gồm:

- Cộng đồng con (Sub-communities)

- Không giới hạn các Bộ sƣu tập (Collection)

Bộ sƣu tập – BST (Collections): Có thể là một chủ đề, một thƣ mục chứa nhiều tài liệu. Mỗi Bộ sƣu tập có thể có các quyền truy cập và dòng xử lý công việc khác nhau.

Với đại đa số ngƣời dùng, phƣơng tiện chính để tƣơng tác với các bộ sƣu tập số là thông qua giao diện ngƣời dùng, ngày nay thƣờng là ứng dụng giao diện web.

Với mỗi loại bộ sƣu tập thƣờng có những yêu cầu riêng với việc hiển thị nội dung của nó. Một kho lƣu trữ phải có khả năng tƣơng thích với giao diện ngƣời dùng của nó phù hợp với các yêu cầu riêng. Manakin đƣợc thiết kế để giải quyết những vấn đề này bằng cách tạo một framenetwork cơ bản hỗ trợ thiết lập các giao diện cho các bộ sƣu tập riêng. Manakin đóng vai trò lớn trong việc thiết lập giao diện đẹp cho thƣ viện số. Giao diện ngƣời dùng hiện thời đƣợc xây dựng dựa treen công nghệ JSP, nó đắt và khó có thể chính sửa thêm theo hƣớng ngƣời dùng. Manakin là một thành phần bổ sung cho Dspace, tạo thay đổi cơ bản trong hƣớng thể hiện nội dung các bộ sƣu tập.

Manakin đƣợc xây dựng trên một framenetwork phát triển web sử dụng kiến trúc đƣờng ống dựa trên XML. Kiến trúc đƣờng ống ở đây có nghĩa là một trang riêng lẻ đƣợc sinh ra thông qua việc gom nhiều thành phần với nhau theo một đƣờng ống, việc kết hợp với các thành phần khác diễn ra cho đến khi một trang đƣợc hình thành, các thành phần kiến trúc chính của Manakin là : Aspets, Themes, DRI Schema. Giao diện lƣu trữ số - Digital Repository Interface (DRI) là một lƣợc đồ XML mô tả cách biểu diễn một trang lƣu trữ. Khi các kho lƣu trữ với nội dung và metadata của nó, lƣợc đồ DRI có thể gồm cả các khái niệm cấu trúc mã và metadata mô tả theo các định dạnhg khác nhau. Các phần cấu trúc của lƣợc đồ dựa trên lƣợc đồ TEI cho cả sự đơn giản và phức tạp của nó và các phần metadata sử dụng lƣợc đồ METS cho việc mã hóa và đóng gói giữa các thành phần của item.

Aspect là các phần mở rộng của manakin, giúp điều chỉnh các đặc tính đang tồn tại hoặc tạo các đặc tính mới cho việc lƣu trữ số. Aspect cung cấp các

chức năng cho các hoạt động thƣ viện số trên giao diện nhƣ cơ chế đăng nhập, tìm kiếm nâng cao, hoặc mua bán trực tuyến.

Manakin Themes là khả năng cách điệu hóa hình ảnh các Aspect trên tạo nên giao diện của trang web Dspace. Các Themes có thể đƣợc thiết lập cho các kho lƣu trữ hoặc cho các community, các bộ sƣu tập hoặc các item bên trong các kho lƣu trữ. Khi một themes đƣợc sử dụng cho một community thì giao diện của tất cả các bộ sƣu tập và item sẽ đƣợc thiết lập theo themes mặc định đó. Ta có thể điều chỉnh themes cho các bộ sƣu tập và item cho riêng chúng. (adsbygoogle = window.adsbygoogle || []).push({});

Hai giai đoạn cơ bản của quá trình hiển thị kho lƣu trữ là phần sinh nội dung đƣợc thực hiền bởi một vòng aspect và phần hiển thị đƣợc thực hiện bởi một themes. Mỗi Aspect đƣợc thực hiện trên một tài liệu DRI, nó bổ sung một tập các đặc tính mới cho kho lƣu trữ, sau đó kết quả này đƣợc hiển thị trên một theme. Cả 3 thành phần này của Manakin đƣợc gộp trong một kiến trúc đƣờng ống để sinh ra một giao diện module hóa hoàn chỉnh cho kho lƣu trữ.

Khi kết hợp các thành phần này với nhau, chúng tăng cƣờng khả năng tƣơng tác và tùy biến cho giao diện của Dspace.

CHƯƠNG III: ỨNG DỤNG XÂY DỰNG THƯ VIỆN SỐ Ở THƯ VIỆN ĐẠI HỌC BÁCH KHOA HÀ NỘI

3.1 Vài nét về thư viện Tạ Quang Bửu

3.1.1 Lịch sử hình thành và phát triển

Thƣ viện Trƣờng Đại học Bách Khoa Hà Nội đƣợc thành lập từ năm 1956 (ngay sau ngày thành lập trƣờng). Trải qua quá trình xây dựng và phát triển, Thƣ viện đã có nhiều đóng góp quan trọng vào việc đào tạo đội ngũ cán bộ khoa học kỹ thuật đông đảo, đóng góp tích cực vào sự nghiệp phát triển kinh tế - khoa học - kỹ thuật của đất nƣớc.

Thời gian đầu mới thành lập, điều kiện hoạt động của Thƣ viện lúc bấy giờ còn gặp rất nhiều khó khăn. Vốn tài liệu ban đầu chỉ có 5000 cuốn sách, cơ sở vật chất nghèo nàn và 2 cán bộ phụ trách không có nghiệp vụ thƣ viện, hơn nữa Thƣ viện là một bộ phận trực thuộc Phòng Giáo vụ. Tuy nhiên, Thƣ viện vẫn

không ngừng phấn đấu để đảm bảo phục vụ tốt cho cán bộ và sinh viên trong trƣờng, kể cả trong thời gian sơ tán.

Thƣ viện đã từng đi sơ tán ở: Lạng Sơn, Hà Bắc, Hải Hƣng, Hà Tây cùng khối lƣợng lớn sách đem theo để phục vụ đào tạo cán bộ khoa học kỹ thuật cho đất nƣớc.

Cũng trong giai đoạn này, từ Trƣờng ĐHBK Hà Nội đã hình thành những trƣờng đại học mới nhƣ: Đại học Xây dựng, Đại học Mỏ-Địa chất, Đại học Công nghiệp nhẹ và Phân hiệu II về Quân sự (nay là học viện Kỹ thuật Quân sự). Thƣ viện Trƣờng cũng chia sẻ nhiều tài liệu và đã cử cán bộ sang làm việc công tác tại Thƣ viện ở trƣờng Đại học Mỏ - địa chất và trƣờng Đại học Xây dựng.

Từ năm 1973, Thƣ viện tách ra thành đơn vị độc lập. Ban Thƣ viện đã liên tục đƣợc đầu tƣ và phát triển không ngừng. Khi miền Nam đƣợc giải phóng, một số cán bộ Thƣ viện đã vào công tác tại miền Trung và miền Nam để xây dựng

Một phần của tài liệu Tìm hiểu phần mềm thư viện số và ứng dụng xây dựng thư viện số ở thư viện tạ quang bửu (Trang 47)