Giới thiệu phần mềm Dlib

Một phần của tài liệu ứng dụng công nghệ thông tin quản lý kho luận án tại thư viện quốc gia việt nam (Trang 48 - 58)

2. Cơ sở dữ liệu toàn văn

2.2. Giới thiệu phần mềm Dlib

Phần mềm quản trị cơ sở dữ liệu Dlib bao gồm: Quản lý luận ỏn

Quản lý sỏch điện tử khỏc

Quản lý Cỏc file õm thanh, hỡnh ảnh hoặc video Bao gồm hai phần

1. phần dành cho độc giả (Tỡm kiếm và xem văn bản )

Chuẩn bị tài liệu Xử lý sách điện tử Phục vụ độc giả Lưu trữ Mô tả(biên mục)đánh chỉ số(index) Biên tập

2. Phần dành cho cỏn bộ thư viện: Đõy là khu vực để quản trị cơ sở dữ liệu.

Ngoài ra cũn cú bổ sung , loại bỏ hoặc sửa chữa tài liệu. Quy định cỏc chớnh sỏch truy cập.

Quản lý người dựng ( hay quản trị người dựng)

2.3. Biờn mục

Nhập vào mục quản trị tài liệu với tài khoản quản trị.

Dữ liệu là cỏc băng, đĩa CD, thư mục hoặc cỏc file được tiếp nhận từ phũng lưu chiểu.

Tiến hành biờn mục sau khi đó sắp xếp, phõn loại.

2.3.1. Chuẩn biờn mục

2.3.1.1 Metadata (Siờu dữ liệu)

Siờu dữ liệu được xỏc định là “dữ liệu mụ tả cỏc thuộc tớnh của đối tượng thụng tin và trao cho cỏc thuộc tớnh này ý nghĩa, khung cảnh và tổ chức. Siờu dữ liệu cũn cú thể được định nghĩa là dữ liệu cú cấu trỳc về dữ liệu”

Mục đớch đầu tiờn và cốt yếu nhất của siờu dữ liệu là gúp phần mụ tả và tỡm lại cỏc tài liệu điện tử trờn mạng internet. Sự phỏt triển mạnh mẽ của internet đó tạo ra sự bựng nổ của cỏc loại dữ liệu đa dạng ở dạng số, hỡnh ảnh, õm thanh, hỡnh ảnh động, tài liệu đa phương tiện. Những tài liệu số này cú thể truy cập trờn internet song việc tỡm kiếm chỳng một cỏch hiệu quả và khoa học như với cỏc hệ thống tin trực tuyến là hết sức khú khăn. Để gúp phần tăng cường chất lượng, tỡm kiếm cỏc tài liệu số trờn mạng internet, người ta đó đưa ra giải phỏp siờu dữ liệu.

Thực ra trong hoạt động thụng tin - thư viện truyền thống, cũng đó cú những khỏi niệm liờn quan đến siờu dữ liệu. Cỏc bản mụ tả thư mục chứa cỏc dữ liệu mụ tả đối tượng nh (cho sỏch, cho tạp chớ) do đú chỳng cú thể được xem nh một dạng siờu dữ liệu. Với việc tự động húa cho cụng tỏc biờn mục, phiếu thư mục được thay thế bằng biểu ghi thư mục. Nh vậy thành phần “siờu dữ liệu” cũn cú thể được trỡnh bày trong biểu ghi. Vỡ vậy, biểu ghi này được coi là biểu ghi siờu dữ liệu (Metadata record ) của đối tượng được CSDL quản lý. Với tài liệu truyền thống trờn giấy, thụng tin mụ tả được bố trớ nằm ngoài đối tượng mà nú mụ tả (vớ dụ: trờn phiếu thư mục của mục lục thư viện, trong biểu ghi của cơ sơ sở dữ liệu).Nhờ những yếu tố mụ tả như vậy, người ta cú thể xỏc định và tỡm kiếm lại được tài liệu một cỏch chớnh xỏc theo một vài yếu tố.

Ngày nay nguồn tài liệu điện tử phõn tỏn trờn mạng nhiều đến mức khụng thể xử lý hết được bằng cỏch thủ cụng nh đó và đang với tài liệu xuất bản trờn giấy. Để xử lý hết được tài liệu điện tử phõn tỏn, người ta phải ỏp dụng cỏc phương phỏp tự động - sử dụng cỏc chương trỡnh đặc biệt. Do tài liệu số (điện tử) được tạo ra, thụng thường khụng tuõn thủ những quy định xuất bản truyền thống, khụng cú những quy tắc nhất định giỳp cho phộp nhận dạng tự động được cỏc yếu tố mụ tả thụng thường như tỏc giả, địa chỉ, xuất bản, thụng tin về khối lượng... nờn cần thiết phải cú quy định thống nhất để cỏc chương trỡnh tự động nhận dạng và xử lý chung theo cỏc yờu cầu nghiệp vụ. Những quy định nh vậy được gọi là cỏc quy định về siờu dữ liệu. Vỡ thế để tạo điều kiện cho cỏc chương trỡnh cú thể định chỉ số tự động theo một yếu tố xỏc định, người ta cần thiết phải đưa thờm vào tài liệu điện tử những thuộc tớnh bổ sung để tăng cường việc mụ tả tài nguyờn thụng tin. Cỏc cụng cụ định chỉ số

tự động sẽ được lập trỡnh để nhận dạng cỏc thuộc tớnh này và định chỉ số chỳng, từ đú hỗ trợ tỡm kiếm theo những thuộc tớnh đặc thự.

Một bản ghi Metadata bao gồm một tập cỏc thuộc tớnh hoặc tập cỏc phần tử cần thiết để mụ tả cỏc tài nguyờn theo yờu cầu. Vớ dụ một hệ thống metadata thụng thường trong biờn mục thư viện chứa một tập cỏc bản ghi metadata dựng để mụ tả sỏch nh: Tỏc giả, nhan đề, ngày xuất bản, chủ đề - đề mục, số gọi để chỉ vị trớ trờn giỏ sỏch...

Cú nhiều chuẩn mụ tả biờn mục mang tớnh chất metadata khỏ thụng dụng.Vớ dụ như Marc21, Unimarc, ISO2709, Dublincore Metadata... cỏc dữ liệu này thường được gắn vào phần đầu cho mỗi tài liệu điện tử đặt trờn website và rất thớch hợp cho tỡm kiếm, lọc ra cỏc thụng tin metadata để tổ chức thành cỏc kho dữ liệu mà khụng cần dựng đến hệ quản trị cơ sở dữ liệu truyền thống.

2.3.1.2. Dublincore Metadata

Dublincore Metad là chuẩn dựng mụ tả nội dung của biểu ghi và dữ liệu. Nó đơn giản hơn MARC Format rất nhiều vỡ chỉ cú 15 trường dữ liệu. Mục đich thiết kế metadata này để sử dụng trờn mạng Internet, mụ tả cỏc tài liệu chuyờn ngành trong cỏc thư viện và tài liệu cỏc website khỏc nhau. Cỏc trường dữ liệu MARC và Dublincore cú thể trao đổi lẫn nhau.Bao gồm 15 trường

1.Nhan đề: - Tờn gọi chớnh thức của tài liệu (Title)

2.Tỏc giả: - Tờn của một hay một số tỏc giả chớnh (Creator)

3.Chủ đề: -Tờn chủ đề - đề mục dựng để phõn loại tài liệu (Subject) 4.Mụ tả: - Mụ tả vắn tắt nội dung tài liệu (Desccription)

5.Nhà xuất bản:- Tờn gọi, nơi ban hành tài liệu (Publisher) 6.Tỏc giả phụ: - Tờn của những tỏc giả cộng tỏc (Contributor)

7.Ngày thỏng: - Ngày thỏng ban hành tài liệu (Date) 8.Loại tài liệu: - Phõn loại tài liệu (Type)

9.Mụ tả vật lý: - Cỏc thụng tin về dạng vật lý (Format)

10.Định danh: - Cỏc thụng tin định danh của tài liệu (Identifier) 11.Nguồn gốc: - Cỏc thụng tin về xuất xứ của tài liệu (Source) 12.Ngụn ngữ: - Cỏc thụng tin về ngụn ngữ (Language)

13.Liờn kết: - Cỏc thụng tin liờn hệ của tài liệu (Coverage) 14.Nơi chứa: - Cỏc thụng tin liờn quan về lưu trữ (Relation) 15.Bản quyền: - Cỏc thụng tin liờn quan quyền tỏc giả (Rights)

Việc sử dụng cỏc phần tử của Dublincore là tựy chọn và cú thể lặp lại. Mỗi phần tử cũng cú một tập giới hạn cỏc thuộc tớnh để giới hạn ý nghĩa của nú. Dublincore Metadata cú những đặc tớnh sau:

Việc tạo lập và duy trỡ khỏ dễ dàng: Cho phộp những người khụng chuyờn nghiệp cú thể tạo cỏc bản ghi mụ tả đơn giản cho cỏc tài nguyờn thụng tin và việc truy xuất chỳng trờn mụi trường mạng một cỏch dễ dàng.

Ngữ nghĩa dễ hiểu và thụng dụng: Việc khai thỏc thụng tin trờn mạng internet diện rộng thường gặp trở ngại bởi những sự khỏc nhau về thuật ngữ và sự mụ tả thực tế. Dublincore Metadata giỳp cho người dũ thụng tin khụng chuyờn cú thể tỡm thấy vấn đề của mỡnh bằng cỏch hỗ trợ một tập cỏc trường thụng dụng mà ngữ nghĩa của chỳng được hiểu phổ biến.

Phạm vi quốc tế: Tập cỏc phần tử Dublincore Metadata lỳc đầu được phỏt triển bằng tiếng anh, nhưng cỏc phiờn bản sau nú được khởi tạo bởi cỏc ngụn ngữ khỏc nhau. Đầu thỏng 11 năm 1999 đó cú nhiều phiờn bản với trờn 20 ngụn ngữ, chủ yếu là tiếng Phần Lan, Na Uy, Thỏi, Nhật, Phỏp, Bồ Đào Nha, Đức, Hy lạp,In-đụ-nờ-xi-a và tiếng Tõy Ban Nha.

Tớnh mở rộng: Dublincore Metadata đó cung cấp một cơ chế cho việc mở rộng cỏc trường Dublincore, phục vụ nhu cầu khai thỏc cỏc tài nguyờn bổ sung. Cỏc phần tử Metadata từ những tập cỏc phần tử khỏc nhau cú thể liờn kết với Metadata của Dublincore. Điều này cho phộp cỏc tổ chức khỏc nhau cú thể dựng cỏc trường Dublincore để mụ tả thụng tin thớch hợp cho việc sử dụng trờn internet.

Phần dành cho bạn đọc

Bạn đọc phải đăng nhập với acount do thư viện cung cấp, mỗi một acount cú một chớnh sỏch truy cập riờng, khỏc nhau. Tựy theo từng loại tài liệu, thỡ mức độ truy cập khỏc nhau.

Sau khi gừ tờn tài liệu cần tỡm, chương trỡnh cho một số kết quả tỡm kiếm như sau:

Khi gừ cỏc điều kiện để tỡm kiếm và cho ra kết quả tỡm kiếm hiển thị cỏc danh mục, bạn đọc nhấn chuột vào và cú thể xem tài liệu theo danh mục đú.

Bạn đọc muốn xem dữ liệu ở dạng số thỡ cú thể kớch chọn vào phần fulltext file dữ liệu đú sẽ hiển thị theo đỳng định dạng trờn một cửu sổ mới. Chẳng hạn như Document thỡ được hiển thị trờn Microsoft word, nếu file định dạng là pdf thỡ được hiển thị bởi chương trỡnh pdf reader, hoặc õm thanh, hỡnh ảnh được hiển thị bầng chương trỡnh windowns media player.

CHƯƠNG III

Một phần của tài liệu ứng dụng công nghệ thông tin quản lý kho luận án tại thư viện quốc gia việt nam (Trang 48 - 58)

Tải bản đầy đủ (DOC)

(65 trang)
w