1. Trang chủ
  2. » Văn Hóa - Nghệ Thuật

Vài nét về tạo lập, khai thác và quản lý tài liệu số trong thư viện

10 3 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 3,9 MB

Nội dung

Hệ thống số hỏa ScanRobot được đảnh giả rất cao ve cóng nghệ và hiện nay van là m ột trong những hệ thông hàng đâu trong lĩnh vực sỏ hóa trên thé giới.. 2.[r]

(1)

VÀI NÉT VỀ TẠO LẬP, KHAI THÁC« »

VÀ QUẢN LÝ TÀI LIỆU SỐ TRONG T H Ư VIỆN

Lại Thế Trung 0972283969 ihetrung@ namhoang.com.vn Cơng ty TNHH Nam Hồng

I ĐẠT VẤN ĐÈ

Công nghệ “số” đời đà thay đồi sâu sắc toàn diện sơ dừ liệu thơne tin xã hội, làm thay địi tồn cách thức người tạo (hông tin, truy cập sù dụng, bào quàn phô biến thông tin

Với thiết bị công nghệ số, dừ liệu thơng tin tạo lập nhanh chóng, lưu trừ lâu đài, sử dụng thuận tiện có tính “phân tán” nghĩa có kha phổ biến rộng rãi mà khơng bị bó hẹp vào phạm vi khơng gian Việc số hố liệu thơng tin khơng chi góp phần báo tơn di sản văn hố, mà cịn nguồn lực thúc đẩy kmh tế - xã hội phát triển Một sổ quốc gia có Việt nam sớm xây dựng chương trình sổ hố thành chương trình trọng điềm Để chương trình số hố dừ liệu thơng tin cỏ thê triền khai có hiệu quả, thực tê có nhiều vấn đc phải đối mặt cần giài quyết, ví dụ tà cách thức tạo lập, khai thác quản lý, quản trị tài liệu sơ, vân đỗ an tồn thơng tin, vân đc quyên

Tại Việt Nam, việc ứng dụng công nghệ số cho hoạt động thông tin thư viện đà rừng bước đạt thành tựu Bài viêt khơng có tham vọng nói lên hết vấn đề mà chi tập trung giới hạn vào sổ nét việc tạo lập, khai thác quản lý tài nguyên số

II ÍTNG d ụ n g c ô n g n g h ệ s ó t i c c t r n g đ i h ọ c

V IỆ T NAM

(2)

Nhiều đơn vị chủ độnẹ số hóa tài liệu đc phục vụ nhu cầu đòng đào cùa bạn đọc mà tài liệu truyền thống đáp ứng, phục vụ Từ chồ phải mua nhiều tài liệu đê phục vụ bạn đọc sổ hóa tài liệu giúp cho việc truy cập đồng thời giảm bớt nhàn phục vụ bạn đọc Trong đon vị chù động số hóa phải kể đến đơn vị đâu Trung tâm Học liệu - Đại học Thái Nguyên Trung tâm Thông tin Thư viện - Đại học Quốc gia Hả Nội, Thư viện Ọuốc gia Việt Nam, Viện Thông tin Khoa học Xà hội hay Đại học Ngoại thương Từ đó, đơn vị ngày thu hút đông đào bạn đọc tham gia không chi thư viện mà số lượng truy cập từ xa tăng lên cao

I I I G I Ả I P H Á P

1 Tạo lập tài liệu sổ

Việc phát triển tài liệu số việc tạo lập tài liệu số trọng số hóa tài liệu sử dụng nguồn tin điện tử mục ticu hàng đầu s ố hóa tài liệu sừ dụng để chì trình chuyển đồi thông tin từ dạng “truyền thống" sang dạng điện từ s ổ hóa coi phương thức tạo lập tài nguyên thông tin điện tử (tập hợp nhũng sưu tập thơng tin kiến thức số hóa, lưu trữ tổ chức có khả truy cập, chia sè, khai thác phân tán theo giao thức thủ tục tiêu chuẩn xác định môi trường điện tử)

Phát triển nguồn tin điện tử đa đạng bao gồm CSDL: (CSDL thư mục, CSDL toàn văn), sách điện tử (e-Book), tạp chí điện tử (e-Joumal), phim ành số hóa xây dựng nhiều dạng khác Các tài liệu điện tử bổ sung nhiều phương thức khác tùy thư viện định tựu chung lại chia thành tài liệu thu thập qua mua bán, trao đồi, biếu tặng, tự xây dựng hay truy cập từ xa từ nguồn đừ liệu khác

a) H ệ thắng m áy sổ hóa

Hệ thống máy số hóa ỉà hệ thống máy tự động quét sách tài liệu dạng in sang dạng điện tử

- Hệ thống máy số hóa tiên tiến sử dụng ống kính qt chun dụng mà khơng sử dụnẹ camera chụp ảnh đóng mờ kiểu cửa trập giúp độ bền lâu Các hệ thống áp dụng cơng nghệ lật trang khí (air-flow) mà không sử dụng thêm chi tiết kẹp giữ trang kính (glass plate), kẹp trang (clamp)

(3)

sụ lật nhiều trang lúc Có hộ thống an tồn trang tự động dừng hoạt động gặp vật cản cô Các dỏng khí, phát dính trang, hệ thống an toan có thê điều chinh phân mém

- Các hệ thống máy sổ hóa có góc mớ sách 60", góc mở có thê điều chinh lèn lới 100° Thực tế chứng minh với góc mờ cànu nhị thi co it tác động xấu đốn tài liệu, đặc biệt phận gáy sách, bìa sách Giá sách làm báng vật liệu gô đặc biệt tránh tôn hại đa tới tãi liệu, thiết kế thân thiện với mơi tnrừniì thơng minh, cho phép tự dộng cân chinh trình quét

- Thời gian đặt sách lèn giá thay sách phái nhanh chóng, đặc biệt máy khơng cần đến hiệu chinh tiêu cự trình quét Các cổ định, cổ định có gắn nam châm dùng đè giữ bìa sách cứng bìa sách mềm giá sách chữ V

- Hệ thống chiếu sáng sử dụng toàn đèn LED giúp ánh sảng đèn có độ ổn định tuổi thọ cực cao Thêm vào LED ánh sáng lạnh không gàv hại cho tài liệu cho người dùng

- Độ phân giài 300 / 400 dpi (tuỳ chọn), phù hợp sù dụng với cường độ cao vận hành liên tục vịng 24h/ ngày Đặc biệt kích thước trang tối đa với 32x32cm, tối thiêu có thề tới 5x5cm Kích thước giúp cho hệ thống máy sổ hóa làm việc tương đơi phong phủ loại sách dày mịng đặc biệt

- Trong trình quét hạn chế tối đa chi tiết khí máy chuyển động, giảm thiều tối đa lỗi thường xày so với hệ thống sử dụng nhiều chi tiết khí chuyển động

- Scan sách có độ dày 15cm, không giới hạn trọng lượng sách Có thê triên khai kêt hợp mảy trạm xứ lý ảnh hệ thông vần Scan tài liệu (tăng tiến độ số hoá cao)

b) Phần m ềm x lý h ìn h ảnh

(4)

Phần mềm phải có đầy đủ chức xừ lý hỉnh ảnh, chinh sửa ảnh giống phần mềm xử lý đồ họa chuyên nghiệp, cho phép xử lý ảnh với tính xử lý ảnh mạnh mẽ

Tốc độ xử lý hình ảnh nhanh Tích hợp ICC (Tiêu chuẩn quốc tế sừ dụng màu sắc - International Color Consortium) Cho phép nhập siêu liệu (metadata) trình xử lý sử dụng tích hợp với với máy quét loại khác

Các chức xử lý ảnh phần mềm đồ họa chuyên nghiệp:

s Cắt xén ảnh (croping), xoay ảnh

s Dựng thẳng ảnh (deskewing)

s Thay đổi (làm đồng loại bị nền) s Thay đổi kích thước ảnh

s Loại bò nhiễu ảnh S Điều chinh sáng/tối

s Điều chinh độ sắc nét, tương phản s Thay đổi định dạng ánh

(5)

N hữ ng tính n ăn g m n h mẽ p h ần mềm xử lý ảnh: - Phan mcm phái tưang đoi thân thiện dề sứ dụng

- Tốc độ xừ lý ảnh nhanh, sứ dụng tuân theo chuẩn màu sắc quốc tế ICC (International Coỉor Consotium)

- Chuyến đối định dạng ánh (Convert Pormat): chuyển đối địiứi dạng ánh nhãm mục đích eiàm dung lượng file ánh sau scan, file anh gốc (tiff) thường chuyển đổi sang dạng jpeg Ngoài ra, thao tác xử lý chinh sứa íìle ảnh chun đơi, ảnh gốc (tiff) lưu lưu

- Cho phép kết xuất ảnh đầu với nhiều định dạna khác như: ipg, tiff, p n g , btnp, p d f

- Tính tốn Bordcr (khung viền trang): Tính tốn Borders nhằm mục đích tính tốn kích thước viền, độ nghiêng trang tài liệu sau scan

- Chinh nghiẽna (Deskevving) nhằm mục đích chinh cho phần nội duns trang (bao gồm phẩn text hình ảnh) cân trang Ngồi ra, phần mềm cịn cho phép xoay trang theo góc 90°, 180°, 270°

- Chinh nhiễu, tẩy (Clip Iiistogram): làm cho trang ánh trắng độ nét chừ tăng lcn

- Cắt viền (Croppingì: Trong trình scan tài liệu, trang sách dù sách có thê có vết đen mép (lồi đặt sách lúc scan khơng cân, mép sách bi quăn, bị gấp mép )• Vi cần phải cắt viền xung quanh để loại bỏ đường viền đen, vết đen bên phần text

- Tạo lề trang (Extrapolation): nhằm mục đích mờ rộng khoảng trắng trang sách sau cắt hết viền đen, trang sách đẹp Phần thực khơng tuỳ thuộc vào nhu cầu người sừ dụng

- Cho phép xử lý hình ảnh theo khối liệu (batch Processing): có thê xứ lý hình ảnh cho trang nhiều tng lúc

- Có tích hợp với đầu đọc in barcode: giúp thuận tiện trinh xử lý, quản lý tài liệu

(6)

< >

Phân mém quản lý quy trình sơ hóa tài liệu

Phần mềm quản lý quy trinh sổ hóa hỗ trợ quản lý, thực quy trình xử lý tự động, đem lại hiệu cao công việc Tạo Workflow lập quy trình xử lý ảnh sau scan cách tự động Tùy theo dạng tài liệu nhu cầu mà tạo Workflow khác

Tự động xử lý khép kín (Ịuy trình cơng việc số hóa cho tài liệu bao gồm: xử lý ảnh, lưu trử, kiểm soát chất lượng, nhận dạng ký tự quang học, kết xuất file liệu

Xử lý hình ảnh q trình nhận dạng (có khả tương lác với phần mềm nhận dạng ký tự quang học) kết xuất tài liệu hoàn toàn tự động qua quy trình xừ lý phần mềm

c) Phần mềm nhận dạng ký tự quang học OCR

D«unwrt Input Cua tom AppUcatl «n «401 Ftn»fUadw EngỊn* Docunmnt Output

: H!r

“ M I

ĩếi m

3 9 3

đ * 3 3

(7)

- Phần mỏm sư dụng công nghệ nhận dạng tài liệu thích ứng

- Có xử iỷ nhận đan ti kỷ tự quang học (OCR) nhặn dạng nu Việt trịn 180 ngơn ngữ khác bao gồm Anh, Pháp, Nga, Dửc, Trung, Nhật, Hàn với độ xác đạt tói 99% tùy theo chât Itrạng IU vá cluìt lượng tái liệu

- Nhận dạng đa Iigỏn ngũ đồng thời Có kha phát tụ động cac ngôn ngữ là) liệu

- Có kết xuất két dạng íìle PDF đa lóp, bao gồm lớp anh gốc lớp văn ban (text) đà nhận dạng cho phcp tim kiêm, eopy toàn nội dung vãn bàn

- Có kha năn tỉ làm việc tự động không câr uiám sát

C o cung L'âp kẽm theo cơng cụ chinh sưa, tinh chinh hình ảnh - Có kha túy chọn cho liệu đẩu ra: DOC/DOCX/ODT/ XI s XLSX PDF PDK/A/ HTML/ TXT/ c s v DjVu/FB2/EPUB

- Giữ lại câu iruc cùa tài liệu nguồn, bao gôm định dạng, siêu liên kèt tha chì email, đầu trang chân trang, thích hỉnh ánh bảng, số trang ghi cuối trang

- Cung cấp trạm soát sưa lồi vãn bàn sau nhận dạng

Vài nét giải pháp ứttỊỊ dụng cơng nghệ sổ hóa tiên tiến trên

th ế giớ i Việt N am

lỉiện the giới mật giải pháp sị hóa tiên tiến thư viện lớn sứ dung mà đáp ứng yêu cầu giải pháp của hãng Treventus - Hãng có trụ s Vienna (Ao) Với sàn phàm hệ thống sỏ hóa ScanRobot tích hợp phần mém xứ lý ảnh phần mềm qn lý quy trình số hóa ScunRobot cỏ mật (rén 40 quốc gia Trung tâm sơ hóa lớn, thư viện Quốc gia vù thư viện trường đại học: Thư viện Đạt học ỉnnsbruck, Thư viện Đ H Gra: (Ảo); Thư viện Bavarian, Thư viện Beriin, Thu viện Đ H M unich (Đức); Thư viện Đ H Siberian Fedcral Trum* tâm sô hóa Elar (Nga); Trung tâm sỗ hỏa SAFIG (Pháp); íh u viện ĐU Slockolm Thư viên D lỉ Gothenburg (Thụy Diên); Thư viện Trung tủm Zurich, Thư viện D H B asel (Thụv Sự), Vãn phòng chinh ohù, I rung tăm sơ hóa D ataG roup (Rumani); Tập đồn Univers 'iusiness Technologies (Nhật Bán)

(8)

Cục Cơng nghệ Thơng tin - Bộ Quốc phịng Dáy đơn vị lởn có kho tài liệu đồ sộ cần số hỏa đê khai thác, sứ dụng vả bảo quàn cách toi đa Hệ thống số hỏa ScanRobot đảnh giả rất cao ve cóng nghệ van m ột hệ thơng hàng đâu trong lĩnh vực sỏ hóa thé giới.

2 Vấn đề quán lý, khai thác tài liệu sổ

Quá trình tham khảo phần mềm mã nguồn mờ, phần mềm thư viện giới, hay phần mềm công ty nước cung cấp khả đáp ứng tiêu chí cùa phần mềm tích hợp việc lựa chọn phần mềm cho hệ thống thư viện việc lảm tất yếu xây dựng mơ hình thư viện đại Việt Nam iúc

Khi mà nhà cung cấp giải pháp thư viện hàng đầu giới tách biệt gói giải pháp riêng biệt cho vấn đề tự động hóa thư viện thư viện số, yêu cầu phần mềm cần đem đến cho thư viện đại ngày Việt Nam giải pháp tích hợp, hồn chinh, ưong 1: giải pháp tự động hóa thư viện, giải pháp thư viện sổ, giài pháp công thông tin điện từ

Phần mềm thư viện cho phép quản lý toàn tài nguỵên thư viện, từ tài liệu truyên thông giá đên tài liệu sô không gian lưu trừ ảo Mọi tài liệu mô tả, đánh địa chi quản lý mượn trả/truy cập thị Hệ thống hỗ trợ Unicode cách đủ, cho phép bạn đọc truy cập tới nguồn tài nguyên bât kỳ ngôn ngừ

Các quy trinh xư lý cung cấp dịch vụ tài liệu truyền thống tài liệu số kết hợp thành dòng cháy thống hệ thông Điều giúp thư viện tối ưu luồng công việc, giảm thiêu thời gian nhập liệu, tăng độ xác tăng cường nhiêu tính mà hệ thống độc lập với khơng có

Đế quản lý đầy đủ chuyên nghiệp cho tài liệu sổ phần mềm thư viện số cần có mođule chính:

s Quản lý kho tư liệu số - Digital repository J Biên tập tài liệu số - Digital Object Maker v' Tra cứu - OPAC

s Tìm tồn văn - Full text search engine s Trình diễn - Mets Navigator

(9)

I v o

i tí ^ k/ i i t í t â n l â p J T i t ó r u OPAC Ị í 4 C t^ k n * k A J ỉ i M * i « n h Ặ l T i ‘»4o « S £ & h / r t t i «A #wW ig l o é n v ị r t

:i _ i l .i i

-1 5r ^ i drt h v o - v e í)

U ( ¥ h v g w i O W l O M IVK M V a n đ * ô "-ằt>

' t - V i m t o Ặ m v é M o h ứ i l n

l ' | f ' M t / W A N / l A N

Hình: Kiên trúc kỹ thuãt phân mềm thư viện sô > Kiến trú c kỹ th u ậ t p h ầ n m ềm th viện số:

v' Tầng liệu bao gồm: khơníì gian lưu trử web tệp tin lài liệu định dạng vãn bản, âm thanh, hinh ảnh, phim , biêu ghi siêu liệu dừ liệu có cấu trúc lưu trử CSDL cua hệ quán trị CSDL SQL Server

s Tâng nghiệp vụ: tầng bao gồm module chương trình thực xừ lý nghiệp vụ chủ yếu cập nhật liệu tìm kiếm thơng tin

J Tang dịch vụ web: tầng giao diện dịch vụ vveb cho phép chức xử lý tầng nghiệp vụ khai thác từ tầng giao diện người dùng từ hệ thống khác Ngoài tầng tầng ứng dụng web, cung cấp giao diện tương tác với người sừ dụng, tra cửu vả trinh diễn tài liệu số

s Tâng giao diện: Một giao diện windows với vơ vàn tính linh động dễ sử dụng phù hợp với yêu cầu tác nghiệp, giao diện web cho phép bạn đọc khai thác tài nguyên thư viện cách dễ dàng nơi lúc

> Quy trình quản lý tài liệu số:

(10)

J Thu thập, số hóa, bỏ sung: Đày ià trinh bô sung tài liệu vào thư viện số Các tộp tin tài liộu có thông qua mua sầm, nhận tặng bicu tự thu thập, số hóa Mồi tài liệu có thè tệp nhiều tệp, nhiều version khác

S Tải lên kho tài liệu số: Kho tài liệu số không gian lưu trữ vvcb nhiều phương thức bảo mật lưu dự phòng Kho bao gồm thư mục đặt tên phù hợp nhu cầu qn lý Có nhiều tính xem sưa xóa tệp tin thư mục, tạo trang vvcb

^ Biên mục bicn tập đối tượng số: phần mềm thư viện sô cho phép tạo biếu ghi siêu dử liệu mô tá tiêu chuấn MARC cho tài liệu liên kết siêu dừ liệu đối tượng số dạng METS Một đối tượng số có thê có nhiều siêu dừ liệu mơ tả siêu liệu qui định trình diễn phức tạp tạp chí sổ

s Tra cứu: nhiều phương pháp tìm kiếm ưu việt cua OPAC kết hợp với tra cứu toàn văn đem lại cho độc già tiện lợi

s Kiềm soát truy cập: Căn vào chinh sách lưu thông đuợc thiết lập, bạn đọc tự định mức độ truy cập theo thời lượng chi phí dựa sách lưu thơng thu viện thiết lập

S Trình diễn: thể theo qui định cấu trúc tài liệu cùa biểu ghi siêu liệu METS Mối quan hệ phức tạp thành phần, trang, chương bài, phần đo ạn giải quyết, đem lại tiện lợi cho người sừ dụng

IV K ẾT LUẬN

Sự phát triền mạnh mẽ công nghệ số hố làm cho sổ lượng tài liệu sị yia tâng mạnh mẽ, vi việc phát triên ứng dụng thư viện điện tư, thư viện sỏ xu tat yếu quan thông tin thư viện

Ngày đăng: 14/05/2021, 11:38

w