Ứng dụng Cụng nghệ hiện đại trong cụng tỏc bổ sung

Một phần của tài liệu Trung tâm Thư viện và Tri thức số - Library and Digital Knowledge Center (Trang 51 - 54)

1.1.4.9 .Quy luật phỏt triển của tài liệu

2.2.7.Ứng dụng Cụng nghệ hiện đại trong cụng tỏc bổ sung

2.2. Hoạt động phỏt triển nguồn lực thụng tin tại Trung tõm

2.2.7.Ứng dụng Cụng nghệ hiện đại trong cụng tỏc bổ sung

Như đó núi khi xõy dựng, phỏt triển nguồn lực thụng tin, việc lựa chọn cụng nghệ để tiến hành rất quan trọng bởi vỡ nú là cụng cụ đắc lực giỳp ta thực hiện cỏc cụng việc trong quy trỡnh tạo lập và vận hành nguồn tài liệu số. Trong quỏ trỡnh triển khai, Trung tõm cũng hết sức chỳ trọng tới vấn đề này. Dựa theo cỏc yờu cầu khi xõy dựng vốn tài liệu số, để nguồn tài liệu số phỏt huy được hết vai trũ của mỡnh, khi tạo lập vốn tài liệu số Trung tõm đó khiển khai trang bị một hệ thống cơ sở hạ tầng nhất định.

Để phỏt triển nguồn lực thụng tin hiện đại, Trung tõm cũng đó cú hệ thống mạng Internet được kết nối Internet với đường truyền đủ đỏp ứng cho số người dựng tối thiểu của thư viện. Hệ thống mỏy chủ đủ mạnh để đỏp ứng việc lưu trữ, bảo quản, cung cấp dữ liệu và quản lý người dựng và cỏc phần mềm hệ thống cú bản quyền. Trang web đăng tải và là cổng truy cập của người dựng vào bộ sưu tập số, tài liệu số của cơ quan. Phần mềm quản lý tài nguyờn số.

Cho đến nay, Trung tõm đó và đang thực hiện quy trỡnh số húa với dữ liệu văn bản (text) và dữ liệu hỡnh ảnh (image/scanned images). Quy trỡnh số húa trải qua cỏc bước: lựa chọn tài liệu; quột tài liệu; phõn trang và tự động xử lý hỡnh ảnh, kiểm tra, sắp xếp và xem lại cỏc tệp tin hỡnh ảnh; chuyển đổi dữ liệu số; nhận dạng chữ viết; tạo ra cỏc tài liệu phức hợp.

Để khụi phục nội dung text của tài liệu từ cỏc file ảnh với nhiều loại font chữ và trờn nền giấy xấu, phần mềm nhận dạng chữ tiếng Việt hiện nay của Trung tõm chưa đỏp ứng được yờu cầu nhận dạng với độ chớnh xỏc cao. Vỡ vậy nếu sử dụng bản text thu được qua nhận dạng thỡ khụng trỏnh khỏi sai sút và khỏc biệt so với bản gốc (nếu chất lượng tài liệu quỏ xấu thỡ chỉ nhận dạng được khoảng dưới 50%). Mỗi bản text thu được như vậy, Trung tõm đều tiến hành hiệu đớnh chỉnh sửa lại. Đặc biệt với những bản text bằng tiếng Việt, thường dẫn đến sự khỏc biệt với bản gốc nhiều. Trong trường hợp này, Trung tõm cú khắc phục bằng cỏch phục vụ tài liệu dạng file ảnh.

Hiện nay, Trung tõm thực hiện việc số húa bằng mỏy scan chuyờn dụng với cỏc phần mềm nhận dạng file ảnh, file text. Việc sử dụng cỏc loại mỏy scan tựy theo đặc điểm điều kiện của từng cơ quan. Trung tõm hiện chỉ cú mỏy scan với tớnh năng đơn giản, cho kết quả là cỏc file ảnh. Sản phẩm sau khi scan khụng được chuyển dạng thành file.doc để chỉnh sửa text. Như vậy, cỏn bộ thư viện chỉ chỉnh sửa được cỏc yếu tố như kớch cỡ, hiệu chỉnh độ sỏng tối, độ tương phản…của file ảnh đú.

Nguồn tài liệu số húa tại trung tõm là sỏch chuyờn khảo, tạp chớ ngành Luật học, ngành An ninh... nờn cú những bài viết cựng nội dung tiờu đề, nhưng cú thể được trỡnh bày ở cỏc vị trớ khụng xuyờn suốt trong tạp chớ. Vỡ vậy, khi scan ra file ảnh, cỏn bộ tại phũng thụng tin sẽ xử lý và đưa cỏc bài viết đú vào cựng một hệ thống xuyờn suốt để khi đưa lờn CSDL số, bạn đọc sẽ dễ dàng tỡm kiếm sử dụng. Sau khi được scan và xử lý, cỏc file này sẽ được chuyển sang định dạng .pdf và đưa lờn CSDL của hệ thống. Do đặc tớnh của mỏy scan tại trung tõm cũn hạn chế, nờn đõy chỉ là giải phỏp tạm thời cho

những số tạp chớ khụng cú file điện tử. Trung tõm chỉ tiến hành scan đối với cỏc số tạp chớ chọn lọc cần thiết. Chủ yếu trung tõm sử dụng dữ liệu là file điện tử cú sẵn được chuyển từ phũng tạp chớ lờn, sau đú thực hiện cỏc thao tỏc nghiệp vụ hoàn chỉnh tài liệu số và đưa lờn CSDL cho bạn đọc tra cứu. Trong thời gian tới, trung tõm sẽ cú những kế hoạch cũng như đề xuất được hỗ trợ cỏc trang thiết bị cụng nghệ hiện đại hơn phục vụ cho cụng tỏc số húa tài liệu.

Hiện nay Trung tõm sử dụng phần mềm Libol 5.5 để lưu trữ cung cấp tài liệu số tới bạn đọc. Tuy nhiờn trong quỏ trỡnh sử dụng, modul số húa của phần mềm vẫn chưa thỏa món mong muốn của cỏn bộ thư viện. Hiện Trung tõm đang muốn lựa chọn một phần mềm quản trị tài nguyờn số tốt hơn, để đỏp ứng cỏc yờu cầu theo ý muốn, khắc phục những hạn chế mà phần mềm Libol gặp phải. Đú là khi quản trị sử dụng tài liệu số, chuyờn viờn của cụng ty Tinh Võn thường phải đến Trung tõm hỗ trợ thường xuyờn về lỗi kỹ thuật hay trong quỏ trỡnh tỏc nghiệp. Phần mềm cũng chưa giải quyết tốt được tớnh năng phõn quyền sử dụng cho bạn đọc.

Hiện nay, Phần mềm hiện đang được cỏc nước trờn thế giới sử dụng phổ biến như phần mềm thư viện số Hũn đỏ xanh – Greenstone. Đõy cũng là sự chỉ đạo theo cụng văn 4960/BGDĐT-CNTT của Bộ Văn húa và Truyền thụng: Sử dụng phần mềm Greenstone trong quản lý thư viện số.

Những CSDL số của cỏc Trung tõm được biờn mục theo khổ mẫu Marc21.

Cú thể núi Trung tõm đó chỳ trọng tới vấn đề ứng dụng cụng nghệ trong việc phỏt triển nguồn lực thụng tin, tuy nhiờn do nhiều yếu tố tỏc động nờn cụng nghệ đảm bảo cho hoạt động số húa vẫn cũn hạn chế. Những mỏy scan tài liệu mới chỉ dừng ở tớnh năng đơn giản như scan ra ảnh, tốc độ bỡnh thường. Những khú khăn gặp phải trong quỏ trỡnh Scan cũng nảy sinh. Vớ dụ như nếu với tạp chớ hay tại liệu in quỏ mỏng, thỡ chữ in của trang trước sẽ hiện lờn ở trang sau. Đối với những tạp chớ đúng quỏ chặt và sỏt gỏy khi Scan sẽ khụng thấy hết được tạp chớ. Đối với tài liệu cũ khi Scan chữ cú thể

bị mờ. Đối với giấy bị đen, vàng ố chất lượng Scan rất kộm. Những ấn phẩm cú độ dày lớn thỡ phải chỉnh sửa lại trang Scan do bị lệch trong quỏ trỡnh Scan. Quỏ trỡnh nhận dạng tiếng Việt thường khụng đảm bảo được chất lượng, phải chỉnh sửa nhiều. Đú là những khú khăn gặp phải trong quỏ trỡnh số húa tài liệu.

Túm lại, vấn đề ứng dụng cụng nghệ cú tỏc động khụng nhỏ tới hoạt động phỏt triển nguồn lực thụng tin/tài liệu tại Trung tõm . Đú là những vấn đề về số húa tài liệu hay quản trị tài liệu số... tất cả sẽ ảnh hướng tới chất lượng phỏt triển nguồn lực thụng tin của cơ quan. Cụng nghệ hiện đại, trang thiết bị đầy đủ sẽ gúp phần khụng nhỏ vào việc tăng cường chất lượng phỏt triển nguồn lực thụng tin núi chung và tài liệu số núi riờng.

Một phần của tài liệu Trung tâm Thư viện và Tri thức số - Library and Digital Knowledge Center (Trang 51 - 54)