1. Trang chủ
  2. » Luận Văn - Báo Cáo

Vài nét về tạo lập khai thác và quản lý tài liệu số trong thư viện

10 11 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

VÀI NÉT VỀ TẠO LẬP, KHAI THÁC « » VÀ QUẢN LÝ TÀI LIỆU SỐ TRONG T H Ư VIỆN Lại Thế Trung 0972283969 ihetrung@namhoang.com.vn Công ty TNHH Nam Hồng I ĐẠT VẤN ĐÈ Cơng nghệ “số” đời đà thay đồi sâu sắc toàn diện sơ dừ liệu thône tin xã hội, làm thay địi tồn cách thức người tạo (hông tin, truy cập sù dụng, bào quàn phô biến thông tin Với thiết bị công nghệ số, dừ liệu thơng tin tạo lập nhanh chóng, lưu trừ lâu đài, sử dụng thuận tiện có tính “phân tán” nghĩa có kha phổ biến rộng rãi mà khơng bị bó hẹp vào phạm vi khơng gian Việc số hố liệu thơng tin khơng chi góp phần báo tơn di sản văn hố, mà nguồn lực thúc đẩy kmh tế - xã hội phát triển Một sổ quốc gia có Việt nam sớm xây dựng chương trình sổ hố thành chương trình trọng điềm Để chương trình số hố dừ liệu thơng tin cỏ thê triền khai có hiệu quả, thực tê có nhiều vấn đc phải đối mặt cần giài quyết, ví dụ tà cách thức tạo lập, khai thác quản lý, quản trị tài liệu sơ, vân đỗ an tồn thông tin, vân đc quyên Tại Việt Nam, thơng tin thư viện đà khơng có tham vọng hạn vào sổ nét nguyên số việc ứng dụng công nghệ số cho hoạt động rừng bước đạt thành tựu Bài viêt nói lên hết vấn đề mà chi tập trung giới việc tạo lập, khai thác quản lý tài II ÍTNG d ụ n g c ô n g n g h ệ s ó t i c c t r n g đ i h ọ c V IỆ T NAM Tài liệu số thực phát triển nước phương Tây từ lâu mà internet phát triền đặc biệt cơng tác số hóa phát Ưiên từ năm 90 kỷ XX, có nhiều tồ chức tiến hành số hóa tài liệu đồ phục phụ nhu cầu đào tạo nghiên cứu cúa trường đại học: dự án sơ hóa sách Google, Microsoít hay Proquest Central, Kbrary Nhưng Việt Nam thi số hóa tài liệu thực quan tâm gần 10 nám trở lại 163 Nhiều đơn vị chủ độnẹ số hóa tài liệu đc phục vụ nhu cầu đòng đào cùa bạn đọc mà tài liệu truyền thống đáp ứng, phục vụ Từ chồ phải mua nhiều tài liệu đê phục vụ bạn đọc sổ hóa tài liệu giúp cho việc truy cập đồng thời giảm bớt nhàn phục vụ bạn đọc Trong đon vị chù động số hóa phải kể đến đơn vị đâu Trung tâm Học liệu - Đại học Thái Nguyên Trung tâm Thông tin Thư viện - Đại học Quốc gia Hả Nội, Thư viện Ọuốc gia Việt Nam, Viện Thông tin Khoa học Xà hội hay Đại học Ngoại thương Từ đó, đơn vị ngày thu hút đông đào bạn đọc tham gia không chi thư viện mà số lượng truy cập từ xa tăng lên cao III G IẢ I P H Á P Tạo lập tài liệu sổ Việc phát triển tài liệu số việc tạo lập tài liệu số trọng số hóa tài liệu sử dụng nguồn tin điện tử mục ticu hàng đầu số hóa tài liệu sừ dụng để chì q trình chuyển đồi thơng tin từ dạng “truyền thống" sang dạng điện từ s ổ hóa coi phương thức tạo lập tài nguyên thông tin điện tử (tập hợp nhũng sưu tập thơng tin kiến thức số hóa, lưu trữ tổ chức có khả truy cập, chia sè, khai thác phân tán theo giao thức thủ tục tiêu chuẩn xác định môi trường điện tử) Phát triển nguồn tin điện tử đa đạng bao gồm CSDL: (CSDL thư mục, CSDL tồn văn), sách điện tử (e-Book), tạp chí điện tử (e-Joumal), phim ành số hóa xây dựng nhiều dạng khác Các tài liệu điện tử bổ sung nhiều phương thức khác tùy thư viện định tựu chung lại chia thành tài liệu thu thập qua mua bán, trao đồi, biếu tặng, tự xây dựng hay truy cập từ xa từ nguồn đừ liệu khác a) H ệ thắng m áy sổ hóa Hệ thống máy số hóa ỉà hệ thống máy tự động quét sách tài liệu dạng in sang dạng điện tử - Hệ thống máy số hóa tiên tiến sử dụng ống kính qt chuyên dụng mà không sử dụnẹ camera chụp ảnh đóng mờ kiểu cửa trập giúp độ bền lâu Các hệ thống áp dụng công nghệ lật trang khí (air-flow) mà khơng sử dụng thêm chi tiết kẹp giữ trang kính (glass plate), kẹp trang (clamp) - Máy số hóa sử dụng dịng khí để chia tách trang, lật giở trang tự động, sừ dụng sóng siêu âm phát dính trang, có phát 164 sụ lật nhiều trang lúc Có hộ thống an tồn trang tự động dừng hoạt động gặp vật cản cô Các dỏng khí, phát dính trang, hệ thống an toan có thê điều chinh phân mém - Các hệ thống máy sổ hóa có góc mớ sách 60", góc mở có thê điều chinh lèn lới 100° Thực tế chứng minh với góc mờ cànu nhị thi co it tác động xấu đốn tài liệu, đặc biệt phận gáy sách, bìa sách Giá sách làm báng vật liệu gô đặc biệt tránh tôn hại đa tới tãi liệu, thiết kế thân thiện với mơi tnrừniì thơng minh, cho phép tự dộng cân chinh trình quét - Thời gian đặt sách lèn giá thay sách phái nhanh chóng, đặc biệt máy khơng cần đến hiệu chinh tiêu cự trình quét Các cổ định, cổ định có gắn nam châm dùng đè giữ bìa sách cứng bìa sách mềm giá sách chữ V - Hệ thống chiếu sáng sử dụng toàn đèn LED giúp ánh sảng đèn có độ ổn định tuổi thọ cực cao Thêm vào LED ánh sáng lạnh khơng gàv hại cho tài liệu cho người dùng - Độ phân giài 300 / 400 dpi (tuỳ chọn), phù hợp sù dụng với cường độ cao vận hành liên tục vòng 24h/ ngày Đặc biệt kích thước trang tối đa với 32x32cm, tối thiêu có thề tới 5x5cm Kích thước giúp cho hệ thống máy sổ hóa làm việc tương đơi phong phủ loại sách dày mòng đặc biệt - Trong trình quét hạn chế tối đa chi tiết khí máy chuyển động, giảm thiều tối đa lỗi thường xày so với hệ thống sử dụng nhiều chi tiết khí chuyển động - Scan sách có độ dày 15cm, khơng giới hạn trọng lượng sách Có thê triên khai kêt hợp mảy trạm xứ lý ảnh hệ thông vần Scan tài liệu (tăng tiến độ số hoá cao) b) Phần m ềm x lý hình ảnh Hệ thắng máy số hóa chun dụng tích hụp với phần mềm xử lý hinh ảnh đầu Sau trình scan tài liệu, sổ íiles ảnh cỏ thê có chất lượng chưa tốt lồi guá trình scan tài liệu scan có chất lượng khơng tốt, vấn đế se khắc phục bời phần xử lý ánh 165 Phần mềm phải có đầy đủ chức xừ lý hỉnh ảnh, chinh sửa ảnh giống phần mềm xử lý đồ họa chuyên nghiệp, cho phép xử lý ảnh với tính xử lý ảnh mạnh mẽ Tốc độ xử lý hình ảnh nhanh Tích hợp ICC (Tiêu chuẩn quốc tế sừ dụng màu sắc - International Color Consortium) Cho phép nhập siêu liệu (metadata) q trình xử lý sử dụng tích hợp với với máy quét loại khác Các chức xử lý ảnh phần mềm đồ họa chuyên nghiệp: s Cắt xén ảnh (croping), xoay ảnh s Dựng thẳng ảnh (deskewing) s Thay đổi (làm đồng loại bò nền) s Thay đổi kích thước ảnh s Loại bị nhiễu ảnh S Điều chinh sáng/tối s Điều chinh độ sắc nét, tương phản s Thay đổi định dạng ánh s Gộp trang, tách trang 166 N hững tính m n h mẽ phần mềm xử lý ảnh: - Phan mcm phái tưang đoi thân thiện dề sứ dụng - Tốc độ xừ lý ảnh nhanh, sứ dụng tuân theo chuẩn màu sắc quốc tế ICC (International Coỉor Consotium) - Chuyến đối định dạng ánh (Convert Pormat): chuyển đối địiứi dạng ánh nhãm mục đích eiàm dung lượng file ánh sau scan, file anh gốc (tiff) thường chuyển đổi sang dạng jpeg Ngoài ra, thao tác xử lý chinh sứa íìle ảnh chun đơi, ảnh gốc (tiff) lưu lưu - Cho phép kết xuất ảnh đầu với nhiều định dạna khác như: ipg, tiff, p n g , btnp, p d f - Tính tốn Bordcr (khung viền trang): Tính tốn Borders nhằm mục đích tính tốn kích thước viền, độ nghiêng trang tài liệu sau scan - Chinh nghiẽna (Deskevving) nhằm mục đích chinh cho phần nội duns trang (bao gồm phẩn text hình ảnh) cân trang Ngồi ra, phần mềm cịn cho phép xoay trang theo góc 90°, 180°, 270° - Chinh nhiễu, tẩy (Clip Iiistogram): làm cho trang ánh trắng độ nét chừ tăng lcn - Cắt viền (Croppingì: Trong trình scan tài liệu, trang sách dù sách có thê có vết đen mép (lồi đặt sách lúc scan khơng cân, mép sách bi quăn, bị gấp mép )• Vi cần phải cắt viền xung quanh để loại bỏ đường viền đen, vết đen bên phần text - Tạo lề trang (Extrapolation): nhằm mục đích mờ rộng khoảng trắng trang sách sau cắt hết viền đen, trang sách đẹp Phần thực khơng tuỳ thuộc vào nhu cầu người sừ dụng - Cho phép xử lý hình ảnh theo khối liệu (batch Processing): có thê xứ lý hình ảnh cho trang nhiều tng lúc - Có tích hợp với đầu đọc in barcode: giúp thuận tiện trinh xử lý, quản lý tài liệu - Cho phép nhập siêu dù liệu (mctadata) kỹ thuật, siêu dừ liệu mô tả, siêu dừ liệu cấu trúc cho tài liệu 167 < > ệ Phân mém quản lý quy trình sơ hóa tài liệu Phần mềm quản lý quy trinh sổ hóa hỗ trợ quản lý, thực quy trình xử lý tự động, đem lại hiệu cao công việc Tạo Workflow lập quy trình xử lý ảnh sau scan cách tự động Tùy theo dạng tài liệu nhu cầu mà tạo Workflow khác Tự động xử lý khép kín (Ịuy trình cơng việc số hóa cho tài liệu bao gồm: xử lý ảnh, lưu trử, kiểm soát chất lượng, nhận dạng ký tự quang học, kết xuất file liệu Xử lý hình ảnh trình nhận dạng (có khả tương lác với phần mềm nhận dạng ký tự quang học) kết xuất tài liệu hoàn tồn tự động qua quy trình xừ lý phần mềm c) Phần mềm nhận dạng ký tự quang học OCR D«unwrt Input CuatomAppUcatl«n «401 Ftn»fUadw EngỊn* Docunmnt Output : đ * m H!r— ĩếi m “M I 168 3 f ế* F o tm a u - Phần mỏm sư dụng công nghệ nhận dạng tài liệu thích ứng - Có xử iỷ nhận đan ti kỷ tự quang học (OCR) nhặn dạng nu Việt trịn 180 ngơn ngữ khác bao gồm Anh, Pháp, Nga, Dửc, Trung, Nhật, Hàn với độ xác đạt tói 99% tùy theo chât Itrạng IU vá cluìt lượng tái liệu - Nhận dạng đa Iigỏn ngũ đồng thời Có kha phát tụ động cac ngơn ngữ là) liệu - Có kết xuất két dạng íìle PDF đa lóp, bao gồm lớp anh gốc lớp văn ban (text) đà nhận dạng cho phcp tim kiêm, eopy tồn nội dung vãn bàn - Có kha năn tỉ làm việc tự động không câr uiám sát C o cung L'âp kẽm theo công cụ chinh sưa, tinh chinh hình ảnh - Có kha túy chọn cho liệu đẩu ra: DOC/DOCX/ODT/ XI s XLSX PDF PDK/A/ HTML/ TXT/ c s v DjVu/FB2/EPUB - Giữ lại câu iruc cùa tài liệu nguồn, bao gôm định dạng, siêu liên kèt tha chì email, đầu trang chân trang, thích hỉnh ánh bảng, số trang ghi cuối trang - Cung cấp trạm soát sưa lồi vãn bàn sau nhận dạng Vài nét giải pháp ứttỊỊ dụng cơng nghệ sổ hóa tiên tiến th ế giới Việt N am lỉiện the giới mật giải pháp sị hóa tiên tiến thư viện lớn sứ dung mà đáp ứng yêu cầu giải pháp hãng Treventus - Hãng có trụ s Vienna (Ao) Với sàn phàm hệ thống sỏ hóa ScanRobot tích hợp phần mém xứ lý ảnh phần mềm quàn lý quy trình số hóa ScunRobot cỏ mật (rén 40 quốc gia Trung tâm sơ hóa lớn, thư viện Quốc gia vù thư viện trường đại học: Thư viện Đạt học ỉnnsbruck, Thư viện Đ H Gra: (Ảo); Thư viện Bavarian, Thư viện Beriin, Thu viện Đ H Munich (Đức); Thư viện Đ H Siberian Fedcral Trum* tâm sơ hóa Elar (Nga); Trung tâm sỗ hỏa SAFIG (Pháp); íh u viện ĐU Slockolm Thư viên D lỉ Gothenburg (Thụy Diên); Thư viện Trung tủm Zurich, Thư viện D H Basel (Thụv Sự), Vãn phòng chinh ohù, I rung tăm sơ hóa D ataG roup (Rumani); Tập đồn Univers 'iusiness Technologies (Nhật Bán) Tại Việt Nam, Thư viện Trung tâm lớn sử dụng hệ thong ScanRobot bao gồm : Trung tâm Thông tin Thư viện - Dại học Quốc gia Hủ Nội, Viện Thòng lin Khoa học Xã hội - Viện Hàn lảm Khoa học Xã hội Việt Nam Học viện Chính tri Hành chinh Quốc gia Hơ Chí Minh, Cục Cơng nghệ Thơng tin - Bộ Quốc phịng Dáy đơn vị lởn có kho tài liệu đồ sộ cần số hỏa đê khai thác, sứ dụng vả bảo quàn cách toi đa Hệ thống số hỏa ScanRobot đảnh giả cao ve cóng nghệ van hệ thơng hàng đâu lĩnh vực sỏ hóa thé giới Vấn đề quán lý, khai thác tài liệu sổ Quá trình tham khảo phần mềm mã nguồn mờ, phần mềm thư viện giới, hay phần mềm công ty nước cung cấp khả đáp ứng tiêu chí cùa phần mềm tích hợp việc lựa chọn phần mềm cho hệ thống thư viện việc lảm tất yếu xây dựng mơ hình thư viện đại Việt Nam iúc Khi mà nhà cung cấp giải pháp thư viện hàng đầu giới tách biệt gói giải pháp riêng biệt cho vấn đề tự động hóa thư viện thư viện số, yêu cầu phần mềm cần đem đến cho thư viện đại ngày Việt Nam giải pháp tích hợp, hồn chinh, ưong 1: giải pháp tự động hóa thư viện, giải pháp thư viện sổ, giài pháp công thông tin điện từ Phần mềm thư viện cho phép quản lý toàn tài nguỵên thư viện, từ tài liệu truyên thông giá đên tài liệu sô không gian lưu trừ ảo Mọi tài liệu mô tả, đánh địa chi quản lý mượn trả/truy cập thị Hệ thống hỗ trợ Unicode cách đủ, cho phép bạn đọc truy cập tới nguồn tài nguyên bât kỳ ngôn ngừ Các quy trinh xư lý cung cấp dịch vụ tài liệu truyền thống tài liệu số kết hợp thành dịng cháy thống hệ thơng Điều giúp thư viện tối ưu luồng công việc, giảm thiêu thời gian nhập liệu, tăng độ xác tăng cường nhiêu tính mà hệ thống độc lập với khơng có Đế quản lý đầy đủ chuyên nghiệp cho tài liệu sổ phần mềm thư viện số cần có mođule chính: s Quản lý kho tư liệu số - Digital repository J Biên tập tài liệu số - Digital Object Maker v' Tra cứu - OPAC s Tìm tồn văn - Full text search engine s Trình diễn - Mets Navigator s Lưu thông - Circulation 170 I vo i1 tí ^ k/ ‘»4 o « S i i títâ n lâ p £ & h / r t t i «A J T itó ru OPAC Ị í 4C t^ k n * k A J #wW ig ỉiM * i« n h Ặ lT i lo é n v ịrt :i _ i l - .i i -1 r^ i - - drt h v o - v e í) U ( ¥ h v g w i O W l O M IVKM V a n đ * ô "-ằt> ' t - V im to Ặ m v é M o h ứiln l ' |f 'M t / W A N / l A N Hình: Kiên trúc kỹ thuãt phân mềm thư viện sô > Kiến trú c kỹ th u ậ t ph ần mềm th viện số: v' Tầng liệu bao gồm: khơníì gian lưu trử web tệp tin lài liệu định dạng vãn bản, âm thanh, hinh ảnh, phim , biêu ghi siêu liệu dừ liệu có cấu trúc lưu trử CSDL cua hệ quán trị CSDL SQL Server s Tâng nghiệp vụ: tầng bao gồm module chương trình thực xừ lý nghiệp vụ chủ yếu cập nhật liệu tìm kiếm thơng tin J Tang dịch vụ web: tầng giao diện dịch vụ vveb cho phép chức xử lý tầng nghiệp vụ khai thác từ tầng giao diện người dùng từ hệ thống khác Ngoài tầng tầng ứng dụng web, cung cấp giao diện tương tác với người sừ dụng, tra cửu vả trinh diễn tài liệu số s Tâng giao diện: Một giao diện windows với vơ vàn tính linh động dễ sử dụng phù hợp với yêu cầu tác nghiệp, giao diện web cho phép bạn đọc khai thác tài nguyên thư viện cách dễ dàng nơi lúc > Quy trình quản lý tài liệu số: Hình: Quy trình quản lý tài liệu sỏ 171 J Thu thập, số hóa, bỏ sung: Đày ià trinh bô sung tài liệu vào thư viện số Các tộp tin tài liộu có thơng qua mua sầm, nhận tặng bicu tự thu thập, số hóa Mồi tài liệu có thè tệp nhiều tệp, nhiều version khác S Tải lên kho tài liệu số: Kho tài liệu số không gian lưu trữ vvcb nhiều phương thức bảo mật lưu dự phòng Kho bao gồm thư mục đặt tên phù hợp nhu cầu quàn lý Có nhiều tính xem sưa xóa tệp tin thư mục, tạo trang vvcb ^ Biên mục bicn tập đối tượng số: phần mềm thư viện sô cho phép tạo biếu ghi siêu dử liệu mô tá tiêu chuấn MARC cho tài liệu liên kết siêu dừ liệu đối tượng số dạng METS Một đối tượng số có thê có nhiều siêu dừ liệu mô tả siêu liệu qui định trình diễn phức tạp tạp chí sổ s Tra cứu: nhiều phương pháp tìm kiếm ưu việt cua OPAC kết hợp với tra cứu toàn văn đem lại cho độc già tiện lợi s Kiềm soát truy cập: Căn vào chinh sách lưu thông đuợc thiết lập, bạn đọc tự định mức độ truy cập theo thời lượng chi phí dựa sách lưu thơng thu viện thiết lập S Trình diễn: thể theo qui định cấu trúc tài liệu cùa biểu ghi siêu liệu METS Mối quan hệ phức tạp thành phần, trang, chương bài, phần đoạn giải quyết, đem lại tiện lợi cho người sừ dụng IV K ẾT LUẬN Sự phát triền mạnh mẽ công nghệ số hố làm cho sổ lượng tài liệu sị yia tâng mạnh mẽ, vi việc phát triên ứng dụng thư viện điện tư, thư viện sỏ xu tat yếu quan thông tin thư viện Số hóa tâi liệu, vấn đề thời cùa hoạt động thòng tin thư viện nước quan tâm Việc triển khai hiệu còng việc phụ thuộc nhiều vào lựa chọn giải pháp, thiết bị sơ hóa phân mềm thu viện số đố việc khai thác, quàn lý tải liệu sổ mang lại hiệu cao mơ hình thư viện “số” ngày 172 ... dàng nơi lúc > Quy trình quản lý tài liệu số: Hình: Quy trình quản lý tài liệu sỏ 171 J Thu thập, số hóa, bỏ sung: Đày ià trinh bô sung tài liệu vào thư viện số Các tộp tin tài liộu có thông qua... điện từ Phần mềm thư viện cho phép quản lý toàn tài nguỵên thư viện, từ tài liệu truyên thông giá đên tài liệu sô không gian lưu trừ ảo Mọi tài liệu mô tả, đánh địa chi quản lý mượn trả/truy... tâm sô hóa lớn, thư viện Quốc gia vù thư viện trường đại học: Thư viện Đạt học ỉnnsbruck, Thư viện Đ H Gra: (Ảo); Thư viện Bavarian, Thư viện Beriin, Thu viện Đ H Munich (Đức); Thư viện Đ H Siberian

Ngày đăng: 18/03/2021, 13:49

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w