Xây dựng, tổ chức và khai thác tài liệu số tại Viện Thông tin khoa học xã hội

136 80 0
Xây dựng, tổ chức và khai thác tài liệu số tại Viện Thông tin khoa học xã hội

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN LẠI THẾ TRUNG XÂY DỰNG, TỔ CHỨC VÀ KHAI THÁC TÀI LIỆU SỐ TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI LUẬN VĂN THẠC SĨ THÔNG TIN - THƯ VIỆN Hà Nội - 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN LẠI THẾ TRUNG XÂY DỰNG, TỔ CHỨC VÀ KHAI THÁC TÀI LIỆU SỐ TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI Chuyên ngành: Mã số: Khoa học Thông tin - Thư viện 60 32 20 LUẬN VĂN THẠC SĨ THÔNG TIN - THƯ VIỆN Người hướng dẫn khoa học: TS LÊ VĂN VIẾT XÁC NHẬN HỌC VIÊN ĐÃ CHỈNH SỬA THEO GÓP Ý CỦA HỘI ĐỒNG Giáo viên hướng dẫn Chủ tịch hội đồng chấm luận văn thạc sĩ khoa học TS Lê Văn Viết PGS.TS Trần Thị Quý Hà Nội - 2015 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu tơi, có hỗ trợ, giúp đỡ từ giáo viên hướng dẫn TS Lê Văn Viết Các nội dung liên quan, kết nghiên cứu đề tài trung thực chưa cơng bố cơng trình trước Những số liệu bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá tác giả thu thập từ nguồn khác nhau, có ghi phần tài liệu tham khảo Ngoài ra, đề tài sử dụng số nhận xét, đánh số liệu quan, tổ chức cụ thể Viện Thông tin khoa học xã hội thể phần tài liệu tham khảo Tôi xin cam đoan chịu hoàn toàn trách nhiệm với kết nghiên cứu Hà Nội, tháng năm 2015 Tác giả Lại Thế Trung LỜI CÁM ƠN Để hồn thành luận văn này, tơi xin bày tỏ biết ơn sâu sắc,chân thành tới TS Lê Văn Viết Trong trình thực đề tài Thầy tận tình hướng dẫn, bảo, động viên để tơi hồn thành kết nghiên cứu Tơi xin trân trọng cám ơn Khoa Thông tin - Thư viện, Trường Đại học Khoa học Xã hội Nhân văn, dạy dỗ, đào tạo, truyền đạt cho kiến thức, kinh nghiệm giúp đỡ suốt trình học tập Tơi xin gửi lời cám ơn tới cán Viện Thông tin khoa học xã hội thuộc Viện Hàn lâm khoa học xã hội Việt Nam giúp nhiều công tác khảo sát, thu thập, xử lý số liệu để tơi có số cụ thể phục vụ đắc lực cho mục đích nghiên cứu Xin trân trọng cám ơn gia đình, bạn bè, đồng nghiệp sát cánh, động viên vượt qua nhiều trở ngại, khó khăn sống để tơi hồn thành chương trình học tập kết nghiên cứu Xin trân trọng cám ơn Hà Nội, tháng năm 2015 Học viên khóa QH-2010-X Lại Thế Trung MỤC LỤC MỞ ĐẦU 10 Tính cấp thiết đề tài 10 Tình hình nghiên cứu 11 Mục đích nhiệm vụ nghiên cứu 14 Giả thuyết nghiên cứu 14 Đối tƣợng phạm vi nghiên cứu 15 Phƣơng pháp nghiên cứu 15 Ý nghĩa khoa học ứng dụng luận văn 16 Dự kiến kết nghiên cứu 16 Bố cục luận văn 16 CHƢƠNG 1: XÂY DỰNG, TỔ CHỨC VÀ KHAI THÁC TÀI LIỆU SỐ VỚI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 17 1.1 Cơ sở lý luận thực tiễn phát triển tài liệu số 17 1.1.1 Các khái niệm 17 1.1.2 Vai trò tài liệu số 18 1.1.3 Đặc trưng tài liệu số 18 1.1.4 Các yếu tố tác động đến việc phát triển tài liệu số 20 1.2 Khái quát Viện Hàn lâm Khoa học Xã hội Việt Nam 21 1.2.1 Lịch sử đời phát triển 21 1.2.2 Chức năng, nhiệm vụ Viện Hàn lâm Khoa học Xã hội Việt Nam 25 1.2.3 Cơ cấu tổ chức đội ngũ cán Viện Hàn lâm Khoa học Xã hội Việt Nam 27 1.3 Khái quát Viện Thông tin Khoa học xã hội 28 1.3.1 Lịch sử đời phát triển 28 1.3.2 Chức năng, nhiệm vụ cấu tổ chức Viện 31 1.3.3 Đội ngũ cán Viện 33 1.3.4 Cơ sở vật chất Viện 33 1.4 Đặc điểm ngƣời dùng tin nhu cầu tin Viện TTKHXH 38 1.4.1 Đặc điểm người dùng tin Viện 38 1.4.2 Đặc điểm nhu cầu tin Viện 39 CHƢƠNG 2: THỰC TRẠNG XÂY DỰNG, TỔ CHỨC VÀ KHAI THÁC TÀI LIỆU SỐ TẠI VIỆN THÔNG TIN KHOA HỌC XÃ HỘI 45 2.1 Xây dựng tài liệu số 45 2.1.1 Bổ sung tài liệu số 45 2.1.2 Bổ sung tài liệu nội sinh 45 2.1.3 Số hóa tài liệu 48 2.1.4 Trao đổi, chia sẻ 57 2.1.5 Tặng biếu 59 2.2 Tổ chức tài liệu số 60 2.2.1 Tổ chức lưu trữ 60 2.2.2 Tổ chức bảo quản 60 2.3 Khai thác tài liệu số 61 2.3.1 Chính sách khai thác 61 2.3.2 Hình thức khai thác 61 2.4 Các yếu tố ảnh hƣởng phát triển tài liệu số Viện TTKHXH 63 2.4.1 Chính sách 63 2.4.2 Kinh phí 64 2.4.3 Phần mềm 65 2.4.4 Trang thiết bị công nghệ 65 2.4.5 Nhân lực 66 2.4.6 Vấn đề quyền 66 2.5 Hiệu công tác tổ chức khai thác tài liệu số Viện TTKHXH 67 2.5.1 Mức độ đáp ứng nội dung 67 2.5.2 Mức độ đáp ứng hình thức 69 2.5.3 Mức độ đáp ứng truy cập 71 2.6 Nhận xét 75 2.6.1 Nhận xét xây dựng TLS 75 2.6.2 Nhận xét tổ chức TLS 75 2.6.3 Nhận xét khai thác TLS 75 2.6.4 Nhận xét chung 76 CHƢƠNG 3: GIẢI PHÁP NÂNG CAO HIỆU QUẢ XÂY DỰNG, TỔ CHỨC VÀ KHAI THÁC TÀI LIỆU SỐ TẠI VIỆN TTKHXH 79 3.1 Giải pháp sách 79 3.2 Giải pháp kinh phí 80 3.3 Giải pháp phần mềm quản lý thƣ viện số 81 3.4 Giải pháp trang thiết bị công nghệ 83 3.5 Giải pháp nhân lực 84 3.6 Giải pháp vấn đề quyền 87 3.7 Một số giải pháp khác 87 KẾT LUẬN 91 TÀI LIỆU THAM KHẢO 92 PHỤ LỤC DANH MỤC CÁC TỪ VIẾT TẮT Các từ viết tắt tiếng Việt BST Bộ sưu tập BSTS Bộ sưu tập số CSDL Cơ sở liệu TTKHXH Thông tin Khoa học Xã hội TLS Tài liệu số TT-TV Thông tin - Thư viện TVĐT Thư viện điện tử TVS Thư viện số Các từ viết tắt tiếng Anh CD-ROM Compact Disc Read Only Memory CD-RW Compact Disc ReWriteable DVD Digital Video Disc ISBD International Standard Biliographic Decription IP Internet Protocal LCC Library of Congress Classification MARC Machine Readable Cataloguing DANH MỤC CÁC BẢNG BIỂU Bảng 1.1: Bảng thống kê tài liệu nội sinh CSDL thư mục 46 Bảng 1.2: Bảng thống kê tài liệu nội sinh CSDL toàn văn 47 Bảng 1.3: Bảng kinh phí nguồn trao đổi, chia sẻ 58 Bảng 1.4: Bảng kinh phí tặng biếu 59 Bảng 1.5: Bảng Đánh giá mức độ đáp ứng nội dung TLS Viện TTKHXH 68 Bảng 1.6: Bảng Đánh giá mức độ đáp ứng hình thức TLS Viện TTKHXH 70 Bảng 1.7: Bảng Đánh giá mức độ đáp ứng máy tính truy cập TLS 72 Bảng 1.8: Bảng Đánh giá mức độ đáp ứng đường truyền truy cập 73 TLS Bảng 1.9: Bảng Nguyên nhân cản trở người dùng tin truy cập khai thác TLS Website TVS 74 DANH MỤC CÁC HÌNH ẢNH, SƠ ĐỒ Hình 1.1: Các yếu tố ảnh hưởng tới cơng tác quản lý dịch vụ thông tin số 21 Hình 1.2: Hệ thống máy số hóa tự động Scanrobot 50 Hình 1.3: Hình ảnh đầu lăng trụ quét hệ thống máy số hóa 51 Hình 1.4: Giao diện phần mềm xử lý hình ảnh Scangate 52 Hình 1.5: Mơ hình hoạt động phần mềm quản lý quy trình số hóa Scanflow 53 Hình 1.6: Mơ hình hoạt động phần mềm nhận diện ký tự quang học 54 Hình 1.7: Sơ đồ hoạt động Máy số hóa chun dụng với hệ thống số hóa 56 Viện TTKHXH Hình 1.8: Giao diện trang chủ phần mềm Greenstone Viện TTKHXH 62 Hình 1.9: Dữ liệu lưu trữ trình bày dạng fulltext 63 Hình 1.10: Biểu đồ Mục đích sử dụng TLS người dùng tin Viện TTKHXH 68 Hình 1.11: Biểu đồ Đánh giá mức độ đáp ứng nội dung TLS Viện TTKHXH 69 Hình 1.12: Biểu đồ Đánh giá mức độ đáp ứng hình thức TLS Viện 70 TTKHXH Hình 1.13: Biểu đồ Mức độ thường xuyên truy cập TLS 71 người dùng tin Viện TTKHXH Hình 1.14: Biểu đồ Đánh giá mức độ đáp ứng máy tính truy cập TLS 72 Hình 1.15: Biểu đồ Đánh giá mức độ đáp ứng đường truyền truy cập 73 TLS Hình 1.16: Khởi tạo đặt tên cho sưu tập Greenstone 97 Hình 1.17: Cơng đoạn thu thập tập tin đưa vào sưu tập Greenstone 97 Hình 1.18: Nhập siêu liệu cho sưu tập (biên tập) Greenstone 98 Hình 1.1 98 Thiết kế mục tìm tin thiết kế phân lớp ình 1.20 Định dạng liệu hình tìm tin duyệt xem sưu tập 99 ình 1.21 Cơng đoạn tạo lập xây dựng sưu tập) Greenstone 99 Hình 1.22 Sơ đồ Quy trình tiền xử lý tài liệu 103 Hình 1.23: Khơng chọn user admin 107 Hình 1.24: Tạo job cho scan 107 Hình 1.25: Chạy test trang 108 Có bƣớc cài đặt cho tác vụ riêng: Bước 1: Lựa chọn tài liệu FineReader: - Tại tài liệu có lựa chọn: + Sử dụng tuỳ chọn tài liệu có sẵn chương trình + Sử dụng tuỳ chọn tài liệu: Người dùng chọn chế độ tự động ngơn ngữ tài liệu, chế độ tài liệu đen trắng hay tài liệu màu (tuỳ nhu cầu công việc, với tài liệu đen trắng tốc độ nhận dạng nhanh 30% so với tài liệu màu) Bật tính tiền xử lý trước nhận dạng, phát hướng trang, tách trang đối diện Chế độ đọc nhanh, chậm, thêm vào mẫu dùng riêng người dùng Hình 1.42: Tab tài liệu 120 Hình 1.43: Tab Quét/mở Hình 1.44: Tab Đọc 121 + Chọn tài liệu có: Lực chọn chế độ chọn tài liệu thủ công hay tự động thư mục đường dẫn tạo người dùng Hình 1.45: Chọn tài liệu có + Sử dụng tài liệu mở (thực xử lý tài liệu mở) Hình 1.46: Sử dụng tài liệu mở Bước Mở hình ảnh /PDF: Chọn mở hình ảnh/tệp PDF theo cách, bắt đầu tác vụ, tự động chọn ảnh/tệp PDF từ thư mục theo đường dẫn Hình 1.47: Mở hình ảnh/ PDF Bước 3: Phân tích Chọn cách bạn phân tích bố cục, khoanh vùng tự động hay tay Kiểm tra trước chuyển sang bước 122 Hình 1.48: Phân tích Bước Đọc Hình 1.49: Đọc Bước Lưu tài liệu - Chọn loại định dạng cần lưu trữ đầu kết - Tạo đường dẫn lưu trữ cố định - Tạo files cho trang tài liệu d3/Nhận dạng tài liệu: - Chọn tác vụ riêng - Chọn tài liệu cần nhận dạng - Chọn chỉnh sửa hình ảnh: 123 Hình 1.50: Giao diện nhận dạng tài liệu Các tính phần chỉnh sửa ảnh: Hình 1.51: Ch nh sửa ảnh + Chỉnh nghiêng: cho toàn tài liệu, trang bên chẵn trang lẻ (tuỳ lựa chọn) + Tẩy bẩn, xén trang, tách trang + Chỉnh sáng tối, độ tương phản, độ nét, sửa biến dạng hình, nghiêng dòng … - Cho đọc nhận dạng, khoanh vùng ảnh, text tự động chọn tay: 124 Hình 1.52: Khoanh vùng định dạng ảnh Sau khoanh vùng chọn định dạng, chọn “Đọc” để chương trình đọc cho kết text bên cạnh để chuyển sang bước soát lỗi Hình 1.53: So sánh, sửa lại tả sau nhận dạng Ở bước kiểm tra, so sánh để sửa lại tả sau nhận dạng cho với ảnh gốc 125 d4/ Lƣu tài liệu theo định dạng cần: Hình 1.54: Lưu tài liệu theo định dạng cần - Lựa chọn chế độ nén khơng nén (tỷ lệ nén 90%) (100MB xuống 10M) - Chọn định dạng cần cho đầu (Word, Excel, PDF, PDF/A, FB2/Epub, txt, html, pptx, DjVu, CSV) - Cho phép tương thích mở với Adobe Acrobat 5.0 cao hơn) - Cho chọn lớp ảnh lớp text text ảnh Hình 1.55: Chọn lớp ảnh lớp text ảnh 126 Phụ lục 4: Phiếu đánh giá TRƯỜNG ĐẠI HỌC KHOA HỌC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM XÃ HỘI VÀ NHÂN VĂN Độc lập - Tự - Hạnh phúc Hà Nội, ngày tháng năm 2015 PHIẾU ĐÁNH GIÁ CÔNG TÁC XÂY DỰNG, TỔ CHỨC VÀ KHAI THÁC TÀI LIỆU SỐ TẠI VIỆN THÔNG TIN KHXH Nhằm bước nâng cao chất lượng sưu tập tài liệu số Viện TTKHXH thời gian tới, tiến hành khảo sát nhu cầu sử dụng tài liệu số NDT Xin Anh/Chị vui lòng cho biết số thơng tin đây: (Đánh dấu x vào ô tương ứng điền thông tin vào chỗ trống) Xin trân trọng cảm ơn! Anh/Chị đánh giá chất lƣợng vốn tài liệu quan a Tài liệu truyền thống Rất tốt ☐ Tốt ☐ Bình thường ☐ Tốt ☐ Bình thường ☐ b Tài liệu đại Rất tốt ☐ Theo Anh/chị có cần số hóa tài liệu khơng?  Rất cần ☐Cần ☐ Có được, khơng có ☐ Khơng cần Anh/Chị sử dụng tài liệu số nhằm mục đích gì? Phục vụ công tác quản lý ☐ Nghiên cứu khoa học ☐ Phục vụ giảng dạy ☐ Tự nâng cao trình độ ☐ Viết luận án, luận văn ☐ Giải trí ☐ 127 ☐ Theo Anh/chị, để phát triển tài liệu số cần nên trọng đến hình thức nào? Nguồn mua tài nguyên thông tin số ☐ Thu thập nội sinh ☐ Nguồn trao đổi tài nguyên thông tin số ☐ Khác… ☐ Nguồn số hóa tài liệu ☐ Anh/Chị thƣờng xuyên sử dụng tài liệu số ngôn ngữ nào?  Tiếng Việt☐ Tiếng Anh☐ Tiếng Pháp☐Ngôn ngữ khác: Hiện nay, Anh/Chị thƣờng xuyên sử dụng tài liệu số mức độ nào? Hàng ngày ☐ Hàng tuần ☐ Hàng tháng ☐ Hàng năm ☐ Không sử dụng ☐ Chất lƣợng mạng trang thiết bị để quan hoạt động nhƣ nào? Rất tốt ☐ Chưa tốt ☐ Kém ☐ Ý kiến đánh giá Anh/Chị mức độ đáp ứng yếu tố cho việc truy cập phần mềm quản lý thƣ viện Viện TTKHXH? Mức độ đáp ứng Điểm Yếu tố đánh giá Máy tính Đáp ứng tốt 9-10 Đáp ứng 8-9 Bình thường 6-8 Khơng đáp ứng

Ngày đăng: 08/04/2020, 03:01

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan