Nghiên cứu công nghệ số hóa và tạo lập chỉ số trong hệ quản trị nội dung : Luận văn ThS. Công nghệ thông tin : 60 48 10

74 22 0
Nghiên cứu công nghệ số hóa và tạo lập chỉ số trong hệ quản trị nội dung : Luận văn ThS. Công nghệ thông tin : 60 48 10

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ HÕA NGHIÊN CỨU CƠNG NGHỆ SỐ HĨA VÀ TẠO LẬP CHỈ SỐ TRONG HỆ QUẢN TRỊ NỘI DUNG LUẬN VĂN THẠC SĨ Hà Nội - 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ HÕA NGHIÊN CỨU CƠNG NGHỆ SỐ HĨA VÀ TẠO LẬP CHỈ SỐ TRONG HỆ QUẢN TRỊ NỘI DUNG Ngành: Công nghệ thông tin Chuyên ngành: Công nghệ phần mềm Mã số: 60 48 10 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS Trần Minh Hà Nội - 2013 LỜI CẢM ƠN Trước tiên tơi xin bày tỏ lịng biết ơn sâu sắc tới TS Trần Minh, Phó viện trưởng Viện cơng nghiệp phần mềm nội dung số Việt Nam Trong thời gian làm luận văn tốt nghiệp, thầy dành nhiều thời gian q báu tận tình bảo, hướng dẫn việc nghiên cứu, thực luận văn Tôi xin cảm ơn thầy giáo, cô giáo giảng dạy tơi q trình học tập làm luận văn Các thầy cô giúp hiểu thấu đáo lĩnh vực mà nghiên cứu để vận dụng kiến thức vào cơng tác Xin cảm ơn bạn bè, đồng nghiệp tạo điều kiện tốt nhất, động viên, cổ vũ tơi suốt q trình học tập nghiên cứu để hoàn thành luận văn tốt nghiệp Hà Nội, tháng 12 năm 2013 Học viên thực Nguyễn Thị Hịa LỜI CAM ĐOAN Tơi xin cam đoan rằng, kết nghiên cứu tơi có giúp đỡ lớn thầy hướng dẫn đồng nghiệp trường Đại học Hải Dương Các số liệu kết nêu luận văn trung thực chưa cơng bố cơng trình nghiên cứu khác Trong luận văn, tơi có tham khảo đến số tài liệu số tác giả liệt kê phần tài liệu tham khảo cuối luận văn Hà Nội, tháng 12 năm 2013 Học viên thực Nguyễn Thị Hòa MỤC LỤC DANH MỤC CÁC CHỮ VIẾT TẮT DANH SÁCH BẢNG DANH SÁCH HÌNH VẼ MỞ ĐẦU Chương PHÂN TÍCH Q TRÌNH SỐ HĨA 11 1.1 Cơng nghệ số hóa 11 1.1.1 Khái niệm 11 1.1.2 Tại phải số hóa liệu 11 1.1.3 Ưu điểm Hạn chế 11 1.1.4 Quá trình số hóa 12 1.2 Công nghệ mã nguồn mở chụp tài liệu 13 1.2.1 Giới thiệu TWAIN thư viện Dynamic Net TWAIN 13 1.2.2 Giới thiệu thư viện SANE 17 Chương LẬP METADATA VÀ CHỈ MỤC NGƯỢC ĐỂ LƯU TRỮ VÀ TÌM KIẾM 35 2.1 Cơ sở tạo lập 35 2.2 Metadata tạo lập (xác thực) 36 2.3 Metadata tìm kiếm (Dublin Core) 36 2.3.1 Tạo lập metadata 37 2.3.2 Lựa chọn chuẩn liệu đặc tả 37 2.4 Phương pháp lập mục ngược để tìm kiếm tài liệu 43 2.4.1 Đánh mục 44 2.4.2 Truy vấn theo nhóm từ 48 2.5 GreenStone tạo lập mục 49 2.5.1 Tổng quan GreenStone 49 2.5.2 Quá trình xây dựng sưu tập 55 Chương ỨNG DỤNG THỬ NGHIỆM 56 3.1 Bài toán ứng dụng 56 3.1.1 Yêu cầu thực tế 56 3.1.2 Bài toán ứng dụng 56 3.2 Ứng dụng thử nghiệm 57 3.2.1 Ứng dụng scan văn 57 3.2.2 Tạo văn lưu trữ với GLI (sau gọi chung sưu tập) 59 3.3.3 Một số giao diện trang lưu trữ tìm kiếm văn 64 3.3 Đánh giá 66 KẾT LUẬN 67 TÀI LIỆU THAM KHẢO 68 PHỤ LỤC: Các xử lý chương trình Scan văn 69 DANH MỤC CÁC CHỮ VIẾT TẮT Từ viết tắt Ý nghĩa Giải thích tiếng Việt API Application Programming Interface CCVC Công chức viên chức CNTT Công nghệ thông tin GLI GreenStone Librarian Interface GNU GNU's Not Unix SANE Scanner Access Now Easy Truy cập máy quét dễ dàng XML eXtensible Markup Language Ngôn ngữ đánh dấu mở rộng Giao diện lập trình ứng dụng Giao diện GreenStone thư viện DANH SÁCH BẢNG Bảng 1.1: Mã trạng thái (Status Codes) 21 Bảng 1.6: Giá trị ý nghĩa SANE_ACTION 27 Bảng 2.1: Các thành tố đặc tả liệu Dublin Core 39 Bảng 2.2: Bảng danh sách Plugin 51 Bảng 2.3: Bảng tên thành phần hiển thị trang web 55 DANH SÁCH HÌNH VẼ Hình 1.1: Mơ hình tổng quan hệ thống số hóa tài liệu 12 Hình 1.2: Các yếu tố TWAIN 13 Hình 1.4: Quá trình thu thập liệu 14 Hình 1.6: Dynamic Net TWAIN Microsoft Visual Studio Net 17 Hình 1.7: Khung chương trình 32 Hình 1.8: Thuộc tính vùng quét (Scan area options) 34 Hình 2.1: Mơ hình thực nghiệp vụ hành 35 Hình 2.2: Sơ đồ chuyển đổi văn gốc vào hệ thống tin học 36 Hình 2.3: Danh sách posting cho từ Brutus, Caesar, Calpurnia 44 Hình 2.4: Quá trình xây dựng token 45 Hình 2.5: Tạo token từ Tài liệu 1, Tài liệu 45 Hình 2.6: Sắp xếp theo từ mục 46 Hình 2.7: Dictionary Postings 47 Hình 2.8: Kết truy vấn hai từ Brutus, Caesar 48 Hình 2.10: Tài liệu liệt kê theo vùng alphabet 54 Hình 3.1: Chế độ quét 1-bit BW 58 Hình 3.2: Chế độ quét 8-bit Gray 58 Hình 3.3: Chế độ quét 24-bit RGB 59 Hình 3.4: Tạo sưu tập 60 Hình 3.5: Chọn tài liệu cho sưu tập 60 Hình 3.6: Biên mục tài liệu theo chuẩn Dublin Core 61 Hình 3.7: Lựa chọn Plugin cho tài liệu 61 Hình 3.8: Chỉ mục tìm kiếm 62 Hình 3.9: Thêm mục tìm kiếm 62 Hình 3.10: Tạo nút tìm kiếm 63 Hình 3.11: Xây dựng sưu tập 63 Hình 3.12: Định dạng Email, ảnh hiển thị 63 Hình 3.13: Các thư mục chứa file tài liệu file đặc tả tương ứng (XML) 64 Hình 3.14: Giao diện giới thiệu 64 Hình 3.15: Tìm kiếm theo tùy chọn 65 Hình 3.16: Tìm kiếm theo tên tệp tin 65 Hình 3.17: Tìm kiếm theo thể loại 65 Hình 3.18: Tìm kiếm theo thời gian 66 ... NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ HÕA NGHIÊN CỨU CƠNG NGHỆ SỐ HĨA VÀ TẠO LẬP CHỈ SỐ TRONG HỆ QUẢN TRỊ NỘI DUNG Ngành: Công nghệ thông tin Chuyên ngành: Công nghệ phần mềm Mã s? ?: 60 48 10. .. Greenstone việc lưu trữ tạo lập mục Phạm vi nghiên cứu: Luận văn tập trung nghiên cứu sở xử lý, lưu trữ chuyển giao văn trường Đại học Hải Dương cơng nghệ số hóa văn TWAIN, SANE tạo lập mục sử dụng ứng... Greenstone Kết cấu luận văn Phần lại luận văn có cấu trúc sau: Chƣơng 1: Phân tích q trình số hóa Chương trình bày khái niệm số hóa tạo lập số, lý cần số hóa, ưu điểm, nhược điểm việc số hóa liệu, đặc

Ngày đăng: 23/09/2020, 21:22

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan