1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu giải pháp tách bảng tách ảnh trong phân tích trang tài liệu

79 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • MỤC LỤC

  • DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT

  • DANH MỤC CÁC BẢNG BIỂU

  • DANH MỤC CÁC HÌNH VẼ

  • MỞ ĐẦU

  • CHƯƠNG 1 TỔNG QUAN HỆ PHÂN TÍCH TÀI LIỆU ẢNH

  • 1.1. Giới thiệu chung một hệ phân tích trang tài liệu

  • 1.2. Thu nhận ảnh (Data Capture)

  • 1.3. Bước xử lý điểm ảnh (Pixel – level processing)

  • 1.3.1. Phương pháp nhị phân (Binarization)

  • 1.3.2. Giảm nhiễu (Noise reduction)

  • 1.3.3. Phân đoạn (Segmentation)

  • 1.3.4. Làm mảnh và xác định vùng (Thinning and region detection)

  • 1.3.5. Mã hóa CC và véctơ hóa (Chain coding and vectorization)

  • 1.4. Bước phân tích các đặc trưng của tài liệu ảnh (Feature – level analysis)

  • 1.5. Phân tích các đối tượng văn bản trong tài liệu

  • 1.5.1. Ước lượng độ nghiêng của văn bản

  • 1.5.2. Phân tích sơ đồ trình bày của trang tài liệu (Layout analysis)

  • 1.6. Nhận dạng ký tự quang học (OCR)

  • 1.6.1. Phương pháp

  • 1.6.2. Nhận dạng ký tự dựa trên ngữ cảnh

  • 1.7. Phân tích các đối tượng ảnh trong tài liệu

  • 1.8. Kết luận chương

  • CHƯƠNG 2 THUẬT TOÁN TÁCH VĂN BẢN - ẢNH TỪ TRANG TÀI LIỆU ẢNH

  • 2.1. Giới thiệu

  • 2.2. Những đặc trưng chung của một tệp tài liệu ảnh

  • 2.3. Thuật toán phân tách văn bản - ảnh

  • 2.3.1. Xoá bỏ các đối tượng tuyến tính (đường thẳng)

  • 2.3.2. Phân tích các thành phần liên thông của nét bút

  • 2.3.3. Kết hợp các nét ký tự tạo thành các chuỗi văn bản

  • 2.3.4. Thực hiện các phép toán hình thái

  • 2.3.5. Phân tích các thành phần liên thông mới (NCCs)

  • 2.3.6. Biểu diễn cấu trúc thông tin của các chuỗi văn bản

  • 2.3.7. Thiết lập các tham số

  • 2.4. Kết luận chương

  • CHƯƠNG 3 THUẬT TOÁN TÁCH BẢNG T-RECS

  • 3.1. Giới thiệu

  • 3.2. Thuật toán phân đoạn khởi tạo

  • 3.2.1. Trường hợp thuật toán nhận dạng sai cột

  • 3.2.2. Cải tiến các bước của thuật toán phân đoạn khởi tạo - T-Recs++

  • 3.2.3. Những ưu điểm của thuật toán

  • 3.2.4. Những mặt hạn chế của thuật toán khởi tạo

  • 3.3. Các bước xử lý khối sau khi phân đoạn

  • 3.3.1. Trộn các khối phân đoạn sai

  • 3.3.2. Phân tách các cột bị trộn vào một khối

  • 3.3.3. Nhóm các từ bị phân tách

  • 3.4. Phân tích khối

  • 3.4.1. Khối loại 2 nằm cùng với khối loại 1

  • 3.5. Xác định cấu trúc các cột, hàng

  • 3.6. Kết luận chương

  • CHƯƠNG 4 THỰC NGHIỆM

  • 4.1. Nhận dạng đối tượng ảnh

  • 4.1.1. Giới thiệu

  • 4.1.2. Mô tả chương trình

  • 4.1.3. Một số kết quả thử nghiệm

  • 4.2. T-Recs++

  • 4.2.1. Giới thiệu

  • 4.2.2. Mô tả chương trình

  • 4.2.3. Một số kết quả thử nghiệm

  • KẾT LUẬN

  • TÀI LIỆU THAM KHẢO

Nội dung

Ngày đăng: 20/07/2021, 11:20

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w