MỤC LỤC
DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT
DANH MỤC CÁC BẢNG BIỂU
DANH MỤC CÁC HÌNH VẼ
MỞ ĐẦU
CHƯƠNG 1
TỔNG QUAN HỆ PHÂN TÍCH TÀI LIỆU ẢNH
1.1. Giới thiệu chung một hệ phân tích trang tài liệu
1.2. Thu nhận ảnh (Data Capture)
1.3. Bước xử lý điểm ảnh (Pixel – level processing)
1.3.1. Phương pháp nhị phân (Binarization)
1.3.2. Giảm nhiễu (Noise reduction)
1.3.3. Phân đoạn (Segmentation)
1.3.4. Làm mảnh và xác định vùng (Thinning and region detection)
1.3.5. Mã hóa CC và véctơ hóa (Chain coding and vectorization)
1.4. Bước phân tích các đặc trưng của tài liệu ảnh (Feature
– level analysis)
1.5. Phân tích các đối tượng văn bản trong tài liệu
1.5.1. Ước lượng độ nghiêng của văn bản
1.5.2. Phân tích sơ đồ trình bày của trang tài liệu (Layout analysis)
1.6. Nhận dạng ký tự quang học (OCR)
1.6.1. Phương pháp
1.6.2. Nhận dạng ký tự dựa trên ngữ cảnh
1.7. Phân tích các đối tượng ảnh trong tài liệu
1.8. Kết luận chương
CHƯƠNG 2
THUẬT TOÁN TÁCH VĂN BẢN - ẢNH
TỪ TRANG TÀI LIỆU ẢNH
2.1. Giới thiệu
2.2. Những đặc trưng chung của một tệp tài liệu ảnh
2.3. Thuật toán phân tách văn bản - ảnh
2.3.1. Xoá bỏ các đối tượng tuyến tính (đường thẳng)
2.3.2. Phân tích các thành phần liên thông của nét bút
2.3.3. Kết hợp các nét ký tự tạo thành các chuỗi văn bản
2.3.4. Thực hiện các phép toán hình thái
2.3.5. Phân tích các thành phần liên thông mới (NCCs)
2.3.6. Biểu diễn cấu trúc thông tin của các chuỗi văn bản
2.3.7. Thiết lập các tham số
2.4. Kết luận chương
CHƯƠNG 3
THUẬT TOÁN TÁCH BẢNG T-RECS
3.1. Giới thiệu
3.2. Thuật toán phân đoạn khởi tạo
3.2.1. Trường hợp thuật toán nhận dạng sai cột
3.2.2. Cải tiến các bước của thuật toán phân đoạn khởi tạo -
T-Recs++
3.2.3. Những ưu điểm của thuật toán
3.2.4. Những mặt hạn chế của thuật toán khởi tạo
3.3. Các bước xử lý khối sau khi phân đoạn
3.3.1. Trộn các khối phân đoạn sai
3.3.2. Phân tách các cột bị trộn vào một khối
3.3.3. Nhóm các từ bị phân tách
3.4. Phân tích khối
3.4.1. Khối loại 2 nằm cùng với khối loại 1
3.5. Xác định cấu trúc các cột, hàng
3.6. Kết luận chương
CHƯƠNG 4
THỰC NGHIỆM
4.1. Nhận dạng đối tượng ảnh
4.1.1. Giới thiệu
4.1.2. Mô tả chương trình
4.1.3. Một số kết quả thử nghiệm
4.2. T-Recs++
4.2.1. Giới thiệu
4.2.2. Mô tả chương trình
4.2.3. Một số kết quả thử nghiệm
KẾT LUẬN
TÀI LIỆU THAM KHẢO