KẾT QUẢ THỰC NGHIỆM

Một phần của tài liệu “Tổng quan về xử lý ảnh” (Trang 47 - 48)

THỰC NGHIỆM VÀ KẾT QUẢ

4.1 KẾT QUẢ THỰC NGHIỆM

Hệ thống đưa ra để xác định vùng chứa chữ tự động đã được thử nghiệm trên nhiều ảnh nhị phân, ảnh màu giả (pseudo-color), ảnh màu và các khung video. Do những ứng dụng khác nhau cần những phương pháp giải quyết bằng đánh giá kinh nghiệm khác nhau nên các module và các thông số được sử dụng trong thuật toán hình 3.6 thay đổi theo. Bảng 1 liệt kê hoạt động của hệ thống. Độ chính xác đối với các ảnh khác được tính một cách chủ quan dựa trên số text quan trọng được định vị đúng trong ảnh. Tỷ lệ sai tương đối cao đối với ảnh màu và thấp nhất đối với ảnh quảng cáo. Đồng thời, độ chính xác cho ảnh màu thấp nhất do độ phức tạp cao của nền. Chi tiết hơn của thực nghiệm đối với các vật mang text được giải thích trong phần sau. Bảng 4.1: Kích thước ảnh và độ chính xác để xác định vùng chứa chữ Ảnh mang text Số ảnh thực nghiệm Cỡ điển hình Độ chính xác (%) Quảng cáo 26 548 x 769 99,2 Ảnh Web 54 385 x 234 97,6 Ảnh màu 30 769 x 537 72,0 Khung video 6,952 160 x 120 94,7 4.1.1 Ảnh quảng cáo

Một số kết quả được thể hiện trong hình 4.1 trong đó cả text thường và văn bản ngược đều được định vị và minh hoạ trong các hộp giới hạn đỏ. Dòng của các khối trắng ở phần trên hình 4.1 (b) được định vị như text do các khối được sắp xếp đều nhau về kích thước và thẳng hàng. Module OCR sẽ loại nó. Text dọc theo nửa vòng tròn trên đỉnh hình 4.1 (e) không thể xoá bỏ bằng thuật toán. Các phương pháp kinh nghiệm phức tạp hơn được cần để xác định vùng chứa chữ này. Một số dấu chấm câu và các dòng có gạch đầu dòng sẽ được bỏ qua như mong đợi do kích thước của chúng nhỏ.

22 ảnh Web điển hình trong hình 4.2 được tải xuống từ Internet. Các kết quả xác định vùng chứa chữ tương ứng được thể hiện trong dải màu xám hình 4.2. Text trong hình 4.2 (a) không được sắp thẳng hàng hoàn toàn dọc theo một đường thằng. Dữ liệu của ảnh hình 4.2 (h) không thể tải hết được do bị gián đoạn ngẫu nhiên trong khi truyền. Hình 4.2 (b) có các logo text. Text dọc trong hình 4.2 (h) và phần lớn text có kích cỡ nhỏ đều bị bỏ qua.

Một phần của tài liệu “Tổng quan về xử lý ảnh” (Trang 47 - 48)

Tải bản đầy đủ (DOC)

(61 trang)
w