THỰC NGHIỆM VÀ KẾT QUẢ
4.1.4 Khung video
Kết quả trong hình 4.5 thể hiện việc thực hiện thuật toán trờn cỏc khung video có độ phân giải thấp 160 x 120, trong đó phông, cỡ chữ, màu và độ tương phản của text thay đổi trong một dải lớn. Text toàn bộ trong hình 4.5 (g) có thể không được định vị. Chú ý rằng không dễ thậm chí đối với cả con người để định vị tất cả text trong hình này do độ phân giải thấp. Màu sắc và kết cấu của text hình 4.6 (b) thay đổi và khá giống nên. Trong hình 4.6 (c), hệ thống xác định vùng chứa chữ không phụ đề trên tường. Text không phụ đề định vị khó hơn do sự định hướng tuỳ tiện, sắp thành hàng và chiếu sáng. Hình 4.7 (a) thể hiện text trong một cửa sổ thường được sử dụng trong việc phát tin tức. Hệ thống không nhạy lắm đối với độ phân giải ảnh. Các khung video hình 4.8 có độ phân giải 720 x 486, trong đó text được thể hiện trên bản đồ dự báo thời tiết không được định vị.
Hình 4.4: Xác định vùng chứa chữ trong ảnh phức tạp cho kết quả sai.
Hình 4.6 Video frame bao gồm cả chữ thường và chữ hoa
Hình 4.8 video frame với độ phân giải cao
4.2 KẾT LUẬN
Vấn đề xác định vùng chứa chữ trong ảnh và khung video đã được trình bày trong bài này. Chuyển đổi text và chú thích cơ sở dữ liệu là 2 ứng dụng quan trọng nhất của xác định vùng chứa chữ. Phương pháp xác định vùng chứa chữ dựa trên xử lý ảnh đã được đưa ra. Ảnh có nhiều giá trị gồm ảnh nhị phân, ảnh dải màu xám, ảnh màu giả (pseudo-color) và ảnh nhiều màu có thể được phân tích thành nhiều ảnh tiền cảnh thực và ảnh tiền cảnh bổ sung nền. Đối với ảnh nhiều màu, phương pháp giảm màu được trình bày, gồm giảm bit và nhóm màu. Do đó, phân tích thành phần liên kết sử dụng thành công trong xử lý ảnh nhị phân có thể được sử dụng trong việc xử lý ảnh có nhiều giá trị để tìm ra text. Đồ án cũng đưa ra hướng tiếp cận với nhận dạng text có thể áp dụng cho các ký tự tách nhau và chạm nhau. Các ứng dụng của xác định vùng chứa chữ được thể hiện bao gồm xác định vùng chứa chữ trong các ảnh quảng cáo đã phân loại, ảnh Web, ảnh màu và khung video. Các kết quả thực nghiệm được đưa ra cho các ứng dụng khác nhau để thể hiện hoạt động của thuật toán. So với các phương pháp xác định vùng chứa chữ truyền thống dựa trên phân tích kết cấu, phương pháp này có một số đặc tính sau:
(i) Thời gian tính toán thấp (0,1 – 0,2 giây). (ii) Không nhạy với phông cỡ chữ.
(iii) Độ chính xác cao. Do nhiều màu sắc nên độ chính xác của xác định vùng chứa chữ đối với ảnh màu không thể so được với những nguồn đầu vào khác. Thuật toán lượng tử màu phức tạp rất cần thiết để tăng độ chính xác này.
KẾT LUẬN
Nghiên cứu và thực hiện các phương pháp xác định vùng chứa chữ nhúng trong ảnh với độ chính xác cao và chi phí thấp là công việc hết sức có ý nghĩa. Đây là tiền đề cho việc xây dựng các ứng dụng liên quan đến chữ nhúng trong ảnh như: xây dựng công cụ tìm kiếm ảnh có nội dung trên web hay thực hiện lọc thư rác cho ảnh có chứa chữ. Đồ án tốt nghiệp “Nghiên cứu các phương pháp tách văn bản
nhúng trong ảnh” được thực hiện không ngoài mục tiêu đó. Sau một thời gian làm
việc nghiêm túc, đồ án đã đạt được một số kết quả mong muốn. Các kết quả này bao gồm :
- Tìm hiểu được một cách tổng quan về một hệ thống xử lý ảnh thông thường và các kiến thức cơ bản liên quan đến xử lý ảnh.
- Xác định được các tính chất quan trọng của chữ nhúng trong ảnh và việc tỏch chỳng.
- Nghiên cứu và tổng hợp được một số phương pháp tách chữ nhúng trong ảnh, từ đó rút ra đánh giá cần thiết và cái nhìn tổng quan cho bài toán tách chữ nhúng trong ảnh.
- Xây dựng thành công một chương trình tách chữ nhúng trong ảnh và cho kết quả thực nghiệm khá tốt.
Bên cạnh các kết quả đạt được, đồ án còn tồn tại một số hạn chế như : - Khả năng áp dụng của chương trình còn hạn chế.
- Chưa quan tâm đến vấn đề chữ trong ảnh được quay theo nhiều hướng khác nhau
- Các ảnh có chứa chữ vẫn đơn giản, không phức tạp cho việc tách chữ. Đồ án có thể tiếp tục phát triển theo các hướng :
- Sử dụng các đặc trưng về vùng chứa chữ trong ảnh để phát triển các ứng dụng khác như lọc spam ảnh.