1. Trang chủ
  2. » Luận Văn - Báo Cáo

“Tổng quan về xử lý ảnh”

60 566 3
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 60
Dung lượng 8,75 MB

Nội dung

Ảnh là phương tiện truyền tải thông tin có ý nghĩa vô cùng lớn trong cuộc sống. Ảnh truyền tải trong môi trường World Wide Web hiện nay được sử dụng khá nhiều, tồn tại ở nhiều dạng khác nhau và vô cùng phong phú. Một yêu cầu đặt ra là tìm kiếm, phân loại, cũng như xác định nội dung ảnh muốn truyền tải điều gì đang là vấn đề cấp thiết hiện nay. Ta có thể kể ra một số ứng dụng như thế như tìm kiếm ảnh theo nội dung trong môi trường World Wide Web hay lọc spam ảnh…vv. Ảnh thường được nhúng kèm theo text trong nó và những text này thường quyết định đến nội dung ảnh muốn truyền tải. Tất cả các ứng dụng kể trên như lọc spam ảnh hay tìm kiếm ảnh trên web…vv đều sử dụng đến đặc tính text kèm theo ảnh để giải quyết. Và như thế bài toán tách chữ nhúng trong ảnh được quan tâm. Đã có rất nhiều phương pháp được đưa ra, tuy nhiên do dữ liệu ảnh là quá phong phú và text nhúng kèm theo nó cũng rất phức tạp như kích cỡ, màu, chiều của chữ…Nên mỗi phương pháp đều có sự hạn chế riêng và đây vẫn là một bài toán mở đang được nhiều người quan tâm. Xuất phát từ thực tế đó, mục tiêu của đồ án này là nghiên cứu phương pháp xác định vùng chứa chữ nhúng trong ảnh có độ chính xác cao đồng thời là tiền đề cho việc lọc spam ảnh. Với mục tiêu đó, đồ án được thực hiện dựa trên phương pháp nghiên cứu: trước hết là ảnh đầu vào được thực hiện giảm màu (color reduction) bao gồm cả giảm bit (drop bit) gộp màu và phân tích ảnh có nhiều giá trị, sau đó được phân tích thành nhiều ảnh tiền cảnh (foreground image). Những ảnh tiền cảnh được tập hợp để nhận dạng vị trí của text trong ảnh đầu vào . Xác định vùng chứa chữ được thể hiện giống các toạ độ hộp ranh giới của nó. Nội dung của đồ án được chia thành 4 phần, ở đó, chương 1 và chương 2 sẽ trình bày các kiến thức cơ bản cho cách tiếp cận ở chương 3 và chương 4. Bố cục chi tiết của đồ án như sau : Chương 1 : “Tổng quan về xử lý ảnh” : Chương này trình bày tổng quan về một hệ thống xử lý ảnh,và các vấn đề liên quan. Chương 2 : “Các phương pháp xác định vùng chứa chữ trong ảnh” : Chương này sẽ trình bày về các phương pháp xác định vùng chứa chữ trong ảnh hiện có, đưa ra phương pháp phân loại mới và phân tích tính chính xác và hiệu năng của mỗi phương pháp. Chương 3 : “Xác định vùng chứa chữ trong ảnh thông thường và ảnh video” : Đây là chương quan trọng nhất của đồ án vì nó sẽ nêu lên một phương pháp Xác định vùng chứa chữ trong ảnh dựa trên các đặc trưng về thành phần của ảnh. Chương 4 : “Thử nghiệm và kết quả” : Chương 4 sẽ trình bày chi tiết quá trình thực hiện, đưa ra các con số thống kê về độ chính xác của phương pháp.

ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH MỤC LỤC Tài liệu tham khảo . ĐÀM QUANG TUẤN HVCNBCVT ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Cụm từ, ký hiệu Ý nghĩa TIE Text information extraction : Vấn đề tách thông tin về chữ FI Foreground Identification : Xác định tiền cảnh BAG Blog Adjacency Graph : Đồ thị khối liền kề OCR Optical Character Recognization : Hệ thống nhận dạng ký tự quang học ĐÀM QUANG TUẤN HVCNBCVT ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH DANH MỤC HÌNH VẼ Tài liệu tham khảo . ĐÀM QUANG TUẤN HVCNBCVT ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH LỜI MỞ ĐẦU Ảnh là phương tiện truyền tải thông tin có ý nghĩa vô cùng lớn trong cuộc sống. Ảnh truyền tải trong môi trường World Wide Web hiện nay được sử dụng khá nhiều, tồn tại ở nhiều dạng khác nhau và vô cùng phong phú. Một yêu cầu đặt ra là tìm kiếm, phân loại, cũng như xác định nội dung ảnh muốn truyền tải điều gì đang là vấn đề cấp thiết hiện nay. Ta có thể kể ra một số ứng dụng như thế như tìm kiếm ảnh theo nội dung trong môi trường World Wide Web hay lọc spam ảnh…vv. Ảnh thường được nhúng kèm theo text trong nó và những text này thường quyết định đến nội dung ảnh muốn truyền tải. Tất cả các ứng dụng kể trên như lọc spam ảnh hay tìm kiếm ảnh trên web…vv đều sử dụng đến đặc tính text kèm theo ảnh để giải quyết. Và như thế bài toán tách chữ nhúng trong ảnh được quan tâm. Đã có rất nhiều phương pháp được đưa ra, tuy nhiên do dữ liệu ảnh là quá phong phú và text nhúng kèm theo nó cũng rất phức tạp như kích cỡ, màu, chiều của chữ…Nên mỗi phương pháp đều có sự hạn chế riêng và đây vẫn là một bài toán mở đang được nhiều người quan tâm. Xuất phát từ thực tế đó, mục tiêu của đồ án này là nghiên cứu phương pháp xác định vùng chứa chữ nhúng trong ảnh có độ chính xác cao đồng thời là tiền đề cho việc lọc spam ảnh. Với mục tiêu đó, đồ án được thực hiện dựa trên phương pháp nghiên cứu: trước hết là ảnh đầu vào được thực hiện giảm màu (color reduction) bao gồm cả giảm bit (drop bit) gộp màu và phân tích ảnh có nhiều giá trị, sau đó được phân tích thành nhiều ảnh tiền cảnh (foreground image). Những ảnh tiền cảnh được tập hợp để nhận dạng vị trí của text trong ảnh đầu vào . Xác định vùng chứa chữ được thể hiện giống các toạ độ hộp ranh giới của nó. Nội dung của đồ án được chia thành 4 phần, ở đó, chương 1 và chương 2 sẽ trình bày các kiến thức cơ bản cho cách tiếp cận ở chương 3 và chương 4. Bố cục chi tiết của đồ án như sau : ĐÀM QUANG TUẤN HVCNBCVT ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH Chương 1 : “Tổng quan về xử ảnh” : Chương này trình bày tổng quan về một hệ thống xử ảnh,và các vấn đề liên quan. Chương 2 : “Các phương pháp xác định vùng chứa chữ trong ảnh” : Chương này sẽ trình bày về các phương pháp xác định vùng chứa chữ trong ảnh hiện có, đưa ra phương pháp phân loại mới và phân tích tính chính xác và hiệu năng của mỗi phương pháp. Chương 3 : “Xác định vùng chứa chữ trong ảnh thông thường và ảnh video” : Đây là chương quan trọng nhất của đồ án vì nó sẽ nêu lên một phương pháp Xác định vùng chứa chữ trong ảnh dựa trên các đặc trưng về thành phần của ảnh. Chương 4 : “Thử nghiệm và kết quả” : Chương 4 sẽ trình bày chi tiết quá trình thực hiện, đưa ra các con số thống kê về độ chính xác của phương pháp. ĐÀM QUANG TUẤN HVCNBCVT 1 ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH Ơ Chương 1 TỔNG QUAN VỀ XỬ ẢNH Xử ảnh là một ngành khoa học còn khác mới và có rất nhiều ứng dụng. Trong chương 1 đồ án sẽ trình bày một cách tổng quan về xử ảnh, các vấn đề liên quan và các khái niệm cơ bản nhất trong khoa học xử ảnh. 1.1 TỔNG QUAN VỀ MỘT HỆ THỐNG XỬ ẢNH Xử ảnh là khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác. nhất là trên quy mô công nghiệp, song trong xử ảnh đã bắt đầu xuất hiện những máy tính chuyên dụng. Để có thể hình dung cấu hình của một hệ thống xử ảnh chuyên dụng hay một hệ thống xử ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử ảnh. Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu được qua camera. Thường ảnh thu được qua camera là tín hiệu tương tự(loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá(loại CCD-charge couped device). Lưu trữ Hình 1.1a Các giai đoạn chính trong xử ảnh Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng(sensor), hay ảnh, tranh được quét trên scanner. Tiếp theo là quá trình số hoá (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hoá bằng lượng hoá trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại. ĐÀM QUANG TUẤN HVCNBCVT Nhận dạng ảnh CAMERA Lư u trữ SENSOR Thu nhận ảnh Số hóa Phân tích ảnh Hệ Q.định 1 ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường ảnh để nâng cao chất lượng ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng các thiết bị thu nhận ảnh, do nguồn sang hay do nhiễu ảnh có thể bị suy biến. Do vậy phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng thái trước khi bị biến dạng. Giai đoạn tiếp theo là xác định các đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính, …vv. Cuối cùng tuỳ vào mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các giai đoạn chính của quá trình xử ảnh có thể mô tả như hình 1.1.a. Với các giai đoạn trên một quá trình xử ảnh (cấu trúc phần cứng theo chức năng) gồm các thành phần tối thiểu như hình 1.1.b. Đối với một hệ thống xử ảnh thu nhận qua camera-camera như là con mắt của hệ thống. Có hai loại camera : camera ống loại CCIR và camera CCD. Loại camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625 dòng. Loại CCD gồm các photo diot và làm tương ứng một cường độ sang tại một điểm ảnh ứng với một phần tử ảnh (pixel). Như vậy ảnh là tập hợp các điểm ảnh. Số pixel tạo nên một điểm ảnh gọi là độ phân giải (resolution). Bộ xử tương tự (analog processor) bộ phận này thực hiện các chức năng sau: - Chọn camera thích hợp nếu hệ thống có nhiều camera - Chọn màu hiển thị tín hiệu. - Thu nhận tín hiệu video thu nhận bởi bộ số hoá (digitalizer). Thực hiện lấy mẫu và mã hoá. - Tiền xử ảnh khi thu nhận: dung kỹ thuật bảng tra (Look Up Table LUT) ĐÀM QUANG TUẤN HVCNBCVT 1 ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH Hình 1.1.b Các thành phần chính của hệ thống xử ảnh Bộ xử ảnh số: gồm nhiều bộ xử chuyên dụng: xử lọc, trích chọn đường bao, nhị phân hoá ảnh. Các bộ xử này làm việc với tốc độ 1/25 giây. Máy chủ : đóng vai trò điều khiển các thành phần miêu tả ở trên. Bộ nhớ ngoài: Dữ liệu ảnh cũng như các dữ liệu khác, để có thể chuyển giao cho các quá trình khác, nó cần được lưu trữ. Để có một ước lượng, xét ví dụ sau: một ảnh đen trắng cỡ 512 x 512 với 256 mức xám chiếm 256 k bytes. Với một ảnh màu cùng kích thước dung lượng sẽ tăng gấp 3 lần. 1.2 CÁC VẤN ĐỀ CƠ BẢN TRONG XỬ ẢNH Như đã đề cập trong phần giới thiệu, chúng ta đã thấy được một cách tổng quát các vấn đề chính trong xử ảnh. Để hiểu chi tiết hơn, trước tiên ta xem xét hai khái niệm (thuật ngữ) thường dung trong xử ảnh: đó là pixel (phần tử ảnh) và gray level (mức xám), tiếp theo là tóm tắt các vấn đề chính. ĐÀM QUANG TUẤN HVCNBCVT Màn hình đồ họa Bộ xử tương tự Camera Bộ nhớ ảnh Máy chủ Bộ nhớ ngoài Bộ xử ảnh số Màn hình Bàn phím Máy in 1 ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH 1.2.1 Một số khái niệm Pixel (picture element) phần tử ảnh Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sang. Để có thể xử ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục dạng tín hiệu rời rạc thong qua quá trình lấy mẫu ( rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà vì thế về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này người ta sử dụng khái niệm picture element mà ta quen gọi hay viết tắt là pixel - phần tử ảnh. Ở đây cũng cần phân biệt khái niêm pixel hay đề cập đến trong kỹ thuật đồ hoạ máy tính. Để tránh nhầm lẫn ta tạm gọi pixel này là pixel của thiết bị. Khái niệm pixel thiết bị có thể xem xét như sau: Khi ta quan sát màn hình trong chế độ đồ hoạ, màn hình không liên tục mà gồm nhiều điểm nhỏ gọi là pixel. Mỗi pixel gồm một cặp toạ độ x,y và màu. Cặp toạ độ x,y tạo nên độ phân giải ( resolution ). Như màu màn hình máy tính có nhiều loại với độ phân giải khác nhau: như màn hình CGA với độ phân giải là 320 x 200, màn hình VGA là 640 x 350,… Như vậy một ảnh là tập hợp các điểm ảnh. Khi được số hoá nó, nó thường được biểu diễn bởi mảng hai chiều I(n,p): n là biểu thị số dòng, p là biểu thị cột. Nói cách khác ảnh gồm n x p pixels. Người ta thường ký hiệu I(x,y) để chỉ một pixel. Thường một giá trị của n chọn bằng p và bằng 256. Hình 1.2 cho thấy việc biểu diễn ảnh với độ phân giải khác nhau. Một pixel có thể lưư trữ trên 1,2,4 hay 24 bit. Gray level: Mức xám. Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số-kết quả của quá trình lượng hoá. Cách mã hoá kinh điển thường dung 16,32,64 mức. Mã hoá 256 mức là mức phổ dụng do do kỹ thuật. Vì 2 8 = 256( 0,1,2…255) nên với 256 mức mỗi pixel sẽ được mã hoá bởi 8 bit. ĐÀM QUANG TUẤN HVCNBCVT 1 ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ ẢNH 1.2.2 Biểu diễn ảnh Trong biểu diễn ảnh người ta thường dung các phần tử đăc chưng của ảnh là pixel. Nhìn chung có thể xem một hàm hai biến chứa các thôg tin như biểu diễn của một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính chất của hàm này. Trong biểu diễn ảnh cần chú ý đến tính trung thực của ảnh hoặc các tiêu chuẩn thong minh để đo chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý. Việc xử ảnh số yêu cầu ảnh phải được mẫu hoá và lượng tử hoá. Thí dụ một ảnh ma trận 512 dòng gồm khoảng 512 x 512 pixel. Việc lượng tử hoá ảnh là chuyển đổi tín hiệu tương tự sang tín hiệu số (analog digital convert) của một ảnh đã lấy mẫu sang một số hữu hạn mức xám. Một số mô hình thường được dung trong biểu diễn ảnh: mô hình toán học, mô hình thống kê. Trong mô hình toán ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở. Với mô hình thống kê một ảnh được coi như một phần tử của một tập hợp đặc chưng bởi các đại lượng như: Kỳ vọng toán học, hiệp biến, phương sai, moment… 1.2.3 Tăng cường ảnh - khôi phục ảnh Tăng cường ảnh là bước quan trọng tạo tiền đề cho xử ảnh. Nó gồm một loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu… h(x,y; α,β) ảnh đầu ảnh đầu vào f(α,β) ra g(x,y) ĐÀM QUANG TUẤN HVCNBCVT f(α,ß) ß g(x,y) nhiÔu ß hệ thống thu nhận 1 . : ĐÀM QUANG TUẤN HVCNBCVT ĐỒ ÁN TỐT NGHIỆP CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH Chương 1 : “Tổng quan về xử lý ảnh” : Chương này trình bày tổng quan về một. cách tổng quan về xử lý ảnh, các vấn đề liên quan và các khái niệm cơ bản nhất trong khoa học xử lý ảnh. 1.1 TỔNG QUAN VỀ MỘT HỆ THỐNG XỬ LÝ ẢNH Xử lý ảnh

Ngày đăng: 08/08/2013, 10:40

HÌNH ẢNH LIÊN QUAN

Hình 1.1a Các giai đoạn chính trong xử lý ảnh -  “Tổng quan về xử lý ảnh”
Hình 1.1a Các giai đoạn chính trong xử lý ảnh (Trang 6)
Hình 1.1a Các giai đoạn chính trong xử lý ảnh -  “Tổng quan về xử lý ảnh”
Hình 1.1a Các giai đoạn chính trong xử lý ảnh (Trang 6)
Hình 1.1.b Các thành phần chính của hệ thống xử lý ảnh -  “Tổng quan về xử lý ảnh”
Hình 1.1.b Các thành phần chính của hệ thống xử lý ảnh (Trang 8)
Hình 1.1.b Các thành phần chính của hệ thống xử lý ảnh -  “Tổng quan về xử lý ảnh”
Hình 1.1.b Các thành phần chính của hệ thống xử lý ảnh (Trang 8)
Hình vẽ dưới đây đưa ra một vài ví dụ về text nhúng trong ảnh. Hình một cho ta một ví dụ về ảnh tài liệu -  “Tổng quan về xử lý ảnh”
Hình v ẽ dưới đây đưa ra một vài ví dụ về text nhúng trong ảnh. Hình một cho ta một ví dụ về ảnh tài liệu (Trang 16)
Hình 2.1: ảnh tài liệu đen trắng:a, chữ trong ảnh một trang báo.b, chữ trong ảnh của hai trang và c là chữ trong bản vẽ kỹ thuật. -  “Tổng quan về xử lý ảnh”
Hình 2.1 ảnh tài liệu đen trắng:a, chữ trong ảnh một trang báo.b, chữ trong ảnh của hai trang và c là chữ trong bản vẽ kỹ thuật (Trang 16)
Hình 2.1: ảnh tài liệu đen trắng:a, chữ trong ảnh một trang báo.b, chữ trong ảnh của hai trang và c là chữ trong bản vẽ kỹ thuật. -  “Tổng quan về xử lý ảnh”
Hình 2.1 ảnh tài liệu đen trắng:a, chữ trong ảnh một trang báo.b, chữ trong ảnh của hai trang và c là chữ trong bản vẽ kỹ thuật (Trang 16)
Hình vẽ dưới đây đưa ra một vài ví dụ về text nhúng trong ảnh. Hình một cho ta một ví dụ về ảnh tài liệu -  “Tổng quan về xử lý ảnh”
Hình v ẽ dưới đây đưa ra một vài ví dụ về text nhúng trong ảnh. Hình một cho ta một ví dụ về ảnh tài liệu (Trang 16)
Hình 2.4: Ảnh phong cảnh với rất nhiều chữ tự nhiên nhúng trong nó. -  “Tổng quan về xử lý ảnh”
Hình 2.4 Ảnh phong cảnh với rất nhiều chữ tự nhiên nhúng trong nó (Trang 17)
Hình 2.3: Ảnh trong video với phụ đề là text.a, phụ đề nằm trực tiếp trên nền ảnh. b,và c, phụ đề nằm trên nên ảnh với độ tương phản cao hơn và c, phụ đề nằm trên nền ảnh với nhiều -  “Tổng quan về xử lý ảnh”
Hình 2.3 Ảnh trong video với phụ đề là text.a, phụ đề nằm trực tiếp trên nền ảnh. b,và c, phụ đề nằm trên nên ảnh với độ tương phản cao hơn và c, phụ đề nằm trên nền ảnh với nhiều (Trang 17)
Hình 2.4: Ảnh phong cảnh với rất nhiều chữ tự nhiên nhúng trong nó. -  “Tổng quan về xử lý ảnh”
Hình 2.4 Ảnh phong cảnh với rất nhiều chữ tự nhiên nhúng trong nó (Trang 17)
Hình 2.3: Ảnh trong video với phụ đề là text.a, phụ đề nằm trực tiếp trên nền ảnh. b,và c, phụ đề nằm trên nên ảnh với độ tương phản cao hơn và c, phụ đề nằm trên nền ảnh với nhiều -  “Tổng quan về xử lý ảnh”
Hình 2.3 Ảnh trong video với phụ đề là text.a, phụ đề nằm trực tiếp trên nền ảnh. b,và c, phụ đề nằm trên nên ảnh với độ tương phản cao hơn và c, phụ đề nằm trên nền ảnh với nhiều (Trang 17)
Hình. 2.6 Một ví dụ về phương pháp dựa trên kết cấu: (a) ảnh đầu vào, (b) clustering, (c) Vùng text sau khi thực hiện toán tử  morphological (Nhìn thấy trong vùng đen in đậm), (d) stroke generation, (e) stroke filtering, (f) stroke aggregation, (g) chip f -  “Tổng quan về xử lý ảnh”
nh. 2.6 Một ví dụ về phương pháp dựa trên kết cấu: (a) ảnh đầu vào, (b) clustering, (c) Vùng text sau khi thực hiện toán tử morphological (Nhìn thấy trong vùng đen in đậm), (d) stroke generation, (e) stroke filtering, (f) stroke aggregation, (g) chip f (Trang 21)
Hình 3.1: Một phần của trang Web -  “Tổng quan về xử lý ảnh”
Hình 3.1 Một phần của trang Web (Trang 28)
Hình 3.1: Một phần của trang Web -  “Tổng quan về xử lý ảnh”
Hình 3.1 Một phần của trang Web (Trang 28)
trong hình 3.3(a) do Zhong et al đưa ra. [6]. Kết quả xác định vùng chứa chữ được thể hiện trong hình 3.3(c), trong đó có một số khoảng trống không thể dự đoán được. -  “Tổng quan về xử lý ảnh”
trong hình 3.3(a) do Zhong et al đưa ra. [6]. Kết quả xác định vùng chứa chữ được thể hiện trong hình 3.3(c), trong đó có một số khoảng trống không thể dự đoán được (Trang 29)
Hình 3.3: xác định vùng chứa chữ bằng phân tích kết cầu: (a) ảnh gốc; (b) biến đổi không gian theo chiều ngang; (c) xác định vùng chứa chữ (thể hiện trong những khối hình chữ nhật). -  “Tổng quan về xử lý ảnh”
Hình 3.3 xác định vùng chứa chữ bằng phân tích kết cầu: (a) ảnh gốc; (b) biến đổi không gian theo chiều ngang; (c) xác định vùng chứa chữ (thể hiện trong những khối hình chữ nhật) (Trang 29)
Hình 3.5: Phân tích ảnh Web của hình 3.4 (c): (a) – (f) ảnh tiền cảnh thực (real foreground image);  -  “Tổng quan về xử lý ảnh”
Hình 3.5 Phân tích ảnh Web của hình 3.4 (c): (a) – (f) ảnh tiền cảnh thực (real foreground image); (Trang 32)
Hình 3.4: Phương pháp xác định vùng chứa chữ sử dụng cách thức phân tích hình khối. (a) ảnh đen trắng trên một trang báo (b) Ảnh bìa một tạp chí sau khi scan (c) Ảnh trên trang -  “Tổng quan về xử lý ảnh”
Hình 3.4 Phương pháp xác định vùng chứa chữ sử dụng cách thức phân tích hình khối. (a) ảnh đen trắng trên một trang báo (b) Ảnh bìa một tạp chí sau khi scan (c) Ảnh trên trang (Trang 32)
Hình 3.5: Phân tích ảnh Web của hình 3.4 (c): (a) – (f) ảnh tiền cảnh thực (real foreground image); -  “Tổng quan về xử lý ảnh”
Hình 3.5 Phân tích ảnh Web của hình 3.4 (c): (a) – (f) ảnh tiền cảnh thực (real foreground image); (Trang 32)
Hình 3.4: Phương pháp xác định vùng chứa chữ sử dụng cách thức phân tích hình khối. (a) ảnh đen trắng trên một trang báo (b) Ảnh bìa một tạp chí sau khi scan (c) Ảnh trên trang -  “Tổng quan về xử lý ảnh”
Hình 3.4 Phương pháp xác định vùng chứa chữ sử dụng cách thức phân tích hình khối. (a) ảnh đen trắng trên một trang báo (b) Ảnh bìa một tạp chí sau khi scan (c) Ảnh trên trang (Trang 32)
Hình 3.6: hệ thống xác định vùng chứa chữ tự động -  “Tổng quan về xử lý ảnh”
Hình 3.6 hệ thống xác định vùng chứa chữ tự động (Trang 34)
Hình 3.6: hệ thống xác định vùng chứa chữ tự động -  “Tổng quan về xử lý ảnh”
Hình 3.6 hệ thống xác định vùng chứa chữ tự động (Trang 34)
Hình 3.7 (b) miêu tả 9 ảnh thành phần của ảnh có nhiều giá trị thể hiện trong hình 3.7 (a) có U = 9 giá trị ảnh khác nhau. -  “Tổng quan về xử lý ảnh”
Hình 3.7 (b) miêu tả 9 ảnh thành phần của ảnh có nhiều giá trị thể hiện trong hình 3.7 (a) có U = 9 giá trị ảnh khác nhau (Trang 35)
Hình 3.7 (b) miêu tả 9 ảnh thành phần của ảnh có nhiều giá trị thể hiện trong hình 3.7 (a) có U = 9 giá trị ảnh khác nhau. -  “Tổng quan về xử lý ảnh”
Hình 3.7 (b) miêu tả 9 ảnh thành phần của ảnh có nhiều giá trị thể hiện trong hình 3.7 (a) có U = 9 giá trị ảnh khác nhau (Trang 35)
Hình 3.9: Ảnh tiền cảnh của ảnh có nhiều giá trị trong hình 3.7 (a): (a) ảnh tiền cảnh thực (real foreground image); (b) ảnh tiền cảnh bổ sung nền (background-complementary -  “Tổng quan về xử lý ảnh”
Hình 3.9 Ảnh tiền cảnh của ảnh có nhiều giá trị trong hình 3.7 (a): (a) ảnh tiền cảnh thực (real foreground image); (b) ảnh tiền cảnh bổ sung nền (background-complementary (Trang 36)
Hình 3.9: Ảnh tiền cảnh của ảnh có nhiều giá trị trong hình 3.7 (a): (a) ảnh tiền cảnh thực (real foreground image); (b) ảnh tiền cảnh bổ sung nền (background-complementary -  “Tổng quan về xử lý ảnh”
Hình 3.9 Ảnh tiền cảnh của ảnh có nhiều giá trị trong hình 3.7 (a): (a) ảnh tiền cảnh thực (real foreground image); (b) ảnh tiền cảnh bổ sung nền (background-complementary (Trang 36)
Ảnh nhị phân (xem hình 3.4(a)) có U= 2. Ảnh nhị phân chỉ có 2 ảnh thành phần, ảnh đã cho và ảnh đảo của nó, mỗi cái là một ảnh tiền cảnh thực. -  “Tổng quan về xử lý ảnh”
nh nhị phân (xem hình 3.4(a)) có U= 2. Ảnh nhị phân chỉ có 2 ảnh thành phần, ảnh đã cho và ảnh đảo của nó, mỗi cái là một ảnh tiền cảnh thực (Trang 38)
Hình 3.10: Biểu đồ ảnh có nhiều giá trị thể hiện trong hình 3.4 (c) -  “Tổng quan về xử lý ảnh”
Hình 3.10 Biểu đồ ảnh có nhiều giá trị thể hiện trong hình 3.4 (c) (Trang 38)
Hình 3.11. Trích tiền cảnh từ khung video có đầy đủ màu: (a) khung gốc; (b) giảm bit; (c) lượng tử hoá màu giảm số lượng màu xuống còn 4; (d)-(g) ảnh tiền cảnh thực; (h) ảnh tiền -  “Tổng quan về xử lý ảnh”
Hình 3.11. Trích tiền cảnh từ khung video có đầy đủ màu: (a) khung gốc; (b) giảm bit; (c) lượng tử hoá màu giảm số lượng màu xuống còn 4; (d)-(g) ảnh tiền cảnh thực; (h) ảnh tiền (Trang 39)
Hình 3.11. Trích tiền cảnh từ khung video có đầy đủ màu: (a) khung gốc; (b) giảm bit; (c) lượng tử hoá màu giảm số lượng màu xuống còn 4; (d)-(g) ảnh tiền cảnh thực; (h) ảnh tiền -  “Tổng quan về xử lý ảnh”
Hình 3.11. Trích tiền cảnh từ khung video có đầy đủ màu: (a) khung gốc; (b) giảm bit; (c) lượng tử hoá màu giảm số lượng màu xuống còn 4; (d)-(g) ảnh tiền cảnh thực; (h) ảnh tiền (Trang 39)
Hình 3.12: Các nguyên mẫu màu: (a) sau khi giảm bit; (b) sau khi lượng tử hoá màu -  “Tổng quan về xử lý ảnh”
Hình 3.12 Các nguyên mẫu màu: (a) sau khi giảm bit; (b) sau khi lượng tử hoá màu (Trang 40)
Hình 3.12: Các nguyên mẫu màu: (a) sau khi giảm bit; (b) sau khi lượng tử hoá màu -  “Tổng quan về xử lý ảnh”
Hình 3.12 Các nguyên mẫu màu: (a) sau khi giảm bit; (b) sau khi lượng tử hoá màu (Trang 40)
Sau khi phân tích ảnh có nhiều giá trị, chúng ta thu được bảng tìm kiếm nhận dạng tiền cảnh (FI) cho các giá trị ảnh điểm theo ảnh tiền cảnh -  “Tổng quan về xử lý ảnh”
au khi phân tích ảnh có nhiều giá trị, chúng ta thu được bảng tìm kiếm nhận dạng tiền cảnh (FI) cho các giá trị ảnh điểm theo ảnh tiền cảnh (Trang 41)
Hình 3.13: Ảnh nhị phân và BAG của nó -  “Tổng quan về xử lý ảnh”
Hình 3.13 Ảnh nhị phân và BAG của nó (Trang 41)
Hình 3.14: thuật toán thế hệ BAG một chiều đối với các ảnh có nhiều giá trị -  “Tổng quan về xử lý ảnh”
Hình 3.14 thuật toán thế hệ BAG một chiều đối với các ảnh có nhiều giá trị (Trang 43)
Hình 3.14: thuật toán thế hệ BAG một chiều đối với các ảnh có nhiều giá trị -  “Tổng quan về xử lý ảnh”
Hình 3.14 thuật toán thế hệ BAG một chiều đối với các ảnh có nhiều giá trị (Trang 43)
Hình 3.16: Các ký tự trong dòng text: (a) các ký tự được phân tách; (b) các thành phần liên kết và các dòng text cho (a); (c) các ký tự chạm nhau; (d) các thành phần liên kết và các dòng -  “Tổng quan về xử lý ảnh”
Hình 3.16 Các ký tự trong dòng text: (a) các ký tự được phân tách; (b) các thành phần liên kết và các dòng text cho (a); (c) các ký tự chạm nhau; (d) các thành phần liên kết và các dòng (Trang 44)
Hình 3.16: Các ký tự trong dòng text: (a) các ký tự được phân tách; (b) các thành phần liên kết và các dòng text cho (a); (c) các ký tự chạm nhau; (d) các thành phần liên kết và các dòng -  “Tổng quan về xử lý ảnh”
Hình 3.16 Các ký tự trong dòng text: (a) các ký tự được phân tách; (b) các thành phần liên kết và các dòng text cho (a); (c) các ký tự chạm nhau; (d) các thành phần liên kết và các dòng (Trang 44)
3.6.2 Đặc trưng hình chiếu -  “Tổng quan về xử lý ảnh”
3.6.2 Đặc trưng hình chiếu (Trang 45)
Bảng 4.1: Kích thước ảnh và độ chính xác để xác định vùng chứa chữ Ảnh mang -  “Tổng quan về xử lý ảnh”
Bảng 4.1 Kích thước ảnh và độ chính xác để xác định vùng chứa chữ Ảnh mang (Trang 47)
Hình 4.1 xác định các dòng chữ trong ảnh quảng cáo -  “Tổng quan về xử lý ảnh”
Hình 4.1 xác định các dòng chữ trong ảnh quảng cáo (Trang 49)
Hình 4.1 xác định các dòng chữ trong ảnh quảng cáo -  “Tổng quan về xử lý ảnh”
Hình 4.1 xác định các dòng chữ trong ảnh quảng cáo (Trang 49)
Hình 4.2: Xác định vùng chứa chữ trên ảnh web. -  “Tổng quan về xử lý ảnh”
Hình 4.2 Xác định vùng chứa chữ trên ảnh web (Trang 50)
Hình 4.2: Xác định vùng chứa chữ trên ảnh web. -  “Tổng quan về xử lý ảnh”
Hình 4.2 Xác định vùng chứa chữ trên ảnh web (Trang 50)
Hình 4.3 Xác định vùng chứa chữ trong ảnh màu -  “Tổng quan về xử lý ảnh”
Hình 4.3 Xác định vùng chứa chữ trong ảnh màu (Trang 51)
Hình 4.3 Xác định vùng chứa chữ trong ảnh màu -  “Tổng quan về xử lý ảnh”
Hình 4.3 Xác định vùng chứa chữ trong ảnh màu (Trang 51)
Hình 4.5 Video frame với phân giải thấp -  “Tổng quan về xử lý ảnh”
Hình 4.5 Video frame với phân giải thấp (Trang 52)
Hình 4.4: Xác định vùng chứa chữ trong ảnh phức tạp cho kết quả sai. -  “Tổng quan về xử lý ảnh”
Hình 4.4 Xác định vùng chứa chữ trong ảnh phức tạp cho kết quả sai (Trang 52)
Hình 4.4: Xác định vùng chứa chữ trong ảnh phức tạp cho kết quả sai. -  “Tổng quan về xử lý ảnh”
Hình 4.4 Xác định vùng chứa chữ trong ảnh phức tạp cho kết quả sai (Trang 52)
Hình 4.5 Video frame với phân giải thấp -  “Tổng quan về xử lý ảnh”
Hình 4.5 Video frame với phân giải thấp (Trang 52)
Hình 4.6 Video frame bao gồm cả chữ thường và chữ hoa -  “Tổng quan về xử lý ảnh”
Hình 4.6 Video frame bao gồm cả chữ thường và chữ hoa (Trang 53)
Hình 4.7 video frame với text trong cửa sổ con. -  “Tổng quan về xử lý ảnh”
Hình 4.7 video frame với text trong cửa sổ con (Trang 53)
Hình 4.6 Video frame bao gồm cả chữ thường và chữ hoa -  “Tổng quan về xử lý ảnh”
Hình 4.6 Video frame bao gồm cả chữ thường và chữ hoa (Trang 53)
Hình 4.7 video frame với text trong cửa sổ con . -  “Tổng quan về xử lý ảnh”
Hình 4.7 video frame với text trong cửa sổ con (Trang 53)
Hình 4.9: Các khung video có text trong cửa sổ phụ -  “Tổng quan về xử lý ảnh”
Hình 4.9 Các khung video có text trong cửa sổ phụ (Trang 54)
Hình 4.8 video frame với độ phân giải cao -  “Tổng quan về xử lý ảnh”
Hình 4.8 video frame với độ phân giải cao (Trang 54)
Hình 4.8 video frame với độ phân giải cao -  “Tổng quan về xử lý ảnh”
Hình 4.8 video frame với độ phân giải cao (Trang 54)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w