Phép chiếu dọc (Vertical Projection)

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu trích chọn đặc trưng ứng dụng cho tìm kiếm từ trong ảnh tài liệu (Trang 63 - 66)

2.3 .Trích chọn đặc trưng ứng dụng cho tìm kiếm từ trong ảnh tài liệu

2.3.3.3 .Phân đoạn từ trong ảnh tài liệu

2.4. Đối sánh những đặc trưng trong hệ thống đề xuất

2.4.4. Phép chiếu dọc (Vertical Projection)

Trong đó, x và y là tọa độ điểm ảnh trong ảnh. Bởi vì ảnh chúng ta xử lý là ảnh nhị phân nên hàm bằng một khi điểm ảnh có tọa độ x, y là điểm ảnh đen và bằng không khi điểm ảnh là trắng. Việc chia x và y cho chiều rộng và chiều cao của Hình chữ nhật bao của một từ đưa ra một moment hình học được chuẩn hóa và không thay đổi với kích thước của từ. Cuối cùng, đặc trưng về điểm trọng tâm được xác định bằng khoảng cách Euclidean so với điểm tận cùng bên trái của Hình chữ nhật bao như sau:

2 2

x y

COGCC

(2.4.5)

2.4.4. Phép chiếu dọc (Vertical Projection)

Đặc trưng này bao gồm một vector với hai mươi phần tử lấy ra từ phép chiếu dọc đã được chuẩn hóa và làm trơn. Những thành phần này tương ứng với hệ số của hai mươi thành phần đầu tiên của phép biến đổi cosin rời rạc( Discrete Cosine Transform ) trong phép chiếu dọc đã được chuẩn hóa và làm trơn. Phép chiếu dọc ứng với từ được làm trơn sử dụng ma trận mặt nạ kích thước 5×1. Với cách này, phép chiếu cuối cùng có tác động nhiều đến sự thay đổi về kích cỡ và loại font chữ.

Hình 2.32 Ảnh tính toán phép chiếu dọc : (a) là ảnh gốc; (b) là phép chiếu dọc; (c) là phép chiếu đã được làm trơn và sử dụng ma trận mặt nạ 5×1.

Dưới đây sẽ đưa ra khái niệm làm trơn ảnh và phép biến đổi cosin rời rạc để phục vụ cho việc trích trọn đặc trưng này và sử dụng cho việc trích chọn các đặc trưng.

* Làm trơn ảnh

Xuất phát từ nguyên nhân thực tế, một bộ phận các điểm ảnh (tùy vào tỷ lệ nhiễu) sẽ biến đổi cường độ sáng, dẫn đến chất lượng ảnh bị giảm đáng kể. Đối với những hệ thống xử lý ảnh số, việc lọc nhiễu, làm trơn ảnh được xem là bước tiền xử lý quan trọng và chất lượng của giai đoạn này ảnh hưởng rất lớn đến tính hiệu quả của các xử lý tiếp hay nói cách khác đó là quá trình nâng cao chất lượng ảnh.

Ví dụ, một mô h́ình đơn giản đó là những điểm ảnh lấy ra từ vùng ảnh của cùng một đối tượng nào đó có giá trị, trong đó một vài mức xám có thể trong điều kiện bức ảnh lý tưởng và là nhiễu Gaussian của giá trị 0 và có độ lệch chuẩn. Hình 2.33 (bên trái trên cùng ) đưa ra một bàn cờ lý tưởng với những vùng đồng nhất. Nhiễu Gaussian đã được thêm vào bức ảnh để tạo ra bức ảnh có nhiễu ở vị trí trung tâm, chú ý rằng những giá trị nhiễu đã được giảm để giữ trong khoảng từ [0-255]. Ở bức ảnh trên cùng phía bên phải là một bức vẽ các giá trị điểm ảnh dọc theo một dòng đơn của bức ảnh.

Nhiễu mà biến thiên ngẫu nhiên bên trên và bên dưới giá trị mức sáng bình thường đối với một vùng có thể được giảm đi bằng cách tính trung bình các giá trị gần nó ( tức là giá trị kề của nó)

Ảnh đầu ra[r,c] = giá trị trung bình của một vài hàng xóm của ảnh đầu vào [r,c]

2 2 2 2 [ , ] [ , ] 25 In r i c j Out r c        (2.4.6)

Hình 2.33 Ảnh bàn cờ lý tưởng và ảnh bàn cờ có nhiễu. Sau đó ảnh được khử nhiễu bằng cách làm trơn ảnh sử dụng ma trận mặt nạ 5x5

Biểu thức 2.4.6 định nghĩa một bộ lọc mà tính trung bình giá trị của 25 điểm ảnh trong ma trận 5×5 các điểm láng giềng của ảnh đầu vào để tạo ra một bức ảnh đã được làm trơn. Hình 2.33( ảnh ở trung tâm bức ảnh phía dưới) giải thích ích lợi của việc làm trơn trên bức ảnh bàn cờ : dòng của ảnh ở bức ảnh bàn cờ phía dưới cùng bên phải được làm trơn hơn so với dòng của bức ảnh đầu vào phía bên phải trên cùng. Cũng chú ý là trong khi ảnh được làm trơn thì rõ ràng hơn so với ảnh gốc, nhưng nó không có độ nét bằng như ảnh gốc.

* Biến đổi cosin rời rạc (Discrete Cosin Transform)

Xem xét một tín hiệu s(n) gồm N điểm được coi như là vector kích thước N như sau:

Phép biến đổi ngược nói rằng S có thể được biểu diễn như là tổng của N vector cơ bản sau:

(2.4.8)

Trong đó tương đương với hệ số biến đổi thứ k trong vector sau: (2.4.9)

Phép biến đổi xuôi nói rằng hệ số mở rộng có thể được xác định bằng cách nhân s với .

(2.4.10)

Phép biến đổi cosin rời rạc (Discrete Cosin Transform) xác định như sau: (2.4.11)

Trong đó, , Như vậy cuối cùng

(2.4.12)

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu trích chọn đặc trưng ứng dụng cho tìm kiếm từ trong ảnh tài liệu (Trang 63 - 66)

Tải bản đầy đủ (PDF)

(82 trang)