Ảnh gốc b) kỹ thuật Dineen c)kỹ thuật Unger (với n=3, ngỡng=4)

Một phần của tài liệu Giáo trình Xử lý ảnh -P7 (Trang 55 - 57)

D. Thử nghiệm mạng trong phục hồi ảnh

a)ảnh gốc b) kỹ thuật Dineen c)kỹ thuật Unger (với n=3, ngỡng=4)

(với n=3, ngỡng=4)

Hình 7.25 Làm trơn biên chữ.

Gọi P(i,j) là điểm tại toạ độ (i,j) trong ảnh. P(i,j) coi là biên nếu thoả 2 điều kiện: - P(i,j) = 1 & ( ∃1 ∈ Vi,j) & ( ∃ 0 ∈ Vi,j)

với Vi,j = Li,j/Pi,j mà Li,j = {Pu,v : |u -i | < ε, |v-j | < ε}

Có nghiã là P(i,j) là biên nếu nó là điểm sáng và tồn tại ít nhất 2 trong 8 láng giềng có mức sáng khác nhaụ

Làm mảnh chữ

Thực chất là kỹ thuật tạo khung ảnh (skeleton) đã nói trong mục 6.4.1

Xoay văn bản đi một góc

Do văn bản lúc đa vào máy có thể lệch đi một góc α nào đó. Trờng hợp này cần tính lại toạ độ mới theo : X’ = X cosα -Ysin α và Y’ = Xsinα + Y cosα, với α là góc lệch so với lề.

7.5.3 Giai đoạn tách chữ

Sau giai đoạn xử lý sơ bộ, văn bản (ảnh) đã đợc tăng cờng, ta chuyển sang giai đoạn tách chữ. Chỉ có thể nhận dạng đúng nếu chữ đã đợc tách khỏi văn bản. Có nhiều thuật toán tách chữ từ đơn giản đến phức tạp áp dụng cho các font chữ khác nhau: tách chữ theo chiều ngang - đứng và tách chữ theo theo lợc đồ xám.

Tách chữ theo chiều ngang và đứng

Với chữ in thờng và in hoa, do quy cách ấn loát luôn nằm trọn trong một ô nào đó. Nh vậy, quá trình tách chữ đồng nhất với việc tìm ra khuôn chữ tại vị trí của nó trong văn

bản. Quá trình này gọi là tách chữ theo hình chữ nhật (ngang và đứng) bao quanh ký tự. Thao tác này đơn giản và nhanh. Tuy nhiên không thể áp dụng với mọi font chữ.

Tách chữ theo lợc đồ xám

Khi máy quét tốt và đối với một số font, các dòng trong văn bản đợc phân cách khá tốt, việc tìm ra đờng phân ranh giữa 2 dòng là khá dễ. Song thực tế luôn không phải là dễ nhất là với chữ Việt có dấu, các dòng có thể dính hay chữ bị nhoè.

Trong trờng hợp này, đờng phân ranh đợc hiểu là đờng có ít điểm cắt nhất. Nh vậy cần xây dựng lợc đồ xám cho các dòng chữ và đờng nằm ngang tại đáy của thung lũng lợc đồ cần tìm. Kỹ thuật này có thể áp dụng cho nhận dạng chữ hoa [10].

7.5.4 Một số thuật toán nhận dạng chữ

Nhận dạng chữ sau khi đã tách khỏi từ là giai đoạn quan trọng nhất và cũng là mục đích của các hệ nhận dạng chữ viết. Mỗi loại chữ có những đặc điểm riêng nên các kỹ thuật áp dụng cũng khác nhaụ

7.5.4.1 Kỹ thuật nhận dạng chữ in

Chữ in thờng rõ nét và chất lợng khá tốt sau khi quét. Trong nhận dạng chữ in, ng- ời ta thờng dùng một số kỹ thuật:

- Kỹ thuật đối sánh từng điểm - xuất phát từ tâm, - Kỹ thuật đối sánh các dãy cắt dọc và cắt ngang, - Kỹ thuật nhận dạng theo hình chiếu,...

Kỹ thuật đối sánh từng điểm xuất phát từ tâm

Chữ sau khi đợc tách khỏi từ, tâm nó đợc tính toán và toạ độ đợc xác định. Chữ đợc đối sánh với chữ chuẩn (nhận dạng chữ viết là bài toán học có mẫu) từng điểm một, từ tâm ra biên. Các hình vành khăn lồng nhau có trọng tâm tạo thành lớp các điểm ảnh có cùng trọng số. Khoảng cách giữa 2 điểm ảnh x và x' đợc tính:

- DIST(x,x') = 0 nếu x ≡ x'

wx ≠ x' với wx là trọng số của lớp x

- Khoảng cách giữa 2 ký tự X và X' : DIST(X,X') =

x X x X∈∑∈

, ' ' DIST(x,x') Nếu DIST(X,X') < ε thì ký tự X đợc coi là X', ε là giá trị ngỡng định trớc.

Thuật toán trên thực hiện khá nhanh, song nếu chất lợng quét tồi, các điểm chữ bị mất nhiều, trọng tâm bị lệch do đó sẽ ảnh hởng đến chất lợng nhận dạng.

Kỹ thuật nhận dạng dựa vào đối sánh các điểm cắt dọc và cắt ngang (adsbygoogle = window.adsbygoogle || []).push({});

Kỹ thuật này nhằm khắc phục một số nhợc điểm của kỹ thuật trên. Giả sử chữ cô lập có kích thớc WChar và HChar. Chúng ta duyệt theo chiều ngang để tìm số điểm cắt theo chiều ngang.

Gọi Hi là số điểm cắt ngang của dòng thữ ị Nh vậy H1. H2,..., HWChar sẽ là dãy các điểm cắt ngang. Tơng tự nh vậy, gọi Vi là số điểm cắt dọc tại cột thứ ị Nh vậy V1. V2,..., VHChar sẽ là dãy các điểm cắt dọc. Bỏ qua các điểm 0 ở đầu và cuối 2 dãy, ta có 2 dãy con H = H1, H2,..., Hni và V1, V2 ,..., Vni sẽ là dãy các điểm cắt dọc, nh chỉ ra trong hình 7.26 dới đây:

Một phần của tài liệu Giáo trình Xử lý ảnh -P7 (Trang 55 - 57)