Phõn vựng ảnh theo miền đồng nhấ t

Một phần của tài liệu Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu template matching (Trang 41)

Kỹ thuật phõn vựng ảnh thành cỏc miền đồng nhất dựa vào cỏc tớnh chất quan trọng nào đú của miền ảnh. Việc lựa chọn cỏc tớnh chất của miền sẽ xỏc định tiờu chuẩn phõnvựng. Tớnh đồng nhất của một miền ảnh là điểm chủ yếu xỏc định tớnh hiệu quả của việc phõn vựng. Cỏc tiờu chuẩn hay được dựng là sự thuần nhất về

mức xỏm, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động.

Cỏc phương phỏp phõn vựng ảnh theo miền đồng nhất thường ỏp dụng là : • Phương phỏp tỏch cõy tứ phõn

• Phương phỏp cục bộ • Phương phỏp tổng hợp

2.4.2.1. Phương phỏp tỏch cõy t phõn

Về nguyờn tắc, phương phỏp này kiểm tra tớnh đỳng đắn của tiờu chuẩn đề ra một cỏch tổng thể trờn miền lớn của ảnh. Nếu tiờu chuẩn được thỏa món, việc phõn

đoạn coi như kết thỳc. Trong trường hợp ngược lại, chia miền đang xột thành 4 miền nhỏ hơn. Với mỗi miền nhỏ, ỏpdụng một cỏch đệ quy phương phỏp trờn cho

đến khi tất cả cỏc miền đều thỏa món điều kiện. Phương phỏp này cú thể mụ tả bằng thuật toỏn sau :

Procedure PhanDoan(Mien) Begin

If miền đang xột khụng thỏa Then Begin

Chia miền đang xột thành 4 miền : Z1, Z2, Z3, Z4 For i=1 to 4 do PhanDoan (Zi) End

End

Tiờu chuẩn xột miền đồng nhất ởđõy cú thể dựa vào mức xỏm. Ngoài ra, cú thể dựa vào độ lệch chuẩn hay độ chờnh giữa giỏ trị mức xỏm lớn nhất và giỏ trị mức xỏm nhỏ nhất. Giả sử Max và Min là giỏ trị mức xỏm lớn nhất và nhỏ nhất trong miền

đang xột. Nếu :

Min

Max− < T(ngưỡng)

ta coi miền đang xột là đồng nhất. Trường hợp ngược lại, miền đang xột khụng là miền đồng nhất và sẽđược chia làm 4 phần.

Thuật toỏn kiểm tra tiờu chuẩn dựa vào độ chờnh lệch max, min được viết :

Function Examin_Criteria(I, N1, M1, N2, M2, T) /* Giả thiết ảnh cú tối đa 255 mức xỏm. (N1, M1), (N2, M2) là tọa độđiểm đầu và điểm cuối của miền; T là ngưỡng. */ Begin 1. Max=0 ; Min=255 2. For i = N1 to N2 do If I[i,j] < Min Then Min=I[i,j] ; If I[i,j]<Max Then Max=I[i,j] ; 3. If ABS(Max–Min)<T Then Examin_Criteria=0 Else Examin_Criteria=1 ; End Nếu hàm trả về giỏ trị 0, cú nghĩa vựng đang xột là đồng nhất, nếu khụng thỡ khụng

đồng nhất. Trong giải thuật trờn, khi miền là đồng nhất cần tớnh lại giỏ trị trung bỡnh và cập nhật lại ảnh đầu ra. Giỏ trị trung bỡnh được tớnh bởi :

Tổng giỏ trị mức xỏm / tổng sốđiểm ảnh trong vựng

Thuật toỏn này tạo nờn một cõy mà mỗi nỳt cha cú 4 nỳt con ở mọi mức trừ mức ngoài cựng. Vỡ thế, cõy này cú tờn là cõy tứ phõn. Cõy cho ta hỡnh ảnh rừ nột về cấu trỳc phõn cấp của cỏc vựng tương ứng với tiờu chuẩn.

nỳt trong và cú 4 nỳt con tương ứng. Tiếp tục như vậy cho đến khi phõn chia xong

đểđạt cỏc vựng đồng nhất..

2.4.2.2. Phương phỏp cc b

í tưởng của phương phỏp là xột ảnh từ cỏc miền nhỏ nhất rồi nối chỳng lại nếu thỏa món tiờu chuẩn để được một miền đồng nhất lớn hơn. Tiếp tục với cỏc miền thu được cho đến khi khụng thể nối thờm được nữa. Số miền cũn lại cho ta kết quả

phõn đoạn. Như vậy, miền nhỏ nhất của bước xuất phỏt là điểm ảnh.

Phương phỏp này hoàn toàn ngược với phương phỏp tỏch. Song điều quan trọng ở đõy là nguyờn lý nối 2 vựng. Việc nối 2 vựng được thực hiện theo nguyờn tắc sau : - Hai vựng phải đỏp ứng tiờu chuẩn, thớ dụ như cựng màu hay cựng mức xỏm. - Hai vựng phải kế cận nhau.

Khỏi niệm kế cận: trong xử lý ảnh, người ta dựng khỏi niệm liờn thụng để xỏc định tớnh chất kế cận. Cú hai khỏi niệm về liờn thụng là 4 liờn thụng và 8 liờn thụng. Với 4 liờn thụng một điểm ảnh I(x,y) sẽ cú 4 kế cận theo 2 hướng x và y ; trong khi đú với 8 liờn thụng, điểm I(x,y) sẽ cú 4 liờn thụng theo 2 hướng x, y và 4 liờn thụng khỏc theo hướng chộo 450

.

4 liờn thụng 8 liờn thụng Hỡnh 2.11. Khỏi niệm 4 liờn thụng và 8 liờn thụng Dựa theo nguyờn lý của phương phỏp nối, ta cú 2 thuật toỏn : (adsbygoogle = window.adsbygoogle || []).push({});

- Thuật toỏn tụ màu (Blob Coloring) : sử dụng khỏi niệm 4 liờn thụng, dựng một cửa sổ di chuyển trờn ảnh để so sỏnh với tiờu chuẩn nối.

- Thuật toỏn đệ quy cực bộ: sử dụng phương phỏp tỡm kiếm trong một cõy để làm tăng kớch thước vựng.

2.4.2.3. Phương phỏp tng hp

tạo nờn một cấu trỳc phõn cấp và thiết lập mối quan hệ giữa cỏc vựng. Tuy nhiờn, nú thực hiện việc chia quỏ chi tiết. Phương phỏp hợp cho phộp làm giảm số miền liờn thụng xuống tối thiểu, nhưng cấu trỳc hàng ngang dàn trải, khụng cho ta thấy rừ mối liờn hệ giữa cỏc miền.

Vỡ nhược điểm này, người ta nghĩ đến phối hợp cả 2 phương phỏp. Trước tiờn, dựng phương phỏp tỏch để tạo nờn cõy tứ phõn, phõn đoạn theo hướng từ gốc đến lỏ. Tiếp theo, tiến hành duyệt cõy theo chiều ngược lại và hợp cỏc vựng cú cựng tiờu chuẩn. Với phương phỏp này ta thu được một cấu trỳc ảnh với cỏc miền liờn thụng cú kớch thước tối đa.

Giải thuật tỏch hợp gồm một số bước chớnh sau: - Kiểm tra tiờu chuẩn đồng nhất:

Nếu khụng thỏa món tiờu chuẩn đồng nhất và số điểm trong một vựng nhiều hơn 1, tỏch vựng ảnh làm 4 miền (trờn, dưới, phải, trỏi) bằng cỏch đệ quy. Nếu kết quả tỏch xong và khụng tỏch được nữa chuyển sang bước 2.

Nếu tiờu chuẩn đồng nhất thỏa món thỡ tiến hành hợp vựng và cập nhật lại giỏ trị trung bỡnh của vựng cho vựng này.

- Hợp vựng:

Kiểm tra 4 lõn cận như đó nờu trờn. Cú thể cú nhiều vựng thỏa món. Khi đú, chọn vựng tối ưu nhất rồi tiến hành hợp.

2.4.3. Phõn vựng ảnh theo kết cấu bề mặt.

Kết cấu thường được nhận biết trờn bề mặt của cỏc đối tượng như gỗ, cỏt, vải vúc…Kết cấu là thuật ngữ phản ỏnh sự lặp lại của cỏc phần tử sợi (texel) cơ bản. Sự

lặp lại này cú thể ngẫu nhiờn hay cú tớnh chu kỡ hoặc gần chu kỡ. Một texel chứa rất nhiều điểm ảnh. Trong phõn tớch ảnh, kết cấu được chia làm hai loại chớnh là: loại thống kờ và loại cấu trỳc.

2.4.3.1. Phương phỏp thng kờ

Tớnh kết cấu ngẫu nhiờn rất phự hợp với cỏc đặc trưng thống kờ. Vỡ vậy, người ta cú thể dựng cỏc đặc trưng ngẫu nhiờn để đo nú như: Hàm tự tương quan (AutoCorrelation Function-ACF), cỏc biến đổi mật độ gờ, ma trận tương tranh,… Theo cỏch tiếp cận bằng hàm tự tương quan, độ thụ của kết cấu sợi tỉ lệ với độ rộng của ACF, được biểu diễn bởi khoảng cỏch x0, y0 sao cho r(x0,0) = r(0, y0) = 1.

Người ta cũng dựng cỏch đo nhỏnh của ACF nhờ hàm khởi sinh moment : M(k,l) = ∑∑ − − m n k n r m n m ) ( ) ( , ) ( à1 à2 (2-18) 1 à = ∑∑ m n n m mr( , ) 2 à = ∑∑ m n n m nr( , )

Cỏc đặc trưng của kết cấu sợi nhưđộ thụ, độ mịn hay hướng cú thểước lượng nhờ

cỏc biến đổi ảnh bằng kỹ thuật lọc tuyến tớnh. Một mụ hỡnh đơn giản trong trường hợp ngẫu nhiờn cho việc phõn tớch tớnh kết cấu đựoc mụ tả trong hỡnh dưới đõy :

Hỡnh 2.12. Phõn tớch kết cấu sợi bằng dải tương quan

Trong mụ hỡnh này, trường kết cấu sợi trước tiờn được giải chập bởi bộ lọc lấy từ đầu ra của ACF. Như vậy, nếu r(m,n) là ACF thỡ :

u(m,n)⊗a(m,n) = ε(m,n)

là trường ngẫu nhiờn khụng tương quan.

Lưu ý rằng, bộ lọc là khụng duy nhất, cú thể là nhõn quả, bỏn nhõn quả hay khụng nhõn quả. Cỏc ACF hay dựng như M(0,2), M(2,0), M(1,1), M(2,2). Cỏc đặc trưng của lược đồ bậc một của ε(m,n) chẳng hạn như trung bỡnh m1, độ phõn tỏn à2

cũng hay được sử dụng.

Ngoài cỏc đặc trưng trờn, cú thể đưa thờm một số khỏi niệm và định nghĩa cỏc đại lượng dựa trờn đú như: lược đồ mức xỏm (Histogram Grey Level Difference), ma trận xuất hiện mức xỏm (Grey Level Occurrence Matrices).

Phõn tớch lược đồ

U(m,n)

ACF

Lọc dải tương quan

Trớch chọn đặc tớnh (adsbygoogle = window.adsbygoogle || []).push({});

2.4.3.1.1. Lược đồ hiu mc xỏm:

Lược đồ hiệu mức xỏm dựng để mụ tả cỏc thụng tin mang tớnh khụng gian và

được định nghĩa như sau. Cho d=(d1, d2) là vecto dịch chuyển giữa 2 điểm ảnh và g(d) là hiệu mức xỏm với khoảng cỏch d :

g(d) = ƒ(k,l)−ƒ(k+d1,l+d2) (2-19)

Với hàm với hàm với hàm ƒ(k, l) cho giỏ trị mức xỏm tại tọa độ (k, l). Gọi hg(g, d) là lược đồ của hiệu mức xỏm khoảng cỏch d. Với mỗi khoảng cỏch d ta cú một lược

đồ mức xỏm riờng. Với một miền ảnh cú kết cấu thụ, lược đồ hg(g, d) cú khuynh hướng tập trung xung quanh g=0 với khoảng cỏch d nhỏ. Trỏi lại, với một miền ảnh cú kết cấu mịn, hg(g, d) sẽ phõn nhỏnh dự với vecto dịch chuyển d khỏ nhỏ. Dựa trờn lược đồ này, người ta định nghĩa lại một sốđại lượng :

- Trung bỡnh : àd = ∑ = N k k h kh g d g 1 ) , ( (2-20) - Phương sai : 2 d σ = ∑ = − N k k g d k h g d g 1 2 ( , ) ) ( à (2-21) - Độ tương phản : cd = ∑ = N k k g kh g d g 1 2 ( , ) (2-22)

Phương sai đo độ tản mỏt của hiệu mức xỏm tại một khoảng cỏch d nào đấy. Kết cấu tất định thường cú phương sai σd tương đối nhỏ. Độ tương phản cd chớnh là mụmen của lược đồ hg(g,d) xung quanh g=0 và đo độ tương phản của hiệu mức xỏm.

Người ta sử dụng entropy đểđo độđồng nhất cảu lược đồ hg :

Hg = - ∑ = N k k g k g g d h g d h 1 )) , ( ln( ) , (

Ưu điểm cơ bản của lược đồ hiệu mức xỏm là tớnh toỏn đơn giản. Ngoài ra cũn cú khả năng cho ta tổ chức kết cấu khụng gian.

2.4.3.1.2. Ma trn xut hin liờn hip mc xỏm

Giả sử P(k,l,d) là xỏc suất liờn hiệp của hai điểm ảnh ƒk và ƒl với cỏc mức xỏm k,l tương ứng cỏch nhau một khoảng d. Xỏc suất này dễ dàng tớnh được nhờ việc tớnh số lần xuất hiện nk,l của cặp điểm ảnh (ƒk, ƒl) cú mức xỏm k và l với khoảng cỏch d. Gọi n là tổng số cặp liờn hiệp cú hể với khoảng cỏch d trong ảnh. Cỏc phần

tử ck,l của ma trận xuất hiện liờn hiệp mức xỏm cdđược tớnh như sau : cd = (ck,l) Và ck,l = P(k,l,d) = n nk,l (2-23) Ma trận xuất hiện liờn hiệp mức xỏm Cd là ma trận vuụng NxN phần tử (N là số mức xỏm của ảnh). Ma trận này chứa cỏc thụng tin hữu ớch về tổ chức kết cấu khụng gian. Nếu kết cấu tương đối thụ thỡ cỏc phần tử của ma trận tập trung xung quanh đường chộo chớnh. Ngược lại, nếu kết cấu bề mặt mịn, giỏ trị cỏc phần tử của cd sẽ phõn rải tương đối rừ.

Dựa trờn khỏi niệm này người ta định nghĩa về một sốđộđo: - Xỏc suất cực đại: Pd = max(k,l)Ck,l Entropy : Hd = ∑∑ = = N k N l l k l k C C 1 1 , , ln( )

Dễ dàng thấy được entropy cực đại khi xỏc suất liờn hiệp P(k,l,d) cú phõn phối đều. Mụ men bậc m : Id = ∑∑ = = − N k N l l k m C l k 1 1 ,

Id cực tiểu khi cỏc phõn tử của ma trận C tập trung trờn đường chộo chớnh vỡ khoảng cỏch klm rất nhỏ, Id nhỏ cú nghĩa là kết cấu khỏ thụ. Người ta cũng cũn đưa vào một sốđộđo khỏc như hàm tự tương quan, phổ năng lượng.

Để ỏp dụng cỏch tiếp cận này, cần cài đặt cỏc giải thuật tớnh cỏc đại lượng đo trờn.

2.4.3.2. Phương phỏp cu trỳc

Kết cấu sợi cú cấu trỳc thuần nhất là những texels xỏc định, mà sự xuất hiện lặp đi lặp lại tuõn theo một luật tất định hay ngẫu nhiờn nào đấy. Một texel về thực tế là một nhúm cỏc điểm ảnh cú cựng một số tớnh chất bất biến lặp trờn ảnh. Một texel cũng cú định nghĩa theo mức xỏm, theo bề mặt hay tớnh đồng nhất đối với một số cỏc tớnh chất như kớch thước, hướng, lược đồ bậc hai (ma trận tương tranh). Với cỏc texel được phõn bố ngẫu nhiờn, tớnh kết cấu sợi tương ứng của nú được coi là yếu (Weak) ngược với qui luật phõn bố tất định gọi là khỏe (Strong). Khi tớnh kết cấu sợi là yếu, luật phõn bố cú thểđo bởi:

- Cỏc loạt dài của cỏc texel liờn thụng tối đa

- Mật độ cực trị tương đối; số pixel trờn một đơn vị diện tớch cú mức xỏm cực trị địa phương so với cỏc lõn cận.

Ngoài hai cỏch tiếp cận trờn, người ta cũn dựng cỏch tiếp cận khỏc bằng cỏch lấy tổ hợp 2 cỏch trờn và gọi là kỹ thuật mosaic. Mụ hỡnh này biểu diễn cỏc quỏ trỡnh học ngẫu nhiờn, thớ dụ như khảm ngẫu nhiờn hay đều của một mặt phẳng vào cỏc đường cong lồi sẽ làm nổi lờn tớnh kết cấu tế bào.

2.5. Nhận dạng ảnh.

Nhận dạng là quỏ trỡnh phõn loại cỏc đối tượng được biểu diễn theo một mụ hỡnh nào

đú và gỏn cho chỳng vào một lớp (gỏn cho đối tượng một tờn gọi) dựa theo những quy luật và cỏc mẫu chuẩn. Quỏ trỡnh nhận dạng dựa vào những mẫu học biết trước gọi là nhận dạng cú thầy hay học cú thầy(supervised learning), trong trường hợp ngược lại gọi là học khụng cú thầy (non-supervised learning). Chỳng ta sẽ lần lượt giới thiệu cỏc khỏi niệm này.

2.5.1. Khụng gian biểu diễn đối tượng, khụng gian diễn dịch

2.5.1.1. Khụng gian biu din đối tượng

Cỏc đối tượng khi quan sỏt hay thu thập được, thường được biểu diễn bởi tập cỏc đặc trưng hay đặc tớnh. Người ta thường phõn cỏc đặc trưng này theo cỏc loại như: đặc trưng tụpụ, đặc trưng hỡnh học và đặc trưng chức năng. Việc biểu diễn ảnh theo đặc trưng nào là phụ thuộc vào ứng dụng tiếp theo.

Ởđõy ta đưa ra một cỏch hỡnh thức việc biểu diễn cỏc đối tượng. Giả sửđối tượng X (ảnh, chữ viết, dấu võn tay,…) được biểu diễn bởi n thành phần (n đặc trưng): X = {x1, x2,..., xn}, mỗi xi biểu diễn một đặc tớnh. Khụng gian biểu diễn đối tượng thường gọi tắt là khụng gian đối tượng X được định nghĩa: (adsbygoogle = window.adsbygoogle || []).push({});

X = {X1, X2,… , Xm}

trong đú mỗi Xi biểu diễn một đối tượng. Khụng gian này cú thể là vụ hạn. Để tiện xem xột chỳng ta chỉ xột tập X là hữu hạn.

2.5.1.2. Khụng gian din dch

Khụng gian diễn dịch là tập cỏc tờn gọi của đối tượng. Kết thỳc quỏ trỡnh nhận dạng ta xỏc định được tờn gọi cho cỏc đối tượng trong tập khụng gian đối tượng hay núi là đó nhận dạng được đối tượng.Một cỏch hỡnh thức gọiΩ là tập tờn đối tượng:

Ω = {w1, w2,...,wk} với wi, i = 1, 2,..., k là tờn cỏc đối tượng

Quỏ trỡnh nhận dạng đối tượng f là một ỏnh xạ ƒ: X --->Ω với ƒ là tập cỏc quy luật đểđịnh một phần tử trong X ứng với một phần tử trong Ω. Nếu tập cỏc quy luật và tập tờn cỏc đối tượng là biết trước như trong nhận dạng chữ viết (cú 26 lớp từ A đến Z), người ta gọi là nhận dạng cú thầy. Trường hợp thứ hai là nhận dạng khụng cú thầy. Đương nhiờn trong trường hợp này việc nhận dạng cú khú khăn hơn.

2.5.1.3. Mụ hỡnh ca quỏ trỡnh nhn dng

Việc chọn lựa một quỏ trỡnh nhận dạng cú liờn quan mật thiết đến kiểu mụ tả mà người ta sử dụn để đặ tảđối tượng. Trong nhận dạng, người ta phõn chia làm 2 họ lớn: - Họ mụ tả theo tham số - Họ mụ tả theo cấu trỳc. Cỏch mụ tả được lựa chọn sẽ xỏc định mụ hỡnh của đối tượng. Như vậy, chỳng ta

Một phần của tài liệu Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu template matching (Trang 41)