Phõn nhúm và vai trũ trong thực tế

Một phần của tài liệu Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay (Trang 26 - 82)

Hiện nay cỏc chuyờn gia đang nghiờn cứu về nhận dạng mờ cú thể chia theo 4 nhúm đề tài chớnh:

- Nhận dạng tĩnh cỏc đối tượng 3 chiều, cú mầu - Nhận dạng động cỏc đối tượng 3 chiều cú mầu

- Nhận dạng theo cụng nghệ hiển thị (Visual Ricogition) cỏc đối tượng 3 chiều cú màu

- Nhận dạng động cỏc biểu hiện của con người(Human Expressions)

Ai cũng hiểu được tầm quan trọng của cỏc vấn đề nhận dạng cỏc đối tượng động 3 chiều trong quốc phũng an ninh, ngành viễn thỏm. Nhưng ngay đối với ngành dõn sự độ quan trọng của đề tài này cũng được phản ảnh qua bảng tổng kết sau cuộc thăm dũ ý kiến của hơn 200 chuyờn gia hang đầu về cụng nghệ mờ được tiến hành (1989) bởi 2 giỏo sư A. Ishakawwa và T.L. Willson. (Cỏc con số ghi trong bảng tớnh theo % của cỏc ý kiến )

Đề tài Độ quan trọng

Cao Trung Bỡnh Thấp 1. Nhận dạng tĩnh dựng cụng nghệ mờ

- Cỏc hệ robot sản xuất dựng cụng nghệ hiển thị -Cỏc hệ theo dừi tự động dựng cụng nghệ hiển thị - Cỏc hệ vận tải robot dựng cụng nghệ hiển thị 2.Nhận dạng động dựng cụng nghệ mờ

-Cỏc hệ robot sản xuất dựng cụng nghệ hiển thị -Cỏc hệ theo dừi tự động dựng cụng nghệ hiển thị

84.0 80.8 42.9 81.8 78.3 16.0 19.2 47.6 9.1 13.0 0 0 9.5 9.1 8.7

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 21

Chƣơng 2

Lí THUYẾT NHẬN DẠNG ẢNH

Trong chương 2, luận văn đề cập tới những vấn đề sau: Cỏc khỏi niệm cơ bản bao gồm: Khỏi niệm ảnh số, Phõn loại ảnh số, Khỏi niệm mức xỏm đồ. Lý thuyết nhận dạng ảnh gồm: Lý thuyết xử lý ảnh 2D, Nõng cao chất lượng ảnh, Phõn loại ảnh và tỡm biờn ảnh, Lý thuyết nhận dạng ảnh. Trong chương này, luận văn đó tham khao một số tài liệu [1] và [9].

2.1. Cỏc khỏi niệm cơ bản 2.1.1. Khỏi niệm ảnh số 2.1.1. Khỏi niệm ảnh số

Ảnh trong thực tế là một ảnh liờn tục về khụng gian và giỏ trị cường độ sỏng. Để cú thể xử lý ảnh bằng mỏy tớnh người ta cần thiết phải số hoỏ ảnh. Trong quỏ trỡnh số hoỏ, ta biến đổi tớn hiệu liờn tục sang tớn hiệu rời rạc thụng qua quỏ trỡnh lấy mẫu (rời rạc hoỏ về khụng gian) và lượng hoỏ thành phần giỏ trị mà về nguyờn tắc bằng mắt thường khụng phõn biệt được hai điểm gần nhau. Một ảnh sẽ là một tập hợp cỏc phần tử ảnh (Picture Element) hay cũn gọi là Pixel.

Như vậy, ảnh số là một tập hợp cỏc điểm ảnh. Khi được số hoỏ, nú thường được biểu diễn bởi một mảng hai chiều I(n,p) với n là số dũng và p là số cột. Ta núi ảnh gồm n x p Pixels. Người ta thường ký hiệu I(x,y) để chỉ một pixel I chớnh là giỏ trị cường độ ỏnh sỏng của điểm ảnh tại Pixel đú. Thường giỏ trị n chọn bằng p và bằng 256. Ảnh cú thể được biểu diễn với cỏc độ phõn giải khỏc nhau. Một pixel cú thể được lưu trữ trờn 1, 4, 8 hay 24 bit tuỳ thuộc vào cường độ sỏng cần phõn biệt của ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đú.

2.1.2. Phõn loại ảnh số

Người ta thường chia ảnh số ra làm ba loại chớnh là:

Ảnh đen trắng: mỗi phần tử ảnh nhận một trong hai giỏ trị tương ứng với hai mức sỏng đen và trắng (cũn gọi là ảnh nhị phõn).

Ảnh xỏm (ảnh đa mức xỏm): Cỏc phần tử ảnh chứa thụng số về cường độ ỏnh đó được mó hoỏ thành N mức(8, 256 hoặc nhiều hơn) tương ứng với 3 bit, 8 bit

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 22

hoặc hơn nữa. Ảnh xỏm cú một đặc trưng là lược đồ xỏm (histogram). Ảnh xỏm được gọi là ảnh grayscale.

Ảnh mầu: mỗi phần tử được ảnh lưu trữ trong ảnh dạng một cấu trỳc cú 3 trường chứa thụng tin về 3 màu cơ bản là đỏ, xanh, lơ (red, bue, green). Màu của ảnh sẽ là giỏ trị tổng hợp của 3 giỏ trị trờn. Mỗi trường biểu diễn giỏ trị cú thể dựng 8 bit, 16 bit hoặc 24 bit để mó hoỏ.

Như vậy ảnh mầu là ảnh mang thụng tin về đối tượng đầy đủ nhất so với ảnh đen trắng và ảnh xỏm. Tuy nhiờn tất cả cỏch biểu diễn này đều chỉ là sự mụ phỏng hệ màu trong tự nhiờn. Thực tế thỡ một ảnh màu được phõn biệt qua 3 thuộc tớnh là độ chúi (Brighness), sắc thỏi màu (Hue), và độ bóo hoà (Saturation). Tuy nhiờn với khả năng cảm nhận của mắt người thỡ cỏch biểu diễn ảnh dưới dạng cấu trỳc 3 màu RBG chất lượng ảnh thu được cú thể chấp nhận được.

2.1.3. Khỏi niệm mức xỏm đồ

Ở trờn đó chỉ ra đối với cỏch biểu diễn ảnh dưới dạng ảnh xỏm thỡ ta cú một đặc trưng là lược đồ xỏm.

Lược đồ xỏm là một hàm đưa ra tần suất xuất hiện của mỗi mức xỏm (graylevel) của cỏc điểm ảnh. Lược đồ này được biểu diễn trong một hệ toạ độ vuụng gúc x,y. Trục hoành x của hệ toạ độ biểu diễn số mức xỏm từ 0 đến N

( thường N= 255). Trục tung y biểu diễn số điểm ảnh trong ảnh ứng với mức xỏm tương ứng trờn trục hoành. Như vậy ta cú thể biểu diễn mức xỏm đồ bằng hàm y=f(x) với f(x) là một hàm rời rạc cú giỏ trị bằng số điểm ảnh trong ảnh cú mức xỏm x.

2.2. Lý thuyết nhận dạng ảnh 2.2.1. Lý thuyết xử lý ảnh 2D

Ảnh thu được sau quỏ trỡnh thu nhận ảnh thường là ảnh 2D, tức là một ma trận hai chiều lưu giữ cỏc giỏ trị cường độ sỏng của cỏc điểm ảnh liờn tục. Như vậy cú thể coi tớn hiệu ảnh thu được là một tớn hiệu hai chiều liờn tục trong khụng gian được biểu diễn bằng hàm hai biến g(x,y). Quỏ trỡnh số hoỏ biến đổi ảnh liờn tục sang dạng rời rạc. Lỳc này tớn hiệu ảnh số 2D được biểu bởi một ma trận cỏc phần tử ảnh g[m,n], như vậy ở đõy ta đó ỏp dụng lý thuyết xử lý tớn hiệu số trong một khụng gian hai chiều thay vỡ khụng gian một chiều như thụng thường.

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 23

Một hệ thống xử lý ảnh sẽ tiếp nhận ảnh số g[m,n] và đưa ra ảnh đó được xử lý g’[m,n]. Trờn phương diện xử lý tớn hiệu số thỡ chức năng của hệ thống này sẽ được đặc trưng bằng hàm truyền đạt H của nú. Ta cú thể thể hiện mối quan hệ này như sau:

'[ , ] ( [ , ])

G m n H g m n (2.1)

Đối với khụng gian 2D ta cũng cú cỏc cỏch tiếp cận khỏc nhau để khảo sỏt hệ thống. Cỏch thứ nhất cú thể khảo sỏt trực tiếp trờn miền khụng gian điểm ảnh [m,n]. Những tỏc động của hàm truyền H sẽ được tớnh toỏn trực tiếp với cỏc điểm ảnh. Một số cụng cụ cơ bản thường được sử dụng là toỏn tử điểm ảnh, tớch chập hay cỏc bộ lọc.

Cỏch tiếp cận thứ hai của hệ thống xử lý số 2D là biến đổi tớn hiệu sang một miền khụng gian khỏc và thực hiện khảo sỏt trong miền khụng gian đú. Sau khi khảo sỏt xong ở miền khụng gian này ta lại biến đổi ngược để đưa tớn hiệu về miền khụng gian điểm ảnh. Việc biến đổi tớn hiệu sang xử lý ở một miền khụng gian khỏc là nhằm làm nổi bật cỏc đặc tớnh của tớn hiệu nhằm làm cho việc phõn tớch và xử lý thuận tiện hơn.Trong lý thuyết xử lý tớn hiệu số ta cú thể thực hiện biến đổi về miền khụng gian thời gian hay miền khụng gian tần số nhằm thực hiện cỏc xử lý thớch hợp.

Dưới đõy chỳng ta sẽ tiến hành xem xột một số cỏc khỏi niệm cơ bản trong một hệ thống xử lý số tớn hiệu hai chiều.

2.2.1.1. Khảo sỏt trực tiếp trong miền khụng gian điểm ảnh

Đỏp ứng xung:

Tương tự như trong khụng gian một chiều, trong khụng gian 2D ta cũng cú khỏi niệm về xung đơn vị như sau. Xung đơn vị δ[m,n] được định nghĩa theo cụng thức: 0 n m, khi 0 0 n 0, m khi 1 ,n m (2.2)

Đỏp ứng xung của một hệ thống chớnh là tớn hiệu đầu ra khi tớn hiệu đầu vào là xung đơn vị. Như vậy đỏp ứng xung h[m,n] của hệ thống cú thể định nghĩa như sau:

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 24

Với một dịch chuyển [α,β] ta cú đỏp ứng xung h[m,n; α,β] (được gọi là hàm phõn tỏn điểm- PSF: Point Spread Function) như sau:

, ; , = H ,

h m n m n (2.4) Toỏn tử tuyến tớnh:

Thường cỏc hệ thống xử lý số tớn hiệu là tuyến tớnh và bất biến, thỏa món tớnh xếp chồng và tớnh dịch chuyển.

1 , 2 , = aH 1 , + bH 2 , 1 , 2 ,

H ax n n bx m n x m n x m n ay m n by m n

, ,

H x m a n y m a n (2.5) Với cỏc hệ thống như vậy đỏp ứng xung hoàn toàn cú thể đặc trưng cho chức năng của hệ thống. Như vậy cú thể coi hoạt động của hệ thống xử lý ảnh tuyến tớnh là sự tỏc động liờn tục lờn ảnh đầu vào g[m,n] bằng đỏp ứng xung h[m,n] để thu được ảnh đầu ra g’[m,n]. Người ta gọi h[m,n] là toỏn tử tuyến tớnh, h[m,n] thỏa món tớnh xếp chồng và dịch chuyển.

Hỡnh 2.1 : Toỏn tử tuyến tớnh

Tớch chập:

Tớch chập trong miền khụng gian tuyến tớnh bất biến thể hiện mối quan hệ đầu ra, đầu vào của hệ thống và đỏp ứng xung h[m,n] được cho bởi cụng thức sau:

' , , , , . ,

k l

g m n h m n g m n h m k n l g k l (2.6)

Đỏp ứng xung h[m,n] thường cú dạng ma trận kớch thước K L bằng 3 3, 7

7 , hoặc 9 9. Cũn g[m,n] là ma trận điểm ảnh cú kớch thước M N. h[m,n]

Đầu vào

x[m,n]

Đầu ra

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 25

Tớch chập hai ma trận h[m,n] với g[m,n] cho ma trận g’[m,n]. Kớch thước của ma trận g’[m,n]P Qvới P= M+K – L cũn Q = N+L-1. mn mo n n pq po q q f f f f f f f f f h h h g g g g g g                   m1 1 11 10 0 01 00 33 32 31 23 22 21 13 12 11 p1 1 11 10 0 01 00 * h h h h h h g g g (2.7) , , , g m n h m n f m n Kỹ thuật lọc số:

Kỹ thuật lọc số ảnh được sử dụng nhằm lọc bỏ thành phần khụng mong muốn để giữ lại những thành phần quan trọng của ảnh. Thường thỡ mục tiờu chớnh của việc sử dụng kỹ thuật lọc ảnh là nhằm loại bỏ nhiễu. Ngoài ra cũn sử dụng một số bộ lọc với mục đớch tỏch cỏc chi tiết của ảnh để xử lý riờng.

Trong miền khụng gian điểm ảnh, bộ lọc thường sử dụng là một mặt nạ di chuyển khắp mặt phẳng ảnh. Tõm của cửa sổ mặt nạ sẽ là điểm chịu tỏc động lọc, giỏ trị của cỏc điểm lõn cận trong mặt nạ sẽ cú ảnh hưởng đến giỏ trị ra của điểm trung tõm. Tựy theo quan hệ giỏ trị ra của điểm trung tõm với giỏ trị của cỏc điểm lõn cận mà ta chia thành hai bộ lọc tuyến tớnh và phi tuyến.

+ Lọc tuyến tớnh:

Điểm trung tõm của mặt nạ sẽ cú giỏ trị bằng tổng số trọng số của cỏc điểm thuộc mặt nạ ( bao gồm giỏ trị của chớnh bản thõn nú). Tổng này là một tổ hợp tuyến tớnh của cỏc điểm lõn cận. Chớnh vỡ thế mà nú được gọi là lọc tuyến tớnh. Giả sử ta xột một mặt nạ lọc 3 3.

W1 W2 W3 W4 W5 W6 W7 W8 W9

Hỡnh 2.2: Mặt nạ bộ lọc tuyến tớnh 3 3

Điểm trung tõm của mặt nạ p5 sẽ được tớnh toỏn theo cụng thức sau:

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 26

Ở đõy, cỏc giỏ trị P1….P9 là cỏc giỏ trị của cỏc điểm ảnh nằm trong vựng ma trận 3 3hiện thời, W1 … W9 là giỏ trị cỏc trọng số của cỏc phần tử trong bộ lọc. + Lọc phi tuyến:

Bộ lọc phi tuyến cũng tương tự bộ lọc tuyến tớnh. Tuy nhiờn đối với lọc phi tuyến thỡ giỏ trị ra của điểm trung tõm khụng phải là tổ hợp tuyến tớnh của cỏc điểm lõn cận mà nú biểu diễn bởi một hàm phi tuyến.

Toỏn tử điểm ảnh:

Phần trờn đó xột một số cỏc phộp biến đổi tỏc động lờn khụng gian điểm ảnh nhằm biến đổi ảnh. Bõy giờ ta sẽ xột đến phộp biến đổi tỏc động lờn từng điểm ảnh để biến đổi giỏ trị cường độ của nú. Hàm biến đổi như vậy gọi là hàm toỏn tử điểm ảnh.

Tỏc động của toỏn tử điểm ảnh cú thể được mụ tả như sau: Giả sử giỏ trị cường độ sỏng của điểm ảnh ban đầu g[m,n] là u và giỏ trị cường độ sỏng của điểm ảnh sau khi biến đổi g’[m,n] là v và gọi hàm toỏn tử điểm ảnh là T thỡ:

g’[m,n] = T(g[m,n]) <=> v= T(u) với 0< u,v < N- 1 (2.9) Với N là số mức cường độ sỏng của ảnh trước khi biến đổi g[m,n]. Hàm T cú thể là một hàm tuyến tớnh hoặc phi tuyến.

Toỏn tử điểm ảnh cú thể coi như hoạt động giống như một bản tra LUT (look up table) với N cột tra. Nú thực hiện phộp biến đổi nhanh giữa cỏc giỏ trị u và cỏc giỏ trị v mà khụng cần phải tớnh toỏn. Tương ứng với mỗi giỏ trị u vào sẽ cú một giỏ trị v ra. Điều này làm cho quỏ trỡnh biến đổi ảnh nhanh hơn rất nhiều.

Hỡnh 2.3 : Toỏn tử điểm ảnh v T(k) N-1 T(u) k u

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 27

2.2.1.2. Thực hiện phộp biến đổi khụng gia.

Phộp biến đổi khụng gian như trờn đó núi là nhằm đưa tớn hiệu biểu diễn sang một vựng khụng gian mới mà tại khụng gian đú cỏc đặc trưng của tớn hiệu sẽ thể hiện rừ hơn và bởi vậy mà giỳp cho quỏ trỡnh xử lý thuận tiện hơn.

Trong kỹ thuật xử lý ảnh, ta thường dựng phộp biến đổi Fourier để đưa tớn hiệu ảnh về miền khụng gian tần số. Sau khi xử lý ta lại dựng biến đổi Fourier ngược để đưa tớn hiệu quay về khụng gian điểm ảnh. Hai phộp biến đổi Fourier thường được sử dụng nhiều là biến đổi Fourier rời rạc và biến đổi Fourier nhanh.

2.2.2. Nõng cao chất lƣợng ảnh

2.2.2.1.Khụi phục ảnh

Nhiễu và mụ hỡnh nhiễu:

Ảnh được coi là một miền đồng nhất về mức xỏm, tức là cỏc điểm ảnh lõn cận cú sự biến đổi liờn tục về mức xỏm.Như vậy sau quỏ trỡnh số húa thỡ trong mỗi cửa sổ đang xột cỏc điểm ảnh đều cú giỏ trị gần bằng như nhau. Thực tế quan sỏt cú điểm ảnh cú giỏ trị khỏc hơn nhiều so với cỏc điểm ảnh khỏc. Đú chớnh là nhiễu. Như vậy, nhiễu trong ảnh số được xem như là sự dịch chuyển đột ngột của tớn hiệu thu nhận trờn một khoảng cỏch nhỏ.

+ Mụ hỡnh liờn tục:

Hệ thống thu nhận ảnh chuyển cỏc hỡnh ảnh thực của mụi trường xung quanh g(x,y) thành dạng tớn hiệu ảnh g’(x,y). Tuy nhiờn trong quỏ trỡnh chuyển đổi cú nhiều yếu tố tỏc động tạo thành nhiễu. Do đú tớn hiệu g’(x,y) cú thể chứa cỏc thành phần nhiễu trong đú. Quỏ trỡnh thu nhận ảnh cú nhiễu cú thể mụ tả một cỏch trực quan như sau :

Hỡnh 2.4: Mụ hỡnh nhiễu Hệ thống thu nhận ảnh H Ảnh gốc g(x,y) Tớn hiệu nhiễu η(x,y) Tớn hiệu ảnh g’(x,y)

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 28

+ Mụ hỡnh rời rạc:

Trờn cơ sở mụ hỡnh nhiễu liờn tục, ta cú thể xõy dựng một mụ hỡnh nhiễu rời rạc tương ứng với ảnh số. Khi đú g(x,y) sẽ chuyển thành ảnh rời rạc g[m,n], ảnh liờn tục g’(x,y) sẽ chuyển thành ma trận điểm ảnh g’[m,n] và nhiễu cũng phõn bố rời rạc tại cỏc điểm ảnh η[m,n]. Giả sử H là hàm tuyến tớnh bất biến trong phạm vi M N(

kớch thước ảnh) thỡ ta cú :

' , , , , , , . , ,

k l

g m n h m n g m n m n h m n m k n l g k l m n (2.10)

Đối với xử lý số ảnh thỡ ta chỉ sử dụng mụ hỡnh nhiễu rời rạc. + Cỏc loại nhiễu:

Cỏc tớn hiệu nhiễu thường được chia thành cỏc loại chớnh như sau:

Một phần của tài liệu Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay (Trang 26 - 82)