Nhận dạng mờ (Fuzzy Pattern Recornition)

Một phần của tài liệu Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay (Trang 25 - 82)

1.5.1. Bài toỏn nhận dạng

Nhiều thụng tin hằng ngày chỳng ta cần thu nhận và xử lý nhiều khi cú hỡnh dạng phức tạp. Bộ mụn nhận dạng cung cấp cho chỳng ta một số phương phỏp để phỏt hiện những cấu trỳc chớnh và một số nột cơ bản của hỡnh dạng đú. Cỏch tiếp cận chớnh với cỏc bài toỏn nhận dạng là: Phõn lớp tuyến tớnh, tiếp cận thống kờ, lý thuyết mờ, cỏc perceptrons, phõn lớp cơ sở tri thức dựa vào kỹ thuật của trớ tuệ nhõn tạo.

Nghĩ tới việc tiếp cận lý thuyết mờ là hoàn toàn tự nhiờn vỡ hỡnh dạng quan sỏt được, cỏc thụng tin nhận được thường rất mờ. Một số kết quả đó được cụng bố (vớ dụ: Bezdek năm 1981, Pedrrycz năm 1990 hay là Bezdek và Pal năm 1992), và đó ứng dụng thành cụng trong xử lý ảnh (nhận dạng chữ viết tay), nhận dạng tiếng núi, robot thụng minh, nhận dạng cỏc đối tượng hỡnh học…

Hỡnh 1.9: Quỏ trỡnh nhận dạng

Bõy giờ ta núi thờm về một số khỏi niệm :

- Dữ liệu (data) thu được từ quỏ trỡnh vật lý hoặc là cỏc hiện tượng. Dữ liệu (theo nghĩa rộng) cú thể ở dạng định tớnh định lượng, dạng số, hỡnh, hay một đoạn văn, ngụn ngữ hay tổ hợp cỏc dạng trờn.

- Khụng gian cỏc dỏng (Pattern Space) cũn được gọi là cấu trỳc (Structure) đú là tập cỏc dỏng vẻ, kiểu dỏng, trong đú thụng tin được tổ chức sao cho chỳng cú thể gúp phần phỏt hiện mối liờn hệ giữa cỏc biến. Núi chung số chiều của khụng gian cỏc dỏng cần ớt hơn số chiều của khụng gian dữ liệu.

Dữ liệu Biến đổi Thu gọn số chiều Thuật toỏn quyết định Kết quả

Khụng gian pattern

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 20

- Khụng gian cỏc đặc tả (Feature Space) là khụng gian nằm giữa khụng gian dữ liệu và khụng gian phõn lớp. Núi chung số chiều của khụng gian đặc tả phải ớt hơn nhiều số chiều khụng gian dữ liệu. Vấn đề khú khăn là chọn những đặc tả nào cho đủ phản ỏnh những nột quan trọng nhất của đối tượng. Khụng gian phõn lớp dĩ nhiờn phải chứa được cỏc lớp mà người nghiờn cứu muốn phõn. Tuy nhiờn thực chất cú bao nhiờu lớp phõn biệt thỡ nhiều khi ngay từ đầu cũng khú xỏc định.

Một nhận xột cũng nờn để ý là tớnh mờ khụng chỉ trong khụng gian dữ liệu mà cũn nằm trong khụng gian cỏc đặc tả và trong cỏc thuật toỏn phõn lớp.

1.5.2. Phõn nhúm và vai trũ trong thực tế

Hiện nay cỏc chuyờn gia đang nghiờn cứu về nhận dạng mờ cú thể chia theo 4 nhúm đề tài chớnh:

- Nhận dạng tĩnh cỏc đối tượng 3 chiều, cú mầu - Nhận dạng động cỏc đối tượng 3 chiều cú mầu

- Nhận dạng theo cụng nghệ hiển thị (Visual Ricogition) cỏc đối tượng 3 chiều cú màu

- Nhận dạng động cỏc biểu hiện của con người(Human Expressions)

Ai cũng hiểu được tầm quan trọng của cỏc vấn đề nhận dạng cỏc đối tượng động 3 chiều trong quốc phũng an ninh, ngành viễn thỏm. Nhưng ngay đối với ngành dõn sự độ quan trọng của đề tài này cũng được phản ảnh qua bảng tổng kết sau cuộc thăm dũ ý kiến của hơn 200 chuyờn gia hang đầu về cụng nghệ mờ được tiến hành (1989) bởi 2 giỏo sư A. Ishakawwa và T.L. Willson. (Cỏc con số ghi trong bảng tớnh theo % của cỏc ý kiến )

Đề tài Độ quan trọng

Cao Trung Bỡnh Thấp 1. Nhận dạng tĩnh dựng cụng nghệ mờ

- Cỏc hệ robot sản xuất dựng cụng nghệ hiển thị -Cỏc hệ theo dừi tự động dựng cụng nghệ hiển thị - Cỏc hệ vận tải robot dựng cụng nghệ hiển thị 2.Nhận dạng động dựng cụng nghệ mờ

-Cỏc hệ robot sản xuất dựng cụng nghệ hiển thị -Cỏc hệ theo dừi tự động dựng cụng nghệ hiển thị

84.0 80.8 42.9 81.8 78.3 16.0 19.2 47.6 9.1 13.0 0 0 9.5 9.1 8.7

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 21

Chƣơng 2

Lí THUYẾT NHẬN DẠNG ẢNH

Trong chương 2, luận văn đề cập tới những vấn đề sau: Cỏc khỏi niệm cơ bản bao gồm: Khỏi niệm ảnh số, Phõn loại ảnh số, Khỏi niệm mức xỏm đồ. Lý thuyết nhận dạng ảnh gồm: Lý thuyết xử lý ảnh 2D, Nõng cao chất lượng ảnh, Phõn loại ảnh và tỡm biờn ảnh, Lý thuyết nhận dạng ảnh. Trong chương này, luận văn đó tham khao một số tài liệu [1] và [9].

2.1. Cỏc khỏi niệm cơ bản 2.1.1. Khỏi niệm ảnh số 2.1.1. Khỏi niệm ảnh số

Ảnh trong thực tế là một ảnh liờn tục về khụng gian và giỏ trị cường độ sỏng. Để cú thể xử lý ảnh bằng mỏy tớnh người ta cần thiết phải số hoỏ ảnh. Trong quỏ trỡnh số hoỏ, ta biến đổi tớn hiệu liờn tục sang tớn hiệu rời rạc thụng qua quỏ trỡnh lấy mẫu (rời rạc hoỏ về khụng gian) và lượng hoỏ thành phần giỏ trị mà về nguyờn tắc bằng mắt thường khụng phõn biệt được hai điểm gần nhau. Một ảnh sẽ là một tập hợp cỏc phần tử ảnh (Picture Element) hay cũn gọi là Pixel.

Như vậy, ảnh số là một tập hợp cỏc điểm ảnh. Khi được số hoỏ, nú thường được biểu diễn bởi một mảng hai chiều I(n,p) với n là số dũng và p là số cột. Ta núi ảnh gồm n x p Pixels. Người ta thường ký hiệu I(x,y) để chỉ một pixel I chớnh là giỏ trị cường độ ỏnh sỏng của điểm ảnh tại Pixel đú. Thường giỏ trị n chọn bằng p và bằng 256. Ảnh cú thể được biểu diễn với cỏc độ phõn giải khỏc nhau. Một pixel cú thể được lưu trữ trờn 1, 4, 8 hay 24 bit tuỳ thuộc vào cường độ sỏng cần phõn biệt của ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đú.

2.1.2. Phõn loại ảnh số

Người ta thường chia ảnh số ra làm ba loại chớnh là:

Ảnh đen trắng: mỗi phần tử ảnh nhận một trong hai giỏ trị tương ứng với hai mức sỏng đen và trắng (cũn gọi là ảnh nhị phõn).

Ảnh xỏm (ảnh đa mức xỏm): Cỏc phần tử ảnh chứa thụng số về cường độ ỏnh đó được mó hoỏ thành N mức(8, 256 hoặc nhiều hơn) tương ứng với 3 bit, 8 bit

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 22

hoặc hơn nữa. Ảnh xỏm cú một đặc trưng là lược đồ xỏm (histogram). Ảnh xỏm được gọi là ảnh grayscale.

Ảnh mầu: mỗi phần tử được ảnh lưu trữ trong ảnh dạng một cấu trỳc cú 3 trường chứa thụng tin về 3 màu cơ bản là đỏ, xanh, lơ (red, bue, green). Màu của ảnh sẽ là giỏ trị tổng hợp của 3 giỏ trị trờn. Mỗi trường biểu diễn giỏ trị cú thể dựng 8 bit, 16 bit hoặc 24 bit để mó hoỏ.

Như vậy ảnh mầu là ảnh mang thụng tin về đối tượng đầy đủ nhất so với ảnh đen trắng và ảnh xỏm. Tuy nhiờn tất cả cỏch biểu diễn này đều chỉ là sự mụ phỏng hệ màu trong tự nhiờn. Thực tế thỡ một ảnh màu được phõn biệt qua 3 thuộc tớnh là độ chúi (Brighness), sắc thỏi màu (Hue), và độ bóo hoà (Saturation). Tuy nhiờn với khả năng cảm nhận của mắt người thỡ cỏch biểu diễn ảnh dưới dạng cấu trỳc 3 màu RBG chất lượng ảnh thu được cú thể chấp nhận được.

2.1.3. Khỏi niệm mức xỏm đồ

Ở trờn đó chỉ ra đối với cỏch biểu diễn ảnh dưới dạng ảnh xỏm thỡ ta cú một đặc trưng là lược đồ xỏm.

Lược đồ xỏm là một hàm đưa ra tần suất xuất hiện của mỗi mức xỏm (graylevel) của cỏc điểm ảnh. Lược đồ này được biểu diễn trong một hệ toạ độ vuụng gúc x,y. Trục hoành x của hệ toạ độ biểu diễn số mức xỏm từ 0 đến N

( thường N= 255). Trục tung y biểu diễn số điểm ảnh trong ảnh ứng với mức xỏm tương ứng trờn trục hoành. Như vậy ta cú thể biểu diễn mức xỏm đồ bằng hàm y=f(x) với f(x) là một hàm rời rạc cú giỏ trị bằng số điểm ảnh trong ảnh cú mức xỏm x.

2.2. Lý thuyết nhận dạng ảnh 2.2.1. Lý thuyết xử lý ảnh 2D

Ảnh thu được sau quỏ trỡnh thu nhận ảnh thường là ảnh 2D, tức là một ma trận hai chiều lưu giữ cỏc giỏ trị cường độ sỏng của cỏc điểm ảnh liờn tục. Như vậy cú thể coi tớn hiệu ảnh thu được là một tớn hiệu hai chiều liờn tục trong khụng gian được biểu diễn bằng hàm hai biến g(x,y). Quỏ trỡnh số hoỏ biến đổi ảnh liờn tục sang dạng rời rạc. Lỳc này tớn hiệu ảnh số 2D được biểu bởi một ma trận cỏc phần tử ảnh g[m,n], như vậy ở đõy ta đó ỏp dụng lý thuyết xử lý tớn hiệu số trong một khụng gian hai chiều thay vỡ khụng gian một chiều như thụng thường.

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 23

Một hệ thống xử lý ảnh sẽ tiếp nhận ảnh số g[m,n] và đưa ra ảnh đó được xử lý g’[m,n]. Trờn phương diện xử lý tớn hiệu số thỡ chức năng của hệ thống này sẽ được đặc trưng bằng hàm truyền đạt H của nú. Ta cú thể thể hiện mối quan hệ này như sau:

'[ , ] ( [ , ])

G m n H g m n (2.1)

Đối với khụng gian 2D ta cũng cú cỏc cỏch tiếp cận khỏc nhau để khảo sỏt hệ thống. Cỏch thứ nhất cú thể khảo sỏt trực tiếp trờn miền khụng gian điểm ảnh [m,n]. Những tỏc động của hàm truyền H sẽ được tớnh toỏn trực tiếp với cỏc điểm ảnh. Một số cụng cụ cơ bản thường được sử dụng là toỏn tử điểm ảnh, tớch chập hay cỏc bộ lọc.

Cỏch tiếp cận thứ hai của hệ thống xử lý số 2D là biến đổi tớn hiệu sang một miền khụng gian khỏc và thực hiện khảo sỏt trong miền khụng gian đú. Sau khi khảo sỏt xong ở miền khụng gian này ta lại biến đổi ngược để đưa tớn hiệu về miền khụng gian điểm ảnh. Việc biến đổi tớn hiệu sang xử lý ở một miền khụng gian khỏc là nhằm làm nổi bật cỏc đặc tớnh của tớn hiệu nhằm làm cho việc phõn tớch và xử lý thuận tiện hơn.Trong lý thuyết xử lý tớn hiệu số ta cú thể thực hiện biến đổi về miền khụng gian thời gian hay miền khụng gian tần số nhằm thực hiện cỏc xử lý thớch hợp.

Dưới đõy chỳng ta sẽ tiến hành xem xột một số cỏc khỏi niệm cơ bản trong một hệ thống xử lý số tớn hiệu hai chiều.

2.2.1.1. Khảo sỏt trực tiếp trong miền khụng gian điểm ảnh

Đỏp ứng xung:

Tương tự như trong khụng gian một chiều, trong khụng gian 2D ta cũng cú khỏi niệm về xung đơn vị như sau. Xung đơn vị δ[m,n] được định nghĩa theo cụng thức: 0 n m, khi 0 0 n 0, m khi 1 ,n m (2.2)

Đỏp ứng xung của một hệ thống chớnh là tớn hiệu đầu ra khi tớn hiệu đầu vào là xung đơn vị. Như vậy đỏp ứng xung h[m,n] của hệ thống cú thể định nghĩa như sau:

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 24

Với một dịch chuyển [α,β] ta cú đỏp ứng xung h[m,n; α,β] (được gọi là hàm phõn tỏn điểm- PSF: Point Spread Function) như sau:

, ; , = H ,

h m n m n (2.4) Toỏn tử tuyến tớnh:

Thường cỏc hệ thống xử lý số tớn hiệu là tuyến tớnh và bất biến, thỏa món tớnh xếp chồng và tớnh dịch chuyển.

1 , 2 , = aH 1 , + bH 2 , 1 , 2 ,

H ax n n bx m n x m n x m n ay m n by m n

, ,

H x m a n y m a n (2.5) Với cỏc hệ thống như vậy đỏp ứng xung hoàn toàn cú thể đặc trưng cho chức năng của hệ thống. Như vậy cú thể coi hoạt động của hệ thống xử lý ảnh tuyến tớnh là sự tỏc động liờn tục lờn ảnh đầu vào g[m,n] bằng đỏp ứng xung h[m,n] để thu được ảnh đầu ra g’[m,n]. Người ta gọi h[m,n] là toỏn tử tuyến tớnh, h[m,n] thỏa món tớnh xếp chồng và dịch chuyển.

Hỡnh 2.1 : Toỏn tử tuyến tớnh

Tớch chập:

Tớch chập trong miền khụng gian tuyến tớnh bất biến thể hiện mối quan hệ đầu ra, đầu vào của hệ thống và đỏp ứng xung h[m,n] được cho bởi cụng thức sau:

' , , , , . ,

k l

g m n h m n g m n h m k n l g k l (2.6)

Đỏp ứng xung h[m,n] thường cú dạng ma trận kớch thước K L bằng 3 3, 7

7 , hoặc 9 9. Cũn g[m,n] là ma trận điểm ảnh cú kớch thước M N. h[m,n]

Đầu vào

x[m,n]

Đầu ra

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 25

Tớch chập hai ma trận h[m,n] với g[m,n] cho ma trận g’[m,n]. Kớch thước của ma trận g’[m,n]P Qvới P= M+K – L cũn Q = N+L-1. mn mo n n pq po q q f f f f f f f f f h h h g g g g g g                   m1 1 11 10 0 01 00 33 32 31 23 22 21 13 12 11 p1 1 11 10 0 01 00 * h h h h h h g g g (2.7) , , , g m n h m n f m n Kỹ thuật lọc số:

Kỹ thuật lọc số ảnh được sử dụng nhằm lọc bỏ thành phần khụng mong muốn để giữ lại những thành phần quan trọng của ảnh. Thường thỡ mục tiờu chớnh của việc sử dụng kỹ thuật lọc ảnh là nhằm loại bỏ nhiễu. Ngoài ra cũn sử dụng một số bộ lọc với mục đớch tỏch cỏc chi tiết của ảnh để xử lý riờng.

Trong miền khụng gian điểm ảnh, bộ lọc thường sử dụng là một mặt nạ di chuyển khắp mặt phẳng ảnh. Tõm của cửa sổ mặt nạ sẽ là điểm chịu tỏc động lọc, giỏ trị của cỏc điểm lõn cận trong mặt nạ sẽ cú ảnh hưởng đến giỏ trị ra của điểm trung tõm. Tựy theo quan hệ giỏ trị ra của điểm trung tõm với giỏ trị của cỏc điểm lõn cận mà ta chia thành hai bộ lọc tuyến tớnh và phi tuyến.

+ Lọc tuyến tớnh:

Điểm trung tõm của mặt nạ sẽ cú giỏ trị bằng tổng số trọng số của cỏc điểm thuộc mặt nạ ( bao gồm giỏ trị của chớnh bản thõn nú). Tổng này là một tổ hợp tuyến tớnh của cỏc điểm lõn cận. Chớnh vỡ thế mà nú được gọi là lọc tuyến tớnh. Giả sử ta xột một mặt nạ lọc 3 3.

W1 W2 W3 W4 W5 W6 W7 W8 W9

Hỡnh 2.2: Mặt nạ bộ lọc tuyến tớnh 3 3

Điểm trung tõm của mặt nạ p5 sẽ được tớnh toỏn theo cụng thức sau:

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 26

Ở đõy, cỏc giỏ trị P1….P9 là cỏc giỏ trị của cỏc điểm ảnh nằm trong vựng ma trận 3 3hiện thời, W1 … W9 là giỏ trị cỏc trọng số của cỏc phần tử trong bộ lọc. + Lọc phi tuyến:

Bộ lọc phi tuyến cũng tương tự bộ lọc tuyến tớnh. Tuy nhiờn đối với lọc phi tuyến thỡ giỏ trị ra của điểm trung tõm khụng phải là tổ hợp tuyến tớnh của cỏc điểm lõn cận mà nú biểu diễn bởi một hàm phi tuyến.

Toỏn tử điểm ảnh:

Phần trờn đó xột một số cỏc phộp biến đổi tỏc động lờn khụng gian điểm ảnh nhằm biến đổi ảnh. Bõy giờ ta sẽ xột đến phộp biến đổi tỏc động lờn từng điểm ảnh để biến đổi giỏ trị cường độ của nú. Hàm biến đổi như vậy gọi là hàm toỏn tử điểm ảnh.

Tỏc động của toỏn tử điểm ảnh cú thể được mụ tả như sau: Giả sử giỏ trị cường độ sỏng của điểm ảnh ban đầu g[m,n] là u và giỏ trị cường độ sỏng của điểm ảnh sau khi biến đổi g’[m,n] là v và gọi hàm toỏn tử điểm ảnh là T thỡ:

g’[m,n] = T(g[m,n]) <=> v= T(u) với 0< u,v < N- 1 (2.9) Với N là số mức cường độ sỏng của ảnh trước khi biến đổi g[m,n]. Hàm T cú thể là một hàm tuyến tớnh hoặc phi tuyến.

Toỏn tử điểm ảnh cú thể coi như hoạt động giống như một bản tra LUT (look up table) với N cột tra. Nú thực hiện phộp biến đổi nhanh giữa cỏc giỏ trị u và cỏc giỏ trị v mà khụng cần phải tớnh toỏn. Tương ứng với mỗi giỏ trị u vào sẽ cú một giỏ trị v ra. Điều này làm cho quỏ trỡnh biến đổi ảnh nhanh hơn rất nhiều.

Hỡnh 2.3 : Toỏn tử điểm ảnh v T(k) N-1 T(u) k u

Soỏ hoựa bụỷi Trung taõm Hoùc lieọu http://lrc.tnu.edu.vn/ 27

2.2.1.2. Thực hiện phộp biến đổi khụng gia.

Một phần của tài liệu Logic mờ ứng dụng trong bài toán nhận dạng chư viết tay (Trang 25 - 82)