Giáo trình Xử lý ảnh -P
Chơng Bảy: nhận dạng ảnh 7 nhận dạng ảnhPattern recognitionNh chỉ ra trong hình 1.1-a chơng Một, nhận dạng ảnh là giai đoạn cuối cùng của các hệ thống xử lý ảnh. Nhận dạng ảnh dựa trên nền tảng lý thuyết nhận dạng (pattern recognition) nói chung và đã đợc đề cập trong nhiều sách về nhận dạng. ở đây, ta không nhắc lại mà chỉ trình bày mang tính chất giới thiệu một số khái niệm cơ bản và các phơng pháp thờng đợc sử dụng trong kỹ thuật nhận dạng. Và cuối cùng sẽ đề cập đến một trờng hợp cụ thể về nhận dạng đó là nhận dạng chữ viết, một vấn đề đã và đang đợc quan tâm nhiều.Trong lý thuyết nhận dạng nói chung và nhận dạng ảnh nói riêng có 3 cách tiếp cận khác nhau:- Nhận dạng dựa vào phân hoạch không gian.- Nhận dạng cấu trúc.- Nhận dạng dựa vào kỹ thuật mạng nơ ron.Hai cách tiếp cận đầu là các kỹ thuật kinh điển. Các đối tợng ảnh quan sát và thu nhận đợc phải trải qua giai đoạn tiền xử lý nhằm tăng cờng chất lợng, làm nổi các chi tiết (chơng 4), tiếp theo là trích chọn và biểu diễn các đặc trng (chơng 5 và chơng 6), và cuối cùng mới qua giai đoạn nhận dạng. Cách tiếp cận thứ ba hoàn toàn khác. Nó dựa vào cơ chế đoán nhận, lu trũ và phân biệt đối tợng mô phỏng theo hoạt động của hệ thần kinh con ng-ời. Do cơ chế đặc biệt, các đối tợng thu nhận bởi thị giác ngời không cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối sánh với các mẫu đã lu trữ để nhận dạng. Đây là cách tiếp cận có nhiều hứa hẹn. Các cách tiếp cận trên sẽ trình bày chi tiết trong các phần dới đây.Nhập môn xử lý ảnh số - ĐHBK Hà nội 164 Chơng Bảy: nhận dạng ảnh7.1 tổng quan về nhận dạngNhận dạng là quá trình phân loại các đối tợng đợc biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tợng một tên gọi) dựa theo những quy luật và các mẫu chuẩn. Quá trình nhận dạng dựa vào những mẫu học biết trớc gọi là nhận dạng có thày hay học có thày (supervised learning); trong trờng hợp ngợc lại gọi là học không có thày (non supervised learning). Chúng ta sẽ lần lợt giới thiệu các khái niệm này.7.1.1 Không gian biểu diễn đối tợng, không gian diễn dịchKhông gian biểu diễn đối tợngCác đối tợng khi quan sát hay thu thập đợc, thờng đợc biểu diễn bởi tập các đặc tr-ng hay đặc tính. Nh trong trờng hợp xử lý ảnh, ảnh sau khi đợc tăng cờng để nâng cao chất lợng, phân vùng và trích chọn đặc tính nh đã trình bày trong các chơng từ chơng Bốn đến chơng Sáu, đợc biểu diễn bởi các đặc trng nh biên, miền đồng nhất, v .,v. Ngời ta thờng phân các đặc trng này theo các loại nh: đặc trng tô pô, đặc trng hình học và đặc trng chức năng. Việc biểu diễn ảnh theo đặc trng nào là phụ thuộc vào ứng dụng tiếp theo.ở đây ta đa ra một cách hình thức việc biểu diễn các đối tợng. Giả sử đối tợng X (ảnh, chữ viết, dấu vân tay, v .,v) đợc biểu diễn bởi n thành phần (n đặc trng): X = {x1, x2, ., xn}; mỗi xi biểu diễn một đặc tính. Không gian biểu diễn đối tợng thờng gọi tắt là không gian đối tợng X đợc định nghĩa: X = {X1, X2, ., Xm}trong đó mỗi Xi biểu diễn một đối tợng. Không gian này có thể là vô hạn. Để tiện xem xét chúng ta chỉ xét tập X là hữu hạn.Không gian diễn dịchKhông gian diễn dịch là tập các tên gọi của đối tợng. Kết thúc quá trình nhận dạng ta xác định đợc tên gọi cho các đối tợng trong tập không gian đối tợng hay nói là đã nhận dạng đợc đối tợng Một cách hình thức gọi là tập tên đối tợng: = {w1, w2, .,wk} với wi, i = 1, 2, ., k là tên các đối tợng Quá trình nhận dạng đối tợng f là một ánh xạ f: X ---> với f là tập các quy luật để định một phần tử trong X ứng với một phần tử trong . Nếu tập các quy luật và tập tên các đối tợng là biết trớc nh trong nhận dạng chữ viết (có 26 lớp từ A đến Z), ngời ta gọi là nhận Nhập môn xử lý ảnh số - ĐHBK Hà nội 165 Chơng Bảy: nhận dạng ảnhdạng có thày. Trờng hợp thứ hai là nhận dạng không có thày. Đơng nhiên trong trờng hợp này việc nhận dạng có khó khăn hơn.7.1.2 Mô hình và bản chất của quá trình nhận dạng7.1.2.1 Mô hìnhViệc chọn lựa một quá trình nhận dạng có liên quan mật thiết đến kiểu mô tả mà ngời ta sử dụng để đặc tả đối tợng. Trong nhận dạng, ngời ta phân chia làm 2 họ lớn:- Họ mô tả theo tham số- Họ mô tả theo cấu trúc.Cách mô tả đợc lựa chọn sẽ xác định mô hình của đối tợng. Nh vậy, chúng ta sẽ có 2 loại mô hình: mô hình theo tham số và mô hình cấu trúc. Mô hình tham số sử dụng một véctơ để đặc tả đối tợng. Mỗi phần tử của véctơ mô tả một đặc tính của đối tợng. Thí dụ nh trong các đặc trng chức năng, ngời ta sử dụng các hàm cơ sở trực giao để biểu diễn. Và nh vậy ảnh sẽ đợc biểu diễn bởi một chuỗi các hàm trực giao. Giả sử C là đờng bao của ảnh và C(i,j) là điểm thứ i trên đờng bao, i = 1, 2, ., N (đờng bao gồm N điểm). Giả sử tiếp :x0 = 11NiN=xiy0 = 11NiN=yilà toạ độ tâm điểm. Nh vậy, moment trung tâm bậc p, q của đờng bao là: àpq =11NiN=(xi-x0)p(yi-y0)q (7.1)Véctơ tham số trong trờng hợp này chính là các moment àij với i=1, 2, .,p và j=1, 2, .,q. Còn trong số các đặc trng hình học, ngời ta hay sử dụng chu tuyến , đờng bao, diện tích và tỉ lệ T = 4S/p2, với S là diện tích, p là chu tuyến.Việc lựa chọn phơng pháp biểu diễn sẽ làm đơn giản cách xây dựng. Tuy nhiên, việc lựa chọn đặc trng nào là hoàn toàn phụ thuộc vào ứng dụng. Thí dụ , trong nhận dạng chữ (sẽ trình bày sau), các tham số là các dấu hiệu:Nhập môn xử lý ảnh số - ĐHBK Hà nội 166 Chơng Bảy: nhận dạng ảnh- số điểm chạc ba, chạc t,- số điểm chu trình,- số điểm ngoặt,- số điểm kết thúc, chẳng hạn với chữ t có 4 điểm kết thúc, 1 điểm chạc t, . Mô hình cấu trúc: Cách tiếp cận của mô hình này dựa vào việc mô tả đối tợng nhờ một số khái niệm biểu thị các đối tợng cơ sở trong ngôn ngữ tự nhiên. Để mô tả đối t-ợng, ngời ta dùng một số dạng nguyên thuỷ nh đoạn thẳng, cung, v, .,v. Chẳng hạn một hình chữ nhật đợc định nghĩa gồm 4 đoạn thẳng vuông góc với nhau từng đôi một. Trong mô hình này ngời ta sử dụng một bộ kí hiệu kết thúc Vt, một bộ kí hiệu không kết thúc gọi là Vn. Ngoài ra có dùng một tập các luật sản xuất để mô tả cách xây dựng các đối tợng phù hợp dựa trên các đối tợng đơn giản hơn hoặc đối tợng nguyên thuỷ (tập Vt). Trong cách tiếp cận này, ta chấp nhận một khẳng đinh là: cấu trúc một dạng là kết quả của việc áp dụng luật sản xuất theo theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu. Một cách hình thức, ta có thể coi mô hình này tơng đơng một văn phạm G = (Vt, Vn, P, S) với:- Vt là bộ ký hiệu kết thúc,- Vn là bộ ký hiệu không kết thúc,- P là luật sản xuất,- S là dạng (ký hiệu bắt đầu).Thí dụ, đối tợng nhà gồm mái và tờng, mái là một tam giác gồm 3 cạnh là 3 đoạn thẳng, t-ờng là một hình chữ nhật gồm 4 cạnh vuông góc với nhau từng đôi một sẽ đợc mô tả thông qua cấu trúc mô tả dựa vào văn phạm sinh nh chỉ ra trong hình 7.1 dới đây. (1) (2) Nhà (3) Mái TờngNhập môn xử lý ảnh số - ĐHBK Hà nội 167 Chơng Bảy: nhận dạng ảnh (6) (4) Đọạn 1 Đoạn 2 Đoạn 3 Đoạn 3 Đoạn 4 Đoạn 5 Đoạn 6 (5) Hình 7.1 Mô hình cấu trúc của một đối tợng nhà.7.1.2.2 Bản chất của quá trình nhận dạngQuá trình nhận dạng gồm 3 giai đoạn chính:- Lựa chọn mô hình biểu diễn đối tợng.- Lựa chọn luật ra quyết định (phơng pháp nhận dạng) và suy diễn quá trình học.- Học nhận dạng.Khi mô hình biểu diễn đối tợng đã đợc xác định, có thể là định lợng (mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạn học. Học là giai đoạn rất quan trọng. Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tợng thành các lớp.Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối tợng vào một lớp hay nói một cách khác gán cho đối tợng một tên. Học có thày (supervised learning)Kỹ thuật phân loại nhờ kiến thức biết trớc gọi là học có thày. Đặc điểm cơ bản của kỹ thuật này là ngời ta có một th viện các mẫu chuẩn. Mẫu cần nhận dạng sẽ đợc đem sánh với mẫu chuẩn để xem nó thuộc loại nào. Thí dụ nh trong một ảnh viễn thám, ngời ta muốn phân biệt một cánh đồng lúa, một cánh rừng hay một vùng đất hoang mà đã có các miêu tả về các đối tợng đó. Vấn đề chủ yếu là thiết kế một hệ thống để có thể đối sánh đối tợng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp. Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là hàm phân lớp hay hàm ra quyết định. Hàm này sẽ đợc đề cập trong phần sau.Học không có thày(unsupervised learning)Kỹ thuật học này phải tự định ra các lớp khác nhau và xác định các tham số đặc tr-ng cho từng lớp. Học không có thày đơng nhiên là khó khăn hơn. Một mặt, do số lớp không đợc biết trớc, mặt khác những đặc trng của các lớp cũng không biết trớc. Kỹ thuật này nhằm tiến hành mọi cách gộp nhóm có thể và chọn lựa cách tốt nhất. Bắt đầu từ tập dữ liệu, nhiều Nhập môn xử lý ảnh số - ĐHBK Hà nội 168 Chơng Bảy: nhận dạng ảnhthủ tục xử lý khác nhau nhằm phân lớp và nâng cấp dần để đạt đợc một phơng án phân loại. Một số kỹ thuật tự học sẽ đợc trình bày trong phần 7.2.4.Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận dạng có thể tóm tắt theo sơ đồ sau: Trích chọn đặc tính Phân lớp trả lời Đánh biểu diễn đối tợng ra quyết định giá Quá trình tiền xử lý Khối nhận dạngHình 7.2 Sơ đồ tổng quát một hệ nhận dạng.7.2 nhận dạng dựa trên phân hoạch không gianTrong kỹ thuật này, các đối tợng nhận dạng là các đối tợng định lợng. Mỗi đối t-ợng đợc biểu diễn bởi một véctơ nhiều chiều. Trớc tiên, ta xem xét một số khái niệm nh: phân hoạch không gian, hàm phân biệt sau đó sẽ đi vào một số kỹ thuật cụ thể. 7.2.1 Phân hoạch không gianGiả sử không gian đối tợng X đợc định nghĩa : X = {Xi, i=1, 2, .,m}, Xi là một véctơ. Ngời ta nói p là một phân hoạch của không gian X thành các lớp Ci, Ci X nếu: Ci Cj = với i j và Ci = XNói chung, đây là trờng hợp lý tởng: tập X tách đợc hoàn toàn. Trong thực tế, th-ờng gặp không gian biểu diễn tách đợc từng phần. Nh vậy phân loại là dựa vào việc xây dựng một ánh xạ f: X ---> p. Công cụ xây dựng ánh xạ này là các hàm phân biệt (Descriminant functions).7.2.2 Hàm phân lớp hay hàm ra quyết địnhĐể phân đối tợng vào các lớp, ta phải xác định số lớp và ranh giới giữa các lớp đó. Hàm phân lớp hay hàm phân biệt là một công cụ rất quan trọng. Gọi {gi} là lớp các hàm phân lớp. Lớp hàm này đợc định nghĩa nh sau:Nhập môn xử lý ảnh số - ĐHBK Hà nội 169 Chơng Bảy: nhận dạng ảnh nếu i k, gk(X) > gi(X) thì ta quyết định X lớp k.Nh vậy để phân biệt k lớp, ta cần k-1 hàm phân biệt. Hàm phân biệt g của một lớp nào đó thờng dùng là hàm tuyến tính, có nghĩa là: g(X) = W0 + W1X1 + W2 X2+. . . + Wk Xktrong đó:- Wi là các trọng số gán cho các thành phần Xi.- W0 là trọng số để viết cho gọn.Trong trờng hợp g là tuyến tính, ngời ta nói là việc phân lớp là tuyến tính hay siêu phẳng (hyperplan).Các hàm phân biệt thờng đợc xây dựng dựa trên khái niệm khoảng cách hay dựa vào xác suất có điều kiện.Lẽ tự nhiên, khoảng cách là một công cụ rất tốt để xác định xem đối tợng có "gần nhau" hay không. Nếu khoảng cách nhỏ hơn một ngỡng nào đấy ta coi 2 đối tợng là giống nhau và gộp chúng vào một lớp. Ngợc lại , nếu khoảng cách lớn hơn ngỡng , có nghĩa là chúng khác nhau và ta tách thành 2 lớp.Trong một số trờng hợp, ngời ta dựa vào xác suất có điều kiện để phân lớp cho đối tợng. Lý thuyết xác suất có điều kiện đợc Bayes nghiên cứu khá kỹ và chúng ta có thể áp dụng lý thuyết này để phân biệt đối tợng. Gọi : P(X/Ci) là xác suất để có X biết rằng có xuất hiện lớp Ci P(Ci /X) là xác suất có điều kiện để X thuộc lớp Ci.với X là đối tợng nhận dạng, Ci là các lớp đối tợng.Quá trình học cho phép ta xác định P(X/Ci) và nhờ công thức Bayes về sác xuất có điều kiện áp dụng trong điều kiện nhiều biến, chúng ta sẽ tính đợc P(Ci/X) theo công thức: P(Ci /X) =)()()/(1)()/()()/(XPCPCXPniCPXCPCPCXPiiiiii== (7.2)Nếu P(Ci /X) > P(Ck /X) với i # k thì X Ci. Tuỳ theo các phơng pháp nhận dạng khác nhau, hàm phân biệt sẽ có các dạng khác nhau.7.2.3 Nhận dạng thống kêNhập môn xử lý ảnh số - ĐHBK Hà nội 170 Chơng Bảy: nhận dạng ảnhNếu các đối tợng nhận dạng tuân theo luật phân bố Gauss, mà hàm mật độ sác xuất cho bởi: 1 (x-m)2 f(x) = exp (- ) 22 22ngời ta có dùng phơng pháp ra quyết định dựa vào lý thuyết Bayes. Lý thuyết Bayes thuộc loại lý thuyết thống kê nên phơng pháp nhận dạng .dựa trên lý thuyết Bayes có tên là phơng pháp thống kê.Quy tắc Bayes- Cho không gian đối tợng X = {Xl, l=1, 2, ., L}, với Xl= {x1, x2, ., xp}- Cho không gian diễn dịch = { C1, C2, ., Cr}, r là số lớpQuy tắc Bayes phát biểu nh sau:: X ---> sao cho X Ck nếu P(Ck /X) > P(Cl /X) l <> k, l=1, 2, .,r.Trờng hợp lý tởng là nhận dạng luôn đúng, có nghĩa là không có sai số. Thực tế , luôn tồn tại sai số trong quá trình nhận dạng. Vấn đề ở đây là xây dựng quy tắc nhận dạng với sai số là nhỏ nhất.Phơng pháp ra quyết định với tối thiểuTa xác định X Ck nhờ xác suất P(Ck/X). Vậy nếu có sai số, sai số sẽ đợc tính bởi 1 - P(Ck/X). Để đánh giá sai số trung bình, ngời ta xây dựng một ma trận L(r,r) giả thiết là có n lớp. Ma trận L đợc định nghĩa nh sau: lk,j > 0 nếu k <>j (tồn tại sai số) (7.3) Lk,j = lk,j <= 0 nếu k = j (không có sai số)Nh vậy, sai số trung bình của sự phân lớp sẽ là: rk(X) = =rjXCjPlk j1)/(, (7.4)Để sai số là nhỏ nhất ta cần có rk là min. Từ công thức 7.2 và 7.4 ta có: rk(X) = =rjCjXPl jk1)/(,P(Cj) (7.5)Vậy, quy tắc ra quyết định dựa trên lý thuyết Bayes có tính đến sai số đợc phát biểu nh sau:Nhập môn xử lý ảnh số - ĐHBK Hà nội 171 Chơng Bảy: nhận dạng ảnh X Ck nếu k < p với p <> k, p=1, 2, ., r. (7.6)với k là rk(X).Trờng hợp đặc biệt với 2 lớp C1 và C2, ta dễ dàng có: X C1 nếu P(X/C1) > )/()()(21212212211CXPCPCPllll (7.7)Giả sử thêm rằng xác suất phân bố là đều (P(C1) = P(C2), sai số là nh nhau ta có: X C1 nếu P(X/C1) > P(X/C2) (7.8) 7.2.4 Một số thuật toán nhận dạng tiêu biểu trong tự họcThực tế có nhiều thuật toán nhận dạng học không có thày. ở đây, chúng ta xem xét 3 thuật toán hay đợc sử dụng: Thuật toán nhận dạng dựa vào khoảng cách lớn nhất, thuật toán K- trung bình (K mean) và thuật toán ISODATA. Chúng ta lần lợt xem xét các thuật toán này vì chúng có bớc tiếp nối, cải tiến từ thuật toán này qua thuật toán khác.7.2.4.1 Thuật toán dựa vào khoảng cách lớn nhấta) Nguyên tắcCho một tập gồm m đối tợng. Ta xác định khoảng cách giữa các đối tợng và khoảng cách lớn nhất ứng với phần tử xa nhất tạo nên lớp mới. Sự phân lớp đợc hình thành dần dần dựa vào việc xác định khoảng cách giữa các đối tợng và các lớp.b) Thuật toánBớc 1- Chọn hạt nhân ban đầu: giả sử X1 C1 gọi là lớp g1. Gọi Z1 là phần tử trung tâm của g1.- Tính tất cả các khoảng cách Dj1 = D(Xj,Z1) với j =1, 2, ., m- Tìm Dk1= maxj Dj1. Xk là phần tử xa nhất của nhóm g1. Nh vậy Xk là phần tử trung tâm của lớp mới g2, kí hiệu Z2.- Tính d1 = D12 = D(Z1,Z2).Bớc 2- Tính các khoảng cách Dj1, Dj2.- Dj1 = D(Xj,Z1), Dj2 = D((Xj,Z2). Đặt Dk(2) = max j DjNguyên tắc chọnNhập môn xử lý ảnh số - ĐHBK Hà nội 172 Chơng Bảy: nhận dạng ảnh- Nếu Dk(2) < d1 kết thúc thuật toán. Phân lớp xong.- Nếu không, sẽ tạo nên nhóm thứ ba. Gọi Xk là phần tử trung tâm của g3, kí hiệu Z3.- Tính d3 = (D12 + D13 + D23)/3với là ngỡng cho trớc và D13 = D(Z1,Z3), D23 = D(Z2,Z3).Quá trình cứ lặp lại nh vậy cho đến khi phân xong. Kết quả là ta thu đợc các lớp với các đại diện là Z1, Z2 , ., Zm.7.2.4.2. Thuật toán K trung bình ( giả sử có K lớp)a) Nguyên tắcKhác với thuật toán trên, ta xét K phần tử đầu tiên trong không gian đối tợng, hay nói một cách khác ta cố định K lớp. Hàm để đánh giá là hàm khoảng cách Euclide: Jk = ==kjZkXjDgkXZkXD1),(),( 2 (7-9)Jk là hàm chỉ tiêu với lớp Ck. Việc phân vùng cho k hạt nhân đầu tiên đợc tiến hành theo nguyên tắc khoảng cách cực tiểu. ở đây, ta dùng phơng pháp đạo hàm để tính cực tiểu.Xét 0=kkZJ với Zk là biến. Ta dễ dàng có (7.9) min khi:( )X Zi kiN=1 = 0 ==> Zk = =NcjjcZN11 (7.10)Công thức 7.10 là giá trị trung bình của lớp Ck và điều này lý giải tên của phơng pháp.b)Thuật toán Chọn Nc phần tử (giả thiết có Nc lớp) của tập T. Gọi các phần tử trung tâm của các lớp đó là: X1, X2, ., XNc và ký hiệu là Z1, Z2, ., ZNc. Thực hiện phân lớpX Ck nếu D(X,Zk) = Min D(X,Zj)(1), j =1, ., Nc. (1) là lần lặp thứ nhất.Tính tất cả Zk theo công thức 7.10.Tiếp tục nh vậy cho đến bớc q.X Gk(q-1) nếu D(X,Zk(q-1)) = min l D(X,Zl(q-1)). Nếu Zk(q-1) = Zk(q) thuật toán kết thúc, nếu không ta tiếp tục thực hiện phân lớp.7.2.4.3 Thuật toán ISODATANhập môn xử lý ảnh số - ĐHBK Hà nội 173 [...]... giải 27 x 27 Mẫu X1 Mẫu X2 Mẫu X3 Mẫu X4 ảnh gốc ảnh nhiễu tại 2 điểm ảnh kết quả số lần lặp 1 2 1 2 4 4 5 3 2 2 2 189 3 ảnh nhiễu tại 5 điểm ảnh nhiễu tại 13 điểm Nhập môn xử lý ảnh số - ĐHBK Hà nội Chơng Bảy: nhận dạng ảnh Hình 7.11 Thí nghiệm mạng với ảnh nhiễu Thứ hai, kích thớc ma trận trong số sẽ là m2 = (Nnơ ron)2 = 49 (N anh)2 Nếu cần nhớ 100 ảnh mẫu, cần phải lu giữ 490.000 trọng số, mỗi trọng... các ảnh vào mẫu 194 Hình 7 16 Các ảnh đầu vào nhiễu và kết quả nhận dạng sai Chơng Bảy: nhận dạng ảnh Từ thí nghiệm trên, có thể rút ra một vài kết luận: - Mạng có thể phục hồi ảnh mẫu nguyên bản ngay cả khi đầu vào bị biến dạng - Mạng có thể tái tạo ảnh mẫu nguyên bản khi biết tín hiệu ra tơng ứng - Mạng có thể nhận ra các thành phần trong ảnh ghép - Mạng có thể hiểu khái niệm ảnh âm bản (ảnh ngợc) ảnh. .. nơ ron Bộ vi xử lý máy tính dựa trên tích hợp các mạch logic cơ sở Có thể thấy rằng các nơ ron hoàn toàn mô phỏng khả năng tính toán của các mạch cơ sở AND, OR, NOT X X w =1 =1,5 Z w =1 =0,5 w =1 w =1 Y Y Nhập môn xử lý ảnh số - ĐHBK Hà nội Z = X and Y Z = X or Y Z X w=-1 =-0,5 180 Y = not X Y Chơng Bảy: nhận dạng ảnh 7.4.2.2 Mạng nơ ron Mạng nơ ron là hệ thống bao gồm nhiều phần tử xử lý đơn giản (nơ... những thông tin hoàn toàn mới lạ, bộ não vẫn có thể tiếp tục làm việc Nhập môn xử lý ảnh số - ĐHBK Hà nội 177 Chơng Bảy: nhận dạng ảnh -Bộ não có khả năng học So sánh khả năng làm việc của bộ não và máy tính Đơn vị tính toán Bộ nhớ Máy tính Bộ xử lý trung tâm với 105mạch logic cơ sở 109 bit RAM 1010 bit bộ nhớ ngoài Thời gian xử lý Thông lợng Cập nhật 10-8 giây 109 bit/giây 105 bit/giây Bộ não ngời Mạng... khác biệt về tốc độ tính toán và khả năng xử lý song song Các bộ vi xử lý có thể tính 10 8 lệnh trong một giây, trong khi đó mạng nơ ron xử lý chậm hơn, cần khoảng vài miligiây để kích hoạt Tuy nhiên, bộ não có thể kích hoạt hầu nh cùng một lúc tại rất nhiều nơ ron và khớp nối, trong khi đó ngay cả máy tính hiện đại cũng chỉ có một số hạn chế các bộ vi xử lý song song Nếu chạy một mạng nơ ron nhân... số ảnh mẫu N anh cần phải nhớ (đã khôi phục) trong mạng: Nnơ ron = 7 N anh (7) Từ công thức này rút ra hai điều: Thứ nhất, độ phân giải r x r của ảnh phụ thuộc vào cần phải nhớ bao nhiêu ảnh mẫu Chẳng hạn, nếu cần nhớ 100 ảnh mẫu thì cần phải có 700 nơ ron, mỗi nơ ron tơng ứng với một điểm ảnh Do vậy, r 2 = Nnơ ron = 7 N anh = 700, do đó ảnh phải có độ phân giải 27 x 27 Mẫu X1 Mẫu X2 Mẫu X3 Mẫu X4 ảnh. .. hiệu vào X là quá trình lặp bao gồm các bớc: 1 Ban đầu , đặt X(0) = X Gọi Y(t) là vectơ tín hiệu ra tơng ứng với một lần cho X(t) lan truyền trong mạng Y(t) = out(t) = Tinh ( HF, X(t)) Nhập môn xử lý ảnh số - ĐHBK Hà nội 186 Chơng Bảy: nhận dạng ảnh 2 Nếu Y(t) X(t) thì tiếp tục bớc lặp với t=t+1 và X(t+1) = Y(t) = out(t) Nếu Y(t) = X(t) thì dừng và khi đó X(t) đợc coi là kết quả xử lý của mạng khi... dạng ảnh Hình 12: Ma trận trọng số liên kết nơ ron Hình 12 Ma trận trọng số liên kết nơ ron Hình 7.12 Ma trận trọng số liên kết nơ ron X1 X2 X3 X4 X5 11000 10110 10010 10001 01100 01010 01001 ảnh mẫu nguyên bản X1 X2 X3 X4 ảnh vào bị biến dạng X5 5 ả 0 Kết quả tính toán 00110 01101 10010 0 10010 01001 Các mẫu ghép tương ứng X25 X14 C X14 2 00011 Nhập môn xử lý ảnh số - ĐHBK Hà nội nhận Hình 7.17 Các ảnh. .. 2 0 4 2 4 0 14 15 16 Kết quả thử nghiệm với các ảnh có nhiễu tại 2,5,13 điểm ảnh (tơng ứng với 13, 31 và 81%) đợc cho trên hình 7.11 Hơn nữa, với ảnh đầu vào có cùng số điểm ảnh biến dạng có thể dẫn tới những hành vi khác nhau (không hội tụ giống nhau, số vòng lặp khác nhau ) Nếu có hơn 50% điểm ảnh biến dạng thì ảnh đợc tái tạo ở đầu ra là âm bản của ảnh gốc E Khả năng nhớ mẫu của mạng Hopfield Kết... khả năng phân tách các ảnh vào ghép Có thể thấy rằng kết quả xử lý của mạng ABAM chỉ là kết quả của việc lắp ráp từ các mẫu học Một cách trực quan, ta có thể cho rằng các mẫu vào tơng tự sẽ cho những kết quả tơng tự Điều này quả thật không đúng Ví dụ X1 bị nhiễu 1 điểm ảnh sẽ cho kết quả ra là ảnh ghép X14, trong khi đó nhiễu tại 1 điểm ảnh ở X2 không làm thay đổi kết quả đầu ra Lý do chính ở đây là . nhận dạng ảnhPattern recognitionNh chỉ ra trong hình 1.1-a chơng Một, nhận dạng ảnh là giai đoạn cuối cùng của các hệ thống xử lý ảnh. Nhận dạng ảnh dựa. nhiều Nhập môn xử lý ảnh số - ĐHBK Hà nội 168 Chơng Bảy: nhận dạng ảnhthủ tục xử lý khác nhau nhằm