Tài liệu tham khảo chuyên ngành viễn thông Phương pháp nhận dạng vật thể dựa trên thuật toán kth-law ECP-SDF
Trang 1LỜI GIỚI THIỆU
Trong những năm gần đây, xử lý hình ảnh (image processing) đã đạt được nhiềuthành tựu và tiến bộ vượt bậc Trong đó, nhận dạng và phân loại hình ảnh là một trongnhững lĩnh vực được theo đuổi một cách tích cực nhất Ý tưởng cốt lõi của việc nhậndạng và phân loại hình ảnh là phân tích ảnh từ các dữ liệu thu được bởi các cảm biếnhình ảnh như camera, Webcam,… Nhờ các hệ thống xử lý ảnh, con người đã giảmđược khối lượng công việc cũng như tăng sự chính xác trong việc đưa ra các quyếtđịnh liên quan đến xử lý hình ảnh trên nhiều lĩnh vực: quân sự và quốc phòng, các hệthống kỹ nghệ hoá sinh, giải phẫu, các hệ thống giao thông thông minh, robotics, cáchệ thống an ninh…
Nhận dạng và phân tích ảnh là một lĩnh vực liên ngành Để thực hiện tốt côngviệc nhận dạng và phân tích này, đòi hỏi người nghiên cứu phải am hiểu nhiều lĩnhvực trong đó đặc biệt là các lĩnh vực liên quan tới cảm biến, các hệ thống xử lý ảnh,các giải thuật xử lý hình ảnh/tín hiệu, VLSI, phần cứng và phần mềm, các hệ thốngtích hợp…
Mục đích của luận văn này là trình bầy một phương pháp nhận dạng vật thể dựatrên thuật toán kth-law ECP-SDF Theo đó, tôi sẽ lần lượt trình bày về cơ sở lý thuyếtcủa việc xử lý ảnh, nhận dạng vật thể,chương trình MATLAB với các hộp công cụ vềkhảo sát và xử lý ảnh(image acquisition toolbox và image processing toolbox), các giảithuật liên quan: FFT, Kth-law ECP-SDF và chương trình mô phỏng nhận dạng vật bấtbiến theo tỉ lệ.
Bởi thời gian hạn hẹp cũng và nhiều hạn chế về kiến thức trong lĩnh vực hết sứcmới mẻ này, tôi mong luận văn này sẽ trình bày một sự hiểu biết tương đối về xử lýảnh nói chung và nhận dạng vật thể nói riêng Đồng thời, hy vọng rằng trong mộttương lai không xa sẽ có điều kiện ứng dụng những nghiên cứu đã đạt được trong luậnvăn này vào thực tế.
Trong quá trình hoàn thành luận văn, tôi xin đặc biệt cảm ơn tới Ths Nguyễn thịThanh Vân và PGS.TS Trần Quanh Vinh Đồng thời tôi cũng xin cảm ơn tất cả cácthầy cô giáo đã dạy tôi trong suốt 4 năm học qua tại trường Đại học Công Nghệ, Đạihọc Quốc gia Hà Nội.
Trang 2CHƯƠNG 1MỞ ĐẦU
1.1 Bài toán nhận dạng vật thể và mục đích của luận văn
Cho đến nay việc sử dụng các cảm biến hình ảnh như camera, Webcam,… đã trởnên hết sức phổ biến trong đời thường cũng như trong lĩnh vực xử lý ảnh Việc sửdụng chương trình MATLAB như một công cụ hữu ích trong xử lý hình ảnh cũngkhông còn xa lạ đối với nhiều người Tuy vậy, nhận dạng vật thể vẫn là một lĩnh vựchết sức hấp dẫn và còn nhiều điều cần khám phá.
Dù cho các công nghệ về nhận dạng và phân loại ảnh đã đạt được nhiều thànhtựu đáng chú ý, lĩnh vực này vẫn phải đối mặt với nhiều vấn đề lớn về kỹ thuật cầngiải quyết Các vấn đề này thường bao gồm: sự ‘méo’ của vật thể do môi trường cónhiễu, góc quay từ cảm biến hình ảnh tới vật thể Đôi khi sự thay đổi của vật thể cầnnhận dạng không được biểu diễn một cách chính xác do các giải thuật được ứng dụngvới tập dữ liệu hạn chế Ngoài ra, còn nhiều vấn đề nảy sinh trong thực tế làm cho vậtcần nhận dạng bị ‘méo’ trong quá trình xử lý hình ảnh Trong các điều kiện thực tếkhó khăn này, một hệ thống nhận dạng đáng tin cậy cần phải thực thi được chức năngnhận dạng và phân loại theo thời gian thực với tỉ lệ chuẩn xác cao Do đó, việc cái tiếnvà phát triển các hệ thống xử lý ảnh cũng như các giải thuật là điều hết sức cần thiếtđối với nhận dạng và phân loại vật thể cần sự chính xác và tốc độ cao.
Đã có nhiều kỹ thuật được phát triển và ứng dụng trong lĩnh vực nhận dạng vàphân loại vật thể: nhận dạng đường biên, nhận dạng qua mầu sắc vật thể, các thuậttoán lọc nhiễu,… tuy nhiên phần lớn các kỹ thuật này gặp khó khăn do vật thể bị thayđổi về hình dạng dưới các góc quay khác nhau của cảm biến hình ảnh Luận văn nàytrình bày một kỹ thuật hiệu quả để giải quyết vấn đề đó Đó là kỹ thuật nhận dạng vậtthể dựa trên thuật toán kth-law ECP-SCF Đồng thời, trong khuôn khổ luận văn này tôicũng giới thiệu chương trình nhận dạng vật thể theo thời gian thực dùng thuật toán nàyđược viết trên MATLAB.
1.2 Tổ chức luận văn
Luận văn được trình bày thành chương.
Chương 1, tác giả trình bày tóm tắt về vấn đề cần giải quyết cũng như tổ chứccủa luận văn.
Trang 3Chương 2 Tổng quan về xử lý ảnh – Nhận dạng vật thể, tác giả trình bày về cáckhái niệm thường gặp và các giai đoạn trong xử lý ảnh nói chung và nhận dạng vật thểnói riêng.
Chương 3 Nhận dạng vật bằng xử lý ảnh, tác giả giới thiệu về các phương phápchung nhất trong nhận dạng vật thể qua việc sử dụng các hàm: tương quan tuyến tínhvà tương quan phi tuyến Đồng thời trình bày về lý thuyết của biến đổi Fourier rờirạc(DFT), biến đổi Fourier nhan (FFT) cũng như thuật toán của bộ lọc tổng hợp ECP-SDF bậc k.
Chương 4 Xử lý ảnh với Matlab, tác giả giới thiệu về chương trình matlab và ứngdụng Matlab trong xử lý ảnh Đồng thời tác giả đã giới thiệu về các hộp công cụ xử lýảnh (image processing toolbox) và thu nhận ảnh (image acquisition toolbox) cùng cáclệnh thường dùng.
Chương 5 Thực nghiệm và kết quả, tác giả trình bày về các bộ lọc đơn, bộ lọctổng hợp ECP-SDF bậc k và thí nghiệm áp dụng các bộ lọc trong nhận dạng vật Đồngthời, trong chương này tác giả cũng đưa ra các ý kiến đánh giá về các khó khăn, giảipháp khắc phục và các ứng dụng có thể dùng tới bộ lọc tổng hợp ECP-SDF bậc k.
Trang 42.1.2 Các khái nịêm liên quan:
* Điểm ảnh(Picture Element)
Gốc của ảnh(ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lýbằng máy tính(số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng mộtảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí(không gian) và độ sáng(mức xám) Khoảng cách giữa điểm ảnh đó được thiết lập sao cho mắt người khôngphân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL:Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi Pixel ứngvới cặp tọa độ (x,y).
Như vậy, điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x,y) với độ xámhoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thíchhợp sao cho mắt người cảm nhận sự liên tục về kkhong gian và mức xám (hoặc màu)của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.
* Độ phân giải của ảnh
Theo định nghĩa ở trên thi mỗi Pixel gồm một cặp toạ độ (x,y) và màu Độ phângiải của ảnh chính là tích số của giá trị lớn nhất của x với giá trị lớn nhất của y.
VD: Màn hình máy tính có nhiều loại với độ phân giảI khác nhau: màn hìnhCGA (Color Graphic Adaptor) có độ phân giảI 320 x 200; màn hình VGA (VideoGraphic Array) độ phân giảI 1280 x 800;
Trang 5Rõ ràng màn hình có độ phân giảI càng cao thì ta có cảm giác nó càng ‘mịn’ hơnso với loại có độ phân giảI thấp hơn.
ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác ) với mứcxám ở các điểm ảnh có thể khác nhau.
ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức ding 1 bit mô tả 21 mứckhác nhau hay mỗi điểm ảnh nhị phân chi có 1 trong 2 giá trị hoặc là 1 hoặc là 2.
ảnh màu: với mỗi điểm ảnh thì người ta dung 3 byte để mô tả mức màu (do thếgiới màu được tạo nên từ 3 màu cơ bản: đỏ(red), lục(blue) và lơ(green)) Do đó có 28*3
=224=16,7 triệu màu.* Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh làpixel Do đó ta có thể biểu diễn một ảnh bởi một hàm 2 biến chứac thông tin Các môhình biểu diễn ảnh cho ta một mô tả lô gic hay định lượng các tính chất của hàm này.Chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý phụ thuộc vào nhiều yếu tốnhư: độ phân giảI, nhiễu,
Để xử lý được ảnh, thì ảnh đó phảI được lấy mẫu (sample) rôI lượng tử hoá(quantization) Tức là đầu tiên chuyển từ ảnh tương tự sang ảnh số sau đó lưu giá trịcủa từng điểm ảnh với một số hữu hạn các mức xám.
* Tăng cường và khôi phục ảnh
Tăng cường ảnh (image enhancement):
Khi ảnh được chuyển từ dạng này sang dạng khác bởi các quá trình như: truyềnảnh, quét ảnh,… thì ảnh nhận được thường có chất lượng thấp hơn so với ảnh ban đầu.Để giúp người ta có thể quan sát bức ảnh một cách chính xác hơn thì đòi hỏi phải cóbiện pháp để nâng cao chất lượng ảnh Qúa trình này được gọi là tăng cường ảnh(image enhancement).
Trang 6Tăng cường ảnh giúp loại bỏ các suy giảm (degradation) gây ra bởi hệ thống xửlý hoặc kênh xử lý ảnh Ngày nay, nhu cầu phát triển các hệ thống tự động cho việcxử lý hình ảnh ngày càng phát triển, kéo theo nó là sự cần thiết trong việc loại bỏ saisố cũng như các yếu tố nhiễu trong qúa trình xử lý Do đó, tăng cường ảnh có thể đượccoi như một tập hợp các kỹ thuật để nâng cao chất lượng hình ảnh đồng thời tập hợpnày cũng được ding để nâng cao độ chính xác trong quá trình tìm kiếm tự động vàchuyển đổi dạng của bức ảnh.
Các kỹ thuật tăng cường ảnh có thể kể đến: kỹ thuật tương phản (contrast), ánhxạ (mapping- gán mỗi mức xám từ ảnh gốc với một mức xám khác của ảnh đã đượcbiên dịch),… Nói chung, các kỹ thuật tăng cường ảnh này đều nhằm mục đích đạtđược kết qủa tốt nhất Những kỹ thuật này thường dựa trên các sự kết hợp giữa cácphương pháp biến đổi trên miền không gian và miền tần số
KhôI phục ảnh (image restoration):
KhôI phục ảnh là quá trình loại bỏ các suy giảm (degradation) trong ảnh Cónhiều nguyên nhân dẫn đến sự suy giảm.
Khi camera không tập trung tiêu cự một cách hợp lý có thể dẫn đến bức ảnh bị‘nhòe’.
Khi chụp ảnh trong điều kiên thời tiết không thuận lợi: sương mù, qúa nắngnóng,… cũng có thể làm cho bức ảnh bị ‘nhòe’.
Chụp ảnh các vật đang chuyển động cũng có thể gây ‘nhòe’ cho bức ảnh
Do có nhiều nguyên nhân gây nên suy giảm ảnh vì vậy, đối với mỗi loại nguyênnhân phảI có các cách phục hồi khác nhau KhôI phục ảnh phần lớn được thực hiệnbằng cách tìm ra các giảI thuật nhằm phục hồi lại các thông tin bị thất lạc trong quátrình xử lý ảnh
Chúng ta cũng cần phân biệt tăng cường ảnh với khôI phục ảnh: trong khi tăngcường ảnh nhằm tăng chất lượng của bức ảnh thì khôI phục ảnh nhằm đưa lại hình ảnhgốc của bức ảnh đã bị suy giảm Các kỹ thuật tăng cường ảnh không áp dụng được vớikhôI phục ảnh.
* Biến đổi ảnh (image transformation)
Thuật ngữ biến đổi ảnh thường dùng để nói tới các kỹ thuật dùng để biến đổi ảnh.Ở đây ảnh có thể được coi như một chuỗi các tín hiệu một chiều được biểu diễn bởi
Trang 7các hàm cơ sở Có nhiều biến đổi được dùng như: biến đổi Fourier, cosin, sin,karhumen loeve,…
Trong khuôn khổ luận văn này, ở phần sau tôI sẽ trình bày về các biến đổiFourier: DFT, FFT, IDFT,… Đây là các biến đổi rất phổ dụng và đã được tôI thực tếáp dụng trong quá trình nghiên cứu.
* Phân tích ảnh (image analysis)
Sau các bước tiền xử lý ảnh, ảnh đã được tăng cường hay được khôi phục để làmnổi các đặc trưng chủ yếu Lúc này nó bắt đầu được đưa vào quá trình phân tích Quátrình phân tích ảnh gồm các công đoạn: trích chọn các đặc tính (feature extraction),phân đoạn ảnh (segmentation) thành các phần tử Tuỳ theo mục đích của việc xử lý,các giai đoạn tiếp theo của quá trình phân tích ảnh có thể là nhận dạng ảnh (phân thànhcác lớp có miêu tả) hay là giảI thích và miêu tả ảnh Hình 1 mô tả tóm lược các bướccủa quá trình phân tích ảnh:
Hình vẽ trang 115
Hình 1 Các bước trong phân tích ảnh
Phân tích ảnh thường dựa trên việc phân tích các đặc trưng của ảnh: mật độ xám,phân bố xác suất, phân bố không gian, biên ảnh,…
2.1.3.Nhận dạng và phân loại ảnh (recognition and classification of imagepartterns)
* Nhận dạng ảnh (recognition of image partterns):
Khi một bức ảnh đã được phân đoạn, nhiệm vụ tiếp theo là nhận dạng vật thểhoặc vùng đã được phân đoạn Mỗi một vật thể là một thành phần ở trong ảnh và các
ảnh đầu ra của
GiảI thích
Trang 8giá trị đo được là các đặc tính của thành phần đó Một tập các vật thể cùng có các đặctính giống nhau được gọi là một ‘lớp vật thể’(pattern class)
Theo đó có thể định nghĩa, nhận dạng là quá trình phân loại các đối tượng đượcbiểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tượngmột tên gọi) dựa theo những quy luật và các mẫu chuẩn.
Sự nhận dạng ảnh thường dựa trên nhiều tính chất của vật và với mỗi tính chấtđều có các kỹ thuật nhận dạng khác nhau VD: Mỗi chữ cáI trong tiếng Anh đều là mộttập các đường thẳng đứng, ngang, chéo hoặc cong Trong khi chữ ‘A’ được mô tả bởi2 đường chéo và một đường nằm ngang thì chữ ‘B’ được mô tả bởi một đường thẳngđứng với 2 đoạn cong Một số tính chất của các vật thể 2 hoặc 3 chiều là diện tích, thểtích, chu vi, bề mặt,… có thể đo được thông qua việc tính toán số ‘pixel’ Tương tựnhư vậy, bang của một vật được đặc trưng bởi đường biên của nó Một số tham số đểxác định bang của một vật là cac mô-ment bất biến (invariant moment), đường trungbình (medial axis) của vật thể …
Mầu của một vật cũng là đặc điểm hết sức quan trọng được dùng trong nhậndạng Kỹ thuật dùng để phát hiện các đặc tính của vật thể gọi là kỹ thuật trích chọn đặctính (feature extraction) Khi đó vật thể được miêu tả như một tập các đặc tính Sự lựachọn và tách lấy các tính chất thích hợp được coi như là vấn đề cơ bản đầu tiên trongnhận dạng ảnh.
* Phân loại thành phần ảnh (classification of image patterns)
Phân loại là một công đoạn quan trọng trong quá trình nhận dạng vật Đã cónhiều kỹ thuật phân loại được sử dụng trong việc nhận dạng thành phần Một số kỹthuật phân loại được biết như là những kỹ thuật lý thuyết chính xác Với những kỹthuật lý thuyết chính xác này, phân loại một thành phần chưa biết được quyết định dựatrên một số nguyên tắc hoặc đã xác định hoặc có ý nghĩa thống kê hoặc thậm chí đôIkhi còn chưa được xác định rõ Hình 1 thể hiện quá trính phân loại
Trang 9Các kỹ thuật nhận dạng vật có mẫu chuẩn được chia làm 2 loại chính:
1.Phương pháp phân loại dựa trên việc thu nhận có giám sát(supervisedlearning).
2.Phương pháp phân loại sử dụng các kỹ thuật không cần giámsát(nonsupervised learning).
Các giải thuật phân loại có giám sát có thể được phân thành các loại nhỏ hơn:* Phân loại dựa vào tham số (Parametric classifiers)
* Phân loại không cần tham số (Nonparametric classifiers)
Đối với phân loại có giám sát dựa trên tham số, thiết bị phân loại lấy mẫu vớimột tập gồm nhiều mẫu thành phần xác định nhằm tính toán các thông số thống kê củamỗi loại thành phần như: trung bình số học, công sai… Các vector đặc tính đầu vàođạt được trong thời gian lấy mẫu của phân loại có giám sát được coi như các biếnGuass.
Các giải thuật không cần giám sát thường được sử dụng trong các bộ phân loạitheo khoảng cách nhỏ nhất (minimum distance classifer) và bộ phân loại tương đồnglớn nhất (maximum likelihood classifier).
Ngược lại, một số thông số không được quan tâm trong phương pháp phân loạico giám sát không cần tham số Một số kỹ thuật của loại này là: K điểm lân cận gầnnhất (K-nearest neighbors), cửa sổ Parzen (Parzen window)…
Đối với các phương pháp phân loại không cần giám sát, bộ phân loại sẽ chia toànbộ tập thông tin dựa trên một số tiêu chuẩn tương đồng Điều này cho kết quả là mộttập các thành phần trong đó mỗi thành phần thuộc về một lớp cụ thể nào đó.
Trích chọn đặc tính
Thu nhận thông tinBộ phân loại
Trang 10CHƯƠNG 3
NHẬN DẠNG VẬT BẰNG XỬ LÝ ẢNH
3.1.Tương quan tuyến tính và tương quan phi tuyến
Một đại lượng tương quan cho phép tính tóa mức độ giống nhau giữa 2 vật Biểuthức toán học thể hiện sự tương quan giữa 2 hàm số s(x,y) và r(x,y) được định nghĩabởi:
xy TF xyr xy
Trong biểu thức thỡ dấu hoa thị biểu diễn cho tớnh liờn hợp phức và thể hiệntương quan chéo Nếu như các hàm số s(x,y) và r(x,y) thể hiện một bức ảnh được phântích và một mẫu tham chiếu thỡ tương quan giữa chúng chính là phét đo sự trùng khớpgiữa các vật trong bức ảnh đối với mẫu tham chiếu Theo đó, sự tương quan có thểđược coi như một sự tính toán cấp độ giống nhau giữa chúng.
Sự tương quan cũng có thể được biểu diễn bởi các biến đổi Fourier Nếu như kýhiệu ^ biểu diễn cho biến đổi Fourier, hàm tương quan được biểu diễn bởi (3.1.1) cóthể được biểu diễn bởi phương trình:
sxyrxys r x ydd
Trong đó TF-1 là biến đổi Fourier.
Phương trình (3.1.2) cho thấy tỉ lệ tương quan giữa 2 hàm số có thể tính toánđược bằng cách nhân các biến đổi fourier trong miền tần số và sau đó nghịch đỏa tíchsố này Các hệ thể hiện sự tương quan được gọi là các hàm tương quan Mỗi hàmtương quan cho phép xử lý theo thời gian thực một dữ lượng thông tin lớn
Các hàm tương quan được mô tả bởi phương trình(3.1.1) cú rất nhiều hạn chế khicú thờm cỏc thành phần nhiễu nền Thêm vào đó, các hàm tương quan này không cònchính xác khi bức ảnh bị ‘méo’ do tỉ lệ thay đổi, vật bị di chuyển hay điều kiện ánhsáng không ổn định Áp dụng các kỹ thuật lọc trong không gian khác nhau trước khithực hiện biến hổi Fourier trong miền tần số cho phép khắc phục những vấn đề này Vídụ: việc nhận dạng các vật bị ảnh hưởng bởi các biến đổi tỉ lệ cũng như góc quay làhoàn toàn có thể thực hiện
Trang 11Một toán tử phi tuyến tác động đến các biến đổi Fourier của bức ánh và mẫutham chiếu được gọi là một hàm tương quan phi tuyến Hàm tương quan phi tuyếnthường được sử dụng do các đặc tính ưu việt của nó so với hàm tương quan tuyến tínhtrên nhiều khía cạnh như khử nhiễu, khả năng phân biệt Với các bộ xử lý bậc k, toántử phi tuyến được áp dụng một cách đối xứng với bức ảnh cũng nhuew với biến đổiFourier tham chiếu:
sgn(|)|exp ^)
(^ ^ ^
k1 (4.1.3)
Tham số k kiểm soát khả năng của hàm phi tuyến được áp dụng VD: với k=1tương ứng với một kỹ thuật lọc tuyến tính; với k=0 tương ứng với một kỹ thuật phituyến nhị phân; các giá trị khác của k cho phép thay đổi đặc tính của toán tử phi tuyến
g cũng như thay đổi tính chất của hàm tương quan (VD khả năng phân biệt hoặcbất biến đối với cường độ sang) Chỉ số k chính xác chỉ đạt được khi có một sự biểudiễn chính xác của hàm tương quan.
Biến đổi Fourier
Các kỹ thuật lọc phi tuyến
Biến đổi Fourier
Các kỹ thuật lọc phi tuyến
Biến đổi Fourier ngược
X
Trang 12Biểu đồ của một bộ xử lý tương quan phi tuyến
3.2 Các kỹ thuật lọc phi tuyến trong nhận dạng theo tỉ lệ
Để xây dựng các hệ thống nhận dạng vật theo tỉ lệ thỡ có nhiều cách tiếp cậnkhỏc nhau Điểm chung nhất giữa các hường tiếp cận là yêu cầu của việc lưu trữ thongtin dựa trên các điều kiện ‘méo’ khác nhau ảnh hưởng tới đối tượng.
Cách thông dụng nhất để lưu giữ thông tin của sự ‘méo’ của đối tượng là thiết kếmột bộ lọc đơn giản cho mỗi loại ‘méo’ Khi đó ta nhắc tới việc thiết lập một bộ lọcthông dải Để xác định liệu đối tượng có bị méo hay không trong bức ảnh cần xử lýcần phải tương quan bức ảnh với nhiều bộ lọc với các dải thông khác nhau Do đó, kỹthuật này thường tốn nhiều thời gian Các bộ lọc tổng hợp được đưa ra như là một đápán cho vấn đề này.
Thông tin trong bộ lọc tổng hợp thường chứa các cách nhỡn khỏc nhau đối vớiđối tượng ở trong các điều kiện khác nhau (điều kiện về góc nhỡn, tỉ lệ tương quan, độchói…) Việc tổng hợp tất cả những thông tin này trong một bộ lọc tổng hợp được thựchiện trong một điều kiện với các giới hạn nhất định
Ưu điểm lớn nhất của việc dung các bộ lọc tổng hợp so với các bộ lọc thông dảilà việc tiết kiệm được thời gian trong quá trỡnh xử lý Chỉ với một phép tương quanđơn giản có thể so sánh bức ảnh của đối tượng với tất cả các bức ảnh trong tập ảnhtham chiếu Mặc dù vậy, các bộ lọc tổng hợp thường thiếu tính chính xác và khả năngphân biệt trong nhận dạng Số lượng bức ảnh mẫu được dung để tham chiếu trong bộlọc tổng hợp được giới hạn nhằm đưa lại kết quả xử lý tốt nhất.
Trong khuôn khổ luận văn này, các bộ lọc phi tuyến sử dụng mặt phẳng Fourierđược sử dụng như các bộ lọc phi tuyến tổng hợp Các kết quả thí nghiệm đó cho thấycỏc bộ lọc phi tuyến trên mặt phẳng Fourier có thể thực thi tốt công việc ngay cả trongtrường hợp có nhiều loại nhiễu khác nhau Hàm ECP-SDF bậc k đó được sử dụng vàphát triển trong nhiều ứng dụng thực tế và đó đưa lại những kết quả đáng tin cậy Vìvậy, tụi xin phộp được sử dụng kết quả của thuật toán này đưa vào chương trình xử lýảnh của mạch nhằm đưa ra một giải pháp cho công việc xử lý ảnh.
3.3 Thuật toán Kth_law ECP-SDF (equal-correlation-peak synthetic
discriminant function) tạm dịch là hàm phân biệt và tổng hợp ảnh tuân theo tỉ lệ tương quan.
Đặt s1(x,y),s2(x,y), ,sN(x,y) để biểu diễn cho N bức ảnh được chọn Đặt P làtổng số pixel của mỗi bức ảnh Thay cho một ma trận biểu diễn một bức ảnh ta sử
Trang 13dụng một khái niệm vector cú trật tự lexico* Mỗi vector cột gồm p phần tử đại diệncho mỗi bức ảnh bằng cách tái sắp xếp các hàng trong ma trận Các phần tử của vectorđược sắp xếp từ trái qua phải và từ trên xuống dưới Tiếp đến chúng ta sẽ xây dựngmột bức ảnh dữ liệu mẫu S có vector si là cột thứ i của nó Khi đó S sẽ là một ma trậnkích thước PxN Khi đó, một bộ lọc tổng hợp có trật tự lexico h(x,y) được biểu diễnbởi công thức:
S+ là ma trận chuyển vị phức liờn hợp của S ()- biểu diễn sự nghịch đảo của ma trận
Vector c chứa giá trị tương quan chéo mong muốn lớn nhất cho mỗi bức ảnh
C* là vector phức liên hợp của cTrong miền tần số, (1) trở thành:
ký hiệu ^ biểu diễn cho biến đổi Fourier Khi đó bộ lọc phi tuyếntổng hợp h đạt được bằng cách thay ^
S ở (3.3.2) bởi S^k Với S^k là một ma trậnphi tuyến đối với mỗi phần tử Toán tử tuyến tính biểu diễn cho phần tử của hàng thứ rvà cột thứ l của ma trận S^k được định nghĩa bởi:
Đồng thời, bộ lọc bậc k tuân theo hàm ECP-SDF được xác định bởi công thức:
Trang 143.4 BIẾN ĐỔI FOURIER RỜI RẠC
Việc phân tích tín hiệu rời rạc theo thời gian trong miền tần số thường đượcthực hiện rất hiệu quả và tiện lợi bằng bộ vi xử lý tín hiệu số Bộ vi xử lý này có thể làmáy tính được sử dụng cho các mục đích chung hoặc là một thiết bị số chuyên dụng.Để thực hiện việc phân tích này, tín hiệu rời rạc theo thời gian {x(n} cần được chuyểntừ miền thời gian sang miền tần số tương ứng thông qua biến đổi Fourier X () củadãy Tuy vậy, do X () là hàm liên tục của biến tần số nên có thể thấy việc xử lý bằngmáy tính của cách biểu diễn này là không thuận tiện.
Để tránh nhược điểm nêu trên có thể đưa ra một cách biểu diễn khác của {x(n}– biểu diễn thông qua việc lấy mẫu phổ X () của tín hiệu Như vậy, từ biểu diễn củatín hiệu trong miền tần số liên tục ta đã đưa đến biến đổi Fourier rời rạc (DFT) Biếnđổi này là một công cụ rất hiệu quả trong việc phân tích các tín hiệu rời rạc theo thờigian.
3.4.1 Lấy mẫu trong miền tần số và biến đổi Fourier rời rạc
Trước khi nghiên cứu DFT, ta hãy xét việc lấy mẫu của biến đổi Fourier đổi vớidãy tín hiệu rời rạc theo thời gian không tuần hoàn và qua đây có thể thiết lập đượcquan hệ giữa biến đổi Fourier đã được lấy mẫu và DFT.
* Lấy mẫu trong miền tần số và khôi phục lại tín hiệu rời rạc theo thờigian
Chúng ta đã biết rằng mọi tín hiệu không tuần hoàn có năng lượng hữu hạn đềucó phổ liên tục Hãy xét một tín hiệu không tuần hoàn rời rạc theo thời gian x (n) vớibiến đổi Fourier:
X () =
jn
Giả sử tín hiệu X () được lấy mẫu tuần hoàn và khoảng cách giữa hai lần lấymẫu liên tiếp là bằng nhau và bằng radian Bởi vì X () là tuần hoàn với chu kỳ 2do vậy chỉ cần xét đến các mẫu được lấy trong miền tần số cơ bản Nếu chọn khoảngtần số cơ bản là 0 2 và số lượng mẫu được lấy trong khoảng này là N thìkhoảng cách giữa các lần lấy mẫu sẽ là = 2/N – xem hình 4.1.
Nếu đánh giá (3.4.1) tại = 2k / N, ta nhận được:
Trang 15 kxnejnN
, k = 0, 1, …, N-1 (3.4.2)
và đây chính là n mẫu được lấy của X ()
Ta hãy chia tổng trong (3.4.2) thành một số lượng vô hạn các tổng, trong đómỗi tổng có chứa N phần tử Như vậy công thức (3.4.2) có thể được viết thành:
1
2 Nn
với k = 0, 1, 2, …, N-1.Tín hiệu:
)( N
)(1 N
)( N
, n = 0, 1, …, N-1 (3.4.8)
Trang 16Quan hệ được đưa ra bởi (3.4.8) chính là công thức cho phép khôi phục lại tínhiệu tuần hoàn xp (n) từ các mẫu của phổ X () Quan hệ này, tuy vậy vẫn không đảmbảo được rằng x (n) hoặc X () có thể được khôi phục từ các mẫu hay không Để đảmbảo được điều này cần phải xem xét thêm quan hệ giữa x (n) và xp (n).
Bởi vì theo công thức (3.4.4) xp (n) là sự mở rộng một cách tuần hoàn của x (n)do vậy x (n) có thể được khôi phục lại từ xp (n) nếu không có sự “trùm thời gian” giữa
các thành phần của xp (n) Điều này đòi hỏi x (n) phải có độ dài hữu hạn và độ dài Lphải nhỏ hơn chu kỳ N của xp (n), Trên hình 4.2 mô tả hai trường hợp của tín hiệu xp
(n) ứng với các trường hợp N > L và N < L Ở đây không làm mất tính tổng quát ta cóthể xem x (n) là một dãy có độ dài hữu hạn với các giá trị khác không trong khoảng 0 n L-1 Có thể đưa ra nhận xét rằng khi N L thì:
x (n) = xp (n), 0 n N-1
vì vậy x (n) có thể được khôi phục từ xp (n) mà không có sự sai lệch Mặt khác nếu N< L thì sẽ không có khả năng khôi phục x (n) từ xp (n) do có sự tùm tín hiệu trong miềnthời gian.
Từ kết quả thu được ở trên ta suy ra phổ của tín hiệu không tuần hoàn rời rạctheo thời gian không tuần hoàn với độ dài hữu hạn L có thể được khôi phục một cáchchính xác thông qua các mẫu của nó tại các tần số k = 2k/N nếu N L Quá trìnhnày được thực hiện trước hết bằng việc xác định xp (n), n = 0, 1, 2, …, N-1 thông quacông thức (3.4.8) Khi N L thì x(n) được xác định thông qua xp(n):
0 n N-1(3.4.9)
với các giá trị khác của nvà do vậy:
)( N
, 0 n N-1 (4.1.10)
Nếu sử dụng công thức (3.4.1) và thay thế x(n) bằng (3.4.10) ta nhận được:
(4.1.11)
Trang 17Tổng của các phần tử nằm trong dấu ngoặc vuông của (4.1.11) biểu diễn côngthức nội suy được dịch bởi 2k/N theo tần số Thật vậy, ta định nghĩa:
Thì (3.4.11) sẽ trở thành:
)( 1
Như vậy, có thể thấy cũng giống như trường hợp tín hiệu liên tục theo thời gian,X() có thể được xác định thông qua các mẫu X(2k/N) của nó thông qua công thứcnội suy (3.4.12), với k = 0, 1, 2, … , N-1 Điểm khác biệt ở đây là ở chỗ P() khôngcó dạng của (sin)/ mà thay vào đó nó sẽ phụ thuộc vào tính chất tự nhiên của X().Độ lệch pha trong (3.4.12) phản ánh tính chất của tín hiệu x(n) – nhân quả và là dãy cóđộ dài hữu hạn N Đồ thị sin(N/2)/(Nsin(/2) được thể hiện trên hình 4.3 với N = 5.Có thể thấy rằng hàm P() có đặc tính:
Và do vậy theo công thức nội suy (3.4.13) thì các giá trị của X() sẽ được xácđịnh chính xác bằng các giá trị mẫu X(2kn/N) với = 2k/N Ở tại các tần số khác,công thức nội suy sẽ cho phép xác định X() thông qua tổ hợp tuyến tính có trọng sốcủa các mẫu phổ.
* Biến đổi Fourier rời rạc (DFT)
Phần 4.1.1 đã xem xét việc lấy mẫu trong miền tần số của tín hiệu không tuầnhoàn x(n) với năng lượng hữu hạn Trong trường hợp tổng quát, các mẫu được lấycách đều nhau theo tần số X(2k/N), k = 0, 1, 2, … , N-1 sẽ không cho phép khôi phụctín hiệu gốc x(n) có độ dài vô hạn Thay vào đó các mẫu này sẽ tương ứng với dãytuần hoàn xp(n) với chu kỳ N Ở đây xp(n) là tín hiệu xấp xỉ của x(n) và quan hệ củachúng được biểu diễn qua công thức:
xp(n) =
xn
Trang 18Bởi vì x(n) = xp(n) trên một chu kỳ đơn (tín hiệu x(n) được đưa thêm N-L điểmmẫu không) do vậy tín hiệu gốc x(n) với độ dài hữu hạn sẽ có thể nhận được từ cácmẫu tần số X(2k/N thông qua công thức (3.4.8) Điều này chứng tỏ các mẫu tần số,X(2k/N), k = 0, 1, 2, … , N-1 sẽ cho phép xác định tín hiệu với độ dài hữu hạn x(n)một cách duy nhất.
Một điều quan trọng cần lưu ý là các giá trị không được đưa thêm vào sẽ khôngcung cấp thêm bất kỳ một thông tin nào về phổ X() của dãy x(n) và để có thể khôiphục lại X() có thể sử dụng công thức (3.4.13) với L mẫu được lấy cách đều nhaucủa X() Tuy vậy việc đưa thêm N-L không vào x(n) và tính N điểm DFT sẽ làm chođồ thị của biến đổi Fourier trở nên tốt hơn.
Nói tóm lại, dãy số x(n) với độ dài hữu hạn L (nghĩa là x(n) = 0 với n < 0 và n L) có biến đổi Fourier:
,)()( L
( 1
Nknj
Để cho thuận tiện thì trong công thức này chỉ số trên của tổng được tăng từ L 1 lên N - 1 bởi vì x(n) = 0 khi n L.
-Quan hệ (3.4.18) chính là công thức dùng để biến đổi dãy x(n) với độ dài L N thành dãy của các mẫu tần số X(k) với độ dài N Bởi vì các mẫu tần số nhận đượcbằng cách đánh giá giá trị của biến đổi Fourier X() tại N tần số rời rạc cách đều nhaudo vậy quan hệ (3.4.18) được gọi là biến đổi Fourier rời rạc (DFT) của x(n) Ngược lạiquan hệ (3.4.18) sẽ cho phép khôi phục dãy x(n) từ các mẫu tần số Biểu thức:
Nknj
được gọi là biến đổi ngược DFT (IDFT) Rõ ràng, khi x(n) có độ dài L < N thìIDFT với N điểm sẽ có x(n) = 0 với L n N – 1 Như vậy các công thức của DFTvà IDFT sẽ là:
Trang 19DFT: ( ) 1 ( ) , 0,1,2, , 1
Nknj
(3.4.18)
Nknj
(3.4.19)
3.4.2 Biến đổi Fourier nhanh FFT:
Do vai trò quan trọng của DFT trong nhiều lĩnh vực khác nhau nên việc tínhtoán hiệu quả của DFT là một bài toán được rất nhiều nhà toán học, kỹ sư v.v… dànhnhiều thời gian để nghiên cứu Phần này sẽ trình bày một số phương pháp khác nhauđể thực hiện việc tính toán DFT một cách hiệu quả hơn.
Như ta đã biết, DFT của dãy x(n) với độ dài hữu hạn N được xác định thôngqua công thức sau:
( 1
Việc tính toán DFT sẽ hiệu quả hơn nếu ta sử dụng một số tính chất quan trọngcủa hệ số pha WN Các tính chất này bao gồm:
NN