1. Trang chủ
  2. » Thể loại khác

www.tinhgiac.com ky thuat nhan dang vat the dua tren thuat toan kth law ecp scf

38 125 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 38
Dung lượng 7,05 MB

Nội dung

Trang 1

LỜI GIỚI THIỆU

Trong những năm gần đây, xử lý hình ảnh (image processing) đã đạt được nhiều

thành tựu và tiến bộ vượt bậc Trong đó, nhận dạng và phân loại hình ảnh là một trong

những lĩnh vực được theo đuôi một cách tích cực nhất Ý tưởng cốt lõi của việc nhận dạng và phân loại hình ảnh là phân tích ảnh từ các dữ liệu thu được bởi các cảm biến hình ảnh như camera, Webcam, Nhờ các hệ thống xử lý ảnh, con người đã giảm được khối lượng công việc cũng như tăng sự chính xác trong việc đưa ra các quyết

định liên quan đến xử lý hình ảnh trên nhiều lĩnh vực: quân sự và quốc phòng, các hệ

thống kỹ nghệ hoá sinh, giải phẫu, các hệ thống giao thông thông minh, robotics, các hệ thống an ninh

Nhận dạng và phân tích ảnh là một lĩnh vực liên ngành Để thực hiện tốt công việc nhận dạng và phân tích này, đòi hỏi người nghiên cứu phải am hiểu nhiều lĩnh vực trong đó đặc biệt là các lĩnh vực liên quan tới cảm biến, các hệ thống xử lý ảnh,

các giải thuật xử lý hình ảnh/tín hiệu, VLSI, phần cứng và phan mém, cdc hé thống

tích hợp

Mục đích của luận văn này là trình bầy một phương pháp nhận dạng vật thể dựa

trên thuật toán kth-law ECP-SDE Theo đó, tôi sẽ lần lượt trình bày về cơ sở lý thuyết của việc xử lý ảnh, nhận dạng vật thể,chương trình MATLAB với các hộp công cụ về khảo sát và xử ly anh(image acquisition toolbox va image processing toolbox), cac giai thuật liên quan: FFT, Kth-law ECP-SDF và chương trình mô phỏng nhận dạng vật bat

biến theo tỉ lệ

Bởi thời gian hạn hẹp cũng và nhiều hạn chế về kiến thức trong lĩnh vực hết sức mới mẻ này, tôi mong luận văn này sẽ trình bày một sự hiểu biết tương đối về xử lý ảnh nói chung và nhận dạng vật thể nói riêng Đồng thời, hy vọng rằng trong một tương lai không xa sẽ có điều kiện ứng dụng những nghiên cứu đã đạt được trong luận văn này vào thực tê

Trong quá trình hoàn thành luận văn, tôi xin đặc biệt cảm ơn tới Ths Nguyễn thị

Thanh Vân và PGS.TS Trần Quanh Vinh Đồng thời tôi cũng xin cảm ơn tất cả các thầy cô giáo đã dạy tôi trong suốt 4 năm học qua tại trường Đại học Công Nghệ, Đại

Trang 2

CHƯƠNG 1 MỞ ĐẦU

1.1 Bài toán nhận dạng vật thể và mục đích của luận văn

Cho đến nay việc sử dụng các cảm biến hình ảnh như camera, Webcam đã trở

nên hết sức phô biến trong đời thường cũng như trong lĩnh vực xử lý ảnh Việc sử

dụng chương trình MATLAB như một công cụ hữu ích trong xử lý hình ảnh cũng không còn xa lạ đối với nhiều người Tuy vậy, nhận dạng vật thê vẫn là một lĩnh vực hêt sức hâp dân và còn nhiêu điêu cân khám phả

Dù cho các công nghệ về nhận dạng và phân loại ảnh đã đạt được nhiều thành tựu đáng chú ý, lĩnh vực này vẫn phải đối mặt với nhiều vẫn đề lớn về kỹ thuật cần giải quyết Các vấn đề này thường bao gồm: sự “méo' của vật thê do môi trường có nhiễu, góc quay từ cảm biến hình ảnh tới vật thể Đôi khi sự thay đổi của vật thể cần nhận dạng không được biểu diễn một cách chính xác do các giải thuật được ứng dụng

với tập dữ liệu hạn chế Ngoài ra, còn nhiều vẫn đề nảy sinh trong thực tế làm cho vật

cân nhận dạng bị 'méo” trong quá trình xử lý hình ảnh Trong các điều kiện thực tế khó khăn này, một hệ thống nhận dạng đáng tin cậy cần phải thực thi được chức năng nhận dạng và phân loại theo thời gian thực với tỉ lệ chuẩn xác cao Do đó, việc cái tiến và phát triển các hệ thống xử lý ảnh cũng như các giải thuật là điều hết sức cần thiết đôi với nhận dạng và phân loại vật thê cân sự chính xác và tôc độ cao

Đã có nhiều kỹ thuật được phát triển và ứng dụng trong lĩnh vực nhận dạng và

phân loại vật thể: nhận dạng đường biên, nhận dạng qua mẫu sắc vật thể, các thuật

toán lọc nhiễu, tuy nhiên phần lớn các kỹ thuật này gặp khó khăn đo vật thể bi thay đổi về hình dạng đưới các góc quay khác nhau của cảm biến hình ảnh Luận văn này trình bày một kỹ thuật hiệu quả để giải quyết vẫn đề đó Đó là kỹ thuật nhận dạng vật thê dựa trên thuật tốn kth-law ECP-SCF Đơng thời, trong khuôn khổ luận văn này tôi cũng giới thiệu chương trình nhận dạng vật thể theo thời gian thực dùng thuật toán này

được viết trên MATLAB 1.2 Tổ chức luận văn

Luận văn được trình bày thành chương

Trang 3

Chương 2 Tổng quan về xử lý ảnh — Nhận dạng vật thẻ, tác giả trình bày về các khái niệm thường gặp và các giai đoạn trong xử lý ảnh nói chung và nhận dạng vật thê nói riêng

Chương 3 Nhận dạng vật bằng xử lý ảnh, tác giả giới thiệu về các phương pháp

chung nhất trong nhận dạng vật thể qua việc sử dụng các hàm: tương quan tuyến tính và tương quan phi tuyến Đồng thời trình bày về lý thuyết của biến đổi Fourier rời rạc(DFT), biến đổi Fourier nhan (FFT) cũng như thuật toán của bộ lọc tổng hợp ECP-

SDF bac k

Chương 4 Xử lý ảnh với Matlab, tác giả giới thiệu về chương trình matlab và ứng dụng Matlab trong xử lý ảnh Đồng thời tác giả đã giới thiệu về các hộp công cụ xử lý anh (image processing toolbox) va thu nhan anh (image acquisition toolbox) cung cac lệnh thường dùng

Chương 5 Thực nghiệm và kết quả, tác giả trình bày về các bộ lọc đơn, bộ lọc tổng hop ECP-SDF bac k và thí nghiệm áp dụng các bộ lọc trong nhận dạng vật Đồng

Trang 4

CHƯƠNG 2

TONG QUAN VE XU’ LY ANH - NHAN DANG VAT THE

2.1 Xử lý ảnh (số) và các khái niệm liên quan:

2.1.1 Xử lý ảnh (số)

Xử lý ảnh (số) là một dạng của xử lý tín hiệu trong đó đầu vào là một hình ảnh (các bức ảnh, các khung hình) và đầu ra của quá trình xử lý ảnh có thể là một hình ảnh khác hoặc là một tập chứa các tính chất hoặc tham số liên quan tới hình ảnh đó Phần

lớn các kỹ thuật xử lý ảnh thì thường qui về việc xử lý hình ảnh như là một tín hiệu 2 chiều rồi sử dụng các kỹ thuật xử lý tín hiệu để xử lý nó

2.1.2 Cac khai njiém lién quan: * Diém anh(Picture Element)

Gốc của ảnh(ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính(số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí(không gian) và độ sáng (mức xám) Khoảng cách giữa điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay goi tat là Pixel Trong khuôn khổ ảnh hai chiều, mỗi Pixel ứng với cap toa dé (x,y)

Như vậy, điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x,y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về kkhong gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

* Độ phân giải của ảnh

Theo định nghĩa ở trên thi mỗi Pixel gồm một cặp toạ độ (x,y) và màu Độ phân giải của ảnh chính là tích số của giá trị lớn nhất của x với giá trị lớn nhất của y

VD: Màn hình máy tính có nhiều loại với độ phân giảI khác nhau: màn hình

CGA (Color Graphic Adaptor) có độ phân giải 320 x 200; màn hình VGA (Video

Trang 5

Rõ ràng màn hình có độ phân giải càng cao thì ta có cảm giác nó càng “mịn” hơn so với loại có độ phân giáI thấp hơn

* Mức xám (Gray level)

Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số — kết quả của quá trình lượng tử hoá

Các thang giá trị mức xám thông thường: 16,32,64,128,256 Trong đó mức 256 được dùng rất phố biến do may tinh ding 1 byte(8 bit) để biểu diễn mức xám, mà mức xám lại dùng 1 byte để biểu diễn: 2Ï=256 mức, tức là từ mức 0 đến mức 255

ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác ) với mức

xám ở các diém ảnh có thê khác nhau

ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức ding 1 bit mơ tả 2Ì mức

khác nhau hay mỗi điểm ảnh nhị phân chi có 1 trong 2 giá trị hoặc là 1 hoặc là 2 ảnh màu: với mỗi điểm ảnh thì người ta dung 3 byte để mô tả mức màu (do thế giới màu được tạo nên từ 3 màu cơ bản: đỏ(red), lục(blue) và lơ(green)) Do đó có 2Ÿ” =2”'=16,7 triệu màu

* Biểu diễn ảnh

Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là pixel Do đó ta có thê biểu diễn một ảnh bởi một hàm 2 biến chứac thông tin Các mô hình biểu diễn ảnh cho ta một mô tả lô gic hay định lượng các tính chất của hàm này Chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý phụ thuộc vào nhiều yếu tố như: độ phân giải, nhiễu

Để xử lý được ảnh, thì ảnh đó phal được lẫy mẫu (sample) rôI lượng tử hoá (quantization) Tức là đầu tiên chuyển từ ánh tương tự sang ảnh số sau đó lưu giá trị của từng điểm ảnh với một số hữu hạn các mức xám

* Tăng cường và khôi phục ảnh

Tang cuong anh (image enhancement):

Khi ảnh được chuyén từ dạng này sang dạng khác bởi các quá trình như: truyền

ảnh, quét ảnh, thì ảnh nhận được thường có chất lượng thấp hơn so với ảnh ban đầu Để giúp người ta có thể quan sát bức ảnh một cách chính xác hơn thì đòi hỏi phải có biện pháp để nâng cao chất lượng ảnh Qúa trình này được gọi là tăng cường ảnh

Trang 6

Tăng cường ảnh giúp loại bỏ các suy giảm (degradation) gây ra bởi hệ thống xử lý hoặc kênh xử lý ảnh Ngày nay, nhu cầu phát triển các hệ thống tự động cho việc xử lý hình ảnh ngày càng phát triển, kéo theo nó là sự cần thiết trong việc loại bỏ sai số cũng như các yếu tô nhiễu trong qúa trình xử lý Do đó, tăng cường ảnh có thể được coi như một tập hợp các kỹ thuật để nâng cao chất lượng hình ảnh đồng thời tập hop

này cũng được ding để nâng cao độ chính xác trong quá trình tìm kiếm tự động và

chuyên đôi dạng của bức ảnh

Các kỹ thuật tăng cường ảnh có thê kế đến: kỹ thuật tương phản (contrast), ánh

xạ (mapping- gán mỗi mức xám từ ảnh gốc với một mức xám khác của ảnh đã được

biên dịch), Nói chung, các kỹ thuật tăng cường ảnh này đều nhăm mục đích đạt được kết qủa tốt nhất Những kỹ thuật này thường dựa trên các sự kết hợp giữa các phương pháp biến đổi trên miền không gian và miễn tần số

Khôi phục ảnh (image restoration):

Khôi phục ảnh là quá trình loại bỏ các suy giảm (degradation) trong ảnh Có nhiều nguyên nhân dẫn đến sự suy giảm

Khi camera không tập trung tiêu cự một cách hợp lý có thê dẫn đến bức ảnh bị

“nhòc"

Khi chụp ảnh trong điều kiên thời tiết không thuận lợi: sương mù, qúa nắng

nóng, cũng có thê làm cho bức ảnh bị “nhòc'

Chụp ảnh các vật đang chuyển động cũng có thể gây ‘nhde’ cho bite ảnh

Do có nhiều nguyên nhân gây nên suy giảm ảnh vì vậy, đối với mỗi loại nguyên nhân phải có các cách phục hồi khác nhau Khôi phục ảnh phần lớn được thực hiện bằng cách tìm ra các giải thuật nhằm phục hồi lại các thông tin bị thất lạc trong quá

trình xử lý ảnh

Chúng ta cũng cần phân biệt tăng cường ảnh với khôI phục ảnh: trong khi tăng

cường ảnh nhằm tăng chất lượng của bức ảnh thì khôI phục ảnh nhằm đưa lại hình ảnh

gốc của bức ảnh đã bị suy giảm Các kỹ thuật tăng cường ảnh không áp dụng được với

khô[T phục ảnh

*, Biến đổi ảnh (image transformation)

Trang 7

các hàm cơ sở Có nhiêu biên đôi được dùng như: biên đôi Fourier, cosin, sin,

karhumen loeve,

Trong khuôn khô luận văn này, ở phần sau tôI sẽ trình bày về các biến đổi Fourier: DFT, FFT, IDFT, Day là các bién déi rat phô dụng và đã được tôI thực tế ap dung trong qua trình nghiên cứu

* Phan tich anh (image analysis)

Sau các bước tiền xử lý ảnh, ảnh đã được tăng cường hay được khôi phục để làm

nổi các đặc trưng chủ yếu Lúc này nó bắt đầu được đưa vào quá trình phân tích Quá

trình phân tích ảnh gom các công đoạn: trích chọn các đặc tinh (feature extraction),

phân đoạn ảnh (segmentation) thành các phần tử Tuỳ theo mục đích của việc xử lý, các giai đoạn tiếp theo của quá trình phân tích ảnh có thể là nhận dạng ảnh (phân thành các lớp có miêu tả) hay là giảI thích và miêu tả ảnh Hình 1 mô tả tóm lược các bước của quả trình phân tích ảnh:

ảnh đầu ra của | Trích chọn Phân Phân

quá trình tiên XL] ac tinh đoạn loai Gial thich

Hình 1 Các bước trong phân tích anh

Phân tích ảnh thường dựa trên việc phân tích các đặc trưng của ảnh: mật độ xám,

phân bố xác suất, phân bố không gian, biên ảnh,

2.1.3.Nhận dạng và phân loại ảnh (recognition and classification of image partterns)

* Nhan dang anh (recognition of image partterns):

Khi một bức ảnh đã được phân đoạn, nhiệm vụ tiếp theo là nhận dạng vật thê

Trang 8

giá trị đo được là các đặc tính của thành phần đó Một tập các vật thê cùng có các đặc tính giống nhau được gọi là m6t ‘lop vat thé’(pattern class)

Theo đó có thể định nghĩa, nhận dạng là quá trình phân loại các đối tượng được

biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tượng một tên gọi) dựa theo những quy luật và các mẫu chuẩn

Sự nhận dạng ảnh thường dựa trên nhiều tính chất của vật và với mỗi tính chất

đều có các kỹ thuật nhận dạng khác nhau VD: Mỗi chữ cáiI trong tiếng Anh đều là một

tập các đường thăng đứng, ngang, chéo hoặc cong Trong khi chữ “A° được mô tả bởi

2 đường chéo và một đường năm ngang thì chữ “B' được mô tả bởi một đường thắng đứng với 2 đoạn cong Một số tính chất của các vật thể 2 hoặc 3 chiều là diện tích, thể tích, chu vi, bề mặt, có thể đo được thông qua việc tính toán số “pixel° Tương tự như vậy, bang của một vật được đặc trưng bởi đường biên của nó Một số tham số để xác định bang của một vật là cac mô-ment bắt biến (invariant moment), đường trung bình (medial axis) của vật thể

Mau của một vật cũng là đặc điểm hết sức quan trọng được dùng trong nhận dạng Kỹ thuật dùng để phát hiện các đặc tính của vật thê gọi là kỹ thuật trích chọn đặc tính (feature extraction) Khi đó vật thê được miêu tả như một tập các đặc tính Sự lựa

chọn và tách lay các tính chất thích hợp được coi như là van dé co bản đầu tiên trong nhận dạng ảnh

* Phân loại thành phần anh (classification of image patterns)

Phân loại là một công đoạn quan trọng trong quá trình nhận dạng vật Đã có

nhiều kỹ thuật phân loại được sử dụng trong việc nhận dạng thành phan Một số kỹ thuật phân loại được biết như là những kỹ thuật lý thuyết chính xác Với những kỹ

thuật lý thuyết chính xác này, phân loại một thành phần chưa biết được quyết định dựa

trên một số nguyên tắc hoặc đã xác định hoặc có ý nghĩa thống kê hoặc thậm chí đôi

Trang 9

Vật cần Trích chọn Bộ phân loại Kết quả

kiểm tra đặc tính đã phân loại Vật mẫu Trích chọn Thu nhận đặc tính thông tin

Các kỹ thuật nhận dạng vật có mẫu chuẩn được chia làm 2 loại chính:

1.Phương pháp phân loại dựa trên việc thu nhận có giám sát(supervised learning)

2.Phuong pháp phân loại sử dụng các kỹ thuật không cần giám sát(nonsupervised learning)

Các giải thuật phân loại có giám sát có thể được phân thành các loại nhỏ hơn: * Phân loại dựa vào tham số (Parametric classifiers)

* Phan loai khéng can tham s6 (Nonparametric classifiers)

Đối với phân loại có giám sát dựa trên tham số, thiết bị phân loại lay mẫu với

một tập gồm nhiều mẫu thành phần xác định nhằm tính tốn các thơng số thống kê của

mỗi loại thành phần như: trung bình số học, cong sai Cac vector đặc tính dau vao

đạt được trong thời gian lẫy mẫu của phân loại có giám sát được coi như các biến Guass

Các giải thuật không cần giám sát thường được sử dụng trong các bộ phân loại

theo khoảng cách nhỏ nhất (minimum distance classifer) và bộ phân loại tương đồng lớn nhất (maximum likelihood classifier)

Ngược lại, một số thông số không được quan tâm trong phương pháp phân loại

co giám sát không cần tham số Một số kỹ thuật của loại này là: K điểm lân cận gan

nhat (K-nearest neighbors), ctra s6 Parzen (Parzen window)

Đối với các phương pháp phân loại không cần giám sát, bộ phân loại sẽ chia toàn

bộ tập thông tin dựa trên một số tiêu chuẩn tương đồng Điều này cho kết quả là một

Trang 10

CHƯƠNG 3

NHẬN DẠNG VẬT BẰNG XỬ LÝ ẢNH

3.1.Tương quan tuyến tính và tương quan phi tuyến

Một đại lượng tương quan cho phép tính tóa mức độ giống nhau giữa 2 vật Biểu thức toán học thể hiện sự tương quan giữa 2 hàm số s(x,y) và r(x,y) được định nghĩa

bởi:

*

c(x,y)= TF (x,y)r (x,y) } (3.1.1)

Trong biểu thức thỡ dấu hoa thị biêu diễn cho tớnh liờn hợp phức và @ thé hién tương quan chéo Nếu như các hàm số s(x,y) và r(x,y) thể hiện một bức ảnh được phân tích và một mẫu tham chiếu thỡ tương quan giữa chúng chính là phét đo sự trùng khớp

giữa các vật trong bức ảnh đối với mẫu tham chiếu Theo đó, sự tương quan có thể

được coi như một sự tính toán cấp độ giống nhau giữa chúng

Sự tương quan cũng có thể được biểu điển bởi các biến đôi Fourier Nếu như ký hiệu ^ biểu diễn cho biến đổi Fourier, hàm tương quan được biểu diễn bởi (3.1.1) có thê được biểu diễn bởi phương trình:

c(x,y)= s(x, y)®rx, y)= [_ | s(6.n`(6~x.n~ yMậi (3.1.2)

Trong đó TE' là biến đôi Fourier

Phương trình (3.1.2) cho thấy tỉ lệ tương quan giữa 2 hàm số có thể tính toán được bằng cách nhân các biến đổi fourier trong miền tần số và sau đó nghịch đỏa tích số này Các hệ thể hiện sự tương quan được gọi là các hàm tương quan Mỗi hàm tương quan cho phép xử lý theo thời gian thực một dữ lượng thông tin lớn

Trang 11

Một toán tử phi tuyến tác động đến các biến đổi Fourier của bức ánh và mẫu

tham chiếu được gọi là một hàm tương quan phi tuyến Hàm tương quan phi tuyến thường được sử dụng do các đặc tính ưu việt của nó so với hàm tương quan tuyến tính trên nhiều khía cạnh như khử nhiễu, khả năng phân biệt Với các bộ xử ly bậc k, toán tử phi tuyến được áp dụng một cách đối xứng với bức ảnh cũng nhuew với biến đổi

Fourier tham chiếu:

e(f) =sen(f)| f IF exo i, | ; k<1 (4.1.3)

Tham số k kiểm soát khả năng của hàm phi tuyến được áp dụng VD: với k=l

tương ứng với một kỹ thuật lọc tuyến tính; với k=0 tương ứng với một kỹ thuật phi

tuyến nhị phân; các giá trị khác của k cho phép thay đổi đặc tính của toán tử phi tuyến ø{) cũng như thay đổi tính chất của hàm tương quan (VD khả năng phân biệt hoặc bat biên đôi với cường độ sang) Chỉ sô k chính xác chỉ đạt được khi có một sự biêu

Trang 12

: Biên đôi Fourier

Cac ky thuat loc

| HAVE HIDDEN A FEV phi tuyen

II TS See THEY ARE THE 5TH AND

8TH LETTERS OF THE ok Ae r ~ ^

ALPHABET Biên đôi Các kỹ thuật

FIND THEM USING Tk

STANDARD CORRELATION Fourier loc phi tuyén X GOOD LUCK! Biên đôi Fourler

Biểu đồ của một bộ xử lý tương quan phi tuyến 3.2 Các kỹ thuật lọc phi tuyến trong nhận dạng theo tỉ lệ

Dé xây dựng các hệ thống nhận dạng vật theo tỉ lệ thỡ có nhiều cách tiếp cận

khóc nhau Điểm chung nhất giữa các hường tiếp cận là yêu cầu của việc lưu trữ thong

tin dựa trên các điều kiện “méo? khác nhau ảnh hưởng tới đối tượng

Trang 13

Thông tin trong bộ lọc tổng hợp thường chứa các cách nhỡn khỏc nhau đối với

đối tượng ở trong các điều kiện khác nhau (điều kiện về góc nhỡn, tỉ lệ tương quan, độ

chói ) Việc tông hợp tất cả những thông tỉn này trong một bộ lọc tông hợp được thực hiện trong một điều kiện với các giới hạn nhất định

Ưu điểm lớn nhất của việc dung các bộ lọc tong hợp so với các bộ lọc thông dải

là việc tiết kiệm được thời gian trong quá trỡnh xử lý Chỉ với một phép tương quan

đơn giản có thể so sánh bức ảnh của đối tượng với tất cả các bức anh trong tap anh

tham chiếu Mặc dù vậy, các bộ lọc tong hợp thường thiếu tính chính xác và khả năng

phân biệt trong nhận đạng Số lượng bức ảnh mẫu được dung để tham chiếu trong bộ

lọc tổng hợp được giới hạn nhăm đưa lại kết quả xử lý tốt nhất

Trong khuôn khô luận văn này, các bộ lọc phi tuyến sử dụng mặt phẳng Fourier được sử dụng như các bộ lọc phi tuyến tổng hợp Các kết quả thí nghiệm đó cho thay cóc bộ lọc phi tuyến trên mặt phẳng Fourier có thê thực thi tốt công việc ngay cả trong trường hợp có nhiều loại nhiễu khác nhau Hàm ECP-SDEF bậc k đó được sử dụng và phát triển trong nhiều ứng dụng thực tế và đó đưa lại những kết quả đáng tin cậy Vì

vậy, tụi xin phộp được sử dụng kết quả của thuật toán này đưa vào chương trình xử lý

ảnh của mạch nhằm đưa ra một giải pháp cho công việc xử lý ảnh

3.3 Thuật toán Kth_law ECP-SDEF (equal-correlation-peak synthetic

discriminant function) tam dịch là hàm phân biệt và tổng hợp ảnh tuân theo tỉ lệ

tương quan

Đặt s¡(x.y),s;¿(x.y) su(x,y) để biểu điễn cho N bức ảnh được chọn Đặt P là tổng số pixel của mỗi bức ảnh Thay cho một ma trận biểu diễn một bức ảnh ta sử dụng một khái niệm vector cú trật tự lexico* Mỗi vector cột gồm p phan tử đại diện cho mỗi bức ảnh bằng cách tái sắp xếp các hàng trong ma trận Các phân tử của vector được sắp xếp từ trái qua phải và từ trên xuống dưới Tiếp đến chúng ta sẽ xây dựng

một bức ảnh dữ liệu mẫu S có vector s; là cột thứ i của nó Khi đó S sé là một ma trận kích thước PxN Khi đó, một bộ lọc tổng hợp có trật tự lexico h(x,y) được biểu diễn

bởi công thức:

h=S(S*S}c (3.3.1)

Trong đó:

S” là ma trận chuyên vị phức liờn hợp của S

Trang 14

Vector c chứa giá trị tương quan chéo mong muốn lớn nhất cho mỗi bức ảnh C* là vector phức liên hợp của c Trong miễn tần số, (1) trở thành: A A(/A+A N1 h= 8 ) c (3.3.2)

ký hiệu ^ biểu diễn cho biến đổi Fourier Khi đó bộ lọc phi tuyến

tông hợp h đạt được bang cách thay % ở (3.3.2) bởi S* Với S* là một ma trận phi

tuyến đối với mỗi phần tử Toán tử tuyến tính biểu diễn cho phần tử của hàng thứ r và A cột thứ l của ma tran S* duoc định nghĩa bởi: ISa|*exp($sa) Đồng thời, bộ lọc bậc k tuân theo hàm ECP-SDF được xác định bởi công thức: + oA “1 h* -si|(s) # c* (3.3.3)

3.4 BIEN DOI FOURIER ROI RAC

Việc phân tích tín hiệu rời rạc theo thời gian trong miền tần số thường được thực hiện rất hiệu quả và tiện lợi băng bộ vi xử lý tín hiệu số Bộ vi xử lý này có thể là máy tính được sử dụng cho các mục đích chung hoặc là một thiết bị số chuyên dụng

Đề thực hiện việc phân tích này, tín hiệu rời rạc theo thời gian {x(n} cần được chuyển

từ miền thời gian sang miễn tần số tương ứng thông qua bién déi Fourier X (w) của

Trang 15

Đề tránh nhược điểm nêu trên có thê đưa ra một cách biểu diễn khác của {x(n}

— biểu diễn thông qua việc lây mẫu phô X (@) của tín hiệu Như vậy, từ biểu diễn của

tín hiệu trong miền tần số liên tục ta đã đưa đến biến đổi Fourier rời rạc (DFT) Biến đổi này là một công cụ rất hiệu quả trong việc phân tích các tín hiệu rời rạc theo thời gian

3.4.1 Lấy mẫu trong mién tan sé va bién déi Fourier roi rac

Trước khi nghiên cứu DFT, ta hãy xét việc lẫy mẫu của biến đổi Fourier đôi với

dãy tín hiệu rời rạc theo thời gian không tuần hoàn và qua đây có thể thiết lập được quan hệ giữa biến đổi Fourier đã được lây mẫu và DFT

* Lấy mẫu trong miền tan số và khôi phục lại tín hiệu rời rạc theo thời gian

Chúng ta đã biết rằng mọi tín hiệu khơng tuần hồn có năng lượng hữu hạn đều có phô liên tục Hãy xét một tín hiệu khơng tuần hồn rời rạc theo thời gian x (n) với

biến đôi Fourier:

X (@) = > xterm (3.4.1)

Gia str tin hiéu X (w) được lấy mẫu tuần hoàn và khoảng cách giữa hai lần lẫy

mẫu liên tiếp là bằng nhau và bằng ồo radian Bởi vì X (@) là tuần hoàn với chu kỳ 2m

do vậy chỉ cần xét đến các mẫu được lẫy trong miền tần số cơ bản Nếu chọn khoảng

tần số cơ bản là 0 < œ < 2œ và số lượng mẫu được lấy trong khoảng này là N thì

khoảng cách giữa các lần lẫy mẫu sẽ là ồœ = 2z/N — xem hình 4.1 Nếu đánh giá (3.4.1) tại œ = 2xk /N, ta nhận được:

xH] =Š x(@)£2”'"k=0,1, ,N-I (3.4.2)

và đây chính là n mẫu được lẫy của X (œ)

Ta hãy chia tổng trong (3.4.2) thành một số lượng vô hạn các tổng, trong đó

Trang 16

Nếu chỉ số n của tổng bên trong được thay đổi thành n - IN và vị trí của hai tổng được thay đổi cho nhau ta sẽ nhận được kết qua sau: 27 N-1 00 - x =S| #xø-N) 2e (3.4.3) n=0 |_[=-00 với k=0,1,2, ,N-1 Tín hiệu: x„(@œ)=Š'x@~—IN) (3.4.4)

là tín hiệu nhận được do sự xếp chồng của vô tín hiệu x (n) đặt lệch nhau một chu kỳ là N Rõ ràng rằng Xp (n) 1a tin hiệu tuần hoàn với chu kỳ cơ bản là N và do vậy nó có thể được khai triển qua chuỗi Fourier bằng công thức sau: N¬I x, (m=) cern ,n=0,1, , N-1 (3.4.5) k=0 voi cac hé so: hiện! Ch =x, ere ,k=0,1, , N-1 (3.4.6) n=0 Bằng cách so sánh (3.4.3) với (3.4.6) ta sẽ có: c, = 4( 77k), k=0, 1, N-1 N N (3.4.7) Từ đâu suy ra: 1 Lf 2z ;2.akn/ N _ x,(n=—> xX ——k |e’ ,n=0,1, , N-1 (3.4.8) N= LN

Quan hệ được đưa ra bởi (3.4.8) chính là công thức cho phép khôi phục lại tín hiệu tuần hoàn x; (n) từ các mẫu của phố X (œ) Quan hệ này, tuy vậy vẫn không đảm bảo được răng x (n) hoặc X (œ) có thể được khôi phục từ các mẫu hay không Để dam bảo được điêu này cân phải xem xét thêm quan hệ giữa x (n) va x, (n)

Trang 17

thê xem x (n) là một đãy có độ dài hữu hạn với các giá trị khác không trong khoảng 0 <n <L-1 Có thể đưa ra nhận xét rằng khi N >L thì:

X (n) = xX, (n), 0 <n <N-1

vì vậy x (n) có thể được khôi phục từ x; (n) mà không có sự sai lệch Mặt khác nếu N < L thì sẽ không có khả năng khôi phục x (n) từ x; (n) do có sự tùm tín hiệu trong miền thời gian

Từ kết quả thu được ở trên ta suy ra phổ của tín hiệu khơng tuần hồn rời rạc

theo thời gian không tuần hoàn với độ dài hữu hạn L có thể được khôi phục một cách

chính xác thông qua các mẫu của nó tại các tần số œ„ = 2xk/N nếu N > L Quá trình

này được thực hiện trước hết bằng việc xác định x; (n), n = 0, 1, 2, , N-1 thông qua

công thức (3.4.8) Khi N > L thì x(n) được xác định thông qua x,(n):

x(n) = \e ov 0<n<N-I (3.4.9)

với các giá trị khác của n

và do vậy:

s(n) = YX Za eres O<n<N-l (4.1.10) Noe N 5 ¬ ¬ - oie

Nếu sử dụng công thức (3.4.1) và thay thế x(n) bằng (3.4.10) ta nhận được:

N-1 ] ®2 27

X(o)= >| —Y =r yen X| kk le? le”

>> ly lÑ —~ (4.1.11)

k=0 N n=0

Trang 18

Như vậy, có thể thấy cũng giống như trường hợp tín hiệu liên tục theo thời gian,

X(ø) có thê được xác định thông qua các mẫu X(2zk/N) của nó thông qua công thức

nội suy (3.4.12), với k = 0, 1, 2, , N-1 Điểm khác biệt ở đây là ở chỗ P(ø) không có đạng của (sinÐ)/0 mà thay vào đó nó sẽ phụ thuộc vào tính chất tự nhiên của X(øœ) Độ lệch pha trong (3.4.12) phản ánh tính chất của tín hiệu x(n) — nhân quá và là dãy có

độ dài hữu hạn N Đồ thị sin(œ@N/2)/(Nsin(œ/2) được thê hiện trên hình 4.3 với N = 5

Có thê thay rang ham P(@) có đặc tính:

27 1, k=0

P| —k |=

Gi % k =1,2, ,N —1 (3.4.14)

Và do vậy theo công thức nội suy (3.4.13) thì các giá tri cha X(œ) sẽ được xác định chính xác bằng các giá trị mẫu X(2kn/N) với œ = 2zk/N Ở tại các tần số khác, công thức nội suy sẽ cho phép xác định X(œ) thông qua tô hợp tuyến tính có trọng số

của các mẫu phô

* Biến đôi Fourier rời rạc (DET)

Phần 4.1.1 đã xem xét việc lấy mẫu trong miền tần số của tín hiệu khơng tuần hồn x(n) với năng lượng hữu hạn Trong trường hợp tông quát, các mẫu được lay

cách đều nhau theo tần số X(2zk/N), k = 0, 1,2, , N-1 sẽ không cho phép khôi phục

tín hiệu gốc x(n) có độ dài vô hạn Thay vào đó các mẫu này sẽ tương ứng với day tuần hoàn Xp(n) voi chu ky N Ở đây x;(n) là tín hiệu xấp xỉ của x(n) và quan hệ của chúng được biểu diễn qua công thức:

x,(n) = 5 x(n-IN) (3.4.15)

j=-œ

Khi day x(n) co độ dài hữu hạn L < N thì x;(n) đơn giản chỉ là sự lặp lại có chu kỳ của x(n) và trong một chu kỳ đơn thì x;(n) sẽ được xác định bởi:

ss(= 10 O<n<L-l

0, L<n<N-1 (3.4.16)

Trang 19

Một điều quan trọng cần lưu ý là các giá trị không được đưa thêm vào sẽ không

cung cấp thêm bất kỳ một thông tin nào về phố X(@) của dãy x(n) và để có thể khôi phục lại X(œ) có thể sử dụng công thức (3.4.13) với L mẫu được lẫy cách đều nhau của X(œ) Tuy vậy việc đưa thêm N-L không vào x(n) và tính N điểm DFT sẽ làm cho

đồ thị của biên đôi Fourier trở nên tôt hơn

Nói tóm lại, đãy số x(n) với độ dài hữu hạn L (nghĩa là x(n) = 0 với n < 0 và n > L) có biến đổi Fourier:

L-1

X(@)=Ð x(n)e ”", 0<ø<2z (3.4.17)

n=0

Khi việc lay mau cua X(w) được thực hiện ở các tần số cách đều nhau œy =

2nk/N, k= 0, 1,2, , N-1 voi N>L thi cdc mau nhan duoc sé là: £-1 X(k)= x( 7%) = Y x(nje 7% N n=0 N-1 XŒ&)=Ð _x(me *, k =0,1,2, ,N—-1 n=0

Đề cho thuận tiện thì trong công thức này chỉ số trên của tổng được tăng từ L - llênN- I1 bởi vì x(n) =0 khin >L

Quan hệ (3.4.18) chính là công thức dùng để biến đổi dãy {x(n)} với độ dài L < N thành đãy của các mẫu tần số {X(k)} với độ dài N Bởi vì các mẫu tần số nhận được bằng cách đánh giá giá trị của biến đôi Fourier X(@) tại N tần số rời rạc cách đều nhau đo vậy quan hệ (3.4.18) được gọi là biến đổi Fourier rời rạc (DFT) của x(n) Ngược lại quan hệ (3.4.18) sẽ cho phép khôi phục dãy x(n) từ các mẫu tần số Biểu thức:

1 N-I

x(m)=—3_X(Œ)e?m^ n=0,1, , N—I

N 4

được gọi là biến đôi ngược DFT (IDFT) Rõ ràng, khi x(n) có độ dài L < N thì IDFT với N điểm sẽ có x(n) = 0 với L<n <N - 1 Như vậy các công thức của DFT và IDFT sẽ là:

NI

DFT:X() =3 _x(ne "Š, k=0,12, ,M-—I1 (3.4.18)

Trang 20

1 N-1

IDFT: (7) = Wy ak ee n=0,1, ,N-1 (34.19)

k=0

3.4.2 Biến đổi Fourier nhanh FFT:

Do vai trò quan trọng của DFT trong nhiều lĩnh vực khác nhau nên việc tính toán hiệu quả của DFT là một bài toán được rất nhiều nhà toán học, kỹ sư v.v dành nhiều thời gian để nghiên cứu Phần này sẽ trình bày một số phương pháp khác nhau để thực hiện việc tính toán DFT một cách hiệu quả hơn

Như ta đã biết, DFT của dãy x(n) với độ dài hữu hạn N được xác định thông

qua công thức sau:

N-1

X(k) =>) x(n)W,", 0<k<N-1 (5.1.1)

n=0

voi: Wy =e “/x (5.1.2)

Trong trường hợp tông quát thì đữ liệu của dãy {x(n)}sẽ có giá trị phức Phép biến đôi Fourier rời rạc ngược (IDFT) của X(k) 1a:

1 N-1

x(n) ==— 2 XW" O0<n<sN-1 (5.1.3)

k=0

Do các biểu thức (5.1.1) và (5.1.3) chỉ khác nhau ở dấu của số mũ W và ở hệ số tỷ lệ 1/N nên mọi lý luận về cách tính của IDFT đều giống với cách tính DFT

Có thê thấy trong công thức tính DFT, đối với mỗi giá trị của k thì việc tính trực tiếp XŒ) sẽ đòi hỏi N phép nhân số phức (4N phép nhân số thực) và N-1 phép cộng số phức (4N-2 phép cộng số thực) Như vậy để tính N giá trị của DFT thì cần phải sử dụng 4N phép nhân thực và N(4N-2) phép cộng thực hay N” phép nhân phức và NŸ - N phép cộng số phức

Việc tính toán DFT sẽ hiệu quả hơn nếu ta sử dụng một số tính chất quan trọng

của hệ số pha Wx Các tính chất này bao gồm:

Tính đối xứng: Wien’? —_pe (5.1.4)

Tính tuầnhoàn We'" =W; (5.1.5)

Trang 21

CHƯƠNG 4

XU LY ANH VOI MATLAB

4.1 Giới thiệu về MATLAB

MATLAB là ngôn ngữ lập trình bậc cao dùng cho kỹ thuật Đồng thời nó là môi trường tương tác có thê thực hiện nhiều nhiệm vụ: phát triển giảI thuật, phân tích đữ liệu, tính toán các phép tính số học và hình ảnh hóa đữ liệu So với các ngôn ngữ lập

trình truyền thống như C, C++ hay Fortran thì MATLAB có nhiều ưu điểm hơn do

được tích hợp các hỗ trợ rất mạnh

MATLAB được sử dụng trong nhiều lĩnh vực ứng dụng bao gồm: sử lý tín hiệu và hình ánh, truyền thông, thiết kế điều khiển, kiểm tra và đo lường, phân tích và mô hình hóa các thông tin tài chính, tính toán trong hóa sinh Ngoài ra, MATLAB còn được tích hợp các hộp công cụ (mỗi hộp gồm hệ thống các hàm có những chức năng đặc biệt của MATLAB) nhằm giảI quyết các lớp vẫn đề cụ thê trong các lĩnh vực ứng dụng khác nhau

MATLAB cung cấp nhiều đặc tính tiện lợi đối với việc xử lý và chia sẻ công việc Trong quá trình làm việc với MATLAB, các đoạn mã của nó có thê được tích

hợp với các ngôn ngữ và ửng dụng khác

4.1.1 Các đặc điễm co ban cia MATLAB:

* Là ngôn ngữ bậc cao dùng cho các tính tốn kỹ thuật * Là mơi trường phát triển để quản lý đữ liệu

* Gồm nhiều công cụ tương tác cho việc khai thác và xử lý dữ liệu, thiết kế và

giảI quyết vẫn đề

* Các hàm đồ thị đối với ảnh 2 hoặc 3 chiều cho phép hình ảnh hóa dữ liệu * Chứa các công cụ để xây dựng các giao diện đồ thị của người sử dụng

* Gồm nhiều hàm chức năng dựa trên các giải thuật cơ sở nhăm tích hợp

MATAB với các ứng dụng và ngôn ngữ lập trình khác như: C,C++, Fortran, Java,

Trang 22

4.1.2 Phát triển giải thuật và ứng dụng

MATLAB là một ngôn ngữ bậc cao được tích hợp các công cụ phái triển giúp

người sử dụng phát triển và phân tích các giảl thuật và ứng dụng một cách nhanh chóng

Ngôn ngữ lập trình MATLAB:

Ngôn ngữ lập trình MATLAB hỗ trợ các phép toán đối với ma trận và vec-tơ cơ sở cho các vẫn đề kỹ thuật và khoa học

Việc lập trình và phát triển giảI thuật trong MATLAB có tốc độ nhanh hơn so với các ngôn ngữ lập trình truyền thống do MATLAB bỏ qua các công việc điều khiển bậc thấp như khai báo biến, khai báo mẫu đữ liệu và xác định vùng nhớ Trong nhiều trường hợp, MATLAB còn bỏ qua cá sự cần thiếp của các vòng lặp “for” Kết quả là, một dòng lệnh được viết trong MATLAB có thê tương đương với nhiều dòng lệnh trong C hay C++

Là một công cụ lập trình mạnh, MATLAB vẫn hỗ trợ những đặc tính của một

ngôn ngữ lập trình truyền thống như: toán tử số học, cấu trúc vòng, các cấu trúc và

dạng dữ liệu cùng đặc tính gỡ tối

VD: Chương trình biểu diễn thuật toán điều chế tín hiệu truyền thông tạo ra 1024 điểm, thực hiện điều chế, thêm nhiễu phức Gauss và vẽ lại kết quả

Trang 23

axix([-2 2 -2 2]); axis square, grid; 15 + + ĐC * e+ © & ‘ - 1 š + + +, * - ew =Ì + xẻ gene ite Về + + + A ane tu + + sai ar se ệ 13 * % +4 + + 05L si ` và + + hở + + a 7 +e? Stags + cn, os s24 ia Spee * + 2 “`, ies + ++ + of +4 oe A eet + Vy ++ MASTS hy a về cv “thes styts ** -.' ơa ` + + a ô+ i ee #, TH 2% _ & eS eee + Sẻ + + +e tt a

= tế Fico tt 2 eee eek « st + eee + tee + “ Etec, f my at + tet *% Vg See 2 re th + ge ste a + + + + + + * * AS 1 1 I 1 Ị 1 I I Ị -2.5 2 15 0.5 0 0.5 1 15 2 2h ` Hinh 4.1

Trong khi đối với phân lớn các ngôn ngữ lập trình truyền thống phải trải qua giai đoạn dịch (compilation) và liên kết (linking) thì MATLAB cho phép người sử dụng có thể thực thi ngay các lệnh hoặc nhóm lệnh cùng lúc Điều này làm cho tốc độ xử lý trên MATLAB nhanh hơn đáng kế so với trên các ngôn ngữ truyền thống

4.1.3 Phân tích và tiếp cận dữ liệu:

Trong quá trình phân tích dữ liệu, MATLAB hỗ trợ hầu hết các công đoạn như: thu nhận dữ liệu từ thiết bị ngoại vi, các phân tích số học, tiền xử lý, hình ảnh hóa

Phân tích dữ liệu:

Chương trình MATLAB cung cấp các công cụ tương tác cũng như các hàm điều khiển theo dòng cho việc tính toán trong phân tích dữ liệu bao gồm:

* Các phép nội suy * Trích chọn tính chất * Chọn ngưỡng và lọc nhiều

* Tương quan, phân tich Fourier va loc

Trang 24

4.1.4 Tiếp cận dữ liệu

Việc tiếp cận dữ liệu từ các thư mục, ứng dụng, cơ sở dữ liệu và thiết bị ngoại vi boi MATLAB 1a hét strc dé dang MATLAB hé tro nhiéu loai dinh dang file: ASCII, nhị phân, các file hình ảnh và âm thanh hay tham chi cac file dinh dang HDF

Trong MATLAB co nhiéu hộp công cụ (toolbox) hỗ trợ cho việc tiếp cận dữ liệu

như: hộp công cụ cơ sở dữ liệu (Database Toolbox), hộp công cụ thu nhận dữ liệu (Data Acquisition Toolbox) hay hộp công cụ điều khiến thiết bị (Instrument Control Toolbox)

4.1.5 Hình ảnh hóa dữ liệu

Tắt cả các đặc tính về hình ảnh cần thiết cho hình ảnh hóa các dữ liệu khoa học kỹ thuật đều được tích hợp trong MATLAB Những đặc tính này bao gồm: các hàm vẽ

ảnh 2 và 3 chiều, các hàm vẽ thê tích 3 chiều, các công cụ tương tác tạo ảnh, khả năng xuất kết quá dưới các dạng file ảnh thông thường

Trang 25

4.1.6 Xuất kết quả và triển khai ứng dụng

MATLAB đưa ra nhiều đặc tính giúp báo cáo và chia sẻ công việc Các đoạn code viết trên MATLAB có thể được tích hợp với các ngôn ngữ và ứng dụng khác Đồng thời cũng có thể triển khai các thuật toán cũng như ứng dụng của nó như một chương trình hoặc các khối phần mềm riêng biệt

Xuất kết quả:

Sau khi hoàn thành công việc, người sử dụng cần xuất kết quả ra thường là dưới

dang hình ảnh hoặc báo cáo MATLAB có hỗ trợ file hình ảnh với nhiều định dạng

khác do đó việc xuất kết quá dưới dạng đồ thị hay fñle ánh là hết sức dễ dàng Ngoài ra, nếu muốn thì cũng có thể chuyển code từ MATLAB ra cdc dạng khác: HTML,

Word, Latex

Kết hợp mã MATLAB với các loại ngôn ngữ và ứng dụng khác:

MATLAB cung cấp sẵn các hàm cho việc kết hợp mã của các ngôn ngữ lập trình khác như C, C++, Fortran hay Java với mã chương trình của nó Sử dụng thư viện công cụ(engine library) của MATLAB, người sử dụng có thể gọi các đoạn mã từ C, C++ hay Fortran

Triển khai ứng dụng:

Các sản phẩm sau khi xử lý băng MATLAB thường là các đoạn mã Các đoạn mã này có thê được cung cấp cho những người khác hoặc ứng dụng vào các sản phẩm phần cứng hoặc phần mềm cụ thể

4.2 Xử lý ảnh bằng MATLAB 4.2.1.Ảnh trong MATLAB

Trong MATLAB, dữ liệu chủ yếu được lưu trữ theo cấu trúc mảng (tập có thứ tự gôm các phần tử số thực hoặc phức) Ảnh trong Matlab cũng được lưu trữ bởi các mảng phân tử với các giá trị lưu trữ có thê là mầu, cường độ của ảnh

Hầu hết các ảnh được MATLAB lưu trữ dưới dạng các máng 2 chiều (VD: ma

trận) Trong các mảng 2 chiều này, mỗi phần tử tương ứng với một pixel và thường được biểu điễn bởi một điểm trên màn hình máy tính(VD: Một bức ảnh có 500 hàng và 700 cột gồm nhiều điểm mẫu khác nhau được lưu trữ bởi một ma trận có kích thước 500x700) Một số bức ảnh, như ảnh mẫu đòi hỏi phảI được lưu trữ bởi mảng ba chiều

Trang 26

và mặt phăng còn lại biêu diễn cho cường độ màu xanh da trời (blue) của phân tử Với

việc lưu trữ các ảnh dưới dạng mảng, việc xử lý ảnh với dữ liệu được lưu bởi dạng ma

trận nào đêu được thực hiện rât thuận tiện

4.2.2.Hộp công cụ xử lý anh (image processing toolbox):

Matlab có thể xử lý cũng như lưu trữ các bức ánh dưới nhiều định dạng khác nhau: BMP, HDF, JPEG, TIFF Dù vậy tất cả các định dạng này đều được quy chuân về 4 dạng cơ bản: nhị phân (Binary), được gán chỉ số (Indexed), mức xám (Grayscale), RGB (RGB hay truecolor) Các định dạng ảnh này sẽ qui định cách mà Matlab biên dịch các phần tử của ma trận dữ liệu (VD: các giá trị cường độ phần tử)

* Ảnh dạng mức xám (gray scale image):

Ảnh loại này được biểu diễn bởi một ma trận mà mọi phần tử của nó đều biểu diễn một giá trị sáng/tối của điểm ảnh ở vị trí tương ứng Có 2 cách để biểu diễn giá trị thể hiện mức độ “'xám' của một pixel: dạng double và dạng uint8 Dạng double gan cho mỗi pixel một giá trị động thuộc khoảng (0,1): giá trị 0 ứng với màu đen còn 1 ứng với màu trắng Dạng uint§ gán cho mỗi pixel một giá trị từ 0 đến 255 thê hiện độ sáng

(brightness): giá trị 0 tương ứng với màu đen còn 255 ứng với màu trắng Mỗi bức

ảnh lưu trữ đưới dạng uint8 chỉ chiếm 1/8 không gian nhớ so với lưu trữ dưới dang

double Mặc dù vậy, đơI khi thuật tốn hoặc các ứng dụng chỉ có thê giảl quyết với

dạng double

* Ảnh kiểu nhị phân:

Mỗi bức ảnh dạng này được lưu trữ bởi một ma trận trong đó mỗi phần tử của ma

trận chỉ có thể có giá trị hoặc 0 (đen) hoặc 1 (trắng) * Ảnh được gán chỉ số:

Đây là một cách thông dụng để biểu diễn các bức ảnh mầu Một bức ảnh được

gán chỉ số được lưu trữ bởi 2 ma trận Ma trận thứ nhất có cùng kích cỡ với bức ảnh và

chứa giá trị thứ nhất của mỗi pIxel Ma trận còn lại được gọi là ma trận màu (color

map) và có kích cỡ có thể khác so với kích cỡ của bức ảnh Các chỉ số ở ma trận thức

nhất cho ta biết số nào sẽ được biểu diễn bởi ma trận màu, * Ảnh dạng RGB:

Các ảnh RGB được Matlab lưu trữ bởi 3 ma trận chứa các kích cỡ ứng với định

Trang 27

cây (Green), xanh da trời (Blue) Đồng thời giá trị mỗi phần tử của ma trận sẽ thể hiện

cường độ từng loại mẫu tại mỗi pixel

* Các lệnh chuyên đôi trong Hộp công cụ xử lý ảnh:

Lệnh ditherQ : chuyên các định dạng khác sang dạng nhị phân

Lệnh Gray2ind(): chuyén tir dang Gray sang indexed

Lénh ind2gray(): chuyén tir dang indexed sang Gray

Lénh ind2rgb(): chuyén tir dang indexed sang RGB

Lệnh mat2gray(): chuyén một ma trận thông thường dạng gray bởi hàm tỉ lệ Lệnh rgb2gray(): chuyên dạng RGB sang dạng Gray

Lệnh rgb2indQ: chuyên dạng RGB sang dạng Indexed

* Doc file anh trong Matlat

Matlab không xử lý trực tiếp bức ảnh mà làm việc thông qua việc chuyên đôi ảnh về dạng (các) ma trận chứa các thông số của nó Thực chất việc xử lý ảnh trong Matlab chính là xử lý các thông số của ma trận Các lệnh cơ bản nhất của xử lý ảnh trong

Matlab chính là các lệnh đọc ghi

Lệnh 1Imread() nhập một bức ảnh vào trong workspace (không gian làm việc) của Matlab Lúc này xử lý bức ảnh tương đương với việc xử lý biên được gắn cho nó

VD: image=imread(‘picture.jpg’); % gán ảnh có tên picture dinh dang jpg cho biên image, bién image được lưu trong workspace

Lệnh imwriteQ chuyên đôi một biến đã được gán cho ảnh thành file ảnh và ghi

nhớ file ảnh đó

VD: imwrite(image,’image.jpg’); % lưu biến image dưới định dạng file ảnh jpg vào thư mục làm việc hiện thời

4.2.3.Hộp công cu thu nh@n anh (image acquisition toolbox):

Hộp công cụ thu nhân ảnh được dùng để thực hiện chức năng thu nhận anh qua các thiết bị được kết nối với máy tính Sử dụng các hàm chức năng của hộp công cụ

này có thê tạo ra một đối tượng thể hiện sự kết nối giữa Matlab và các thiết bị thu hình

Trang 28

Hộp công cụ sử dụng các thành phần được gọi là các bộ thích ứng dùng để liên kết với các thiết bị thông qua các trình điều khiến

Với hộp công cụ thu nhận hình ảnh, ta có thể nối trực tiếp phần cứng ở trong

thanh công cụ và có thể thiết lập các tham số thu nhận đồng thời xem và yêu cầu đữ

liệu ảnh Ngoài ra, ta có thê tiếp cận dữ liệu của Matlab dưới một vài định dạng đồng

thời tạo ra một file AVI

Matlab thông qua hộp công cụ thu nhận hình ảnh hỗ trợ kết nối với nhiều loại thiết bị thu nhận ảnh bao gồm: các thiết bị camera kỹ thuật SỐ chuyên biệt dựa trên kết nối 1394 (DCAM), các thiết bị hỗ trợ kết nối USB (WEB camera, máy quay kỹ thuật

sô, cạc chuyên đôi TV ) MATLAB Image acquisition Toolbox M-file Functions Hardware driver Adaptor CUsB ` Ca > `

USB Frame Firewire

source grabber source Hình 4 Thành phần hộp công cụ thu nhận ảnh 4.2.4.Một số ví dụ về xử lý ảnh với Matlab: VDI:Đọc và hiển thị một bức ảnh

>> I=imread('C:\Documents and Settings\Hoang Anh Nguyen The\My Documents\My Pictures\me\xe_dien1.jpg');%doc file anh tu dong dan

Trang 29

VD2: Chuyển một ảnh RGB sang Gray

Trang 31

CHƯƠNG 5

THUC NGHIEM VA KET QUA

5.1 Nhắc lại bài toán nhận dạng đặt ra ở chương 1:

Cho một tập ảnh mẫu dùng để so sánh và nhận dạng vật, xác định vị trí của mẫu cần nhận dạng trong một bức ảnh chứa mẫu đó Viết chương trình trên Matlab sử dụng bộ lọc ECP-SDF bậc k để giải quyết bài toán

5.2 Thuật toán:

Trong quá trình xử lý và nhận dạng ảnh, “méo? là nguyên nhân gây ra nhiều khó khăn Trong việc phân tích các dạng “méo, những thao tác thường được tiễn hành là: chụp lại một số bưc ảnh trong điều kiện môi trường thực tẾ, lây một

mẫu ảnh làm ảnh tham chiếu dùng cho việc nhận dạng Sau các thao tác này, những bức ảnh có chứa mẫu tham chiếu được chia làm 3 nhóm: nhóm thứ nhất

gôm các bức ảnh chứa mẫu tham chiếu chuẩn, nhóm các bức ảnh chứa mẫu tham chiếu (nhưng không giỗng hệt và chưa được đưa và làm dữ liệu nhận dạng) và nhóm cuối cùng gồm các ảnh không hề chứa mẫu tham chiếu Hình a,b,c thể

hiện các mẫu vật đã được lưu, chưa được lưu và hoàn toàn sai khác với mẫu cần

nhận dạng Việc lọc phi tuyến trong xử lý ảnh được bắt đầu bằng việc gán mẫu

tha chiếu vào trung tâm của một bức ảnh có nền đen hoàn toàn (các pixel của

nền bức ảnh có giá trị 0) Hình thể hiện một ví dụ về mẫu tham chiếu được

dùng đề lập nên các bộ lọc phi tuyến

Trang 32

bằng cách biến đổi Fourier toán tử phi tuyến của phương trình (4.1.3) với các thông số lấy từ mẫu tham chiếu Hình dưới đây mô tả các bước tiễn hành tông hợp một bộ lọc phi tuyến tông hợp Bộ lọc phi tuyến tổng hợp này đạt được bằng cách áp dụng phương trình (4.1.8) với hệ số k tùy thuộc mức độ biến đổi theo tỉ lệ của vật Trong chương trình, ta sử dụng k=0.l bởi thực nghiệm đã chứng tỏ giá trị này của k cho kết quả tương quan theo độ nét, khả năng phân

biệt và sự bất biến theo độ sáng là tốt nhất Bién d6i Fourier Các tính toán phi tuyến Tổng hợp các bộ lọc Biên đôi Fourler ngược

5.3 Chương trình nhận dạng vật bất biến theo tỉ lệ: VDI: Nhận dạng chữ E bằng bộ lọc phi tuyến đơn

Mẫu tham chiếu:

=

Trang 33

| HAVE HIDDEN A FEW LETTERS IN THIS TEXT THEY ARE THE 5TH AND 8TH LETTERS OF THE ALPHABET FIND THEM USING STANDARD COREREELATION GOOD LUCK!

Két quả thu được với bộ lọc phi tuyến đơn:

Trang 34

VD2: Nhận dạng với bộ lọc phi tuyến tông hợp

Mẫu tham chiếu:

Trang 35

5.4 Đánh giá kết quả thu được:

Qua các ví dụ minh họa ở phần trước tôi đã trình bày kết quả đạt được của phương pháp nhận dạng vật với bộ lọc phi tuyến: đơn và tổng hợp Với bộ lọc phi tuyến đơn mỗi lần chỉ cho phép nhập một mẫu tham chiếu và việc nhận dạng chỉ là nhận dạng riêng mẫu tham chiếu đó Trong khi đó, bằng việc sử dụng bộ lọc ECP-SDF

bặc k thay vì mỗi lần chỉ nhập được mọt mẫu tham chiếu ta có thể nhập được nhiều

mẫu tham chiếu Về mặt ý tưởng, điều này có vẻ là không khó để thực hiện tuy nhiên

các bộ lọc phi tuyến tông hợp thông thường thường phải đối mặt với vẫn đề thời gian xử lý do khối lượng các phép tính toán thường là rất lớn Với bộ lọc phi tuyến ECP- SDF bậc k, ta đã giải quyết được phần nào vấn đề về thời gian xử lý Đồng thời bộ lọc cũng nêu lên một giải pháp khả thi đối với việc nhận dạng vật thê khi nó được đặt ở các vị trí khác nhau (với điều kiện có đủ mẫu tham chiếu) Đối với nhận dạng nhiều vật thể trong cùng một bức ảnh, khi có đủ mẫu tham chiếu ta cũng quy về giỗng như VIỆC giải quyết vân đề nhận dạng vật dược dặt ở các vị trí khác nhau Thêm vào đó, bộ lọc ECP-SDF bậc k cũng giải quyết được khá hiệu quả van dé nhận dạng vật khi có

các thành phần tác động dẫn tới hiện tượng “méo? ở mẫu vật như: vật trong bức ảnh bị

Trang 36

Trong quá trình thực hiện các thí nghiệm và chạy chương trình, do nhiều yếu tô

khách quan cũng như chủ quan tác động nên kết quá thu được chưa phải là lý tưởng

Các yếu tố này bao gồm:

* Chất lượng của camera dùng để tiến hành thí nghiệm không phải là cao Do đó

khi ta thực hiện bắt ảnh thường bị nhiễu và chất lượng hình ảnh không tốt

* Điều kiện tiến hành thí nghiệm không lý tưởng: điều kiện về độ sáng, độ chói, goc quay

* Các bước tiền xử lý đang còn đơn giản do đó chưa hỗ trợ tốt cho quá trình xử lý ảnh

* Thuật toán giải quyết vẫn đề chưa phải là lý tưởng (do không có đối sánh) dẫn đến việc xử lý chưa đạt được tối ưu

Các biện pháp khắc phục:

* Dùng camera có chất lượng tốt hơn

* Thực hiện các kỹ thuật tiền xử lý: tách đường bao, tăng độ sắc nét, lọc nhiễu bằng các loại bộ lọc có hiệu quả cao

* Tối ưu hóa giải thuật và chương trình 5,5 Các ứng dụng có thé 4p dụng:

Xử lý ảnh là một lĩnh vực còn mới mẻ và đang trong quá trình phat triên mạnh mẽ Các ứng dụng của xử lý ảnh là hết sức thiết thực và cần thiết trong nhiều lĩnh vực

Áp dụng bộ lọc ECP-SDF bậc k có thê giúp ta giải quyết nhiều bài toán trên nhiều lĩnh

vực như:

* Nhận dạng các biển báo giao thông để thông báo lại cho những người tham gia điều khiển giao thông

* Nhận dạng sản phẩm trong dây chuyền sản xuất tự động

Trang 37

MỤC LỤC

09)0€).989:000007 1

051019))/0ãỎỒŨỖŨỶ 2

//05271000110157Ẻ 2

1.1 Bài toán nhận dạng vật thể và mục đích của luận văn - 2-5-5: 2 1.2 Tổ chức luận văn - G2 St SE S113 8 13893818 1881858151135 15513 11 3E Ererrsera 2

0:i0/9))/622115 5 II 4

TONG QUAN VE XU LY ANH - NHẬN DẠNG VẬTT THỂ 4

2.1 Xử lý ảnh (số) và các khái niệm liên quan: .- 2+2 2 s + s+szx+scs£ 4

2.1.1 Xử lý ảnh (SỐ) << CS SH1H TH T HT TT rưp 4

2.1.2 Các khái niêm liên quaHi: 2222333 9 1 51 5511111111111 rre 4 2.1.3.Nhận dạng và phân loại anh (recognition and classification of image 24/2017 a 7 1.Phương pháp phân loại dựa trên việc thu nhận có giám sát(supervised 618m 7< 9 2.Phương pháp phân loại sử dụng các kỹ thuật không cần giám sát(nonsupervised Ïe€arn1ng)) - - - - - cc 111111111211 1111190 11111111 1k rkg 9 CHUONG B 1 5 10 NHẬN DẠNG VẬT BẰNG XỬ LÝ ẢNH ¿7:cc+cccrsrerrrrrrrree 10

3.1.Tương quan tuyến tính và tương quan phi tuyến - 5-2 55552 10 3.2 Các kỹ thuật lọc phi tuyến trong nhận dạng theo ti 16 . - 12 343 Thuật toán Kth law ECP-SDF (equal-correlation-peak synthetic discriminant function) tạm dịch là hàm phân biệt và tổng hợp ảnh tuân theo tỉ

5n: 0107 aag 13

3.4 BIẾN ĐÔI FOURIER RỜI RẠC 2G e1 S2 S3 SE SE EeESsEEzereeseed 14

Trang 38

3.4.2 Biến đổi Fourier nhanh FFT: + te E2 SE SE E2 E SE E SE E2 Eczz£zzst 20 510/90/6 1 21

XỬ LÝ ẢNH VỚI MATTLAB -. -:-52+2t +22 2Et2E+EEEEEveErrkrrkrrkrrerkervee 21

4.1 Giới thiệu về MATLAB 5+2 22 tri 21

4.1.1 Các đặc điểm cơ bản của MATLAEB:: 2 cc SE S213 ESsE se esesd 21

4.1.2 Phát triển giải thuật và ứng dụng .-. - << sex verreekred 22 4.1.3 Phân tích và tiếp cận dữ liệu: - - Ăn nS nh sen 23

4.1.4 Tiếp cận đữ liệu - s1 E11 TT TT HT re gvreở 24

4.1.5 Hình ảnh hóa dữ liệu - - CĐ S SE SH ky se kvxa 24

4.1.6 Xuất kết quả và triển khai ứng dụng . ¿2222 c2: 25 4.2 Xử lý ảnh bằng MA TLAB - - EEEE*E£EExEE SE cvctcvcgvrkrkrki 25

4.2.1.Ảnh trong MATTLA - - - St S333 ST SE E11 x11 1y, 25

4.2.2.Hộp công cụ xử lý anh (image processing toolbox): 26 4.2.3.H6p cong cu thu nhan anh (image acquisition toolbox): 27

4.2.4.Một số ví dụ về xử lý ảnh với Matlab: . 5-5 56s c+c+zeeced 28

:i0/9)/65 1= 3]

THỰC NGHIỆM VÀ KẾT QU Ả - <9 SE sgk cvgvevrerxe 31

5.1 Nhắc lại bài toán nhận dạng đặt ra ở chương Ì: «««- 31

5.2 Thuật tOáT: - - -Ă C0 Ơn ng ng ven 31

5.3 Chương trình nhận dạng vật bất biến theo tỉ lệ: - 2s se sec: 32

Ngày đăng: 02/12/2017, 21:07

TỪ KHÓA LIÊN QUAN

w