Phát hiện biên, biểu diễn fourier elliptic và ứng dụng

Trang 1

`

Trang 2

ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN

Trang 3

CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN 3

1.1 Một số khái niệm cơ bản trong xử lý ảnh 3

1.1.1 Xử lý ảnh 3

1.1.2 Quá trình thu nhận, biểu diễn và lưu giữ ảnh 3

1.1.3 Histogram của ảnh 7

1.1.4 Nhận dạng ảnh 8

1.2 Biên ảnh và vai trò trong nhận dạng ảnh 9

1.2.1 Khái niệm về biên ảnh và các phương pháp phát hiện biên cơ bản 9

1.2.2 Vai trò của biên trong nhận dạng ảnh 14

1.2.3 Biểu diễn biên dựa trên mô tả Fourier 14

1.2.3.1 Phương pháp dựa trên mô tả Fourier 16

Trang 4

2.1.1 Phương pháp phát hiện biện trực tiếp 22

2.1.2 Phương pháp phát hiện biên gián tiếp 31

2.1.3 Phương pháp phát hiện biên kết hợp 32

2.1.4 Phát hiện biên dựa vào trung bình cục bộ 38

2.1.5 Cải thiện và nâng cao chất lượng biên ảnh 40

2.2 Phép biến đổi Fourier 49

2.2.1 Định nghĩa 49

2.2.1 Elliptic Fourier 50

2.2.3 Biến đổi Fourier rời rạc 55

2.2.4 Các thuộc tính khác của biến đổi Fourier 61

CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM 62

Trang 5

LỜI CẢM ƠN

Trong quá trình làm luận văn thạc sĩ với đề tài “Phát hiện biên, biểu

diễn Fourier Elliptic và ứng dụng”, em đã nhận được nhiều đóng góp và

tạo điều kiện của các thầy cô và đồng nghiệp Lời đầu tiên em xin chân thành cảm ơn tới toàn thể các thầy cô, những người đã giảng dạy em

Đặc biệt, em xin tỏ lòng cảm ơn chân thành và sâu sắc tới thầy thầy Phạm Việt Bình, người đã luôn tận tình hướng dẫn, định hướng, và có những chỉ bảo cặn kẽ em trong thời suốt thời gian qua

Em rất cảm ơn các bạn, các đồng nghiệp đã động viên, khích lệ, cũng như trao đổi tài liệu cho em trong thời gian làm luận văn

Em cũng chân thành mong được sự đóng góp ý kiến của các thầy, các cô và các đồng nghiệp để em có phát triển đề tài trong thời gian tới

Xin chân thành cảm ơn !

Thái Nguyên, ngày 12 tháng 11 năm 2009

Học viên

Phạm Ngọc Quý

Trang 6

Danh mục các ký hiệu, các chữ viết tắt

Trang 7

Danh mục các hình

Hình 1.1 Các giai đoạn chính trong quá trình xử lý ảnh 3

Hình 1.2 Điểm 8 láng giềng và điểm 4 láng giềng 6

Hình 1.3(a) Đồ thị biểu diễn Histogram ảnh 8

Hình 1.3(b) Ảnh gốc 8

Hình 1.3(c) Histogram của ảnh gốc theo RGB và Gray 8

Hình 1.4 Ví dụ chu tuyến của đối tượng ảnh 12

Hình 1.5 Phân loại biểu diễn hình dạng và các kỹ thuật biểu diễn 15

Hình 1.6 Biểu diễn góc quay 20

Hình 1.7 Biểu diễn góc quay trong trường hợp có thay đổi nhỏ 21

Hình 2.1 Mô hình 8 hướng 23

Hình 2.2 Ảnh trước khi dò biên 24

Hình 2.3 Ảnh sau khi dò biên 25

Hình 2.4 (a) Ảnh gốc (b) Đạo hàm bậc nhất (c) Đạo hàm bậc hai 25

Hình 2.5(a) Ảnh gốc (b) Ảnh biên dùng Laplace H1 (a) Ảnh biên H2 27

Hình 2.6 Minh họa biểu diễn biên nhờ các phép hình thái 30

Trang 8

Hình 2.16 Ảnh biên kết hợp phương pháp kết hợp với N =5 37

Hình 2.17 Ma trận điểm ảnh trước và sau lọc 39

Hình 2.18 Các ảnh biên kết quả thu được theo thuật toán đề xuất 39

Hình 2.19 Lấy tổ hợp các điểm ảnh lân cận 41

Hình 2.20 Một số kiểu mặt nạ sử dụng cho kỹ thuật lọc phi tuyến 41

Hình 2.21 Minh họa thuật toán hậu xử lý 46

Hình 2.22 Ví dụ về chain code 51

Hình 2.23 Minh họa sự kết hợp của chuỗi mã 4, 8-láng giềng 52

Hình 2.24 Minh họa chuỗi mã 54

Hình 2.25 Biển đổi xung mẫu 57

Hình 2.26 Ảnh dùng biến đổi Fourier rời rạc 2D 58

Hình 2.27 (a) Ảnh mặt (b) Biển đổi ảnh mặt 60

Hình 2.28 Biến đổi Fourier 2D 61

Hình 3.1 Thuật toán số hóa biên ảnh của đối tượng ảnh 63

Hình 3.2 Thuật toán chaincodeal 64

Hình 3.3 Lá gấc ban đầu 66

Hình 3.4 Lá gấc sau khi Histogram 67

Hình 3.5 Lá gấc sau khi chain code 67

Hình 3.6 (a) Lá gấc trước khi được xử lý 68

Hình 3.6 (b) Lá gấc sau khi được xử lý 68

Trang 10

PHẦN MỞ ĐẦU

Xử lý ảnh là một lĩnh vực đã và đang được quan tâm của nhiều nhà khoa học trong và ngoài nước bởi tính phong phú và lợi ích của nó được ứng dụng trong khoa học kỹ thuật, kinh tế, xã hội và đời sống con người Lĩnh vực xử lý ảnh liên quan tới nhiều ngành khác như: hệ thống tin học, trí tuệ nhân tạo, nhận dạng, viễn thám, y học, nông học

Hiện nay, thông tin hình ảnh đóng vai trò rất quan trọng trong trao đổi thông tin, bởi phần lớn thông tin mà con người thu được thông qua thị giác Do vậy, vấn đề nhận dạng trong xử lý ảnh, đặc biệt là nhận dạng biên ảnh đang được quan tâm bởi yêu cầu ứng dụng đa dạng của chúng trong thực tiễn

Mục đích đặt ra cho xử lý ảnh được chia thành hai phần chính: phần thứ nhất liên quan đến những khả năng từ các ảnh thu lại các ảnh để rồi từ các ảnh đã được cải biến nhận được nhiều thông tin để quan sát và đánh giá bằng

mắt, chúng ta coi như là sự biến đổi ảnh (image transformation) hay sự làm

đẹp ảnh (image enhancement) Phần hai nhằm vào nhận dạng hoặc đoán nhận

ảnh một cách tự động, đánh giá nội dung các ảnh

Quá trình nhận dạng ảnh nhằm phân loại các đối tượng thành các lớp

đối tượng đã biết (supervised learning) hoặc thành những lớp đối tượng chưa biết (unsupervised learning) Sau quá trình tăng cường và khôi phục (đối với những ảnh có nhiễu), giai đoạn tiếp theo, người ta phải trích rút các đặc tính

quan trọng, quyết định của ảnh cần nhận dạng Các đặc tính đó có thể là đặc tính hình học, đặc tính ngữ cảnh

Các đặc tính hình học chứa những thông tin về vị trí, kích thước hình học, hình dạng của các đối tượng trong ảnh, là đặc tính rất quan trọng trong xử lý nhận dạng ảnh Các đặc tính này thường được trích rút ra thông qua việc xác định các đường biên các đối tượng trong ảnh Biên chứa các thông tin về

Trang 11

hình dạng ngoài của đối tượng ảnh Có thể nói xác định biên là một trong những vấn đề quan trọng và hấp dẫn trong lĩnh vực nghiên cứu xử lý ảnh bởi khả năng biểu đạt cấu trúc đối tượng và tính ứng dụng rộng rãi của nó vào việc giải quyết nhiều bài toán khó như: nhận dạng tự động, thị thực máy tính, hoạt hình…

Bên cạnh đó, trong những năm gần đây các nghiên cứu về biên ảnh và phép biến đổi Fourier đã và đang được ứng dụng rộng rãi Thực tế này đặt ra các bài toán như: đưa những ứng dụng đó vào xã hội và đời sống con người Một số nhóm nghiên cứu trong và ngoài nước đã đưa ra các phương pháp giải quyết kết hợp các phương pháp phát hiện biên và phép biến đổi Fourier để hoàn thành những ứng dụng góp phần vào sự phát triển trong xã hội

Chình vì những ứng dụng thực tiễn đó em đã nghiên cứu luận văn thạc sĩ với đề tài “Phát hiện biên, biểu diễn Forier Elliptic và ứng dụng” Luận văn gồm phần mở đầu, phần kết luận, và 3 chương nội dung:

Chương 1: Tổng quan về xử lý ảnh và biên

Chương 2: Một số phương pháp phát hiện biên và phép biểu diễn Fourier Elliptic

Chương 3: Chương trình thử nghiệm

Trang 12

CHƯƠNG 1: TỔNG QUAN VỀ XỬ Lí ẢNH VÀ BIấN 1.1 Một số khỏi niệm cơ bản trong xử lý ảnh

1.1.1 Xử lý ảnh

Xử lý ảnh(Image processing) là đối tượng nghiờn cứu của lĩnh vực thị

giỏc mỏy, là quỏ trỡnh biến đổi từ một ảnh ban đầu sang một ảnh mới với cỏc đặc tớnh mà tuõn theo ý muốn của việc xử lý Xử lý ảnh cú thể là quỏ trỡnh phõn tớch, phõn lớp cỏc đối tượng, làm tăng chất lượng, phõn đoạn và tỡm biờn, gỏn nhón cho vựng hay quỏ trỡnh biờn dịch cỏc thụng tin hỡnh ảnh của ảnh Hỡnh dưới sẽ minh họa cỏc giai đoạn chớnh trong quỏ trỡnh xử lý ảnh

Hỡnh 1.1 Cỏc giai đoạn chớnh trong quỏ trỡnh xử lý ảnh

1.1.2 Quỏ trỡnh thu nhận, biểu diễn và lưu giữ ảnh

1.1.2.1.Quỏ trỡnh thu nhận ảnh

Ảnh tồn tại trong thực tế là một ảnh liờn tục cả về khụng gian cũng như về giỏ trị độ sỏng, và việc thu nhận ảnh cú thể dựng Scanner, camera Muốn đưa ảnh liờn tục trong thực tế vào mỏy tớnh để xử lý cần phải qua một khõu trung gian đú là quỏ trỡnh số hoỏ Số hoỏ là quỏ trỡnh rời rạc hoỏ về khụng gian và lượng tử hoỏ về giỏ trị.Quỏ trỡnh rời rạc hoỏ về khụng gian là quỏ trỡnh thu nhận những điểm rời rạc từ một ảnh liờn tục, nhưng phải đảm bảo

Hệ Q.định

L-u trữ

SENSOR

Số hoáThu nhận

L-u trữ

Phântích ảnh

Trang 13

chính là việc tìm cách biểu diễn cả một ảnh lớn có vô số điểm, bởi một số hữu hạn điểm, sao cho không làm mất đi hay thay đổi tính chất của ảnh, để việc lưu trữ và xử lý ảnh được dễ dàng Còn quá trình lượng tử hoá về giá trị là quá trình rời rạc hoá về mặt giá trị để có thể đơn giản hoá việc tính toán và đưa vào máy để xử lý Tuỳ theo từng loại ảnh, độ chính xác yêu cầu và khả năng xử lý của máy tính mà ta có các mức lượng tử thích hợp Ví dụ với ảnh 256 cấp xám, ta phải dùng 256 mức lượng tử và biểu diễn trong máy tính bằng 8 bits

1.1.2.2 Quá trình biểu diễn ảnh

Sau quá trình số hoá sẽ thu được một ma trận tương ứng với ảnh cần xét, mỗi phần tử của ma trận tương ứng với một điểm ảnh Ảnh thường được biểu diễn bởi một mảng hai chiều I(n,p) gồm n dòng và p cột Như vậy, ảnh gồm nxp pixels và người ta thường kí hiệu I(x,y) để chỉ một pixel cụ thể trong ảnh Các điểm này được đặc trưng bằng toạ độ màu (R,G,B) tương ứng với nó trên hệ toạ độ màu cơ bản sau:

Trong đó R = Red, G = Green, B = Blue

Hệ toạ độ (R,G,B ) là hệ cơ bản nhất, người ta đã chứng minh được Black

Blue

Cyan White

Green

YellowRed

Mag

Trang 14

thực tế đều có thể biểu diễn bởi toạ độ của chúng trong hệ toạ độ này, tức là từ ba màu này chúng ta có thể tổng hợp được nhiều màu trong thực tế Xét một số trường hợp đặc biệt sau:

 Màu đen (Black) tạo bởi R=B=G=0

 Màu vàng (Yellow) tạo bởi R=G=1, B=0

 Màu tím (Magenta) tạo bởi R=B=1, G=0

 Màu xanh (Cyan) tạo bởi R=0, G=B=1

 Màu trắng (White) tạo bởi R=G=B=1

Từ đó ta có thể thấy rằng, ảnh đa cấp sáng là trường hợp đặc biệt của ảnh màu, trong đó các thành phần tọa độ màu tương ứng bằng nhau (R=G=B=1)

Về mặt toán học có thể xem ảnh là một hàm hai biến f(x,y) với x,y là các biến tọa độ Giá trị số ở điểm (x,y) tương ứng với giá trị xám hoặc độ sáng của ảnh (x là các cột còn y là các hàng) Giá trị của hàm ảnh f(x,y) được hạn chế trong phạm vi của các số nguyên dương

0 = f(x,y) = fmax

Thông thường đối với ảnh xám, giá trị fmax là 255 ( 28=256) và mỗi phần tử ảnh được mã hóa bởi một byte Ảnh có thể được biểu diễn theo một trong

hai mô hình: mô hình Vector hoặc mô hình Raster

 Mô hình Raster: là mô hình biểu diễn ảnh thông dụng nhất hiện nay

Ảnh được biểu diễn dưới dạng ma trận các điểm ảnh Tùy theo nhu cầu thực tế mà mỗi điểm ảnh có thể được biểu diễn bởi một hay nhiều bit Mô hình Raster thuận lợi cho việc thu nhận, hiển thị và in ấn

 Mô hình Vector: Bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ dàng hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ưu điểm cho phép dễ dàng lựa chọn, sao chép, di chuyển, tìm kiếm … Theo những yêu cầu này thì kỹ thuật biểu diễn vector tỏ ra ưu việt hơn Trong mô hình này, người ta sử dụng hướng vector của các điểm ảnh

Trang 15

lân cận để mã hóa và tái tạo lại hình ảnh ban đầu Các ảnh vector được thu nhận trực tiếp từ các thiết bị số hóa như Digitalize hoặc được chuyển đổi từ các ảnh Raster thông qua các chương trình vector hóa Khi xử lý các ảnh Raster chúng ta có thể quan tâm đến mối quan hệ trong vùng lân cận của các điểm ảnh Các điểm ảnh có thể xếp hàng trên một lưới (raster) hình vuông, lưới hình lục giác hoặc theo một cách hoàn toàn ngẫu nhiên với nhau Cách sắp xếp theo hình vuông là được quan tâm đến nhiều nhất và có hai loại: điểm 4 láng giềng (4 liền kề) hoặc 8 láng giềng (8 liền kề) Hình dưới đây minh họa điểm 4 láng giềng và điêm 8 láng giềng

1.1.2.3 Lưu giữ ảnh

Trong sự phát triển công nghệ thông tin nói chung, một vấn đề lớn chi phối các hoạt động thuộc lĩnh vực này là vấn đề bộ nhớ Cần thiết phát triển quá trình xử lý thông tin sao cho nhanh chóng và chính xác, song cũng cần phát triển khả năng lưu trữ, bảo toàn các thông tin này Các thế hệ máy tính ngày nay đã có bộ nhớ rất lớn, song bao giờ nó cũng ít đối với những gì chúng ta muốn lưu trữ và xử lý Trong kĩ thuật xử lý ảnh cũng vậy, vì lượng thông tin chứa trong một bức ảnh là khá lớn, lên việc lưu giữ nó là vấn đề cần quan tâm Trong thực tế ma trận điểm ảnh tạo ra bởi quá trình số hoá, được

H×nh 1.2 : §iÓm 8 l¸ng giÒng vµ ®iÓm 4 l¸ng giÒng

Trang 16

lưu trữ trong máy tính dưới dạnh các files và thường thì các files này được nén để tiết kiệm bộ nhớ

Hầu hết các files ảnh đều có phần đề ở đầu files để ghi những thông tin cơ bản về ảnh như: Kích thước ảnh, số planes, số bits cho một điểm ảnh Trong thực tế, ta hay gặp và xử lý đầu vào là các ảnh bitmap đó là ảnh được tạo ra từ các điểm ảnh Ngoài ra trong quá trình thực hiện, sau một số phép biến đổi có thể chuyển nó về dạng vectơ có đơn vị là các đường để tiện cho việc lưu giữ

1.1.3 Histogram của ảnh

Như ta đã biết, mỗi điểm có một giá trị độ sáng nào đó Histogram của ảnh là đồ thị cho biết tần suất hiện các điểm ảnh với các mức biến thiên độ sáng

Thí dụ: Có một ảnh 100 điểm , độ sáng của ảnh được phân thành 5 mức

sáng: level1, level2, , level 5

Số điểm ảnh của các mức tương ứng là 20, 25, 10, 30, 15 Như vậy tần suất hiện của các điểm ảnh ở mức tương ứng là 20%, 25%, 10%, 30%, 15%, với ảnh này ta có histogram của ảnh như hình 1.3

Từ kết quả histogram của ảnh, chỉ cho ta nhìn nhận tổng quát quá trình phân bố giải độ sáng trên ảnh, chứ không cho ta biết kết cấu chi tiết của ảnh.Ngoài ra, căn cứ vào số đỉnh trên histogram của ảnh sẽ có sự nhìn nhận ban đầu về số vùng của ảnh Đó là cơ sở cho việc phân vùng ảnh và tìm biên sau này, đặc biệt là phương pháp tìm biên gián tiếp

Trang 17

- Mô tả tham số (nhận dạng theo tham số) - Mô tả theo cấu trúc ( nhận dạng theo cấu trúc)

0.1 0.2 0.3

Trang 18

Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu)

Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính

Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ, v.v ) phục vụ cho nhiều lĩnh vực

Ngoài hai kỹ thuật nhận dạng trên, hiện nay một số kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơron và fourier đang được áp dụng và cho kết quả khả quan

1.2 Biên ảnh và vai trò trong nhận dạng ảnh

1.2.1 Khái niệm về biên ảnh và các phương pháp phát hiện biên cơ bản

1.2.1.1 Khái niệm biên ảnh

 Các phương pháp phát hiện biên là các phương pháp xử lý cục bộ rất quan trọng trong việc xác định sự thay đổi độ sáng của hàm ảnh  Một điểm ảnh được coi là biên nếu ở đó có sự thay đổi đột ngột về mức

xám Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh  Phương pháp phát hiện biên trực tiếp nhằm làm nổi biên dựa vào sự

biến thiên về độ sáng của điểm ảnh Sử dụng kỹ thuật đạo hàm để phát hiện biên Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp gradient, nếu lấy đạo hàm bậc hai ta có kỹ thuật Laplace

 Một hàm ảnh phụ thuộc vào 2 biến đó là toạ độ của điểm ảnh, vì vậy các toán tử mô tả biên ảnh được biểu diễn bởi các đạo hàm riêng (theo 2 hướng x,y)

 Phương pháp gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm

Trang 19

 Biên ảnh được biểu diễn bởi 1 véc tơ với 2 thành phần:

o Biên độ của gradient

o Và hướng của biên với góc , hướng của biên lệch so với hướng của gradient  một góc -900

 Hướng gradient là hướng của sự gia tăng lớn nhất của hàm ảnh

 Như mô tả trong hình dưới, các đường biên khép kín là các đường có cùng độ sáng; quy ước hướng là chỉ hướng đông

 Biên thường được sử dụng trong phân tích ảnh để xác định đường bao của các vùng trong ảnh

 Đường bao và các thành phần của nó (các điểm biên) vuông góc với hướng của gradient

 Một số dạng của đường bao ảnh

Trang 20

Roof là dạng điển hình cho các đối tượng có đường biên mảnh

 Các kỹ thuật phát hiện biên thường được điều chỉnh để phù hợp với dạng của biên ảnh

 Đôi khi chúng ta chỉ chú ý đến sự thay đổi biên độ mà không quan tâm đến sự thay đổi về hướng; khi đó chúng ta sử dụng toán tử tuyến tính Laplace để phát hện biên

 Toán tử Laplace có cùng tính chất ở mọi hướng, và do đó nó là thành phần bất biến quay trong các ảnh

1.2.1.2 Các phương pháp phát hiện biên cơ bản

Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự

biến thiên mức xám của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi theo hướng Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace

Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành

các vùng thì ranh giới giữa các vùng đó gọi là biên Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên

1.2.1.2.1 Phương pháp phát hiện biên trực tiếp

a) Kỹ thuật phát hiện biên Gradient

Theo định nghĩa gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh

b) Kỹ thuật phát hiện biên Laplace

Trang 21

Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai Laplace

1.2.1.2.2 Phương pháp phát hiện biên gián tiếp

a) Một số khái niệm cơ bản

*Ảnh và điểm ảnh:

Ảnh là một mảng số thực 2 chiều (Iij) có kích thước (mn), trong đó mỗi phần tử Iij(i = 1, ,m; j = 1, ,n) biểu thị mức xám của ảnh tại (i,j) tương ứng

*Các điểm 4 và 8-láng giềng

Giả sử (i,j) là một điểm ảnh, các điểm 4 và 8 láng giềng là: N4= {(i’,j’) : i’|+|j-j’| = 1}, N8 = {(i’,j’) : max(|i-i’|,|j-j’|) =1}

|i-b) Chu tuyến của một đối tượng ảnh

Định nghĩa 1: [Chu tuyến]

Chu tuyến của một đối tượng ảnh là dãy các điểm của đối tượng ảnh P1,,Pn sao cho Pi và Pi+1 là các 8-láng giềng của nhau (i=1, ,n-1) và P1 là 8-láng giềng của Pn, i Q không thuộc đối tượng ảnh và Q là 4-láng giềng của Pi (hay nói cách khác i thì Pi là biên 4) Kí hiệu <P1P2 Pn>.Hình 1.4 biểu diễn chu tuyến của ảnh, P là điểm khởi đầu chu tuyến

Hình 1.4 Ví dụ về chu tuyến của đối tượng ảnh

P

Trang 22

Định nghĩa 2: [Chu tuyến đối ngẫu]

Hai chu tuyến C= <P1P2 Pn> và C= <Q1Q2 Qm> được gọi là đối ngẫu của nhau nếu và chỉ nếu i j sao cho:

1 Pi và Qj là 4-láng giềng của nhau

2 Các điểm Pi là vùng thì Qj là nền và ngược lại

Định nghĩa 3: [Chu tuyến ngoài]

Chu tuyến C được gọi là chu tuyến ngoài nếu và chỉ nếu: 1 Chu tuyến đối ngẫu C là chu tuyến của các điểm nền 2 Độ dài của C nhỏ hơn độ dài C

Định nghĩa 4: [Chu tuyến trong]

Chu tuyến C được gọi là chu tuyến trong nếu và chỉ nếu: 1 Chu tuyến đối ngẫu C là chu tuyến của các điểm nền 2 Độ dài của C lớn hơn độ dài C

c) Thuật toán dò biên tổng quát

Về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm các bước sau:

 Xác định điểm biên xuất phát

 Dự báo và xác định điểm biên tiếp theo

Lặp bước 2 cho đến khi gặp điểm xuất phát

Thuật toán dò biên tổng quát

Bước 1: Xác định cặp nền-vùng xuất phát Bước 2: Xác định cặp nền-vùng tiếp theo Bước 3: Lựa chọn điểm biên

Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2

Trang 23

1.2.2 Vai trò của biên trong nhận dạng

Như đã đề cập tới ở phần tổng quan về một hệ thống nhận dạng và xử lý ảnh, quá trình nhận dạng có hai giai đoạn cần thực hiện:

Giai đoạn học: Các đặc điểm của đối tượng mẫu được lưu trữ (gọi là học

mẫu) và tập các phần tử mẫu được chia thành các lớp

Giai đoạn nhận dạng: Khi có đối tượng cần nhận dạng, các đặc điểm của đối

tượng sẽ được trích chọn và sử dụng hàm quyết định để xác định đối tượng cần nhận dạng thuộc lớp nào

1.2.3 Biểu diễn biên dựa trên mô tả Fourier

Hình dạng mà một đặc trưng trực quan quan trọng và nó là một trong những đặc trưng gốc của việc mô tả nội dung ảnh Tuy nhiên, mô tả nội dung hình dạng là một công việc khó Bởi vì khó xác định được các đặc trưng hình dạng và phép đo sự tương tự giữa các hình dạng Để tạo vấn đề phức tạp hơn, hình dạng thường không rõ ràng cùng với các nhiễu không rõ ràng

Trong phần này mục tiêu chính nghiên cứu về hình dạng để nhận dạng đối tượng Mỗi một kỹ thuật biểu diễn hình dạng nhằm vào các ứng dụng riêng biệt Sự chính xác là mối quan tâm chính trong các kỹ thuật biểu diễn Các yêu cầu được đưa ra để đo hiệu quả biểu diễn hình dạng gồm: truy vấn chính xác, các đặc trưng cô đọng, ứng dụng tổng quát, độ phức tạp tính toán thấp, thao tác truy vấn đơn giản

Biểu diễn biên dựa trên mô tả Fourier: là mô tả hình dạng của đối tượng ảnh bằng một biến đổi Fourier của đường biên của đối tượng

Ba loại biểu diễn đường biên: bằng độ cong, bằng khoảng cách trọng tâm, bằng hàm toạ độ phức

Trang 24

Phương pháp chung nhất và tổng quát nhất là dựa trên việc sử dụng điểm nằm trên đường bao hình dạng trái ngược với các điểm bên trong hình dạng Các kỹ thuật biểu diễn hình dạng có thể nhận ra giữa vùng không gian và vùng đặc trưng Các phương pháp trong vùng không gian tương xứng với hình dạng trên các điểm cơ sở (hoặc đặc trưng điểm), trong khi kỹ thuật vùng đặc trưng tương xứng với hình dạng trên các đặc trưng cơ sở (véc tơ) Sự phân loại khác của các kỹ thuật biểu diễn hình dạng được dựa trên sự bảo toàn thông tin gốc Các phương pháp cho phép xây dựng lại hình dạng từ các mô tả gọi là bảo toàn thông tin, trong khi các phương pháp khác chỉ có thể xây dựng lại một phần hoặc mô tả không rõ ràng gọi là không bảo toàn thông tin

Hình 1.5 Phân loại biểu diễn hình dạng và các kỹ thuật biểu diễn

Trang 25

Một khi đối tượng trong ảnh đã được xác định, chúng sẽ được đặc trưng hóa thông qua các phương pháp như: miền, độ lệch tâm - eccentricity (chẳng hạn như tỷ lệ giữa trục chính và trục phụ), vòng tròn - circularity (sự tương đồng với vòng tròn bao quanh vùng có kích thước tương tự), dấu hiệu hình dạng (một dãy các số chỉ khoảng cách từ biên tới tâm của hình dạng), mô men hình dạng (shape moments), sự uốn cong - curvature (xác định mức độ đường biên đổi hướng), chiều fractal – fractal dimension (mức độ tự tương tự), v.v

Một số tiêu chuẩn biểu diễn hình dạng:

 Bất biến đối với phép quay, co giãn và tịnh tiến  Nhỏ gọn, dễ thao tác

 Tương tự với cảm nhận của con người  Bền vững với phép biến đổi hình dạng  Độc lập với các ứng dụng

Sau đây sẽ trình bày một số phương pháp biểu diễn hình dạng

1.2.3.1 Phương pháp dựa trên mô tả Fourier

Năm 1977, Persoon và Fu lần đầu tiên đã đưa ra kỹ thuật sử dụng ký hiệu mô tả Fourier để biểu diễn hình dạng Rất nhiều nghiên cứu đã được thực hiện theo sau ý tưởng này Trong số đó, Refiei và Mendlzon đã đưa ra phương pháp biểu diễn hình dạng của họ sử dụng các dấu hiệu mô tả Fourier để mô tả hình dạng của một đối tượng

Giả sử biên hình dạng được trích chọn trong quá trình tiền xử lý là: ( ( ), ( )),x t y tt 0,1, ,N1

Trang 26

Nếu ta xem xét hình dạng trên một mặt phẳng phức, ta có thể thu được hàm phức một chiều f(t) bằng cách lần theo biên của nó f(t) đơn giản là một số phức được tổng quát hóa từ hệ tọa độ đường bao

f miêu tả đường bao của hình dạng, f(t) là dấu hiệu hình dạng bất

biến đối với phép dịch chuyển

Biến đổi Fourier rời rạc của dấu hiệu hình dạng f(t) được cho bởi:

với u=0 đến M-1, trong đó M là tổng số mẫu f(t)

Có nhiều loại dấu hiệu hình dạng Các loại dấu hiệu hình dạng hay sử dụng là trên cơ sở độ cong, trên cơ sở bán kính và trên cơ sở tọa độ biên hình dạng Hiệu năng phân lớp hình dạng trên cơ sở ba loại dấu hiệu này không khác nhau nhiều Dấu hiệu trên cơ sở bán kính là đơn giản và dễ cài đặt nhất

Dấu hiệu trên cơ sở bán kính bao gồm một số khoảng cách theo thứ tự

từ tâm hình dạng đến các điểm trên biên (gọi là radius - các bán kính) Radius

được định nghĩa như sau:

)(

Trang 27

Radius hình dạng và biến đổi giữa chúng là bất biến dịch chuyển Chú ý rằng các hình dạng không chuẩn hóa hướng trước khi sử dụng radius hình dạng Thực hiện chuẩn hóa bằng cách bỏ qua các giá trị pha của Fourier (FD) Xoay hình dạng được phản ánh trong thông tin pha của Fu và độ lớn của Fu, hay | F |u là bất biến với xoay | F |0 phản ánh năng lượng của radius hình dạng, vậy | F | / | F |u o sẽ bất biến co dãn Do vậy, ta sử dụng véc tơ đặc trưng sau (nó bất biến với dịch chuyển, xoay, và co dãn) để chỉ mục hình dạng:

Khoảng cách giữa các hình dạng được tính toán bằng khoảng cách Euclidean giữa các véc tơ đặc trưng của chúng

Chỉ mục mỗi hình dạng trong CSDL cùng với mô tả Fourier Sự tương tự giữa hai hình dạng truy vấn và mỗi hình dạng trong CSDL với

Trang 28

là chuyển đổi độ dài bán kính nhạy cảm vào miền tần số nơi dữ liệu bền vững hơn đối với thay đổi nhỏ và nhiễu

1.2.3.2 Phương pháp góc quay

Arkin và các đồng nghiệp đề xuất một phương pháp hiệu quả để biểu diễn các hình đa giác gọi là phương pháp góc quay Tổng quát, phương pháp biểu diễn một hình đa giác A đơn giản sẽ mô tả biên của A bằng cách liệt kê dãy các đỉnh (vertex) trong đó mối đỉnh được mô tả bởi cặp tọa độ (x,y) Tuy nhiên, Arkin đưa ra một cách biểu diễn khác cho biên của một hình đa giác Theo phương pháp của ông, biên có thể được mô tả bởi hàm quay A S Hàm

 S

 đo góc của tiếp tuyến của cung (arc-length) theo chiều ngược chiều quay đồng hồ Cung S được tính từ điểm tham chiếu bắt đầu O trên biên của đa giác Khi đó A O là góc tạo bởi tiếp tuyến tại O và trục tham chiếu nào đó, chẳng hạn là trục x Theo cách này, hàm quay A S sẽ đi dọc theo biên, tăng khi quay sang bên trái và giảm khi quay sang bên phải

Không mất tính tổng quát, Arkin giả thiết rằng mọi đa giác được thay đổi kích thước hay chuẩn hóa sao cho chu vi của nó bằng 1 Khi đó A S là

một hàm với đối số nằm trong khoảng [0,1] Hình mô tả việc biểu diễn góc

quay của một đa giác

Trang 29

Hình 1.6 Biểu diễn theo góc quay

Trong Hình 1.6a, O là điểm bắt đầu và góc quay tương ứng với nó là

v1 Mọi góc quay được biểu diễn trong Hình 1.6b có thể tính được bằng cách di chuyển ngược chiều quay đồng hồ dọc theo biên của đa giác Chú ý rằng với đa giác lồi A, hàm quay của nó A S sẽ tăng đơn điệu từ v đến v2

Cho trước hai đa giác A và B với các hàm quay tương ứng là A S và  S

 , sự khác biệt giữa chúng được định nghĩa là:

2,

Trang 30

Hình 1.7 Biểu diễn góc quay trong trường hợp có thay đổi nhỏ

Trong Hình 1.7 đa giác Q chỉ có một chút thay đổi nhỏ so với P Tuy nhiên, khi ta sử dụng các hàm quay của chúng để so sánh, sự khác biệt do phần mờ trong đồ thị sẽ không đủ nhỏ để cho biết hai hình này là rất tương tự nhau

Trang 31

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN BIÊN VÀ PHÉP BIỂU DIỄN FOURIER ELLIPTIC

2.1 Một số phương pháp phát hiện biên 2.1.1 Phương pháp phát hiện biện trực tiếp

2.1.1.1 Kỹ thuật Gradient

Đây là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm Theo định nghĩa Gradient là một vector biểu thị tốc độ thay đổi giá trị của một đại lượng Vì ảnh là một mảng hai chiều nên ta tính vi sai giữa hai điểm ảnh cạnh nhau theo hai hướng x và y

fx ( , ) (  , ) ( , )

fy ( , ) ( ,  ) ( , )

Với dx, dy là khoảng cách giữa các điểm theo hướng x và y (được tính bằng số điểm ảnh) và fx, fy là các đạo hàm gián đoạn hay các Gradient theo các hướng x và hướng y

Đạo hàm theo hướng r và góc  bất kỳ được tính theo công thức:

fxcos + fysin

yyfxxff

Trang 32

còn kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo 8 hướng của tất cả các điểm ảnh cạnh nó Hình 2.1 minh họa mô hình 8 hướng Có khá nhiều toán tử đạo hàm đã được áp dụng Các toán tử sử dụng kỹ thuật Gradient đáng kể nhất là toán tử Robert, Sobel và Prewitt Còn toán tử la bàn hay được sử dụng là toán tử Krish

Dưới đây là các mặt nạ tương ứng với các kỹ thuật nêu trên:

1 2

0

7 6

5 4 3

E NE N

-1 -2 -1 Hy = 0 0 0 1 2 1

(b) Mặt nạ Sobel

Ngang (hướng x) Dọc (hướng y)

-1 0 1 Hx = -1 0 1 -1 0 1

-1 -1 -1 Hy = 0 0 0 1 1 1

(c) Mặt nạ Prewitt

0 1 H1 =

-1 0

-1 0 H2 =

0 -1 (a) Mặt nạ Robert

Trang 33

Tiếp theo là một số kết quả minh họa của sử dụng các mặt nạ Robert, Sobel.

Hình 2.2 Ảnh trước khi dò biên

(d) Các mặt nạ toán tử Krish theo các hướng 00, 450, 900, 1350, 1800, 2250, 2700, 3150

Trang 34

Hình 2.3 Ảnh sau khi dò biên

Các kỹ thuật đánh giá Gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét Nhưng khi mức xám thay đổi chậm miền chuyển tiếp trải rộng thì phương pháp Laplace (sử dụng đạo hàm bậc hai) tỏ ra hiệu quả hơn

2.1.1.2 Kỹ thuật Laplace

Toán tử Laplace được định nghĩa như sau:

Trong đó f(x,y) là hàm cường độ của ảnh

Để hiểu hoạt động của phương pháp Laplace trong việc trích ra đường biên chúng ta có thể xem các sơ đồ dưới đây

f(x) a

c

Trang 35

Như vậy, đạo hàm bậc hai có thể dùng để phát hiện đường biên ảnh Thông thường các điểm không (cross-zero) của đạo hàm bậc hai là nơi có đường biên, tuy nhiên phải chú ý là đạo hàm của một hàm hai biến tại bất kỳ điểm nào cũng phụ thuộc vào hướng lấy đạo hàm

Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ cho đạo hàm bậc hai Có ba kiểu mặt nạ hay dùng

Các kết quả nhiên cứu cho thấy trong phương pháp đạo hàm bậc hai, toán tử Laplace rất nhậy cảm với nhiễu và tạo thành biên kép Để khắc phục nhược điểm này người ta mở rộng toán tử Laplace và dùng xấp xỉ Laplace-Gauss để phát hiện các điểm không:

h(m,n)=c[1-(m2+n2)/ σ 2]exp(-(m2+n2)/2 σ 2)

Với σ là tham số điều khiển độ rộng, và c là chuẩn tổng các phần tử có kích thước mặt nạ là đơn vị Cắt điểm không của ảnh cho trước chập với h(m,n) sẽ cung cấp cho ta vị trí biên của ảnh Các điểm biên của ảnh được xác định bởi các điểm cắt điểm không (cross-zero) và các điểm không là duy nhất Do vậy kỹ thuật này cho đường biên mảnh Tuy nhiên như đã nói ở trên, kỹ thuật Laplace rất nhạy cảm với nhiễu do đạo hàm bậc hai thường không ổn định

0 -1 0 H1 = -1 4 -1

0 -1 0

-1 -1 -1 H2 = -1 8 -1 -1 -1 -1

1 -2 1 H3 = -2 5 -2 1 -2 1

Trang 36

a) b)

c)

Hình 2.5 a) Ảnh gốc; b) Ảnh biên dùng Laplace H1; c) Ảnh biên dùng Laplace H2;

Trang 37

Ngoài hai kỹ thuật dò biên kể trên, trong các phương pháp phát hiện biên trực tiếp người ta còn sử dụng một số kỹ thuật khác nữa đó là: phương pháp dò biên theo quy hoạch động, phương pháp tiếp cận bởi mô hình mặt, phương pháp tiếp cận tối ưu hóa

 Phương pháp dò biên theo quy hoạch động là phương pháp tìm cực trị của các quá trình nhiều bước dựa vào nguyên lý tối ưu của Bellman Thuật toán xác định một đường bao tối ưu của ảnh trên cơ sở đánh giá khoảng cách, gradient biên độ và gradient hướng của các đỉnh

 Phương pháp tiếp cận bởi mô hình mặt dựa vào việc thực hiện xấp xỉ đa thức trên ảnh gốc hay ảnh đã thực hiện phép lọc Laplace Cách tiếp cận tối ưu nhằm xác định một hàm (một bộ lọc), làm giảm phương sai

σ 2

hoặc giảm một số điểm cực trị cục bộ

 Phương pháp tiếp cận tối ưu hóa định vị đúng vị trí bằng cách cực tiểu hóa phương sai σ 2

của vị trí các điểm cắt không (cross-zero) hoặc hạn chế số điểm cực trị cục bộ để chỉ tạo ra một đường bao

Nhìn chung các phương pháp phát hiện biên như đã trình bày ở trên đều có ít nhiều sử dụng đến các kỹ thuật đạo hàm Ý tưởng chung của các kỹ thuật tìm biên sử dụng đạo hàm đó là sử dụng các bộ lọc thông cao để làm nổi biên Bởi vì các điểm biên là các chi tiết có tần số không gian cao nên khi ảnh được lọc thông cao, các phần tử có tần số không gian cao sẽ sáng hơn còn các phần tử có tần số không gian thấp sẽ tối đi Kỹ thuật lọc thông cao được thực hiện nhờ thao tác nhân chập

Việc sử dụng các mặt nạ nhân chập có một nhược điểm chung đó là bản thân phép lọc không tự động loại bỏ hoặc hạn chế được nhiễu Bởi vì đặc tính của nhiễu, nếu xem xét một cách tương đương trong không gian tần số, nhiễu ứng với các thành phần tần số cao trong ảnh Các phép lọc thông cao tuy làm

Trang 38

phân tích, nhận dạng ảnh người ta thường muốn xử lý trên các ảnh biên chỉ có hai màu (màu biên và màu nền) để cho đơn giản Các ảnh qua lọc lấy biên không cho ra ảnh biên (hai màu) mà cần phải thông qua một vài phép xử lý trung gian nữa (chẳng hạn phân ngưỡng) thì mới thu được ảnh biên thực sự Bản thân quá trình xử lý này cũng có thể lại làm mất đi các chi tiết của ảnh biên sau phép lọc

Ngoài ra, các kỹ thuật tìm biên sử dụng đạo hàm còn có một hạn chế nữa là không cho phép điều chỉnh độ chi tiết của ảnh biên thu được Trong các ảnh chụp thế giới thực, sẽ có rất nhiều các đối tượng trong ảnh có độ chi tiết (mờ, rõ) khác nhau Khi nhận dạng, không hẳn là chúng ta sẽ quan tâm đến tất cả các đối tượng mà chủ yếu là chỉ quan tâm đến các đối tượng chính trong ảnh Các đối tượng này thường có độ chi tiết và độ rõ cao Sử dụng các mặt nạ nhân chập không cho phép chúng ta điều chỉnh độ chi tiết của các ảnh biên thu được một cách dễ dàng, rõ ràng buộc tổng các hệ số của bộ lọc phải bằng 1; nhằm ngăn cản sự tăng quá giới hạn của các giá trị mức xám (các giá trị điểm ảnh phải giữ được giá trị của nó một cách gần đúng không thay đổi quá nhiều so với giá trị thực) Phần dưới đây, tôi xin giới thiệu tổng quan kỹ thuật phát hiện biên thuộc loại phát hiện biên trực tiếp nhưng không dựa và đạo hàm mà dựa vào phép toán hình thái [29] đang được nhiều nhà khoa học quan tâm

2.1.1.3 Tìm biên bằng phép toán hình thái Ở phần này, em chỉ xin được giới thiệu tổng quan phép toán hình thái để làm

định hướng cho quá trình nghiên cứu sau này Phép toán hình thái thực hiện trên cơ sở ảnh ban đầu đã được làm trơn bằng phép lọc trung vị Giả sử P là một điểm của ảnh đã được làm trơn, tính hai độ lệch của điểm đó với các giá trị lớn nhất và nhỏ nhất của cửa sổ xung quanh P, (cửa sổ 33) Giá trị nhỏ

Trang 39

hơn trong hai giá trị đó sẽ được chọn làm giá trị điểm ảnh đầu ra Quá trình

này sẽ được mô tả mhư sau:

Giả sử ảnh gốc I(m,n) được làm trơn bằng bộ lọc trung bình tạo ra ảnh O1(m,n):

W(m,n) là cửa sổ của (m,n) nhận điểm này làm trung tâm (phép xếp chồng tại trung tâm) được chọn thích hợp Nw là số điểm của cửa sổ này Một điểm ảnh đầu ra O2(m,n) được tính từ ảnh O1(m,n) thông qua phép so sánh và lựa chọn bởi:

mO

Trang 40

2.1.2 Phương pháp phát hiện biên gián tiếp

2.1.2.1 Phân vùng ảnh dựa theo ngưỡng biên độ

Ảnh khi được miêu tả thông qua hàm f(x,y) có thể được quan niệm như một môi trường vật lý Trong đó, các hiện tượng như phản xạ, truyền sáng, màu sắc hoặc đáp ứng đa phổ đều có thể mô tả được Các hàm f(x,y) có thể đặc trưng cho biên độ của các tính chất vật lý của ảnh, còn các biến (x,y) ngoài ý nghĩa vị trí có thể được sử dụng như là điện áp, nhiệt độ, hoặc vận tốc

Chúng ta có thể dùng ngưỡng biên độ để phân vùng ảnh khi mà biên độ là đủ lớn để đặc trưng cho ảnh Kỹ thuật phân ngưỡng theo biên độ được tiến hành theo các bước như sau:

 Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể sử dụng để chọn ngưỡng

 Chọn ngưỡng t sao cho một phần xác định trước của toàn bộ số mẫu là thấp hơn t

 Điều chỉnh ngưỡng dựa trên xem xét lược đồ xám của các điểm lân cận  Chọn ngưỡng như xem xét lược đồ xám của những điểm thỏa mãn tiêu

chuẩn chọn Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính của ảnh lưỡng cực tốt hơn ảnh gốc

Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn nhằm cực tiểu xác suất của sai số hoặc một số tính chất khác theo luật của Bayes

2.1.2.2 Phân vùng dựa theo miền đồng nhất

Định dạng
Số trang	83
Dung lượng	1,52 MB