Bởi vì xử lý hình thái học trên ảnhcung cấp cho chúng ta những mô tả định lượng về cấu trúc và hình dạng hình học của các đốitượng trong ảnh dựa trên những lý thuyết trong toán học như l
Trang 1Tiểu luận: KỸ THUẬT XỬ LÝ HÌNH THÁI HỌC CỦA ẢNH
I Giới thiệu:
Hiện nay, các kỹ thuật xử lý ảnh số trên máy tính đang được rất nhiều nhà nghiên cứu quantâm và phát triển, trong đó có xử lý hình thái học trên ảnh Bởi vì xử lý hình thái học trên ảnhcung cấp cho chúng ta những mô tả định lượng về cấu trúc và hình dạng hình học của các đốitượng trong ảnh dựa trên những lý thuyết trong toán học như lý thuyết tập hợp, hình học tôpô,xác suất, v.v và nó đang được ứng dụng rộng rãi trong nhiều ứng dụng như phát hiện biên, phânđoạn đối tượng, giảm nhiễu, tìm xương ảnh v.v Trong các ứng dụng thị giác máy tính, xử lýhình thái học có thể được sử dụng để nhận dạng đối tượng, nâng cao chất lượng ảnh, phân đoạnảnh và kiểm tra khuyết điểm trên ảnh Các phép toán xử lý hình thái học được thực hiện chủ yếutrên ảnh nhị phân và ảnh xám Những thành phần chính của ảnh nhị phân là các thành tố cấu trúctrong không gian 2 chiều
Ảnh nhị phân hay còn được gọi là ảnh đen trắng tương ứng với hai giá trị 0 (màu trắng) và 1(màu đen) Ảnh xám là ảnh mà tại mỗi điểm ảnh có giá trị cường độ sáng nằm trong khoảng [0,255]
II Tổng quan:
Hình thái học được xây dựng dựa trên cơ sở lý thuyết tập hợp Các tập hợp đại diện cho cácđối tượng trong một hình ảnh Ví dụ, một tập hợp của tất cả các điểm trắng trông một ảnh nhịphân là một mô tả hình thái hoàn hảo của một ảnh
Trong hình ảnh nhị phân, các tập hợp là các thành viên của không gian số nguyên 2 chiều Z2,trong đó mỗi phần tử của một tập hợp là một bộ (vector 2 chiều) có tọa độ là (x, y) là tọa độ củamột điểm ảnh trắng hoặc đen trong ảnh
Các ảnh xám có thể được biểu diễn như là các tập, nơi mỗi thành phần có trong không gian 3chiều Z3: hai thành phần là tọa độ của một điểm ảnh, và thành phần thứ ba là giá trị cường độ rờirạc của ảnh
Một vài phép toán cơ bản của tập hợp
- Cho tập A xác định trong Z2, nếu a=(a1,a2) là một phần tử của A thì a A, nếu a khôngnằm trong A thì a A
- Nếu A là con B thì A chứa trong B A B
- Phép hợp 2 tập hợp: C AB
- Phép giao 2 tập hợp: D A B
- Nếu A và B không có phần tử nào chung thì: AB
- Phần bù của tập A, ký hiệu là AC là tập hợp các phần tử không chứa trong A
- Phần sai khác của hai tập A và B, ký hiệu A-B, được định nghĩa
- Phản chiếu của tập B, ký hiệu B^
- Chuyển vị của tập A bởi z=(z1,z2) ký hiệu (A)z
Trang 2Hình 1 Ví dụ cơ bản về các phép toán tập hợp
Hình 2 Ba phép toán logic cơ bản trên tập hợp
Các phép toán luận lý liên quan đến ảnh nhị phân:
Phần lớn các ứng dụng dựa trên các khái niệm về hình thái học đã thảo luận trong chương nàyliên quan đến hình ảnh nhị phân Phép toán logic, mặc dù đơn giản nhưng, cung cấp một công cụ
bổ sung mạnh mẽ để thực hiện các thuật toán xử lý hình ảnh dựa trên hình thái học Các phéptoán logic đã được giới thiệu trong phần trước Trong phần này, chúng ta quan tâm các phép toánlogic liên quan đến ảnh nhị phân
Các phép toán logic chính được sử dụng trong xử lý hình ảnh là các phép AND, OR và NOT(phép bù) Các phép toán này có khả năng kết hợp để tạo bất kỳ một phép toán logic khác
Phép toán logic được thực hiện trên một điểm ảnh theo từng điểm ảnh giữa các điểm ảnhtương ứng của hai hoặc nhiều hình ảnh (ngoại trừ phép NOT, hoạt động trên các điểm ảnh củamột hình ảnh duy nhất) Vì phép AND của hai biến số nhị phân 1 luôn có giá trị là 1, kết quả ở vịtrí nào trong một kết quả hình ảnh luôn là 1 chỉ khi các điểm ảnh tương ứng trong hai hình ảnhđầu vào là 1 Hình 9.3 dưới cho thấy những ví dụ khác nhau của hoạt động logic liên quan đếnhình ảnh, nơi màu đen cho thấy một số nhị phân 1 và màu trắng cho thấy một 0 ( Chúng tôi sửdụng cả hai công ước trong chương này, đôi khi đảo ngược ý nghĩa nhị phân của bóng tối [ đenhoặc màu xám] chống ánh sáng [trắng] , tùy thuộc vào đó là rõ ràng hơn trong một tình huốngnhất định) Ví dụ, phép XOR mang lại một 1 khi một hoặc các điểm ảnh khác ( nhưng không phải
cả hai ) có giá trị là 1, và nó mang giá trị 0 nếu ngược lại Phép toán này không giống như phép
Trang 3OR, đó là 1 khi một hoặc các điểm ảnh khác là 1, hoặc khi cả hai điểm ảnh là 1 - Tương tự,không- và hoạt động lựa chọn các điểm ảnh màu đen đồng thời là trong B , và không trong A.Điều quan trọng cần lưu ý là các hoạt động logic vừa mô tả có một sự tương ứng một-một vớicác hoạt động tập hợp thảo luận tại mục 9.1.1 với hạn chế rằng hoạt động logic được giới hạn chocác biến nhị phân, mà không phải là trường hợp chung của phép toán.Vì thế, ví dụ, các hoạt độnggiao trong lý thuyết tập hợp giảm đến và hoạt động khi biến có liên quan là nhị phân Thuật ngữnhư giao và AND thường được sử dụng thay thế cho nhau trong các tài liệu để chỉ chung các hoạtđộng thiết lập nhị phân, với ý nghĩa nói chung là rõ ràng.
Hình 3 Các phép toán logic trên tập hợp
III Thành phần cấu trúc ảnh (SE)
Ngoài các định nghĩa lý thuyết tập hợp cơ bản, sự phản chiếu của một tập B được định nghĩa:
Bˆ = {w| w = −b, for b∈B}
Nếu B là một tập hợp các pixel (điểm 2D) đại diện cho một đối tượng trong một hình ảnh, thìphản chiếu của nó là tập hợp các điểm trong B, mà tọa độ (x, y) được thay thế bằng (-x,-y) nhưdưới đây Sự chuyển vị của một tập hợp B bằng điểm z =(z1, z2), ký hiệu là (B)z được địnhnghĩa:
Nếu B là tập hợp các pixel, (B)z là tập các điểm mà có tọa độ (x, y) được thay thế bằng (x + z1, y+ z2)
Trang 4
Sự phản chiếu (reflection) và truyền dẫn (transmission) được sử dụng rộng rãi để xây dựnghoạt động dựa trên các thành phần cấu trúc (SEs): một tập hợp nhỏ của các ảnh con sử dụng đểthăm dò một hình ảnh đã được phân tích cho các tính chất cần quan tâm
Ví dụ về các thành phần cấu trúc: vuông bóng mờ biểu thị một thành viên của SE
Nguồn gốc của các thành tố cấu trúc được đánh dấu bằng một dấu chấm đen
Khi làm việc với hình ảnh, các thành tố cấu trúc SE là hình chữ nhật: thêm số lượng nhỏ nhấtcác yếu tố ảnh nền
Tập A được điền các hình nền el-ts để tạo một mảng hình chữ nhật
Trang 5Thành phần cấu trúc (SE) như là một mảng:
Quá trình xử lý tập hợp bằng SE:
Các hoạt động: tạo ra một tập mới bằng cách chạy B trên A sao cho gốc của B truy cập mọiphần tử của A; tại mỗi điểm của gốc B, nếu B hoàn toàn chứa trong A, đánh dấu vị trí đó như mộtthành viên của một tập mới Kết quả là, các biên của A được xói mòn
IV Các phép toán xử lý hình thái học của ảnh:
Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ bản là phép toán coảnh (Erosion) và giãn ảnh (Dilation) Yếu tố quan trọng trong các phép toán này là lựa chọn mộtphần tử cấu trúc có hình dáng phù hợp
1 Phần tử cấu trúc
Đối với ảnh nhị phân, phần tử cấu trúc hay thành phần cấu trúc (SE) là một ảnh có kích thướcnhỏ gồm có hai giá trị 0 và 1, các giá trị bằng 0 được bỏ qua trong quá trình tính toán, gọi H(i, j)
là phần tử cấu trúc của ảnh nhị phân và được thể hiện như sau:
Một số hình dáng của phần tử cấu trúc thường được sử dụng trên ảnh nhị phân: dạng đườngtheo chiều ngang và dọc, hình vuông, hình ellipse,
Hình 4: Một số hình dáng của phần tử cấu trúc phẳng
Trang 6Đối với ảnh xám, phần tử cấu trúc là không phẳng, tức là các phần tử cấu trúc sử dụng các giátrị 0 và 1 để xác định phạm vi của phần tử cấu trúc trong mặt phẳng x và mặt phẳng y và thêm giátrị độ cao để xác định chiều thứ ba.Cấu trúc phần tử không phẳng gồm có hai phần:
Phần thứ nhất: Một mảng hai chiều gồm có các giá trị 0 và 1, trong đó giá trị bằng 1 xác định
hàng xóm của phần tử cấu trúc
Hình 5 Một mặt nạ xác định hàng xóm của phần tử cấu trúc không phẳng
Phần thứ hai: Một mảng hai chiều có kích thước bằng với kích thước của mảng hai chiều ở phần
thứ nhất nhưng chứa các giá trị thực của phần tử cấu trúc
Hình 6 Ma trận giá trị thực tương ứng với hâng xóm trong phần tử cấu trúc không phẳng.
2 Phép co ảnh – Erosion
Xét tập hợp A vâ tập hợp B (Phần tử cấu trúc), phép co ảnh nhị phân của tập hợp A bởi
phần tử cấu trúc B được kí hiệu A⊖B và viết dưới dạng công thức như sau:
Vì “B phải được chứa trong A” tương đương với “B không chia sẻ bất cứ thành phần chungnào với nền”, do đó việc co ảnh có thể được mô tả bằng hình thức sau:
Với Ac là phần bù của A và là tập rỗng
Phép co ảnh nhị phân của tập hợp A bởi phần tử cấu trúc B là tập hợp các điểm z (z nằm ởtâm điểm của phần tử cấu trúc B) sao cho Bz lâ tập con của A
Trang 7Hình 7 Ví dụ về phép toán co ảnh nhị phân với phần tử cấu trúc phẳng.
Phép toán co ảnh của ảnh xám I với cấu trúc phần tử không phẳng H tại vị trí (x, y) của ảnh I
được xác định như sau:
(I⊖H)(x, y) = min(I(x+i, y+j) - H(i, j) | (i, j) D H )
Hình 8 Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không phẳng.
Trong đó, DH là không gian ảnh của phần tử cấu trúc không phẳng H
Trang 8Gọi A là ảnh gốc, B là một phần tử cấu trúc Phép giãn nhị phân của ảnh A với phần tử cấu
trúc B được kí hiệu A+B và chúng ta có thể biểu diễn phép toán giãn ảnh dưới dạng phép toán tổhợp như sau:
Hay:
Phép giãn ảnh nhị phân của tập A bởi phần tử cấu trúc B lâ tập hợp của các điểm z (z là tâmcủa phần tử cấu trúc B trên tập A) sao cho phản xạ của Bz giao với tập A tại ít nhất một điểm
Trang 9Hình 11 Ví dụ về phép giãn nhị phân trên ảnh với phần tử cấu trúc phẳng.
Phép toán giãn ảnh của ảnh xám I với cấu trúc phần tử không phẳng H tại vị trí (x, y) của ảnh I
được xác định như sau:
(I+H)(x, y) = max(I(x+i, y+j)+H(i, j) | (i, j) D H )
Hình 12 Phép toán giãn ảnh trên ảnh xám với phần tử cấu trúc không phẳng.
Trong đó, DH là không gian ảnh của phần tử cấu trúc không phẳng H
Có những định nghĩa khác của sự giãn nở quá Tuy nhiên, các phương trình trước là trực quanhơn khi xem các yếu tố cấu trúc như một mặt nạ chập Chúng ta cần phải nhớ rằng sự giãn nởđược dựa trên các hoạt động thiết lập và do đó là một hoạt động phi tuyến, trong khi chập làtuyến tính
Không giống như sự co ảnh, sự giãn nở "phát triển" hay "làm dày" đối tượng trong một hìnhảnh nhị phân Cách thức và mở rộng sự tăng trưởng này là hình ảnh kiểm soát các yếu tố cấu trúc
Trang 10Hình 13 Phương pháp giãn ảnh
Một trong những ứng dụng đơn giản cho sự giãn nở ảnh là thu hẹp khoảng cách
Hình 14 Ví dụ đơn giản về sự giãn nở ảnh
Thành phần cấu trúc B sử dụng:
Trang 114 Phép đối ngẫu - Duality
Phép co ảnh và sự giãn nở ảnh thiết lập cho phần bù và phản chiếu của ảnh:
Sự co ảnh của A bằng B là sự bổ sung của sự giãn nở ảnh bổ sung của A bởi sự phản chiếucủa B và ngược lại
Tính hai mặt đặc biệt hữu ích khi các thành phần cấu trúc đối xứng liên quan đến nguồn gốccủa nó với, do đó B^ = B Chúng ta có thể có được sự co ảnh của một hình ảnh của B chỉ đơngiản bằng cách làm giãn nở nền tảng ảnh của nó (bù của A) với các yếu tố cấu trúc tương tự và
bổ sung kết quả
Để chứng minh tính hợp lệ của nguyên tắc nhị nguyên, chúng ta bắt đầu với định nghĩa co ảnh
Nếu tập (B)z chứa trong A, thì và
Nhưng phần bù của tập các giá trị của z thỏa mãn phương trình đầu tiên là:
5 Phép mở ảnh và đóng ảnh – Openning & Closing
Như chúng ta đã thấy, sự giãn nở mở rộng các thành phần của một hình ảnh trong khi sự coảnh co lại chúng Việc mở ảnh thường làm mềm các đường viền của một đối tượng và loại bỏnhững chỗ lồi lõm mỏng
Phép đóng ảnh cũng có xu hướng làm mịn các đường nét, loại bỏ các lỗ nhỏ và điền nhữngkhoảng trống trong các đường viền
Việc mở một tập A bởi cấu trúc thành phần B được định nghĩa là
Vì vậy, việc mở A bằng B là sự co ảnh của A bằng B, theo sau là một sự giãn nở ảnh kết quảcủa B Tương tự như vậy, việc phép đóng một tập hợp A bởi cấu trúc thành phần B được địnhnghĩa là:
Do đó, phép đóng A bằng B là sự giãn nở của A bằng B, tiếp theo là sự co ảnh kết quả của B
Trang 12Giả sử B là một quả bóng phẳng tròn lăn Sau đó, ranh giới của việc mở được xác định bởicác điểm trong B đạt được xa nhất vào ranh giới của A là B được cuộn xung quanh bên trongranh giới này.
Các hình học "phù hợp" tài sản của các phép mở dẫn đến một công thức thiết lập lý thuyết nóirằng phép mở của A bởi B có thể thu được bằng cách lấy sự kết hợp của tất cả các phép dịch B làphù hợp vào A:
Với U {.} biểu thị sự kết hợp của tất cả các bộ bên trong dấu ngoặc
Phép đóng có một cách hiểu hình học tương tự, ngoại trừ việc chúng ta lăn B ở bên ngoài ranhgiới
Một tập hợp A; các yếu tố cấu trúc là một đĩa:
Sự co ảnh A bởi B:
Giãn nở của các tập A bị co bởi B Kết quả là mở đầu cho A bởi B
Trang 13Giãn nở A bởi B:
Sự co của tập A giãn ra bởi B Kết quả là giá trị gần giống của A bằng B
Phép đóng và phép mở cũng liên quan với nhau trong việc thiết lập phần bù và phản chiếu củaảnh:
Các phép mở đáp ứng được các thuộc tính sau:
1) Mở A bằng B là một tập hợp con (subimage) của A
2) C là một tập hợp con của D, sau đó C◦ B là một tập hợp con của D ◦ B
3) (A ◦ B) ◦ B = A ◦ B
Các phéo đóng đáp ứng các đặc tính sau:
1) là một tập hợp con (subimage) của phép đóng của A bằng B
2) Nếu C là một tập hợp con của D, C • B là một tập hợp con của D • B
3) (A • B) • B = A • B
Điều kiện cuối cùng trong cả hai trường hợp nói rằng nhiều lỗ hoặc đóng của một tập không
có hiệu lực sau khi các phép toán đã được áp dụng một lần Hoạt động hình thái học có thể được
sử dụng để xây dựng các bộ lọc khái niệm tương tự như các bộ lọc không gian
Hình vẽ dưới đây mô tả việc mở và đóng một hình ảnh nhị phân
Trang 14Hình 15 Phép mở và đóng ảnh
Nhiễu xung quanh đã bị loại bỏ trong quá trình co ảnh vì tất cả các thành phần nhiễu nhỏ hơn
so với các yếu tố cấu trúc Tối ưu yếu tố điểm nhiễu có trong dấu vân tay tăng kích thước Mởrộng này không được sử dụng do bằng cách thực hiện sự giãn nở đã làm giảm hoặc hoàn toàn xóanhiễu này
Các phép toán này tương đương với phép mở, có hiệu lực là để loại bỏ gần như tất cả nhiễutrong hình ảnh Tuy nhiên, khoảng cách mới giữa các sống vân tay được tạo ra Để chống lại hiệuứng này, một sự giãn ảnh về phép mở đã được thực hiện
Hầu hết các lỗi đã được khôi phục nhưng các sống ảnh đã dày lên, có thể được hiệu chỉnh bởi
sự co ảnh Kết quả là tương đương với phép đóng của phép mở
6 Phép biến hình Hit or Miss
Các hình thái biến đổi hit-or-miss là một công cụ cơ bản để phát hiện hình dạng ảnh Chúngtôi giới thiệu khái niệm này với sự trợ giúp của hình 9.12, trong đó cho thấy một tập hợp A gồm
ba hình dạng (tập con), ký hiệu là X, Y và Z bóng trong hình 9,12 (a) đến (c) cho thấy các bộban đầu, trong khi bóng trong hình 9,12 (d) và (e) cho thấy kết quả của hoạt động hình thái Mụctiêu là để tìm vị trí của một trong những hình dạng, nói, X
Hãy để cho nguồn gốc của mỗi hình dạng được đặt tại trung tâm của lực hấp dẫn Để cho A
"được bao bọc bởi một cửa sổ nhỏ, W nền địa phương của X đối với W được định nghĩa là sựkhác biệt thiết lập (W - X) , Như thể hiện trong hình 9.12 (b) Hình 9.12 (c) cho thấy bổ sung của
A, đó là cần thiết sau này Hình 9.12 (d) cho thấy sự xói mòn của A bằng X (các đường đứt nétđược bao gồm tài liệu tham khảo) Nhớ lại rằng sự xói mòn của A bằng X là tập hợp các địa điểm
về nguồn gốc của X, như vậy mà X là hoàn toàn có trong A Giải nghĩa một cách khác, A © X cóthể được xem như hình học tập của tất cả các địa điểm về nguồn gốc của Xát mà Xfound một trậnđấu (hit) trong A Hãy nhớ rằng trong hình 9 * chỉ có 12 A gồm ba bộ phân chia X, Y và Z
Trang 15Hình 9.12 (e) cho thấy sự xói mòn của phần bù của A bằng cách thiết lập nền địa phương (W
- A ') Các khu vực bóng mờ bên ngoài trong hình 9,12 (e) là một phần của sự xói mòn Chúngtôi lưu ý từ Hình 9,12 (d) và (e) là một tập các địa điểm mà một chính xác phù hợp với bên A làgiao điểm của sự xói mòn của A bằng X và sự xói mòn của Ac bằng (W - X) như hình 9.12 (f).Ngã tư này được chính xác vị trí tìm kiếm Nói cách khác, nếu B là tập gồm X và nền tảng của
nó, các trận đấu (hoặc thiết lập các trận đấu) của B trong A, ký hiệu là A, B ®, là
Chúng ta có thể khái quát hóa các ký hiệu phần nào bằng cách cho phép B = (B1, B2), nơi B1
là tập hợp hình thành từ các yếu tố của B kết hợp với một đối tượng và B2 là tập các phần tử của
B kết hợp với nền tảng tương ứng Từ các cuộc thảo luận trước đó, B1 và B2 = X = (W - X) Với
ký hiệu phương trình này (9,4-1) trở nên
Vì vậy, thiết lập một ® B chứa tất cả các điểm (bản gốc) mà tại đó, đồng thời, Bx tìm thấymột trận đấu ("hit") trong A và B2 tìm thấy một trận đấu trong Ac Bằng cách sử dụng định nghĩacủa sự khác nhau tập hợp trong phương trình (9,1-8) và mối quan hệ giữa hai xói mòn và giãn nởđược đưa ra trong phương trình (9,2-4), chúng ta có thể viết phương trình (9,4-2) như
Tuy nhiên, phương trình (9,4-2) được coi là trực quan hơn Chúng tôi đề cập đến một trong
ba phương trình trước đó như các hình thái hit-or-miss biến đổi
Lý do cho việc sử dụng một yếu tố cấu trúc liên quan với các đối tượng và một phần tử B2 kếthợp với nền dựa trên một định nghĩa cho rằng hai hoặc nhiều đối tượng là khác biệt nếu chúngtạo thành phân chia bộ (ngắt kết nối) Điều này được đảm bảo bằng cách yêu cầu mỗi đối tượng
có ít nhất một nền tảng một điểm ảnh dày xung quanh nó Trong một số ứng dụng, chúng ta cóthể quan tâm trong việc phát hiện các mẫu nhất định (kết hợp) của 1 và 0 trong một tập hợp,trong trường hợp một nền tảng là không cần thiết Trong trường hợp như vậy, biến đổi hit-or-miss làm giảm xói mòn đơn giản Như đã trình bày trước đây, xói mòn vẫn là một tập hợp cáctrận đấu, nhưng mà không có yêu cầu bổ sung của một trận đấu nền tảng để phát hiện đối tượng
cá nhân Chương trình phát hiện mô hình đơn giản hóa này được sử dụng trong một số thuật toánphát triển trong phần sau