Tìm hiểu phép toán hình thái, phương pháp di truyền và ứng dụng

Trang 1

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

LUẬN VĂN THẠC SỸ KỸ THUẬT

ĐỀ TÀI: TÌM HIỂU PHÉP TOÁN HÌNH THÁI, PHƯƠNG PHÁP DI TRUYỀN VÀ ỨNG DỤNG

HỌC VIÊN THỰC HIỆN: PHẠM ĐĂNG TỨ

GIÁO VIÊN HƯỚNG DẪN: PGS.TS NGÔ QUỐC TẠO

THÁI NGUYÊN – NĂM 2009

Trang 2

Trong lời đầu tiên của báo cáo luận văn tốt nghiệp “Tìm hiểu phép toán hình

thái, phương pháp di truyền và ứng dụng” này, tôi muốn gửi những lời cảm ơn và

biết ơn chân thành của mình tới tất cả những người đã hỗ trợ, giúp đỡ tôi về chuyên môn, vật chất và tinh thần trong quá trình thực hiện luận văn

Trước hết, tôi xin chân thành cảm ơn PGS TS Ngô Quốc Tạo thuộc viện Công nghệ thông tin, người đã trực tiếp hướng dẫn, nhận xét, giúp đỡ tôi trong suốt quá trình thực hiện luận văn

Xin chân thành cảm ơn Khoa Công nghệ thông tin, Viện Công nghệ thông tin đã giúp đỡ tôi trong suốt quá trình học tập và nghiên cứu

Tôi cũng xin bày tỏ lòng biết ơn đến gia đình và những người bạn thân đã giúp đỡ, động viên tôi rất nhiều trong suốt quá trình học tập và làm luận văn tốt nghiệp

Do thời gian thực hiện có hạn, kiến thức chuyên môn còn nhiều hạn chế nên đồ án tôi thực hiện chắc chắn không tránh khỏi những thiếu sót nhất định Tôi rất mong nhận được ý kiến đóng góp của thầy, cô giáo và các bạn

Xin chân thành cảm ơn !

Thái Nguyên, tháng 11/2009 Phạm Đăng Tứ

Trang 3

MỤC LỤC DANH MỤC CÁC HÌNH VẼ

Chương I Giới thiệu chung về xử lý ảnh và phương pháp nâng

Trang 4

Chương IV: Một cách tiếp cận di truyền trong bài toán phân rã

Trang 5

DANH MỤC CÁC HÌNH VẼ

Hình I.1 Sơ đồ quy trình xử lý ảnh 8

Hình I.2 Mô hình tổng quát của hệ thống nhận dạng ảnh 13

Hình II.1.3 Các phép toán cơ bản trên tập hợp 19

HÌnh II.1.4 Các phép toán cơ bản 20

Hình II.2.2 Ứng dụng của phép toán dilation 22

Hình II.2.3 Loại bỏ thành phần nhiễu 23

Hình II.2.6 Phép toán Opening và Closing 25

Hình II.2.7 Xử lý nhiễu trong ảnh vân tay 26

Hình II.2.8 Phép toán Hit ỏ Miss 27

Hình II.3.2 Ảnh được trích chọn biên 30

Hình II.3.3 Ví dụ thuật toán tô miền 31

Hình II.3.4 Tìm các thành phần liên thông trong ảnh 32

Hình II.3.5 Xác định vật thể lạ trong ảnh 33

Hình III.1 Mô phỏng quá trình tiến hóa 40

Hình III.6 Đột biến tại bít thứ 6 44

Trang 6

Hình III.7 Mô tả hoạt động thuật toán 45

Hình IV.2 Ví dụ về cắt và ghép nối 58

Trang 7

LỜI NÓI ĐẦU

Trong thực tế, hình dạng thường được chú trọng hơn kích thước và con người nhận ra các đối tượng xung quanh chủ yếu thông qua hình dạng Chính vì vậy, biểu diễn hình dạng là một vấn đề quan trọng và không thể thiếu trong quá trình nhận dạng đối tượng

Xử lý ảnh quan tâm chủ yếu đến việc trích chọn các thông tin hữu ích từ trong ảnh Các thuật toán xử lý ảnh được phân ra làm 3 mức Mức thấp nhất là các phương pháp thao tác trực tiếp với các dữ liệu thô, các giá trị điểm ảnh có thể bị nhiễu Mức thứ hai là tận dụng các kết quả ở mức 1 để đưa ra các kết quả tốt hơn như: phân đoạn ảnh, liên kết ảnh Mức thứ ba là các phương pháp trích trọn ngữ nghĩa các thông tin dựa trên các kết quả của các mức thấp hơn, ví dụ như: nhận dạng chữ viết tay, nhận dạng mặt người

Toán học hình thái (Mathematic Morphology) là một lĩnh vực riêng biệt trong xử lý ảnh Không giống như các cách tiếp cận khác thiên về toán học tính toán, MM dựa trên cấu trúc và hình dạng, dùng các toán hình thái cơ bản để làm đơn giản ảnh nhưng vẫn giữ lại những đặc trưng chính MM còn là một công cụ cơ bản để trích chọn các thành phần ảnh, như biên ảnh, xương ảnh, rất hữu dụng cho việc biểu diễn các các vùng khác nhau trên một ảnh Những kỹ thuật dùng toán hình thái như lọc ảnh, làm mảnh ảnh hay làm dầy ảnh có sử dụng toán học hình thái cũng được sử dụng trong quá trình tiền xử lý ảnh Ngoài ra, một trong các ứng dụng quan trọng mà tôi đề cập chính trong luận văn này là: Phân rã phần tử cấu trúc thành các phần tử cấu trúc nhỏ hơn Phần tử cấu trúc là phần tử tham gia trong các phép toán hình thái, và việc phân rã phần tử cấu trúc hoặc nói một cách khác là ma trận điểm ảnh có ba lợi ích quan trọng: Thứ nhất, làm giảm phép toán trong các ứng dụng mà phần tử đó tham gia Thứ hai, giảm không gian lưu trữ ảnh Thứ ba, đối với

Trang 8

các hệ thống chỉ hỗ trợ tập lệnh SIMD trên các phần tử nhỏ hơn nhiều phần tử cấu trúc, thì việc phân rã phần tử cấu trúc thành các phần tử cấu trúc nhỏ hơn là cần thiết

Trong khuôn khổ của luận văn này tôi đi tìm hiểu các khái niệm cơ bản về toán học hình thái như phép toán làm béo, làm gầy dựa vào cấu trúc mẫu, một số thuật toán dựa trên phép toán hình thái; Tìm hiểu về thuật toán di truyền, lai ghép, đột biến tái sinh và lựa chọn, phương pháp phân rã phần tử cấu trúc mẫu dựa trên thuật toán di truyền vv Bố cục của luận văn được tổ chức như sau:

Chương I Giới thiệu chung về xử lý ảnh và phương pháp nâng cao

chất lượng hình ảnh

Chương II: Trình bày các khái niệm cơ bản về toán học hình thái Chương III: Trình bày các khái niệm liên quan đến thuật toán di truyền

Chương IV: Giải quyết bài toán phân rã phần tử cấu trúc bằng phương

pháp tiếp cận ngẫu nhiên dựa trên thuật toán di truyền

Chương V: Trình bày kết quả thực nghiệm

Trang 9

CHƯƠNG I GIỚI THIỆU CHUNG VỀ XỬ LÝ ẢNH VÀ PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH 1 Giới thiệu chung về xử lý ảnh

Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên Mục đích của xử lý ảnh gồm:

- Mô tả tham số (nhận dạng theo tham số) - Mô tả theo cấu trúc (nhận dạng theo cấu trúc)

Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu

Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh Kỹ thuật này được sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể)

Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu) Nhận dạng chữ in hoặc đánh máy trong văn bản

Trang 10

phục vụ cho việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính, Nhận dạng chữ viết tay (với múc độ ràng buộc khác nhau về cách viết, kiểu chữ,

Các quá trình của xử lý ảnh:

Các quá trình của xử lý ảnh được tiến hành theo sơ đồ sau:

Hình I.1 Sơ đồ quy trình xử lý ảnh

Trước hết là qúa trình thu nhận ảnh Ảnh có thể thu nhận qua camera Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device)

Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, tranh được quét qua scanner Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại

Trang 11

Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết là công việc tăng cường hình ảnh (Image Enhancement) để nâng cao chất lượng hình ảnh Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến Do vậy cần phải tăng cường và khôi phục (Image Restoration) lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng Giai đoạn tiếp theo là phát hiện các đặc tính như biên (Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc tính (Feature Extraction),v.v

Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác Các giai đoạn chính của quá trình xử lý ảnh có thể mô tả ở hình I.1

2 Giới thiệu ảnh nhị phân

Như đã giới thiệu ở trên Trong quá trình xử lý ảnh, một ảnh thu nhập vào máy tính phải được mã hoá Hình ảnh khi lưu trữ dưới dạng tập tin phải được số hoá Tiêu chuẩn đặt ra là ảnh phải lưu trữ thế nào sao cho các ứng dụng khác nhau có thể thao tác trên các loại dữ liệu này Hiện nay có trên 30 kiểu lưu trữ ảnh khác nhau, trong đó ta thường gặp các dạng ảnh sau: TIFF, GIF, BMP, PCX, JPEG, Nói chung mỗi kiểu lưu ảnh có ưu điểm riêng

2.1 Một số khái niệm

* Pixel (Picture Element): Phần tử ảnh

Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh Trong quá trình số hoá, ngươì ta biến đổi tín hiêụ liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị mà về nguyên tắc, mắt thường không phân biệt được hai điểm kề nhau

Trang 12

Trong quá trình này, người ta sử dụng khái niệm Picture Element mà ta quen gọi hay viết là pixel - phần tử ảnh Như vậy một ảnh là một tập hợp các pixel Ở đây cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ hoạ máy tính Để tránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết bị Khái niệm pixel thiết bị có thể xem xét như sau: Khi ta quan sát màn hình (trong chế độ đồ hoạ), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel Mỗi pixel gồm một cặp toạ độ x,y và màu

* Ảnh nhị phân

Tuỳ theo vùng các giá trị mức xám của điểm ảnh, mà các ảnh được phân chia ra thành ảnh màu, ảnh xám, hay ảnh nhị phân Khi trên một ảnh chỉ có giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các điểm ảnh của nó gọi là điểm ảnh nhị phân

* Với ảnh xám

Nếu dùng 8 bít (1 byte) để biểu diễn mức xám thì số các mức xám có thể biểu diễn được là 28 hay 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn chúc mức cường độ tối nhất và mức 255 biểu diễn cho mức cường độ sáng nhất

* Với ảnh mầu

Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba mầu riêng rẽ gồm: đỏ(red), lục(green) và lam(blue) Để biểu diễn cho một điểm ảnh mầu cần 24 bít, 24 bít này được chia thành ba khoảng 8 bít Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các mầu chính tổ hợp của các mầu ta được nhiều mức biểu diễn, như vậy mỗi điểm ảnh có thể được mô tả rõ giá trị màu tự nhiên của nó (true color)

Trang 13

* Ảnh đa cấp xám

Ảnh đa cấp xám được áp dụng tronh nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh mức xám cũng ứng dụng được trên ảnh mầu Ta có thể biến đổi ảnh mầu về ảnh xám Mỗi điểm ảnh mầu có 3 giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thi ta có màu xám(Grey), khi đó với mỗi điểm ảnh ta chỉ cần lưu 1 giá trị

Việc xử lý ảnh nhị phân là một bước tiền xử lý các ảnh, để phân đoạn và tách ra các đặc tính Nhờ vậy ta có thể biết được mối quan hệ tôpô giữa các điểm ảnh cũng như thực hiện các phép biến đổi ảnh không tuyến tính đạt hiệu quả; trong quá trình xử lý ảnh các phép biến đổi này dẫn đến sự đơn giản hóa việc đánh giá ảnh Việc đếm các điểm ảnh trên ảnh nhị phân đã qua biến đổi tạo điều kiện thuận lợi cho việc tách ra các đặc tính Bằng cách sử dụng các ảnh nhị phân đã qua xử lý như là những mặt nạ đối với các ảnh xám, ta có thể tách ra các vùng đáng quan tâm của một ảnh xám từ tập hợp các ảnh

Để tạo ra một ảnh nhị phân, một ảnh xám cần phải được biến đổi thành một ảnh nhị phân nhờ một quá trình phân đoạn thích hợp Muốn thế phương pháp đơn giản nhất là phương pháp tách ngưỡng Các giá trị nằm ở bên trên ngưỡng được gán giá trị 1 còn ở bên dưới ngưỡng thì được gán giá trị 0 Việc tìm giá trị ngưỡng có thể thực hiện tự động nhờ kỹ thuật tách ngưỡng tự động

2.2 Đặt bài toán nâng cao chất lƣợng ảnh bằng các phép toán hình thái

Hình ảnh trong thực tế khi nhận được qua các thiết bị như: Photocopy, Fax, ít nhiều đều bị nhiễu, thâm chí có thể biến dạng đến mức độ có thể khiến người nhận được hiểu sai về mặt ý nghĩa Như chúng ta đã biết trong các ngành Thiết kế kỹ thuật như: Thiết kế máy, Thiết kế xây dựng, Thiết kế mạch điện v.v dù là theo TCVN (tiêu chuẩn Việt Nam) hay ISO(International

Trang 14

Standard Oganize), một bản vẽ được thể hiện chỉ xoay quanh một số dạng đường như: đường thẳng, đường cong khép kín ,đường cong mở (có thể lồi hoặc lõm), các cung tròn, elip, đường ZigZag Các dạng đường như thế được biểu diễn bằng những nét vẽ Nét vẽ có thể là nét liền (Continuous), có thể là nét đứt (dash), có thể là nét chấm gạch như đường tâm (Center), có thể là đường khuất (Hide) (Hình 1.2) , Mỗi độ lớn (high) của nét vẽ (nét mảnh hoặc nét đậm), có khi thể hiện một ý nghiã khác nhau Như trong thể hiện của đường ren của một bulon chẳng hạn: Đường chân ren phải được thể hiện bằng một nét liền mảnh, trong khi đường đỉnh của ren lại phải thể hiện bằng một nét đậm Hoặc một đường khuất, sẽ thể hiện cho hình chiếu cuả một đường thuộc một mặt được nằm ở phía sau của một mặt khác theo góc nhìn vuông góc với mặt phẳng chiếu Trong khi đó, nét liền sử dụng để biểu diễn cho hình chiếu cuả đối tượng ở mặt trước đó

Do vậy, nếu như nét vẽ của một đường thẳng lẽ ra là một nét vẽ liền trong khi đó đường mà chúng ta nhận được lại là một nét đứt thì việc đọc các thông tin trên bản vẽ sẽ dẫn đến việc hiểu sai về mặt ý nghĩa là điều không tránh khỏi Để giải quyết bài toán này như: Nối liền những nét đứt, làm trơn biên ảnh các phép toán hình thái nhị phân đã ra đời, thông qua đó các phép đóng ảnh, mở ảnh cũng được định nghĩa để giải quyết bài toán nêu trên

Trang 15

2.3 Đặt bài toán nâng cao chất lượng ảnh bằng kỹ thuật tìm xương và làm mảnh

Trong xử lý ảnh và nhận dạng ảnh, có một số loại ảnh đường nét gồm các đối tượng (objects) là các đường cong có độ dài lớn hơn nhiều so với độ dày của nó, ví dụ như là ảnh các kí tự, dấu vân tay, sơ đồ mạch điện tử, bản vẽ kỹ thuật, bản đồ v.v Để xử lý các loại ảnh này người ta thường xây dựng các hệ mô phỏng theo cách phân tích ảnh của con người gọi là hệ thống thị giác máy (Computer Vision System) Có nhiều hệ thống được cài đặt theo phương pháp này như hệ thống nhận dạng chữ viết bằng thiết bị quang học OCR (Optical Character Recognition ), hệ thống nhận dạng vân tay AFIS (Automated fingerprint Identification System) v.v

Hình I.2 Mô hình tổng quát của hệ thống nhận dạng ảnh

Có nhiều phương pháp trích chọn đặc điểm được biết tới như phương pháp sử dụng sóng ngắn (Wavelet), sử dụng hệ số Fourier, sử dụng các mô men bất biến, sử dụng các đặc trưng của biên như tính trơn và các điểm đặc biệt, sử dụng các đặc trưng tô pô dựa trên xương của đường nét Phương pháp trích chọn đặc điểm sử dụng ảnh đã mảnh được sử dụng nhiều vì việc

Trang 16

trích chọn đặc điểm trở nên dễ dàng Sau bước này các đường nét đã mảnh được véctơ hoá ảnh phục vụ việc nén dữ liệu, nhằm giảm thiểu yêu cầu về

không gian lưu trữ, xử lý và thời gian xử lý Kỹ thuật làm mảnh là một trong

nhiều ứng dụng của phép toán hình thái học (Morphology) sẽ giải quyết một số vấn đề cuả bài toán nêu trên trong công đoạn tiền xử lý ảnh

3 Khái quát về phương pháp nâng cao chất lượng hình ảnh

Nâng cao chất lượng hình ảnh là một bước quan trọng tạo tiền đề cho xử lý ảnh Mục đích chính là nhằm làm nổi một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn ảnh, khuếch đại ảnh, tăng cường ảnh và khôi phục ảnh là hai quá trình khác nhau về mục đích

Tăng cường ảnh bao gồm một loạt các phương pháp nhằm hoàn thiện trạng thái quan sát của một ảnh Tập hợp các kỹ thuật này tạo nên giai đoạn tiền xử lý ảnh Nhiệm vụ của tăng cường ảnh không phải là làm tăng lượng thông tin vốn có trong ảnh mà làm nổi bật các đặc trưng đã chọn làm sao để có thể phát hiện tốt hơn, tạo thành quá trình tiền xử lý cho phân tích ảnh

Khôi phục ảnh nhằm khôi phục ảnh gần với ảnh thực nhất trước khi nó bị biến dạng do nhiều nguyên nhân khác nhau Khôi phục ảnh đề cập tới các kỹ thuật loại bỏ hay tối thiểu hóa các ảnh hưởng của môi trường hay các hệ thống thu nhận, phát hiện và lưu trữ ảnh đến ảnh thu nhận được Ở đây, ta có thể liệt kê các nguyên nhân biến dạng: do nhiễu bộ phận cảm nhận tín hiệu, ảnh mờ do Camera, nhiễu ngẫu nhiên của khí quyển, khôi phục ảnh bao gồm nhiều quá trình như: lọc ảnh, khử nhiễu nhằm làm giảm các biến dạng để có thể khôi phục lại ảnh gần giống ảnh gốc tùy theo các nguyên nhân gây ra biến dạng

Về nguyên tắc khôi phục ảnh nhằm xác định mô hình toán học của quá trình đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh

Trang 17

Việc xác định mô hình có thể thực hiện theo hai hướng: trước và sau Theo hướng thưc nhất, một mô hình sẽ được xây dựng từ các ảnh kiêm nghiệm để xác định đáp ứng xung của hệ thống nhiễu Theo hướng thứ 2 người ta thực hiện các phép đo trên ảnh Nói chung là mô hình không biết trước các mô

hình toán học dùng cho cả hai phương pháp là rất phức tạp

Trang 18

CHƯƠNG II: CÁC KHÁI NIỆM CƠ BẢN VỀ TOÁN HỌC HÌNH THÁI 1 Quan hệ giữa khái niệm tập hợp và phép toán hình thái

Toán học hình thái (MM) dựa trên khái niệm về tập hợp, và chính nhờ có khái niệm này mà toán học hình thái mang lại một cách tiếp mới cận đối với các bài toán xử lý ảnh Trong hầu hết các trường hợp, phép toán hình thái đều thể hiện một tính chất nào đó của phép toán liên quan đến khái niệm tập hợp Bằng các khái niệm đơn giản về phép toán hợp,giao, phần bù v.v, chúng ta có thể xây dựng các phép toán rất hữu ích cho các kỹ thuật xử lý ảnh

Ảnh số là sự biểu diễn ảnh dưới dạng tín hiệu tương tự hoặc tín hiệu số Trong biểu diễn số của các ảnh đa mức xám, tập hợp các điểm ảnh được biểu diễn dưới dạng một ma trận hai chiều Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường độ của ảnh tại vị trí đó, phần tử trong ma trận được gọi là một phần tử ảnh, thông thường kí hiệu là PEL (Picture Element) hoặc là điểm ảnh (Pixel)

Đối với ảnh nhị phân, ta ngầm định các điểm ảnh thể hiện đối tượng ảnh được mã hóa bởi các điểm ảnh có giá trị 1 Tương ứng với đó, nền sẽ được mã hóa bởi các điểm ảnh có giá trị 0

Hình II.1.1 Ảnh nhị phân

Trang 19

Mỗi một phần tử được đại diện bởi một bộ 3 phần tử (x1,x2,x3) tương ứng là toạ độ điểm ảnh và mức xám tại ảnh đó Hình II.1.2 mô tả một thể hiện đơn giản của ảnh đa cấp xám

Hình II.1.2 Ảnh đa cấp xám

Như vậy, ta đã hình dung được mối quan hệ giữa ảnh và khái niệm tập hợp Đối với mỗi ảnh thì sẽ có tương ứng một tập hợp thể hiện ảnh và ngược lại, từ một tập hợp, ta có thể dựng lại ảnh tương ứng

1.1 Một số khái niệm cơ bản về tập hợp

Giả sử A là một tập thuộc Z2 Nếu a = (a1,a2) là một phần tử của A, thì ta kí hiệu là:

aA

Trang 20

Tương tự như vậy, trong trường hợp a không phải là phần tử con của A thì kí hiệu:

aA

Tập hợp không chứa phần tử nào thì được gọi là tập rỗng

Trong khuôn khổ của luận văn này, chúng ta sẽ quan tâm tới khái niệm phần tử của một tập hợp trong phạm vi của ảnh nhị phân Ví dụ như khi ta viết C = w w d d,Dthì nghĩa là C là tập các phần tử, w là đối của các phần tử tương ứng của tập D qua gốc tọa độ

Nếu như với mọi phần tử A đều thuộc tập B thì ta nói rằng tập A là một tập con của tập B và kí hiệu là :

Trang 21

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình II.1.3 Các phép toán cơ bản trên tập hợp

Phần bù của tập A là tập tất cả các phần tử không thuộc A Ac = w wA

Hiệu của A vả B, kí hiệu là A-B được định nghĩa bởi

Trang 22

1.2 Các phép toán logic trên ảnh nhị phân

Phần lớn các ứng dụng trong chương này là đề cập tới ảnh nhị phân, các phép toán logic dù đơn giản nhưng cung cấp một cách thực thi hiệu quả để có thể triển khai các thuật toán xử lý ảnh dựa trên phép toán hình thái

Phép toán cơ bản nhất được sử dụng trong xử lý ảnh là : phép toán AND, phép toán OR và phép toán NOT Các tính chất của chúng được định nghĩa trong bảng dưới đây :

HìnhII.1.4 Các phép toán cơ bản

Trang 23

2 Phép toán làm béo (Dilation) và làm gầy (Erosion)

Ta bắt đầu thảo luận về phép toán hình thái, bước đầu xem xét 2 phép toán hình thái cơ bản: làm béo và làm gầy Đây là 2 phép toán cơ bản nhất và thực tế rằng đa số các thuật toán đều dựa trên 2 phép toán này

Hình II.2.1(a) thể hiện ảnh tham gia thuật toán làm béo, hình II.2.1(b) mô tả phần tử cấu trúc và tập ngược của nó( những điểm chấm đen mô tả các phần tử gốc) Trong trường hợp này phần tử cấu trúc và phần tử cấu trúc nghịch của nó trùng nhau do B đối xứng

Trang 24

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình II.2.1 Phép toán làm béo

Một trong các ứng dụng đơn giản nhất của phép toán làm béo là nối các nét đứt trong quá trình nâng cao chất lượng ảnh Hình II.2.2 dưới đây là một ví dụ ảnh với các kí tự đứt gãy do quá trình quét ảnh không được tốt hay do việc zoom ảnh quá lớn Độ dài lớn nhất của mỗi phần gãy trong ví dụ này là 2 pixel Ta có thể dùng một phần tử cấu trúc đơn giản để nối các nét đứt này lại với nhau Kết quả của việc thực hiện phép toán làm béo này là ảnh được khôi phục, các vết đứt gãy được thay thế bởi các điểm ảnh tạo cho các nét chữ được trơn và liên tục

HìnhII.2.2 Ứng dụng của phép toán dilation

Trang 25

2.2 Làm gầy

Cho tập A và B trong Z2, tập gầy của A gây bởi B được kí hiệu là

Một trong các ứng dụng đơn giản nhất của phép toán làm gầy là loại bỏ các thành phần dư thừa hay các thành phần nhiễu Hình II.2.3 mô tả một ảnh nhị phân được cấu tạo bởi các hình vuông với các kích thước là 1,2,5,7,9 và 15 điểm ảnh Bằng cách sử dụng phần tử cấu trúc với kích thước phù hợp và sử dụng phép toán làm gầy, chúng ta có thể loại bỏ các hình vuông điểm ảnh nhỏ (nhiễu) và giữ lại các hình vuông điểm ảnh với kích thước lớn (các thành phần chính của ảnh)

Hình II.2.3 Loại bỏ thành phần nhiễu

2.3 Phép toán Opening và Closing

Như chúng ta đã thấy, phép toán làm béo tăng kích thước của ảnh còn phép toán làm gầy giảm kích thước của ảnh Trong phần này, chúng ta sẽ bàn đến 2 trong những phép toán quan trọng nhất: Opening và Closing Opening ban đầu làm mịn đường biên của đối tượng sau đó loại bỏ các phần lồi ra Closing cũng nhằm mục đích làm mịn đường biên nhưng khác với phép toán Opening, phép toán Closing ban đầu sẽ làm dày đối tượng và sau đó mới thực hiện việc làm mịn biên của ảnh

Trang 26

Opening của tập A bởi phần tử cấu trúc B được ký hiệu là:

Hình II.2.4 Phép toán Opening

Ngược lại, phép toán Closing cũng có một thể hiện tương tự, nhưng bằng cách ngược lại Quả bóng sẽ được lăn ở phía ngoài cấu trúc hình học của A

Hình II.2.5 Phép toán Closing

Trang 27

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình II.2.6 Phép toán Opening

Một số tính chất cơ bản của phép toán opening:

Trang 28

Các phép toán hình thái còn được sử dụng để xây dựng các bộ lọc Ví dụ như trong bài toán nhận dạng vân tay người, ảnh cần nhận dạng có nhiễu (như thể hiện trong hình II.2.7(a) Các nhiễu là các chấm trắng nhỏ (khác với ví dụ trước, trong ví dụ này nội dung của ảnh được thể hiện bởi các điểm ảnh sáng còn nền là các điểm ảnh sẫm mầu) Mục tiêu của quá trình tiền xử lý ảnh trước khi nhận dạng là việc lọc các thành phần nhiễu nhưng đồng thời phải đảm bảo sự ảnh hưởng đến các thành phần vân tay ít nhất có thể Để lọc các thành phần nhiễu, ta sử dụng phần tử cấu trúc được mô tả trong hình II.2.7(b) Toàn bộ hình II.2.7 thể hiện từng bước của quá trình lọc ảnh Các nhiễu được hoàn toàn loại bỏ trong phép toán làm gầy ở giai đoạn đầu do kích thước của các điểm nhiễu là nhỏ hơn kích thước của phần tử cấu trúc và sau đó được khôi phục lại nguyên dạng như ảnh lúc đầu Chú ý rằng, sau quá trình này gần như toàn bộ các thành phần nhiễu đã bị lọc bỏ

Hình II.2.7 Xử lý nhiễu trong ảnh vân tay

Trang 29

2.4 Biến đổi Hit or Miss

Biến đổi Hit or Miss là một công cụ cơ bản để dò tìm ảnh Tôi giới thiệu khái niệm này với sự trợ giúp của hình I.2.8 Trong hình, tập A bao gồm 3 ảnh X, Y, Z mục tiêu là tìm vị trí của một trong 3 ảnh trên, giả sử là X

Giả sử gốc của mỗi ảnh là tại trung tâm của ảnh Giả sử X được bao bởi một cửa sổ nhỏ W Ta định nghĩa nền của tập X trên ảnh W là tập tất cả các điểm ảnh thuộc W mà không thuộc X, ký hiệu là W-X như được mô tả trong hình II.2.8(b) Trong hình II.2.8(c) mô tả phần bù của tập A Hình II.2.8(d) thể hiện tập A gầy Nhớ lại rằng tập gầy A bởi X là tập tất cả các vị trí của điểm gốc X sao cho X hoàn toàn nằm trong tập A Hiểu theo cách hình học thuần túy thì AӨX có thể coi như là tập hợp tất cả các điểm gốc của X mà tại đó X giao (match) với tập A Hình II.2.8 thể hiện việc làm gầy phần bù tập A bởi phần tử cấu trúc (W − X ) Phần tối phía ngoài trong hình II.2.8(e) là phần bị ăn mòn

Trang 30

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình II.2.8 Phép toán Hit or Miss

Chú ý rằng trong hình II.2.8(d) và (e), tập tất cả các vị trí mà X hoàn

bởi (W − X ) như trong hình II.2.8(f) Nói một cách khác nếu ký hiệu B là tập cấu thành lên X và nền của nó, tập các điểm phù hợp (match) của B trong A, ký hiệu là

được định nghĩa bởi:

Chúng ta có thể ký hiệu B=(B1, B2), trong đó B1 là tập được tạo thành

có dạng biến đổi khác:

3 Một số thuật toán dựa trên phép toán hình thái 3.1 Trích chọn biên

Biên của A được ký hiệu là β(A)

có thể đạt được bằng cách ban đầu làm gầy A bởi B sau đó thực hiện phép trừ A

Trang 31

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình II.3.1 Trích chọn biên

Mặc dù phần tử cấu trúc B ở trong ví dụ được cho bởi hình II.3.1 là một trong các phần tử cấu trúc được sử dụng nhiều nhất, tuy nhiên, tùy theo đặc điểm của ảnh cần được trích chọn, mà ta chọn các phần tử cấu trúc khác cho phù hợp Biên của hình A trong ví dụ này có độ dày là 1 điểm ảnh, nhưng với phần tử cấu trúc kích thước là 5 x 5, thì biên của A sẽ có độ dày là 2 và 3 điểm ảnh Như vậy, với các phần tử cấu trúc khác nhau thì cho ta kết quả khác nhau Do vậy, việc chọn các phần tử cấu trúc tuỳ thuộc vào mục tiêu cũng như các ứng dụng cụ thể

Hình II.3.2 cho ta một ứng dụng thuật toán tách biên cụ thể hơn Trong ví dụ này, phần tử 1 đại diện cho điểm ảnh trắng, phần tử 0 tương ứng với điểm ảnh đen Do phần tử cấu trúc là phần tử cấu trúc trong ví dụ ở hình II.3.1, cho nên biên của ảnh đạt được chỉ có kích thước là một điểm ảnh

Trang 32

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình II.3.2 Ảnh được trích chọn biên

3.2 Tô miền

Trong hình I.3.3, tập A chứa một tập con mà các phần tử liên thông 8 Xuất phát với một điểm p nằm bên trong, mục tiêu là tô toàn bộ miền có biên bởi các điểm đó

Ta xây dựng thuật toán như sau: 1

Trong đó X0=P và B là phần tử cấu trúc đối xứng như ở trên hình I.3.3

tập A và Xk

Trang 33

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Hình II.3.3 Ví dụ thuật toán tô miền

3.3 Tách các thành phần liên thông

Trong rất nhiều ứng dụng, việc phân tích ảnh đòi hỏi ta phải tách các thành phần liên thông để phục vụ cho tác vụ xử lý Ví dụ như trong ứng dụng nhận dạng mặt người, việc đầu tiên cần phải xử lý là phải tách các thành phần liên thông, sau đó thực hiện việc nhận dạng trên các thành phần đó

Giả sử A chứa thành phần liên thông Y và p là một điểm của Y đã được biết trước

Thuật toán được mô tả bởi phương trình sau:

Trang 34

lại, trong phương trình (II.3-2) thành phần bù của tập A tham gia thuật toán

Hình II.3.4 Tìm các thành phần liên thông trong ảnh

Thành phần liên thông được sử dụng rộng rãi trong chẩn đoán tự động Hình II.3.5(a) thể hiện ảnh X quang cấu trúc xương của một con cá Mục tiêu là phải xác định được vật lạ trong quá trình xử lý cá trước khi đóng gói và gửi đi Trong trường hợp này, các điểm ảnh thể hiện đối tượng (xương và vật lạ) có mật độ nhiều hơn so với mật độ các điểm ảnh cấu thành nền Như vậy dẫn tới mức xám của đối tượng so với nền của ảnh sẽ có sự chênh lệch Bằng cách đưa ra một ngưỡng đơn, ta có thể táchđược đối tượng ra khỏi nền Kết quả của quá trình tách nền được thể hiện trên hình II.3.5(b)

Đặc trưng quan trọng nhất của các hình phía dưới đó chính là các điểm cấu thành xương chứ không phải là các cô lập, các vật lạ Chúng ta có thể giả thuyết rằng chỉ có các điểm còn lại sau khi ta thực hiện phép toán làm gầy bởi phần tử cấu trúc 5x5 là thành phần của xương Kết quả của quá trình làm gầy là ảnh II.3.5(c) Chúng ta thực hiện việc đánh nhãn các đối tượng còn lại bằng cách tách các thành phần liên thông Có tất cả 15 thành phần liên thông trong

Trang 35

đó có 3 thành phần bị loại bỏ do kích thước quá nhỏ không có ý nghĩa Kết hợp với ảnh gốc ban đầu, ta dễ dàng xác định được vị trí của các vật lạ

{B} = {B1,B2, , Bn} Trong đó Bi

chính là phần tử Bi-1 nhưng được xoay đi Sử dụng khái niệm này, chúng ta có thể xây dựng quá trình làm mảnh bởi một dãy các phần tử cấu trúc

Trang 36

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn A ⊗ {B} = (( (( A⊗ B1) ⊗ B2) ) ⊗ Bn) (II.3-5)

Hình II.3.6 Làm mảnh ảnh

Quá trình để làm mảnh A bắt đầu bằng việc làm mảnh A bởi B1, sau đó tiếp tục với B2, quá trình làm mảnh kết thúc cho đến khi không có sự thay đổi nào xảy ra

Hình II.3.6(a) thể hiện tập tất cả các phần tử cấu trúc thường được sử dụng cho quá trình làm mảnh và II.3.6(b) biểu diễn ảnh A sau khi được làm mảnh bởi dãy các phần tử cấu trúc trong hình II.3.6(a)

Tiêu đề	Tìm hiểu phép toán hình thái, phương pháp di truyền và ứng dụng
Tác giả	Phạm Đăng Tứ
Người hướng dẫn	PGS.TS. Ngô Quốc Tạo
Trường học	Đại học Thái Nguyên
Chuyên ngành	Công nghệ thông tin
Thể loại	luận văn thạc sĩ
Năm xuất bản	2009
Thành phố	Thái Nguyên

Định dạng
Số trang	72
Dung lượng	1,69 MB