Nghiên cứu phương pháp phân chia vùng ảnh và ứng dụng

Nội dung chính của luận văn tập trung tìm hiểu về một số phương pháp phân chia vùng ảnh và ứng dụng vào việc phân tách các vùng trong ảnh chụp CT não người.. Luận văn được chia thành 3 n

Trang 1

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Trang 2

MỤC LỤC

MỞ ĐẦU 1

CHƯƠNG I TỔNG QUAN VỀ PHÂN CHIA VÙNG ẢNH 3

1.1 Tổng quan về phân chia vùng ảnh 3

1.2 Các hướng tiếp cận phân chia vùng ảnh 4

1.2.1 Các kỹ thuật phân chia vùng ảnh dựa trên không gian đặc trưng 4

1.2.2 Các kỹ thuật dựa trên không gian ảnh 5

1.2.3 Các kỹ thuật dựa trên các mô hình vật lý 5

CHƯƠNG II MỘT SỐ PHƯƠNG PHÁP PHÂN CHIA VÙNG ẢNH CƠ BẢN……… …….7

2.1 Các phương pháp phân chia vùng ảnh tiêu biểu 7

2.1.1 Phân vùng dựa vào ngưỡng biên độ 7

2.1.2 Phân vùng dựa trên cơ sở vùng 8

2.1.3 Phân vùng theo miền đồng nhất 12

2.1.4 Phân vùng theo đồ thị 18

2.2 Phân vùng dựa trên thuật toán phân cụm 24

2.2.1 Thuật toán phân cụm K-means 24

2.2.2 Thuật toán phân cụm Fuzzy C-means 25

2.2.3 Thuật toán DBSCAN 26

2.2.4 Đánh giá các thuật toán phân cụm 32

CHƯƠNG IIIỨNG DỤNG CHO BÀI TOÁN PHÂN CHIA VÙNG ẢNH Y KHOA 34

Trang 3

3.1 Giới thiệu bài toán 34

3.2 Tìm hiểu ảnh y học và chẩn đoán ảnh y học 35

3.2.1 Giới thiệu chung về ảnh y học 35

3.2.2 Tìm hiểu chung về chuẩn DICOM 36

3.2.3 Kiến thức cơ bản về chẩn đoán ảnh y học 37

3.3 Các bước cài đặt thử nghiệm chương trình 41

3.4 Các chức năng của chương trình 43

3.5 Kết quả thử nghiệm 44

TÀI LIỆU THAM KHẢO 47

PHỤ LỤC 49

A Cấu trúc file DICOM 49

B Một số loại chấn thương cơ bản 52

Trang 4

DANH MỤC CÁC TỪ VIẾT TẮT

1 DICOM Digital Imaging and Communications

in Medicine

Số hóa và truyền

ảnh y tế

2 DBSCAN Density Based Spatial Clustering of

Applications with Noise

Phân cụm dữ liệu

và xác định nhiễu dựa trên mật độ

3 CT Computed Tomography Scanner Chụp cắt lớp điện

toán

Trang 5

LỜI CAM ĐOAN Tôi là: Nguyễn Thị Bích Điệp

Lớp: CK11A

Khoá học: 2012 - 2014

Chuyên ngành: Khoa học máy tính

Mã số chuyên ngành: 60 48 01

Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông Thái Nguyên

Giáo viên hướng dẫn: TS Vũ Việt Vũ

Tôi xin cam đoan luận văn “Nghiên cứu phương pháp phân chia vùng ảnh

và ứng dụng” này là công trình nghiên cứu của riêng tôi Các số liệu sử dụng

trong luận văn là trung thực Các kết quả nghiên cứu được trình bày trong luận văn chưa từng được công bố tại bất kỳ công trình nào khác

Thái Nguyên, ngày 10 tháng 06 năm 2014

HỌC VIÊN

Nguyễn Thị Bích Điệp

Trang 6

LỜI CẢM ƠN

Học viên xin gửi lời cảm ơn chân thành tới TS Vũ Việt Vũ, Trường Đại học Kỹ thuật Công nghiệp – Đại học Thái Nguyên, người đã tận tình hướng dẫn giúp học viên hoàn thành luận văn tốt nghiệp

Học viên cũng xin gửi lời cảm ơn sâu sắc đến các thầy cô giáo của Trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên, cùng các thầy cô giáo của Viện Công nghệ thông tin - Viện khoa học Việt Nam đã nhiệt tình giảng dạy, truyền đạt kiến thức cho học viên trong suốt 2 năm học

Học viênxin cảm ơn sự giúp đỡ của lãnh đạo khoa Chẩn đoán hình ảnh, bệnh viên Đa khoa Trung ương Thái Nguyên đã hỗ trợ và cung cấp hình ảnh cho luận văn của học viên Cảm ơn bác sĩ Lê Thị Lan – bệnh viên Đa khoa Trung ương Thái Nguyên đã giúp đỡ, bổ trợ cho học viên những kiến thức căn bản về chẩn đoán hình ảnh y khoa để học viên có thể hoàn thành được luận văn của mình

Nguyễn Thị Bích Điệp

Trang 7

MỞ ĐẦU

Xử lý ảnh là một lĩnh vực khoa học công nghệ khá mới so với nhiều ngành khoa học khác Tuy vậy, tốc độ phát triển của nó rất nhanh với nhiều ứng dụng thiết thực trong các ngành: vật lý, hóa học, sinh học, y học…

Phân chia vùng ảnh là một bài toán cơ bản trong toàn bộ quá trình xử lý ảnh Quá trình này thực hiện việc phân ảnh thành các vùng rời rạc và đồng nhất với nhau hay nói cách khác là xác định các biên của các vùng ảnh đó Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộ hay từng phần của các đối tượng thật sự bên trong ảnh

Vì thế, trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân chia vùng ảnh luôn đóng một vai trò cơ bản và thường là bước tiền

xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung

Một số ứng dụng thực tế của bài toán phân chia vùng ảnh là:Truy xuất hình ảnh dựa trên nội dung; Hình ảnh y khoa: xác định vị trí khối u và bệnh lý khác, đo khối lượng môchẩn đoán, nghiên cứu về cấu trúc giải phẫu; Phát hiện và nhận dạng: Nhận dạng vân tay, nhận dạng khuôn mặt…

Hiện nay, có nhiều công trình nghiên cứu khoa học về phân tích ảnh y học Các ứng dụng hiện nay đều hướng đến mục tiêu hỗ trợ các bác sĩ trong việc chẩn đoán bệnh lý, tổn thương dựa trên định tính

Ảnh y học là kỹ thuật và quá trình được sử dụng để tái tạo ra hình ảnh cơ thể con người hoặc bộ phận cơ thể Ảnh y học thường chụp các bộ phận bên trong cơ thể người bằng các thiết bị chuyên dụng như máy X-Quang chụp hộp sọ, máy chụp cắt lớp vi tính, máy chụp cộng hưởng từ, máy chụp mạch

Trang 8

não nên ảnh thường không rõ, không sắc nét,gây khó khăn cho các chuyên gia y học trong việc chẩn đoán bệnh Mặc dù các thiết bị y tế với công nghệ ngày càng nâng cao để hỗ trợ cho các chuyên gia y tế phân tích và xử lý thông tin từ ảnh nhưng vấn đề đặt ra cần phải giải quyết song song là việc nâng cao chất lượng ảnh - đây là một khâu quan trọng được coi là bước tiền

xử lý cho bước tiếp theo là phân chia vùng ảnh y học.Nếu phân chia vùng ảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng ảnh, bởi vậy người ta xem công đoạn phân chia vùng ảnh là quá trình then chốt trong quá trình xử lý ảnh nói chung

Nội dung chính của luận văn tập trung tìm hiểu về một số phương pháp phân chia vùng ảnh và ứng dụng vào việc phân tách các vùng trong ảnh chụp

CT não người Luận văn được chia thành 3 nội dung chính:

Chương 1: Tổng quan về phân chia vùng ảnh

Chương 2: Tìm hiểu một số phương pháp phân chia vùng ảnh tiêu biểu và tập trung tìm hiểu phương pháp phân chia vùng ảnh dựa trên các thuật toán phân cụm

Chương 3: Ứng dụng cho bài toán phân chia vùng ảnh y khoa

Khi viết báo cáo này học viên đã cố gắng để đạt được những mục tiêu và định hướng nghiên cứu đề ra ban đầu, song điều kiện thời gian và năng lực còn hạn chế nên không tránh khỏi thiếu sót Học viên mong nhận được sự góp ý của thầy giáo hướng dẫn, thầy cô giáo để học viên có được những kinh nghiệm thực tế và bổ ích để sau này có thể xây dựng được một chương trình hoàn thiện hơn

Trang 9

CHƯƠNG I TỔNG QUAN VỀ PHÂN CHIA VÙNG ẢNH

Chươngnày tìm hiểu những vấn đề tổng quan của phân chia vùng ảnh

Để có được những kiến thức ban đầu về phân chia vùng ảnh, qua quá trình đọc tài liệu, học viên đã tìm hiểu những khái niệm cơ bản về phân chia vùng ảnh, nền tảng các giải thuật phân chia vùng ảnh và các hướng tiếp cận phân chia vùng ảnh

1.1 Tổng quan về phân chia vùng ảnh

Phân chia vùng ảnh [1] là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh Quá trình này thực hiện việc phân chia vùng ảnh thành các vùng rời rạc và đồng nhất với nhau hay nói cách khác là xác định các biên của các vùng ảnh đó Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với tòan bộ hay từng phần của các đối tượng thật sự bên trong ảnh Vì thế, trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh (image processing), thị giác máy tính, phân chia vùng ảnh luôn đóng một vai trò cơ bản và thường

là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vào những thời gian đầu, các phương pháp phân chia vùng ảnh được đưa ra chủ yếu làm việc trên các ảnh mức xám do các hạn chế về phương tiện thu thập và lưu trữ

Ngày nay, cùng với sự phát triển về các phương tiện thu nhận và biểu diễn ảnh, các ảnh màu đã hầu như thay thế hoàn toàn các ảnh mức xám trong việc biểu diễn và lưu trữ thông tin do các ưu thế vượt trội hơn hẳn so với ảnh mức xám Do đó, các kỹ thuật, thuật giải mới thực hiện việc phân chia vùng ảnh trên các loại ảnh màu liên tục được phát triển để đáp ứng các nhu cầu

Trang 10

mới Các thuật giải, kỹ thuật này thường được phát triển dựa trên nền tảng các

thuật giải phân chia vùng ảnh mức xám đã có sẵn

1.2 Các hướng tiếp cận phân chia vùng ảnh

Phân chia vùng ảnh[1] là chia ảnh thành các vùng không trùng lặp Mỗi vùng gồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó Tiêu chí này phụ thuộc vào mục tiêu của quá trình phân vùng Ví dụ như đồng nhất về màu sắc, mức xám, kết cấu, độ sâu của các layer… Sau khi phân vùng mỗi pixel chỉ thuộc về một vùng duy nhất Để đánh giá chất lượng của quá trình phân vùng là rất khó Vì vậy trước khi phân chia vùng ảnh cần xác định

rõ mục tiêu của quá trình phân vùng là gì Xét một cách tổng quát, ta có thể chia các hướng tiếp cận phân chia vùng ảnh thành ba nhóm chính như sau:

Các kỹ thuật phân chia vùng ảnh dựa trên không gian đặc trưng Các kỹ thuật dựa trên không gian ảnh

Các kỹ thuật dựa trên các mô hình vật lý

1.2.1 Các kỹ thuật phân chia vùng ảnh dựa trên không gian đặc trưng

Nếu chúng ta giả định màu sắc bề mặt của các đối tượng trong ảnh là một thuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gian màu nào đó, vậy thì chúng ta sẽ có một cái nhìn đối với mỗi đối tượng trong

ảnh như là một cụm (cluster) các điểm trong không gian màu đó Mức độ

phân tán của các điểm trong trong một cụm được xác định chủ yếu bởi sự khác biệt về màu sắc Một cách khác, thay vì ánh xạ các pixel trong ảnh vào

một không gian màu cụ thể, ta xây dựng một histogram dựa trên các đặc trưng màu dạng ad-hoc cho ảnh đó (ví dụ như Hue), và thông thường, các đối

tượng trong ảnh sẽ xuất hiện như các giá trị đỉnh trong histogram đó Do đó, việc phân vùng các đối tượng trong ảnh tương ứng với việc xác định các cụm – đối với cách biểu diễn thứ nhất; hoặc xác định các vùng cực trị của

Trang 11

histogram – đối với cách biểu diễn thứ hai.Các phương pháp tiếp cận này chỉ làm việc trên một không gian màu

1.2.2 Các kỹ thuật dựa trên không gian ảnh

Kỹ thuật được đề cập trong phần trên hoạt động dựa trên các không gian đặc trưng của ảnh (thông thường là màu sắc) Do đó, các vùng ảnh kết quả là đồng nhất tương ứng với các đặc trưng đã chọn cho từng không gian Tuy nhiên, không có gì đảm bảo rằng tất cả các vùng này thể hiển một sự cô đọng (compactness) về nội dung xét theo ý nghĩa không gian ảnh (ý nghĩa các vùng theo sự cảm nhận của hệ thần kinh con người) Mà đặc tính này là quan trọng thứ hai sau đặc tính về sự thuần nhất của các vùng ảnh Do các phương pháp gom cụm cũng như xác định ngưỡng histogram đã nêu đều bỏ qua thông tin về vị trí của các pixel trong ảnh

Trong các báo cáo khoa học về phân chia vùng ảnh mức xám, có khá nhiều kỹ thuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tính đồng nhất trong không gian đặc trưng của ảnh và tính cô đọng về nội dung ảnh Tuỳ theo các kỹ thuật mà các thuật giải này áp dụng, chúng được phân thành các nhóm sau:

 Các thuật giải áp dụng kỹ thuật chia và trộn vùng

 Các thuật giải áp dụng kỹ thuật tăng trưởng vùng

 Các thuật giải áp dụng lý thuyết đồ thị

 Các giải thuật áp dụng mạng neural

 Các giải thuật dựa trên cạnh

1.2.3 Các kỹ thuật dựa trên các mô hình vật lý

Tất cả các giải thuật được xem xét qua, không ít thì nhiều ở mặt nào đó đều có khả năng phát sinh việc phân vùng lỗi trong các trường hợp cụ thể nếu

Trang 12

như các đối tượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng sáng hoặc bóng mờ, các hiện tượng này làm cho các màu đồng nhất trong ảnh thay đổi nhiều hoặc ít một cách đột ngột Và kết quả là các thuật giải này tạo ra các kết quả phân vùng quá mức mong muốn so với sự cảm nhận các đối tượng trong ảnh bằng mắt thường Để giải quyết vấn đề này, các giải thuật phân chia vùng ảnh áp dụng các mô hình tương tác vật lý giữa bề mặt các đối tượng với ánh sáng đã được đề xuất Các công cụ toán học mà các phương pháp này sử dụng thì không khác mấy so với các phương pháp ở trên, điểm khác biệt chính là việc áp dụng các mô hình vật lý để minh hoạ các thuộc tính phản chiếu ánh sáng trên bề mặt màu sắc của các đối tượng

Trang 13

CHƯƠNG II MỘT SỐ PHƯƠNG PHÁP PHÂN CHIA VÙNG ẢNH CƠ BẢN

Ở chương 1 học viên đã tìm hiểu sơ lược về các hướng tiếp cận phân chia vùng ảnh Có rất nhiều kỹ thuật phân chia vùng ảnh được sử dụng tùy vào tính chất của bài toán Trong quá trình tìm hiểu và đọc tài liệu tham khảo, học viên nhận thấy rất nhiều công trình nghiên cứu hay các luận văn đã

đi sâu tìm hiểu một số kỹ thuật phân vùng tiêu biểu như: Phân vùng dựa vào ngưỡng biên độ, phân vùng dựa trên cơ sở vùng, phân vùng theo miền đồng nhất, phân vùng theo đồ thị Vì vậy trong luận văn của mình, học viên đi sâu vào nghiên cứu phương pháp phân chia vùng ảnh dựa trên các thuật toán phân cụm vì một số ưu điểm của nó sẽ được trình bày dưới đây

2.1 Các phương pháp phân chia vùng ảnh tiêu biểu

2.1.1 Phân vùng dựa vào ngưỡng biên độ

Biên độ của các tính chất vật lý của ảnh (như là độ phản xạ, độ truyền sáng, màu sắc …) là một đặc tính đơn giản và rất hữu ích Nếu biên

độ đủ lớn đặc trưng cho ảnh thì chúng ta có thể dùng ngưỡng biên độ để phân chia vùng ảnh Thí dụ, biên độ trong bộ cảm biến hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Đặc biệt, kỹ thuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang

Việc chọn ngưỡng trong kỹ thuật này là một bước vô cùng quan trọng, thông thường người ta tiến hành theo các bước chung như sau:

- Xem xét lược đồ xám của ảnh để xác định đỉnh và khe Nếu ảnh có nhiều đỉnh và khe thì các khe có thể sử dụng để chọn ngưỡng

- Chọn ngưỡng T sao cho một phần xác định trước η của toàn bộ số mẫu

Trang 14

- Điều chỉnh ngƣỡng dựa trên xét lƣợc đồ xám của các điểm lân cận

- Chọn ngƣỡng bằng cách xem xét lƣợc đồ xám của những điểm thoả tiêu chuẩn đã chọn

Một thuật toán đơn giản trong kỹ thuật này là: giả sử rằng chúng ta đang quan tâm đến các đối tƣợng sáng (object) trên nền tối (background), một tham số T gọi là ngƣỡng độ sáng, sẽ đƣợc chọn cho một ảnh f[x,y] theo cách:

If f[x,y] ≥ T f[x,y] = object = 1 Else f[x,y] = Background = 0

Ngƣợc lại, đối với các đối tƣợng tối trên nền sáng ta có thuật toán sau:

If f[x,y] < T f[x,y] = object = 1 Else f[x,y] = Background = 0

Ta cần chọn ngƣỡng T để việc phân vùng đạt đƣợc kết quả cao nhất Có rất nhiều thuật toán chọn ngƣỡng: ngƣỡng cố định, dựa trên lƣợc đồ, sử dụng Entropy, sử dụng tập mờ, chọn ngƣỡng thông qua sự không ổn định của lớp

Công thức cơ bản

Trang 15

Cho R mô tả toàn bộ vùng ảnh Chúng ta xem phân chia vùng ảnh là

phải thỏa mãn một vài thuộc tính đã được xác định trước; ví dụ P(R i )=TRUE

nếu tất cả pixel trong R i có mức xám giống nhau Cuối cùng điều kiện (e) nghĩa

là chân trị của P theo các vùng R i và R j khác nhau nếu j khác i

Trang 16

Việc chọn tiêu chuẩn phụ thuộc vào từng loại ảnh Ví dụ phân tích ảnh chụp vệ tinh trái đất phụ thuộc vào màu sắc Với ảnh trắng đen, phân tích vùng phải giải thích được một tập mô tả dựa trên giá trị mức xám và đặc trưng không gian Việc mô tả các thuộc tính một cách rời rạc có thể đưa ra những kết quả sai lạc khi thông tin liên thông hoặc lân cận không được dùng trong quá trình phát triển vùng Ví dụ, hiển thị một khoảng bất kỳ những pixel với

ba giá trị mức xám tách biệt Những pixel phát triển thì có giá trị mức xám giống nhau để có dạng một “vùng” mà không chú ý đến vấn đề liên thông sẽ đưa ra một kết quả phân vùng vô nghĩa

Một vấn đề khác trong phát triển vùng là dạng của điều kiện dừng Cơ bản phát triển vùng sẽ dừng khi không có pixel nào thỏa mãn tiêu chuẩn để nằm trong vùng đó Tiêu chuẩn chẳng hạn như mức xám, cấu trúc, màu là những bản chất cục bộ, không xét đến lịch sử của quá trình phát triển vùng Thêm tiêu chuẩn sẽ làm tăng thêm sức mạnh của định luật phát triển vùng dùng khái niệm của kích thước, sự giống nhau của một pixel ứng cử và những pixel đã được phát triển, và hình của những vùng đã được phát triển Sử dụng những loại tiêu chuẩn đã được miêu tả, dựa trên giả thuyết kiểu của kết quả được mong đợi có giá trị từng phần bé nhất

Chia và chọn vùng

Đặt R biểu diễn toàn bộ vùng ảnh và chọn tính chất P cho trước Một phương pháp phân vùng R là chia nó ra thành những vùng nhỏ hơn và những vùng tứ phân nhỏ hơn, đối với bất kì vùng Ri nào, P(Ri)=TRUE Bắt đầu với toàn bộ vùng Nếu P(Ri)=FALSE thì ta chia ảnh thành 4 phần Nếu P là FALSE cho bất kì vùng tứ phân nào, chúng ta chia vùng tứ phân đó thành 4 phần nhỏ hơn, và cứ tiếp tục như thế Kỹ thuật phân chia đặc biệt này có sự thuận lợi trong biểu diễn được gọi là cây tứ phân (Quadtree) Chú ý rằng gốc

Trang 17

của cây tứ phân tương ứng với toàn bộ ảnh và mỗi node tương ứng với phần chia nhỏ hơn Trong trường hợp này, chỉ R4 được chia nhỏ hơn nữa

Nếu chỉ phân chia thì phần cuối cùng sẽ chứa những vùng gần nhau

có cùng thuộc tính Trở ngại này có thể được khắc phục bằng cách hợp lại Những vùng gần nhau mà có những pixel tổng hợp thỏa tính chất P nghĩa là 2 vùng lân cận Ri và Rj được hợp lại nếu P(Ri U Rk)=TRUE

Hình 2.1

Tóm lại ta có thủ tục sau:

- Chia thành 4 vùng bằng nhau bất kì vùng nào có P(Rj)= FALSE

- Hợp những vùng kề nhau Ri và Rj với P(Ri U Rj)=TRUE

- Dừng nếu không thể phân chia hoặc không thể hợp được nữa

Ta định nghĩa P(Ri) = TRUE nếu có ít nhất 80% các pixel trong Rj có thuộc tính |zj-mi|≤2σi với zj là mức xám của pixel thứ j trong vùng Ri, mi là mức xám của vùng đó, và σi là độ lệch chuẩn của mức xám trong Ri Nếu P(Ri)=TRUE trong điều kiện này, giá trị của tất cả các pixel được đặt bằng với mi Phân chia và hợp được thực hiện sử dụng thuật toán trên

Trang 18

a.Hình ban đầu b.Kết quả sau khi tách và trộn

c Kết quả sau khi phân ngưỡng Hình 2.2 Minh họa phân ngưỡng

Kết quả của việc áp dụng kĩ thuật này vào ảnh trong hình 2.2a được hiển thị trong hình 2.2b Chú ý rằng ảnh đã được phân vùng hoàn toàn Ảnh hiển thị trong hình 2.2c nhận được bởi phân ngưỡng hình 2.2a, với một ngưỡng đặt tại điểm chính giữa của 2 đỉnh chính của Histogram

2.1.3 Phân vùngtheo miền đồng nhất

Giới thiệu

Kỹ thuật phân chia vùng ảnh thành các miền đồng nhất dựa vào các thuộc tính quan trọng nào đó của miền Mỗi một thuộc tính khi sử dụng thì có một tiêu chuẩn phân vùng tương ứng Một số thuộc tính tiêu biểu như: mức xám, màu sắc ( đối với ảnh màu), kết cấu sợi v.v…

Giả sử ảnh X phải được phân thành N vùng khác nhau R1, R2, … RN và nguyên tắc phân vùng là một vị từ của công thức P(R)

Trang 19

Việc phân chia vùng ảnh chia tập X thành các tập con Ri , i = 1 N phải thỏa mãn:

Các vùng Ri, i=1 N phải lấp kín hoàn toàn ảnh:

X=

Hai vùng khác nhau phải là những tập hợp rời nhau:

Ri R j = 0 với i ≠ j Mỗi vùng Ri phải có tính đồng nhất:

P(Ri) = TRUE với i = 1 N Nếu Ri, Rj là hai vùng rời nhau thì (Ri Rj) phải là một vùng ảnh không đồng nhất:

P(Ri Rj) = FALSE với i ≠ j Kết quả của việc phân chia vùng ảnh phụ thuộc vào dạng của vị từ P và các đặc trưng được biểu diễn bởi vectơ đặc trưng Thường thì vị từ P có dạng P(R,X,t), trong đó X là vectơ đặc trưng gắn với một điểm ảnh và t là một tập hợp các tham số (thường là các ngưỡng) Trong trường hợp đơn giản nhất, vectơ đặc trưng X chỉ chứa giá trị mức xám của ảnh I(k,l) và vectơ ngưỡng chỉ gồm một ngưỡng T Một nguyên tắc phân vùng đơn giản có công thức:

P(R): f(k,l) < T Trong trường hợp các ảnh màu, vectơ đặc trưng X có thể là ba thành phần ảnh RGB [fR(k,l), fG(k,l), fB(k,l)]T Lúc đó luật phân ngưỡng có dạng:

P(R,x,t): ((fR(k,l)<TR)&& (fG(k,l)<TR)&&(fB(k,l)<TR))

Trang 20

Phương pháp tách cây tứ phân

Phương pháp tách cây tứ phân dựa trên nguyên tắc kiểm tra tính hợp thức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn Nếu tiêu chuẩn được thoả việc phân vùng coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn, áp dụng đệ quy bằng phương pháp trên cho mỗi miền nhỏ hơn cho đến khi tất cả các miền đều thoả mãn tiêu chuẩn đồng nhất

Thuật toán được mô tả như sau:

Procedure PhanDoan(Mien) Begin

If (miền đang xét không thoả) Then Begin

Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4 For i=1 to 4 Do PhanDoan(Zi)

End Else Exit End;

Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức, trừ mức ngoài cùng Vì thế cây này có tên là cây tứ phân Gốc của cây là ảnh ban đầu, một vùng thoả tiêu chuẩn tạo nên một nút lá, nếu không sẽ tạo nên một nút nhánh

Giả sử chọn tiêu chuẩn phân vùng là màu sắc và quy ước mọi điểm của vùng là màu trắng sẽ tạo nên một nút lá trắng và tương tự như vậy với nút lá đen Nút màu ghi có nghĩa là vùng không thuần nhất và phải tiếp tục chia

Trang 21

a Ảnh gốc b Phân mức 1

Hình 2.3 Minh họa kỹ thuật tách cây tứ phân

Hình 2.3 - minh họa thuật toán tách cây tứ phân: ảnh gốc (a) được chia thành 4 phần được kết quả phân mức 1 (b), tiếp tục thực hiện đối với các phần nhỏ, ta được phân mức 2, 3

Phương pháp phân vùng hợp

Phương pháp phân vùng bởi hợp thao tác ngược lại với phương pháp tách cây tứ phân, nghĩa là xuất phát từ các miền nhỏ nhất - các điểm ảnh rồi

Trang 22

hợp chúng lại nếu thoả mãn tiêu chuẩn đề ra để đƣợc miền đồng nhất lớn hơn Tiếp tục với các miền thu đƣợc cho đến khi ta không thể hợp nhất chúng với nhau nữa, lúc này số miền còn lại chính là các phân vùng của ảnh

Việc hợp nhất hai miền phải thoả mãn hai nguyên tắc sau:

Sau khi hợp nhất (k,l) vào vùng R thì ta phải cập nhật lại giá trị trung

(2.4)

Trang 23

Nếu có nhiều hơn một vùng lân cận thỏa mãn thì hợp điểm (k,l) với vùng Ri sao cho sự khác biệt |(k,l)-mi| nhỏ nhất

Cũng trong phương pháp pháp phân vùng bởi hợp, có một cách tiếp cận khác với kỹ thuật trên, đó là phương pháp phân vùng dựa vào đồ thị Phân vùng dựa trên đồ thị tìm cách hợp nhất hai miền Ri và Rj theo tính chất so sánh giữa hai cặp miền

Phương pháp tách hợp (Split- Merge)

Hai phương pháp vừa xét ở trên có một số nhược điểm Phương pháp tách tạo nên một cấu trúc phân cấp và thiết lập mối quan hệ giữa các vùng Tuy nhiên nó thực hiện việc chia quá chi tiết Phương pháp hợp cho phép giảm số vùng liên thông xuống mức tối thiểu nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy mối liên hệ giữa các vùng Chính vì nhược điểm này ta nghĩ đến việc phối hợp cả 2 phương pháp Trước tiên dùng phương pháp tách để tạo nên cấy tứ phân, phân vùngtheo hướng từ gốc lên lá Tiếp theo tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn Với phương pháp này ta thu được miêu tả cấu trúc của ảnh với các miền liên thông có kích thước tối đa

Giải thuật trên gồm một số bước sau:

B1: Kiểm tra tiêu chuẩn đồng nhất

Nếu không thỏa và số điểm trong vùng lớn hơn một điểm, tách làm 4 vùng (trên, dưới, trái, phải) bằng cách gọi đệ quy Nếu kết quả tách xong và không tách được nữa thì chuyển sang B2

Nếu tiêu chuẩn đồng nhất là thỏa thì tiến hành hợp vùng và cập nhật giá trị trung bình cho vùng

B2: Hợp vùng: Cần kiểm tra 4 lân cận đã nêu trên Có thể có nhiều vùng thỏa mãn khi đó ta chọn vùng tối ưu rồi tiến hành hợp

Trang 24

Phương pháp này thu được kết quả số vùng là nhỏ hơn phương pháp tách và ảnh được làm trơn

2.1.4 Phân vùngtheo đồ thị

Phân chia vùng ảnh dựa vào đồ thị là một phương pháp tiếp cận khá hiện đại dựa trên thuộc tính non-local của ảnh đầu vào Phương pháp này phát hiện ra biên giữa hai vùng của ảnh bằng cách so sánh sự khác nhau giữa nội vùng (intercomponent) với sự khác nhau với các vùng khác Thuật toán phân vùng dựa vào đồ thị tuân theo chiến lược tham lam, có thời gian chạy gần như tuyến tính, nhưng vẫn đảm bảo được việc phân vùng chính xác và hiệu quả

Giới thiệu

Các phương pháp phân chia vùng ảnh cổ điển đều có chung một nhược điểm là chạy rất chậm trong các ứng dụng xử lý ảnh và hầu như không nắm bắt được các thuộc tính non-local quan trọng của ảnh Vì vậy, hầu hết các nghiên cứu của những năm gần đây đều có xu hướng tìm kiếm một kỹ thuật phân vùng có khả năng xử lý trong cơ sở dữ liệu ảnh lớn một cách nhanh chóng, chính xác và hiệu quả Kỹ thuật phân vùng dựa vào đồ thị được mô tả

ở đây không những vừa nắm bắt được các đặc tính non-local mà độ phức tạp

tính toán chỉ là O(nlogn) đối với bức ảnh có n điểm ảnh (pixel)

Giống như các phương pháp phân cụm cổ điển, phương pháp này cũng dựa trên việc chọn các cạnh từ một đồ thị Đồ thị này được xây dựng bằng cách coi mỗi điểm ảnh là một đỉnh, hai điểm ảnh kề nhau thì được nối bởi một cạnh vô hướng, trọng số trên một cạnh thể hiện sự khác nhau giữa hai điểm ảnh Tuy nhiên, phương pháp này thực hiện việc điều chỉnh sự phân vùng dựa vào mức độ thay đổi giữa các miền lân cận của ảnh

Ví dụ:Ảnh phía trên bên trái của hình: hầu hết đều thấy rằng bức ảnh này có ba miền phân biệt: một hình chữ nhật ở nữa bên trái, một hình chữ

Trang 25

nhật đặc ở giữa nửa bên phải và phần bao quanh hình chữ nhật đặc này Đó là thuộc tính quan trọng của sự tri giác (perceptually) và các đặc trưng này cũng

sẽ được nắm bắt bởi thụật toán phân vùng

Hình 2.4 Nhận dạng các vùng ảnh

Phương pháp phân vùng dựa vào đồ thị sẽ tìm dấu hiệu đường biên giữa hai vùng bằng cách so sánh hai đại lượng: một là dựa vào cường độ khác nhau dọc theo đường biên và hai là dựa vào cường độ khác nhau giữa các điểm ảnh với mỗi vùng

Phương pháp

Cho G = (V,E) là một đồ thị vô hướng với các đỉnh vi V, là tập hợp các phần tử cần được phân vùng và các cạnh (vi ,vj) E, tương ứng với các cặp đỉnh lân cận nhau Mỗi cạnh (vi ,vj) E có một trọng số tương ứng, trọng

số là một số không âm đo sự khác nhau giữa hai phần tử lân cận vi và vj, ký hiệu w(vi, vj) Ở đây trọng số của cách cạnh đo sự khác nhau giữa hai điểm nối bởi cạnh đó (có nhiều mức độkhác nhau: màu sắc, vị trí, sự vận động hoặc các thuộc tính khác)

Trang 26

Như vậy phân vùng một bức ảnh là việc phân chia V thành các thành phần, mà mỗi thành phần (hoặc miền) C V tương đương với một thành phần liên thông trong đồ thị G‟ = <V,E‟ >, E‟ E

Trước hết, ta định nghĩa độ khác nội vùng (internal difference) và độ khác giữa hai vùng (difference between two components)

Độ khác nội vùng (internal difference) của một thành phần C V là trọng số lớn nhất trong cây tỏa nhánh tối thiểu của thành phần đó, kí hiệu Int(C) Khi đó:

Độ khác giữa hai vùng (difference between two components) C1, C2

V, là trọng số nhỏ nhất giữa hai vùng, kí hiệu là Dif(C1,C2) Khi đó:

Dif(C1,C2) = min w(Vi,Vj) (2.6)

Vi C1,Vj C2,(Vi,Vj) E Nếu không có cạnh nối nào giữa C1 và C2 thì đặt Dif(C1,C2) = ∞ Độ

đo sự khác nhau này là về nguyên lý thì vẫn có vẻ mơ hồ, vì nó chỉ phản ánh được cạnh có trọng số nhỏ nhất nối giữa hai thành phần

Trang 27

Một khái niệm có liên quan trong định nghĩa về tính chất D là giá trị khác nội vùng nhỏ nhất, kí hiệu MInt Giá trị Mintđược định nghĩa như sau: MInt (C1, C2) = min( Int (C1 ) + τ (C1 ), Int (C1 ) + τ (C 2 )) (2.7)

Hàm ngưỡng τ điều khiển mức độ khác nhau giữa hai thành phần, sao cho giá trị này phải lớn hơn các giá trị khác nội vùng của các thành phần để

nhằm mục đích nhận ra đường biên giữa chúng Đối với các thành phần nhỏ

Int(C) là không đủ tốt để ước lượng các đặc tính của dữ liệu Trong một số trường hợp khi |C| = 1 thì Int(C) = 0 với |C| là kích thước của thành phần C Khi đó chúng ta sử dụng một hàm ngưỡng dựa trên kích thước của thành phần:

Định nghĩa 1

Một phân vùng được xem là quá mịn nếu tồn tại một số cặp miền

C1,C2 S mà giữa hai miền này không có dấu hiệu của đường biên

Để định nghĩa được những khái niệm bổ sung cho phân vùng quá thô, chúng ta đưa ra khái niệm tinh chỉnh (refinement) của một phân vùng

Trang 28

Cho hai phân vùng S và T của cùng một tập cơ sở, ta nói rằng T là một tinh chỉnh (refinement) của S khi mỗi thành phần của T đƣợc chứa trong (hoặc bằng) một số thành phần của S Và ta cũng nói rằng T là một tinh chỉnh đúng (proper refinement) của S khi T ≠ S

Chú ý rằng nếu T là tinh chỉnh đúng của S thì T có thể đƣợc chứa bởi một hoặc một số các miền trong S và S đƣợc gọi là thô hơn T

Định nghĩa 2

Một phân vùng đƣợc xem là quá thô khi tồn tại một tinh chỉnh đúng của S mà phân vùng đó vẫn chƣa là quá mịn Vấn đề đặt ra là liệu có phải luôn luôn tồn tại phân vùng không quá thô cũng không quá mịn hay không?

Và nếu tồn tại thì phân vùng đó có là duy nhất không?

Thực tế cho thấy là nói chung luôn có thể có nhiều hơn một phân vùng không quá thô cũng không quá mịn, do đó phân vùng này là không duy nhất

Trở lại với thuật toán phân vùng dựa trên đồ thị, thuật toán này gần với thuật toán Kruskal xây dựng cây tỏa nhánh tối thiểu của một đồ thị Độ phức

tạp của thuật toán là O(m log m), trong đó m là số cạnh của đồ thị

Trang 29

Bước 2: Bắt đầu với phân vùng S0

, lúc này mỗi đỉnh nằm trong 1 thành phần

Bước 3: Lặp lại bước 4 với q = 1,…,m

Bước 4: Xây dựng Sq

từ Sq-1 như sau: Cho vi và vj là hai đỉnh nối với nhau bởi cạnh thứ q, tức là oq = (vi,vj) Nếu vi và vj nằm trong hai thành phần tách rời nhau của Sq-1 và (oq) nhỏ hơn sự khác nhau nội vùng của cả hai thành phần thì trộn hai thành phần này với nhau, ngược lại không làm gì

q-1

≠ Cj q-1

và (oq) ≤ Mint(Ci

q-1

,Cj q-1

Trang 30

2.2 Phân vùng dựa trên thuật toán phân cụm

2.2.1 Thuật toán phân cụm K-means

K-Means là thuật toán rất quan trọng và được sử dụng phổ biến trong

kỹ thuật phân cụm Tưtưởng chính của thuật toán K-Means là tìm cách phân nhóm các đối tượng (objects) đã cho vào k cụm (k là số các cụm được xác định trước, k nguyên dương) sao cho tổng bình phương khoảng cách giữa các đối tượng đến tâm nhóm (centroid) là nhỏ nhất

Thuật toán K-Means thực hiện qua các bước chính sau:

1 Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster) Mỗi cụm được đại diện bằng các tâm của cụm

2 Tính khoảng cách giữa các đối tượng (objects) đến K tâm (thường dùng khoảng cách Euclidean)

3 Nhóm các đối tượng vào nhóm gần nhất

4 Xác định lại tâm mới cho các nhóm

5 Thực hiện lại bước 2 cho đến khi không có sự thay đổi nhóm nào của các đối tượng

Nhóm các đối tượng vào nhóm gần nhất

Không có đối tượng nào thay đổi nhóm?

Đúng Sai