.2 Không gian điểm ảnh s với các lân cận của nó

Một phần của tài liệu Phân loại ba vùng GM, WM, CSF từ ảnh não người và xác định điểm bất thường bằng phương pháp EM cải tiến (Trang 33 - 42)

Khái niệm của một clique: Một collection  {sS s, S} là một hệ lân cận cho S nếu với mỗi pixel: 1)ss và 2) s  r rs với bất kỳ rS. Các phần tử của tập s là các lân cận của vị trí không gian s. Một tập các pixel CS là một clique nếu với bất kỳ pixels r, C s, r . Như vậy, một tập hợp của tất cả các clique kí hiệu là C được tạo ra bởi hệ lân cận. Tập các clique C được sử dụng trong

26

đề tài này sẽ bao gồm tất cả các cặp pixel liền kề theo chiều ngang và chiều dọc, cộng với tất cả các pixel đơn.

Giả sử có điểm ảnh r tại tọa độ (x,y);(xem Hình 2.3) Ta có các loại tập hợp lân cận như sau:

 Tập hợp 4 lân cận: r có 4 điểm lân cận gần nhất theo chiều đứng và ngang:

Hình 2.3 Các lân cận của một điểm ảnh (x,y) 4( ) {( 1, );( , 1);( , 1);( 1; )}

N rxy x yx yxy (2-2)

Trong đó: số 1 là giá trị logic; N4(r) là tập 4 điểm lân cận của r.

 Tập hợp các lân cận chéo: Các điểm lân cận chéo N( )r

( ) {( 1, 1); ( 1, 1); ( 1, 1); ( 1; 1)}

N r  xyxyxyxy (2-3)

 Tập hợp 8 lân cận: N r8( )N r4( )N r( ) [5]. (2-4)

2.2.2 Các mối liên kết ảnh

Các mối liên kết được sử dụng để xác định giới hạn (boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng.

Giả sử V là tập các giá trị mức xám. Có 3 loại liên kết:

 Liên kết 4: Hai điểm ảnh r và s được nói là liên kết 4 với các giá trị cường độ sáng V nếu s nằm trong một các lân cận 4 của p, tức sN r4( ).

27

 Liên kết 8: Hai điểm ảnh r và s nằm trong một các lân cận 8 của r, tức 8( )

sN r

 Liên kết m (liên kết hỗn hợp): Hai điểm ảnh r và s với các giá trị cường độ sáng V được nói là liên kết m nếu: 1) sN r4( ) và 2) sN r8( )[5].

2.2.3 Mô hình trường ngẫu nhiên Markov (Markov Random Field)

2.2.3.1 Giới thiệu

Mô hình trường ngẫu nhiên Markov (MRF) là một mô hình thống kê được sử dụng để mô hình các quan hệ không gian tồn tại trong vùng lân cận của pixel. Các phương pháp phân đoạn ảnh khác nhau sử dụng MRF để tận dụng thông tin vùng lân cận trong quá trình phân đoạn. Ví dụ, trong hình ảnh y tế, hầu hết các pixel lân cận có cùng một lớp. Phương pháp phân đoạn có thể sử dụng MRF để mô hình hóa thực tế này. Bằng cách sử dụng thông tin lân cận, ảnh hưởng của nhiễu trong phân đoạn sẽ giảm. [6]

Bây giờ xét các mô hình 2D Markov.

2.2.3.2 Trường ngẫu nhiên Markov

Hãy cho S là ma trận hai chiều biểu thị một ảnh 2D. Trong MRF, đề tài cũng xem xét một tập hợp các biến ngẫu nhiên mà chúng có một số thuộc tính độc lập có điều kiện. Đề tài nói rằng MRF chứa một tập hợp các vị trí mà có thể lập chỉ mục với hai giá trị i và j khi muốn nhấn mạnh cấu trúc 2D của các vị trí. Vì vậy, có thể nói về vị trí Si, j và lân cận dọc của nó Si + 1, j. Cũng có thể thuận tiện khi sử dụng một chỉ mục duy nhất, gọi là Si. Trong trường hợp này, thứ tự của các vị trí là tùy ý.

Đề tài cũng gỉa sử rằng đề tài có một bộ nhãn Ld. Các nhãn có thể có các giá trị liên tục, nhưng sẽ cho rằng có một bộ nhãn riêng biệt. Mỗi vị trí sẽ có một nhãn. Vì vậy, các vị trí có thể được coi là các biến ngẫu nhiên có thể có một bộ giá trị rời rạc. Việc gán nhãn là gán một nhãn cho mỗi vị trí. Hãy biểu thị nó là f = {f1, ..., fm}, do đó fi là nhãn của vị trí Si.

28

Tiếp theo, giả sử rằng các vị trí có cấu trúc lân cận Ni biểu thị tất cả các vị trí là lân cận của Si. Nghĩa là, Sj∈ Ni có nghĩa là Sj và Si là lân cận của nhau. Chúng ta có thể định nghĩa bất kỳ cấu trúc lân cận nào mà chúng ta muốn, với ràng buộc là các lân cận phải đối xứng, nghĩa là Sj∈ Ni⇔ Si∈ Nj. Ngoài ra, một vị trí không phải là lân cận của chính nó. Ta biểu thị tập tất cả các lân cận là N.

Cấu trúc lân cận này hiện cho phép xác định cấu trúc Markov của phân phối. Ta nói rằng F là MRF trên S đối với N khi và chỉ khi: P f( ) 0, f

{ }

( | ) ( | )

i

i S i i N

P f f   P f f

Điều kiện đầu tiên là cần thiết vì một số lý do kỹ thuật. Điều đó có nghĩa là trong mô hình hóa, chúng ta không thể tạo ra bất kỳ nhãn nào có xác suất bằng 0, nhưng vì xác suất có thể rất nhỏ nên đây không phải là một hạn chế. Điều kiện thứ hai quy định tính chất Markov.

Để ví dụ cho điều này, hãy xét bài toán phân đoạn một ảnh thành tiền cảnh (foreground) và hậu cảnh (background). Ta có thể gán một vị trí cho mỗi pixel trong ảnh. Bộ nhãn của đề tài là nhị phân, biểu thị tiền ảnh hoặc hậu ảnh. Giả sử chúng ta muốn mã hóa ràng buộc mà các vùng tiền cảnh có xu hướng gắn kết bằng cách nói rằng nếu một pixel ở tiền cảnh thì các pixel lân cận của nó cũng có khả năng là tiền cảnh. Ta có thể định nghĩa một cấu trúc lân cận đơn giản dựa trên lân cận liên kết 4. Đó là Ni, j = {Si 1, j, Si + 1, j, Si, j − 1, Si, j + 1} (chú ý cách chuyển từ sử dụng một sang hai chỉ mục). Sau đó, với các xác suất có điều kiện có sẵn trên chúng mà có thể mã hóa ràng buộc chẳng hạn như nếu tất cả các pixel lân cận là tiền cảnh, thì nó cũng có thể là tiền cảnh; nếu tất cả các lân cận của nó là hậu cảnh, thì nó cũng có thể là hậu cảnh và trong các trường hợp khác, nó có khả năng là một trong hai [12].

2.2.3.3 MRF và phân phối Gibbs

Cho bất kỳ tập hợp các biến ngẫu nhiên, có một số vấn đề tự nhiên để giải quyết. Đầu tiên cho một MRF, thật đơn giản để xác định xác suất của bất kỳ nhãn cụ thể nào. Tuy nhiên, việc tìm ra tập hợp các xác suất có điều kiện để sử dụng trong MRF

29

không đơn giản như vậy. Điều đầu tiên, một tập tùy ý các xác suất có điều kiện cho các vị trí và lân cận khác nhau có thể không nhất quán lẫn nhau và không có cách rõ ràng để xác định chúng. Cuối cùng, một vấn đề chính sẽ là tìm ra khả năng ghi nhãn của MRF [12].

Những vấn đề này được thực hiện dễ dàng hơn bằng cách sử dụng phân phối Gibbs, chuyển đổi tương đương với MRF nhưng theo một số cách thì nó dễ dàng hơn. Trong một phân phối Gibbs, các clique lưu giữ các phụ thuộc giữa các lân cận. Một tập hợp các vị trí {i1, i2, ..., in} tạo thành một clique nếu với tất cả k j i, , kNj. Cho phân phối xác suất được xác định cho một tập hợp các vị trí và nhãn, đề tài nói rằng đó là phân phối Gibbs nếu phân phối có dạng sau:

( ) 1 ( ) U f T P f e Z   (2-5)

Trong đó hàm năng lượng U(f) có dạng sau:

( ) c( )

c C

U f V f

 (2-6)

Trong đó C là tập hợp của tất cả các clique và Vc(f) là tiềm năng clique được xác định cho mọi clique. Nghĩa là, P (f) là một hàm số mũ trên tổng các tiềm năng có thể được xác định độc lập cho mỗi clique. Điều này tương tự với cấu trúc lân cận trong MRF. Trong các ký hiệu trên, T là một đại lượng vô hướng được gọi là nhiệt độ. Trong phương trình trên, Z là giá trị chuẩn hóa cần để làm cho tổng các xác suất bằng 1: ( ) U f T f F Z e    (2-7)

T là một đại lượng vô hướng xác định phân phối tăng như thế nào; lưu ý rằng khi T rất nhỏ, phân phối bị chi phối bởi phần tử của nó.

30

Lý do chính phân phối Gibbs rất quan trọng vì chúng chuyển đổi tương đương với MRF. Điều đó có nghĩa là đối với bất kỳ MRF nào, có thể viết phân phối xác suất dưới dạng phương trình (2-5). Điều đó có nghĩa là trong việc học hoặc thiết kế MRF, chúng ta có thể tập trung vào việc tìm kiếm các tiềm năng clique. Lưu ý rằng để xác định đầy đủ phân phối này vẫn còn rất khó khăn vì chúng ta phải xác định giá trị của Z. Một cách đơn giản để tính toán liên quan đến việc tính toán một tổng của một số lượng các số hạng theo cấp số nhân. Có rất nhiều cách xấp xỉ giá trị này. Tuy nhiên, trong nhiều trường hợp là không cần thiết vì để tìm phân phối MAP cho MRF, đề tài chỉ gặp vấn đề tìm nhãn mà nó tối thiểu hóa hàm năng lượng U(f), vì Z là đại lượng không đổi cho tất cả nhãn. Việc tìm nhãn tối thiểu U(f) vẫn là một vấn đề tối ưu hóa NP-hard trong hầu hết các trường hợp, nhưng có nhiều thuật toán giải quyết vấn đề này [12].

2.2.3.4 MRF với các biến quan sát

Cho đến giờ, mới chỉ xem xét phân phối trên nhãn. Điều này liên quan tới giá trị trung bình chỉ rõ phân phối tiên nghiệm trên các ảnh được gán nhãn. Nhưng ở đây, ta muốn kết nối chúng với thông tin trong một ảnh cụ thể. Để làm điều này, sử dụng các mẫu trong đó mỗi vị trí là một pixel, vì thế sẽ có một thông tin ảnh ở mỗi vị trí. Hãy gọi thông tin hình ảnh là X, với thông tin tại mỗi pixel được cho bởi Xi hoặc Xi, j. Sau đó giải quyết bài toán:

( | )

arg max

f

P f X (2-8)

Để hình dung cụ thể, hãy xét một ví dụ về khử nhiễu hình ảnh. Đề tài xem xét một MRF trong đó mỗi pixel là một vị trí và hai pixel là lân cận nếu chúng cùng nằm trong liên kết 4. Giả sử mỗi pixel có cường độ sáng từ 0 đến 255 cho bởi nhãn của nó. Xi là cường độ này với độ nhiễu được thêm vào, do đó:

i i i

31

Trong đó ei là phân phối độc lập và được rút ra từ giá trị trung bình bằng 0, phân phối Gauss với phương sai σ2. Sử dụng định luật Bayes, ta có:

( | ) ( ) ( | ) ( ) P X f P f P f X P X  (2-9) Để tính nó, ta có: ( | ) ( i | i) P X f P X f (2-10)

Lưu ý rằng mỗi Xi độc lập có điều kiện với tất cả các nhãn fi, tức là: ( i | ) ( i| i)

P X fP X f (2-11)

Và Xi cũng độc lập với nhau cho các nhãn, túc là:

( | ) ( i | )

P X f P X f (2-12)

Mô hình nhiễu nói rằng P(Xi|fi) sẽ là một phân phối Gauss với giá trị trung bình fi, do đó: 2 2 ( ) 2 2 1 ( | ) 2 i i f X i i P X f e     (2-13)

Do đó, có thể định nghĩa tiềm năng clique: 2 2 ( ) ( ) 2 i i c i f X V f    (2-14)

Đây là những clique đơn nắm giữ dữ liệu (pixel). Nếu chúng ta muốn, chúng ta có thể thêm tiên nghiệm trên các nhãn khác nhau.

Chúng ta cũng có thể xác định clique tiềm năng theo cặp để mã hóa tiên nghiệm mà các pixel lân cận có cường độ tương tự. Cách đơn giản nhất để làm điều này là xác định:

32 { , } 0 c i j c i j for c i j V f f V k f f      (2-15) 2.3 Phân đoạn ảnh

Mục tiêu của phân đoạn ảnh là chia một ảnh thành một tập hợp các vùng có ý nghĩa về mặt ngữ nghĩa, đồng nhất và không chồng lấp của các thuộc tính tương tự như cường độ, độ sâu, màu sắc hoặc kết cấu. Kết quả phân đoạn là ảnh của các nhãn xác định từng vùng đồng nhất hoặc một tập hợp các đường viền mô tả ranh giới vùng. Các thành phần cơ bản của phân tích MRI não có cấu trúc bao gồm phân loại dữ liệu MRI thành các loại mô cụ thể, xác định và mô tả các cấu trúc giải phẫu cụ thể. Phân loại có nghĩa là gán cho mỗi phần tử trong ảnh một lớp mô, trong đó các lớp được xác định trước. Các vấn đề của phân đoạn và phân loại được liên kết với nhau vì phân đoạn ngụ ý phân loại, trong khi phân loại ám chỉ phân đoạn một hình ảnh. Trong trường hợp MRI não, các yếu tố hình ảnh thường được phân loại thành ba loại mô chính: vùng trắng (WM), vùng xám (GM) và dịch não tủy (CSF); (xem Hình 2.4). Các kết quả phân đoạn được tiếp tục sử dụng trong các ứng dụng khác nhau như để phân tích cấu trúc giải phẫu, để nghiên cứu các vùng bệnh lý, để lập kế hoạch phẫu thuật và mô phỏng [1].

Hình 2.4 Một ví dụ về phân đoạn MRI não với ảnh MRI gốc (a) và hình ảnh được phân đoạn với ba nhãn: WM, GM và CSF (b) [1].

33

Phân đoạn ảnh có thể được thực hiện trên hình ảnh 2D, chuỗi hình ảnh 2D hoặc hình ảnh thể tích 3D. Hầu hết các nghiên cứu phân đoạn ảnh đã tập trung vào ảnh 2D. Nếu dữ liệu được xác định trong không gian 3D (ví dụ: thu được từ một loạt ảnh MRI), thì thông thường, mỗi hình ảnh “lát cắt” được phân đoạn riêng lẻ theo từng lát cắt một.

34

CHƯƠNG 3 PHƯƠNG PHÁP EM CẢI TIẾN ĐỀ XUẤT TRONG PHÂN ĐOẠN ẢNH NÃO NGƯỜI MRI

3.1 Phương pháp đề xuất

Các phương pháp hình thái học thông thường hay phân đoạn ảnh cơ bản thường cho kết quả không chính xác trong phân đoạn ảnh MRI não người; vì vậy, cần phải thực hiện kết hợp các phương pháp khác nhau để trích xuất chính xác các phân vùng. Trong đề tài, đề tài kết hợp hai phương pháp EM/MPM và PSO với nhau trong các bước cơ bản của một phương pháp EM vốn chưa cho kết quả chính xác như Ground Truth. Phương pháp PSO sẽ thay thế ở bước khởi tạo nhãn và tham số mô hình ngẫu nhiên cho ảnh vùng nhãn để giảm thiểu việc tạo các phân vùng ban đầu không chính xác. Phương pháp EM ước lượng tham số nhanh hơn và MPM trong EM/MPM sẽ giảm thiểu việc phân loại điểm ảnh sai giữa các phân vùng.

Một phần của tài liệu Phân loại ba vùng GM, WM, CSF từ ảnh não người và xác định điểm bất thường bằng phương pháp EM cải tiến (Trang 33 - 42)

Tải bản đầy đủ (PDF)

(83 trang)