Nhóm các nhóm pixel

Một phần của tài liệu Xây dựng cơ sở dữ liệu phục vụ quá trình xử lý ảnh X quang vú trên máy tính (Trang 90)

Với đầu ra phân ngưỡng từ bộ lọc ảnh biểu diễn trên Hình 6.3, các vị trí của các khối u chưa được xác định hồn tồn. Mỗi pixel trắng trên Hình 6.3 biểu thị một vị trí cĩ thể của khối u; tuy nhiên, các pixel được nhĩm vào các nhĩm riêng biệt biểu diễn các phát hiện đơn. Các pixel này trong các nhĩm phân biệt cần được nhĩm lại và trích ra dưới dạng một khối u đơn để so sánh với bệnh lý.

Hình 6.1 Ảnh X quang vú

Hình 6.3 Ảnh phân ngưỡng từ Hình 6.2

Nhĩm các nhĩm pixel riêng biệt khơng phải là một nhiệm vụ đơn giản. Nĩ địi hịi kiểm tra từng pixel trên ảnh và nhĩm tất cả các pixel cĩ cùng cường độ là các lân cận gần nhất. Pixel A là lân cận gần nhất của pixel B khi pixel A là một trong tám pixel nằm ngay cạnh B; Hình 6.4 biểu diễn pixel này và tám pixel lân cận của nĩ. Hình 6.3 cĩ 4 nhĩm pixel riêng biệt và Hình 6.5 biểu diễn 4 nhĩm này đã được trích rút với ảnh riêng biệt cho mỗi nhĩm.

Hình 6.5 Bốn nhĩm pixel trên Hình 6.3

Thuật tốn nhĩm và trích các nhĩm pixel trên Hình 6.5 là một phần trong kết quả của nghiên cứu trong luận văn. Các bước của thuật tốn này như sau:

Các bước nhĩm pixel

1. Tạo ra hai danh sách. Danh sách thứ nhất là danh sách pixel cho tất cả các pixel trên ảnh. Danh sách thứ hai là danh sách trống, chứa các nhĩm pixel đã nhĩm lạị

2. Pixel đầu tiên trong danh sách pixel được loại bỏ khỏi danh sách và xử lý. Quá trình này được lặp lại cho tới khi danh sách pixel trống. ðể xử lý một pixel, mỗi nhĩm trong danh sách nhĩm được kiểm trạ Nếu pixel được xử lý là lân cận gần nhất của bất cứ pixel nào trong một nhĩm trong số đĩ, nĩ sẽ được thêm vào nhĩm đĩ. Mỗi pixel sẽ chỉ được thêm vào một nhĩm trong danh sách nhĩm.

3. Khi danh sách nhĩm đã trống, tất cả các pixel đã được thêm vào một nhĩm nào đĩ. Tuy nhiên, trong hầu hết quy trình xử lý ảnh X quang vú, một số nhĩm trong danh sách nhĩm vẫn cĩ thể nhĩm lại được. Vì thế, bước tiếp theo địi hỏi mỗi nhĩm trong danh sách nhĩm được so sánh với các nhĩm khác. Các nhĩm chứa các lân cận gần nhất được kết hợp lại với nhaụ

4. Cuối cùng, mỗi nhĩm trong danh sách nhĩm được định dạng và lưu trữ dưới dạng một bức ảnh riêng biệt.

Hình 6.6 minh họa sơđồ của quy trình nàỵ

Mỗi ảnh X quang vú thường cĩ nhiều hơn một triệu pixel, và xử lý khơng hiệu quả sẽ dễ dàng tạo ra các yêu cầu tính tốn khơng thực tế. Nếu N là số lượng pixel trên ảnh; thuật tốn nhĩm pixel của ta cĩ hiệu suất là O(N) và cĩ thời gian chạy tuyến tính. Bất cứ ảnh X quang vú nào với N pixel đều cần một số lượng khơng đổi N phép tốn để nhĩm các pixel này vào các nhĩm.

Lí do cho hiệu suất tuyến tính này là để hai pixel được nhĩm vào một nhĩm, chúng cần là các lân cận gần nhất của một kết hợp nào đĩ của các pixel. ðiều này cĩ nghĩa là để nhĩm một pixel đơn, khơng cần xét từng pixel trên ảnh mà chỉ tám lân cận của pixel đơn đĩ. Nếu một pixel thuộc về một nhĩm nào đĩ với bất cứ pixel nào khác, một pixel phải nằm trong số tám lân cận của nĩ. ðiều này cho phép xử lý danh sách tuyến tính các pixel chỉ một lần. Do số lượng pixel trên ảnh lớn hơn nhiều con số 8, nến nĩ vẫn được coi là bậc N.

Quy trình xử lý danh sách pixel đầu tiên tạo ra một danh sách các nhĩm. ðộ dài của danh sách này nhỏ so với số lượng pixel trên ảnh. Bước 3 của thuật tốn kết hợp các nhĩm; tuy nhiên, một số trong các nhĩm này cĩ thể là các lân cận gần nhất. ðây là một tác động của quá trình đơn giản hố; nếu một pixel thuộc về một nhĩm nào đĩ với các pixel khác, một trong số chúng phải nằm trong số 8 lân cận gần nhất. Vì tám pixel lân cận gần nhất là các pixel duy nhất được kiểm tra, cĩ những trường hợp một nhĩm đơn các pixel bị phân loại nhầm vào hai nhĩm. Ví dụ, Hình 6.7 chỉ chứa một nhĩm phân biệt các lân cận gần nhất. Tuy nhiên, sau hai bước của thuật tốn, hai nhĩm khác nhau lại cĩ mặt trong danh sách nhĩm như minh họa trên Hình 6.8 và 6.9.

Hình 6.6 Sơđồ thuật tốn nhĩm pixel

Trình tự xử lý các pixel gây ra vấn đề này; tuy nhiên cũng dễ giải quyết. Mỗi nhĩm trong danh sách nhĩm được kiểm tra và nếu chúng cĩ chung các lân cận gần nhất, chúng được kết hợp lạị Quá trình này lặp cho tới khi các nhĩm phân biệt được. Quá trình kết hợp các nhĩm pixel cĩ lân cận gần nhất như sau:

Thuật tốn kết hợp nhĩm pixel

1. Tạo một danh sách trống các nhĩm pixel

2. Nhĩm đầu tiên trong danh sách nhĩm ban đầu được thêm vào danh sách trống.

3. Các nhĩm cịn lại được loại bỏ khỏi danh sách ban đầu và thêm vào danh sách mới mỗi lần cho tới khi danh sách ban đầu trống. Khi mỗi nhĩm được

thêm vào danh sách mới, nĩ được kiểm tra với các nhĩm khác. Nếu nĩ cĩ chung các lân cận gần nhất với một nhĩm nào đĩ đã ở trong danh sách, nĩ được kết hợp vào nhĩm nàỵ Khi một nhĩm như vậy được tìm thấy, quy trình xử lý nhĩm đĩ kết thúc và tiếp tục với nhĩm tiếp theọ

Hình 6.7 Ví dụ về nhĩm pixel

Hình 6.9 Nhĩm phân loại nhầm thứ hai

Khi đã thực hiện, vẫn cịn khả năng các nhĩm trong danh sách mới vẫn cĩ cùng các lân cận gần nhất. ðiều này cĩ thể xảy ra khi hai nhĩm được thêm vào danh sách mới, và một nhĩm thứ ba liên kết hai nhĩm ban đầu được thêm vàọ Nĩ sẽ được kết hợp với chỉ một trong hai nhĩm ban đầụ Khả năng này yêu cầu quá trình xử lý phải được lặp lại cho tới khi số lượng các nhĩm trong danh sách ban đầu khơng thay đổị Nghĩa là, khơng nhĩm nào được kết hợp nữa và vì thế khơng cịn nhĩm nào dùng chung các lân cận gần nhất.

Thuật tốn nhĩm này cĩ thể cần một lượng thời gian tính tốn đáng kể, nhưng trên thực tế nĩ thực hiện một số ít các bước lặp. Nếu G là số lượng các nhĩm pixel sau quá trình xử lý ban đầu, mỗi bước kết hợp các nhĩm cần O(G2) bước. Tổng thể việc kết hợp các nhĩm cĩ thể lên tới O(G3) bước, và mỗi nhĩm cĩ N/G

pixel. ðơn giản hố sao cho mỗi pixel chỉ cần kiểm tra đối với các lân cân ngay cạnh nĩ, mỗi lần so sánh nhĩm cần N/G bước. Vì thế, trường hợp xấu nhất đối với thuật tốn kết hợp nhĩm là O(G3) = O((N/G)3) = O(N3). ðiều này cĩ thể khơng chấp nhận được, nhưng cĩ một số điều kiện làm giảm bớt kết quả nàỵ ðầu tiên, G

thường luơn nhỏ hơn nhiều so với N. Vì G biểu diễn các vùng quan trọng trên ảnh X quang vú, nĩ thường nhỏ hơn 50 và số lượng pixel trên ảnh X quang vú cĩ thể lên tới 5 triệụ Khi quét một bức ảnh nào đĩ để tìm khối u, số lượng pixel được xử lý và số lượng các nhĩm pixel thường nhỏ (thậm chí bằng 0). Hơn nữa trong suốt quá trình xử lý các nhĩm, khi gặp một nhĩm cĩ cùng các lân cận gần nhất với một nhĩm khác, bước này kết thúc. Nghĩa là hầu hết các bước trong quy trình khơng yêu cầu số lượng phép tính cực đạị

Nĩi chung, cĩ đặc tính cố hữu trong thuật tốn này, nĩ ngăn chặn trường hợp xấu nhất. Nếu một bức ảnh chứa nhiều nhĩm nhỏ các pixel, việc kết hợp các nhĩm sẽ đươđơn giản hố bởi số lượng nhỏ các pixel trong từng nhĩm. Khi bức ảnh bao gồm ít nhĩm lớn pixel, số lượng nhỏ các nhĩm thì cần ít phép tính. Bằng cách thiết kế, việc sử dụng thuật tốn này thường luơn thoả mãn một trong hai điều kiện trên.

Hai ví dụ minh hoạ điều này, ví dụđầu tiên trên hình 6.10 là một ảnh đầu ra của thuật tốn phân vùng của chúng tạ Mỗi vùng xám biểu diễn một thành phần trên ảnh X quang vú. Bằng cách áp dụng thuật tốn nhĩm pixel vừa trình bày, các vùng khác nhau này được trích rút. Hình 6.11 biểu diễn các ảnh riêng biệt, nền trên hình 6.10 được loại bỏ.

Hình 6.11 Các thành phần trên ảnh

Mỗi thành phần trong ví dụ này chứa rất nhiều pixel. Tuy nhiên, chỉ cĩ 4 vùng. Vì thế, bước cuối cùng chỉ yêu cầu O(N) bước. Vì G = 4, bước kết hợp O(G3)

cần 64 so sánh nhĩm. Theo N, mỗi bước so sánh cần N/G bước, nghĩa là N/4. Vì thế bước so sánh nhĩm tổng thể cần: 64 16 ( ) 4 N N O N ∗ = ∗ = (6.1)

ðây là hiệu suất của bước đầu tiên trong thuật tốn nhĩm.

Ví dụ thứ hai là ảnh đầu ra từ thuật tốn phát hiện khối u, minh họa trên Hình 6.12. Nĩ chứa 20 nhĩm khác nhau, và các nhĩm này chứa trung bình N/400 pixel.

Vì thế tổng số lần so sánh nhĩm cho ví dụ này cần số lượng bước bằng:

3 20 20 ( ) 400 N N O N ∗ = ∗ = (6.2)

Khi các kết quả phát hiện được nhĩm lại thành các nhĩm khác nhau, chúng được đặt trong các bức ảnh rời rạc và lưu trữ dưới dạng các filẹ ðây là một phép tốn đơn giản, nhưng nĩ cho phép so sánh nhanh với bệnh lý.

Trong nghiên cứu này, các phát hiện về khối u được nhĩm lại được so sánh trực tiếp với bệnh lý của nĩ. Tuy nhiên, ta cĩ thể sử dụng các phát hiện này để trích rút các dữ liệu từ các ảnh X quang vú ban đầu để xử lý và phân loại sau nàỵ Việc này làm tăng đáng kể hiệu suất do vùng tổng trong các vùng được phát hệin nhỏ hơn nhiều so với tồn bộ bức ảnh.

Chương 7 - KT LUN 7.1 Tng kết

Luận văn đã trình bày một thuật tốn phân vùng ảnh X quang vú thành các thành phần nền, mơ vú, cơ ngực và lớp mỡ dưới da, cùng với các ví dụ minh họa và các kết quả. Thuật tốn phân vùng này đĩng vai trị bước tiền xử lý trong quy trình kiểm tra ảnh X quang. Nĩ giảm đáng kể số lượng các pixel cần sử dụng trong thuật tốn kiểm trạ Phưong pháp phân vùng này cho phép từng thành phần được kiểm tra độc lập với các thành phần khác, nĩ làm giảm sai số và đơn giản hố việc tìm kiếm.

Luận văn cũng đã giới thiệu một phương pháp định vị khối u trên ảnh X quang vú. Kỹ thuật này sử dụng đối sánh mẫu để xác định các khối cĩ khả năng trên ảnh và sử dụng phương pháp đa tỷ lệ để giảm số lượng lỗi tích cực saị Thuật tốn đối sánh mẫu được đánh giá với một vài mẫu khác nhaụ Phương pháp này cũng được sử dụng với vai trị bước tiền xử lý. Khi cần, nĩ trích rút ra các vùng nghi ngờ để phân tích về saụ Nĩ tập trung và giới hạn vùng tìm kiếm khối u trên ảnh, làm giảm thời gian tìm kiếm.

7.2 Phương hướng trong tương lai

Nghiên cứu trong tương lai sẽ chú trọng vào cách thức phân biệt chính xác giữa các khối u lành tính và ác tính. ðồng thời xây dựng một hệ thống hỗ trợ bác sĩ trong hoạt động kiểm tra và chẩn đốn hình ảnh ở Bệnh viện K Hà Nộị

TÀI LIU THAM KHO Tiếng Anh

1. John Terry Sample (2003), Computer assisted screening of digital mammogram images, University of Southern Mississippị

2. http://www.imaginis.com 3. http://www.ehealthmd.com 4. http://www.wikipediạcom

5. Ian T.Young, Jan J.Gerbrands, Lucas J. Van Vliet (1998), Fundamentals of Image Processing, Delf University of Technologỵ

6. Martin Masek (2004), Hierarchical segmentation of mammograms based on pixel

intensity, The University of Western Australiạ

Tiếng Vit

7. Lương Mạnh Bá, Nguyễn Thanh Thuỷ (2003), Nhp mơn xnh số, NXB Khoa học và Kỹ thuật.

XÂY DNG CƠ S D LIU PHC V QUÁ TRÌNH XNH X QUANG VÚ TRÊN MÁY TÍNH

TĨM TẮT

T khố:

Ảnh X quang vú, phân vùng ảnh, đối sánh mẫu, phát hiện khối u, bệnh ung thư vú. Bệnh ung thư vú là một căn bệnh rất phổ biến với nữ giới trên thế giới hiện naỵ Ở các nước phát triển, quá trình chẩn đốn ảnh X quang vú được hỗ trợ rất nhiều từ hệ thống máy tính. Tuy nhiên, ở Việt Nam, cơng việc chẩn đốn vẫn cịn được thực hiện thủ cơng, phụ thuộc chủ yếu vào kinh nghiệm của các bác sĩ.

Vì vậy, nhu cầu về một hệ thống chẩn đốn dựa trên máy tính với các thuật tốn xử lý ảnh nhằm hỗ trợ bác sĩ trở nên vơ cùng thiết yếụ Luận văn trình bày về một bước tiền xử lý với ảnh, bao gồm một thuật tốn phân vùng ảnh X quang vú và một phương pháp định vị khối u trên ảnh.

Thuật tốn phân vùng ảnh X quang vú dựa trên lược đồ xám của ảnh. Thuật tốn phân vùng trình bày trong luận văn cĩ ưu thế hơn một số thuật tốn phân vùng khác do nĩ khơng địi hỏi một bộ dữ liệu đã được học. Phương pháp định vị khối u trên ảnh sử dụng các mẫu để đối sánh. Các mẫu này được trích từ các ảnh X quang vú chuẩn, với một số dạng đặc trưng và cĩ thể điều chỉnh đa tỷ lệ để phù hợp với kích thước thật của khối ụ

Cũng từ đĩ xuất hiện nhu cầu về một cơ sở dữ liệu sử dụng được cho các bệnh viện ở Việt Nam. Vì vậy, một cơ sở dữ liệu bao gồm các ảnh X quang đã được chẩn đốn đúng được thiết lập. Cơ sở dữ liệu này là cơ sở dữ liệu chuẩn, sử dụng để thiết lập các mẫu phục vụ cho quá trình xác định khối u trên các ảnh X quang vú thu thập từ Bệnh viện K Hà Nộị

Một phần của tài liệu Xây dựng cơ sở dữ liệu phục vụ quá trình xử lý ảnh X quang vú trên máy tính (Trang 90)

Tải bản đầy đủ (PDF)

(103 trang)