Luận văn thạc sĩ Kỹ thuật điện tử: Phân đoạn các vùng tế bào trong ảnh y sinh

Đây chính là các điểm seeds sẽ đượcsử dụng cho giải thuật lan truyền tế bào.Luận văn sử dụng bộ hai bộ dữ liệu ảnh tế bào là Serous cytology và Bronchialcytology với các kết quả phân đoạ

GIỚI THIỆU ĐỀ TÀI

Đặt vấn đề

Trong y học, các phương pháp khám, chữa bệnh dựa trên hình ảnh đã trở nên rất phổ biến như siêu âm, nội soi, X-quang, chụp cộng hưởng từ Ảnh y sinh thường chụp các bộ phận bên trong cơ thể người nên ảnh thường không rõ ràng và cần các công cụ xử lý ảnh để giúp việc chẩn đoán, điều trị bệnh dễ dàng hơn Một trong những bài toán được đặt ra trong lĩnh vực này là phân đoạn các vùng mô cần quan tâm khỏi các vùng còn lại.

Ví dụ trong việc xét nghiệm máu hay các nghiên cứu về tế bào, các bác sĩ thường có nhu cầu đếm số lượng tế bào và số lượng các tế bào bị nhiễm trùng, qua đó xác định được tỉ lệ các tế bào bị nhiễm trùng, và có thể kết luận được bệnh nhân có bị nhiễm bệnh hay không.

Các phương pháp phân đoạn các vùng tế bào phổ biến hiện nay thường dựa trên khả năng quan sát, đánh giá và sự tương tác của người giám sát Các phương pháp này bộc lộ những khuyết điểm như tốn nhiều thời gian, yêu cầu sự tập trung cao của chuyên viên y tế Khi số lượng ảnh hay số lượng các vùng cần phân đoạn lớn thì sẽ ảnh hưởng đến thời gian và sự chính xác của việc đánh giá, chuẩn đoán bệnh Việc tăng chất lượng và giảm thời gian phân đoạn ảnh sẽ hỗ trợ rất nhiều cho việc chẩn đoán và là nền tảng để làm cho hiệu suất của việc khám chữa bệnh tăng lên.

Thực tế trên đặt ra yêu cầu về một giải thuật hợp lí có khả năng phân đoạn tự động

GIỚI THIỆU ĐỀ TÀI

các vùng cần quan tâm trong ảnh y sinh nói chung và các ảnh tế bào nói riêng Luận văn sẽ thực hiện một phương pháp phân đoạn cải tiến dựa trên nguyên lý lan truyền tế bào cho phép phân đoạn ảnh y sinh mà không cần tương tác của người giám sát Giải thuật phân đoạn được thực hiện trên MATLAB và được thử nghiệm, đánh giá với các bộ dữ liệu ảnh tế bào Serous và Bronchial và các ảnh cộng hưởng từ MRI.

1.2 Tình hình nghiên cứu phân đoạn ảnh y sinh

Từ khi thuyết tế bào được phát hiện vào đầu thế kỷ 19, nhiều nghiên cứu về tế bào đã được thực hiện [11] Một trong những công cụ hữu ích cho quá trình nghiên cứu tế bào là kính hiển vi quang học [12] Kính hiển vi quang học cho phép con người quan sát và thu được lượng lớn các ảnh chụp tế bào Sự phong phú, không đồng nhất, số lượng lớn đã gây ra những khó khăn khi thực hiện việc quản lý, xử lý, phân tích ảnh bằng tay.

Từ đó, xử lý ảnh bằng máy tính trở thành chìa khoá quan trọng thực hiện các bước xử lý phức tạp trong y học tế bào [12, 13, 14, 15] Một vấn đề trọng tấm trong các nghiên cứu là phân đoạn tế bào [16] Vấn đề này đã nhận được sự quan tâm ngày càng lớn trong những năm qua (hình 1.1)

Máy tính được sử dụng lần đầu tiên để phân tích các tế bào đã xuất hiện gần nửa thế kỉ Vào những năm 1950, một hệ thống đã được phát triển để tự động hóa việc phân loại các tế bào được nhuộm màu để cho phép sàng lọc hàng loạt đối với các trường hợp nghi ngờ ung thư cổ tử cung Những hệ thống này thực hiện bằng các quy tắc lấy ngưỡng trên các ảnh 1D [17] Những năm 1960 chứng kiến những thành tựu đầu tiên của xử lí ảnh trên không gian 2 chiều (2D) để tính toán sự khác biệt của các loại tế bào bạch cầu dựa trên các thông tin về màu sắc và hình thái đơn giản [18] Hệ thống này được thương mại hóa vào giữa những năm 1970 Đây cũng là khoảng thời gian chứng kiến sự hỗ trợ của kính hiển vi máy tính trong việc tìm kiếm và phân tích hình thái của các tế bào thần kinh[19] Vào những năm 1990 khi máy tính đã trở nên đủ mạnh để xử lí các dữ liệu ảnh 2D phức tạp và thậm chí là 3D (với sự hỗ trợ của kính hiển vi đồng tiêu) là lúc xử lí ảnh(Image processing) và thị giác máy tính (Computer Vision) bắt đầu phát triển một cách nhanh chóng [20] Trong đó các nghiên cứu thuộc lĩnh vực tế bào chủ yếu tập trung về các vấn đề đếm số tế bào, xác định các loại tế bào và giai đoạn của chúng, sự tương tác

CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI giữa chúng (morphodynamics) , tổ chức cấp mô và tổ chức nội bào [14].

Hình 1.1: Số lượng bài báo và nghiên cứu hàng năm về phân đoạn ảnh y tế [1]

Phân đoạn ảnh tự động cho phân tích tế bào thường gặp nhiều thách thức do sự phức tạp của hình ảnh (các loại tế bào khác nhau, kính hiển vi khác nhau, mật độ tế bào, dạng tế bào) Tuy nhiên, trong các nghiên cứu được xem xét, các phương pháp phân đoạn tế bào đều dựa trên một số hướng tiếp cận cơ bản Một trong những phương pháp phổ biến nhất là lấy ngưỡng [21] Phương pháp này được thực hiện với giả định rằng, các tế bào có sự đồng nhất về mức xám và khác biệt so với nền Việc lấy ngưỡng tự động được thực hiện dựa trên phân tích thống kê về cường độ mức xám (toàn cục hoặc cục bộ) Một phương pháp khác là phân đoạn dựa trên việc dò tìm các đặc trưng của tế bào Chẳng hạn ở độ phóng đại thấp, các tế bào hiển thị như các chấm nhỏ và có thể được dò tìm bằng bộ lọc Gaussian Ở độ phóng đại cao, tế bào xuất hiện như các vùng rộng và có thể được phát hiện dựa trên hình dạng của chúng Việc dò biên có thể được sử dụng để liên kết các vùng với nhau [21] Các phương pháp phân đoạn dựa trên biến đổi hình thái cũng được áp dụng trong phân đoạn tế bào Các phép biến đổi hình thái không tuyến tính cho phép kiểm tra và biến đổi hình dạng của các đối tượng trong ảnh và thường được sử dụng để kết nối các vùng trong phân đoạn tế bào Nhiều bộ biến đổi hình thái phức tạp đã được phát triển Các phép biến đổi hình thái cũng được áp dụng như các tiền xử lý cho các phương pháp khác Một hướng tiếp cận khá mới là phát triển vùng(region accumulation) Hướng tiếp cận này trong phân đoạn tế bào được bắt đầu bằng việc chọn các điểm seed trong ảnh và lặp lại việc thêm các điểm khác vào các vùng đã đánh dấu Điều quan trọng trong hướng này là cách để phát triển vùng Thông thường,việc phát triển vùng sẽ được thực hiện dựa trên sự tương đồng về mức xám của điểm ảnh đang xét với các điểm ảnh đã được phân đoạn Các phương pháp phân đoạn thường

CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI được kết hợp với nhau để mang lại hiệu quả cao nhất.

Giải thuật lan truyền tế bào tự động (CA) được đề xuất bởi tiến sĩ John von Neumann những năm 1960 Giải thuật này đã có ứng dụng rộng rãi để mô hình hoá hệ thống trong các lĩnh vực như vật lý, sinh học, xã hội học Trong 50 năm trở lại đây, nhiều nhà nghiên cứu (bao gồm các tên tuổi nổi tiếng như John von Neumann [22], Stephen Wolfram [23], và John Conway [24] đã thực hiện nghiên cứu các đặc tính của CA Trong những năm 1960, 1970 đã có những nỗ lực để phát triển các thiết bị phần cứng chuyên dụng để áp dụng CA vào trong việc phân tích hình ảnh [25] Những năm 1990, CA được áp dụng để thực hiện một loạt các nhiệm vụ thị giác máy tính, chẳng hạn như: tính toán tính chất của vùng nhị phân như diện tích, chu vi [26], so khớp mẫu [27], lọc nhiễu và tăng cường ảnh [28].

Một trong những ưu điểm của CA là kết hợp thông tin của điểm ảnh (mức xám, màu sắc) với vị trí của các điểm ảnh, từ đó cho phép có nhiều thông tin hơn về hệ thống mặc dù thông tin của các điểm ảnh rời rạc là rất hạn chế Tuy nhiên nhược điểm của CA là cần có các thông tin khởi tạo ban đầu bằng tay Điều này gây khó khăn trong việc thực hiện các hệ thống lớn Gần đây đã có các nghiên cứu nhằm tự động hoá các bước này Ví dụ, Sipper đã phát triển một phương pháp để thực hiện điều này [29] Mặc dù mục tiêu nghiên cứu của Sipper là khá đơn giản, và kết quả thu được chưa thực sự tốt nhưng đã chứng minh rằng phương hướng này là khả thi Luận văn này sẽ thực hiện một phương pháp ước lượng tự động dựa trên mô hình trộn Gaussian để ứng dụng CA vào trong phân đoạn tế bào.

1.3 Phương pháp phân đoạn thực hiện

Luận văn này sẽ thực hiện một phương pháp cải tiến giải thuật lan truyền tế bào để cho phép phân đoạn tự động các tế bào trong ảnh y sinh Giải thuật lan truyền tế bào yêu cầu người giám sát cung cấp các điểm seeds ban đầu (được gọi là mặt nạ) để thực hiện phân đoạn Việc phân đoạn đặt được bằng cách lan truyền từ các điểm seeds đến các điểm ảnh khác cho đến khi toàn bộ ảnh được phân đoạn Đối với ảnh tế bào, việc chọn ra các điểm seeds này sẽ mất rất nhiều nỗ lực Phương pháp cải tiến mà luận văn

CHƯƠNG 1 GIỚI THIỆU ĐỀ TÀI đề xuất sẽ giúp chọn ra các điểm seeds mà không cần sự tương tác của người giám sát. Đầu tiên giải thuật K-mean được áp dụng để phân cụm các điểm ảnh Tiếp đó, mô hình trộn Gauss (GMM) được dùng để ước lượng mô hình phân bố của ảnh Từ đó cho phép ước lượng được các điểm ảnh nhiều khả năng thuộc về vùng cần quan tâm, cụ thể là các nhân tế bào, và các điểm ảnh thuộc về vùng nền Đây chính là các điểm seeds sẽ được sử dụng cho giải thuật lan truyền tế bào trong các bước phân đoạn tiếp theo.

Luận văn sẽ sử dụng hai bộ cơ sở dữ liệu ảnh tế bào là bộ dữ liệu Serous cytology [30] và Bronchial cytology [31], đồng thời cũng thử nghiệm với một bộ dữ liệu ảnh MRI [32] Bộ cơ sở dữ liệu Serous cytology gồm 10 ảnh màu RGB được thu thập bằng kính hiển vi từ các tế bào huyết thanh được nhuộm theo phương pháp Pap (nhuộm Papanicolaou) với các kết quả phân đoạn tin cậy (ground – truth) để có thể dễ dàng đánh giá khả năng phân đoạn của phương pháp đề xuất trên cơ sở dữ liệu này.

Bộ cơ sở dữ liệu Brochial cytology gồm 7 ảnh tế bào được nhuộm theo phương phápPap thu thập bằng kính hiển vi với các tế bào phế quản Kết quả phân đoạn tham khảo đi kèm từng ảnh trong bộ cơ sở dữ liệu.

TỔNG QUAN CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH Y SINH

Lấy ngưỡng

Lấy ngưỡng là một trong những phương pháp đơn giản và phổ biến nhất cho phân đoạn ảnh nói chung và phân đoạn ảnh y tế nói riêng Phương pháp này có thể dựa trên các đặc tính đơn giản, cần thiết nhất của ảnh như mức xám, độ tương phản, độ truyền sáng, màu sắc hoặc đáp ứng phổ để phân đoạn ảnh thành các vùng có đặc tính tương đồng Lấy ngưỡng sẽ phân hoạch ảnh ra làm 2 phần, một phần chứa các đối tượng

TỔNG QUAN CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH Y SINH

(object hay foreground) trong bức ảnh và phần kia chứa nền ảnh (background) [33].

Lấy ngưỡng có thể dựa trên thông tin toàn cục của bức ảnh hoặc thông tin cục bộ của từng vùng trong ảnh Nếu chỉ có một ngưỡng được sử dụng cho toàn bộ hình ảnh thì được gọi là lấy ngưỡng toàn cục Mặt khác, khi hình ảnh được phân chia thành nhiều vùng nhỏ và từng ngưỡng được xác định cho từng vùng, đó được gọi là ngưỡng địa phương.

2.1.1 Lấy ngưỡng toàn cục Đây là phương pháp lấy ngưỡng đơn giản nhất Nếu giá trị một điểm bé hơn một ngưỡng nào đó thì nó là điểm đen (0); mặt khác nó được coi là một điểm trắng (1). g(x,y) 

(2.1) trong đó: g(x,y)là giá trị kết quả tại điểm đang xét f(x,y)là giá trị ban đầu của điểm ảnh T là hằng số

Giá trị ngưỡng T thường được xác định dựa trên histogram của ảnh.

(a) Ảnh đầu vào (b) Histogram (c) Ảnh sau khi phân đoạnHình 2.1: Phân đoạn ảnh với phương pháp lấy ngưỡng toàn cục [2]

CHƯƠNG 2 TỔNG QUAN CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH Y SINH

Một biến thể của phương pháp này là lấy ngưỡng toàn cục đa mức g(x,y) 

Hình 2.2: Phương pháp phân đoạn lấy ngưỡng một mức và đa mức [2]

Trong phương pháp lấy ngưỡng thì việc chọn ngưỡng T đóng vai trò quyết định.

Thông thường nó được chọn dựa trên lược đồ mức xám của ảnh T sẽ có giá trị mức xám tại các điểm cực tiểu trên lược đồ xám.

Thuật toán lấy ngưỡng Otsu

Otsu là tên một nhà nghiên cứu người Nhật đã nghĩ ra ý tưởng cho việc tính ngưỡng T một cách tự động (adaptive) dựa vào giá trị điểm ảnh của ảnh đầu vào nhằm thay thế cho việc sử dụng ngưỡng cố định (fixed hay const) [34] Phương pháp này cho kết quả là mỗi ảnh khác nhau có một ngưỡng tương ứng khác nhau.

Lấy ngưỡng toàn cục có ưu điểm là hiệu suất cao do chỉ phải tính mức ngưỡng T đúng 1 lần Tuy nhiên trong nhiều trường hợp, ảnh thu nhận không được chiếu sáng đồng đều Khi đó lấy ngưỡng toàn cục tỏ ra kém hiệu quả.

Lấy ngưỡng cục bộ cũng tương tự như lấy ngưỡng toàn cục, tuy nhiên mức ngưỡngT là thay đổi, không những phụ thuộc vào đặc tính mà còn vào vị trí của điểm ảnh đang

CHƯƠNG 2 TỔNG QUAN CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH Y SINH xét Chẳng hạn T có thể lấy giá trị trung bình của một vùng ảnh xung quanh điểm đang xét Do đó lấy ngưỡng cục bộ có tính thích nghi cao hơn lấy ngưỡng toàn cục.

2.2 Phân đoạn dựa vào đường biên

Biên là ranh giới giữa một đố tượng và nền hay là đường ranh giới phân biệt giữa hai đối tượng kề nhau Biên đóng một vị trí hết sức cơ bản trong phân tích ảnh Một ảnh chỉ với màu đen trắng nhưng có đường biên rõ ràng thì người ta hoàn toàn có thể nhận biết được đối tượng trong ảnh Phát hiện biên là một công cụ quan trọng trong xử lý ảnh số Nó làm giảm một cách đáng kể khối lượng dữ liệu cần tính toán, chỉ giữ lại một số ít những thông tin cần thiết đồng thời vẫn bảo toàn được những cấu trúc quan trọng trong bức ảnh.

Trong xử lý ảnh, một điểm có thể là biên nếu có sự thay đổi đột ngột về mức xám tại vị trí điểm ảnh đó Tập hợp các điểm biên gần nhau tạo thành biên hay đường bao của ảnh Một số kiểu đường biên thường gặp là: Biên dạng nhảy bậc, biên dốc, biên dạng xung vuông, biên dạng hình nón.

(a) Biên dạng nhảy bậc (b) Biên dốc

(c) Biên dạng xung vuông (d) Biên dạng hình nón Hình 2.3: Các dạng đường biên thường gặp [3]

Trên thực tế ảnh thường các điểm ảnh thường có sự thay đổi mức xám đột ngột và không đồng nhất, đặc biệt là ảnh nhiễu với các nguyên nhân thiết bị nhập ảnh, cường độ ánh sáng, nhiệt độ, chuyển động, hiệu ứng áp suất Các đường biên lúc này trở nên gồ

CHƯƠNG 2 TỔNG QUAN CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH Y SINH ghề, mấp mô, đứt đoạn.

Các phương pháp phát hiện biên truyền thống thường dựa trên kết quả của phép tích chập (convolution) giữa bức ảnh cần nghiên cứu f(x,y)và một bộ lọc 2Dh(x,y)thường được gọi là mặt nạ (mask) Thông thường mặt nạ là một ma trận 3x3, có tác dụng như một bộ lọc thông cao để làm nổi rõ biên và loại bỏ các chi tiết khác Tùy cách chọn mặt nạ mà có các phương pháp do biên khác nhau.

Việc phân đoạn ảnh dựa vào đường biên được tiến hành qua các bước:

1 Phát hiện và làm nổi biên 2 Làm mảnh biên

3 Nhị phân hoá đường biên 4 Mô tả biên

Có nhiều phương pháp phát hiện biên đang được áp dụng, tuy nhiên ta có thể phân thành hai nhóm cơ bản là phát hiện biên dùng Gradient và phương pháp Laplacian.

Phương pháp phát hiện biên dùng Gradient (sử dụng các toán tử Roberts, Prewitt, Sobel, Canny) dựa vào tính giá trị cực đại và cực tiểu của đạo hàm bậc nhất của ảnh Phương pháp Laplacian sẽ tìm kiếm những điểm có giá trị 0 khi lấy đạo hàm bậc hai của ảnh.

Phương pháp gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm bậc nhất Theo định nghĩa, gradient là một vector có các thành phần biểu thị tốc độ biến đổi các giá trị theo hai hướngx,yđược tính theo công thức 2.3 và 2.4. g x (x,y) =∂f(x,y)

Trong đó dx, dy là khoảng cách giữa các điểm ảnh theo hướng x và y Thực tế người ta hay dùngdx=dy=1.

Với một ảnh liên tục f(x,y), các đạo hàm riêng cho phép xác định vị trí cực đại cục bộ theo hướng của biên Biên độ và hướng của gradient được xác định dựa trên sự kết hợp của cả hai giá trị đạo hàm riêng này theo công thức 2.5 và 2.6. g(x,y) q g 2 x (x,y) +g 2 y (x,y) (2.5) ϕ(x,y) =arctang x (x,y) g y (x,y) (2.6)

Thực ra đạo hàm của ảnh không tồn tại vì f(x,y)không liên tục Ở đây ta chỉ mô phỏng theo ý nghĩa của đạo hàm Ngoài việc tính gradient theo hướng x, y, có thể áp dụng mở rộng theo các hướng khác Việc này thường được thực hiện bằng cách tích chập ảnh f(x,y) với các mặt nạ khác nhau Một số mặt nạ thường được áp dụng là Sobel, Prewitt, Robert.

dụng

Tthống kê về số lượng và các phương pháp phân đoạn ảnh được sử dụng qua từng thời đoạn dựa trên các bài báo nghiên cứu được xuất bản được cho trong hình 2.8 [1].

Các phương pháp được áp dụng rất đa dạng Theo thời gian, có thể nhận thấy sự gia tăng của các phương pháp tiếp cận dựa trên vùng (region-based) Tuy nhiên phương pháp lấy ngưỡng vẫn tiếp tục được nghiên cứu và ứng dụng như là các bước tiền xử lí để làm nền tảng cho các phương pháp phức tạp hơn.

Hình 2.8: Thống kê các phương pháp phân đoạn ảnh được sử dụng [1]

Chương này đã trình bày tổng quan về các phương pháp phân đoạn được dùng trong xử lý ảnh nói chung cũng như trong ảnh y tế nói riêng Mỗi phương pháp đều có những ưu, nhược điểm và không có phương pháp nào là tốt nhất Việc áp dụng phương pháp nào phụ thuộc vào từng trường hợp và mục đích cụ thể Hiện nay, cùng với sự gia tăng khả năng tính toán của phần cứng, các phương pháp có độ phức tạp cao như Region growing, clustering được sử dụng nhiều hơn, tuy nhiên các phương pháp đơn giản như lấy ngưỡng vẫn được áp dụng rộng rãi.

Chương tiếp theo sẽ trình bày chi tiết hơn về các lý thuyết, giải thuật sẽ được áp dụng để thực hiện đề tài.

CƠ SỞ LÝ THUYẾT VÀ GIẢI THUẬT

Không gian màu

Ánh sáng màu là tổ hợp các ánh sáng đơn sắc Mắt người có thể cảm nhận được một số màu nhất định nhưng lại có thể phân biệt được hàng ngàn màu Có 3 thuộc tính chủ yếu trong cảm nhận màu:

• Brightness:sắc màu, còn gọi là độ chói.

• Hue:sắc lượng, còn gọi là sắc thái màu

Tổ hợp B, H, S đối với từng ánh sáng màu giúp mắt con người có thể phân biệt được hàng ngàn màu Trong xử lý ảnh số, không gian màu là một mô hình toán học dùng để mô tả các màu sắc trong thực tế được biểu diễn dưới dạng số.

CƠ SỞ LÝ THUYẾT VÀ GIẢI THUẬT

Trong võng mạc mắt người có các tế bào cảm thụ hình nón nhạy với ánh sáng Có khoảng 6á 7 triệu tế bào loại này trong mắt, được chia làm ba nhúm nhạy với ba màu ánh sáng khác nhau: 65% tế bào nhạy với ánh sáng đỏ (Red), 32% tế bào nhạy với ánh sáng xanh lục (Green) và 2% còn lại nhạy với ánh sáng xanh lơ (Blue) Ba màu này gọi là màu cơ bản Sự kết hợp của 3 màu này sẽ tạo ra tất cả các màu khác.

Không gian màu RGB được xem như một khối lập phương 3 chiều với màu đỏ là trục x, màu xanh lục là trục y, màu xanh lơ là trục z Mỗi màu trong không gian này được xác định bởi 3 thành phần R, G, B (hình 3.1) Ứng với các tổ hợp khác nhau của 3 màu này sẽ cho ta một màu mới Cách biểu diễn không gian màu này khá giống với thực tế mà mắt con người cảm nhận màu sắc nên được gọi là không gian màu cơ sở.

(a) Ba màu cơ bản (b) Biểu diễn màu

Hình 3.1: Không gian màu RGB [9]

Trong biểu diễn ảnh số, mỗi màu RGB thường được mã hóa bằng 8 bit, nghĩa là 8 bit cho kênh R, 8 bit cho kênh G, 8 bit cho kênh B Mỗi kênh màu này sẽ nhận giá trị từ 0-255 Các kênh màu kết hợp với nhau ta sẽ được một màu khác nhau, như vậy ta sẽ có tổng cộng 255x255x255 = 16,6 triệu màu sắc Ví dụ: màu đen là sự kết hợp của các kênh màu (R, G, B) với giá trị tương ứng (0, 0, 0) màu trắng có giá trị (255, 255, 255),màu vàng có giá trị (255,255, 0), màu tím đậm có giá trị (64, 0, 128).

CHƯƠNG 3 CƠ SỞ LÝ THUYẾT VÀ GIẢI THUẬT

HSV là không gian màu được dùng nhiều trong việc chỉnh sửa ảnh, phân tích ảnh và một phần của lĩnh vực thị giác máy tính Thực chất không gian màu HSV là sự biến đổi của không gian RGB Hệ không gian này dựa vào 3 thông số để mô tả màu sắc (H

= Hue: Màu, S = Saturation: Độ đậm đặc hay sự bão hòa, V = Value: giá trị cường độ sáng).

Không gian màu này thường được biểu diễn dưới dạng hình trụ hoặc hình nón.

Hình 3.2: Không gian màu HSV [9]

Theo đó, đi theo vòng tròn từ 0-360 độ là trường biểu diễn màu sắc(Hue) Trường này bắt đầu từ màu đỏ đầu tiên (red primary) tới màu xanh lục đầu tiên (green primary) nằm trong khoảng 0-120 độ, từ 120-240 độ là màu xanh lục tới xanh lơ (green primary - blue primary), từ 240-360 là từ màu đen tới lại màu đỏ.

Theo như cách biểu diễn không gian màu theo hình trụ như trên, đi từ giá trị độ sáng (V) được biểu diễn bằng cách đi từ dưới đáy hình trụ lên và nằm trong khoảng từ 0 -1. Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh hình trụ là độ sáng lớn nhất (V

= 1) Đi từ tâm hình trụ ra mặt trụ là giá trị bão hòa của màu sắc (S) S có giá trị từ 0 -1 0 ứng với tâm hình trụ là chỗ mà màu sắc là nhạt nhất S = 1 ở ngoài mặt trụ, là nơi

Hình 3.3: Hình tròn biểu diễn màu sắc trong không gian HSV [9] mà giá trị màu sắc là đậm đặc nhất.

Như vậy với mỗi giá trị (H, S, V) sẽ cho ta một màu sắc mà ở đó mô tả đầy đủ thông tin về màu sắc, độ đậm đặc và độ sáng của màu đó.

Ngoài 2 không gian màu trên, còn có rất nhiều không gian màu khác được sử dụng vào những mục đích khác nhau như CYMK, YcbCr .

3.2 Giải thuật phân cụm K-means

K-means là giải thuật được sử dụng phổ biến trong kỹ thuật phân cụm Nội dung chính của thuật toán k-means là tìm cách phân nhóm các đối tượng đã cho vào k cụm (k là số các cụm được xác đinh trước, k nguyên dương) sao cho tổng khoảng cách giữa các đối tượng đến trọng tâm nhóm là nhỏ nhất Khoảng cách ở đây có thể là khoảng cách Euclidean, nhưng cũng có thể được định nghĩa theo cách khác.

Trong giải thuật k-means, dữ liệu cần phân cụm được biểu diển như một tập hợp

D={x 1 ,x 2 ,x 3 , ,x n }trong đóx i ={x i1 ,x i2 ,x i3 , ,x ir }là một vector có r chiều với r là một số phụ thuộc vào thuộc tính của dữ liệu muốn phân cụm Khi áp dụng trong phân đoạn ảnh, xi có thể là mức xám, hay màu sắc của mỗi điểm ảnh.

Trọng tâm nhóm

Trong giải thuật K-means thì k trọng tâm tương ứng với k nhóm ban đầu được chọn ngẫu nhiên, sau mỗi lần nhóm các đối tượng vào các nhóm, trọng tâm được tính toán lại theo công thức 3.1. c i j = ∑ t s=1 x s j t (3.1)

Trong đó: t là số phần tử của nhóm cần xác định trọng tâm c i j là tọa độ thứ jcủa trọng tâm nhómi

Khoảng cách

Khoảng cách trong giải thuật K-means đặc trưng cho sự khác biệt giữa các điểm dữ liệu và trọng tâm của nhóm Trong luận văn này, khoảng cách được dùng là khoảng cách Euclidean, được tính toán theo công thức 3.2. δ i j s m s=1 ∑

Trong đó: δ i j là khoảng cách từx i đếnx j x is ,x js là thuộc tính thứscủax i ,x j Trọng tâm của nhóm được xác định bằng giá trị trung bình các phần tử trong nhóm.

Giải thuật

Mô hình trộn Gauss

Mô hình trộn Gauss (Gaussian mixture model – GMM) là một dạng mô hình thống kê được xây dựng từ việc huấn luyện các tham số thông qua dữ liệu học [35] Mô hình GMM còn có một số tên gọi khác như Weighted Normal Distribution Sums hay Radial Basis Function Approximations Mô hình trộn Gauss được áp dụng rộng rãi trong nhiều lĩnh vực như xử lý ảnh, tài chính, khí tượng .

Hàm mật độ xác suất của một biến ngẫu nhiênx= (x 1 ,x 2 , x d ) T có phân bố Gauss được chỉ ra trong công thức 3.3.

(3.3) trong đú: à là kỳ vọng và Σlà ma trận hiệp phương sai (covariance) của phõn bố Gauss đó.

Nếuxlà biến ngẫu nhiên một chiều thì hàm mật độ xác suất theo phân bố Gauss trở thành công thức 3.4. p(x) = 1 σ

(3.4) trong đú à vàσ lần lượt là giỏ trị trung bỡnh và độ lệch chuẩn của biếnx.

Mô hình trộn Gauss (GMM) xấp xỉ một hàm mật độ xác suất bằng cách hợp các hàm mật độ Gauss Hàm mật độ xác suất của mô hình trộn Gauss chính là tổng có trọng số của các phân bố Gauss theo công thức: p(x) K

∑ j=1 w j N(x|à j ,Σj) (3.5) trong đó w j là trọng số của phân bố Gauss thứ j Các trọng số này phải thỏa mãn điều kiện 3.6.

Các trọng sốw j thể hiện mức độ ảnh hưởng của mỗi phân bố Gauss đối với mô hình trộn Gauss Phân phối Gauss nào có trọng số càng lớn thì mức độ ảnh hưởng của phân phối Gauss đó đến mô hình GMM càng lớn.

Tùy thuộc vào cách tổ chức ma trận hiệp phương sai (covariance matrix), GMM có thể có một số biến thể khác nhau như sau:

• Nodal covariance matrix GMM: mỗi phân bố Gauss trong mô hình GMM có một ma trận hiệp phương sai riêng.

• Grand Covariance matrix GMM: tất cả các phân bố Gauss trong mô hình GMM dùng một ma trận hiệp phương sai.

• Global Covariance matrix GMM: mọi phân bố Gauss trong tất cả các GMM dùng chung một ma trận hiệp phương sai.

Thông thường dạng Nodal covariance matrix GMM được dùng phổ biến và đây cũng là mô hình được áp dụng trong đề tài.

Vấn đề đặt ra lúc này là từ một tập các dữ liệu đầu vàoX ={x 1 ,x 2 , ,x n }làm sao cú thể mụ hỡnh húa thành một mụ hỡnh GMM với đầy đủ cỏc thụng sốθ = (w j ,à j ,Σ j ).

Một cách tiếp cận để giải quyết vấn đề này là sử dụng thuật toán cực đại hóa kỳ vọng(Expectation Maximization–EM).

Thuật toán cực đại hóa kỳ vọng

Thuật toán EM (Expectation Maximization) [35] là một trong những phương pháp phổ biến nhất để ước lượng tham số cho mô hình trộn Gauss Thuật toán EM ước lượng tham số GMM dựa trên việc cực đại hóa xác suất quyết định p(X|θ)(3.7).

CHƯƠNG 3 CƠ SỞ LÝ THUYẾT VÀ GIẢI THUẬT p(X|θ) N

Nội dung cơ bản của thuật toán EM là từ mô hình θ ban đầu, ước lượng một mô hìnhθ t mới sao cho: p(X|θ t )≥p(X|θ) (3.8)

Mô hình mới này lại tiếp tục được dùng làm mô hình khởi đầu mới cho lần lặp tiếp theo Quá trình này sẽ dừng lại cho đến khi kết quả hôi tụ Khi đó, p(X|θ) đặt giá trị cực đại.

Với tập dữ liệu huấn luyệnX ={x 1 ,x 2 , ,x N }thì các trọng sốw j , giá trị trung bình à và phương saiΣcủa GMM ở mỗi bước lập sẽ được tớnh theo cỏc cụng thức 3.9, 3.10, 3.11. w j = 1 N

∑ N i=1 p(j|x i ,θ t ) (3.11) Trong đó j=1 k,klà số phân bố Gauss trong mô hình GMM.

Thuật toán EM tương tự như thuật toán K-mean và có tên gọi khác là phân cụm K-mean mềm (soft K-mean clustering).

Vấn đề quan trọng trong thuật toán EM là chọn các tham số khởi động Thông thường để chọn một mô hình với các tham số khởi động phù hợp, thuật toán K- means được sử dụng để khởi tạo các giá trị bắt đầu nhằm đem lại tốc độ hội tụ nhanh hơn.

Thuật toán Graph Cuts

Graph-Cuts là một phương pháp phân đoạn có tương tác, trong đó ảnh sẽ được chia thành hai miền là "đối tượng"(object ) và "nền"(background) Một người dùng - bằng trực giác - sẽ chỉ ra các điểm ảnh (seeds) chắc chắn thuộc về object và các điểm ảnh chắc chắn thuộc về background Điều này được gọi là "ràng buộc cứng"(hard constrains).

Những điều kiện cứng này cung cấp các manh mối về các vùng mà người dùng muốn phân đoạn Phần còn lại của ảnh (các điểm ảnh chưa được gắn với điều kiện cứng) sẽ được phân đoạn bằng cách chọn ra phương án tối ưu (dựa trên một hàm chi phí) trong tất cả các phương án phân đoạn thoả mãn điều kiện cứng Hàm chi phí này được định nghĩa dựa trên các thuộc tính của đường biên và của vùng được phân đoạn và được xem như là điều kiện mềm cho việc phân đoạn [10]

Xét tập hợp chứa tất cả các điểm ảnhPvà tập hợpN chứa các cặp p,qlà các điểm ảnh hàng xóm trongP Một phương án phân đoạn có thể được diễn tả bằng tập hợp nhãn

A= (A 1 , ,A p , ,A |P| )trong đó mỗi thành phầnA p có giá trị là "obj"hoặc "bkg"(viết tắt của object và background) nếu điểm ảnh pthuộc object hoặc background Khi đó, điều kiện mềm dựa trên thuộc tính đường biên và vùng được chỉ ra bởi hàm chi phí E(A):

Hệ sốλ ≥0trong 3.12 chỉ ra mối tương quan giữa các thuộc tính vùng và các thuộc tính của biên Thành phầnR(A)được xem như là chi phí để gán điểm ảnh pcho vùng

"object"hoặc "background", tương ứng vớiR p (”ob j”)và R p (”bkg”) Chẳng hạn,R p (ã) có thể dựa trên xác suất cường độ điểm ảnh ptrong mô hình phân phối của object và background Thành phầnB(A)đại diện cho các chi phí liên quan đến đường biên giữa các vùng trong phương án phân đoạn Hệ sốB {p,q} có thể được coi là chi phí để bẻ gãy kết nối giữa điểm ảnh pvàq Thường thì B {p,q} sẽ càng lớn nếu điểm ảnh pvàqcàng tương tự nhau và sẽ càng nhở nếupvàqcàng khác biệt Mục tiêu của thuật toán là chọn ra phương án phân đoạn để cực tiểu hoá hàm chi phí mà vẫn thoả mãn các ràng buộc cứng [10]. Đầu tiên, một đồ thị graphG={V,E}được xác định như là một tập các nút V đại diện cho các điểm ảnh và một tập các cạnh vô hướng E liên kết các nút đó Mỗi cạnh e∈Etrong graph được gắn một giá trị trọng số không âmw e Trong graph, có 2 nút đặc biệt là T (background terminal) và S (object terminal) Có hai loại cạnh liên kết các nút là n-link và t-link Cạnh t-link liên kết 2 nút terminal với các điểm ảnh và n-link liên kết các điểm ảnh với nhau.

Hình 3.5: Một graph trong giải thuật Graph-cut [10]

Hình 3.5 minh hoạ một graph với 9 điểm ảnh Các t-link liên kết điểm T và S với các điểm ảnh và các n-link liên kết điểm ảnh với các điểm ảnh láng giềng của nó Mỗi điểm ảnh p đều có t-link và n-link Các cạnh liên kết giữa các điểm láng giếng được ký hiệu p,q và các cạnh liên kết giữa các điểm ảnh với T và S được ký hiệu là p,S và p,T.

Giá trị của các cạnh trong đồ thị sẽ càng lớn nếu sự tương đồng giữa hai đỉnh của cạnh càng nhiều.

Graph này sẽ được cắt thành các phần riêng biệt tương đương với việc phân đoạn ảnh thành đối tượng và nền Đường cắt sẽ đi ngang qua các cạnh sao cho hàm chi phí đường cắt nhỏ nhất Hàm chi phí được xác định theo công thức 3.16.

|C|= ∑ e∈C w e (3.16) Đường cắt sẽ chia đồ thị thành hai phần tương ứng với các phân đoạn trong ảnh gốc.

(a) Đường cắt (b) Kết quả phân đoạn Hình 3.6: Minh hoạ đường cắt và kết quả phân đoạn giải thuật Graph-cut [10] Để giải thuật phân đoạn hiệu quả thì việc chọn các điểm seeds ban đầu đóng vai trò quan trọng Nếu chọn các điểm seeds này không tốt thì kết quả phân đoạn sẽ không chính xác.

Chương này đã trình bày các lý thuyết và giải thuật sẽ được sử dụng trong phương pháp phân đoạn đề xuất Giải thuật graph-cut cũng được trình bày và sẽ được dùng để so sánh kết quả Chương tiếp theo sẽ trình bày các áp dụng các lý thuyết và giải thuật để đề xuất một phương pháp phân đoạn tự động dựa trên giải thuật lan truyền tế bào.

THỰC HIỆN PHÂN ĐOẠN ẢNH Y TẾ

truyền tế bào tự động

THỰC HIỆN PHÂN ĐOẠN ẢNH Y TẾ

Nhãn của điểm ảnh p được xác định ban đầu như sau: l p 

−1 nếu p∈nền 1 nếu p∈vật thể 0 pkhác

Hệ số sức mạnh cũng được xác định ban đầu dựa trên nhãn của chúng như sau:

Giải thuật được gồm các bước như sau:

1 Ảnh đầu vào được gán các nhãn để xác định các điểm ảnh nào chắc chắn là đối tượng, điểm ảnh nào chắc chắn là nền và các điểm chưa được đánh dấu Hệ số sức mạnh của mỗi điểm ảnh cũng được xác định thông qua nhãn của chúng. k=0,l o p =l p ,C o p =C p (4.3)

2 Kiểm tra xem kết quả của các nhãn đã hội tụ (không còn sự thay đổi nào về nhãn và hệ số sức mạnh của các điểm ảnh) chưa, nếu kết quả đã hội tụ thì kết thúc thuật toán Nếu kết quả không hội tụ thì tiếp tục bước 3

3 Cập nhật trạng thái trước đó của các điểm ảnh l k+1 p =l k p ,C k+1 p =C k p (4.4)

4 Với các điểm ảnh láng giềng q của điểm ảnh p các hàm chuyển trạng thái được tính theo công thức:

5 Nếu tích giữa hàm chuyển trạng thái và hệ số sức mạnh của điểm ảnh láng giềng q lớn hơn hệ số sức mạnh của điểm ảnh p hiện tại thì nhãn và hệ số sức mạnh của

CHƯƠNG 4 THỰC HIỆN PHÂN ĐOẠN ẢNH Y TẾ điểm ảnh q sẽ được thay thế bởi nhãn và hệ số sức mạnh của điểm ảnh láng giềng q như sau: l k+1 p =l q k ;C k+1 p =∆(p,q)ãC q k (4.6) 6 Lặp lại từ bước 2 cho đến khi kết quả hội tụ.

Sơ đồ khối các bước trên được trình bày trong hình 4.1 Để có thể giải thích một các trực quan về giải thuật, chúng ta sẽ dùng một ví dụ tương tự về sự lây lan của vi khuẩn đối với các tế bào tương đương quá trình lan truyền các nhãn của mỗi điểm ảnh Các vi khuẩn bắt đầu lây lan từ một số vị trí ban đầu (các điểm được đánh dấu như nhãn nền và đối tượng) và cố gắng tấn công vào các vị trí mới (tương tự giải thuật sẽ lan dần cho đếm khi phân đoạn cho toàn bức ảnh) Khả năng tấn công của các vi khuẩn được xác định bởi hệ số sức mạnh, và mỗi vị trí bị tấn công có khả năng bảo vệ của mình (chính là hệ số sức mạnh của điểm ảnh đó) Nếu sức tấn công mạnh hơn khả năng bảo vệ, các vi khuẩn sẽ chiếm được vị trí đó (trạng thái nhãn của điểm ảnh này sẽ thay đổi theo điểm ảnh láng giềng đó).

4.2 Kết quả phân đoạn có tương tác

Với hai cơ sở dữ liệu được sử dụng, các ảnh tế bào nhuộm theo phương pháp Pap sẽ được phân đoạn thành hai vùng: vùng nhân tế bào (tiền cảnh) và vùng tế bào chất và vùng tự do (hậu cảnh)

Từ nguyên lý giải thuật lan truyền tế bào đã trình bày, người giám sát sẽ chỉ ra các điểm ảnh chắc chắn thuộc về vùng tiền cảnh và các điểm ảnh thuộc hậu cảnh bằng các công cụ hỗ trợ (có tương tác) Các điểm còn lại không được đánh dấu sẽ được phân đoạn dựa trên thông tin về các điểm đánh dấu ban đầu này Lúc này nhãn của các điểm ảnh sẽ có giá trị là 1,-1,0 đối với các điểm ảnh được đánh dấu thuộc đối tượng, nền hay chưa đánh dấu.

Như minh hoạ trong hình 4.2a và 4.3a, các vùng thuộc nhân tế bào được đánh dấu

CHƯƠNG 4 THỰC HIỆN PHÂN ĐOẠN ẢNH Y TẾ

Hình 4.1: Sơ đồ khối phân đoạn ảnh với giải thuật lan truyền tự động màu xanh, các vùng tế bào chất và vùng khác đánh dấu bằng màu đỏ Các điểm này được xem như mặt nạ khỏi động cho giải thuật Quá trình lan truyền để phân đoạn các

CHƯƠNG 4 THỰC HIỆN PHÂN ĐOẠN ẢNH Y TẾ điểm ảnh chưa đánh dấu diễn ra như đã trình bày Quá trình này dừng lại cho đến khi không còn sự thay đổi về nhãn cũng như hệ số sức mạnh của các điểm ảnh.

(a) Đánh dấu mặt nạ (b) Kết quả phân đoạn

Hình 4.2: Ví dụ phân đoạn có tương tác

(a) Đánh dấu mặt nạ (b) Kết quả phân đoạn Hình 4.3: Ví dụ phân đoạn có tương tác với mặt nạ chi tiết hơn

Kết quả phân đoạn được cho trong hình 4.2b và 4.3b Kết quả phân đoạn phụ thuộc khá nhiều vào việc đánh dấu các điểm bắt đầu Việc chọn các điểm ban đầu càng nhiều thì kết quả phân đoạn càng chính xác hơn Phân đoạn trong hình 4.2, một số điểm ảnh thuộc vùng tế bào chất được phân đoạn thành vùng nhân tế bào khiến các nhân tế bào bị ghộp vào nhau Phân đoạn trong hình 4.3, mặt nạ được đánh dấu chi tiết hơn bằng cách đánh dấu các vùng tế bào chất như là hậu cảnh, giải thuật đã tách được các vùng nhân của các tế bào khác nhau.

Tuy nhiên, nếu số lượng đối tượng cần phân đoạn trong hình nhiều thì việc đánh dấu mặt nạ chi tiết cho các đối tượng sẽ mất nhiều thời gian Còn nếu đánh dấu thiếu các đối tượng sẽ dẫn đến phân đoạn thiếu Từ đây đặt ra yêu cầu ước lượng mặt nạ khởi động cho giải thuật lan truyền tế bào một cách tự động (không tương tác) Phần tiếp theo, luận văn sẽ trình bày giải pháp cho vấn đề này bằng việc kết hợp giải thuật K-mean với GMM.

4.3 Cải tiến giải thuật với ước lượng mặt nạ tự động

Như đã trình bày ở phần trước, giải thuật lan truyền tế bào là một giải thuật có tương tác Người giám sát sẽ phải chỉ ra các điểm seeds - là các điểm chắc chắn thuộc về tiền cảnh hoặc hậu cảnh Kết quả thu được sẽ phụ thuộc nhiều vào việc chọn các điểm seeds này Các điểm seeds được chọn càng nhiều thì việc phân đoạn càng hiệu quả Tuy nhiên, có những ảnh mà số lượng các đối tượng cần phân đoạn lớn, như các ảnh chụp tế bào, thì việc đánh dấu mặt nạ này tốn nhiều thời gian Phần tiếp theo sẽ trình bày phương pháp cho phép đánh dấu mặt nạ tự động để rút ngắn được công đoạn này.

Việc đánh dấu mặt nạ sẽ dựa trên sự khác biệt về cường độ giữa các điểm ảnh thuộc đối tượng và nền Đầu tiên, các giá trị cường độ sẽ được phân cụm bằng phương pháp K-mean Kết quả phân cụm với K-mean sẽ được dùng để ước lượng nhanh các giá trị khởi động cho thuật toán EM để mô hình hoá cường độ của các điểm ảnh với bộ trộn Gauss Từ mô hình bộ trộn Gauss được xây dựng, ta có thể ước lượng sơ bộ các điểm thuộc nền hay đối tượng bằng cách lấy ngưỡng đa mức, với các mức ngưỡng là giá trị trung bình của các thành phần tương ứng trong mô hình GMM.

Ví dụ với hình 4.5 bộ Serous, kết quả ước lượng bộ trộn Gauss có các giá trị trung bình là 39, 106 và 152 tương ứng với vùng nhân tế bào, tế bào chất, và vùng tự do Mô hình GMM tương ứng được chỉ ra trong hình 4.5b (đường màu đỏ) Có thể nhận thấy mô hình này có dạng gần giống với histogram của ảnh (đường màu xanh) Một cách gần đúng, có thể xem các giá trị nhỏ hơn 39 là đối tượng, các giá trị lớn hơn 106 là nền (bao gồm vùng tế bào chất và vùng tự do) Mặt nạ ước lượng cho trong hình 4.5c Các vùng màu trắng là các vùng được xem chắc chắn thuộc đối tượng Các vùng màu đen là các

Hình 4.4: Sơ đồ khối ước lượng mặt nạ tự động vùng được xem là nền Các vùng xám là các vùng chưa xác định và sẽ được phân đoạn trong các bước tiếp theo.

KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN

Kết quả phân đoạn bộ dữ liệu Serous

Hình 5.1 đến 5.10 trình bày các kết quả phân đoạn ảnh cho bộ dữ liệu Serous Các vùng được phân đoạn được bao trong đường biên màu đỏ và đi kèm là ground-truth tương ứng Kết quả phân đoạn khi quan sát trực tiếp khá tốt Nhưng vẫn có một số trường hợp, vùng tế bào chất bị nhầm thành nhân tế bào.

(a) Kết quả phân đoạn (b) Ground-truthHình 5.1: Kết quả phân đoạn ảnh 1 bộ dữ liệu Serous

KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN

(a) Kết quả phân đoạn (b) Ground-truth Hình 5.2: Kết quả phân đoạn ảnh 2 bộ dữ liệu Serous

5.2 Kết quả phân đoạn bộ dữ liệu Bronchial

Các hình từ 5.11 đến 5.16 là kết quả phân đoạn các ảnh trong bộ Bronchial cùng ground-truth đi kèm Kết quả phân đoạn không tốt bằng bộ dữ liệu Serous Lý dó chính là màu sắc của vùng nhân và vùng tế bào chất có sự tương đồng khiến việc ước lượng mặt nạ không tốt Đồng thời giải thuật lan truyền cũng sẽ lan từ vùng nhân sang vùng tế bào chất dẫn đến 2 vùng này bị ghộp làm một.

CHƯƠNG 5 KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN

5.3 Đánh giá kết quả Để đánh giá một cách định lượng kết quả, ta có thể sử dụng các chỉ tiêu sau:

TP (True positive): Số lượng điểm ảnh thuộc nhân tế bào được phân đoạn đúng

TN (True negative): Số lượng điểm ảnh thuộc nền (vùng tế bào chất và vùng tự do) được phân đoạn đúng

FP (False positive): Số lượng điểm ảnh thuộc nền bị phân đoạn thành nhân tế bào

FN (False negative): Số lượng điểm ảnh thuộc nhân tế bào bị phân đoạn thành nền

Các thông số này thu được bằng cách so sánh kết quả phân đoạn với ground-truth cho trước (được trình bày cùng với kết quả phân đoạn trong phần trước) Kết quả phân

(a) Kết quả phân đoạn (b) Ground-truth Hình 5.11: Kết quả phân đoạn ảnh 1 bộ dữ liệu Bronchial

(a) Kết quả phân đoạn (b) Ground-truthHình 5.12: Kết quả phân đoạn ảnh 2 bộ dữ liệu Bronchial

(a) Kết quả phân đoạn (b) Ground-truthHình 5.15: Kết quả phân đoạn ảnh 5 bộ dữ liệu Bronchial đoạn có các giá trị độ nhạy, độ đặc trưng, độ chính xác càng cao thì việc phân đoạn càng tốt Số liệu về kết quả phân đoạn được cho trong bảng 5.1 và bảng 5.2 Các số liệu TP,

TN, FP, FN có được bằng cách đếm số lượng điểm ảnh có ý nghĩa tương ứng trong kết quả phân đoạn khi so sánh với ground-truth.

Bộ dữ liệu Serous được phân đoạn khá tốt Độ chính xác cao nhất đạt được với ảnh 8, 9, 10 - trên 0.95 Với bộ dữ liệu Bronchical thì độ chính xác thấp hơn, đạt khoảng từ 0.6 đến 0.7 Các số liệu cho thấy sự phù hợp với các nhận xét định tính trong phần trước. Ảnh TP TN FP FN Độ nhạy Độ đặc trưng Độ chính xác

Bảng 5.1: Đánh giá kết quả phân đoạn bộ dữ liệu Serous

CHƯƠNG 5 KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN Ảnh TP TN FP FN Độ nhạy Độ đặc trưng Độ chính xác

Bảng 5.2: Đánh giá kết quả phân đoạn bộ dữ liệu Bronchical

5.4 Đánh giá thời gian xử lý

Giải thuật phân đoạn được thực hiện với Matlab 2016a trên máy Mac OS Sierra, 16Gb, CPU Intel Core i7 Thời gian xử lý phân đoạn tự động bộ dữ liệu Serous và Bronchial cho trong bảng 5.3 và 5.4. Ảnh Kích thước Thời gian xử lý (giây)

Bảng 5.3: Thời gian xử lý phân đoạn bộ dữ liệu Serous

Thời gian xử lý trung bình cho bộ Serous và Bronchial lần lượt là 0.4 và 0.5 giây.

Thời gian xử lý này là rất nhanh so với thời gian phân đoạn khi chọn mặt nạ bằng tay(trên 10 giây) Điều này là do khi chọn mặt nạ bằng tay, chỉ có một số ít điểm seeds

CHƯƠNG 5 KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN Ảnh Kích thước Thời gian xử lý (giây)

Bảng 5.4: Thời gian xử lý phân đoạn bộ dữ liệu Bronchical được chọn ban đầu và số lượng các điểm ảnh chưa được phân đoạn còn nhiều Do đó giải thuật lan truyền tế bào (được thực hiện bằng 3 vòng lặp lòng nhau) sẽ mất nhiều thời gian để có thể phân đoạn hết số lượng điểm ảnh này Ngược lại, với ước lượng mặt nạ tự động, số lượng các điểm ảnh được phân đoạn ban đầu nhiều, chỉ còn một số lượng nhỏ các điểm ảnh chưa được phân đoạn Do đó giải thuật lan truyền tế bào sẽ thực hiện nhanh hơn do phải thực hiện số lần lặp ít hơn Việc tạo mặt nạ tự động yêu cầu thực hiện thêm giải thuật K-means và ước lượng GMM Hai giải thuật này có thời gian chạy nhanh nên ít ảnh hưởng đến thời gian xử lý tổng thể.

5.5 Thử nghiệm với ảnh MRI Ảnh MRI là ảnh được máy cộng hưởng từ hạt nhân MRI tạo ra Các lý thuyết về kỹ thuật chụp ảnh cộng hưởng từ ra đời từ sau chiến tranh thế giới thứ 2 nhưng phải đến những năm 1990, nhờ những tiến bộ trong lỉnh vực máy tính, các chương trình điều khiển, lưu trử, xử lý ảnh, chụp ảnh cộng hưởng từ mới trở nên phổ biến và được ứng dụng rộng rãi Ngày nay, chụp ảnh cộng hưởng từ đã trở thành phương pháp chẩn đoán, an toàn (so với X-quang) và đáng tin cậy trong khám chữa bệnh.

Máy cộng hưởng từ MRI hoạt động dựa trên hiện tượng cộng hưởng từ của hạt nhân nguyên tử Mỗi hạt nhân trong môi trường vật chất đều có một mômen từ tạo ra bởi spin (xoay) nội tại của nó Các hạt nhân đều sắp xếp một cách ngẫu nhiên và từ trường của chúng triệt tiêu lẫn nhau do đó không có từ trường dư ra để ghi nhận được Khi có

CHƯƠNG 5 KẾT QUẢ VÀ HƯỚNG PHÁT TRIỂN một từ trường mạnh tác động từ bên ngoài, các mômen từ của hạt nhân sẽ sắp hàng song song cùng hướng hoặc ngược hướng của từ trường này Ngoài ra chúng còn chuyển động dần chung quanh hướng của từ trường bên ngoài đó Các vec tơ từ hạt nhân sắp hàng song song cùng chiều với hướng từ trường bên ngoài có số lượng lớn hơn các vectơ từ hạt nhân sắp nhân sắp hàng ngược chiều và chúng không thể triệt tiêu cho nhau hết Do đó, sẽ có một sự từ hoá vật thể theo hướng của từ trường bên ngoài Khi từ trường bên ngoài biến mất, các môment từ hạt nhân sẽ trờ về vị trị ban đầu Quá trình này sẽ phát ra các sóng điện từ có tính chất phụ thuộc vào mật độ proton và vật chật xung quanh.

Phân tích các thông tin trong tín hiệu phản hồi này, người ta có thể tạo ra một ảnh số về đối tượng được chụp [36].

Thông thường, ảnh cộng hưởng từ là một tập hợp các ảnh được chụp theo 4 chiều - 3 chiều không gian và 1 chiều thời gian Hình 5.17 là một ảnh MRI được trích ra từ một bộ ảnh chụp tim Hình 5.18 là một ví dụ khác về ảnh MRI chụp não Có thể thấy ảnh MRI có nhiều chi tiết phức tạp Nhiều vùng có cùng giá trị cường độ nhưng lại thuộc về các đối tượng khác nhau Do đó, việc ước lượng mặt nạ tự động sẽ kém hiệu quả.

Tuy nhiên thực tế trong các trương hợp này, người giám sát (nhân viên y tế) thường chỉ quan tâm đến một số vùng nhất bất thường trong hình Khi đó, phương thức phân đoạn có tương tác sẽ tỏ ra phù hợp và hoạt động tốt hơn.

Hình 5.17: Ví dụ về ảnh MRI chụp tim

Hình 5.19, 5.20, 5.21 là một số kết quả phân đoạn với giải thuật lan truyền tế bào có tương tác Nhân viên y tế sẽ thực hiện khoang các vùng quan tâm (đường viền màu xanh) và các vùng biên (đường viền màu đỏ).

Nhìn chung, giải thuật đã phân đoạn được các vùng quan tâm ra khỏi các vùng khác.

Hình 5.18: Ví dụ về ảnh MRI chụp não

Hình 5.19: Kết quả phân đoạn ảnh MRI

Nhưng kết quả này cũng phụ thuộc nhiều vào việc đánh dấu các vùng quan tâm và các vùng biên Cách để có kết quả phân đoạn tốt là đánh dấu khoang vùng gần với đường biên các vùng quan tâm Việc này không những cải thiện khả năng phân đoạn mà còn giúp giảm thời gian chạy chương trình.

Luận văn này đã trình bày một phương pháp phân đoạn không tương tác cho phép phân đoạn tự động các ảnh tế bào trong ảnh y sinh Phương pháp phân đoạn dựa trên phân lớp K-mean, mô hình hình trộn Gauss và giải thuật lan truyền tế bào Giải thuật

Tiêu đề	Phân đoạn các vùng tế bào trong ảnh y sinh
Tác giả	Nguyễn Duy Tân
Người hướng dẫn	Tiến sĩ Trương Công Dung Nghi
Trường học	Đại học Quốc gia TP.HCM
Chuyên ngành	Kỹ thuật điện tử
Thể loại	Luận văn thạc sĩ
Năm xuất bản	2017
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	78
Dung lượng	2,07 MB