Trong phần này chúng ta trình bày một số kết quả về phân đoạn ảnh y tế bằng cách sử dụng các tiêu chí giới thiệu trong phần trước. Chúng ta đề xuất các ví dụ khác nhau sử dụng cả pdfs tham số và không tham số cho các ứng dụng khác nhau: siêu âm tim, chụp cộng hưởng từ não và truyền dịch MRI.
3.3.6.1. Nhiễu và hình dạng trước khi phân đoạn siêu âm tim
Chúng ta đề xuất minh họa sự quan tâm của việc sử dụng hình dạng trước khi hình ảnh siêu âm tim thực sự. Chúng ta sử dụng một mô hình Rayleigh tham số phân phối cho nhiễu với một tiêu chuẩn đồng nhất chống log, và hình dạng trước hạn với những thời điểm Legendre bất biến và một chương trình xen kẽ giảm thiểu. Để đối phó với sự thay đổi hình dạng của trái tim trên hình ảnh, chúng ta chọn 0.7 và 0.4. Những thông số cho kết quả tốt nhất về đánh giá định lượng và định tính của các phân đoạn.
Hình 3.10: Phân đoạn ảnh của tâm thất trái trong siêu âm tim bằng cách sử dụng một mô hình Rayleigh của nhiễu mà không có bất kỳ hình dạng trước (a) và với một hình dạng trước (b). Các đường viền chuyên môn được đưa ra trong (c) và kết quả phân đoạn của
phương pháp AAMM được đưa ra trong (d). Các đồ họa (e) đưa ra một so sánh giữa phương pháp AAMM và nhiễu và hình dạng trước khi phân chia đường viền tích cực trên
một chuỗi thu thập 14 hình ảnh (khoảng cách trung bình tính bằng điểm ảnh)
Chúng ta tiến hành thí nghiệm trên quan điểm cả lớp, đỉnh, độ tương phản và siêu âm tim cổ điển. Các kết quả trên xem đỉnh cho siêu âm cổ điển được mô tả trong hình 3.10. Tầm quan trọng của việc thêm một hình dạng trước dữ liệu siêu âm tim đã được chứng minh ở đây. Ngoài việc so sánh, chúng ta cũng so sánh phương pháp này với một phương pháp phân đoạn nổi tiếng, AAMM của Bosch đề xuất. Trong hình 3.10d, chúng ta trình bày các kết quả phân đoạn của hình ảnh bằng cách sử dụng echographic AAMM. Chúng ta cũng tính toán khoảng cách trung bình giữa AAMM và phân đoạn
chuyên môn (điểm chéo trên hình 3.10e), và khoảng cách trung bình giữa các đường nét năng động và phân đoạn chuyên môn (điểm vòng tròn trên hình 3.10e). Như mô tả trên hình 3.10e, đường nét tích cực gần với phân đoạn chuyên môn hơn AAMM. Ngoài ra, chúng ta tính toán hệ số Dice cho cả hai phương pháp trên, AAMM là 0.74 và đường viền tích cực là 0.83.
3.3.6.2. Tham số pdfs cho phân đoạn MRI não
Ở đây chúng ta đưa ra một ví dụ về mô phỏng não T1-weighted, hình ảnh MRI được cung cấp bởi Montreal Neurological Institute Brain Web URL. Chúng ta thực hiện các phân đoạn của WM trên một hình ảnh não MRI với nhiễu là 7%. Đối với hình ảnh như vậy, vấn đề của phân đoạn đặc biệt quan trọng cho cả hai mục đích chẩn đoán và điều trị. Nó trở nên cần thiết để có được một phân đoạn mạnh mẽ của các mô khác nhau (WM, GM, hoặc CSF). Mô hình nhiễu trong hình ảnh MRI được giả định được đại diện bởi một phân phối Rician. Tuy nhiên, với cường độ tín hiệu lớn phân phối nhiễu có thể được coi như là một phân phối Gaussian cho WM hoặc GM. Đối với CSF, trong đó có một cường độ tín hiệu thấp, mô hình nhiễu có thể được xấp xỉ bởi một nhiễu Rayleigh.
Hình 3.11: Kết quả phân đoạn MRI não T1-weighted (giải nén của White Matter). Cột (a): đường viền cuối cùng và pdfs của phương pháp Chan & Vese, cột (b): phương pháp
log, cột (c): tối đa hóa sự chênh lệch KL.
Trong hình 3.11, đầu tiên chúng ta so sánh phương pháp Chan-Vese với (anti-)log có nhiễu Gaussian và sự phân kỳ tối đa hóa sử dụng Kullback Leibler (KL) cho các phân đoạn WM. Hai tiêu chí khác tách hỗn hợp mà không cần giải nén một Gaussian duy
nhất. Để giải nén pdfs Gaussian duy nhất sử dụng phương pháp Chan-Vese, một thủ tục đa pha có thể được sử dụng thuận lợi. Từ quan điểm định lượng, phương pháp của chúng ta đưa ra một hệ số dice là 0.91, False Positive Fraction (FPF) là 0,8 và True Positive Fraction (TPF) là 84% (tính trên toàn bộ khối lượng).
3.3.6.3. Pdfs không tham số cho theo dõi truyền dịch MRI
Các MRI truyền dịch (p-MRI) đã nổi lên như một công cụ điều tra lâm sàng trong việc đánh giá các bệnh tim mạch. Theo dõi không thời gian của cơ tim vận chuyển thức ăn tương phản cho phép xác định các kháng truyền dịch hoặc thiếu máu cục bộ khu vực. Vì vậy cần một công cụ định lượng tự động dựa vào các phân đoạn chính xác và theo dõi của các cấu trúc tim. Khó khăn chính nằm ở thực tế là các khu vực khác nhau (cơ tim, tâm thất trái) không đồng nhất. Chúng ta theo dõi bằng cách sử dụng pdfs không tham số. Từ một phân đoạn ban đầu của tâm thất trái, chúng ta theo dõi cấu trúc này và giảm thiểu khoảng cách giữa các pdf của cường độ của các khu vực.
Hình 3.12: Giảm thiểu khoảng cách giữa các pdf khu vực hiện tại (màu xanh hoặc đường nét đứt) và một tham khảo (đường màu đỏ) được tính toán từ các phân đoạn
của LV trong khung hình trước (pdf là pdf của cường độ I trong khu vực ).
Trong hình 3.12, chúng ta cho thấy sự phát triển của đường cong trong một khung hình của trình tự và sự phát triển chung của pdf của khu vực bên trong. Nó là thú vị để xem làm thế nào pdf hội tụ đối với tham chiếu pdf như thể hiện trong hình 3.12. Ví dụ
này cho thấy rằng công cụ này có thể được sử dụng để theo dõi phân đoạn nhưng một số cải tiến đáng chú ý là cần thiết liên quan đến thực tế là các tiêu chí cần cả pdf tham chiếu trong và là một tham chiếu bên ngoài. Các tham chiếu pdf bên ngoài có thể được tính toán hẹp ví dụ để có tính đại diện hơn.
3.3.7. Kết luận
Kết quả thực nghiệm được đưa ra để chứng minh khả năng áp dụng các thiết lập chung của chúng ta để phân đoạn ảnh y tế. Thật vậy, chúng ta có thể nhận thấy rằng nhiều loại nhiễu thường góp phần làm suy giảm hình ảnh y tế (Gaussian, Poisson, Rayleigh). Khuôn khổ chung của chúng ta cho phép sử dụng các mô hình nhiễu sẽ được thu lại bởi họ theo hàm mũ. Mô hình nhiễu có ảnh hưởng đến tính chính xác của các phân đoạn và mạnh mẽ của mình để lựa chọn các thông số quy tắc. Các ví dụ cho thấy kết quả thu được có liên quan cả trong MRI và hình ảnh siêu âm tim. Khi giao dịch với các đối tượng không đồng nhất, chúng ta đề xuất chứ không phải có lợi ích nhuận của pdfs không tham số mà không có giả định được thực hiện trên mô hình phân phối. Điều này đã được khai thác để theo dõi LV trong chuỗi p-MRI. Liên quan đến pdfs thông số, các thông số của mô hình nhiễu phụ thuộc vào khu vực bên trong và bên ngoài các đường nét tích cực và họ ước tính tự động trong quá trình phân đoạn bằng cách sử dụng ML (khả năng tối đa) ước lượng. Các tham số chỉ để thiết lập sau đó là tham số λ quy tắc cho phép làm mịn các đường viền. Việc đặt tham số này quá cao có thể dẫn đến một phân đoạn dưới của cấu trúc và như vậy giá trị của nó được thực hiện khoảng 10 và 100 cho các kết quả thử nghiệm đưa ra ở trên. Tuy nhiên, các thí nghiệm được báo cáo cho thấy rằng việc lựa chọn mô hình thích hợp nhiễu cho phép các phân đoạn là ít nhạy cảm với sự lựa chọn của tham số này. Theo như pdfs không tham số có liên quan, tham số hạt nhân h cho phép làm mịn pdf ban đầu. Tuy nhiên, chúng ta đặt giá trị này là 1 vì chúng ta muốn một ước tính của pdf rất gần với pdf ban đầu về tính chính xác của việc theo dõi.
Xu hướng gần đây trong phân đoạn ảnh y tế là việc sử dụng tốc độ tính toán của các đường viền tích cực như một cơ sở cho một công cụ phân đoạn tương tác. Các công cụ đánh giá trên có thể khai thác không chỉ cho các phân đoạn tự động mà còn là một cơ sở quan trọng cho quá trình phân đoạn tương tác.
CHƯƠNG 4 THỰC HIỆN PHÂN ĐOẠN XƯƠNG BÀN TAY SỬ DỤNG
BỘ LỌC PHẦN TỬ KẾT HỢP VỚI MÔ HÌNH PCA
4.1. Giới thiệu
Các mô hình khác nhau của hình ảnh y tế là cơ sở quan trọng của chẩn đoán trong y học hiện đại. Khi đó, một số lượng lớn dữ liệu được tạo ra bởi các thiết bị hình ảnh sẽ được lọc để sau đó chỉ chứa các thông tin có liên quan, phục vụ cho việc chẩn đoán. Bước đầu tiên của quá trình này thường là phân đoạn các cấu trúc giải phẫu khác nhau. Các phân đoạn này tốn rất nhiều thời gian, do đó, hiện nay có nhiều nghiên cứu sâu rộng về việc tìm kiếm các kỹ thuật phân đoạn một cách tự động. Trong trường hợp của các hình dạng giải phẫu phức tạp (như ranh giới xương), xây dựng mô hình là một thách thức, cần phải áp dụng các thuật toán phù hợp [10]. Mô hình hình dạng tích cực (ASM) là mô hình thống kê thay đổi tuyến tính của các hình dạng xác định bởi một tập hợp các điểm mốc. Tiếp đó, một tập hợp các hình dạng đã tạo được áp dụng cho các thuật toán. Khi đó, những hình dạng có một trọng tâm chung, và giảm thiểu sự chênh lệch độ quay. Kết quả của mô hình tuyến tính sẽ chứa một hình dạng trung bình, và một tập hợp các vectơ cơ sở biến dạng. Trong trường hợp có một hình ảnh mới, các tính năng hình ảnh địa phương được xác định cho mỗi điểm mốc, và tối ưu hóa lặp đi lặp lại để biến hình dạng này phù hợp với các đối tượng trong hình ảnh mới. Ngoài ra, các tính năng được sử dụng để xác định biên của các điểm mốc là rất đơn giản, nhưng không đủ nhạy trong trường hợp hình ảnh X-quang. Vì vậy, ta sẽ trình bày việc thực hiện một phiên bản mở rộng của ASM bằng cách sử dụng một mô hình đường biên tốt hơn được thống kê từ các tập dữ liệu đầu vào và đã sử dụng phương pháp tối ưu khai triển tích phân (DE) để tìm các hình dạng tối ưu. Điều này giúp tăng hiệu quả của thuật toán trên các số liệu một cách đáng kể.
Trong bước đầu tiên của thuật toán, một mô hình hình dạng tuyến tính sẽ được tạo ra từ các tập dữ liệu, tương tự như phương pháp ASM. Bằng cách tìm các hướng chính của phương sai trong không gian hình dạng, số chiều của mô hình có thể được giảm đáng kể, phương pháp tiêu chuẩn là duy trì khoảng 95% của phương sai hiện tại trong các tập dữ liệu. Kết quả là một mô hình hình dạng sinh sản có thể tạo ra các hình dạng khác nhau từ một mô hình tuyến tính
ít chiều. Số chiều của hình dạng gốc ban đầu là 128, vì chúng ta có 2 tọa độ, và 64 điểm mốc. Với phương pháp này, các chiều của hình dạng giảm còn 8 chiều biến dạng và 5 chiều chuyển đổi (với tỉ lệ theo x, y và xoay xung quanh z: Tx, Ty, Sx, Sy, Rz ). 13 chiều mô hình hình dạng này có thể tạo ra một loạt các hình dạng, mà vẫn giống như tập dữ liệu, nhưng cũng có thể tạo ra các hình dạng mới, mà trước đây không chưa có.
Trong bước thứ hai, các điểm ảnh được phân loại để phân biệt giữa hai loại điểm ảnh, chúng ta sử dụng các mẫu trong các cơ sở dữ liệu để tạo ra phân loại này. Các cơ sở dữ liệu chứa các hình ảnh mặt nạ, và gán nhãn cho mỗi điểm ảnh trên từng hình ảnh. Đường biên của cấu trúc xương bàn tay được gán nhãn dương, trong khi các điểm ảnh còn lại thuộc về lớp nền. Để phân biệt giữa hai lớp điểm ảnh, chúng ta sử dụng một tập hợp các tính năng hình ảnh địa phương tập trung vào các điểm ảnh quan tâm. Ưu điểm chính của các tính năng này là chúng có thể đánh giá nhanh chóng trên những hình ảnh tích phân. Trong thực hiện này, 14 tính năng được chọn trước Haar-like đã được sử dụng để đánh giá trong vùng lân cận của điểm ảnh trung tâm. Kích thước của cửa sổ được sử dụng trong khoảng 3 × 3 đến 9 × 9. Đáp ứng của các bộ dò được thu thập cho mỗi điểm ảnh biên dương, và một tập hợp các điểm ảnh nền ngẫu nhiên được sử dụng để có các mẫu âm hay lớp nền.
Trong bước tiếp theo, một phân loại tập hợp ngẫu nhiên được tạo ra để phân biệt sự khác nhau giữa những điểm ảnh trên đường biên và những điểm ảnh còn lại. Hình 4 cho thấy cấu trúc cơ bản của một bộ phân loại tập hợp ngẫu nhiên. Một giá trị xác suất của mỗi điểm ảnh sẽ được đánh giá, xác suất này tương ứng với khả năng rằng điểm ảnh này có thuộc về lớp đường biên hay không. Bằng cách đánh giá trên mỗi điểm ảnh của mỗi hình ảnh thử nghiệm, chúng ta đã thu thập được một bản đồ xác suất cho mỗi hình ảnh thử nghiệm.
Bước cuối cùng của thuật toán của chúng ta sử dụng thuật toán DE để tối ưu hóa các hình dạng và các thông số chuyển đổi cho phù hợp với hình dạng trên bản đồ xác suất. Tại mỗi hình dạng và thông số chuyển đổi, vector 2D của những điểm mốc hình dạng được tạo ra. Sau đó, tại mỗi điểm mốc, bản đồ xác suất được lấy mẫu để kiểm tra xác suất điểm mốc được định vị trên đường biên của xương. Xác suất của mỗi điểm mốc sau đó được lấy trung bình. Nhiệm vụ của tối ưu hóa là để tìm các tham số mà xác suất hình dạng chính xác là tối đa. Để tìm các hình dạng và chuyển đổi các tham số đó mang lại khả năng tối đa trên bản đồ xác suất tính toán, chúng ta đã sử dụng các thuật toán DE.