Vùng cơ ngực là vùng có mật độ dễ nhận thấy nhất trong ảnh chụp X-quang vú hướng chéo xiên MLO (hình 2.1). Vùng này có mật độ/độ lớn tương đương như của các mô tuyến dầy đặc trong ảnh. Do đó, phần cơ ngực cần được tách ra khỏi vùng ảnh vú nhằm giới hạn việc tìm kiếm, phát hiện các dấu hiệu nghi ngờ ung thư vú chỉ được thực hiện trong phần mô vú mà thôi. Để tách, loại bỏ phần cơ ngực ra khỏi vùng ảnh vú đã có nhiều cách tiếp cận khác nhau.
Karssemrijer [72] đã sử dụng biến đổi Hough để phát hiện phần cơ ngực. Phương pháp này giả thiết rằng đường biên phân cách giữa phần cơ ngực và phần mô vú trên ảnh có thể xấp xỉ bằng một đoạn thẳng theo một hướng nhất định. Để đảm bảo phát hiện đúng đoạn thẳng này, Karssemrijer sử dụng các mức ngưỡng cho độ lớn gradient, hướng gradien, chiều dài đoạn thẳng và diện tích phần cơ ngực tương ứng.
Ferrari [83] đề xuất một phương pháp phát hiện phần cơ ngực cũng dựa trên biến đổi Hough. Điểm khác biệt so với hướng tiếp cận của Karssemrijer [72] là các ràng buộc về hình học và giải phẫu được dùng thay thế cho các mức ngưỡng. Một kỹ thuật phát hiện phần cơ ngực dựa trên bộ lọc sóng con Gabor cũng đã được Ferrari đưa ra trong [83]. Trước tiên lọc vùng ảnh vú bằng các bộ lọc Gabor để tăng cường đường biên phần cơ ngực. Các bộ lọc sóng con được sử dụng để phát hiện phần cơ ngực dựa trên hướng xấp xỉ của phần cơ. Nhờ đó đã vư ợt qua được giới hạn giả thiết đường biên của phần cơ ngực là đường thẳng như trong [72].
Hướng tiếp cận tách phần cơ ngực của Mirzaalian [41] là dựa trên thuật toán khuếch tán phi tuyến. Trước tiên một vùng ảnh hình chữ nhật được xác định bởi điểm trên cùng bên trái, điểm trên cùng bên phải, điểm giữa điểm trên cùng bên trái và điểm dưới cùng bên trái của đường bao vùng ảnh vú đã được tách ra từ trước. Vùng ảnh chữ nhật này sẽ chứa phần cơ ngực. Thực hiện vòng lặp khuếch tán phi tuyến trên vùng chữ nhật này theo
, . , , U x t D x t U x t t (2.2) , 1 exp , m m C D x t U x t (2.3)
trong đó: U là vùng cơ ngực; D là hàm khuếch tán; Cm và λ là các hệ số cố định; m là hệ số quyết định tốc độ khuếch tán. Sau đó, lấy ngưỡng ảnh.
Trong nghiên cứu của mình, Raba [29] dùng thuật toán phát triển vùng kết hợp với ước lượng mức ngưỡng để phát hiện vùng cơ ngực. Quá trình phát triển vùng được bắt đầu từ một điểm trong vùng cơ ngực. Giới hạn về diện tích vùng phát triển được là tiêu chí
dừng. Khi giới hạn này bị vượt qua thì tiêu chí phát triển vùng sẽ được điều chỉnh giảm dần dựa trên ước lượng từ mức xám đồ của lần phát triển vùng trước đó.
Kwok [93] đã đưa ra một thuật toán thích nghi để phát hiện vùng cơ ngực có sử dụng thông tin về vị trí và hình dạng của vùng cơ ngực. Ban đầu, đường biên của vùng cơ ngực được tạm coi như là đường thẳng và được xác thực vị trí và hướng. Sau đó ước lượng này được tinh chỉnh nhờ vòng lặp “phát hiện mỏm” giúp đường biên vùng cơ ngực được xác định chính xác hơn.
Subashini [96] sử dụng thuật toán CCL [81] để phát hiện phần cơ ngực. Trước tiên vị trí phần cơ ngực được xác định nằm ở góc trái trên hay phải trên của ảnh bằng cách đồng thời tìm các pixel khác 0 từ các đỉnh trái trên và phải trên. Từ đỉnh tương ứng, tìm kiếm sự thay đổi về cường độ trên hàng. Tọa độ của pixel mà tại đó có sự thay đổi về cường độ được coi là độ rộng của vùng cơ ngực. Sử dụng độ cao bằng ½ độ cao của toàn bộ ảnh, thu được 1 vùng ảnh chữ nhật chứa toàn bộ phần cơ ngực. Thực hiện lấy ngưỡng đơn trên vùng ảnh này thu được ảnh nhị phân chứa phần cơ ngực và các mô khác. Quét từng hàng từ trái hoặc phải, tìm sự thay đổi cường độ sẽ thu được phần cơ ngực.
Chen [109] cũng sử dụng phương pháp phát triển vùng để tách phần cơ ngực. Tuy nhiên, khác với phương pháp của Raba [29], điểm gốc ban đầu lại được chọn gần với đường biên của phần cơ ngực với phần mô vú. Dựng đường thẳng với hệ số góc bằng 1 đi qua điểm gốc này. Xác định các điểm đường biên trên đường thẳng này (ở các thang chia khác nhau). Điểm bắt đầu phát triển vùng được chọn là từ các điểm đường biên này dựa trên độ lớn và vị trí của đường biên. Khác với thông thường, khi quá trình phát triển vùng dừng lại khi chênh lệch giữa giá trị trung bình của vùng được phát triển với giá trị điểm ảnh lân cận mới lớn hơn một ngưỡng xác định, ở đây, trong nghiên cứu của mình, mức ngưỡng được tăng dần để tránh phân tách quá chi tiết các vùng không đồng nhất. Quá trình phát triển vùng dừng lại khi vùng phát triển tiến sát với các lề của ảnh.
Như đã đề cập ở mục 2.2, Masek [67] dùng đa mức ngưỡng tối thiểu entropy chéo để phân tách phần cơ ngực, phần mô vú (mô mỡ hay mô tuyến) trong vùng ảnh vú và vùng nền ảnh, vùng nhãn ảnh. Phần cơ ngực sẽ được tách ra khỏi phần mô vú nhờ việc tiếp tục lấy ngưỡng tối thiểu hóa entropy chéo trên vùng ảnh vú đã được tách ra trước đó. Tuy nhiên việc lấy ngưỡng này phụ thuộc rất nhiều vào tỷ lệ mô tuyến cũng như m ật độ trung bình của mô tuyến trong vùng ảnh vú. Kết quả là phần cơ ngực có thể được tách khỏi phần mô vú sau một hoặc hai thậm chí là ba lần lấy ngưỡng tối thiểu hóa entropy chéo tùy thuộc vào ảnh.
Ví dụ minh họa ở hình 2.5 cho thấy, với ảnh mô tuyến thì chỉ cần lấy ngưỡng một lần để tách phần cơ ngực ra khỏi vùng mô vú. Tuy nhiên, đối với ảnh mô tuyến dầy đặc thì sau khi lấy ngưỡng lần thứ nhất, phần cơ ngực và phần mô tuyến bị chồng lên nhau. Thực hiện lấy ngưỡng một lần nữa mới có thể tách được phần cơ ngực. Không những vậy, phần cơ ngực được tách ra là khá thiếu chính xác.
Ảnh gốc Lấy ngưỡng lần 1 Lấy ngưỡng lần 2
Hình 2.5.Kết quả tách phần cơ ngực khỏi phần mô vú dùng đa mức ngưỡng tối thiểu entropy chéo của Masek [67]. Trên: ảnh mdb209, ảnh mô tuyến. Dưới: ảnh mdb163, ảnh mô tuyến dầy đặc.
Như vậy, số ngưỡng tối thiểu entropy chéo cần thiết để tách phần cơ ngực là khác nhau đối với các ảnh chụp X-quang vú khác nhau nên việc tự động tách phần cơ ngực từ tất cả các ảnh chụp X-quang vú đang nghiên cứu là ít tin cậy. Để khắc phục nhược điểm này của phương pháp đa mức ngưỡng tối thiểu entropy chéo để tách phần cơ ngực [67], trong luận án này cũng sử dụng đa mức ngưỡng. Cụ thể là 04 mức ngưỡng bao gồm 02 mức ngưỡng Otsu, 01 mức ngưỡng tối đa entropy và 01 mức ngưỡng tối thiểu xác suất sai số [81]. Nguyên lý của phương pháp này được mô tả ở hình 2.6.
Điểm khác biệt ở đây là việc phân ngưỡng được thực hiện đồng thời chứ không phải tuần tự như phương pháp đa mức ngưỡng tối thiểu entropy chéo [67]. Hình 2.7 minh họa 4 ảnh phân ngưỡng thu được. Nhờ vậy, có thể luôn luôn tự động chọn được phần cơ ngực là vùng ảnh có diện tích lớn nhất, nằm ở góc trên ảnh và có dạng giống hình tam giác nhất trong số 04 ảnh phân ngưỡng thu được luôn chọn mà không phụ thuộc vào tỷ lệ và mật độ mô tuyến của ảnh chụp X-quang vú.
Hình 2.7.Minh họa 4 ảnh phân ngưỡng tương ứng thu được
Đánh giá phương pháp được sử dụng trên cơ sở dữ liệu mini-MIAS [47] thì thấy với hầu hết các ảnh, phần cơ ngực được bóc tách tốt khỏi vùng ảnh vú (hình 2.8). Tuy nhiên, trong một vài trường hợp, phần cơ ngực không được tách khỏi vùng ảnh vú (hình 2.9). Đó là khi lỗi số hóa hay nhãn ảnh chờm vào vùng vú như đã đề cập ở mục 2.2. Trong hình 2.10 là một số kết quả so sánh phương pháp được sử dụng với phương pháp của Masek [67]. Kết quả thu được cho thấy hai phương pháp này là hoàn toàn tương đương nhau.
Hình 2.9.Kết quả tách phần cơ ngực của phương pháp được sử dụng Trên: ảnh mdb274, nhãn ảnh chờm vào vùng ảnh vú. Dưới: ảnh mdb283, lỗi số hóa chờm vào vùng ảnh vú