Từ các thực tiễn của lĩnh vực chẩn đoán hình ảnh y tế đã phân tích bên trên, cho thấy vấn đề ứng dụng trí tuệ nhân tạo trong xử lý ảnh y tế, để phát triển các hệ thống hỗ trợ phát hiện h
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI SƯ PHẠM KỸ THUẬT HƯNG YÊN
HOÀNG QUỐC TUÂN
NÂNG CAO HIỆU QUẢ HỖ TRỢ CHẨN ĐOÁN MỘT SỐ DẠNG UNG THƯ DỰA TRÊN KỸ THUẬT XỬ LÝ ẢNH VÀ MẠNG
NƠ-RON TÍCH CHẬP
Tóm tắt luận án tiến sĩ kỹ thuật
Chuyên ngành: Kỹ thuật điện tử
Mã số: 9520203
Hưng Yên – 2024
Trang 2
Công trình được hoàn thành tại:
Trường Đại học Sư phạm Kỹ thuật Hưng Yên
Người hướng dẫn khoa học 1: PGS.TS Bùi Trung Thành
Người hướng dẫn khoa học 2: TS Phạm Xuân Hiển
Phản biện 1: GS.TS Trần Xuân Nam
Phản biện 2: PGS.TS Trương Vũ Bằng Giang
Có thể tìm hiểu luận án tại:
- Thư viện Trường Đại học Sư phạm Kỹ thuật Hưng Yên
- Thư viện Quốc gia Việt Nam
Trang 3MỞ ĐẦU
1 Tính cấp thiết của luận án
Sự thiếu hụt nguồn lực y tế so với nhu cầu trong lĩnh vực chẩn đoán hình ảnh là một thực tế hiện nay ở Việt Nam và nhiều quốc gia khác trên thế giới Theo thống kê gần đây, tại Nhật Bản chỉ
có 36 bác sĩ chẩn đoán hình ảnh/triệu dân Cả Liberia chỉ có 2 bác sĩ chẩn đoán hình ảnh và 14 quốc gia tại châu Phi không có bác sĩ chẩn đoán hình ảnh [1] Ngay cả đối với những quốc gia có nền kinh tế và nền y học phát triển, tình trạng thiếu hụt nhân lực để xử lý các công việc chẩn đoán hình ảnh vẫn xảy ra Tại Anh, ước tính có hơn 300.000 hình ảnh X-quang phải chờ đến hơn 30 ngày trước khi được phân tích tại một thời điểm bất kỳ trong năm [1] Trí tuệ nhân tạo (AI) được coi là
xu hướng tất yếu và là giải pháp cho các phần mềm hỗ trợ chẩn đoán bằng máy tính có độ chính xác cao hơn, giúp giải quyết những thiếu hụt về nhân lực [2] Đã có nhiều các công cụ AI mới được phát triển để ứng dụng trong phân tích và chẩn đoán nhiều dạng ung thư khác nhau dựa trên hình ảnh y tế như X-quang phổi, X-quang vú, CT/MRI sọ não [3, 4] Tại Mỹ, một số phần mềm ứng dụng trí tuệ nhân tạo đã được Cục quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA) cấp giấy phép hoạt động Một ví dụ đó là phần mềm chẩn đoán đột quỵ não do thiếu máu cục bộ cấp tính dựa trên kết quả phân tích hình ảnh chụp CT não của Viz.AI Kết quả thử nghiệm lâm sàng cho thấy hệ thống AI của Viz.AI giúp tiết kiệm tới 45% thời gian chẩn đoán và chăm sóc bệnh nhân [5], điều này vô cùng ý nghĩa trong những trường hợp bệnh nhân cần phải chẩn đoán và can thiệp y tế sớm vì ảnh hưởng tới tính mạng
Ngày nay, hệ thống y tế tại Việt Nam đã có nhiều thay đổi tích cực, nhưng đầu tư và chi phí cho y tế vẫn còn rất hạn chế Thống kê gần đây, ở Việt Nam chỉ có hơn 8 bác sĩ/vạn dân Số liệu thống kê này cũng chỉ ra rằng, tỷ lệ bác sĩ/người bệnh ở Việt Nam là rất thấp, ngay cả so sánh với các nước khác trong khu vực Đông Nam Á Với thực trạng như hiện nay, cần rất nhiều năm để Việt Nam có thể bắt kịp Singapore, nơi có 23 bác sĩ/vạn dân [6] Một vấn đề nữa tại Việt Nam là sự mất cân bằng về trình độ giữa các bệnh viện tại địa phương (tuyến huyện, tỉnh) so với các bệnh viện tuyến trung ương hay các thành phố lớn vẫn còn một khoảng cách xa Từ những thực tế trên, việc
sử dụng các công nghệ số với nòng cốt là dữ liệu lớn và trí tuệ nhân tạo, để xây dựng nền y tế thông minh được coi là giải pháp để thay đổi nhanh nền y tế của Việt Nam [7] Khi đó các công nghệ số phân tích dữ liệu sẽ được ứng dụng để phát triển các giải pháp chẩn đoán bệnh sớm, với chi phí thấp
và dễ dàng tiếp cận người dùng ở quy mô lớn [8] [9]
Trong khoảng thời gian 5 năm trở lại đây, sự phát triển nhanh của dữ liệu lớn và năng lực tính toán đã giúp cho các mô hình trí tuệ nhân tạo đạt được những tiến bộ vượt bậc Những đột phá trong nghiên cứu cơ bản và nghiên cứu về ứng dụng trí tuệ nhân tạo trong y tế liên tiếp được công
bố và đưa vào triển khai thực tế [10-12] Hiểu một cách ngắn gọn là các mô hình trí tuệ nhân tạo có thể tham gia hỗ trợ bác sĩ trong toàn bộ quy trình khám bệnh lâm sàng dựa trên hình ảnh y tế Trí tuệ nhân tạo giúp cho các thiết bị thu nhận hình ảnh y tế tạo ra các hình ảnh nhanh hơn, chất lượng hơn với giá thành rẻ hơn Việc phân tích, chẩn đoán bệnh và tự động xuất báo cáo… cũng đều có thể đảm nhiệm bởi các phần mềm ứng dụng trí tuệ nhân tạo [13, 14] Trong các tác vụ trên, trí tuệ nhân tạo đã được ứng dụng nhiều trong tác vụ hỗ trợ chẩn đoán bệnh dựa trên hình ảnh [15-17], đặc biệt là phát hiện sớm các bệnh lý liên quan đến ung thư [18, 19] Hệ thống hỗ trợ phát hiện (computer-aided detection – CADe) và hỗ trợ chẩn đoán (computer-aided diagnosis – CADx) đã làm giảm các lỗi do phương pháp chẩn đoán truyền thống, chủ yếu dựa trên kinh nghiệm của các bác sĩ [20, 21] Hiệu suất của các hệ thống như vậy đóng một vai trò quan trọng trong việc nâng cao chất lượng của công việc chẩn đoán
Từ các thực tiễn của lĩnh vực chẩn đoán hình ảnh y tế đã phân tích bên trên, cho thấy vấn đề ứng dụng trí tuệ nhân tạo trong xử lý ảnh y tế, để phát triển các hệ thống hỗ trợ phát hiện hay hệ thống hỗ trợ chẩn đoán bằng máy tính là lĩnh vực nghiên cứu mới và có đóng góp lớn cho ngành y
tế Đề tài “Nâng cao hiệu quả hỗ trợ chẩn đoán một số dạng ung thư dựa trên kỹ thuật xử lý ảnh
và mạng nơ-ron tích chập” được lựa chọn để thực hiện luận án tiến sĩ chuyên ngành Kỹ thuật điện
tử Kết quả nghiên cứu được áp dụng trên tập dữ liệu ảnh y tế công khai, đã được các bác sĩ chẩn
Trang 4đoán hình ảnh uy tín xác nhận thông tin và gắn nhãn
Thách thức đặt ra với luận án là trong phạm vi nghiên cứu độc lập của nghiên cứu sinh
trong trường đại học, cần phải có thiết bị xử lý hình ảnh tốc độ cao, thu thập được tập dữ liệu chuẩn
đã được xác nhận bởi các bác sĩ từ các bệnh viện hay được cho phép sử dụng tập dữ liệu công khai, tập dữ liệu đủ tin cậy đảm bảo sự chính xác trong quá trình thực nghiệm
2 Mục tiêu của luận án
Mục tiêu của luận án là nghiên cứu một số giải pháp để nâng cao độ chính xác của hệ thống
hỗ trợ chẩn đoán hình ảnh y tế bằng máy tính (CADx) dựa trên kỹ thuật xử lý ảnh và mạng nơ-ron tích chập Ứng dụng giải pháp đề xuất mới trong hỗ trợ chẩn đoán ung thư nhờ chẩn đoán hình ảnh, giúp các bác sĩ chẩn đoán hình ảnh dễ dàng hơn cho việc chuẩn đoán bệnh và lập kế hoạch điều trị
3 Đối tượng, phạm vi và phương pháp nghiên cứu
Đối tượng nghiên cứu của luận án
- Ảnh y tế của một số dạng ung thư có thể phát hiện sớm nhờ chẩn đoán hình ảnh, có tập dữ liệu
đã được công bố trong các nghiên cứu trước đây và được phép sử dụng hợp pháp trong các nghiên
cứu thực nghiệm của Luận án Trong nghiên cứu này, tác giả lựa chọn ảnh siêu âm tuyến vú và
tuyến giáp làm đối tượng nghiên cứu Hai loại ung thư tuyến vú và tuyến giáp là những loại ung thư
phổ biến hiện nay và có thể chẩn đoán sớm qua hình ảnh
- Kỹ thuật xử lý ảnh và mạng nơ-ron tích chập ứng dụng trong tác vụ phân vùng ảnh và phân loại
ảnh
Phạm vi nghiên cứu của luận án: Hình ảnh y tế bao gồm nhiều loại khác nhau, trên nhiều bộ
phận của cơ thể con người với các đặc điểm và giải pháp xử lý khác nhau Nghiên cứu này tập trung vào các loại hình ảnh y tế có sẵn các tập dữ liệu công khai để giảm thời gian cho việc thu thập dữ liệu cũng như đảm bảo độ tin cậy của dữ liệu Vì vậy, phạm vi nghiên cứu tập trung chủ yếu ở hai vấn đề chính:
- Đi sâu vào các giải pháp kỹ thuật nhằm nâng cao độ chính xác của mô hình phát hiện, phân vùng các đối tượng quan tâm trên hình ảnh y tế dựa trên kỹ thuật xử lý ảnh và mạng nơ-ron tích chập;
- Phát triển giải pháp cho mô hình phân loại ảnh y tế dựa trên cấu trúc CNN trong trường hợp có
ít dữ liệu huấn luyện
Phương pháp nghiên cứu:
Nghiên cứu lý thuyết: Phân tích, đánh giá các nghiên cứu về vấn đề phát hiện, phân vùng đối tượng trên ảnh y tế và phân loại ảnh y tế đã được công bố trên các tài liệu, tạp chí; Tổng hợp các thông tin liên quan đến đối tượng nghiên cứu, lựa chọn các cách tiếp cận đã được áp dụng thành công dựa vào các kết quả nghiên cứu đã công bố; Đề xuất giải pháp mới trong phạm vi nghiên cứu
Nghiên cứu thực nghiệm: Thực hiện viết chương trình với ngôn ngữ Python cho các giải pháp đề xuất; Chạy thử nghiệm chương trình của giải pháp đề xuất mới với các bộ dữ liệu hình ảnh
y tế công khai, đã được sử dụng ở các nghiên cứu khác; So sánh và đánh giá kết quả thực nghiệm so với kết quả của các nghiên cứu đã công bố, từ đó kết luận tính đúng đắn của kết quả nghiên cứu
4 Ý nghĩa khoa học và thực tiễn
Ý nghĩa khoa học:
Việc ứng dụng khoa học kỹ thuật vào y tế nhằm nâng cao chất lượng khám chữa bệnh là rất cần thiết Trong đó việc ứng dụng các mô hình, kỹ thuật xử lý ảnh tiên tiến nhằm hỗ trợ quá trình chẩn đoán bệnh thông qua hình ảnh y tế đang được nhiều cơ sở y tế, tổ chức khoa học quan tâm Đề tài luận án nghiên cứu và đề xuất các gải pháp nâng cao độ chính xác của mô hình phát hiện, phân vùng đối tượng trong ảnh y tế và phân loại ảnh y tế dựa trên việc áp dụng AI (các mạng học sâu) là
đề tài có ý nghĩa khoa học cao trong lĩnh vực chẩn đoán hình ảnh y tế
Ý nghĩa thực tiễn
Trang 5Từ các thực tiễn về sự thiếu hụt nguồn lực y tế của lĩnh vực chẩn đoán hình ảnh y tế cho thấy vấn đề ứng dụng trí tuệ nhân tạo trong xử lý ảnh y tế, để phát triển các hệ thống hỗ trợ phát hiện hay hệ thống hỗ trợ chẩn đoán bằng máy tính có ý nghĩa thực tiễn cao và có đóng góp lớn cho ngành y tế Các hệ thống chẩn đoán hình ảnh sử dụng hỗ trợ từ máy tính đã được phát triển để hỗ trợ các bác sĩ chẩn đoán một số bệnh trong y khoa dựa trên các ảnh y tế Để giảm các lỗi do giải pháp chẩn đoán truyền thống, chủ yếu dựa trên kinh nghiệm của các bác sĩ thì hiệu suất của các hệ thống như vậy đóng một vai trò quan trọng trong việc nâng cao chất lượng của công việc chẩn đoán
5 Những đóng góp của luận án
Đóng góp thứ nhất: Đề xuất giải pháp phân vùng ảnh y tế sử dụng một mạng phân vùng duy nhất
dựa trên cấu trúc mạng U-Net được cải tiến, nhiều lớp hơn so với mạng U-Net truyền thống, tăng khả năng học, giảm hiện tượng mất Gradient khi huấn luyện Nâng cao hiệu quả phát hiện và phân vùng đối tượng trong ảnh y tế cho mạng phân vùng với giải pháp sử dụng ảnh đa phân giải được tăng cường từ ảnh gốc
Đóng góp thứ hai: Đề xuất giải pháp thiết kế một hệ thống phân loại ảnh y tế dựa trên cấu trúc
CNN Hệ thống phân loại này ứng dụng khi huấn luyện mô hình gặp phải trường hợp đối tượng ảnh cần phân loại, không có sẵn một số lượng lớn dữ liệu cho mô hình huấn luyện nhưng hệ thống vẫn duy trì độ chính xác phân loại cao
6 Bố cục luận án
Luận án gồm 3 chương:
Chương 1: Tổng quan về xử lý ảnh y tế và ứng dụng mạng nơ-ron tích chập trong hỗ trợ chẩn đoán qua hình ảnh Chương này trình bày tổng quan về xử lý ảnh y tế, kỹ thuật AI và các cấu trúc mạng mạng nơ-ron tích chập được phát triển để ứng dụng cho vấn đề phát hiện, phân vùng đối tượng trong hình ảnh Kỹ thuật phân loại ảnh, cấu trúc mạng mạng nơ-ron tích chập được phát triển
để ứng dụng cho vấn đề phân loại ảnh và tổng quan về các nghiên cứu trước đây liên quan đến mục tiêu nghiên cứu cũng như đối tượng nghiên cứu của luận án
Chương 2: Giải pháp nâng cao hiệu quả phân vùng khối u trên hình ảnh siêu âm tuyến vú Chương này trình bày về giải pháp đề xuất mới để phát triển mô hình mạng trí tuệ nhân tạo giúp nâng cao hiệu quả phát hiện và phân vùng đối tượng trong ảnh y tế Đặc điểm tập dữ liệu ảnh siêu
âm tuyến vú BUS và BUSI phục vụ quá trình thực nghiệm, quy trình thực nghiệm và kết quả thực nghiệm phân vùng ảnh trên tập dữ liệu BUS và BUSI cho giải pháp đề xuất mới
Chương 3: Giải pháp nâng cao hiệu quả phân loại khối u tuyến giáp sử dụng một lượng nhỏ
dữ liệu huấn luyện mạng phân loại Chương này trình bày về giải pháp đề xuất mới để phát triển mô hình mạng phân loại ảnh, giúp cải thiện hạn chế của mạng nơ-ron tích chập trong tác vụ phân loại ảnh y tế khi có ít dữ liệu huấn luyện Đặc điểm tập dữ liệu ảnh siêu âm tuyến giáp TDID phục vụ quá trình thực nghiệm, quy trình thực nghiệm và kết quả thử nghiệm phân loại ảnh trên tập dữ liệu ảnh TDID cho giải pháp đề xuất mới
Trang 6CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH Y TẾ VÀ ỨNG DỤNG MẠNG NƠ- RON TÍCH CHẬP TRONG HỖ TRỢ CHẨN ĐOÁN QUA HÌNH
ẢNH
Tóm tắt:
Trong chương này, tác giả trình bày tổng quan về kỹ thuật chẩn đoán hình ảnh trong y tế, đặc điểm của một số phương thức ảnh y tế cơ bản và ứng dụng mạng nơ-ron tích chập trong tác vụ phân tích ảnh y tế Tiếp theo, tác giả trình bày và phân tích cấu trúc của hệ thống hỗ trợ chẩn đoán hình ảnh y tế bằng máy tính(CAD) Phân tích các kết quả nghiên cứu cùng hướng nghiên cứu với luận án, dựa trên những công trình nghiên cứu đã được công bố gần đây ở trong và ngoài nước, chỉ
ra được các vấn đề còn tồn tại của những nghiên cứu trước đây đã phân tích Từ những cơ sở lý thuyết và những vấn đề tồn tại của những nghiên cứu trước đây trong phạm vi nghiên cứu của luận
án, tác giả đề xuất giải pháp mới để nâng cao hiệu quả hỗ trợ chẩn đoán một số dạng ung thư dựa trên kỹ thuật xử lý ảnh và mạng nơ-ron tích chập
1.1 Tổng quan về chẩn đoán hình ảnh trong y tế
Y học hiện đại chẩn đoán bệnh dựa vào các triệu chứng lâm sàng (chẩn đoán lâm sàng) và các triệu chứng cận lâm sàng (chẩn đoán cận lâm sàng) Trong chẩn đoán cận lâm sàng thì chẩn đoán dựa trên hình ảnh thu được từ các thiết bị, máy y tế ngày càng chiếm một vai trò quan trọng Nhất là ngày nay, sự trợ giúp của các phần mềm tin học giúp cho hình ảnh y tế rõ nét và chính xác hơn [22, 23]
Các phương pháp chẩn đoán hình ảnh rất phong phú, như chẩn đoán qua hình ảnh X-quang, hình ảnh siêu âm, siêu âm - Doppler màu, hình ảnh nội soi, hình ảnh chụp cắt lớp vi tính CT, hình ảnh chụp cộng hưởng từ MRI, hình ảnh kính hiển vi [24]
Chẩn đoán hình ảnh đã góp phần quan trọng nâng cao tính chính xác, kịp thời và hiệu quả trong chẩn đoán bệnh Như dựa trên hình ảnh siêu âm, các bác sĩ có thể đo được tương đối chính xác kích thước các tạng đặc trong ổ bụng (gan, lách, thận, tuỵ, ) và phát hiện các khối bất thường nếu có Từ hình ảnh siêu âm tim, cấu trúc, kích thước các buồng tim, van tim và các mạch máu lớn
có thể được xác định Trong sản khoa, siêu âm giúp xác định và theo dõi sự phát triển của thai nhi trong bụng mẹ Hình ảnh CT giúp bác sĩ xác định được một số bệnh lý ở sọ não, đặc biệt là xác định máu tụ nội sọ, khối u não Chụp cộng hưởng từ xác định chính xác hơn các hình thái và các khối bất thường trong cơ thể [24]
1.2 Ảnh y tế và kỹ thuật cơ bản trong xử lý ảnh y tế
1.3 Phân tích hình ảnh y tế với mạng nơ-ron tích chập
1.4.1 Các nghiên cứu phát triển hệ thống CAD cho ảnh y tế gần đây
Trong báo cáo của nghiên cứu trước đây [62], các hệ thống CAD (Computer-aided Diagnosis) bao gồm bốn giai đoạn như trình bày trong Hình 1.11
Tiền xử lý ảnh: Nhiệm vụ của tiền xử lý ảnh có thể thực hiện một số tác vụ như thay đổi
kích thước, độ phân giải mà không làm thay đổi các tính năng quan trọng của hình ảnh trước khi chẩn đoán
Trang 7Phân vùng ảnh: Phân vùng ảnh để chia ảnh thành các vùng không chồng lấn và sẽ tách các
đối tượng trong ảnh ra khỏi hình ảnh tổng thể Vai trò của phân vùng ảnh là làm giảm độ phức tạp của hình ảnh, giúp cho quá trình xử lý hoặc phân tích hình ảnh sau đó trở nên đơn giản hơn Đây là một trong những tác vụ khó khăn nhất trong xử lý ảnh và nhận dạng mẫu, đồng thời quyết định chất lượng của bước phân tích cuối cùng trong một hệ thống CAD đầy đủ
Trích xuất và lựa chọn đặc trưng Phân loại ảnh
Đánh giá kết quả
Hình 1.11 Sơ đồ khối hệ thống CAD cho ảnh y tế [62]
Trích xuất và lựa chọn đặc trưng: Bước này nhằm tìm vectơ đặc trưng của đối tượng quan
tâm trong ảnh, dựa vào vectơ đặc trưng này có thể phân biệt chính xác đối tượng quan tâm trong ảnh là vùng tổn thương/không tổn thương hoặc lành tính/ác tính đối với các ca ung thư Không gian đặc trưng có thể rất lớn và phức tạp, vì vậy việc trích xuất và lựa chọn các đặc trưng hiệu quả nhất
là rất quan trọng
Phân loại: Dựa vào các đặc trưng được lựa chọn, vùng nghi ngờ sẽ được phân loại thành
tổn thương/không tổn thương hoặc lành tính/ác tính bằng nhiều phương pháp phân loại khác nhau Trong các kỹ thuật áp dụng vào hệ thống CAD, hai kỹ thuật quan trọng nhất quyết định hiệu suất của hệ thống CAD đó là phân vùng ảnh và phân loại ảnh
1.4.2 Nhận xét, đánh giá các nghiên cứu đã khảo sát và đề xuất giải pháp của tác giả
Từ những khảo sát như đã trình bày ở Mục 1.4.1, có thể khẳng định sự vượt trội về hiệu suất của các giải pháp phân vùng và phân loại ảnh y tế khi ứng dụng CNN Đối với tác vụ phân vùng ảnh y tế, các tác giả đã sử dụng 3 cấu trúc mạng chủ yếu đó là : mạng Faster-RCNN, mạng FCN-AlexNet và U-net Với tác vụ phân loại ảnh y tế, hai cấu trúc mạng đó là: ResNet và Inception (GoogLeNet) được các tác giả ứng dụng phổ biến trong nhiều nghiên cứu Các giải pháp trong các nghiên cứu đã khảo sát đạt được những kết quả tích cực trong tác vụ phân vùng và phân loại ảnh y
tế, thể hiện ở các tiêu chí đánh giá được các tác giả trình bày trong các công bố Tuy nhiên, qua phân tích, tác giả nhận thấy các nghiên cứu trên còn những hạn chế cần cải tiến:
Hạn chế trong tác vụ phân vùng ảnh y tế: Vì liên quan đến y tế, nên yêu cầu độ chính xác
của các hệ thống hỗ trợ chẩn đoán bằng máy tính càng cao càng tốt, điều đó phụ thuộc lớn vào kết quả ở khâu phân vùng ảnh Vấn đề đầu tiên các nghiên cứu đã khảo sát gặp hạn chế đó là việc phát hiện vùng ảnh có chứa khối u bị ảnh hưởng bởi nhiễu và kích thước khác nhau của khối u ở các giai đoạn bệnh Các giải pháp phổ biến như active model [64-66], U-Net, Residual UNet, UNet++ …gặp khó khăn trong việc xác định khối u có kích thước nhỏ, hoặc khi khối u to và bị vôi hóa [37, 67] Với các khối u có kích thước nhỏ, khi áp dụng các cấu trúc mạng phân vùng phổ biến trên thì sau một vài lớp tích chập thông tin sẽ bị mất, vì vậy rất khó để xác định được vị trí khối u do sau mỗi lớp tích chập các bản đồ đặc trưng (feature maps) có kích thước bị giảm đi sau mỗi lớp pooling [31] Vấn đề thứ hai đó là để tăng hiệu suất của mạng phân vùng, nghiên cứu trước đây đã sử dụng giải pháp kết hợp các mô hình mạng khác nhau cho việc phát hiện đối tượng [70] hoặc sử dụng số lượng rất lớn dữ liệu huấn luyện Giải pháp kết hợp nhiều mạng phân vùng khác nhau này có hạn chế làm cho mô hình mạng phân vùng trở nên phức tạp vì phải xử lý với nhiều cấu trúc mạng khác nhau
Hạn chế trong tác vụ phân loại ảnh y tế: Để đạt độ chính xác cao cho mô hình phân loại,
cần một lượng lớn dữ liệu huấn luyện [78, 80, 81] Do đó, phải mất nhiều thời gian hơn và nhiều nỗ lực hơn để thu thập những dữ liệu này Ngoài ra, các thiết bị thu nhận hình ảnh đắt tiền và hơn nữa
nó đòi hỏi sự hợp tác và thỏa thuận giữa bác sĩ và bệnh nhân Quá trình huấn luyện cần thời gian dài [74, 78-81] Một vấn đề nghiêm trọng khác là các mô hình phân loại thông thường, không thể áp
Trang 8dụng cho một số trường hợp không có sẵn một lượng lớn hình ảnh y tế làm dữ liệu huấn luyện do vấn đề Overfitting khi huấn luyện mạng phân loại hay độ chính xác phân loại không cao [82]
Từ những hạn chế và những vấn đề chưa đề cập đến của các nghiên cứu trước đây đã khảo sát, hướng nghiên cứu của tác giả tập trung vào một số giải pháp để nâng cao hiệu suất của mô hình phát hiện, phân vùng và phân loại ảnh y tế, từ đó nâng cao hiệu quả của hệ thống hỗ trợ chẩn đoán bằng máy tính cho ảnh y tế, đặc biệt là một số dạng ung thư, tiến tới đưa vào các ứng dụng thực tế tại các bệnh viện giúp các bác sĩ chẩn đoán hình ảnh dễ dàng hơn cho việc chuẩn đoán bệnh và lập
Dùng một mạng phân vùng duy nhất được xây dựng và cải tiến mới dựa trên cấu trúc mạng phân vùng truyền thống cho việc phát hiện và phân vùng đối tượng Điều này giúp cho việc giảm kích thước mô hình nhưng cấu trúc mạng sâu hơn hơn so với các nghiên cứu trước khi mà họ dùng nhiều mạng khác nhau để phát hiện đối tượng trên ảnh đầu vào, rồi kết hợp kết quả của các mạng khác nhau đó để đưa ra kết quả phân vùng cuối cùng
Kết hợp kết quả phát hiện và phân vùng đối tượng của ảnh chứa đối tượng có kích thước to (ảnh gốc) và đối tượng có kích thước nhỏ (ảnh thu nhỏ) Việc này sẽ giúp tăng cường kết quả phát hiện và phân vùng hơn so với việc chỉ dùng kết quả phát và phân vùng đối tượng từ một ảnh gốc đầu vào
Đề xuất thứ hai: Đề xuất mới đối với mô hình phân loại ảnh y tế
Xây dựng mô hình phân loại ảnh y tế có thể huấn luyện trên một số lượng nhỏ dữ liệu huấn luyện để có thể áp dụng cho các trường hợp khó khăn trong vấn đề thu thập dữ liệu ảnh Sử dụng giải pháp trích xuất đặc trưng ảnh đầu vào bằng CNN được đào tạo trước làm Black-bone cho mô hình phân loại, huấn luyện mô hình phân loại bằng các cặp ảnh trong cơ sở dữ liệu ban đầu, giải pháp này giúp tăng đáng kể dữ liệu huấn luyện và khắc phục được hiện tượng mạng nơ-ron không hội tụ khi huấn luyện Tăng hiệu suất phân loại bằng việc so sánh ảnh đầu vào với một số lượng ảnh chuẩn lưu trong cơ sở dữ liệu
1.5 Kết luận Chương 1
Chương 1 đã trình bày tổng quan về vấn đề ứng dụng xử lý ảnh trong y tế bao gồm: tính cấp thiết của xử lý ảnh y tế trong chẩn đoán cận lâm sàng, các phương thức hình ảnh y tế khác nhau được sử dụng trong chẩn đoán hình ảnh và đặc điểm của các phương thức hình ảnh này
Chương này cũng trình bày về các kỹ thuật cốt lõi trong xử lý ảnh y tế, các giải pháp về ứng dụng trí tuệ nhân tạo trong xử lý ảnh y tế, các mô hình mạng trí tuệ nhân tạo đã được sử dụng trong việc phân tích hình ảnh y tế để phát triển các hệ thống hỗ trợ phát hiện bằng máy tính (CAD)
và hệ thống hỗ trợ chẩn đoán bằng máy tính (CADx)
Tiếp theo, một bức tranh tổng quan về tình hình nghiên cứu trước đây liên quan đến các giải pháp phân vùng và phân loại hình ảnh y tế được đưa ra Cho đến hiện tại, các nghiên cứu trên thế giới đã đạt được những thành công to lớn từ giai đoạn thu thập dữ liệu, các giải pháp tăng cường
dữ liệu và phát triển các mô hình phát hiện, phân vùng và phân loại dựa trên mô hình mạng nơ-ron tích chập với nhiều biến thể khác nhau như Resnet, Inceptionnet, U-Net
Trang 9CHƯƠNG 2 GIẢI PHÁP NÂNG CAO HIỆU QUẢ PHÂN VÙNG KHỐI U TRÊN
HÌNH ẢNH SIÊU ÂM TUYẾN VÚ
Tóm tắt:
Nội dung trong chương này trình bày về giải pháp phân vùng ảnh siêu âm tuyến vú đề xuất trong luận án Tác giả trình bày tổng quan về giải pháp đề xuất mới trong phần mở đầu của Chương 2 Tiếp theo, trình bày về các nội dung chi tiết của giải pháp gồm: Kỹ thuật tăng cường dữ liệu huấn luyện zero-padding-scaling để tạo ra tập dữ liệu tổng quát với các ảnh đa phân giải; Cấu trúc mạng phân vùng cải tiến với các khối Residual block dựa trên cấu trúc Unet truyền thống; Thuật toán để nâng cao độ chính xác phân vùng ảnh đa phân giải Thực nghiệm giải pháp đề xuất mới cho vấn đề phân vùng ảnh trên tập dữ liệu ảnh siêu âm tuyến vú, phân tích đánh giá kết quả thực nghiệm của giải pháp đề xuất mới trong nghiên cứu này và thảo luận so sánh với kết quả của một số nghiên cứu khác khi thực nghiệm trên cùng một tập dữ liệu
2.1 Tổng quan giải pháp đề xuất cho mô hình phân vùng ảnh y tế
Kết hợp ảnh phân vùng đa phân giải (AND, OR, DOMINANT)
(Ảnh đa phân giải)
(Cặp ảnh đầu vào)
(Ảnh phân vùng đầu ra)
Trích xuất đặc trưng ảnh Tái tạo ảnh
(Ảnh phân vùng đa phân giải) (Tích chập) (Giải chập)
Hình 2.2 Tổng thể của giải pháp phân vùng đề xuất mới [84]
Hình 2.2 về giải pháp phân vùng đề xuất trong luận án, đầu tiên các ảnh đầu vào được tạo ra thêm từ một ảnh đầu vào duy nhất bằng cách sử dụng kỹ thuật zero-padding-scaling Những ảnh đầu vào này được huấn luyện và kiểm tra bằng cách sử dụng một mạng phân vùng dựa trên học sâu
để phân vùng tổn thương trên từng ảnh Cuối cùng, các kết quả phân vùng của các ảnh scale được kết hợp để tạo thành hình ảnh phân vùng cuối cùng Như mô tả trong Hình 2.2, giải pháp đề xuất vẫn chủ yếu sử dụng một mạng phân vùng dựa trên học sâu cho vấn đề phân vùng tổn thương Tuy nhiên, tác giả tập trung vào ba điểm cải tiến để giải quyết vấn đề của hệ thống phân vùng tổn thương Đầu tiên, để giải bài toán vùng tổn thương biến thiên lớn có nguồn gốc do sự khác nhau giữa các giai đoạn của bệnh, tác giả đề xuất giải pháp zezo-padding-scaling để gia tăng lượng ảnh
dữ liệu được thu thập Từ các ảnh gốc trong tập dữ liệu, kỹ thuật tăng cường dữ liệu cơ bản được thực hiện Kết quả là tập dữ liệu huấn luyện lớn hơn so với tập dữ liệu ảnh gốc được tạo ra và tập
dữ liệu mới này chứa rất nhiều ảnh có vùng tổn thương có kích thước khác nhau, chi tiết cho bước đầu tiên này được trình bày ở Mục 2.2 Cải tiến thứ hai đó là một mạng phân vùng duy nhất được thiết kế dựa trên mạng U-Net truyền thống [36], với khối kết nối phụ - bổ sung giúp cho việc có thể thiết kế một mạng phân vùng sâu hơn nhưng vẫn đảm bảo việc huấn luyện tốt và tăng cường độ chính xác phân vùng so với các nghiên cứu trước đây, chi tiết về mạng phân vùng trình bày ở Mục 2.3 Cuối cùng, phân vùng tổn thương của một ảnh đầu vào tại các tỷ lệ (scale) khác nhau và phối
Trang 10hợp các kết quả phân vùng ảnh tương ứng với các ảnh đầu vào tại các tỷ lệ khác nhau để nâng cao
độ chính xác phân vùng Giải thích chi tiết cho bước này ở trong Mục 2.4
2.2 Tăng cường dữ liệu bằng giải pháp thu nhỏ kích thước ảnh gốc và đệm viền
Trong nghiên cứu này, kết quả khi sử dụng giải pháp thu nhỏ kích thước ảnh gốc và đệm viền là đã tạo ra lần lượt các ảnh có độ phân giải khác nhau với 5 giá trị độ phân giải (scale factor value) (0,9; 0,8; 0,7; 0,6; 0,5) được sử dụng để tạo ra lần lượt các ảnh từ một ảnh gốc ban đầu Kết quả thu được 6 ảnh từ mỗi ảnh gốc (gồm 1 ảnh gốc và 5 ảnh mới (scale)), trong đó kích thước của vùng tổn thương được xếp theo thứ tự từ lớn đến nhỏ như trong Hình 2.9
(a) (b) (c) (d) (e) (f)
Hình 2.5 Ảnh zero-padding-scaling được tạo ra từ một ảnh gốc đầu vào duy nhất (a) là ảnh tổn
thương đầu vào.; từ (b) đến (f) tương ứng là ảnh được Scale với tỷ lệ 0,9; 0,8; 0,7; 0,6 và 0,5
Sau khi thực hiện kỹ thuật scale trên ảnh gốc, những vùng biên của ảnh đã được scale được thêm bằng các điểm ảnh based – zero, việc này giúp các ảnh đã được scale có cùng kích thước với nhau và cùng kích thước với ảnh gốc Bằng cách sử dụng giải pháp zero-padding-scaling, tập dữ liệu huấn luyện không chỉ được mở rộng mà còn tổng quát hơn tập dữ liệu gốc (nhờ tạo ra thêm các ảnh có vùng tổn thương kích thước nhỏ từ các ảnh có vùng tổn thương kích thước lớn)
2.3 Mạng phân vùng đề xuất trong nghiên cứu
Trong nghiên cứu này, một mạng phân vùng được xây dựng dựa trên một mạng mã hóa - giải mã tự động với việc sử dụng một khối kết nối phụ - bổ sung Không giống như các mạng phân loại dựa trên học sâu thông thường, mạng phân vùng hình ảnh không chứa lớp kết nối đầy đủ (FCN) Thay vào đó, nhãn của loại cho mỗi điểm ảnh (phân loại kiểu pixel-wise) trong ảnh đầu vào được dự đoán
bằng cách sử dụng một mạng tích chập
(a) (b)
Hình 2.6 Sơ đồ khối tích chập: (a) khối tích chập thông thường và (b) khối tích tập có kết nối
phụ-bổ sung (Residual Connection) [88]
Trang 11Bằng cách sử dụng kết nối phụ bổ sung như trong Hình 2.6, một mạng phân vùng dựa trên U-Net [36] được xây dựng như trong Hình 2.7
Ảnh đầu vào
(Ký hiệu)
Giảm kích
phụ - bổ sung Kết hợp đặc trưng ảnh Lớp đầu ra
Ảnh phân vùng đầu ra
Tăng kích thước
Hình 2.7 Kiến trúc mạng phân vùng cải tiến mới trong luận án [84]
Hình 2.7 minh họa kiến trúc mạng phân vùng cho việc phân vùng tổn thương trong ảnh siêu
âm giống như mạng U-Net thông thường [36] Tuy nhiên, điểm khác là các khối kết nối phụ-bổ sung được sử dụng để truyền thông tin hình ảnh thay vì sử dụng các lớp tích chập như thường lệ Thêm vào đó, ma trận ảnh trong các đường dẫn rút gọn được xử lý xa hơn bằng cách sử dụng khối
kết nối phụ, bổ sung thông tin của ảnh, khối này còn được gọi là “Residual Connection”
2.4 Giải pháp tổng hợp ảnh phân vùng đầu ra của mạng phân vùng
Để phối hợp các kết quả của các ảnh đầu ra tương ứng, sử dụng 3 nguyên tắc phối hợp, đó là AND, OR và DOMINANT Nguyên tắc AND được thực hiện bằng cách chồng các kết quả lên nhau bằng phép toán logic AND Kết quả là ảnh đầu ra cuối cùng là ảnh có chứa vùng xếp chồng nhỏ nhất của tất cả các ảnh đầu ra của mạng phân vùng Tức là nếu tất cả các ảnh trong loạt ảnh đầu ra quyết định rằng 1 điểm ảnh trong ảnh cuối cùng là điểm ảnh tổn thương thì điểm ảnh được coi là điểm ảnh tổn thương Nguyên tắc OR thực hiện bằng cách lấy vùng bao phủ rộng nhất của loạt ảnh đầu ra dựa trên phép toán logic OR Kết quả là một điểm ảnh ở ảnh cuối cùng được gọi là điểm ảnh tổn thương nếu như ít nhất một ảnh trong loạt ảnh đầu ra quyết định nó là điểm ảnh tổn thương Cuối cùng, nguyên tắc DOMINANT được thực hiện dựa trên kết quả có ưu thế nhất trong loạt kết quả đầu ra Tức là, một điểm ảnh trong ảnh kết quả cuối cùng được coi như điểm ảnh tổn thương nếu đa số từng giá trị ngưỡng DOMINANT của các ảnh trong loạt ảnh đầu ra đều quyết định nó là điểm ảnh tổn thương Các nguyên tắc phối hợp này được thể hiện trong các phương trình (2.6-2.8)
AND_RULE = AND(O i) (2.6)
OR_RULE = OR(O i) (2.7) DOMINANT= > 0.5 (2.8)
(a)
Trang 12(b)
Hình 2.8 Ví dụ cho việc phân vùng đối tượng trên các ảnh Scale: (a) ảnh bên trái là ảnh đầu
vào (ảnh siêu âm) và ảnh bên phải là ảnh trên nền đen của vùng tổn thương (b) là các kết quả ảnh phân vùng đầu ra của các ảnh scale
2.5 Thực nghiệm giải pháp phân vùng đề xuất
Các nghiên cứu trước đây cũng đã chỉ ra rằng ung thư vú là một trong những nguyên nhân dẫn đến tử vong cho phụ nữ trên thế giới [62, 64, 83] Theo như thống kê của tổ chức y tế thế giới WHO, vào năm 2020, có khoảng 2,3 triệu phụ nữ được chẩn đoán ung thư vú và 685.000 ca tử vong [90] Tuy nhiên, ung thư vú có thể được chữa trị một cách hiệu quả, đặc biệt nếu được phát hiện sớm Kết quả là việc phát hiện và chữa trị sớm trở nên vô cùng quan trọng trong để giảm tỷ lệ tử vong
Việc chẩn đoán ung thư tuyến vú bằng cách sử dụng ảnh siêu âm vẫn là một thách thức trong các hệ thống chẩn đoán bệnh tuyến vú bởi vì nó tiêu tốn thời gian và yêu cầu kiến thức chuyên sâu từ các bác sỹ chẩn đoán hình ảnh Kết quả là có hiệu suất chẩn đoán thấp Để có sự hỗ trợ cho các bác sỹ chẩn đoán hình ảnh trong quá trình này, hệ thống chẩn đoán có sự hỗ trợ của máy tính đã và đang được phát triển Hệ thống này được sử dụng để không chỉ có sự hỗ trợ của các bác
sỹ trong quá trình đọc ảnh siêu âm tuyến vú mà còn để đảm bảo hiệu suất của quá trình chẩn đoán
Trong phần thực nghiệm này, hai bộ dữ liệu công khai được tác giả sử dụng, đó là tập dữ liệu BUS [37] và tập dữ liệu BUSI [91] Các tập dữ liệu này đã được sử dụng trong các nghiên cứu trước đây trong vấn đề phân vùng tổn thương tuyến vú Các đặc điểm thống kê của hai tập dữ liệu này được trình bày trong Bảng 2.1 Tập dữ liệu BUS [37] nhỏ hơn với 163 ảnh được thu thập vào năm 2012 từ trung tâm chẩn đoán UDIAT của tổ chức Parc Tauli, Tây Ban Nha với hệ thống ACUSON Sequoia C152 system 17L5HD linear array transucer (8,5 MHz)
Bảng 2.1 Bảng mô tả về tập dữ liệu BUS và BUSI được sử dụng trong các thử nghiệm
tổn thương
Ảnh không chứa tổn thương
Độ phân giải hình ảnh (pixels)
Trong tập đữ liệu BUSI mới được phát hành bởi Al-Dhabyani và cộng sự [91] có chứa 780 ảnh siêu âm tuyến vú của phụ nữ trong độ tuổi từ 25 đến 75 Trong 780 ảnh này, có 647 ảnh được chỉ ra có tổn thương, các ảnh từ số 1 đến số 437 có chứa tổn thương lành tính, các ảnh từ số 438 đến
số 467 có chứa tổn thương ác tính và 133 ảnh từ số 468 đến số 780 thì không có tổn thương Nghiên cứu này chỉ sử dụng 647 ảnh có chứa tổn thương tuyến vú cho thực nghiệm và bỏ qua 133 ảnh còn lại bởi vì chúng không chứa các tổn thương