Ngoài ra,hướng tiếp cận trên còn được kết hợp với việc áp dụng phương pháp biến đồi hệ tọa độ cực polar transformation nhằm giảm bớt độ phức tạp cũng như cải thiện độ chínhxác cho nhiệm
Trang 1ĐẠI HỌC QUOC GIA TP HCM
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
#2
*@®-LÊ NHẬT HUY
PHAN VUNG KHOI U GAN TREN ANH CT Ô BỤNG SU DỤNG
CHUYEN DOI HOUNSFIELD DA KENH
LUẬN VAN THẠC SĨ, KHÓA LUẬN CAO HỌC
NGÀNH KHOA HỌC MÁY TÍNH
Mã số: CH1801028
TP HO CHÍ MINH - NĂM 2022
Trang 2LÊ NHẬT HUY
PHAN VUNG KHOI U GAN TREN ANH CT O BỤNG SỬ DỤNG
CHUYEN DOI HOUNSFIELD ĐA KENH
LUẬN VĂN THẠC SI, KHOA LUẬN CAO HỌC
NGÀNH KHOA HỌC MÁY TÍNH
Mã số: CH1801028
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 Tiến sĩ Lê Minh Hưng
TP HO CHÍ MINH ~ NĂM 2022
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan, luận văn thạc sĩ “Phân vùng Khối u gan Trên Ảnh CT 6bung Sử dụng Chuyển đổi Hounsfield da kênh” là công trình nghiên cứu do chính tôithực hiện, thông qua sự hướng dẫn khoa học của Tiến sĩ Lê Minh Hưng Các kết quảnghiên cứu trong luận văn chưa được công bố trong các nghiên cứu nào khác trướcđây Tất cả những tham khảo và kế thừa đều được trích dẫn và tham chiều đầy đủ
Trang 4LỜI CAM ĐOAN
12 Giới thiệu bài toán
1.3 Những công trình liên quan
1.3.1 Mô hình mạng nơ-ron U-Net
1.3.2 Chuyển đổi hệ tọa độ cực
Chương 2 PHƯƠNG PHÁP LUẬN
2.1 Kiến trúc tổng quan.
2.2 Chuyển đổi Hounsfield đa kênh
2.2.1 Ý tưởng ban đầu
2.2.2 Các hướng tiếp cận
2.3 Phương pháp biến đôi hệ
Chương 3 THUC NGHIỆM
3.1 Bộ dữliệu
3.2 Cấu hình thực nghiệm
3.3 Tham số thực nghiệm.
3.4 Chi
3.4.1 Huấn luyện mô hình
quá trình triên khai
Trang 5DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Chụp cắt lớp vi tinh - Computed Tomography
Dice Similarity Coefficient
Ung thư biểu mô tế bào gan - Hepatocellular
carcinoma
Don vi Hounsfield — Hounsfield Unit
Intersection over Union
Liver Tumor Segmentation Challenge 2017
Vùng quan tâm — Region of Interest
2 chiều
3 chiều
Trang 6Chương 1 TONG QUAN
DANH MUC CAC BANG
Bảng 1.1 Thang đơn vị Hounsfield được đề xuất cho cơ thể người
Bảng 3.1 Tham sô thực nghiệm trong quá trình huân luyện các mô hình.
Bảng 4.1 Bảng so sánh hiệu năng giữa các phương pháp được dé cập trong luận văn.
Bảng 4.2 Bảng so sánh hiệu năng giữa phương pháp đề xuat và các phương pháp tốt
nhat hiện nay we 42
Trang 7DANH MỤC CÁC HÌNH VE, DO THỊHình 1.1 Hình mình họa kiến trúc của mô hình mạng nơ-ron U-Net [20] 3
Hình 1.2 Hình minh họa hệ thống phân đoạn hình ảnh hệ tọa độ cực của M Bender vic
et al [2] .l5 Hình 1.3 Hình minh họa hệ thông phân đoạn hình ảnh hệ tọa độ cực đa diém của M Benẽevié et al [3] 16
Hình 2.1 Lược đồ hệ thống phân đoạn gan và khối u gan 18Hình 2.2 Phân bé của don vị Hounsfield của gan (màu xanh) và u gan (màu đỏ) [5]
19 Hình 2.3 Hình minh họa của phép chuyên đôi Hounsfield đa kênh .20
Hình 2.4 Biểu dé phân bé đơn vị Hounsfield của ảnh u gan .21Hình 2.5 Sơ đồ phương pháp chuyển đổi Hounsfield đa kên 22
Hình 2.6 Hình minh họa phương pháp biến đổi hệ tọa độ cực [2] .24 Hình 2.7 Hình minh họa phương pháp biến đổi hệ tọa độ cực trên ảnh gan và ung thư gan „25 Hình 2.8 Hình minh họa phương pháp.
thư gai
Hình 2.9 Hình minh họa phương pháp Hysteresi
(B) Axial, (C) Sagittal [8]
Hình 3.2 Sơ đồ tiền xử lý dữ liệu gan
Hình 3.3 Sơ đô tiên xử lý dữ u gan.
Hình 3.4 Sơ đồ huấn luyện mô hình bộ dữ liệu gan
Hình 3.5 Biểu đồ hệ sé DSC trong huấn luyện mô hình Cartesian U-Net ở bộ dữ liệu
gan 35
Hình 3.6 Biéu đô hệ sô DSC trong hi
gan
Hình 4 7 Sơ đô hu: luyện mô hình bộ đữ liệu u gan.
Hình 3.8 Biểu đồ hệ số DSC trong huấn luyện mô hình Cartesian U-Net ở bộ dữ liệu
khối u gan.
Hình 3.10 Sơ đô hệ thông phân đoạn gan.
Hình 3.11 Sơ đồ hệ thống phân đoạn ung thư gan
Hình 3.12 Hệ sé precision và recall trong confusion matrix [19]
Hình 4.1 Một vai kết quả phân đoạn gan và khối u gan của phương pháp đề xuất với
ảnh đầu vào (Input), nhãn thực tế (GT) và kết quả dự đoán (predicted) Al
Trang 8MỞ ĐÀU
MỞ DAU
Trong lĩnh vực chan đoán bệnh dựa trên hình ảnh y khoa, nhiệm vụ phân đoạn
đối tượng trên ảnh chụp cắt lớp vi tính (CT) 6 bụng mang lại nhiều giá trị thực tiễn
Trong đó, một trường hợp cụ thé sử dụng phân đoạn đối tượng trong ảnh ykhoa là phân đoạn khối u gan Do phạm vi phân bổ rộng ở nhiều cấp độ đơn vịHounsfield (HU) khác nhau, cũng như sự đa dang trong kết cấu về hình dạng và vị trícủa đối tượng cần phân đoạn, yêu cầu nhiệm vụ phân đoạn khối u gan cần có tính linh
hoạt và thích nghỉ cao Đây vừa là thách thức và cũng vừa là lợi thế nếu được tận
dụng đúng cách Để hưởng lợi từ sự đa dạng trên, luận văn này để xuất một phươngpháp huấn luyện mạng no-ron sử dụng phép chuyên đổi Hounsfield đa kênh trên tập
dữ liệu gốc, với mỗi kênh là một cửa số giới han mức Hounsfield khác nhau, thể hiện
các đặc trưng khác nhau và thay đổi linh hoạt theo từng phân bé khác nhau của dữliệu, với mục đích tối ưu hóa quá trình rút trích đặc trưng của mô hình Ngoài ra,hướng tiếp cận trên còn được kết hợp với việc áp dụng phương pháp biến đồi hệ tọa
độ cực (polar transformation) nhằm giảm bớt độ phức tạp cũng như cải thiện độ chínhxác cho nhiệm vụ định vị vật thể cần phân đoạn, tạo điều kiện thuận lợi cho mô hìnhmạng nơ-ron hội tụ nhanh hơn Vì lẽ đó, ở nhiệm vụ phân đoạn khối u gan trên lát catngang 2D của anh CT, kết quả cho thay phương pháp đề xuất đạt được hiệu năng caonhất trên tập dữ liệu Liver Tumor Segmentation Challenge (LiTS17) mà không cầncác cầu trúc mô hình mạng nơ-ron quá phức tạp
Trang 9Chương 1 TONG QUAN
Chương 1 TONG QUAN
1.1 Lý do chọn đề tài
1.1.1 Bênh lý ung thư gan
Theo các thống kê y tế, ung thư gan là một trong những bệnh lý ung thư có tỉ
lệ mắc mới và tử vong cao nhất trong các bệnh lý ung thư thường gặp Điều này làm
cho ung thư gan trở thành bệnh lý ung thư phổ biến thứ sáu và là nguyên nhân gây tử
vong do ung thư cao thứ hai trên toàn thế giới [15]
a) Gan:
Gan là cơ quan rắn có khối lượng lớn nhất bên trong cơ thể con người (3%khối lượng cơ thể) Gan có vi trí nằm ở phan trên bên phải của khoang bụng, bên dướiphổi và tim, bên phải dạ dày, ruột và lá lách Gan chứa nhiều mạng lưới mạch máu
và có vị trí tại giao điểm giữa hệ tuần hoàn và hệ tiêu hóa
Do vị trí giải phẫu đặc thù, gan là một trong những cơ quan đảm nhận nhiều
chức năng nhất trong hệ tuân hoàn Gan có vai trò nội và ngoại tiết của cơ thể, bao
gồm các chức năng: đào thải độc tỐ, sản xuất mật, lưu trữ các vitamin và khoáng chất,
tổng hợp các yếu tố đông máu và chuyền hóa glycogen thành glucose từ đó giúp cânbằng đường huyết, cung cấp năng lượng cho mọi hoạt động
b) U lành tính:
Do việc phân đoạn u lành tính không mang lại giá trị từ góc độ y tế, phạm vinghiên cứu của đề tài sẽ không đề cập đến bài toán xử lý ảnh liên quan tới u lành tính.Tuy nhiên, các đặc trưng của các tổn thương lành tính này có thể hữu ích dé giúpphân biệt chúng với các tôn thương ác tính
c) Ung thư biểu mô tế bào gan (HCC):
Ung thư biểu mô tế bào gan là bệnh ung thư gan nguyên phát phô biến nhất,
có tiên lượng xấu, cũng như tỷ lệ mắc bệnh nghiêm trọng và ngày càng tăng Tuynhiên, loại ung thư này thường phát triển trên gan có bệnh lý sẵn có, điều này chophép theo dõi những bệnh nhân có nguy cơ cao dé phát hiện sớm các tổn thương
Bênh lý ung thư gan thường có tiên lượng xấu, ít phương pháp điều trị manglại khả năng sống sót lâu dài Dù vậy, khả năng sống sót lâu dài cao hơn khi được
Trang 10Chương 1 TONG QUAN
phát hiện va điều trị sớm Song, việc lựa chọn phương pháp điều trị rất phức tạp, đòihỏi nhiều bác sĩ từ nhiều lĩnh vực khác nhau Hơn nữa, phác đồ điều trị tối ưu vẫncòn đang được tranh luận Các phương pháp điều trị hiện nay là phẫu thuật cắt bỏ,
ghép gan và phẫu thuật nội soi.
Kỹ thuật phô biến trong chan đoán ung thư gan là kỹ thuật siêu âm, do có chi
phí thấp, thực hiện đơn giản và cho kết quả có tỷ lệ chan đoán chính xác cao Tuy
nhiên phương pháp chan đoán bằng ảnh chụp CT không những cho kết quả có tỷ lệchính xác cao mà còn mang lại độ nhạy tốt nhất dé phát hiện và mô tả đặc điểm của
thức chụp ảnh này bao gồm Chụp cắt lớp vi tính (CT) hoặc Chụp cộng hưởng từ
(MRI) cho phép chụp ảnh giải phẫu học 3D của cơ thé theo cách không xâm lần
Các bác sĩ X quang và bác sĩ ung thư thường sử dụng ảnh chụp cắt lớp vi tính
(CT) cho việc đánh giá và xác định giai đoạn của ung thư gan Từ đó, việc chan đoáncũng như lập phác đồ và theo dõi kết quả điều trị phụ thuộc nhiều vào nhiệm vụ phân
đoạn các mô gan ác tính.
Tuy nhiên, công tác chan đoán hình ảnh CT thường tốn kém và tốn thời gian
Bên cạnh đó, kết quả của việc phân đoạn ảnh CT cũng phụ thuộc vào chuyên môn
người thực hiện, đặc biệt là trong quá trình xác định khu vực khối u, do tính chất phântán rộng và đa dạng của khối u
10
Trang 11Chương 1 TONG QUAN
b) Don vi Hounsfield (HU):
O anh chụp CT, đơn vi Hounsfield (HU) là đơn vị đặc trưng cho mức độ suy
giảm của tia X quang trên mô Dựa theo các nghiên cứu liên quan tới ảnh chụp CT,
mỗi phần tử trong ảnh được gán một giá trị trong thang tương phản tương ứng, được
kiến nghị phân theo như trong Bảng 1.1 [13][18]
Ngoài ra, các nghiên cứu cũng chỉ ra rằng độ tương phản Hounsfield ở gan
chịu ảnh hưởng đáng kể bởi hàm lượng chất béo trong gan [11] Vì vậy, việc xác địnhthang đơn vị Hounsfield đối với đối tượng gan vẫn còn nhiều tranh luận
Bảng 1.1 Thang đơn vị Hounsfield được đề xuất cho cơ thể người
Don vị Hounsfield Xương 1000
Chất béo -50 đến -100
Không khí -1000
Chi thích: Nguôn số liệu được trích dan từ [13][18]
1.2 Giới thiệu bài toán
Trong luận văn này, tôi giới thiệu một kỹ thuật mới kết hợp với việc sử dụng
mô hình mạng nơ-ron đề phân đoạn các khối u gan
Bằng cách sử dụng chuyên đổi Hounsfield đa kênh trên các lát cắt ngang 2Dcủa ảnh chụp CT, chúng ta có thé tận dụng tối đa sự đa dạng trong phân phdi của cáckết cầu vật thé từ đó lam phong phú thêm các đặc trưng, phục vụ cho việc huấn luyện
mô hình Hơn nữa, hệ thống chuyền đổi đa kênh sở hữu khả năng biến chuyển linhhoạt theo từng hình ảnh lát cắt khác nhau
Ngoài ra, hướng tới việc cải thiện hiệu năng tốt hơn nữa, tôi đồng thời nghiên
cứu phương pháp biến đồi hệ tọa độ cực (polar transformation)[2][3] trên các vật thể
1I
Trang 12Chương 1 TONG QUAN
khối u gan Trong đó, một hình ảnh trong hệ tọa độ Descartes được chuyển đổi thành
hệ tọa độ mới với hai trục lần lượt là khoảng cách tới gốc tọa độ và hệ số góc
Sự kết hợp của các phép chuyển đồi trong giai đoạn tiền xử lý ảnh giúp giảm
độ phức tạp về hình đáng và vị trí vật thể, cho phép quá trình huấn luyện được tiếnhành tốt hơn, từ đó đạt được hiệu năng cao dù chỉ với mô hình có số lượng tham số
nhỏ.
Dựa theo ý tưởng trên, tôi sử dụng các kỹ thuật để xuất như một bước tiền xử
lý cho các kiến trúc mạng nơ-ron hiện tại, điển hình là mô hình U-Net [20], một trong
những kiến trúc mạng nơ-ron được sử dụng rộng rãi nhất trong nhiệm vụ phân đoạn
hình ảnh y khoa.
12
Trang 13Chương 1 TONG QUAN
1.3 Những công trình liên quan
1.3.1 Mô hình mạng nơ-ron U-Net
Trong bài toán phân đoạn ảnh y khoa, như đã đề cập, mô hình U-Net [20] là
một trong những mô hình mạng nơ-ron tích chập nỗi bật nhất
Mô hình U-Net là mô hình một mạng nơ-ron tích chập dựa trên kiến trúc
encoder-decoder, trong đó các đặc trưng được rút trích từ các bộ encoder và decoder
được kết nối qua lại, bổ sung thông tin cho nhau (Hình 1.1)
Hình 1.1 Hình minh họa kiến trúc của mô hình mạng no-ron U-Net [20].
Kiến trúc mô hình U-Net mang nhiều đặc trưng giúp mô hình phù hợp với bài
toán phân đoạn ảnh nói chung và phân đoạn ảnh y khoa nói riêng:
e GO phần encoder (phần bên trái) là một kiến trúc mang no ron tích chập
tiêu chuẩn với các lớp convolutional layer và max pooling, có nhiệm
vụ rút trích đặc trưng cũng như giảm kích thước ảnh nhưng vẫn giữ được những thuộc tính quan trọng của ảnh.
13
Trang 14Chương 1 TONG QUAN
e Phan decoder (phan bên phải) có nhiệm vụ khôi phục lại kích thước củaảnh gốc bằng lớp up-conv có chức năng tăng kích thước của ảnh
e Các layer ở hai phần encoder va decoder được kết nối với nhau giúpgiảm thiểu khả năng xảy ra vanishing gradient, vấn đề gây khó khăntrong việc cập nhật trọng số cho mô hình; cũng như bổ sung các thông
tin cần thiết từ layer ở encoder sang decoder
e Ngoài ra, kiến trúc mô hình U-Net còn không có sự hiện diện của các
lớp Fully Connected dé kết nói các đặc trưng được rút trích Nhiệm vụ
kết nối đặc trưng này được đảm nhiệm bởi phần decoder của mô hình
Việc loại bỏ hoàn toàn lớp Fully Connected khỏi mô hình giúp cho mô
hình linh hoạt hơn trong việc chấp nhận các kích thước khác nhau của
input.
Một số phiên bản cải tiến về kiến trúc của mô hình U-Net đã được đề xuất cho
nhiệm vụ phân đoạn hình ảnh y khoa trên tập dữ liệu ảnh chụp CT tương tự, trong cả
2 hướng dùng ảnh CT 3D nguyên mẫu và sử dụng các lát cắt ngang 2D của ảnh
Một phiên bản mở rộng của kiến trúc mô hình Net đã được dé xuất là Net 3D [6], với đầu vào trực tiếp là ảnh CT 3D nguyên mẫu
U-Ngoài ra, các mô hình KiU-Net và KiU-Net 3D [21] với thiết kế là sự kết hợp
giữa hai phần: Kite-Net với khả năng nắm bắt tốt các chỉ tiết nhỏ cũng như các cạnhviền của hình ảnh đầu vào và U-Net với khả năng học các đặc trưng tổng quát hơn
Đối với bài toán phân đoạn gan và khối u gan, với những ưu điểm nêu trên,
mô hình KiU-Net 3D [21] mang lại kết quả tốt nhất hiện nay khi so sánh ở hệ số đánhgiá DSC lần lượt với nhiệm vụ phân đoạn gan và khối u gan là 0.9423 và 0.775
Tuy nhiên, với việc sử dụng đầu vào trực tiếp là anh CT 3D nguyên mẫu, các
mô hình U-Net 3D yêu cầu một mô hình huắn luyện phức tạp hơn, tốn nhiều chi phí
về tài nguyên cũng như thời gian dé thực nghiệm Đây cũng chính là lý do phạm vi
nghiên cứu của luận văn là tối ưu hóa hiệu năng trên mô hình U-Net cơ bản nhất dựa
trên các phương pháp tiền xử lý dit liệu phù hợp
14
Trang 15Chương 1 TONG QUAN
1.3.2 Chuyển đổi hệ tọa độ cực
Chuyển đổi hệ tọa độ cực là phương pháp chuyền đồi ảnh ở hệ tọa độ Descartes
(với hai trục hoành x và trục tung y) sang hệ tọa độ cực (với hai trục thể hiện khoảng
cách gốc tọa độ p và hệ số góc quanh gốc tọa độ ø)
Việc sử dụng phép chuyển đổi hệ tọa độ cực kết hợp với mô hình mạng
nơ-ron đã được đề xuất trước đây, cụ thê là tnơ-rong lĩnh vực phân đoạn ảnh y khoa với
nghiên cứu của Q Liu et el [12] Nghiên cứu này dé xuất mô hình DDNet với sự kết
hợp thông tin từ cả hai hệ tọa độ Descartes và hệ tọa độ cực qua một dual-domain
fusion module.
Thời gian gan đây, lĩnh vực xử ly anh y khoa xuất hiện một phương pháp của
M Benševié et al [2] sử dụng phép biến đổi tọa độ cực trên các bộ dữ liệu gan (LiTS),
polyp (CVC-ClinicDB), ung thư da (ISIC 2018 Lesion Boundary Segmentation), mô
mỡ thượng tâm mac EAT (Cardiac Fat) Nghiên cứu nay sử dung phép biến đổi tọa
độ cực như một bước tiền xử ly dit liệu trước khi đưa vào huấn luyện ở mô hình
U-Net Hệ thống sẽ gồm hai bước là phân đoạn sơ bộ trên mô hình U-Net ở hệ tọa độDescartes, từ đó tiến hành biến đồi hệ tọa độ cực và phân đoạn ở hệ tọa độ cực, sau
đó chuyển đổi kết quả lại hệ tọa độ Descartes như thê hiện ở Hình 1.2
Với hướng tiếp cận áp dụng phương pháp biến đổi hệ tọa độ cực, M Benevié
et al [1] đã đưa ra kết quả ở nhiệm vụ phân đoạn gan ở hệ số DSC là 0.9302 và ở hệ
số IoU là 0.8985 (kết quả cho hệ số IoU tốt nhất hiện tại) Tuy nhiên, công trìnhnghiên cứu trên chưa đưa ra được kết quả khi áp dụng cho nhiệm vụ phân đoạn khối
u gan, đây cũng chính là lý do cho việc áp dụng phương pháp trên vào hướng nghiên
cứu của luận văn.
Cartesian Cartesian Center of Polar Polar Polar Inverse
image network mass transform network prediction polar transform
a > fir 1n a | > i oat m m
Hình 1.2 Hình minh họa hệ thống phân đoạn hình ảnh hệ tọa độ cực của M Benevié et
al [2].
15
Trang 16Chương 1 TONG QUAN
Ngoài ra, phương pháp trên còn được phát triển thành phép biến đổi hệ toa độcực đa đối tượng để phân đoạn các động mạch chủ trong các lát cắt ngang từ ảnh chụp
CT động mạch (CTA) [3] Với hướng phát triển trên, hình ảnh sẽ được chuyền đổi hệ
tọa cực cho từng thành phần cần phân vùng trước khi đưa vào mô hình, sau đó kết
hợp các đầu ra lại với nhau trước khi chuyển đổi ngược lại hệ tọa độ Descartes (Hình
pháp trên và việc sử dụng chuyền đổi Hounsfield đa kênh như là bước tiền xử lý ảnh
để phục vụ cho việc huấn luyện mô hình mạng nơ-ron U-Net
1.4 Đóng góp cúa đề tài
Với việc áp dụng phương pháp được đề xuất trong nhiệm vụ phân đoạn khối
u gan, luận văn mang lại một số đóng góp sau:
¢ Phuong pháp chuyền đổi Hounsfield đa kênh:
o Tận dụng được sự phân bé mức Hounsfield rộng của các đối tượng
ung thư cẦn phân đoạn
o Chuyển đồi ảnh gốc thành ảnh đa kênh với mỗi kênh thé hiện cácđặc trưng khác nhau của ảnh nhằm tối ưu hóa quá trình rút tríchđặc trưng khi huấn luyện mô hình
16
Trang 17Chương 1 TONG QUAN
¢ _ Phương pháp biến đôi hệ toa độ cực (Polar transformation):
o_Hỗ trợ chuyển vật thê ung thư cần phân đoạn về một vị trí cụ thể,
giúp giảm bớt sự đa dạng và phân tán của vị trí cũng như hình
dang vật thé, từ đó gia tăng độ chính xác cho mô hình hudn luyện
Việc phối hợp cả 2 phương pháp trên như một bước tiền xử lý cho mô hình
mạng nơ-ron giúp hệ thống đạt được kết quả cao nhất ở bài toán Phân đoạn Ung thư
gan trên tập dữ liệu Liver Tumor Segmentation Challenge (LiTS17) [5][12].
17
Trang 18Chương 2 PHƯƠNG PHÁP LUẬN.
Chương 2 PHƯƠNG PHÁP LUẬN
Trong pham vi nghiên cứu của luận văn này, tôi trình bày hai phương pháp
luận của hướng tiếp cận được đề xuất áp dụng vào việc phân đoạn khối u gan trênanh CT 6 bụng:
© Chuyển đổi Hounsfield đa kênh: đây là phương pháp được tôi đưa ra
nhằm giải quyết vấn đề đa dạng trong phân bổ của ảnh CT u gan, mục
đích nhằm tận dụng tối đa từ sự đa đạng trên trong quá trình rút trích đặctrưng khi huấn luyện mô hình
© Phuong pháp biến đồi hệ tọa độ cực: đây là phương pháp đã được đề xuất
ở các báo cáo khoa học trước đây Cụ thé là phương pháp biến đổi hệ tọa
độ cực đa điểm trên nhiều đối tượng cho việc giải quyết bài toán phân
đoạn các động mạch chủ trong các lát cắt từ ảnh chụp CT động mạch
2.1 Kiến trúc tổng quan
Trong bai toán phân đoạn khối u gan, hệ thống được mô tả như lược dé ở Hình
2.1., với
¢ Input: Hình chụp CT đã được cắt lat theo lát cắt ngang 2D
© Output: Phân đoạn của gan và khối u gan
Ở giai đoạn Phân đoạn Gan, phương pháp đề xuất áp dụng biến đổi hệ tọa độcực ở bước tiền xử lý trước khi đưa vào mô hình huấn luyện
Ở giai đoạn Phân đoạn U Gan, áp dung cùng lúc 2 phương pháp chuyển đồiHounsfield đa kênh và biến đồi hệ tọa độ cực ở bước tiền xử lý
Hình 2.1 Lược đồ hệ thông phân đoạn gan và khối u gan.
Trang 19Chương 2 PHƯƠNG PHÁP LUẬN.
2.2 Chuyển đổi Hounsfield đa kênh
2.2.1 Ý tưởng ban đầu
Nhằm loại bỏ thông tin từ các mô không cần thiết và giữ lại nhiều nhất các đặctrưng về vị trí giải phẫu cũng như hình dáng của gan và khối u gan, tôi đã xử lý để bộhình ảnh huấn luyện trở nên cân bằng hơn bằng cách áp dụng vùng quan tâm (ROI)đồng bộ là [0, 200] HU
Tuy nhiên, do đặc trưng giải phẫu các cá thé ung thư, vùng khối u gan có phân
bổ ở độ tương phản Hounsfield rộng hơn, có sự đa dang hơn về độ sáng, độ tươngphản và độ bão hòa trên các mẫu khiến việc học trở nên khó khăn hơn và tỷ lệ nhằm
lẫn cao hơn (Hình 2.2) Vì lẽ đó, phương pháp chuyên đôi Hounsfield đa kênh ra đời
dé khắc phục van đề trên
Hình 2.2 Phân bô của đơn vị Hounsfield của gan (màu xanh) và u gan (màu đỏ) [5].
Trang 20Chương 2 PHƯƠNG PHÁP LUẬN.
Phương pháp chuyển đổi Hounsfield đa kênh là phương pháp tiền xử lý ảnh
chuyền đổi ảnh gốc 1 kênh sang ảnh huấn luyện đa kênh với mỗi kênh là một cửa số
đơn vị Hounsfield khác nhau Mục đích của phép chuyền đổi trên nhằm tận dụng sự
đa dạng trong phân bé của vùng ung thư gan, với mỗi kênh đại diện cho một cửa số
vùng quan tâm (ROI) khác nhau, thể hiện các đặc trưng khác nhau, từ đó giúp mô
Nhằm hiện thực hóa ý tưởng trên, các hướng tiếp cận sau đã được đưa vào thử
nghiệm và đánh giá để đưa ra hướng tiếp cận hiệu quả nhất cho bài toán:
20
Trang 21Chương 2 PHƯƠNG PHÁP LUẬN.
e _ Chuyển đồi ảnh gốc thành ảnh 3 kênh theo phân bỏ cố định:
o Cửa số [0, 200]: dựa theo sự phân bố của ảnh u gan tập trungtrong đoạn Hounsfield từ 0 đến 200 HU (Hình 2.4)
o Cửa số [-œ, 0] và cửa sô [200, +œ]: thể hiện các đặc trưng bênngoài vùng phân bồ tập trung
Tuy nhiên sự phân bồ da dạng của u gan trên thang đo Hounsfield dé dẫn đếncác trường hợp có cửa sô mang quá ít đặc trưng, không mang lại nhiều ý nghĩa cho
quá trình huấn luyện
Trang 22Chương 2 PHƯƠNG PHÁP LUẬN.
© Chuyén đồi thành ảnh 3 kênh bằng phân khoảng dữ liệu:
o Phân khoảng thành 3 cửa số đơn vị Hounsfield bằng nhau dựatheo biểu đồ phân bố histogram của vùng vật chất cần phân đoạn
(Hình 2.5).
Điểm trừ của hướng tiếp cận này là thiếu một kênh ảnh có khả năng tổng quát
được các đặc trưng chủ yếu của hình ảnh gan Ngoài ra vẫn còn một số cửa số không
chứa nhiều đặc trưng phục vụ cho việc huấn luyện
Bese
Hình 2.5 So đồ phương pháp chuyền đổi Hounsfield đa kênh
¢ Chuyén đổi thành anh 3 kênh kết hợp phân bồ có định và phân khoảng
Trang 23Chương 2 PHƯƠNG PHÁP LUẬN.
© Trong số 3 cửa sé phân khoảng bằng nhau, lựa chọn 2 cửa số có
khả năng thể hiện đặc trưng cao nhất qua độ phân tán của cácpixel, được tính bằng độ lệch chuẩn:
(2.1)
Trong đó, x; là phân tử thứ i, Z là giá trị trung bình và n là số lượng phan tử.Hướng tiếp cận này cho phép ảnh đa kênh vừa có khả năng thé hiện các đặctrưng tổng quan của gan vừa có khả năng thẻ hiện các đặc trưng chỉ tiết đa dạng khác
của u gan.
Ngoài ra, các hướng tiếp cận chuyên đồi thành ảnh 2 kênh, 4 kênh, cũng đãđược thử nghiệm và đánh giá Tuy nhiên đều chưa mang lại kết quả khả quan
2.3 Phương pháp biến đổi hệ tọa độ cực
Nhằm hiểu hơn về phương pháp biến đổi hệ toa độ cực [2], khái niệm về 2 hệ
tọa độ được trình bày như sau:
e Hệ tọa độ Descartes là hệ tọa độ thường được dùng, hình ảnh được thể
hiện bởi các pixel dàn trải theo 2 trục x, y.
e Hé tọa độ cực gồm trục p thể hiện khoảng cách đến gốc tọa độ của mỗipixel và trục ø thể hiện hệ số góc quanh gốc tọa độ của pixel đó
Phuong pháp biến đồi hệ tọa độ cực xoay quanh việc biến đổi ảnh ở hệ tọa độDescartes sang hệ tọa độ cực Nói một cách chính xác, đây là phương pháp huấn luyện
mô hình mạng nơ-ron trên ảnh có hệ tọa độ cực.
Đê phục vụ cho việc huấn luyện trên, ảnh đầu vào cần được chuyền đổi sang
hệ tọa độ cực với gốc tọa độ có vị trí gần với trọng tâm của vùng cần được phân đoạn
Vi gốc tọa độ nay là không thé xác định trước nên tôi bước đầu sử dụng một mô hìnhphân đoạn thô sơ, ở đây là U-Net cho ảnh có hệ tọa độ Descartes, để định vị các vùngcần phân đoạn một cách sơ bộ, từ kết quả đó xác định điểm trọng tâm của vùng
23.
Trang 24Chương 2 PHƯƠNG PHÁP LUẬN.
pixel angular coordinate
Hình 2.6 Hình minh họa phương pháp biến đồi hệ tọa độ cực [2].
Việc áp dụng phương pháp biến đổi hệ tọa độ cực mang lại cải thiện đáng kể
cho nhiệm vụ phân đoạn ảnh y khoa [2] Xét trường hợp minh họa tại Hình 2.6 với
bài toán yêu cầu một mô hình tuyến tính dự đoán biên quyết định của hình tròn trênảnh Để giải quyết bài toán trên cần sử dụng một hàm sé bậc bốn dé thé hiện biênquyết định của hình tròn Tuy nhiên, khi toàn bộ đường tròn trong hệ tọa độ Descartesđược chuyển đổi thành một đường thăng trong hệ tọa độ cực, một hàm tuyến tínhtrong không gian 2 chiều đơn giản là đủ để mô tả biên quyết định tuyến tính này.Chính vì vậy, chúng ta có thể sử dụng mô hình đơn giản hơn để dự đoán biên quyết
định trên hình ảnh trong tọa độ cực.
24
Trang 25Chương 2 PHƯƠNG PHÁP LUẬN.
Hơn nữa, ý tưởng này có thể áp dụng với các trường hợp phức tạp hơn, cụ thể
là việc biến đổi hệ tọa độ cực của hình ảnh với vùng phân đoạn là gan và khối u gan
đơn giản hóa độ phức tạp cần thiết của mô hình phân đoạn (Hình 2.7) Bên cạnh đó,bằng cách áp dụng quá trình biến đổi hệ tọa độ cực bằng cách sử dụng tâm của đối
tượng làm gốc tọa độ, vị trí của đối tượng huấn luyện được cố định Do đó, mô hình
chỉ cần học các đặc trưng khoảng cách từ đường viền vùng phân đoạn đến góc tọa độ
mà không cần phải học cách xác định vị trí của đối tượng
cartesian Polar
bere er er
Hình 2.7 Hình minh hoa phương pháp biến đổi hệ tọa độ cực trên ảnh gan và ung thư gan.
Trang 26Chương 2 PHƯƠNG PHÁP LUẬN.
Khi áp dụng cho nhiệm vụ phân đoạn ảnh, quy trình biến đổi hệ tọa độ cựcđược thực hiện theo 2 bước: xác định trọng tâm của vùng cần phân đoạn làm gốc tọa
độ cực, sau đó chuyển tọa độ Descartes ban đầu thành tọa độ cực cho mỗi pixel
Ở bước một, trong tâm của vùng phân đoạn ở anh Descartes I(x, y) được tinhbằng cách:
¢ Dau tiên, tính moment matrix M tại hang i và cột j bằng công thức (2.2):
n
My =) Tey)! -y! (2.2)
k=0
© Sau đó, tọa độ tâm của vùng phân đoạn (c,, cy) được tinh theo công thức
(2.3) và (2.4), với Myo, Moo, Mọi lần lượt tương ứng với moment matrix
Ở bước 2, tôi sử dụng Dinh ly Pythagoras và Hàm tiếp tuyến dé chuyền hệ tọa
độ, với mỗi pixel ở hệ tọa độ Descartes (x, y) được chuyền sang hệ tọa độ cực (2, Ø)bằng công thức (2.5) và (2.6), với ø thể hiện khoảng cách đến gốc tọa độ của mỗipixel và trục ø thể hiện hệ số góc quanh gốc tọa độ của pixel:
p = magnitude(x,y) = yx? + y? (2.5)
@ = angle(x,y) = atan2(y,x) = (2.6)
Trong đó atan2 là hàm arctangent với 2 đối số
26
Trang 27Chương 2 PHƯƠNG PHÁP LUẬN.
Do đặc trưng của khối u gan khác gan ở khả năng xuất hiện đưới dạng nhiều
phần tử ở cùng một ảnh lát cắt, phương pháp biến đổi hệ tọa độ cực đa điểm được
đưa ra dé giải quyết van đề
Bằng cách áp dụng phép biến đổi hệ tọa độ cực riêng cho mỗi phần tử và trọngtâm của mỗi phan tử lần lượt đóng vai trò là gốc tọa độ của hệ tọa độ cực ta được kết
quả minh họa như trong Hình 2.8.
Polar Transformation Boss eu.
cho thấy ngưỡng trong khoảng [0, 0.4] cho kết quả tốt nhất
Hysteresis thresholding là phương pháp đặt ngưỡng nhằm phân loại thành phan
nào thật sự thành phần cần phân đoạn sau khi kết hợp các dự đoán phân đoạn Với
việc áp dụng ngưỡng trên và dưới cho các thành phần dự đoán phân đoạn sẽ có các
trường hợp sau xảy ra:
¢ Cac thành phần với cường độ lớn hơn ngưỡng trên (High) chắc chắn là
thành phần cần phân đoạn
¢ Các thành phan với cường độ nhỏ hơn ngưỡng dưới (Low) chắc chắn
là thành phần không cần phân đoạn
2?
Trang 28Chương 2 PHƯƠNG PHÁP LUẬN.
© _ Các thành phần có cường độ giữa ngưỡng trên (High) và dưới (Low) sẽ
được xác định là thành phần cần phân đoạn nếu nó có kết nối với một
thành phần cần phân đoạn đã được xác định
Vi dụ minh họa cho phương pháp Hysteresis thresholding được thể hiện ở Hình
29.
© Trường hợp A, B là thành phần cần phân đoạn (do có cường độ lớn hơn
ngưỡng trên High).
¢ _ Trường hợp D là thành phần không cần phân đoạn (do có cường độ nhỏ
hơn ngưỡng dưới Low).
e _ Trường hợpC là trường hợp cần phân đoạn (do có cường độ giữa ngưỡngtrên High và dưới Low và có kết nói với thành phần cần phân đoạn là B)
e _ Trường hợp E là trường hợp không cần phân đoạn (do có cường độ giữangưỡng trên High và dưới Low và không có kết nói với thành phần cần
phân đoạn nào).
High
Low
Hình 2.9 Hình minh họa phương pháp Hysteresis thresholding [1].
28
Trang 29Chương 3 THỰC NGHIEM
Chương 3 THỰC NGHIỆM
Phan này của luận văn mô tả việc triển khai phương pháp được sử dụng déphân đoạn các khối u gan đầu cuối, bao gồm mô tả bộ dữ liệu và chỉ tiết quá trìnhtriển khai
3.1 Bộ dữliệu
Bộ dữ liệu ảnh chụp CT ung thư gan mà tôi sử dụng cho các nghiên cứu trong
luận văn là bộ dữ liệu LiTS [5] từ cuộc thi Tumor Segmentation Challenge MICCAI
2017 Bộ dữ liệu bao gồm 131 ảnh chụp CT của những bệnh nhân bị ung thư biểu mô
tế bào gan (HCC) bao gồm nhãn thực tế của các phân đoạn gan và khối u do chuyêngia cung cấp Bộ dữ liệu được tổng hợp từ bảy bệnh viện và cơ quan nghiên cứu khác
nhau, ngoài ra còn được đánh giá một cách độc lập bởi ba bác sĩ và chuyên gia X
quang Trong nghiên cứu của mình, tôi tiến hành cắt lát ảnh chụp CT 3D theo trụcaxial như được mô tả ở Hình 3.1 thành nhiều lát cắt ngang 2D Ngoài ra, để tạo ramột hệ thống tuần tự tự động dé phân đoạn các khối u gan, tôi cũng tiến hành các
3g
Trang 30Chương 3 THỰC NGHIEM
nhiệm vụ phân đoạn gan và khối u một cách riêng biệt, nhãn thực tế của phân đoạn
gan được sử dụng như là tập huấn luyện dé phân đoạn khối u
Với 131 ảnh chụp CT 3 chiều, tôi sử dụng 101 ảnh cho quá trình huấn luyện,
15 ảnh cho quá trình đánh giá (validate) và 15 ảnh còn lại cho quá trình kiểm thử
(test).
Trong tập dữ liệu phân đoạn gan, tôi bỏ qua các nhãn phân đoạn khối u và tiếpcận tập dữ liệu như một bài toán phân đoạn nhị phân Ngoài ra, tôi cũng tiến hànhloại bỏ các lát cắt không có nhãn phân đoạn gan, kết quả là tập dit liệu khoảng 29,000lát cắt 2D đề huấn luyện, 4,000 lát cắt dé đánh giá (validate) và 5,000 lát dé kiểm thử
(test).
Tương tự, tập dữ liệu khối u gan cũng được coi như là bài toán phân đoạn nhịphân và các lát cắt không chứa nhãn phân đoạn cũng bị loại bỏ, tạo ra tập dữ liệu
khoảng 10,000 lát cắt cho quá trình huấn luyện, 1,500 lát cắt cho quá trình đánh giá
(validate) và 2,200 lát cắt còn lại dùng cho quá trình kiểm thử (test)
Với tiến trình tiền xử lý dữ liệu gan, phương pháp áp dụng vùng quan tâm
(ROT) [0, 200] HU và biên đôi tọa độ cực cho tập dữ liệu gan như lược đồ ở Hình
Trang 31Chương 3 THỰC NGHIEM
Với tiến trình tiền xử lý dữ liệu u gan, phương pháp áp dụng chuyển đổi
Hounsfield đa kênh kết hợp biến đổi tọa độ cực đa điểm theo lược đồ ở Hình 3.3
Hình 3.3 Sơ đồ tiền xử lý dữ liệu u gan.
Trang 32Chương 3 THỰC NGHIEM
3.3 Tham số thực nghiệm
Quá trình huấn luyện các mô hình được thực hiện với các tham số như Bảng
3.1.
Bang 3.1 Tham số thực nghiệm trong quá trình huấn luyện các mô hình
Bài | Mô hình Tham so
toán Batchsize | Epoch | LearningRate | LearningRate | Dropout
Scheduler
Gan | Cartesian | 6 100 0.001 Có
U-Net Polar U- | 6 100 0.001 Step: 20, Không Net Gamma: 0.1
from epoch 40 Khoi | Cartesian | 8 100 0.001 Có
3.4 Chỉ tiết quá trình triển khai
3.4.1 Huấn luyện mô hình
Ở quá trình huấn luyện, hệ thống phân đoạn ung thư gan được chia thành haiphần riêng biệt
32