Mô hình PGD - UNet kết hợpkiến trúc U — Net với phương pháp khai thác thông tin biến đổi đã tạo ra một môhình phân đoạn chính xác và ôn định hơn, quá trình khai thác thông tin ở các tầng
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM TPHCM KHOA CÔNG NGHỆ THÔNG TIN
ĐINH TRONG LUAN
NHAN DIEN KHOI U BEN TRONG TUYEN TUY
BANG MO HINH DEEP LEARNING
KHOA LUAN TOT NGHIEP
TP.HO CHI MINH - NAM 2023
Trang 2TRƯỜNG ĐẠI HỌC SU PHAM TPHCM
KHOA CÔNG NGHE THONG TIN
DINH TRONG LUAN
NHAN ĐIỆN KHOI U BEN TRONG TUYẾN TUY
BANG MO HINH DEEP LEARNING
CHUYEN NGANH: KHOA HỌC MAY TÍNH
NGƯỜI HUONG DAN KHOA HỌC: THS TRINH HUY HOANG
THS VY VAN
Trang 3Lời cam đoan
Tôi xin cam đoan khóa luận này của tự bản thân tôi tìm hiéu, nghiên cứu
dưới sự hướng dan của Ths.Trịnh Huy Hoàng và Ths.Vy Vân Các số liệu, hình
ảnh phân tích được dẫn chứng có nguồn gốc rõ ràng Kết quả nghiên cứu trong
khóa luận hoàn toàn trung thực, khách quan và chưa được công bố trong bat kìnghiên cứu nào khác Các tài liệu tham khảo được trích dẫn và chú thích day đủ
Sinh viên thực hiện
Dinh Trọng Luân
Trang 4Lời cảm ơn
Lời cảm ơn đầu tiên, tôi xin trân trọng cảm ơn sâu sắc Ths.Trịnh Huy
Hoàng và Ths Vy Vân — Giảng viên khoa công nghệ thông tin đã hướng dẫn tôi
thực hiện khóa luận tốt nghiệp Đặc biệt là Ths.Vy Vân mặc dù cô công tác ở
nước ngoài nhưng vẫn dành thời gian đê trao đôi, hướng dẫn động viên hỗ trợtôi trong suốt quá trình hoàn thành khóa luận
Tôi xin gửi lời cám ơn đến quý thầy cô trường Đại học Sư Phạm Thành
phó Hỗ Chí Minh đã truyền đạt kiến thức quý báu cho tôi trong quá trình học tập
Cảm on nhà trường đã tạo điều kiện, môi trường tốt dé tôi tham gia các hoạt động
hội thảo về công nghệ thông tin do trường tổ chức, các hội thảo đã cho tôi kiến
thức vô cùng sầu sắc dé thực hiện khóa luận
Cuỗi cùng tôi xin bày tỏ lời cảm ơn chân thành với gia đình tôi Những
người đồng hành, sát cánh, khích lệ, động viên tôi những lúc khó khăn trong suốt
quá trình thực hiện khóa luận.
Trang 5Mục lục
Đanh mục thuật ngữ "na 5
Danh muc Cae Rink 0 1 Ả 6
DE ania soe Ras cccessasccccssesntccssrnnrcs essen eeereeneeseenniereenni concer cccceeccccasieeeeses 7
Mareen il); (Gai Gra (MAN G 00 ;2:-::::s::s:::::2:25222322202225222352122521223352252321825535555328552582535333855233233352853333252333323534 8
NWS GOH AEARG th sss cosevavscsnvcoxavevsewcvsexnvasssassossnvcssnsssssasscsssvasssssvcvavussavasscsussabavessssasesosssassssasensssosss 8 1.2 Mục tiêu của khóa luận - - C1291 9T 1c 12 1S ING ht ER AG is sssssssassasssesssasisavicsesesssnseseszacsesesosascnascssnsssnsasasncnsnsnsnsnscnsnenananaoaaa 13 1.4 Giới hạn của khóa luận ó- (5 1S vn nàng ngàn, 13
1.5 Tóm tắt những đóng góp của khóa luận -22 -22v2vccrrerrrrrrrx 13
B51) Siig Oo WE Hist BOA G6 sssscessssccsssssszcsssassccosssncctosssncctosssnsctossssscbosnscseasssncctos 141.5.2 Đóng góp vẻ mặt thực tiỄn 6s 2 1 22111222111202111021110201 12 2e l41,6 T6 6n ailHnaốaốa_-_AỶỲyỶ-a 14
Chương 2 Các nghiên cứu ung thư biểu mô tuyến Lụy 22522 2222222222022 16
2.1 Tông quan các mô hình phân đoạn Anb ccsssssscccssssssssesessnsseeeeenssnnnveeeneensnnneeesee l6
2.2 Các mô hình phân đoạn ung thư biểu mô tuyến Lụy -c-cccccccccccce 20
2.2.1 Mô hình DLU - Net trong phân đoạn khối u biểu mô tuyến Lụy 20 2.2.2 Mô hình PGD — UNet trong phân đoạn khôi u biểu mô tuyến tụy 21 2.2.3 Ket nh ad 23
Chương 3 Phân đoạn khối u biểu mô tuyến tụy dựa trên phương pháp dé xuat 24
B.D CO nh ẽ 24
S520) Anh To nnnannnnnnnrnnnttiioinitionititGGHBSHHHIRG00015G88802300388G3003383308838330088330EegEEazccze 24
3.1.2 Ảnh CT ô bụng 2¿- 22222 222C2222ECE2E22CEEEEEEEEEEEEECEEEEEEECEEEEEECEEEreerrrvee 25
3.2 Phương pháp tiếp C&M o.oo ccccccssecsssssseesssnneessnnnneesssnnnuessennnnsesssnieessnnnnnensnnieneeneneee 26
3.3 Phương pháp đề xuất - 222-©CCVV2222ZEEEEEEEE22ECEEEEEE.ETEEEEEEEEECrrrEErLreeccce 26
3.3.1 Chuyên đổi ảnh và chọn lọc các sliees -22222222222222222zzzcccccczzzed 273.3.2 Trích xuất vùng quan tâm -22-222222222CEE2222CCEEEE2ZrCEEEEecEEErrerrrrrrrccee 29
3:3:3.Lãm;giầu:đ#ỆH:;::::-::::::::::-:::-::::c: c 2-2-2755 7cc22222222205237258528585263855875- 30
5:51 IMBIHInHiU'=iMsfIBNNIENiLssoisssssesoiitiiis0902000112010202221000134022021012018022202003001402202 31
Trang 63.4 Ham Dice — OSS hs 34
Chung siniiiiiwenchiiimeaeiiaaiiiiiiaeaiiasiie 37
"“ c nh ẽẻẽốTxÀŒŒtt 37
II han ố ẽ .ẽố ẽố ẽẽ 38
4:3 Phương pháp đánh: gid) và MEE GU ssssssssssssssssssssssssssssssssacocoscsssnsssssssssosssosossssssssssssssons 39
431) PAWN F PHA 6 GOAN GA ocoiionoinntinintiitiiiiiiiii1111311043138ã83831855838858588585855858588ã8ã5 39
Trang 7Danh mục thuật ngữ viết tắtThuật ngữ tiếng anh
World Health Organization
Computed Tomography
Magnetic Resonance Imaging
Artificial Intelligence
Convolutional neural network
Dice Similarity Coefficient
Medical Segmentation Decathlon
Bidirectional Convolutional Long Short
Fully Convolutional neural network
Batch Normalization
Rectified Linear Unit
Hyper ~ Pairing Network
Atrous Spatial Pyramid Pooling
Trang 8Danh mục các hình vẽ Hình 2.1- Mơ hình mang Fully convolutional neural network [7] -. -‹ 16 Hình 222 = AG Danae (8) oisssciescccccsssicweviscsswecsansssnssasssoansascsosisansisssareesassosssrecsassorsssesze 18
Hình 2:3 = Kiểntrũe DU =Netl[Ợkossaasaononnr-nnn-inn inn n-inn-annnnlsnantoannna 20
Hình 24-MưlBinhiPfSD= UINGE [4] sisssssssissescssssssssesssssssscsseseesassssaceasasseseacassoscssassaseusssseseas 22 HigRiS.1= GuáitìnBiO 1) Ol 24
Hình 3.2- Tang quan vẻ phương pháp đề xuất 22-©22C2222222CEEE2222zzccCC22zzzzcre 27
Hình 3.3- Chuyên đơi anh và chọn các slices cĩ khối u 22222222222222222222zzcc 28
Hình 3.4- Slice và mặt nạ tương ứng khi chưa mở rộng cửa sỗ - 30Hình 3.5- Slice và mặt nạ tương ứng sau khi mở rộng cửa sơ - 30
Hình 3.6- Anh và mặt nạ tương ứng trước khi làm giàu dữ liệu - 31Hình 3.7- Ảnh và mặt nạ của nĩ sau khi làm giàu dữ liệu -.-« -<<<<<<<<<< 31
Hình 3.§- Mơ hình U — Net cải tiỄn s22 221 22222221222111222122221277232 272222222112 32
Hình 4/1= Slices swab rma mips chỉ CG 0 a ssssssssscxsssssvssessssveeosesnsnsssssensssssosveasssnscnsnssasocssssesazs 37
Hình 4.2- Slice và mặt na bao gồm nên, tuyến tụy và khối u ccccc-cc 38
Hình 4.3- Slice và mặt nạ bao gồm nên và tuyỂn Lụy -2 -222c2czzccccccczcccee 38
Hình 4.4- Kết quả sau 50 lần đảo tạo s-2222222222222222222222222222222222222221222222222222 e2 41
Hình 4.5- Kếtquả sau 100ilần GAO 190 sscsssssssssssssssssssssnssssssscscnccoaasanssccsssasaesssonsadaassssoaaaaaass 4I
Hình 4.6- Kết quả của một slice ngẫu nhiên và mặt nạ tương tng của nĩ với Mean IOU
CŨ ĐỒIicctiiitiniitsiini2111314215131355383135538583835858338858535858565885858588585856588585558855385885388055355305825538588ã532552E 42
Trang 10Chương 1 Giới thiệu
1.1 Giới thiệu
Ung thư tuyển tụy là một dang ung thư liên quan đến các mô ở tuyến tụy,
một cơ quan nội tiếp nằm phía sau dạ dày và gân túi mật Tuyến tụy có vai trò
quan trọng trong việc tiết ra các enzyme hỗ trợ tiêu hóa và các hóc môn giảm
đường huyết Ở dang ung thư, các tế bào ung thư xuất phát từ mô tuyến tụy và
lần lượt nhân lên lan rộng ra các mô xung quanh, hình thành khối u ác tính cho
người bệnh Theo thông kê của WHO, ung thư tuyến tụy chỉ đứng thứ 14 về tỉ lệ
nhưng lại đứng hàng thứ 7 vẻ tỉ lệ tử vong do ung thư Điều này cho thấy tiênlượng của ung thư tuyến tụy rất xấu, trên thực tế tỉ lệ sông trung bình sau 5 năm
của ung thư tụy chí khoảng 9,3% [1] Vì tí lệ tai phát ung thư khá lớn nên những
bệnh nhân sau phẫu thuật thường chỉ sống được 2-3 năm, những bệnh nhân mắc
chứng ung thư giai đoạn cuối thì thời gian sống không quá | năm Ung thư tuyến
tụy thường có nguồn gốc từ các mô ngoại tuyến, các loại ung thư thường thấy
bao gồm:
Một là ung thư biểu mô tuyến, nó là một loại ung thư bắt nguồn từ cáctuyến tiết ra hoặc tiết dịch trong cơ thê Ung thư biểu mô tuyến phát triên khi các
tế bào bat thường trên biéu mô tuyến tụy phát triển và phân chia không kiểm soát,
tạo thành khôi u ác tính Ung thư biéu mô tuyến tụy thường gây ra triệu chứng ở
giai đoạn sớm vả thường phát hiện khi đã phát trién đến giai đoạn muộn Việc
chuan đoán ung thư tuyến tụy sớm thông qua hình ảnh siêu âm, MRI, CT đã và
đang được nghiên cứu rất nhiều trong thời gian gần đây nhằm cải thiện tình trạng
bệnh của bệnh nhân.
Hai là ung thư ở nang tức là túi chứa day chất long hình thành trong tuyển
tụy Hau hết các u nang tuyến tụy là lành tính nhưng một số lại là ung thư Đây
là ung thư hiểm gặp và rất nguy hiểm, loại ung thư này bat đầu phat trién từ tế
bào nang túi, một thành phần của tuyến tụy Nang túi là một tế bào nhỏ bao quanh
các tế bào tuyến tụy, tao ra một số chat bôi trơn và chat long cho các enzyme tiêuhóa được trao đổi giữa các bộ phận của tiêu hóa một cách hiệu quả Tuy nhiên,
Trang 11nang túi cũng có thê trở nên bat thường và phát triển thành khỗi u ác tinh, gây ra
ung thư nang túi tuyến tụy
Ba là ở các tế bào “Acinar”, loại ung thư này phát triển trong các tế bàoacinar của tuyến tuy, nam ở hai đầu của ông dẫn sản xuất ra các enzyme tiêu hóa
Té bào Acinar là những tế bào sản xuất enzyme tiêu hóa giúp phân hủy thức ăn
và hỗ trợ quá trình tiêu hóa Loại ung thư này cũng có triệu chứng bệnh dé nhằmlẫn với các bệnh khác và rất khó phát hiện trong quá trình điều trị của bệnh nhân
Đề chuẩn đoán ung thư tuyến tụy loại Acinar, các bác sĩ thường sử dụng nhiều kĩ
thuật như siêu âm, chụp CT hoặc MRI, hoặc thực hiện xét nghiệm tế bào và mô
Việc xác định đúng loại ung thư nay rat quan trọng đề đưa ra phác đô điều trị phù
hợp cho bệnh nhân trong quá trình điều trị
Sở di, ung thư tuyên tụy có tiên lượng xấu hơn so với các loại ung thư tiêuhóa khác là do tuyến tụy có vị trí đặc biệt ở rất sâu trong 6 bụng Triệu chứngbệnh ở giai đoạn đầu thường nhằm lẫn với các loại bệnh khác nên người bệnhthường được chuân đoán ở giai đoạn muộn Ung thư tuyến tụy sẽ không đượcphát hiện cho đến khi tế bảo ung thư ở các mô của nó lan rộng đến các cơ quankhác Thời gian mắc bệnh càng dai thì triệu chứng cảng rõ rang nhưng ti lệ chữa
trị khỏi sẽ giảm dẫn.
Việc chuân đoán ung thư tuyến tụy thường diễn ra khi các bệnh nhân tìm
đến bác sĩ với các triệu chứng đau bụng, ngứa vàng đa, sụt cân Qua thăm khám,bác sĩ sẽ yêu cầu bệnh nhân chụp CT (chụp cắt lớp vi tính) hoặc chụp MRI (chụp
cộng hưởng từ) hoặc siêu âm dé chuẩn đoán bệnh rõ hơn qua hình ảnh Việc
chuân đoán ung thư tuyến tụy qua hình ảnh là một khó khăn, thách thức lớn vớibác sĩ vì vị trí đặc biệt của tuyến tụy và kích thước rất nhỏ của nó (chỉ khoáng 80gram) trong ô bụng Thêm vào đó đây là một vẫn đề nhạy cảm vì nó liên quan
đến tính mạng của người bệnh, quá trình chuẩn đoán của các bác sĩ phải hết sức
kĩ càng Điều này khiến cho quá trình chuan đoán mắt rất nhiều thời gian, vì vậy
sức khỏe của bệnh nhân cũng bị ảnh hưởng trong thời gian chuẩn đoán bệnh (dokhối u càng ngày càng phát triển, xâm lắn đến các mô xung quanh) Việc cấp
Trang 12thiết là phải rút ngắn thời gian chuẩn đoán nhưng vẫn đảm bảo độ chính xác chophác đồ điều trị của các bệnh nhân.
Rút ngắn thời gian chuẩn đoán bệnh dựa vào hình ảnh đã được nghiên cứurất nhiều trong những năm gan đây trong cộng đồng AI Đặc biệt trong lĩnh vực
Deep Learning (một lĩnh vực nhỏ thuộc AI) đã nghiên cứu và có những thành tựu
đáng kê về van dé phát hiện ung thư biêu mô tuyến tụy (loại ung thư phô biến
nhất trong các dạng ung thư tuyến tụy) Những nghiên cứu này nhằm hỗ trợ các
bác sĩ chuẩn đoán khối u cho bệnh nhân một cách nhanh chóng Từ đó giúp bệnh
nhân chữa trị kịp thời, cải thiện và tăng tỉ lệ sông cho các bệnh nhân ung thư biểu
mô tuyến tụy
Cụ thé là Feng Jiang và cộng sự của ông ấy đề xuất mô hình DLU — Net[2] cho phân đoạn ung thư của tuyến tụy, kiến trúc này là sự kết hợp giữa môhình U — Net, các mô đun tích chập có thẻ biến dang và cấu trúc Bidirectional
Convolutional Long Short — Term Memory (BConvLSTM) Mô hình U — Net [3]
là một mô hình mang no — ron sau được sử dung đề phan đoạn anh Nó có cầu
trúc encoder — decoder với các lớp tích chập và lớp pooling được sử dụng dé thu
nhỏ kích thước anh dau vào, các lớp upsampling được sử dụng dé phục hồi kích
thước ảnh dau ra, kiến trúc này được chứng minh là rat hiệu quả trong việc phân
đoạn ảnh Các mô đun biến dạng và cầu trúc BConvLSTM là một kĩ thuật được
sử dụng dé kết hợp các đặc trưng ở các tang sâu của mạng nơ — ron, kỹ thuật nàyđược sử dụng dé giải quyết vẫn dé mat mát thông tin khi thông tin ở các tang sâu
bị mat đi do quá trình tích chập va pooling Điều này giúp cải thiện khả năngphân đoạn ảnh của mô hình và đưa ra kết quả chính xác hơn
Ziqiang Li và cộng sự của ông ay đã dé xuất mô hình PGD — UNet [4] cho
phân đoạn tuyến tụy và khối u tuyến, mô hình này kết hop hai kiến trúc chính là
U — Net và khả năng khai thác không gian biến đôi của tích chập dưới dạng biến
đổi hình học của tuyến tụy và khối u Mô hình PGD - UNet là một phương pháp
đảo tạo mạng nơ —ron dé giảm nhiều trong quá trình học, nhờ kha năng khai thácthông tin biến đôi không gian giữa tuyến tụy và khối u, mô hình bảo toàn được
thông tin vị trí các đặc trưng bị mắt trong quá trình tông hợp của lớp pooling,
¡0
Trang 13điều này làm tăng tính ồn định và đạt được kết quả tốt hơn trong quá trình phânđoạn Các tang của mô hình sẽ được thêm dan vào trong quá trình huan luyện vàđược huấn luyện giảm nhiễu trong ảnh đầu vào Mô hình PGD - UNet kết hợpkiến trúc U — Net với phương pháp khai thác thông tin biến đổi đã tạo ra một mô
hình phân đoạn chính xác và ôn định hơn, quá trình khai thác thông tin ở các tầng
tích chập giúp bảo toàn vị trí của các đặc trưng vả tăng tính ồn định cho mô hình,
trong khi đó kiến trúc U - Net giúp mô hình học được các đặc trưng cấp cao trongảnh và phân đoạn chính xác các vùng trong ảnh.
Wang Zhisheng và cộng sự của anh ấy đã áp dụng phương pháp Coarse to
Fine [5] dé phân đoạn khối u tuyến tụy, phương pháp này bao gồm hai giai đoạn
để giải quyết thách thức trong việc phân đoạn tế bao ung thư trong ảnh CT Giaiđoạn đầu tiên của phương pháp là giai đoạn phân đoạn toàn cục dựa trên mô hìnhmang CNN, mồ hình CNN được huấn luyện phân đoạn trên tập đữ liệu lớn, từ đóhọc được các đặc trưng của tế bảo ung thư tuyến tụy và phân loại chúng với các
vùng khác trong ảnh Sau đó, ảnh được chia thành những vùng nhỏ hơn cho giai
đoạn phân đoạn chi tiết, giai đoạn này sử dụng mô hình được cải tiền từ mô hình
U — Net dé phân đoạn tế bao ung thư tuyến tụy, tiếp theo so sánh với những đặc
trưng đã được học ở giai đoạn toàn cục, điều này làm cho mô hình phân đoạn
chính xác hơn các tế bảo ung thư
Các nghiên cứu trên sử đụng phép đo độ tương đồng — DSC đẻ đánh kếtquả của nghiên cứu, nó đo sự giống nhau giữa ảnh dự đoán của các mô hinh CNN
với nhãn thực tế của chúng Giá trị của DSC đao động từ 0 đến 1, với giá trị càng
gan | thì mức độ tương đông giữa hai ảnh càng cao và ngược lại Feng Jiang và
cộng sự của ông ay đề xuất mô hình DLU — Net cho phân đoạn ung thư của tuyến
tụy với kết quả DSC trung bình là 91.16% Ziqiang Li và cộng sự của ông ấy đã
dé xuất mô hình PGD - UNet cho phân đoạn tuyến tụy và khối u tuyến đã đạt
được kết quả DSC trung bình lần lượt là 77.01% và 50.12% Wang Zhisheng và
cộng sự của anh ấy đã áp dụng phương pháp Coarse to Fine dé phân đoạn khối u
tuyến tụy và đạt được kết quả DSC trung bình là 63.4%
II
Trang 14Mặc dù đạt được các thành tựu đáng kê trong việc phân đoạn ung thư biểu
mô tuyến tụy nhưng về độ chính xác cúa các nghiên cứu vẫn còn rat quan ngại
Do vị trí đặc biệt của tuyến tụy, kích thước nhỏ, thêm vào đó là khối u biểu môtuyến rất khó phát hiện nếu không có sự hỗ trợ của các bác sĩ, các chuyên gia vẻ
tuyền tụy cho quá trình chuẩn bị dữ liệu dé nghiên cứu Với thách thức đó, nghiên
cứu dé xuất cách trích xuất vùng đặc trưng dựa trên ý tướng của phương pháp
structured labeling [6] và áp dụng mô hình U - net cho phân đoạn khỗi u biéu mô
tuyến tụy nhằm cải thiện độ chính xác của các nghiên cứu trước đó Ý tưởng này
sử dụng kĩ thuật trích xuất vùng đặc trưng theo nhãn thật để giảm thiểu ảnh hưởngcủa các thông tin nhiễu trong ảnh, chỉ tập trung chủ yêu vào việc phân đoạn khối
u của biểu mô tuyến tụy
1.2 Mục tiêu của khóa luận
Khóa luận tập trung thực hiện phân đoạn khối u nhằm nâng cao hiệu suất
và cải thiện độ chính xác về giá trị DSC so với các nghiên cứu trước Cụ thê là
như sau:
i Nghién cứu các phương pháp tiếp cận vẻ trích xuất tuyến tụy — vùng chứa
khói u Từ đó dé xuất ý tưởng mới dựa vào phương pháp được chọn nhằm
loại bỏ thông tin nhiều trong quá trình học của mô hình CNN.
ii — Nghiên cứu mô hình U — net trong việc phân đoạn ảnh y khoa nhằm phân
đoạn khối u một cách tự động
Việc kiêm tra tính hiệu quả của mô hình CNN dé xuất, khóa luận sử dụngtập dữ liệu công khai của cuộc thi Medical Segmentation Decathlon (MSD), đây
là cuộc thi về phân đoạn ảnh y tế, được tô chức nhằm thúc day sự phát triên và
đánh giá các kĩ thuật phân đoạn hình ảnh y tế Cuộc thi đã đưa ra các thách thức khác nhau về phân đoạn ảnh y tế, bao gồm phân đoạn tế bao ung thư, phân đoạn mạch máu và phân đoạn não MSD đã thu hút sự tham gia của rất nhiều đội nhóm
từ khắp nơi trên thé giới, những người đã đóng góp đáng kẻ vào sự tiền bộ trong
lĩnh vực phân đoạn hình ảnh y tế Đề đánh giá chất lượng của phương pháp khóa
luận sứ dụng giá trị DSC dé đo sự tương đồng giữa anh dự đoán và nhăn thực tế,
12
Trang 151.4.
1.5.
Nội dung thực hiện
Nhằm thực hiện được mục tiêu đã nêu, khóa luận thực hiện các công đoạn
sau đây:
1 Tiên hành nghiên cứu các phương pháp trích xuất vùng quan tâm — những
vùng chứa thông tin cần thiết cho việc phân đoạn khối u.
ii Tìm hiểu về thực trạng của các nghiên cứu, đưa ra ưu điểm và mặt hạn
chế của các công trình nghiên cứu đã áp dụng trước đó.
ii Tim hiểu về mô hình U — Net, các phương pháp cải thiện mô hình U —
Net.
iv _ Xây dựng mô hình U — Net đã được cải tiễn cho bài toán phân đoạn khối
u biểu mô tuyển tụy, kết hợp với ý tưởng đẻ xuất dé cải thiện giá tri DSC
Vẻ mặt thực nghiệm, khóa luận dé xuất thực nghiệm va đánh giá mô hìnhtrên tập dữ liệu MSD Đưa ra các chỉ số đánh giá và đặc biệt là giá trị DSC trong
việc đánh giá khối u trên tập dữ liệu và so sánh giá trị DSC với các nghiên cứu
khác Dong thời chi ra mặt hạn chế trong quá trình nghiên cứu cần được khắc
phục, điều này sẽ được trình bày trong phan kết luận của chương 5.
Giới hạn của khóa luận
Trong phạm vi nghiên cứu, khóa luận chỉ tập trung nghiên cứu theohướng tự động phát hiện khỗi u biêu mô tuyến tụy Việc cập nhật trong quá trìnhhuấn luyện, khóa luận sứ dụng giá trị DSC, chưa sử dụng các phương pháp khác
dé tính độ tương đông giữa ảnh dự đoán và nhãn thực tế Khóa luận chỉ sử dụng
tập dữ liệu MSD cho quá trình huắn luyện và kiêm thử, không sử dụng thêm tập
dữ liệu khác.
Tóm tắt những đóng góp của khóa luận
Khóa luận có những đóng góp vẻ mặt khoa học và thực tiễn, chỉ tiết được
trình bày ở phan 1.5.1 và 1.5.2
13
Trang 161.5.1 Đóng góp về mặt khoa học
Khóa luận đã dé xuất phương pháp trích xuất vùng quan tâm đựa trên nhãn
thực của dir liệu trong tập dữ liệu MSD Cụ thé là khóa luận đưa ra phương pháp
đề xuất mới dựa vào nghiên cứu [6] đẻ tim ra cửa số chứa tuyến tụy, từ đó mở
rộng ra bon phía dé đảm bao vùng quan tâm chứa nhiều nhất các thông tin cần
thiết trong việc phân đoạn khối u biểu mô tuyến tụy
Khóa luận tinh chỉnh mô hình U - Net dé phù hợp cho quá trình đào tạo
nhằm tối ưu hóa số lượng tham số đầu vào của mô hình, Đồng thời giảm khối
lượng tính toán của mô hình xuống mức thấp nhất có thê trong quá trình đào tạo
Từ đó, tăng tính hội tụ của mô hình, giảm thời gian và số lần lặp trong quá trình
đảo tạo.
1.5.2 Đóng góp về mặt thực tiễn
Bên cạnh những đóng góp về mặt khoa học, khóa luận còn có những đónggóp vẻ mặt thực tiễn:
e Khoa luận đánh giá phương pháp đề xuất bằng cách thực nghiệm trên
tập dữ liệu tiêu chuẩn MSD
e Độ hội tụ va độ chính xác khi dp dụng trên bộ dit liệu MSD cho kết
quả đáng khích lệ kết quả của khóa luận cao hơn các bài báo kháctrong việc phân đoạn tự động khôi u biểu mô tuyến tụy trên cùng tập
dữ liệu MSD.
1.6 Tổ chức khóa luận
Đề đạt được mục tiêu trên, khóa luận được trình bày thành năm chương
có cầu trúc như sau:
e Chương 1: Giới thiệu
Trong chương nay, nghiên cứu trình bày về đề tài nghiên cứu củakhóa luận như mục tiêu, nội dung thực hiện, các đóng góp về mặt
khoa học và thực tiễn.
° Chương 2: Các nghiên cứu ung thư biéu mô tuyến tụy
14
Trang 17Trong chương này, khóa luận trình bày vẻ các nghiên cứu liên quanđến van dé nhận điện khối u biểu mô tuyến tụy một cách tự động,những phương pháp tiếp cận dé trích xuất tuyến tụy cho mô hình
đảo tạo và giá trị DSC trong việc đánh giá mô hình của quá trình
đào tạo Các nghiên cứu liên quan bao gồm các mô hình như: DLU
— Net và PGD — UNet.
© Chương 3: Phân đoạn khối u biểu mô tuyến tụy dựa trên phương
pháp dé xuất
Trong chương này, khóa luận trình bày về cơ sở lý thuyết và
phương pháp đẻ xuất được xây dựng dựa trên nghiên cứu của tácgiả Quannan Li và cộng sự của ông Trinh bày về mô hình U - Net
được cải tiền dé đảo tạo dữ liệu và giá trị DSC đề đánh giá mô hình
trong quá trình đào tạo.
»« Chương 4: Kết quả thực nghiệm
Trong chương này, khóa luận trình bày các bước tiền hành cũng
như thực nghiệm trên bộ dữ liệu MSD Sau đó đưa ra đánh giá và
so sánh với các nghiên cứu khác dé làm rõ kết quả của phương pháp
Trang 18Chương 2 Các nghiên cứu ung thư biểu mô tuyến tụy
2.1 Tông quan các mô hình phân đoạn ảnh
Trong những năm gần đây, các thuật toán phân đoạn hình ảnh y tế dựatrên Deep Learning liên tục phát triên Cụ thé là Fully Convolutionnal neuralnetwork [7] (FCN) là một trong những mạng than kinh đầu tiên được dé xuất đẻ
phân đoạn hình ảnh FCN có khả năng xử lý ảnh đầu vào có kích thước khác
nhau mà không cần phải thực hiện các bước xử lý trước như phân đoạn ảnh
thành các phần nhỏ hơn Mô hình FCN thay vì sử dụng các lớp fully connected
như trong các mạng nơ — ron truyền thông thì nó chi sử dụng các lớp
convolutional và transposed convolutional đẻ trích xuất đặc trưng và tạo kích
thước đầu ra cho ảnh Điều này giúp ECN giữ được thông tin không gian của
hình ảnh trong quá trình xử lý và cho phép đầu ra có kích thước tùy ý.
Lớp Transposed convolutional _~ ⁄ Anh
phan
x đoạn
Các lớp tích chập Hình 2.1- Mô hình mạng Fully convolutional neural network [7]
Mô hình FCN bao gồm các lớp tích chập và transposed convolutional,
trong lớp tích chập chứa hàm kích hoạt được gọi là activation Các lớp tích chap
được sử dụng để trích xuất các đặc trưng của ánh đầu vào sau đó qua hàm
activation dé kích hoạt các giá trị trong ma trận đầu ra, transposed convolutional
là lớp có chức năng phục hoi kích thước của ảnh dau ra Điều nay làm cho mô
hình FCN có cau trúc dang encoder - decoder, các lớp tích chập đại diện chophan encoder, lớp transposed convolutional đại điện cho phan decoder M6 hìnhFCN được ứng dụng phô biến trong các bài toán phân đoạn ảnh đơn giản nơi
16
Trang 19mô hình được huắn luyện đề phân đoạn từng pixel trong ảnh đầu vào thuộc về
lớp nào Với FCN, việc phan đoạn ảnh trở nên hiệu quả va đơn giản hon vi nó
có khả năng xử lý các ảnh đầu vào có kích thước khác nhau và cho ra kết quảvới kích thước tương ứng Mặc dù mô hình FCN có nhiều ưu điểm nhưng nó
cũng ton tại một số nhược điểm như:
e© Ton tài nguyên tính toán và thời gian: FCN có nhiều lớp
convolutional và transposed convolutional điều này dẫn đến tốn
tài nguyên và mat thời gian tinh toán của hệ thông Đề giảm thiểuvan dé này các kiến trúc mạng khác như U — Net, SegNet và Mask
R —CNN đã được phát triển để sử dung tài nguyên tính toán hiệu
quả hơn.
©_ Không giữ được thông tin vẻ cau trúc không gian: FCN chỉ xử lý
ảnh theo cách giống như chúng là một tập hợp các pixel độc lập.
Đôi với những hình ánh phức tap, đặc biệt là ảnh y khoa có cấu
trúc không gian thì mô hình không thé phan biệt được, nó không
có thông tin về cầu trúc không gian của ảnh như là việc xác địnhmỗi quan hệ giữa các pixel và vị trí của chúng trên ảnh Dé khắcphục van dé này, các kiến trúc mạng sau đó đã tích hợp thêm các
mô — đun biến đôi không gian dé lưu giữ các vị trí trong không
gian ảnh, từ đó cải thiện khả năng phân đoạn, giúp bài toán phân đoạn trở nên chính xác hơn.
Với vấn dé tốn tài nguyên tính toán và thời gian của mô hình FCN, cácnhà nghiên cứu Ronneberger, Olaf, Philipp Fischer và Thomas Brox tiếp tục cải
thiện mạng nơ — ron FCN và đề xuất mang nơ —ron U — Net Đây là mô hình
mạng học sâu được sứ dụng phô biến trong các bài toán xử lý ảnh y khoa, đặc
biệt là trong việc phân đoạn ảnh y tế Mô hình được đặt tên theo hình dạng của
nó vì có cấu trúc giống như chữ U với hai phần chính là encoder va decoder.
Phan encoder có có chức nang trích xuất các đặc trưng của hình ảnh, cau tao của
phan này bao gồm 4 tầng học sâu, mỗi tầng được cấu tạo từ hai lớp tích chập và
theo sau là một lớp pooling Các lớp tích chập có chức năng làm nôi bật và trích
17
Trang 20xuất các đặc trưng của hình ảnh lớp pooling có chức năng trích xuất các đặc
trưng nồi bật nhất trong hình ảnh đó Phần decoder được sử đụng đẻ khôi phục
lại ảnh gốc từ các đặc trưng đã được trích xuất, phần này có cấu tạo gồm 4 tầng.
mỗi tầng gồm một lớp up — convolutional (transposed convolutional) và theo
sau đó là hai lớp tích chập Lớp transposed convolutional được sử dụng đề tăng
kích thước của các đặc trưng ở phần encoder trước đó lên gấp đôi, sau đó hai
lớp tích chập sẽ trích xuất các đặc trưng mới này dé mô hình học được dit liệu
mới từ các đặc trưng nôi bật nhất của hình ảnh Cầu trúc đầy đủ của mô hình U
— Net được thé hiện ở hình sau:
Anh sau khi
„# phân đoạn
kì " ~cor+ 3x2, ReLU
s 8 " ¬ = copy and crop
i-i-l — Benen # max pool 2x2
5 “đệ tox + : 4 up-conv 2x2
be ne a = conv 1x1
Hinh 2.2- M6 hinh U — Net [3]
Ở hình 2.2 ta thay mô hình U — Net còn sử dung kỹ thuật skip connection
(được thé hiện với mũi tên màu xám — copy and crop) dé kết nối các tầng tích
chập của phan encoder và decoder Kỹ thuật này giúp mô hình sử dụng các đặc
trưng của phan encoder bỏ sung vào các đặc trưng của lớp transposed
convolutional, sau đó các tích chập của phan decoder sẽ học được các thông tin
chính xác hơn, tránh việc bị mat mat thông tin qua nhiều sau mỗi tầng học sâu.
Việc sử dụng kỹ thuật skip connection kết hợp với lớp transposed convolutional
giúp cho mô hình phân đoạn chính xác hơn, đặc biệt là trong phần đoạn ảnh y
18
Trang 21tế Mô hình U - Net đã giải quyết về van dé tài nguyên tính toán và thời gian
của mô hình FCN, chính kỹ thuật skip connection giữa các lớp trong quá trình
encoder và decoder giúp cho thông tin về đặc trưng được giữ nguyên làm độ
phân giải hình ảnh ở mồ hình U — Net cao hơn so với FCN Từ đó mô hình có
thé phân đoạn chính xác các đôi tượng nhỏ và phức tạp như là ảnh y khoa, đồng
thời giảm khối lượng tính toán và thời gian đẻ xử lý các đối tượng ảnh
Các mô hình CNN phân đoạn ảnh y khoa được dé xuất sau này về cơ bản
đều dựa trên kiến trúc mạng U — Net va độ chính xác phân đoạn của chúng cũng
được cải thiện trong từng bài toán cụ thể Mặc đù mô hình U — Net làm rất tốt
trong việc phân đoạn hình ảnh y khoa nhưng với những đổi tượng có nhiêu hìnhdạng, kích thước nhỏ trong ánh y khoa cũng là một van đề lớn ảnh hướng đếnviệc phân đoạn các đối tượng Đặc biệt là tuyên tụy và khôi u biểu mô tuyén làcác đối tượng có đa dạng kích thước và vị trí trong ảnh y khoa, khiến cho việc
phân đoạn trở nên khó khan, không đảm bảo tính chính xác Zhou Yuyin và đồng
nghiệp của ông ấy đã dé xuất mạng nơ — ron Hyper — Pairing Network (HPN)(8] mang này sử dụng các tầng tích chập 3D dé tích hợp thông tin đa giai đoạn
và tôi ưu hóa độ chính xác của mang trong việc phan đoạn khối tuyến tụy trêncác ảnh có cau trúc 3D Tuy nhiên mô hình này không thé trích xuất chính xác
các đặc trưng biên dạng khi phân đoạn các tôn thương ung thư tuyến tụy với
những thay đôi lớn vẻ hình dạng Điều này liên quan đến cấu trúc không gian
giữa các pixel, từ đây việc xác định mỗi liên hệ giữa các pixel và vị trí của chúng
trên ảnh đôi với các cơ quan có cau trúc phức tap trong cơ thẻ là điều rất quan
trọng trong quá trình phân đoạn hình ảnh.
Trong lĩnh vực phân đoạn ánh y khoa đặc biệt là phân đoạn ung thư biểu
mô tuyến tụy, có những kiến trúc mạng được dé xuất như mô hình DLU - Net,
PGD - Unet hay phương pháp Coarse to Fine, Các mô hình vả phương pháp này
khắc phục được vẫn đề về những thay đôi lớn của hình dạng các đối tượng trong
quá trình phân đoạn chúng xác định được cầu trúc và mối liên hệ giữa các pixel,
từ đó làm cho quá trình phân đoạn chính xác và hiệu quả hơn Ngoài những mô
hình DLU — Net, PGD — UNet và phương pháp Coarse to Fine còn có nhiều
19
Trang 22nghiên cứu khác dang tiếp tục được thực hiện đê tìm ra những kiến trúc mạng
mới và cải thiện kết qua phân đoạn trong lĩnh vực anh y khoa Nhưng các môhình và phương pháp này vẫn nôi bật hơn cả trong giai đoạn hiện tại về vẫn đềphân đoạn ung thư tuyến tụy, ta cùng tìm hiểu về các mô hình và phương pháp
phân đoạn này ở bên dưới.
2.2 Các mô hình phân đoạn ung thư biểu mô tuyến tụy
2.2.1 Mô hình DLU - Net trong phân đoạn khối u biểu mô tuyến tụy
Xuất phát từ van dé của tuyến tụy — đó là kích thước tương đôi nhỏ và đa
dạng Do vậy các mạng lưới phân đoạn trước đó không thẻ trích xuất chính xác
các đặc điểm biến dang của khối u khi phân đoạn các tôn thương ung thư biéu
mô tuyến tụy Dựa vào điều này Feng Jiang và cộng sự của ông ấy dé xuất mô
hình DLU — Net sử dung các lớp tích chập có thé thay đôi hình dạng dé mô hình
hóa đối tượng có sự biến đôi hình dạng không xác định Cau trúc của mô hình
DLU - Net được thê hiện trong hình sau:
Hình 2.3- Kiến trúc DLU — Net [2]
Kiến trúc của mô hình DLU — Net bao gồm quá trình encoder và decoder,
mỗi quá trình đều có bốn bước xử lý Mỗi bước ở quá trình encoder bao gồm hai
lớp tích chập kết hợp với lớp Batch Normalization (BN) và hàm kích hoạtRectified Linear Unit (Relu) dé giảm hiện tượng vanishing gradient từ đó cải
thiện tốc độ huấn luyện của mạng nơ - ron, sau đó bản đồ đặc trưng được chuyển
20
Trang 23sang lớp tiếp theo thông qua một lớp pooling Dé bù đắp cho thiếu sót về việchọc các đặc trưng do giảm sâu ở từng ting của mạng nơ - ron, một mạng tích
chập densely connected được thêm vào lớp cuỗi cùng cho quá trình mã hóa
Trong quá trình decoder ông và cộng sự của mình đã sử dụng cầu trúc
BConvLSTM đề kết hợp các bản dé đặc trưng khác nhau Cau trúc này có tác
dụng xứ lý các thông tin không gian và thời gian trong quá trình phan đoạn hình
ảnh Bang cách sử dụng BConvLSTM, mô hình DLU - Net có thé đem lại kết
quả phân đoạn chính xác hơn so với việc đơn giản là nỗi các đặc trưng ở phan
encođer sang phần decođer trong mạng U — Net truyền thông Thực chất môhình DLU — Net được cải tién từ mô hình U — Net bang cách thêm các mô — dunbiến đổi không gian kết hợp với cau trúc BConvLSTM, điều này đã giải quyết
được van dé biến đôi không gian ma các mô hình trước đây chưa làm được
Quá trình decoder có bản đồ đặc trưng của mỗi lớp được tạo thành từ haiphan: một phan là từ bản đỗ đặc trưng của quá trình encoder và một phan từ bản
đồ đặc trưng tương ứng của phan decoder hiện tại Thay vì đơn gián ghép haiphan lại với nhau như trong mạng U ~ Net truyền thống thì DLU ~ Net sử dụng
cau trúc BConvLSTM dé kết hợp hai bán đồ đặc trưng này lại với nhau, tạo ra
kết quả phân đoạn chính xác hơn Qua thực nghiệm trên tập dữ liệu MSD, mô
hình DLU — Net cho kết quả phân đoạn khối u biểu mô tuyến rất tốt so với các
mô hình cô điển trước đó với giá trị DSC trung bình là 91.16%
2.2.2 Mô hình PGD — UNet trong phân đoạn khối u biểu mô tuyến tụy
Do bản chat của tuyến tụy và khối u biêu mô tuyến về hình dạng và kích
thước không đều, đặc biệt là khối u do tính xâm lắn của nó đến các mô tuyển
tụy, điều này dẫn đến khối u có nhiều các biến thé về hình dạng Trong hau hết
các trường hợp, khôi u sẽ chồng chéo lên tuyến tụy, điều này gây trở ngại cho
việc phân đoạn chính xác tuyến tụy và khối u cùng một lúc Sự biến đôi kích
thước của khối u giữa các bệnh nhân trong từng giai đoạn ung thư khiến cho
việc gin nhãn của các chuyên gia y tế về tuyển tụy cũng gặp rat nhiều khó khăn
21
Trang 24Cuối cùng là sự mat cân bằng giữa các cơ quan nội tạng trong anh CT cũng gây
khó khăn trong việc phân đoạn ung thư biểu mô tuyến tụy.
Để giải quyết các thách thức nói trên, đặc biệt là van dé biến dạng của
tuyến tụy và khối u trong ảnh CT một số kiến trac mang CNN đã được cải tiênbang cách tích hợp vào các lớp tích chập biến dạng làm cho mô hình có thê định
hình được các biến thé của khối u, điều này làm cho mô hình phân đoạn trở lên
chính xác hơn J.Dai và cộng sự của ông [9] lần đầu tiên giới thiệu tinh năng của
lớp tích chập có thể biến dang, bằng cách thêm các offset bd sung vào vị trí lay
mẫu lưới thông thường của các nhân tích chập điều này làm cho mô hình có khả
năng mô hình hóa các biến đổi hình học của những đặc trưng trong mang CNN
Mặc dù mô hình hóa biến đôi hình học được cải thiện nhưng vẫn còn một số van
dé tồn đọng trong lớp tích chập biến dạng Trước tiên, lớp tích chập biến dang
đòi hỏi vị trí thông tin chính xác dé tính toán offset, điều này xung đột với tích
vô hướng của CNN Mặt khác, các offsetđược học từ các bản đỗ đặc trưng trước
đó, khó có thé đảm bảo rằng các offset phù hợp được học với cùng một vùng
tiếp nhận Dé khắc phục nhược điểm này Ziqiang Li và cộng sự của ông đã đề
xuất mô hình PGD — UNet đề cải thiện sự biến dạng của cấu trúc giải phẫu, đặc
biệt là các cơ quan trong cơ thé và khôi u
ae Atreuy Spatial Pyramid Pooling 8 “In
Hình 2.4- Mô hình PGD — UNet [4]
22
Trang 25Theo hình 2.4 ta thấy mô hình lay kiến trúc U — Net làm xương sống, kếthợp với các lớp tích chập biến dang và các lớp CoordPool (lớp đường dẫn định
vị phụ trợ) CoordConv, các lớp tích chập và lớp Atrous Spatial Pyramid Pooling
(ASPP) Lớp tích chập có tính năng học các đặc trưng của hình ảnh, lớp
Deformable Convolution sử dụng các offset dé cải thiện khả năng mô hình hóa
các biên đồi hình học, lớp CoordPool có chức năng đưa ra thông tin về vị trí cụ
thé của các đối tượng ảnh dé hỗ trợ cho lớp Deformable Convolution, lớp
CoordConv sử dụng thông tin về vị trí của các điểm ảnh để cải thiện khả năng
định vị của các đối tượng lộ) tầng cuối cùng của mô hình là lớp ASPP được sử
dụng đề giảm bớt số lượng tham số cho mô hình, giảm chỉ phí tính toán và giúp
tăng tốc độ huan luyện của mô hình, đồng thời lớp này còn được sử dụng dé
trích xuất các đặc trưng ở nhiêu ti lệ khác nhau Nhờ kiến trúc đặc biệt của môhình mà quá trình phân đoạn tuyến tụy và khối u trở nên chính xác hơn, kết quảthực nghiệm trên tập dữ liệu MSD cho thấy giá trị DSC trung bình của tuyến tụy
và khối u biêu mô tuyến lần lượt là 77.01% và 50.12%.
2.2.3 Kết luận.
Mô hình DLU — Net và PGD — UNet đều sử dung các lớp tích chập biến
dạng đề khắc phục vấn dé biến đôi hình học của các đối tượng rất tốt, đặc biệt
là khôi u Mặc dù mỗi mô hình đều sử dụng các phương pháp tiếp cận khác nhau
nhưng nhìn chung thì vẫn đề cần giải quyết trong bài toán phân đoạn này bao
gồm hai yếu tố, yếu tố thứ nhất là giải quyết van đề hình học bằng các lớp tích
chập biến di, yếu tố thứ hai là cai thiện độ chính xác và ôn định hơn trong quá
trình phan đoạn so với các mô hình CNN khác Nhưng giá trị DSC trung bình
của cả hai mô hình vẫn còn hạn chế, do vậy khóa luận đề xuất một phương pháp
mới và mô hình U — Net được cải tiễn ở chương 3 nhằm tăng giá tri DSC trong
quá trình thực nghiệm Khóa luận sử dụng tập đữ liệu MSID dé đánh giá và so
sánh kết quả với hai mô hình DLU — Net, PGD — Unet trong chương 4.
23
Trang 26Chương 3 Phân đoạn khối u biéu mô tuyến tụy dựa trên phương pháp đề xuất
3.1 Cơ sở lý thuyết
Trong chương này, khóa luận trình bày về phương pháp tạo ảnh CT dé
người đọc có thê hiểu rõ được cau tạo của nó Sau đó khóa luận trình bay về
phương pháp tiếp cận và đưa ra phương pháp đẻ xuất đẻ thực hiện phân đoạn ung thư biểu mô tuyến tụy Cuỗi cùng khóa luận trình bày vẻ mô hình U - Net được
cải tiên cho quá trình phân đoạn khôi u biêu mô tuyển.
3.1.1 Ảnh CT
Anh CT là một công nghệ hình ảnh y tế được sử dụng đẻ tạo ra hình
ảnh chỉ tiết về các bộ phận bên trong cơ thé con người hoặc động vật bằngcách sử dung các tia X Anh CT được tao ra bằng máy chụp CT, nó có thẻquay quanh cơ thể người hoặc động vật dé tạo ra nhiều hình ảnh từ các góckhác nhau Sau đó các anh này được đưa qua máy tính xử lý, quá trình xử
lý sẽ áp dụng các thuật toán phức tạp đê ghép các ảnh này lại với nhauthành một ảnh 3D của các cơ quan và bộ phận bên trong cơ thẻ Sau khitạo ra các anh CT, các chuyên gia y tế sẽ phân tích và chuân đoán các bệnh
lý của bệnh nhan dựa trên những hình ảnh này Việc tạo anh CT là một quá trình nhanh chóng và không gây đau đớn cho bệnh nhân Tuy nhiên vì nó
sử dụng tia X nên cũng gây ra rủi ro cho các bệnh nhân.
Hình 3.1- Quá trình tạo ảnh CT
24