LOI CAM DOANKhóa luận “Ung dụng phương pháp học chuyển giao vào chan đoán bệnh ung thư phối" là công trình nghiên cứu của tôi, được thực hiện dưới sự hướng dan chuyên nghiệp của Thạc si
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM TPHCM
KHOA CÔNG NGHỆ THONG TIN
TP HO CHI MINH
UNG DUNG PHUONG PHAP HOC CHUYEN GIAO
VAO CHAN DOAN BENH UNG THU PHOI
KHOA LUAN TOT NGHIEP
THÀNH PHO HO CHÍ MINH - NAM 2024
Trang 2TRUONG DAI HOC SƯ PHAM TPHCM
KHOA CONG NGHE THONG TIN
ER Sp
TP HO CHÍ MINH
UNG DỤNG PHƯƠNG PHAP HỌC CHUYEN GIAO
VAO CHAN DOAN BENH UNG THU PHOI
CHUYEN NGHANH: KHOA HOC MAY TINH
KHOA LUAN TOT NGHIEP
NGƯỜI HUONG DAN KHOA HOC: THS TRINH HUY HOANG
THÀNH PHO HO CHÍ MINH — NAM 2024
Trang 3LOI CAM DOAN
Khóa luận “Ung dụng phương pháp học chuyển giao vào chan đoán bệnh
ung thư phối" là công trình nghiên cứu của tôi, được thực hiện dưới sự hướng dan
chuyên nghiệp của Thạc si Trịnh Huy Hoàng Moi kết qua và quan điểm được trình bày
trong khóa luận là kết quả của quá trình nghiên cứu nghiêm túc, chân thật và không chứa bat kỳ nội dung sao chép từ các nguồn thông tin khác mà không ghi rõ trong phan tai
liệu tham khảo.
Tôi xin chịu trách nhiệm về lời cam đoan nảy.
Thành phố Hỗ Chi Minh, ngày 5 thang 4 năm 2024
Trang 4bước trong tương lai.
Không thé không kẻ đến sự ủng hộ từ gia đình, bạn bè, và người thân trong suốt
thời gian học tập vả nghiên cứu Cam ơn vì sự động viên va ủng hộ của mọi người là
động lực to lớn giúp tôi hoàn thành khóa luận tốt nghiệp nay.
Mặc dù đã cô găng hết sức trong việc nghiên cứu va viết khóa luận Tuy nhiên,tôi biết rằng khóa luận của tôi vẫn còn tồn tại những thiếu sót Tôi mong nhận được sự
thông cảm và góp ý xây dựng từ quý thay cô và toàn thé các bạn dé hoàn thiện hơn nữa
công trình nghiên cứu này.
Thành pho Hồ Chí Minh, ngày 5 tháng 4 năm 2024
Trang 5MỤC LỤC
LỜI CAM ĐOAN 1
LOI CẢM ON 2
MUC LUC 3
DANH MUC KY HIEU VA CHU VIET TAT 6
DANH MUC BANG BIEU 7
DANH MUC HINH VE 8
MO DAU 10
LY do Chom G6 tai NGG IIdẳẮẶẶ 10
Mục HÊ0ingHiển CUD, cis sscssseessncssesssessensnsnscscancnasseanesasionsesnensscsseassscssnssncasie 10
Đối tượng và phạm vi nghiên cứu -.2-©2¿7222S+SE2SE2cS22722zxcrrerrecxe, 10
Phương pháp nghiên cứu 2 2 1H21 212 HH du li
Cấu trúc của khóa luận -2 22222+t2SEEZSEEZ2EEEZEEEZcEEEeeEzerrrsrrrsrrrrved 12
CHUONG 1 TONG QUAN TINH HÌNH NGHIÊN CỨU 13
MD," Gssae yea BA 5 ceca sec acs cc asscsssczsssaezssczsscocsescesecvasecasscsascasocaesszesstousseseccts 13
1.2 Các phương pháp áp dụng cho bài toán Sccc<ssersxe 13
1.2.1 Học máy (Machine learning) óc si sie 13
1.2.2 Học sâu (Deep leaming) : :c-ccociisiisoioeiisssoeoio 14
l5 (Cá4cb@9dữiHfntiilifillassssnaoannonrnanniraan-ờnaaaiman 15
1.3.1 Bộ dữ liệu hình anh mô bệnh học ung thư phôi và đại tràng (Lung
and Colon Cancer Histopathological Image Dataset) (LC25000) 15
1.3.2 Bộ dữ liệu CT va PET/CT quy mô lớn cho việc chân đoán ung thư
phôi (A Large-Scale CT and PET/CT Dataset for Lung Cancer Diagnosis)
(Lung-PET-CT-Dx) 15
Trang 61.3.3 The Lung Image Database Consortium and Image Database
Resource Initiative (LIDC-IDRI) - - 522011 1131 1 311 2112 11 sk, 17
1.3.4 Phân tích hạch phối 16 (Lung Nodule Analysis 16) (LUNA 16)1§
CHƯƠNG2 CƠ SỞ LÝ THUYET 20
2.1 Các phương pháp chân đoán hình anh y khoa truyền thống: 20
ZAM, ‘CHP X=đQUaHEHEV¡ossiaianiiioioiiiiotiiiitiati41128111211ã5611033ã6ã58ã3806 20
PW De, (CHUN CHHEUD¿ :2(4:20021/012020122022120220221132121212222121240321402101330220132034 20
201,3 ChyipiPEV ICD siisssssssssssccssssssssssssssiseasssssssacssssisaraessaveavsssavoasscesoracie 20
2.1.4 Chụp cộng hưởng từ (MRÌ]) -SehHhaue 20
2.2 Mang thần kinh (Neural NeIVOIEÌ - - 21
2.3 Perceptron đa lớp (Multi Layer Perceptron) (MLP) 23
2.4 Mạng thần kinh tích chập (Convolutional neural networks) 24
II, ee Mee N7 na na Gõ nẽẳỶ“ 24
DAD HồnIKRGHINBBÙ;zaisiiiisiiaiiiaiiiiiiiinitiiitsiibiiii2002110920i020004i06.ả.6236) 27
2.4.3 Các tham số của bộ lọc 2- ccsskeeseeeeeeesresres-.- dO)
2.5 Học chuyền giao (Transfer learning) các án se 33
SS Định BGHÌÏ4:::ssssaansaioenonrinenoliniiiiaiiiaotiiatseastrasosanssagneasnn 33
2.5.2 Phân loại học tập chuyên giao ccaanreese 34
2.5.3 Các thành phan có thé chuyên giao: -2-25s55ccccsee 34 2.5.4 Hạn chế chuyền giao tiêu cực (negative transfer) 35 2.5.5 Học chuyên giao trong học sâu ¿ -+-©s++cssccszee 38
2.5.6 Học chuyền giao sâu (Deep transfer learning) 39
2.5.7 Các biến thé học chuyển giao sâu - 6-52 2 cccscssecsec 4]
2.5.8 Triển khai học chuyên giao: 0 cccecsesssessseesseeseeeseesseesseeeeees 43
Z!0 Những môiliinhiBoeSãDn::o:iccnooinoigiiiiattiiiaiigiiniinsauaadi 44
Trang 7CHUONG 3 UNG DUNG PHƯƠNG PHAP HỌC CHUYEN GIAO VÀO
CHAN DOAN UNG THU PHOI 51
3.1 GiGi thigu phương Phapiccsscrssesssscssesssossisssssesssosssessscsssossersessessessasease 51
3.2 Triển khai phương phap 0 -.0.-cecceeccsssessecsseceesseeeveesesseeseeeeeeneee 51
3.2.1 Xử lý đữ liệu -.ccccccseereeceersrrrsrareo.ST
3.2.2 Hàm mat mát 2222©C2z+ECxtrrxrerxrrxrercreecrrecrk 53
F253; Kay Gung môIBÌHB::::::::::ccoccooccbonisiiisriretiirsiiissgissiisagiasgienii 53
CHUONG 4 THỰC NGHIEM VA ĐÁNH GIÁ 56
4.1 Môi trường huấn luyện và thực nghiệm .2- 22-52-52 56
4.2 Phuong pháp đánh giá Ăn HH hy 56
4.2.1 Độ chính xác(Accuracy) ::-::: :::-::<-(-coccoieiiiioiioroeaooaoo 56
4.2.2 Ïl-SCOF€ Lo Sen nhai ¬ 56
BIB hố ẽ ẽẽẽ 57 KET LUẬN VA HƯỚNG PHÁP TRIEN 60
HC TH HH8 7õ nan nan aoanananenal 60
TA nh ” - 60
TAI LIEU THAM KHẢO 61
1 Tiếng ViỆt 22222222222 22222.22.EE.EE.cccee 61
2 Tiếng Anh cu ch nh ng nàn ng ấu 6]
Trang 8DANH MỤC KÝ HIỆU VÀ CHU VIET TAT
Local Binary Pattern Lung Nodule Analysis 16
The Lung Image Database Consortium
Magnetic Resonance Imaging Neural Architecture Search Network Mobile Neural Networks
Positron Emission Tomography Residual Network
Support Vector Machine Visual Geometry Group
Trang 9DANH MỤC BANG BIEU
Bang 2-1 Triển khai học chuyên giao - 2565 2S 2sp2srrrcrrrsrreerecs 43
Bảng 4-1 So sánh kết quả của phương án dé xuất với các mô hình khác 38
Trang 10DANH MỤC HÌNH VE
Hình 1-1 Bộ dữ liệu Lung-PET-CT-Dx [ IÖ] .- 555 Sc2<x+z<vszesvzex l6
Hình 1-2 Bộ dữ liệu LIDC-IDRI [ 16] - <5 6< 133223 xxx 18
Hình 1-3 Bộ dt Lee BUNA: 167) sssisssssasscassssasssasssasssasssasssassssasssssssasssaassasisaaseas 19
Hình 2-1 Giải phẫu một nơ-ron [2] ccccccccsscssscesssessessesssesesseesseesssesreensevcsseasteessees 21
Hình 2-2 Minh hoa quá trình tính toán của một nơ-ron - - c-<ss-<- 22 Hiñh.2z3Perceptron da lop [20 i¿sssiosnaiiiasiaiooaiiiooiiiiiiitiisiiiasii36165141211231ã181ảãä6 23
Hình 2-4 Kiến trúc của CNN [ 1] -<-zcccsee+seeczescczxecrzeccccee 24 Hình 2-5 Biểu diễn hình anh đầu vào và bộ lọc dưới dang ma trận 25
Hình 2-6 Cách thức hoạt động của phép tích chập [ I] ‹.-<- 25
Hình 2-7 Gộp cực đại và gộp trung bình s5 ĂSSseieeerrersrerrrrree 26
Hinh 2-8 Lop Ket ni day GU 1n 114 27Hình 2-9 Đồ thị của ham Sigmoid 0 0ccsessseessseeeseeeseesceeesseeesseessecsseeenses 28Hình 2-10 Đồ thị của hàm Tanh - 2-5211 2112518251155 111 2117217250121 1y 29Hình 2-ii Đồi cũa hàm REE cscs ccssssusssswsnscosnssssssssncssscasssssvscoisssnssasssnnne’ 29
Hình 2-12 Bước trượt đơn với bộ lọc 33 .c cc-cccseceseesees-er-Ð Í
Hình 2-13 Bướt trượt lớn với bước trượt bằng 2 và bộ lọc 33 - 31
Hình 2-14 Padding "Zero" với kích thước Í - <5 s+cs<cse<ereeeerex 32
Hình 2-15 Học quy nạp (Inductive learning) và chuyền giao quy nạp (Inductive
Hình 2-23 Cau hình của GoogleNet [19] - -2-©2seSsseSxeecrxecrreee 48
Trang 11Hình 2-24 Residual Block of ResÌNet .- - Q57 G5 49
Hình 2-25 Kiến trúc của D-net P15) s.ccssesssscssscssccsssassoossacsinessssassscasscossasssassansnses 50
Hình 3-1 Ung thư biéu mô phôi (Lung _aca) - 2222222 22s22scczeczccczerree 52
Hình 3-2 Mô phỏi lành tính (Lung_n) 022202220232 2221122212222) 52 Hình 3-3 Ung thư biểu mô tế bảo vảy phôi (Lung_sec) 2-52 52
Hình 3-4 Số lượng ảnh theo mỗi lớp của tập huấn luyện, kiếm thử, kiểm tra 53Hình 3-5 Mô hình học chuyên giao dé phân loại ung thử phôi dựa trên GoogLeNet
388S:8553554i15888i888855438858353554355861584355555 285333853:5555883888555388853838343388638495551585538ã584 53
Hình 3-6 Đồ thị của hâm RTI ss csssasssssssscsssaassansscssuossecrsssnssssasessssanssaosssssssnsses 54
Hình 4-1 Độ lỗi trong quá trình huấn luyện vả xác thực . - 57
Hình 4-2 Độ chính xác trong quá trình huấn luyện và xác thực 57
Hình 4-3 Ma trận nhằm [a0 o.oo cee cceeccescseescssesececssecesecsseeessveseecesesveveseceseeeeees 58
Trang 12MỞ DAU
Lý do chọn đề tài
Ung thư phôi là một trong những căn bệnh ung thư phô biến nhất và có tỷ lệ tử
vong cao nhất trên thế giới, gây ra gánh nặng lớn cho ngành y tế Ở Việt Nam, ung thưphôi đứng thứ hai về tỉ lệ mắc phải ở cả hai giới tính Do đó, việc chân đoán sớm bệnh
ung thư phổi đóng vai trò quan trọng trong việc cải thiện tỷ lệ sống sót và chất lượng
cuộc sông của bệnh nhân
Tuy nhiên, việc chân đoán hình ảnh y tế thủ công gặp phải rất nhiều hạn chế như chi phí cao, thời gian chờ dài, thiếu bác sĩ chân đoán hình anh, Do đó, việc áp dụng công nghệ học máy chuyên giao vảo quá trình chân đoản bệnh ung thư phôi là hết sức
cần thiết giúp giảm chỉ phí chân đoán, rút ngắn thời gian chờ kết quả
Vì lý do như trên, dé tài này đã được lựa chọn nhằm nghiên cứu một giải phápchan đoán ung thư phổi bằng áp dụng hoc máy chuyên giao dựa trên mô hình
GoogLeNet Mục tiêu của khóa luận nảy là đưa ra kết quả có thé hỗ trợ bác sĩ chân đoán
ung thư phôi chính xác hơn, từ đó cải thiện quá trình điều trị cho bệnh nhân
Mục tiêu nghiên cứu
Xây dựng một mô hình chân đoán ung thư phôi dựa trên việc điều chỉnh mô hình
GoogLeNet dé có thé phù hợp với bộ dit liệu.
So sánh hiệu quá của mô hình đã sửa đôi với các mô hình khác.
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu
Trong đề tai này, đối tượng nghiên cứu là mạng thân kinh sâu dựa trên việc học
chuyên giao được ứng dụng dé chan đoán ung thư phôi.
Cụ thé, mô hình được xây dựng dựa trên kiến trúc GoogLeNct.
Phạm vi nghiên cứu
10
Trang 13Trong đề tài này, tôi tập trung nghiên cứu vào việc sửa đổi mô hình GoogLeNet
đề phù hợp với vấn đề phân loại hình ảnh phôi Kiến trúc GoogLeNet có độ sâu 22 lớp
(27 lớp nếu tính thêm lớp gộp chung).
Phương pháp nghiên cứu
Đề thực hiện dé tài nay, tôi sẽ áp dung tong hợp nhiều phương pháp nghiên cứu khác nhau như: mô hình hóa, khảo sát và thực nghiệm Mô hình hóa chuyển một yêu câu thực tế thành dạng một bai toán lý thuyết Khảo sát các phương pháp đã được sử dụng cho bài toán, sau đó nhận xét, đánh giá và so sánh dé lựa chọn phương pháp phù
hợp Sau đó mô hình tinh toán được đề xuất dé giải quyết yêu cầu đã được đặt ra
Cài đặt thực nghiệm, tỉnh chỉnh các thông số, kỹ thuật để nâng cao kết quả của
mô hình đề xuất.
Phương pháp nghiên cứu của dé tai bao gồm các bước chính dé đạt được mục
tiêu nghiên cứu như sau:
+ Nghiên cứu yêu cầu việc thu thập một bộ dữ liệu đủ lớn và đa dạng chứa
các hình ảnh của phôi.
+ Cúc phương pháp học chuyên giao được áp dụng dé xây dựng mô hình
phân loại Điều này bao gồm tiên xử lý dữ liệu, huấn luyện mô hình và đánh giá hiệu suất.
+ Mô hình được đánh giá bằng cách sử dụng các phép đo độ chính xác, độ
tin cậy và tốc độ phân loại Nếu cần, mô hình được tôi ưu hóa bằng cách
thir nghiệm các kỹ thuật như data augmentation và regularization
techniques.
+ Phương pháp nghiên cứu nay đòi hỏi việc thử nghiệm và đánh giả trên
các bộ dit liệu thực tế dé đảm bao tính ứng dụng và hiệu quả của mô hình chan đoán u phối dựa trên ảnh y khoa.
+ Thực hiện so sánh với các phương pháp khác vả các công trình liên quan
dé đánh giá độ hiệu quả và ưu điểm của mô hình được xây dựng Điều
này đảm báo tính tiên phong vả đóng góp mới cho lĩnh vực phân loại
ảnh.
Trang 14Cấu trúc của khóa luận
Dựa vào những mục đã trinh bày, khóa luận được chia thành các phân như sau:
Mở đâu
+ Tinh cấp thiết của đề tai
+ Mục đích nghiên cứu
+ Đối tượng và phạm vi nghiên cứu
+ Phương pháp nghiên cứu
+ Cau trúc của khóa luận tốt nghiệp
Nội dụng gồm 5 chương:
Chương |: Tổng quan tình hình nghiên cứuChương 2: Cơ sở lý thuyết
Chương 3: Ứng dụng phương pháp học chuyên giao vào chân đoán ung thử phôi
Chương 4: Thực nghiệp và đánh giá
Chương 5: Kết luận và hướng phát trién
12
Trang 15CHƯƠNG 1 TONG QUAN TINH HÌNH NGHIÊN CỨU
1.1 Tổng quan
Ung thư phôi la một trong những loại ung thư phô biến nhất va có tỷ lệ tử vong
cao nhất trên toàn thé giới Việc phát hiện sớm và chan đoán ung thư phổi rat quan trọng
dé cung cap liệu pháp điều trị hiệu qua và tăng tỷ lệ sông sót cho bệnh nhân
Trong các phương pháp chân đoán thủ công, quá trình này đòi hỏi thời gian và
công sức lớn từ các nhân viên y tế Mặc dù phương pháp này rất quen thuộc và đáng tin
cậy nhưng nó có thê gặp các hạn chế trong việc đưa ra quyết định chân đoán chính xác
đo phụ thuộc nhiều vào kinh nghiệm và kiến thức của các nhân viên y tế, và cũng bởi
van dé thiểu hụt bác sĩ chan đoán hình ảnh Ngược lai, phương pháp chân đoán bằngcông nghệ học sâu cung cấp kết quả chân đoán một cách nhanh chóng và độ chính xáccao (đối với mô hình thực hiện hiệu quả)
Các mô hình học sâu có thê giải quyết được rất nhiều nhiệm vụ trong hầu hết các lĩnh vực Học chuyển giao là một phương pháp thay đôi mô hình học máy, học sâu đề
rút ra kiến thức từ một hoặc nhiều nhiệm vụ nguồn và áp dụng kiến thức đó vào nhiệm
vụ mục tiêu Hai cách tiếp cận phô biến của học chuyền giao là phát triển một mô hình
từ đầu và sử dụng một mô hình được dao tạo trước Trong khóa luận này, tôi dé xuất một phương pháp sửa đổi quá trình học tập mạng neural sâu dựa trên mô hình
GoogLeNet dé chan đoán ung thư phổi GoogLeNet được thiết kế ban dau dé phân loại
các đôi tượng quen thuộc như mèo, chó, trái cây, Do đó, khi áp dụng GoogLeNet cho chân đoán hình anh phôi, cần thực hiện việc điều chinh mô hình dé phù hợp với bộ dữ
liệu.
1.2 Các phương pháp áp dụng cho bài toán
1.2.1 Học máy (Machine learning)
Các phương pháp được áp dụng trong bài toán phát hiện bạo lực thường sử dụng
các kỹ thuật truyền thống của học máy như Linear regression, Decision Trees, Random
Forest, SVM, KNN, Một số nhà nghiên cứu đã chọn các phương pháp mô hình học
13
Trang 16máy thay vì mô hình học sâu cho bài toán này, thường là đo ưu tiên hiệu suất, khôngcần nhiều tài nguyên tính toán và đôi khi phương pháp nảy mang lại hiệu quả cao hơn.
Rehman và các cộng sự đã sử dụng kỹ thuật patch-based LBP dé giúp phát hiện
va chân đoán ung thư phôi Kỹ thuật này đã chuyên đôi các hình ảnh sang thang độ xám, sau đó chọn các đặc diém cau trúc và biến đôi chúng thành hệ số DCT và hợp nhất chúng
để tạo ra một vector đặc trưng Cuối cùng, vector này được sử dung dé phân loại ảnh
ung thư phôi dựa trên phương pháp học máy SVM và KNN [14].
Firdaus va các đồng nghiệp đã sử dụng kỹ thuật Gray Level Co-occurrence
Matrix (GLCM) đề xử lý ảnh và phân tích hình ảnh GLCM là một phương pháp thong
kê tính toán tần suất các cặp pixel có mức độ xám cụ thể xuất hiện cạnh nhau trong ảnh
Thông tin này sẽ tạo thành một ma trận và sẽ được sử đụng dé phân loại lại anh ung thư phôi dựa trên phương pháp SVM {6}.
1.2.2 Học sâu (Deep learning)
Học sâu (Deep learning) là một nhánh con của trí tuệ nhân tao (artificial
intelligence) tập trung vào việc xây dựng và huấn luyện các mô hình học sâu dé tự động
học hoi từ dir liệu Trong học sâu, có các mang thần kinh sâu (deep neural networks)
được sử dụng dé mô hình hóa và học các biéu diễn phức tạp của dit liệu thông qua việc
sử dụng nhiều lớp nơ-ron ân Các mang thần kinh sâu này có khả năng tự học các đặc trưng cấp cao từ đữ liệu đầu vào một cách tự động mà không cần sự can thiệp của con người dé chỉ định các đặc trưng cụ thé Các mô hình học sâu đã được áp dụng trong các
nghiên cứu liên quan đến chân đoán ung thử phôi và đạt được kết quả tốt hơn so với các
phương pháp truyền thông Các bài báo đã đề xuất nhiều kiến trúc mô hình học sâu dé
mô hình có thé tự động học và khai thác các đặc trưng có lợi cho việc chân đoán ung
thư phôi.
Shimazaki và các cộng sự đã đề xuất một kiến trúc CNN bằng phương pháp phân
đoạn dé chân đoán ung thử phôi từ ảnh X-quang dé cải thiện độ nhạy (sensitivity) trong
khi vẫn duy trì kết quả FP (false positive) thấp Kiến trúc CNN của họ dựa trên kiến trúc
mã hóa-giải mã dé xuât ra phan đoạn ảnh Kiên trúc mã hóa-giải mã có câu trúc that cô
lá
Trang 17chai, giúp giảm độ phân giải của bản đồ đặc trưng và cải thiện khả năng chống nhiễu và
quá khớp của mồ hình [17].
Abunajm và các cộng sự đã dé xuất một mô hình đựa trên CNN dé dự đoán và
phát hiện ung thử phôi từ hình ảnh chụp CT Mô hình này bao gồm một số lớp tích chập,
lớp gộp và lớp kết nỗi đầy đủ Mô hình này đã đạt được kết quả rất tốt với độ chính xác
là 99.45%.4].
1.3 Cac bộ dữ liệu tiêu chuẩn
1.3.1 Bộ dữ liệu hình ảnh mô bệnh học ung thư phối và đại tràng (Lung and Colon
Cancer Histopathological Image Dataset) (LC25000)
LC25000 [5] là bộ dữ liệu hình ảnh y học phục vụ cho nghiên cứu phan loại ung
thư và chân đoán y tế LC25000 chứa 25.000 ảnh màu được chia thành 5 lớp mỗi lớp
gồm 5000 ảnh:
e© Ung thư biểu mô đại trang (Colon_aca).
e M6 đại tràng lành tính (Colon_n).
© Ung thư biéu mô phôi (Lung_aca).
e Ung thư biểu mô tế bao váy phổi (Lung sec)
¢ Mô phôi lành tính (Lung_n).
Và được chia thành 2 thư mục:
© Phôi (15.000 ảnh).
© Đại tràng (10.000 ảnh).
Mỗi hình ảnh có kích thước 768x768 pixel được lưu trữ đưới dang tệp jpeg.
1.3.2 Bộ dữ liệu CT và PET/CT quy mô lớn cho việc chan đoán ung thư phổi (A
Large-Scale CT and PET/CT Dataset for Lung Cancer Diagnosis)
(Lung-PET-CT-Dx)
Bộ dữ liệu Lung-PET-CT-Dx [10] bao gồm 251,135 hình ảnh DICOM CT và PET-CT của bệnh nhân ung thư phôi cùng tệp XML cho biết vị trí khối u Dữ liệu được thu thập từ bệnh nhân nghi ngờ ung thư phỏi, đã sinh thiết phối va PET/CT, sau đó được
phân thành 4 nhóm theo chân đoán mô bệnh học:
15
Trang 18e A: Ung thư tuyến phôi (Adenocarcinoma).
e B: Ung thư biéu mô tế bao nhỏ (Small Cell Carcinoma).
e E: Ung thu biéu mô tế bào lớn (Large Cell Carcinoma).
Œœ
Bộ dữ liệu có độ phan giải cao (CT: 512x512 pixel, ImmxImm; PET: 200x200
Hình 1-1 Bộ dữ liệu Lung-PET-CT-Dx [10]
pixel, 4.07mm*4.07mm) Và vị trí của khôi u được 5 chuyên gia phẫu thuật nội soi nôi
tiếng có chuyên môn về ung thư phổi đánh dau, 2 người với 15 năm kinh nghiệm và 3
người còn lại có hơn 5 năm kinh nghiệm.
Thông tin về dữ liệu:
e ID bệnh nhân.
e Tudi.
16
Trang 19tôi đa là khoảng 0.87 trên bộ kiểm thử.
Bộ dữ liệu Lung-PET-CT-Dx là mã nguồn mở và có thé được truy cập miễn phi,
giúp cho các nhà nghiên cứu va bác sĩ lâm sàng trên toàn thế giới có thé sử dụng nó dé
phát trién các thuật toán chân đoán ung thư phôi tốt hơn và nâng cao hiệu quả cham sóc sức khỏe cho bệnh nhân ung thư phỏi.
1.3.3 The Lung Image Database Consortium and Image Database Resource
Initiative (LIDC-IDRD
LIDC-IDRI | 16) chứa 1018 anh chụp CT có đánh dau các tồn thương được chú
thích ở định dạng DICOM Chú thích chân đoán được cung cấp ở định dạng XML Đỗi
với mỗi ảnh chụp CT, bốn bác sĩ chuyên khoa phôi giàu kinh nghiệm đã thực hiện quy
trình gồm 2 giai đoạn chú thích và rà soát.
¢ Giai đoạn 1: Các bác sĩ đánh giá từng ảnh CT và phân loại tôn thương
thành “khối u > 3 mm.” “khối u = 3 mm,” hoặc “không phải khôi u > 3
mm”.
e Giai đoạn 2: Sau đó, mỗi bác sĩ xem xét lại các phân loại của các tôn
thương khác va đưa ra chân đoán cudi cùng.
17
Trang 201.3.4 Phân tích hạch phôi 16 (Lung Nodule Analysis 16) (LUNA 16)
LUNA 16 [7] được phát triển từ LIDC-IDRI Bộ dữ liệu bao gom 36.378 chú
thích của các bác sĩ chuyên khoa trên 888 ảnh chụp CT được chọn lọc.
18
Trang 21Các bác sĩ chuyên khoa chỉ đánh giá các chú thích được phân loại là khối u có
kích thước > 3 mm là các tôn thương liên quan; các khối u có kích thước < 3 mm và các tôn thương không phải khối u sẽ không được xem xét là liên quan đến các quy trình sàng
lọc ung thư phôi Tông cộng có 1186 khối được coi là các ví du đương tính (tức là các
tôn thương mà thuật toán cần phát hiện) Các khối u khác, tức là những khối u có đường
kính khác nhau, được coi là các phát hiện không liên quan sé không được tính là FP
(false positive) hoặc TP (true positive) và bị loại hoàn toàn khỏi quy trình đánh giá.
19
Trang 22CHƯƠNG 2 CƠ SỞ LÝ THUYET
2.1 Các phương pháp chan đoán hình ảnh y khoa truyền thống:
2.1.1 Chụp X-quang ngực
Chụp X-quang ngực là phương pháp phô biến giúp pháp hiện các bắt thường có
trong phôi va các cơ quan xung quanh Đây là một phương pháp hữu ích dé sàng lọc ung
thư phôi ở những người có nguy cơ cao mắc bệnh ung thư.
2.1.2 Chụp CT ngực
Chup CT ngực tạo ra hình anh chi tiết hơn chụp X-quang về câu trúc của phôi vả các cơ quan xung quanh, cho phép bác sĩ nhận biết rõ ràng các biểu hiện của ung thư phôi CT ngực có thé phát hiện các khối u nhỏ hơn va phân loại chúng theo tính chat,
giúp đánh giá mức độ nghiêm trọng của bệnh Phương pháp này cho phép thu được hình
ảnh từ nhiều góc độ và mặt của phôi, cung cấp thông tin đa chiều về sự phát triển của
ung thư phôi Được coi là phương pháp tiêu chuan trong chân đoán và đánh giá sự phát triển của ung thư phôi.
2.1.3 Chụp PET/CT
Chụp PET/CT kết hợp hai công nghệ hình ảnh là PET (Positron Emission
Tomography) va CT (Computed Tomography) trong một quy trình Điều nay cho phép
cung cấp thông tin về cả chức năng va cau trúc của các mô trong cơ thé PET/CT sửdụng chất đánh đấu phát xạ đẻ phát hiện các tế bào ung thư, bao gồm cả các tế bào ungthư phổi và các điểm lan rộng có thể nằm ở những nơi khác trong cơ thể
2.1.4 Chụp cộng hưởng từ (MRD
Chụp cộng hướng từ (MRI) sử dụng từ trường và sóng radio dé tạo hình ảnh bên
trong cơ thẻ Phương pháp này có khả năng tạo ra hình ảnh chỉ tiết về cấu trúc của các
mô va cơ quan trong cơ thê, bao gôm ca phôi va các khôi u.
20
Trang 232.2 Mạng thần kinh (Neural Network)
Mạng thần kinh (Neural Network) là một phương thức trong lĩnh vực trí tuệ nhân tạo, lay cảm hứng bộ não của con người Các tế bao than kinh (no-ron) có trong bộ não
tạo thành một mạng phức tap, có tính liên kết cao và gửi các tín hiệu điện đến nhau đẻ
giúp con người có kha năng tư duy, xử lý thông tin có thé nhận biết được các sự vật,
hiện tượng khác nhau Một mang thần kinh nhân tạo (Artificial Neural Network) được
tạo từ:
¢ Các nơ-ron nhân tạo được gọi là nút (node) Mỗi nút này có thê nhận đầu
vảo, thực hiện một số phép tinh, va sau đó truyền kết quả ra các nút khác.
e Mang than kinh nhan tạo là tập hợp các nơ-ron nhân tao được tạo tô chức
thành các lớp và liên kết với nhau theo một số cách cụ thê.
Mạng thần kinh nhân tạo là các chương trình phan mém hoặc thuật toán đượcviết trên máy tính Các chương trình này mô phỏng cách thức hoạt động của não bộ con
người bằng cách sử dụng các nơ-ron nhân tạo Các nơ-ron nhân tạo là các khối phan
mềm nhỏ thực hiện các phép toán và truyền tín hiệu cho nhau Mục đích của mạng than
kinh nhân tạo la sử dụng máy tính đề tính toán và đưa ra dự đoán dựa trên dữ liệu.
Hình 2-1 Giải phẫu một nơ-ron [2]
Như hình trên, ta có thé thay một nơ-ron có thé nhận nhiều đầu vào và cho ra một
kết quả duy nhất Quá trình tính toán của một nơ-ron diễn ra như sau:
21
Trang 24Trong hình:
XI, X2 Xm là các tín hiệu đầu vào từ các nơ-ron khác hoặc từ thông tin đầu
vào của mạng thần kinh Các tín hiệu nay được biểu điển dưới dang số
thực.
Wi, W2, , Wm là các trọng số liên kết, thé mức độ ảnh hưởng của mỗi tín
hiệu đầu vào đến kết qua dau ra của tế bảo than kinh.
Hàm kết hợp (Sum): Các tín hiệu đầu vào được nhân với trọng SỐ tương
ứng và sau đó được cộng lại.
Kết quả của phép tính trên sẽ được cộng thêm với một đại lượng có tên là
độ lệch (bias) và đưa qua một hàm kích hoạt (activation function).
Hàm kích hoạt (activation function): thường là các hàm phi tuyến tính Làđiều cần thiết để mạng học được các biểu diễn phức tạp giữa đầu vào vàđầu ra, tạo ra các dự đoán phi tuyến tính
Đầu ra (Output): là tín hiệu đầu ra của một tế bảo than kinh sẽ được sử
dung là đầu vào cho một tế bao than kinh khác hoặc là đầu ra của một
mang than kinh
22
Trang 252.3 Perceptron đa lớp (Multi Layer Perceptron) (MLP)
Multi Layer Perceptron là tập hợp tế bảo thần kinh tạo thành các nhóm mỗi nhóm
là một lớp tạo thành một mạng phức tap Mô hình của MLP gòm ba thành phan cơ bản
sau: lớp dau vào (inpuU lớp ân (hidđen) và lớp đầu ra (output) Mỗi lớp gồm nhiều nút
¢ Lớp dau vào (Input layer): Thông tin từ bên ngoài đi vào mạng no-ron
nhân tạo qua lớp đầu vào Mỗi nút trong lớp đầu vào đại diện cho một đặc
điểm của dữ liệu đầu vào.
e Lớp an (Hidden layer): Thực hiện các phép tính phức tạp dé trích xuất các
đặc điểm quan trọng từ thông tin đầu vào Mỗi nút trong lớp ân là một ron nhân tạo thực hiện các phép toán vả truyền tín hiệu cho các nơ-ron
nơ-khác Số lượng nơ-ron va số lượng lớp ân có thé thay đôi tủy theo độ phức
tạp của bài toán.
e Lớp đầu ra (Output layer): Đưa ra dự đoán hoặc quyết định dựa trên các
đặc điểm được trích xuất từ thông tin đầu vào Mỗi nút trong lớp đầu rađại điện cho một kết quá đầu vào có thẻ
23
Trang 262.4 Mạng thần kinh tích chap (Convolutional neural networks)
Mang than kinh tich chap (Convolutional neural networks = CNN) là một loại
mạng than kinh nhân tạo được sử dụng phô bién trong các tác vụ thị giác máy tính, đặc
biệt là phân tích ảnh Các lớp của CNN thường bao gồm một loạt các lớp được liên kết với nhau thông qua phép tích chập Lớp tiếp theo là kết quả tích chập từ lớp trước đó.
` CONVOLUTION + RELY — POOUMO CONVOLUTION + RELY POOUMO PATTON ce 1O91MAX
HIDDEN LAYERS CLASSIFICATION
Hình 2-4 Kiến trúc của CNN [1]
Kiến trúc của một CNN cơ bản sé bao hém: Lớp đầu vao (Input layer), lớp tích
chap (convolutional layer), hàm kích hoạt (activation layer), lớp gộp (pooling layer), lớp
kết nối hoàn toàn (fully connected layers)
2.4.1 Các kiểu lớp
Lớp tích chập (Convolutional layer)
Là một phân quan trọng trong mạng thần kinh, thường được sử dụng ngay sau
lớp đầu vào Trong lớp này, các bộ lọc (filter) hoặc hạt nhân (kernel) được áp dụng dé thực hiện phép tích chập trên dit liệu đầu vào, từ đó trích xuất các đặc trưng quan trọng.
Cách thức hoạt động của phép tích chập như sau:
e Phép tích chập được thực hiện trên hai hàm, thường được gọi là “hình ảnh
a.
dau vao” (input image) va “bộ lọc” (filter) hoặc “hat nhân” (kernel) Ham dau
24
Trang 27vào có thé là tín hiệu, ảnh hoặc bat kỳ dit liệu nào khác có thẻ biểu diễn dưới
đạng ma trận Bộ lọc là một mảng nhỏ các giá trị được sử dụng dé “trượt” qua hình ảnh đầu vào.
Pilter/Kernet
(b)
Hình 2-5 Biểu diễn hình ảnh đầu vào và bộ lọc dưới dang ma trận
e Tich điểm: Tai mỗi vị trí trên hình ảnh đầu vào, bộ lọc được nhân với một
phan của hàm đầu vào có củng kích thước Các giá trị được nhân sau đó được
cộng lại đề tạo ra một gia trị đơn lẻ cho vị trí đó trên đầu ra.
¢ Lap lại: Quá trình này được lặp lại cho tat cả các vị trí trên hình ảnh dau vào,
bắt dau từ trái sang phải và tử trên xuống dưới Tạo ra một “ban dé đặc trưng”
(feature map) cho thấy mức độ tương quan giữa hàm đầu vào và bộ lọc tại
mỗi vị trí.
Image
Hình 2-6 Cách thức hoạt động của phép tích chap [1]
25
Trang 28Lớp gộp (Pooling Layer):
Lớp gop là một phép giảm kích thước dữ liệu Lớp gộp sử dụng một cửa số
(pooling window) trượt qua toàn bộ bản đô đặc trưng, mỗi lần trượt theo các bước trượt
cho trước Lớp nảy giảm số lượng tham số, day nhanh quá trình tính toán, tránh quákhớp bằng cách làm giảm kích thước lớp trước đó nhưng vẫn giữ lại thông tin quantrọng Hai loại gộp phô biến lả:
«_ Gộp cực đại (Max Pooling): Giữ lại giá trị lớn nhất từ mỗi vùng của bản
46 đặc trưng sau mỗi lần di chuyên của cửa số gộp Max Pooling giữ lại
các đặc trưng nôi bật nhất
¢ Gộp trung bình (Average Pooling) Giữ lại giá trị trung bình từ mỗi vùng
của bản đồ đặc trưng sau mỗi lan di chuyển của cửa số gộp Giữ lại thông
tin chỉ tiết hơn so với gộp cực dai, có thé làm giảm nhiều trong dit liệu
Hình 2-7 Gộp cực đại và gộp trung bình
Ngoài hai phép gộp phô biến là gộp cực đại và gộp trung bình thì còn có gop tong
(sum pooling), gộp cực tiểu (min pooling)
26
Trang 29Lớp kết nối đầy đủ (Fully connected layers)
Dữ liệu vào lớp này sẽ được làm phẳng thành một vectơ Mỗi phan tử ở vectơ
dau vào sẽ được kết nỗi với tat cả các vectơ cả lớp kết nỗi day đủ này Trong mô hình
CNN, lớp kết nỗi day đủ thường được tim thấy ở cuối mạng va dùng dé tôi ưu hóa mục
Hàm kích hoạt trong mạng thần kinh là một hàm được áp dụng cho đầu ra của
mỗi nơ-ron trong một lớp dé tạo ra đầu ra phi tuyên tính, giúp mạng thần kinh có khả
năng học và biêu dién các hàm phức tap Dưới đây là một số hàm kích hoạt phô biến.
Hàm Sigmoid:
Hàm Sigmoid có dạng hình chữ S chuyên đổi đầu vào là các số thực thành đầu
ra nằm trong phạm vi giữa 0 và 1 Điều này giúp nó phù hợp cho các bài toán phân loại,
nơi đầu ra cần được biêu diễn dưới dang xác suất Khi đầu vào đủ lớn (dương hoặc âm),
đạo hàm của hàm sigmoid tiến gần đến 0, dẫn đến hiện tượng biến mat đạo hàm
(vanishing gradient) và lam chậm quá trình học của mạng than kinh
Công thức của hàm Sigmoid:
1
a(x) =
27
Trang 30Dao hàm của hàm Sigmoid có thé tính toán dé dang bằng cách sử dụng chính giá
trị của hàm Sigmoid Cụ thẻ nếu a(x) là giá trị đầu ra của hàm Sigmoid tại điểm x, thiđạo ham của ham Sigmoid tai điểm x được tinh bằng công thức sau:
Ham Tanh có dạng cong hình Hyperbolic Tangent, tương tự như chữ S nhưng có
giá trị đầu ra trong khoảng [-1, 1] và có tâm đối xứng tại 0 Khi dit liệu đầu vào có giá
trị trung bình gần 0, hàm Tanh sẽ hoạt động hiệu quả hơn vì nó có thé phân bố đều các
giá trị đầu ra cho các tín hiệu dương và âm
Hàm Tanh có biểu dién toán học như sau:
x —x
tanh(x) = aoe (3)
Hàm Tanh có nhiều ưu điểm tương tự như ham Sigmoid, bao gồm dé tính toán,
khả năng đạo hàm tốt và phù hợp cho các bài toán phân loại Tương tự như hàmSigmoid, hàm Tanh cũng dẫn đến van đề vẻ biến mat đạo hàm khi đầu vào đủ lớn, dẫnđến việc chậm quá trình học của mạng thần kinh
28
Trang 31-100 =-75 =-5.0 -25 00 2.5 5.0 7.5 10.0
x
Hình 2-10 Đồ thị của hàm Tanh
Ham Rectified Linear Unit (ReLU):
Ham Rectified Linear Unit (ReLU) là một hàm kích hoạt phi tuyén phô biến trongmạng neural Hảm này được định nghĩa bởi công thức sau:
Relu(x) = max (0,x) (4)
Cụ thê:
« Khix >0, hàm ReLU trả về giá trị x.
« Khix<0, hàm ReLU trả về giá trị 0
Trang 32Hàm ReLU chỉ đơn giản là chon giá trị lớn nhất giữa 0 và đầu vào, làm cho nótrở thành một trong những hàm kích hoạt nhanh nhất va dé tính toán Trong quá trình
lan truyền ngược (backpropagation), ReLU giữ nguyên đạo hàm bằng 1 đỗi với các giá
trị dương, không gây ra van dé về biến mat đạo hàm như các hàm kích hoạt khác như
sigmoid hay tanh.
Nếu gia trị đầu vào của một nơ-ron luôn nhỏ hơn 0, ReLU sẽ luôn trả về 0 cho
nơ-ron đó Nơ-ron nay được gọi là "nơ-ron chết" (dead neuron) và không còn khả năng
học.
Ham ReLU là một hàm kích hoạt hiệu quả và được sử dung phô biến trong mạng
nơ-ron nhân tạo Ưu điểm chính của ReLU là đơn giản, hiệu quả tính toán, và khả năng giải quyết vẫn đề biến mất đạo hàm Tuy nhiên, ReLU cũng có một số nhược điểm như
van dé "chết neuron" Các biến thé khác của ReLU có thê khắc phục nhược điểm của
Bước trượt (Stride):
Xác định số lượng pixel mà bộ lọc (filter) đi chuyên trong mỗi bước khi thực hiện
phép toán tích chập.
Có hai loại bước trượt chính:
e Bude trượt đơn (bước trượt = 1): Bộ lọc di chuyền một pixel trong mỗi
bước.
¢ Bước trượt lớn (bước trượt > 1): Bộ lọc di chuyển nhiều hơn một pixel
trong mỗi bước Vi dụ, bước trượt bang 2 có nghĩa là bộ lọc di chuyên hai
pixel trong mỗi bước.
Hiệu ứng của bước trượt:
30