Khóa luận tốt nghiệp Khoa học máy tính: Ứng dụng phương pháp học chuyển giao vào chẩn đoán bệnh Ung thư phổi

LOI CAM DOANKhóa luận “Ung dụng phương pháp học chuyển giao vào chan đoán bệnh ung thư phối" là công trình nghiên cứu của tôi, được thực hiện dưới sự hướng dan chuyên nghiệp của Thạc si

Trang 1

TRƯỜNG ĐẠI HỌC SƯ PHẠM TPHCM

KHOA CÔNG NGHỆ THONG TIN

TP HO CHI MINH

UNG DUNG PHUONG PHAP HOC CHUYEN GIAO

VAO CHAN DOAN BENH UNG THU PHOI

KHOA LUAN TOT NGHIEP

THÀNH PHO HO CHÍ MINH - NAM 2024

Trang 2

TRUONG DAI HOC SƯ PHAM TPHCM

KHOA CONG NGHE THONG TIN

ER Sp

TP HO CHÍ MINH

UNG DỤNG PHƯƠNG PHAP HỌC CHUYEN GIAO

VAO CHAN DOAN BENH UNG THU PHOI

CHUYEN NGHANH: KHOA HOC MAY TINH

KHOA LUAN TOT NGHIEP

NGƯỜI HUONG DAN KHOA HOC: THS TRINH HUY HOANG

THÀNH PHO HO CHÍ MINH — NAM 2024

Trang 3

LOI CAM DOAN

Khóa luận “Ung dụng phương pháp học chuyển giao vào chan đoán bệnh

ung thư phối" là công trình nghiên cứu của tôi, được thực hiện dưới sự hướng dan

chuyên nghiệp của Thạc si Trịnh Huy Hoàng Moi kết qua và quan điểm được trình bày

trong khóa luận là kết quả của quá trình nghiên cứu nghiêm túc, chân thật và không chứa bat kỳ nội dung sao chép từ các nguồn thông tin khác mà không ghi rõ trong phan tai

liệu tham khảo.

Tôi xin chịu trách nhiệm về lời cam đoan nảy.

Thành phố Hỗ Chi Minh, ngày 5 thang 4 năm 2024

Trang 4

bước trong tương lai.

Không thé không kẻ đến sự ủng hộ từ gia đình, bạn bè, và người thân trong suốt

thời gian học tập vả nghiên cứu Cam ơn vì sự động viên va ủng hộ của mọi người là

động lực to lớn giúp tôi hoàn thành khóa luận tốt nghiệp nay.

Mặc dù đã cô găng hết sức trong việc nghiên cứu va viết khóa luận Tuy nhiên,tôi biết rằng khóa luận của tôi vẫn còn tồn tại những thiếu sót Tôi mong nhận được sự

thông cảm và góp ý xây dựng từ quý thay cô và toàn thé các bạn dé hoàn thiện hơn nữa

công trình nghiên cứu này.

Thành pho Hồ Chí Minh, ngày 5 tháng 4 năm 2024

Trang 5

MỤC LỤC

LỜI CAM ĐOAN 1

LOI CẢM ON 2

MUC LUC 3

DANH MUC KY HIEU VA CHU VIET TAT 6

DANH MUC BANG BIEU 7

DANH MUC HINH VE 8

MO DAU 10

LY do Chom G6 tai NGG IIdẳẮẶẶ 10

Mục HÊ0ingHiển CUD, cis sscssseessncssesssessensnsnscscancnasseanesasionsesnensscsseassscssnssncasie 10

Đối tượng và phạm vi nghiên cứu -.2-©2¿7222S+SE2SE2cS22722zxcrrerrecxe, 10

Phương pháp nghiên cứu 2 2 1H21 212 HH du li

Cấu trúc của khóa luận -2 22222+t2SEEZSEEZ2EEEZEEEZcEEEeeEzerrrsrrrsrrrrved 12

CHUONG 1 TONG QUAN TINH HÌNH NGHIÊN CỨU 13

MD," Gssae yea BA 5 ceca sec acs cc asscsssczsssaezssczsscocsescesecvasecasscsascasocaesszesstousseseccts 13

1.2 Các phương pháp áp dụng cho bài toán Sccc<ssersxe 13

1.2.1 Học máy (Machine learning) óc si sie 13

1.2.2 Học sâu (Deep leaming) : :c-ccociisiisoioeiisssoeoio 14

l5 (Cá4cb@9dữiHfntiilifillassssnaoannonrnanniraan-ờnaaaiman 15

1.3.1 Bộ dữ liệu hình anh mô bệnh học ung thư phôi và đại tràng (Lung

and Colon Cancer Histopathological Image Dataset) (LC25000) 15

1.3.2 Bộ dữ liệu CT va PET/CT quy mô lớn cho việc chân đoán ung thư

phôi (A Large-Scale CT and PET/CT Dataset for Lung Cancer Diagnosis)

(Lung-PET-CT-Dx) 15

Trang 6

1.3.3 The Lung Image Database Consortium and Image Database

Resource Initiative (LIDC-IDRI) - - 522011 1131 1 311 2112 11 sk, 17

1.3.4 Phân tích hạch phối 16 (Lung Nodule Analysis 16) (LUNA 16)1§

CHƯƠNG2 CƠ SỞ LÝ THUYET 20

2.1 Các phương pháp chân đoán hình anh y khoa truyền thống: 20

ZAM, ‘CHP X=đQUaHEHEV¡ossiaianiiioioiiiiotiiiitiati41128111211ã5611033ã6ã58ã3806 20

PW De, (CHUN CHHEUD¿ :2(4:20021/012020122022120220221132121212222121240321402101330220132034 20

201,3 ChyipiPEV ICD siisssssssssssccssssssssssssssiseasssssssacssssisaraessaveavsssavoasscesoracie 20

2.1.4 Chụp cộng hưởng từ (MRÌ]) -SehHhaue 20

2.2 Mang thần kinh (Neural NeIVOIEÌ - - 21

2.3 Perceptron đa lớp (Multi Layer Perceptron) (MLP) 23

2.4 Mạng thần kinh tích chập (Convolutional neural networks) 24

II, ee Mee N7 na na Gõ nẽẳỶ“ 24

DAD HồnIKRGHINBBÙ;zaisiiiisiiaiiiaiiiiiiiinitiiitsiibiiii2002110920i020004i06.ả.6236) 27

2.4.3 Các tham số của bộ lọc 2- ccsskeeseeeeeeesresres-.- dO)

2.5 Học chuyền giao (Transfer learning) các án se 33

SS Định BGHÌÏ4:::ssssaansaioenonrinenoliniiiiaiiiaotiiatseastrasosanssagneasnn 33

2.5.2 Phân loại học tập chuyên giao ccaanreese 34

2.5.3 Các thành phan có thé chuyên giao: -2-25s55ccccsee 34 2.5.4 Hạn chế chuyền giao tiêu cực (negative transfer) 35 2.5.5 Học chuyên giao trong học sâu ¿ -+-©s++cssccszee 38

2.5.6 Học chuyền giao sâu (Deep transfer learning) 39

2.5.7 Các biến thé học chuyển giao sâu - 6-52 2 cccscssecsec 4]

2.5.8 Triển khai học chuyên giao: 0 cccecsesssessseesseeseeeseesseesseeeeees 43

Z!0 Những môiliinhiBoeSãDn::o:iccnooinoigiiiiattiiiaiigiiniinsauaadi 44

Trang 7

CHUONG 3 UNG DUNG PHƯƠNG PHAP HỌC CHUYEN GIAO VÀO

CHAN DOAN UNG THU PHOI 51

3.1 GiGi thigu phương Phapiccsscrssesssscssesssossisssssesssosssessscsssossersessessessasease 51

3.2 Triển khai phương phap 0 -.0.-cecceeccsssessecsseceesseeeveesesseeseeeeeeneee 51

3.2.1 Xử lý đữ liệu -.ccccccseereeceersrrrsrareo.ST

3.2.2 Hàm mat mát 2222©C2z+ECxtrrxrerxrrxrercreecrrecrk 53

F253; Kay Gung môIBÌHB::::::::::ccoccooccbonisiiisriretiirsiiissgissiisagiasgienii 53

CHUONG 4 THỰC NGHIEM VA ĐÁNH GIÁ 56

4.1 Môi trường huấn luyện và thực nghiệm .2- 22-52-52 56

4.2 Phuong pháp đánh giá Ăn HH hy 56

4.2.1 Độ chính xác(Accuracy) ::-::: :::-::<-(-coccoieiiiioiioroeaooaoo 56

4.2.2 Ïl-SCOF€ Lo Sen nhai ¬ 56

BIB hố ẽ ẽẽẽ 57 KET LUẬN VA HƯỚNG PHÁP TRIEN 60

HC TH HH8 7õ nan nan aoanananenal 60

TA nh ” - 60

TAI LIEU THAM KHẢO 61

1 Tiếng ViỆt 22222222222 22222.22.EE.EE.cccee 61

2 Tiếng Anh cu ch nh ng nàn ng ấu 6]

Trang 8

DANH MỤC KÝ HIỆU VÀ CHU VIET TAT

Local Binary Pattern Lung Nodule Analysis 16

The Lung Image Database Consortium

Magnetic Resonance Imaging Neural Architecture Search Network Mobile Neural Networks

Positron Emission Tomography Residual Network

Support Vector Machine Visual Geometry Group

Trang 9

DANH MỤC BANG BIEU

Bang 2-1 Triển khai học chuyên giao - 2565 2S 2sp2srrrcrrrsrreerecs 43

Bảng 4-1 So sánh kết quả của phương án dé xuất với các mô hình khác 38

Trang 10

DANH MỤC HÌNH VE

Hình 1-1 Bộ dữ liệu Lung-PET-CT-Dx [ IÖ] .- 555 Sc2<x+z<vszesvzex l6

Hình 1-2 Bộ dữ liệu LIDC-IDRI [ 16] - <5 6< 133223 xxx 18

Hình 1-3 Bộ dt Lee BUNA: 167) sssisssssasscassssasssasssasssasssasssassssasssssssasssaassasisaaseas 19

Hình 2-1 Giải phẫu một nơ-ron [2] ccccccccsscssscesssessessesssesesseesseesssesreensevcsseasteessees 21

Hình 2-2 Minh hoa quá trình tính toán của một nơ-ron - - c-<ss-<- 22 Hiñh.2z3Perceptron da lop [20 i¿sssiosnaiiiasiaiooaiiiooiiiiiiitiisiiiasii36165141211231ã181ảãä6 23

Hình 2-4 Kiến trúc của CNN [ 1] -<-zcccsee+seeczescczxecrzeccccee 24 Hình 2-5 Biểu diễn hình anh đầu vào và bộ lọc dưới dang ma trận 25

Hình 2-6 Cách thức hoạt động của phép tích chập [ I] ‹.-<- 25

Hình 2-7 Gộp cực đại và gộp trung bình s5 ĂSSseieeerrersrerrrrree 26

Hinh 2-8 Lop Ket ni day GU 1n 114 27Hình 2-9 Đồ thị của ham Sigmoid 0 0ccsessseessseeeseeeseesceeesseeesseessecsseeenses 28Hình 2-10 Đồ thị của hàm Tanh - 2-5211 2112518251155 111 2117217250121 1y 29Hình 2-ii Đồi cũa hàm REE cscs ccssssusssswsnscosnssssssssncssscasssssvscoisssnssasssnnne’ 29

Hình 2-12 Bước trượt đơn với bộ lọc 33 .c cc-cccseceseesees-er-Ð Í

Hình 2-13 Bướt trượt lớn với bước trượt bằng 2 và bộ lọc 33 - 31

Hình 2-14 Padding "Zero" với kích thước Í - <5 s+cs<cse<ereeeerex 32

Hình 2-15 Học quy nạp (Inductive learning) và chuyền giao quy nạp (Inductive

Hình 2-23 Cau hình của GoogleNet [19] - -2-©2seSsseSxeecrxecrreee 48

Trang 11

Hình 2-24 Residual Block of ResÌNet .- - Q57 G5 49

Hình 2-25 Kiến trúc của D-net P15) s.ccssesssscssscssccsssassoossacsinessssassscasscossasssassansnses 50

Hình 3-1 Ung thư biéu mô phôi (Lung _aca) - 2222222 22s22scczeczccczerree 52

Hình 3-2 Mô phỏi lành tính (Lung_n) 022202220232 2221122212222) 52 Hình 3-3 Ung thư biểu mô tế bảo vảy phôi (Lung_sec) 2-52 52

Hình 3-4 Số lượng ảnh theo mỗi lớp của tập huấn luyện, kiếm thử, kiểm tra 53Hình 3-5 Mô hình học chuyên giao dé phân loại ung thử phôi dựa trên GoogLeNet

388S:8553554i15888i888855438858353554355861584355555 285333853:5555883888555388853838343388638495551585538ã584 53

Hình 3-6 Đồ thị của hâm RTI ss csssasssssssscsssaassansscssuossecrsssnssssasessssanssaosssssssnsses 54

Hình 4-1 Độ lỗi trong quá trình huấn luyện vả xác thực . - 57

Hình 4-2 Độ chính xác trong quá trình huấn luyện và xác thực 57

Hình 4-3 Ma trận nhằm [a0 o.oo cee cceeccescseescssesececssecesecsseeessveseecesesveveseceseeeeees 58

Trang 12

MỞ DAU

Lý do chọn đề tài

Ung thư phôi là một trong những căn bệnh ung thư phô biến nhất và có tỷ lệ tử

vong cao nhất trên thế giới, gây ra gánh nặng lớn cho ngành y tế Ở Việt Nam, ung thưphôi đứng thứ hai về tỉ lệ mắc phải ở cả hai giới tính Do đó, việc chân đoán sớm bệnh

ung thư phổi đóng vai trò quan trọng trong việc cải thiện tỷ lệ sống sót và chất lượng

cuộc sông của bệnh nhân

Tuy nhiên, việc chân đoán hình ảnh y tế thủ công gặp phải rất nhiều hạn chế như chi phí cao, thời gian chờ dài, thiếu bác sĩ chân đoán hình anh, Do đó, việc áp dụng công nghệ học máy chuyên giao vảo quá trình chân đoản bệnh ung thư phôi là hết sức

cần thiết giúp giảm chỉ phí chân đoán, rút ngắn thời gian chờ kết quả

Vì lý do như trên, dé tài này đã được lựa chọn nhằm nghiên cứu một giải phápchan đoán ung thư phổi bằng áp dụng hoc máy chuyên giao dựa trên mô hình

GoogLeNet Mục tiêu của khóa luận nảy là đưa ra kết quả có thé hỗ trợ bác sĩ chân đoán

ung thư phôi chính xác hơn, từ đó cải thiện quá trình điều trị cho bệnh nhân

Mục tiêu nghiên cứu

Xây dựng một mô hình chân đoán ung thư phôi dựa trên việc điều chỉnh mô hình

GoogLeNet dé có thé phù hợp với bộ dit liệu.

So sánh hiệu quá của mô hình đã sửa đôi với các mô hình khác.

Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu

Trong đề tai này, đối tượng nghiên cứu là mạng thân kinh sâu dựa trên việc học

chuyên giao được ứng dụng dé chan đoán ung thư phôi.

Cụ thé, mô hình được xây dựng dựa trên kiến trúc GoogLeNct.

Phạm vi nghiên cứu

10

Trang 13

Trong đề tài này, tôi tập trung nghiên cứu vào việc sửa đổi mô hình GoogLeNet

đề phù hợp với vấn đề phân loại hình ảnh phôi Kiến trúc GoogLeNet có độ sâu 22 lớp

(27 lớp nếu tính thêm lớp gộp chung).

Phương pháp nghiên cứu

Đề thực hiện dé tài nay, tôi sẽ áp dung tong hợp nhiều phương pháp nghiên cứu khác nhau như: mô hình hóa, khảo sát và thực nghiệm Mô hình hóa chuyển một yêu câu thực tế thành dạng một bai toán lý thuyết Khảo sát các phương pháp đã được sử dụng cho bài toán, sau đó nhận xét, đánh giá và so sánh dé lựa chọn phương pháp phù

hợp Sau đó mô hình tinh toán được đề xuất dé giải quyết yêu cầu đã được đặt ra

Cài đặt thực nghiệm, tỉnh chỉnh các thông số, kỹ thuật để nâng cao kết quả của

mô hình đề xuất.

Phương pháp nghiên cứu của dé tai bao gồm các bước chính dé đạt được mục

tiêu nghiên cứu như sau:

+ Nghiên cứu yêu cầu việc thu thập một bộ dữ liệu đủ lớn và đa dạng chứa

các hình ảnh của phôi.

+ Cúc phương pháp học chuyên giao được áp dụng dé xây dựng mô hình

phân loại Điều này bao gồm tiên xử lý dữ liệu, huấn luyện mô hình và đánh giá hiệu suất.

+ Mô hình được đánh giá bằng cách sử dụng các phép đo độ chính xác, độ

tin cậy và tốc độ phân loại Nếu cần, mô hình được tôi ưu hóa bằng cách

thir nghiệm các kỹ thuật như data augmentation và regularization

techniques.

+ Phương pháp nghiên cứu nay đòi hỏi việc thử nghiệm và đánh giả trên

các bộ dit liệu thực tế dé đảm bao tính ứng dụng và hiệu quả của mô hình chan đoán u phối dựa trên ảnh y khoa.

+ Thực hiện so sánh với các phương pháp khác vả các công trình liên quan

dé đánh giá độ hiệu quả và ưu điểm của mô hình được xây dựng Điều

này đảm báo tính tiên phong vả đóng góp mới cho lĩnh vực phân loại

ảnh.

Trang 14

Cấu trúc của khóa luận

Dựa vào những mục đã trinh bày, khóa luận được chia thành các phân như sau:

Mở đâu

+ Tinh cấp thiết của đề tai

+ Mục đích nghiên cứu

+ Đối tượng và phạm vi nghiên cứu

+ Phương pháp nghiên cứu

+ Cau trúc của khóa luận tốt nghiệp

Nội dụng gồm 5 chương:

Chương |: Tổng quan tình hình nghiên cứuChương 2: Cơ sở lý thuyết

Chương 3: Ứng dụng phương pháp học chuyên giao vào chân đoán ung thử phôi

Chương 4: Thực nghiệp và đánh giá

Chương 5: Kết luận và hướng phát trién

12

Trang 15

CHƯƠNG 1 TONG QUAN TINH HÌNH NGHIÊN CỨU

1.1 Tổng quan

Ung thư phôi la một trong những loại ung thư phô biến nhất va có tỷ lệ tử vong

cao nhất trên toàn thé giới Việc phát hiện sớm và chan đoán ung thư phổi rat quan trọng

dé cung cap liệu pháp điều trị hiệu qua và tăng tỷ lệ sông sót cho bệnh nhân

Trong các phương pháp chân đoán thủ công, quá trình này đòi hỏi thời gian và

công sức lớn từ các nhân viên y tế Mặc dù phương pháp này rất quen thuộc và đáng tin

cậy nhưng nó có thê gặp các hạn chế trong việc đưa ra quyết định chân đoán chính xác

đo phụ thuộc nhiều vào kinh nghiệm và kiến thức của các nhân viên y tế, và cũng bởi

van dé thiểu hụt bác sĩ chan đoán hình ảnh Ngược lai, phương pháp chân đoán bằngcông nghệ học sâu cung cấp kết quả chân đoán một cách nhanh chóng và độ chính xáccao (đối với mô hình thực hiện hiệu quả)

Các mô hình học sâu có thê giải quyết được rất nhiều nhiệm vụ trong hầu hết các lĩnh vực Học chuyển giao là một phương pháp thay đôi mô hình học máy, học sâu đề

rút ra kiến thức từ một hoặc nhiều nhiệm vụ nguồn và áp dụng kiến thức đó vào nhiệm

vụ mục tiêu Hai cách tiếp cận phô biến của học chuyền giao là phát triển một mô hình

từ đầu và sử dụng một mô hình được dao tạo trước Trong khóa luận này, tôi dé xuất một phương pháp sửa đổi quá trình học tập mạng neural sâu dựa trên mô hình

GoogLeNet dé chan đoán ung thư phổi GoogLeNet được thiết kế ban dau dé phân loại

các đôi tượng quen thuộc như mèo, chó, trái cây, Do đó, khi áp dụng GoogLeNet cho chân đoán hình anh phôi, cần thực hiện việc điều chinh mô hình dé phù hợp với bộ dữ

liệu.

1.2 Các phương pháp áp dụng cho bài toán

1.2.1 Học máy (Machine learning)

Các phương pháp được áp dụng trong bài toán phát hiện bạo lực thường sử dụng

các kỹ thuật truyền thống của học máy như Linear regression, Decision Trees, Random

Forest, SVM, KNN, Một số nhà nghiên cứu đã chọn các phương pháp mô hình học

13

Trang 16

máy thay vì mô hình học sâu cho bài toán này, thường là đo ưu tiên hiệu suất, khôngcần nhiều tài nguyên tính toán và đôi khi phương pháp nảy mang lại hiệu quả cao hơn.

Rehman và các cộng sự đã sử dụng kỹ thuật patch-based LBP dé giúp phát hiện

va chân đoán ung thư phôi Kỹ thuật này đã chuyên đôi các hình ảnh sang thang độ xám, sau đó chọn các đặc diém cau trúc và biến đôi chúng thành hệ số DCT và hợp nhất chúng

để tạo ra một vector đặc trưng Cuối cùng, vector này được sử dung dé phân loại ảnh

ung thư phôi dựa trên phương pháp học máy SVM và KNN [14].

Firdaus va các đồng nghiệp đã sử dụng kỹ thuật Gray Level Co-occurrence

Matrix (GLCM) đề xử lý ảnh và phân tích hình ảnh GLCM là một phương pháp thong

kê tính toán tần suất các cặp pixel có mức độ xám cụ thể xuất hiện cạnh nhau trong ảnh

Thông tin này sẽ tạo thành một ma trận và sẽ được sử đụng dé phân loại lại anh ung thư phôi dựa trên phương pháp SVM {6}.

1.2.2 Học sâu (Deep learning)

Học sâu (Deep learning) là một nhánh con của trí tuệ nhân tao (artificial

intelligence) tập trung vào việc xây dựng và huấn luyện các mô hình học sâu dé tự động

học hoi từ dir liệu Trong học sâu, có các mang thần kinh sâu (deep neural networks)

được sử dụng dé mô hình hóa và học các biéu diễn phức tạp của dit liệu thông qua việc

sử dụng nhiều lớp nơ-ron ân Các mang thần kinh sâu này có khả năng tự học các đặc trưng cấp cao từ đữ liệu đầu vào một cách tự động mà không cần sự can thiệp của con người dé chỉ định các đặc trưng cụ thé Các mô hình học sâu đã được áp dụng trong các

nghiên cứu liên quan đến chân đoán ung thử phôi và đạt được kết quả tốt hơn so với các

phương pháp truyền thông Các bài báo đã đề xuất nhiều kiến trúc mô hình học sâu dé

mô hình có thé tự động học và khai thác các đặc trưng có lợi cho việc chân đoán ung

thư phôi.

Shimazaki và các cộng sự đã đề xuất một kiến trúc CNN bằng phương pháp phân

đoạn dé chân đoán ung thử phôi từ ảnh X-quang dé cải thiện độ nhạy (sensitivity) trong

khi vẫn duy trì kết quả FP (false positive) thấp Kiến trúc CNN của họ dựa trên kiến trúc

mã hóa-giải mã dé xuât ra phan đoạn ảnh Kiên trúc mã hóa-giải mã có câu trúc that cô

lá

Trang 17

chai, giúp giảm độ phân giải của bản đồ đặc trưng và cải thiện khả năng chống nhiễu và

quá khớp của mồ hình [17].

Abunajm và các cộng sự đã dé xuất một mô hình đựa trên CNN dé dự đoán và

phát hiện ung thử phôi từ hình ảnh chụp CT Mô hình này bao gồm một số lớp tích chập,

lớp gộp và lớp kết nỗi đầy đủ Mô hình này đã đạt được kết quả rất tốt với độ chính xác

là 99.45%.4].

1.3 Cac bộ dữ liệu tiêu chuẩn

1.3.1 Bộ dữ liệu hình ảnh mô bệnh học ung thư phối và đại tràng (Lung and Colon

Cancer Histopathological Image Dataset) (LC25000)

LC25000 [5] là bộ dữ liệu hình ảnh y học phục vụ cho nghiên cứu phan loại ung

thư và chân đoán y tế LC25000 chứa 25.000 ảnh màu được chia thành 5 lớp mỗi lớp

gồm 5000 ảnh:

e© Ung thư biểu mô đại trang (Colon_aca).

e M6 đại tràng lành tính (Colon_n).

e Ung thư biểu mô tế bao váy phổi (Lung sec)

¢ Mô phôi lành tính (Lung_n).

Và được chia thành 2 thư mục:

Mỗi hình ảnh có kích thước 768x768 pixel được lưu trữ đưới dang tệp jpeg.

1.3.2 Bộ dữ liệu CT và PET/CT quy mô lớn cho việc chan đoán ung thư phổi (A

Large-Scale CT and PET/CT Dataset for Lung Cancer Diagnosis)

(Lung-PET-CT-Dx)

Bộ dữ liệu Lung-PET-CT-Dx [10] bao gồm 251,135 hình ảnh DICOM CT và PET-CT của bệnh nhân ung thư phôi cùng tệp XML cho biết vị trí khối u Dữ liệu được thu thập từ bệnh nhân nghi ngờ ung thư phỏi, đã sinh thiết phối va PET/CT, sau đó được

phân thành 4 nhóm theo chân đoán mô bệnh học:

15

Trang 18

e A: Ung thư tuyến phôi (Adenocarcinoma).

e B: Ung thư biéu mô tế bao nhỏ (Small Cell Carcinoma).

e E: Ung thu biéu mô tế bào lớn (Large Cell Carcinoma).

Œœ

Bộ dữ liệu có độ phan giải cao (CT: 512x512 pixel, ImmxImm; PET: 200x200

Hình 1-1 Bộ dữ liệu Lung-PET-CT-Dx [10]

pixel, 4.07mm*4.07mm) Và vị trí của khôi u được 5 chuyên gia phẫu thuật nội soi nôi

tiếng có chuyên môn về ung thư phổi đánh dau, 2 người với 15 năm kinh nghiệm và 3

người còn lại có hơn 5 năm kinh nghiệm.

Thông tin về dữ liệu:

e ID bệnh nhân.

e Tudi.

16

Trang 19

tôi đa là khoảng 0.87 trên bộ kiểm thử.

Bộ dữ liệu Lung-PET-CT-Dx là mã nguồn mở và có thé được truy cập miễn phi,

giúp cho các nhà nghiên cứu va bác sĩ lâm sàng trên toàn thế giới có thé sử dụng nó dé

phát trién các thuật toán chân đoán ung thư phôi tốt hơn và nâng cao hiệu quả cham sóc sức khỏe cho bệnh nhân ung thư phỏi.

1.3.3 The Lung Image Database Consortium and Image Database Resource

Initiative (LIDC-IDRD

LIDC-IDRI | 16) chứa 1018 anh chụp CT có đánh dau các tồn thương được chú

thích ở định dạng DICOM Chú thích chân đoán được cung cấp ở định dạng XML Đỗi

với mỗi ảnh chụp CT, bốn bác sĩ chuyên khoa phôi giàu kinh nghiệm đã thực hiện quy

trình gồm 2 giai đoạn chú thích và rà soát.

¢ Giai đoạn 1: Các bác sĩ đánh giá từng ảnh CT và phân loại tôn thương

thành “khối u > 3 mm.” “khối u = 3 mm,” hoặc “không phải khôi u > 3

mm”.

e Giai đoạn 2: Sau đó, mỗi bác sĩ xem xét lại các phân loại của các tôn

thương khác va đưa ra chân đoán cudi cùng.

17

Trang 20

1.3.4 Phân tích hạch phôi 16 (Lung Nodule Analysis 16) (LUNA 16)

LUNA 16 [7] được phát triển từ LIDC-IDRI Bộ dữ liệu bao gom 36.378 chú

thích của các bác sĩ chuyên khoa trên 888 ảnh chụp CT được chọn lọc.

18

Trang 21

Các bác sĩ chuyên khoa chỉ đánh giá các chú thích được phân loại là khối u có

kích thước > 3 mm là các tôn thương liên quan; các khối u có kích thước < 3 mm và các tôn thương không phải khối u sẽ không được xem xét là liên quan đến các quy trình sàng

lọc ung thư phôi Tông cộng có 1186 khối được coi là các ví du đương tính (tức là các

tôn thương mà thuật toán cần phát hiện) Các khối u khác, tức là những khối u có đường

kính khác nhau, được coi là các phát hiện không liên quan sé không được tính là FP

(false positive) hoặc TP (true positive) và bị loại hoàn toàn khỏi quy trình đánh giá.

19

Trang 22

CHƯƠNG 2 CƠ SỞ LÝ THUYET

2.1 Các phương pháp chan đoán hình ảnh y khoa truyền thống:

2.1.1 Chụp X-quang ngực

Chụp X-quang ngực là phương pháp phô biến giúp pháp hiện các bắt thường có

trong phôi va các cơ quan xung quanh Đây là một phương pháp hữu ích dé sàng lọc ung

thư phôi ở những người có nguy cơ cao mắc bệnh ung thư.

2.1.2 Chụp CT ngực

Chup CT ngực tạo ra hình anh chi tiết hơn chụp X-quang về câu trúc của phôi vả các cơ quan xung quanh, cho phép bác sĩ nhận biết rõ ràng các biểu hiện của ung thư phôi CT ngực có thé phát hiện các khối u nhỏ hơn va phân loại chúng theo tính chat,

giúp đánh giá mức độ nghiêm trọng của bệnh Phương pháp này cho phép thu được hình

ảnh từ nhiều góc độ và mặt của phôi, cung cấp thông tin đa chiều về sự phát triển của

ung thư phôi Được coi là phương pháp tiêu chuan trong chân đoán và đánh giá sự phát triển của ung thư phôi.

2.1.3 Chụp PET/CT

Chụp PET/CT kết hợp hai công nghệ hình ảnh là PET (Positron Emission

Tomography) va CT (Computed Tomography) trong một quy trình Điều nay cho phép

cung cấp thông tin về cả chức năng va cau trúc của các mô trong cơ thé PET/CT sửdụng chất đánh đấu phát xạ đẻ phát hiện các tế bào ung thư, bao gồm cả các tế bào ungthư phổi và các điểm lan rộng có thể nằm ở những nơi khác trong cơ thể

2.1.4 Chụp cộng hưởng từ (MRD

Chụp cộng hướng từ (MRI) sử dụng từ trường và sóng radio dé tạo hình ảnh bên

trong cơ thẻ Phương pháp này có khả năng tạo ra hình ảnh chỉ tiết về cấu trúc của các

mô va cơ quan trong cơ thê, bao gôm ca phôi va các khôi u.

20

Trang 23

2.2 Mạng thần kinh (Neural Network)

Mạng thần kinh (Neural Network) là một phương thức trong lĩnh vực trí tuệ nhân tạo, lay cảm hứng bộ não của con người Các tế bao than kinh (no-ron) có trong bộ não

tạo thành một mạng phức tap, có tính liên kết cao và gửi các tín hiệu điện đến nhau đẻ

giúp con người có kha năng tư duy, xử lý thông tin có thé nhận biết được các sự vật,

hiện tượng khác nhau Một mang thần kinh nhân tạo (Artificial Neural Network) được

tạo từ:

¢ Các nơ-ron nhân tạo được gọi là nút (node) Mỗi nút này có thê nhận đầu

vảo, thực hiện một số phép tinh, va sau đó truyền kết quả ra các nút khác.

e Mang than kinh nhan tạo là tập hợp các nơ-ron nhân tao được tạo tô chức

thành các lớp và liên kết với nhau theo một số cách cụ thê.

Mạng thần kinh nhân tạo là các chương trình phan mém hoặc thuật toán đượcviết trên máy tính Các chương trình này mô phỏng cách thức hoạt động của não bộ con

người bằng cách sử dụng các nơ-ron nhân tạo Các nơ-ron nhân tạo là các khối phan

mềm nhỏ thực hiện các phép toán và truyền tín hiệu cho nhau Mục đích của mạng than

kinh nhân tạo la sử dụng máy tính đề tính toán và đưa ra dự đoán dựa trên dữ liệu.

Hình 2-1 Giải phẫu một nơ-ron [2]

Như hình trên, ta có thé thay một nơ-ron có thé nhận nhiều đầu vào và cho ra một

kết quả duy nhất Quá trình tính toán của một nơ-ron diễn ra như sau:

21

Trang 24

Trong hình:

XI, X2 Xm là các tín hiệu đầu vào từ các nơ-ron khác hoặc từ thông tin đầu

vào của mạng thần kinh Các tín hiệu nay được biểu điển dưới dang số

thực.

Wi, W2, , Wm là các trọng số liên kết, thé mức độ ảnh hưởng của mỗi tín

hiệu đầu vào đến kết qua dau ra của tế bảo than kinh.

Hàm kết hợp (Sum): Các tín hiệu đầu vào được nhân với trọng SỐ tương

ứng và sau đó được cộng lại.

Kết quả của phép tính trên sẽ được cộng thêm với một đại lượng có tên là

độ lệch (bias) và đưa qua một hàm kích hoạt (activation function).

Hàm kích hoạt (activation function): thường là các hàm phi tuyến tính Làđiều cần thiết để mạng học được các biểu diễn phức tạp giữa đầu vào vàđầu ra, tạo ra các dự đoán phi tuyến tính

Đầu ra (Output): là tín hiệu đầu ra của một tế bảo than kinh sẽ được sử

dung là đầu vào cho một tế bao than kinh khác hoặc là đầu ra của một

mang than kinh

22

Trang 25

2.3 Perceptron đa lớp (Multi Layer Perceptron) (MLP)

Multi Layer Perceptron là tập hợp tế bảo thần kinh tạo thành các nhóm mỗi nhóm

là một lớp tạo thành một mạng phức tap Mô hình của MLP gòm ba thành phan cơ bản

sau: lớp dau vào (inpuU lớp ân (hidđen) và lớp đầu ra (output) Mỗi lớp gồm nhiều nút

¢ Lớp dau vào (Input layer): Thông tin từ bên ngoài đi vào mạng no-ron

nhân tạo qua lớp đầu vào Mỗi nút trong lớp đầu vào đại diện cho một đặc

điểm của dữ liệu đầu vào.

e Lớp an (Hidden layer): Thực hiện các phép tính phức tạp dé trích xuất các

đặc điểm quan trọng từ thông tin đầu vào Mỗi nút trong lớp ân là một ron nhân tạo thực hiện các phép toán vả truyền tín hiệu cho các nơ-ron

nơ-khác Số lượng nơ-ron va số lượng lớp ân có thé thay đôi tủy theo độ phức

tạp của bài toán.

e Lớp đầu ra (Output layer): Đưa ra dự đoán hoặc quyết định dựa trên các

đặc điểm được trích xuất từ thông tin đầu vào Mỗi nút trong lớp đầu rađại điện cho một kết quá đầu vào có thẻ

23

Trang 26

2.4 Mạng thần kinh tích chap (Convolutional neural networks)

Mang than kinh tich chap (Convolutional neural networks = CNN) là một loại

mạng than kinh nhân tạo được sử dụng phô bién trong các tác vụ thị giác máy tính, đặc

biệt là phân tích ảnh Các lớp của CNN thường bao gồm một loạt các lớp được liên kết với nhau thông qua phép tích chập Lớp tiếp theo là kết quả tích chập từ lớp trước đó.

` CONVOLUTION + RELY — POOUMO CONVOLUTION + RELY POOUMO PATTON ce 1O91MAX

HIDDEN LAYERS CLASSIFICATION

Hình 2-4 Kiến trúc của CNN [1]

Kiến trúc của một CNN cơ bản sé bao hém: Lớp đầu vao (Input layer), lớp tích

chap (convolutional layer), hàm kích hoạt (activation layer), lớp gộp (pooling layer), lớp

kết nối hoàn toàn (fully connected layers)

2.4.1 Các kiểu lớp

Lớp tích chập (Convolutional layer)

Là một phân quan trọng trong mạng thần kinh, thường được sử dụng ngay sau

lớp đầu vào Trong lớp này, các bộ lọc (filter) hoặc hạt nhân (kernel) được áp dụng dé thực hiện phép tích chập trên dit liệu đầu vào, từ đó trích xuất các đặc trưng quan trọng.

Cách thức hoạt động của phép tích chập như sau:

e Phép tích chập được thực hiện trên hai hàm, thường được gọi là “hình ảnh

a.

dau vao” (input image) va “bộ lọc” (filter) hoặc “hat nhân” (kernel) Ham dau

24

Trang 27

vào có thé là tín hiệu, ảnh hoặc bat kỳ dit liệu nào khác có thẻ biểu diễn dưới

đạng ma trận Bộ lọc là một mảng nhỏ các giá trị được sử dụng dé “trượt” qua hình ảnh đầu vào.

Pilter/Kernet

(b)

Hình 2-5 Biểu diễn hình ảnh đầu vào và bộ lọc dưới dang ma trận

e Tich điểm: Tai mỗi vị trí trên hình ảnh đầu vào, bộ lọc được nhân với một

phan của hàm đầu vào có củng kích thước Các giá trị được nhân sau đó được

cộng lại đề tạo ra một gia trị đơn lẻ cho vị trí đó trên đầu ra.

¢ Lap lại: Quá trình này được lặp lại cho tat cả các vị trí trên hình ảnh dau vào,

bắt dau từ trái sang phải và tử trên xuống dưới Tạo ra một “ban dé đặc trưng”

(feature map) cho thấy mức độ tương quan giữa hàm đầu vào và bộ lọc tại

mỗi vị trí.

Image

Hình 2-6 Cách thức hoạt động của phép tích chap [1]

25

Trang 28

Lớp gộp (Pooling Layer):

Lớp gop là một phép giảm kích thước dữ liệu Lớp gộp sử dụng một cửa số

(pooling window) trượt qua toàn bộ bản đô đặc trưng, mỗi lần trượt theo các bước trượt

cho trước Lớp nảy giảm số lượng tham số, day nhanh quá trình tính toán, tránh quákhớp bằng cách làm giảm kích thước lớp trước đó nhưng vẫn giữ lại thông tin quantrọng Hai loại gộp phô biến lả:

«_ Gộp cực đại (Max Pooling): Giữ lại giá trị lớn nhất từ mỗi vùng của bản

46 đặc trưng sau mỗi lần di chuyên của cửa số gộp Max Pooling giữ lại

các đặc trưng nôi bật nhất

¢ Gộp trung bình (Average Pooling) Giữ lại giá trị trung bình từ mỗi vùng

của bản đồ đặc trưng sau mỗi lan di chuyển của cửa số gộp Giữ lại thông

tin chỉ tiết hơn so với gộp cực dai, có thé làm giảm nhiều trong dit liệu

Hình 2-7 Gộp cực đại và gộp trung bình

Ngoài hai phép gộp phô biến là gộp cực đại và gộp trung bình thì còn có gop tong

(sum pooling), gộp cực tiểu (min pooling)

26

Trang 29

Lớp kết nối đầy đủ (Fully connected layers)

Dữ liệu vào lớp này sẽ được làm phẳng thành một vectơ Mỗi phan tử ở vectơ

dau vào sẽ được kết nỗi với tat cả các vectơ cả lớp kết nỗi day đủ này Trong mô hình

CNN, lớp kết nỗi day đủ thường được tim thấy ở cuối mạng va dùng dé tôi ưu hóa mục

Hàm kích hoạt trong mạng thần kinh là một hàm được áp dụng cho đầu ra của

mỗi nơ-ron trong một lớp dé tạo ra đầu ra phi tuyên tính, giúp mạng thần kinh có khả

năng học và biêu dién các hàm phức tap Dưới đây là một số hàm kích hoạt phô biến.

Hàm Sigmoid:

Hàm Sigmoid có dạng hình chữ S chuyên đổi đầu vào là các số thực thành đầu

ra nằm trong phạm vi giữa 0 và 1 Điều này giúp nó phù hợp cho các bài toán phân loại,

nơi đầu ra cần được biêu diễn dưới dang xác suất Khi đầu vào đủ lớn (dương hoặc âm),

đạo hàm của hàm sigmoid tiến gần đến 0, dẫn đến hiện tượng biến mat đạo hàm

(vanishing gradient) và lam chậm quá trình học của mạng than kinh

Công thức của hàm Sigmoid:

1

a(x) =

27

Trang 30

Dao hàm của hàm Sigmoid có thé tính toán dé dang bằng cách sử dụng chính giá

trị của hàm Sigmoid Cụ thẻ nếu a(x) là giá trị đầu ra của hàm Sigmoid tại điểm x, thiđạo ham của ham Sigmoid tai điểm x được tinh bằng công thức sau:

Ham Tanh có dạng cong hình Hyperbolic Tangent, tương tự như chữ S nhưng có

giá trị đầu ra trong khoảng [-1, 1] và có tâm đối xứng tại 0 Khi dit liệu đầu vào có giá

trị trung bình gần 0, hàm Tanh sẽ hoạt động hiệu quả hơn vì nó có thé phân bố đều các

giá trị đầu ra cho các tín hiệu dương và âm

Hàm Tanh có biểu dién toán học như sau:

x —x

tanh(x) = aoe (3)

Hàm Tanh có nhiều ưu điểm tương tự như ham Sigmoid, bao gồm dé tính toán,

khả năng đạo hàm tốt và phù hợp cho các bài toán phân loại Tương tự như hàmSigmoid, hàm Tanh cũng dẫn đến van đề vẻ biến mat đạo hàm khi đầu vào đủ lớn, dẫnđến việc chậm quá trình học của mạng thần kinh

28

Trang 31

-100 =-75 =-5.0 -25 00 2.5 5.0 7.5 10.0

x

Hình 2-10 Đồ thị của hàm Tanh

Ham Rectified Linear Unit (ReLU):

Ham Rectified Linear Unit (ReLU) là một hàm kích hoạt phi tuyén phô biến trongmạng neural Hảm này được định nghĩa bởi công thức sau:

Relu(x) = max (0,x) (4)

Cụ thê:

« Khix >0, hàm ReLU trả về giá trị x.

« Khix<0, hàm ReLU trả về giá trị 0

Trang 32

Hàm ReLU chỉ đơn giản là chon giá trị lớn nhất giữa 0 và đầu vào, làm cho nótrở thành một trong những hàm kích hoạt nhanh nhất va dé tính toán Trong quá trình

lan truyền ngược (backpropagation), ReLU giữ nguyên đạo hàm bằng 1 đỗi với các giá

trị dương, không gây ra van dé về biến mat đạo hàm như các hàm kích hoạt khác như

sigmoid hay tanh.

Nếu gia trị đầu vào của một nơ-ron luôn nhỏ hơn 0, ReLU sẽ luôn trả về 0 cho

nơ-ron đó Nơ-ron nay được gọi là "nơ-ron chết" (dead neuron) và không còn khả năng

học.

Ham ReLU là một hàm kích hoạt hiệu quả và được sử dung phô biến trong mạng

nơ-ron nhân tạo Ưu điểm chính của ReLU là đơn giản, hiệu quả tính toán, và khả năng giải quyết vẫn đề biến mất đạo hàm Tuy nhiên, ReLU cũng có một số nhược điểm như

van dé "chết neuron" Các biến thé khác của ReLU có thê khắc phục nhược điểm của

Bước trượt (Stride):

Xác định số lượng pixel mà bộ lọc (filter) đi chuyên trong mỗi bước khi thực hiện

phép toán tích chập.

Có hai loại bước trượt chính:

e Bude trượt đơn (bước trượt = 1): Bộ lọc di chuyền một pixel trong mỗi

bước.

¢ Bước trượt lớn (bước trượt > 1): Bộ lọc di chuyển nhiều hơn một pixel

trong mỗi bước Vi dụ, bước trượt bang 2 có nghĩa là bộ lọc di chuyên hai

pixel trong mỗi bước.

Hiệu ứng của bước trượt:

30

Tiêu đề	Ứng Dụng Phương Pháp Học Chuyển Giao Vào Chẩn Đoán Bệnh Ung Thư Phổi
Người hướng dẫn	ThS. Trịnh Huy Hoàng
Trường học	Trường Đại Học Sư Phạm TPHCM
Chuyên ngành	Khoa Học Máy Tính
Thể loại	Khóa Luận Tốt Nghiệp
Năm xuất bản	2024
Thành phố	Thành Phố Hồ Chí Minh

Định dạng
Số trang	64
Dung lượng	54,92 MB

Khóa luận tốt nghiệp Khoa học máy tính: Ứng dụng phương pháp học chuyển giao vào chẩn đoán bệnh Ung thư phổi

THỰC NGHIỆM VÀ ĐÁNH GIÁ