Để phục vụ cho việc chẩn đoán bệnh, một số phương pháp đã đượcthực hiện dựa trên hình ảnh dữ liệu các bệnh về da và đưa ra chẩn đoán với độ chính xác khá cao.. Bài toán nhận diện ung thư
Trang 1ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC MÁY TÍNH
NGUYEN HOÀNG QUAN
KHOA LUAN TOT NGHIEP
TRONG HINH ANH TON THUONG DA
CU NHÂN NGANH KHOA HOC MAY TÍNH
TP HO CHi MINH, 2021
Trang 2ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG
TIN KHOA KHOA HOC MAY TINH
NGUYEN HOANG QUAN - 17520936
KHOA LUAN TOT NGHIEP
XAC DINH KHA NANG UNG THU AC TINH
TRONG HINH ANH TON THUONG DA
CU NHÂN NGANH KHOA HOC MAY TÍNH
GIANG VIEN HUONG DAN
TS MAI TIEN DUNG
TP HO CHi MINH, 2021
Trang 3DANH SÁCH HOI DONG BẢO VỆ KHÓA LUẬN
Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số
nầy cà cccsằ- của Hiệu trưởng Trường Đại học Công nghệ Thông tin.
1 Chủ tịch.
2Thư ký.
3Ủy viên
4Ủy viên.
Trang 4CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH
Tên khóa luận:
Ước lượng giãn cách xã hội trong video giám sát
hóm SV thực hiện: án bộh an:
Nguyễn Hoang Quân - 17520936 TS Mai Tiến Dũng
Đánh giá Khóa luận
1 Vê cuôn báo cáo:
Số trang Số chương
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một sô nhận xét về hình thức cuôn báo cáo:
Trang 53 Về chương trình ứng dụng:
Diém từng sinh viên;
Nguyễn Hoang Quân 0
Người nhận xét
(Ky tên va ghi rõ họ tên)
Trang 6CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH
Tên khóa luận:
Ước lượng giãn cách xã hội trong video giám sát
Nguyễn Hoàng Quân - 17520936
Đánh giá Khóa luậ
I Về cuốn báo cáo:
Số trang Số chương
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản pham
Một sô nhận xét về hình thức cuôn báo cáo:
Trang 73 Về chương trình ứng dụng:
Diém từng sinh viên;
Nguyễn Hoang Quân 0
Người nhận xét (Ký tên va ghi rõ họ tên)
Trang 8LỜI CÁM ƠN
Trong thời gian làm đồ án tốt nghiệp, em đã nhận được nhiều sự giúp đỡ, đóng góp ý kiến
và chỉ bảo nhiệt tình của thầy cô, gia đình và bạn bè.
Lời cảm ơn dau tiên em xin gửi đên TS Mai Tiên Dũng giáo viên hướng dân của em
-người đã tận tình hướng dẫn, chỉ bảo em trong suốt quá trình làm khoá luận.
Em cũng xin chân thành cảm ơn các thầy cô giáo trong trường Đại học Công nghệ thông
tin đã dạy dỗ cho em kiến thức về các môn đại cương cũng như các môn chuyên ngành,
giúp em có được cơ sở lý thuyết vững vàng và tạo điều kiện giúp đỡ em trong suốt quá
trinh học tập.
Em cũng xin chân thành cảm ơn gia đình và bạn bè, đã luôn tạo điều kiện, quan tâm, giúp
đỡ, động viên em trong suốt quá trình học tập và hoàn thành khoá luận tốt nghiệp.
Do giới hạn kiên thức và khả năng lý luận của bản thân còn nhiêu thiêu sót và hạn chê,
kính mong nhận được sự chỉ dẫn và đóng góp của các thây, cô đê khoá luận của em được hoàn thiện hơn Xin cảm ơn thây cô.
Trang 9ĐẠI HỌC QUOC GIA TP HO CHÍMINH CỘNG HOA XÃ HỘI CHỦ NGHĨA VIỆT NAM
TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc
CÔNG NGHỆ THÔNG TIN
ĐĂNG KÝ ĐÈ TÀI KHÓA LUẬN TÓT NGHIỆP
TÊN DE TÀI: Xác định khả năng ung thư ác tính trong ảnh ton thương da
TEN DE TÀI TIENG ANH: Identify melanoma in lesion images
Cán bộ hướng dẫn: TS Mai Tiến Dũng
Thời gian thực hiện: Từ ngày 07/09/2020 đến ngày 02/01/2021.
Sinh viên thực hiện:
Họ tên sinh viên - MSSV : Nguyễn Hoàng Quân - 17520936 Lớp: KHCL2017.2
Email: 17520936 @ gm.uit.edu.vn Điện thoại: 0834500688
Nội dung đề tai:(M6 ta chỉ tiết mục tiêu, phạm vi, đối tượng, phương pháp thực hiện,
kết quả mong đợi của đề tài)
A Mô tả bài toán:
- Cho hình ảnh chứa vùng da bị tôn thương, hệ thống sẽ xác định kha năng ung thư
ác tính trong hình ảnh đó.
B Đối tượng và phạm vi nghién cứu:
- Phạm vi nghiên cứu trong khóa luận được thực hiện theo mô tả trong cuộc thi
SIM - ISIC Melanoma Classification
(https://www.kaggle.com/c/siim-isic-melanoma-classification)
C Muc tiéu:
- Tim hiểu bài toán và các phương pháp nghiên cứu liên quan đến bai toán xác định
khả năng có ung thư ác tính từ vùng da bị ton thương.
- Thue nghiệm các phương pháp có độ chính xác cao, từ đó đề xuất các hướng cải
o Thực nghiệm lai một số giải pháp phù hợp
© Đánh gia và lựa chọn phương pháp phù hop với nang lực va khả năng tính
toán.
> Dự kiến kết quả:
Trang 10o Các hướng tiếp cận liên quan
o Những ưu và khuyết của các hướng tiếp cận này
o Hướng tiếp cận trong KLTN.
> Nội dung 2: Thực nghiệm và cải tiễn hệ thống.
> Phương pháp thực hiện:
© Thực nghiệm cải tiến bằng cách kết hợp các ưu điểm của các hệ thống nhằm
nâng cao độ chính xác hệ thông
© Submit kết quả và tinh chỉnh hệ thống.
> Dự kiến kết quả:
© Phương pháp hiệu quả cho bai toán
o Các kết quả thực nghiệm.
> Nội dung 3: Báo cáo KLTN
Kế hoạch thực hién:(M6 ta tóm tắt kế hoạch làm việc và phân công công việc cho từng
sinh viên tham gia)
Tháng 8-9: Khao sát và thực nghiệm các phương pháp liên quan.
Tháng 10: Thực nghiệm và cải tiến kết quả
Tháng 11: Tinh chỉnh hệ thong
Tháng 12: Viết bdo cáo và hoàn thiện KLTN.
Xác nhận của CBHD TP HCM, ngay thang năm 2020
(Ký tên và ghi rõ họ tên) Sinh viên
(Ký tên và ghi rõ họ tên)
Mai Tiến Dũng
Trang 1114 Mục tiêu dé tai} ee 4
15 Câu trúc Khóa luận tốt nghiệp| - 4
3 HƯỚNG TIẾP CÂN TRONG KHÓA LUẬN 14
3.3 Giaiđoandự đoán| Ặ Q Q TQ HQ HQ eee 24
Trang 124 THỰC NGHIỆM VÀ ĐÁNH GIÁ
4.1 Môi trường và ngôn ngữ cài đặt
4.2 Phương pháp đánh giá|
4.21 Độ đo ROC-AUC|
¬ eee 4.5 Kết quả huấn luyện mô hình|
4.6 Kết quả tổng hợp mô hinh]}
5 _KÊTLUẬN 51 Kếtluận
52 _ Hướng pháttriển
A Cơ sở lý thuyết A.1 K-Nearest Neighbors} .
A.11 Ý tưởngcủaKNN|
A.1.2 Các bước chính củaKNNL
A.2_ Suport Vector Machinel
A.2.1 Ý tưởng chính của SVM A.2.2_ Các bước chính của SVM A.3 Decision Tree]
A.3.1 Thuật toán Iterative Dichotomiser 3}
AA Logistic Regression)
A.5 Naive Bayes}
A.5.1 Dinh ly Bayesl
A.5.2 Các mô hình thuật toán Naive Bayes}
A.6 Neuron Network)
A.7_ Convolutional Neuron Network
Bibliography
xii
27
27
27
28
30
34
36
37
42 42
42
44 44
44
46
46 48
49
50
50
51
54
54
55
56
58
62
Trang 13Danh sách hình ve
11 Bénh ung thư hắc tô da và lenigoNOS[] 3
12_ Bệnhung thư hắc tổ da và nevus| 3
13 Bệnh ung thu hắc tô da và seborrhic keratosisl 4
21 Lanrộng bÊmặt| c Ặ co 7 2.2 Ung thưhắc tố thểnốt 7
2.3 Ung thư hắc tô Lentigo ác tính| 8
c.-1k Ễ 9
3.1 Kiến trúc tong quan của hệ thống - giai đoạn huấn luyện 15 3.2 Tỉ lệ mô hình theo chiều rộng, chiều sâu, độ phân giải nguồn [15]| 20 3.3 Kiến trúc của EfficientNet| 21
3.4 Cấu trúc mô hình sử dung metadata Nguôn: [6]] 23 3.5 Kiến trúc tổng quan của hệ thông - giai đoạn dự đoán 24 41 Cấu trúc filesubmitl - 28
4.2 Đường cong ROC|[ Ặ Ặ.ẶẶ SỐ V SẺ Ợ 29 4.3 diện tích ở dưới đường cong ROC| 29
4.4 Hinh ảnh từ bộ du liệu ISIC 2020| - 31
4.5 Hinh ảnh từ bộ du liệu ISIC 2020| - 31
4.6 Hình ảnh từ bộ du liệu ISIC 2019| 33
4.7 Hình ảnh từ bộ dữ liệu ISIC 2019| - 33
TH tee eee 34 bbb 34 HH e rece 35 Occ vce 35
4.12 Biểu đồ so sánh kết quả của các modelÌl - 37 4.13 Biểu đồ so sánh kết quả tổng hợp của các model 40
Trang 144.14 Biểu đỗ so sánh kết quả tổng hợp của các model khi chưa chuyển
dữ liệu về trong khoảng 0 đến 1| - 41
A.1 Bản đồ của kmn với k = 1.(Nguôn Wikipedia)
A.2_ SVM dùng để phân tập dữ liệu thành 2 lớp Nguồn [14||
A.5 Quá trình xử lí thông tin của neuralnetwork| 58
A.6 Cấu trúc của mạng CNN Nguỏn [8|| - 59
Trang 154.6 Kết quả của cácmodell ee 39
4.7 Kết quả của các model khi không chuyển dữ liệu về 0 tới 1| 41
Trang 16Danh mục từ viết tắt
AUC Area Under the (ROC) Curve CNN Convolutional Neural Network SVM_ Support Vector Machine
KNN Nearest Neighbor
Trang 18TOM TAT KHOA LUAN
Y Dược là một ngành khoa hoc với vai trò đặc biệt cao cả, đó là cham sóc sức
khoẻ cho con người - mục tiêu và động lực của quá trình phát triển; Quá trìnhphát triển do chính con người thực hiện và nhằm mục đích nâng cao chất lượngđời sống con người Vì vậy việc nghiên cứu phát triển cũng như ứng dụng cácthành tựu mới về khoa học công nghệ trong lĩnh vực t tế cần được hết sức coi
trọng.
Một trong các bệnh khó điều trị nhất của con người hiện nay chính là ung thư.Tuy nhiên trong số đó thì ung thư da nếu phát hiện sớm có thể điều trị khỏi hoàn
toàn, cho nên van dé chẩn đoán sớm ung thu da ngày càng trở nên cần thiết và
quan trọng Để phục vụ cho việc chẩn đoán bệnh, một số phương pháp đã đượcthực hiện dựa trên hình ảnh dữ liệu các bệnh về da và đưa ra chẩn đoán với độ
chính xác khá cao.
Vì vậy với mục đích tìm hiểu và xây dựng một chương trình có thể ứng dụngtrong y tế nên em đã chọn đề tài là xác định khả năng ung thư ác tính trong hìnhảnh tổn thương da
Khóa luận trình bày quá trình tìm hiểu, thực nghiệm phương pháp đạt hạng 1 l6]
trong cuộc thi SHM-ISIC Melanoma Classification Identify Melanoma In Lesion
Images do Kaggle tổ chức và áp dung các kiến thức trong lĩnh vực máy học, thigiác máy tính để thử nghiệm các phương pháp đã được học để thử nghiệm ởbước tổng hợp mô hình Cuối cùng sinh viên phân tích, đánh giá các kết quả đạt
được.
Trang 19Chương 1
TỔNG QUAN
Tóm tắt
Trong chương này, chúng tôi trình bày định nghĩa về bài toán Nhận diện ung
thư ác tính, các ứng dụng trong thực tế và các thách thức mà bài toán đang gặp
phải Chúng tôi đưa ra mục tiêu, nội dung cụ thể và phương pháp thực hiện Cấutrúc của Khóa luận tốt nghiệp cũng sẽ được đẻ cập trong chương này
11 Giới thiệu bài toán
Ngày nay ung thư da là một trong những loại ung thư phổ biến nhất [13].
Trong đó ung thư hắc tố là một dạng ung thư da nghiêm trọng bắt đầu từ các tếbào được gọi là tế bào hắc tố Mặc dù ít phổ biến hơn ung thư biểu mô tế bào đáy
và ung thư biểu mô tế bào vảy, ung thư hắc tổ nguy hiểm hơn vì khả năng lây lan
sang các cơ quan khác rất nhanh nếu không được điều trị ở giai đoạn đầu 75%
ca ung thư đa tử vong là do ung thư hắc tố gây ra Hiệp hội Ung thư Hoa Kỳ ước
tính đến năm 2020 sẽ có hơn 100000 trường hợp bị ung thư ác tính, mà trong đó
có gần 7000 người sẽ chết vì căn bệnh này Vì vậy việc phát hiện sớm và chính xác
các dấu hiệu của căn bệnh - với sự hỗ trợ của khoa học máy tính có thể giúp hàngnghìn người được điều trị hiệu quả hơn
Bài toán nhận điện khả năng ung thư ác tính sẽ có :
- input : hình ảnh một vùng da bị tổn thương.
- output : xác xuất cho biết phan trăm mà hình ảnh đó có thé bị ung thư ác tính
Trang 20Chương 1 TONG QUAN 2
của cơ thể, nó sẽ trở nên khó điều trị hơn và có thể gây chết người
- Tỉ lệ sống sót ước tính trong 5 năm đối với những bệnh nhân Hoa Kỳ có khối u
ác tính được phát hiện sớm là khoảng 99%.
- Ước tính sẽ có khoảng 6850 người (4610 nam và 2240 nữ) sẽ chết vì u ác tính ở
Hoa Kỳ vào năm 2020.
Bởi vì sự nguy hiểm của u ác tính, nên việc có thể chẩn đoán chính xác, phát
hiện sớm là điều rất cần thiết và quan trọng.Với sự phát triển của mạng học sâudựa trên thị giác máy tính đã thúc đẩy độ chính xác của các mô hình tới gần trình
độ của con người hơn Ngoài ra bài toán còn có thể mở rộng quy mô và có thể
được sử dụng bởi các bác sĩ ở những vùng khó khăn.
Bài toán nhận diện ung thư hắc tố có thể được sử dụng ở các phòng khám da
liễu, bệnh viện hoặc trong các hộp công cụ của các bác sĩ da liễu để giúp các bác
sĩ có thể nâng cao độ chính xác chuẩn đoán của họ, hỗ trợ tốt hơn cho công việc
Từ đó có thể giúp nhiều người bệnh được phát hiện sớm để có thể điều trị hiệu
quả hơn.
Trang 21(A) melanoma (B) lentigo NOS
HÌNH 1.1: Bệnh ung thư hắc té da và lentigo NOS
HÌNH 1.2: Bệnh ung thư hắc tố da và nevus
Trang 22trong cuộc thi SIIM-ISIC Melanoma Classification Iden-tify Melanoma In Lesion
Images và thực hiện một số thay đổi ở bước tổng hợp các mô hình
1.5 Câu trúc Khóa luận tot nghiệp
Nội dung Khóa luận tốt nghiệp được tổ chức như sau:
e Chương [I|giới thiệu tổng quan vẻ khóa luận.
° Chuong)2trinh bày cơ sở lý thuyết va các nghiên cứu liên quan đến bài toán
này.
° Chuong|3|trinh bày chỉ tiết các hướng tiếp cận của khóa luận.
¢ Chương |4| trình bày môi trường thực nghiệm, tập dt liệu, phương pháp
đánh giá và kết quả thực nghiệm
° ChươngJ|là phần kết luận và hướng phát triển của khóa luận.
Trang 232.1 Tổng quan về ung thư da
Ung thư da hắc sắc tố (ung thư tế bào hắc tổ hay Melanoma) là loại ung thư
da nghiêm trọng nhất, phát triển trong các tế bào (melanocytes) sản xuất melanin
- sắc tố quyết định màu sắc làn da.
Tế bào hắc tố là tế bào da được tìm thấy ở lớp trên của da Chúng tao ra mộtsắc tổ được gọi là melanin, mang lại màu sắc cho da Có hai loại melanin: eume-
lanin và pheomelanin.
Khi da tiếp xúc với bức xa tia cực tim (UV) từ mặt trời hoặc giường tắm nắng,
nó sẽ gây tổn thương da khiến các tế bao hắc tố sản sinh ra nhiều hắc tố hơn,nhưng chỉ có sắc tố eumelanin cé gắng bảo vệ da bang cách làm cho da đen hoặc
rám nắng U hắc tố xảy ra khi tổn thương DNA do đốt cháy hoặc sạm da do bức
xạ tia cực tím gây ra những thay đổi (đột biến) trong tế bào hắc tố, dẫn đến sựphát triển không kiểm soát của tế bào
Những người có làn da sam màu tự nhiên có nhiều eumelanin hon và những
người có làn da trắng tự nhiên có nhiều pheomelanin hơn Trong khi eumelanin
Trang 24Chương 2 NGHIÊN CUU LIÊN QUAN 6
có khả năng bảo vệ da khỏi tác hại của ánh nắng mặt trời thì pheomelanin thì
không Đó là lý do tại sao những người có làn da sim màu có nguy cơ phát triểnkhối u ác tính thấp hơn những người có làn da trắng, do thiếu eumelanin nên dễ
bị tổn thương do ánh nắng mặt trời, bỏng rát và ung thư da
Mặc dù ít phổ biến hơn ung thư biểu mô tế bào đáy (BCC) và ung thư biểu mô
tế bào vảy (SCC), u ác tính nguy hiểm hơn vì khả năng lây lan sang các cơ quankhác nhanh hơn nếu không được điều trị ở giai đoạn dau
2.1.1 Cách nhận dạng u ác tính
U hắc tố có nhiều hình dạng, kích thước và màu sắc khác nhau Đó là lý dotại sao rất khó để cung cấp một tập hợp các dấu hiệu cảnh báo toàn diện.Ung thư
da hắc sắc tố có xu hướng gia tăng ở những người dưới 40 tuổi, đặc biệt là phụ
nữ Tuy nhiên, néu phát hiện được những thay đổi sớm và được điều trị trước khiung thư lan rộng, bệnh có thể được chữa khỏi
Ung thư da hắc sắc tố có thể hình thành ở bắt cứ vị trí nào trên cơ thể nhưngthường thây nhất ở những vùng da tiếp xúc với ánh nắng mặt trời như lưng, chân,
tay và mặt.
Ngoài ra, ở người có màu da tối, ung thư dang này cũng có thể xuất hiện ở những
vị trí không tiếp xúc nhiều với ánh nắng mặt trời như lòng bàn chân, lòng bàn tay
và giường móng tay.
Khối u ác tính dạng này cũng có thể hình thành trong mắt hay trong mũi hoặc
cổ họng (hiếm) Nốt ruôi trên cơ thể có sự thay đổi về hình dang, màu sắc, kích
thước
Xuất hiện những đốm, mảng khác màu trên da, phát triển bất thường
2.1.2 Bốn loại u ác tính chính
Ung thư hắc tố lan rộng bé mặt: Loại này chiếm 70% ung thu hắc tố Thông
thường không có triệu chứng, nó xảy ra phổ biến nhất trên cang chân của nữ
giới và thân mình ở nam giới Thương tổn thường là mảng có các vùng da không
đều, nổi cao, màu rám hoặc nâu, thường có các đốm đỏ, trắng, đen và xanh hoặc
Trang 25Chương 2 NGHIÊN CUU LIEN QUAN 7
các nốt xanh-đen nhỏ, đôi khi có màu xanh Nên chu ý những dấu hiệu của bờ
thương tổn, cùng với việc mở rộng hoặc thay đổi màu sắc Về mặt mô học, các tếbào hắc tố không điển hình xâm nhập đặc trưng vào lớp trung bì và thượng bì
HÌNH 2.1: Lan rộng bé mặt
Ung thư hắc tố thể nốt Loại này chiếm từ 15 đến 30% ung thư hắc tố Nó có
thể xảy ra ở bất kỳ nơi nào trên cơ thể như là một sẩn tối màu, hoặc một mảngthay đổi từ màu ngọc trai để màu xám, đến màu đen Đôi khi, một thương tổn
chứa ít chất sắc t6 hoặc có thể trông giống như một khối u mạch máu Trừ khi nó
bị loét, ung thư hắc tố thể nốt không có triệu chứng, nhưng bệnh nhân thường
tìm lời khuyên bởi vì tổn thương nhanh chóng lan rộng.
HINH 2.2: Ung thư hắc tố thể nét
Ung thư hắc tố Lentigo ác tính Loại này chiếm 5% ung thư hắc tố Nó có xu
hướng phát sinh ở bệnh nhân lớn tuổi Nó phát sinh từ lentigo ác tính (tàn nhang
Trang 26Chương 2 NGHIÊN CUU LIÊN QUAN 8
Hutchinson hoặc khối u hắc tố ác tính tại chỗ - một đốm nâu nhạt hoặc nâu)
Nó thường xảy ra trên mặt hoặc các vùng tiếp xúc với ánh nắng mạn tính như
là một dát hoặc mảng phẳng, màu rám hoặc màu nâu, không có triệu chứng, với
các dém nâu sam hoặc đốm đen phân tán không đều trên bề mặt của nó Trong
lentigo ác tính, cả tế bào hắc tố bình thường và ác tính đều giới hạn ở lớp thượng
bì Khi các tế bào hắc tố ác tính xâm nhập vào lớp trung bì, tổn thương này đượcgọi là ung thư hắc tố lentigo ác tính, và ung thư có thể di căn Loại u ác tính này
thông thường có các đột biến ở gen C-kit
Khối u ác tính tuyến bã đậu : Đây là dạng u ác tính phổ biến nhất được tìm
thấy ở những người da màu, bao gồm cả những cá nhân có tổ tiên gốc Phi Nó
thường xuất hiện ở những vị trí khó phát hiện bao gồm cả đưới móng tay và lòngban chân hoặc long bàn tay Nó có thể xuất hiện dưới dang một vùng màu den
hoặc nâu.
Trang 27Chương 2 NGHIÊN CUU LIÊN QUAN 9
2.2 Các nghiên cứu liên quan
Năm 2020 đã có rất nhiều công trình nghiên cứu của các bệnh về da đượccông bố tại hội nghị CVPR (Conference on Computer Vision and Pattern Recog-nition).Trong đó bài toán nhận điện ung thư hắc tố từ hình ảnh da tổn thương làbài toán liên quan mật thiết đến các bài toán về nhận diện các bệnh về da Vì vậy
trước khi giải quyết bài toán nhận diện ung thư hắc tố ta cần nghiên cứu về cácbài toán xử lí các căn bệnh về da
2.2.1 Tình hình nghiên cứu của các bài toán liên quan
Mạng học sâu đã được áp dụng trên rất nhiều các lĩnh vực từ phân tích hình
ảnh đến xử lí ngôn ngữ tự nhiên Gần đây mạng học sâu cũng đã có thành cônglớn trong việc phân loại va phân đoạn ảnh y tế [1] , Haenssle và cộng sự [7] vàBrinker [3] đã thực hiện các nghiên cứu chỉ ra rằng hiệu suất của các mô hình họcsâu có thể cạnh tranh với các bác sĩ da liễu Phân đoạn theo ngữ nghĩa (semanticsegmentation) là một nhiệm vụ quan trọng và phổ biến trong việc làm cho máytính có thể hỗ trợ chẩn đoán bệnh qua hình ảnh da Mặc dù các phương pháp tiếpcận dựa trên học sâu đã cải thiện đáng kể sự chính xác của phân đoạn những vẫn
có những cách để cải thiện bằng cách giải quyết những thách thức lớn như màu
sắc [11], sự thay đổi về hình dạng tổn thương, kích thước và các mức độ tương
phan khác nhau Tuy nhiên, mang học sâu có hiệu quả nhất khi có sẵn một lượnglớn dữ liệu lớn để có thé dao tao và như vậy sẽ khó khăn khi tìm dữ liệu cho
Trang 28Chương 2 NGHIÊN CUU LIÊN QUAN 10
những căn bệnh hiếm gặp Một số cách để để đối phó với van đề ít đữ liệu này
đã dé xuất như transfer learning [9l và few-shot learning đòi hỏi mạng phải
được đào tạo trước trên một số lượng lớn dữ liệu đã được gắn nhãn Thu thập
data của các bệnh về da là khá khó khăn, trong hoàn cảnh này, kho lưu trữ ISIC
đóng một vai trò quan trọng trong lĩnh vực cung cấp bộ đữ liệu về tổn thương
đa lớn nhất được sử dụng bởi hầu hết trong các bài báo về mạng học sâu
Subhranil Bagchi và các đồng nghiệp [2] đã đề xuất sử dụng hai kỹ thuật học
sâu kết hợp (được đào tạo với trọng số bị tổn thất) để cái thiện độ chính xác so với
các mô hình phân loại riêng lẻ Kỹ thuật kết hợp giúp giảm bớt sự chính xác quá
mức (over-fitting) do mất cân bằng trong tập dữ liệu Ngoài ra, nhóm tác giả déxuất module CS-KSU (Class Specific - Known vs Simulated Unknown) để phát
hiện sự hiện diện của hình ảnh thuộc các lớp lạ trong lúc kiểm tra Phương phápcủa nhóm tác giả gồm 2 bước chính là :
© Xây dựng thành phần Stacking: nhằm phân lớp hình ảnh tổn thương da
thành một trong các bệnh đã được biết trước Để xây dựng Stacking mô đun,nhóm tác giả huấn luyện 4 mô hình sử dụng EfficientNet-B2, EfficientNet-B5(với 2 thiết lập) và DenseNet
© Xây dung module CS-KSU : nhằm xác định một cách chắc chắn rằng thành
phần Stacking có nhận biết hình ảnh tổn thương da chính xác hay không
Module CS-KSU bao gồm các module phân loại hai lớp, mỗi module được
dùng để nhận biết một trong các lớp đã biết trong tập dữ liệu Module KSU kết luận kết quả của phân loại trong khi thành phan Stacking sẽ đưa
CS-ra lớp của một hình ảnh Module CS-KSU sẽ quyết định kết quả mà thành
phan Stacking đưa ra là đúng hay sai Trong trường hợp mô hình khôngnhận ra hình ảnh thuộc lớp nào, ảnh đó sẽ thuộc lớp Unknown(chua biết)
Kushagra Mahajan và các đồng nghiệp cũng đã tìm hiểu và đưa ra các hướng
tiếp cận sử dụng meta-learning dựa trên few-shot learning như phương pháp
Reptile( phương pháp dựa trên độ đốc) và mạng Prototypical(dựa trên khoảngcách) để xác định các tổn thương da từ các hình ảnh y tế Nhóm tác giả để xuấtphương pháp tiếp cận gọi là mạng Meta-DermDiagnosis sử dụng meta-learning
để tạo điều kiện thích ứng nhanh chóng với mạng lưới thần kinh sâu được đào
Trang 29Chương 2 NGHIÊN CUU LIÊN QUAN 11
tạo dựa trên các mẫu dữ liệu về các bệnh thông thường Nhóm tác giả đã thựchiện các điều sau trong bài báo :
° Sử dụng meta-learning để xác định các bệnh hiếm gặp trong bộ dữ liệu hình
ảnh tổn thương da có ít data được ghi chú bằng cách định nghĩa vấn dé như
1-shot, 3-shot, 5-shot phân loại.
© Tìm hiểu mạng Reptile và dựa trên đo lường để xác định bệnh từ hình ảnh
tổn thương da trong dữ liệu thấp
¢ Chứng minh tích chập G có thể cải thiện đáng kể hiệu suất của mạng trong
trường hợp hình ảnh tổn thương da vì hướng của hình thường không phải
là một thuộc tính quan trọng trong hình ảnh tổn thương da.
© Đánh giá mạng Meta-DermDiagnosis trên các bộ dit liệu về tổn thương da
trong đó với bộ dữ liệu ISIC 2018 có điểm AUC trung bình đạt 86.8.
2.2.2 Tình hình nghiên cứu của bài toán nhận diện ung thư ác
tính
Trong cuộc thi SHM-ISIC Melanoma Classification Identify melanoma in
le-sion images 2020 (nhan dién ung thu hắc tố dựa trên các hình anh tổn thương
da) được tổ chức ở Kaggle Những người tham gia được yêu cầu xây dựng các
mô hình để có thể nhận điện bệnh ung thư hắc tố da sử dụng hình ảnh các tổn
thương da và meta data.
Có hơn 3300 đội tham dự, Oishen Ha và các cộng sự đã đạt hạng 1 trong cuộc
thi này (ol với phương pháp là sử dụng các mô hình lần lượt là EfficientnetB3,
Effi-cientnetB4, EfficientnetB5, EfficientnetBó, EfficientnetB7, se_resnext101, resnest101,
cùng với đó sử dụng các size hình ảnh khác nhau với từng mô hình.Ngoài bộ
dataset ISIC 2020 của cuộc thi, nhóm còn sử dụng thêm bộ dataset ISIC 2019 đểgiúp việc huấn luyện đạt hiệu quả cao hơn Target của bộ dataset là 0 (âm tính)
và 1(dương tính), Qishen Ha và các cộng sự đã thay đổi và dùng cột diagnosistrong dataset để làm target Khi dùng cột diagnosis để làm target thì dữ liệu của
dataset ISIC 2020 và ISIC 2019 khác nhau nên nhóm đã thay đổi bằng cách gán lại
cột diagnosis của dataset ISIC 2020 theo cách dưới đây.
Trang 30Chương 2 NGHIÊN CUU LIÊN QUAN 12
¢ 2020 seborrheic keratosis -> BKL
¢ 2020 lichenoid keratosis -> BKL
¢ 2020 solar lentigo -> BKL
se 2020 lentigo NOS -> BKL
e 2020 cafe-au-lait macule -> unknown
se 2020 atypical melanocytic proliferation -> unknown
se 2020 nevus -> NV
se 2020 melanoma -> MEL
Sau khi da train 18 mô hình Oishen Ha và các cộng sự tổng hợp các model lại
bằng cách tính trung bình của các model đó và kết quả là 0.9490
lan Pan — người đạt hạng 2 trong cuộc thi với kết quả là 0.9485 đã sử dụngcác mô hình EfficientNet-B6 và EfficientNet-B7 để huấn luyện rồi sau đó kết hợp
lại.Trước đó lan Pan đào tạo một mô hình trên bộ dữ liệu ISIC 2019 chỉ sử dụng
cột diagnosis làm target, do bộ dữ liệu năm 2019 có chẩn đoán bổ trợ khá day
đủ trong khi bộ dữ liệu năm 2020 không cho biết Sau đó áp dụng mô hình lên
bộ dữ liệu ISIC 2020, mục đích là để gắn nhãn unknown là nevus hoặc không
nevus Bây giờ tất cả các tập dữ liệu ISIC 2019 và ISIC 2020 đều có các nhãn ởcột diagnosis là unknown, melanoma, nevus Ipan sẽ train dữ liệu lấy 3 thong tin
này làm target Ngoài ra,do số lượng ảnh bị ung thư hắc tổ trong tập dir liệu ISIC
2019 lớn hơn ISIC 2020 khá nhiều nên lan Pan đã thực hiện Upsampling các ảnh
bị ung thư hắc tố trong tập dữ liệu ISIC 2020 lên 7 lần để số lượng ảnh bị ung thưhắc tố trong 2 tập di liệu là như nhau Yếu tố quyết định dé đạt điểm cao trong
bài của lan Pan là Pseudolabeling, do số lượng ảnh bị ung thư hắc tố trong tập
dữ liệu ISIC 2020 rất ít, nên việc thực hiện Pseudolabeling đã giúp cái thiện hệ
thống và làm tăng số điểm
Masdevallia - người đạt hạng 3 trong cuộc thi với kết quả là 0.9484 đã huấn
luyện 8 mô hình với mô hình mạng EfficientNet-B5,Bó,B7 và sử dụng các size
Trang 31Chương 2 NGHIÊN CUU LIÊN QUAN 13
hình khác nhau như bảng 2.1.
Trong để tài này, sinh viên tìm hiểu phương pháp xây dựng hệ thống dựa trên
phương pháp đạt hạng 1 trong cuộc thi SIIM-ISIC Melanoma Classification
Iden-tify melanoma in lesion images vì đây là phương pháp có số điểm cao nhất trong
Trang 32Nhận diện ung thư là một chủ đề được các nhà khoa học thường xuyên nghiên
cứu của lĩnh vực thị giác máy tính lẫn trong y học Vì ung thư da có tỉ lệ gây tử
vong cao nhưng có thể chữa khỏi nếu phát hiện sớm nên nếu bài toán nhận diệnung thư được thực hiện thành công với tỉ lệ dự đoán chính xác cao thì sẽ có thể
sẽ được áp dụng rộng rãi và giúp được rất nhiều người phát hiện bệnh sớm để
có những biện pháp chữa trị hợp lí nhất cũng như giúp các bác sĩ trong việc dự
đoán bệnh cho bệnh nhân.
Trong phạm vi dé tài này, sinh viên sẽ tìm hiểu phương pháp xây dung mô
hình của nhóm dat hạng 1 [13] trong cuộc thi SHM-ISIC Melanoma Classification
Identify Melanoma In Lesion Images cùng với đó thử nghiệm một số thay đổi ởbước tổng hợp mô hình Trong phần này, sinh viên sẽ giới thiệu về phương pháp
của mô hình.
Trang 33Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 15
3.2 Giai đoạn huấn luyện
Giai đoạn huấn luyện của hệ thống sẽ gồm các bước xử lí dữ liệu, xử lí ảnh
đầu vào, và huấn luyện mô hình mạng học sâu
⁄/ Xử lí dữ liệu Xử lí ảnh đầu vào), Mô hình mạng
- 2 class -> 9 class
—>* -SE ResNextl01
- Sử dung thém dataset Pi a c7 ea
dataset isic 2020
Tiền Xử lí dữ liệu
HÌNH 3.1: Kiến trúc tổng quan của hệ thống — giai đoạn huấn luyện
3.2.1 Tiền xử lí dữ liệu
Mục đích nhận diện của mô hình là có bị ung thư hắc tố hoặc không bị ung
thư hắc tố, tuy nhiên trong dataset ISIC 2020 có 33000 hình trong tập train chỉ có
1.76% hình bị ung thư hắc tố Với dữ liệu ít như vậy khi train sẽ gây ra khó khăn
và sẽ đạt hiệu quả không cao Dataset ISIC 2019 tuy có ít hình trong tập train hơn
(25000 hình) tuy nhiên lại có 17.85% hình bị ung thư hắc tố - gấp 10 lần so với
dataset ISIC 2020, vì vậy việc sử dụng thêm dataset ISIC 2019 sẽ giúp việc đánh
giá mô hình tốt và ổn định hơn Để giúp kết quả của mô hình đạt hiệu quả cao,
bộ dữ liệu được chia thành 5 fold với các quy tắc sau đây :
¢ Tach riêng người bệnh: Một bệnh nhân trong tập dữ liệu có thé có nhiều
hình, nên tất cả hình ảnh của một bệnh nhân bây giờ đều thuộc trong cùng
1 fold
e Cân bằng các hình ảnh bị ung thư hắc tố: Số lượng ảnh bị ung thư hắc tô rất
ít 1.76% nên mỗi fold cũng sẽ có 1.76% hình ảnh bị ung thư hắc tố
Trang 34Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 16
* Cùng một bệnh nhân có vài người có nhiều ảnh trong tập dữ liệu, có người
có ít ảnh trong tập dữ liệu nên ở số lượng người có số ảnh trong tập dữ liệu
bằng nhau sẽ ở cùng một fold
Tăng cường hình ảnh (image augmentation) là một nhiệm vụ quan trong để mô
hình không bị overfit.Sinh viên sử dụng các hàm của thư viện Albumentation[4]
của Pytorch để tăng cường dữ liệu
Trang 35Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 17
3.2.2 Các lớp của mô hình
File miêu tả của tập train có một cột là chẩn đoán (diagnosis) gồm 9 giá trịlần lượt như sau : atypical melanocytic proliferation, cafe-au-lait macule, lentigo
NOS, lichenoid keratosis, melanoma, nevus, lichenoid keratosis, solar lentigo,
un-known thể hiện cho các bệnh về da Trong đó giá trị melanoma cho biết ảnh đó
bị ung thư hắc tố, còn lại các giá trị khác cho biết ảnh đó không bị ung thư hắc
tố Anh sẽ là ung thư hắc tố khi và chỉ khi cột diagnosis có giá trị là melanoma,
tuy nhiên khi ảnh không phải là ung thư hắc tố thi sé có nhiều giá trị hơn so vớitarget ban đầu Như vậy néu sử dụng cột diagnosis lam target sẽ cho model nhiều
thông tin hơn
Tuy nhiên có một van dé khi sử dụng cột diagnosis làm target Do sử dụng 2
bộ dataset là ISIC 2020 va ISIC 2019 và giá trị của cột diagnosis của 2 dataset khác nhau Dataset ISIC 2020 có 9 giá trị là: atypical melanocytic proliferation, cafe- au-lait macule, lentigo NOS, lichenoid keratosis, melanoma, nevus, seborrheric
keratosis, solar lentigo, unknown Dataset ISIC 2019 có 8 giá trị là : AK, BCC,
BKL, DF, MEL, NV, SCC, VASC Vì vay ta sẽ chuyén các giá tri của bộ dataset từ
năm 2020 sang năm 2019 như trong bảng 3.1
BANG 3.1: Chuyển từ diagnosis sang target
2019 Diagnosis 2020 Diagnosis Target
DF DF
cafe-au-lait macule unknown atypical melanocytic proliferation
Trang 36Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 18
Như vậy model sẽ có 9 target trong đó có một model chỉ có 4 target là : NV,
MEL, BKL, unknown (chuyển 5 target còn lại thành unknown)
3.2.3 Sử dụng mang học sâu
EfficientNet
Kể từ khi AlexNet giành chiến thắng trong cuộc thi ImageNet năm 2012, CNN
đã trở thành thuật toán cơ sở cho nhiều loại nhiệm vụ trong học sâu, đặc biệt làđối với thị giác máy tính Từ năm 2012 đến nay, các nhà nghiên cứu đã thử nghiệm
và cô gắng đưa ra các kiến trúc ngày càng tốt hơn để cải thiện độ chính xác của
mô hình trong các nhiệm vụ khác nhau Từ đó Mingxing Tan và Quoc V Le đã
tạo ra EfficientNet [15], một mô hình không chi tập trung vào việc cải thiện độ
chính xác mà còn tăng hiệu quả của mô hình
EfficientNet là một kiến trúc mạng CNN và phương pháp chia tỷ lệ giúp cảithiện độ chính xác của mô hình và nhu cầu tính toán bằng cách thu phóng môtheo mọi hướng gồm chiều sâu, chiều rộng và độ phân giải
việc thu phón mô hinhg thường được thực hiện để cải thiện độ chính xác của môhình đối với một tác vụ nhất địnt.Thu phóng mô hình nếu được thực hiện đúngcách, cũng có thể giúp cải thiện hiệu quả của một mô hình.
Trong CNN có 3 kích thước tỷ lệ là
© Độ sâu của mạng tương đương với số lớp trong đó
s® Độ rộng của mang
¢ Độ phân giải hình ảnh được chuyển đến CNN
Tỷ lệ chiều rộng: Chiều rộng của hình ảnh nói chung có nghĩa là các kênh giống
như R, G, B trong hình ảnh có màu Trong phương pháp mở rộng này, khi mạng
phát triển, mô hình CNN sẽ cố gắng thêm nhiều kênh hơn để làm cho mạng trở
nên rộng khắp Các mạng rộng này, chẳng hạn như WideResNet và MobileNets,
gặp khó khăn trong việc nắm bắt các tính năng cấp cao hơn
Tỷ lệ chiều sâu: CNN được tạo thành từ một số lớp giúp hiểu và hiểu hình ảnhđầu vào Việc tăng số lượng lớp có lợi cho một số thời điểm mà sau đó mô hình
Trang 37Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 19
không thể học được do sự phức tạp và van dé gradient biến mat
Tỷ lệ độ phân giải: Độ phân giải của hình ảnh không là gì khác ngoài chiều cao
x chiều rộng của hình ảnh Hình ảnh có kích thước 512 x 512 có nhiều thông tin
hơn khi so sánh với hình ảnh có kích thước 256 x 256 Tuy nhiên, việc sử dụng
đầu vào độ phân giải cao luôn có xu hướng đặt tải lên nhu cầu tính toán và sau
một số ngưỡng sẽ không cung cấp hiệu suất đáng kể về hiệu suất của mô hình
Vì số lượng các tham số để tính toán thuận tiện là nhỏ, nên EfficientNet có thểđược sử dụng rất tốt để xử lý nhanh, đặc biệt là trong MobileAI Nhiều thứnguyên có thể được giới thiệu sau đó để mở rộng quy mô và mở ra toàn bộ lĩnh
vực nghiên cứu mới trên CNN.
EfficientNet đã mở ra một lĩnh vực nghiên cứu rộng rãi để cải thiện kết quả
của một số nhiệm vụ thị giác máy tính Nó có khả năng giúp cung cấp một giải
pháp tốt trong việc chọn độ sâu, chiều rộng và độ phân giải của mô hình để thuđược kết quả tối đa từ nó
Trang 38Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 20
Theo nhóm tác giả quan sát các chiều của các mô hình thường không thu
nhỏ/thu phóng đọc lập với nhau Bởi vậy nên, theo trực giác của bản thân, nhóm
tác giả cho rằng cần phối hợp và cân bằng các kích thước tỷ lệ khác nhau hơn làchia tỷ lệ một chiều thông thường Từ đó nhóm tác giả kết luận được rằng :"Đểđạt được độ chính xác và hiệu quả tốt hơn, điều quan trọng là phải cân bằng tất
cả các kích thước của chiều rộng, chiều sâu và độ phân giải mang trong quá trình
thu phóng quy mô ConvNet"
Nhóm tác giả đã để xuất một phương pháp thu phóng phức hợp mới, sử dụng
hệ số kép ¢ để thu phóng đồng nhất chiều rộng, độ sâu và độ phân giải của mang
theo cách:
d— n?
w = BP
Trang 39Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 21
s z là độ phân giải của mạng
° a,B,y là các hằng số có thể được xác định bằng small grid search
¢ là hệ số do người dùng chỉ định để kiểm soát sO lượng tai nguyên khác có sẵn
để thu phóng mô hình, trong khi a, B, chỉ định cách gan các tài nguyên bổ sung
này cho độ rộng, độ sâu và độ phân giải của mạng tương ứng Dang chú ý, FLOPS
của một op tích hợp thông thường tỷ lệ với d,w?,r?,nghia là độ sâu mang tăng
gap đôi sẽ tăng gấp đôi FLOPS, nhưng tăng gap đôi độ rộng hoặc độ phân giảicủa mạng sẽ tang FLOPS lên bốn lần Vì các hoạt động tích phân thường chiếm
ưu thé trong chi phí tính toán trong ConvNets, nên việc thu phóng Mang Convvới phương trình 3 sẽ làm tăng tổng FLOPS khoảng (a - B? - y*)? Trong bài báotrên, tác giả ràng buộc a- BŸ - y* ~ 2 sao cho với bat kỳ tham số nào, tổng FLOPS
sẽ tăng xap xỉ lên 2?
Kiến trúc mạng EfficientNet: Kiến trúc của đường cơ sở EfficientNet bao gồmcác lớp sâu của các khối MBConv như thể hiện trong hình 3.2
12
ìx28x40 4 ®
3 9 9s li 2l |9 œ | nlễ|alã|s ã|slš s š|slãislEIs Sls|lŠ 558h 1p: = iS) el = sigieiginislzia|#iaigiz\alais Sik) ele) xã
#l|;|Ä|ñ|A| 5 |ŠS|n|siø SP oF a2 as) ele Se) Sy) es ñ kịu _Ì ae
RISE Sle] eS) e|Ê' e|Š| eR) £|Š| S/R] £|Š| £|“' |=) |“! S/F] e *| s $ oie
ee ee ee ee ee ee ee ee >È ee es ee ee ee
5 5 S Š Š Š 6 6 5 Š 8 Š 8 5 $ 6 8
a a 8 | @ o ø o ee ® a i] @ a a ø a
= = = = = = = = = = = = = = = =
HÌNH 3.3: Kiến trúc của EfficientNet)
Để xây dựng các mô hình có hiệu suất tốt, hiệu quả cần có một mô hình cơ
sở tốt Trong EfficientNet, các mô hình cơ sở EfficientNet-B0 được xây dựng từ
Trang 40Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 22
(MBConv) tương tự như MobileNetV2 và MnasNet Các cải tiến trên mô hình cơ
sở được thực hiện sau đó trên mô hình EfficientNets
Nhóm tác giả phát triển mạng cơ sở của mình bằng cách tận dụng tìm kiếm kiến
trúc no-ron đa mục tiêu để tối ưu hóa cả độ chính xác và FLOPS Cụ thể, nhómtác giả sử dụng ACC(n)x[FLOPS(m) /T]" làm mục tiêu tối ưu hóa, trong đóACC(m) và FLOPS(m) biểu thị độ chính xác va FLOPS của mô hình m, T là mức
FLOPS mục tiêu và w = —0.07 là siêu tham số để kiểm soát sự cân bằng giữa độ
chính xác và FLOPS Tuy nhiên không giống nghiên cứu trên, ở đây nhóm tác giả
tối ưu hóa FLOPS thay vì độ trễ vì họ không nhắm mục tiêu bắt kỳ thiết bị phần
cứng cụ thể nào Từ đó nhóm tác giả tạo ra một mạng hiệu quả, thứ được đặt tên
đặt tên là EfficientNet-B0.
Bắt đầu từ mô hình cơ sở EfficientNet-B0, nhóm tác giả áp dụng phương phápthu phóng phức hợp của mình để thu phóng quy mô với hai bước bao gồm:
® Bước 1: Dat giá trị ý = 1 là có định.Nhóm tác giả sau đó tién hành tìm giá
trị a,B,y theo công thức trên Cuối cùng nhóm tác giả tìm được các hệ sốtốt nhất cho EfficientNet-B0 là a = 1.2,B = 1.1, = 1.15 dưới điều kiện làa-B^-ˆ 2
® Bước 2: Sau đó cho giá trị a, B,1 có định rồi điều chỉnh giá trị @ để có được
EfficientNet-B1 tới B7
BANG 3.2: Số tham số của các mô hình EfficientNet
Số lượng tham số(triệu)
EfficientNet-B0 5.3 EfficientNet-B1 7.8 EfficientNet-B2 9.2 EfficientNet-B3 12
EfficientNet-B4 19
EfficientNet-B5 30
EfficientNet-B6 43 EfficientNet-B7 66