1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Khoa học máy tính: Xác định khả năng ung thư ác tính trong ảnh tổn thương da

81 5 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xác định khả năng ung thư ác tính trong ảnh tổn thương da
Tác giả Nguyen Hoang Quan
Người hướng dẫn TS. Mai Tien Dung
Trường học Đại học Quốc gia TP. Hồ Chí Minh
Chuyên ngành Khoa học máy tính
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2021
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 81
Dung lượng 43,18 MB

Nội dung

Để phục vụ cho việc chẩn đoán bệnh, một số phương pháp đã đượcthực hiện dựa trên hình ảnh dữ liệu các bệnh về da và đưa ra chẩn đoán với độ chính xác khá cao.. Bài toán nhận diện ung thư

Trang 1

ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

KHOA KHOA HỌC MÁY TÍNH

NGUYEN HOÀNG QUAN

KHOA LUAN TOT NGHIEP

TRONG HINH ANH TON THUONG DA

CU NHÂN NGANH KHOA HOC MAY TÍNH

TP HO CHi MINH, 2021

Trang 2

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG

TIN KHOA KHOA HOC MAY TINH

NGUYEN HOANG QUAN - 17520936

KHOA LUAN TOT NGHIEP

XAC DINH KHA NANG UNG THU AC TINH

TRONG HINH ANH TON THUONG DA

CU NHÂN NGANH KHOA HOC MAY TÍNH

GIANG VIEN HUONG DAN

TS MAI TIEN DUNG

TP HO CHi MINH, 2021

Trang 3

DANH SÁCH HOI DONG BẢO VỆ KHÓA LUẬN

Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số

nầy cà cccsằ- của Hiệu trưởng Trường Đại học Công nghệ Thông tin.

1 Chủ tịch.

2Thư ký.

3Ủy viên

4Ủy viên.

Trang 4

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH

Tên khóa luận:

Ước lượng giãn cách xã hội trong video giám sát

hóm SV thực hiện: án bộh an:

Nguyễn Hoang Quân - 17520936 TS Mai Tiến Dũng

Đánh giá Khóa luận

1 Vê cuôn báo cáo:

Số trang Số chương

Số bảng số liệu Số hình vẽ

Số tài liệu tham khảo Sản phẩm

Một sô nhận xét về hình thức cuôn báo cáo:

Trang 5

3 Về chương trình ứng dụng:

Diém từng sinh viên;

Nguyễn Hoang Quân 0

Người nhận xét

(Ky tên va ghi rõ họ tên)

Trang 6

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH

Tên khóa luận:

Ước lượng giãn cách xã hội trong video giám sát

Nguyễn Hoàng Quân - 17520936

Đánh giá Khóa luậ

I Về cuốn báo cáo:

Số trang Số chương

Số bảng số liệu Số hình vẽ

Số tài liệu tham khảo Sản pham

Một sô nhận xét về hình thức cuôn báo cáo:

Trang 7

3 Về chương trình ứng dụng:

Diém từng sinh viên;

Nguyễn Hoang Quân 0

Người nhận xét (Ký tên va ghi rõ họ tên)

Trang 8

LỜI CÁM ƠN

Trong thời gian làm đồ án tốt nghiệp, em đã nhận được nhiều sự giúp đỡ, đóng góp ý kiến

và chỉ bảo nhiệt tình của thầy cô, gia đình và bạn bè.

Lời cảm ơn dau tiên em xin gửi đên TS Mai Tiên Dũng giáo viên hướng dân của em

-người đã tận tình hướng dẫn, chỉ bảo em trong suốt quá trình làm khoá luận.

Em cũng xin chân thành cảm ơn các thầy cô giáo trong trường Đại học Công nghệ thông

tin đã dạy dỗ cho em kiến thức về các môn đại cương cũng như các môn chuyên ngành,

giúp em có được cơ sở lý thuyết vững vàng và tạo điều kiện giúp đỡ em trong suốt quá

trinh học tập.

Em cũng xin chân thành cảm ơn gia đình và bạn bè, đã luôn tạo điều kiện, quan tâm, giúp

đỡ, động viên em trong suốt quá trình học tập và hoàn thành khoá luận tốt nghiệp.

Do giới hạn kiên thức và khả năng lý luận của bản thân còn nhiêu thiêu sót và hạn chê,

kính mong nhận được sự chỉ dẫn và đóng góp của các thây, cô đê khoá luận của em được hoàn thiện hơn Xin cảm ơn thây cô.

Trang 9

ĐẠI HỌC QUOC GIA TP HO CHÍMINH CỘNG HOA XÃ HỘI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc

CÔNG NGHỆ THÔNG TIN

ĐĂNG KÝ ĐÈ TÀI KHÓA LUẬN TÓT NGHIỆP

TÊN DE TÀI: Xác định khả năng ung thư ác tính trong ảnh ton thương da

TEN DE TÀI TIENG ANH: Identify melanoma in lesion images

Cán bộ hướng dẫn: TS Mai Tiến Dũng

Thời gian thực hiện: Từ ngày 07/09/2020 đến ngày 02/01/2021.

Sinh viên thực hiện:

Họ tên sinh viên - MSSV : Nguyễn Hoàng Quân - 17520936 Lớp: KHCL2017.2

Email: 17520936 @ gm.uit.edu.vn Điện thoại: 0834500688

Nội dung đề tai:(M6 ta chỉ tiết mục tiêu, phạm vi, đối tượng, phương pháp thực hiện,

kết quả mong đợi của đề tài)

A Mô tả bài toán:

- Cho hình ảnh chứa vùng da bị tôn thương, hệ thống sẽ xác định kha năng ung thư

ác tính trong hình ảnh đó.

B Đối tượng và phạm vi nghién cứu:

- Phạm vi nghiên cứu trong khóa luận được thực hiện theo mô tả trong cuộc thi

SIM - ISIC Melanoma Classification

(https://www.kaggle.com/c/siim-isic-melanoma-classification)

C Muc tiéu:

- Tim hiểu bài toán và các phương pháp nghiên cứu liên quan đến bai toán xác định

khả năng có ung thư ác tính từ vùng da bị ton thương.

- Thue nghiệm các phương pháp có độ chính xác cao, từ đó đề xuất các hướng cải

o Thực nghiệm lai một số giải pháp phù hợp

© Đánh gia và lựa chọn phương pháp phù hop với nang lực va khả năng tính

toán.

> Dự kiến kết quả:

Trang 10

o Các hướng tiếp cận liên quan

o Những ưu và khuyết của các hướng tiếp cận này

o Hướng tiếp cận trong KLTN.

> Nội dung 2: Thực nghiệm và cải tiễn hệ thống.

> Phương pháp thực hiện:

© Thực nghiệm cải tiến bằng cách kết hợp các ưu điểm của các hệ thống nhằm

nâng cao độ chính xác hệ thông

© Submit kết quả và tinh chỉnh hệ thống.

> Dự kiến kết quả:

© Phương pháp hiệu quả cho bai toán

o Các kết quả thực nghiệm.

> Nội dung 3: Báo cáo KLTN

Kế hoạch thực hién:(M6 ta tóm tắt kế hoạch làm việc và phân công công việc cho từng

sinh viên tham gia)

Tháng 8-9: Khao sát và thực nghiệm các phương pháp liên quan.

Tháng 10: Thực nghiệm và cải tiến kết quả

Tháng 11: Tinh chỉnh hệ thong

Tháng 12: Viết bdo cáo và hoàn thiện KLTN.

Xác nhận của CBHD TP HCM, ngay thang năm 2020

(Ký tên và ghi rõ họ tên) Sinh viên

(Ký tên và ghi rõ họ tên)

Mai Tiến Dũng

Trang 11

14 Mục tiêu dé tai} ee 4

15 Câu trúc Khóa luận tốt nghiệp| - 4

3 HƯỚNG TIẾP CÂN TRONG KHÓA LUẬN 14

3.3 Giaiđoandự đoán| Ặ Q Q TQ HQ HQ eee 24

Trang 12

4 THỰC NGHIỆM VÀ ĐÁNH GIÁ

4.1 Môi trường và ngôn ngữ cài đặt

4.2 Phương pháp đánh giá|

4.21 Độ đo ROC-AUC|

¬ eee 4.5 Kết quả huấn luyện mô hình|

4.6 Kết quả tổng hợp mô hinh]}

5 _KÊTLUẬN 51 Kếtluận

52 _ Hướng pháttriển

A Cơ sở lý thuyết A.1 K-Nearest Neighbors} .

A.11 Ý tưởngcủaKNN|

A.1.2 Các bước chính củaKNNL

A.2_ Suport Vector Machinel

A.2.1 Ý tưởng chính của SVM A.2.2_ Các bước chính của SVM A.3 Decision Tree]

A.3.1 Thuật toán Iterative Dichotomiser 3}

AA Logistic Regression)

A.5 Naive Bayes}

A.5.1 Dinh ly Bayesl

A.5.2 Các mô hình thuật toán Naive Bayes}

A.6 Neuron Network)

A.7_ Convolutional Neuron Network

Bibliography

xii

27

27

27

28

30

34

36

37

42 42

42

44 44

44

46

46 48

49

50

50

51

54

54

55

56

58

62

Trang 13

Danh sách hình ve

11 Bénh ung thư hắc tô da và lenigoNOS[] 3

12_ Bệnhung thư hắc tổ da và nevus| 3

13 Bệnh ung thu hắc tô da và seborrhic keratosisl 4

21 Lanrộng bÊmặt| c Ặ co 7 2.2 Ung thưhắc tố thểnốt 7

2.3 Ung thư hắc tô Lentigo ác tính| 8

c.-1k Ễ 9

3.1 Kiến trúc tong quan của hệ thống - giai đoạn huấn luyện 15 3.2 Tỉ lệ mô hình theo chiều rộng, chiều sâu, độ phân giải nguồn [15]| 20 3.3 Kiến trúc của EfficientNet| 21

3.4 Cấu trúc mô hình sử dung metadata Nguôn: [6]] 23 3.5 Kiến trúc tổng quan của hệ thông - giai đoạn dự đoán 24 41 Cấu trúc filesubmitl - 28

4.2 Đường cong ROC|[ Ặ Ặ.ẶẶ SỐ V SẺ Ợ 29 4.3 diện tích ở dưới đường cong ROC| 29

4.4 Hinh ảnh từ bộ du liệu ISIC 2020| - 31

4.5 Hinh ảnh từ bộ du liệu ISIC 2020| - 31

4.6 Hình ảnh từ bộ du liệu ISIC 2019| 33

4.7 Hình ảnh từ bộ dữ liệu ISIC 2019| - 33

TH tee eee 34 bbb 34 HH e rece 35 Occ vce 35

4.12 Biểu đồ so sánh kết quả của các modelÌl - 37 4.13 Biểu đồ so sánh kết quả tổng hợp của các model 40

Trang 14

4.14 Biểu đỗ so sánh kết quả tổng hợp của các model khi chưa chuyển

dữ liệu về trong khoảng 0 đến 1| - 41

A.1 Bản đồ của kmn với k = 1.(Nguôn Wikipedia)

A.2_ SVM dùng để phân tập dữ liệu thành 2 lớp Nguồn [14||

A.5 Quá trình xử lí thông tin của neuralnetwork| 58

A.6 Cấu trúc của mạng CNN Nguỏn [8|| - 59

Trang 15

4.6 Kết quả của cácmodell ee 39

4.7 Kết quả của các model khi không chuyển dữ liệu về 0 tới 1| 41

Trang 16

Danh mục từ viết tắt

AUC Area Under the (ROC) Curve CNN Convolutional Neural Network SVM_ Support Vector Machine

KNN Nearest Neighbor

Trang 18

TOM TAT KHOA LUAN

Y Dược là một ngành khoa hoc với vai trò đặc biệt cao cả, đó là cham sóc sức

khoẻ cho con người - mục tiêu và động lực của quá trình phát triển; Quá trìnhphát triển do chính con người thực hiện và nhằm mục đích nâng cao chất lượngđời sống con người Vì vậy việc nghiên cứu phát triển cũng như ứng dụng cácthành tựu mới về khoa học công nghệ trong lĩnh vực t tế cần được hết sức coi

trọng.

Một trong các bệnh khó điều trị nhất của con người hiện nay chính là ung thư.Tuy nhiên trong số đó thì ung thư da nếu phát hiện sớm có thể điều trị khỏi hoàn

toàn, cho nên van dé chẩn đoán sớm ung thu da ngày càng trở nên cần thiết và

quan trọng Để phục vụ cho việc chẩn đoán bệnh, một số phương pháp đã đượcthực hiện dựa trên hình ảnh dữ liệu các bệnh về da và đưa ra chẩn đoán với độ

chính xác khá cao.

Vì vậy với mục đích tìm hiểu và xây dựng một chương trình có thể ứng dụngtrong y tế nên em đã chọn đề tài là xác định khả năng ung thư ác tính trong hìnhảnh tổn thương da

Khóa luận trình bày quá trình tìm hiểu, thực nghiệm phương pháp đạt hạng 1 l6]

trong cuộc thi SHM-ISIC Melanoma Classification Identify Melanoma In Lesion

Images do Kaggle tổ chức và áp dung các kiến thức trong lĩnh vực máy học, thigiác máy tính để thử nghiệm các phương pháp đã được học để thử nghiệm ởbước tổng hợp mô hình Cuối cùng sinh viên phân tích, đánh giá các kết quả đạt

được.

Trang 19

Chương 1

TỔNG QUAN

Tóm tắt

Trong chương này, chúng tôi trình bày định nghĩa về bài toán Nhận diện ung

thư ác tính, các ứng dụng trong thực tế và các thách thức mà bài toán đang gặp

phải Chúng tôi đưa ra mục tiêu, nội dung cụ thể và phương pháp thực hiện Cấutrúc của Khóa luận tốt nghiệp cũng sẽ được đẻ cập trong chương này

11 Giới thiệu bài toán

Ngày nay ung thư da là một trong những loại ung thư phổ biến nhất [13].

Trong đó ung thư hắc tố là một dạng ung thư da nghiêm trọng bắt đầu từ các tếbào được gọi là tế bào hắc tố Mặc dù ít phổ biến hơn ung thư biểu mô tế bào đáy

và ung thư biểu mô tế bào vảy, ung thư hắc tổ nguy hiểm hơn vì khả năng lây lan

sang các cơ quan khác rất nhanh nếu không được điều trị ở giai đoạn đầu 75%

ca ung thư đa tử vong là do ung thư hắc tố gây ra Hiệp hội Ung thư Hoa Kỳ ước

tính đến năm 2020 sẽ có hơn 100000 trường hợp bị ung thư ác tính, mà trong đó

có gần 7000 người sẽ chết vì căn bệnh này Vì vậy việc phát hiện sớm và chính xác

các dấu hiệu của căn bệnh - với sự hỗ trợ của khoa học máy tính có thể giúp hàngnghìn người được điều trị hiệu quả hơn

Bài toán nhận điện khả năng ung thư ác tính sẽ có :

- input : hình ảnh một vùng da bị tổn thương.

- output : xác xuất cho biết phan trăm mà hình ảnh đó có thé bị ung thư ác tính

Trang 20

Chương 1 TONG QUAN 2

của cơ thể, nó sẽ trở nên khó điều trị hơn và có thể gây chết người

- Tỉ lệ sống sót ước tính trong 5 năm đối với những bệnh nhân Hoa Kỳ có khối u

ác tính được phát hiện sớm là khoảng 99%.

- Ước tính sẽ có khoảng 6850 người (4610 nam và 2240 nữ) sẽ chết vì u ác tính ở

Hoa Kỳ vào năm 2020.

Bởi vì sự nguy hiểm của u ác tính, nên việc có thể chẩn đoán chính xác, phát

hiện sớm là điều rất cần thiết và quan trọng.Với sự phát triển của mạng học sâudựa trên thị giác máy tính đã thúc đẩy độ chính xác của các mô hình tới gần trình

độ của con người hơn Ngoài ra bài toán còn có thể mở rộng quy mô và có thể

được sử dụng bởi các bác sĩ ở những vùng khó khăn.

Bài toán nhận diện ung thư hắc tố có thể được sử dụng ở các phòng khám da

liễu, bệnh viện hoặc trong các hộp công cụ của các bác sĩ da liễu để giúp các bác

sĩ có thể nâng cao độ chính xác chuẩn đoán của họ, hỗ trợ tốt hơn cho công việc

Từ đó có thể giúp nhiều người bệnh được phát hiện sớm để có thể điều trị hiệu

quả hơn.

Trang 21

(A) melanoma (B) lentigo NOS

HÌNH 1.1: Bệnh ung thư hắc té da và lentigo NOS

HÌNH 1.2: Bệnh ung thư hắc tố da và nevus

Trang 22

trong cuộc thi SIIM-ISIC Melanoma Classification Iden-tify Melanoma In Lesion

Images và thực hiện một số thay đổi ở bước tổng hợp các mô hình

1.5 Câu trúc Khóa luận tot nghiệp

Nội dung Khóa luận tốt nghiệp được tổ chức như sau:

e Chương [I|giới thiệu tổng quan vẻ khóa luận.

° Chuong)2trinh bày cơ sở lý thuyết va các nghiên cứu liên quan đến bài toán

này.

° Chuong|3|trinh bày chỉ tiết các hướng tiếp cận của khóa luận.

¢ Chương |4| trình bày môi trường thực nghiệm, tập dt liệu, phương pháp

đánh giá và kết quả thực nghiệm

° ChươngJ|là phần kết luận và hướng phát triển của khóa luận.

Trang 23

2.1 Tổng quan về ung thư da

Ung thư da hắc sắc tố (ung thư tế bào hắc tổ hay Melanoma) là loại ung thư

da nghiêm trọng nhất, phát triển trong các tế bào (melanocytes) sản xuất melanin

- sắc tố quyết định màu sắc làn da.

Tế bào hắc tố là tế bào da được tìm thấy ở lớp trên của da Chúng tao ra mộtsắc tổ được gọi là melanin, mang lại màu sắc cho da Có hai loại melanin: eume-

lanin và pheomelanin.

Khi da tiếp xúc với bức xa tia cực tim (UV) từ mặt trời hoặc giường tắm nắng,

nó sẽ gây tổn thương da khiến các tế bao hắc tố sản sinh ra nhiều hắc tố hơn,nhưng chỉ có sắc tố eumelanin cé gắng bảo vệ da bang cách làm cho da đen hoặc

rám nắng U hắc tố xảy ra khi tổn thương DNA do đốt cháy hoặc sạm da do bức

xạ tia cực tím gây ra những thay đổi (đột biến) trong tế bào hắc tố, dẫn đến sựphát triển không kiểm soát của tế bào

Những người có làn da sam màu tự nhiên có nhiều eumelanin hon và những

người có làn da trắng tự nhiên có nhiều pheomelanin hơn Trong khi eumelanin

Trang 24

Chương 2 NGHIÊN CUU LIÊN QUAN 6

có khả năng bảo vệ da khỏi tác hại của ánh nắng mặt trời thì pheomelanin thì

không Đó là lý do tại sao những người có làn da sim màu có nguy cơ phát triểnkhối u ác tính thấp hơn những người có làn da trắng, do thiếu eumelanin nên dễ

bị tổn thương do ánh nắng mặt trời, bỏng rát và ung thư da

Mặc dù ít phổ biến hơn ung thư biểu mô tế bào đáy (BCC) và ung thư biểu mô

tế bào vảy (SCC), u ác tính nguy hiểm hơn vì khả năng lây lan sang các cơ quankhác nhanh hơn nếu không được điều trị ở giai đoạn dau

2.1.1 Cách nhận dạng u ác tính

U hắc tố có nhiều hình dạng, kích thước và màu sắc khác nhau Đó là lý dotại sao rất khó để cung cấp một tập hợp các dấu hiệu cảnh báo toàn diện.Ung thư

da hắc sắc tố có xu hướng gia tăng ở những người dưới 40 tuổi, đặc biệt là phụ

nữ Tuy nhiên, néu phát hiện được những thay đổi sớm và được điều trị trước khiung thư lan rộng, bệnh có thể được chữa khỏi

Ung thư da hắc sắc tố có thể hình thành ở bắt cứ vị trí nào trên cơ thể nhưngthường thây nhất ở những vùng da tiếp xúc với ánh nắng mặt trời như lưng, chân,

tay và mặt.

Ngoài ra, ở người có màu da tối, ung thư dang này cũng có thể xuất hiện ở những

vị trí không tiếp xúc nhiều với ánh nắng mặt trời như lòng bàn chân, lòng bàn tay

và giường móng tay.

Khối u ác tính dạng này cũng có thể hình thành trong mắt hay trong mũi hoặc

cổ họng (hiếm) Nốt ruôi trên cơ thể có sự thay đổi về hình dang, màu sắc, kích

thước

Xuất hiện những đốm, mảng khác màu trên da, phát triển bất thường

2.1.2 Bốn loại u ác tính chính

Ung thư hắc tố lan rộng bé mặt: Loại này chiếm 70% ung thu hắc tố Thông

thường không có triệu chứng, nó xảy ra phổ biến nhất trên cang chân của nữ

giới và thân mình ở nam giới Thương tổn thường là mảng có các vùng da không

đều, nổi cao, màu rám hoặc nâu, thường có các đốm đỏ, trắng, đen và xanh hoặc

Trang 25

Chương 2 NGHIÊN CUU LIEN QUAN 7

các nốt xanh-đen nhỏ, đôi khi có màu xanh Nên chu ý những dấu hiệu của bờ

thương tổn, cùng với việc mở rộng hoặc thay đổi màu sắc Về mặt mô học, các tếbào hắc tố không điển hình xâm nhập đặc trưng vào lớp trung bì và thượng bì

HÌNH 2.1: Lan rộng bé mặt

Ung thư hắc tố thể nốt Loại này chiếm từ 15 đến 30% ung thư hắc tố Nó có

thể xảy ra ở bất kỳ nơi nào trên cơ thể như là một sẩn tối màu, hoặc một mảngthay đổi từ màu ngọc trai để màu xám, đến màu đen Đôi khi, một thương tổn

chứa ít chất sắc t6 hoặc có thể trông giống như một khối u mạch máu Trừ khi nó

bị loét, ung thư hắc tố thể nốt không có triệu chứng, nhưng bệnh nhân thường

tìm lời khuyên bởi vì tổn thương nhanh chóng lan rộng.

HINH 2.2: Ung thư hắc tố thể nét

Ung thư hắc tố Lentigo ác tính Loại này chiếm 5% ung thư hắc tố Nó có xu

hướng phát sinh ở bệnh nhân lớn tuổi Nó phát sinh từ lentigo ác tính (tàn nhang

Trang 26

Chương 2 NGHIÊN CUU LIÊN QUAN 8

Hutchinson hoặc khối u hắc tố ác tính tại chỗ - một đốm nâu nhạt hoặc nâu)

Nó thường xảy ra trên mặt hoặc các vùng tiếp xúc với ánh nắng mạn tính như

là một dát hoặc mảng phẳng, màu rám hoặc màu nâu, không có triệu chứng, với

các dém nâu sam hoặc đốm đen phân tán không đều trên bề mặt của nó Trong

lentigo ác tính, cả tế bào hắc tố bình thường và ác tính đều giới hạn ở lớp thượng

bì Khi các tế bào hắc tố ác tính xâm nhập vào lớp trung bì, tổn thương này đượcgọi là ung thư hắc tố lentigo ác tính, và ung thư có thể di căn Loại u ác tính này

thông thường có các đột biến ở gen C-kit

Khối u ác tính tuyến bã đậu : Đây là dạng u ác tính phổ biến nhất được tìm

thấy ở những người da màu, bao gồm cả những cá nhân có tổ tiên gốc Phi Nó

thường xuất hiện ở những vị trí khó phát hiện bao gồm cả đưới móng tay và lòngban chân hoặc long bàn tay Nó có thể xuất hiện dưới dang một vùng màu den

hoặc nâu.

Trang 27

Chương 2 NGHIÊN CUU LIÊN QUAN 9

2.2 Các nghiên cứu liên quan

Năm 2020 đã có rất nhiều công trình nghiên cứu của các bệnh về da đượccông bố tại hội nghị CVPR (Conference on Computer Vision and Pattern Recog-nition).Trong đó bài toán nhận điện ung thư hắc tố từ hình ảnh da tổn thương làbài toán liên quan mật thiết đến các bài toán về nhận diện các bệnh về da Vì vậy

trước khi giải quyết bài toán nhận diện ung thư hắc tố ta cần nghiên cứu về cácbài toán xử lí các căn bệnh về da

2.2.1 Tình hình nghiên cứu của các bài toán liên quan

Mạng học sâu đã được áp dụng trên rất nhiều các lĩnh vực từ phân tích hình

ảnh đến xử lí ngôn ngữ tự nhiên Gần đây mạng học sâu cũng đã có thành cônglớn trong việc phân loại va phân đoạn ảnh y tế [1] , Haenssle và cộng sự [7] vàBrinker [3] đã thực hiện các nghiên cứu chỉ ra rằng hiệu suất của các mô hình họcsâu có thể cạnh tranh với các bác sĩ da liễu Phân đoạn theo ngữ nghĩa (semanticsegmentation) là một nhiệm vụ quan trọng và phổ biến trong việc làm cho máytính có thể hỗ trợ chẩn đoán bệnh qua hình ảnh da Mặc dù các phương pháp tiếpcận dựa trên học sâu đã cải thiện đáng kể sự chính xác của phân đoạn những vẫn

có những cách để cải thiện bằng cách giải quyết những thách thức lớn như màu

sắc [11], sự thay đổi về hình dạng tổn thương, kích thước và các mức độ tương

phan khác nhau Tuy nhiên, mang học sâu có hiệu quả nhất khi có sẵn một lượnglớn dữ liệu lớn để có thé dao tao và như vậy sẽ khó khăn khi tìm dữ liệu cho

Trang 28

Chương 2 NGHIÊN CUU LIÊN QUAN 10

những căn bệnh hiếm gặp Một số cách để để đối phó với van đề ít đữ liệu này

đã dé xuất như transfer learning [9l và few-shot learning đòi hỏi mạng phải

được đào tạo trước trên một số lượng lớn dữ liệu đã được gắn nhãn Thu thập

data của các bệnh về da là khá khó khăn, trong hoàn cảnh này, kho lưu trữ ISIC

đóng một vai trò quan trọng trong lĩnh vực cung cấp bộ đữ liệu về tổn thương

đa lớn nhất được sử dụng bởi hầu hết trong các bài báo về mạng học sâu

Subhranil Bagchi và các đồng nghiệp [2] đã đề xuất sử dụng hai kỹ thuật học

sâu kết hợp (được đào tạo với trọng số bị tổn thất) để cái thiện độ chính xác so với

các mô hình phân loại riêng lẻ Kỹ thuật kết hợp giúp giảm bớt sự chính xác quá

mức (over-fitting) do mất cân bằng trong tập dữ liệu Ngoài ra, nhóm tác giả déxuất module CS-KSU (Class Specific - Known vs Simulated Unknown) để phát

hiện sự hiện diện của hình ảnh thuộc các lớp lạ trong lúc kiểm tra Phương phápcủa nhóm tác giả gồm 2 bước chính là :

© Xây dựng thành phần Stacking: nhằm phân lớp hình ảnh tổn thương da

thành một trong các bệnh đã được biết trước Để xây dựng Stacking mô đun,nhóm tác giả huấn luyện 4 mô hình sử dụng EfficientNet-B2, EfficientNet-B5(với 2 thiết lập) và DenseNet

© Xây dung module CS-KSU : nhằm xác định một cách chắc chắn rằng thành

phần Stacking có nhận biết hình ảnh tổn thương da chính xác hay không

Module CS-KSU bao gồm các module phân loại hai lớp, mỗi module được

dùng để nhận biết một trong các lớp đã biết trong tập dữ liệu Module KSU kết luận kết quả của phân loại trong khi thành phan Stacking sẽ đưa

CS-ra lớp của một hình ảnh Module CS-KSU sẽ quyết định kết quả mà thành

phan Stacking đưa ra là đúng hay sai Trong trường hợp mô hình khôngnhận ra hình ảnh thuộc lớp nào, ảnh đó sẽ thuộc lớp Unknown(chua biết)

Kushagra Mahajan và các đồng nghiệp cũng đã tìm hiểu và đưa ra các hướng

tiếp cận sử dụng meta-learning dựa trên few-shot learning như phương pháp

Reptile( phương pháp dựa trên độ đốc) và mạng Prototypical(dựa trên khoảngcách) để xác định các tổn thương da từ các hình ảnh y tế Nhóm tác giả để xuấtphương pháp tiếp cận gọi là mạng Meta-DermDiagnosis sử dụng meta-learning

để tạo điều kiện thích ứng nhanh chóng với mạng lưới thần kinh sâu được đào

Trang 29

Chương 2 NGHIÊN CUU LIÊN QUAN 11

tạo dựa trên các mẫu dữ liệu về các bệnh thông thường Nhóm tác giả đã thựchiện các điều sau trong bài báo :

° Sử dụng meta-learning để xác định các bệnh hiếm gặp trong bộ dữ liệu hình

ảnh tổn thương da có ít data được ghi chú bằng cách định nghĩa vấn dé như

1-shot, 3-shot, 5-shot phân loại.

© Tìm hiểu mạng Reptile và dựa trên đo lường để xác định bệnh từ hình ảnh

tổn thương da trong dữ liệu thấp

¢ Chứng minh tích chập G có thể cải thiện đáng kể hiệu suất của mạng trong

trường hợp hình ảnh tổn thương da vì hướng của hình thường không phải

là một thuộc tính quan trọng trong hình ảnh tổn thương da.

© Đánh giá mạng Meta-DermDiagnosis trên các bộ dit liệu về tổn thương da

trong đó với bộ dữ liệu ISIC 2018 có điểm AUC trung bình đạt 86.8.

2.2.2 Tình hình nghiên cứu của bài toán nhận diện ung thư ác

tính

Trong cuộc thi SHM-ISIC Melanoma Classification Identify melanoma in

le-sion images 2020 (nhan dién ung thu hắc tố dựa trên các hình anh tổn thương

da) được tổ chức ở Kaggle Những người tham gia được yêu cầu xây dựng các

mô hình để có thể nhận điện bệnh ung thư hắc tố da sử dụng hình ảnh các tổn

thương da và meta data.

Có hơn 3300 đội tham dự, Oishen Ha và các cộng sự đã đạt hạng 1 trong cuộc

thi này (ol với phương pháp là sử dụng các mô hình lần lượt là EfficientnetB3,

Effi-cientnetB4, EfficientnetB5, EfficientnetBó, EfficientnetB7, se_resnext101, resnest101,

cùng với đó sử dụng các size hình ảnh khác nhau với từng mô hình.Ngoài bộ

dataset ISIC 2020 của cuộc thi, nhóm còn sử dụng thêm bộ dataset ISIC 2019 đểgiúp việc huấn luyện đạt hiệu quả cao hơn Target của bộ dataset là 0 (âm tính)

và 1(dương tính), Qishen Ha và các cộng sự đã thay đổi và dùng cột diagnosistrong dataset để làm target Khi dùng cột diagnosis để làm target thì dữ liệu của

dataset ISIC 2020 và ISIC 2019 khác nhau nên nhóm đã thay đổi bằng cách gán lại

cột diagnosis của dataset ISIC 2020 theo cách dưới đây.

Trang 30

Chương 2 NGHIÊN CUU LIÊN QUAN 12

¢ 2020 seborrheic keratosis -> BKL

¢ 2020 lichenoid keratosis -> BKL

¢ 2020 solar lentigo -> BKL

se 2020 lentigo NOS -> BKL

e 2020 cafe-au-lait macule -> unknown

se 2020 atypical melanocytic proliferation -> unknown

se 2020 nevus -> NV

se 2020 melanoma -> MEL

Sau khi da train 18 mô hình Oishen Ha và các cộng sự tổng hợp các model lại

bằng cách tính trung bình của các model đó và kết quả là 0.9490

lan Pan — người đạt hạng 2 trong cuộc thi với kết quả là 0.9485 đã sử dụngcác mô hình EfficientNet-B6 và EfficientNet-B7 để huấn luyện rồi sau đó kết hợp

lại.Trước đó lan Pan đào tạo một mô hình trên bộ dữ liệu ISIC 2019 chỉ sử dụng

cột diagnosis làm target, do bộ dữ liệu năm 2019 có chẩn đoán bổ trợ khá day

đủ trong khi bộ dữ liệu năm 2020 không cho biết Sau đó áp dụng mô hình lên

bộ dữ liệu ISIC 2020, mục đích là để gắn nhãn unknown là nevus hoặc không

nevus Bây giờ tất cả các tập dữ liệu ISIC 2019 và ISIC 2020 đều có các nhãn ởcột diagnosis là unknown, melanoma, nevus Ipan sẽ train dữ liệu lấy 3 thong tin

này làm target Ngoài ra,do số lượng ảnh bị ung thư hắc tổ trong tập dir liệu ISIC

2019 lớn hơn ISIC 2020 khá nhiều nên lan Pan đã thực hiện Upsampling các ảnh

bị ung thư hắc tố trong tập dữ liệu ISIC 2020 lên 7 lần để số lượng ảnh bị ung thưhắc tố trong 2 tập di liệu là như nhau Yếu tố quyết định dé đạt điểm cao trong

bài của lan Pan là Pseudolabeling, do số lượng ảnh bị ung thư hắc tố trong tập

dữ liệu ISIC 2020 rất ít, nên việc thực hiện Pseudolabeling đã giúp cái thiện hệ

thống và làm tăng số điểm

Masdevallia - người đạt hạng 3 trong cuộc thi với kết quả là 0.9484 đã huấn

luyện 8 mô hình với mô hình mạng EfficientNet-B5,Bó,B7 và sử dụng các size

Trang 31

Chương 2 NGHIÊN CUU LIÊN QUAN 13

hình khác nhau như bảng 2.1.

Trong để tài này, sinh viên tìm hiểu phương pháp xây dựng hệ thống dựa trên

phương pháp đạt hạng 1 trong cuộc thi SIIM-ISIC Melanoma Classification

Iden-tify melanoma in lesion images vì đây là phương pháp có số điểm cao nhất trong

Trang 32

Nhận diện ung thư là một chủ đề được các nhà khoa học thường xuyên nghiên

cứu của lĩnh vực thị giác máy tính lẫn trong y học Vì ung thư da có tỉ lệ gây tử

vong cao nhưng có thể chữa khỏi nếu phát hiện sớm nên nếu bài toán nhận diệnung thư được thực hiện thành công với tỉ lệ dự đoán chính xác cao thì sẽ có thể

sẽ được áp dụng rộng rãi và giúp được rất nhiều người phát hiện bệnh sớm để

có những biện pháp chữa trị hợp lí nhất cũng như giúp các bác sĩ trong việc dự

đoán bệnh cho bệnh nhân.

Trong phạm vi dé tài này, sinh viên sẽ tìm hiểu phương pháp xây dung mô

hình của nhóm dat hạng 1 [13] trong cuộc thi SHM-ISIC Melanoma Classification

Identify Melanoma In Lesion Images cùng với đó thử nghiệm một số thay đổi ởbước tổng hợp mô hình Trong phần này, sinh viên sẽ giới thiệu về phương pháp

của mô hình.

Trang 33

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 15

3.2 Giai đoạn huấn luyện

Giai đoạn huấn luyện của hệ thống sẽ gồm các bước xử lí dữ liệu, xử lí ảnh

đầu vào, và huấn luyện mô hình mạng học sâu

⁄/ Xử lí dữ liệu Xử lí ảnh đầu vào), Mô hình mạng

- 2 class -> 9 class

—>* -SE ResNextl01

- Sử dung thém dataset Pi a c7 ea

dataset isic 2020

Tiền Xử lí dữ liệu

HÌNH 3.1: Kiến trúc tổng quan của hệ thống — giai đoạn huấn luyện

3.2.1 Tiền xử lí dữ liệu

Mục đích nhận diện của mô hình là có bị ung thư hắc tố hoặc không bị ung

thư hắc tố, tuy nhiên trong dataset ISIC 2020 có 33000 hình trong tập train chỉ có

1.76% hình bị ung thư hắc tố Với dữ liệu ít như vậy khi train sẽ gây ra khó khăn

và sẽ đạt hiệu quả không cao Dataset ISIC 2019 tuy có ít hình trong tập train hơn

(25000 hình) tuy nhiên lại có 17.85% hình bị ung thư hắc tố - gấp 10 lần so với

dataset ISIC 2020, vì vậy việc sử dụng thêm dataset ISIC 2019 sẽ giúp việc đánh

giá mô hình tốt và ổn định hơn Để giúp kết quả của mô hình đạt hiệu quả cao,

bộ dữ liệu được chia thành 5 fold với các quy tắc sau đây :

¢ Tach riêng người bệnh: Một bệnh nhân trong tập dữ liệu có thé có nhiều

hình, nên tất cả hình ảnh của một bệnh nhân bây giờ đều thuộc trong cùng

1 fold

e Cân bằng các hình ảnh bị ung thư hắc tố: Số lượng ảnh bị ung thư hắc tô rất

ít 1.76% nên mỗi fold cũng sẽ có 1.76% hình ảnh bị ung thư hắc tố

Trang 34

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 16

* Cùng một bệnh nhân có vài người có nhiều ảnh trong tập dữ liệu, có người

có ít ảnh trong tập dữ liệu nên ở số lượng người có số ảnh trong tập dữ liệu

bằng nhau sẽ ở cùng một fold

Tăng cường hình ảnh (image augmentation) là một nhiệm vụ quan trong để mô

hình không bị overfit.Sinh viên sử dụng các hàm của thư viện Albumentation[4]

của Pytorch để tăng cường dữ liệu

Trang 35

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 17

3.2.2 Các lớp của mô hình

File miêu tả của tập train có một cột là chẩn đoán (diagnosis) gồm 9 giá trịlần lượt như sau : atypical melanocytic proliferation, cafe-au-lait macule, lentigo

NOS, lichenoid keratosis, melanoma, nevus, lichenoid keratosis, solar lentigo,

un-known thể hiện cho các bệnh về da Trong đó giá trị melanoma cho biết ảnh đó

bị ung thư hắc tố, còn lại các giá trị khác cho biết ảnh đó không bị ung thư hắc

tố Anh sẽ là ung thư hắc tố khi và chỉ khi cột diagnosis có giá trị là melanoma,

tuy nhiên khi ảnh không phải là ung thư hắc tố thi sé có nhiều giá trị hơn so vớitarget ban đầu Như vậy néu sử dụng cột diagnosis lam target sẽ cho model nhiều

thông tin hơn

Tuy nhiên có một van dé khi sử dụng cột diagnosis làm target Do sử dụng 2

bộ dataset là ISIC 2020 va ISIC 2019 và giá trị của cột diagnosis của 2 dataset khác nhau Dataset ISIC 2020 có 9 giá trị là: atypical melanocytic proliferation, cafe- au-lait macule, lentigo NOS, lichenoid keratosis, melanoma, nevus, seborrheric

keratosis, solar lentigo, unknown Dataset ISIC 2019 có 8 giá trị là : AK, BCC,

BKL, DF, MEL, NV, SCC, VASC Vì vay ta sẽ chuyén các giá tri của bộ dataset từ

năm 2020 sang năm 2019 như trong bảng 3.1

BANG 3.1: Chuyển từ diagnosis sang target

2019 Diagnosis 2020 Diagnosis Target

DF DF

cafe-au-lait macule unknown atypical melanocytic proliferation

Trang 36

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 18

Như vậy model sẽ có 9 target trong đó có một model chỉ có 4 target là : NV,

MEL, BKL, unknown (chuyển 5 target còn lại thành unknown)

3.2.3 Sử dụng mang học sâu

EfficientNet

Kể từ khi AlexNet giành chiến thắng trong cuộc thi ImageNet năm 2012, CNN

đã trở thành thuật toán cơ sở cho nhiều loại nhiệm vụ trong học sâu, đặc biệt làđối với thị giác máy tính Từ năm 2012 đến nay, các nhà nghiên cứu đã thử nghiệm

và cô gắng đưa ra các kiến trúc ngày càng tốt hơn để cải thiện độ chính xác của

mô hình trong các nhiệm vụ khác nhau Từ đó Mingxing Tan và Quoc V Le đã

tạo ra EfficientNet [15], một mô hình không chi tập trung vào việc cải thiện độ

chính xác mà còn tăng hiệu quả của mô hình

EfficientNet là một kiến trúc mạng CNN và phương pháp chia tỷ lệ giúp cảithiện độ chính xác của mô hình và nhu cầu tính toán bằng cách thu phóng môtheo mọi hướng gồm chiều sâu, chiều rộng và độ phân giải

việc thu phón mô hinhg thường được thực hiện để cải thiện độ chính xác của môhình đối với một tác vụ nhất địnt.Thu phóng mô hình nếu được thực hiện đúngcách, cũng có thể giúp cải thiện hiệu quả của một mô hình.

Trong CNN có 3 kích thước tỷ lệ là

© Độ sâu của mạng tương đương với số lớp trong đó

s® Độ rộng của mang

¢ Độ phân giải hình ảnh được chuyển đến CNN

Tỷ lệ chiều rộng: Chiều rộng của hình ảnh nói chung có nghĩa là các kênh giống

như R, G, B trong hình ảnh có màu Trong phương pháp mở rộng này, khi mạng

phát triển, mô hình CNN sẽ cố gắng thêm nhiều kênh hơn để làm cho mạng trở

nên rộng khắp Các mạng rộng này, chẳng hạn như WideResNet và MobileNets,

gặp khó khăn trong việc nắm bắt các tính năng cấp cao hơn

Tỷ lệ chiều sâu: CNN được tạo thành từ một số lớp giúp hiểu và hiểu hình ảnhđầu vào Việc tăng số lượng lớp có lợi cho một số thời điểm mà sau đó mô hình

Trang 37

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 19

không thể học được do sự phức tạp và van dé gradient biến mat

Tỷ lệ độ phân giải: Độ phân giải của hình ảnh không là gì khác ngoài chiều cao

x chiều rộng của hình ảnh Hình ảnh có kích thước 512 x 512 có nhiều thông tin

hơn khi so sánh với hình ảnh có kích thước 256 x 256 Tuy nhiên, việc sử dụng

đầu vào độ phân giải cao luôn có xu hướng đặt tải lên nhu cầu tính toán và sau

một số ngưỡng sẽ không cung cấp hiệu suất đáng kể về hiệu suất của mô hình

Vì số lượng các tham số để tính toán thuận tiện là nhỏ, nên EfficientNet có thểđược sử dụng rất tốt để xử lý nhanh, đặc biệt là trong MobileAI Nhiều thứnguyên có thể được giới thiệu sau đó để mở rộng quy mô và mở ra toàn bộ lĩnh

vực nghiên cứu mới trên CNN.

EfficientNet đã mở ra một lĩnh vực nghiên cứu rộng rãi để cải thiện kết quả

của một số nhiệm vụ thị giác máy tính Nó có khả năng giúp cung cấp một giải

pháp tốt trong việc chọn độ sâu, chiều rộng và độ phân giải của mô hình để thuđược kết quả tối đa từ nó

Trang 38

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 20

Theo nhóm tác giả quan sát các chiều của các mô hình thường không thu

nhỏ/thu phóng đọc lập với nhau Bởi vậy nên, theo trực giác của bản thân, nhóm

tác giả cho rằng cần phối hợp và cân bằng các kích thước tỷ lệ khác nhau hơn làchia tỷ lệ một chiều thông thường Từ đó nhóm tác giả kết luận được rằng :"Đểđạt được độ chính xác và hiệu quả tốt hơn, điều quan trọng là phải cân bằng tất

cả các kích thước của chiều rộng, chiều sâu và độ phân giải mang trong quá trình

thu phóng quy mô ConvNet"

Nhóm tác giả đã để xuất một phương pháp thu phóng phức hợp mới, sử dụng

hệ số kép ¢ để thu phóng đồng nhất chiều rộng, độ sâu và độ phân giải của mang

theo cách:

d— n?

w = BP

Trang 39

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 21

s z là độ phân giải của mạng

° a,B,y là các hằng số có thể được xác định bằng small grid search

¢ là hệ số do người dùng chỉ định để kiểm soát sO lượng tai nguyên khác có sẵn

để thu phóng mô hình, trong khi a, B, chỉ định cách gan các tài nguyên bổ sung

này cho độ rộng, độ sâu và độ phân giải của mạng tương ứng Dang chú ý, FLOPS

của một op tích hợp thông thường tỷ lệ với d,w?,r?,nghia là độ sâu mang tăng

gap đôi sẽ tăng gấp đôi FLOPS, nhưng tăng gap đôi độ rộng hoặc độ phân giảicủa mạng sẽ tang FLOPS lên bốn lần Vì các hoạt động tích phân thường chiếm

ưu thé trong chi phí tính toán trong ConvNets, nên việc thu phóng Mang Convvới phương trình 3 sẽ làm tăng tổng FLOPS khoảng (a - B? - y*)? Trong bài báotrên, tác giả ràng buộc a- BŸ - y* ~ 2 sao cho với bat kỳ tham số nào, tổng FLOPS

sẽ tăng xap xỉ lên 2?

Kiến trúc mạng EfficientNet: Kiến trúc của đường cơ sở EfficientNet bao gồmcác lớp sâu của các khối MBConv như thể hiện trong hình 3.2

12

ìx28x40 4 ®

3 9 9s li 2l |9 œ | nlễ|alã|s ã|slš s š|slãislEIs Sls|lŠ 558h 1p: = iS) el = sigieiginislzia|#iaigiz\alais Sik) ele) xã

#l|;|Ä|ñ|A| 5 |ŠS|n|siø SP oF a2 as) ele Se) Sy) es ñ kịu _Ì ae

RISE Sle] eS) e|Ê' e|Š| eR) £|Š| S/R] £|Š| £|“' |=) |“! S/F] e *| s $ oie

ee ee ee ee ee ee ee ee >È ee es ee ee ee

5 5 S Š Š Š 6 6 5 Š 8 Š 8 5 $ 6 8

a a 8 | @ o ø o ee ® a i] @ a a ø a

= = = = = = = = = = = = = = = =

HÌNH 3.3: Kiến trúc của EfficientNet)

Để xây dựng các mô hình có hiệu suất tốt, hiệu quả cần có một mô hình cơ

sở tốt Trong EfficientNet, các mô hình cơ sở EfficientNet-B0 được xây dựng từ

Trang 40

Chương 3 HƯỚNG TIẾP CẬN TRONG KHÓA LUẬN 22

(MBConv) tương tự như MobileNetV2 và MnasNet Các cải tiến trên mô hình cơ

sở được thực hiện sau đó trên mô hình EfficientNets

Nhóm tác giả phát triển mạng cơ sở của mình bằng cách tận dụng tìm kiếm kiến

trúc no-ron đa mục tiêu để tối ưu hóa cả độ chính xác và FLOPS Cụ thể, nhómtác giả sử dụng ACC(n)x[FLOPS(m) /T]" làm mục tiêu tối ưu hóa, trong đóACC(m) và FLOPS(m) biểu thị độ chính xác va FLOPS của mô hình m, T là mức

FLOPS mục tiêu và w = —0.07 là siêu tham số để kiểm soát sự cân bằng giữa độ

chính xác và FLOPS Tuy nhiên không giống nghiên cứu trên, ở đây nhóm tác giả

tối ưu hóa FLOPS thay vì độ trễ vì họ không nhắm mục tiêu bắt kỳ thiết bị phần

cứng cụ thể nào Từ đó nhóm tác giả tạo ra một mạng hiệu quả, thứ được đặt tên

đặt tên là EfficientNet-B0.

Bắt đầu từ mô hình cơ sở EfficientNet-B0, nhóm tác giả áp dụng phương phápthu phóng phức hợp của mình để thu phóng quy mô với hai bước bao gồm:

® Bước 1: Dat giá trị ý = 1 là có định.Nhóm tác giả sau đó tién hành tìm giá

trị a,B,y theo công thức trên Cuối cùng nhóm tác giả tìm được các hệ sốtốt nhất cho EfficientNet-B0 là a = 1.2,B = 1.1, = 1.15 dưới điều kiện làa-B^-ˆ 2

® Bước 2: Sau đó cho giá trị a, B,1 có định rồi điều chỉnh giá trị @ để có được

EfficientNet-B1 tới B7

BANG 3.2: Số tham số của các mô hình EfficientNet

Số lượng tham số(triệu)

EfficientNet-B0 5.3 EfficientNet-B1 7.8 EfficientNet-B2 9.2 EfficientNet-B3 12

EfficientNet-B4 19

EfficientNet-B5 30

EfficientNet-B6 43 EfficientNet-B7 66

Ngày đăng: 05/10/2024, 00:25

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN