1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Khoa học máy tính: Phân lớp ảnh hiển vi tế bào ung thư máu bằng kỹ thuật xử lý mất cân bằng dữ liệu

73 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân lớp ảnh hiển vi tế bào ung thư máu bằng các kỹ thuật xử lý mất cân bằng dữ liệu
Tác giả Lý Hồng Thiên Ân, Trần Dương Kha
Người hướng dẫn TS. Lê Minh Hưng
Trường học Đại học Quốc gia TP. Hồ Chí Minh
Chuyên ngành Khoa học Máy tính
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2021
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 73
Dung lượng 35,43 MB

Nội dung

Trong khóa luận này, nhóm chúngtôi đề xuất các phương pháp tự động phân loại ảnh tế bào bình thường và tế bào ác tính dựa trên mang Convolutional Neural Network, với đầu vào là ảnh tế bà

Trang 1

ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

KHOA KHOA HỌC MÁY TÍNH

LÝ HÒNG THIÊN ÂN TRÀN DƯƠNG KHA

KHÓA LUẬN TÓT NGHIỆP

PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BẰNG

CAC KY THUAT XU LY MAT CAN BANG DU LIEU

CLASSIFCATION OF MALIGNANT CELLS IN B-ALL

WHITE BLOOD CANCER MICROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES

CU NHÂN NGANH KHOA HỌC MAY TÍNH

TP HO CHi MINH, 2021

Trang 2

ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

KHOA KHOA HỌC MÁY TÍNH

LÝ HÒNG THIÊN ÂN - 17520210

TRAN DƯƠNG KHA - 17520602

KHÓA LUẬN TÓT NGHIỆP

PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BẰNG

CAC KY THUAT XU LY MAT CAN BANG DU LIEU

CLASSIFCATION OF MALIGNANT CELLS IN B-ALL

WHITE BLOOD CANCER MICROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES

CU NHÂN NGANH KHOA HỌC MAY TÍNH

GIANG VIEN HUONG DAN

TS LE MINH HUNG

TP HO CHÍ MINH, 2021

Trang 3

DANH SÁCH HOI DONG BAO VỆ KHÓA LUẬN

Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số

TH SH Ki ni tt ngày / /2021 của Hiệu trưởng Trường Đại học Công nghệ Thông tin.

1 Chủ tịch: PGS.TS Lê Hoàng Thái

2 Thư ký: ThS Cáp Phạm Dinh Thăng

3 Ủy viên: TS Mai Tiến Dũng

Trang 4

ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH CONG HOA XÃ HOI CHỦ NGHĨA VIỆT NAM

TRUONG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN

TP HCM, ngày tháng năm 2021

NHẬN XÉT KHÓA LUẬN TÓT NGHIỆP

CỦA GIẢNG VIÊN HƯỚNG DẪN

Tên khóa luận:

PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BANG CÁC KỸ THUẬT

XU LY MÁT CAN BANG DU LIEU

(CLASSIFCATION OF MALIGNANT CELLS IN B-ALL WHITE BLOOD CANCER

MICROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES)

Nhóm SV thực hiên: Cán bô hướng dẫn:

Lý Hồng Thiên Ân — 17520210 TS Lê Minh Hưng

Tran Dương Kha — 17520602

Đánh giá Khóa luân:

1 Về cuốn báo cáo:

Số trang Số chương

Số bảng số liệu Số hình vẽ

Số tài liệu tham khảo Sản phẩm

Một số nhận xét về hình thức cuốn báo cáo:

Trang 5

Điểm từng sinh viên:

Trang 6

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH CONG HOA XÃ HOI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN

TP HCM, ngày tháng năm 2021

NHAN XÉT KHÓA LUẬN TOT NGHIỆP

CUA CÁN BỘ PHAN BIEN

Tên khóa luận:

PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BANG CÁC KỸ THUAT

XU LY MAT CAN BANG DU LIEU

(CLASSIFCATION OF MALIGNANT CELLS IN B-ALL WHITE BLOOD CANCER

IMCROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES)

Nhom SV thuc hién: Cán bô phản biên:

Lý Hồng Thiên Ân - 17520210 TS Mai Tiến Dũng

Trần Dương Kha - 17520602

Đánh gia Khóa luân:

1 Về cuốn báo cáo:

Số trang Số chương

Số bảng số liệu Số hình vẽ

Số tài liệu tham khảo Sản phẩm

Một số nhận xét về hình thức cuốn báo cáo:

Trang 8

ĐẠI HỌC QUOC GIA TP HO CHÍMINH CỘNG HÒA XA HOI CHỦ NGHĨA VIỆT NAM

TRUONG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc

CÔNG NGHỆ THÔNG TIN

DE CUONG CHI TIẾT

TEN DE TÀI: Phân lớp ảnh hiển vi tế bao ung thu máu bằng các kỹ thuật xử ly

mat cân bằng dữ liệu

TÊN DE TÀI TIENG ANH: Classification of Malignant Cells in B-ALL White

Blood Cancer Microscopic Image using unbalanced dataset processing techniques

Cán bộ hướng dẫn: T.S Lê Minh Hưng

Thời gian thực hiện: Từ ngày 07/09/2020 đến ngày 11/01/2021.

Sinh viên thực hiện:

Lý Hồng Thiên Ân - 17520210 Lớp: KHTN2017

Email: 17520210@gm.uit.edu.vn Điện thoại: 0969688712

Tran Dương Kha — 17520602 Lớp: KHTN2017

Email: 17520602 @gm.uit.edu.vn Điện thoại: 0906253029

Nội dung đề tài:

-_ Trong lĩnh vực y khoa về ung thư, bệnh ung thư máu rất nguy hiểm vì sự sản sinh

mat kiểm SOát của tế bào bạch cầu, dẫn đến thiếu máu Điều này có thể dẫn đến

chết sớm nếu được chân đoán vào những giai đoạn sau hay quá trình điều trị bị trì hoãn Vì vậy cần có các công cụ hỗ trợ dé phát hiện tế bào ung thư ở giai đoạn

đầu đề điều trị sớm, làm tăng khả năng sống của bệnh nhân.

Mục tiêu:

- _ Tìm hiểu kiến thức liên quan bệnh ung thư máu và các hướng giải quyết đã có

- Dé xuât mô hình mới trong việc phân loại tê bào ung thư mau

Phạm vi đề tài:

Trang 9

- Nhóm sử dụng bộ dữ liệu từ cuộc thi ISBI2019

Đối tượng:

- _ Tập trung vào lĩnh vực y khoa về ung thư máu

Phương pháp thực hiện:

Tim hiểu và phân tích dữ liệu ảnh hiền vi tế bào ung thư máu

Khảo sát các phương pháp tiên xử lý và hướng giải quyêt phân loại ảnh tê bào

ung thư máu đã có

- _ Xây dựng mô hình dé cải thiện các van đề tồn dong ở các mô hình đã có

Kết quả mong đợi:

- _ Xây dựng và nghiên cứu một số phương pháp, mô hình phân loại ảnh tế bao ung

thư máu

- Một mô hình phân loại có độ chính xác cao hơn mô hình học sâu truyền thống

Kế hoạch thực hiện:

STT Thời gian Nội Dung Sinh viên thực hiện

1 07/09/2020 - 14/09/2020 | Xác định dé tài thực hiện Lý Hồng Thiên Ân

Trần Dương Kha

2 15/09/2020 - 25/09/2020 | Tìm hiểu các nghiên cứu Lý Hồng Thiên Ân

liên quan Trần Dương Kha

So sánh kết quả từng

phương pháp

3 26/09/2020 - 03/10/2020 | Phân tích, xử lý dữ liệu Lý Hồng Thiên Ân

Trần Dương Kha

4 04/10/2020 - 24/10/2020 | Thực nghiệm các hướng Lý Hồng Thiên Ân

phát triện Trần Dương Kha

5 25/10/2020 - 25/11/2020 | Tiến hành cài đặt một số Lý Hồng Thiên Ân

phương pháp đã nghiên cứu Trần Dương Kha

6 26/11/2020 - 14/12/2020 | Đánh giá kết quả đã nghiên | Lý Hồng Thiên An

cứu và đưa ra các độ đo của Trần Dương Kha

mô hình

7 15/12/2020 - 11/01/2021 | Viết báo cáo và chính sửa | Lý Hồng Thiên An

Trần Dương Kha

Trang 10

Xác nhận của CBHD

(Ký tên và ghi rõ họ tên)

TS Lê Minh Hưng

Trang 11

LOI CAM ON

Đầu tiên, chúng em xin bày tỏ lòng biết on đến toàn thé Ban giám hiệu,quý thầy cô trường Đại học Công nghệ Thông tin đã tận tình giảng dạy, chỉ bảochúng em trong suốt quãng thời gian dưới mái trường Đại học

Chúng em xin cảm ơn TS Lê Minh Hưng đã tận tình giúp đỡ, hướng dẫn

chúng em trong suốt thời gian thực hiện đề tài khóa luận, cảm ơn thầy chia sẻ,động viên chúng em trong những quãng thời gian gặp khó khăn để chúng em cóthể hoàn thành khóa luận thuận lợi nhất

Chúng em cũng xin cảm ơn đến tập thể các bạn lớp KHTN2017 đã đồng

hành cùng chúng em trong suốt bốn năm học tập dưới mái trường Dai học

Dù nhóm thực hiện khóa luận đã cô gắng dé hoàn thành khóa luận với khảnăng tốt nhất, nhưng khóa luận này khó tránh khỏi những thiếu sót, nhóm thựchiện rất mong những ý kiến đóng góp của quý thầy cô

Một lần nữa chúng em xin chân thành cảm ơn!

Trang 12

MỤC LỤC

/9/:81990:70c07

DANH MỤC CÔNG THUC 2-2 s£s£Ss£EsseEssSvssSxsersserseersersserseeDANH MỤC HÌNH V Ế <2 s©ss©Ess©xs©xseESsersstrsersserssersetrserssersee

DANH MỤC TU VIET TAT - 5° s° 52s se S2 ESs£Ss£EssEssEssexserserssessee

TOM TAT KHÓA LUẬN 2-22¿©2S£+EEE£2EEC2EE2221E222127122211 211 2E crke 1CHUONG 1 MỞ ĐẦU -55:-c5Scctttttrtrtttrrrrttrirrrrrrirrrrrieg 2

1.1 GIỚI thiỆU SG 2 S3 9 TH HH HH Tnhh nh ng 2

1.2 _ Thách thức và hướng giải QuyẾt ¿-2¿©++++cx2x++zx+srxezrxrrreee 6

1.3 Mục tiêu và phạm vi nghién CỨU - eee 5< * + ***k**vEsEEesereeeskerske 7

1.4 Dong góp của khoá luận ¿+5 +22 +13 kg rưệt 8

1.5 Cấu trúc khóa luận -: -c+:+22++t2£Exttttrrttrtrrtrrrrrrrrrrrrrrrrrk 8

CHƯƠNG 2 CƠ SỞ LÝ THUYÊT -¿¿:-2252cccvcsrrrrrreerrrrrrree 9

2.1 Mạng nơ-ron tích chập — CNN - Ă SH Hy 9

2.1.1 Mang nơ-ron tích Chap eeeeceeceeseceseceseeeceeeceseceeeeeeeaeeeseseneeseeeas 9 2.1.2 Lớp ConvolutionalL - cv 9 HH ng rưy 10 2.1.3 Hàm kích hoạt - - - - c E33 221111111112231 111111 551111112 xe lãi 2.1.4 Lớp PoOling - SG HH HH rệt 13

2.1.5 Lớp Fully Connected (FC) cee eccccceseceseceseeeeseeeseeeeeeeeasensaeenaes 14

2.2 Học chuyền tiếp và tinh chỉnh mang cecceccececcesessesesesesseeseesesseeesseeees 16

2.3 Các mô hình học sâu liên quan - s5 555 + ***kESseeseeereeeererere 19

2.3.1 Mô hình DenselNet - sàn HH ngư 19

2.3.2 Mô hình EfficlentÌNet LH HH ng ng 21

2.4 HAM mất Mato eeccceeeecsssseeecessseeecessneecessnnesessnneseesnneeeessneeceesnetees 25

2.4.1 Hàm mat mát Binary Cross-Entropy -¿-zs s+zszzse+ 252.4.2 Hàm mất mát Focal O§S ¿2252 se SE+E+E+E+E+E+EvESEeEEEEzezszrsee 27

Trang 13

2.4.3 Hàm mat mát Hinge 1088 c.ccccccsscsssessessesssesseesesseessessessessessessesseeses 30

CHUONG 3 PHƯƠNG PHÁP THỰC HIỆN 2-©52©52+ss+cxcccez 31

cô: na e 31 3.2 _ Các nghiên cứu liên Quan - 5 5 + + xxx ng nrệt 32

3.3 Phương pháp thực hiỆn - 6 22 E3 E191 1311191119 1 ng re, 34

3.3.1 Phương pháp tiền xử lý ảnh đầu vào -¿-¿©cscc-xee: 353.3.2 Phương pháp xử lý mat cân bằng dit liệu -2- 2-52 383.3.3 Hàm mất mát cải tiến Focal Hinge Loss . -2- 5-5552 39

CHƯƠNG 4 THỰC NGHIỆM ¿25252222222 ‡v+xcEeEekerrrrxrrrxrrsee 41

4.1 DG ai cha 41 4.2 Cac thực nghiỆm c1 22211131111 1113 1119 1111 1H ng nh ng 41

4.2.1 Thực nghiệm 1: Phân lớp với SVM eee eeceeeseeseeeeseeeeneeeeneeeenees 42

4.2.2 Thực nghiệm 2: Huấn luyện mô hình DenseNet201 và

EfficientNetB2 với các hàm mat mát khác nhau - 43

4.2.3 Thực nghiệm 3: Thực nghiệm hàm mất mát đề xuất Focal Hinge

Loss và kết hợp mô hình - ¿2-2 2 £+££+E£Ee£EerEerkerxrrerreee 45

4.3 Chương trình demo -. c3 **E*EESEEEEEEtrereerrsrrrrererrsee 48

CHƯƠNG 5 KET LUẬN VA HƯỚNG PHAT TRIẺN - 51

5.1 Kt yan cocseccecccccccsscsssesssesssssssessecssecsssssssssecsussssssessseessessusssesssecsseesssseessess 515.2 Hướng phát tien ccececceeccecceccessessessesssssessecsesssessessessesssessessessesseessesseesees 51TÀI LIEU THAM KHAO 0 ccccccsscssssesssessssesssesssessssesssecssecsssesasecssesssnsessessseee 53

Trang 14

DANH MỤC BANG

Bảng 3.1 Phân phối dit liệu huấn luyện trước và sau khi tăng cường 37

Bảng 4.1 Kết quả trên tập đánh giá và kết quả trên tập kiểm tra khi sử dụng SVM

Vi dac trung SURF 012122 42

Bang 4.2 Kết qua W-FI của các thực nghiệm với các ham mat mát trên tập kiểm

Bang 4.3 Kết quả W-F1 của phương pháp đề xuất với các hàm mắt mát đã thực

nghiệm trên tập kIÊm (T4 - 5 + 11 91 1v ng ng ngư 45

Bảng 4.4 Confusion matrix của các mô hình tương ứng khi sử dụng Focal Hing

Bang 4.5 So sánh kết quả W-F1 Score của phương pháp đề xuất với các công

Trang 15

DANH MỤC CÔNG THỨC

Công thức 1 Binary CTOSS-€TTODY Gà vn ngu 26

Công thức 2 Hàm mat mát CE trong bài báo về Focal Loss . 27Công thức 3 Định nghĩa xác suất của mô hình trong bài báo về Focal Loss 27

Công thức 4 Hàm mat mát Focal Loss - 2-2 + +2 + E+E+EeEEeExeExzrezxez 29

Công thức 5 Ham mat mát Hinge Loss cc.cccccccsscsssesssesssesseessecssecsessecssecssecseesses 30Công thức 6 Ham mat mát Weighted Binary Cross-entropy - 38Công thức 7 Trọng số của hàm WBCE o csssesssessesssesssesssessscssecssecsssssecssecssecseceses 38

Công thức 8 Hàm mất mát Focal Hinge Loss 2 2- 2 s2 +2+z+£z+£xcsez 39

Công thức 9 Định nghĩa tham số alpha -2- 2-2 2 22S£+E££E££EeEEeEszrxzrszsez 39

Trang 16

DANH MỤC HÌNH VE

Hình 1.1 Minh họa bệnh bạch cầu - -¿©5++cc22+vtctcvvvrerrtrrrrrrrrrrrk 3Hình 1.2 Minh họa phương pháp đo tế bao dong chảyy -2¿© 2522 52552 5

Hình 1.3 Minh họa quy trình phân ỚP - 6 + 55t 2E sEEsskersrerkrsree 6

Hình 2.1 Minh họa toàn bộ luồng CNN để xử lý hình ảnh đầu vào và phân loại

các đôi tượng dựa trên giá tri [6] - - +5 + 2+ k + E+skEsskEseeseessrseee 9

Hình 2.2 Minh họa lớp Convolutional với bộ lọc 3x3, bước trượt l 10 Hình 2.3 Minh hoa hàm kích hoạt SigmOId - - 5s ++s£+s£+s£+s+eexeexeeres 12

Hình 2.4 Minh họa hàm kích hoạt Tanh 2552222 *s +2 s+++zeeezxe 12

Hình 2.5 Minh họa hàm kích họa ReLU 2 5255222 *£++2z££++ze£cezzx+ 13

Hình 2.6 Minh họa Max Pooling và Average Pooling -‹-s- «xxx 14

Hình 2.7 Minh họa lớp Fully Connected .- - 255 + + ++vssexssexeeexeeress 15

Hình 2.8 Minh họa một mang CNN hoàn chỉnh 55-55 s+s++s++sxsss 15

Hình 2.9 Minh họa cho học chuyên tiếp II 17

Hình 2.10 Minh họa một DenseNet có 5 block « «+ +++<ss+++zss+<zzs+ 19

Hình 2.11 Minh họa DenseNet với 4 Dense block, xen kẽ là các lớp transition 20

Hình 2.12 Kiến trúc DenselNet - 2 2+S2+SE+2E2EESEE22E22E122171 212222 Excrke 21

Hình 2.13 Thu phóng mô hình (a) là mạng cơ sở; (b)-(d) là mạng thu phóng trên

một chiều, lần lượt là chiều rộng, chiều sâu và độ phân giải; (e) là

mạng thu phóng trên cả ba chiều theo một tỷ lệ có định 22

Hình 2.14 Kiến trúc EfficienNets-BO cscscsssesssessesssessseessesssessussscssecssesseseseesses 24

Hình 2.15 Minh hoa Binary Cross Entropy s65 St Essesrsrsekre 26

Hình 2.16 Minh họa sự thay đổi của ham Focal Loss với một số giá trị gamma

khác nhau - - 5 (G1019 19119 Họ ng 28

Hình 2.17 Minh họa hàm Hinge Los - 5c 2c 22c 3221 SEseirssrrrsrrrerrre 30

Hình 3.1 Minh hoa số lượng mẫu ở các lớp trong các tập dữ liệu - 32Hình 3.2 Minh họa một số anh từ bộ dữ liệu, hàng trên là tế bảo ung thư, hàng

dưới là tế bao bình thường ¿2-2 2 SE E+EE2E£EeEEeEEeEEerkerkrreee 32

Trang 17

Hình 3.3 So sánh phương pháp đề xuất của tác giả với các công trình liên quan

Hình 3.4 Tổng quát phương pháp thực hiện của khóa luận -. - 35

Hình 3.5 Minh họa một số ảnh sau khi crop, hàng trên là tế bào ung thư, hàng

dưới là tế bào bình thường - 2-22 2 2+EE+EE££E£+EE+EEeEEezEzrxerxrree 36

Hình 3.6 Minh họa sự thay đổi của hàm Focal Hinge Loss với một SỐ giá tri

gamma khac mhau 0088 40

Hình 4.1 Kết qua dự đoán SVM kernel linear (bên trên) va kernel RBF (bên dưới)

trén tap Gan r0 42

Hình 4.2 Kiến trúc mang tinh chỉnh DenseNet201 và EfficientNetB2 44

Hình 4.3 Biểu đồ biểu diễn quá trình huấn luyện và đánh giá của EfficientNetB2

trên hàm mắt mát Focal Hinge LOss -¿ 2 2 ++x2£++zz+£xzsz 47

Hình 4.4 Biểu đồ biểu diễn quá trình huấn luyện và đánh giá của DenseNet201

trên hàm mat mát Focal Hinge LOss -. ¿- ¿2 +2 +22: 47

Hình 4.5 Minh họa giao diện W€bSI(e óc c 2+3 vn re 48

Hình 4.6 Minh họa trạng thái sau khi chọn ảnh (bên trên) và sau khi hoàn tất dự

đoán (bên ưƯỚI) c1 22 132111123111 1112 11181158111 111181118118 get 50

Trang 18

DANH MỤC TU VIET TAT

BCE Binary Cross-entropy

CE Cross-entropy

C-NMC Classification of Normal versus Malignant Cells in

B-ALL White Blood Cancer Microscopic Image CNN Convolutional Neural Network

ISBI IEEE International Symposium on Biomedical Imaging

FC Fully Connected

FHL Focal Hinge Loss

FL Focal Loss

ReLU Rectified Linear Unit

SURF Speeded-up Robust Features

SVM Support Vector Machine

WBCE Weighted Binary Cross-entropy

Trang 19

TOM TAT KHÓA LUẬN

Bệnh bạch cầu là loại ung thư tế bào bạch cầu có nguồn gốc trong tủy và ảnhhưởng cả người lớn và trẻ em Có 4 loại chính: Ac tính thé Lymphoblastic (Acute

Lymphoblastic Leukemia), ác tính thé Myelogenous (Acute Myelogenous Leukemia), lành tính thé Myeloid (Chronic Myeloid Leukemia), lành tính thé

Lymphocytic (Chornic Lymphocytic Leukemia) Trong đó, loại ác tinh ALL là

loai té bao hoat động không đúng, sinh sản vượt tầm kiểm soát, dẫn đến thiếu

2

Mau.

Thông qua dé tài, nhóm chúng tôi muốn nghiên cứu, thử nghiệm một số mô hình

phân loại tế bào bình thường và tế bào ác tính Kết quả của quá trình nghiên cứu

và thử nghiệm sẽ giúp bác sĩ giảm thời gian chân đoán tế bào ác tính và tăng độchính xác trong việc phân loại tế bào ác tính Trong khóa luận này, nhóm chúngtôi đề xuất các phương pháp tự động phân loại ảnh tế bào bình thường và tế bào

ác tính dựa trên mang Convolutional Neural Network, với đầu vào là ảnh tế bàomáu hiển vi đã được chuân hóa màu trong nhà kính và kết quả trả về là lớp mà tế

bào đó thuộc về, với xác suất dự đoán tương ứng Nhóm chúng tôi đã tiến hành

giải quyết vấn đề lớn là: các phương pháp xử lý ảnh đầu vào cho bài toán phân lớp

tế bào ung thư máu, và các phương pháp xử lý mat cân bằng giữa hai lớp, đề xuất

mô hình kết hợp DenseNet va EfficientNet cùng với hàm mat mát cải tiến Focal

Hinge Loss mà nhóm dé xuat.

Nhóm thực hiện đề xuất hàm mat mát Focal Hinge Loss dựa trên ý tưởng từ ham

mat mát Focal Loss và Hinge Loss có W-F1 Score cao hon một số thực nghiệmcủa các nghiên cứu khác Kết quả của hàm mat mát Focal Hinge Loss được thực

nghiệm trên bộ dữ liệu C-NMC2019 từ cuộc thi Classification of Normal versus

Malignant Cells in B-ALL White Blood Cancer Microscopic Image: ISBI2019

với 10661 ảnh huấn luyện thuộc 2 lớp bình thường và ác tinh ALL đạt được Fl

Score = 91.94% thuộc vào thứ hạng 5 trong cuộc thi.

Trang 20

Chuong 1 MỞ ĐẦU

Giới thiệu

Bệnh bạch cầu là loại ung thư tế bào bạch cầu có nguồn gốc trong tủy (xem

Hình 1.1) và ảnh hưởng cả người lớn và trẻ em Bệnh bach cầu có thể chiathành lành tính hoặc ác tính dựa trên tiễn độ phát triển của nó Có nhiềuloại bệnh bạch cầu, nhưng phổ biến nhất là 4 loại sau: Ác tính thểLymphoblastic (Acute Lymphoblastic Leukemia), ác tính thé Myelogenous

(Acute Myelogenous Leukemia), lành tính thé Myeloid (Chronic Myeloid

Leukemia), lành tính the Lymphocytic (Chornic Lymphocytic Leukemia).

Loại phổ biến nhất gây ảnh hưởng đến trẻ em là AML va ALL TrongALL, tế bào bạch cầu lympho không hoạt động bình thường và sinh san

vượt tầm kiểm soát, dẫn đến tình trạng thiêu máu.

Cụ thé hơn, trong tủy xương, các tế bào gốc sẽ bắt đầu nhân lên và phân

chia thành các tế bao máu cần thiết cho cơ thé như hồng cau, bach cầu vàtiêu cau Tuy nhiên, ở một người mac bệnh bạch cầu, các tế bào bach cầu

sẽ nhân chia nhanh chóng một cách không có hệ thống Các tế bào bấtthường này bắt đầu chiếm lấy phần lớn không gian bên trong tủy xương,

lấn át các tế bào bình thường khác, cản trở chúng phát triển Điều này rất

xấu cho cơ thé vì nhiều nguyên do: các tế bào ung thư nay không phục vụ

mục đích hữu ích nào cho cơ thể, mặt khác, nó còn chiếm không gian của

những tế bào khác khiến chúng không còn chỗ dé phát triển trong tủyxương, cuối cùng dẫn đến ngày càng ít tế bào bình thường được tạo ra vàcàng nhiều tế bào ung thư được giải phóng vào máu Khi không có một

lượng đầy đủ các tế bào máu bình thường, các cơ quan và mô trong cơ thể

sẽ không nhận được lượng oxy va chất dinh dưỡng chùng cần dé hoạt độnghiệu quả Hậu quả của nó có thé kế đến một số như cơ thé dễ bị nhiễmtrùng, suy nhược và mệt mỏi kéo dai, mat cân nặng và suy giảm cảm giác

thèm ăn, đau nhức suong, Những điêu này có thé dân đên chêt sớm nêu

Trang 21

bệnh nhân chỉ được chân đoán vao những giai đoạn sau của quá trình phát

triển ung thư, hay quá trình điều trị bị trì hoãn

Trong năm 2020 tai Mỹ có 6150 trường hợp mới do ALL (3470 ở nam giới

và 2680 ở nữ giới), 1520 trường hợp tử vong do ALL (860 ở nam giới và

660 ở nữ giới) Nguy cơ mắc ALL ở nam giới cao hơn nữ giới, ở người datrắng cao hơn người Mỹ gốc Phi Tuổi tác cũng là nhân tố nguy cơ quan

trọng ảnh hưởng đến sự chân đoán, mối nguy phát triển ALL cao nhất ở trẻ

em đưới 5 tuổi, sau đó giảm dan cho đến độ tuổi 25 và bắt đầu gia tăng trởlại sau 50 tuổi [1] Tuy nhiên, nếu bệnh bach cầu sớm được chan đoán vào

giai đoạn đầu, chúng ta có thê gia tăng khả năng điều trị và từ đó nâng cao

tỉ lệ sống sót cho bệnh nhân

Hematopoietic stem cells

Myeloid J Lymphoid

stem cells @) @ stem cells

— Abnormal Growth Abnormal Growth

masts of Myloid of Lymphoid

) white blood cells white blood cells

Hình 1.1 Minh họa bệnh bach cau’

Những van dé nêu trên đã tạo động lực cho sự xuât hiện của nhiêu cuộc thảo luận, nghiên cứu nhăm tìm ra các cách thức, công cụ phát hiện tê bào ung thư máu mới đê quá trình chân đoán và điêu tri trở nên hiệu quả hơn.

' Nguồn: https://my.clevelandclinic.org/health/diseases/4365-leukemia

3

Trang 22

Sự tiến bộ của công nghệ kỹ thuật áp dụng vào lĩnh vực y học có thể giúp

giảm thời gian, công sức của đội ngũ chuyên gia trong quá trình chân đoán

và điều trị Phân loại tế bào thông qua xử lý hình ảnh những năm gần đây

đã thu hút được nhiều sự quan tâm trên phương diện xây dựng các công cụchân đoán với sự hỗ trợ của máy tính đối với các bệnh rối loạn máu nhưbệnh bạch cầu Dé đi đến quyết định quả quyết về chân đoán bệnh và mức

độ tiến triển, việc xác định những tế bào ác tính với độ chính xác cao là rấtquan trọng Các công cụ dưới sự hỗ trợ của máy tính có thể rất hữu íchtrong việc tự động hóa quá trình phân đoạn và nhận dạng tế bào Việc xácđịnh tế bào ác tính và tế bào bình thường từ hình ảnh hién vi rất khó khănbởi vì về mặt hình thái cả hai loại tế bào tương đối giống nhau Kết quả làbệnh bạch cầu (ung thư máu) chỉ được phát hiện trong các giai đoạn ungthư đã phát triển mạnh thông qua phân tích hình ảnh hiển vi, không phải vì

khả năng dé xác định chúng đưới kính hiển vi, mà là vì kiến thức lĩnh vực

y tế, nghĩa là, các tế bào ung thư bắt đầu phát triển một cách không hạnchế, và do đó, chúng hiện diện với sé lượng lớn hon nhiều khi so với số

lượng của chúng ở một người bình thường [2|.

Tuy vậy, điều quan trọng là cần phải chân đoán bệnh sớm dé điều trị bệnhtốt hơn và cải thiện sự sông còn chung của các đối tượng mắc bệnh ungthư Mặc dù các phương pháp tiên tiến như phương pháp đo tế bào dòngchảy (flow cytometry) đã xuất hiện, đây là một công cụ dùng dé phát hiện

và xác định đặc điểm của tế bào vi sinh vật một cách nhanh chóng dựa trên

đặc tính tán xạ ánh sáng và huỳnh quang của chúng (xem Hình 7.2), nhưng

đây là một phương pháp sử dụng thiết bị công nghệ kỹ thuật cao nên chúngrất đắt tiền và không được trang bị rộng rãi trong các phòng thí nghiệm

bệnh lý hoặc các bệnh viện, đặc biệt là ở các vùng nông thôn Mặt khác,

một giải pháp dưa trên máy tính có thê được triển khai một cách dễ dàng

với một mức chi phí thấp hơn nhiêu

Giả thuyết rằng các phương pháp xử lý hình ảnh y tế tiên tiến có thể dẫn

đên việc xác định tê bảo bình thường và tê bào ác tính, và từ đó, có thê hỗ

4

Trang 23

trợ chân đoán ung thư một cách hiệu quả về mặt chỉ phí Với sự phát triển

đáng kinh ngạc của lĩnh vực trí tuệ nhân tạo (Artificial Intelligence), đặc

biệt là học sâu (Deep Learning), nó đã tìm được con đường ứng dụng của

mình trong rất nhiều lĩnh vực khác nhau, và lĩnh vực y tế cũng không phải

là một ngoại lệ Nhiều cuộc thử nghiệm trên quy mô nhỏ đã cho thấy tiềmnăng rất lớn của các công cụ ứng dụng trí tuệ nhân tạo Nhiều người kỳvọng rằng trong tương lại không xa, chúng ta sẽ có thể hoàn toàn tin tưởngcông nghệ này và mở rộng quy mô sử dụng trên toàn thế giới Điều này sẽđưa con người tiến đến một bước nhảy vọt trong vấn đề chăm sóc sức

khỏe, và từ đó nâng cao đáng kê chât lượng cuộc sông của con người.

Hình 1.2 Minh họa phương pháp đo tế bào dòng chảy”

Bài toán cụ thê:

? Nguồn:

https://www.researchgate.net/figure/Principles-of-flow-cytometry-in-a-sample-cells-of-interest-are-labeled-with_fig2_ 304613284

5

Trang 24

Xây dựng một mô hình thực hiện nhiệm vụ phân lớp nhi phân (2 lớp) giữa

tế bào bạch cầu bình thường và tế bào bạch cầu ung thư

Input: Ảnh hiển vi của tế báo bạch cau

Output: Lớp phân loại dự đoán tương ứng (1: Ung thu, 0: Bình thường).

Xử lý ảnh đầu vào Tăng cường dữ liệu > Mô hình CNN

| Xửlýmẩtcân

| bang dữ liệu

| trong quả trình

i huấn luyện

Hình 1.3 Minh họa quy trình phân lớp.

Thách thức và hướng giải quyết

Thách thức:

Do van đề bao mật dữ liệu của lĩnh vực y té, dé thu thập được một tập anhlâm sàn lớn là một thách thức không nhỏ Mặt khác, hiệu suất của mô hìnhhọc sâu chịu ảnh hưởng lớn vào kích thước bộ dữ liệu huấn luyện Do đó,

dữ liệu không đủ lớn trở thành một vấn đề đáng lưu tâm

Hình thái giữa tế bào ung thư và tế bào bình thường tương đối giống nhau.Điều này làm cho việc tìm đặc trưng phân biệt giữa hai loại tế bào trở nên

Trang 25

Kết hợp mô hình dé nhăm kết hop đặc trưng rút trích và làm tăng khả năng

phân lớp của bộ phân loại.

Mục tiêu và phạm vỉ nghiên cứu

Sau day là mục tiêu và phạm vi nghiên cứu mà khóa luận hướng tới:

Mục tiêu nghiên cứu:

Tìm hiểu tông quan về bài toán phân loại ảnh hiển vi tế bào ung thư máuB-ALL, tìm hiểu bộ đữ liệu C-NMC 2019 [3] được sử dụng tại cuộc thi

Cải tiến hàm mat mát từ Focal Loss và Hinge Loss cùng phương pháp kết

hợp mô hình so với các nghiên cứu liên quan trước đó.

Pham vi nghiên cứu:

Tìm hiểu tổng quan về bài toán phân loại ảnh hiển vi tế bào ung thư máuB-ALL, tìm hiểu bộ dữ liệu C-NMC 2019 được sử dụng tại cuộc thi

ISBI2019.

Đánh giá kết qua của một số phương pháp mô hình tốt hiện nay

Tìm hiểu một số mô hình CNN như: EfficientNet [4], DenseNet [5]

Tìm hiểu cách xử lý anh tế bào khi đưa vào mô hình CNN

Trang 26

1.5

Tìm hiểu các phương pháp xử lý mat cân bằng dữ liệu

Đánh giá hàm mat mát cải tiễn và phương pháp kết hợp mô hình so với các

nghiên cứu liên quan trước đó.

Đóng góp của khoá luận

Những đóng góp chính của chúng tôi trong khoá luận này bao gồm:

Hệ thống lại kiến thức mô hình học sâu mạng tích chập và tìm hiểu cácphương pháp giải quyết bài toán phân lớp ảnh hiền vi tế bào ung thư máu

Phân tích đánh giá một số phương pháp tiên tiến hiện nay cho bài toánphân lớp ảnh hiền vi tế bào ung thư máu

Đề xuất hàm mat mát Focal Hinge Loss giải quyết van đề mat cân băng dữliệu dựa trên hàm mat mát Focal Loss và Hinge Loss

Lam tiền dé cho các nghiên cứu sau này

Cấu trúc khóa luận

Bồ cục của khóa luận bao gồm:

Chương 1 Mở đầu: Giới thiệu tổng quan bài toán, mục tiêu, phạm vi và

Chương 5 Kết luận và Hướng phát triển: Đưa ra kết luận, tổng kết

những kết quả đạt được và đề ra hướng phát triển nghiên cứu trong tương

lai.

Trang 27

Trong mạng nơ-ron, mô hình mạng nơ-ron tích chập (CNN) là một trong

những mô hình dé nhận dạng và phân loại hình ảnh Trong đó, xác định đốitượng và nhận dạng khuôn mặt là một trong sỐ những lĩnh vực mà CNN

được sử dụng rộng rãi.

CNN phân loại hình ảnh bằng cách lấy 1 hình anh đầu vào, xử lý va phân

loại nó theo các hạng mục nhất định (Ví dụ: chó, mèo, gau, ) May tinh

coi hình ảnh đầu vào là một mang pixel và nó phụ thuộc vào độ phân giảicủa hình ảnh Dựa trên độ phân giải hình anh, máy tính sẽ thấy H x W x D(H: chiều cao, W: chiều rộng, D: độ dày)

Về kỹ thuật, mô hình CNN để huấn luyện và kiểm tra, mỗi hình ảnh đầuvào sẽ chuyển nó qua một loạt các lớp tích chập với các bộ lọc, tổng hợp

lại các lớp được kết nối đầy đủ (Fully Connected) và áp dụng hàm Softmax

dé phân loại đối tượng có giá trị xác suất giữa 0 và 1 (Hình 2.1) [6]

| IMPUT CONVOLUTION + RELU POOLING CONVOLUTION + RELU POOLING =_— CONNECTED SOFTMAX 7

FEATURE LEARNING CLASSIFICATION

Hình 2.1 Minh họa toàn bộ luồng CNN dé xử lý hình anh đầu vào và phân

loại các đối tượng dựa trên giá trị [6].

Trang 28

2.1.2 Lớp Convolutional

Lớp Convolutional, hay còn gọi là lớp tích chập, là thành phần đầu tiên vàcũng là thành phần quan trọng nhất của mạng CNN, đảm nhận chức năngtrích xuất đặc trưng từ đữ liệu đầu vào Lớp tích chập lây dữ liệu đầu vào là

ảnh hoặc dữ liệu đầu ra của lớp liền trước, thực hiện các phép chuyên đổi

để tạo ra dữ liệu đầu vào cho lớp kế tiếp (đầu ra lớp này là đầu vào lớpsau) Đầu ra của lớp tích chập thường được gọi là feature map Phépchuyên đổi được sử dụng ở đây là phép tính tích chập Mỗi lớp tích chậpchứa một hoặc nhiều bộ lọc — bộ phát hiện đặc trưng (filter — featuredetector) cho phép phát hiện và trích xuất những đặc trưng khác nhau của

ảnh Những bộ lọc ở các lớp tích chập đầu chịu trách nhiệm nắm bắt những

đặc trưng cấp thấp (low-level feature) như cạnh, màu sắc Ở những lớp tiếptheo, những bộ lọc sẽ có thể phát hiện các đối tượng cụ thé như góc cạnh,

hình tròn, hình vuông, đường sọc, các hình dạng phức tạp hơn Khi mạng

càng sâu, thì những bộ lọc này càng có khả năng năm bắt những đặc trưngphức tạp hơn nữa như tai, mắt, mũi, miệng, ; và cuối cùng, chúng có thể

phát hiện được những đặc trưng cấp cao (high-level feature) như toàn bộ

hình dạng khuôn mặt, động vật, nhà cửa, Theo một cách tóm gọn, mạng

càng sâu, số lượng lớp Convolutional càng nhiều, thì mô hình sẽ càng có

thêm khả năng học được những đặc trưng phức tạp của dữ liệu, từ đó gia

tăng đáng ké độ chính xác của kết quả dự đoán

Ảnh Bộ lọc Feature map

Hình 2.2 Minh họa lớp Convolutional với bộ lọc 3x3, bước trượt 1.

10

Trang 29

2.1.3 Hàm kích hoạt

Hàm kích hoạt là hàm được thêm vào mạng nơ-rơn nhân tạo để giúp mạng

có thê học được những đặc trưng phức tạp của dữ liệu (hàm kích hoạt được

sử dụng ngay sau lớp Convolutional hay lớp Fully Connected) Hau hết

những dữ liệu trong thực tế đều có tính phi tuyến, do đó mạng nơ-ron cũng

cần phải thể hiện được tính phi tuyến tương ứng, và hàm kích hoạt sẽ giúpmạng có được tính chất trên Do đó, hàm kích hoạt có ảnh hưởng khôngnhỏ đến kết quả và độ chính xác của mô hình Có nhiều loại hàm kích hoạt

có thé được sử dụng như Sigmoid, Tanh, ReLU,

e Sipmoid

Hàm kích hoạt Sigmoid nhận giá trị đầu vào và biến đối nó thành một giátrị nằm trong khoảng từ 0 đến 1 (Hinh 2.3) Khi giá trị đầu vào là một giátri đương lớn, giá tri đầu ra sẽ gần bằng 1; và ngược lại, khi giá trị đầu vào

là một giá trị âm nhỏ, giá trị đầu ra sẽ gần bằng 0 Hàm Sigmoid có nhược

điểm là bão hòa ở hai cực và gây ra vấn đề triệt tiêu đạo hàm (vanishinggradient): khi đầu vào là các giá trị càng âm hoặc càng đương, đạo hàm của

hàm số tại các giá trị này sẽ tiến gần đến 0 Và khi giá trị đạo hàm gầnbang 0, các trọng số tương ứng với nơ-ron đang xét sẽ gần như không được

cập nhật, hay nói cách khác, mô hình lúc này gần như không học được nữa

Hàm Sigmoid còn có nhược điểm là không có trung tâm tại 0

(zero-centered) gây khó khăn cho việc hội tụ [7]; và ngoài ra còn yêu cầu chỉ phí

tính toán cao.

11

Trang 30

Hình 2.3 Minh họa hàm kích hoạt Sigmoid.

Tanh

Hàm Tanh là hàm kích hoạt phi tuyến khá tương đồng với hàm Sigmoid.

Miền giá trị đầu ra của hàm Tanh thuộc khoảng từ -1 đến 1 (Hình 2.4).Hàm Tanh giúp khắc phục được một nhược điểm của hàm Sigmoid đó là

có trung tâm tại 0, do đó nó giúp quá trình hội tụ diễn ra nhanh hơn Nhưng

mặt khác nó vẫn còn tôn tại những nhược điêm còn lại của hàm Sigmoid.

Hình 2.4 Minh họa hàm kích hoạt Tanh.

ReLU

12

Trang 31

ReLU, viết tắt của Rectified Linear Unit, là hàm kích hoạt phi tuyến được

sử dụng phổ biến nhất trong các mạng nơ-ron hiện nay Hàm ReLU rất đơngiản, nó chuyên đổi bat kỳ giá trị nào nhỏ hơn 0 thành 0 (Hinh 2.5) Do đó,hàm ReLU rất hiệu quả về mặt tính toán khi nó yêu cầu ít chi phí tính toán

hơn so với hàm Sigmoid và Tanh Hàm ReLU không xảy ra hiện tượng bão

hòa nên nó không gây ra vấn đề triệt tiêu đạo hàm Nhưng hàm ReLU gặpphải một vấn đề gọi là “chết ReLU” (dying ReLU) Với các giá trị đầu vào

âm, đạo ham tại các giá tri này sẽ bằng 0, dẫn tới việc trọng số của một số

nơ-ron sẽ không được cập nhật và từ đó ngăn cản quá trình hội tụ Hiện

tượng này được khắc phục ở một số hàm kích hoạt cải tiễn của hàm ReLU

như Leaky ReLU, Parameterised ReLU,

lớn nhất trong một vùng được chỉ định Lớp Pooling hoạt động gắn giống

với lớp Convolutional, nó cũng có một cửa sô trượt gọi là pooling window,

13

Trang 32

cửa sô này trượt qua từng phan của ma trận dữ liệu đầu vào (thường là các

feature map có được từ lớp Convolutional), trả về giá trị tương ứng với mộtphương thức cụ thể từ vùng được xác định bởi pooling window (với MaxPooling, phương thức đó là lấy giá trị lớn nhất) (Hình 2.6) Một số loại

Pooling khác như Average Pooling, Sum Pooling, trong đó Average

Pooling trả về giá trị trung bình, còn Sum Pooling trả về giá trị tổng

Max Pooling với

Nếu những lớp Convolutional và lớp Pooling có vai trò như bộ trích xuất

đặc trưng, thì những lớp FC có vai trò như bộ phân loại Sau khi ảnh được

truyền qua nhiều lớp Convolutional và lớp Pooling thì mô hình lúc này đã

học được tương đối các đặc trưng của ảnh Đến phân đoạn này, mạng CNN

sẽ bắt đầu trở nên giống với mạng nơ-ron truyền thống Đầu ra của lớpPooling cuối cùng là các feature map sẽ được “làm phang” thành mộtvector Nghĩa là, giả sử đầu ra là một tập gồm N feature map có kích thướcHxW, thì sau khi “làm phẳng” sẽ thu được một vector có HxWxN phần tử

Sau đó vector này sẽ được kết nối với lớp Fully Connected dé kết hợp các

14

Trang 33

đặc trưng tìm được ở quá trình trước đó và đưa ra kết quả dự đoán của mô

hình Có thể có hai hay nhiều lớp FC với số lượng nơ-ron bất kỳ, nhưng

lớp FC cuối cùng sẽ có số nơ-ron tương ứng với số lớp của bài toán và sử

dung hàm kích hoạt sigmoid hoặc softmax để cho ra một phân phối xác

suất và từ phân phối xác suất này ta có thé đưa ra quyết định dự đoán (Hình

Trang 34

2.2 Học chuyền tiếp và tinh chỉnh mạng

Học chuyền tiếp (Transfer Learning) là phương pháp được sử dụng phổbiến trong các bài toán hiện nay Học chuyền tiếp là kỹ thuật sử dụng môhình đã được huấn luyện trên một tập dữ liệu cụ thé nào đó để giải quyếtmột tác vụ cụ thể nào đó và tận dụng “kiến thức” đã học được từ đó đểthích ứng nó trên tập dữ liệu mới nhằm giải quyết vấn đề mới Thực tếngày nay ít trường hợp sử dụng mô hình học từ đầu, nhất là các mô hình

học sâu (Deep Learning) Việc huấn luyện một mô hình học sâu để giải

quyết một vấn đề phức tạp thông thường cần một lượng dữ liệu rất lớn,nhưng việc thu thập lượng dữ liệu như vậy có thê rất khó khăn bởi nhiều lý

do, có thé kê đến như là thời gian và nỗ lực cần có dé thu thập va gan nhãncho các mẫu dữ liệu, đặc biệt là trong các lĩnh vực như y tế khi dữ liệu tiếp

cận được rất hạn chế, không được công bồ rộng rãi và đòi hỏi một đội ngũchuyên gia với trình độ chuyên môn cao để gắn nhãn Điều này chính là

động lực cho sự xuất hiện của học chuyên tiếp Một điều đáng chú ý lànhiều thí nghiệm đã cho thấy rằng học chuyền tiếp thường sẽ dẫn đến kếtquả tốt hơn so với huấn luyện hoàn toàn từ đầu trên tập dữ liệu mục tiêu,nghĩa là, sử dụng trọng số được khởi tạo từ trọng số của một mô hình đãđược huấn luyện thường sẽ cho kết quả tốt hơn so với khởi tạo trọng số

một cách ngẫu nhiên (Hình 2.9).

16

Trang 35

Transfer learning: idea

Source labels i Target labels =

Hinh 2.9 Minh hoa cho hoc chuyén tiép [10]

Có hai chiến thuật phố biến nhất cho học chuyền tiếp:

Loại bỏ lớp phân loại cuối cùng (lớp FC cuối cùng) của mô hình muốn tậndụng kiến thức, sử dụng phan mô hình còn lại dé chuyển đổi dữ liệu thành

một vector có số chiều bằng với số nơ-ron của lớp FC cuối mới (lớp FC kếcuối trước khi loại bỏ lớp EC cuối) Như vậy cho phép ta trích xuất đặctrưng từ nguồn dữ liệu mới, tận dụng kiến thức có được từ nguồn dữ liệu

khác Ta có thê dùng đặc trưng trích xuất được cho những tác vụ khác

Chiến thuật tiếp theo sẽ tién xa thêm một bước, lần này ta sẽ loại bỏ một

hoặc một số lớp phân loại cuối cùng và thay thế chúng với một hoặc một số

lớp khác và tiễn hành tái huấn luyện có chọn lọc một số lớp trước đó Như

ta đã biết, thông thường những lớp đầu sẽ nắm bắt dữ liệu ở dạng thị giác

máy tính cấp thấp (low-level vision) như cạnh, màu sắc, còn những lớpcuối sẽ chứa thông tin thị giác cấp cao (high-level vision) liên quan tới ứngdụng, bài toán cụ thé Sử dụng sự hiểu biết này, ta có thể đóng băng một sỐlớp nhất định trong khi tái huấn luyện, hoặc tinh chỉnh toàn bộ lớp dé phù

hợp với nhu cầu của chúng ta Lấy một ví dụ, sử dụng mô hình VGG đã

được huấn luyện với tập dữ liệu lớn như ImageNet, ta sẽ loại bỏ lớp FC

17

Trang 36

cuối (lớp FC với 1000 no-ron) và thay thé với lớp FC mới, ví dụ lớp FC

với 3 nơ-ron trong trường hợp bài toán phân loại 3 lớp; hoặc ta cũng có théloại bỏ cả 3 lớp FC cuối của mạng VGG và thay thé nó với hai hoặc nhiềuhơn lớp FC mới với số lượng nơ-ron khác và bắt đầu tái huấn luyện Trongtrường hợp này, ta sẽ tận dụng kiến thức của toàn bộ mạng và sử dụng nónhư điểm khởi đầu cho bước tái huấn luyện Điều này đổi lại giúp ta đạt

được hiệu suất tốt hơn với thời gian huấn luyện nhỏ hơn

Tinh chỉnh mạng: trong quá trình huấn luyện, ta có thé đóng băng (freeze)hoặc mở băng (unfreeze) một hoặc nhiều lớp của mạng Trong đó, các lớp

bị đóng băng, trọng số sẽ không được cập nhật trong suốt quá trình lan

truyền ngược (backpropagation) Ngược lại, trọng số ở các lớp không bị

đóng băng sẽ được cập nhật liên tục trong quá trình lan truyền ngược Việc

chọn freeze hay unfreeze một hay nhiều lớp phụ thuộc vào tính chất của

bài toán Nếu dữ liệu mới có số lượng nhỏ, ta nên freeze nhiều hơn dé tránhoverfitting; trong trường hợp dữ liệu mới có số lượng lớn, ta có thê

unfreeze nhiều lớp hơn đề mô hình có thể học được hiệu quả hơn.

18

Ngày đăng: 02/10/2024, 04:30