Trong khóa luận này, nhóm chúngtôi đề xuất các phương pháp tự động phân loại ảnh tế bào bình thường và tế bào ác tính dựa trên mang Convolutional Neural Network, với đầu vào là ảnh tế bà
Trang 1ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC MÁY TÍNH
LÝ HÒNG THIÊN ÂN TRÀN DƯƠNG KHA
KHÓA LUẬN TÓT NGHIỆP
PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BẰNG
CAC KY THUAT XU LY MAT CAN BANG DU LIEU
CLASSIFCATION OF MALIGNANT CELLS IN B-ALL
WHITE BLOOD CANCER MICROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES
CU NHÂN NGANH KHOA HỌC MAY TÍNH
TP HO CHi MINH, 2021
Trang 2ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC MÁY TÍNH
LÝ HÒNG THIÊN ÂN - 17520210
TRAN DƯƠNG KHA - 17520602
KHÓA LUẬN TÓT NGHIỆP
PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BẰNG
CAC KY THUAT XU LY MAT CAN BANG DU LIEU
CLASSIFCATION OF MALIGNANT CELLS IN B-ALL
WHITE BLOOD CANCER MICROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES
CU NHÂN NGANH KHOA HỌC MAY TÍNH
GIANG VIEN HUONG DAN
TS LE MINH HUNG
TP HO CHÍ MINH, 2021
Trang 3DANH SÁCH HOI DONG BAO VỆ KHÓA LUẬN
Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số
TH SH Ki ni tt ngày / /2021 của Hiệu trưởng Trường Đại học Công nghệ Thông tin.
1 Chủ tịch: PGS.TS Lê Hoàng Thái
2 Thư ký: ThS Cáp Phạm Dinh Thăng
3 Ủy viên: TS Mai Tiến Dũng
Trang 4ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH CONG HOA XÃ HOI CHỦ NGHĨA VIỆT NAM
TRUONG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN
TP HCM, ngày tháng năm 2021
NHẬN XÉT KHÓA LUẬN TÓT NGHIỆP
CỦA GIẢNG VIÊN HƯỚNG DẪN
Tên khóa luận:
PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BANG CÁC KỸ THUẬT
XU LY MÁT CAN BANG DU LIEU
(CLASSIFCATION OF MALIGNANT CELLS IN B-ALL WHITE BLOOD CANCER
MICROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES)
Nhóm SV thực hiên: Cán bô hướng dẫn:
Lý Hồng Thiên Ân — 17520210 TS Lê Minh Hưng
Tran Dương Kha — 17520602
Đánh giá Khóa luân:
1 Về cuốn báo cáo:
Số trang Số chương
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một số nhận xét về hình thức cuốn báo cáo:
Trang 5Điểm từng sinh viên:
Trang 6ĐẠI HỌC QUOC GIA TP HO CHÍ MINH CONG HOA XÃ HOI CHỦ NGHĨA VIỆT NAM
TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN
TP HCM, ngày tháng năm 2021
NHAN XÉT KHÓA LUẬN TOT NGHIỆP
CUA CÁN BỘ PHAN BIEN
Tên khóa luận:
PHAN LỚP ANH HIẾN VI TE BAO UNG THU MAU BANG CÁC KỸ THUAT
XU LY MAT CAN BANG DU LIEU
(CLASSIFCATION OF MALIGNANT CELLS IN B-ALL WHITE BLOOD CANCER
IMCROSCOPIC IMAGE USING UNBALANCED DATASET PROCESSING TECHNIQUES)
Nhom SV thuc hién: Cán bô phản biên:
Lý Hồng Thiên Ân - 17520210 TS Mai Tiến Dũng
Trần Dương Kha - 17520602
Đánh gia Khóa luân:
1 Về cuốn báo cáo:
Số trang Số chương
Số bảng số liệu Số hình vẽ
Số tài liệu tham khảo Sản phẩm
Một số nhận xét về hình thức cuốn báo cáo:
Trang 8ĐẠI HỌC QUOC GIA TP HO CHÍMINH CỘNG HÒA XA HOI CHỦ NGHĨA VIỆT NAM
TRUONG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc
CÔNG NGHỆ THÔNG TIN
DE CUONG CHI TIẾT
TEN DE TÀI: Phân lớp ảnh hiển vi tế bao ung thu máu bằng các kỹ thuật xử ly
mat cân bằng dữ liệu
TÊN DE TÀI TIENG ANH: Classification of Malignant Cells in B-ALL White
Blood Cancer Microscopic Image using unbalanced dataset processing techniques
Cán bộ hướng dẫn: T.S Lê Minh Hưng
Thời gian thực hiện: Từ ngày 07/09/2020 đến ngày 11/01/2021.
Sinh viên thực hiện:
Lý Hồng Thiên Ân - 17520210 Lớp: KHTN2017
Email: 17520210@gm.uit.edu.vn Điện thoại: 0969688712
Tran Dương Kha — 17520602 Lớp: KHTN2017
Email: 17520602 @gm.uit.edu.vn Điện thoại: 0906253029
Nội dung đề tài:
-_ Trong lĩnh vực y khoa về ung thư, bệnh ung thư máu rất nguy hiểm vì sự sản sinh
mat kiểm SOát của tế bào bạch cầu, dẫn đến thiếu máu Điều này có thể dẫn đến
chết sớm nếu được chân đoán vào những giai đoạn sau hay quá trình điều trị bị trì hoãn Vì vậy cần có các công cụ hỗ trợ dé phát hiện tế bào ung thư ở giai đoạn
đầu đề điều trị sớm, làm tăng khả năng sống của bệnh nhân.
Mục tiêu:
- _ Tìm hiểu kiến thức liên quan bệnh ung thư máu và các hướng giải quyết đã có
- Dé xuât mô hình mới trong việc phân loại tê bào ung thư mau
Phạm vi đề tài:
Trang 9- Nhóm sử dụng bộ dữ liệu từ cuộc thi ISBI2019
Đối tượng:
- _ Tập trung vào lĩnh vực y khoa về ung thư máu
Phương pháp thực hiện:
Tim hiểu và phân tích dữ liệu ảnh hiền vi tế bào ung thư máu
Khảo sát các phương pháp tiên xử lý và hướng giải quyêt phân loại ảnh tê bào
ung thư máu đã có
- _ Xây dựng mô hình dé cải thiện các van đề tồn dong ở các mô hình đã có
Kết quả mong đợi:
- _ Xây dựng và nghiên cứu một số phương pháp, mô hình phân loại ảnh tế bao ung
thư máu
- Một mô hình phân loại có độ chính xác cao hơn mô hình học sâu truyền thống
Kế hoạch thực hiện:
STT Thời gian Nội Dung Sinh viên thực hiện
1 07/09/2020 - 14/09/2020 | Xác định dé tài thực hiện Lý Hồng Thiên Ân
Trần Dương Kha
2 15/09/2020 - 25/09/2020 | Tìm hiểu các nghiên cứu Lý Hồng Thiên Ân
liên quan Trần Dương Kha
So sánh kết quả từng
phương pháp
3 26/09/2020 - 03/10/2020 | Phân tích, xử lý dữ liệu Lý Hồng Thiên Ân
Trần Dương Kha
4 04/10/2020 - 24/10/2020 | Thực nghiệm các hướng Lý Hồng Thiên Ân
phát triện Trần Dương Kha
5 25/10/2020 - 25/11/2020 | Tiến hành cài đặt một số Lý Hồng Thiên Ân
phương pháp đã nghiên cứu Trần Dương Kha
6 26/11/2020 - 14/12/2020 | Đánh giá kết quả đã nghiên | Lý Hồng Thiên An
cứu và đưa ra các độ đo của Trần Dương Kha
mô hình
7 15/12/2020 - 11/01/2021 | Viết báo cáo và chính sửa | Lý Hồng Thiên An
Trần Dương Kha
Trang 10Xác nhận của CBHD
(Ký tên và ghi rõ họ tên)
TS Lê Minh Hưng
Trang 11LOI CAM ON
Đầu tiên, chúng em xin bày tỏ lòng biết on đến toàn thé Ban giám hiệu,quý thầy cô trường Đại học Công nghệ Thông tin đã tận tình giảng dạy, chỉ bảochúng em trong suốt quãng thời gian dưới mái trường Đại học
Chúng em xin cảm ơn TS Lê Minh Hưng đã tận tình giúp đỡ, hướng dẫn
chúng em trong suốt thời gian thực hiện đề tài khóa luận, cảm ơn thầy chia sẻ,động viên chúng em trong những quãng thời gian gặp khó khăn để chúng em cóthể hoàn thành khóa luận thuận lợi nhất
Chúng em cũng xin cảm ơn đến tập thể các bạn lớp KHTN2017 đã đồng
hành cùng chúng em trong suốt bốn năm học tập dưới mái trường Dai học
Dù nhóm thực hiện khóa luận đã cô gắng dé hoàn thành khóa luận với khảnăng tốt nhất, nhưng khóa luận này khó tránh khỏi những thiếu sót, nhóm thựchiện rất mong những ý kiến đóng góp của quý thầy cô
Một lần nữa chúng em xin chân thành cảm ơn!
Trang 12MỤC LỤC
/9/:81990:70c07
DANH MỤC CÔNG THUC 2-2 s£s£Ss£EsseEssSvssSxsersserseersersserseeDANH MỤC HÌNH V Ế <2 s©ss©Ess©xs©xseESsersstrsersserssersetrserssersee
DANH MỤC TU VIET TAT - 5° s° 52s se S2 ESs£Ss£EssEssEssexserserssessee
TOM TAT KHÓA LUẬN 2-22¿©2S£+EEE£2EEC2EE2221E222127122211 211 2E crke 1CHUONG 1 MỞ ĐẦU -55:-c5Scctttttrtrtttrrrrttrirrrrrrirrrrrieg 2
1.1 GIỚI thiỆU SG 2 S3 9 TH HH HH Tnhh nh ng 2
1.2 _ Thách thức và hướng giải QuyẾt ¿-2¿©++++cx2x++zx+srxezrxrrreee 6
1.3 Mục tiêu và phạm vi nghién CỨU - eee 5< * + ***k**vEsEEesereeeskerske 7
1.4 Dong góp của khoá luận ¿+5 +22 +13 kg rưệt 8
1.5 Cấu trúc khóa luận -: -c+:+22++t2£Exttttrrttrtrrtrrrrrrrrrrrrrrrrrk 8
CHƯƠNG 2 CƠ SỞ LÝ THUYÊT -¿¿:-2252cccvcsrrrrrreerrrrrrree 9
2.1 Mạng nơ-ron tích chập — CNN - Ă SH Hy 9
2.1.1 Mang nơ-ron tích Chap eeeeceeceeseceseceseeeceeeceseceeeeeeeaeeeseseneeseeeas 9 2.1.2 Lớp ConvolutionalL - cv 9 HH ng rưy 10 2.1.3 Hàm kích hoạt - - - - c E33 221111111112231 111111 551111112 xe lãi 2.1.4 Lớp PoOling - SG HH HH rệt 13
2.1.5 Lớp Fully Connected (FC) cee eccccceseceseceseeeeseeeseeeeeeeeasensaeenaes 14
2.2 Học chuyền tiếp và tinh chỉnh mang cecceccececcesessesesesesseeseesesseeesseeees 16
2.3 Các mô hình học sâu liên quan - s5 555 + ***kESseeseeereeeererere 19
2.3.1 Mô hình DenselNet - sàn HH ngư 19
2.3.2 Mô hình EfficlentÌNet LH HH ng ng 21
2.4 HAM mất Mato eeccceeeecsssseeecessseeecessneecessnnesessnneseesnneeeessneeceesnetees 25
2.4.1 Hàm mat mát Binary Cross-Entropy -¿-zs s+zszzse+ 252.4.2 Hàm mất mát Focal O§S ¿2252 se SE+E+E+E+E+E+EvESEeEEEEzezszrsee 27
Trang 132.4.3 Hàm mat mát Hinge 1088 c.ccccccsscsssessessesssesseesesseessessessessessessesseeses 30
CHUONG 3 PHƯƠNG PHÁP THỰC HIỆN 2-©52©52+ss+cxcccez 31
cô: na e 31 3.2 _ Các nghiên cứu liên Quan - 5 5 + + xxx ng nrệt 32
3.3 Phương pháp thực hiỆn - 6 22 E3 E191 1311191119 1 ng re, 34
3.3.1 Phương pháp tiền xử lý ảnh đầu vào -¿-¿©cscc-xee: 353.3.2 Phương pháp xử lý mat cân bằng dit liệu -2- 2-52 383.3.3 Hàm mất mát cải tiến Focal Hinge Loss . -2- 5-5552 39
CHƯƠNG 4 THỰC NGHIỆM ¿25252222222 ‡v+xcEeEekerrrrxrrrxrrsee 41
4.1 DG ai cha 41 4.2 Cac thực nghiỆm c1 22211131111 1113 1119 1111 1H ng nh ng 41
4.2.1 Thực nghiệm 1: Phân lớp với SVM eee eeceeeseeseeeeseeeeneeeeneeeenees 42
4.2.2 Thực nghiệm 2: Huấn luyện mô hình DenseNet201 và
EfficientNetB2 với các hàm mat mát khác nhau - 43
4.2.3 Thực nghiệm 3: Thực nghiệm hàm mất mát đề xuất Focal Hinge
Loss và kết hợp mô hình - ¿2-2 2 £+££+E£Ee£EerEerkerxrrerreee 45
4.3 Chương trình demo -. c3 **E*EESEEEEEEtrereerrsrrrrererrsee 48
CHƯƠNG 5 KET LUẬN VA HƯỚNG PHAT TRIẺN - 51
5.1 Kt yan cocseccecccccccsscsssesssesssssssessecssecsssssssssecsussssssessseessessusssesssecsseesssseessess 515.2 Hướng phát tien ccececceeccecceccessessessesssssessecsesssessessessesssessessessesseessesseesees 51TÀI LIEU THAM KHAO 0 ccccccsscssssesssessssesssesssessssesssecssecsssesasecssesssnsessessseee 53
Trang 14DANH MỤC BANG
Bảng 3.1 Phân phối dit liệu huấn luyện trước và sau khi tăng cường 37
Bảng 4.1 Kết quả trên tập đánh giá và kết quả trên tập kiểm tra khi sử dụng SVM
Vi dac trung SURF 012122 42
Bang 4.2 Kết qua W-FI của các thực nghiệm với các ham mat mát trên tập kiểm
Bang 4.3 Kết quả W-F1 của phương pháp đề xuất với các hàm mắt mát đã thực
nghiệm trên tập kIÊm (T4 - 5 + 11 91 1v ng ng ngư 45
Bảng 4.4 Confusion matrix của các mô hình tương ứng khi sử dụng Focal Hing
Bang 4.5 So sánh kết quả W-F1 Score của phương pháp đề xuất với các công
Trang 15DANH MỤC CÔNG THỨC
Công thức 1 Binary CTOSS-€TTODY Gà vn ngu 26
Công thức 2 Hàm mat mát CE trong bài báo về Focal Loss . 27Công thức 3 Định nghĩa xác suất của mô hình trong bài báo về Focal Loss 27
Công thức 4 Hàm mat mát Focal Loss - 2-2 + +2 + E+E+EeEEeExeExzrezxez 29
Công thức 5 Ham mat mát Hinge Loss cc.cccccccsscsssesssesssesseessecssecsessecssecssecseesses 30Công thức 6 Ham mat mát Weighted Binary Cross-entropy - 38Công thức 7 Trọng số của hàm WBCE o csssesssessesssesssesssessscssecssecsssssecssecssecseceses 38
Công thức 8 Hàm mất mát Focal Hinge Loss 2 2- 2 s2 +2+z+£z+£xcsez 39
Công thức 9 Định nghĩa tham số alpha -2- 2-2 2 22S£+E££E££EeEEeEszrxzrszsez 39
Trang 16DANH MỤC HÌNH VE
Hình 1.1 Minh họa bệnh bạch cầu - -¿©5++cc22+vtctcvvvrerrtrrrrrrrrrrrk 3Hình 1.2 Minh họa phương pháp đo tế bao dong chảyy -2¿© 2522 52552 5
Hình 1.3 Minh họa quy trình phân ỚP - 6 + 55t 2E sEEsskersrerkrsree 6
Hình 2.1 Minh họa toàn bộ luồng CNN để xử lý hình ảnh đầu vào và phân loại
các đôi tượng dựa trên giá tri [6] - - +5 + 2+ k + E+skEsskEseeseessrseee 9
Hình 2.2 Minh họa lớp Convolutional với bộ lọc 3x3, bước trượt l 10 Hình 2.3 Minh hoa hàm kích hoạt SigmOId - - 5s ++s£+s£+s£+s+eexeexeeres 12
Hình 2.4 Minh họa hàm kích hoạt Tanh 2552222 *s +2 s+++zeeezxe 12
Hình 2.5 Minh họa hàm kích họa ReLU 2 5255222 *£++2z££++ze£cezzx+ 13
Hình 2.6 Minh họa Max Pooling và Average Pooling -‹-s- «xxx 14
Hình 2.7 Minh họa lớp Fully Connected .- - 255 + + ++vssexssexeeexeeress 15
Hình 2.8 Minh họa một mang CNN hoàn chỉnh 55-55 s+s++s++sxsss 15
Hình 2.9 Minh họa cho học chuyên tiếp II 17
Hình 2.10 Minh họa một DenseNet có 5 block « «+ +++<ss+++zss+<zzs+ 19
Hình 2.11 Minh họa DenseNet với 4 Dense block, xen kẽ là các lớp transition 20
Hình 2.12 Kiến trúc DenselNet - 2 2+S2+SE+2E2EESEE22E22E122171 212222 Excrke 21
Hình 2.13 Thu phóng mô hình (a) là mạng cơ sở; (b)-(d) là mạng thu phóng trên
một chiều, lần lượt là chiều rộng, chiều sâu và độ phân giải; (e) là
mạng thu phóng trên cả ba chiều theo một tỷ lệ có định 22
Hình 2.14 Kiến trúc EfficienNets-BO cscscsssesssessesssessseessesssessussscssecssesseseseesses 24
Hình 2.15 Minh hoa Binary Cross Entropy s65 St Essesrsrsekre 26
Hình 2.16 Minh họa sự thay đổi của ham Focal Loss với một số giá trị gamma
khác nhau - - 5 (G1019 19119 Họ ng 28
Hình 2.17 Minh họa hàm Hinge Los - 5c 2c 22c 3221 SEseirssrrrsrrrerrre 30
Hình 3.1 Minh hoa số lượng mẫu ở các lớp trong các tập dữ liệu - 32Hình 3.2 Minh họa một số anh từ bộ dữ liệu, hàng trên là tế bảo ung thư, hàng
dưới là tế bao bình thường ¿2-2 2 SE E+EE2E£EeEEeEEeEEerkerkrreee 32
Trang 17Hình 3.3 So sánh phương pháp đề xuất của tác giả với các công trình liên quan
Hình 3.4 Tổng quát phương pháp thực hiện của khóa luận -. - 35
Hình 3.5 Minh họa một số ảnh sau khi crop, hàng trên là tế bào ung thư, hàng
dưới là tế bào bình thường - 2-22 2 2+EE+EE££E£+EE+EEeEEezEzrxerxrree 36
Hình 3.6 Minh họa sự thay đổi của hàm Focal Hinge Loss với một SỐ giá tri
gamma khac mhau 0088 40
Hình 4.1 Kết qua dự đoán SVM kernel linear (bên trên) va kernel RBF (bên dưới)
trén tap Gan r0 42
Hình 4.2 Kiến trúc mang tinh chỉnh DenseNet201 và EfficientNetB2 44
Hình 4.3 Biểu đồ biểu diễn quá trình huấn luyện và đánh giá của EfficientNetB2
trên hàm mắt mát Focal Hinge LOss -¿ 2 2 ++x2£++zz+£xzsz 47
Hình 4.4 Biểu đồ biểu diễn quá trình huấn luyện và đánh giá của DenseNet201
trên hàm mat mát Focal Hinge LOss -. ¿- ¿2 +2 +22: 47
Hình 4.5 Minh họa giao diện W€bSI(e óc c 2+3 vn re 48
Hình 4.6 Minh họa trạng thái sau khi chọn ảnh (bên trên) và sau khi hoàn tất dự
đoán (bên ưƯỚI) c1 22 132111123111 1112 11181158111 111181118118 get 50
Trang 18DANH MỤC TU VIET TAT
BCE Binary Cross-entropy
CE Cross-entropy
C-NMC Classification of Normal versus Malignant Cells in
B-ALL White Blood Cancer Microscopic Image CNN Convolutional Neural Network
ISBI IEEE International Symposium on Biomedical Imaging
FC Fully Connected
FHL Focal Hinge Loss
FL Focal Loss
ReLU Rectified Linear Unit
SURF Speeded-up Robust Features
SVM Support Vector Machine
WBCE Weighted Binary Cross-entropy
Trang 19TOM TAT KHÓA LUẬN
Bệnh bạch cầu là loại ung thư tế bào bạch cầu có nguồn gốc trong tủy và ảnhhưởng cả người lớn và trẻ em Có 4 loại chính: Ac tính thé Lymphoblastic (Acute
Lymphoblastic Leukemia), ác tính thé Myelogenous (Acute Myelogenous Leukemia), lành tính thé Myeloid (Chronic Myeloid Leukemia), lành tính thé
Lymphocytic (Chornic Lymphocytic Leukemia) Trong đó, loại ác tinh ALL là
loai té bao hoat động không đúng, sinh sản vượt tầm kiểm soát, dẫn đến thiếu
2
Mau.
Thông qua dé tài, nhóm chúng tôi muốn nghiên cứu, thử nghiệm một số mô hình
phân loại tế bào bình thường và tế bào ác tính Kết quả của quá trình nghiên cứu
và thử nghiệm sẽ giúp bác sĩ giảm thời gian chân đoán tế bào ác tính và tăng độchính xác trong việc phân loại tế bào ác tính Trong khóa luận này, nhóm chúngtôi đề xuất các phương pháp tự động phân loại ảnh tế bào bình thường và tế bào
ác tính dựa trên mang Convolutional Neural Network, với đầu vào là ảnh tế bàomáu hiển vi đã được chuân hóa màu trong nhà kính và kết quả trả về là lớp mà tế
bào đó thuộc về, với xác suất dự đoán tương ứng Nhóm chúng tôi đã tiến hành
giải quyết vấn đề lớn là: các phương pháp xử lý ảnh đầu vào cho bài toán phân lớp
tế bào ung thư máu, và các phương pháp xử lý mat cân bằng giữa hai lớp, đề xuất
mô hình kết hợp DenseNet va EfficientNet cùng với hàm mat mát cải tiến Focal
Hinge Loss mà nhóm dé xuat.
Nhóm thực hiện đề xuất hàm mat mát Focal Hinge Loss dựa trên ý tưởng từ ham
mat mát Focal Loss và Hinge Loss có W-F1 Score cao hon một số thực nghiệmcủa các nghiên cứu khác Kết quả của hàm mat mát Focal Hinge Loss được thực
nghiệm trên bộ dữ liệu C-NMC2019 từ cuộc thi Classification of Normal versus
Malignant Cells in B-ALL White Blood Cancer Microscopic Image: ISBI2019
với 10661 ảnh huấn luyện thuộc 2 lớp bình thường và ác tinh ALL đạt được Fl
Score = 91.94% thuộc vào thứ hạng 5 trong cuộc thi.
Trang 20Chuong 1 MỞ ĐẦU
Giới thiệu
Bệnh bạch cầu là loại ung thư tế bào bạch cầu có nguồn gốc trong tủy (xem
Hình 1.1) và ảnh hưởng cả người lớn và trẻ em Bệnh bach cầu có thể chiathành lành tính hoặc ác tính dựa trên tiễn độ phát triển của nó Có nhiềuloại bệnh bạch cầu, nhưng phổ biến nhất là 4 loại sau: Ác tính thểLymphoblastic (Acute Lymphoblastic Leukemia), ác tính thé Myelogenous
(Acute Myelogenous Leukemia), lành tính thé Myeloid (Chronic Myeloid
Leukemia), lành tính the Lymphocytic (Chornic Lymphocytic Leukemia).
Loại phổ biến nhất gây ảnh hưởng đến trẻ em là AML va ALL TrongALL, tế bào bạch cầu lympho không hoạt động bình thường và sinh san
vượt tầm kiểm soát, dẫn đến tình trạng thiêu máu.
Cụ thé hơn, trong tủy xương, các tế bào gốc sẽ bắt đầu nhân lên và phân
chia thành các tế bao máu cần thiết cho cơ thé như hồng cau, bach cầu vàtiêu cau Tuy nhiên, ở một người mac bệnh bạch cầu, các tế bào bach cầu
sẽ nhân chia nhanh chóng một cách không có hệ thống Các tế bào bấtthường này bắt đầu chiếm lấy phần lớn không gian bên trong tủy xương,
lấn át các tế bào bình thường khác, cản trở chúng phát triển Điều này rất
xấu cho cơ thé vì nhiều nguyên do: các tế bào ung thư nay không phục vụ
mục đích hữu ích nào cho cơ thể, mặt khác, nó còn chiếm không gian của
những tế bào khác khiến chúng không còn chỗ dé phát triển trong tủyxương, cuối cùng dẫn đến ngày càng ít tế bào bình thường được tạo ra vàcàng nhiều tế bào ung thư được giải phóng vào máu Khi không có một
lượng đầy đủ các tế bào máu bình thường, các cơ quan và mô trong cơ thể
sẽ không nhận được lượng oxy va chất dinh dưỡng chùng cần dé hoạt độnghiệu quả Hậu quả của nó có thé kế đến một số như cơ thé dễ bị nhiễmtrùng, suy nhược và mệt mỏi kéo dai, mat cân nặng và suy giảm cảm giác
thèm ăn, đau nhức suong, Những điêu này có thé dân đên chêt sớm nêu
Trang 21bệnh nhân chỉ được chân đoán vao những giai đoạn sau của quá trình phát
triển ung thư, hay quá trình điều trị bị trì hoãn
Trong năm 2020 tai Mỹ có 6150 trường hợp mới do ALL (3470 ở nam giới
và 2680 ở nữ giới), 1520 trường hợp tử vong do ALL (860 ở nam giới và
660 ở nữ giới) Nguy cơ mắc ALL ở nam giới cao hơn nữ giới, ở người datrắng cao hơn người Mỹ gốc Phi Tuổi tác cũng là nhân tố nguy cơ quan
trọng ảnh hưởng đến sự chân đoán, mối nguy phát triển ALL cao nhất ở trẻ
em đưới 5 tuổi, sau đó giảm dan cho đến độ tuổi 25 và bắt đầu gia tăng trởlại sau 50 tuổi [1] Tuy nhiên, nếu bệnh bach cầu sớm được chan đoán vào
giai đoạn đầu, chúng ta có thê gia tăng khả năng điều trị và từ đó nâng cao
tỉ lệ sống sót cho bệnh nhân
Hematopoietic stem cells
Myeloid J Lymphoid
stem cells @) @ stem cells
— Abnormal Growth Abnormal Growth
masts of Myloid of Lymphoid
) white blood cells white blood cells
Hình 1.1 Minh họa bệnh bach cau’
Những van dé nêu trên đã tạo động lực cho sự xuât hiện của nhiêu cuộc thảo luận, nghiên cứu nhăm tìm ra các cách thức, công cụ phát hiện tê bào ung thư máu mới đê quá trình chân đoán và điêu tri trở nên hiệu quả hơn.
' Nguồn: https://my.clevelandclinic.org/health/diseases/4365-leukemia
3
Trang 22Sự tiến bộ của công nghệ kỹ thuật áp dụng vào lĩnh vực y học có thể giúp
giảm thời gian, công sức của đội ngũ chuyên gia trong quá trình chân đoán
và điều trị Phân loại tế bào thông qua xử lý hình ảnh những năm gần đây
đã thu hút được nhiều sự quan tâm trên phương diện xây dựng các công cụchân đoán với sự hỗ trợ của máy tính đối với các bệnh rối loạn máu nhưbệnh bạch cầu Dé đi đến quyết định quả quyết về chân đoán bệnh và mức
độ tiến triển, việc xác định những tế bào ác tính với độ chính xác cao là rấtquan trọng Các công cụ dưới sự hỗ trợ của máy tính có thể rất hữu íchtrong việc tự động hóa quá trình phân đoạn và nhận dạng tế bào Việc xácđịnh tế bào ác tính và tế bào bình thường từ hình ảnh hién vi rất khó khănbởi vì về mặt hình thái cả hai loại tế bào tương đối giống nhau Kết quả làbệnh bạch cầu (ung thư máu) chỉ được phát hiện trong các giai đoạn ungthư đã phát triển mạnh thông qua phân tích hình ảnh hiển vi, không phải vì
khả năng dé xác định chúng đưới kính hiển vi, mà là vì kiến thức lĩnh vực
y tế, nghĩa là, các tế bào ung thư bắt đầu phát triển một cách không hạnchế, và do đó, chúng hiện diện với sé lượng lớn hon nhiều khi so với số
lượng của chúng ở một người bình thường [2|.
Tuy vậy, điều quan trọng là cần phải chân đoán bệnh sớm dé điều trị bệnhtốt hơn và cải thiện sự sông còn chung của các đối tượng mắc bệnh ungthư Mặc dù các phương pháp tiên tiến như phương pháp đo tế bào dòngchảy (flow cytometry) đã xuất hiện, đây là một công cụ dùng dé phát hiện
và xác định đặc điểm của tế bào vi sinh vật một cách nhanh chóng dựa trên
đặc tính tán xạ ánh sáng và huỳnh quang của chúng (xem Hình 7.2), nhưng
đây là một phương pháp sử dụng thiết bị công nghệ kỹ thuật cao nên chúngrất đắt tiền và không được trang bị rộng rãi trong các phòng thí nghiệm
bệnh lý hoặc các bệnh viện, đặc biệt là ở các vùng nông thôn Mặt khác,
một giải pháp dưa trên máy tính có thê được triển khai một cách dễ dàng
với một mức chi phí thấp hơn nhiêu
Giả thuyết rằng các phương pháp xử lý hình ảnh y tế tiên tiến có thể dẫn
đên việc xác định tê bảo bình thường và tê bào ác tính, và từ đó, có thê hỗ
4
Trang 23trợ chân đoán ung thư một cách hiệu quả về mặt chỉ phí Với sự phát triển
đáng kinh ngạc của lĩnh vực trí tuệ nhân tạo (Artificial Intelligence), đặc
biệt là học sâu (Deep Learning), nó đã tìm được con đường ứng dụng của
mình trong rất nhiều lĩnh vực khác nhau, và lĩnh vực y tế cũng không phải
là một ngoại lệ Nhiều cuộc thử nghiệm trên quy mô nhỏ đã cho thấy tiềmnăng rất lớn của các công cụ ứng dụng trí tuệ nhân tạo Nhiều người kỳvọng rằng trong tương lại không xa, chúng ta sẽ có thể hoàn toàn tin tưởngcông nghệ này và mở rộng quy mô sử dụng trên toàn thế giới Điều này sẽđưa con người tiến đến một bước nhảy vọt trong vấn đề chăm sóc sức
khỏe, và từ đó nâng cao đáng kê chât lượng cuộc sông của con người.
Hình 1.2 Minh họa phương pháp đo tế bào dòng chảy”
Bài toán cụ thê:
? Nguồn:
https://www.researchgate.net/figure/Principles-of-flow-cytometry-in-a-sample-cells-of-interest-are-labeled-with_fig2_ 304613284
5
Trang 24Xây dựng một mô hình thực hiện nhiệm vụ phân lớp nhi phân (2 lớp) giữa
tế bào bạch cầu bình thường và tế bào bạch cầu ung thư
Input: Ảnh hiển vi của tế báo bạch cau
Output: Lớp phân loại dự đoán tương ứng (1: Ung thu, 0: Bình thường).
Xử lý ảnh đầu vào Tăng cường dữ liệu > Mô hình CNN
| Xửlýmẩtcân
| bang dữ liệu
| trong quả trình
i huấn luyện
Hình 1.3 Minh họa quy trình phân lớp.
Thách thức và hướng giải quyết
Thách thức:
Do van đề bao mật dữ liệu của lĩnh vực y té, dé thu thập được một tập anhlâm sàn lớn là một thách thức không nhỏ Mặt khác, hiệu suất của mô hìnhhọc sâu chịu ảnh hưởng lớn vào kích thước bộ dữ liệu huấn luyện Do đó,
dữ liệu không đủ lớn trở thành một vấn đề đáng lưu tâm
Hình thái giữa tế bào ung thư và tế bào bình thường tương đối giống nhau.Điều này làm cho việc tìm đặc trưng phân biệt giữa hai loại tế bào trở nên
Trang 25Kết hợp mô hình dé nhăm kết hop đặc trưng rút trích và làm tăng khả năng
phân lớp của bộ phân loại.
Mục tiêu và phạm vỉ nghiên cứu
Sau day là mục tiêu và phạm vi nghiên cứu mà khóa luận hướng tới:
Mục tiêu nghiên cứu:
Tìm hiểu tông quan về bài toán phân loại ảnh hiển vi tế bào ung thư máuB-ALL, tìm hiểu bộ đữ liệu C-NMC 2019 [3] được sử dụng tại cuộc thi
Cải tiến hàm mat mát từ Focal Loss và Hinge Loss cùng phương pháp kết
hợp mô hình so với các nghiên cứu liên quan trước đó.
Pham vi nghiên cứu:
Tìm hiểu tổng quan về bài toán phân loại ảnh hiển vi tế bào ung thư máuB-ALL, tìm hiểu bộ dữ liệu C-NMC 2019 được sử dụng tại cuộc thi
ISBI2019.
Đánh giá kết qua của một số phương pháp mô hình tốt hiện nay
Tìm hiểu một số mô hình CNN như: EfficientNet [4], DenseNet [5]
Tìm hiểu cách xử lý anh tế bào khi đưa vào mô hình CNN
Trang 261.5
Tìm hiểu các phương pháp xử lý mat cân bằng dữ liệu
Đánh giá hàm mat mát cải tiễn và phương pháp kết hợp mô hình so với các
nghiên cứu liên quan trước đó.
Đóng góp của khoá luận
Những đóng góp chính của chúng tôi trong khoá luận này bao gồm:
Hệ thống lại kiến thức mô hình học sâu mạng tích chập và tìm hiểu cácphương pháp giải quyết bài toán phân lớp ảnh hiền vi tế bào ung thư máu
Phân tích đánh giá một số phương pháp tiên tiến hiện nay cho bài toánphân lớp ảnh hiền vi tế bào ung thư máu
Đề xuất hàm mat mát Focal Hinge Loss giải quyết van đề mat cân băng dữliệu dựa trên hàm mat mát Focal Loss và Hinge Loss
Lam tiền dé cho các nghiên cứu sau này
Cấu trúc khóa luận
Bồ cục của khóa luận bao gồm:
Chương 1 Mở đầu: Giới thiệu tổng quan bài toán, mục tiêu, phạm vi và
Chương 5 Kết luận và Hướng phát triển: Đưa ra kết luận, tổng kết
những kết quả đạt được và đề ra hướng phát triển nghiên cứu trong tương
lai.
Trang 27Trong mạng nơ-ron, mô hình mạng nơ-ron tích chập (CNN) là một trong
những mô hình dé nhận dạng và phân loại hình ảnh Trong đó, xác định đốitượng và nhận dạng khuôn mặt là một trong sỐ những lĩnh vực mà CNN
được sử dụng rộng rãi.
CNN phân loại hình ảnh bằng cách lấy 1 hình anh đầu vào, xử lý va phân
loại nó theo các hạng mục nhất định (Ví dụ: chó, mèo, gau, ) May tinh
coi hình ảnh đầu vào là một mang pixel và nó phụ thuộc vào độ phân giảicủa hình ảnh Dựa trên độ phân giải hình anh, máy tính sẽ thấy H x W x D(H: chiều cao, W: chiều rộng, D: độ dày)
Về kỹ thuật, mô hình CNN để huấn luyện và kiểm tra, mỗi hình ảnh đầuvào sẽ chuyển nó qua một loạt các lớp tích chập với các bộ lọc, tổng hợp
lại các lớp được kết nối đầy đủ (Fully Connected) và áp dụng hàm Softmax
dé phân loại đối tượng có giá trị xác suất giữa 0 và 1 (Hình 2.1) [6]
| IMPUT CONVOLUTION + RELU POOLING CONVOLUTION + RELU POOLING =_— CONNECTED SOFTMAX 7
FEATURE LEARNING CLASSIFICATION
Hình 2.1 Minh họa toàn bộ luồng CNN dé xử lý hình anh đầu vào và phân
loại các đối tượng dựa trên giá trị [6].
Trang 282.1.2 Lớp Convolutional
Lớp Convolutional, hay còn gọi là lớp tích chập, là thành phần đầu tiên vàcũng là thành phần quan trọng nhất của mạng CNN, đảm nhận chức năngtrích xuất đặc trưng từ đữ liệu đầu vào Lớp tích chập lây dữ liệu đầu vào là
ảnh hoặc dữ liệu đầu ra của lớp liền trước, thực hiện các phép chuyên đổi
để tạo ra dữ liệu đầu vào cho lớp kế tiếp (đầu ra lớp này là đầu vào lớpsau) Đầu ra của lớp tích chập thường được gọi là feature map Phépchuyên đổi được sử dụng ở đây là phép tính tích chập Mỗi lớp tích chậpchứa một hoặc nhiều bộ lọc — bộ phát hiện đặc trưng (filter — featuredetector) cho phép phát hiện và trích xuất những đặc trưng khác nhau của
ảnh Những bộ lọc ở các lớp tích chập đầu chịu trách nhiệm nắm bắt những
đặc trưng cấp thấp (low-level feature) như cạnh, màu sắc Ở những lớp tiếptheo, những bộ lọc sẽ có thể phát hiện các đối tượng cụ thé như góc cạnh,
hình tròn, hình vuông, đường sọc, các hình dạng phức tạp hơn Khi mạng
càng sâu, thì những bộ lọc này càng có khả năng năm bắt những đặc trưngphức tạp hơn nữa như tai, mắt, mũi, miệng, ; và cuối cùng, chúng có thể
phát hiện được những đặc trưng cấp cao (high-level feature) như toàn bộ
hình dạng khuôn mặt, động vật, nhà cửa, Theo một cách tóm gọn, mạng
càng sâu, số lượng lớp Convolutional càng nhiều, thì mô hình sẽ càng có
thêm khả năng học được những đặc trưng phức tạp của dữ liệu, từ đó gia
tăng đáng ké độ chính xác của kết quả dự đoán
Ảnh Bộ lọc Feature map
Hình 2.2 Minh họa lớp Convolutional với bộ lọc 3x3, bước trượt 1.
10
Trang 292.1.3 Hàm kích hoạt
Hàm kích hoạt là hàm được thêm vào mạng nơ-rơn nhân tạo để giúp mạng
có thê học được những đặc trưng phức tạp của dữ liệu (hàm kích hoạt được
sử dụng ngay sau lớp Convolutional hay lớp Fully Connected) Hau hết
những dữ liệu trong thực tế đều có tính phi tuyến, do đó mạng nơ-ron cũng
cần phải thể hiện được tính phi tuyến tương ứng, và hàm kích hoạt sẽ giúpmạng có được tính chất trên Do đó, hàm kích hoạt có ảnh hưởng khôngnhỏ đến kết quả và độ chính xác của mô hình Có nhiều loại hàm kích hoạt
có thé được sử dụng như Sigmoid, Tanh, ReLU,
e Sipmoid
Hàm kích hoạt Sigmoid nhận giá trị đầu vào và biến đối nó thành một giátrị nằm trong khoảng từ 0 đến 1 (Hinh 2.3) Khi giá trị đầu vào là một giátri đương lớn, giá tri đầu ra sẽ gần bằng 1; và ngược lại, khi giá trị đầu vào
là một giá trị âm nhỏ, giá trị đầu ra sẽ gần bằng 0 Hàm Sigmoid có nhược
điểm là bão hòa ở hai cực và gây ra vấn đề triệt tiêu đạo hàm (vanishinggradient): khi đầu vào là các giá trị càng âm hoặc càng đương, đạo hàm của
hàm số tại các giá trị này sẽ tiến gần đến 0 Và khi giá trị đạo hàm gầnbang 0, các trọng số tương ứng với nơ-ron đang xét sẽ gần như không được
cập nhật, hay nói cách khác, mô hình lúc này gần như không học được nữa
Hàm Sigmoid còn có nhược điểm là không có trung tâm tại 0
(zero-centered) gây khó khăn cho việc hội tụ [7]; và ngoài ra còn yêu cầu chỉ phí
tính toán cao.
11
Trang 30Hình 2.3 Minh họa hàm kích hoạt Sigmoid.
Tanh
Hàm Tanh là hàm kích hoạt phi tuyến khá tương đồng với hàm Sigmoid.
Miền giá trị đầu ra của hàm Tanh thuộc khoảng từ -1 đến 1 (Hình 2.4).Hàm Tanh giúp khắc phục được một nhược điểm của hàm Sigmoid đó là
có trung tâm tại 0, do đó nó giúp quá trình hội tụ diễn ra nhanh hơn Nhưng
mặt khác nó vẫn còn tôn tại những nhược điêm còn lại của hàm Sigmoid.
Hình 2.4 Minh họa hàm kích hoạt Tanh.
ReLU
12
Trang 31ReLU, viết tắt của Rectified Linear Unit, là hàm kích hoạt phi tuyến được
sử dụng phổ biến nhất trong các mạng nơ-ron hiện nay Hàm ReLU rất đơngiản, nó chuyên đổi bat kỳ giá trị nào nhỏ hơn 0 thành 0 (Hinh 2.5) Do đó,hàm ReLU rất hiệu quả về mặt tính toán khi nó yêu cầu ít chi phí tính toán
hơn so với hàm Sigmoid và Tanh Hàm ReLU không xảy ra hiện tượng bão
hòa nên nó không gây ra vấn đề triệt tiêu đạo hàm Nhưng hàm ReLU gặpphải một vấn đề gọi là “chết ReLU” (dying ReLU) Với các giá trị đầu vào
âm, đạo ham tại các giá tri này sẽ bằng 0, dẫn tới việc trọng số của một số
nơ-ron sẽ không được cập nhật và từ đó ngăn cản quá trình hội tụ Hiện
tượng này được khắc phục ở một số hàm kích hoạt cải tiễn của hàm ReLU
như Leaky ReLU, Parameterised ReLU,
lớn nhất trong một vùng được chỉ định Lớp Pooling hoạt động gắn giống
với lớp Convolutional, nó cũng có một cửa sô trượt gọi là pooling window,
13
Trang 32cửa sô này trượt qua từng phan của ma trận dữ liệu đầu vào (thường là các
feature map có được từ lớp Convolutional), trả về giá trị tương ứng với mộtphương thức cụ thể từ vùng được xác định bởi pooling window (với MaxPooling, phương thức đó là lấy giá trị lớn nhất) (Hình 2.6) Một số loại
Pooling khác như Average Pooling, Sum Pooling, trong đó Average
Pooling trả về giá trị trung bình, còn Sum Pooling trả về giá trị tổng
Max Pooling với
Nếu những lớp Convolutional và lớp Pooling có vai trò như bộ trích xuất
đặc trưng, thì những lớp FC có vai trò như bộ phân loại Sau khi ảnh được
truyền qua nhiều lớp Convolutional và lớp Pooling thì mô hình lúc này đã
học được tương đối các đặc trưng của ảnh Đến phân đoạn này, mạng CNN
sẽ bắt đầu trở nên giống với mạng nơ-ron truyền thống Đầu ra của lớpPooling cuối cùng là các feature map sẽ được “làm phang” thành mộtvector Nghĩa là, giả sử đầu ra là một tập gồm N feature map có kích thướcHxW, thì sau khi “làm phẳng” sẽ thu được một vector có HxWxN phần tử
Sau đó vector này sẽ được kết nối với lớp Fully Connected dé kết hợp các
14
Trang 33đặc trưng tìm được ở quá trình trước đó và đưa ra kết quả dự đoán của mô
hình Có thể có hai hay nhiều lớp FC với số lượng nơ-ron bất kỳ, nhưng
lớp FC cuối cùng sẽ có số nơ-ron tương ứng với số lớp của bài toán và sử
dung hàm kích hoạt sigmoid hoặc softmax để cho ra một phân phối xác
suất và từ phân phối xác suất này ta có thé đưa ra quyết định dự đoán (Hình
Trang 342.2 Học chuyền tiếp và tinh chỉnh mạng
Học chuyền tiếp (Transfer Learning) là phương pháp được sử dụng phổbiến trong các bài toán hiện nay Học chuyền tiếp là kỹ thuật sử dụng môhình đã được huấn luyện trên một tập dữ liệu cụ thé nào đó để giải quyếtmột tác vụ cụ thể nào đó và tận dụng “kiến thức” đã học được từ đó đểthích ứng nó trên tập dữ liệu mới nhằm giải quyết vấn đề mới Thực tếngày nay ít trường hợp sử dụng mô hình học từ đầu, nhất là các mô hình
học sâu (Deep Learning) Việc huấn luyện một mô hình học sâu để giải
quyết một vấn đề phức tạp thông thường cần một lượng dữ liệu rất lớn,nhưng việc thu thập lượng dữ liệu như vậy có thê rất khó khăn bởi nhiều lý
do, có thé kê đến như là thời gian và nỗ lực cần có dé thu thập va gan nhãncho các mẫu dữ liệu, đặc biệt là trong các lĩnh vực như y tế khi dữ liệu tiếp
cận được rất hạn chế, không được công bồ rộng rãi và đòi hỏi một đội ngũchuyên gia với trình độ chuyên môn cao để gắn nhãn Điều này chính là
động lực cho sự xuất hiện của học chuyên tiếp Một điều đáng chú ý lànhiều thí nghiệm đã cho thấy rằng học chuyền tiếp thường sẽ dẫn đến kếtquả tốt hơn so với huấn luyện hoàn toàn từ đầu trên tập dữ liệu mục tiêu,nghĩa là, sử dụng trọng số được khởi tạo từ trọng số của một mô hình đãđược huấn luyện thường sẽ cho kết quả tốt hơn so với khởi tạo trọng số
một cách ngẫu nhiên (Hình 2.9).
16
Trang 35Transfer learning: idea
Source labels i Target labels =
Hinh 2.9 Minh hoa cho hoc chuyén tiép [10]
Có hai chiến thuật phố biến nhất cho học chuyền tiếp:
Loại bỏ lớp phân loại cuối cùng (lớp FC cuối cùng) của mô hình muốn tậndụng kiến thức, sử dụng phan mô hình còn lại dé chuyển đổi dữ liệu thành
một vector có số chiều bằng với số nơ-ron của lớp FC cuối mới (lớp FC kếcuối trước khi loại bỏ lớp EC cuối) Như vậy cho phép ta trích xuất đặctrưng từ nguồn dữ liệu mới, tận dụng kiến thức có được từ nguồn dữ liệu
khác Ta có thê dùng đặc trưng trích xuất được cho những tác vụ khác
Chiến thuật tiếp theo sẽ tién xa thêm một bước, lần này ta sẽ loại bỏ một
hoặc một số lớp phân loại cuối cùng và thay thế chúng với một hoặc một số
lớp khác và tiễn hành tái huấn luyện có chọn lọc một số lớp trước đó Như
ta đã biết, thông thường những lớp đầu sẽ nắm bắt dữ liệu ở dạng thị giác
máy tính cấp thấp (low-level vision) như cạnh, màu sắc, còn những lớpcuối sẽ chứa thông tin thị giác cấp cao (high-level vision) liên quan tới ứngdụng, bài toán cụ thé Sử dụng sự hiểu biết này, ta có thể đóng băng một sỐlớp nhất định trong khi tái huấn luyện, hoặc tinh chỉnh toàn bộ lớp dé phù
hợp với nhu cầu của chúng ta Lấy một ví dụ, sử dụng mô hình VGG đã
được huấn luyện với tập dữ liệu lớn như ImageNet, ta sẽ loại bỏ lớp FC
17
Trang 36cuối (lớp FC với 1000 no-ron) và thay thé với lớp FC mới, ví dụ lớp FC
với 3 nơ-ron trong trường hợp bài toán phân loại 3 lớp; hoặc ta cũng có théloại bỏ cả 3 lớp FC cuối của mạng VGG và thay thé nó với hai hoặc nhiềuhơn lớp FC mới với số lượng nơ-ron khác và bắt đầu tái huấn luyện Trongtrường hợp này, ta sẽ tận dụng kiến thức của toàn bộ mạng và sử dụng nónhư điểm khởi đầu cho bước tái huấn luyện Điều này đổi lại giúp ta đạt
được hiệu suất tốt hơn với thời gian huấn luyện nhỏ hơn
Tinh chỉnh mạng: trong quá trình huấn luyện, ta có thé đóng băng (freeze)hoặc mở băng (unfreeze) một hoặc nhiều lớp của mạng Trong đó, các lớp
bị đóng băng, trọng số sẽ không được cập nhật trong suốt quá trình lan
truyền ngược (backpropagation) Ngược lại, trọng số ở các lớp không bị
đóng băng sẽ được cập nhật liên tục trong quá trình lan truyền ngược Việc
chọn freeze hay unfreeze một hay nhiều lớp phụ thuộc vào tính chất của
bài toán Nếu dữ liệu mới có số lượng nhỏ, ta nên freeze nhiều hơn dé tránhoverfitting; trong trường hợp dữ liệu mới có số lượng lớn, ta có thê
unfreeze nhiều lớp hơn đề mô hình có thể học được hiệu quả hơn.
18