3.1. Giới thiệu phương pháp
Chương này đề xuất một phương pháp dựa trên mạng thần kinh sâu và học chuyên giao dé nâng cao hiệu qua trong việc chân đoán ung thư phôi.
Phương pháp nay sửa đổi mô hình dựa trên GoogLeNet dé nhận điện hình ảnh đầu vào và chan đoán xem nó có thuộc một trong ba trường hợp sau:
¢ Ung thư biéu mô phổi (Lung aca).
© Ung thư biéu mô tế bào vảy phôi ( Lung_scc).
¢ Mô phôi lành tính (Lung_n).
Lí do chọn mô hình GoogLeNet:
¢ - Hiệu quả tinh toán: Kiến trúc Inception giúp giảm số lượng tham số trong mang, dẫn đến hiệu quả tính toán cao hơn và nhu câu bộ nhớ thấp hơn.
¢ Khả năng trích xuất đặc trưng đa cấp: GoogLeNet có thê trích xuất các đặc trưng ở nhiều mức độ chỉ tiết khác nhau, giúp cải thiện khả năng nhận điện các đối tượng trong hình ánh.
© Khả năng mở rộng: GoogLeNet có thê được dé dang mở rộng bằng cach thêm nhiều mô-đun Inception.
© Dễ dàng trién khai: GoogLeNet đã được triển khai trong nhiều thư viện học sâu phô biến, chẳng hạn như TensorFlow và PyTorch.
3.2. Triển khai phương pháp
3.2.1. Xử lý dữ liệu
Sử dụng 15000 hình anh về phổi trong bộ dit liệu LC25000. Bộ dit liệu gồm 3 lớp: Ung thư biéu mô phôi (Lung_aca). ung thư biéu mô tế bảo vảy phôi (Lung_scc), và
mô phôi lành tính (Lung_n).
51
Hình 3-2 Mô phôi lành tính (Lung_n)
Bộ dit liệu được chia thành thành ba tập là tập huấn luyện, tập kiểm thử, và tập kiêm. Tập huấn luyện, tập kiểm thir và tập kiểm tra đều có lượng ảnh trong mỗi lớp là
bằng nhau và lần lượt bằng 3000 hình ảnh mỗi lớp trong tập huấn luyện, 1000 hình ảnh
mỗi lớp trong tập kiêm thử va 1000 hình ảnh mỗi lớp cho tập kiểm tra.
52
Táo habe luyện Yop liếm Uva Tây liếm tra
Leno 4
ano
“e3 4
>
1ằ;
kegs kg ^ heme wee wor tử cc ko .. hen hogxedt
in us “>
Hình 3-4 Số lượng ảnh theo mỗi lớp của tập huấn luyện, kiểm thử, kiếm tra
3.2.2. Hàm mắt mát
Sử dụng CrossEntropy làm ham mat mát. Hàm nay đo lường mức độ sai lệch
giữa dự đoán của mô hình vả giá trị thực tế, giúp mô hình học cách phân loại các mẫu
đữ liệu một cách nhanh chóng. CrossEntropy có công thức như sau:
N
LO.9) = È_ y, log(pi) (5)
í
Trong đó:
e y,là xác suất thực sự của lớp thứ i (bằng 1 cho lớp thực tế, 0 cho các lớp còn lại)
© — p¿ là vector xác suất dự đoán của diém dữ liệu thứ i e N là số lượng lớp cần phân loại.
e log là hàm logarit tự nhiên.
3.2.3. Xây dung mô hình
JIIIIIIẬ1¡III=z
Hình 3-5 Mô hình học chuyển giao dé phân loại ung thử phoi dựa trên
GoogLeNet
53
Trong khóa luận này, tôi dé xuất một mô hình học sâu dựa trên cấu trúc của GoogLeNet dé giải bài toàn nhận diện ung thử phối. Bằng cách thêm vào các lớp batch normalization sau mỗi lớp tích chập và bỏ đi hai bộ phân loại bô trợ (auxiliary classifier)
giúp giảm số lượng tham số cái thiện quá trình huấn luyện, giảm khả năng bị quá khớp.
Hình ảnh sẽ đi vào mô hình sẽ được thay đôi độ phân giải về 224x224 pixel va gặp các lớp tích chập. Lớp tích chập có chức năng chính là trích xuất các đặc trưng từ hình ảnh. Lớp tích chập sẽ sử dụng các bộ lọc đi chuyên trên ảnh đầu vào và thực hiện các pháp tích chập với từng phần nhỏ trên ảnh. Đầu ra cuối cùng của lớp tích chập này là một vectơ. Kích thước của bộ lọc cũng ảnh hưởng đến số lượng đầu vào của lớp tích
chập. Vi vậy việc sử dùng các bộ lọc có kích thước 1x1 trước các bộ lọc 3x3 và 5x5
giúp giảm kích thước của mạng nơ-ron, tăng tốc độ tính toán và giảm chỉ phí đào tạo mạng. Điều này được thực hiện rat tốt nhờ vào mô-đun Inception của GoogLeNet.
Sau mỗi lớp tích chập tôi đều thêm một lớp batch normalization, là một kỹ thuật chuẩn hóa đầu vào của mỗi lớp trong quá trình huấn luyện mạng nơ-ron. Tác dụng
chính của Batch Normalization là làm ồn định quá trình huấn luyện, tăng tốc độ hội tụ
và giảm quá khớp.
Và sau đó nữa là hàm kích hoạt ReLU:
Relu(x) = max (0,x) (4)
Ham ReLU rất được ưu chuộng vì nó là một hàm đơn giản dé tính toán và còn giúp tăng tốc độ tính toán trong quá trình huấn luyện
-109 -73 -59 -23 Q0 25 150 75 109
54
Lớp gộp thường được sử dùng sau các lớp ReLU, dé giảm kích thước của đầu
vào bằng cách thực hiện một phép gộp trên các vùng không gian của đặc trưng. Lớp gộp sẽ giúp giảm số lượng tính toán và số lượng tham số cần tìm hiệu. Hai loại gộp phô biến đó là gộp cực đại và gộp trung bình. Trong khóa luận này, hầu hết các thao tác gộp đều sử dụng gộp cực đại dé chọn giá trị lớn nhất từ các cửa số trượt có kích
thước 3x3 hoặc 7x7. Điều này đồng thời giảm nhiễu va giữ lại các đặc trưng có độ
quan trọng cao.
Giai đoạn phân loại của mô hình sẽ bắt đầu với lớp gộp trung bình. Sau đó là
một lớp dropout 40%, lớp nay sẽ chọn 40% nơ-ron ngẫu nhiên và loại bỏ trong quá
trình huấn luyện để ngăn ngừa quá khớp. Sau nữa là lớp làm phẳng, một lớp kết nói đây du. Kết qua dy đoán 1a một trong 3 trường hợp sau:
© Ung thư biêu mô phôi (Lung_aca).
© Ung thư biểu mô tế bảo vảy phôi (Lung sec).
e Mô phôi lành tính (Lung_n).
55