ỨNG DỤNG PHƯƠNG PHÁP HỌC CHUYEN GIAO VÀO CHAN DOAN UNG THU PHÓI

Một phần của tài liệu Khóa luận tốt nghiệp Khoa học máy tính: Ứng dụng phương pháp học chuyển giao vào chẩn đoán bệnh Ung thư phổi (Trang 53 - 58)

3.1. Giới thiệu phương pháp

Chương này đề xuất một phương pháp dựa trên mạng thần kinh sâu và học chuyên giao dé nâng cao hiệu qua trong việc chân đoán ung thư phôi.

Phương pháp nay sửa đổi mô hình dựa trên GoogLeNet dé nhận điện hình ảnh đầu vào và chan đoán xem nó có thuộc một trong ba trường hợp sau:

¢ Ung thư biéu mô phổi (Lung aca).

© Ung thư biéu mô tế bào vảy phôi ( Lung_scc).

¢ Mô phôi lành tính (Lung_n).

Lí do chọn mô hình GoogLeNet:

¢ - Hiệu quả tinh toán: Kiến trúc Inception giúp giảm số lượng tham số trong mang, dẫn đến hiệu quả tính toán cao hơn và nhu câu bộ nhớ thấp hơn.

¢ Khả năng trích xuất đặc trưng đa cấp: GoogLeNet có thê trích xuất các đặc trưng ở nhiều mức độ chỉ tiết khác nhau, giúp cải thiện khả năng nhận điện các đối tượng trong hình ánh.

© Khả năng mở rộng: GoogLeNet có thê được dé dang mở rộng bằng cach thêm nhiều mô-đun Inception.

© Dễ dàng trién khai: GoogLeNet đã được triển khai trong nhiều thư viện học sâu phô biến, chẳng hạn như TensorFlow và PyTorch.

3.2. Triển khai phương pháp

3.2.1. Xử lý dữ liệu

Sử dụng 15000 hình anh về phổi trong bộ dit liệu LC25000. Bộ dit liệu gồm 3 lớp: Ung thư biéu mô phôi (Lung_aca). ung thư biéu mô tế bảo vảy phôi (Lung_scc), và

mô phôi lành tính (Lung_n).

51

Hình 3-2 Mô phôi lành tính (Lung_n)

Bộ dit liệu được chia thành thành ba tập là tập huấn luyện, tập kiểm thử, và tập kiêm. Tập huấn luyện, tập kiểm thir và tập kiểm tra đều có lượng ảnh trong mỗi lớp là

bằng nhau và lần lượt bằng 3000 hình ảnh mỗi lớp trong tập huấn luyện, 1000 hình ảnh

mỗi lớp trong tập kiêm thử va 1000 hình ảnh mỗi lớp cho tập kiểm tra.

52

Táo habe luyện Yop liếm Uva Tây liếm tra

Leno 4

ano

“e3 4

>

1ằ;

kegs kg ^ heme wee wor tử cc ko .. hen hogxedt

in us “>

Hình 3-4 Số lượng ảnh theo mỗi lớp của tập huấn luyện, kiểm thử, kiếm tra

3.2.2. Hàm mắt mát

Sử dụng CrossEntropy làm ham mat mát. Hàm nay đo lường mức độ sai lệch

giữa dự đoán của mô hình vả giá trị thực tế, giúp mô hình học cách phân loại các mẫu

đữ liệu một cách nhanh chóng. CrossEntropy có công thức như sau:

N

LO.9) = È_ y, log(pi) (5)

í

Trong đó:

e y,là xác suất thực sự của lớp thứ i (bằng 1 cho lớp thực tế, 0 cho các lớp còn lại)

© — p¿ là vector xác suất dự đoán của diém dữ liệu thứ i e N là số lượng lớp cần phân loại.

e log là hàm logarit tự nhiên.

3.2.3. Xây dung mô hình

JIIIIIIẬ1¡III=z

Hình 3-5 Mô hình học chuyển giao dé phân loại ung thử phoi dựa trên

GoogLeNet

53

Trong khóa luận này, tôi dé xuất một mô hình học sâu dựa trên cấu trúc của GoogLeNet dé giải bài toàn nhận diện ung thử phối. Bằng cách thêm vào các lớp batch normalization sau mỗi lớp tích chập và bỏ đi hai bộ phân loại bô trợ (auxiliary classifier)

giúp giảm số lượng tham số cái thiện quá trình huấn luyện, giảm khả năng bị quá khớp.

Hình ảnh sẽ đi vào mô hình sẽ được thay đôi độ phân giải về 224x224 pixel va gặp các lớp tích chập. Lớp tích chập có chức năng chính là trích xuất các đặc trưng từ hình ảnh. Lớp tích chập sẽ sử dụng các bộ lọc đi chuyên trên ảnh đầu vào và thực hiện các pháp tích chập với từng phần nhỏ trên ảnh. Đầu ra cuối cùng của lớp tích chập này là một vectơ. Kích thước của bộ lọc cũng ảnh hưởng đến số lượng đầu vào của lớp tích

chập. Vi vậy việc sử dùng các bộ lọc có kích thước 1x1 trước các bộ lọc 3x3 và 5x5

giúp giảm kích thước của mạng nơ-ron, tăng tốc độ tính toán và giảm chỉ phí đào tạo mạng. Điều này được thực hiện rat tốt nhờ vào mô-đun Inception của GoogLeNet.

Sau mỗi lớp tích chập tôi đều thêm một lớp batch normalization, là một kỹ thuật chuẩn hóa đầu vào của mỗi lớp trong quá trình huấn luyện mạng nơ-ron. Tác dụng

chính của Batch Normalization là làm ồn định quá trình huấn luyện, tăng tốc độ hội tụ

và giảm quá khớp.

Và sau đó nữa là hàm kích hoạt ReLU:

Relu(x) = max (0,x) (4)

Ham ReLU rất được ưu chuộng vì nó là một hàm đơn giản dé tính toán và còn giúp tăng tốc độ tính toán trong quá trình huấn luyện

-109 -73 -59 -23 Q0 25 150 75 109

54

Lớp gộp thường được sử dùng sau các lớp ReLU, dé giảm kích thước của đầu

vào bằng cách thực hiện một phép gộp trên các vùng không gian của đặc trưng. Lớp gộp sẽ giúp giảm số lượng tính toán và số lượng tham số cần tìm hiệu. Hai loại gộp phô biến đó là gộp cực đại và gộp trung bình. Trong khóa luận này, hầu hết các thao tác gộp đều sử dụng gộp cực đại dé chọn giá trị lớn nhất từ các cửa số trượt có kích

thước 3x3 hoặc 7x7. Điều này đồng thời giảm nhiễu va giữ lại các đặc trưng có độ

quan trọng cao.

Giai đoạn phân loại của mô hình sẽ bắt đầu với lớp gộp trung bình. Sau đó là

một lớp dropout 40%, lớp nay sẽ chọn 40% nơ-ron ngẫu nhiên và loại bỏ trong quá

trình huấn luyện để ngăn ngừa quá khớp. Sau nữa là lớp làm phẳng, một lớp kết nói đây du. Kết qua dy đoán 1a một trong 3 trường hợp sau:

© Ung thư biêu mô phôi (Lung_aca).

© Ung thư biểu mô tế bảo vảy phôi (Lung sec).

e Mô phôi lành tính (Lung_n).

55

Một phần của tài liệu Khóa luận tốt nghiệp Khoa học máy tính: Ứng dụng phương pháp học chuyển giao vào chẩn đoán bệnh Ung thư phổi (Trang 53 - 58)

Tải bản đầy đủ (PDF)

(64 trang)