1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát hiện ký sinh trùng sốt rét trong ảnh tế bào máu

185 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 185
Dung lượng 6,18 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGOẠI NGỮ - TIN HỌC TP.HCM KHOA CÔNG NGHỆ THÔNG TIN KHÓA LUẬN TỐT NGHIỆP PHÁT HIỆN KÝ SINH TRÙNG SỐT RÉT TRONG ẢNH TẾ BÀO MÁU GIẢNG VIÊN HƯỚNG DẪN: ThS Tôn Quang Toại SINH VIÊN THỰC HIỆN: Đỗ Huỳnh Phương – 15DH110020 Nguyễn Minh Tiến – 15DH110289 TP.HỒ CHÍ MINH - 2019 LỜI CẢM ƠN  Lời đầu tiên, chúng em bày tỏ lòng biết ơn chân thành lời cảm ơn sâu sắc đến Ths Tôn Quang Toại – Giảng viên hướng dẫn thực khóa luận tốt nghiệp chúng em Thầy Tôn Quang Toại hết lòng hỗ trợ giúp đỡ chúng em nhiều suốt q trình nghiên cứu hồn thành khóa luận tốt nghiệp chúng em Trong suốt trình thực đề tài, thầy giúp đỡ giải đáp khó khăn mà chúng em gặp phải, thầy nhiệt tình hết lịng sinh viên Chúng em trân trọng biết ơn thầy điều thầy hướng dẫn để khóa luận tốt nghiệp chúng em hồn thành tốt đẹp Chúng em gửi lời cảm ơn chân thành đến thầy, cô giảng viên trường Đại học Ngoại ngữ -Tin học TPHCM tận tình giảng dạy hướng dẫn chúng em suốt trình học tập trường chúng em gửi lời cảm ơn đến Khoa công nghệ thông tin trường tạo điều kiện cho chúng em thực khóa luận tốt nghiệp cách thuận lợi Chúng em gửi lời cảm ơn đến bố mẹ, gia đình ni nấng dạy dỗ, động viên chúng em hồn thành tốt khóa luận tốt nghiệp Chúng em cố gắng để hồn thành khóa luận tốt nghiệp cách tốt suốt trình thực nội dung khóa luận tốt nghiệp mắc sai sót Kính mong nhận cảm thơng, đóng góp tận tình từ thầy cô bạn Chúng em xin cảm ơn chân thành nhất! MỤC LỤC LỜI CẢM ƠN Chương GIỚI THIỆU 1.1 Artificial intelligence (AI) 1.2 Machine Learning (ML) .2 1.2.1 Dataset, training set, testing set validation set 1.2.2 Supervised learning (Học có giám sát) .4 1.2.3 Unsupervised learning (Học không giám sát) 1.2.4 Semi-supervised learning (Học bán giám sát) 1.2.5 Reinforcement learning (Học tăng cường) 1.3 Những thách thức Machine Learning 1.3.1 Số lượng liệu đào tạo không đủ 1.3.2 Chất lượng liệu không tốt (Poor-quality data) 1.3.3 Đặc trưng không liên quan (Irrelevant features) 1.3.4 Overfitting .8 1.3.5 Underfitting 1.4 Deep learning (DL) 1.5 Computer vision (thị giác máy tính) 10 1.5.1 Các ứng dụng Computer Vision 11 1.5.2 Tương tác người máy 11 1.5.3 Ứng dụng vào Robot 12 1.5.4 Đa phương tiện 12 1.5.5 Image Processing (Xử lý hình ảnh) 12 1.6 Tổng quan đề tài khóa luận 14 1.6.1 Giới thiệu bệnh sốt rét 14 1.6.2 Phân bố thiệt hại bệnh sốt rét 15 1.6.3 Các loại ký sinh trùng sốt rét 15 1.6.4 Các phương pháp chuẩn đoán bệnh sốt rét .17 1.6.5 Tập liệu bệnh sốt rét (Malaria Dataset) .21 Chương LÝ THUYẾT NỀN TẢNG 22 2.1 Bài toán Classification .22 2.2 Parametric model (Mơ hình tham số) 24 2.3 Neural Networks (NN) 25 2.3.1 Giới thiệu mạng neuron nhân tạo 25 2.3.2 Neuron sinh học 25 2.3.3 Mạng neuron đơn tầng (The Perceptron) 27 2.3.4 Activation function (Hàm kích hoạt) 28 2.3.5 Mạng neuron nhiều tầng (Multilayer Neural Networks) .33 2.3.6 Toán học mạng neuron 37 2.3.7 Lan truyền tiến (Forward propagation) 38 2.3.8 Lan truyền ngược (Backpropagation) 39 2.4 Convolutional Neural Networks (CNN) 42 2.4.1 Giới thiệu mạng neuron tích chập 42 2.4.2 Kiến trúc mạng tích chập 44 2.4.3 Các mơ hình sử dụng kiến trúc CNN 51 2.4.4 Visualization 65 2.5 Huấn luyện mơ hình 69 2.5.1 Hiện tượng Vanishing Gradients Exploring Gradients .69 2.5.2 Phương pháp sinh thêm liệu (Data Augmentation) 70 2.5.3 Các phương pháp khởi tạo trọng số 70 2.5.4 Các phương pháp tối ưu (Optimizer) .72 2.5.5 Các phương pháp Regularization 78 2.5.6 Các phương pháp đánh giá mơ hình 83 Chương CÔNG TRÌNH LIÊN QUAN 86 3.1 Giới thiệu cơng trình 86 3.2 Tổng quan cơng trình 86 3.3 Tập liệu (dataset) 86 3.4 Cấu hình hệ thống dùng để huấn luyện 87 3.5 Mơ hình tùy chỉnh 89 3.6 Mơ hình huấn luyện trước (pre-trained model) 90 3.7 Đánh giá kết số liệu 90 Chương MƠ HÌNH ĐỀ XUẤT VÀ KẾT QUẢ THỰC NGHIỆM 92 4.1 Chuẩn bị tập liệu 92 4.1.1 Dữ liệu (Data) 92 4.1.2 Phân chia tập liệu 93 4.2 Cấu hình huấn luyện 93 4.3 Tiền xử lý ảnh 94 4.4 Hàm softmax 94 4.5 Hàm loss (loss function) 94 4.6 Thuật toán huấn luyện 95 4.7 Xây dựng mơ hình 95 4.7.1 Mô hình A (Mơ hình đề xuất) 96 4.7.2 Mơ hình B 116 4.7.3 Mơ hình C 135 4.7.4 Mơ hình D 158 4.7.5 So sánh kết luận mơ hình .165 4.7.6 Thực nghiệm mơ hình C phương pháp Cross validation 165 4.7.7 Visualization ảnh tế bào máu 166 KẾT LUẬN 169 TÀI LIỆU THAM KHẢO 170 DANH SÁCH BẢNG Bảng 2-1 Mật độ neuron người loài động vật 25 Bảng 2-2 Tóm tắt kiến trúc LeNet-5 53 Bảng 2-3 Tóm tắt kiến trúc AlexNet 54 Bảng 2-4 Cấu hình ConvNet (arxiv.org) 60 Bảng 2-5 So sánh mô hình tốn phân loại ILSVRC 61 Bảng 3-1 Phân chia tập validation 87 Bảng 3-2 Kiếm trúc mơ hình tùy chỉnh (customized) nhóm tác giả 89 Bảng 3-3 Bảng thống kê số liệu cho mơ hình tùy chỉnh mơ hình pre-trained 91 Bảng 4-1 Phân chia tập liệu 93 Bảng 4-2 Cấu hình máy ảo huấn luyện Google Colab 94 Bảng 4-3 Kiến trúc mơ hình A .96 Bảng 4-4 Thông tin thực nghiệm (Mơ hình A) 97 Bảng 4-5 Thông tin thực nghiệm (Mơ hình A) 98 Bảng 4-6 Thông tin thực nghiệm (Mơ hình A) 99 Bảng 4-7 Thơng tin thực nghiệm (Mơ hình A) 100 Bảng 4-8 Thơng tin thực nghiệm (Mơ hình A) 101 Bảng 4-9 Thông tin thực nghiệm (Mơ hình A) 102 Bảng 4-10 Thông tin thực nghiệm (Mơ hình A) .104 Bảng 4-11 Thông tin thực nghiệm (Mô hình A) .105 Bảng 4-12 Thơng tin thực nghiệm (Mơ hình A) .107 Bảng 4-13 Thông tin thực nghiệm 10 (Mơ hình A) .108 Bảng 4-14 Thông tin thực nghiệm 11 (Mơ hình A) .109 Bảng 4-15 Thơng tin thực nghiệm 12 (Mơ hình A) .110 Bảng 4-16 Thông tin thực nghiệm 13 (Mơ hình A) .111 Bảng 4-17 Thông tin thực nghiệm 14 (Mơ hình A) .113 Bảng 4-18 Tóm tắt tất thực nghiệm mơ hình A 114 Bảng 4-19 Thơng tin thực nghiệm mơ hình LeNet-5 115 Bảng 4-20 Kiến trúc mơ hình B 116 Bảng 4-21 Thông tin thực nghiệm (Mơ hình B) 117 Bảng 4-22 Thơng tin thực nghiệm (Mơ hình B) 118 Bảng 4-23 Thơng tin thực nghiệm (Mơ hình B) 119 Bảng 4-24 Thông tin thực nghiệm (Mơ hình B) 120 Bảng 4-25 Thông tin thực nghiệm (Mơ hình B) 121 Bảng 4-26 Thông tin thực nghiệm (Mơ hình B) 122 Bảng 4-27 Thơng tin thực nghiệm (Mơ hình B) 125 Bảng 4-28 Thơng tin thực nghiệm (Mơ hình B) 126 Bảng 4-29 Thông tin thực nghiệm (Mơ hình B) 128 Bảng 4-30 Thông tin thực nghiệm 10 (Mơ hình B) .129 Bảng 4-31 Thông tin thực nghiệm 11 (Mô hình B) .130 Bảng 4-32 Thơng tin thực nghiệm 12 (Mơ hình B) .131 Bảng 4-33 Thông tin thực nghiệm 13 (Mơ hình B) .132 Bảng 4-34 Thông tin thực nghiệm 14 (Mơ hình B) .133 Bảng 4-35 Tóm tắt tất thực nghiệm mơ hình B .134 Bảng 4-36 Kiến trúc mơ hình C 135 Bảng 4-37 Thông tin thực nghiệm (Mơ hình C) 137 Bảng 4-38 Thông tin thực nghiệm (Mơ hình C) 138 Bảng 4-39 Thông tin thực nghiệm (Mô hình C) 139 Bảng 4-40 Thơng tin thực nghiệm (Mơ hình C) 140 Bảng 4-41 Thông tin thực nghiệm (Mơ hình C) 141 Bảng 4-42 Thông tin thực nghiệm (Mơ hình C) 142 Bảng 4-43 Thông tin thực nghiệm (Mơ hình C) 145 Bảng 4-44 Thông tin thực nghiệm (Mô hình C) 148 Bảng 4-45 Thơng tin thực nghiệm (Mơ hình C) 150 Bảng 4-46 Thông tin thực nghiệm 10 (Mơ hình C) .151 Bảng 4-47 Thông tin thực nghiệm 11 (Mơ hình C) .152 Bảng 4-48 Thông tin thực nghiệm 12 (Mô hình C) .153 Bảng 4-49 Thơng tin thực nghiệm 13 (Mơ hình C) .154 Bảng 4-50 Thông tin thực nghiệm 14 (Mơ hình C) .155 Bảng 4-51 Tóm tắt tất thực nghiệm mơ hình C .156 Bảng 4-52 Thơng tin thực nghiệm (Mơ hình D) 158 Bảng 4-53 So sánh mơ hình thực nghiệm 165 Bảng 4-54 Kết thực nghiệm phương pháp cross validation .166 DANH SÁCH HÌNH Hình 1-1 Tổng quan trí tuệ nhân tạo Hình 1-2 Mơ q trình phân loại spam email Hình 1-3 Ví dụ Reinforcement learning (Aurélien Géron) Hình 1-4 Ví dụ Underfitting (bên trái), Good fit (ở giữa) Overfitting (bên phải) (Andriy Burkov's) Hình 1-5 Lịch sử deep learning (Nguồn: beamandrew.github.io) 10 Hình 1-6 Các loại nhận dạng Computer vision (leonardoaraujosantos.gitbooks.io) .11 Hình 1-7 Bản đồ phân bố bệnh sốt rét toàn cầu 15 Hình 1-8 Năm loại Plasmodium người giai đoạn phát triển phin máu (sciencedirect.com) 16 Hình 1-9 Các giai đoạn ký sinh trùng vết máu mỏng (sciencedirect.com) 17 Hình 1-10 Quá trình chẩn đốn bệnh sốt rét kính hiển vi ánh sáng 19 Hình 1-11 Mơ tả q trình thu thập tập liệu sốt rét (blog.insightdatascience.com) 21 Hình 2-1 Ví dụ phân loại nhị phân phân loại đa lớp 22 Hình 2-2 Cấu tạo neuron người .26 Hình 2-3 Kiến trúc mạng perceptron 27 Hình 2-4 Đồ thị phương trình tuyến tính 28 Hình 2-5 Đồ thị phương trình phi tuyến .28 Hình 2-6 Đồ thị hàm binary step 29 Hình 2-7 Đồ thị hàm sigmoid .29 Hình 2-8 Đồ thị hàm 30 Hình 2-9 Đồ thị so sánh hàm sigmoid hàm .31 Hình 2-10 Biều đồ hàm acrtan 31 Hình 2-11 Đồ thị hàm ReLU 32 Hình 2-12 Biểu đồ hàm PReLU 32 Hình 2-13 Biểu đồ hàm ELU 33 Hình 2-14 Biểu đồ hàm SoftPlus 33 Chương 4: Mơ hình đề xuất kết thực nghiệm Macro avg 0.98 0.98 0.98 5512 Weight avg 0.98 0.98 0.98 5512 Confusion matrix Hình 4-46 Confusion matrix cho mơ hình C Theo confusion matrix hình 4-46, mơ hình C dự đốn 2.628 ảnh Parasitized 2.752 ảnh Uninfected Mô hình C dự đốn sai 98 ảnh Parasitized sai 34 ảnh Uninfected Kết luận thực nghiệm mơ hình C: Sau tất thực nghiệm để tìm siêu tham số thích hợp cho mơ hình, chúng em tìm siêu tham số thích hợp cho mơ hình C, bên cạnh tìm siêu tham số không phù hợp với mô hình C Với mơ hình C, tốc độ học 0.001, sử dụng kỹ thuật BatchNormalization, kỹ thuật Dropout kỹ thuật Data augmentation đem lại kết tốt thực nghiệm 10 có accuracy cao với 96.69% tập validation Mơ hình kiểm tra tập test thực nghiệm 14 đạt accuracy 97.61% loss 0.0741 Trang 157 Chương 4: Mơ hình đề xuất kết thực nghiệm 4.7.4 Mơ hình D Chúng em lựa chọn kiến trúc mơ hình ResNet-50 loại mơ hình kiến trúc ResNet Tại mơ hình D chúng em áp dụng kỹ thuật BatchNormalization Data augmentation chạy 150 epochs với thực nghiệm để đánh giá mô hình Bảng 4-52 Thơng tin thực nghiệm (Mơ hình D) Size ảnh đầu vào 64 x 64 Optimizer SGD (learning rate: 0.001, momentum=0.9) Kernel size 3x3 Epochs 150 Thời gian huấn luyện tiếng 40 phút Dropout Không Sinh thêm liệu Có Tóm tắt mơ hình D thực nghiệm Layer (type) Output Shape Param # =================================================================== input_16 (InputLayer) (None, 64, 64, 3) _ batch_normalization_631 (BatchNor (None, 64, 64, 3) 12 _ conv2d_646 (Conv2D) (None, 64, 64, 64) 4800 _ batch_normalization_632 (BatchNor (None, 64, 64, 64) 256 _ activation_631 (Activation) (None, 64, 64, 64) _ zero_padding2d_16 (ZeroPadding2D (None, 66, 66, 64) _ max_pooling2d_24 (MaxPooling2D) (None, 32, 32, 64) _ batch_normalization_633 (BatchNor (None, 32, 32, 64) 256 _ activation_632 (Activation) (None, 32, 32, 64) _ conv2d_647 (Conv2D) (None, 32, 32, 32) 2048 _ batch_normalization_634 (BatchNor (None, 32, 32, 32) 128 _ activation_633 (Activation) (None, 32, 32, 32) _ Trang 158 Chương 4: Mơ hình đề xuất kết thực nghiệm conv2d_648 (Conv2D) (None, 32, 32, 32) 9216 _ batch_normalization_635 (BatchNor (None, 32, 32, 32) 128 _ activation_634 (Activation) (None, 32, 32, 32) _ conv2d_649 (Conv2D) (None, 32, 32, 128) 4096 _ conv2d_650 (Conv2D) (None, 32, 32, 128) 8192 _ add_196 (Add) [(None, 32, 32, 128), _ batch_normalization_636 (BatchNor (None, 32, 32, 128) 512 _ activation_635 (Activation) (None, 32, 32, 128) _ conv2d_651 (Conv2D) (None, 32, 32, 32) 4096 _ batch_normalization_637 (BatchNor (None, 32, 32, 32) 128 _ activation_636 (Activation) (None, 32, 32, 32) _ conv2d_652 (Conv2D) (None, 32, 32, 32) 9216 _ batch_normalization_638 (BatchNor (None, 32, 32, 32) 128 _ activation_637 (Activation) (None, 32, 32, 32) _ conv2d_653 (Conv2D) (None, 32, 32, 128) 4096 _ add_197 (Add) [(None, 32, 32, 128), _ batch_normalization_639 (BatchNor (None, 32, 32, 128) 512 _ activation_638 (Activation) (None, 32, 32, 128) _ conv2d_654 (Conv2D) (None, 32, 32, 32) 4096 _ batch_normalization_640 (BatchNor (None, 32, 32, 32) 128 _ activation_639 (Activation) (None, 32, 32, 32) _ conv2d_655 (Conv2D) (None, 32, 32, 32) 9216 _ batch_normalization_641 (BatchNor (None, 32, 32, 32) 128 _ activation_640 (Activation) (None, 32, 32, 32) _ conv2d_656 (Conv2D) (None, 32, 32, 128) 4096 _ add_198 (Add) [(None, 32, 32, 128), Trang 159 Chương 4: Mơ hình đề xuất kết thực nghiệm _ batch_normalization_642 (BatchNor (None, 32, 32, 128) 512 _ activation_641 (Activation) (None, 32, 32, 128) _ conv2d_657 (Conv2D) (None, 32, 32, 64) 8192 _ batch_normalization_643 (BatchNor (None, 32, 32, 64) 256 _ activation_642 (Activation) (None, 32, 32, 64) _ conv2d_658 (Conv2D) (None, 16, 16, 64) 36864 _ batch_normalization_644 (BatchNor (None, 16, 16, 64) 256 _ activation_643 (Activation) (None, 16, 16, 64) _ conv2d_659 (Conv2D) (None, 16, 16, 256) 16384 _ conv2d_660 (Conv2D) (None, 16, 16, 256) 32768 _ add_199 (Add) [(None, 16, 16, 256), _ batch_normalization_645 (BatchNor (None, 16, 16, 256) 1024 _ activation_644 (Activation) (None, 16, 16, 256) _ conv2d_661 (Conv2D) (None, 16, 16, 64) 16384 _ batch_normalization_646 (BatchNor (None, 16, 16, 64) 256 _ activation_645 (Activation) (None, 16, 16, 64) _ conv2d_662 (Conv2D) (None, 16, 16, 64) 36864 _ batch_normalization_647 (BatchNor (None, 16, 16, 64) 256 _ activation_646 (Activation) (None, 16, 16, 64) _ conv2d_663 (Conv2D) (None, 16, 16, 256) 16384 _ add_200 (Add) [(None, 16, 16, 256), _ batch_normalization_648 (BatchNor (None, 16, 16, 256) 1024 _ activation_647 (Activation) (None, 16, 16, 256) _ conv2d_664 (Conv2D) (None, 16, 16, 64) 16384 _ batch_normalization_649 (BatchNor (None, 16, 16, 64) 256 _ Trang 160 Chương 4: Mơ hình đề xuất kết thực nghiệm activation_648 (Activation) (None, 16, 16, 64) _ conv2d_665 (Conv2D) (None, 16, 16, 64) 36864 _ batch_normalization_650 (BatchNor (None, 16, 16, 64) 256 _ activation_649 (Activation) (None, 16, 16, 64) _ conv2d_666 (Conv2D) (None, 16, 16, 256) 16384 _ add_201 (Add) [(None, 16, 16, 256), _ batch_normalization_651 (BatchNo (None, 16, 16, 256) 1024 _ activation_650 (Activation) (None, 16, 16, 256) _ conv2d_667 (Conv2D) (None, 16, 16, 64) 16384 _ batch_normalization_652 (BatchNor (None, 16, 16, 64) 256 _ activation_651 (Activation) (None, 16, 16, 64) _ conv2d_668 (Conv2D) (None, 16, 16, 64) 36864 _ batch_normalization_653 (BatchNor (None, 16, 16, 64) 256 _ activation_652 (Activation) (None, 16, 16, 64) _ conv2d_669 (Conv2D) (None, 16, 16, 256) 16384 _ add_202 (Add) [(None, 16, 16, 256), _ batch_normalization_654 (BatchNor (None, 16, 16, 256) 1024 _ activation_653 (Activation) (None, 16, 16, 256) _ conv2d_670 (Conv2D) (None, 16, 16, 128) 32768 _ batch_normalization_655 (BatchNor (None, 16, 16, 128) 512 _ activation_654 (Activation) (None, 16, 16, 128) _ conv2d_671 (Conv2D) (None, 8, 8, 128) 147456 _ batch_normalization_656 (BatchNor (None, 8, 8, 128) 512 _ activation_655 (Activation) (None, 8, 8, 128) _ conv2d_672 (Conv2D) (None, 8, 8, 512) 65536 _ conv2d_673 (Conv2D) (None, 8, 8, 512) 131072 Trang 161 Chương 4: Mơ hình đề xuất kết thực nghiệm _ add_203 (Add) [(None, 8, 8, 512), _ batch_normalization_657 (BatchNor (None, 8, 8, 512) 2048 _ activation_656 (Activation) (None, 8, 8, 512) _ conv2d_674 (Conv2D) (None, 8, 8, 128) 65536 _ batch_normalization_658 (BatchNor (None, 8, 8, 128) 512 _ activation_657 (Activation) (None, 8, 8, 128) _ conv2d_675 (Conv2D) (None, 8, 8, 128) 147456 _ batch_normalization_659 (BatchNor (None, 8, 8, 128) 512 _ activation_658 (Activation) (None, 8, 8, 128) _ conv2d_676 (Conv2D) (None, 8, 8, 512) 65536 _ add_204 (Add) [(None, 8, 8, 512), _ batch_normalization_660 (BatchNo (None, 8, 8, 512) 2048 _ activation_659 (Activation) (None, 8, 8, 512) _ conv2d_677 (Conv2D) (None, 8, 8, 128) 65536 _ batch_normalization_661 (BatchNor (None, 8, 8, 128) 512 _ activation_660 (Activation) (None, 8, 8, 128) _ conv2d_678 (Conv2D) (None, 8, 8, 128) 147456 _ batch_normalization_662 (BatchNor (None, 8, 8, 128) 512 _ activation_661 (Activation) (None, 8, 8, 128) _ conv2d_679 (Conv2D) (None, 8, 8, 512) 65536 _ add_205 (Add) [(None, 8, 8, 512), _ batch_normalization_663 (BatchNor (None, 8, 8, 512) 2048 _ activation_662 (Activation) (None, 8, 8, 512) _ conv2d_680 (Conv2D) (None, 8, 8, 128) 65536 _ batch_normalization_664 (BatchNo (None, 8, 8, 128) 512 _ Trang 162 Chương 4: Mơ hình đề xuất kết thực nghiệm activation_663 (Activation) (None, 8, 8, 128) _ conv2d_681 (Conv2D) (None, 8, 8, 128) 147456 _ batch_normalization_665 (BatchNor (None, 8, 8, 128) 512 _ activation_664 (Activation) (None, 8, 8, 128) _ conv2d_682 (Conv2D) (None, 8, 8, 512) 65536 _ add_206 (Add) [(None, 8, 8, 512), _ batch_normalization_666 (BatchNor (None, 8, 8, 512) 2048 _ activation_665 (Activation) (None, 8, 8, 512) _ conv2d_683 (Conv2D) (None, 8, 8, 128) 65536 _ batch_normalization_667 (BatchNor (None, 8, 8, 128) 512 _ activation_666 (Activation) (None, 8, 8, 128) _ conv2d_684 (Conv2D) (None, 8, 8, 128) 147456 _ batch_normalization_668 (BatchNor (None, 8, 8, 128) 512 _ activation_667 (Activation) (None, 8, 8, 128) _ conv2d_685 (Conv2D) (None, 8, 8, 512) 65536 _ add_207 (Add) [(None, 8, 8, 512), _ batch_normalization_669 (BatchNor (None, 8, 8, 512) 2048 _ activation_668 (Activation) (None, 8, 8, 512) _ conv2d_686 (Conv2D) (None, 8, 8, 128) 65536 _ batch_normalization_670 (BatchNor (None, 8, 8, 128) 512 _ activation_669 (Activation) (None, 8, 8, 128) _ conv2d_687 (Conv2D) (None, 8, 8, 128) 147456 _ batch_normalization_671 (BatchNor (None, 8, 8, 128) 512 _ activation_670 (Activation) (None, 8, 8, 128) _ conv2d_688 (Conv2D) (None, 8, 8, 512) 65536 _ add_208 (Add) [(None, 8, 8, 512), Trang 163 Chương 4: Mô hình đề xuất kết thực nghiệm _ batch_normalization_672 (BatchNor (None, 8, 8, 512) 2048 _ activation_671 (Activation) (None, 8, 8, 512) _ max_pooling2d_25 (MaxPooling2D) (None, 1, 1, 512) _ flatten_16 (Flatten) (None, 512) _ dense_16 (Dense) (None, 2) 1026 _ activation_672 (Activation) (None, 2) =================================================================== Total params: 2,164,174.0 Trainable params: 2,150,472.0 Non-trainable params: 13,702.0 ▪ Biểu đồ huấn luyện Hình 4-47 Biểu đồ huấn luyện thực nghiệm (mơ hình D) ▪ Kết quả: Test accuracy: 96.93% - Test loss: 0.3518 ▪ Nhận xét: Mơ hình ResNet cho kết khơng qua ấn tượng accuracy 96.93% loss 0.3518 Hiện tượng overfitting chưa xuất mơ hình học tốt Kết luận thực nghiệm mơ hình D: Kiến trúc mơ hình D dựa ý tưởng kiến trúc ResNet với mạng 50 tầng sâu ưu điểm skip connection có mạng ResNet kỳ vọng cho kết Trang 164 Chương 4: Mô hình đề xuất kết thực nghiệm tốt, sau thực nghiệm mơ hình D với 150 epochs kết khơng tốt mơ hình C với accuracy mơ hình D thấp 0.68% so với mơ hình C 4.7.5 So sánh kết luận mơ hình Bảng 4-53 So sánh mơ hình thực nghiệm STT Tên mơ hình Test Accuracy Test Validation Mơ hình A (ý tưởng LeNet-5) 96.35% 0.1050 Mơ hình B (ý tưởng mơ hình A) 96.79% 0.0996 Mơ hình C (ý tưởng VGG-16) 97.61% 0.0741 Mơ hình D (ý tưởng ResNet-50) 96.93% 0.3518 Kết luận: Sau nhiều thực nghiệm mơ hình kiểm tra mơ hình tập test, mơ hình đạt kết tốt mơ hình C với kiến trúc dựa ý tưởng mơ hình VGG-16 đạt accuracy 97.61% loss thấp 0.0741 tập liệu chúng em chia Các mơ hình A,B với kiến trúc dựa ý tưởng LeNet D với kiến trúc dựa ý tưởng ResNet-50 có kết tốt có accuracy 96% xem bảng 4-53 Mơ hình C với ý tượng dựa ý tưởng kiến trúc mơ hình VGG-16 cho kết ấn tượng nên chúng em lựa chọn kiến trúc mơ hình C kiến trúc mơ hình tốt dùng cho tốn phân loại tế bào máu bị nhiễm bệnh chúng em chúng em sử dụng mơ hình C huấn luyện để áp dụng vào giao diện phân loại tế bào máu bị nhiễm bệnh 4.7.6 Thực nghiệm mơ hình C phương pháp Cross validation Cross validation cải tiến validation với mơi hình đánh giá nhiều tập validation khác Một cách thường dùng chia tập training thành k tập có kích thước tập gần Tại lần kiểm thử, số tập k tập lấy làm validation set, phần lại k tập training set Mơ hình cuối xác định dựa trung bình kết lần huấn luyện Cách làm cịn có tên gọi k-fold cross validation Trang 165 Chương 4: Mơ hình đề xuất kết thực nghiệm Hình 4-48 Phương pháp cross validation cho đề tài sốt rét nhóm Chúng em thực phương pháp cross validation cho tập liệu chúng em gồm 27.558 ảnh chia thành folds (k-fold = 3) fold có 9.186 ảnh thực huấn luyện hình 4-48 Mỗi fold huấn luyện 30 epochs Kết huấn luyện Bảng 4-54 Kết thực nghiệm phương pháp cross validation Fold Test accuracy Test loss 96.81% 0.0902 97.11% 0.0880 97.26% 0.0771 Kết cuối Accuracy : 97.06% ± 0.0350 Kết luận Thực nghiệm phương pháp cross validation fold cho kết tốt gần mức 97% Trung bình accuracy folds 97.06% với độ lệch chuẩn 0.0350 4.7.7 Visualization ảnh tế bào máu Nhóm chúng em thực visualization ảnh tế bào bị nhiễm qua tầng mơ hình C trơng nào, xem hình 4-49, hình 4-50, hình 4-51 hình 4-52 Trang 166 Chương 4: Mơ hình đề xuất kết thực nghiệm Hình 4-49 Ảnh đầu tế bào bị nhiễm tầng convolution mơ hình C nhóm (64 filters) Hình 4-50 Ảnh đầu tế bào bị nhiễm tầng convolution thứ hai mơ hình C nhóm (64 filters) Hình 4-51 Ảnh đầu tế bào bị nhiễm sau max pooling thứ mơ hình C nhóm (64 filters) Trang 167 Chương 4: Mơ hình đề xuất kết thực nghiệm Hình 4-52 Ảnh đầu tế bào bị nhiễm tầng convolution thứ ba mơ hình C nhóm (128 filters) Heatmap cho ảnh tế bào bị nhiễm Sau ảnh gốc qua tầng, mơ hình chọn điểm vùng mà mơ hình cho có đặc trưng bị nhiễm Như bên phải ngồi hình 4-53 vùng máy chọn có đặc trưng vùng có màu sáng theo biên độ nhiệt Hình 4-53 Ảnh gốc (bên trái), Heatmap đầu (ở giữa) Heatmap ảnh gốc (bên phải) Trang 168 KẾT LUẬN Những vấn đề làm Sau chúng em hồn thành báo cáo khóa luận tốt nghiệp có góc nhìn lẫn kiến thức mảng lạ Machine learning cụ thể Deep learning Qua khóa luận chúng em tích lũy nhiều kiến thức lẫn kinh nghiệm từ thực nghiệm mơ hình Có thể phân biệt hiểu dạng toán machine learning vấn đề chúng em làm là: ▪ Có kiến thức tổng quan Machine learning, Neural Network, Convolutional Neural Network nhiều kiến thức liên quan khác ▪ Nghiên cứu nhiều cơng trình nghiên cứu thơng qua viết chun sâu nhiều kiến trúc mơ LeNet, VGGNet, GoogleNet, ResNet, Và kỹ thuật sử dụng mô hình ▪ Xây dựng mơ hình phân loại cho đề tài phân loại tế bào nhiễm trùng sốt rét với mơ hình C đạt kết tốt với độ xác 97.61% ▪ Tinh chỉnh mơ hình để phù hợp với toán ▪ Xây đựng giao diện phân loại ảnh tế bào nhiễm trùng sốt rét Những vấn đề chưa làm Chúng em chưa thực nghiệm mơ hình với kiến trúc khác GoogleLeNet, AlexNet Chúng em chưa so sánh kết thực nghiệm nhóm thực với cơng trình liên quan Hướng phát triển Sử dụng kỹ thuật Detection tế bào bị nhiễm hay Segmentation vùng bị nhiễm tế bào để nâng cấp toán Classification Xây dựng ứng dụng di động để triển khai hệ thống Xây dựng giao diện phân loại từ ảnh vết máu Trang 169 TÀI LIỆU THAM KHẢO [1] A Peart, "Homage to John McCarthy, the Father of Artificial Intelligence (AI)," in Artificial Solutions, 2017 [2] "World malaria report 2017," in https://www.who.int/malaria/publications/world-malaria-report-2017/en/, 2017 [3] L H N C f B Communications, "Malaria Datasets," in ceb.nlm.nih.gov, 2018 [4] "Activation function," in https://en.wikipedia.org/wiki/Activation_function [5] "Neural Network," in cs231n [6] A Géron, "Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts," in Tools, and Techniques to Build Intelligent Systems, 2017 [7] "Convolutional Neural Networks (CNNs / ConvNets)," in cs231n [8] L B Y B v P H Yann LeCun, "Gradient-Based Learning Applied Document Recognition," in Proceedings of the IEEE, 1998 [9] I S G E H Alex Krizhevsky, "Imagenet classification with deep convolutional neural networks," in Advances in neural information processing systems, 2012 [10] C e a Szegedy, "Going Deeper with Convolutions," in Proceedings of the IEEE conference on computer vision and pattern recognition., 2015 [11] K a A Z Simonyan, "Very deep convolutional networks for large-scale image recognition," in arXiv preprint arXiv:1409.1556, 2014 [12] e a He Kaiming, "Deep residual learning for image recognition.," in Proceedings of the IEEE conference on computer vision and pattern recognition, 2016 [13] e a He Kaiming, "Identity Mappings in Deep Residual Networks," in European conference on computer vision Springer, Cham, 2016 [14] A Ng, "Improving deep neural networks: Hyperparameter tuning, regularization and optimization," in Deeplearning on Coursera, 2017 [15] D P a J B Kingma, "Adam: A method for stochastic optimization.," in arXiv preprint arXiv:1412.6980, 2014 [16] M A a H M Nabian, "Physics-Informed Regularization of Deep Neural Networks," in arXiv preprint arXiv:1810.05547, 2018 Trang 170 [17] S e a Rajaraman, "Pre-trained convolutional neural networks as feature extractors toward improved malaria parasite detection in thin blood smear images," in PeerJ : e4568., 2018 Trang 171

Ngày đăng: 01/09/2023, 21:57

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w