1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Đồ án hcmute) phát hiện bệnh phổi dựa trên ảnh x quang dùng học sâu

67 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ THÔNG TIN PHÁT HIỆN BỆNH PHỔI DỰA TRÊN ẢNH X-QUANG DÙNG HỌC SÂU GVHD: Th.S NGUYỄN THIÊN BẢO SVTH: TRƯƠNG HÙNG ANH NGUYỄN XUÂN HIỆU SKL009802 Tp Hồ Chí Minh, Tháng / 2023 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KỸ THUẬT DỮ LIỆU _ KHÓA LUẬN TỐT NGHIỆP KỸ SƯ CNTT ĐỀ TÀI: PHÁT HIỆN BỆNH PHỔI DỰA TRÊN ẢNH X-QUANG DÙNG HỌC SÂU SVTH : TRƯƠNG HÙNG ANH - 18133001 NGUYỄN XUÂN HIỆU - 18133013 NGÀNH : CÔNG NGHỆ THÔNG TIN GVHD : TS NGUYỄN THIÊN BẢO KHÓA: 2018 - 2022 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH KHOA CƠNG NGHỆ THÔNG TIN _ KHÓA LUẬN TỐT NGHIỆP KỸ SƯ CNTT ĐỀ TÀI: PHÁT HIỆN BỆNH PHỔI DỰA TRÊN ẢNH X-QUANG DÙNG HỌC SÂU SVTH : TRƯƠNG HÙNG ANH - 18133001 NGUYỄN XUÂN HIỆU - 18133013 KHÓA : 2018 - 2022 NGÀNH : CÔNG NGHỆ THÔNG TIN GVHD : TS NGUYỄN THIÊN BẢO TP Hồ Chí Minh, tháng năm 2022 ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc KHOA CNTT ******* *** Tp Hồ Chí Minh, ngày…tháng…năm 2022 NHIỆM VỤ KHĨA LUẬN TỐT NGHIỆP Họ tên SV: Trương Hùng Anh MSSV: 18133001 Lớp: 181330B Họ tên SV: Nguyễn Xuân Hiệu MSSV: 18133013 Lớp: 181330B Chuyên ngành: Kỹ thuật liệu Giảng viên hướng dẫn: TS Nguyễn Thiên Bảo Ngày nhận đề tài: 15/09/2022 ĐT: Ngày nộp đề tài: Tên đề tài: Phát bệnh phổi dựa ảnh X-Quang dùng học sâu Các số liệu, tài liệu ban đầu: Tập liệu huấn luyện từ GVHD Kaggle, tài liệu nghiên cứu Deep Learning từ GVHD tự tìm kiếm Nội dung thực đề tài: ● Tìm hiểu xây dựng mơ hình phát bệnh phổi dựa hình ảnh X-Quang sử dụng mơ hình học sâu Sản phẩm: ● Các mơ hình sau huấn luyện với độ xác cao TRƯỞNG NGÀNH GIẢNG VIÊN HƯỚNG DẪN T.S Nguyễn Thiên Bảo ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT ******* Độc lập – Tự – Hạnh phúc *** PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN Họ tên SV: Trương Hùng Anh MSSV: 18133001 Lớp: 181330B Họ tên SV: Nguyễn Xuân Hiệu MSSV: 18133013 Lớp: 181330B Chuyên ngành: Kỹ thuật liệu Tên đề tài: Phát bệnh phổi dựa ảnh X-Quang dùng học sâu Họ tên Giáo viên hướng dẫn: TS Nguyễn Thiên Bảo NHẬN XÉT Về nội dung đề tài & khối lượng thực hiện: Ưu điểm: Khuyết điểm: Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: (Bằng chữ: .) Tp Hồ Chí Minh, ngày 27 tháng 12 năm 2022 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) ĐH SƯ PHẠM KỸ THUẬT TP.HCM CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM KHOA CNTT ******* Độc lập – Tự – Hạnh phúc *** PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Họ tên SV: Trương Hùng Anh MSSV: 18133001 Lớp: 181330B Họ tên SV: Nguyễn Xuân Hiệu MSSV: 18133013 Lớp: 181330B Chuyên ngành: Công nghệ phần mềm Tên đề tài: Phát bệnh phổi dựa ảnh X Quang dùng học sâu Họ tên Giáo viên phản biện: NHẬN XÉT Về nội dung đề tài & khối lượng thực hiện: Ưu điểm: Khuyết điểm: Đề nghị cho bảo vệ hay không? Đánh giá loại: Điểm: (Bằng chữ: .) Tp Hồ Chí Minh, ngày 27 tháng 12 năm 2022 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) ` LỜI CẢM ƠN Để hoàn thành đề tài báo cáo này, xin gửi lời cảm ơn chân thành đến giảng viên, Thầy Nguyễn Thiên Bảo, người đồng hành suốt trình làm đề tài Cảm ơn thầy đưa lời khuyên từ kinh nghiệm thực tiễn để định hướng cho chúng tơi với yêu cầu đề tài chọn, giải đáp thắc mắc đưa góp ý, chỉnh sửa kịp thời giúp chúng tơi hồn thành thời hạn đề Chúng xin gửi lời cảm ơn chân thành đên trường Đại học Sư phạm Kỹ thuật nói chung ngành Cơng Nghệ Thơng Tin nói riêng cung cấp cho tơi khơng kiến thức mà sở vật chất đại, giúp tơi có tảng để làm nên đề tài Cùng với đó, chúng tơi xin gửi cảm ơn đến bạn khóa cung cấp nhiều thơng tin kiến thức hữu ích trình thực đề tài Đề tài báo cáo thực khoảng thời gian ngắn, với kiến thức hạn chế thiếu sót mặt kỹ thuật kinh nghiệm việc thực dự án Do đó, q trình làm nên đề tài có thiếu sót điều khơng thể tránh khỏi nên tơi mong nhận ý kiến đóng góp quý báu quý thầy cô để kiến thức tơi hồn thiện tơi làm tốt lần sau Cuối lời, chúng tơi kính chúc q thầy, q ln dồi sức khỏe thành công nghiệp trồng người Một lần xin chân thành cảm ơn Tp Hồ Chí Minh, ngày 27 tháng 12 năm 2022 Sinh viên thực Trương Hùng Anh – Nguyễn Xuân Hiệu ` LỜI MỞ ĐẦU Ngày nay, việc ứng dụng công nghệ thông tin tin học hóa coi yếu tố định đến hoạt động cơng ty phủ đóng vai trị vơ quan trọng tạo bước đột phá mạnh mẽ Ngoài ra, cơng nghệ thơng tin cịn ứng dụng nhiều lĩnh vực y học nói chung việc phân tích X-Quang nói riêng làm cho sống người trở nên dễ dàng Gần với hoành hành đại dịch COVID-19 làm ngành y tế nước nhà trở nên tải nên việc ứng dụng công nghệ thông tin vào lĩnh vực cần thiết cấp bách Vì vậy, phát triển sản phẩm để phục vụ đất nước điều quan trọng Mong muốn tìm hiểu thêm lĩnh vực kiểm thử phần mềm thử sức thân mình, tơi chọn chủ đề "Tìm hiểu toán phân loại bệnh phổi dựa ảnh X Quang dùng học sâu" Trong trình tìm hiểu thực đề tài, thời gian kinh nghiệm thực tế có hạn nên chúng tơi mong nhận lời khuyên chân thành từ thầy Phần tiếp sau đây, nhóm chúng tơi xin phép trình bày báo cáo đề tài ứng dụng Deep Learning “Phát bệnh phổi dựa ảnh X Quang dùng học sâu” THỰC NGHIỆM VÀ KẾT QUẢ  target_size: kích cỡ hình ảnh input, ảnh điều chỉnh kích cỡ Tơi định nghĩa từ đầu kích cỡ (224x224)  batch_size: Số lượng hình ảnh tạo batch từ generator Tơi định nghĩa batch size 32 kích cỡ hình ảnh q lớn để RAM xử lí  Class_mode: Tơi chọn ‘categorical’ cho tốn 4.3.3 Tensorflow - Keras17 Keras open source cho Neural Network viết ngơn ngữ Python Nó library phát triển vào năm 2005 Francois Chollet, kỹ sư nghiên cứu Deep Learning Keras sử dụng chung với thư viện tiếng Tensorflow, CNTK, Theano Ở đây, dùng thư viện tensorflow để triển khai model import thư viện cần thiết Hình 34 Import thư viện 4.3.4 Build model Hình 35 Build VGG16 model 17 Tham khảo từ: https://viblo.asia/p/lam-quen-voi-keras-gGJ59mxJ5X2 Trang | 37 THỰC NGHIỆM VÀ KẾT QUẢ  Input_shape: Theo tơi define từ đầu, giá trị (224,224,3) Ở đây, tượng trưng cho kênh màu (grayscale), cho rgb  Weights: Chọn imagenet đào tạo trước ImageNet Hình 36 Model Compile Hình 36 mơ tả model Compile:  Learning Rate: mục đích cuối để giảm thiểu tối đa loss giá trị thực tế dự đoán training set Adam phương pháp tỷ lệ học tập thích ứng, có nghĩa là, tính tốn tỷ lệ học tập độc lập cho parameters khác  Loss function: Vì mơ hình categorical classification, tơi sử dụng categorical crossentropy trình training để đánh giá loss  Metrics: accuracy - Tính tần suất actual labels với predictions Nó đo lường loss độ xác training validation Trang | 38 THỰC NGHIỆM VÀ KẾT QUẢ Hình 37 Model tạo Hình 37 cho ta tổng quan lớp Conv2d MaxPooling tạo model với đầu vào có dạng (None, 224, 224, 64) 4.3.5 Fit model Trang | 39 THỰC NGHIỆM VÀ KẾT QUẢ Hình 38 Fit model Hình 38 mơ tả cải thiện mơ hình với tập train validation gán hình 31 Mơ hình chạy với số lượng epochs Hình 39 Training Như thấy hình 39, parameters tơi dùng cho model.fit bao gồm: train set, epochs set Sau chạy khoảng epochs, thấy mô hình có độ val_loss = 8,51% val_accuracy = 96,71% với thời gian 4517s thể bảng với epoch train Bảng Bảng kết chi tiết VGG16 Epoch Accuracy Loss Val_acc Val_loss 0.9232 0.1943 0.9043 0.2781 0.9575 0.1132 0.8929 0.3364 0.9671 0.0851 0.8967 0.3751 0.9628 0.1002 0.7296 1.1278 0.9668 0.0835 0.8240 0.6852 4.3.6 Evaluate Trang | 40 THỰC NGHIỆM VÀ KẾT QUẢ Hình 40 41 thể confusion matrix Classification Report VGG16 Hình 40 Confusion matrix VGG16 Hình 41 Classification Report VGG16 Trang | 41 THỰC NGHIỆM VÀ KẾT QUẢ Mơ hình VGG19: Đối với mơ hình VGG19 khác VGG16 chỗ sử dụng keras VGG19 thay VGG16 để chạy mơ hình Kết mơ hình VGG19 sau chạy với epochs năm Kết thị bảng thể thông số accuracy loss qua epoch Confusion matrix Classification Report VGG19 thể hình 42 43 Bảng Bảng kết chi tiết VGG19 Epoch Accuracy Loss Val_acc Val_loss 0.9092 0.2719 0.8839 0.5765 0.9446 0.2042 0.8469 0.9196 0.9476 0.1967 0.8763 0.7450 0.9527 0.1632 0.9082 0.5464 0.9503 0.1883 0.8839 0.5569 Trang | 42 THỰC NGHIỆM VÀ KẾT QUẢ Hình 42 Confusion matrix VGG19 Hình 43 Classification Report VGG19 Mơ hình ResNet50: Đối với mơ hình Resnet50 tương tự VGG16 chạy với thư viện keras ResNet50 mơ hình chạy với epoch 10 thu kết Trang | 43 THỰC NGHIỆM VÀ KẾT QUẢ Kết thị bảng thể thông số accuracy loss qua epoch Confusion matrix Classification Report VGG19 thể hình 44 45 Bảng Bảng kết chi tiết ResNet50 Epoch Accuracy Loss Val_acc Val_loss 0.7724 0.8119 0.8533 0.3457 0.8566 0.3467 0.8508 0.3424 0.8611 0.3475 0.6429 1.1102 0.8772 0.3130 0.8763 0.2828 0.8921 0.2886 0.7321 0.7236 0.8724 0.3573 0.7577 0.8258 0.8834 0.3200 0.7054 0.9750 0.8858 0.3257 0.8724 0.3629 0.9020 0.2753 0.8482 0.3871 10 0.8909 0.3091 0.8355 0.5262 Trang | 44 THỰC NGHIỆM VÀ KẾT QUẢ Hình 44 Confusion matrix ResNet50 Hình 45 Classification Report ResNet50 Trang | 45 THỰC NGHIỆM VÀ KẾT QUẢ 4.4 KẾT QUẢ Sau huấn luyện ba mơ hình ta có ROC_AUC ba mơ hình: Hình 46 ROC_AUC ResNet50, VGG16, VGG19 Hình mơ tả ROC_AUC ba mơ hình ResNet50, VGG16, VGG19 với số ROC 0.84, 0.82, 0.88 Dựa vào số ROC_AUC để đánh gia mơ hình phân loại nên tơi chọn mơ hình VGG19 với số ROC_AUC gần để dự đoán ảnh đưa vào bị viêm phổi bình thường Trang | 46 THỰC NGHIỆM VÀ KẾT QUẢ Hình 47 Kiểm tra bệnh phổi ảnh X-quang Hình 47 đoạn code tơi dùng để tự kiểm tra bệnh phổi từ hình X-quang bất kì, sử dụng VGG19 model train kết xác Trang | 47 TÀI LIỆU THAM KHẢO CHƯƠNG 5.1 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN NỘI DUNG THỰC HIỆN Tổng kết đề tài: Về nhóm hồn thành mục tiêu ban đầu đặt huấn luyện mơ hình học sâu để phát bệnh phổi đạt độ xác cao Từ áp dụng vào ĩnh vực y tế giúp cải thiện chất lượng khám chữa bệnh phổi Cụ thể: Lý thuyết ● Tìm hiểu loại bệnh phổi quy trình phân loại ● Tìm hiểu Học Máy, Học Sâu ● Tìm hiểu mơ hình phân loại ảnh: ResNet50, VGG16, VGG19 Thực hành ● Ứng dụng mơ hình học sâu tìm hiểu vào toán phát bệnh phổi dựa hình ảnh X-Quang ● Huấn luyện ba mơ hình phát bệnh phổi dựa hình ảnh X-Quang với độ xác cao 5.2 HẠN CHẾ ● Nguồn tài ngun phục vụ cho việc huấn luyện cịn ít, hầu hết cung cấp miễn phí ● Người thực hạn chế kiến thức kinh nghiệm lĩnh vực Học Máy, Học Sâu ● Thời gian thực đề tài ngắn dẫn đến chưa cải tiến mơ hình ● Chưa phân loại bệnh cụ thể, dừng lại bước phát bệnh 5.3 HƯỚNG PHÁT TRIỂN ● Phát triển thành ứng dụng cho điện thoại ● Phát triển website đơn giản tích hợp với API có chức phát bệnh phổi dựa hình ảnh X-Quang ● Tiếp tục tìm hiểu model cải tiến model để giải toán nhanh có kết tốt ● Phát triển để phân loại bệnh cụ thể Trang | 48 TÀI LIỆU THAM KHẢO Bảng Bảng phân công Tuần Cơng việc Sản phẩm Người thực Tìm hiểu đề tài Trương Hùng Anh Tìm hiểu liệu Nguyễn Xuân Hiệu Tìm hiểu model Trương Hùng Anh Nguyễn Xuân Hiệu Báo cáo lần đầu Trương Hùng Anh Nguyễn Xuân Hiệu Thống kê chi tiết liệu Nguyễn Xuân Hiệu Tổng hợp kiến thức CNNs thông tin liên quan Trương Hùng Anh Train thử liệu model Trương Hùng Anh 10 - 11 Đưa phương pháp cải thiện model train Nguyễn Xuân Hiệu Trương Hùng Anh Nguyễn Xuân Hiệu Trương Hùng Anh Thử cải thiện phương pháp đưa Nguyễn Xuân Hiệu Hoàn thiện báo cáo Trương Hùng Anh Nguyễn Xuân Hiệu Trang | 49 TÀI LIỆU THAM KHẢO TÀI LIỆU THAM KHẢO [1] Géron, A (2019) Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow [2] VNVC (2021, January, 2) VIÊM PHỔI: NGUYÊN NHÂN, TRIỆU CHỨNG, ĐIỀU TRỊ VÀ CÁCH PHÒNG NGỪA https://vnvc.vn/benh-viem-phoi-nguyen-nhan-trieu-chung-dieu-tri-vacach-phong-ngua/#:~:text=ph%E1%BB%95i%20ra%20sao%3F,B%E1%BB%87nh%20vi%C3%AAm%20ph%E1%BB%95i%20l%C3%A0%20g%C3%AC%3F,kh u%E1%BA%A9n%2C%20virus%2C%20vi%20n%E1%BA%A5m [3] Tâm Anh (2021, January, 2) CHỤP X-QUANG PHỔI GIÚP PHÁT HIỆN BỆNH GÌ? https://tamanhhospital.vn/chup-xquang-phoi/ [4] Wikipedia (2021, January, 2) Machine Learning Machine learning - Simple English Wikipedia, the free encyclopedia [5] Hội điện quang y học hạt nhân Việt Nam (2020, February, 26) Đặc điểm Xquang viêm phổi CORONA VIRUS https://www.radiology.com.vn/bai-giang/dac-diem-hinh-anh-xquangviem-phoi-do-corona-virus-n193.html [6] Nguyễn Thanh Tuấn “Deep Learning Cơ Bản” nttuan8.com, 2020 [7] The Difference Between AI, Machine Learning, and Deep Learning? | NVID (https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-intelligence-machine-learningdeep-learning-ai/, 2016)IA Blog [8] Yann LeCun, Léon Bottou, YoShua Bengio and Patrick Haffner (1998, November) "Gradient-Based Learning Applied to Document Recognition" http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf [9] Tô Đức Thắng (2020, January, 14) Giới thiệu mạng ResNET https://viblo.asia/p/gioithieu-mang-resnet-vyDZOa7R5wj [10] Vncoder RNN gì? https://sites.google.com/site/vncoder95/machine-learning/rnn-la-gi [11] PyCharm The Python IDE for Professional Developers https://www.jetbrains.com/pycharm/ [17] Wikipedia (2022, June, 30) Kaggle https://en.wikipedia.org/wiki/Kaggle [18] Google Colab Google Colab Trang | 50 S K L 0

Ngày đăng: 10/10/2023, 15:19

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN