Báo cáo học phần đồ án chuyên ngành đề tài phân loại tổn thương da bằng cnn

69 0 0
Báo cáo học phần đồ án chuyên ngành đề tài phân loại tổn thương da bằng cnn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trang 2 LỜI CẢM ƠNChúng em xin cảm ơn các thầy cô, bạn bè đã hỗ trợ và giúp đỡ chúngem trong quá trình thực hiện bài tập lớn về chủ đề ‘Phân loại tổn thương dabằng mạng CNN’.Việc áp dụng

lOMoARcPSD|39269578 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO HỌC PHẦN ĐỒ ÁN CHUYÊN NGÀNH ĐỀ TÀI PHÂN LOẠI TỔN THƯƠNG DA BẰNG CNN Giảng viên hướng dẫn: ThS Ngô Thị Thanh Hòa 2020601151 Nhóm thực hiện: Nhóm 4 2020603068 Lớp: 2020600842 Thành viên: 20231IT6052001 Nguyễn Tuấn Anh Nguyễn Thị Huyền Trịnh Đức Nhân Hà nội, Năm 2023 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 LỜI CẢM ƠN Chúng em xin cảm ơn các thầy cô, bạn bè đã hỗ trợ và giúp đỡ chúng em trong quá trình thực hiện bài tập lớn về chủ đề ‘Phân loại tổn thương da bằng mạng CNN’ Việc áp dụng các kĩ thuật nhận dạng và xử lý ảnh trong đời sống là vô cùng quan trọng, qua đó đã giúp chúng ta thực hiện được những công việc cần đến độ chính xác cao với thời gian ngắn một cách dễ dàng chẳng hạn như nhận diện khuôn mặt, vân tay, biển số xe, phát hiện vật thể… Qua môn học này, chúng em đã có cơ hội học hỏi không chỉ về lý thuyết mà còn về kỹ năng thực hiện dự án thực tế Môn học đã trau dồi thêm cho chúng em những kiến thức về xử lý ảnh, deep learning đồng thời giúp chúng em phát triển kỹ năng làm việc nhóm, giải quyết vấn đề, và hiểu rõ hơn về quá trình nghiên cứu khoa học Chúng em xin gửi lời cảm ơn chân thành đối với sự hướng dẫn tận tâm của ThS Ngô Thị Thanh Hòa trong suốt quá trình học và thực hiện đồ án, những kiến thức và kỹ năng thu được từ môn học này sẽ là nền tảng quan trọng cho sự phát triển của chúng em trong lĩnh vực của mình Chúng em mong rằng sẽ có cơ hội được học hỏi thêm nhiều từ cô trong những môn học sắp tới Trong quá trình làm đồ án chúng em đã nỗ lực, cố gắng để làm sao có thể hoàn thành một cách tốt nhất, tuy nhiên vẫn còn tồn tại những hạn chế Chúng em rất mong nhận được sự đóng góp ý kiến của cô để có thể hoàn thiện hơn Nhóm sinh viên thực hiện Nguyễn Tuấn Anh Trịnh Đức Nhân Nguyễn Thị Huyền 2 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 LỜI MỞ ĐẦU Báo cáo này tập trung vào phân loại tổn thương da bằng mạng nơ-ron tích chập (CNN) Tổn thương da là vấn đề y tế quan trọng và phức tạp, ảnh hưởng đến sức khỏe và chất lượng cuộc sống của con người Việc phân loại tổn thương da một cách chính xác và nhanh chóng có thể đóng vai trò quan trọng trong chẩn đoán và điều trị hiệu quả Trong báo cáo này, chúng em giới thiệu phương pháp phân loại tổn thương da sử dụng mạng nơ-ron tích chập CNN là một thuật toán học sâu mạnh mẽ trong lĩnh vực thị giác máy tính, đã đạt được những thành tựu đáng kể trong việc xử lý ảnh và nhận dạng đối tượng Chúng em sử dụng CNN để học các đặc trưng của tổn thương da từ tập dữ liệu đã được gán nhãn Báo cáo này được chia thành các phần chính sau:  Tổng quan về đề tài và cơ sở lý thuyết: Giới thiệu và trình bày lý do chọn đề tài, trình bày một số kiến thức cơ bản về trí tuệ nhân tạo, tổng quan về ảnh và một số kỹ thuật xử lý ảnh, trích chọn đặc trưng ảnh và giới thiệu một số kỹ thuật học máy  Kỹ thuật học sâu CNN trong chẩn đoán bệnh: Trình bày về kiến trúc và hoạt động của mạng nơ-ron tích chập, đặc biệt là các lớp tích chập, lớp pooling và lớp kết nối đầy đủ Giải thích cách CNN có thể học và trích xuất các đặc trưng hữu ích từ ảnh tổn thương da  Thực nghiệm, kết quả nghiên cứu: Mô tả quá trình xây dựng mô hình phân loại tổn thương da bằng CNN, bao gồm việc chuẩn bị dữ liệu, tiền xử lý và tạo mô hình CNN Trình bày phương pháp đánh giá mô hình và kết quả phân loại tổn thương da So sánh kết quả của mô hình với các phương pháp khác có sẵn để đánh giá hiệu suất của CNN trong việc phân loại tổn thương da  Kiểm thử chương trình: Khái quát về kiểm thử, mô tả quá trình kiểm tra và đánh giá chương trình phân loại tổn thương da được phát triển Kết quả kiểm thử và các thử nghiệm khác nhau sẽ được trình bày, đảm bảo tính tin cậy và hiệu quả của chương trình 3 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578  Kết luận: Tổng kết những kết quả và nhận xét quan trọng từ báo cáo, đồng thời đề xuất hướng phát triển tiếp theo trong lĩnh vực này Hy vọng rằng báo cáo này sẽ cung cấp cái nhìn tổng quan về việc sử dụng mạng nơ-ron tích chập trong phân loại tổn thương da và cung cấp một cơ sở để nghiên cứu và ứng dụng trong tương lai 4 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 MỤC LỤC LỜI MỞ ĐẦU 3 CHƯƠNG I TỔNG QUAN VỀ ĐỀ TÀI VÀ CƠ SỞ LÝ THUYẾT 10 1.1 Giới thiệu về lý do chọn đề tài 10 1.2 Tổng quan về trí tuệ nhân tạo (Artificial intelligence) 11 1.3 Tổng quan về ảnh và một số kỹ thuật xử lý ảnh 11 1.3.1 Tổng quan về ảnh 11 1.3.1.1 Một số khái niệm cơ bản 11 1.3.1.2 Một số dạng ảnh 13 1.3.2 Một số kỹ thuật xử lý ảnh 13 1.3.2.1 Lược đồ ảnh (Histogram) 13 1.3.2.2 Nhị phân hóa ảnh 14 1.4 Trích chọn và biểu diễn đặc trưng hình ảnh 14 1.4.1 Đặc trưng ảnh 14 1.4.1.1 Đặc trưng màu sắc 14 1.4.1.2 Đặc trưng kết cấu 14 1.4.1.3 Đặc trưng hình dạng 15 1.4.2 Một số phương pháp trích chọn đặc trưng đơn giản 15 1.4.2.1 Trích chọn đặc trưng ảnh dựa trên màu sắc 15 1.4.2.2 Trích chọn đặc trưng ảnh dựa trên kết cấu 15 1.4.2.3 Trích chọn đặc trưng ảnh dựa trên hình dạng 17 1.5 Các kỹ thuật học máy 17 1.5.1 Tổng quan về học máy 18 1.5.2 Linear Regression 18 1.5.3 Logistic Regression 20 1.5.4 Mạng neural nhân tạo .21 1.5.5 Mạng neural sâu 23 5 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 CHƯƠNG 2 KỸ THUẬT HỌC SÂU CNN TRONG CHẨN ĐOÁN BỆNH24 2.1 Giới thiệu về bộ dữ liệu 24 2.2 Mạng neural học sâu sử dụng trong nhận dạng 26 2.2.1 Giới thiệu về mô hình CNN 26 2.2.2 Cấu trúc mô hình CNN 27 2.2.2.1 Lớp tích chập 27 2.2.2.2 Hàm kích hoạt ReLU 27 2.2.2.3 Lớp Pooling .28 2.2.2.4 Lớp Fully Connected 28 2.3 Môi trường thực nghiệm và cài đặt các thư viện 29 2.3.1 Giới thiệu về môi trường colab 29 2.3.2 Các thư viện được sử dụng 30 CHƯƠNG 3 THỰC NGHIỆM, KẾT QUẢ NGHIÊN CỨU 32 3.1 Làm sạch dữ liệu 32 3.2 Phân tích dữ liệu 34 3.2.1.Trực quan hóa sự phân bố của 7 loại tổn thương da khác nhau .35 3.2.2 Trực quan hóa sự phân bổ của 4 loại xác thực kỹ thuật khác nhau (dx_type) 36 3.2.3 Trực quan hóa sự phân bố của những vị trí tổn thương da khác nhau (localization) 37 3.2.4 Trực quan hóa sự phân bố tuổi (age) 37 3.2.5 Trực quan hóa sự phân bố giới tính (sex) 38 3.3 Xử lý ảnh 38 3.3.1 Thay đổi kích thước hình ảnh 38 3.3.2 Một vài mẫu theo từng loại tổn thương da: 40 3.4 Mã hóa one–hot Encoding 41 3.4.1 Tách Features và Target 41 6 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 3.4.2 Target One-Hot Encoding 42 3.5 Tạo các lớp và định nghĩa các hàm .43 3.5.1 Tạo lớp ‘TimeHistory(Callback)’ để theo dõi quá trình training của model 43 3.5.2 Hàm tính RMSE .43 3.5.3 Hàm tính toán độ chính xác, mất mát của tập dữ liệu training, validation 44 3.5.4 Hàm tính toán độ chính xác, mất mát của tập dữ liệu testing 46 3.5.5 Hàm tính toán lớp thực tế và lớp dự đoán 47 3.5.6 Hàm trả về báo cáo các lớp phân loại 48 3.6 Huấn luyện mô hình và so sánh kết quả giữa các thuật toán 50 3.6.1 Huấn luyện mô hình: 50 3.6.2 So sánh kết quả giữa các mô hình 52 3.6.3 Một số kết quả trên tập data test 53 3.7 Kiến trúc mạng và tham số thực hiện 55 CHƯƠNG 4: KIỂM THỬ CHƯƠNG TRÌNH 59 4.1 Khái niệm về kiểm thử 59 4.2 Các loại kiểm thử và mức độ kiểm thử 59 4.2.1 Các loại kiểm thử 59 4.2.2 Mức độ kiểm thử 59 4.2.3 Phương pháp kiểm thử thực hiện 61 4.3 Thực hiện kiểm thử 61 KẾT LUẬN 67 TÀI LIỆU THAM KHẢO 69 7 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 DANH MỤC HÌNH ẢNH Hình 1.1 Ảnh ký tự chữ A và ma trận số của vùng chọn 12 Hình 1.2 Ma trận số biểu thị mức xám của các điểm ảnh 12 Hình 2.1 Một số ví dụ trong bộ dữ liệu 25 Hình 2.2 Các file dữ liệu 26 Hình 2.3 Một số bản ghi trong file ‘HAM10000_metadata.csv’ 26 Hình 2.4 Kiến trúc mạng CNN 27 Hình 2.5 Ví dụ về lớp tích chập 27 Hình 2.6 Rectified Linear Unit 28 Hình 2.7 Ví dụ về lớp Pooling 28 Hình 2.8 Lớp Fully Connected 29 Hình 3.1 Đọc bộ dữ liệu 32 Hình 3.2 Làm sạch dữ liệu 32 Hình 3.3 Kết quả làm sạch dữ liệu 33 Hình 3.4 Hiển thị giá trị còn thiếu 33 Hình 3.5 Kiểm tra những giá trị còn thiếu .34 Hình 3.6 Biểu đồ phân bố các loại tổn thương trong bộ dữ liệu 35 Hình 3.7 Số lượng từng loại tổn thương 36 Hình 3.8 Biểu đồ phân bố kỹ thuật chẩn đoán .36 Hình 3.9 Biểu đồ phân bố vị trí tổn thương 37 Hình 3.10 Biểu đồ phân bố độ tuổi mắc bệnh 37 Hình 3.11 Biểu đồ phân bố giới tính 38 Hình 3.12 Giảm kích thước ảnh .39 Hình 3.13 Data Frame sau khi thay đổi kích thước ảnh 39 Hình 3.14 Kiểm tra phân bố kích thước ảnh 40 Hình 3.15 Tạo biểu đồ chứa một số mẫu .40 8 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 Hình 3.16 Một vài mẫu tổn thương da 41 Hình 3.17 Target One-Hot Encoding 42 Hình 3.18 Tạo lớp 'TimeHistory' 43 Hình 3.19 Hàm tính RMSE 43 Hình 3.20 Công thức tính RMSE 44 Hình 3.21 Công thức tính MSE 44 Hình 3.22 Công thức tính MAPE 44 Hình 3.23 Kết quả hiệu suất mô hình trên tập dữ liệu 46 Hình 3.24 Kết quả tính toán độ chính xác, mất mát của tập test 47 Hình 3.25 Confusion matrix của nhãn dự đoán và nhãn thực tế 48 Hình 3.26 Độ chính xác của các nhãn phân loại 48 Hình 3.27 Kết quả phân loại 49 Hình 3.28 Một đoạn huấn luyện mô hình 51 Hình 3.29 Kết quả training .52 Hình 3.30 Dựa vào tập training và validation 52 Hình 3.31 Dựa vào tập testing 53 Hình 3.32 Sample 1 - Sample 3 54 Hình 3.33 Sample 8 - Sample 5 54 Hình 3.34 Sample 28 - Sample 35 55 Hình 4.1 Các mức độ kiểm thử 61 Hình 4.2 Kết quả kiểm thử .66 9 Downloaded by SAU SAU (saudinh1@gmail.com) lOMoARcPSD|39269578 CHƯƠNG I TỔNG QUAN VỀ ĐỀ TÀI VÀ CƠ SỞ LÝ THUYẾT 1.1 Giới thiệu về lý do chọn đề tài Ung thư da là một trong những vấn đề sức khỏe nghiêm trọng trên toàn cầu, và việc phát hiện sớm ung thư da đóng vai trò quan trọng trong việc cải thiện tỷ lệ sống sót và kết quả điều trị Trong nỗ lực này, mô hình Convolutional Neural Network (CNN) đã được chứng minh là một công cụ mạnh mẽ và hiệu quả trong phát hiện ung thư da từ dữ liệu hình ảnh CNN có khả năng tự động học các đặc trưng và mô hình hoá thông qua quá trình huấn luyện trên dữ liệu Điều này cho phép nó tìm ra các mẫu và đặc trưng phức tạp trong ảnh da liễu mà có thể không dễ dàng nhận thấy bằng mắt thường Điểm mạnh này giúp CNN phân loại các ảnh da liễu một cách chính xác và hiệu quả, đồng thời giảm thiểu sự phụ thuộc vào kỹ thuật viên hoặc chuyên gia y tế Ung thư da thường được chẩn đoán dựa trên việc phân tích các biểu hiện hình ảnh trên da như màu sắc, hình dạng và kích thước của nốt ruồi hay khối u CNN có thể xử lý dữ liệu không gian này một cách hiệu quả bằng cách sử dụng các lớp tích chập để trích xuất các đặc trưng từ ảnh Điều này giúp nâng cao khả năng phát hiện các biểu hiện và đặc trưng quan trọng của ung thư da Hiệu suất tính toán và tốc độ xử lý được triển khai trên các hệ thống tính toán hiệu suất cao, cho phép xử lý nhanh chóng và chính xác hàng ngàn hoặc thậm chí hàng triệu ảnh da liễu trong việc xử lý lượng lớn dữ liệu hình ảnh và giảm thời gian đáng kể trong quá trình chẩn đoán và đánh giá ung thư da Phương pháp phát hiện ung thư da bằng CNN có tiềm năng ứng dụng rộng rãi trong thực tế Nó có thể được tích hợp vào các hệ thống y tế thông minh, ứng dụng di động hoặc thiết bị y tế di động để cung cấp hỗ trợ chẩn đoán và theo dõi từ xa cho bệnh nhân Việc phát hiện ung thư da sớm và xác định các vùng da đáng ngờ có thể giúp giảm tải cho hệ thống y tế và tăng cường khả năng chăm sóc sức khỏe cộng đồng 10 Downloaded by SAU SAU (saudinh1@gmail.com)

Ngày đăng: 22/03/2024, 22:36