1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống chẩn đoán bệnh ung thư hắc tố da bằng phương pháp học sâu

30 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Phương pháp nghiên cứuLuận văn này tập trung vào vấn đề tự động phát hiện tổn thương da và đưa ra chẩn đoán bệnh ung thư hắc tố da hay các loại bệnh về da liễu khác.Áp dụng thuật toán ph

lOMoARcPSD|38837747 TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO THỰC TẬP Tên đơn vị: Viện hàn lâm khoa học và công nghệ Việt Nam Tên đề tài : Xây dựng hệ thống chẩn đoán bệnh Ung thư hắc tố da bằng phương pháp học sâu Sinh viên thực hiện : Đặng Hữu Trung Mã sinh viên :1911061392 Lớp : ĐH9C5 Khóa : 9 (2019-2023) Hệ : CHÍNH QUY Hà Nội, năm 2023 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 CHƯƠNG I: GIỚI THIỆU VỀ CƠ SỞ THỰC TẬP 4 1.1 Cơ sở thực tập 4 1.1.1 Viện Hàn Lâm Khoa học và Công nghệ Việt Nam .4 1.1.2 Viện Công Nghệ Thông tin 5 1.2 Tóm lược quá trình hình thành phát triển .6 1.2.1 Quá trình thành lập .6 1.2.2 Chức năng, nhiệm vụ 7 1.2.3 Tiềm năng khoa học – công nghệ 7 1.3 Cơ cấu tổ chức Viện công nghệ thông tin .8 CHƯƠNG II: TỔNG QUAN VỀ BỆNH UNG THƯ HẮC TỐ DA MELANOMA 9 2.1 Giới thiệu chung về bệnh Melanoma 9 2.2 Nguyên nhân bệnh Melanoma 9 2.3 Triệu chứng bệnh Melanoma 10 2.4 Phương pháp chẩn đoán .12 2.4.1 Phương pháp soi da .12 2.4.2 Phương pháp xử lý hình ảnh da bị tổn thương 13 2.5 Mạng Nơ-ron tích chập 13 2.6 EfficientNet 14 2.7 Hàm kích hoạt Relu 17 2.8 Hàm Softmax 17 2.9 Hàm Sigmoid 18 2.10 Hàm Tanh 18 CHƯƠNG III XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN .20 3.1 Giới thiệu chung 20 3.2 Thực nghiệm 21 TÀI LIỆU THAM KHẢO 24 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 DANH MỤC TỪ VIẾT TẮT STT Từ viết tắt Tiếng Anh Nghĩa của từ Tiếng Việt 1 CNN Convolutional Neural Mạng Nơ-ron tích chập Network 2 DNA Deoxyribonucleic Acid Phân tử mang thông tin di truyền 3 UV Ultraviolet Tia cực tím Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 DANH MỤC HÌNH ẢNH Hình 1.1 Ung thư hắc tố có màu sẫm lan trên bề mặt Trang Hình 1.2 Ung thư hắc tố có triệu chứng loét xùi lan trên bề mặt da 10 Hình 1.3 Ung thư hắc tố lan rồng bề mặt 10 Hình 1.4 Nốt ruồi có màu sắc bất thường 11 Hình 1.5 Ung thư hắc tố xuất hiện ở móng 11 Hình 1.6 Ung thư hắc tố xuất hiện trên mi mắt 11 Hình 2.5 Một trình tự CNN để phân loại các chữ số viết tay 12 Hình 3.2.1 Dữ liệu chương trình 13 Hình 3.2.2 Thư mục chứa chương trình và dữ liệu 21 Hình 3.2.3 Mã nguồn chương trình 21 Hình 3.2.4 Giao diện chương trình khởi chạy 22 Hình 3.2.5 Thư mục chương trình sau khi hoàn tất 23 23 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 MỞ ĐẦU 1 Lý do lựa chọn đề tài Bệnh ngoài da là một trong những loại bệnh phổ biến nhất trên toàn thế giới, vượt qua cả số ca cảm lạnh và đau đầu 25% tất cả các phương pháp điều trị cho bệnh nhân trên toàn thế giới là nhằm mục đích điều trị các bệnh lý về da Ung thư da là một trong các ung thư thường gặp và khá dễ chẩn đoán Ung thư da là các ung thư xuất phát từ biểu mô da che phủ mặt ngoài cơ thể, gồm nhiều lớp tế bào Lớp tế bào đáy sinh ra ung thư tế bào đáy, lớp tế bào vảy sinh ra ung thư biểu mô vảy Các tuyến phụ thuộc của da như tuyến mồ hôi, tuyến bã sinh ra ung thư tuyến mồ hôi, tuyến bã… Ung thư da hay gặp ở người da trắng, chủ yếu ở người già, nam nhiều hơn nữ Bệnh thường xuất hiện ở vùng da hở với tỷ lệ 90% ở vùng đầu mặt cổ Tỉ lệ mắc ung thư da ở Việt Nam vào khoảng 2,9-4,5/100.000 dân Ung thư hắc tố da (Melanoma) là ung thư da ác tính nhất, phát triển từ các tế bào sản xuất melanin (melanocytes) Ung thư hắc tố cũng có thể biểu hiện ở vị trí ngoài da như mắt hoặc hiếm hơn là cơ quan nội tạng (ví dụ: ruột) Nguy cơ mắc ung thư hắc tố da dường như đang gia tăng ở người dưới 40 tuổi, đặc biệt là phụ nữ Báo cáo thực tập này tập trung vào việc tìm hiểu bệnh ung thư hắc tố da, áp dụng các thuật toán tối ưu để huấn luyện hệ thống chẩn đoán tổn thương da có khả năng bị ung thư 2 Mục tiêu của đề tài Giải quyết bài toán nhận dạng hình ảnh bằng mô hình mạng nơ-ron Xây dựng được hệ thống mạng nơ-ron phát hiện khả năng ung thư da dựa vào hình ảnh Ứng dụng nội dung được học trong quá trình đào tạo vào thực tiễn Tăng cường kiến thức về nhận dạng hình ảnh, cụ thể về mạng Nơ-ron truyền thống, Nơ-ron network, mạng Nơ-ron sâu tạo nền tảng cơ bản cho quá trình nghiên cứu sau này 1 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 - Nâng cao kỹ năng thực hành với ngôn ngữ lập trình python - Tạo thói quen và rèn luyện kĩ năng đọc tài liệu khoa học, đặc biệt là tài liệu tiếng anh 3 Nội dung nghiên cứu a Đối tượng nghiên cứu - Mô hình mạng nơ-ron tích chập Unet Mô hình mạng nơ-ron EfficientNet dùng cho bài toán phân loại bệnh ung thư hắc tố da hay các loại bệnh khác - Đánh giá hiệu suất của hai mô hình b Phạm vi nghiên cứu - Nhận dạng hình ảnh tự nhiên - Phân tích, xử lý ảnh - Mạng Nơ-ron nhân tạo - Cơ sở dữ liệu 4 Phương pháp nghiên cứu Luận văn này tập trung vào vấn đề tự động phát hiện tổn thương da và đưa ra chẩn đoán bệnh ung thư hắc tố da hay các loại bệnh về da liễu khác Áp dụng thuật toán phân loại từ hình ảnh da liễu bằng cách sử dụng mạng nơ-ron nhân tạo Đối với vấn đề đầu tiên là xây dựng một mạng nơ-ron để xác định trích xuất ra vùng da bị tổn thương Đối với vấn đề thứ hai là xây dựng một mạng nơ-ron với vai trò là phân loại là vùng da bị tổn thương đó thuộc loại bệnh ung thư da hắc tố hay các loại bệnh da liễu khác Phương pháp nghiên cứu xuyên suốt của luận văn là kết hợp nghiên cứu lý thuyết, và đánh giá thông qua mô phỏng thực nghiệm Quá trình thực hiện 2 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 bao gồm các bước: xây dựng mô hình, huấn luyện, đánh giá khả năng chẩn đoán ung thư hắc tố da 5 Kết quả đạt được (dự kiến) 6 Bố cục dự án Chương I Giới thiệu về cơ sở thực tập 1.1 Cơ sở thực tập 1.2 Tóm lược quá trình hình thành và phát triển 1.3 Cơ cấu tổ chức Viện công nghệ thông tin Chương II Tổng quan về bệnh ung thư hắc tố da Melanoma 2.1 Giới thiệu chung về bệnh Melanoma 2.2 Nguyên nhân bệnh Melanoma 2.3 Triệu chứng bệnh Melanoma 2.4 Phương pháp chẩn đoán 2.5 Mạng Nơ-ron tích chập 2.6 EfficientNet 2.7 Hàm kích hoạt Relu 2.8 Hàm Softmax 2.9 Hàm Sigmoid 2.10 Hàm Tanh Chương 3 Xây dựng hệ thống chuẩn đoán 3.1 Giới thiệu chung 3.2 Thực nghiệm 7 Tài liệu tham khảo 3 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 CHƯƠNG I: GIỚI THIỆU VỀ CƠ SỞ THỰC TẬP 1.1 Cơ sở thực tập 1.1.1 Viện Hàn Lâm Khoa học và Công nghệ Việt Nam Viện Hàn lâm Khoa học và Công nghệ Việt Nam có tên giao dịch quốc tế bằng tiếng Anh là: Vietnam Academy of Science and Technology, viết tắt là VAST Vào ngày 15/5/2017, Thủ tướng Chính phủ ký ban hành Nghị định số 60/2017/NĐ-CP quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Viện Hàn lâm Khoa học và Công nghệ Việt Nam Theo đó, Viện Hàn lâm Khoa học và Công nghệ Việt Nam là cơ quan thuộc Chính phủ, thực hiện chức năng nghiên cứu cơ bản về khoa học tự nhiên và phát triển công nghệ; cung cấp luận cứ khoa học cho công tác quản lý khoa học, công nghệ và xây dựng chính sách, chiến lược, quy hoạch phát triển kinh tế, xã hội; đào tạo nhân lực khoa học, công nghệ có trình độ cao theo quy định của pháp luật Lãnh đạo Viện Hàn lâm Khoa học và Công nghệ Việt Nam gồm Chủ tịch và ba Phó Chủ tịch Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam do Thủ tướng Chính phủ bổ nhiệm và chịu trách nhiệm trước Chính phủ và Thủ tướng Chính phủ về toàn bộ hoạt động của Viện Hàn lâm Khoa học và Công nghệ Việt Nam Trước năm 1970, Đảng và Nhà nước đã có chủ trương xây dựng một Trung tâm khoa học của cả nuớc và quyết định xây dựng Viện Khoa học Tự nhiên Ngay trong thời gian kháng chiến chống Mỹ một số cơ sở nghiên cứu đã được tiến hành thành lập như viện Toán học, viện Vật lý, viện Nghiên cứu biển Năm 1970 các viện trên và nhiều đơn vị nghiên cứu khác được tập hợp lại thành Trung tâm nghiên cứu khoa học, thuộc Uỷ ban Khoa học và Kỹ thuật Nhà nước (nay là Bộ Khoa học và Công nghệ) Ngày 20 tháng 5 năm 1975 Hội đồng Chính phủ (nay là Chính phủ) có nghị định số 118/CP thành lập Viện Khoa học Việt Nam trên cơ sở Trung tâm này Viện Khoa học Việt Nam là cơ quan thuộc Hội đồng Chính phủ có nhiệm vụ: “Nghiên cứu các các vấn đề khoa học kỹ thuật có tầm quan trọng về mặt kinh tế, những vấn đề tổng hợp liên quan đến nhiều ngành, những vấn đề phải tích luỹ 4 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 số liệu trong nhiều năm để qua điều tra, khảo sát rút ra các quy luật nhằm góp phần giải quyết những nhiệm vụ kinh tế quan trọng lâu dài, những vấn đề khoa học cơ bản để làm cơ sở cho việc phát triển nền khoa học của cả nước…” Lãnh đạo Viện Hàn lâm Khoa học và Công nghệ Việt Nam qua các thời kỳ: - Từ năm 1975 đến năm 1983, Viện trưởng là cố GS.VS Trần Đại Nghĩa - Từ năm 1983 đến năm 1994, Viện trưởng là GS.VS Nguyễn Văn Hiệu - Từ năm 1994 đến 2008, Chủ tịch Viện là GS.VS Đặng Vũ Minh - Từ năm 2008 đến nay, Chủ tịch Viện là GS.VS.Châu Văn Minh - Ban lãnh đạo: Hình 1.1: Sơ đồ Ban lãnh đạo Sơ đồ bộ máy quản lí: Hình 1.2: Sơ đồ bộ máy quản lý 5 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 1.1.2 Viện Công Nghệ Thông tin Viện Công Nghệ Thông Tin – Viện Hàn Lâm Khoa Học và Công Nghệ Việt Nam Viện Công nghệ thông tin (Viện CNTT) thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Viện HLKHCNVN) thành một Viện nghiên cứu khoa học công nghệ hàng đầu của cả nước đạt trình độ tiên tiến trong khu vực trong lĩnh vực Công nghệ thông tin (CNTT) và Tự động hoá (TĐH), thực hiện nghiên cứu cơ bản trong các hướng chính của Công nghệ thông tin và Tự động hoá, chú trọng đầu tư nghiên cứu phát triển, triển khai công nghệ mới và ứng dụng Xây dựng đội ngũ cán bộ có trình độ cao, cơ sở vật chất hiện đại, mở rộng hợp tác quốc tế nhằm đáp ứng nhu cầu phát triển khoa học công nghệ (KHCN) của đất nước Nâng cao tiềm lực KHCN của Viện CNTT, từng bước tăng cường cơ sở vật chất kĩ thuật, lực lượng cán bộ, xây dựng một số lĩnh vực và phòng thí nghiệm trọng điểm đạt trình độ tiên tiến trong khu vực Hình thành đội ngũ cán bộ KHCN trình độ cao, đủ sức nghiên cứu và giải quyết các nhiệm vụ KHCN trọng điểm quốc gia ở trình độ quốc tế, vận hành hiệu quả Phòng thí nghiệm trọng điểm (PTNTĐ) Công nghệ mạng và đa phương tiện Viện CNTT đẩy mạnh công tác đào tạo và phát triển nhân lực trong lĩnh vực Công nghệ thông tin và Tự động hoá, nâng cao trình độ các cán bộ nghiên cứu, tiệm cận từng bước tới trình độ quốc tế, đủ năng lực giải quyết những vấn đề khoa học công nghệ quan trọng của đất nước 1.2 Tóm lược quá trình hình thành phát triển 1.2.1 Quá trình thành lập - Thành lập theo Quyết định số 246/CP ngày 27/12/1976 với tên Viện Khoa học Tính toán và Điều khiển Năm 1989 đổi tên là Viện Tin học Các đơn vị tiền thân:  Phòng Máy tính thành lập năm 1968  Ban Điều khiển học thành lập năm 1973 6 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 Ung thư hắc tố da có thể phát triển ở các vị trí kín đáo xảy ra đen có da tối màu Tổn thương phát triển ở móng tay, móng chân, gan bàn tay, gan bàn chân Hình 2.5: Ung thư hắc tố xuất hiện ở móng Ung thư hắc tố biểu hiện ở miệng, đường tiêu hóa, đường sinh dục tiết niệu bệnh thường khó được phát hiện Ung thư hắc tố biểu hiện ở mắt: thường xuất hiện nhiều nhất ở mi mắt, một số trường hợp xuất hiện ở lớp hắc mạc Người bệnh có thay đổi thị lực (nhìn mờ) Hình 2.6: Ung thư hắc tố xuất hiện trên mi mắt 2.4 Phương pháp chẩn đoán 2.4.1 Phương pháp soi da Phương pháp soi da đã được biết đến từ thế kỷ 17 Nhưng chỉ được tập trung nghiên cứu trong vòng 40 năm trở lại đây chủ yếu tại Graz (Cộng hòa Áo) và được ứng dụng để tăng độ chính xác của chuẩn đóan ung thư da bằng cách phân loại cấu trúc nốt ruồi So sánh kết quả của kiểm tra sinh thiết và phương pháp soi da, thấy rằng phương pháp soi da có thể áp dụng để nhận dạng khối u 12 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 ác tính Vì vậy, chúng ta có thể hoàn toàn tin tưởng phương pháp này, bởi vì nó đã trải qua một quá trình nghiên cứu khoa học nghiêm ngặc trên nhiều trường hợp bệnh 2.4.2 Phương pháp xử lý hình ảnh da bị tổn thương Ngày nay, một số phương pháp về lĩnh vực xử lý ảnh đã được phát triển bằng thuật toán hoặc hệ thống để phát hiện và phân loại các loại bệnh thông qua hình ảnh da bị tổn thương Trong báo cáo này sẽ chú trọng vào việc áp dụng thuật toán để trích xuất hình dạng của tổn thương da và sau đó trích xuất các đặc điểm quan tâm Phát triển một hệ thống tương quan với các thuật toán để thực hiện chẩn đoán chính xác 2.5 Mạng Nơ-ron tích chập Mạng nơron tích chập (còn gọi là ConvNet/CNN) là một thuật toán học sâu có thể lấy hình ảnh đầu vào, gán độ quan trọng (các trọng số và độ lệch có thể học được) cho các đặc trưng/đối tượng khác nhau trong hình ảnh và có thể phân biệt được từng đặc trưng/đối tượng này với nhau Công việc tiền xử lý được yêu cầu cho mạng nơron tích chập thì ít hơn nhiều so với các thuật toán phân loại khác Trong các phương thức sơ khai, các bộ lọc được thiết kế bằng tay (hand - engineered), với một quá trình huấn luyện để chọn ra các bộ lọc/đặc trưng phù hợp thì mạng nơron tích chập lại có khả năng tự học để chọn ra các bộ lọc/đặc trưng tối ưu nhất 13 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747 Hình 2.7: Một trình tự CNN để phân loại các chữ số viết tay 2.6 EfficientNet EfficientNet là một kiến trúc mạng neural convolutional (CNN) được phát triển bởi các nhà nghiên cứu tại Google Brain vào năm 2019 Kiến trúc này được thiết kế để đạt được hiệu suất tốt nhất với số lượng tham số ít nhất có thể EfficientNet sử dụng một kỹ thuật gọi là "compound scaling" để tăng cường hiệu suất mô hình Kỹ thuật này kết hợp việc tăng kích thước mô hình (chiều rộng, chiều cao và độ sâu) cùng lúc với việc tăng độ phân giải của ảnh đầu vào Điều này giúp mô hình có thể học được các đặc trưng phức tạp hơn và đạt được độ chính xác cao hơn trên các tập dữ liệu lớn Tuy nhiên, việc tăng kích thước mô hình cũng dẫn đến tăng số lượng tham số và tính toán, do đó, EfficientNet sử dụng các kỹ thuật như Depthwise Separable Convolution và Swish Activation để giảm số lượng tham số và tăng tốc độ tính toán EfficientNet đã đạt được kết quả tốt nhất trên nhiều bài toán trong lĩnh vực thị giác máy tính, bao gồm ImageNet, CIFAR-10 và CIFAR-100 Nó cũng đã được sử dụng trong nhiều ứng dụng thực tế như nhận dạng khuôn mặt, phân loại ảnh y tế và phát hiện vật thể  EfficientNetB0 Hình 2.8: EfficientNetB0 14 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747  EfficientNetB1 Hình 2.9: EfficientNetB1  EfficientNetB2 Hình 2.10: EfficientNetB2  EfficientNetB3 Hình 2.11: EfficientNetB3 15 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com) lOMoARcPSD|38837747  EfficientNetB4 Hình 2.12: EfficientNetB4  EfficientNetB5 Hình 2.13: EfficientNetB5  EfficientNetB6 Hình 2.14: EfficientNetB6 16 Downloaded by Yen Nguyen (nguyenyen.11@gmail.com)

Ngày đăng: 13/03/2024, 16:28

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w