Phương pháp nghiên cứuLuận văn này tập trung vào vấn đề tự động phát hiện tổn thương da và đưa ra chẩn đoán bệnh ung thư hắc tố da hay các loại bệnh về da liễu khác.Áp dụng thuật toán ph
Trang 1TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO THỰC TẬP
Tên đơn vị: Viện hàn lâm khoa học và công nghệ Việt
Nam Tên đề tài : Xây dựng hệ thống chẩn đoán bệnh
Ung thư hắc tố da bằng phương pháp học sâu
Trang 2CHƯƠNG I: GIỚI THIỆU VỀ CƠ SỞ THỰC TẬP 4
1.1 Cơ sở thực tập 4
1.1.1 Viện Hàn Lâm Khoa học và Công nghệ Việt Nam 4
1.1.2 Viện Công Nghệ Thông tin 5
1.2 Tóm lược quá trình hình thành phát triển 6
1.2.1 Quá trình thành lập 6
1.2.2 Chức năng, nhiệm vụ 7
1.2.3 Tiềm năng khoa học – công nghệ 7
1.3 Cơ cấu tổ chức Viện công nghệ thông tin 8
CHƯƠNG II: TỔNG QUAN VỀ BỆNH UNG THƯ HẮC TỐ DA MELANOMA 9
2.1 Giới thiệu chung về bệnh Melanoma 9
2.2 Nguyên nhân bệnh Melanoma 9
2.3 Triệu chứng bệnh Melanoma 10
2.4 Phương pháp chẩn đoán 12
2.4.1 Phương pháp soi da 12
2.4.2 Phương pháp xử lý hình ảnh da bị tổn thương 13
2.5 Mạng Nơ-ron tích chập 13
2.6 EfficientNet 14
2.7 Hàm kích hoạt Relu 17
2.8 Hàm Softmax 17
2.9 Hàm Sigmoid 18
2.10 Hàm Tanh 18
CHƯƠNG III XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN 20
3.1 Giới thiệu chung 20
3.2 Thực nghiệm 21
TÀI LIỆU THAM KHẢO 24
Trang 4DANH MỤC HÌNH ẢNH
Trang Hình 1.1 Ung thư hắc tố có màu sẫm lan trên bề mặt 10 Hình 1.2 Ung thư hắc tố có triệu chứng loét xùi lan trên bề mặt da 10
Hình 1.6 Ung thư hắc tố xuất hiện trên mi mắt 12 Hình 2.5 Một trình tự CNN để phân loại các chữ số viết tay 13
Hình 3.2.2 Thư mục chứa chương trình và dữ liệu 21
Hình 3.2.5 Thư mục chương trình sau khi hoàn tất 23
Trang 5MỞ ĐẦU
1 Lý do lựa chọn đề tài
Bệnh ngoài da là một trong những loại bệnh phổ biến nhất trên toàn thế giới, vượt qua cả số ca cảm lạnh và đau đầu 25% tất cả các phương pháp điều trị cho bệnh nhân trên toàn thế giới là nhằm mục đích điều trị các bệnh lý về da.
Ung thư da là một trong các ung thư thường gặp và khá dễ chẩn đoán.Ung thư da là các ung thư xuất phát từ biểu mô da che phủ mặt ngoài cơ thể,gồm nhiều lớp tế bào Lớp tế bào đáy sinh ra ung thư tế bào đáy, lớp tế bào vảysinh ra ung thư biểu mô vảy Các tuyến phụ thuộc của da như tuyến mồ hôi,tuyến bã sinh ra ung thư tuyến mồ hôi, tuyến bã…
Ung thư da hay gặp ở người da trắng, chủ yếu ở người già, nam nhiều hơn
nữ Bệnh thường xuất hiện ở vùng da hở với tỷ lệ 90% ở vùng đầu mặt cổ Tỉ lệmắc ung thư da ở Việt Nam vào khoảng 2,9-4,5/100.000 dân
Ung thư hắc tố da (Melanoma) là ung thư da ác tính nhất, phát triển từ các
tế bào sản xuất melanin (melanocytes) Ung thư hắc tố cũng có thể biểu hiện ở
vị trí ngoài da như mắt hoặc hiếm hơn là cơ quan nội tạng (ví dụ: ruột) Nguy
cơ mắc ung thư hắc tố da dường như đang gia tăng ở người dưới 40 tuổi, đặcbiệt là phụ nữ
Báo cáo thực tập này tập trung vào việc tìm hiểu bệnh ung thư hắc tố da,
áp dụng các thuật toán tối ưu để huấn luyện hệ thống chẩn đoán tổn thương da
có khả năng bị ung thư
2 Mục tiêu của đề tài
Giải quyết bài toán nhận dạng hình ảnh bằng mô hình mạng nơ-ron Xâydựng được hệ thống mạng nơ-ron phát hiện khả năng ung thư da dựa vào hìnhảnh
Ứng dụng nội dung được học trong quá trình đào tạo vào thực tiễn Tăngcường kiến thức về nhận dạng hình ảnh, cụ thể về mạng Nơ-ron truyền thống,Nơ-ron network, mạng Nơ-ron sâu tạo nền tảng cơ bản cho quá trình nghiên cứu
Trang 6- Nâng cao kỹ năng thực hành với ngôn ngữ lập trình python
- Tạo thói quen và rèn luyện kĩ năng đọc tài liệu khoa học, đặc biệt là tàiliệu tiếng anh
3 Nội dung nghiên cứu
a Đối tượng nghiên cứu
- Mô hình mạng nơ-ron tích chập Unet Mô hình mạng nơ-ron
EfficientNet dùng cho bài toán phân loại bệnh ung thư hắc tố da hay các loại bệnh khác
- Đánh giá hiệu suất của hai mô hình
4 Phương pháp nghiên cứu
Luận văn này tập trung vào vấn đề tự động phát hiện tổn thương da và đưa ra chẩn đoán bệnh ung thư hắc tố da hay các loại bệnh về da liễu khác
Áp dụng thuật toán phân loại từ hình ảnh da liễu bằng cách sử dụng mạngnơ-ron nhân tạo
Đối với vấn đề đầu tiên là xây dựng một mạng nơ-ron để xác định tríchxuất ra vùng da bị tổn thương
Đối với vấn đề thứ hai là xây dựng một mạng nơ-ron với vai trò là phânloại là vùng da bị tổn thương đó thuộc loại bệnh ung thư da hắc tố hay các loạibệnh da liễu khác
Phương pháp nghiên cứu xuyên suốt của luận văn là kết hợp nghiên cứu
lý thuyết, và đánh giá thông qua mô phỏng thực nghiệm Quá trình thực hiện
2
Trang 7bao gồm các bước: xây dựng mô hình, huấn luyện, đánh giá khả năng chẩn đoánung thư hắc tố da.
5 Kết quả đạt được (dự kiến)
6 Bố cục dự án
Chương I Giới thiệu về cơ sở thực tập
1.1 Cơ sở thực tập
1.2 Tóm lược quá trình hình thành và phát triển
1.3 Cơ cấu tổ chức Viện công nghệ thông tin
Chương II Tổng quan về bệnh ung thư hắc tố da Melanoma
2.1 Giới thiệu chung về bệnh Melanoma
2.2 Nguyên nhân bệnh Melanoma
Chương 3 Xây dựng hệ thống chuẩn đoán
3.1 Giới thiệu chung
3.2 Thực nghiệm
7 Tài liệu tham khảo
Trang 8CHƯƠNG I: GIỚI THIỆU VỀ CƠ SỞ THỰC TẬP
1.1 Cơ sở thực tập
1.1.1 Viện Hàn Lâm Khoa học và Công nghệ Việt Nam
Viện Hàn lâm Khoa học và Công nghệ Việt Nam có tên giao dịch quốc tếbằng tiếng Anh là: Vietnam Academy of Science and Technology, viết tắt làVAST Vào ngày 15/5/2017, Thủ tướng Chính phủ ký ban hành Nghị định số60/2017/NĐ-CP quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức củaViện Hàn lâm Khoa học và Công nghệ Việt Nam Theo đó, Viện Hàn lâm Khoahọc và Công nghệ Việt Nam là cơ quan thuộc Chính phủ, thực hiện chức năngnghiên cứu cơ bản về khoa học tự nhiên và phát triển công nghệ; cung cấp luận cứkhoa học cho công tác quản lý khoa học, công nghệ và xây dựng chính sách, chiếnlược, quy hoạch phát triển kinh tế, xã hội; đào tạo nhân lực khoa học, công nghệ
có trình độ cao theo quy định của pháp luật
Lãnh đạo Viện Hàn lâm Khoa học và Công nghệ Việt Nam gồm Chủ tịch và
ba Phó Chủ tịch Chủ tịch Viện Hàn lâm Khoa học và Công nghệ Việt Nam doThủ tướng Chính phủ bổ nhiệm và chịu trách nhiệm trước Chính phủ và Thủtướng Chính phủ về toàn bộ hoạt động của Viện Hàn lâm Khoa học và Công nghệViệt Nam
Trước năm 1970, Đảng và Nhà nước đã có chủ trương xây dựng một Trungtâm khoa học của cả nuớc và quyết định xây dựng Viện Khoa học Tự nhiên Ngaytrong thời gian kháng chiến chống Mỹ một số cơ sở nghiên cứu đã được tiến hànhthành lập như viện Toán học, viện Vật lý, viện Nghiên cứu biển Năm 1970 cácviện trên và nhiều đơn vị nghiên cứu khác được tập hợp lại thành Trung tâmnghiên cứu khoa học, thuộc Uỷ ban Khoa học và Kỹ thuật Nhà nước (nay là BộKhoa học và Công nghệ) Ngày 20 tháng 5 năm 1975 Hội đồng Chính phủ (nay làChính phủ) có nghị định số 118/CP thành lập Viện Khoa học Việt Nam trên cơ sởTrung tâm này
Viện Khoa học Việt Nam là cơ quan thuộc Hội đồng Chính phủ có nhiệmvụ: “Nghiên cứu các các vấn đề khoa học kỹ thuật có tầm quan trọng về mặt kinh
tế, những vấn đề tổng hợp liên quan đến nhiều ngành, những vấn đề phải tích luỹ
4
Trang 9số liệu trong nhiều năm để qua điều tra, khảo sát rút ra các quy luật nhằm gópphần giải quyết những nhiệm vụ kinh tế quan trọng lâu dài, những vấn đề khoahọc cơ bản để làm cơ sở cho việc phát triển nền khoa học của cả nước…”
Lãnh đạo Viện Hàn lâm Khoa học và Công nghệ Việt Nam qua các thời kỳ:
- Từ năm 1975 đến năm 1983, Viện trưởng là cố GS.VS Trần Đại Nghĩa
- Từ năm 1983 đến năm 1994, Viện trưởng là GS.VS Nguyễn Văn Hiệu
- Từ năm 1994 đến 2008, Chủ tịch Viện là GS.VS Đặng Vũ Minh
- Từ năm 2008 đến nay, Chủ tịch Viện là GS.VS.Châu Văn Minh
- Ban lãnh đạo:
Hình 1.1: Sơ đồ Ban lãnh đạo
Sơ đồ bộ máy quản lí:
Hình 1.2: Sơ đồ bộ máy quản lý
Trang 101.1.2 Viện Công Nghệ Thông tin
Viện Công Nghệ Thông Tin – Viện Hàn Lâm Khoa Học và Công Nghệ ViệtNam Viện Công nghệ thông tin (Viện CNTT) thuộc Viện Hàn lâm Khoa học vàCông nghệ Việt Nam (Viện HLKHCNVN) thành một Viện nghiên cứu khoa họccông nghệ hàng đầu của cả nước đạt trình độ tiên tiến trong khu vực trong lĩnhvực Công nghệ thông tin (CNTT) và Tự động hoá (TĐH), thực hiện nghiên cứu
cơ bản trong các hướng chính của Công nghệ thông tin và Tự động hoá, chú trọngđầu tư nghiên cứu phát triển, triển khai công nghệ mới và ứng dụng Xây dựng độingũ cán bộ có trình độ cao, cơ sở vật chất hiện đại, mở rộng hợp tác quốc tế nhằmđáp ứng nhu cầu phát triển khoa học công nghệ (KHCN) của đất nước
Nâng cao tiềm lực KHCN của Viện CNTT, từng bước tăng cường cơ sở vậtchất kĩ thuật, lực lượng cán bộ, xây dựng một số lĩnh vực và phòng thí nghiệmtrọng điểm đạt trình độ tiên tiến trong khu vực Hình thành đội ngũ cán bộ KHCNtrình độ cao, đủ sức nghiên cứu và giải quyết các nhiệm vụ KHCN trọng điểmquốc gia ở trình độ quốc tế, vận hành hiệu quả Phòng thí nghiệm trọng điểm(PTNTĐ) Công nghệ mạng và đa phương tiện
Viện CNTT đẩy mạnh công tác đào tạo và phát triển nhân lực trong lĩnhvực Công nghệ thông tin và Tự động hoá, nâng cao trình độ các cán bộ nghiêncứu, tiệm cận từng bước tới trình độ quốc tế, đủ năng lực giải quyết những vấn đềkhoa học công nghệ quan trọng của đất nước
1.2 Tóm lược quá trình hình thành phát triển
1.2.1 Quá trình thành lập
- Thành lập theo Quyết định số 246/CP ngày 27/12/1976 với tên Viện Khoa
học Tính toán và Điều khiển Năm 1989 đổi tên là Viện Tin học Các đơn vịtiền thân:
Phòng Máy tính thành lập năm 1968
Ban Điều khiển học thành lập năm 1973
6
Trang 11- Năm 1993 cùng với Trung tâm nghiên cứu hệ thống và quản lý, Trung tâm
toán ứng dụng và tin học (thành phố Hồ Chí Minh) hợp nhất thành ViệnCông nghệ Thông tin (CNTT)
- Giấy chứng nhận đăng ký hoạt động KHCN số 207, ngày 10/12/1993 của
Bộ Khoa học, Công nghệ và Môi trường
1.2.2 Chức năng, nhiệm vụ
- Nghiên cứu các vấn đề cơ bản của tin học, cơ sở toán học và kỹ thuật của
công nghệ thông tin (CNTT), ứng dụng CNTT trong các hệ thống kinh tế
-xã hội và trong tự động hóa sản xuất
- Thiết kế, chế tạo các sản phẩm của CNTT, đặc biệt là các sản phẩm phần
mềm
- Triển khai ứng dụng CNTT trong sản xuất đời sống, chuyển giao công nghệ
trong lĩnh vực CNTT, tư vấn kỹ thuật cho việc thực hiện một số dự án nhànước về ứng dụng CNTT trong quản lý, phát triển kinh tế và sản xuất
- Tư vấn kỹ thuật
- Đào tạo cán bộ nghiên cứu khoa học - công nghệ về CNTT
- Tổ chức hợp tác quốc tế trong lĩnh vực CNTT.
1.2.3 Tiềm năng khoa học – công nghệ
- Viện là đơn vị nghiên cứu, triển khai và ứng dụng công nghệ thông tin lớn
- Viện là đơn vị đào tạo tiến sĩ về công nghệ thông tin lớn nhất cả nước Viện
đã đào tạo hơn 50 tiến sĩ cho các trường Đại học, Viện nghiên cứu và Bộ
Trang 12ngành ở Việt Nam Hàng năm số nghiên cứu sinh của Viện thường xuyêntrên 30 người
- Viện là đơn vị chủ trì Tạp chí hàng đầu chuyên ngành “Tin học và điều
khiển học“
- Viện là đơn vị chủ trì Hội thảo quốc gia thường niên “ Những vấn đề chọn
lọc công nghệ thông tin và truyền thông “
- Viện đã được Chính phủ lựa chọn xây dựng và điều hành Phòng thí nghiệm
trọng điểm về Công nghệ mạng và Đa phương tiện
1.3 Cơ cấu tổ chức Viện công nghệ thông tin
Ban lãnh đạo đương nhiệm gồm
Viện trưởng: PGS.TS NCVC Nguyễn Trường Thắng
Phó Viện trưởng: PGS.TS NCVC Nguyễn Đức Dũng
PGS.TS NCVC Nguyễn Long Giang
TS NCVC Nguyễn Thu Anh
Hình 1.3: Cơ cấu tổ chức Viện Công nghệ thông tin
8
Trang 13CHƯƠNG II: TỔNG QUAN VỀ BỆNH UNG THƯ HẮC TỐ DA
MELANOMA
Trong các bệnh ung thư, ung thư hắc tố da (Melanoma) là căn bệnh kháphổ biến là ung thư da ác tính nhất vào năm 2022, ước tính có khoảng 99.780trường hợp ung thư hắc tố mới xảy ra ở Hoa Kỳ, gây ra ước tính 7.650 ca tửvong Ung thu hắc tố da phát triển từ các tế bào sản xuất melanin (melanocytes).Ung thư hắc tố cũng có thể biểu hiện ở vị trí ngoài da như mắt hoặc hiếm hơn là
cơ quan nội tạng (ví dụ: ruột) Nguy cơ mắc ung thư hắc tố da dường như đanggia tăng ở người dưới 40 tuổi, đặc biệt là phụ nữ
2.2 Nguyên nhân bệnh Melanoma
Nguyên nhân gây ung thư hắc tố da hiện chưa được sáng tỏ tuy nhiên tiếpxúc nhiều với tia UV từ ánh nắng mặt trời là yếu tố nguy cơ chính của bệnh
Ung thư hắc tố da xảy ra khi các tế bào sản xuất melanin – sắc tố da của
cơ thể bị phát triển quá mức không thể kìm hãm, dẫn đến hình thành khối u áctính Nguyên nhân là do các tổn thương DNA ở tế bào bình thường Tuy nhiêntại sao DNA bị tổn thương và dẫn tới hình thành các khối u vẫn chưa được biếtrõ
Các bác sỹ cho rằng tiếp xúc với tia UV là nguyên nhân hàng đầu gây ungthư hắc tố da Tia UV không phải là nguyên nhân gây tất cả các trường hợp ungthư hắc tố, đặc biệt ở các vị trí không tiếp xúc với ánh nắng mặt trời (kẽ taychân, gan bàn tay, bàn chân…) Điều đó chứng tỏ có nhiều yếu tố nguy cơ kháccủa ung thư hắc tố, bao gồm:
Da trắng: Có ít các sắc tố (melanin) trên da có nghĩa rằng bạn có ít khảnăng bảo vệ khỏi các bức xạ UV hơn Người tóc vàng, người dễ dàng có các tànnhang, rám nắng có nguy cơ phát triển ung thư hắc tố hơn người da đen
Tiền sử rám nắng: tăng nguy cơ ung thư hắc tố
Sống vùng gần xích đạo: có nguy cơ tiếp xúc trực tiếp với ánh nắng mặt
Trang 14Có nhiều nốt ruồi hoặc các nốt ruồi không bình thường: Có nhiều hơn 50nốt ruồi là yếu tố nguy cơ của ung thư hắc tố Tương tự, có nhiều các nốt ruồibất thường cũng là yếu tố nguy cơ của bệnh.
Tiền sử gia đình bị ung thư hắc tố: người có tiền sử gia đình mắc ung thưhắc tố, đặc biệt là người thân thế hệ 1 như bố mẹ, anh chị em có nguy cơ mắcbệnh cao hơn
Suy giảm hệ miễn dịch: người có hệ miễn dịch bị suy giảm có nguy cơ ung thư hắc tố da cao hơn
Các dấu hiệu ban đầu của ung thư hắc tố da:
Thay đổi trên nốt ruồi cũ: đột ngột thay đổi về hình dáng, kíchthước hay chảy máu, ngứa ngáy Nốt ruồi có viền không đều, nham nhở, bất đốixứng
Hình 2.1: Ung thư hắc tố có màu sẫm lan trên bề mặt
10
Trang 15Hình 2.2: Ung thư hắc tố có triệu chứng loét xùi lan trên bề mặt da
Xuất hiện nốt tăng sắc tố hoặc khác thường trên da
Đặc biệt: Ung thư hắc tố không phải luôn bắt đầu từ nốt ruồi có sẵn
mà có thể xảy ra ở các vị trí da bình thường khác Các nốt ruồi bất thường cóhình dạng bất đối xứng; Đường viền không đều, nham nhở có thể có khía; Thayđổi màu sắc; Đường kính lớn hơn 6 mm; Thay đổi: tăng kích thước, thay đổimàu sắc hình dạng theo thời gian, ngứa, loét, chảy máu…
Hình 2.3: Ung thư hắc tố lan rồng bề mặt
Hình 2.4: Nốt ruồi có màu sắc bất thường
Trang 16Ung thư hắc tố da có thể phát triển ở các vị trí kín đáo xảy ra đen có da tối màu Tổn thương phát triển ở móng tay, móng chân, gan bàn tay, gan bànchân.
Hình 2.5: Ung thư hắc tố xuất hiện ở móng
Ung thư hắc tố biểu hiện ở miệng, đường tiêu hóa, đường sinh dục tiết niệubệnh thường khó được phát hiện
Ung thư hắc tố biểu hiện ở mắt: thường xuất hiện nhiều nhất ở mi mắt,một số trường hợp xuất hiện ở lớp hắc mạc Người bệnh có thay đổi thị lực(nhìn mờ)
Hình 2.6: Ung thư hắc tố xuất hiện trên mi mắt
12
Trang 17ác tính Vì vậy, chúng ta có thể hoàn toàn tin tưởng phương pháp này, bởi vì nó
đã trải qua một quá trình nghiên cứu khoa học nghiêm ngặc trên nhiều trườnghợp bệnh
2.4.2 Phương pháp xử lý hình ảnh da bị tổn thương
Ngày nay, một số phương pháp về lĩnh vực xử lý ảnh đã được phát triểnbằng thuật toán hoặc hệ thống để phát hiện và phân loại các loại bệnh thông quahình ảnh da bị tổn thương
Trong báo cáo này sẽ chú trọng vào việc áp dụng thuật toán để trích xuấthình dạng của tổn thương da và sau đó trích xuất các đặc điểm quan tâm Pháttriển một hệ thống tương quan với các thuật toán để thực hiện chẩn đoán chínhxác
2.5 Mạng Nơ-ron tích chập
Mạng nơron tích chập (còn gọi là ConvNet/CNN) là một thuật toán họcsâu có thể lấy hình ảnh đầu vào, gán độ quan trọng (các trọng số và độ lệch cóthể học được) cho các đặc trưng/đối tượng khác nhau trong hình ảnh và có thểphân biệt được từng đặc trưng/đối tượng này với nhau Công việc tiền xử lýđược yêu cầu cho mạng nơron tích chập thì ít hơn nhiều so với các thuật toánphân loại khác Trong các phương thức sơ khai, các bộ lọc được thiết kế bằngtay (hand - engineered), với một quá trình huấn luyện để chọn ra các bộ lọc/đặctrưng phù hợp thì mạng nơron tích chập lại có khả năng tự học để chọn ra các bộlọc/đặc trưng tối ưu nhất