1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đồ án tốt nghiệp Công nghệ kỹ thuật điện tử, viễn thông: Phân loại ảnh ung thư vú từ xa sử dụng mạng học

77 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 4,09 MB

Nội dung

Hệ thống này sử dụng mô hình mạng nơ-ron tích chập EfficientNet-B0 được huấn luyện trên tập dữ liệu ảnh X-quang vú MINI-DDSM.. Mục tiêu Đề tài "Phân loại ảnh ung thư vú từ xa sử dụng mạ

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

THÀNH PHỐ HỒ CHÍ MINH

ĐỒ ÁN TỐT NGHIỆP NGÀNH CÔNG NGHỆ KỸ THUẬT ĐIỆN TỬ, VIỄN THÔNG

GVHD: NGUYỄN THANH HẢI SVTH: NGUYỄN THÀNH TRUNG

TRẦN QUỐC TUẤNPHÂN LOẠI ẢNH UNG THƯ VÚ TỪ XA

SỬ DỤNG MẠNG HỌC SÂU

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH

KHOA ĐIỆN – ĐIỆN TỬ

TP Hồ Chí Minh, tháng 7 năm 2024

Trang 3

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP HỒ CHÍ MINH

KHOA ĐIỆN – ĐIỆN TỬ

TP Hồ Chí Minh, tháng 7 năm 2024

Trang 4

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

Tp Hồ Chí Minh, ngày 21 tháng 6 năm 2024

NHIỆM VỤ KHÓA LUẬN TỐT NGHIỆP

Họ và tên sinh viên: Nguyễn Thành Trung MSSV: 19161184

Trần Quốc Tuấn MSSV: 20161277 Ngành: Công nghệ kỹ thuật Điện tử - Viễn thông

Giáo viên hướng dẫn: PGS.TS Nguyễn Thanh Hải

Ngày nhận đề tài: 27-2-2024 Ngày nộp đề tài: 20-6-2024

1 Tên Đề Tài: Phân loại ảnh ung thư vú từ xa sử dụng mạng học sâu

2 Các số liệu ban đầu:

- Tệp dữ liệu Mini-DDSM

- Các mô hình phân loại: VGG-16, EfficientNet-B0, DenseNet

- Phương pháp đánh giá: Recall, Precision, F1-Score

- Ngôn ngữ lập trình sử dụng: HTML, CSS, Python

- Các framework được sử dụng: Pytorch, Flask

3 Nội dung thực hiện đề tài:

- Tìm kiếm và sàng lọc tập ảnh để sử dụng cho quá trình huấn luyện và thử

nghiệm hệ thống

- Nghiên cứu về nguyên lý của trí tuệ nhân tạo và mạng học sâu

- Tìm hiểu và nắm vững quá trình huấn luyện mạng học sâu

- Thực hiện quá trình huấn luyện và điều chỉnh mạng học sâu trên tập ảnh đã

chuẩn bị

- Lập trình để thiết kế web chuẩn đoán hình ảnh

- Hoàn thiện trang web để người dùng có thể gửi ảnh từ xa

- Viết báo cáo

- Bảo vệ luận văn

TRƯỞNG NGÀNH GIÁO VIÊN HƯỚNG DẪN

Trang 5

PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN

Họ và tên sinh viên: Nguyễn Thành Trung MSSV: 19161184

Trần Quốc Tuấn MSSV: 20161277 Ngành: Công nghệ kỹ thuật Điện tử - Viễn Thông (CLC)

Tên đề tài: Phân loại ảnh ung thư vú từ xa sử dụng mạng học sâu

Họ và tên Giáo viên hướng dẫn: PGS TS Nguyễn Thanh Hải

Nhận xét

1 Về nội dung đề tài & khối lượng thực hiện:

Đề tài phát triển một hệ thống tự động phân loại ảnh chụp X-quang vú thành ba trường

hợp của bệnh ung thư vú là Normal, Benign, Cancer Đề tài có nội dung phù hợp với

thực tế và có thể áp dụng vào thực tiễn trong tương lai

2 Ưu điểm:

Mô hình hệ thống hoạt động tốt, chẩn đoán nhanh và chính xác, có khả năng phát

hiện sớm các dấu hiệu của ung thư vú từ đó giúp giảm tải khối lượng công việc và hỗ

trợ bác sĩ trong quá trình chẩn đoán Với những ưu điểm nổi bật trên, hệ thống sẽ góp

phần nâng cao chất lượng chăm sóc sức khỏe và giúp giảm thiểu tỷ lệ tử vong do mắc

phải bệnh ung thư vú

3 Khuyết điểm:

Chất lượng và độ chính xác của hệ thống phụ thuộc rất nhiều vào dữ liệu huấn luyện

Việc huấn luyện và vận hành các mô hình mạng học sâu luôn đòi hỏi tài nguyên tính

toán mạnh mẽ, bao gồm phần cứng GPU và dung lượng lưu trữ lớn

4 Đề nghị cho bảo vệ hay không:

5 Đánh giá loại:

6 Điểm: ……….(Bằng chữ: )

Tp Hồ Chí Minh, ngày 21 tháng 6 năm 2024

Giáo viên hướng dẫn

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

THÀNH PHỐ HỒ CHÍ MINH

KHOA ĐIỆN-ĐIỆN TỬ

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

Trang 6

PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN

Họ và tên sinh viên: Nguyễn Thành Trung MSSV: 19161184

Trần Quốc Tuấn MSSV: 20161277 Ngành: Công nghệ kỹ thuật Điện tử - Viễn Thông

Tên đề tài: Phân loại ảnh ung thư vú từ xa sử dụng mạng học sâu

Họ và tên Giáo viên phản biện:

NHẬN XÉT 1 Về nội dung đề tài & khối lượng thực hiện:

2 Ưu điểm:

3 Khuyết điểm:

4 Đề nghị cho bảo vệ hay không?

5 Đánh giá loại:

6 Điểm:……….(Bằng chữ: )

Tp Hồ Chí Minh, ngày tháng năm 2024

Giáo viên phản biện

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

THÀNH PHỐ HỒ CHÍ MINH

KHOA ĐIỆN-ĐIỆN TỬ

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

Trang 7

LỜI CẢM ƠN

Từ tận đáy lòng nhóm chúng em muốn bày tỏ lòng biết ơn sâu sắc đến thầy PSG.TS Nguyễn Thanh Hải Thầy đã trực tiếp hướng dẫn và chia sẻ những kiến thức, kinh nghiệm quý báu

Nhóm chúng em cũng xin bày tỏ lòng biết ơn tới tất cả quý Thầy Cô, phòng ban của Trường Đại học Sư Phạm Kỹ Thuật Thành phố Hồ Chí Minh, Khoa Điện - Điện tử đã tạo điều kiện cho nhóm thực hiện và hoàn thành tốt đề tài

Lời cuối cùng, nhóm chúng em xin gửi lời cảm ơn chân thành tới gia đình và bạn

bè vì đã luôn ủng hộ, động viên và hỗ trợ trong suốt quá trình học tập và thực hiện đồ án tốt nghiệp

Sinh viên thực hiện đề tài

Nguyễn Thành Trung Trần Quốc Tuấn

Trang 8

LỜI CAM ĐOAN

Nhóm chúng em xin cam kết khóa luận tốt nghiệp này được thực hiện dựa vào các nguồn tài liệu (có trích dẫn đầy đủ) và không hề có một sự sao chép hoàn toàn nào từ tài liệu hay công trình đã có trước đó Nếu có bất kỳ vi phạm nào, nhóm xin hoàn toàn chịu trách nhiệm

Sinh viên thực hiện đề tài

Nguyễn Thành Trung Trần Quốc Tuấn

Trang 9

TÓM TẮT

Ung thư vú là căn bệnh ung thư phổ biến nhất ở phụ nữ, gây ra nhiều ca tử vong mỗi năm Việc phát hiện sớm ung thư vú là chìa khóa để điều trị thành công, tuy nhiên không phải ai cũng có thể tiếp cận các dịch vụ chẩn đoán chất lượng cao Chẩn đoán ung thư vú từ xa nổi lên như một giải pháp đầy hứa hẹn, mang đến cơ hội tiếp cận y tế bình đẳng cho mọi người, đặc biệt là những bệnh nhân ở khu vực xa xôi hoặc thiếu điều kiện

y tế

Nhận thức được tầm quan trọng của việc chẩn đoán ung thư vú từ xa, nhóm chúng

em đã nghiên cứu và phát triển một hệ thống chẩn đoán ung thư vú từ xa dựa trên trí tuệ nhân tạo (AI) và học sâu Hệ thống này sử dụng mô hình mạng nơ-ron tích chập EfficientNet-B0 được huấn luyện trên tập dữ liệu ảnh X-quang vú MINI-DDSM Từ đó nhóm tiến hành xây dựng hệ thống thành một trang web, cho phép người dùng dễ dàng truy cập và thực hiện chẩn đoán Người dùng chỉ cần nhập thông tin bệnh nhân và tải ảnh X-quang lên trang web, hệ thống sẽ phân tích hình ảnh và đưa ra kết quả chẩn đoán Hệ thống hoạt động ổn định và đáp ứng được các mục tiêu đã đề ra của đề tài Nhóm hy vọng trong tương lai hệ thống sẽ phát triển và hoàn thiện hơn nữa để có thể đưa vào sử dụng tại các cơ sở y tế và bệnh viện , góp phần hỗ trợ bác sĩ trong quá trình chẩn đoán bệnh ung thư vú

Trang 10

MỤC LỤC

NHIỆM VỤ KHÓA LUẬN TỐT NGHIỆP i

PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN ii

PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN i

LỜI CẢM ƠN ii

LỜI CAM ĐOAN iii

TÓM TẮT iv

DANH MỤC HÌNH ẢNH viii

DANH MỤC BẢNG x

DANH SÁCH CÁC TỪ VIẾT TẮT xi

Chương 1: TỔNG QUAN 1

1.1 Đặt vấn đề 1

1.2 Mục tiêu, đối tượng và giới hạn nghiên cứu 2

1.2.1 Mục tiêu 2

1.2.2 Đối tượng 2

1.2.3 Giới hạn 4

1.3 Nội dung thực hiện 5

1.4 Bố cục 5

Chương 2: CƠ SỞ LÝ THUYẾT 8

2.1 Ung thư vú 8

2.1.1 Một số khái niệm về các giai đoạn ung thư vú 9

2.1.2.Chụp X-quang vú 9

2.1.3 Các bước thực hiện kĩ thuật chụp x-quang vú 10

2.1.4 Phân loại các tổn thương X-quang vú 11

Trang 11

2.2 Deep Learning 13

2.2.1 Cách thức hoạt động của Deep Learning 13

2.2.2 Ưu và nhược điểm của Deep Learning [9] 15

2.3 Convolutional Neural Networks( CNN) 15

2.4 Transfer Learning 17

2.5 Một số Mô Hình Phân Loại Dựa Trên Mô Hình CNN 18

2.5.1 VGG16 18

2.5.2 EFFICIENTNET-B0 20

2.5.3 DENSENET 21

2.6 Ứng dụng của Website trong lĩnh vực y tế 21

Chương 3: PHÂN LOẠI HÌNH ẢNH UNG THƯ VÚ DÙNG MẠNG EFFICIENTNET-B0 23

3.1 Sơ đồ khối của hệ thống 23

3.2 Thu thập dữ liệu 24

3.3 Cơ Sở Dữ Liệu Mini-DDSM 25

3.4 Xử lý dữ liệu 27

3.5 Biến đổi dữ liệu (Data Transform) 28

3.6 Tinh Chỉnh Mô Hình 30

3.7 Mô hình mạng EfficientNet-B0 30

3.8 Quá Trình Huấn Luyện Mô Hình 33

3.9 Thông tin phần cứng sử dụng để huấn luyện mô hình 34

Chương 4: XÂY DỰNG HỆ THỐNG CHẨN ĐOÁN TỪ XA 35

4.1 Thiết kế hệ thống chẩn đoán từ xa bệnh ung thư vú dựa trên trí tuệ nhân tạo 35

4.2 Mô hình hệ thống hỗ trợ chẩn đoán từ xa bệnh ung thư vú 35

4.3 Tổng quan về hệ thống 37

Trang 12

4.4 Xây dựng ứng dụng 38

4.4.1 Thi Công Frontend 38

4.4.2 Thi Công Backend 40

4.5 Thi công model API 42

CHƯƠNG 5: KẾT QUẢ VÀ NHẬN XÉT 45

5.1 Kết quả huấn luyện hệ thống 45

5.1.1 Kết quả huấn luyện thể hiện ở dạng biểu đồ: 45

5.1.2 Đánh giá theo phương pháp ma trận nhầm lẫn 46

5.2 Kiểm tra độ chính xác và độ ổn định của hệ thống 49

5.2.1 Độ chính xác của hệ thống 49

5.2.2 Độ ổn định của hệ thống 51

5.3 Kết quả thực thi Website 51

5.5 Nhận xét 55

Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 56

6.1 Kết luận 56

6.2 Hướng phát triển 56

Trang 13

DANH MỤC HÌNH ẢNH

Hình 2.1 Các triệu chứng và dấu hiệu của UTV 8

Hình 2.2 Các giai đoạn của ung thư vú 9

Hình 2.3 Ảnh X-quang vú 10

Hình 2.4 Ảnh minh họa chụp ung thư vú tại bệnh viện 11

Hình 2.5 Mô vú có tổn thương (hình bên trái) và các kiểu mô vú (hình bên phải) theo BI-RADS 12

Hình 2.6 Mối quan hệ của học sâu, máy học và trí tuệ nhân tạo 13

Hình 2.7 Deep Learning hoạt động như thế nào? 14

Hình 2.8 Mô hình CNN 16

Hình 2.9 Cách thức hoạt động của Transfer Learning 18

Hình 2.10 Cấu trúc CNN của VGG-16 19

Hình 2.11 Cấu trúc của EfficienNet-B0 20

Hình 2.12 Cấu trúc của Densenet 21

Hình 3.1 Sơ đồ khối của hệ thống hỗ trợ chẩn đoán ung thư vú 23

Hình 3.2 Sơ đồ thu thập dữ liệu 25

Hình 3.3 Biểu đồ dữ liệu huấn luyện 27

Hình 3.4 Ảnh sau khi sử dụng data transform 29

Hình 3.5 Sơ đồ khối của mạng EfficientNet-B0 32

Hình 4.1 Mô hình hệ thống 36

Hình 4.2 Sơ đồ các giao diện phần mềm chính của hệ thống 36

Hình 4.3 Sơ đồ khối của Website 37

Hình 4.4 Hình ảnh của giao diện người dùng 39

Hình 4.5 Giao diện hiển thị kết quả chẩn đoán 40

Hình 4.6 Lưu đồ giải thuật của Backend 41

Hình 4.7 Mô hình hoạt động của API 43

Hinh 4.8 Lưu đồ giải thuật của API 44

Hình 5.1 Giá trị độ chính xác (Accuracy) 45

Hình 5.2 Giá trị hàm mất mát (Loss) 45

Hình 5.3 Chỉ số của một ma trận nhầm lẫn 47

Trang 14

Hình 5.4 Ma trận nhầm lẫn 48

Hình 5.5 Biểu đồ hiệu suất của mô hình 49

Hình 5.6 Biểu đồ kiểm tra độ chính xác của tập train 50

Hình 5.7 Biểu đồ kiểm tra độ chính xác của tập test 50

Hình 5.8 Giao diện truy cập web của máy tính người dùng 52

Hình 5.9 Kết quả nhận diện của trường hợp Benign 53

Hình 5.10 Kết quả nhận diện của trường hợp Cancer 53

Hình 5.11 Kết quả nhận diện của trường hợp Normal 54

Hình 5.12 Giao diện khi truy cập bằng điện thoại 54

Trang 15

DANH MỤC BẢNG

Bảng 3.1: Số lượng các nhãn (Labels) 26

Bảng 3.2: Hình ảnh trong tập MINI-DDSM 26

Bảng 3.3: Dữ liệu huấn luyện 27

Bảng 3.4: Chi tiết số lượng train và test 28

Bảng 3.5: So sánh 2 tập dữ liệu 30

Bảng 5.1: Kiểm tra độ ổn định của hệ thống 51

Trang 16

DANH SÁCH CÁC TỪ VIẾT TẮT

1 Mini-DDSM Mini Digital Database for Screening Mammography

2 BRCA1 Gen Breast Cancer 1

3 BRCA2 Gen Breast Cancer 2

4 UTV Ung Thư Vú

5 AI Artificial Intelligence

6 CNN Convolutional Neural Network

7 VGG Visual Geometry Group

8 API Application Programming Interface

Trang 17

Chương 1:

TỔNG QUAN1.1 Đặt vấn đề

Hiện nay bệnh ung thư là một trong những loại bệnh rất nguy hiểm và rất khó chữa trị Trong đó ung thư vú đang trở thành một vấn đề sức khỏe cộng đồng nghiêm trọng, ảnh hưởng đến hàng triệu phụ nữ trên khắp thế giới nói chung và Việt Nam nói riêng Sự gia tăng của tình trạng này có liên quan đến nhiều yếu tố, bao gồm di truyền, môi trường, lối sống không lành mạnh như hút thuốc, rượu bia và chế độ ăn uống không cân đối

Trong danh sách các loại ung thư, ung thư vú (UTV) xuất hiện rất phổ biến ở phụ nữ, đặc biệt là ở nhóm phụ nữ sau tuổi 40 Theo những số liệu mới nhất, trên toàn cầu có khoảng 19,3 triệu người mắc bệnh ung thư và 10 triệu người mất mạng mỗi năm do bệnh này Ở Việt Nam, con số mắc bệnh ước tính là khoảng 182.000

trường hợp với khoảng 122.000 người tử vong mỗi năm [1] UTV chiếm vị trí thứ ba

về tỷ lệ cao nhất (9,6%) sau ung thư phổi và ung thư gan Thống kê từ Tổ chức Ung thư toàn cầu (GLOBOCAN) cho thấy rằng trong năm 2020, hơn 2,2 triệu phụ nữ đã được chuẩn đoán mắc ung thư vú với gần 685.000 trường hợp dẫn đến tử vong Ở châu Á, tỷ lệ này chiếm tới 45% tổng số ca ung thư vú trên toàn cầu Dự báo cho thấy

số lượng ca mắc ung thư vú dự kiến sẽ tăng 20,9% và tỷ lệ tử vong sẽ tăng 27,8% trong khoảng thời gian từ năm 2020 đến 2030 [2] Sự nguy hiểm của UTV là vô cùng nghiêm trọng nên việc chuẩn đoán sớm có thể giúp cải thiện khả năng chữa trị Theo nghiên cứu tại Hoa Kỳ, nếu UTV được phát hiện sớm khi bệnh còn khu trú trong tuyến vú thì tỷ lệ sống sau 5 năm tăng đến 90%, còn ở châu Á đã chỉ ra tỷ lệ sống thêm 5 năm nữa của bệnh nhân khoảng 56,5% đến 86,7% [2]

Với tỷ lệ rất nhiều phụ nữ mắc phải UTV như hiện nay, việc phát hiện sớm và định hình rõ loại bệnh ung thư này để điều trị là cực kỳ quan trọng vì điều này giúp tăng khả năng khỏi bệnh và giảm bớt khó khăn trong quá trình điều trị Ngoài việc chú ý đến các dấu hiệu trong cuộc sống hàng ngày, việc thực hiện các chương trình tầm soát định kỳ để phát hiện sớm cũng rất cần thiết Tuy nhiên, vì một số lý do khác nhau rất nhiều người chủ quan mà không thực hiện tầm soát định kỳ Hơn nữa, có thể

Trang 18

do thiết bị, công nghệ, hoặc những nguyên nhân khác mà việc tầm soát lần đầu không thể phát hiện ra, đến khi bệnh có dấu hiệu rõ ràng thì đã quá muộn và khó chữa trị

Có nhiều phương pháp chẩn đoán ung thư vú, từ các kiểm tra tự thực hiện hàng tháng cho đến các phương pháp hình ảnh và xét nghiệm chuyên sâu Trong số các phương pháp chẩn đoán, hình ảnh X-quang vú (mammography) đóng vai trò quan trọng trong việc phát hiện sớm ung thư vú

Do đó, việc áp dụng công nghệ, đặc biệt là Trí Tuệ Nhân Tạo (AI) để hỗ trợ bác

sĩ trong việc phát hiện sớm và đưa ra các khuyến nghị liên quan đến ung thư là vô cùng quan trọng Sử dụng Trí tuệ nhân tạo (AI) trong chẩn đoán ung thư vú giúp phát hiện sớm và chính xác hơn, tối ưu hóa thời gian và tài nguyên của bác sĩ, hỗ trợ quyết định lâm sàng và tiềm năng mở rộng tầm ảnh hưởng đến các khu vực xa xôi AI liên tục cập nhật và cải tiến từ dữ liệu mới, giúp nâng cao khả năng chẩn đoán theo thời gian Đây là một công cụ quan trọng trong cuộc chiến chống lại căn bệnh nguy hiểm này, mang lại lợi ích đáng kể cho bệnh nhân và hệ thống y tế

1.2 Mục tiêu, đối tượng và giới hạn nghiên cứu

1.2.1 Mục tiêu

Đề tài "Phân loại ảnh ung thư vú từ xa sử dụng mạng học sâu" đặt ra mục tiêu phát triển một hệ thống chẩn đoán ung thư vú sử dụng trí tuệ nhân tạo (AI) và dựa trên dữ liệu lớn từ hình ảnh X-quang, đồng thời xây dựng thêm một trang web để chuẩn đoán ảnh từ xa Mục tiêu của nó là hỗ trợ bác sĩ trong quá trình chẩn đoán bệnh ung thư vú, đồng thời cung cấp phương tiện hiệu quả và tiện lợi để phát hiện sớm các dấu hiệu của bệnh

1.2.2 Đối tượng

Đối tượng nghiên cứu:

1 Ảnh X-quang vú (Mammography):

• Loại dữ liệu hình ảnh: ảnh xám (grayscale), độ phân giải cao

• Thu thập từ các nguồn uy tín: kho dữ liệu y tế, bệnh viện, trung tâm chẩn đoán hình ảnh

2 Các mô hình mạng học sâu:

• Sử dụng các kiến trúc mạng nơ-ron tích chập (CNN) tiên tiến như ResNet, VGG, EfficienNet, Inception, v.v

Trang 19

• Có thể kết hợp với các kỹ thuật học sâu khác như mạng nơ-ron tuần hoàn (RNN), Transformer để tăng hiệu quả phân loại

• Huấn luyện mô hình trên tập dữ liệu ảnh X-quang vú

3 Thuật toán tiền xử lý ảnh:

• Kỹ thuật bình thường hóa dữ liệu: điều chỉnh độ sáng, độ tương phản, v.v

để đồng nhất dữ liệu đầu vào

• Kỹ thuật tăng cường dữ liệu: tạo thêm ảnh mới từ ảnh gốc bằng cách xoay, lật, cắt xén, v.v để tăng kích thước tập dữ liệu và giảm nhiễu

• Kỹ thuật xử lý ảnh: lọc nhiễu, loại bỏ các vật thể không mong muốn, v.v

để cải thiện chất lượng ảnh đầu vào

4 Lập trình Web:

• Xây dựng giao diện web:

o Thiết kế giao diện người dùng (UI) thân thiện, dễ sử dụng

o Cho phép người dùng tải lên ảnh X-quang vú và nhận kết quả phân loại

o Hiển thị kết quả phân loại một cách rõ ràng, dễ hiểu

o Cung cấp thông tin về độ tin cậy của kết quả phân loại

• Kết nối với mô hình học sâu:

o Sử dụng các API hoặc dịch vụ web để kết nối giao diện web với mô hình học sâu được đào tạo

o Truyền ảnh X-quang vú tải lên từ người dùng đến mô hình học sâu

o Nhận kết quả phân loại từ mô hình học sâu và hiển thị trên giao diện web

• Quản lý dữ liệu:

o Lưu trữ ảnh X-quang vú được tải lên và kết quả phân loại một cách an toàn

o Bảo vệ dữ liệu người dùng theo quy định của pháp luật

Khi hoàn thành đề tài kết quả dự kiến ta có:

1 Xây dựng mô hình phân loại ảnh ung thư vú từ xa có độ chính xác cao:

• Đạt tỷ lệ phân loại chính xác (accuracy) cao hơn các phương pháp truyền thống

• Giảm tỷ lệ sai sót (error rate) và tỷ lệ dương tính giả (false positive rate)

2 Phát triển hệ thống hỗ trợ chẩn đoán ung thư vú từ xa:

• Tự động phân loại ảnh X-quang vú của bệnh nhân

Trang 20

• Cung cấp kết quả phân loại và mức độ tin cậy cho bác sĩ tham khảo

• Hỗ trợ bác sĩ trong việc chẩn đoán ung thư vú sớm và chính xác hơn

3 Đánh giá hiệu quả của mô hình học sâu trong phân loại ảnh ung thư vú:

• So sánh hiệu suất của mô hình học sâu với các phương pháp truyền thống

• Phân tích các yếu tố ảnh hưởng đến hiệu quả phân loại của mô hình

• Xác định những hạn chế và hướng nghiên cứu tiếp theo

• Phân tích mô bệnh học ung thư vú

• Dự đoán nguy cơ tái phát ung thư vú

• Lập kế hoạch điều trị ung thư vú phù hợp với từng bệnh nhân

Tóm lại “Phân loại ảnh ung thư vú từ xa sử dụng mạng học sâu” là một lĩnh vực nghiên cứu đầy tiềm năng với nhiều ứng dụng thực tế trong y tế Đề tài này có thể góp phần nâng cao hiệu quả chẩn đoán và điều trị ung thư vú, góp phần cứu sống nhiều người bệnh

1.2.3 Giới hạn

Mặc dù đề tài "Phân loại ảnh ung thư vú từ xa sử dụng mạng học sâu" mang đến tiềm năng to lớn trong việc hỗ trợ chẩn đoán ung thư vú, tuy nhiên, nghiên cứu này vẫn còn một số hạn chế cần được lưu:

- Sử dụng các nguồn ảnh X- quang vú có sẵn như MIAS, DDSM, Mini- DDSM,

- Mô hình chỉ được huấn luyện và thực nghiệm trên các model pretrained: Resnet-152, EfficienB0, DenseNet201, VGG-16

- Mô hình chỉ được thí nghiệm trên Laptop, chưa áp dụng vào thực tế

Trang 21

1.3 Nội dung thực hiện

Trong quá trình thực hiện Đồ án tốt nghiệp, nhóm tập trung giải quyết và hoàn thành được những nội dung sau:

• Nội dung 1: Tìm kiếm và sàng lọc tập ảnh để sử dụng cho quá trình huấn luyện

và thử nghiệm hệ thống

• Nội dung 2: Nghiên cứu về nguyên lý của trí tuệ nhân tạo và mạng học sâu

• Nội dung 3: Tìm hiểu và nắm vững quá trình huấn luyện mạng học sâu

• Nội dung 4: Thực hiện quá trình huấn luyện và điều chỉnh mạng học sâu trên tập ảnh đã chuẩn bị

• Nội dung 5: Lập trình để thiết kế web chuẩn đoán hình ảnh

• Nội dung 6: Hoàn thiện trang web để người dùng có thể gửi ảnh từ xa

• Nội dung 7: Viết báo cáo

• Nội dung 8: Bảo vệ luận văn

- Giới thiệu về mạng học sâu, các kiến trúc phổ biến, ưu điểm và ứng dụng trong

y tế, đặc biệt là trong phân loại ảnh

- Xác định mục tiêu đối tượng và giới hạn nghiên cứu, xây dựng nội dung thực hiện và bố cục đồ án

Chương 2: CƠ SỞ LÝ THUYẾT

- Tóm tắt các mô hình mạng học sâu phổ biến cho phân loại ảnh ung thư vú, phân tích ưu nhược điểm của từng mô hình và lựa chọn mô hình phù hợp cho bài toán

- Mô tả các nguồn dữ liệu ảnh ung thư vú uy tín, cấu trúc và đặc điểm của tập

dữ liệu, cũng như kỹ thuật xử lý dữ liệu trước khi huấn luyện mô hình

- Giới thiệu các chỉ số đánh giá hiệu quả mô hình phân loại, phương pháp phân tích kết quả đánh giá và điều chỉnh mô hình

Trang 22

- Giới thiệu và cách thiết lập Website để kết nối máy học

Chương 3: XÂY DỰNG MÔ HÌNH HUẤN LUYỆN

- Giới thiệu khung phần mềm và công cụ phát triển được sử dụng để xây dựng

- Giải thích phương pháp lưu trữ và chia sẻ mô hình sau khi hoàn thành huấn luyện

Chương 4: THI CÔNG HỆ THỐNG

- Trình bày thiết kế và triển khai hệ thống web để phân loại ảnh ung thư vú từ

Chương 5: KẾT QUẢ VÀ NHẬN XÉT, ĐÁNH GIÁ MÔ HÌNH

- Trình bày kết quả thu được sau khi huấn luyện mô hình, bao gồm độ chính xác, độ nhạy, độ đặc hiệu và các chỉ số đánh giá khác

- Phân tích hiệu quả của mô hình và so sánh với các phương pháp phân loại ảnh ung thư vú truyền thống

- Đưa ra nhận xét về ưu và nhược điểm của mô hình, cũng như những hạn chế của nghiên cứu

Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

- Tóm tắt những kết quả chính của nghiên cứu và khả năng hoạt động của hệ thống

Trang 23

- Đưa ra kết luận về tiềm năng ứng dụng của hệ thống trong chẩn đoán ung thư

vú từ xa

- Gợi ý một số hướng phát triển tiếp theo cho nghiên cứu, bao gồm cải thiện độ chính xác của mô hình, mở rộng khả năng phân loại sang các loại ung thư khác, và triển khai hệ thống vào thực tế lâm sàng

Trang 24

Chương 2:

CƠ SỞ LÝ THUYẾT2.1 Ung thư vú

Ung thư vú là bệnh liên quan đến sự phát triển bất thường của tế bào vú Dưới điều kiện bình thường thì tế bào vú sẽ phân chia một cách kiểm soát và tự giới hạn, nhưng trong trường hợp ung thư quá trình này bị gián đoạn và tế bào bắt đầu phát triển không kiểm soát, tạo thành khối u ác tính

Các yếu tố góp phần vào sự phát triển của ung thư vú bao gồm [3]:

1 Yếu tố Gen: Một trong những yếu tố quan trọng nhất là di truyền Các gen BRCA1 và BRCA2 là những gen đặc biệt có liên quan đến nguy cơ phát triển ung thư vú và chúng có thể được truyền từ thế hệ này sang thế hệ khác

2 Yếu tố Hormon: Hormon estrogen và progesterone có vai trò quan trọng trong

sự phát triển của tế bào vú Estrogen dư thừa trong cơ thể có thể tăng nguy cơ mắc ung thư vú

3 Lối sống và môi trường: Hút thuốc lá, tiêu thụ rượu, tiếp xúc với các chất độc hại, thiếu vận động và chế độ ăn uống không cân đối

4 Tuổi tác: Nguy cơ mắc ung thư vú tăng theo độ tuổi, với hầu hết các trường hợp được chẩn đoán ở phụ nữ sau tuổi 50

Hình 2.1 Các triệu chứng và dấu hiệu của UTV [19]

Trang 25

2.1.1 Một số khái niệm về các giai đoạn ung thư vú

Ung thư vú được chia thành các giai đoạn khác nhau dựa trên mức độ tiến triển của bệnh Ở giai đoạn đầu hay còn gọi là tiền ung thư, các tế bào bất thường chỉ mới bắt đầu tăng trưởng bất thường trong các ống dẫn sửa Giai đoạn I là giai đoạn xâm lấn, các tế bào khối u đã lan sang các mô vú khỏe mạnh nhưng vẫn chỉ nằm trong một khu vực nhỏ Đến giai đoạn II, tế bào ung thư đã phát triển và lan đến một vùng giới hạn của vú và các hạch bạch huyết Gian đoạn III cho các tế bào ung thư đã lan rộng đến các hạch bạch huyết nhưng vẫn chưa di căn đến xương và các cơ quan khác Cuối cùng khi đã đến gian đoạn IV thì các tế bào ung thư đã di căn xa vú gây ảnh hưởng đến xương, phổi, gan và não làm cho việc điều trị trở nên rất khó khăn so với các giai đoạn trước [4]

Hình 2.2 Các giai đoạn của ung thư vú [20]

2.1.2.Chụp X-quang vú

Các phương pháp sàng lọc để phát hiện sớm ung thư vú bao gồm tự kiểm tra vú hằng ngày, khám sức khoẻ định kỳ sau tuổi 40 và đặc biệt là chụp X-quang tuyến vú (mammography) Chính vì vậy, chụp X-quang tuyến vú được coi là một phương pháp quan trọng trong việc giảm tỷ lệ chết do ung thư vú, lên tới 20-22% [5] và có giá trị cao trong chương trình sàng lọc phát hiện ung thư vú ở mỗi quốc gia

Ngoài ra, chụp X-quang được khuyến nghị cho những bệnh nhân nữ có triệu chứng lâm sàng và những người có tiền sử gia đình bị ung thư vú [6] Theo đó, chụp X-quang vú được chỉ định như sau: Sàng lọc ung thư vú ở phụ nữ không có triệu chứng với độ tuổi sàng lọc từ 40 - 75 tuổi để chụp X-quang vú hai năm một lần và mỗi năm một lần với phụ nữ có nguy cơ cao

Trang 26

Hình 2.3 Ảnh X-quang vú

Nhu cầu chụp X-quang vú hiện nay là rất lớn Chính vì thế nên cần phải có nhiều bác sĩ chuyên về phiên giải hình ảnh X-quang vú hay còn gọi là bác sĩ chẩn đoán hình ảnh ung thư vú Tuy nhiên ở Việt Nam vẫn chưa có nghiên cứu cụ thể về

số lượng bác sĩ chẩn đoán hình ảnh ung thư vú có thể đáp ứng được với nhu cầu đang tăng cao về chụp X-quang tuyến vú

Theo một nghiên cứu dự đoán tại Mỹ cho thấy rằng trong hai thập kỷ tới sẽ có

sự thiếu hụt trầm trọng về số lượng bác sĩ chẩn đoán hình ảnh X-quang tuyến vú Điều này gợi ra một vấn đề quan trọng về việc cần phải đảm bảo có đủ nguồn nhân lực chuyên môn trong lĩnh vực này để đáp ứng nhu cầu sàng lọc và chẩn đoán ung thư vú

2.1.3 Các bước thực hiện kĩ thuật chụp x-quang vú

– Giải thích cho bệnh nhân về quy trình chụp Xquang vú

– Bệnh nhân cởi áo ngoài và áo lót, có thể thay áo rộng không cần cài cúc phía trước để thuận tiện cho quá trình chụp

– Bệnh nhân sẽ đứng hoặc ngồi quay mặt về phía máy chụp

– Đặt vú lên bảng nhận ảnh, ép vú bởi tấm nhựa ép vú của máy Ép đủ lực cho tuyến vú mỏng ra và dàn đều giúp quan sát rõ hơn tổn thương vú, giảm cường độ chiếu tia, ảnh không bị rung do di động (chú ý cảm giác đau của bệnh nhân) – Chụp ít nhất ở hai tư thế: Tư thế thẳng trên dưới, tư thế chếch trong-ngoài Có thể chụp tư thế nghiêng phối hợp xác định rõ hơn vị trí của tổn thương

– Chụp ép phóng đại khu trú vùng nghi ngờ tổn thương hoặc tổn thương chưa được bộc lộ rõ trên các tư thế đã chụp

Trang 27

– Hình ảnh chụp X-quang vú sẽ được xử lý và lưu trữ dưới dạng hình ảnh số hoặc được in phim

– Siêu âm vú phối hợp (Hình ảnh X-quang vú luôn được đọc phối hợp với hình ảnh siêu âm vú)

– Phân tích hình ảnh, kết luận hình ảnh tuyến vú theo phân loại BIRADS [7]

Hình 2.4 Ảnh minh họa chụp ung thư vú tại bệnh viện

2.1.4 Phân loại các tổn thương X-quang vú

Hiện nay, tại Việt Nam tất cả các bệnh viện đều đang áp dụng hệ thống phân loại BIRADS năm 2013 (Breast Imaging Reporting and Data System) để phân loại mức độ ác tính của các tổn thương trên X-quang tuyến vú [8]:

• BI-RADS 0: không đánh giá được tổn thương trên X-quang tuyến vú, cần dựa vào các thăm dò khác

• BI-RADS 1: Tuyến vú bình thường, không có tổn thương

• BI-RADS 2: Tổn thương ở vú thuộc dạng lành tính

• BI-RADS 3: Tuyến vú có tổn thương khả năng là tổn thương lành tính Tuy nhiên cần theo dõi trong khoảng thời gian ngắn để đưa ra các kết luận chính xác Nguy cơ

ác tính >0% nhưng <2%

• BI-RADS 4: Vùng vú có những dấu hiệu bất thường khả năng là tổn thương ác tính Bác sĩ sẽ chỉ định người bệnh làm sinh thiết để đánh giá được chính xác mức độ tổn thương

• BI-RADS 5: Ở mức độ này, tổn thương ở vú gần như chắc chắn là ác tính, tỷ lệ mắc phải ung thư vú là rất cao (lớn hơn 95%)

Trang 28

Hình 2.5 Mô vú có tổn thương (hình bên trái) và các kiểu mô vú

(hình bên phải) theo BI-RADS

Một vấn đề phổ biến trong hệ thống y tế ở Việt Nam hiện nay là ngoài sự thiếu hụt các bác sĩ có chuyên môn về đọc phim X-quang tuyến vú thì còn có khoảng cách lớn về trình độ của giữa các bệnh viện trung ương với tuyến cơ sở Điều này ảnh hưởng trực tiếp đến độ chính xác của chẩn đoán X-quang tuyến vú

Để giải quyết vấn đề này, một giải pháp được đề xuất là sử dụng trí tuệ nhân tạo để phát triển một hệ thống hỗ trợ chẩn đoán X-quang ung thư vú Mục tiêu của

hệ thống này là tăng độ chính xác của chẩn đoán, giảm thời gian đọc kết quả và giảm

sự chênh lệch về độ chính xác giữa các bác sĩ ở các tuyến khác nhau

Hiện nay, nghiên cứu về ứng dụng trí tuệ nhân tạo (AI) trong chẩn đoán ung thư vú đang thu hút sự quan tâm lớn trên toàn cầu, bao gồm cả Việt Nam Trên thế giới, nhiều nghiên cứu đã chứng minh hiệu quả của AI trong việc phát hiện sớm ung thư vú, giúp cải thiện độ chính xác và tốc độ chẩn đoán so với các phương pháp truyền thống Ở Việt Nam, mặc dù nghiên cứu về AI trong y tế đang còn ở giai đoạn đầu nhưng đã có những tiến bộ đáng kể Một số bệnh viện và trung tâm nghiên cứu

đã bắt đầu ứng dụng AI vào chẩn đoán và điều trị ung thư, đồng thời hợp tác với các

tổ chức quốc tế để nâng cao năng lực và tiếp cận công nghệ tiên tiến

Áp dụng trí tuệ nhân tạo (AI) vào lĩnh vực y học đặc biệt là trong việc phân tích hình ảnh X-quang sẽ mang sẽ lại những cải tiến đáng kể trong quá trình chẩn đoán

và điều trị bệnh ung thư vú, đồng thời giảm thiểu những khó khăn liên quan đến sự chênh lệch về trình độ chuyên môn giữa các bác sĩ và sự thiếu hụt nguồn nhân lực chuyên môn

Trang 29

2.2 Deep Learning

Deep Learning là một phương pháp của Machine Learning (máy học) trong lĩnh vực trí tuệ nhân tạo (AI), ở đó các hệ thống máy tính được lập trình để tự động học

từ dữ diệu và cải thiện chính nó thông qua các thuật toán [9]

Hình 2.6 Mối quan hệ giữa học sâu, máy học và trí tuệ nhân tạo

Thuật ngữ "sâu" trong Deep Learning được sử dụng để mô tả việc mạng neural bao gồm nhiều tầng (hay lớp) các đơn vị tính toán, được gọi là neurons Các tầng này kết nối với nhau và truyền dữ liệu qua từ tầng này sang tầng khác, tạo thành một mạng neural có khả năng học và hiểu được những mô hình phức tạp của dữ liệu Deep Learning hiện đang phát triển rất nhanh và đã gây ra được cuộc cách mạng trong nhiều lĩnh vực như thị giác máy tính, xử lý ngôn ngữ tự nhiên và nhận dạng giọng nói Trong thị giác máy tính, các mạng neural sâu đã đạt được những thành tựu

ấn tượng trong việc phân loại ảnh, nhận dạng khuôn mặt và phát hiện vật thể Trong lĩnh vực xử lý ngôn ngữ tự nhiên, Deep Learning được áp dụng để xây dựng các hệ thống dịch máy, phân loại văn bản và tạo ra các mô hình ngôn ngữ tự động

Một trong những thành tựu quan trọng nhất của Deep Learning là khả năng tự học các đặc trưng từ các dữ liệu thô mà không cần phải xây dựng các đặc trưng thủ công Điều này mang lại lợi ích lớn vì nó giúp giảm bớt công sức, sự phụ thuộc vào kiến thức chuyên gia trong quá trình xây dựng mô hình học máy

2.2.1 Cách thức hoạt động của Deep Learning

Deep Learning hoạt động bằng cách xây dựng và huấn luyện các mạng neural sâu để tự động học và hiểu dữ liệu [9]

Trang 30

Hình 2.7 Deep Learning hoạt động như thế nào?

Quá trình này bao gồm các bước chính sau:

• Chuẩn bị dữ liệu: Đây là bước quan trọng đầu tiên trong Deep Learning, quá trình này bao gồm thu thập và làm sạch dữ liệu, chuyển đổi dữ liệu sang định dạng phù hợp cho mạng nơ-ron, gán nhãn chính xác cho dữ liệu để mô hình phân loại hoặc

dự đoán, cuối cùng là chia dữ liệu thành tập con khác nhau như tập huấn luyện,

tập kiểm tra và tập xác thực

• Xây dựng mạng nơ-ron: Mạng nơ-ron là mô hình học máy phỏng theo cấu trúc và hoạt động của não bộ con người Nó có cấu trúc lặp lại của các lớp (Layer) và các nơ-ron là đơn vị xử lý cơ bản, thực hiện tính toán và truyền tín hiệu Mỗi nơ-ron nhận đầu vào từ các nơ-ron ở tầng trước đó và tính toán đầu ra dựa trên các trọng

số (Weight) và hàm kích hoạt (Activation function) từ đó tổng hợp thông tin này

trước khi truyền tới các nơ-ron ở tầng tiếp theo

• Huấn luyện mạng nơ-ron: Sau khi đã xây dựng mạng nơ-ron ta huấn luyện bằng

cách sử dụng các tập dữ liệu có gán nhãn Quá trình huấn luyện bao gồm:

o Truyền dữ liệu đầu vào: Dữ liệu đầu vào được đưa vào mạng nơ-ron

o Tính toán đầu ra: Mỗi nơ-ron tính toán đầu ra của mình dựa trên dữ liệu đầu vào và các trọng số

o So sánh dự đoán với nhãn thực tế: Đầu ra dự đoán được so sánh với nhãn thực tế để tính toán lỗi

o Điều chỉnh trọng số: Trọng số của các kết nối giữa các nơ-ron được điều chỉnh để giảm thiểu lỗi dự đoán

o Lặp lại: Quá trình này được lặp lại nhiều lần cho đến khi đạt được hiệu suất mong muốn

Trang 31

• Đánh giá và sử dụng mô hình: Sau khi mạng nơ-ron được huấn luyện, mô hình sẽ được đánh giá trên các tập dữ liệu kiểm tra để đảm bảo hiệu suất Sau đó, mô hình

có thể sử dụng để thực hiện những nhiệm vụ như phân loại, dự đoán, v.v

• Cải thiện mô hình: Quá trình này có thể được lặp lại nhiều lần, với việc chỉnh sửa cấu trúc mạng nơ-ron như thay đổi số lượng lớp, số lượng nơ-ron trong mỗi lớp hoặc kiểu kết nối giữa các lớp Điều chỉnh thuật toán huấn luyện cũng như việc

thu thập và sử dụng thêm dữ liệu huấn luyện để cải thiện hiệu suất của mô hình 2.2.2 Ưu và nhược điểm của Deep Learning [9]

❖ Ưu điểm

• Khả năng học tự động từ dữ liệu phức tạp: Deep Learning có khả năng tự học và

trích xuất các đặc trưng từ dữ liệu ở nhiều dạng khác nhau như hình ảnh, âm thanh,

văn bản, giọng nói, v.v

• Độ chính xác cực kỳ cao: Cung cấp kết quả dự đoán chính xác trên các lĩnh vực

khác nhau như nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên và dự đoán chuỗi

thời gian

• Khả năng thích ứng: Có thể học hỏi và thích ứng với các dữ liệu mới liên tục

❖ Nhược điểm

• Cần dữ liệu huấn luyện lớn: Deep Learning thường yêu cầu một lượng lớn dữ liệu

để huấn luyện mô hình một cách hiệu quả Việc thu thập và chuẩn bị dữ liệu có thể tốn kém và mất thới gian, đặc biêt là các tác vụ phức tạp

• Chi phí tính toán cao: Việc huấn luyện các mô hình Deep Learning trên lượng dữ liệu lớn đòi hỏi nguồn tài nguyên tính toán mạnh mẽ, bao gồm CPU, GPU và bộ nhớ Chi phí cho phần cứng và phần mềm có thể cao, đặc biệt đối với các doanh nghiệp và tổ chức nhỏ

• Khó giải thích: Do cấu trúc phức tạp của mạng nơ-ron, việc giải thích cách thức của một mô hình có thể khó khăn, đặc biệt là trong các ứng dụng yêu cầu giải thích rõ ràng như y học hoặc tài chính

2.3 Convolutional Neural Networks( CNN)

Convolutional Neural Network (CNN) là một trong những mô hình Deep Learning tiên tiến nhất CNN có kiến trúc lý tưởng nên thường được sử dụng trong

Trang 32

thị giác máy tính để xử lý, phân tích hình ảnh và giúp chúng ta xây dựng được những

hệ thống thông minh với độ chính xác rất cao [10]

Hình 2.8 Mô hình CNN

Cấu trúc cơ bản của một CNN bao gồm các thành phần chính sau:

1 Lớp Convolutional : Đây là lớp đầu tiên và cũng là lớp quan trọng nhất của mô hình CNN, trong đó các bộ lọc (filters) được dùng để xử lý ảnh đầu vào Mỗi bộ lọc sẽ tạo ra một feature map biểu diễn các đặc trưng cụ thể của hình ảnh

2 Lớp Activation: Sau mỗi lớp convolutional, một hàm kích hoạt như ReLU (Rectified Linear Unit) thường được áp dụng để tạo tính phi tuyến cho mạng

3 Lớp Pooling: Lớp này thường được sử dụng để giảm kích thước của feature map bằng cách chọn ra giá trị quan trọng nhất trong mỗi vùng của feature map Các lớp pooling phổ biến bao gồm max pooling và average pooling

4 Lớp Fully Connected: Sau khi thông qua các lớp convolutional và pooling, đầu ra được đưa vào các lớp fully connected để thực hiện phân loại hoặc dự đoán Lớp này thường được kết hợp với hàm kích hoạt như Softmax để tạo ra các xác suất phân loại

5 Dropout Layer: Đây là một kỹ thuật được sử dụng để ngăn chặn việc quá mức hóa (overfitting) bằng cách ngẫu nhiên loại bỏ một số neuron trong quá trình huấn luyện

Cấu trúc tổng quát của một CNN bao gồm các lớp convolutional, lớp activation, lớp pooling và lớp fully connected được xếp chồng lên nhau theo thứ tự Các tham

số của mạng, bao gồm số lượng và kích thước của các bộ lọc được học trong quá trình huấn luyện để tối ưu hóa hiệu suất của mạng trên tập dữ liệu huấn luyện

Trang 33

Ưu điểm của CNN:

➢ Tính tự động hóa: CNN có khả năng tự động học các đặc trưng quan trọng từ ảnh, giúp giảm thiểu sự can thiệp của con người trong quá trình xử lý ảnh

➢ Hiệu quả tính toán: CNN chỉ tính toán trên các vùng đặc trưng của ảnh, giúp giảm thiểu thời gian tính toán và tăng tốc độ xử lý

➢ Khả năng tái sử dụng: CNN có thể sử dụng lại các trọng số đã học được trong quá trình huấn luyện để giúp hệ thống phân loại ảnh tự động và hiệu quả

➢ Độ chính xác cao: CNN có độ chính xác cao trong việc phân loại các đối tượng trong ảnh và trích xuất các đặc trưng quan trọng từ ảnh

Nhược điểm của CNN:

➢ Cần nhiều dữ liệu huấn luyện: CNN yêu cầu một lượng dữ liệu huấn luyện lớn

để có thể học được các đặc trưng quan trọng từ ảnh

➢ Nhạy cảm với biến động trong dữ liệu: CNN có thể bị ảnh hưởng nếu dữ liệu huấn luyện thay đổi hoặc bị nhiễu

➢ Độ phức tạp cao: CNN có cấu trúc phức tạp và khó hiểu, đặc biệt là với những người mới bắt đầu học

2.4 Transfer Learning

Trong quá trình thiết kế một mô hình máy học, chúng ta chỉ có một lượng data nhỏ nhưng vẫn muốn xây dựng được một mô hình hoàn chỉnh thì làm thế nào để mô hình đó có thể hoạt động tốt? Chính Transfer Learning sẽ giúp giải quyết vấn đề đó Transfer Learning là một lĩnh vực con trong máy học và AI, trong đó kiến thức

từ một tác vụ (task) được áp dụng và chuyển giao (transfer) sang một tác vụ tương tự khác Thay vì huấn luyện một mô hình từ đầu cho mỗi nhiệm vụ mới, Transfer Learning cho phép tái sử dụng kiến thức đã học được từ các nhiệm vụ trước đó để cải thiện hiệu suất của mô hình trên nhiệm vụ mới mà không cần nhiều dữ liệu huấn luyện [11]

Trang 34

Hình 2.9 Cách thức hoạt động của transfer learning

Trong Deep Learning, Transfer Learning thường được thực hiện bằng cách sử dụng các mô hình được huấn luyện trước (model pretrained), phổ biến như VGG, DenseNet, EfficientNet của Pytorch Transfer Learning giúp giảm thiểu thời gian và công sức đầu tư vào việc huấn luyện mô hình từ đầu, đồng thời hỗ trợ cải thiện hiệu suất mô hình

Ở đề tài này, nhóm đã quyết định sử dụng mô hình EfficientNet để giải quyết các yêu cầu của bài toán EfficientNet là một kiến trúc mạng nơ-ron có hiệu suất cao,

đã chứng minh được sự hiệu quả trong xử lý hình ảnh

2.5 Một số Mô Hình Phân Loại Dựa Trên Mô Hình CNN

2.5.1 VGG16

Mô hình VGG-16 [13] là một kiến trúc mạng nơ-ron tích chập (CNN) được đề xuất bởi Visual Geometry Group (VGG) tại Đại học Oxford Mô hình bao gồm 16 lớp, trong đó có13 lớp tích chập và 3 lớp kết nối đầy đủ VGG-16 nổi tiếng với tính đơn giản và hiệu quả cao cũng như khả năng đạt hiệu suất mạnh mẽ trên các nhiệm

vụ thị giác máy tính khác nhau bao gồm phân loại hình ảnh và nhận dạng đối tượng Kiến trúc của mô hình bao gồm một chuỗi các lớp tích chập liên tiếp sau đó là các lớp max-pooling với độ sâu tăng dần Thiết kế này cho phép mô hình học các biểu diễn phức tạp theo cấp bậc của các đặc trưng thị giác, dẫn đến các dự đoán mạnh mẽ

và chính xác Mặc dù đơn giản so với các kiến trúc gần đây hơn, VGG-16 vẫn là lựa chọn phổ biến cho nhiều ứng dụng học sâu nhờ tính linh hoạt và hiệu suất xuất sắc của nó

Trang 35

Cuộc thi The ImageNet Large Scale Visual Recognition Challenge (ILSVRC)

là một cuộc thi hàng năm về thị giác máy tính, trong đó các đội tham gia giải quyết các nhiệm vụ bao gồm định hình được đối tượng và phân loại hình ảnh VGG16 được

đề xuất bởi Karen Simonyan và Andrew Zisserman vào năm 2014 đã đạt vị trí hàng đầu trong cả hai nhiệm vụ, phát hiện đối tượng từ 200 lớp và phân loại hình ảnh thành

Cuối cùng, mô hình kết thúc với ba lớp kết nối đầy đủ (fully connected layers) Hai lớp đầu tiên mỗi lớp đều có 4096 kênh và lớp thứ ba có 1000 kênh, tương ứng với số lượng lớp đầu ra trong tập dữ liệu ImageNet

Cấu hình của VGG16 là một điểm đặc biệt, cụ thể sự lặp đi lặp 5 lần của khối tích chập và khối tổng hợp Điều này giúp VGG16 nhận biết và học các đặc điểm của hình ảnh (Input đầu vào) một cách chi tiết và dễ dàng

Trang 36

2.5.2 EFFICIENTNET-B0

EfficientNet [14] là một mạng CNN mới có hiệu suất cao và tốc độ nhanh Nó

sử dụng phương pháp mở rộng phức hợp mới, sử dụng một hệ số kết hợp để mở rộng đồng nhất chiều rộng, chiều sâu và độ phân giải của kiến trúc mạng CNN

Hình 2.11 Cấu Trúc Của Efficient_B0

EfficientNet được sử dụng làm mạng trích xuất đặc trưng không gian trong các nhiệm vụ phân loại EfficientNet bao gồm bảy mô hình CNN được đặt tên từ EfficientNet-B0 đến EfficientNet-B7 Cấu trúc chi tiết của EfficientNet-B0 được chia thành bảy khối dựa trên số kênh, bước nhảy và kích thước bộ lọc tích chập Trong đề tài này, nhóm quyết định sử dụng EfficientNet-B0 vì nó cung cấp tốc độ tính toán nhanh và có độ chính xác cực kỳ cao

Trang 37

Trong nhiều trường hợp, DenseNet vẫn đạt được kết quả tốt nhất trên nhiều tập dữ liệu kiểm chuẩn, mặc dù nó có ít tham số và chi phí tính toán ít hơn đáng kể khi so sánh với các mô hình mạng khác DenseNet đã chứng tỏ được hiệu suất cao trong các thí nghiệm về phân loại ảnh

Hình 2.12 Cấu trúc của Densenet 2.6 Ứng dụng của Website trong lĩnh vực y tế

Công nghệ thông tin đang ngày càng đóng vai trò quan trọng trong lĩnh vực y

tế, mang đến nhiều giải pháp, ứng dụng web giúp nâng cao chất lượng dịch vụ và trải nghiệm của bệnh nhân Một số ứng dụng tiêu biểu bao gồm:

❖ Quản lý hồ sơ bệnh án: Hệ thống EMR giúp lưu trữ, truy cập và quản lý thông tin bệnh nhân an toàn, hiệu quả

❖ Đặt lịch khám: Hệ thống đặt lịch trực tuyến giúp bệnh nhân dễ dàng đặt lịch, chọn bác sĩ và theo dõi lịch hẹn

❖ Telehealth: Telehealth cho phép bệnh nhân tham khảo ý kiến bác sĩ từ xa qua video call, chat hoặc tin nhắn

Trang 38

❖ Quản lý sức khỏe: Trang web giúp theo dõi các chỉ số sức khỏe như nhịp tim, huyết áp, giấc ngủ và chế độ ăn uống Ngoài ra còn có thể theo dõi lịch sử dùng thuốc và nhận thông báo khi cần uống thuốc

Ngoài ra, còn rất nhiều giải pháp, ứng dụng web và app khác hỗ trợ cho các lĩnh vực như: chẩn đoán hình ảnh, hỗ trợ điều trị, nghiên cứu y khoa, Nhờ sự phát triển của công nghệ, lĩnh vực y tế ngày càng trở nên hiện đại, hiệu quả và dễ tiếp cận hơn với người dân Từ đó, nhóm chúng em quyết định xây dựng một trang web với mục đích hỗ trợ chẩn đoán ung thư vú

Ngày đăng: 19/12/2024, 11:27

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN