Sự kết hợp giữa bộ dữ liệu mới này và các mô hình đã nêu bên trên hứahẹn là một hướng nghiên cứu tốt cho ra kết quả khả quan.Đề tài dành sự quan tâm chủ yếu vào xem xét ứng dụng một số m
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN LÊ PHƯƠNG THẢO ỨNG DỤNG HỌC MÁY TRONG NGHIÊN CỨU BÀI TOÁN PHÂN LOẠI DỮ LIỆU HÌNH ẢNH X-QUANG LỒNG NGỰC ĐỀ ÁN THẠC SĨ KHOA HỌC DỮ LIỆU ỨNG DỤNG Bình Định - Năm 2023 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUY NHƠN LÊ PHƯƠNG THẢO ỨNG DỤNG HỌC MÁY TRONG NGHIÊN CỨU BÀI TOÁN PHÂN LOẠI DỮ LIỆU HÌNH ẢNH X-QUANG LỒNG NGỰC ĐỀ ÁN THẠC SĨ KHOA HỌC DỮ LIỆU ỨNG DỤNG Ngành : Khoa học dữ liệu ứng dụng Mã số : 8904648 Người hướng dẫn khoa học : TS Nguyễn Văn Vũ Bình Định - Năm 2023 i Lời cam đoan Tôi xin cam đoan nội dung trong đề tài "Ứng dụng học máy trong nghiên cứu bài toán phân loại dữ liệu hình ảnh X-quang lồng ngực" là kết quả thực hiện của tác giả cùng với cộng sự và có định hướng của thầy hướng dẫn Các nội dung và kết quả sử dụng ở đây đều có trích dẫn và chú thích nguồn gốc rõ ràng Bình Định, ngày tháng 11 năm 2023 Tác giả Lê Phương Thảo ii Lời cảm ơn Đề án được hoàn thành dưới sự hướng dẫn của Thầy Nguyễn Văn Vũ Tác giả xin bày tỏ lòng biết ơn chân thành đến Thầy, người đã tận tình giúp đỡ để tác giả có thể hoàn thành công việc một cách tốt nhất Tác giả cũng xin chân thành cảm ơn quý Thầy, Cô khoa Toán và Thống kê, khoa Công nghệ thông tin, Phòng đào tạo sau đại học trường Đại học Quy Nhơn, cùng quý thầy cô tham gia giảng dạy cho lớp Cao học Khoa học dữ liệu ứng dụng K24B đã tạo điều kiện giúp đỡ cho tác giả trong quá trình học tập và nghiên cứu Xin gửi lời cảm ơn đến bạn Nguyễn Quốc Dương - Lớp Cao học Khoa học dữ liệu ứng dụng K24B, trường Đại học Quy Nhơn đã đồng hành, hỗ trợ tác giả nhiệt tình trong quá trình hoàn thành đề án Cuối cùng, tác giả cũng xin cảm ơn gia đình, bạn bè đã quan tâm, động viên và giúp đỡ tác giả trong quá trình học tập và hoàn thành đề án này Lê Phương Thảo được tài trợ bởi Tập đoàn Vingroup – Công ty CP và hỗ trợ bởi Chương trình học bổng thạc sĩ, tiến sĩ trong nước của Quỹ Đổi mới sáng tạo Vingroup (VINIF), Viện Nghiên cứu Dữ liệu lớn, mã số VINIF.2021.ThS.QN.05 iii Mục lục Lời cam đoan i Lời cảm ơn ii Mở đầu 1 1 Kiến thức chuẩn bị 3 1.1 Mạng neuron 3 1.1.1 Perceptron đa tầng 4 1.1.2 Hàm kích hoạt 5 1.1.3 Đào tạo có giám sát 6 1.1.4 Chính quy hóa (Regularization) 10 1.2 Mạng neuron tích chập - Convolutional neural networks 11 1.3 Faster R-CNN 13 1.4 Các thước đo đánh giá mô hình phát hiện vật thể 15 1.4.1 Độ chính xác 16 1.4.2 Precision 16 1.4.3 Recall 17 1.4.4 F1 Score 17 1.4.5 Precision và recall trong phát hiện đối tượng 18 1.4.6 AP - average precision và mAP - mean average precision 19 1.4.7 Non-Maximum Suppression (NMS) 19 2 Mô hình YOLO và một số vấn đề liên quan 21 2.1 Lịch sử hình thành 21 2.2 YOLO: You Only Look Once 23 2.2.1 YOLOv1 hoạt động như thế nào? 23 2.2.2 Kiến trúc mô hình YOLOv1 23 2.2.3 Đào tạo mô hình YOLOv1 24 iv 2.2.4 Những điểm mạnh và hạn chế của YOLOv1 26 2.3 YOLOv2 26 2.4 YOLOv3 28 2.5 YOLOv4 31 2.6 YOLOv5 34 2.7 Scaled-YOLOv4 36 2.8 YOLOR 36 2.9 YOLOX 37 2.10 YOLOv6 38 2.11 YOLOv7 39 2.12 DAMO-YOLO 41 2.13 YOLOv8 42 2.14 PP-YOLO, PP-YOLOv2, and PP-YOLOE 44 2.14.1 PP-YOLO tăng cường và tiền xử lý 45 2.14.2 PP-YOLOv2 45 2.14.3 PP-YOLOE 46 2.15 YOLO-NAS 47 2.16 YOLO với Transformers 49 3 Ứng dụng trong bài toán chẩn đoán bất thường trên ảnh X-quang lồng ngực 51 3.1 Tập dữ liệu 51 3.1.1 Khái quát tập dữ liệu 51 3.1.2 Phân tích tập dữ liệu 52 3.1.3 Xử lý dữ liệu 55 3.2 Tiến trình thực nghiệm 56 3.3 Xây dựng hệ thống giao diện người dùng 58 Kết luận 61 v Danh sách bảng 3.1 Các loại bất thường được phát hiện và gắn nhãn trên hình ảnh X-quang 52 3.2 Các tham số đào tạo mô hình Faster R-CNN 57 3.3 Số lượng của mỗi lớp sau khi phân chia tập dữ liệu 58 3.4 Kết quả đào tạo của các mô hình YOLO 58 3.5 Kết quả đào tạo của mô hình YOLOv7 59 vi Danh sách hình vẽ 1.1 Biểu đồ mạng cho một đơn vị xử lý 4 1.2 Biểu đồ mạng cho perceptron (L + 1) tầng 5 1.3 Các hàm kích hoạt Sigmoidal 6 1.4 Minh họa thuật toán Gradient descent 8 1.5 Tổng quan về kiến trúc mạng neuron tích chập (CNN) và quy trình đào tạo 12 1.6 Minh họa lớp tích chập 12 1.7 Tổng quan về kiến trúc Faster R-CNN 14 1.8 IoU - Intersection over union 18 1.9 Precision-recall curve 19 1.10 Ức chế không tối đa (NMS) 20 2.1 Dòng thời gian của các phiên bản YOLO 22 2.2 Dự đoán đầu ra YOLO 24 2.3 Hàm YOLO cost 25 2.4 Anchor boxes 27 2.5 Dự đoán bounding boxes 27 2.6 YOLOv3 Darknet-53 backbone 30 2.7 YOLOv3 Kiến trúc phát hiện đa quy mô 30 2.8 Kiến trúc của mô hình phát hiện vật thể hiện đại 31 2.9 Kiến trúc YOLOv4 33 2.10 Kiến trúc YOLOv5 35 2.11 Sự khác biệt giữa YOLOv3 head và YOLOX decoupled head 38 2.12 Kiến trúc YOLOv6 39 2.13 Kiến trúc YOLOv7 40 2.14 Kiến trúc YOLOv8 43 2.15 Kiến trúc PP-YOLOE 46 2.16 Kiến trúc YOLO-NAS 48 2.17 Kiến trúc ViT-YOLO 50 vii 3.1 Một số ví dụ minh họa về tập dữ liệu 53 3.2 Minh họa về bảng dữ liệu chứa trong file csv 54 3.3 Phân phối về ghi chú của mỗi bệnh nhân 54 3.4 Phân phối về ghi chú của mỗi bệnh nhân 55 3.5 Phân phối về số lượng chú thích của các bác sĩ 55 3.6 Intersection over Union 56 3.7 Xử lý dữ liệu trên những ảnh có bounding box chồng lên nhau 56 3.8 Cấu hình cho hình ảnh và nhãn tương ứng để đào tạo mô hình YOLO 57 3.9 Sử dụng mô hình YOLOv7 để dự báo bất thường trên ảnh X-quang lồng ngực 60 3.10 Mô tả quy trình của hệ thống thử nghiệm dành cho người dùng 60 3.11 Giao diện hệ thống thử nghiệm dành cho người dùng 61 1 Mở đầu Trí tuệ nhân tạo (AI) đang có tác động rất lớn đến hầu hết các lĩnh vực khoa học, đặc biệt là lĩnh vực y tế Ngày nay, trí tuệ nhân tạo đang được ứng dụng để phát hiện, chẩn đoán và can thiệp sớm nhiều bệnh lý ở người Một số nghiên cứu đã sử dụng AI để chẩn đoán các bệnh như tiểu đường [1], viên giác mạc [2], chẩn đoán ung thư gan [3], dự đoán bại não [4], Đây là một bước tiến tiên phong trong việc phát hiện và điều trị bệnh AI cũng giúp các hệ thống chăm sóc sức khỏe dễ dàng chuyển trọng tâm và nguồn lực từ chữa bệnh sang phòng ngừa Trong chẩn đoán các bệnh lý về phổi, chụp X-quang là một trong những xét nghiệm cận lâm sàng cực kì quan trọng Thông qua kỹ thuật này, bác sĩ sẽ nhanh chóng phát hiện các bất thường và lên kế hoạch điều trị bệnh phù hợp nhất; đồng thời theo dõi tình trạng hồi phục của người bệnh nếu đang trong thời gian điều trị Trong phạm vi hiểu biết của tác giả, hiện đã có nhiều nghiên cứu ứng dụng AI trong việc hỗ trợ phát hiện sớm dấu hiệu bệnh lý từ ảnh X-quang phổi Tuy nhiên, cùng với cơ hội, ứng dụng AI trong những tình huống như vậy cũng đang phải đối diện với không ít thách thức, chẳng hạn như: thiếu các bộ dữ liệu chuẩn hóa và khả năng diễn giải của các mô hình AI còn hạn chế Đó là lý do thúc đẩy tác giả chọn đề tài này Có thể nói hai thành phần chủ yếu quyết định hiệu quả của việc ứng dụng AI trong việc hỗ trợ chẩn đoán bệnh lý về phổi là một mô hình học máy đủ tốt và một bộ dữ liệu đủ tốt Các bệnh lý về phổi thường xuất hiện dưới dạng một vùng trên phim chụp X-quang ngực Có nhiều mô hình máy học giúp phát hiện tổn thương phổi trên ảnh X-quang dựa trên những kỹ thuật phát hiện đối tượng khác nhau, chẳng hạn như: CNN, Mask RCNN, Faster R-CNN, YOLO, và đều cho kết quả khá tốt trong một số nghiên cứu trên một số dữ liệu phim chụp X-quang phổi [5? , 6] Các phiên bản cải tiến gần đây của mô hình cuối cùng dường như tỏ ra vượt trội hơn về mặt hiệu năng và vẫn còn là chủ đề cho nhiều hướng phát triển tiếp nối Để xây dựng một mô hình phù hợp cho mục đích nghiên cứu, một bộ dữ liệu kiểm thử đủ tốt là yếu tố không thể thiếu, chẳng hạn, ChestX-ray14 [6] phát hành bởi Viện Y tế Quốc gia Hoa Kỳ (NIH) Gần đây, Viện Nghiên cứu Dữ liệu lớn VinBigdata, Tập đoàn