Ứng dụng kỹ thuật học sâu hỗ trợ phát hiện và phân loại một số bệnh lý về phổi trên ảnh chụp x quang phổi

ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Đo kích thước hộp sọ dựa hệ thống điểm tham chiếu chuẩn so sánh kích thước hai nhóm khoẻ mạnh bị hội chứng rượu thai nhi chuột sử dụng ảnh cắt lớp điện toán NGUYỄN ĐỨC TRUNG TRUNG.ND2022M@sis.hust.edu.vn Ngành Kỹ thuật Y sinh Giảng viên hướng dẫn: TS Nguyễn Thu Vân Trường: Điện – Điện tử HÀ NỘI, 2023 ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Đo kích thước hộp sọ dựa hệ thống điểm tham chiếu chuẩn so sánh kích thước hai nhóm khoẻ mạnh bị hội chứng rượu thai nhi chuột sử dụng ảnh cắt lớp điện toán NGUYỄN ĐỨC TRUNG TRUNG.ND2022M@sis.hust.edu.vn Ngành Kỹ thuật Y sinh Giảng viên hướng dẫn: TS Nguyễn Thu Vân Trường: Điện – Điện tử HÀ NỘI, 2023 Chữ ký GVHD CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn: Nguyễn Đức Trung Đề tài luận văn: Đo kích thước hộp sọ dựa hệ thống điểm tham chiếu chuẩn so sánh kích thước hai nhóm khoẻ mạnh bị hội chứng rượu thai nhi chuột sử dụng ảnh cắt lớp điện toán Chuyên ngành: Kỹ thuật Y sinh Mã số SV: 20202766M Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 26/04/2023 với nội dung sau: - Đã chỉnh sửa lỗi tả tên đề tài luận văn với tên đề tài định bảo vệ - Đã chỉnh sửa lỗi tả, cụm từ phù hợp sử dụng luận văn - Đã chỉnh sửa làm rõ thích hình vẽ - Đã chỉnh sửa, trình bày lại luận văn theo form mẫu quy định - Đã chỉnh sửa trình bày tài liệu tham khảo theo quy định Ngày tháng năm Giáo viên hướng dẫn Tác giả luận văn TS Nguyễn Thu Vân Nguyễn Đức Trung CHỦ TỊCH HỘI ĐỒNG GS.TS Nguyễn Đức Thuận LỜI CẢM ƠN Tôi xin chân thành cảm ơn giảng viên hướng dẫn cô TS Nguyễn Thu Vân hướng dẫn, hỗ trợ động viên q trình thực đề tài Cơ dành nhiều thời gian tâm huyết để giúp tơi hồn thành nghiên cứu Những kiến thức kinh nghiệm quý báu mà cô chia sẻ giúp nắm bắt nhiều thơng tin hữu ích tiếp cận với phương pháp nghiên cứu đề tài dễ dàng Tôi muốn gửi lời cảm ơn đến chuyên gia, nhà nghiên cứu, quan tổ chức có liên quan đến đề tài nghiên cứu cung cấp tài liệu thông tin quý báu giúp tiến hành nghiên cứu cách xác hiệu Ngồi ra, tơi xin gửi lời cảm ơn đến gia đình, bạn bè người thân yêu động viên, hỗ trợ tạo điều kiện cho tơi hồn thành đề tài nghiên cứu cách hồn thiện Hà Nội, ngày tháng Tác giả năm 2023 Nguyễn Đức Trung MỤC LỤC DANH MỤC TỪ VIẾT TẮT DANH MỤC HÌNH ẢNH DANH MỤC BẢNG CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 Tổng quan phổi 1.1.1 Vị trí, cấu tạo chức phổi 1.1.2 Những dấu hiệu bất thường phổi 10 1.2 Bệnh lý phổi 10 1.2.1 Những bệnh lý phổi thường gặp 10 1.2.2 Các bệnh phổi phổ biến 10 1.2.3 Các bệnh phổi khác 12 1.2.4 Các bệnh lý phổi xuất tập liệu 12 1.3 X-quang ngực 15 1.3.1 Ảnh X-quang ngực 15 1.3.2 Nguyên lý chụp X-quang 15 1.3.3 Chụp X-quang ngực 16 CHƯƠNG TRANSFER LEARNING 19 2.1 Mạng nơ ron tích chập 19 2.2 Cấu trúc mạng nơ ron tích chập 19 2.2.1 Lớp tích chập 20 2.2.2 Lớp gộp 22 2.2.3 Lớp kết nối đầy đủ 23 2.3 Tổng quang transfer learning 23 2.4 Pre-Trained Model 23 2.5 Những kịch transfer learning 24 2.6 Các cách để tinh chỉnh mơ hình 25 2.7 Lợi ích hạn chế 26 2.8 Các Pretrained model sử dụng luận án 27 2.8.1 ImageNet 28 2.8.2 Mơ hình VGG-16 28 2.8.3 Mơ hình DenseNet121 32 CHƯƠNG MỘT SỐ NGHIÊN CỨU LIÊN QUAN 34 3.1 ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases 34 3.2 CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning 36 3.3 Tập liệu NIH 37 3.4 CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison 39 3.5 Tập liệu CheXpert 41 3.6 VinBigData Chest X-ray Abnormalities Detection 42 3.6.1 Tập liệu VinBigData 43 CHƯƠNG ÁP DỤNG KĨ THUẬT HỌC SÂU ỨNG VỚI TỪNG TẬP DỮ LIỆU 45 4.1 Công cụ sử dụng 45 4.2 Tập liệu NIH 46 4.2.1 Dán nhãn liệu 46 4.2.2 Phương pháp tiến hành 47 4.3 Tập liệu Chexpert 52 4.3.1 Dán nhãn liệu 52 4.3.2 Xây dựng mơ hình 53 4.4 Tập liệu Dicom VinBigData 57 4.4.1 Tiền xử lý ảnh Dicom 57 4.4.2 Kịch thứ nhất: Huấn luyện với tập liệu CheXpert kiểm thử với VinBigData 58 4.4.3 Kịch thứ hai: Huấn luyện với tập liệu VinBigData kiểm thử với CheXpert 58 4.4.4 Kịch thứ ba: Trộn tập liệu dùng cho huấn luyện kiểm thử 58 CHƯƠNG KẾT QUẢ VÀ THẢO LUẬN 59 5.1 Tập liệu NIH 59 2|Page 5.2 Tập liệu CheXpert 61 5.2.1 Mơ hình mặt cắt trực diện 61 5.2.2 Mơ hình mặt cắt bên 62 5.2.3 Mơ hình ensemble 62 5.3 Tập liệu Dicom VinBigData 64 5.3.1 Kịch thứ 64 5.3.2 Kịch thứ hai 66 5.3.3 Kịch thứ ba 68 KẾT LUẬN 70 TÀI LIỆU THAM KHẢO 71 3|Page DANH MỤC TỪ VIẾT TẮT CNN Mạng Nơ-ron Tích Chập CO2 Carbon dioxide Conv Lớp tích chập COPD Bệnh phổi tắc nghẽn mãn tính DCNN Mơ hình học sâu ILSVRC Thử thách Phân loại Hình ảnh Quy mô Lớn ImageNet NIH Viện Y tế Quốc gia ReLU Đơn vị tuyến tính chỉnh lưu RGB Giá trị màu sắc hình SGD Gradient Descent Ngẫu Nhiên 4|Page DANH MỤC HÌNH ẢNH Hình 1.1 Cấu tạo sơ lược phổi người Hình 1.2 Ảnh X-quang bệnh xẹp phổi 13 Hình 1.3 Ảnh X-quang ngực có xâm lấn bên trái 14 Hình 1.4 Ảnh X-quang tràn dịch màng phổi bên phải 15 Hình 1.5 Máy tạo ảnh X-quang 16 Hình 2.1 Kiến trúc mơ hình CNN 20 Hình 2.2 Phép tích chập 20 Hình 2.3 Cách di chuyển lọc 21 Hình 2.4 Các kiểu phép gộp 22 Hình Cấu trúc dạng Transfer learning 24 Hình Chiến lược áp dụng transfer learning 25 Hình So sánh tương quan hiệu model train từ đầu transfered model 27 Hình ImageNet 28 Hình Cấu trúc lớp mơ hình VGG-16 29 Hình 10 Kiến trúc chi tiết mơ hình VGG-16 29 Hình 11 Kiến trúc tổng quan mơ hình VGG 30 Hình 12 DenseNet (2016) 32 Hình 13 Khối lớp tích chập với kết nối lại 33 Hình 14 Kiến trúc DenseNet cho ImageNet 33 Hình Quy trình tổng quan bao gồm kiến trúc mơ hình DCNN Xiaosong Wang q trình xác định vị trí bệnh lý 35 Hình Hình ảnh tập liệu NIH 38 Hình 3 Thông tin ảnh tập liệu NIH 39 Hình Mơ mục tiêu nghiên cứu 40 Hình Ảnh X-quang bệnh nhân tập liệu CheXpert 42 Hình Thư mục tập liệu CheXpert 42 5|Page Hình Cuộc thi Phát bất thường ảnh X-quang lồng ngực VinBigdata 43 Hình Kết mơ hình Mohamed Arshath 43 Hình Giao diện Google Colaboratory 45 Hình Cấu hình phần cứng Google Colab cung cấp 45 Hình Chia liệu trước đưa vào mơ hình 46 Hình 4 Mơ hình VGG16 mơ hình VGG16 khơng có lớp fully connected .47 Hình Cấu trúc mơ hình VGG16 tơi xây dựng .48 Hình Lưu đồ mơ hình VGG16 .49 Hình Cấu trúc mơ hình DenseNet121 tơi xây dựng 50 Hình Lưu đồ mơ hình DenseNet121 50 Hình Cấu trúc mơ hình gộp 51 Hình 10 Ảnh mặt cắt ngực .53 Hình 11 Kiến trúc mơ hình tập liệu CheXpert .54 Hình 12 Lưu đồ mơ hình 56 Hình Accuracy mơ hình VGG16 59 Hình Accuracy mơ hình DenseNet121 59 Hình Accuracy mơ hình gộp 59 Hình Accuracy mơ hình mặt cắt trực diện 61 Hình 5 Loss mơ hình mặt cắt bên 61 Hình Accuracy mơ hình mặt cắt bên 62 Hình Loss mơ hình mặt cắt bên 62 Hình Accuracy mơ hình kịch thứ 64 Hình Loss mơ hình kịch thứ 65 Hình 10 Accuracy kịch thứ 66 Hình 11 Loss kịch thứ 67 Hình 12 Accuracy kịch thứ 68 Hình 13 Loss kịch thứ 69 6|Page 4.4.2 Kịch thứ nhất: Huấn luyện với tập liệu CheXpert kiểm thử với VinBigData Với kịch sử dụng tập liệu CheXpert để huấn luyện, với tỉ lệ 6:1 tương ứng với số lượng ảnh tập huấn luyện kiểm thử 30000 5000 Số lượng ảnh nhãn Khơng có bệnh bệnh Effusion tập Mô hình huấn luyện tơi sử dụng mơ hình gộp áp dụng với tập liệu NIH (Hình 5.9) Mỗi lớp tích hợp VGG16 DenseNet121 trích xuất tính riêng cách hồn tồn riêng biệt đưa vào lớp phân loại thu độ xác cao epoch để có kết cao Feature map sau qua mơ hình VGG16 làm phẳng để trở thành vectơ có kích thước 25088 Densenet sau qua lớp 2D average pooling để trích xuất đặc trưng tiêu biểu vectơ có kích thước 1024 Các vectơ kết hợp sau qua lớp gộp mơ hình Vectơ có kích thước 26112, lớp kết nối đầy đủ có 128 nút ẩn với hàm kích hoạt ReLu Cuối cùng, lớp sigmoid sử dụng để tính tốn điểm xác suất Hàm tối ưu hóa “Adam” hàm mát “binary cross entropy” áp dụng với learning rate 1e-5 4.4.3 Kịch thứ hai: Huấn luyện với tập liệu VinBigData kiểm thử với CheXpert Ngược lại với kịch thứ nhất, với kịch dùng tập liệu VinBigData để huấn luyện Tham số mơ cấu trúc mơ hình nhãn giữ giống với kịch thứ Tỉ lệ số lượng ảnh tập train valid giữ 6:1 tương ứng với 1680 280 Sau thu trọng số mô hình tiến hành kiểm nghiệm ảnh từ tập liệu CheXpert 4.4.4 Kịch thứ ba: Trộn tập liệu dùng cho huấn luyện kiểm thử Với kịch này, thử trộn ảnh tập liệu để xây dựng bên liệu tổng hợp từ liệu số lượng ảnh nhãn liệu tập liệu Điều có nghĩa với tập huấn luyện có 3360 ảnh 1680 ảnh tập CheXpert nửa lại tập liệu VinBigData, tương tự 560 ảnh dùng cho kiểm thử Số lượng ảnh nhãn với tập huấn luyện kiểm thử Sau chia ảnh vào tập huấn luyện kiểm thử giữ lại 10% ảnh lại nhãn Effusion để dành cho việc kiểm tra kết sau huấn luyện, số lượng ảnh nhãn Khơng có bệnh tập liệu CheXpert lấy theo tương đương theo tỉ lệ 1:1 Tham số mơ cấu trúc mơ hình giữ ngun kịch 58 | P a g e CHƯƠNG KẾT QUẢ VÀ THẢO LUẬN 5.1 Tập liệu NIH Dưới kết sau huấn luyện với VGG16, DenseNet121 mơ hình gộp với tốn phân loại ảnh bệnh Atelectasis ảnh Khơng có bệnh: Hình Accuracy mơ hình VGG16 Hình Accuracy mơ hình DenseNet121 Hình Accuracy mơ hình gộp Bảng Accuracy, loss AUROC mơ hình 59 | P a g e Độ xác kết hợp VGG16 DenseNet121 cao kết thu sau epoch VGG16 epoch DenseNet121 epoch Kết giải thích tương trợ lẫn loại mơ hình VGG16 hoạt động tốt với vấn đề phân loại hình ảnh DenseNet121 hoạt động với liệu lớn tránh bị overfitting Độ xác điểm AUROC với bệnh Infiltration mơ hình gộp cao so với VGG16 DenseNet121 Thảo luận: Đối với nhãn bệnh Infiltration, tiến hành tương tự với nhãn bệnh Atelectasis bảng so sánh kết mơ hình gộp với mơ hình nghiên cứu Wang et al (2017) [12], Yao et al (2017) [15], CheXNet of Pranav Rajpurkar [13] Bảng So sánh kết AUC với nghiên cứu khác Pathology Wang et al Yao et al CheXNet Concatenate model(ours) Atelectasis 0.716 0.772 0.8094 0.8522 Infiltration 0.609 0.695 0.7345 0.8185 Như thấy mơ hình gộp cho kết tốt kết [12], [15], [13] Nguyên nhân việc liệt kê đây: - Trong nghiên cứu [12], [15], [13], họ sử dụng phân loại nhị phân phương pháp họ sử dụng one with the rest Điều có nghĩa bệnh đưa đầu tất bệnh lại đưa đầu khác Trong trường hợp này, hai lớp khơng phân biệt hồn tồn Bởi hình ảnh chụp X-quang ngực, dấu hiệu để nhận biết bệnh lý giống Điều thách thức lớn với bác sĩ chuyên khoa Đây công việc khó khăn để phân loại dựa hình ảnh Ví dụ: Atelectasis nhiều thùy phổi (phần) phổi bị sụp tắc nghẽn áp lực bên bên ngồi ống thơng phổi phổi Infiltration biểu cho có thứ "xâm nhập" vào phần chứa khơng khí phổi Tuy nhiên, lấy hình ảnh X-quang bệnh này, chúng giống Đó lý máy tính sai gọi nhiễu có số đồ đặc trưng giống từ đầu Trong đó, với dự án tơi, tơi chia thành lớp: bình thường loại bệnh Hai lớp hoàn toàn khác Điều làm cho kết tơi cao so với báo 60 | P a g e - - 5.2 Một lý khác đến từ khác biệt tỷ lệ thư mục huấn luyện thư mục xác thực siêu tham số mà tơi chọn cho mơ hình Điều ảnh hưởng đến kết Lý cuối khác biệt cấu trúc mơ hình mà tơi sử dụng so với báo khác Tập liệu CheXpert 5.2.1 Mơ hình mặt cắt trực diện Độ xác mơ hình mặt cắt trực diện 87.25% AUC 0.9373 Kết nhận sau epoch Hình Accuracy mơ hình mặt cắt trực diện Hình 5 Loss mơ hình mặt cắt bên 61 | P a g e 5.2.2 Mơ hình mặt cắt bên Với mơ hình bên, độ xác 88.43% AUC 0.9557 Kết nhận sau epoch Hình Accuracy mơ hình mặt cắt bên Hình Loss mơ hình mặt cắt bên 5.2.3 Mơ hình ensemble So sánh độ xác mơ hình ensemble với mơ hình trực diện với bệnh tràn dịch màng phổi Bảng 62 | P a g e Bảng Bảng so sánh kết độ xác mơ hình ensamble mơ hình trực diện Number of patient Model Accuracy 200 Ensemble model 89% 200 Frontal model 80% 550 Ensemble model 88.19% 550 Frontal model 80.9% 2000 Ensemble model 85.5% 2000 Frontal model 79% So sánh kết AUROC mơ hình ensemble với mơ hình Jeremy Irvin [6] số lượng bệnh nhân (200 bệnh nhân) Bảng Mơ hình Jeremy Irvin mơ hình sửa đổi từ kiến trúc Densenet121 Bảng Bảng so sánh kết AUROC mơ hình ensemble mơ hình Jeremy Irvin Pathology Jeremy Irvin et al(U- Jeremy Irvin et Ensemble model al(U-Zeros ) Ignore) Pleural effusion 0.928 0.931 0.9531 Thảo luận: Theo bảng trên, thấy điểm AUROC mơ hình ensemble cao mơ hình Jeremy Irvin Kết khác phương pháp xây dựng mơ hình Sự khác biệt phương pháp đây: • Với phương pháp Jeremy Irvin, họ sử dụng ảnh mặt cắt để huấn luyện kiểm tra Họ chạy mơ hình ba lần lấy tập hợp 30 điểm kiểm tra tạo tập hợp xác thực Trong huấn luyện mặt cắt với mơ hình riêng biệt Sau đó, lấy kết mơ hình tập hợp với trọng số • Với cách dán nhãn tập liệu phương pháp [6], chúng phân chia theo “một nhãn bệnh phần lại” Trong tơi chia thành nhãn hồn tồn riêng biệt: Bình thường nhãn bệnh Hai nhãn có nhiều điểm 63 | P a g e khác đặc điểm bệnh lý ảnh bị trùng nhãn với Đó lý kết tốt • Sự khác biệt tỷ lệ số lượng ảnh train test Tôi sử dụng tỉ lệ 6: tương ứng với tỷ lệ số lượng ảnh train test họ sử dụng 7: 5.3 Tập liệu Dicom VinBigData 5.3.1 Kịch thứ Với kịch sử dụng tập liệu CheXpert để huấn luyện, với tỉ lệ 6:1 tương ứng với số lượng ảnh tập huấn luyện kiểm thử 30000 5000 Số lượng ảnh nhãn Khơng có bệnh bệnh Effusion tập Sau epoch kết mà tơi thu là: Hình Accuracy mơ hình kịch thứ 64 | P a g e Hình Loss mơ hình kịch thứ Như ta thấy mơ hình đạt accuracy lớn 0.8738 sau epoches So sánh kết với mơ hình dùng để huấn luyện cho mặt cắt tập liệu CheXpert ta Bảng 5 So sánh kết mơ hình gộp kết mơ hình mặt cắt phần trước Mơ hình mặt cắt diện Mơ hình mặt cắt bên Mơ hình gộp 87.25% 88.43% 87.38% Accuracy Sau huấn luyện mơ hình tơi tiến hành test ảnh tập liệu VinBigData khảo sát 100, 200, 500 ảnh đạt kết sau: Bảng Kết sau thử nghiệm với VinBigData Số lượng ảnh khảo sát Nhãn khơng có bệnh Nhãn bệnh Effusion 100 95% 56% 200 95% 61% 500 93.8% 57.2% Thảo luận: Đầu tiên so sánh kết accuracy mơ hình gộp mơ hình mặt cắt diện mặt cắt bên tập liệu CheXpert ta thấy mơ hình gộp khơng cho kết bật đáng kể so với mơ hình cịn lại (được huấn luyện 65 | P a g e mơ hình DenseNet121), chí cịn thấp so với mơ hình mặt cắt bên Ngun nhân accuracy mơ hình gộp thấp mơ hình mặt cắt bên tơi dùng ảnh mặt cắt để huấn luyện cho mơ hình gộp khơng phân tách riêng biệt mơ hình mặt cắt bên Vì lý nên thử nghiệm với tập liệu CheXpert phần trên, tơi khơng dùng mơ hình gộp để huấn luyện với tập liệu Sau đó, kiểm nghiệm với tập liệu VinBigData, ta thấy nhãn khơng có bệnh cho kết dự đoán tốt hẳn so với nhãn bệnh Effusion Điều lý giải việc ảnh tập liệu Dicom có nhiều nhãn bệnh lý Và ta biết bệnh lý thể ảnh X-quang tương đồng, khó để phân biệt Hơn với việc sử dụng phân loại đầu nhãn bệnh góp phần khiến kết kiểm nghiệm thiếu xác Một nguyên nhân dẫn đến chênh lệch kết nhãn Khơng có bệnh bệnh Effusion chênh lệch số lượng ảnh dán nhãn tập liệu VinBigData Số lượng ảnh Khơng có bệnh chiếm phần lớn tập liệu (10606 ảnh số 18000 ảnh tập liệu) số lượng ảnh nhãn bệnh Effusion chiếm tỉ trọng nhỏ tập liệu (1032 ảnh số 18000 ảnh tập liệu) Sự chênh lệch số lượng ảnh phần ảnh hưởng đến kết kiểm nghiệm sai sót đến từ việc dán nhãn liệu tập liệu gốc ban đầu 5.3.2 Kịch thứ hai Sau huấn luyện mơ hình với 20 epoch tơi thu kết sau: Hình 10 Accuracy kịch thứ 66 | P a g e Hình 11 Loss kịch thứ Như ta thấy mơ hình đạt accuracy cao 0.9393 sau 16 epoches Sau huấn luyện mơ hình tơi tiến hành test ảnh tập liệu CheXpert khảo sát 100, 200, 500 ảnh đạt kết sau: Bảng Kết sau thử nghiệm với CheXpert Số lượng ảnh khảo sát Nhãn khơng có bệnh Nhãn bệnh Effusion 100 47% 90% 200 45.5% 86% 500 46.8% 88% Thảo luận: Sau huấn luyện với tập liệu VinBigData, mơ hình cho kết accuracy 0.9393 sau 16 epoch Kết so sánh với mơ hình Mohamed Arshath thi mơ hình Mohamed Arshath cho kết tốt Bảng So sánh kết accuracy mơ hình Accuracy Mơ hình Mohamed Arshath Mơ hình 0.951511 0.9393 67 | P a g e Phương pháp Mohamed Arshath cho kết tốt khác kiến trúc mơ phương pháp thực liệt kê đây: Phương pháp Mohamed Arshath sử dụng kích thước ảnh đầu vào 256x256 tơi sử dụng cho mơ hình 224x224 - Mohamed Arshath sử dụng Transfer learning áp dụng với mô hình Resnet34 tơi sử dụng mơ hình gộp VGG-16 DenseNet121 - Một lý đến từ cách chọn số lượng ảnh cho tập huấn luyện kiểm thử Sau hoàn tất huấn luyện mơ hình kiểm nghiệm với tập liệu CheXpert ngược lại với kịch nhãn bệnh Effusion lại cho kết tốt hẳn so với nhãn khơng có bệnh Tương tự với kịch thứ kịch chênh lệch kết hai nhãn Khơng có bệnh bệnh Effusion chênh lệch số lượng ảnh dán nhãn tập liệu CheXpert Số lượng ảnh bệnh Effusion chiếm phần lớn tập liệu (75696 ảnh số 224316 ảnh tập liệu) số lượng ảnh nhãn Khơng có bệnh chiếm tỉ trọng nhỏ tập liệu (16627 ảnh số 224316 ảnh tập liệu) Sự chênh lệch số lượng ảnh phần ảnh hưởng đến kết kiểm nghiệm sai sót đến từ việc dán nhãn liệu tập liệu gốc ban đầu - 5.3.3 Kịch thứ ba Sau huấn luyện với 20 epoch, tơi thu kết sau: Hình 12 Accuracy kịch thứ 68 | P a g e Hình 13 Loss kịch thứ Mơ hình đạt dược accuracy cao 0.8875 sau 20 epoch Sau tơi tiến hành kiểm thử thu kết Đối với việc kiểm thử sử dụng 10% số lượng ảnh sau chia vào tập huấn luyện kiểm thử Bảng Kết kiểm nghiệm với ảnh tập liệu Tập liệu Nhãn khơng có bệnh Nhãn bệnh Effusion CheXpert 84.37% 73.43% Dicom 98.43% 84.61% Thảo luận: Đối với kịch không thấy xuất hiện tượng kết kiểm nghiệm bị chênh lệch nhiều nhãn đầu với kịch trước Khi kiểm thử với tập liệu VinBigData kết cho tốt so với tập liệu CheXpert 69 | P a g e KẾT LUẬN Luận văn tiến hành kiểm nghiệm ba tập liệu, với tập liệu xây dựng phương pháp riêng để ứng dụng kĩ thuật học sâu Kết cho thấy phương pháp đạt độ xác khoảng 77% tập liệu NIH, 89% tập liệu CheXpert 94% tập liệu VinBigData Trong số kết có kết thể tốt so với nghiên cứu khác, nhiên có kết thấp so sánh với nghiên cứu khác tập liệu Thông qua luận văn này, tơi hy vọng góp phần đưa phân loại ban đầu bệnh lý phổi ảnh X-quang, giúp bác sĩ lâm sàng giảm thiểu thời gian chuẩn đoán tăng tính xác cho chuẩn đốn 70 | P a g e TÀI LIỆU THAM KHẢO [1] BSCKI Vũ Thanh Tuấn, Phổi người: Cấu tạo chức bệnh thường gặp phổi [Online]: https://medlatec.vn/tin-tuc/phoi-nguoi-cau-tao-chucnang-va-cac-benh-thuong-gap-o-phoi-s64-n31434 [2] Lê Nga, Hơn 20.000 người Việt chết ung thư phổi năm [Online]: https://vnexpress.net/suc-khoe/hon-20-000-nguoi-viet-chet-vi-ung-thu-phoimoi-nam-3835948.html [3] Robert M Castellan, Richard E Manrow, Thomas Richards, Judith J Smith, Mary White Lung disease [Online]: https://www.womenshealth.gov/a-ztopics/lung-disease [4] Bác sĩ Trần Thị Kim Ngọc, Nguyên nhân triệu chứng xẹp phổi cách điều trị [Online]: https://medlatec.vn/tin-tuc/nguyen-nhan-trieu-chung-xep-phoi-vacach-dieu-tri-s64-n22291 [5] Richard W Light, MD, Vanderbilt University Medical Center Tràn dịch màng phổi [Online]:https://www.msdmanuals.com/vi-vn/chuy%C3%AAngia/r%E1%BB%91i-lo%E1%BA%A1n-ch%E1%BB%A9c-n%C4%83ngh%C3%B4-h%E1%BA%A5p/c%C3%A1c-b%E1%BB%87nh-l%C3%BDtrung-th%E1%BA%A5t-v%C3%A0-m%C3%A0ngph%E1%BB%95i/tr%C3%A0n-d%E1%BB%8Bch-m%C3%A0ngph%E1%BB%95i [6] Kelly B, Ulster Med J The chest radiograph 2012 [7] Keshav Dhandhania How to understand Gradient Descent, the most popular ML algorithm 18 June 2018 [Online]: https://www.freecodecamp.org/news/understanding-gradient-descent-the-mostpopular-ml-algorithm-a66c0d97307f/ [8] Viet Huynh Tìm hiểu mạng nơron tích chập (convolutional neural networks) [Online]:https://thanhvie.com/tim-hieu-ve-mang-no-ron-tichchap-convolutional-neuralnetworks/#:~:text=M%E1%BA%A1ng%20n%C6%A1ron%20t%C3%ADc h%20ch%E1%BA%ADp%20(c%C3%B2n,%C4%91%E1%BB%91i%20t %C6%B0%E1%BB%A3ng%20n%C3%A0y%20v%E1%BB%9Bi%20nha u 71 | P a g e [9] Nguyen Viet Hoai Tổng quan kỹ thuật transfer learning domain adaptation [Online]:https://viblo.asia/p/domain-adaptation-p1-tong-quan-ve-ky-thuattransfer-learning-va-domain-adaptation-L4x5xV8qZBM [10] Muneeb ul Hassan, VGG16 – Convolutional Network for Classification and Detection [Online]: https://neurohive.io/en/popular-networks/vgg16/ [11] Gao Huang, Zhuang Liu, Laurens van der Maaten, Densely Connected Convolutional Networks [Online]: https://arxiv.org/pdf/1608.06993.pdf [12] Xiaosong Wang, Yifan Peng, Le Lu, Zhiyong Lu, Mohammadhadi Bagheri, Ronald M Summers ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases [13] Pranav Rajpurkar, Jeremy Irvin, Kaylie Zhu, …, Matthew P Lungren, Andrew Y Ng CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning [14] VinGroup VinBigData Chest X-ray Abnormalities Detection - Automatically localize and classify thoracic abnormalities from chest radiographs https://www.kaggle.com/competitions/vinbigdata-chest-xray[Online]: abnormalities-detection/overview [15] Li Yao, Eric Poblenz, Dmitry Dagunts, Ben Covington, Devon Bernard, Kevin Lyman Learning to diagnose from scratch by exploiting dependencies among labels [16] Jeremy Irvin, Pranav Rajpurkar, Michael Ko, …, Andrew Y Ng CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison [17] Cuộc thi Xử lý ảnh y tế quy mô tồn cầu với tổng giải thưởng 50.000 USD thức khởi động [Online]: https://institute.vinbigdata.org/events/vingroup-to-chuc-cuoc-thi-xu-ly-anhy-te-quy-mo-toan-cau-voi-tong-giai-thuong-50-000-usd/ [18] Google Colab Là Gì Và Dùng Để https://codelearn.io/sharing/google-colab-la-gi Làm Gì? [Online]: [19] Mohamed Arshath VinBigData Chest X-ray Abnormalities Detection [Online]:https://www.kaggle.com/code/marshath/valleydao-vinbigdataclassification/notebook 72 | P a g e

Định dạng
Số trang	76
Dung lượng	2,27 MB