Chương 4 Thực nghiệm 40 4.1. Thiết lập thực nghiệm
4.2. Kết quả thực nghiệm
4.2.4. Trả lời câu hỏi RQ4: Các điểm hạn chế của phương pháp đề xuất là gì?
Mô hình U-Net kết hợp phân loại phân cấp có cấu trúc phức tạp hơn so với U-Net truyền thống do phải xử lý nhiều nhiệm vụ phân loại cùng lúc. Điều này dẫn đến việc tăng số lượng tham số trong mô hình, từ đó yêu cầu nhiều tài nguyên tính toán hơn và có thể kéo dài thời gian huấn luyện. Với nhiều nhánh phân loại và các
Mặc dù mô hình này chia sẻ đặc trưng giữa các nhiệm vụ nhưng nếu không được điều chỉnh đúng cách, mô hình có thể gặp phải tình trạng quá khớp trên các lớp cụ thể hoặc bị ảnh hưởng bởi các nhánh không liên quan.
Điều này đặc biệt xảy ra khi một trong các nhánh có hiệu suất kém, ảnh hưởng đến các nhánh khác. Nếu một trong các nhánh phân loại gặp khó khăn trong việc học, nó có thể kéo theo hiệu suất của các nhánh còn lại, do các đặc trưng được chia sẻ. Điều này có thể dẫn đến tình trạng một số nhiệm vụ không đạt được hiệu suất mong muốn. Để tận dụng được đầy đủ lợi ích của HC U-Net, cần có dữ liệu phong phú và cân bằng cho tất cả các nhiệm vụ phân loại, nếu dữ liệu không đồng đều giữa các lớp hoặc nhiệm vụ, mô hình có thể ưu tiên học các nhiệm vụ dễ hơn hoặc các lớp có nhiều dữ liệu hơn. Khi xử lý các bài toán phức tạp với nhiều cấp độ phân loại, việc thu thập và gán nhãn dữ liệu chính xác cho từng lớp có thể rất tốn kém và mất thời gian.Phương pháp này yêu cầu nhiều tài nguyên tính toán hơn so với các mô hình đơn nhiệm như U-Net hoặc U-Net++. Điều này có thể trở thành rào cản khi triển khai mô hình trong các ứng dụng thực tế, đặc biệt là trong các hệ thống yêu cầu thời gian thực hoặc có hạn chế về tài nguyên phần cứng, cùng với đó, do cấu trúc phức tạp và nhiều nhánh, việc triển khai HC U-Net trong môi trường sản xuất có thể gặp khó khăn, đặc biệt khi tích hợp với các hệ thống hiện có. Do tính chất đa nhiệm và phân cấp, việc giải thích tại sao mô hình đưa ra một quyết định cụ thể ở từng nhánh có thể trở nên khó khăn, đặc biệt trong các ứng dụng cần sự minh bạch như lĩnh vực y tế.
Kết luận thực nghiệm
Qua thực nghiệm trên tập dữ liệu KC về ung thư phổi của Bệnh viện Bạch Mai, phương pháp đề xuất cho thấy tính cạnh tranh với các phương pháp truyền thông đặc biệt là ưu điểm về thời gian huấn luyện và phân vùng. Phương pháp này giảm thiểu thời gian phân vùng ảnh chủ yếu nhờ vào việc sử dụng lại đặc trưng, tích hợp nhiều nhiệm vụ vào cùng một mô hình và tối ưu hóa quá trình huấn luyện và suy luận thay vì xử lý từng lớp phân loại một cách độc lập. Điều này không chỉ giảm thời gian xử lý mà còn hướng đến cải thiện hiệu suất tổng thể của mô hình. Trong tương lai, luận văn hướng đến tích hợp các kỹ thuật giúp giải thích các quyết định của mô hình học máy bằng cách tạo ra các mô hình giải thích cục bộ.
Từng dự đoán riêng lẻ sẽ được giải thích chi tiết để có thể đạt được hai mục tiêu chính là hiểu rõ hơn về cách HC U-Net đưa ra quyết định cho từng nhánh phân loại và xác định các yếu tố quan trọng hoặc nhạy cảm trong ảnh. Đồng thời, luận văn sẽ tiếp tục thực nghiệm trên các tập dữ liệu khác để chứng minh sự hiệu quả của phương pháp đề xuất.
Chương 5
Kết luận
Hiện nay, các mô hình phân vùng ảnh được phát triển và ứng dụng rộng rãi tuy nhiên với các tập dữ liệu đặc thù và trong một số điều kiện đặc biệt, các mô hình này chưa thật sự phát huy tác dụng và thể hiện kết quả rõ nét. Qua quá trình thực nghiệm trên tập dữ liệu KC về ung thư phổi của Bệnh viện Bạch Mai, phương pháp đề xuất đã chứng minh tính cạnh tranh và hiệu quả cao so với các phương pháp đơn nhiệm truyền thống như U-Net và U-Net++. Điểm mạnh chính của phương pháp nằm ở khả năng tối ưu hóa thời gian huấn luyện và phân vùng ảnh, nhờ vào việc sử dụng lại các đặc trưng giữa các nhiệm vụ phân loại và tích hợp nhiều nhiệm vụ vào cùng một mô hình duy nhất. Thay vì xử lý từng lớp phân loại một cách độc lập, mô hình áp dụng phương pháp phân loại phân cấp, giúp giảm thiểu thời gian xử lý và nâng cao hiệu suất tổng thể của mô hình. Phương pháp đề xuất đã đạt được độ chính xác cao trên các chỉ số đánh giá như IoU, độ nhạy, độ đặc hiệu và độ chính xác. Tuy nhiên, mô hình vẫn đối mặt với những thách thức như khả năng phân biệt chính xác các lớp nhỏ hoặc khó phân biệt, điều này có thể ảnh hưởng đến độ chính xác tổng thể. Hơn nữa, việc mô hình phải xử lý đồng thời nhiều nhiệm vụ phức tạp đòi hỏi lượng tài nguyên tính toán lớn, dẫn đến chi phí vận hành cao và thời gian huấn luyện kéo dài. Các thách thức từ sự phức tạp và độ tương phản thấp của ảnh y tế, đặc biệt là ảnh mô bệnh học, đã được đề cập trong phần tổng quan. Việc kết hợp giữa phân loại và phân vùng trong cùng một mô hình, mặc dù mang lại nhiều lợi ích về hiệu suất và thời gian, cũng đi kèm với những khó khăn nhất định.
Cấu trúc phức tạp của mô hình với nhiều nhánh phân loại đòi hỏi sự điều chỉnh cẩn thận các siêu tham số và tài nguyên tính toán lớn. Thêm vào đó, việc giải thích và hiểu rõ cách thức mô hình đưa ra quyết định trong các ứng dụng y tế là một thách thức không nhỏ, do tính chất chia sẻ đặc trưng giữa các nhánh phân loại.
Trong tương lai, để khắc phục những hạn chế này và nâng cao hiệu suất mô hình, luận văn sẽ tập trung vào việc tích hợp các kỹ thuật giúp giải thích các quyết định của mô hình học máy. Việc phát triển các mô hình giải thích cục bộ cho từng dự đoán riêng lẻ sẽ giúp hiểu rõ hơn về cách HC U-Net đưa ra quyết định cho từng nhánh phân loại. Điều này không chỉ cải thiện tính minh bạch trong các ứng dụng y tế mà còn giúp tăng độ tin cậy và sự chấp nhận của mô hình trong cộng đồng y tế. Hơn nữa, luận văn sẽ tiếp tục thực nghiệm trên các tập dữ liệu khác để đánh giá tính tổng quát và hiệu quả của phương pháp đề xuất. Những thực nghiệm này sẽ giúp chứng minh khả năng ứng dụng rộng rãi của mô hình trong các bài toán phân đoạn ảnh y tế khác, đặc biệt là trong các lĩnh vực yêu cầu độ chính xác cao và khả năng phân loại phức tạp như ung thư.
Kết quả thực nghiệm cũng chỉ ra rằng việc áp dụng phương pháp phân loại phân cấp trong phân đoạn ảnh y tế không chỉ giúp cải thiện hiệu suất mà còn tối ưu hóa thời gian và tài nguyên so với các phương pháp truyền thống. Tuy nhiên, để đạt được kết quả tối ưu, cần có sự cân nhắc kỹ lưỡng về mặt dữ liệu và tài nguyên tính toán. Việc áp dụng mô hình trong thực tế sẽ cần tiếp tục được nghiên cứu và điều chỉnh để phù hợp với các môi trường triển khai khác nhau, đặc biệt là trong các hệ thống yêu cầu thời gian thực hoặc có hạn chế về tài nguyên phần cứng.
Xét một cách tổng thể, phương pháp đề xuất đã cho thấy tiềm năng lớn trong việc cải thiện quá trình phân đoạn ảnh y tế, với những ưu điểm rõ rệt về thời gian và hiệu suất. Tuy nhiên, để phát huy hết tiềm năng của mô hình, luận văn cần tiếp tục nghiên cứu và tối ưu hóa nhằm khắc phục những hạn chế còn tồn tại và mở rộng khả năng ứng dụng trong các lĩnh vực y tế khác.
Tài liệu tham khảo
[1] Sebastian Ruder. An overview of multi-task learning in deep neural networks. ArXiv e-prints, 11 2017.
[2] Keiron O’Shea and Ryan Nash. An introduction to convolutional neural networks. ArXiv e-prints, 11 2015.
[3] Yipei Wang Mingyuan Liu Yubo Fan-Maode Lai Eric I-Chao Chang Yan Xu, Yang Li. Gland instance segmentation using deep multichannel neural networks. In Gland Instance Segmentation Using Deep Multichannel Neural Networks, pages 2901 – 2912, China, 2017. IEEE Transactions on Biomedical Engineering.
[4] Luping Zhou Lei Wang Zhimin Gao, Jianjia Zhang. Hep-2 cell image classification with convolutional neural networks. 2014 1st Workshop on Pattern Recognition Techniques for Indirect Immunofluorescence Images, 2014. doi: 10.1109/I3A.2014.15.
[5] Tell Bennett Debashis Ghosh Lin Yang Fuyong Xing, Toby C. Cornish.
Pixel-to-pixel learning with weak supervision for single-stage nucleus recognition in ki67 images. IEEE, 2019. doi: 10.1109/TBME.2019.2900378.
[6] Yen-Cheng Lin Ting-Chun Chen Chia-Heng Yen Nai-Chi Chiu Hsuen-En Hwang Chien-An Liu Jia-Guan Huang Rheun-Chuan Lee Yee Chao Shinn- Ying Ho Yi-Hsiang Huang I-Cheng Lee, Yung-Ping Tsai. A hierarchical fusion strategy of deep learning networks for detection and segmentation of hepatocellular carcinoma from computed tomography images. Cancer Imaging, jan 2024. ISSN 42. doi: 10.1186/s40644-024-00686-8.
[7] Purnendu Mishra-Rajiv Kumar Kiran Aatre Gursewak Singh- Shubham Mathur Akash Modi, Sumit Kumar Jha. Multi-stain multi-level convolutional network for multi-tissue breast cancer image segmentation, 2024.
[8] Yu Zhang Jing Chen Haixia Xu Gang Wang Wenlong Feng Yuchun Li, Mengxing Huang. Automated gleason grading and gleason pattern region segmentation based on deep learning for pathological images of prostate cancer. IEEE, pages 117714–117725, 2020. doi: 10.1109/ACCESS.2020.
3005180.
[9] Ruofeng Tong Hongjie Hu Qiaowei Zhang Yutaro Iwamoto Xianhua Han Yen-Wei Chen Jian Wu Huimin Huang, Lanfen Lin. Unet 3+: A full-scale connected unet for medical image segmentation. IEEE, 2020. doi: 10.1109/
ICASSP40776.2020.9053405.
[10] Ming Yang Shaoqing Chen Wanyi Xie, Dong Liu. Segcloud: a novel cloud image segmentation model using a deep convolutional neural network for ground-based all-sky-view camera observation. Atmospheric Measurement Techniques, pages 1953–1961, 2020. doi: 10.5194/amt-13-1953-2020.
[11] Erick Almara Jazhiel Chacón, J. Alberto Vázquez. Classification algorithms applied to structure formation simulations. Astronomy and Computing, 2021, Article 100527, 2021. doi: 10.48550/arXiv.2106.06587.
[12] Abdelsalam Maatuk Alhaam Alariyibi, Mohamed El-Jarai. Evaluating the accuracy of classification algorithms for detecting heart disease risk.
Machine Learning and Applications: An International Journal (MLAIJ), 2023. doi: 10.48550/arXiv.2312.04595.
[13] Eugenio Culurciello Alfredo Canziani, Adam Paszke. An analysis of deep neural network models for practical applications, 2016.
[14] Mohamed Batouche Meriem Bahi. Deep learning for ligand-based virtual screening in drug discovery. 2018 3rd International Conference on Pattern
[15] Weizhu Chen Jianfeng Gao Xiaodong Liu, Pengcheng He. Multi-task deep neural networks for natural language understanding. ArXiv e-prints, 5 2019.
[16] Xiaokang Liu Jin Huang Yishan Shen Ke Zhang Rong Zhou Eashan Adhikarla Wenxuan Ye Yixin Liu Zhaoming Kong-Kai Zhang Yilong Yin Vinod Namboodiri-Brian D. Davison Jason H. Moore Yong Chen Jun Yu, Yutong Dai. Unleashing the power of multi-task learning: A comprehensive survey spanning traditional, deep, and pretrained foundation model eras.
IEEE, 2024. doi: 10.48550/arXiv.2404.18961.
[17] Rosalind W. Picard D. Martinez. Multi-task neural networks for personalized pain recognition from physiological signals. Seventh International Conference on Affective Computing and Intelligent Interaction Workshops and Demos (ACIIW), 2017. doi: 10.1109/ACIIW.2017.8272611.
[18] Mahdieh Abbasi Louis-Émile Robitaille Boyu Wang Christian Gagné Fan Zhou, Changjian Shui. Task similarity estimation through adversarial multitask neural network. IEEE Transactions on Neural Networks and Learning Systems, pages 466–480, 10 2020. doi: 10.1109/TNNLS.2020.
3028022.
[19] Youli Dong Chunyi Yue Yongning Zou Guoping Xu, Hanqiang Cao.
Stochastic gradient descent with step cosine warm restarts for pathological lymph node image classification via pet/ct images. 2020. doi: 10.1109/
ICSIP49896.2020.9339360.
[20] Wen Shu Xiaobing Feng Yingchun Wang Pengju Yan Xiaolin Li Chulin Sha Min He unyu Li, Ye Zhang. Multi-proxy multi-gate mixture of experts network for multiple instance learning in histopathology image analysis, 2019.
[21] Darragh O’Brien Nam H. Trinh. Semi-supervised learning with generative adversarial networks for pathological speech classification. IEEE, 2020. doi:
10.1109/ISSC49989.2020.9180211.
[22] Zihao Wang Lihua Wang Yubo Ren Yudong Liu Xiaosong Rao Chunhou Zheng Fa Zhang Rui Yan, Fei Ren. A hybrid convolutional and recurrent