Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 92 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
92
Dung lượng
4,92 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM VÕ THỊ MỘT KHÓA LUẬN TỐT NGHIỆP PHÂN LOẠI COVID-19 TỪ HÌNH ẢNH X-QUANG BẰNG MÁY HỌC Classification of Coronavirus (COVID-19) from X-ray images using Machine learning KỸ SƯ KỸ THUẬT PHẦN MỀM TP HỒ CHÍ MINH, 2021 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM VÕ THỊ MỘT – 16520756 KHÓA LUẬN TỐT NGHIỆP PHÂN LOẠI COVID-19 TỪ HÌNH ẢNH X-QUANG BẰNG MÁY HỌC Classification of Coronavirus (COVID-19) from X-ray images using Machine learning KỸ SƯ NGÀNH KỸ THUẬT PHẦN MỀM GIẢNG VIÊN HƯỚNG DẪN NGUYỄN TẤN TRẦN MINH KHANG TP HỒ CHÍ MINH, 2021 THƠNG TIN HỘI ĐỒNG CHẤM KHÓA LUẬN TỐT NGHIỆP Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số …………………… ngày ………………… Hiệu trưởng Trường Đại học Công nghệ Thông tin ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN XÉT KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ HƯỚNG DẪN/PHẢN BIỆN) Tên khóa luận: PHÂN LOẠI COVID-19 TỪ HÌNH ẢNH X-QUANG BẰNG MÁY HỌC Cán hướng dẫn/phản biện: Nhóm SV thực hiện: Võ Thị Một 16520756 Nguyễn Tấn Trần Minh Khang Đánh giá Khóa luận Về báo cáo: Số trang _ Số chương Số bảng số liệu _ Số hình vẽ Số tài liệu tham khảo _ Sản phẩm Một số nhận xét hình thức báo cáo: …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… Về nội dung nghiên cứu: …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… Về chương trình ứng dụng: …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… Về thái độ làm việc sinh viên: …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… …… ……… ……… ……… ……… ……… ……… ……… ……… ……………… Đánh giá chung:Khóa luận đạt/khơng đạt u cầu khóa luận tốt nghiệp kỹ sư/ cử nhân, xếp loại Giỏi/ Khá/ Trung bình Điểm sinh viên: :……… /10 :……… /10 Người nhận xét (Ký tên ghi rõ họ tên) LỜI CẢM ƠN Tôi xin chân thành cảm ơn Ban giám hiệu nhà trường, quý thầy cô khoa Công nghệ phần mềm quý thầy khoa Khoa học máy tính trường Đại học Công nghệ Thông tin, tạo điều kiện hỗ trợ nhiệt tình để tơi hồn thành tốt đề tài Tơi xin gửi lời biết ơn kính trọng sâu sắc đến TS Nguyễn Tấn Trần Minh Khang Ths Võ Duy Nguyên, nhiệt tình dạy, định hướng nghiên cứu suốt trình thực khóa luận Cuối tơi xin cảm ơn đến gia đình, bạn bè, người thân quan tâm động viên đóng góp ý kiến giúp đỡ tơi hồn thành đề tài nghiên cứu Q trình làm khóa luận cho tơi thêm nhiều kiến thức bổ ích từ thực tiễn, kinh nghiệm kĩ về học tập nghiên cứu Và hành trang vững cho nghiệp tương lai Từ để tơi học hỏi rút kinh nghiệm cho trình làm việc sau Một lần xin gửi đến thầy cơ, bạn bè, người thân lời cảm ơn chân thành tốt đẹp nhất! Tp Hồ Chí Minh, ngày … tháng … năm 2021 Võ Thị Một ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH CỘNG HỒ XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC Độc Lập – Tự Do – Hạnh Phúc CÔNG NGHỆ THÔNG TIN ĐỀ CƯƠNG CHI TIẾT Tên đề tài: Phân loại COVID-19 từ hình ảnh X-quang máy học Cán hướng dẫn: TS.Nguyễn Tấn Trần Minh Khang Thời gian thực hiện: Từ ngày 07/09/2020 đến ngày 27/12/2020 Sinh viên thực hiện: Võ Thị Một: 16520756 Nội dung đề tài: • Thực trạng: COVID-19 bệnh đường hơ hấp cấp tính người phát vào năm 2019, gây vi-rút SARS-CoV-2 chưa xác định khứ Coronavirus họ virus lớn gây bệnh bệnh nhân từ cảm lạnh thông thường đến hội chứng hô hấp tiến triển Middle East Resporatory Syndrone (MERS-COV) Severe Acute Respiratory Syndrone (SARS-COVS) Thế giới bị ảnh hưởng, nhiều người chết, nhiều quốc gia tuyên bố tình trạng khẩn cấp Việc phát tình trạng bệnh sớm có ích cho trình điều trị bệnh nhân Một giải pháp hữu hiệu đề xuất giúp bác sĩ sàng lọc lâm sàng trường hợp nhiễm bệnh chẩn đốn bệnh thơng qua ảnh chụp X-quang • Mục tiêu: − Thực khảo sát phương pháp máy học cho toán phân loại COVID-19 ảnh X-quang Từ đó, có lựa chọn phù hợp trình nghiên cứu thực nghiệm trình phát bệnh COVID-19 − Xây dựng ứng dụng chẩn đoán bệnh COVID-19 giúp hỗ trợ bác sĩ trình sàng lọc lâm sàng trường hợp nhiễm bệnh thơng qua ảnh chụp X-quang • Phương pháp thực hiện: − Tổng hợp liệu X-quang từ nhiều nguồn liệu công bố từ báo khoa học − Tìm hiểu đặc trưng phổ biến ảnh y khoa (Haralick) đặc trưng học sâu (VGG19, DenseNet121) − Cài đặt, đánh giá thực nghiệm phương pháp máy học phổ biến: k-NN, SVM, Logistic Regression cho toán phân loại ảnh sử dụng đặc trưng khảo sát − Phân tích thống kê kết thực nghiệm − Xây dựng ứng dụng phân loại COVID-19 • Kết mong đợi: − Hồn thành việc khảo sát phân loại ảnh COVID-19 phương pháp máy học chọn Dựa kết thực nghiệm, chọn phương pháp phù hợp để làm sở xây dựng ứng dụng phân loại COVID-19 ảnh X-quang − Hoàn thành ứng dụng phân loại hoạt động tốt với đầy đủ chức đề Ứng dụng có giao diện chức thân thiện, giúp cho người dùng cảm thấy thuận tiện việc sử dụng Kế hoạch thực hiện: (thời gian thực 16 tuần) STT Công việc Phase 1: Khảo sát phân loại ảnh COVID-19 phương pháp máy học Sprint 1: Phân tích tìm hiểu phương pháp thực Thời gian thực 07/09/2020 - 01/11/2020 07/09/2020 – 15/09/2020 - Phân tích đề tài - Tìm hiểu báo liên quan đến đề tài 1.1 - Tình hình nhiễm bệnh COVID-19 nước giới - Tìm hiểu phương pháp sử dụng cho tốn trích xuất đặc trưng phân lớp Sprint 2: Tìm hiểu liệu COVID-19 16/09/2020 – 25/09/2020 - Tìm hiểu thơng tin liệu ảnh chụp X-quang COVID-19 nguồn uy tín cơng bố 2.1 - Tham khảo liệu nghiên cứu đạt kết tốt Sprint 3: Tổng hợp xây dựng liệu COVID-19 có chất lượng tốt 26/09/2020 – 10/10/2020 - Thu thập liệu COVID-19 3.1 - Sàn lọc hình ảnh chụp X-quang từ liệu thu thập - Thống kê liệu gán nhãn đầy đủ thư mục - Hoàn thành liệu tổng hợp COVID-19 hoàn chỉnh Sprint 4: Khảo sát phương pháp máy học phân loại COVID-19 4.1 - Thực nghiệm phương pháp phân loại tìm hiều để phân loại ảnh COVID-19 11/10/2020 – 15/11/2020 - Thống kê đánh giá kết thực nghiệm Phase 2: Xây dựng ứng dụng chẩn đốn bệnh COVID-19 Sprint 5: Phân tích xây dựng chức cho ứng dụng 5.1 Phân tích yêu cầu cho ứng dụng 5.2 Hoàn thành sơ đồ thể chức cho ứng dụng 5.3 Thiết kế phát thảo ban đầu cho ứng dụng Sprint 6: Tìm hiểu cơng nghệ kỹ thuật để xây dựng ứng dụng 6.1 Tìm hiểu cơng nghệ xây dựng ứng dụng thiết bị di động 6.2 Tìm hiểu framework, IDE trình triển khai ứng dụng 16/11/2020 – 27/12/2020 16/11/2020 – 25/11/2020 26/11/2020 – 02/12/2020 Sprint 7: Thiết kế sở liệu 7.1 Thiết kế sở liệu 7.2 Tìm hiểu hệ quản trị sở liệu phù hợp với ứng dụng Sprint 8: Thực xây dựng ứng dụng phân loại COVID19 thiết bị di động, máy tính bảng 8.1 Tiến hành xây dựng ứng dụng với chức sử dụng cơng nghệ phương pháp tìm hiểu 8.2 Kiểm thử, sửa lỗi hoàn thành ứng dụng 03/12/2020 – 10/12/2020 11/12/2020 – 27/12/2020 TP HCM, ngày 29 tháng 09 năm 2020 Xác nhận CBHD Sinh viên (Ký tên ghi rõ họ tên) (Ký tên ghi rõ họ tên) Nguyễn Tấn Trần Minh Khang Võ Thị Một 5.5.3 Màn hình hiển thị chế độ view ảnh Hình 5.12 Màn hình hiển thị chế độ view ảnh với chức tương tác ảnh Bảng 5.7 Bảng mơ tả chức hình hiển thị chế độ view STT Tên đối tượng Kiểu Mô tả chức Choose Image Button Chọn ảnh X-quang từ thiết bị máy tính Info Image Layout Hiển thị thơng tin thuộc tính ảnh y khoa Load ảnh với chế độ view ảnh, áp dụng View Image ImageView công cụ tương tác theo chuẩn ảnh y khoa 60 Hình 5.13 Thanh cơng cụ với chức tương tác với ảnh y khoa Bảng 5.8 Mơ tả chức thích tương tác với hình ảnh STT Tên đối tượng Kiểu Chức WWWC Button Người dùng có thẻ tình chỉnh độ sáng tối ảnh theo tần số ZOOM Button Phóng to thu nhỏ ảnh PAN Button Di chuyển ảnh khung view LENTH Button Chú thích đường thẳng PROBE Button Chú thích theo điểm ELLIPTICAL Button Chú thích eclipse Button Chú thích hình chữ nhật ROI RECTANGLE ROI ANGLE Button Chú thích theo góc HIGHLIGHT Button Làm nỗi bật vùng ảnh theo hình chữ nhật 10 FREEFORM Button Chú thích theo đường vẽ ngẫu nhiên Button Thực xữ lý phân loại ROI 11 DETECT 61 Hình 5.14 Phần hiển thị thơng tin ảnh thơng tin bện 62 5.5.4 Màn hình hiển thị thơng tin ảnh kết chẩn đốn Hình 5.15 Màn hình hiển thị thơng tin ảnh kết chẩn đoán 63 Chương KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 6.1 Kết luận Trong nghiên cứu tạo liệu tổng hợp từ nhiều nguồn khác Thơng qua đó, tơi thực khảo sát phương pháp máy học k-NearestNeighborss, Support Vector Machines, Logistic Regression sử dụng đặc trưng ảnh y khoa, đặc trưng học sâu nhằm tạo hệ thống phân loại bệnh COVID-19 ảnh chụp X-quang phổi Qua kết thực nghiệm nhận thấy rằng, sử dụng k-NN trường hợp sử dụng độ đo khoảng cách Cosine, kết phân loại cao với đặc trưng Inception-ResNet-V2 với giá trị k=3 Trường hợp sử dụng độ đo khoảng cách Minkowski, kết phân loại cao k=7 đặc trưng VGG16 Đối với phương pháp SVM Logistic Regression, kết phân loại cao sử dụng đặc trưng VGG16 Thông qua kết nghiên cứu, thấy với việc lựa chọn phương pháp phù hợp để đạt kết cáo phân loại ảnh Đặc trưng ảnh đóng vai trị quan trọng có ảnh hưởng lớn đến kết phân loại Các đặc trưng rút trích từ mạng huấn luyện liệu ImageNet mang lại kết cao thực nghiệm Bên cạnh đó, tơi thực kết nghiên cứu ứng dụng Demo với Flask framework, thư viện hỗ trợ chế độ xem ảnh y khoa sử dụng Reactjs Sau trình nghiên cứu thực nghiệm phương pháp phân loại Covid 19 ảnh X-quang phổi thực xây đựng demo, phần học tiếp cận trình nghiên cứu khoa học với kiến thức, công nghệ Công bố báo khoa học: Khảo sát phương pháp máy học cho toán phân loại COVID-19 ảnh X-quang Hội thảo quộc gia lần thứ XXIII: Một số vấn đề chọn lọc thông tin truyền thông – Trường đại học Hạ Long: 5-6/11/2020 64 6.2 Hướng phát triển • Tôi tiến hành đặc trưng phương pháp khác nhằm tăng kết phân loại tình trạng bệnh • Với gia tăng kho ảnh y khoa tương lai công bố, bổ sung thêm lượng liệu đầu vào trình huấn luyện • Phát triển thêm mặt chức cho ứng dụng demo 65 TÀI LIỆU THAM KHẢO [1] Who.int 2021 Coronavirus Disease (COVID-19) Situation Reports [online] Available at: [Accessed 13 January 2021] [2] En.wikipedia.org 2021 Severe Acute Respiratory Syndrome Coronavirus [online] Available at: [Accessed 13 January 2021] [3] U.S Embassy & Consulate in Vietnam 2021 COVID-19 Information | U.S Embassy & Consulate In Vietnam [online] Available at: [Accessed 13 January 2021] [4] Covidreference.com 2021 Các Quy Trình Xét Nghiệm Chẩn Đốn – COVID Reference [online] Available at: [Accessed 13 January 2021] [5] Suthaharan, S (2016) Support vector machine In Machine learning models and algorithms for big data classification (pp 207-235) Springer, Boston, MA [6] Peterson, L E (2009) K-nearest neighbor Scholarpedia, 4(2), 1883 [7] Wright, R E (1995) Logistic regression [8]Vi.wikipedia.org 2021 Trích Chọn Đặc Trưng [online] Available at: [Accessed 13 January 2021] [9] Hastie, T., Tibshirani, R., & Friedman, J (2009) Overview of supervised learning In The elements of statistical learning (pp 9-41) Springer, New York, NY 66 [10] Ml-cheatsheet.readthedocs.io 2021 Classification Algorithms — ML Glossary Documentation [online] Available at: [Accessed 13 January 2021] [11] Li, Y D., Hao, Z B., & Lei, H (2016) Survey of convolutional neural network Journal of Computer Applications, 36(9), 2508-2515 [12] Python.org 2021 [online] Available at: [Accessed 13 January 2021] [13] Flask.palletsprojects.com 2021 Welcome To Flask — Flask Documentation (1.1.X) [online] Available at: [Accessed 13 January 2021] [14] Reactjs.org 2021 React – A Javascript Library For Building User Interfaces [online] Available at: [Accessed 13 January 2021] [15] Kaggle.com 2021 COVID-19 Radiography Database [online] Available at: [Accessed 13 January 2021] [16] Kaggle.com 2021 Covid-19 Image Dataset [online] Available at: [Accessed 13 January 2021] [17] Kaggle.com 2021 COVID-19 Radiography Database [online] Available at: [Accessed 13 January 2021] [18] Theroyakash, “COVID19 High quality images,” Kaggle, 19-Mar-2020 [Online] Available: https://www.kaggle.com/theroyakash/covid19 [Accessed: 13Jan-2021] 67 [19] H Ong, “Scikit-learn: K-nearest neighbors,” ng, 18-Apr-2018 [Online] Available: https://ongxuanhong.wordpress.com/2015/07/28/scikit-learn-k-nearestneighbors/ [Accessed: 13-Jan-2021] [20] “Support-vector machine,” Wikipedia, 31-Dec-2020 [Online] Available: https://en.wikipedia.org/wiki/Support-vector_machine [Accessed: 13-Jan-2021] [21] “Sigmoid function,” Wikipedia, 25-Dec-2020 [Online] Available: https://en.wikipedia.org/wiki/Sigmoid_function#:~:text=4%20Applications,Definition,refer%20to%20the%20same%20object [Accessed: 13-Jan-2021] [22] De Abreu, G.L.C.M., Ribeiro, J.F and Steffen Jr, V., 2004 Finite element modeling of a plate with localized piezoelectric sensors and actuators Journal of the Brazilian Society of Mechanical Sciences and Engineering, 26(2), pp.117-128 [23] “Sigmoid function,” Wikipedia, 25-Dec-2020 [Online] Available: https://en.wikipedia.org/wiki/Sigmoid_function#:~:text=4%20Applications,Definition,refer%20to%20the%20same%20object [Accessed: 13-Jan-2021] [24] Simonyan, K and Zisserman, A., 2014 Very deep convolutional networks for large-scale image recognition arXiv preprint arXiv:1409.1556 [25] Hassan, M.U., 2018 VGG16–Convolutional network for classification and detection [26] Mahdianpari, Masoud & Salehi, Bahram & Rezaee, Mohammad & Mohammadimanesh, Fariba & Zhang, Yun (2018) Very Deep Convolutional Neural Networks for Complex Land Cover Mapping Using Multispectral Remote Sensing Imagery Remote Sensing 10 1119 10.3390/rs10071119 68 PHỤ LỤC 69 70 71 72 73 74 ...ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM VÕ THỊ MỘT – 16520756 KHÓA LUẬN TỐT NGHIỆP PHÂN LOẠI COVID- 19 TỪ HÌNH ẢNH X- QUANG BẰNG MÁY HỌC Classification... HỌC Độc Lập - Tự Do - Hạnh Phúc CÔNG NGHỆ THÔNG TIN TP HCM, ngày… tháng… năm…… NHẬN X? ?T KHÓA LUẬN TỐT NGHIỆP (CỦA CÁN BỘ HƯỚNG DẪN/PHẢN BIỆN) Tên khóa luận: PHÂN LOẠI COVID- 19 TỪ HÌNH ẢNH X- QUANG. .. qua ảnh chụp X- quang • Mục tiêu: − Thực khảo sát phương pháp máy học cho toán phân loại COVID- 19 ảnh X- quang Từ đó, có lựa chọn phù hợp trình nghiên cứu thực nghiệm trình phát bệnh COVID- 19 − X? ?y