ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

70 29 0
ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ NÔNG NGHIỆP VÀ PTNT TRƯỜNG ĐẠI HỌC THỦY LỢI VŨ HUY HOÀNG ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ ĐỒ ÁN TỐT NGHIỆP HÀ NỘI, NĂM 2022 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ NÔNG NGHIỆP VÀ PTNT TRƯỜNG ĐẠI HỌC THỦY LỢI VŨ HUY HOÀNG ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ Ngành : Công nghệ thông tin Mã số: NGƯỜI HƯỚNG DẪN PGS TS.Lê Đức Hậu HÀ NỘI, NĂM 2022 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat GÁY BÌA ĐỒ ÁN TỐT NGHIỆP, KHĨA LUẬN TỐT NGHIỆP VŨ HUY HOÀNG ĐỒ ÁN/KL TỐT NGHIỆP HÀ NỘI, NĂM 2022 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat TIEU LUAN MOI download : skknchat123@gmail.com moi nhat CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc  NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Họ tên sinh viên: Vũ Huy Hoàng Hệ đào tạo : Đại học quy Lớp: 59TH1 Ngành: Công nghệ thông tin Khoa: Công nghệ thông tin 1- TÊN ĐỀ TÀI: ” Ứng dụng học máy để phân loại ung thư vú ” 2- NỘI DUNG CÁC PHẦN THUYẾT MINH VÀ TÍNH TỐN: Phần Chương 1: Giới thiệu Chương 2: Cơ sở lý thuyết Chương 3: Phân tích giải toán Chương 4: Kết thực nghiệm 3- GIÁO VIÊN HƯỚNG DẪN TỪNG PHẦN Phần Chương 1: Giới thiệu Chương 2: Cơ sở lý thuyết Chương 3: Phân tích giải tốn Chương 4: Kết thực nghiệm 4- NGÀY GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Hà Nội, ngày tháng năm 2022 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Trưởng Bộ môn (Ký ghi rõ Họ tên) Giáo viên hướng dẫn (Ký ghi rõ Họ tên) Nhiệm vụ Đồ án tốt nghiệp Hội đồng thi tốt nghiệp Khoa thông qua Hà Nội,ngày tháng năm 2022 Chủ tịch Hội đồng (Ký ghi rõ Họ tên) Sinh viên hoàn thành nộp Đồ án tốt nghiệp cho Hội đồng thi ngày tháng năm 2021 Sinh viên làm Đồ án tốt nghiệp (KÝ VÀ GHI RÕ HỌ TÊN) Hoàng Vũ Huy Hoàng TIEU LUAN MOI download : skknchat123@gmail.com moi nhat TRƯỜNG ĐẠI HỌC THUỶ LỢI KHOA CƠNG NGHỆ THƠNG TIN BẢN TĨM TẮT ĐỀ CƯƠNG ĐỒ ÁN TỐT NGHIỆP TÊN ĐỀ TÀI: Ứng dụng học máy để phân loại ung thư vú Sinh viên thực hiện: Vũ Huy Hoàng Lớp: 59TH1 Giáo viên hướng dẫn: PGS TS Lê Đức Hậu TÓM TẮT ĐỀ TÀI Trong năm gần đây, với phát triển ngành khoa học kỹ thuật công nghệ việc phát bệnh ung thư ngày xác Việc phát sớm giúp cho bác sĩ biết có phương pháp điều trị để giảm thiểu khả tử vong cho người bệnh Ung thư vú bệnh ung thư thứ hai số bệnh ung thư chẩn đoán nhiều Ung thư vú loại ung thư phổ biến phụ nữ Nó ảnh hưởng đến 10% tất phụ nữ số giai đoạn sống họ Ung thư vú bắt đầu khối u ác tính ung thư bắt đầu phát triển từ tế bào vú Ung thư vú xảy chủ yếu phụ nữ từ 40 tuổi trở lên xảy tế bào tuyến sản xuất sữa (được gọi thùy) bất thường phân chia mạnh mẽ Cần có hệ thống phát hỗ trợ máy tính (CAD) sử dụng phương pháp học máy để cung cấp chẩn đốn xác ung thư vú Các hệ thống CAD hỗ trợ phát ung thư vú giai đoạn đầu Khi ung thư vú phát đủ sớm, tỷ lệ sống sót tăng lên điều trị tốt Trong thời gian làm đồ án tốt nghiệp, em chọn đề tài “Ứng dụng học máy để phân loại ung thư vú” Đề tài nhằm đưa chẩn đoán bệnh ung thư vú dựa liệu thu thập CÁC MỤC TIÊU CHÍNH Tìm hiểu kiến thức liên quan học máy, công cụ xử lý liệu xây dựng ứng dụng Nghiên cứu thuật tốn: Thuật tốn Nạve Bayes, Thuật toán SVM (Support Vector Machine) Đánh giá xác định thuật toán tốt TIEU LUAN MOI download : skknchat123@gmail.com moi nhat KẾT QUẢ DỰ KIẾN Nắm vững kiến thức liên quan Dự đoán ung thư thực liệu thu thập Tổng hợp kiến thức viết báo cáo TIEU LUAN MOI download : skknchat123@gmail.com moi nhat LỜI CAM ĐOAN Tác giả xin cam đoan Đồ án tốt nghiệp/ Khóa luận tốt nghiệp thân tác giả Các kết Đồ án tốt nghiệp/Khóa luận tốt nghiệp trung thực, không chép từ nguồn hình thức Việc tham khảo nguồn tài liệu (nếu có) thực trích dẫn ghi nguồn tài liệu tham khảo quy định Tác giả ĐATN Hoàng Vũ Huy Hoàng i TIEU LUAN MOI download : skknchat123@gmail.com moi nhat lượt liệu xây dựng thuật tốn Nạve Bayes thuật tốn SVM (Support Vector Machine) Kiểm thử mơ hình Ở phần này, làm việc với tập liệu kiểm thử Tập liệu kiểm thử đưa vào mơ hình huấn luyện từ bước trước Các trọng số hay thơng tin mơ hình tải từ thư mục mà lưu trữ bước huấn luyện mơ hình Sau đưa qua mơ hình đó, mơ hình cho kết đầu khác Và với kết đầu ra, tiến hành tính tốn đánh giá hiệu mơ hình huấn luyện Hình 3.7 Mơ hình huấn luyện tổng qt 3.2.4.1 Huấn luyện với mơ hình Nạve Bayes Trong phần trên, tìm hiểu cách hoạt động huấn luyện tổng quan Như nói trên, thành phần mơ hình thuật tốn Nạve Bayes thuật tốn SVM (Support Vector Machine) Trong phần này, tìm hiểu sử dụng thuật tốn Nạve Bayes 36 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Và huấn luyện với tham số var_smoothing = 0.1 tìm bước trước Cách hoạt động huấn luyện sử dụng thuật tốn Nạve Bayes hồn tồn tương tự với cách hoạt động huấn luyện tổng quát Với liệu huấn luyện đưa vào thuật toán Nạve Bayes, sau kết mơ hình đánh giá thơng qua thuật tốn đánh giá với tập huấn luyện Chi tiết cách hoạt động huấn luyện sử dụng thuật tốn Nạve Bayes mơ tả hình Hình 3.8 Mơ hình huấn luyện với thuật toán Naive Bayes 3.2.4.2 Huấn luyện với mơ hình SVM (Support Vector Machine) Trong phần bên trên, tìm hiểu cách hoạt động huấn luyện sử dụng thuật tốn Nạve Bayes Cũng tương tự vậy, phần tìm hiểu cách hoạt động huấn luyện sử dụng thuật toán SVM (Support Vector Machine) Với tham số C=1.0 gamma = 0.1 tìm bước trước Với liệu huấn luyện đưa vào thuật toán SVM, sau kết mơ hình đánh giá thơng qua thuật tốn đánh giá với tập huấn luyện Chi tiết cách hoạt động huấn luyện 37 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat sử dụng thuật toán SVM (Support Vector Machine) mơ tả chi tiết hình sau Hình 3.9 Mơ hình huấn luyện với thuật tốn SVM 38 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat CHƯƠNG Kết thực nghiệm Như nói phần trước liệu chia thành hai tập tập huấn luyện tập thử nghiệm Với 569 ghi liệu chia thành 398 ghi để huấn luyện 171 bạn ghi để thực nghiệm Chi tiết mơ tả hình 13 Hình 4.10 Chia liệu Sau huấn luyện mơ hình huấn luyện thử nghiệm với tập huấn luyện Kết huấn luyện mô tả ma trận nhầm lẫn đây: +) Ma trận nhầm lẫn với thuật tốn Nạve Bayes [ 101 547] 104 614] +) Ma trận nhầm lẫn với thuật toán SVM [ 39 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Nhìn vào ma trận nhầm lẫn với thuật tốn Nạve Bayes có 99 ghi dự đốn dương tính Trong có 57 ghi dự đốn âm tính Cịn lại có ghi dự đốn dương tính sai có ghi dự đốn âm tính sai Cịn ma trận nhầm lẫn với thuật tốn SVM có 107 ghi dự đốn dương tính 60 ghi dự đốn âm tính Cịn lại có ghi dự đốn dương tính sai ba ghi dự đốn tâm tính sai Như nhờ hai ma trận nhầm lẫn kết luận với thuật tốn Naive Bayes có 156 ghi dự đốn cho vào lớp mong muốn 15 ghi dự đốn vào lớp sai với mong muốn Cịn với thuật tốn SVM cho 167 ghi dự đốn vào lớp mong muốn ghi dự đoán vào lớp sai mong muốn Và dễ thấy thuật toán SVM cho kết dự đoán tốt thuật toán Naive Bayes Tương tự đánh giá hai thuật toán với Precision Recall cho lớp dự đoán Đầu tiên kết chẩn đốn u lành tính B dựa theo việc đánh giá Precision Recall dựa hai thuật tốn Nạve Bayes SVM +) Thuật tốn Nạve Bayes: Recall= Precision= TP = 99 =0.94 TP+FN 99+6 TP 99 = =0.92 TP+FP 99+9 +) Thuật toán SVM : Recall= Precision= TP = 107 TP+FN 107 +1 TP 107 = =0.99 =0.97 TP+FP 107+3 40 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Bảng 4.3 Bảng kết chẩn đốn u lành tính B dựa theo việc đánh giá Precision Recall Thuật tốn Nạve Bayes SVM Kết cho thấy với thuật toán SVM cho kết Precision Recall với lớp chẩn đốn u lành tính B cao thuật tốn Nạve Bayes (0.97 so với 0.94 0.99 so với 0.92) Bảng kết chẩn đốn u ác tính M dựa theo việc đánh giá Precision Recall dựa hai thuật tốn Nạve Bayes SVM Bảng 4.4 Bảng kết chẩn đốn u ác tính M dựa theo việc đánh giá Precision Recall Thuật tốn Nạve Bayes SVM Kết cho thấy với thuật toán SVM cho kết Precision Recall với lớp chẩn đốn ác tính B cao thuật tốn Nạve Bayes (0.98 so với 0.86 0.95 so với 0.90) +) Độ xác: - Thuật tốn Nạve Bayes: 41 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat Độ xác= -Thuật tốn SVM : Độ xác= Kết đánh giá dựa độ xác với hai mơ hình Nạve Bayes SVM cho độ xác 912 0.977 Kết ghi chi tiết bảng Bảng 4.5 Bảng kết đánh giá dựa theo độ xác Accuracy Thuật tốn Nạve Bayes 0.906 SVM 0.977 Từ bảng 4.3 cho thấy kết huấn luyện với thuật tốn SVM cho độ xác cao huấn luyện với thuật toán Naive Bayes (0.977 so với 0.912) Sau đánh giá với Precision Recall độ xác tất cho ta thấy thuật toán SVM cho kết thực nghiệm cao thuật tốn Nạve Bayes Do kết mơ hình huấn luyện thuật tốn SVM chọn mơ hình để dự đốn 42 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat KẾT LUẬN Đề tài đề tài lĩnh vực tin sinh học Một lĩnh vực có vai trị lớn nhằm phục vụ cho lĩnh vực y khoa – lĩnh vực cấp thiết sống Bài toán đưa sử dụng hai thuật tốn thuật tốn Nạve Bayes thuật toán SVM (Support Vector Machine) nhằm phân loại ung thư vú Đây tốn có ứng dụng cao sống Kết huấn luyện thực nghiệm với Support Vector Machine cho độ xác lên tới 0.977 Do mơ hình đề xuất đề tài có tính khả thi cao ứng dụng cho tốn thực tế Ngồi ra, thực đề tài này, em học cách ứng dụng triển khai thuật toán Machine Learning vào tốn thực tế Đồng thời có hiểu biết sâu sắc thuật toán nghiên cứu thuật tốn Nạve Bayes thuật tốn SVM (Support Vector Machine) Tuy nhiên, đề tài tồn nhiều hạn chế Dữ liệu sử dụng đề tài lấy từ liệu từ Wisconsin (WDBC) để huấn luyện Bộ liệu có trường liệu lớn, yêu cầu đưa vào thực tế khó đáp ứng đầy đủ Ngồi ra, tốn chưa ứng dụng cho dự liệu thực tế nhóm bệnh nhân khác Mơ hình huấn luyện đề tài chưa ứng dụng để giải toán bệnh viện sở y tế Trong tương lai, em hi vọng đề tài đề tài lĩnh vực tin sinh học khác đưa vào thực tế để giải toán sở y tế bệnh viện Để tốn tốt có tính ứng dụng cần bổ sung thêm liệu Cũng cần bổ sung thêm kiến thức y học để hiểu biết thuộc tính liên quan đến vấn đề ung thư vú từ thêm giảm bớt trường liệu để phục vụ huấn luyện nhằm có kết huấn luyện tốt có tính thực tiễn Ngồi cần bổ sung thêm kiến thức thuật toán học máy khác để ứng dụng cho toán 43 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat 44 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat TÀI LIỆU THAM KHẢO [1] "Wikipedia", [Online], Available: https://vi.wikipedia.org/wiki/H %E1%BB %8Dc_m%C3%A1y [2] "m2tech", [Online], Available : https://m2tech.buyit.vn/hoc-maymachine-learning-la-gi-ung-dung-cua-hoc-may/ [3] N.T.HOP, [Online], Available : https://viblo.asia/p/thuat-toan-phan-lopnaive-bayes-924lJWPm5PM [4] "Wordpress", [Online], Available : https://neralnetwork.wordpress.com/2018/05/11/thuat-toan-support-vectormachine-svm/ [5] "Viblo", [Online], Available : https://viblo.asia/p/support-vectormachine-trong-hoc-may-mot-cai-nhin-don-gian-hon-XQZkxoQmewA [6] "vimentor.com", [Online], Available : https://www.vimentor.com/vi/lesson/tien-xu-ly-du-lieu-trong-linh-vuc-hoc-mayphan-3 [7] "Viblo", [Online], Available : https://viblo.asia/p/confusion-matrixma-tran-nham-lan-ma-tran-loi-V3m5WQB7ZO7 [8] "hoctructuyen123", [Online], Available : http://hoctructuyen123.net/cacphuong-phap-danh-gia-mot-mo-hinh-phan-lop-du-lieu [9] "Openplanning.net", [Online], Available : https://openplanning.net/11385/gioi-thieu-ve-python [10] tecktrending.com, [Online], Available : https://tecktrending.com/thu-vienpython-cho-khoa-hoc-du-lieu/ [11] Benhvien103, [Online], Available : http://www.benhvien103.vn/thuctrang-va-cap-nhat-ung-thu-tai-viet-nam/ [12] "ichi.pro", [Online], Available : https://ichi.pro/vi/tien-xu-ly-du-lieu-voipython-62761617448240 [13] "tek4.vn", [Online], Available : https://tek4.vn/khoa-hoc/machinelearning-co-ban/training-set-va-testing-set [14] D Graffox, "IEEE Citation Reference," Sep 2009 [Online] Available: http://www.ieee.org/documents/ieeecitationref.pdf [15] Apr 2011 [Online] Available: http://libinfo.uark.edu/reference/citingyoursources.asp [16] [Online] Available: http://www.ijssst.info/info/IEEE-CitationStyleGuide.pdf [Accessed 2011] 45 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat [17] J Barzun and H Graff, The Modern Researcher, 5th ed ed., New York: Harcourt Brace Jovanovich Inc., 1992 [18] N Wells, 2007 [Online] Available: http://www.nissawells.com/samples/w-manual.pdf [19] P J Denning, "Editorial: Plagiarism in the Web," Communications of the ACM, vol 98, no 12, p 29, Dec 1995 [20] B Martin, "Plagiarism: a misplaced emphasis," Journal of Information Ethics, vol 3, no 2, pp 36-47, 1994 [21] B Belkhouche et al, "Plagiarism detection in software designs," in Proc of the 42nd Ann Southeast Regional Conf., 2004 [22] T Doe, Dec 2011 [Online] Available: http://grad.uark.edu/dean/thesisguide.php [23] Cornell University Library PSEC Documentation Committee, Feb 2010 [Online] Available: http://www.library.cornell.edu/resrch/citmanage/apa [24] "Wordpress", [Online], Available : 46 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat PHỤ LỤC 47 TIEU LUAN MOI download : skknchat123@gmail.com moi nhat ... trị để giảm thiểu khả tử vong cho người bệnh Ung thư vú bệnh ung thư thứ hai số bệnh ung thư chẩn đoán nhiều Ung thư vú loại ung thư thường gặp nguyên nhân phổ biến thứ hai gây tử vong ung thư. .. phương pháp học máy phổ biến 2.1.3 Phân loại ứng dụng học máy Máy học cổ điển thư? ??ng phân loại theo cách thuật tốn học để trở nên xác dự đốn Có bốn cách tiếp cận bản: học có giám sát, học khơng... tới núm vú Loại phổ biến ung thư vú ung thư ống dẫn, gọi ung thư biểu mô ống động mạch, chiếm 80% tất bệnh ung thư vú Ung thư biểu mô tiểu thùy, chiếm 10% trường hợp Phần lại bệnh ung thư vú có

Ngày đăng: 15/10/2022, 04:49

Hình ảnh liên quan

Hình 2.1 Các phương pháp học máy phổ biến hiện nay - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 2.1.

Các phương pháp học máy phổ biến hiện nay Xem tại trang 21 của tài liệu.
Hình 2.2 Minh họa siêu phẳng trong SVM - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 2.2.

Minh họa siêu phẳng trong SVM Xem tại trang 29 của tài liệu.
Hình 2.3 Vấn đề chọn siêu phẳng trong SVM - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 2.3.

Vấn đề chọn siêu phẳng trong SVM Xem tại trang 30 của tài liệu.
Hình 2.4 Margin trong vấn đề chọn siêu phẳng - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 2.4.

Margin trong vấn đề chọn siêu phẳng Xem tại trang 31 của tài liệu.
Confusion Matrixma trận nhầm lẫn hay ma trận lỗi là một bố cục bảng cụ thể cho phép hình dung hiệu suất của một thuật tốn - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

onfusion.

Matrixma trận nhầm lẫn hay ma trận lỗi là một bố cục bảng cụ thể cho phép hình dung hiệu suất của một thuật tốn Xem tại trang 39 của tài liệu.
Một mơ hình phân lớp tốt là mơ hình cĩ cả Precision và Recall đều cao, tức càng gần một càng tốt - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

t.

mơ hình phân lớp tốt là mơ hình cĩ cả Precision và Recall đều cao, tức càng gần một càng tốt Xem tại trang 44 của tài liệu.
Hình 3.6 Phân bổ của dữ liệu vào 2 lớp - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 3.6.

Phân bổ của dữ liệu vào 2 lớp Xem tại trang 51 của tài liệu.
TIEU LUAN MOI download : skknchat123@gmail.com moi nhat - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

download.

skknchat123@gmail.com moi nhat Xem tại trang 51 của tài liệu.
Mục tiêu của machinelearning là tạo ra những mơ hình cĩ khả năng tổng quát hĩa để dự đốn tốt trên cả dữ liệu chưa thấy bao giờ (nằm ngồi tập huấn luyện), do đĩ, để biết một thuật tốn hay mơ hình cĩ tốt hay khơng thì sau khi được huấn luyện, mơ hình cần đư - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

c.

tiêu của machinelearning là tạo ra những mơ hình cĩ khả năng tổng quát hĩa để dự đốn tốt trên cả dữ liệu chưa thấy bao giờ (nằm ngồi tập huấn luyện), do đĩ, để biết một thuật tốn hay mơ hình cĩ tốt hay khơng thì sau khi được huấn luyện, mơ hình cần đư Xem tại trang 54 của tài liệu.
Kiểm thử mơ hình - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

i.

ểm thử mơ hình Xem tại trang 56 của tài liệu.
Hình 3.8 Mơ hình huấn luyện với thuật tốn Naive Bayes - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 3.8.

Mơ hình huấn luyện với thuật tốn Naive Bayes Xem tại trang 57 của tài liệu.
Hình 3.9 Mơ hình huấn luyện với thuật tốn SVM - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 3.9.

Mơ hình huấn luyện với thuật tốn SVM Xem tại trang 58 của tài liệu.
Hình 4.10 Chia dữ liệu - ỨNG DỤNG học máy để PHÂN LOẠI UNG THƯ vú

Hình 4.10.

Chia dữ liệu Xem tại trang 59 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan