1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ

62 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Học Máy Để Phân Loại Ung Thư Vú
Tác giả Vũ Huy Hoàng
Người hướng dẫn PGS TS. Lê Đức Hậu
Trường học Trường Đại Học Thủy Lợi
Chuyên ngành Công Nghệ Thông Tin
Thể loại Đồ Án Tốt Nghiệp
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 62
Dung lượng 891,42 KB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ NÔNG NGHIỆP VÀ PTNT TRƯỜNG ĐẠI HỌC THỦY LỢI VŨ HUY HOÀNG ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ ĐỒ ÁN TỐT NGHIỆP HÀ NỘI, NĂM 2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ NÔNG NGHIỆP VÀ PTNT TRƯỜNG ĐẠI HỌC THỦY LỢI VŨ HUY HOÀNG ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ Ngành : Công nghệ thông tin Mã số: NGƯỜI HƯỚNG DẪN PGS TS.Lê Đức Hậu HÀ NỘI, NĂM 2022 GÁY BÌA ĐỒ ÁN TỐT NGHIỆP, KHĨA LUẬN TỐT NGHIỆP VŨ HUY HỒNG ĐỒ ÁN/KL TỐT NGHIỆP HÀ NỘI, NĂM 2022  CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM  Độc lập - Tự - Hạnh phúc     NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP  Họ tên sinh viên: Vũ Huy Hồng Hệ đào tạo : Đại học quy  Lớp: 59TH1 Ngành: Công nghệ thông tin  Khoa: Công nghệ thông tin 1- TÊN ĐỀ TÀI: ” Ứng dụng học máy để phân loại ung thư vú ” 2- NỘI DUNG CÁC PHẦN THUYẾT MINH VÀ TÍNH TOÁN: Phần Tỷ lệ Chương 1: Giới thiệu 10% Chương 2: Cơ sở lý thuyết 40% Chương 3: Phân tích giải toán 40% Chương 4: Kết thực nghiệm 10% 3- GIÁO VIÊN HƯỚNG DẪN TỪNG PHẦN Phần Giáo viên hướng dẫn Chương 1: Giới thiệu Chương 2: Cơ sở lý thuyết PGS TS.Lê Đức Hậu Chương 3: Phân tích giải tốn Chương 4: Kết thực nghiệm 4- NGÀY GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Hà Nội, ngày tháng năm 2022 Trưởng Bộ môn (Ký ghi rõ Họ tên) Giáo viên hướng dẫn (Ký ghi rõ Họ tên) Nhiệm vụ Đồ án tốt nghiệp Hội đồng thi tốt nghiệp Khoa thông qua Hà Nội,ngày tháng năm 2022 Chủ tịch Hội đồng (Ký ghi rõ Họ tên) Sinh viên hoàn thành nộp Đồ án tốt nghiệp cho Hội đồng thi ngày tháng năm 2021 Sinh viên làm Đồ án tốt nghiệp (KÝ VÀ GHI RÕ HỌ TÊN) Hoàng Vũ Huy Hồng TRƯỜNG ĐẠI HỌC THUỶ LỢI KHOA CƠNG NGHỆ THƠNG TIN BẢN TĨM TẮT ĐỀ CƯƠNG ĐỒ ÁN TỐT NGHIỆP TÊN ĐỀ TÀI: Ứng dụng học máy để phân loại ung thư vú Sinh viên thực hiện: Vũ Huy Hoàng Lớp: 59TH1 Giáo viên hướng dẫn: PGS TS Lê Đức Hậu TÓM TẮT ĐỀ TÀI Trong năm gần đây, với phát triển ngành khoa học kỹ thuật cơng nghệ việc phát bệnh ung thư ngày xác Việc phát sớm giúp cho bác sĩ biết có phương pháp điều trị để giảm thiểu khả tử vong cho người bệnh Ung thư vú bệnh ung thư thứ hai số bệnh ung thư chẩn đoán nhiều Ung thư vú loại ung thư phổ biến phụ nữ Nó ảnh hưởng đến 10% tất phụ nữ số giai đoạn sống họ Ung thư vú bắt đầu khối u ác tính ung thư bắt đầu phát triển từ tế bào vú Ung thư vú xảy chủ yếu phụ nữ từ 40 tuổi trở lên xảy tế bào tuyến sản xuất sữa (được gọi thùy) bất thường phân chia mạnh mẽ Cần có hệ thống phát hỗ trợ máy tính (CAD) sử dụng phương pháp học máy để cung cấp chẩn đốn xác ung thư vú Các hệ thống CAD hỗ trợ phát ung thư vú giai đoạn đầu Khi ung thư vú phát đủ sớm, tỷ lệ sống sót tăng lên điều trị tốt Trong thời gian làm đồ án tốt nghiệp, em chọn đề tài “Ứng dụng học máy để phân loại ung thư vú” Đề tài nhằm đưa chẩn đoán bệnh ung thư vú dựa liệu thu thập CÁC MỤC TIÊU CHÍNH  Tìm hiểu kiến thức liên quan học máy, công cụ xử lý liệu xây dựng ứng dụng  Nghiên cứu thuật tốn: Thuật tốn Nạve Bayes, Thuật tốn SVM (Support Vector Machine)  Đánh giá xác định thuật toán tốt KẾT QUẢ DỰ KIẾN  Nắm vững kiến thức liên quan  Dự đoán ung thư thực liệu thu thập  Tổng hợp kiến thức viết báo cáo LỜI CAM ĐOAN Tác giả xin cam đoan Đồ án tốt nghiệp/ Khóa luận tốt nghiệp thân tác giả Các kết Đồ án tốt nghiệp/Khóa luận tốt nghiệp trung thực, không chép từ nguồn hình thức Việc tham khảo nguồn tài liệu (nếu có) thực trích dẫn ghi nguồn tài liệu tham khảo quy định Tác giả ĐATN Hoàng Vũ Huy Hoàng i LỜI CÁM ƠN Đồ án “Ứng dụng học máy để phân loại ung thư vú” kết nghiên cứu đồ án tốt nghiệp thân em giúp đỡ thầy cô bạn bè Sau thời gian học tập rèn luyện thân trường Đại học Thủy Lợi, em giao thực học phần tốt nghiệp Nhân dịp hoàn thành đồ án tốt nghiệp, em xin gửi lời cảm ơn sâu sắc tới quý thầy cô trường tạo điều kiện giúp đỡ để em hồn thành tốt khóa học Đặc biệt, em gửi lời cảm ơn chân thành đến thầy giáo PGS TS Lê Đức Hậu, thời gian thực đồ án tốt nghiệp đã trực tiếp hướng dẫn và bảo tận tình để em hoàn thành được công việc của mình Cuối cùng, em xin chân thành cảm ơn gia đình, bạn học trường động lực cho em phấn đấu, ln bên động viên, khích lệ giúp đỡ em nhiều lúc khó khăn Do thân cịn nhiều hạn chế nên q trình thực đồ án khơng tránh khỏi sai sót, em mong nhận góp ý quý thầy cô bạn ii Tiếp theo, bạn biết cách để thực phép toán để làm liệu bạn, ví dụ liệu nan (not a number), xóa liệu dư thừa điền vào liệu bị khuyết Các đầu việc nằm bước tinh chỉnh liệu trình phân tích liệu Cuối cùng, bạn biết cách mã hóa đặc trưng liệu cách đắn khía cạnh phù hợp với học máy Đơi bạn muốn tiền xử lý liệu suốt trình thu thập, điều thực tế rơi vào bước biến đổi liệu (transforming data) Nhưng khơng thành vấn đề, khơng có luồng xử lý cứng nhắc cho việc chuẩn bị liệu trước đưa vào huấn luyện 3.2.2 Chia liệu Trong machine learning vậy, cần kiểm thử để dự đoán khả hoạt động hiệu mơ hình thực tế Có nhiều cách để kiểm thử đánh giá hiệu mơ hình Một cách hợp lý sử dụng tập liệu kiểm thử (testing set) độc lập tập liệu huấn luyện (training set) để đánh giá ước lượng hiệu mơ hình Thơng thường training set testing set tách từ liệu quan sát cung cấp (chẳng hạn lấy 80% liệu quan sát cung cấp để huấn luyện 20% liệu quan sát cịn lại khơng liên quan đến 80% trước để đánh giá) [13]  Training Set (Tập huấn luyện) Tập huấn luyện (training set) tập liệu sử dụng để huấn luyện mơ hình Các thuật tốn học máy học mơ hình từ tập huấn luyện Việc học khác tùy thuộc vào thuật tốn mơ hình sử dụng Các thuật tốn nói chung tìm cách tối ưu sai số dự đoán tập huấn luyện đến mức đủ tốt Trong trường hợp overfitting sai số dự đốn mơ hình tập huấn luyện thấp, chí = 0%  Testing Set (Tập kiểm thử) 33 Mục tiêu machine learning tạo mơ hình có khả tổng qt hóa để dự đoán tốt liệu chưa thấy (nằm ngồi tập huấn luyện), đó, để biết thuật tốn hay mơ hình có tốt hay khơng sau huấn luyện, mơ hình cần đánh giá hiệu thông qua liệu kiểm thử (testing set) Bộ liệu sử dụng để tính độ xác sai số mơ hình dự đốn huấn luyện Chúng ta biết nhãn thực điểm tập hợp liệu kiểm thử này, tạm thời giả vờ đưa giá trị đầu vào tập vào mơ hình dự đốn để nhận kết dự đốn đầu Sau nhìn vào nhãn thực so sánh với kết dự đốn đầu vào tương ứng xem liệu mơ hình có dự đốn hay khơng Việc tính tổng trung bình tồn lỗi tính tốn lỗi dự đốn tập kiểm thử  Tập liệu kiểm chứng (Vadidation Set) Với toán em, sau thử nghiệm tỷ lệ chia liệu khác mang lại kết khác nhau, em chia liệu thành tập với tỷ lệ tập huấn luyện 70% tập thử nghiệm 30% 3.2.3 Tìm tham số tối ưu Hình 3.1 TÌm tham số tốt cho học máy 34 Với tập huấn luyện mà có bước trước, trích phần đế tìm tham số tối ưu cho hai thuật tốn SVM Nạve Bayes Ở phần nay, em sử dụng phương pháp đánh giá hiệu Repeated Stratified KFold với 30% tập huấn luyện Sau đó, với thuật toán, đánh giá hiệu với tưng tham số  Với SVM tìm tham số tối ưu cho tham số gamma C - C: Tham số điều chỉnh (Regularization parameter) em thử nghiệm với với giá trị 0.1, 1.0, 10, 100 - Gamma: Hệ số nhân cho ‘rbf’, ‘poly’ ‘sigmoid’ Với tam số này, em thử nghiệm với với giá trị 0.1, 1.0, 10, 100 Kết cho thấy, với tham số C, gamma với giá trị 1.0 0.1 cho kết tốt  Với Naïve Bayes em tối ưu tham số var-smothing Trong đồ án này, em thử nghiệm với tham số là: 1.e+00, 1.e-01, 1.e-02, 1.e-03, 1.e-04, 1.e-05, 1.e-06, 1.e-07, 1.e-08, 1.e-09 Và kết em chọn giá trị băng 0.1 cho kết tốt 3.2.4 Huấn luyện Sau liệu tiền xử lý liệu ta bắt đầu quy trình huấn luyện với thuật tốn Nạve Bayes SVM Q trình huấn luyện chia thành bước chính:  Xử lý liệu Bước phần xử lý liệu, đọc liệu từ nguồn liệu, nguồn liệu tệp có định dạng csv lưu nhớ máy tính Bộ liệu liệu chẩn đoán ung thư vú Wisconsin (WDBC) tặng vào ngày tháng 11 năm 1995 bao gồm 569 trường hợp 357 trường hợp lành tính 212 trường hợp trường hợp ác tính Sau đó, với liệu chia thành hai tập tập huấn luyện tập kiểm thử Tập huấn luyện sử dụng bước huấn luyện mơ hình, cịn tập kiểm thử sử dụng bước kiểm thử  Huấn luyện mơ hình Sau xử lý liệu xong, bắt đầu trình huấn luyện Với tập liệu huấn luyện, đưa vào để huấn luyện Dữ liệu huấn luyện lần 35 lượt liệu xây dựng thuật tốn Nạve Bayes thuật tốn SVM (Support Vector Machine)  Kiểm thử mơ hình Ở phần này, làm việc với tập liệu kiểm thử Tập liệu kiểm thử đưa vào mơ hình huấn luyện từ bước trước Các trọng số hay thơng tin mơ hình tải từ thư mục mà lưu trữ bước huấn luyện mô hình Sau đưa qua mơ hình đó, mơ hình cho kết đầu khác Và với kết đầu ra, tiến hành tính tốn đánh giá hiệu mơ hình huấn luyện Hình 3.7 Mơ hình huấn luyện tổng qt 3.2.4.1 Huấn luyện với mơ hình Nạve Bayes Trong phần trên, tìm hiểu cách hoạt động huấn luyện tổng quan Như nói trên, thành phần mơ hình thuật tốn Nạve Bayes thuật toán SVM (Support Vector Machine) Trong phần này, tìm hiểu sử dụng thuật tốn Nạve Bayes 36 Và huấn luyện với tham số var_smoothing = 0.1 tìm bước trước Cách hoạt động huấn luyện sử dụng thuật tốn Nạve Bayes hoàn toàn tương tự với cách hoạt động huấn luyện tổng quát Với liệu huấn luyện đưa vào thuật tốn Nạve Bayes, sau kết mơ hình đánh giá thơng qua thuật tốn đánh giá với tập huấn luyện Chi tiết cách hoạt động huấn luyện sử dụng thuật tốn Nạve Bayes mơ tả hình Hình 3.8 Mơ hình huấn luyện với thuật tốn Naive Bayes 3.2.4.2 Huấn luyện với mơ hình SVM (Support Vector Machine) Trong phần bên trên, tìm hiểu cách hoạt động huấn luyện sử dụng thuật tốn Nạve Bayes Cũng tương tự vậy, phần tìm hiểu cách hoạt động huấn luyện sử dụng thuật toán SVM (Support Vector Machine) Với tham số C=1.0 gamma = 0.1 tìm bước trước Với liệu huấn luyện đưa vào thuật tốn SVM, sau kết mơ hình đánh giá thơng qua thuật toán đánh giá với tập huấn luyện Chi tiết cách hoạt động huấn luyện 37 sử dụng thuật toán SVM (Support Vector Machine) mơ tả chi tiết hình sau Hình 3.9 Mơ hình huấn luyện với thuật tốn SVM 38 CHƯƠNG Kết thực nghiệm Như nói phần trước liệu chia thành hai tập tập huấn luyện tập thử nghiệm Với 569 ghi liệu chia thành 398 ghi để huấn luyện 171 bạn ghi để thực nghiệm Chi tiết mơ tả hình 13 Hình 4.10 Chia liệu Sau huấn luyện mơ hình huấn luyện thử nghiệm với tập huấn luyện Kết huấn luyện mô tả ma trận nhầm lẫn đây: +) Ma trận nhầm lẫn với thuật tốn Nạve Bayes [ 1019 547 ] +) Ma trận nhầm lẫn với thuật toán SVM [ 1042 614 ] 39 Nhìn vào ma trận nhầm lẫn với thuật tốn Nạve Bayes có 99 ghi dự đốn dương tính Trong có 57 ghi dự đốn âm tính Cịn lại có ghi dự đốn dương tính sai có ghi dự đốn âm tính sai Cịn ma trận nhầm lẫn với thuật tốn SVM có 107 ghi dự đốn dương tính 60 ghi dự đốn âm tính Cịn lại có ghi dự đốn dương tính sai ba ghi dự đốn tâm tính sai Như nhờ hai ma trận nhầm lẫn kết luận với thuật tốn Naive Bayes có 156 ghi dự đoán cho vào lớp mong muốn 15 ghi dự đoán vào lớp sai với mong muốn Cịn với thuật tốn SVM cho 167 ghi dự đoán vào lớp mong muốn ghi dự đoán vào lớp sai mong muốn Và dễ thấy thuật toán SVM cho kết dự đoán tốt thuật toán Naive Bayes Tương tự đánh giá hai thuật toán với Precision Recall cho lớp dự đoán Đầu tiên kết chẩn đốn u lành tính B dựa theo việc đánh giá Precision Recall dựa hai thuật tốn Nạve Bayes SVM  +) Thuật tốn Nạve Bayes: Recall= TP 99 = =0.94 TP+ FN 99+6 Precision= TP 99 = =0.92 TP+ FP 99+ +) Thuật toán SVM : Recall= TP 107 = =0.99 TP+ FN 107 +1 Precision= TP 107 = =0.97 TP+ FP 107+3 40 Bảng 4.3 Bảng kết chẩn đoán u lành tính B dựa theo việc đánh giá Precision Recall Thuật tốn Precision Recall Nạve Bayes 0.94 0.92 SVM 0.97 0.99 Kết cho thấy với thuật toán SVM cho kết Precision Recall với lớp chẩn đốn u lành tính B cao thuật tốn Naïve Bayes (0.97 so với 0.94 0.99 so với 0.92) Bảng kết chẩn đoán u ác tính M dựa theo việc đánh giá Precision Recall dựa hai thuật tốn Nạve Bayes SVM  Bảng 4.4 Bảng kết chẩn đốn u ác tính M dựa theo việc đánh giá Precision Recall Thuật tốn Precision Recall Nạve Bayes 0.86 0.90 SVM 0.98 0.95 Kết cho thấy với thuật toán SVM cho kết Precision Recall với lớp chẩn đoán ác tính B cao thuật tốn Nạve Bayes (0.98 so với 0.86 0.95 so với 0.90) +) Độ xác: - Thuật tốn Nạve Bayes: 41 Độ xác= TP+TN 99+ 57 = =0.912 TP+ FP+TN + FN 99+6+ 57+6 -Thuật tốn SVM : Độ xác= TP+TN 107+60 = =0.977 TP+ FP+TN + FN 107+1+60+3 Kết đánh giá dựa độ xác với hai mơ hình Nạve Bayes SVM cho độ xác 912 0.977 Kết ghi chi tiết bảng Bảng 4.5 Bảng kết đánh giá dựa theo độ xác Thuật tốn Accuracy Naïve Bayes 0.906 SVM 0.977 Từ bảng 4.3 cho thấy kết huấn luyện với thuật toán SVM cho độ xác cao huấn luyện với thuật tốn Naive Bayes (0.977 so với 0.912) Sau đánh giá với Precision Recall độ xác tất cho ta thấy thuật tốn SVM cho kết thực nghiệm cao thuật tốn Nạve Bayes Do kết mơ hình huấn luyện thuật tốn SVM chọn mơ hình để dự đoán 42 KẾT LUẬN Đề tài đề tài lĩnh vực tin sinh học Một lĩnh vực có vai trò lớn nhằm phục vụ cho lĩnh vực y khoa – lĩnh vực cấp thiết sống Bài toán đưa sử dụng hai thuật toán thuật tốn Nạve Bayes thuật tốn SVM (Support Vector Machine) nhằm phân loại ung thư vú Đây tốn có ứng dụng cao sống Kết huấn luyện thực nghiệm với Support Vector Machine cho độ xác lên tới 0.977 Do mơ hình đề xuất đề tài có tính khả thi cao ứng dụng cho tốn thực tế Ngồi ra, thực đề tài này, em học cách ứng dụng triển khai thuật toán Machine Learning vào toán thực tế Đồng thời có hiểu biết sâu sắc thuật tốn nghiên cứu thuật tốn Nạve Bayes thuật toán SVM (Support Vector Machine) Tuy nhiên, đề tài tồn nhiều hạn chế Dữ liệu sử dụng đề tài lấy từ liệu từ Wisconsin (WDBC) để huấn luyện Bộ liệu có trường liệu lớn, yêu cầu đưa vào thực tế khó đáp ứng đầy đủ Ngồi ra, tốn chưa ứng dụng cho dự liệu thực tế nhóm bệnh nhân khác Mơ hình huấn luyện đề tài chưa ứng dụng để giải toán bệnh viện sở y tế Trong tương lai, em hi vọng đề tài đề tài lĩnh vực tin sinh học khác đưa vào thực tế để giải toán sở y tế bệnh viện Để toán tốt có tính ứng dụng cần bổ sung thêm liệu Cũng cần bổ sung thêm kiến thức y học để hiểu biết thuộc tính liên quan đến vấn đề ung thư vú từ thêm giảm bớt trường liệu để phục vụ huấn luyện nhằm có kết huấn luyện tốt có tính thực tiễn Ngoài cần bổ sung thêm kiến thức thuật toán học máy khác để ứng dụng cho toán 43 44 TÀI LIỆU THAM KHẢO [1] "Wikipedia", [Online], Available: https://vi.wikipedia.org/wiki/H%E1%BB %8Dc_m%C3%A1y [2] "m2tech", [Online], Available : https://m2tech.buyit.vn/hoc-may-machinelearning-la-gi-ung-dung-cua-hoc-may/ [3] N.T.HOP, [Online], Available : https://viblo.asia/p/thuat-toan-phan-lop-naivebayes-924lJWPm5PM [4] "Wordpress", [Online], Available : https://neralnetwork.wordpress.com/2018/05/11/thuat-toan-support-vectormachine-svm/ [5] "Viblo", [Online], Available : https://viblo.asia/p/support-vector-machine-tronghoc-may-mot-cai-nhin-don-gian-hon-XQZkxoQmewA [6] "vimentor.com", [Online], Available : https://www.vimentor.com/vi/lesson/tienxu-ly-du-lieu-trong-linh-vuc-hoc-may-phan-3 [7] "Viblo", [Online], Available : https://viblo.asia/p/confusion-matrix-ma-trannham-lan-ma-tran-loi-V3m5WQB7ZO7 [8] "hoctructuyen123", [Online], Available : http://hoctructuyen123.net/cac-phuongphap-danh-gia-mot-mo-hinh-phan-lop-du-lieu [9] "Openplanning.net", [Online], Available : https://openplanning.net/11385/gioithieu-ve-python [10] tecktrending.com, [Online], Available : https://tecktrending.com/thu-vien-pythoncho-khoa-hoc-du-lieu/ [11] Benhvien103, [Online], Available : http://www.benhvien103.vn/thuc-trang-vacap-nhat-ung-thu-tai-viet-nam/ [12] "ichi.pro", [Online], Available : https://ichi.pro/vi/tien-xu-ly-du-lieu-voi-python62761617448240 [13] "tek4.vn", [Online], Available : https://tek4.vn/khoa-hoc/machine-learning-coban/training-set-va-testing-set [14] D Graffox, "IEEE Citation Reference," Sep 2009 [Online] Available: http://www.ieee.org/documents/ieeecitationref.pdf [15] Apr 2011 [Online] Available: http://libinfo.uark.edu/reference/citingyoursources.asp [16] [Online] Available: http://www.ijssst.info/info/IEEE-Citation-StyleGuide.pdf [Accessed 2011] 45 [17] J Barzun and H Graff, The Modern Researcher, 5th ed ed., New York: Harcourt Brace Jovanovich Inc., 1992 [18] N Wells, 2007 [Online] Available: http://www.nissawells.com/samples/wmanual.pdf [19] P J Denning, "Editorial: Plagiarism in the Web," Communications of the ACM, vol 98, no 12, p 29, Dec 1995 [20] B Martin, "Plagiarism: a misplaced emphasis," Journal of Information Ethics, vol 3, no 2, pp 36-47, 1994 [21] B Belkhouche et al, "Plagiarism detection in software designs," in Proc of the 42nd Ann Southeast Regional Conf., 2004 [22] T Doe, Dec 2011 [Online] Available: http://grad.uark.edu/dean/thesisguide.php [23] Cornell University Library PSEC Documentation Committee, Feb 2010 [Online] Available: http://www.library.cornell.edu/resrch/citmanage/apa [24] "Wordpress", [Online], Available : 46 PHỤ LỤC 47

Ngày đăng: 14/10/2022, 21:54

HÌNH ẢNH LIÊN QUAN

Hình 2.1 Các phương pháp học máy phổ biến hiện nay - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Hình 2.1 Các phương pháp học máy phổ biến hiện nay (Trang 20)
Hình 2.2 Minh họa siêu phẳng trong SVM - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Hình 2.2 Minh họa siêu phẳng trong SVM (Trang 28)
Hình 2.3 Vấn đề chọn siêu phẳng trong SVM - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Hình 2.3 Vấn đề chọn siêu phẳng trong SVM (Trang 29)
Hình 2.4 Margin trong vấn đề chọn siêu phẳng - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Hình 2.4 Margin trong vấn đề chọn siêu phẳng (Trang 30)
Confusion Matrix ma trận nhầm lẫn hay ma trận lỗi là một bố cục bảng cụ thể cho phép hình dung hiệu suất của một thuật tốn - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
onfusion Matrix ma trận nhầm lẫn hay ma trận lỗi là một bố cục bảng cụ thể cho phép hình dung hiệu suất của một thuật tốn (Trang 36)
Một mơ hình phân lớp tốt là mơ hình cĩ cả Precision và Recall đều cao, tức càng gần một càng tốt - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
t mơ hình phân lớp tốt là mơ hình cĩ cả Precision và Recall đều cao, tức càng gần một càng tốt (Trang 39)
Từ tình hình thực tiễn trên, em nhận thấy việc ứng dụng các thuật tốn học máy vào chẩn đốn ung thư đang ngày càng trở nên cần thiết hơn - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
t ình hình thực tiễn trên, em nhận thấy việc ứng dụng các thuật tốn học máy vào chẩn đốn ung thư đang ngày càng trở nên cần thiết hơn (Trang 43)
Hình 3.6 Phân bổ của dữ liệu vào 2 lớp - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Hình 3.6 Phân bổ của dữ liệu vào 2 lớp (Trang 46)
Mục tiêu của machinelearning là tạo ra những mơ hình cĩ khả năng tổng quát hĩa để dự đốn tốt trên cả dữ liệu chưa thấy bao giờ (nằm ngồi tập huấn luyện), do đĩ, để biết một thuật tốn hay mơ hình cĩ tốt hay khơng thì sau khi được huấn luyện, mơ hình cần đư - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
c tiêu của machinelearning là tạo ra những mơ hình cĩ khả năng tổng quát hĩa để dự đốn tốt trên cả dữ liệu chưa thấy bao giờ (nằm ngồi tập huấn luyện), do đĩ, để biết một thuật tốn hay mơ hình cĩ tốt hay khơng thì sau khi được huấn luyện, mơ hình cần đư (Trang 49)
 Kiểm thử mơ hình - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
i ểm thử mơ hình (Trang 51)
3.2.4.2 Huấn luyện với mơ hình SVM (Support Vector Machine) - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
3.2.4.2 Huấn luyện với mơ hình SVM (Support Vector Machine) (Trang 52)
Hình 3.9 Mơ hình huấn luyện với thuật tốn SVM - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Hình 3.9 Mơ hình huấn luyện với thuật tốn SVM (Trang 53)
Sau khi huấn luyện thì các mơ hình đã được huấn luyện sẽ được thử nghiệm với tập huấn luyện - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
au khi huấn luyện thì các mơ hình đã được huấn luyện sẽ được thử nghiệm với tập huấn luyện (Trang 54)
Bảng dưới là kết quả chẩn đố nu ác tính M dựa theo việc đánh giá bằng Precision và Recall dựa trên hai thuật tốn Nạve Bayes và SVM  - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Bảng d ưới là kết quả chẩn đố nu ác tính M dựa theo việc đánh giá bằng Precision và Recall dựa trên hai thuật tốn Nạve Bayes và SVM (Trang 56)
Bảng 4.3 Bảng kết quả chẩn đố nu lành tính B dựa theo việc đánh giá bằng Precision và Recall - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
Bảng 4.3 Bảng kết quả chẩn đố nu lành tính B dựa theo việc đánh giá bằng Precision và Recall (Trang 56)
Kết quả đánh giá dựa trên độ chính xác với hai mơ hình Nạve Bayes và SVM cho độ chính xác lần lượt là 0 - ỨNG DỤNG HỌC MÁY ĐỂ PHÂN LOẠI UNG THƯ VÚ
t quả đánh giá dựa trên độ chính xác với hai mơ hình Nạve Bayes và SVM cho độ chính xác lần lượt là 0 (Trang 57)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w