3.1 Tổng quan bài tốn học cĩ giám sát, hỗ trợ chẩn đốn bệnh ung thư vú
3.1.2 Giới thiệu về ung thư vú
Nguyên nhân chính thứ hai gây tử vong ở phụ nữ là ung thư vú (sau ung thư phổi) 1. 246.660 trường hợp phụ nữ mắc mới ung thư vú xâm lấn dự kiến sẽ được chẩn đốn ở Hoa Kỳ trong năm 2016 và 40,450 phụ nữ tử vong là ước tính. Ung thư vú chiếm khoảng 12% tổng số ca ung thư mới và 25% tổng số ca ung thư ở phụ nữ. Cơng nghệ Thơng tin và Truyền thơng (ICT) cĩ thể đĩng những vai trị tiềm năng trong việc chăm sĩc bệnh ung thư. Trên thực tế, dữ liệu lớn cĩ nâng cao khơng chỉ kích thước của dữ liệu mà cịn tạo ra giá trị từ nĩ; Dữ liệu lớn, trở thành đồng nghĩa của dữ liệu khai thác, phân tích kinh doanh và thơng minh kinh doanh, đã tạo ra một thay đổi lớn trong BI từ báo cáo và quyết định đến kết quả dự đốn. Ví dụ, các phương pháp tiếp cận khai thác dữ liệu được áp dụng cho các chủ đề khoa học y tế tăng lên nhanh chĩng do hiệu suất cao trong việc dự đốn kết quả, giảm chi phí thuốc, nâng cao sức khỏe của bệnh nhân, cải thiện giá trị và chất lượng chăm sĩc sức khỏe và trong việc đưa ra quyết định theo thời gian thực để cứu sống con người. Cĩ nhiều thuật tốn để phân loại và dự đốn kết quả ung thư vú. Bài báo hiện tại cho một so sánh giữa hiệu suất của bốn bộ phân loại: SVM5, NB6, C4.57 và k-NN8 nằm trong số những các thuật tốn khai thác dữ liệu cĩ ảnh hưởng trong cộng đồng nghiên cứu và nằm trong số 10 thuật tốn khai thác dữ liệu hàng đầu 9,10. Của em mục đích là đánh giá hiệu quả và hiệu quả của các thuật tốn đĩ về độ chính xác, độ nhạy, độ đặc hiệu và độ chính xác.