Các tiêu chí đánh giá hiệu quả phân loại

Một phần của tài liệu Nghiên cứu, phát triển giải pháp hỗ trợ phát hiện các dấu hiệu tổn thương hình khối trên ảnh chụp Xquang vú (Trang 82)

Các vùng nghi ngờ tổn thương hình khối (gồm các TP-ROI và FP-ROI như đã được đánh giá ở chương 3) sẽ được phân loại thành vùng chứa tổn thương hình khối hay vùng mô vú bình thường dựa trên các đặc trưng của từng vùng. Như vậy phân loại một vùng nghi ngờ có thể là phân loại đúng hoặc phân loại sai. Bốn khả năng phân loại có thể được thể hiện ở bảng 4.1. Cụ thể như sau

Dương tính thật TP (True Positive):

TP-ROI được phân loại đúng thành vùng chứa tổn thương hình khối Âm tính thật TN (True Negative):

FP-ROI được phân loại đúng thành vùng chứa mô vú bình thường Dương tính giả FP (False Positive)

FP-ROI bị phân loại sai thành vùng chứa tổn thương hình khối Âm tính giả FN (False Negative)

TP-ROI bị phân loại sai thành vùng chứa mô vú bình thường

Bảng 4.1.Bốn trường hợp phân loại có thể

Phân loại

Vùng chứa tổn

thương hình khối Vùng chứa mô vúbình thường

Thực tế

TP-ROI TP FN

FP-ROI FP TN

Để đánh giá hiệu quả của một phương pháp phân loại có thể dựa trên một số tiêu chí như tỷ lệ dương tính thật, tỷ lệ âm tính thật tỷ lệ dương tính giả, tỷ lệ âm tính giả được cho bởi

Độ nhậy hay tỷ lệ dương tính thật TPF (True PositiveFraction): Độ nhạy = TPF= TP

TP+FN (4.1)

Độ đặc hiệu hay tỷ lệ âm tính thật TNF (True Negative Fraction): Độ đặc hiệu TNF= TN

TN+FP (4.2)

Tỷ lệ dương tính giả FPF (False Positive Fraction) FP FPF=

TN+FP (4.3)

Tỷ lệ âm tính giả FNF (False Negative Fraction) FN FNF=

TP+FN (4.4)

Có thể dễ dàng nhận thấy, các tỷ lệ này là không độc lập với nhau. Ta luôn có TPF + FNF = 1

Mục đích của việc phân loại này như đã nêu ở trên là làm giảm số lượng dương tính giả mà vẫn giữ được độ nhạy cao tức là tỷ lệ FPF cần được giảm thiểu trong khi đó tỷ lệ TPF vẫn cao. Như vậy, có thể đánh giá hiệu quả của phương pháp phân loại chỉ dựa vào 2 chỉ tiêu TPF và FPF. Tuy nhiên, khi sử dụng cặp 2 chỉ tiêu này để so sánh hiệu quả của các phương pháp phân loại khác nhau sẽ gặp khó khăn. Nhất là trong trường hợp một phương pháp phân loại có TPF cao hơn và FPF thấp hơn một phương pháp khác. Tức là một phương pháp cho hiệu quả tốt hơn với những người thực tế bị bệnh còn một phương pháp lại cho hiệu quả tốt hơn với những người thực tế không bị bệnh. Khi đó rất khó để chỉ ra phương pháp nào là tốt hơn phương pháp nào. Vấn đề này được giải quyết bằng cách sử dụng đường cong đặc tính bên nhận ROC (Receiver Operating Characteristic) [42].

Được thể hiện ở hình 4.1 là mô tả cách hình thành đường cong ROC. Ngưỡng phân loại được thay đổi để thu được các cặp giá trị (TPF, FPF) khác nhau. Đường cong ROC biểu diễn sự thay đổi của TPF theo FPF.

Hình 4.1.Cách tính các cặp giá trị (TPF, FPF) khác nhau để xây dựng đường cong ROC.

Hình 4.2.Ví dụ minh họa đường cong ROC.

Hình 4.2 minh họa một đường cong ROC thu được. Đường cong ROC được sử dụng để lựa chọn điểm làm việc bù trừ giữa TPF và FPF. Diện tích dưới đường cong ROC AZ

được sử dụng để đánh giá hiệu quả phân loại tổng thể của phương pháp phân loại. Giá trị của AZnằm trong dải từ 0 tới 1. Giá trị AZcàng lớn, hiệu quả phân loại càng cao. Nếu 0.8 ≤ AZ< 0.9 thì hiệu quả phân loại là tốt. Còn nếu AZ≥ 0.9 thì hiệu quả phân loại là xuất sắc [59].

Một phần của tài liệu Nghiên cứu, phát triển giải pháp hỗ trợ phát hiện các dấu hiệu tổn thương hình khối trên ảnh chụp Xquang vú (Trang 82)

Tải bản đầy đủ (PDF)

(139 trang)