CHƯƠNG 3 THỰC NGHIỆM VÀ ĐÁNH GIÁ
3.2. Phương pháp đánh giá
3.2.1 Bước nhận dạng và phân loại thông tin 3.2.1.1. Confusion matrix 3.2.1.1. Confusion matrix
Confusion Matrix (Hình 3-4. Confusion Matrix) cung cấp một cách chi tiết để đánh giá kết quả của một thuật toán phân loại có giám sát (supervised tiết để đánh giá kết quả của một thuật toán phân loại có giám sát (supervised
49
learning). Một ma trận nhầm lẫn chia kết quả thành hai loại: giá trị (nhãn) dự đoán và giá trị (nhãn) thực tế của các điểm dữ liệu.
Hình 3-4. Confusion Matrix Trong đó:
− True Positive (TP): trường hợp dương tính và được dự đốn dương tính.
− True Negative (TN): trường hợp âm tính và được dự đốn âm tính.
− False Positive (FP): trường hợp âm tính và được dự đốn dương tính.
− False Negative (FN): trường hợp dương tính và được dự đốn âm tính.
3.2.1.2. Precison and Recall
Precision được định nghĩa là tỉ lệ số điểm True Positive trong tổng số những điểm được phân loại là Positive (TP + FP).
Recall được định nghĩa là tỉ lệ số điểm True Positive trong số những điểm thật sự là Positive (TP +FN).
50
3.2.1.3. Intersection ove Union (IoU)
Intersection over Union (IoU) được đùng làm tiêu chuẩn để đánh giá cho bài toán phát hiện đối tượng trên ảnh, bằng cách đánh giá mức độ overlap (trùng lắp) giữa 2 bounding boxes. Kết quả IoU được cho là tốt khi >=0.5.
3.2.1.4. Average Precision (AP)
Giả sử có N ngưỡng để tính precision và recall, mỗi ngưỡng có 1 cặp giá trị với . Precision-Recall curve được vẽ bằng cách vẽ từng điểm có toạ độ trên trục toạ độ và nối chúng với nhau.
Hình 3-5. Đồ thị mối quan hệ của precision, recall (Precision-Recall curve)13 Average precision được định nghĩa là diện tích phần phía dưới đường biểu diễn mối quan hệ của precision và recall. AP thường được tính xấp xỉ bằng cơng thức như sau:
Trong đó: là diện tính hình chữ nhật có chiều rộng và chiều cao .
51
3.2.1.5. Mean Average Precision (mAP)
Mean Average Precision được tính bằng cách lấy trung bình AP của tất cả các lớp.
3.2.2 Bước ánh xạ thông tin ra dạng text 3.2.2.1. Khoảng cách Levenshtein 3.2.2.1. Khoảng cách Levenshtein
Levenshtein là khoảng cách khác biệt giữa 2 chuỗi ký tự, khoảng cách này được đặt tên theo Vladimir Levenshtein – người đề ra khái niệm này vào năm 1965. Khoảng cách Levenshtein giữa chuỗi S và chuỗi T là số bước ít nhất biến chuỗi S thành chuỗi T thơng qua 3 phép biến đổi:
− Xoá 1 ký tự: “steam” → “team”.
− Thêm 1 ký tự: “steam” → “stream”.
− Thay ký tự này bằng ký tự khác: “steam” → “steal”.
Hình 3-6. Ảnh minh họa 3 phép biến đổi thêm, sửa, xóa14.
Ví dụ, khoảng cách Levenshtein giữa chuỗi “sitting” và “kitten” là 3 vì “sitting” cần ít nhất 3 bước biến đổi để trở thành “kitten”:
− Bước 1: “sitting” → “kitting” (thay thế).
− Bước 2: “kitting” → “kitteng” (thay thế).
− Bước 3: “kitteng” → “kitten” (xóa).
3.2.2.2. Độ đo CER
Trong cuộc thi RIVF2021 MC-OCR, độ đo CER được sử dụng để đánh giá kết quả được các thí sinh nộp lên.
14 https://towardsdatascience.com/evaluating-ocr-output-quality-with-character-error-rate-cer-and- word-error-rate-wer-853175297510
52
CER được xây dựng dựa trên khoảng cách Levenshtein với cơng thức như sau:
Trong đó:
− là số bước biến đổi ít nhất để chuyển kết quả dự đoán được thành đáp án thực tế (groundtruth).
− là số ký tự trong đáp án thực tế.