Ảnh minh họa 3 phép biến đổi thêm, sửa, xóa

Một phần của tài liệu Tìm hiểu phương pháp rút trích thông tin hóa đơn tiếng việt (Trang 55 - 58)

Ví dụ, khoảng cách Levenshtein giữa chuỗi “sitting” và “kitten” là 3 vì “sitting” cần ít nhất 3 bước biến đổi để trở thành “kitten”:

− Bước 1: “sitting” → “kitting” (thay thế).

− Bước 2: “kitting” → “kitteng” (thay thế).

− Bước 3: “kitteng” → “kitten” (xóa).

3.2.2.2. Độ đo CER

Trong cuộc thi RIVF2021 MC-OCR, độ đo CER được sử dụng để đánh giá kết quả được các thí sinh nộp lên.

14 https://towardsdatascience.com/evaluating-ocr-output-quality-with-character-error-rate-cer-and- word-error-rate-wer-853175297510

52

CER được xây dựng dựa trên khoảng cách Levenshtein với cơng thức như sau:

Trong đó:

− là số bước biến đổi ít nhất để chuyển kết quả dự đoán được thành đáp án thực tế (groundtruth).

− là số ký tự trong đáp án thực tế.

3.3. Quy trình thực nghiệm và đánh giá 3.3.1 Dữ liệu 3.3.1 Dữ liệu

Dữ liệu trong quá trình thực nghiệm được lấy từ cuộc thi RIVF2021 MC-OCR. Trong đó:

− Tập train của cuộc thi được dùng để huấn luyện các model object detection ở giai đoạn 1.

− Tập private test của cuộc thi được dùng để model dự đoán kết quả và submit kết quả lên server của cuộc thi để nhận được đánh giá.

3.3.2 Cài đặt môi trường

− Link reference: https://github.com/open-mmlab/mmdetection

− Yêu cầu cài đặt:

− Chuẩn bị:

+ config_faster_rcnn.py: file dùng để thiết lập cấu hình cho phương pháp Faster RCNN.

+ config_yolov3.py: file dùng để thiết lập cấu hình cho phương pháp YOLOv3.

+ config_yolof.py: file dùng để thiết lập cấu hình cho phương pháp YOLOF.

Python v3.7.10 PyTorch: 1.7.0 CUDA >= v10.0 MMCV >= 1.3.8

53 3.3.3 Tiến hành thực nghiệm

3.3.3.1. Huấn luyên model

(a) Phương pháp Faster R-CNN:

− Chạy huấn luyện bằng command:

(b) Phương pháp YOLOv3:

− Chạy huấn luyện bằng command:

(c) Phương pháp YOLOF:

− Chạy huấn luyện bằng command:

3.3.3.2. Nhận diện và rút trích thơng tin:

Sau khi huấn luyện các model để nhận diện và phân loại thơng tin cần trích xuất, nhóm sử dụng các model này để dự đoán bounding box của các thông tin trong từng hóa đơn và lưu trữ thông tin của các bounding box này dưới dạng file json (COCO format) (Giai đoạn 1).

File json này sau đó sẽ được đưa qua model pretrained TransformerOCR của Phạm Quốc được nhắc đến ở phần 2.2.2.2. Kết quả đầu ra của model là phần thông tin trong các bounding box dưới dạng text được nhóm chuyển vào file csv theo đúng format quy định của cuộc thi RIVF2021 MC-OCR để submit

lên trang web cuộc thi

(https://aihub.vn/competitions/1?fbclid=IwAR38wwnawFQDJbCLzOiVEG5sS YEOshGfisF4xjePXZK6Irlv2482aAIarsY#participate-submit_results) và được chấm điểm tự động dựa trên độ đo CER.

!python tools/train.py config_faster_rcnn.py

!python tools/train.py config_yolov3.py

54

Một phần của tài liệu Tìm hiểu phương pháp rút trích thông tin hóa đơn tiếng việt (Trang 55 - 58)

Tải bản đầy đủ (PDF)

(62 trang)