8 Tổng kết
7.3 Ảnh dữ liệu của kiểu gán nhãn rút gọn
Với mục tiêu là so sánh và tìm ra mô hình phù hợp với tập dữ liệu và bài toán, nên tôi đã thực hiện các thí nghiệm trên tập huấn luyệnkhông được làm giàu, để các mẫu trong tập huấn luyện giống nhau khi thực hiện quá trình huấn luyện. Ngoài ra, các thông số mô hình đều được giữ giống nhau nhằm đảm bảo tính khách quan. Sau nhiều lần huấn luyện và thử nghiệm, kết quả cuối cùng được đưa qua hàm đánh giá đã nêu ở trên và được thể hiện ở trong bảng 7.2.
STT Thí nghiệm mean IU frequency weighted IU
1 Thí nghiệm 1 0.560 0.759 2 Thí nghiệm 2 0.581 0.782 3 Thí nghiệm 3 0.581 0.788 4 Thí nghiệm 4 0.629 0.797 5 Thí nghiệm 5 0.642 0.805 6 Thí nghiệm 6 0.648 0.826
Bảng 7.2: Kết quả đánh giá của từng thí nghiệm
Dựa vào bảng 7.2 ta có thể kết luận rằng, với tập dữ liệu nhỏ hiện tại thì việc giảm số lượng nhãn giúp mô hình hoạt động hiểu quả hơn rất nhiều, ngoài ra việc đưa các nhãn Giá trị về thành một cũng giúp việc học giảm đi sai số rất nhiều. Ngoài ra giữa ba biến thể của U-Net thì có vẻ như Res50-U-Net cho ra kết quả nhỉnh hơn 2 mô hình còn lại. Tuy nhiên với bài toán nhận diện vùng văn bản thì kết quả này chưa thực sự đánh giá chính xác mô hình được, do nhiều điểm ảnh không mang tính chất chính xác ngay từ khi đánh nhãn, với cách đánh nhãn hình vuông bao vùng có chữ viết.
Hình 7.4b cho ta thấy kết quả dự đoán của mô hình Res50-U-Net - nhãn rút gọn trên tập kiểm tra so với hinh 7.4a. Mặc dù với kết quả đánh giá không được quá cao, nhưng nhờ tính chất vùng văn bản cộng thêm bước hậu xử lý loại bỏ những vùng nhiễu thì kết quả đem lại vẫn tương đối tốt.
(a) Ảnh với nhãn được đánh
(b) Ảnh sau khi đi qua Res50-U-Net và bước hậu xử lý