Hình ảnh từ bộ dữ liệu ArT Nguồn: [47] [48]

Một phần của tài liệu Ứng dụng học sâu giải quyết bài toán nhận dạng ký tự tiếng việt (Trang 41 - 44)

2 CÁC PHƯƠNG PHÁP TIẾP CẬN BÀI TOÁN

1.18 Hình ảnh từ bộ dữ liệu ArT Nguồn: [47] [48]

Chương 2

CÁC PHƯƠNG PHÁP TIẾP CẬN BÀI TOÁN

Để lựa chọn và phát triển theo hướng đi có khả năng nổi trội nhất, tác giả tập trung vào việc phân tich, đánh giá tính chất, điểm mạnh điểm yếu của từng phương pháp tiếp cận, từ đó xác định hướng tiếp cận hiệu quả nhất cho đề tài.

2.1 Phương pháp nhận dạng từng ký tự - Char-

acter Based OCR

2.1.1 Tổng quan hướng tiếp cận

Theo Tappert et al. (1990) [39], Nhận dạng ký tự quang học - Optical Character Recognition được định nghĩa là một hệ thống chuyển đổi chữ đầu vào thành ký tự máy. Đến thời điểm hiện tại, OCR đã phát triển và được cải tiến với rất nhiều nghiên cứu, hướng tiếp cận khác nhau, một trong số phương pháp tiếp cận đầu tiên cần nhắc tới là Phương pháp nhận dạng từng ký tự - Character Based OCR.

Cũng như tên gọi, điểm đặc biệt nhất của phương pháp tiếp cận này là chia tách ảnh đầu vào thành từng ký tự và đưa vào mô hình, mỗi ký tự được so sánh với một cơ sở dữ liệu các ký tự. Ký tự trong cơ sở dữ liệu giống với ký tự đang đọc nhất sẽ được chọn. Trên thực tế phân tách dữ liệu sẽ được tiến hành như Hình 2.1 bên dưới.

Hình 2.1: Phân tách ký tự trong Phương pháp nhận dạng từng ký tự - Character Based OCR. Nguồn: [44]

2.1.2 Xử lý ảnh

Thông thường, các ảnh đầu vào không ở định dạng lý tưởng cho mô hình học máy. Để đầu vào tối ưu và đầu ra chính xác nhất, trước tiên cần xử lý hình ảnh. Đây là một bước rất quan trọng đối với OCR, mục đích chính là làm cho văn bản trở nên dễ đọc hơn. Các vấn đề thường gặp với ảnh đầu vào có thể kể đến như ảnh bị lệch, đơn sắc, sai kích thước, quá nhiễu, ... Một số kỹ thuật xử lý ảnh như sau:

Khử độ lệch (De-skewing):Nếu ảnh đầu vào không được căn chỉnh chính xác (bị lệch, nghiêng, xoay, ...), cần xoay lại tài liệu vài độ theo chiều kim đồng hồ hoặc ngược chiều kim đồng hồ để tạo ra các dòng văn bản thẳng theo chiều ngang hoặc dọc, ví dụ như Hình 2.2 bên dưới:

Một phần của tài liệu Ứng dụng học sâu giải quyết bài toán nhận dạng ký tự tiếng việt (Trang 41 - 44)

Tải bản đầy đủ (PDF)

(107 trang)