Giao diện chương trình

Dưới đây là giao diện đầu tiên khi khởi động chương trình với 3 chức năng chính:

- Trích xuất ảnh từ Video đồng thời xử lý ảnh thành ảnh đa cấp xám - Sử dụng Tesseract-OCR để nhận dạng văn bản từ ảnh

- Lọc trùng văn bản

Chức năng trích xuất ảnh từ Video và xử lý ảnh thành ảnh đa cấp xám

Hình 3. 2: Chức năng tách và xử lý ảnh thành ảnh đa cấp xám

Ở đây, giao diện cho phép người dùng chọn đường dẫn tới nơi lưu trữ video cần xử lý. Với 2 lựa chọn tương ứng với mục tiêu đề ra:

- CUT: Thực hiện lấy ảnh ra từ video theo từng khung hình đại diện - CONVERT: Thực hiện xử lý ảnh thu được thành tập ảnh đa cấp xám

Sử dụng Tesseract-OCR để nhận dạng văn bản từ ảnh

Hình 3. 3: Chức năng sử dụng Tesseract OCR để nhận dạng văn bản

Giao diện cho phép người dùng lựa chọn thư mục chứa ảnh đa cấp xám ở trên để tiến hành thu thập văn bản bằng Tesseract-OCR. Văn bản thu được sẽ hiển thị trên Listbox. Với mỗi dòng là nội dung văn bản mà Tesseract-OCR thu nhập được.

- SAVE: Lưu lại toàn bộ đường dẫn tới từng ảnh đa cấp xám cần xử lý bằng Tesseract-OCR dưới dạng tập tin txt (out-list.txt).

- OCR: sẽ sử dụng Tesseract-OCR trên từng đường dẫn ảnh theo tập tin out- list.txt thu được ở trên và đưa kết quả thu nhận được lên Listbox của giao diện. Đồng thời lưu kết quả thu được trên tập tin out-ocr.txt

Lọc trùng lặp văn bản

Giao diện cho phép người dùng lựa chọn việc lọc trùng những văn bản bị trùng lặp ở những ảnh đa cấp xám giống nhau qua nút FILTER

Hình 3. 4: Chức năng lọc trùng văn bản

FILTER: Tiến hành lọc trùng theo dòng những văn bản có nội dung giống nhau từ tập tin out-ocr.txt ở phần trên theo từng dòng một. Kết quả thu được sẽ hiện thị lên textbox của giao diện đồng thời lưu trữ thành tập tin filter-ocr.txt

Các giải thuật trong nhận dạng văn bản