Chuyển về ảnh đen trắng

Một phần của tài liệu Mạng Nơ Ron nhân tạo trong nhận dạng văn bản và ứng dụng vào hệ thống nhận dạng chữ Việt in (Trang 70 - 71)

d. Đánh giá về mạng RBF

3.2.1.1.Chuyển về ảnh đen trắng

Hệ thống sử dụng phƣơng pháp phân ngƣỡng toàn cục: tìm một ngƣỡng cho toàn bộ ảnh văn bản, dựa trên ƣớc lƣợng giá trị màu nền từ biểu đồ tần suất cƣờng độ sáng của ảnh.

Hình 3.2. Phân ngƣỡng một giai đoạn

Trong hình trên, trục x là cƣờng độ sáng và trục y là số điểm ảnh có cƣờng độ sáng tƣơng ứng. Điểm phân biệt màu nền, màu chữ là ngƣỡng T, là điểm cực tiểu trong biểu đồ.

Phƣơng pháp phân ngƣỡng toàn cục có ƣu điểm là đơn giản. Tuy nhiên trong một số trƣờng hợp nó không tìm đƣợc ngƣỡng thích hợp nên có nhiều phƣơng pháp khác nhƣ phân ngƣỡng cục bộ (thích ứng), phân ngƣỡng tổng thể qua nhiều giai đoạn.

Hình 3.3. Ảnh đen trắng nhận đƣợc sau khi phân ngƣỡng

3.2.1.2. Khử nhiễu

Nhiễu ảnh hƣởng không chỉ đến khả năng của bộ nhận dạng mà còn ảnh hƣởng đến việc xác định vị trí của ký tự. Do đó để nâng cao chất lƣợng nhận dạng thì khử đƣợc nhiễu càng nhiều càng tốt. Có thể sử dụng phƣơng pháp lọc trung vị (median filter) để khử nhiễu đốm.

Với nhiễu vạch, trong [34] đã áp dụng phƣơng pháp khử miền liên thông nhỏ: xác định tất cả các vùng liên thông trên ảnh. Với mỗi vùng liên thông nhỏ (kích thƣớc nhỏ hơn ngƣỡng), kiểm tra xem nó có phải là nhiễu không? (là nhiễu nếu nó không phải là dấu ký tự, dấu “.”, “,”). Nếu là nhiễu thì ta xoá nó.

3.2.1.3. Tách khối

Hiện tại hệ thống mới chỉ xử lý các văn bản có cấu trúc đơn giản. Tuy nhiên hoàn toàn có thể áp dụng phƣơng pháp tách khối dựa trên khoảng cách Hausdorff đã nghiên cứu ở chƣơng 1 đối với các văn bản phức tạp.

Một phần của tài liệu Mạng Nơ Ron nhân tạo trong nhận dạng văn bản và ứng dụng vào hệ thống nhận dạng chữ Việt in (Trang 70 - 71)