1. Trang chủ
  2. » Thể loại khác

NHẬN DẠNG KÝ TỰ QUANG HỌC BẰNG MẠNG NƠRON

5 310 2

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 5
Dung lượng 209 KB

Nội dung

NHẬN DẠNG TỰ QUANG HỌC BẰNG MẠNG NƠRON OPTICAL CHARACTER RECOGNITION BY NEURAL NETWORK TS Ngô Văn Sỹ Khoa Điện tử Viễn thông, Trường Đại học Bách khoa, Đại học Đà Nẵng TÓM TẮT Nhận dạng tự quang học kỹ thuật sử dụng để chuyển đổi ảnh văn sang dạng văn chỉnh sửa máy tính Nó ứng dụng cơng tác quét lưu trữ tài liệu cũ, đẩy nhanh việc nhập liệu vào máy với lỗi Bài báo giới thiệu phương pháp nhận dạng tự kỹ thuật mạng nơron ABSTRACT Optical Character Recognition (OCR) is a technology that is used to convert scanned images of text into computer editable and searchable text It can be used to scan and preserve historical documents, to scan data entry forms in a faster and less error prone manner… This plan introduce a method which identify characters, it’s Neural Network technology Đặt vấn đề Mạng nơron nhân tạo (Artificial Neural Network: ANNs) tái tạo kỹ thuật chức hệ thần kinh người với vô số nơron liên kết truyền thông với qua mạng Giống người, ANNs học kinh nghiệm, lưu kinh nghiệm sử dụng tình phù hợp Trong kỹ thuật nhận dạng tự, mạng nơron tỏ ưu phương pháp truyền thống chỗ không tốn thời gian cho thủ tục tiền xử lý, làm mảnh tự, trích trọn đặc trưng… Mặt khác phương pháp định nhận dạng truyền thống cài đặt tĩnh chương trình, muốn bổ xung thêm mẫu học ta phải thiết kế lại chương trình Trong với mạng nơron, cần cung cấp tập mẫu vào liệu cho pha huấn luyện bổ xung vào “bộ nhớ mạng” kiểu liệu mà không ảnh hưởng đến cấu trúc chương trình ban đầu Trong phạm vi đề tài giới thiệu tổng quan lý thuyết mạng nơron ứng dụng mạng Perceptron nhiều lớp lan truyền ngược sai số để thiết kế chương trình nhận dạng tự quang học Phương pháp thuật toán nhận dạng tự 2.1 Cơ sở liệu Cơ sở liệu cho toán nhận dạng tự quang gồm 90 tự Latinh với loại font khác nhau, với giá trị Unicode tương ứng chúng Hình Mẫu tự nhận dạng tự quang 2.2 Phương pháp nhận dạng Phương pháp nhận dạng tự quang mạng nơron bao gồm bước miêu tả hình 2.2.1 Thu nhận ảnh Ảnh văn bản, tài liệu thu nhận máy quét scanner, webcam, thiết bị thu nhận ảnh thông dụng khác Chuyển đổi sang dạng ảnh nhị phân 2.2.2 Phân tích ảnh để tìm tự Thu nhận ảnh tự Phân tích ảnh để tìm tự Tiền xử lý tự Mạng nơron nhận dạng tự Quá trình phân tích ảnh để tìm tự bao gồm Hậu xử lý liệu bước sau:  Tách dòng tự khỏi ảnh tự Hình Các bước nhận dạng  Tách từ riêng biệt khỏi dòng tự tự dùng mạng nơron  Tách riêng tự khỏi từ Thuật toán sử dụng để tách tự khỏi ảnh văn dựa đặc tính biên độ độ sáng pixel ảnh 2.2.3 Tiền xử lý tự Quá trình tiền xử lý tự giải vần đề ánh xạ giá trị pixel ảnh tự vào ma trận 10x15 tuyến tính hóa ma trận thành 150 giá trị đưa vào 150 nơron lớp vào mạng 2.2.4 Mạng nơron nhận dạng tự Hiện nay, loại mạng nơron thơng dụng gồm có: mạng truyền thẳng (feel-forward), mạng hồi qui (feedback), mạng tự tổ chức (self-organizing).Mạng truyền thẳng feed-forward bao gồm nhiều lớp đơn vị xử lý phi tuyến (non-linear processing unit) Một vector đầu vào đưa vào lớp vào mạng sau tính tốn thực lan truyền thẳng từ lớp vào sang lớp ẩn kết thúc lớp Mạng Perceptron nhiều lớp Hình Mạng MLP nhận dạng tự quang MLP (MultiLayer Perceptron) loại mạng truyền thẳng điển hình, sử dụng rộng rãi hệ thống nhận dạng nhận dạng tự quang, chữ viết tay, nhận dạng tiếng nói… Với tốn nhận dạng tự, ta thiết kế mạng MLP có lớp: lớp vào có 150 nút tương ứng với 150 phần tử vectơ ma trận pixel, lớp ẩn có 250 nơron ( xác định phương pháp thử-sai (Trial-and-errors)) lớp có 16 nơron tương ứng với 16 bit nhị phân giá trị Unicode tự Quá trình huấn luyện mạng: Quá trình huấn luyện trình học với tập mẫu (X s, Ts), s = 1, N để điều chỉnh tập trọng số liên kết Giải thuật huấn luyện phổ biến mạng MLP giải thuật lan truyền ngược sai số Back Propagation - Bước1: Lan truyền xuôi đầu vào Xs={x1,x2,…, xn} qua mạng: * Đầu nơron j lớp ẩn: n yj=g( ∑ w ii xi − θ j ) (1) Start i =1 m * Đầu nơron k lớp ra: yk=g( ∑ y j w jk ) s=1 j =1 m n j =1 i =1 l=1 =g( ∑ w jk g (∑ wij xi − θ j ) − θ k ) (2) - Bước 2: Lan truyền ngược sai số: Xs So sánh phần tử vectơ đầu thực Y s với phần tử tương ứng vectơ đầu mẫu T s để tính sai lệch: ek=tk - yk Tổng bình phương sai số mạng ứng với mẫu học (Xs, Ts): p Es = ∑ ( yk − tk ) 2 k =1 Ts Mạng MLP Ys p E= ∑ ( yk − t k ) k =1 Y E

Ngày đăng: 02/12/2017, 19:32

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w