Báo cáo nghiên cứu khoa học NHẬN DẠNG ký tự QUANG học BẰNG MẠNG NƠRON

5 600 2
Báo cáo nghiên cứu khoa học    NHẬN DẠNG ký tự QUANG học BẰNG MẠNG NƠRON

Đang tải... (xem toàn văn)

Thông tin tài liệu

TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(27).2008 NHẬN DẠNG KÝ TỰ QUANG HỌC BẰNG MẠNG NƠRON OPTICAL CHARACTER RECOGNITION BY NEURAL NETWORK NGÔ VĂN SỸ Trường Đại học Bách khoa, Đại học Đà Nẵng TÓM TẮT Nhận dạng ký tự quang học kỹ thuật sử dụng để chuyển đổi ảnh văn sang dạng văn chỉnh sửa máy tính Nó ứng dụng công tác quét lưu trữ tài liệu cũ, đẩy nhanh việc nhập liệu vào máy với lỗi Bài báo giới thiệu phương pháp nhận dạng ký tự, kỹ thuật mạng nơron ABSTRACT Optical Character Recognition (OCR) is a technology used to convert scanned images of a text into an editable and searchable text on the computer It can be used for preserving historical documents and scanning data entry forms in a faster and less error prone manner… This paper introduces a character-identifying method called Neural Network Technology Đặt vấn đề Mạng nơron nhân tạo (Artificial Neural Network: ANNs) tái tạo kỹ thuật chức hệ thần kinh người với vô số nơron liên kết truyền thông với qua mạng Giống người, ANNs học kinh nghiệm, lưu kinh nghiệm sử dụng tình phù hợp Trong kỹ thuật nhận dạng ký tự, mạng nơron tỏ ưu phương pháp truyền thống chỗ không tốn thời gian cho thủ tục tiền xử lý, làm mảnh ký tự, trích trọn đặc trưng… Mặt khác phương pháp định nhận dạng truyền thống cài đặt tĩnh chương trình, muốn bổ sung thêm mẫu học phải thiết kế lại chương trình Trong với mạng nơron, cần cung cấp tập mẫu vào liệu cho pha huấn luyện bổ sung vào “bộ nhớ mạng” kiểu liệu mà không ảnh hưởng đến cấu trúc chương trình ban đầu Trong phạm vi báo giới thiệu tổng quan lý thuyết mạng nơron ứng dụng mạng Perceptron nhiều lớp lan truyền ngược sai số để thiết kế chương trình nhận dạng ký tự quang học Phương pháp thuật toán nhận dạng ký tự 2.1 Cơ sở liệu Hình 1: Mẫu ký tự nhận dạng ký tự quang 20 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(27).2008 Cơ sở liệu cho toán nhận dạng ký tự quang gồm 90 ký tự Latinh với loại font khác nhau, với giá trị Unicode tương ứng chúng 2.2 Phương pháp nhận dạng Phương pháp nhận dạng ký tự quang mạng nơron bao gồm bước mô tả hình Thu nhận ảnh ký tự Phân tích ảnh để tìm ký tự Tiền xử lý ký tự Hình 2: Các bước nhận dạng ký tự dùng mạng nơron Mạng nơron nhận dạng ký tự Hậu xử lý liệu 2.2.1 Thu nhận ảnh Ảnh văn bản, tài liệu thu nhận máy quét scanner, webcam, thiết bị thu nhận ảnh thông dụng khác 2.2.2 Phân tích ảnh để tìm ký tự Quá trình phân tích ảnh để tìm ký tự bao gồm bước sau: - Tách dòng ký tự khỏi ảnh ký tự - Tách từ riêng biệt khỏi dòng ký tự - Tách riêng ký tự khỏi từ Thuật toán sử dụng để tách ký tự khỏi ảnh văn dựa đặc tính biên độ độ sáng pixel ảnh 2.2.3 Tiền xử lý ký tự Quá trình tiền xử lý ký tự giải vấn đề ánh xạ giá trị pixel ảnh ký tự vào ma trận 10x15 tuyến tính hóa ma trận thành 150 giá trị đưa vào 150 nơron lớp vào mạng 2.2.4 Mạng nơron nhận dạng ký tự Hiện nay, loại mạng nơron thông dụng gồm có: mạng truyền thẳng (feelforward), mạng hồi qui (feedback), mạng tự tổ chức (self-organizing) Mạng truyền thẳng feed-forward bao gồm nhiều lớp đơn vị xử lý phi tuyến (non-linear processing unit) Một vector đầu vào đưa vào lớp vào mạng sau tính toán thực lan truyền thẳng từ lớp vào sang lớp ẩn kết thúc lớp Mạng Perceptron nhiều lớp MLP (MultiLayer Perceptron) loại mạng 21 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(27).2008 truyền thẳng điển hình, sử dụng rộng rãi hệ thống nhận dạng nhận dạng ký tự quang, chữ viết tay, nhận dạng tiếng nói… Trong báo này, thiết kế chương trình nhận dạng ký tự quang sử dụng mạng MLP có lớp: lớp vào có 150 nút tương ứng với 150 phần tử vectơ ma trận pixel, lớp ẩn có 250 nơron lớp có 16 nơron tương ứng với 16 bit nhị phân giá trị Unicode ký tự Quá trình huấn luyện mạng: Quá trình huấn luyện trình học Hình 3: Mạng MLP nhận dạng ký tự quang với tập mẫu (Xs, Ts), s  1, N để điều chỉnh tập trọng số liên kết Giải thuật huấn luyện áp dụng thiết kế chương trình nhận dạng ký tự giải thuật lan truyền ngược sai số Back Propagation Bước 1: Lan truyền xuôi đầu vào Xs={x1, x2, …, xn} qua mạng: n * Đầu nơron j lớp ẩn:yj= g(  w ii xi   j ) (1) i 1 * Đầu nơron k lớp ra: m m n j 1 j 1 i 1 yk= g(  y j w jk )=g(  w jk g ( wij xi   j )   k ) (2) Bước 2: Lan truyền ngược sai số: So sánh phần tử vectơ đầu thực Ys với phần tử tương ứng vectơ đầu mẫu Ts để tính sai lệch: ek=tk - yk Tổng bình phương sai số mạng ứng với mẫu học (Xs, Ts): p  ( yk  tk ) 2 k 1 Thông tin sai số lan truyền ngược qua mạng để điều chỉnh lại giá trị trọng số vòng lặp thứ l: * Với liên kết nơron ẩn nơron ra: w jk    k (l ) y j (l ) , với  hệ số học, yj tính theo công thức (1) E  k (l )  ek (l ) g k' ( y k (l )) w jk (l  1)  w jk (l )  w jk * Với liên kết nơron vào nơron ẩn: wij    j (l ) xi m  j (l )  g 'j ( y j ).  k (l ).w jk (l  1) j 1 22 (3) TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(27).2008 wij (l  1)  wij (l )  wij (4) Sau hiệu chỉnh trọng số, mẫu Xs tiếp tục đưa vào mạng lần thứ (l+1) tiếp tục thuật toán hiệu chỉnh trọng số E<  cho trước số vòng lặp đạt đến mức định trước Mẫu đưa vào mạng trình huấn luyện lặp lại mạng học thuộc tất mẫu Lưu cấu hình mạng lại để sẵn sàng đưa vào sử dụng Hàm kích hoạt sử dụng mạng Perceptron nhiều lớp hàm sigmoid lưỡng  , hàm sigmoid đơn cực g(s)= cực: g(s)= , đạo hàm hai s 1 e  e s hàm là: g ' ( s )  g ( s )(1  g ( s )) Sử dụng mạng: Mạng sau huấn luyện sử dụng bảng tra Các ảnh ký tự sau bước tiền xử lý đưa vào đầu vào mạng, đầu mạng vectơ Y với phần tử yk tính theo công thức (1) (2) Như đầu mạng giá trị Unicode ký tự 2.2.5 Hậu xử lý liệu Giai đoạn làm nhiệm vụ chuyển đổi giá trị Unicode sang dạng ký tự tương ứng xếp lại ký tự dạng text theo dạng ảnh văn ban đầu 2.3 Kết đánh giá Thử nghiệm việc huấn luyện mạng với tập mẫu loại font: Latinh Arial, Latinh Tahoma, Latinh Times Roman 2.3.1 Kết thay đổi số vòng lặp (Epoch) Số kí tự = 90, tốc độ học learning_rate = 150, hệ số góc hàm sigmoid  =0.014 Epoch=300 Epoch=600 Epoch=800 Loại Font Số ký Số ký Số ký % Error % Error % Error tự sai tự sai tự sai Latin Arial 4.44 3.33 1.11 Latin Tahoma 1.11 0 0 Latin Times Roman 0 0 1.11 2.3.2 Kết thay đổi tham số learing_rate Số kí tự = 90, số Epoch = 600, hệ số góc  = 0.014 50 100 120 Loại Font Số ký Số ký Số ký % Error % Error % Error tự sai tự sai tự sai Latin Arial 82 91.11 18 20 3.33 Latin Tahoma 56 62.22 11 12.22 1.11 Latin Times Roman 77 85.56 15 16.67 0 23 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG - SỐ 4(27).2008 2.3.3 Đánh giá ảnh hưởng thay đổi thông số Tăng số vòng lặp tổng quát tỉ lệ thuận hiệu suất mạng Nhưng đến mức gây tượng học vẹt (over learning), bỏ qua trạng thái tối ưu Kích thước đầu vào nhân tố ảnh hưởng trực tiếp đến hiệu suất mạng Thực tế số đầu vào nhiều mạng yêu cầu huấn luyện nhiều để nhận bắt lỗi tốt Sự thay đổi tham số learning_rate ảnh hưởng hiệu suất mạng số vòng lặp xác định Giá trị tham số nhỏ mạng hiệu chỉnh trọng số chậm Nhưng muốn đạt đến trạng thái tối ưu ta phải tăng số vòng lặp nhiều Kết luận Với kết thu trình thử nghiệm huấn luyện ta chọn thông số mạng: số vòng lặp epoch=600, tốc độ học learning_rate=150, hệ số góc hàm sigmoid   0.014 , ngưỡng sai số   0.0002 TÀI LIỆU THAM KHẢO [1] Lương Mạnh Bá, Nguyễn Thanh Thủy (1999), Nhập môn xử lý ảnh số, Nhà xuất khoa học kỹ thuật, Hà Nội, tr 153-211 [2] Học viện công nghệ Bưu Viễn Thông (2007), Nhập môn Trí tuệ Nhân tạo, Hà Nội, tr 118-133 [3] K.-L Du, PhD, M.N.S Swamy, PhD, D.Sc (Eng) (2006), Neural Networks in a Softcomputing Framework.pdf, Concordia University, Montreal, Canada [4] CHRISTOPHER M BISHOP(1995), Neural Networks for Pattern Recognition.pdf, CLARENDON PRESS • OXFORD, UK 24 ... pháp nhận dạng Phương pháp nhận dạng ký tự quang mạng nơron bao gồm bước mô tả hình Thu nhận ảnh ký tự Phân tích ảnh để tìm ký tự Tiền xử lý ký tự Hình 2: Các bước nhận dạng ký tự dùng mạng nơron. .. hình, sử dụng rộng rãi hệ thống nhận dạng nhận dạng ký tự quang, chữ viết tay, nhận dạng tiếng nói… Trong báo này, thiết kế chương trình nhận dạng ký tự quang sử dụng mạng MLP có lớp: lớp vào có... lý ký tự Quá trình tiền xử lý ký tự giải vấn đề ánh xạ giá trị pixel ảnh ký tự vào ma trận 10x15 tuyến tính hóa ma trận thành 150 giá trị đưa vào 150 nơron lớp vào mạng 2.2.4 Mạng nơron nhận dạng

Ngày đăng: 20/12/2015, 07:34

Từ khóa liên quan

Mục lục

  • NGÔ VĂN SỸ

  • Đặt vấn đề

  • Phương pháp và thuật toán nhận dạng ký tự

    • Cơ sở dữ liệu

    • Phương pháp nhận dạng

      • Thu nhận ảnh

      • Phân tích ảnh để tìm ký tự

      • Tiền xử lý ký tự

      • Mạng nơron nhận dạng ký tự

      • Hậu xử lý dữ liệu

      • Kết quả và đánh giá

        • Kết quả khi thay đổi số vòng lặp (Epoch)

        • Kết quả thay đổi tham số learing_rate

        • Đánh giá ảnh hưởng của sự thay đổi các thông số.

        • Kết luận

          • Lương Mạnh Bá, Nguyễn Thanh Thủy (1999), Nhập môn xử lý ảnh số, Nhà xuất bản khoa học và kỹ thuật, Hà Nội, tr 153-211.

          • Học viện công nghệ Bưu chính Viễn Thông (2007), Nhập môn Trí tuệ Nhân tạo, Hà Nội, tr 118-133.

          • K.-L. Du, PhD, M.N.S. Swamy, PhD, D.Sc (Eng) (2006), Neural Networks in a Softcomputing Framework.pdf, Concordia University, Montreal, Canada.

          • CHRISTOPHER M. BISHOP(1995), Neural Networks for Pattern Recognition.pdf, CLARENDON PRESS • OXFORD, UK.

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan