1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Kiểm tra lỗi in trên rearcase sử dụng mạng nơron nhân tạo

23 330 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 23
Dung lượng 479,94 KB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRƯƠNG THANH TÙNG KIỂM TRA LỖI IN TRÊN REARCASE SỬ DỤNG MẠNG NƠRON NHÂN TẠO Chuyên ngành: Kỹ thuật Điều khiển Tự động hóa Mã số: 60520216 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA Đà Nẵng – Năm 2017 Công trình hoàn thành TRƯỜNG ĐẠI HỌC BÁCH KHOA Người hướng dẫn khoa học: TS NGUYỄN VĂN MINH TRÍ Phản biện 1: TS Nguyễn Quốc Định Phản biện 2: TS Nguyễn Lê Hòa Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật Điều khiển Tự động hóa, họp Trường Đại học Bách khoa – Đại học Đà Nẵng vào ngày 25 tháng 03 năm 2017 Có thể tìm hiểu luận văn tại:  Trung tâm Học liệu, Đại học Đà Nẵng trường Đại học Bách khoa  Thư viện Khoa Điện, Trường Đại học Bách khoa – Đại học Đà Nẵng MỤC LỤC MỞ ĐẦU NỘI DUNG CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI KIỂM TRA LỖI IN TRÊN REARCASE SỬ DỤNG MẠNG NORON NHÂN TẠO 1.1 Giới thiệu đề tài nghiên cứu 1.2 Mục tiêu nhiệm vụ đề tài: CHƯƠNG 2: CƠ SỞ LÍ THUYẾT VỀ XỬ LÝ ẢNH 2.1Xử lí ảnh, vấn đề xử lí ảnh 2.2 Xử lí ảnh để nhận dạng kí tự CHƯƠNG 3: NHẬN DẠNG KÝ TỰ DÙNG MẠNG NƠRON NHÂN TẠO 3.1 Mô tả toán 3.2 Quá trình thực CHƯƠNG 4: CHƯƠNG TRÌNH MÔ PHỎNG VÀ KẾT QUẢ 14 4.1 Môi trường thực nghiệm 14 4.2 Tạo sở liệu mẫu 14 4.3 Chương trình 15 4.4 Hướng phát triển 19 KẾT LUẬN 20 MỞ ĐẦU LÍ DO CHỌN ĐỀ TÀI Với vận động không ngừng công nghệ thông tin toàn cầu, tổ chức kinh tế xã hội, mong muốn tận dụng tối đa khả cho phép công nghệ thông tin, để đại hoá trình quản lý, sản xuất kinh doanh nhằm đạt hiệu kinh tế cao Nhận dạng toán xuất cách lâu thu hút nhiều quan tâm, nghiên cứu Đặc biệt vài thập niên gần đây, thúc đẩy trình tin học hoá lĩnh vực, toán nhận dạng không dừng lại mức độ nghiên cứu mà trở thành lĩnh vực để áp dụng vào thực tế Các toán nhận dạng ứng dụng thực tế tập trung vào nhận dạng mẫu, nhận dạng tiếng nói nhận dạng chữ Trong số này, nhận dạng chữ toán quan tâm nhiều đạt nhiều thành tựu rực rỡ Các ứng dụng có ý nghĩa thực tế lớn kể đến như: nhận dạng chữ in dùng trình công nghiệp in khắc mã hàng hóa, kiểm tra lỗi tự động, lưu sách báo thư viện, nhận dạng chữ viết tay dùng việc phân loại thư bưu điện, toán tiền nhà băng lập thư viện sách cho người mù (ứng dụng có nghĩa: scan sách bình thường, sau cho máy tính nhận dạng trả dạng tài liệu mà người mù đọc được) Xuất phát từ yêu cầu công ty, cần có nghiên cứu vấn đề Chính em chọn đề tài “Kiểm tra lỗi in rearcase sử dụng mạng nơ ron nhân tạo” với mong muốn phần áp dụng vào toán thực tế công ty MỤC TIÊU NGHIÊN CỨU Đề tài tập trung nghiên cứu lí thuyết công nghệ xử lý ảnh, nhận dạng ký tự sử dụng mạng notron nhân tạo Sau xây dựng ứng dụng xử lý ảnh C#, nhận liệu từ camera, xử lý ảnh, nhận diện kí tự so sánh với ảnh mẫu để kiểm tra, phát lỗi khâu sản xuất Sau lưu kết vào sở liệu PHƯƠNG PHÁP NGHIÊN CỨU Đề tài nghiên cứu theo phương pháp kết hợp lý thuyết nhu cầu thực tế Cụ thể sau: - Nghiên cứu tài liệu liên công nghệ xử lý ảnh, vấn đề xử lý ảnh - Nghiên cứu xử lý ảnh để nhận dạng kí tự Nghiên cứu nhận dạng kí tự sử dụng mạng nơtron nhân tạo Xây dựng ứng dụng C# để đưa vào kiểm thử so với yêu cầu thực tế Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI Ý nghĩa khoa học: Triển khai việc ứng dụng công nghệ xử lý ảnh để nhận dạng ký tự, vật thể tự động, từ phân tích ký tự, vật thể theo mục đích người sử dụng Ý nghĩa thực tiễn: Tạo phần mềm để công việc sản xuất tự động đạt hiệu có suất cao CẤU TRÚC LUẬN VĂN Mở đầu Chương 1: Tổng quan đề tài nghiên cứu Giới thiệu xử lí ảnh, nhận dạng ký tự Mục tiêu nhiệm vụ hoàn thành nhận dạng ký tự in rearcase Chương 2: Cơ sở lý thuyết Xử lý ảnh vấn đề xử lý ảnh Xử lý ảnh để nhận dạng ký tự Chương 3: Nhận dạng ký tự dùng mạng Nơron nhân tạo Mô tả toán trình thực Chương 4: Chương trình mô kết Xây dựng chương trình với môi trường thực nghiệm, tạo sở liệu mẫu, chương trình Hướng phát triễn Kết luận NỘI DUNG CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI KIỂM TRA LỖI IN TRÊN REARCASE SỬ DỤNG MẠNG NORON NHÂN TẠO 1.1 Giới thiệu đề tài nghiên cứu Đối với người chúng ta, việc học phân biệt khác ký tự thật dễ dàng để máy tính làm điều tương tự không dễ dàng chút nào, việc cần đến người có kiến thức tốt xử lý ảnh giúp máy tính học phân biệt ký tự đôi khi, kết không mong muốn Nhận dạng toán xuất cách lâu thu hút nhiều quan tâm, nghiên cứu Đặc biệt vài thập niên gần đây, thúc đẩy trình tin học hoá lĩnh vực, toán nhận dạng không dừng lại mức độ nghiên cứu mà trở thành lĩnh vực để áp dụng vào thực tế Các toán nhận dạng ứng dụng thực tế tập trung vào nhận dạng mẫu, nhận dạng tiếng nói nhận dạng chữ Trong số này, nhận dạng chữ toán quan tâm nhiều đạt nhiều thành tựu rực rỡ Các ứng dụng có ý nghĩa thực tế lớn kể đến như: nhận dạng chữ in dùng trình công nghiệp in khắc mã hàng hóa, kiểm tra lỗi tự động, lưu sách báo thư viện, nhận dạng chữ viết tay dùng việc phân loại thư bưu điện, toán tiền nhà băng lập thư viện sách cho người mù (ứng dụng có nghĩa: scan sách bình thường, sau cho máy tính nhận dạng trả dạng tài liệu mà người mù đọc được) Xuất phát từ yêu cầu thực tế, cần có nghiên cứu vấn đề Chính em chọn đề tài “kiểm tra lỗi in rearcase sử dụng mạng nơ ron nhân tạo” với mong muốn phần áp dụng vào toán thực tế sản xuất 1.2 Mục tiêu nhiệm vụ đề tài: Nhận thấy tầm quan trọng công nghệ xử lí ảnh đời sống sản xuất nay, em làm đề tài với mục tiêu xây dựng ứng dụng xử lí ảnh C#, nhận liệu từ camera, xử lí ảnh, nhận diện kí tự so sánh với ảnh mẫu để kiểm tra, phát lỗi so với dạng yêu cầu Sau lưu kết vào sở liệu Nhiệm vụ chương trình nhận dạng so sánh mẫu in với mẫu yêu cầu giống Tương tác với người dùng tự động báo kết 6 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT VỀ XỬ LÝ ẢNH 2.1Xử lí ảnh, vấn đề xử lí ảnh 2.1.1 Xử lí ảnh 2.1.2 Các vấn đề xử lí ảnh 2.2 Xử lí ảnh để nhận dạng kí tự 2.2.1 Tổng quan 2.2.2 Các phương pháp nhận dạng ký tự CHƯƠNG 3: NHẬN DẠNG KÝ TỰ DÙNG MẠNG NƠRON NHÂN TẠO 3.1 Mô tả toán Đầu vào : Các liệu đầu vào qua xử lý đạt chuẩn yêu cầu trước đưa vào nhận dạng.Các liệu đầu vào file ảnh dạng văn có định dạng *.bmp, dạng file ảnh chuẩn, có kiểu màu pixel đen trắng, để việc tiến hành nhận dạng xác.Các file ảnh qua giai đoạn tiền xử lý : xử lý ảnh nhiễu, ảnh đa sắc , lọc ảnh Đầu mong muốn : file text chứa ký tự Unicode tương ứng mà chương trình mong muốn huấn luyện mạng học thuộc.Số ký tự đầu mong muốn phải tương ứng với số kí tự ảnh đầu vào cần huấn luyện 3.2 Quá trình thực 3.2.1 Xử lí liệu Lọc nhiễu làm mịn ảnh Thường ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ cần làm tõ chi tiết đường biên ảnh Các toán tử không gian dùng kỹ thuật tăng cường ảnh phân nhóm theo công dụng: làm trơn nhiễu, biên Nhị phân ảnh: Quá trình phân tích ảnh thực chất phân tích chuỗi văn ảnh thành ký tự Việc phân tích dựa việc nhận dạng pixel màu ký tự ảnh với liệu đầu vào xử lý chuyển thành định dạng *.bmp có pixel điểm đen RGB(0,0,0) điểm trắng RGB(255, 255, 255) 3.2.2 Tách ký tự Tách dòng kí tự Tách kí tự Xác định giới hạn xác cho ký tự 3.2.3 Ánh xạ ký tự ảnh vào ma trận giá trị Sau tách, ký tự ảnh ánh xạ vào ma trận chiều, có kích thước 15 x 10 Vì ký tự ảnh dù chuẩn hóa, chọn lọc sau tách có kích thước lớn so với ma trận ( khoảng 58x 74), nên ký tự ảnh phải qua bước chuyển đổi tỉ lệ trước chuyển giá trị vào ma trận nhị phân 15 x10 Việc chuyển đổi tỉ lệ nguyên nhân gây sai số dẫn đến nhận dạng ký tự bị sai 3.2.4 Tìm biên, đường bao Chương trình sử dụng phương pháp Canny để tìm biên Làm trơn ảnh lọc Gauss nhằm giảm thiểu ảnh hưởng nhiễu chi tiết không mong nuôn cấu trúc ảnh 9 3.2.5 Huấn luyện mạng a) Xác định cấu trúc mạng Mạng noron xây dựng theo phương pháp học có giám sát Bài toán lựa chọn mạng Feed-forward lớp với cấu trúc sau : Số noron lớp đầu vào : 150 noron Qua kiểm nghiệm, dựa nhiều tài liệu, nhận thấy giá trị 150 noron đầu vào phù hợp để nhận dạng với kiểu kí tự ảnh có font chữ trung bình, phổ biến.Các kí tự ảnh có chiều cao trung bình 70 pixel chiều rộng khoảng 54 pixel Số noron lớp ẩn : 500 noron.Việc lựa chọn giá trị dựa thực nghiệm tài liệu chuyên nhận dạng kí tự quang học.Số noron định từ kết tối ưu giá trị lỗi sở trình huấn luyện Số noron đầu : 16 noron tương ứng với 16 bit nhị phân mã Unicode.Từ 16 noron ta tổng hợp chuyển thành 16 bit nhị phân, sau chuyển thành kí tự Unicode b) Thuật toán huấn luyện mạng Mạng feed- forward sử dụng giải thuật lan truyền ngược sai số Back Propagation Giải thuật gồm bước : - Bước 1: Lan truyền xuôi đầu vào qua mạng Sử dụng công thức : Công thức chung tính đầu noron thứ i lớp thứ k:  n  yi  f   w ij x j  bi   j0  10 Với f hàm chuyển sigmoid lưỡng cực tính theo công thức: f 1  e t α: hệ số góc hàm chuyển t: biến net-input bi: hệ số ngưỡng hay độ lệch Áp dụng mô hình mạng chương trình :Công thức cho đầu noron thứ i (1250) lớp ẩn :  n  a i  f   w ij x j  bi   j1  Với wij : trọng số noron thứ i lớp ẩn kết nối với đầu vào thứ j lớp vào x j : giá trị đầu vào noron thứ j lớp vào bi : giá trị ngưỡng hay độ lệch noron thứ i đầu vào Công thức cho đầu noron thứ k (k =116)tại lớp output: n   n  n    yk  f   w kja j  bk   f  w kj  f   w ijx j     j1   j1        j1 11 - Bước : Lan truyền ngược Tính toán sai lệch đầu thực đầu mong muốn noron thứ k đầu ei= ti- yi Tổng bình phương sai số mạng ứng với mẫu học (Xs, Ts): p E    t i  yi  k 1 P: số phần tử đầu Nếu E< ε l+1

Ngày đăng: 10/05/2017, 23:02

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w