BÁO cáo NHẬP môn TRÍ TUỆ NHÂN tạo đề tài NHẬN DIỆN kí tự VIẾT TAY áp DỤNG mô HÌNH CNN

27 62 3
BÁO cáo NHẬP môn TRÍ TUỆ NHÂN tạo đề tài  NHẬN DIỆN kí tự VIẾT TAY áp DỤNG mô HÌNH CNN

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ********** BÁO CÁO NHẬP MÔN TRÍ TUỆ NHÂN TẠO ĐỀ TÀI : NHẬN DIỆN KÍ TỰ VIẾT TAY ÁP DỤNG MÔ HÌNH CNN Giáo viên hướng dẫn : ThS.Ngô Văn Linh Sinh viên thực hiện : Nhóm 04- 118596 Họ tên MSSV Nguyễn Thị Thắm 20183984 Trần Thị Hồng Nhung 20183965 Vũ Thị Ngọc Lan 20183939 Hà Nội-2020 Mục lục 2 III Giới thiệu đề tài Hiện nay, thông tin, tri thức được chuyển thành dữ liệu lưu trữ trên các thiết bị như máy tính, laptop, hay trên các nền tảng trực tuyến Đối với những dữ liệu mới, việc đưa dữ liệu vào kho lưu trữ có thể thực hiện rất dễ dàng bằng cách nhập trực tiếp Tuy nhiên, có rất nhiều tài liệu cũ được viết bằng tay cần được lưu trữ vào máy mà việc nhập trục tiếp gây tốn thời gian và không hiệu quả Bài toán nhận dạng chữ viết tay được đặt ra để giải quyết vấn đề này Bài toán đã được nghiên cứu rất nhiều và đạt được kết quả đáng kể với nhiều phương pháp khác nhau Trong đó, phương pháp sử dụng mạng noron tích chập được sử dụng khá phổ biến và đem lại hiệu quả tốt Do đó, nhóm em đã chọn đề tài: “ Nhận diện kí tự viết tay áp dụng mô hình CNN “ để tìm hiểu và xây dựng được một mô hình giải quyết bài toán III Mô tả bài toán Tên đề tài: Nhận diện kí tự viết tay áp dụng mô hình CNN * Mục đích: Nhận diện kí tự viết tay (số và chữ Latin), từ ảnh đầu chụp đầu vào đưa ra kết quả là kí tự dưới dạng UNICODE * Yêu cầu: • Ảnh đầu vào là ảnh chụp kí tự cần nhận diện, rõ nét, không bị khuyết thiếu • Ứng dụng đưa ra kết quả với độ chính xác cao, nhanh chóng, ít lỗi • Sử dụng mạng noron * Ứng dụng: Kết quả bài toán có thể ứng dụng trong nhận diện biển số xe, chấm bài thi trắc nghiệm,… 3 IV Cơ sở lý thuyết và phương pháp giải quyết Trong phần này chúng em xin trình bày qua về những kiến thức mà chúng em đã áp dụng vào để hoàn thành project này Trong đó bao gồm các kiến thức về mạng nơ-ron nhiều lớp, thuật toán lan truyền ngược, mô hình mạng tích chập Và phương pháp giải quyết bài toán được áp dụng bao gồm phương pháp xử lý ảnh và xây dựng mô hình nhận diện 1 Cơ sở lý thuyết 1.1 Mạng noron và giải thuật lan truyền ngược Ý tưởng của mạng nơ-ron Một mạng nơ-ron đơn giản có cấu trúc như sau: Cấu tạo của một mạng nơ ron bao gồm: - đầu Các node: mỗi node thực hiện một các phép tính toán Các kết nối: thực hiện việc truyền tín hiệu từ node này đến node khác Thông tin của mỗi kết nối là một trọng số (weight) để chỉ ra mức độ tín hiệu mạnh hay yếu Dữ liệu đầu vào sẽ đi qua các lớp và mạng sẽ tính toán để cho ra ra phù hợp Hình 1: Kiến trúc một mạng nơ-ron đơn giản Nguồn: Mạng nơ-ron nhiều lớp Trong thực tế áp dụng, người ta thường dùng mạng nơ-ron bao gồm nhiều lớp kề nhau.Các node giữa hai lớp kề nhau sẽ liên kết với nhau Đầu ra của lớp trước sẽ trở thành đầu vào của lớp kế tiếp Những lớp ở giữa của mạng (tức là trừ input và output) được gọi chung là các hidden layers 4 Hình 2: Cấu trúc mạng nơ-ron nhiều lớp Nguồn: Natural Language In Action.Hobson Lane, Cole Howard, Hannes Max Hapke (2019) 5 Hàm kích hoạt Hoạt động tính toán tại mỗi node được minh họa thông qua một mô hình đơn giản Perceptron dưới đây: Từ sơ đồ Hình 3, ta có: -Đầu vào là vector x gồm n chiều x = [1, x1, x2, …, xn] Đầu ra là nhãn 0 hoặc 1 -Vector trọng số w = [w0, w1, w2, …, wn] Mỗi thuộc tính của đầu vào xi sẽ được gắn với một kết nối đặc trưng bởi trọng số wi Hình 3: Mô hình Perceptron Nguồn: Natural Language In Action Hobson Lane, Cole Howard, Hannes Max Hapke (2019) Mỗi node sẽ thực hiện tính toán wx T Sau đó tích vô hướng này được đưa vào hàm kích hoạt f(x) Hàm kích hoạt ở đây sẽ biến wxT về dạng 0 hoặc 1 f(x) = 0 1 nếu wx T > t nếu wx T

Ngày đăng: 27/10/2022, 05:46

Tài liệu cùng người dùng

Tài liệu liên quan