Những vấn đề mới trong công nghệ thông tin và truyền thông NHẬN DẠNG BIỂN số XE từ dữ LIỆU HÌNH ẢNH

40 52 0
Những vấn đề mới trong công nghệ thông tin và truyền thông NHẬN DẠNG BIỂN số XE từ dữ LIỆU HÌNH ẢNH

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC KỸ THUẬT - HẬU CẦN CAND KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO CHUYÊN ĐỀ Học phần: Những vấn đề công nghệ thông tin truyền thông NHẬN DẠNG BIỂN SỐ XE TỪ DỮ LIỆU HÌNH ẢNH Nhóm học viên: Trịnh Xn Tiến Lê Thị Nguyệt Nguyễn Thị Huyền Trang Bắc Ninh, tháng năm 2017 TRƯỜNG ĐẠI HỌC KỸ THUẬT - HẬU CẦN CAND KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO CHUYÊN ĐỀ Học phần: Những vấn đề công nghệ thông tin truyền thông NHẬN DẠNG BIỂN SỐ XE TỪ DỮ LIỆU HÌNH ẢNH GIÁO VIÊN HƯỚNG DẪN: TS Lương Khắc Định Nhóm học viên: Trịnh Xuân Tiến Lê Thị Nguyệt Nguyễn Thị Huyền Trang Bắc Ninh, tháng năm 2017 LỜI CẢM ƠN Trước hết, nhóm chúng em xin gửi lời cảm ơn chân thành, sâu sắc đến thầy giáo TS Lương Khắc Định - giáo viên giảng dạy Trong thời gian qua giám sát ln nhiệt tình hướng dẫn, bảo, trau dồi cho chúng em kiến thức quý giá kiến thức chuyên đề Sự gợi ý ý tưởng, cung cấp tài liệu, số liệu, hướng dẫn giám sát nhân tố giúp chúng em hồn thành tốt chuyên đề Chúng em xin chân thành cảm ơn thầy, cô giáo khoa Công nghệ thông tin – Trường Đại học Kỹ thuật – Hậu cần CAND truyền đạt kiến thức cần thiết, đồng thời tạo điều kiện thuận lợi cho chúng em học tập nghiên cứu Điều có ý nghĩa to lớn học viên chuyên ngành Công nghệ thơng tin Trong q trình làm chun đề, kinh nghiệm kiến thức chưa sâu sắc nên chuyên đề chúng em không tránh khỏi sai sót Mong q giám sát thơng cảm góp ý cho chúng em để chun đề hồn chỉnh Em xin chân thành cảm ơn! Bắc Ninh, tháng năm 2017 HỌC VIÊN MỤC LỤC DANH MỤC HÌNH ẢNH III MỞ ĐẦU CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ NHẬN DẠNG TỪ DỮ LIỆU HÌNH ẢNH 1.1 Tổng quan nhận dạng 1.1.1 Khái niệm nhận dạng 1.1.2 Không gian biểu diễn đối tượng, không gian diễn dịch 1.1.3 Mơ hình chất q trình nhận dạng .4 1.2 Xử lý ảnh 1.2.1 Quá trình xử lý ảnh 1.2.2 Các vấn đề xử lý ảnh 1.3 Công nghệ Tesseract OCR .9 1.3.1 Lịch sử 1.3.2 Kiến trúc hoạt động 10 CHƯƠNG BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE 11 2.1 Nhận dạng biển số xe 11 2.1.1 Khái niệm .11 2.1.2 Phân loại biển số xe 12 2.1.3 Những quy định màu sắc chữ số đặc biệt 13 2.2 Hướng giải 15 2.2.1 Hướng tiếp cận phát triển vùng 15 2.2.2 Hướng tiếp cận dò biên biến đổi Hough 15 2.2.3 Hướng giải 16 2.3 Phát vùng chứa biển số xe 17 2.4 Xác định xác vùng chứa biển số xe 19 2.5 Nhận dạng ký tự 20 2.5.1 Mơ hình mạng notron nhân tạo 20 2.5.2 Phương pháp thuật toán nhận dạng kí tự .24 CHƯƠNG XÂY DỰNG CHƯƠNG TRÌNH NHẬN DẠNG BIỂN SỐ XE .28 3.1 Công cụ xây dựng 28 3.1.1 Microsoft Visual Studio 2013 28 3.1.2 Microsoft Net framework 28 3.2 Chương trình nhận dạng biển số xe 29 3.2.1 Giao diện phần mềm 29 3.2.2 Các bước nhận diện biển số xe 29 3.3 Đánh giá sản phẩm demo .32 i 3.3.1 Giao diện .32 3.3.2 Tính năng, hiệu suất 32 3.3.3 Độ ổn định 32 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 33 TÀI LIỆU THAM KHẢO 34 ii DANH MỤC HÌNH ẢNH Hình 1.1 Sơ đồ trình nhận dạng .6 Hình 1.2 Sơ đồ bước xử lý ảnh Hình 1.3 Kiến trúc tesseract 10 Hình 2.1 Mẫu biển số xe 15 Hình 2.2 Các bước phát vùng chứa biển số xe .17 Hình 2.3 Các bước xác định xác vùng chứa biển số xe 19 Hình 3.1 Giao diện phần mềm .29 Hình 3.2 Button chọn hình 29 Hình 3.3 Bước lựa chọn hình ảnh có sẵn 30 Hình 3.4 Button chụp hình 30 Hình 3.5 Phát vùng chứa biển số xe .30 Hình 3.6 Nhận dạng ký tự 31 Hình 3.7 Xử lý hình ảnh 31 Hình 3.8 Nhận diện ký tự 31 Hình 3.9 Kết nhận diện 32 iii MỞ ĐẦU Tên đề tài “Nghiên cứu nhận dạng biển số xe từ liệu hình ảnh” Lý chọn đề tài Cùng với phát triển khoa học kỹ thuật nhu cầu lại ngày tăng, số lượng phương tiện giao thông đường ngày xuất nhiều Với số lượng phương tiện giao thơng lớn, khơng ngừng tăng lên làm nảy sinh nhiều vấn đề việc kiểm sốt phương tiện cơng tác quản lý, xử lý vi phạm giao thông mà nguồn nhân lực người khó thực Để giải vấn đề nhu cầu đặt phải áp dụng các26 hệ thống quản lý, xử lý vi phạm giao thông tự động Để xây dựng hệ thống quản lý giao thơng tự động “Bài toán nhận dạng biển số xe” tiền đề để xây dựng mơ hình quản lý đó, Việt Nam hệ thống quản lý chưa nhiều lĩnh vực nhận dạng q trình phát triển Từ thực tế đó, thời gian học môn vấn đề công nghệ thơng tin, em định lựa chọn tìm hiểu đề tài: “Nghiên cứu nhận dạng biển số xe từ liệu hình ảnh” Mục tiêu nghiên cứu Chúng em thực đề tài: “Nhận dạng biển số xe từ liệu hình ảnh” với mục tiêu cụ thể sau: - Tìm hiể u về trình xử lý nhận dạng ảnh - Tìm hiểu công nghệ Tesseract OCR - Xây dựng phần mềm nhận dạng biển số xe từ liệu hình ảnh Phương pháp nghiên cứu - Phương pháp nghiên cứu tài liệu: Nghiên cứu tài liệu có liên quan đến đề tài nhằm thu thập hệ thống sở lí luận đề tài nghiên cứu ứng dụng phương pháp nghiên cứu khoa học phục vụ cho đề tài - Phương pháp tham khảo từ chuyên gia: Lấy ý kiến từ giám sát cô giáo Khoa Công nghệ thông tin, giáo viên hướng dẫn đề tài nhằm định hướng trình nghiên cứu đảm bảo kết nghiên cứu xác - Phương pháp thực nghiệm: Nghiên cứu phần mềm nhận dạng xây dựng có liên quan để phục vụ việc xây dựng phần mềm nhận dạng nhóm Phạm vi nghiên cứu Trong khuôn khổ báo cáo kết thúc học phần môn Những vấn đề công nghệ thơng tin, nhóm chúng em định hướng đề tài nghiên cứu Công nghệ Tesseract OCR phần mềm có liên quan đến nhận dạng biển số xe từ liệu hình ảnh Bố cục báo cáo Trong báo cáo này, phần mở đầu phần kết luận, nội dung báo cáo chia làm chương: Chương 1: CƠ SỞ LÝ THUYẾT VỀ NHẬN DẠNG TỪ DỮ LIỆU HÌNH ẢNH 1.1 Tổng quan nhận dạng 1.2 Xử lý ảnh 1.3 Công nghệ Tesseract OCR Chương 2: BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE 2.1 Nhận dạng biển số xe 2.2 Hướng giải 2.3 Phát vùng chứa biển số xe 2.4 Xác định xác vùng chứa biển số xe 2.5 Nhận dạng ký tự Chương 3: XÂY DỰNG CHƯƠNG TRÌNH NHẬN DẠNG BIỂN SỐ XE 3.1 Công cụ xây dựng 3.2 Chương trình nhận dạng biển số xe 3.3 Đánh giá sản phẩm Demo CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ NHẬN DẠNG TỪ DỮ LIỆU HÌNH ẢNH 1.1 Tổng quan nhận dạng 1.1.1 Khái niệm nhận dạng Nhận dạng trình phân loại đối tượng biểu diễn theo mơ hình gán cho chúng vào lớp (gán cho đối tượng tên gọi) dựa theo quy luật mẫu chuẩn Quá trình nhận dạng dựa vào mẫu học biết trước gọi nhận dạng có giám sát (supervised learning), trường hợp ngược lại gọi học giám sát (non supervised learning) 1.1.2 Khơng gian biểu diễn đối tượng, không gian diễn dịch Không gian biểu diễn đối tượng Các đối tượng quan sát hay thu nhập thường biểu diễn tập đặc trưng hay đặc tính Như trường hợp xử lý ảnh, ảnh sau tăng cường để nâng cao chất lượng, phân vùng trích chọn đặc tính, biểu diễn đặc trưng biên, miền đồng nhất… Người ta thường phân đặc trưng theo loại như: đặc trưng tô pô (tập điểm), đặc trưng hình học đặc trưng chức Việc biểu diễn ảnh theo đặc trưng phụ thuộc vào ứng dựng Ví dụ : giả sử đối tượng X (ảnh, chữ viết, dấu vân tay,…) biểu diễn n thành phần đặc trưng: 𝑋 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }; 𝑥𝑖 biểu diễn đặc tính Khơng gian biểu diễn đối tượng thường gọi tắt không gian đối tượng A định nghĩa: 𝐴 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } Trong 𝑥𝑖 biểu diễn đối tượng Khơng gian vơ hạn, để tiện xem xét ta xét tập hữu hạn Không gian diễn dịch Không gian diễn dịch tập tên gọi đối tượng Kết thúc trình nhận dạng ta xác định tên gọi cho đối tượng tập không gian đối tượng hay nói nhận dạng đối tượng Một hình thức gọi Ω tập tên đối tượng: Ω = {𝜔1 , 𝜔2 , … , 𝜔𝑘 } với 𝜔𝑖 , i= 1,2,….k tên đối tượng Quá trình nhận dạng đối tượng f ánh xạ f: AΩ với f tập quy luật để định phần tử A ứng với phần tử Ω Nếu tập quy luật tập tên đối tượng biết trước nhận dạng chữ viết có (có 26 lớp từ AZ), người ta gọi nhận dạng có giám sát Trường hợp hai nhận dạng khơng có giám sát (trường hợp khó khăn hơn) 1.1.3 Mơ hình chất q trình nhận dạng Mơ hình q trình nhận dạng Việc chọn lựa trình nhận dạng có liên quan mật thiết đến kiểu mơ tả mà người ta sử dụng để đặc tả đối tượng Trong nhận dạng, người ta phân chia theo hai họ lớp: - Họ mô tả theo tham số - Họ mô tả theo cấu trúc Cách mô tả lựa chọn xác định mơ hình đối tượng Như vậy, chúng có loại mơ hình: mơ hình theo tham số mơ hình cấu trúc - Mơ hình tham số Mơ hình tham số sử dụng vector để đặc đối tượng Mỗi phần tử vector mơ tả đặc tính đối tượng Ví dụ đặc trưng chức năng, người ta sử dụng hàm sở trực giao để biểu diễn Và ảnh biểu diễn chuỗi hàm trực giao Giả sử C đường bao ảnh C(i,j) điểm thứ i đường bao với i=1,2…,N ( đường bao gồm N điểm) Trong đó: 𝑁 𝑥0 = ∑ 𝑥𝑖 𝑁 𝑖=1 𝑁 𝑦= ∑ 𝑦𝑖 𝑁 𝑖=1 tọa độ tâm điểm Ta có moment trung tâm bậc p, q đường bao sau: 𝑁 𝜇𝑝𝑞 = ∑(𝑥𝑖 − 𝑥0 )𝑝 (𝑦𝑖 − 𝑦0 )𝑞 𝑁 𝑖=1 Vector tham số trường hợp moment 𝜇𝑖𝑗 với i=1,2,…,p j=1,2,…,q Việc lựa chọn phương pháp biểu diễn làm đơn giản cách xây dựng việc lựa chọn đặc trưng hoàn toàn phụ thuộc vào ứng dụng Trong nhận dạng chữ, tham số dấu hiệu: số điểm chạc ba, chạc tư, số điểm chu trình, số điểm ngoặt, số điểm kết thúc - Mơ hình cấu trúc Cách tiếp cận mơ hình dựa vào việc mơ tả đối tượng nhờ số khái niệm biểu thị đối tượng sở ngôn ngữ tự nhiên Để mô tả đối tượng, người ta dùng số dạng nguyên thủy đoạn thẳng, cung Chẳng hạn hình chữ nhật định nghĩa gồm đoạn thẳng vng góc với đơi Trong mơ hình quay, phép tỷ lệ để đưa vùng 𝐼𝑐′ thành hình chữ nhật Khi thu ảnh có nhiều nguyên nhân làm cho ảnh biển số xe bị nghiêng kéo theo ký tự bị nghiêng theo làm việc nhận dạng khơng xác Vì vậy, ta cần nắn tứ giác trở lại hình chữ nhật nắn ký tự trở nên thẳng đứng theo tiêu chí: tỷ lệ chiều dài/rộng số ký tự vùng biển số xe Tiêu chí tỷ lệ chiều dài/rộng Với quốc gia biển số xe có kích thước định thể thông qua tỷ lệ cạnh nằm khoảng 3.5 W/H 4.5 với biển số có hai hàng tỷ lệ 0.8  W/H  1.4 Kết thu tập 𝐼𝑐′ chứa biển số xe với số vùng nhỏ hẳn số vùng mà ta thu ban đầu sau biến đổi Hough Tiêu chí số ký tự vùng biển số xe Với nước số kí tự biển khác Ở Việt Nam, số ký tự biển số xe thường 6,7,8 tương ứng với xe quân đội, xe máy cũ xe ô tô xe máy Mỗi ký tự có đặc trưng: 0.33 ≤ height ≤ 0.85 Width ≤ 0.22 Ta có ngưỡng sử dụng [6,8] Nếu tìm biển số xe thỏa mãn ta dừng thuật tốn chuyển sang nhận dạng ký tự Nếu tất biển số xe tồn ảnh bắt buộc phải duyệt qua toàn vùng ảnh 2.5 Nhận dạng ký tự 2.5.1 Mơ hình mạng notron nhân tạo Mơ hình notron nhân tạo Mạng notron nhân tạo (Artificial Neural Network) bao gồm nút (đơn vị xử lý) nối với liên kết notron Mỗi liên kết kèm theo trọng số đó, đặc trưng cho đặc tính kích hoạt notron Có thể xem trọng số phương tiện phương tiện để lưu giữ thông tin dài hạn mạng nhiệm vụ trinh huấn luyện (học) mạng cập nhật trọng số có thêm thơng tin mẫu học, nói cách khác số điều chỉnh cho Trong mạng, số notron nối với mơi trườn bên ngồi đầu ra, đầu vào Mỗi notron nối với nowtron khác nhận tín hiệu 𝑠𝑗 từ chúng với trọng số 𝑤𝑗 Tổng thông tin vào có trọng số là: 𝑁𝑒𝑡 = ∑ 𝑤𝑗 𝑠𝑗 20 Người ta gọi thành phần tuyến tính notron Hàm kích hoạt g (hàm chuyển) đóng vai trò biến đổi từ Net sang tín hiệu đầu out 𝑂𝑢𝑡 = 𝑔(𝑁𝑒𝑡) Đây thành phần phi tuyến notron Có hàm kích hoạt thường dùng thực tế Hàm dạng bước: 𝑣ớ𝑖 𝑥 ≥ 𝑠𝑡𝑒𝑝(𝑥) = { 𝑣ớ𝑖 𝑥 < Hàm dấu: 𝑣ớ𝑖 𝑥 ≥ 𝑠𝑡𝑒𝑝(𝑥) = { −1 𝑣ớ𝑖 𝑥 < Hàm sigmoid: 𝑠𝑡𝑒𝑝(𝑥) = { 𝑠𝑡𝑒𝑝(𝑥) = { 𝑣ớ𝑖 𝑥 ≥ 𝜃 𝑣ớ𝑖 𝑥 < 𝜃 𝑣ớ𝑖 𝑥 ≥ 𝜃 −1 𝑣ớ𝑖 𝑥 < 𝜃 𝑆𝑖𝑔𝑚𝑜𝑖𝑑 (𝑥) = + 𝑒 −𝛼(𝑥+𝜃) Ở đây, ngưỡng 𝜃 đóng vai trò làm tăng tính thích nghi khả tính tốn mạng notron Sử dụng ký pháp vector 𝑆 = (𝑠1 , … , 𝑠𝑛 , 𝜃) vector tín hiệu vào, 𝑊 = (𝑤1 , … , 𝑤𝑛 ) vetor trọng số, ta có: 𝑜𝑢𝑡 = 𝑔(𝑁𝑒𝑡 ) Với 𝑁𝑒𝑡 = 𝑆𝑊 Trường hợp xét ngưỡng 𝜃, ta dùng biểu diễn vector mới: 𝑆 = (𝑠1 , … , 𝑠𝑛 , 𝜃), 𝑊 ′ (𝑤1 , … , 𝑤𝑛 , −1) Mạng notron hệ thống bao gồm nhiều phần tử xử lý đơn giản (notron) hoạt động song song Tính hệ thống tùy thuộc vào cấu trúc hệ, trọng số liên kết notron trình gộp lại notron đơn lẻ Mạng notron học từ liệu mẫu tổng quát hóa dựa liệu mẫu học Trong mạng notron notron đón nhận tín hiệu vào gọi notron vào notron đưa thông tin gọi notron Phân loại mạng notron Theo kiểu liên kết notron: gồm mạng notron truyền thẳng (feel-forward Neural Network) mạng notron quy hồi (Recurrent Neural Network) Trong notron truyền thẳng, liên kết notron theo hướng định, khơng tạo thành đồ thị, khơng có chu trình với đỉnh notron, cung llieen kết chúng Ngược lại, mạng quy hồi cho phép liên kết notron tạo thành chu trình Vì thông tin notron truyền lại cho notron góp phần kích hoạt chúng nên mạng quy hồi có khả lưu giữ trạng thái dạng ngưỡng kích hoạt ngồi trọng số liên kết notron 21 Theo số lớp: notron tổ chức lại thành lớp cho notron lớp nối với notron lớp tiếp theo, không cho phép liên kết notron lớp, từ notron lớp lên notron lớp Tại không cho phép liên kết nhảy qua lớp Chức - Mạng notron công cụ tính tốn Giả sử mạng notron Neural Network có m notron vào n notron ra, với vector tín hiệu vào 𝑋 = (𝑥1 , 𝑥2 , … , 𝑥𝑚 ) sau q trình tính toán notron ẩn ta nhận kết 𝑌 = (𝑦1 , 𝑦2 , … , 𝑦𝑛 ) Theo ý nghĩa mạng notron làm việc với tư cách bảng tra mà không cần biết dạng phụ thuộc hàm tường minh Y X, ta có: 𝑌 = 𝑡𝑖𝑛ℎ(𝑋, 𝑁𝑁) Lưu ý notron lớp tính tốn đồng thời nên độ phức tạp tính tốn nói chung phụ thuộc vào số lớp mạng Các thông số cấu trúc mạng notron bao gồm: + Số tín hiệu vào, số tín hiệu + Số lớp notron + Số notron lớp ẩn + Số lượng liên kết notron (liên kết đầy đủ, liên kết phận liên kết ngẫu nhiên) + Các trọng số liên kết notron - Mạng notron hệ thống thích nghi có khả học Mạng notron có khả học để chỉnh trọng số liên kết cấu trúc mạng cho phù hợp với mẫu học Người ta phân biệt ba loại kỹ thuật học: + Học có giám sát (Supervised learning) + Học không giám sát (Unsupervised learning) + Học tăng cường Trong học giám sát, mạng cung cấp tập mẫu học {(𝑋𝑠 , 𝑌𝑠 )} với 𝑋𝑠 tín hiệu vào kết hệ phải 𝑌𝑠 Ở lần học, vector tín hiệu vào 𝑋𝑠 đưa vào mạng sau so sánh sai khác kết 𝑌𝑠 với kết tính tốn out Sai số dùng để hiệu chỉnh lại trọng số liên kết mạng Quá trình tiệp tục thỏa mãn tiêu chuẩn Có hai cách sử dụng tập mẫu học dùng mẫu lần lượt, hết mẫu đến mẫu khác, sử dụng đồng thời tất mẫu học lúc Các mạng với chế học không giám sát gọi mạng tự tổ chức Các kỹ thuật học mạng notron nhằm vào hiệu chỉnh trọng số liên kết (học tham số) điều chỉnh, 22 sửa đổi cấu trúc mạng bao gồm số lớp, số notron, kiểu trọng số liên kết (học cấu trúc) - Học tham số: Giả sử có k notron mạng notron có liên kết vào với notron khác Khi ma trận trọng số liên kết W có kích thước kx1 Các thủ tục học tham số nhằm mục đích tìm kiếm ma trận W cho 𝑌𝑠 = 𝑇𝑖𝑛ℎ(𝑋𝑠 , 𝑊) mẫu học 𝑆 = (𝑋𝑠 , 𝑌𝑠 ) (1) - Học cấu trúc: Với học tham số ta giả định mạng có cấu trúc cố định Việc học cấu trúc mạng truyền thẳng gắn với yêu cầu tìm số lớp mạng L số notron lớp 𝑛𝑗 Tuy nhiên với mạng quy hồi phải xác định thêm tham số ngưỡng 𝜃 notron mạng Một cách tổng quát phải xác định tham số 𝑃 = (𝐿, 𝑛1 , … , 𝑛𝑘 , 𝜃1 , … , 𝜃𝑘 ) với 𝑘 = ∑ 𝑛𝑗 cho 𝑌𝑠 = 𝑇𝑖𝑛ℎ(𝑋𝑠 , 𝑃 ) mẫu học 𝑠 = (𝑋𝑠 , 𝑌𝑠 ) (2) Thực chất, việc điều chỉnh vector tham số W (1) hay P (2) quy tốn tìm kiếm tối ưu khơng gian tham số Do vậy, áp dụng chế tìm kiếm theo gradient Thuật toán lan truyền ngược Back Propagation Đây phương pháp thông dụng để huấn luyện cho mạng nơron truyền thẳng nhiều lớp, áp dụng cho mạng truyền thẳng với hàm chuyển hàm lỗi khả vi Tiêu chuẩn huấn luyện: Làm cho sai số đầu nhỏ tốt Triết lý phương pháp: dựa đầu để điều chỉnh trọng số lớp ra, sau dựa tính tốn lớp để điều chỉnh trọng số lớp ẩn Huấn luyện mạng neural nhiều lớp sử dụng thuật tốn lan truyền ngược gồm hai q trình: Q trình truyền tuyến tính q trình truyền ngược: Q trình truyền tuyến tính: Dữ liệu từ lớp nhập qua lớp ẩn đến lớp xuất để thay đổi giá trị trọng số liên kết W neural mạng biểu diễn liệu học Sau tìm khác giá trị thật hàm mẫu mà mạng tính kết dự đốn mạng gọi lỗi (học có giám sát) Q trình truyền ngược: Giá trị lỗi truyền ngược lại cho trình huyến luyện(học) tìm trọng số Wi để lỗi nhỏ Hạn chế: + Ngoài thành công giải thuật học lan truyền ngược, có số khía cạnh làm cho giải thuật trở nên chưa bảo đảm lúc tốt Khó khăn chủ yếu q trình huấn luyện lâu Có thể nhịp độ học động lực khơng 23 tối ưu Sự sai sót việc huấn luyện nói chung xuất từ hai nguồn: mạng liệt cực tiểu địa phương + Mạng liệt: xảy trọng số điều chỉnh tới giá trị lớn Tổng đầu vào đơn vị ẩn đơn vị đầu mà đạt giá trị cao (hoặc dương âm), qua hàm kích hoạt sigmoid, đơn vị có giá trị kích hoạt gần gần Giá trị hiệu chỉnh trọng số gần 0, q trình huấn luyện đến trạng thái dừng ảo + Cực tiểu địa phương: bề mặt sai số mạng phức tạp đầy đồi thung lũng Bởi hạ độ dốc, mạng bị mắc bẫy cực tiểu địa phương có nhiều cực tiểu thấp gần bên cạnh Những phương pháp thống kê giúp để tránh bẫy này, chúng làm chậm Một phương án khác tăng thêm số lượng đơn vị ẩn Như làm việc không gian sai số nhiều chiều, nên hội gặp bẫy nhỏ Tuy nhiên việc tăng có giới hạn trên, vượt qua giới hạn này, hội mắc bẫy lại tăng lên 2.5.2 Phương pháp thuật tốn nhận dạng kí tự Q trình phân tích ảnh thực chất phân tích chuỗi văn ảnh thành ký tự Việc phân tích dựa việc nhận dạng pixel màu ký tự ảnh với liệu đầu vào xử lý chuyển thành định dạng *.bmp có pixel điểm đen RGB (0,0,0) điểm trắng RGB (255, 255, 255) Q trình phân tích ảnh thực sau: - Phân tích ảnh thu thành dòng - Phân tích dòng thành ký tự ảnh Tách dòng kí tự Việc tách dòng kí tự sở để tiến hành tách kí tự cách dễ dàng nhanh chóng Thuật tốn: Bắt đầu từ điểm ảnh (x, y) file ảnh (0,0), gán số dòng xét lines =0 Bước 1: Xác định giới hạn dòng: Quét hết chiều rộng ảnh, giá trị y (chạy x

Ngày đăng: 22/09/2019, 09:46