Nghiên cứu ứng dụng đường cong tham số B-Spline vào nhận dạng chữ số viết ta

26 277 0
Nghiên cứu ứng dụng đường cong tham số B-Spline vào nhận dạng chữ số viết ta

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 126 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG CAO BÁ THÀNH NGHIÊN CỨU ỨNG DỤNG ĐƯỜNG CONG THAM SỐ B-SPLINE VÀO NHẬN DẠNG CHỮ SỐ VIẾT TAY Chuyên ngành: KHOA HỌC MÁY TÍNH Mã ngành: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Footer Page of 126 Header Page of 126 Chương trình ñược hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS Nguyễn Tấn Khôi Phản biện 1: PGS.TS Tăng Tấn Chiến Phản biện 2: TS Trương Công Tuấn Luận văn ñược bảo vệ trước Hội ñồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật họp Đại học Đà Nẵng vào ngày 03 tháng 03 năm 2012 Footer Page of 126 Header Page of 126 MỞ ĐẦU Lý chọn ñề tài Hiện công nghệ thông tin phát triển mạnh, ñã ñi sâu vào thành phần xã hội máy tính ñã trở thành công cụ ñắc lực thiếu nhiều lĩnh vực, giúp lưu trữ liệu cách hiệu ñặc biệt tài liệu ñã ñược số hóa Trong nhiều lĩnh vực thuộc ngành Công nghệ thông tin Trí tuệ nhân tạo lĩnh vực ñược quan tâm hàng ñầu ñược ñánh giá phát triển mạnh tương lai Lĩnh vực Trí tuệ nhân tạo nói chung, toán nhận dạng chữ viết tay nói riêng ñã ñược nhiều nhà nghiên cứu quan tâm ý nghĩa thực tiễn to lớn Trong ñiều kiện thực tế nhiều trường hợp nhận thông tin quản lý thông qua biểu mẫu ngày nhiều tài liệu quan trọng ñược lưu trữ giấy Trong trường học phiếu ñiểm hay ñăng ký thông tin ñầu vào học sinh, sinh viên ñược lưu trữ biểu mẫu giấy, quan quản lý nhận thông tin người dân ñể xử lý từ biểu mẫu Để phục vụ cho công tác chỉnh sửa, tra cứu, in ấn quản lý tốt quan, trường học cần phải số hóa thông tin ñể lưu trữ máy tính Để giải toán trên, thông thường có hai cách thực hiện: Cách 1: Quét tài liệu viết tay giấy thành file ảnh lưu vào máy tính Nhưng chỉnh sửa, tra cứu hay quản lý tốt thông tin Cách 2: Số hóa thủ công tài liệu viết tay giấy Cách nhiều thời gian chi phí Từ kết trên, thấy số hóa tài liệu cần phải có công cụ tự ñộng cấp bách, nhằm giảm thiểu thời gian chi Footer Page of 126 Header Page of 126 phí Phương pháp B-Spline tỏ ưu số phương pháp khác chỗ, ñịnh nhận dạng số phương pháp khác ñược cài ñặt tỉnh chương trình, muốn bổ sung thêm số mẫu phải thiết kế lại chương trình Trong ñó với phương pháp B-Spline cần ta cung cấp mẫu cho máy học ta bổ sung vào nhớ kiểu liệu mới, việc không ảnh hưởng ñến cấu trúc chương trình ban ñầu Xuất phát từ vấn ñề trên, việc tiến hành ñề tài “Nghiên cứu ứng dụng ñường cong tham số B-Spline vào nhận dạng chữ số viết tay” cần thiết Mục tiêu nhiệm vụ ñề tài Mục tiêu ñề tài nghiên cứu ứng dụng ñường cong tham số B-spline ñể máy học ký tự mẫu có cấu trúc mở xây dựng hệ thống cho phép nhận dạng số tài liệu từ file ảnh nhằm giúp số hóa tài liệu tự ñộng nhanh chóng Xây dựng ứng dụng cho phép ñưa vào tập tin bitmap bảng ñiểm xuất mã số học sinh, ñiểm tương ứng học sinh ñó trường THPT số Nghĩa Hành, từ ñó triển khai cho trường Các nhiệm vụ cụ thể ñề tài bao gồm Nghiên cứu lý thuyết ñường cong tham số B-spline Nghiên cứu lý thuyết xử lý ảnh, áp dụng vào bước tiền xử lý ảnh (ảnh Bitmap ký tự) Nghiên cứu cho máy học nhận dạng ký tự phương pháp sử dụng ñường cong tham số B-spline qua tham số ñặc trưng như: ñỉnh ñiều khiển, vectơ nút Nghiên cứu xây dựng ứng dụng nhận dạng chữ số viết tay sử dụng ñường cong B-spline ứng dụng vào ñể nhập ñiểm tự ñộng Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu Footer Page of 126 Header Page of 126 Đường cong tham số B-spline Lý thuyết xử lý ảnh Kỹ thuật nhận dạng ký tự viết tay bao gồm: nhận dạng chữ số viết tay Ngôn ngữ lập trình C# Phạm vi nghiên cứu Nghiên cứu lý thuyết toán học ñường cong B-Spline áp dụng vào phương pháp nhận dạng ký tự viết tay Nghiên cứu phương pháp, thuật toán ñơn giản phục vụ cho việc tiền xử lý ảnh ký tự Cho phép người dùng ñưa ảnh ký tự ñể máy học nhận dạng Đối với nhận dạng chữ viết tay cho máy học nhận dạng ký tự số từ “0” ñến “9” ký tự chữ Phương pháp nghiên cứu Đề tài nghiên cứu ñường cong B-spline xử lý ảnh ñể xử lý liệu ảnh ñầu vào Từ ñó ñề xuất phương pháp, giải thuật xây dựng ứng dụng nhận dạng ký tự viết tay Để làm rõ vấn ñề trên, luận văn sử dụng phương pháp nghiên cứu lý thuyết thực nghiệm Nghiên cứu lý thuyết Đường cong tham số B-spline Xử lý ảnh Các mô hình tổ chức lưu trữ liệu Nghiên cứu thực nghiệm Thu thập tài liệu thông tin liên quan ñến ñề tài Lựa chọn mô hình, cách tiếp cận phù hợp với nội dung Đề xuất qui trình nhận dạng dùng ñường cong tham số B-spline Footer Page of 126 Header Page of 126 Triển khai xây dựng chương trình Kiểm thử, nhận xét ñánh giá kết hệ thống Ý nghĩa khoa học thực tiễn Áp dụng kỹ thuật ñường cong tham số B-spline vào nhận dạng chữ viết tay ứng dụng cho nhận dạng ñiểm số từ bảng ñiểm trường học Ứng dụng nhận dạng bảng ñiểm phục vụ nhập ñiểm tự ñộng trường THPT số Nghĩa Hành Trợ giúp cho giáo viên nhà trường ñỡ thời gian kinh phí cho việc nhập bảng ñiểm vào máy tính Bố cục luận văn Bố cục luận văn gồm ba chương ñược tóm tắt sau Chương - Cơ sở lý thuyết Chương trình bày sở lý thuyết có liên quan ñề tài như: Tìm hiểu ñường cong B-spline xử lý ảnh ñể áp dụng cho nhận dạng chữ viết tay Chương - Giải pháp ứng dụng ñường cong B-spline vào nhận dạng Trong chương này, giới thiệu giải pháp trình nhận dạng chữ viết tay, phương pháp giải thhuật dùng nhận dạng chữ viết Chương - Xây dựng hệ thống thử nghiệm Phân tích chức hệ thống, thiết kế kiến trúc hệ thống thực xây dựng ứng dụng theo cách thức áp dụng ñường cong B-spline vào nhận dạng chữ viết tay, sau ñó thử nghiệm ñánh giá kết ñạt ñược chương trình Footer Page of 126 Header Page of 126 CHƯƠNG - CƠ SỞ LÝ THUYẾT Chương giới thiệu sở lý thuyết có liên quan ñến ñề tài, làm tảng nhằm hổ trợ xây dựng ứng dụng ñặt ñề tài sau này, gồm nội dung sau - Giới thiệu số phương pháp nhận dạng chữ viết tay dang ñược sử dụng - Cơ sở lý thuyết ñường cong tham số B-spline - Giới thiệu cách thu nhận ảnh, tách ký tự, nhị phân hóa ký tự, tìm xương giảm số ñiểm biểu diễn ký tự 1.1 Một số phương pháp nhận dạng chữ viết tay 1.1.1 Phương pháp nhận dạng sử dụng lưới 1.1.2 Phương pháp nhận dạng chia miền ño mật ñộ 1.1.3 Phương pháp nhận dạng phân tích ñường ñơn 1.1.4 Phương pháp nhận dạng phân tích ñường biên 1.2 Xử lý ảnh cho nhận dạng chữ viết 1.2.1 Những vấn ñề xử lý ảnh 1.2.1.1 Điểm ảnh 1.2.1.2 Độ phân giải ảnh 1.2.1.3 Mức xám ảnh 1.2.1.4 Định nghĩa ảnh số 1.2.1.5 Quan hệ ñiểm ảnh 1.2.2 Lọc nhiễu Để làm ñược ñiều dùng lọc giống lọc Medial nghĩa dùng ma trận 3x3 quét khắp ảnh bitmap Thực lọc ánh xạ ñi từ ảnh nguồn A sang file ảnh ñích B ñịnh [1] Footer Page of 126 Header Page of 126 2  1 nÕu ∑∑ W (i, j) ≥ W (i, j) =  i = −1 j= −1 0 tr−êng hîp kh¸c  Thế việc lọc nhiễu fiel ảnh làm dấu chấm chữ i chữ j Do ñó số trường hợp khử nhiễu[1][3] 1.2.3 Nhị phân hóa ký tự Trong ñồ họa máy tính, màu ñiểm ảnh với ñịnh dạng ảnh RGB ñược xác ñịnh ba số: R: Red (ñỏ), G: Green (Lục xanh cây), B: Blue (Lam - xanh da trời) R, G, B nằm khoảng [0 255] Để xác ñịnh ñộ sáng ñiểm ảnh, ta sử dụng công thức[1] L = 0.299*R + 0.587*G + 0.114*B Ta quy ước L ≥ 0.8 pixel trắng ngược lại pixel ñen, từ ñó ta có ma trận nhị phân hình ảnh 1.2.4 Phân tách ký tự Quá trình phân tách ký tự, trải qua hai bước: Xác ñịnh tọa ñộ hàng ký tự xác ñịnh tọa ñộ cực trái cực phải ký tự hàng Để xác ñịnh tọa ñộ hàng ký tự, ta sử dụng ñường thẳng quét từ xuống ma trận nhị phân ký tự Nếu ñường thẳng gặp pixel ñen (0) ta ñánh dấu tọa ñộ cực hàng Ta tiếp tục quét cho ñến gặp hàng trắng (không có pixel ñen hàng), ta ñánh dấu cực hàng, từ ñó ta xác ñịnh ñược tọa ñộ hàng, tiếp tục trình cho ñến hết chiều dài thẳng ñứng ma trận nhị phân Áp dụng phương pháp tương tự theo chiều dọc cho hàng ta xác ñịnh ñược tọa ñộ cực Footer Page of 126 Header Page of 126 trái cực phải ký tự Xác ñịnh cực ký tự ñược minh hoạ hình 1.5 sau 1.2.5 Tìm xương ký tự 1.2.6 Giảm số ñiểm biểu diễn ký tự 1.3 Đường cong B-spline 1.3.1 Phương trình tính chất ñường cong B-spline Đường cong B-Spline xác ñịnh công thức [10][11][12] n P(t) = ∑ Ni,k (t)Bi t ≤ t < t max , ≤ k ≤ n + (1.1) i=0 Trong ñó: - Bi tập hợp n + ñiểm kiểm soát, k cấp ñường cong - Ni,k hàm sở B-Spline bậc k-1 Hàm sở B-Spline thứ i Ni,k(t) ñược ñịnh nghĩa phương trình ñệ quy sau 1 nÕu t ≤ t < t i i+1 N i,0 (t) =  0 tr−êng hîp kh¸c với Ni ,k ( t ) = (t − ti ) (t − t) N i , k −1 ( t ) + i + k N i +1, k −1 ( t ) t i + k −1− t i t i + k − t i +1 (1.2) (quy ước: 0/0 = 0) vectơ nút [ti, , tm] dãy số nguyên tăng dần t0 < t1 < … < tm-1 1.3.2 Các dạng vectơ nút 1.3.2.1 Vectơ nút dạng ñồng Footer Page of 126 Header Page 10 of 126 1.3.2.2 Vectơ nút dạng ñồng mở 1.3.3 Điều khiển hình dạng ñường cong B-Spline 1.3.4 Thêm nút vào vectơ nút Cho ñường cong B-Spline ñược ñịnh nghĩa công thức[10][11][12] n P ( t ) = ∑ N i ,k ( t )Bi i=0 Với vectơ nút [T] = [t0 t1 … tn+k] Sau thêm nút vào vectơ nút, ta có ñường cong m R ( y) = ∑ M j,k ( y)c j j=0 Với vectơ nút [Y] = [y0 y1 … ym+k] Giả sử m > n Mục ñích xác ñịnh ña giác kiểm soát Cj cho P(t) = R(y) Theo thuật toán Oslo[12] ta có n C j = ∑ α ik, j B i ≤ i < n, ≤ j < m (1.3) i=0 Hàm α ik, j αik, j = ñược tính sau 1 nÕu t ≤ y < t i i i+1 α ik, j =  0 tr−êng hîp kh¸c ( y j+ k −1 − t i ) t i + k −1− t i n ∑α k i, j α ik, −j + ( y j+ k −1 − t i + k ) t i + k − t i +1 αik+−11 ( t ) (1.4) =1 i =0 1.3.5 Các phép biến ñổi affine ñối với ñường cong B-spline Footer Page 10 of 126 Header Page 12 of 126 10 ỨNG DỤNG ĐƯỜNG CONG BSPLINE VÀO NHẬN DẠNG CHỮ VIẾT TAY CHƯƠNG - Trong chương này, tập trung giải công việc sau - Đưa ý tưởng giải pháp nhận dạng chữ viết tay ứng dụng ñường cong B-spline - Đưa giải thuật phương pháp sử dụng trình nhận dạng chữ viết tay 2.1 Giải pháp nhận dạng 2.1.1 Ý tưởng nhận dạng Trong trình nghiên cứu ñường cong B-spline nhận phương pháp xây dựng ñường cong hiệu Theo ñó ta cần xác ñịnh số hữu hạn ñiểm kiểm soát (Control points) từ ñiểm kiểm soát ta dễ dàng xây dựng nên ñường cong B-spline Tính chất quan trọng ñường cong B-spline bất biến với phép biến ñổi Affine (phép tịnh tiến, phép co phép quay) nghĩa muốn co ñường cong B-spline ta cần co ñiểm kiểm soát chúng mà ñường cong không bị biến dạng Ý tưởng - Cho máy học ký tự mẫu: ñọc từ tập tin ảnh ký tự cần học sau ñó xử lý, xác ñịnh vector kiểm soát chúng lưu lên tập tin liệu - Đọc ký tự muốn nhận dạng từ tập tin ảnh ký tự, xử lý tìm vector kiểm soát chúng Đối sánh vector kiểm soát ký tự cần nhận dạng với vector kiểm soát ký tự mà máy ñã học ñưa kết Footer Page 12 of 126 Header Page 13 of 126 11 Một số trường hợp cần phải xét thêm ký tự không kích thước, bị viết nghiêng Trường hợp 1: Ký tự có kích thước khác Dựa tính chất bất biến với phép biến ñổi Affine (phép tịnh tiến, phép thu nhỏ, phép phóng to, phép quay) Ta cần co hay phóng lớn ký tự ñó khung chuẩn, nghĩa ta việc phóng to hay thu nhỏ ñiểm kiểm soát chúng Trường hợp 2: Ký tự không chồng khít lên khung chuẩn Lúc tịnh tiến thăm dò (tịnh tiến qua trái, qua phải, lên hay xuống) cho ñến chúng chồng khít lên nhau, lúc sai số khoảng cách nhỏ Trường hợp 3: Ký tự viết nghiêng Trong trường hợp ta sử dụng phép quay ký tự thăm dò Nếu ta quay theo chiều dương mà sai số khoảng cách (dùng ñộ ño Euclide) so với ký tự mẫu mà tốt ta tiếp tục quay theo hướng này, không tốt ta quay theo chiều ngược lại 2.1.2 Phương pháp nhận dạng ký tự viết tay Phương pháp ứng dụng ñường cong B-spline vào nhận dạng chữ viết tay bao gồm bước ñược mô tả sau Footer Page 13 of 126 Header Page 14 of 126 12 2.1.2.1 Thu nhận ảnh ký tự Ảnh ký tự ñược thu nhận máy Scanner, Webcam, thiết bị thu nhận ảnh thông dụng khác ñược lưu dạng file ảnh 2.1.2.2 Tiền xử lý ảnh Quá trình tiền xử lý ảnh ký tự bao gồm bước sau: - Lọc nhiễu công ñoạn quan trọng xử lý ảnh, làm cho ảnh tốt ñể ứng dụng vào xác ñịnh số hàng số cột ñạt hiệu cao - Nhị phân ảnh chuyển ảnh bitmap thành ma trận nhị phân ñể ứng dụng vào công ñoạn sau hiệu hơn, tìm xương, phân tách ký tự - Phân tách thông tin khỏi ñối tượng hình học nhằm mục ñích tách ký tự khỏi ñối tượng hình học ñể lấy riêng phần ký tự nằm khung biểu mẫu - Phân tách ký tự tách ký tự ñể áp dụng vào tìm xương tìm vectơ kiểm soát sau Footer Page 14 of 126 Header Page 15 of 126 13 - Tìm xương nhằm mục ñích giảm thiểu số lượng ñiểm biểu diễn ñường cong, ñể thuận tiện cho việc tìm ñiểm kiểm soát ký tự ñối sánh sau - Giảm số lượng ñiểm biểu diễn ảnh mục ñích giảm thiểu không quan lưu trữ thuận tiện cho việc ñối sách nhận dạng sau 2.1.2.3 Xây dựng ñường cong B-Spline Có nhiều cách ñể xây dựng ñường cong B-spline dựa tập ñiểm kiểm soát chúng, luận văn ñề xuất áp dụng phương pháp phân rã (subdivision) ñể xây dựng ñường cong tham số B-spline[15] Phương pháp phân rã ñường cong B-spline bậc dựa thuật toán phân chia khung ña giác ñiều khiển Bằng cách chèn liên tiếp ñỉnh vào khung ña giác ban ñầu ta ñược khung ña giác có nhiều ñiểm hơn, tiệm cận ñường cong B-spline[15] - Thuật toán phân chia (Subdivision) khung ña giác ñiều khiển[15] Footer Page 15 of 126 Header Page 16 of 126 14 Cho ña giác có n ñiểm kiểm soát P k = {P0k , P1k , , Pnk−1 } (k ∈ N) Các bước xây dựng ñường cong B-spline bậc ba thực sau Xác ñịnh ñiểm cạnh ña giác kiểm soát dựa công thức [2.2a 2.2b] sau Ở bước (k + 1) có ñược ñường cong P k +1 = {Pik }i = m ñiểm {Pik } ñược tính sau P2ki+−11 = Pik−1 + Pik + Pik+1 cho i = n − 8 P2ki+1 = k k Pi + Pi +1 2 cho i = n − (2.2a) (2.2b) Khi số buớc k tăng lên, ñiểm kiểm soát tiệm cận với ñường cong B-spline Ở ñã tạo ñược ñường cong tham số B-spline áp dụng phương pháp phân rã Bài toán ngược lại, tức từ tập ñiểm nằm ñường cong, cần phải xác ñịnh ñiểm kiểm soát chúng - Thuật toán tái tạo (Inverse Subdivision) khung ñiều khiển ñường cong B-spline từ tập ñiểm cho trước[15] Footer Page 16 of 126 Header Page 17 of 126 15 k = ta thu ñược khung ñiều khiển có ñỉnh, từ ñó ta xây dựng ñược ñường cong B-spline bậc Từ ñỉnh ban ñầu, tính ngược ñỉnh dựa công thức sau 1 Pik = − P2ki+−12 + 2P2ki+−11 − P2ki++11 cho i = n − (2.3a) 2 Pik = 2P2ki+1 − Pik+1 cho i=0 (2.3b) Pik = 2P2ki+−12 − Pik−1 cho i = n −1 (2.3c) 2.1.2.4 Đối sánh ký tự cần nhận dạng với mẫu cho trước Qui trình ñối sánh mẫu bao gồm bước sau[11][12] - Dùng ñộ ño khoảng cách Euclide ñể ñối sánh với vectơ kiểm soát ký tự cần nhận dạng với tập vectơ mẫu ñể tìm ký tự giống - Trường hợp vectơ ký tự cần nhận dạng vectơ mẫu làm mịn ñường cong cách thêm ñiểm kiểm soát 2.1.2.5 Xuất kết Footer Page 17 of 126 Header Page 18 of 126 2.2 16 Phương pháp giải thuật sử dụng nhận dạng 2.2.1 Phương pháp phân tách ký tự khỏi ñối tượng hình học Xác ñịnh ñường ngang bảng ñiểm 1) Sử dụng ñường thẳng ngang quét từ xuống ñến ñụng ñường kẻ ngang bảng ñiểm liên tiếp pixel ñen (0) theo chiều ngang ñường thẳng 2) Tiếp tục quét ñến nét ñường thẳng gặp liên tiếp pixel trắng (1) ñánh dấu toạ ñộ cực ñối tượng hình học 3) Tiếp tục cho ñường thẳng quét ñến gặp liên tiếp pixel ñen (0) ñánh dấu toạ ñộ cực ñối tượng hình học 4) Lặp lại bước cho ñến hết chiều dài ñường thẳng ñứng Tương tự phương pháp ta xác ñịnh ñược cực trái cực phải ñối tượng hình học 2.2.2 Thuật toán phân tách ký tự Để phân tách ký tự, ta phải trải qua hai giai ñoạn: Xác ñịnh tọa ñộ hàng ký tự xác ñịnh tọa ñộ cực trái cực phải ký tự hàng Xác ñịnh tọa ñộ cực cực hàng ký tự 1) Ta sử dụng ñường thẳng ngang quét từ xuống ma trận nhị phân ký tự 2) Nếu ñường thẳng gặp pixel ñen (0) ta ñánh dấu tọa ñộ cực hàng 3) Nếu ñường thẳng gặp hàng trắng (không có pixel ñen hàng), ta ñánh dấu cực hàng 4) Lặp lại bước ñến hết chiều dài ñường thẳng ñứng ma trận nhị phân ảnh Tương tự phương pháp ta xác ñịnh ñược cực trái cực phải ký tự Footer Page 18 of 126 Header Page 19 of 126 17 2.2.3 Đo khoảng cách vectơ kiểm soát Lần lượt ñi qua mẫu chuẩn ñã ñược học, ta thực co phóng to ký tự cần nhận dạng khung chuẩn bắt ñầu ñối sánh Sử dụng ñộ ño khoảng cách Euclide ñể ño sai khác vectơ kiểm soát với Gọi hai vectơ kiểm soát ñó p = (p1, p2, , pn) q = (q1, q2, , qn), ta xem p q hai ñiểm không gian Euclide n chiều, khoảng cách từ p ñến q ñược tính bằng[11][12] E ( p, q ) = n ∑ (p − q ) i i (2.4) i =1 Trường hợp ñộ dài hai vectơ kiểm soát khác nhau, giả sử p có ñộ dài n, q có ñộ dài m với m > n ta cần bổ sung vào p với k = m - n ñiểm kiểm soát ñể cho ñộ dài hai vectơ Cách thêm ñiểm kiểm soát tham khảo [11][12] 2.3 Kết chương Trong chương trình bày giải thuật sử dụng ñường cong B- Spline vào nhận dạng chữ số viết tay Cho máy học ký tự mẫu từ file bitmap, xử lý xác ñịnh vectơ kiểm soát chúng lưu lên file liệu Đọc ký tự muốn nhận dạng từ file bitmap, xử lý tìm vectơ kiểm soát chúng, ñối sánh vectơ kiểm soát ký tự cần nhận dạng với vectơ kiểm soát ký tự mà máy ñã học cho kết Phương pháp B-Spline tỏ ưu số phương pháp khác chỗ, ñịnh nhận dạng số phương pháp Footer Page 19 of 126 Header Page 20 of 126 18 khác ñược cài ñặt tỉnh chương trình, muốn bổ sung thêm số mẫu phải thiết kế lại chương trình Trong ñó với phương pháp B-Spline cần ta cung cấp mẫu cho máy học ta bổ sung vào nhớ kiểu liệu mới, việc không ảnh hưởng ñến cấu trúc chương trình ban ñầu XÂY DỰNG HỆ THỐNG NHẬN DẠNG CHỮ VIẾT TAY CHƯƠNG - Trong chương trước, luận văn ñã giới thiệu phương pháp nhận dạng ứng dụng ñường cong tham số B-spline, xử lý liệu từ file ảnh số giải thuật nhận dạng Chương tập trung vào việc phân tích thiết kế hệ thống, xây dựng, thử nghiệm ứng dụng từ ñó ñánh giá kết ñạt ñược 3.1 Phân tích thiết kế hệ thống 3.1.1 Chức máy học ký tự mẫu 3.1.2 Chức nhận dạng 3.1.3 Kiến trúc tổng thể hệ thống Mô hình kiến trúc tổng thể hệ thống nhận dạng chữ viết tay Footer Page 20 of 126 Header Page 21 of 126 3.2 Kịch sử dụng 3.3 Kết thực nghiệm 19 3.3.1 Nhận dạng chữ in Cho máy học mẫu ký tự số in font Arial cỡ chữ 14 Khi cho máy nhận dạng ký tự số in có kích cỡ font chữ máy nhận dạng ñúng 100% Khi cho nhận dạng ký tự số in font chữ kích cỡ 18 máy nhận dạng ñúng 98% Khi cho nhận dạng dạng ký tự số in font chữ kích thước 10 máy nhận dạng ñúng khoảng 90% 3.3.2 Nhận dạng chữ viết tay Cho máy học mẫu ký tự số viết tay từ "0" ñến "9" ký tự viết lần Sau ñó viết lại 10 ký tự số từ "0" ñến "9" cho nhận dạng máy nhận dạng cho kết sau Footer Page 21 of 126 Header Page 22 of 126 20 Bảng: Kết ñối sánh sử dụng ñộ ño khoảng cách Euclide Mẫu Ký tự 63.73 114.98 123.23 97.78 122.36 130.28 172.9 161.54 132.29 94.34 82.81 51.75 96.04 88.82 43.69 129.41 107.33 98.79 155.68 134.38 171.39 178.17 81.75 111.58 88.86 72.91 110.92 138.25 132.78 87.63 147.84 108.88 119.96 76.96 173.73 158.01 55.56 116.11 167.26 99.88 185.07 202.79 144.68 199.79 139.73 124.12 179.73 66.34 145.69 169.94 226.97 191.51 103.31 173.64 106.95 80.67 150.66 120.46 65.29 146.15 122.56 106.24 156.03 206.05 166.55 103.29 136.72 157.35 172.52 95.33 189.87 152.28 80.09 136.72 89.5 130.19 157.74 208.57 104.95 195.96 202.68 199.57 150.13 179.47 91.11 81.5 91.23 62.31 71.29 75.54 98.18 107.71 164.83 75.34 120.41 119.12 104.45 117.33 40.84 113.59 3.3.3 Nhận dạng bảng ñiểm Cho máy học ký tự số viết tay in ñược người vào ñiểm viết mẫu Footer Page 22 of 126 Header Page 23 of 126 21 Kết nhận dạng bảng ñiểm ñạt khoảng 96% Dưới ñây giao diện ứng dụng nhận dạng bảng ñiểm kết Footer Page 23 of 126 Header Page 24 of 126 3.4 22 Đánh giá kết Kết nhận dạng cho thấy phương pháp sử dụng ñường cong B-Spline ñể nhận dạng ký tự in ký tự viết tay hiệu Nhận dạng ký tự số in kích thước ñạt tỷ lệ xác 100%, nhận dạng ký tự viết tay ñạt 98% Đặc biệt ñộ xác tăng mẫu có kích thước lớn ñộ lệch ñặc trưng mẫu tỉ lệ thuận với kích thước, kích thước lớn ñộ lệch ñặc trưng Footer Page 24 of 126 Header Page 25 of 126 23 cao ngược lại Tuy nhiên, trường hợp người dùng cho hệ thống nhận dạng mẫu có kích thước bé, ñộ lệch ñặc trưng giảm, dẫn ñến việc hệ thống nhận dạng nhầm lẫn mẫu Kết nhận dạng hai nhóm viết tay khác ñạt tỷ lệ thấp Cho nhóm A viết mẫu nhóm B viết nhận dạng, kết thu ñược khoảng 50% Nhận dạng bảng ñiểm, kết ñạt 96% Độ xác nhận dạng bảng ñiểm không mong muốn, nguyên nhân chất lượng ảnh bảng ñiểm kém, ký tự ñiểm viết tay bị trùng lên ñường biên ñó kết tiền xử lý hình ảnh không ñạt hiệu cao dẫn ñến máy ñịnh nhận dạng ñiểm sai Footer Page 25 of 126 Header Page 26 of 126 24 KẾT LUẬN Kết ñạt ñược Qua thời dài nghiên cứu kết hợp với học hỏi kinh nghiệm từ người ñã nghiên cứu trước lĩnh vực này, luận văn ñã hoàn thành ñạt ñược kết sau: Về lý thuyết: Luận văn ñã trình bày tổng quan vấn ñề ñường cong tham số B-spline, xử lý ảnh dùng nhận dạng chữ viết tay, nêu ñược giải pháp kỹ thuật ñể xây dựng ñược hệ thống nhận dạng Về thực tiễn: Luận văn ñã xây dựng ñược hệ thống sử dụng ñường cong B-Spline ñể nhận dạng ký tự viết tay Kết thực nghiệm cho thấy khả nhận dạng phương pháp xác, ñặc biệt ký tự có kích thước lớn việc nhận dạng tốt Cách tổ chức lưu trữ mẫu chuẩn quan trọng, ảnh hưởng lớn ñến ñộ xác nhận dạng Hướng phát triển luận văn Bên cạnh vấn ñề ñã ñạt ñược ñã trình bày, ñề tài cần ñược phát triển thêm vấn ñề sau: - Hoàn thiện chức chương trình - Hoàn thiện chức nhận dạng bảng ñiểm ñể triển khai cho phép nhận dạng bảng ñiểm tự ñộng trường học - Phát triển ứng dụng ñể nhận dạng văn viết tay, ñặc biệt nhận dạng văn viết tay tiếng việt Phát triển ñể nhận dạng vân tay Footer Page 26 of 126 ... tự) Nghiên cứu cho máy học nhận dạng ký tự phương pháp sử dụng ñường cong tham số B-spline qua tham số ñặc trưng như: ñỉnh ñiều khiển, vectơ nút Nghiên cứu xây dựng ứng dụng nhận dạng chữ số viết. .. thuật nhận dạng ký tự viết tay bao gồm: nhận dạng chữ số viết tay Ngôn ngữ lập trình C# Phạm vi nghiên cứu Nghiên cứu lý thuyết toán học ñường cong B-Spline áp dụng vào phương pháp nhận dạng ký... ñường cong B-spline xử lý ảnh ñể áp dụng cho nhận dạng chữ viết tay Chương - Giải pháp ứng dụng ñường cong B-spline vào nhận dạng Trong chương này, giới thiệu giải pháp trình nhận dạng chữ viết tay,

Ngày đăng: 06/05/2017, 11:59

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan