1. Trang chủ
  2. » Luận Văn - Báo Cáo

nghiên cứu phương pháp máy vectơ tựa trong nhận dạng chữ viết tay (xử lý ảnh)

66 1,7K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 66
Dung lượng 0,91 MB

Nội dung

Luận văn thạc sỹ Khoa học máy tính.Đề tài: nghiên cứu phương pháp máy vectơ tựa trong nhận dạng chữ viết tay (xử lý ảnh)

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN  NGUYỄN MINH ĐỨC NGHIÊN CỨU PHƯƠNG PHÁP MÁY VÉCTƠ TỰA TRONG NHẬN DẠNG CHỮ VIẾT TAY LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG, 2012 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN  NGUYỄN MINH ĐỨC NGHIÊN CỨU PHƯƠNG PHÁP MÁY VÉCTƠ TỰA TRONG NHẬN DẠNG CHỮ VIẾT TAY Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS. Phạm Anh Phương ĐÀ NẴNG, 2012 ii LỜI CẢM ƠN Tôi xin được gửi lời cám ơn sâu sắc tới TS. Phạm Anh Phương về những chỉ dẫn khoa học và tận tình hướng dẫn, định hướng cho tôi trong suốt quá trình thực hiện Luận văn. Tôi xin chân thành cám ơn các Thầy, Cô trong Khoa Sau đại học, những người đã quan tâm tổ chức, chỉ đạo và trực tiếp giảng dạy trong suốt quá trình học tập của chúng tôi. Tôi xin chân thành cám ơn bạn bè, đồng nghiệp đã có nhiều ý kiến quan trọng giúp tôi hoàn thiện tốt hơn luận văn của mình. Tôi xin gửi lời cảm ơn tới gia đình, anh chị em và những người thân đã quan tâm, giúp đỡ và động viên để tôi yên tâm và hoàn thành được luận văn. Đà Nẵng, tháng 6 năm 2012 Nguyễn Minh Đức iii LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu và kết quả nghiên cứu trong luận văn này là trung thực và không trùng lặp với các đề tài khác. Học viên thực hiện luận văn Nguyễn Minh Đức iv MỤC LỤC Trang phụ bìa i Lời cảm ơn ii Lời cam đoan iii Mục lục iv Danh mục ký hiệu và từ viết tắt vi Danh sách các bảng biểu vii Danh sách các hình vẽ viii Mở đầu 1 1. do chọn đề tài 1 2. Mục đích nghiên cứu 2 3. Đối tượng và phạm vi nghiên cứu của đề tài 2 4. Phương pháp nghiên cứu 2 5. Kết cấu của luận văn 3 CHƯƠNG 1. TỔNG QUAN VỀ NHẬN DẠNG CHỮ VIẾT TAY 4 1.1. Giới thiệu 4 1.2. Các phương pháp nhận dạng cổ điển 5 1.2.1. Nhận dạng dựa vào đặc trưng cấu trúc chữ 5 1.2.2. Nhận dạng bằng phương pháp đối sánh mẫu 9 1.3. Sử dụng các phương pháp máy học tiên tiến 10 1.3.1. Sử dụng mạng Nơron 10 1.3.2. Sử dụng mô hình Markov ẩn 12 1.3.3. Sử dụng phương pháp máy véc tơ tựa 13 1.4. Mô hình tổng quát của một hệ nhận dạng 14 1.4.1. Mô hình tổng quát 14 1.4.2. Tiền xử 15 1.4.2.1. Nhị phân hóa ảnh 16 1.4.2.2. Hiệu chỉnh kích thước ảnh 16 1.4.2.3. Khử nhiễu 17 1.4.2.4. Làm trơn biên chữ 18 1.4.2.5. Làm dày chữ 19 1.4.2.6. Làm mảnh chữ 20 1.4.2.7. Xoay văn bản 20 1.4.3. Tách chữ 20 1.4.4. Trích chọn đặc trưng 21 1.4.4.1. Đặc trưng thống kê 22 1.4.4.2. Đặc trưng hình học và hình thái 24 1.4.4.3. Biến đổi toàn cục và triển khai chuỗi 24 1.4.5. Huấn luyện và nhận dạng 25 v 1.4.6. Hậu xử 25 CHƯƠNG 2. PHƯƠNG PHÁP MÁY VÉCTƠ TỰA 27 2.1. Cơ sở thuyết 27 2.1.1. Giới thiệu bài toán phân lớp nhị phân 27 2.1.2. Máy SVM tuyến tính 28 2.1.2.1. SVM trong trường hợp tập mẫu phân hoạch tuyến tính được 28 2.1.2.2. SVM tuyến tính trong trường hợp tập mẫu không phân hoạch tuyến tính được 30 2.1.3. Máy SVM phi tuyến 35 2.2. Các thuật toán huấn luyện SVM 37 2.2.1. Thuật toán chặt khúc 37 2.2.2. Thuật toán phân rã 37 2.2.3. Thuật toán cực tiểu tuần tự 38 2.2.3.1. Tối ưu hai α i 39 2.2.3.2. Cập nhật các tham số mỗi bước tối ưu thành công 39 2.2.3.3. Chọn hai α i cho việc tối ưu 40 CHƯƠNG 3. ÁP DỤNG SVM VÀO BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY 42 3.1. Một số chiến lược SVM đa lớp. 42 3.1.1. Sử dụng mô hình SVM đa lớp theo chiến lược OVO 42 3.1.2. Sử dụng mô hình SVM đa lớp theo chiến lược OVR 44 3.2. Đề xuất mô hình nhận dạng 45 3.2.1. Chuẩn hóa kích thước ảnh 45 3.2.2. Trích chọn đặc trưng 46 3.2.3. Lựa chọn thuật toán huấn luyện phân lớp 48 3.2.4. Phân lớp nhận dạng. 48 3.3. Kết quả thực nghiệm 50 3.3.1. Kết quả thực nghiệm trên bộ dữ liêu MNIST 50 3.3.2. Kết quả thực nghiệm trên tập dữ liệu USPS 52 Kết luận 54 1. Các kết quả đạt được 54 2. Các hạn chế của luận văn 54 3. Hướng phát triển 55 Tài liệu tham khảo 56 Tài liệu tiếng Việt 56 Tài liệu tiếng Anh 57 vi DANH MỤC KÝ HIỆU VÀ TỪ VIẾT TẮT Ký hiệu Thuật ngữ SVM Support Vector Machine – (Máy Vectơ tựa) MNIST Bộ mẫu chữ số viết tay NIST - Viện Công nghệ và Tiêu chuẩn Quốc gia Hoa Kỳ SMO Sequential Minimal Optimization – (Thuật toán cực tiểu tuần tự) OVO One – versus – One – (Một chống một) OVR One – versus – Rest – (Một chống phần còn lại) USPS United States Postal service ANN Artificial Neural Network (Mạng nơron nhân tạo) HMM Hiden Markov Models – (Mô hình Markov ẩn) MLP MultiLayer Perceptron kNN k láng giềng gần nhất KKT Karush-Kuhn-Tucker Kernel Hàm nhân Decomposition Phân rã QP Quadratic Programing (quy hoạch toàn phương) vii DANH SÁCH CÁC BẢNG BIỂU Bảng 1: Kết quả thực nghiệm trên tập MNIST với hàm nhân RBF(s =0.08) 51 Bảng 2. Kết quả thực nghiệm trên tập dữ liệu USPS 52 Bảng 3. Kết quả thực nghiệm trên tập dữ liệu USPS với C=10, hàm nhân RBF(=0.05) 53 viii DANH SÁCH CÁC HÌNH VẼ Hình 1-1 Mã Freeman 6 Hình 1-2 Mô tả một số ký tự dựa trên cấu trúc nguyên thủy 7 Hình 1-3 Mạng perceptron đa lớp 12 Hình 1-4 Mô hình tổng quát của một hệ nhận dạng chữ viết 15 Hình 1-5 Nhị phân hóa ảnh 16 Hình 1-6 Chuẩn hóa kích thước ảnh các ký tự “A” và “D” 17 Hình 1-7 Nhiễu đốm và nhiễu vệt đen dài 17 Hình 1-8 Làm trơn biên chữ bằng kỹ thuật Dineen và Unger 19 Hình 1-9 Xác định khoảng phân cách giữa hai ký tự và hai từ 21 Hình 1-10 Phân vùng ký tự A 23 Hình 1-11 Trích chọn theo phép chiếu theo hai chiều trên ký tự a 23 Hình 1-12 Trích chọn theo chu tuyến của ký tự a 24 Hình 2-1 Các siêu phẳng H1, H2 phân cách giữa hai lớp 27 Hình 2-2 Siêu phẳng tách tuyến tính 28 Hình 2-3 Không thể phân hoạch tập mẫu trên bằng một siêu phẳng 30 Hình 2-4 Một mặt phân chia phi tuyến có thể trở thành một siêu phẳng trong không gian lớn hơn. 35 Hình 3-1 Sơ đồ bỏ phiếu cho bài toán phân 5 lớp 43 Hình 3-2 Bài toán phân bốn lớp theo chiến lược OVR 44 Hình 3-3 Mô hình nhận dạng chữ viết tay rời rạc 45 Hình 3-4 Chuẩn hóa kích thước ảnh 46 Hình 3-5 Trích chọn đặc trưng nhị phân 47 Hình 3-6 Trích chọn đặc trưng ma trận trọng số vùng 48 Hình 3-7 Các mẫu chữ số viết tay trích từ tập dữ liệu MNIST 51 Hình 3-8 Các mẫu chữ số viết tay trích từ tập dữ liệu USPS 52 1 MỞ ĐẦU 1. do chọn đề tài Đã từ lâu chiếc máy tính trở thành công cụ không thể thiếu trong hầu hết các lĩnh vực đời sống xã hội, máy tính hỗ trợ từng cá nhân cũng như cơ quan doanh nghiệp phát triển. Con người không ngừng nghiên cứu để tăng cường sức mạnh của máy tính, từ tốc độ xử lý, khả năng tính toán cũng như khả năng lưu trữ thông tin, qua đó giúp cho máy tính ngày càng thông minh hơn và đảm nhận các chức năng gần với con người hơn. Để thực hiện việc lưu trữ và xử thông tin, vấn đề giao tiếp giữa con người với máy tính càng được chú trọng. Trong các lĩnh vực đời sống xã hội, những thông tin được lưu trữ dưới dạng các văn bản viết tay là các tài liệu quan trọng và có số lượng cực lớn. Việc lưu trữ các tài liệu đó vào máy tính dưới dạng các tài liệu văn bản đòi hỏi phải xây dựng những chương trình giúp máy tính nhận dạng được chữ viết tay. Sự nhận dạng chính xác ký tự latin đánh máy được xem là vấn đề đã được giải quyết. Hiện nay, với chữ Việt, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 có khả năng nhận dạng trực tiếp các loại tài liệu được quét qua máy quét, không cần lưu trữ dưới dạng tệp ảnh trung gian. Các trang tài liệu có thể được quét và lưu trữ dưới dạng tệp tin nhiều trang. Kết quả nhận dạng được lưu trữ sang định dạng của Microsoft Word, Excel phục vụ rất tốt nhu cầu số hóa dữ liệu. Trong khi đó, bài toán nhận dạng chữ viết tay vẫn chưa được giải quyết một cách trọn vẹn và vẫn đang là một vấn đề thách thức đối với các nhà nghiên cứu không những trong nước mà trên toàn thế giới vì những đặc thù riêng của nó. Chữ viết tay phụ thuộc nhiều vào phong cách của người viết, mỗi người có một cách viết khác nhau. Hiện tại có khá nhiều phương pháp nhận dạng chữ viết trong đó phương pháp máy véctơ tựa (SVM - Support Vector Machine) là phương pháp máy học tiên [...]... dụng trong nhiều lĩnh vực không chỉ trong nhận dạng xử ảnh mà còn trong lĩnh vực khai phá dữ liệu, phân tích văn bản, phân tích gene… Vì vậy luận văn này chọn phương pháp máy Véctơ tựa để nghiên cứu bài toán nhận dạng chữ viết tay 2 Mục đích nghiên cứu - Nghiên cứu về phương pháp phân lớp SVM áp dụng cho bài toán nhận dạng chữ viết tay - Cài đặt demo dạng chữ viết tay rời rạc với độ chính xác chấp nhận. .. quan về nhận dạng chữ viết: Giới thiệu về chữ in và chữ viết tay, trong đó tập trung vào bài toán đặt nhận dạng chữ viết tay ngoại tuyến và lựa chọn phương pháp nhận dạng Đồng thời giới thiệu tổng quan về một hệ nhận dạng với tất cả các khâu từ tiền xử lý, trích chọn đặc trưng cho tới khâu huấn luyện, nhận dạng và cuối cùng là phần hậu xử Chương 2 Phương pháp máy Véctơ tựa: Bao gồm các cơ sở thuyết... 3 Đối tượng và phạm vi nghiên cứu của đề tài Đối tượng nghiên cứu của đề tài: - Quy trình nhận dạng chữ viết tay ngoại tuyến - Phương pháp phân lớp máy Véctơ tựa Phạm vi nghiên cứu của đề tài: - Nhận dạng chữ viết tay rời rạc trên các tập dữ liệu chữ số viết tay MNIST và USPS - Trong phương pháp SVM chọn thuật toán huấn luyện cực tiểu tuần tự -SMO - Đối với SVM đa lớp, nghiên cứu hai chiến lược OVO... số “10”, chữ “SO” với số “50”.v.v 26 Kết luận Chương một của luận văn đã nghiên cứu tổng quan về một hệ nhận dạng chữ viết tay bao gồm các bước từ bước tiền xữ lý, trích chọn đặc trưng cho đến các bước huấn luyện, nhận dạng và hậu xử Chương một cũng giới thiệu một số kỹ thuật nhận dạng chữ viết tay bao gồm các kỹ thuật nhận dạng cổ điển như nhận dạng dựa vào đặc trưng cấu trúc chữ, phương pháp đối... sự đồng dạng chứ không có sự đồng nhất), độ nghiêng của chữ, khoảng trống giữa các chữ, hoặc cách viết một số ký tự nhất định của từng người viết, ngoài ra chữ viết tay còn thay đổi theo trạng thái tinh thần của người viết Chính vì những do đó mà việc giải quyết bài toán toán nhận dạng chữ viết tay vẫn tiếp tục là một đề tài thách thức với các nhà nghiên cứu Có hai loại nhận dạng chữ viết tay: -... sánh mẫu và các kỹ thuật nhận dạng tiên tiến như mô hình Markov ẩn, mạng Nơron, SVM Trong số các kỹ thuật nhận dạng nêu trên thì SVM đang được nhiều nhà nghiên cứu quan tâm vì áp dụng phương pháp này cho bài toán nhận dạng chữ viết tay mang lại độ chính xác rất cao Ở chương hai của luận văn sẽ tập trung nghiên cứu phương pháp SVM 27 CHƯƠNG 2 PHƯƠNG PHÁP MÁY VÉCTƠ TỰA 2.1 Cơ sở thuyết 2.1.1 Giới thiệu... nhận dạng ký tự hoặc chữ viết dựa trên thông tin thu được trong thời gian thực ngay lúc người dùng thực hiện hành động viết, những thông tin đó là tốc độ viết, áp lực khi viết và hướng viết Đối với phương pháp nhận dạng, hiện nay có khá nhiều phương pháp, cổ điển nhất là nhận dạng dựa vào đặc trưng cấu trúc chữ, phương pháp đối sánh mẫu, K láng giềng gần nhất, hay một số phương pháp tiên tiến như sử... thuyết của phương pháp SVM và các thuật toán huấn luyện SVM phổ biến Chương 3 Áp dụng SVM vào bài toán nhận dạng chữ viết tay: Đề xuất mô hình nhận dạng cùng với việc cài đặt ứng dụng và một số kết quả thực nghiệm trên các bộ dữ liệu chuẩn với các chiến lược thường được sử dụng cho bài toán phân đa lớp 4 CHƯƠNG 1 TỔNG QUAN VỀ NHẬN DẠNG CHỮ VIẾT TAY 1.1 Giới thiệu Chữ in hay chữ đánh máydạng chữ mà... đạt độ chính xác nhận dạng lên tới 99% và được sử dụng rộng rãi trong việc số hóa tất cả các tài liệu văn bản in Trong khi đó, bài toán nhận dạng chữ viết tay vẫn chưa được giải quyết trọn vẹn vì những khó khăn nhất định xuất phát từ chính những đặc điểm của chữ viết tay Chữ viết tay với những đặc thù độc đáo của nó như sự biến đổi đa dạng trong cách viết từng ký tự (cùng một người viết nhưng các ký... giả sử dụng trong các hệ nhận dạng chữ Trong kỹ thuật nhận dạng ký tự, mạng Nơron tỏ ra ưu thế hơn các phương pháp truyền thống ở chỗ không tốn thời gian cho thủ tục tiền xử lý, làm mảnh ký tự, trích trọn đặc trưng… Mặt khác các phương pháp ra quyết định trong nhận 12 dạng truyền thống được cài đặt tĩnh trong chương trình, khi muốn bổ sung thêm các mẫu học mới phải thiết kế lại chương trình Trong khi

Ngày đăng: 13/03/2014, 10:41

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w