1. Trang chủ
  2. » Kinh Doanh - Tiếp Thị

Tìm Hiểu Mạng Neural Hamming Và Ứng Dụng Trong Bài Toán Nhận Dạng Chữ Cái Tiếng Việt

74 347 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 74
Dung lượng 1,37 MB

Nội dung

Header Page of 126 ĐẠI HỌC THÁI NGUYÊN TÌM HIỂU MẠNG NEURAL HAMMING ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG CÁC CHỮ CÁI TIẾNG VIỆT Thái Nguyên – 2013 Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 ĐẠI HỌC THÁI NGUYÊN TÌM HIỂU MẠNG NEURAL HAMMING ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG CÁC CHỮ CÁI TIẾNG VIỆT Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS Lê Quang Minh Thái Nguyên – 2013 Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 LỜI CẢM ƠN Để hoàn thành luận văn này, bên cạnh nỗ lực cố gắng thân có hƣớng dẫn nhiệt tình quý Thầy Cô, nhƣ động viên ủng hộ gia đình bạn bè suốt thời gian học tập nghiên cứu thực luận văn thạc sĩ Xin chân thành bày tỏ lòng biết ơn đến Thầy giáo TS Lê Quang Minh, ngƣời hết lòng giúp đỡ tạo điều kiện tốt cho hoàn thành luận văn Xin gửi lời tri ân điều mà Thầy dành cho Xin chân thành bày tỏ lòng biết ơn đến toàn thể quý Thầy Cô trƣờng Đại học Công nghệ Thông tin & Truyền thông nhƣ quý Thầy Cô tận tình truyền đạt kiến thức quý báu tạo điều kiện thuận lợi cho suốt trình học tập, nghiên cứu thực luận văn Xin chân thành bày tỏ lòng biết ơn đến gia đình, ngƣời không ngừng động viên, hỗ trợ tạo điều kiện tốt cho suốt thời gian học tập thực luận văn Cuối cùng, xin chân thành bày tỏ lòng biết ơn đến anh chị bạn bè đồng nghiệp hỗ trợ cho suốt trình học tập, nghiên cứu thực luận văn cách hoàn chỉnh Thái Nguyên, tháng 11 năm 2013 Học viên thực Phùng Văn Kiệm Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 MỤC LỤC LỜI CẢM ƠN MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT DANH MỤC HÌNH VẼ MỞ ĐẦU CHƢƠNG I: TỔNG QUAN VỀ HIỆN TRẠNG CÁC BÀI TOÁN NHẬN DẠNG THIẾT LẬP BÀI TOÁN NGHIÊN CỨU 1.1 Tổng quan toán nhận dạng 1.2 Cụ thể toán nhận dạng chữ Tiếng Việt 1.3 Thiết lập toán 1.3.1 Ảnh đầu 1.3.2 Tiền sử lý 1.3.2.1 Nhị phân hóa ảnh 1.3.2.2 Lọc nhiễu 1.3.2.3 Chuẩn hóa kích thƣớc ảnh 1.3.2.4 Làm trơn biên chữ 1.3.2.5 Làm đầy chữ 1.3.2.6 Làm mảnh chữ 1.3.2.7 Điều chỉnh độ nghiêng văn 1.3.3 Quá trình biến đổi ảnh 1.3.3.1 Biến đổi Fourier 1.3.3.2 Biến đổi Wavelet 1.3.3.3 Phƣơng pháp mô men 1.3.3.4 Khai triển Karhunent-Loeve 1.3.4 Nhận dạng 10 1.3.4.1 Đối sánh mẫu 10 Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 1.3.4.2 Phƣơng pháp tiếp cận cấu trúc 11 1.3.4.3 Mô hình Markov ẩn (HMM - Hidden Markov Model) 13 1.3.4.4 Máy véc tơ tựa (SVM) 13 1.3.4.5 Mạng nơ ron 14 1.3.5 Kết 15 1.4 Kết luận 15 CHƢƠNG II: TÌM HIỂU MẠNG NEURAL MẠNG HAMMING 16 2.1 Mạng Neural 16 2.1.1 Khái niệm mạng Neural 16 2.1.2 Lịch sử phát triển mạng Neural 16 2.1.3 Đặc trƣng mạng neural 18 2.1.3.1 Tính phi tuyến 18 2.1.3.2 Tính chất tƣơng ƣớng đầu vào đầu 19 2.1.3.3 Tính chất thích nghi 19 2.1.3.4 Tính chất đƣa lời giải có chứng 19 2.1.3.5 Tính chất chấp nhận sai xót 20 2.1.3.6 Khả cài đặt VLSI(Very-large-scale-intergrated) 20 2.1.3.7 Tính chất đồng dạng phân tích thiết kế 20 2.1.4 Phân loại mạng neural nhân tạo 21 2.1.4.1 Phân loại theo kiểu liên kết neural 21 2.1.4.2 Một số loại mạng neural 21 2.1.5 Xây dựng mạng neural 23 2.1.6 Huấn luyện mạng neural 25 2.1.6.1 Phƣơng pháp học 25 2.1.6.2 Thuật toán học 26 2.1.7 Ứng dụng mạng neural 31 2.2 Mạng Hamming 32 Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 2.2.1 Kiến trúc mạng Hamming 32 2.2.2 Thuật toán học điển hình mạng Neural 34 2.3 Kết luận 40 CHƢƠNG III: ỨNG DỤNG MẠNG HAMMING TRONG BÀI TOÁN NHẬN DẠNG CÁC CHỮ CÁI TIẾNG VIỆT 41 3.1 Đặc thù khó khăn toán nhận dạng chữ Tiếng Việt 41 3.2 Thuật toán chung chƣơng trình 43 3.3 Cấu trúc mạng Neural Hamming chƣơng trình nhận dạng chữ Tiếng Việt 44 3.4 Xây dựng chƣơng trình nhận dạng chữ Tiếng Việt 46 3.4.1 Công cụ ngôn ngữ lập trình 46 3.4.2 Xây dựng chƣơng trình 46 3.4.2.1 Xây dựng mô hình mạng Neural Hamming tín hiệu đầu vào 46 3.4.2.2 Định vị thu gọn kích cỡ ảnh 48 3.4.2.3 Xây dựng thuật toán 49 3.4.2.4 Nhận dạng 50 3.4.2.5 Giao diện chƣơng trình 54 3.5 Thử nghiệm chƣơng trình 54 3.6 Nhận xét chung trình thử nghiệm nhận dạng chữ Tiếng Việt kết luận chƣơng 60 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 63 Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 DANH MỤC CÁC TỪ VIẾT TẮT Từ Ý nghĩa RBF Radial Basic Function HMM Hidden Markov Model SVM Support Vector Machines USPS United States Postal Service MNIST Bộ mẫu chữ số viết tay NIST-Viện Công nghệ Tiêu chuẩn Quốc gia Hoa Kỳ (National Insitute of Standard and Technology of the United States) SV Support Vector SOM Self Origanizing Map ANN Artificial Neural Network VLSI Very-large-scale-intergrated MLP Multi Layer Perceptron LMS Least Means Square Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 DANH MỤC BẢNG, HÌNH VẼ Bảng 3.1: Kết nhận dạng chữ Tiếng Việt Font Times New Roman 57 Bảng 3.2: Kết nhận dạng chữ Tiếng Việt Font Arial 59 Hình 1.1 Sơ đồ hệ thống nhận dạng Hình 1.2 Nhị phân hóa ảnh Hình 1.3 Nhiễu đốm nhiễu vệt Hình 1.4.Chuẩn hóa kích thƣớc ảnh ký tự “A” “P” Hình 1.5.(a) Ảnh gốc, (b) Ảnh sau đƣợc làm trơn biên Hình 1.6 Làm mảnh chữ Hình 1.7 Hiệu chỉnh độ nghiêng văn Hình 2.1: Mạng tiến với mức neural 21 Hình 2.2: Mạng tiến kết nối đầy đủ với mức ẩn mức đầu 22 Hình 2.3: Mạng hồi quy neural ẩn vòng lặp tự phản hồi 23 Hình 2.4: Mạng hồi quy có neural ẩn 23 Hình 2.5: Sơ đồ đồ thị có hƣớng đơn giản 24 Hình 2.6 Cấu trúc mạng hamming 32 Hình 2.7 Sơ đồ khối thuật toán lan truyền ngƣợc 39 Hình 3.1 Phân tích chữ cỡ 30x20 thành điểm ảnh 41 Hình 3.2 Phân tích chữ cỡ 60x30 thành điểm ảnh 42 Hình 3.3 Sơ đồ thuật toán chung chƣơng trình 43 Hình 3.4 Lƣu đồ trình xử lý ảnh 44 Hình 3.5 Cấu trúc mạng Neural 45 Hình 3.6 Hàm truyền Neural lớp 45 Hình 3.7 Quá trình xử lý ảnh thuật toán 47 Hình 3.8 Định vị trí biên ảnh 48 Hình 3.9 Hàm truyền Neural lớp thứ 49 Hình 3.10 Sơ đồ hàm đầu 51 Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page of 126 Hình 3.11 Giao diện chƣơng trình 54 Hình 3.12 Kết nhận dạng chữ Â với kích thƣớc 80x50 độ nhiễu 25% 55 Hình 3.13 Kết nhận dạng chữ Â với kích thƣớc 80x50 pixel độ nhiễu 35% 55 Hình 3.14 Kết nhận dạng chữ Â với kích thƣớc 60x30 pixel độ nhiễu 25% 56 Hình 3.15 Kết nhận dạng chữ Â font Arial với kích thƣớc 60x30 pixel với độ nhiễu 25% 56 Hình 3.16 Bảng kết trọng số đầu ảnh không tính nhiễu 57 Hình 3.17 Bảng kết trọng số đầu ảnh có tính nhiễu 57 Hình 3.18 So sánh ảnh đầu vào ảnh mẫu 60 Số hóa trung tâm học liệu Footer Page of 126 http://www.lrc.tnu.edu.vn/ Header Page 10 of 126 MỞ ĐẦU Từ lâu nhà khoa học nhận thấy ƣu điểm óc ngƣời tìm cách bắt chƣớc để thực máy tính, tạo cho có khả học tập, nhận dạng phân loại Vì nhà khoa học nghiên cứu sáng tạo mạng Neural nhân tạo Nó thực đƣợc ý nhanh chóng trở thành hƣớng nghiên cứu đầy triển vọng đặc biệt lĩnh vực nhận dạng toán nhận dạng ký tự toán lớp toán nhận dạng, xử lý ảnh Hiện giới, sản phẩm nhận dạng ký tự đƣợc triển khai tƣơng đối rộng rãi Tuy nhiên sản phẩm nhận dạng ký tự tiếng Anh, nhận dạng ký tự tiếng Việt có ngƣời Việt Nam phát triển đƣợc Ở nƣớc ta vài năm gần có số sản phẩm nhận dạng tiếng việt đƣợc triển khai thị trƣờng Nhƣng sản phẩm đƣợc bán thị trƣờng dƣới dạng đóng kín nên việc để phát triển thành phần mềm tự động cập nhật ảnh điều Vì nên chọn đề tài: “Tìm hiểu mạng Neural Hamming ứng dụng toán nhận dạng chữ Tiếng Việt” Hệ thống chữ Tiếng Việt đƣợc xây dựng dựa chữ Latinh có thêm chữ ghép dấu phụ Do việc nhận dạng gặp khó khăn so với chữ Latinh thông thƣờng cần phải có thuật toán xử lý đem lại độ xác cao Trong khuôn khổ, thời lƣợng luận văn, đƣa chƣơng trình mô mạng Neural nhận dạng 29 chữ Tiếng Việt từ A đến Y 10 chữ số từ đến Số hóa trung tâm học liệu Footer Page 10 of 126 http://www.lrc.tnu.edu.vn/ Header Page 60 of 126 51 Gán đầu Neural =0 Định vị cắt ảnh với kích cỡ cần thiết Định vị ảnh bƣớc chuyển hóa thành dạng vecto Nếu nhƣ điểm ảnh thứ k ảnh xét mà màu đen (black) giá trị đầu Neural đƣợc cộng thêm trọng số tín hiệu đầu vào từ điểm ảnh k Trong trƣờng hợp ngƣợc lại trừ trọng số tín hiệu đầu vào Giá trị đầu nhận đƣợc qua hàm truyền xác định giá trị đầu Code chƣơng trình thuật toán phần đƣợc xây dựng nhƣ sau : for(int i=0; i=N/2) InputRow[i].fOutput=N/2; } Hình 3.10 Sơ đồ hàm đầu Số hóa trung tâm học liệu Footer Page 60 of 126 http://www.lrc.tnu.edu.vn/ Header Page 61 of 126 52 Tiếp theo ta cần truyền giá trị đầu lớp thứ vào đầu vào lớp thứ danh sách kết nhận dạng trƣớc Code nhƣ sau: float fOutputs[M]; for(int i=0; i

Ngày đăng: 13/05/2017, 12:31

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Hoàng Kiếm, Nguyễn Hồng Sơn, Đào Minh Sơn, “Ứng dụng mạng nơron nhân tạo trong hệ thống xử lý biểu mẫu tự động”, Kỷ yếu hội nghị kỷ niệm 25 năm thành lập Viện Công nghệ Thông tin, 2001, tr. 560-567 Sách, tạp chí
Tiêu đề: Ứng dụng mạng nơron nhân tạo trong hệ thống xử lý biểu mẫu tự động
[3] Lê Hoài Bắc, Lê Hoàng Thái, “Neural Network & Genetic Algorithm in Application to Handwritten Character Recognition”, Tạp chí Tin học và Điều khiển học, Tập 17, số 4, 2001, tr. 57-65 Sách, tạp chí
Tiêu đề: Neural Network & Genetic Algorithm in Application to Handwritten Character Recognition
[4] Nguyễn Thị Thanh Tân, Ngô Quốc Tạo, “Một cấu trúc mạng nơ ron thích hợp cho việc nhận dạng chữ số viết tay”, Kỷ yếu hội thảo FAIR03, NXB KH&KT Hà Nội, 2004, tr. 200-210 Sách, tạp chí
Tiêu đề: Một cấu trúc mạng nơ ron thích hợp cho việc nhận dạng chữ số viết tay
Nhà XB: NXB KH&KT Hà Nội
[5] Nguyễn Thị Thanh Tân, Lương Chi Mai, “Phương pháp nhận dạng từ viết tay dựa trên mô hình mạng nơ ron kết hợp với thống kê từ vựng”, Tạp chí Tin học và Điều khiển học, Tập 22, số 2, 2006, tr. 141-154 Sách, tạp chí
Tiêu đề: Phương pháp nhận dạng từ viết tay dựa trên mô hình mạng nơ ron kết hợp với thống kê từ vựng
[6]. Phạm Anh Phương, Ngô Quốc Tạo, Lương Chi Mai, “Ứng dụng SVM cho bài toán phân lớp nhận dạng”, Kỷ yếu Hội thảo khoa học Quốc gia lần thứ ba về nghiên cứu, phát triển và ứng dụng Công nghệ thông tin và Truyền thông (ICT.rda’06), nhà xuất bản Khoa học và Kỹ thuật, Hà nội, trang 393-400, 20-21/05/2006 Sách, tạp chí
Tiêu đề: Ứng dụng SVM cho bài toán phân lớp nhận dạng”, "Kỷ yếu Hội thảo khoa học Quốc gia lần thứ ba về nghiên cứu, phát triển và ứng dụng Công nghệ thông tin và Truyền thông
Nhà XB: nhà xuất bản Khoa học và Kỹ thuật
[7]. Phạm Anh Phương, Ngô Quốc Tạo, Lương Chi Mai, “Trích chọn đặc trƣng wavelet Haar kết hợp với SVM cho việc nhận dạng chữ viết tay tiếng Việt”, Tạp chí Công nghệ Thông tin và Truyền thông, ISSN 0866- 7039, kỳ 3, số 20, 10-2008, tr 36-42 Sách, tạp chí
Tiêu đề: Trích chọn đặc trƣng wavelet Haar kết hợp với SVM cho việc nhận dạng chữ viết tay tiếng Việt”, "Tạp chí Công nghệ Thông tin và Truyền thông
[8]. Phạm Anh Phương, “Áp dụng một số chiến lược SVM đa lớp cho bài toán nhận dạng chữ viết tay hạn chế”, Tạp chí khoa học Đại học Huế, ISSN 1859-1388, số 45, 2008, tr. 109-118 Sách, tạp chí
Tiêu đề: Áp dụng một số chiến lược SVM đa lớp cho bài toán nhận dạng chữ viết tay hạn chế”, "Tạp chí khoa học Đại học Huế
[9]. Nguyễn Thị Thanh Tân, Lương Chi Mai, “Phương pháp nhận dạng từ viết tay dựa trên mô hình mạng nơ ron kết hợp với thống kê từ vựng”, Tạp chí Tin học và Điều khiển học, Tập 22, số 2, 2006, tr. 141-154.Tiếng Anh Sách, tạp chí
Tiêu đề: Phương pháp nhận dạng từ viết tay dựa trên mô hình mạng nơ ron kết hợp với thống kê từ vựng”, "Tạp chí Tin học và Điều khiển học
[11] I. S. Oh, J. S. Lee, S. M. Choi, K. C. Hong, “Class-expert Approach to Unconstrained Handwritten Numeral Recognition”, in Proc.5th Int.Workshop Frontiers in Handwriting Recognition, pp. 95-102, Essex, England, 1996 Sách, tạp chí
Tiêu đề: Class-expert Approach to Unconstrained Handwritten Numeral Recognition
[12] L. F. C. Pessoa, P. Maragos, “Neural Networks with Hybrid Morphological/Rank/Linear Nodes: A Unifying Framework with Applications to Handwritten Character Recognition”, Pattern Recognition, vol.33, pp. 945-960, 2000 Sách, tạp chí
Tiêu đề: Neural Networks with Hybrid Morphological/Rank/Linear Nodes: A Unifying Framework with Applications to Handwritten Character Recognition
[13] T. Kohonen, “Self Organizing Maps”, Springer Series in Information Sciences, vol.30, Berlin, 1995 Sách, tạp chí
Tiêu đề: Self Organizing Maps
[14] Rabiner L.R - "A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition" - Proceedings of IEEE, VOL.77, NO.2, FEB 1989, pp. 257-286 Sách, tạp chí
Tiêu đề: A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition
[15] M. Y. Chen, A. Kundu, J. Zhou, “Off-line Handwritten Word Recognition Using a Hidden Markov Model Type Stochastic Network”, IEEE Trans. Pattern Recognition and Machine Intelligence, vol.16, pp.481-496, 1994 Sách, tạp chí
Tiêu đề: Off-line Handwritten Word Recognition Using a Hidden Markov Model Type Stochastic Network
[16] M. Y. Chen, A. Kundu, S. N. Srihari, “Variable Duration Hidden Markov Model and Morphological Segmentation for Handwritten Word Recognition”, IEEE Trans. Image Processing, vol.4, pp.1675-1688, 1995 Sách, tạp chí
Tiêu đề: Variable Duration Hidden Markov Model and Morphological Segmentation for Handwritten Word Recognition
[17] A. Kornai, K. M. Mohiuddin, S. D. Connell, “An HMM-Based Legal Amount Field OCR System For Checks”, IEEE Trans, Systems, Man and Cybernetics, pp. 2800-2805, 1995 Sách, tạp chí
Tiêu đề: An HMM-Based Legal Amount Field OCR System For Checks
[18] M. A. Mohamed, P. Gader, “Generalized Hidden Markov Models – Part II: Application to Handwritten Word Recognition”, IEEE Trans. Fuzzy Systems, vol.8, no.1, pp.82-95, 2000 Sách, tạp chí
Tiêu đề: Generalized Hidden Markov Models – Part II: Application to Handwritten Word Recognition
[19] M. A. Mohamed, P. Gader, “Handwritten Word Recognition Using Segmentation-Free Hidden Markov Modeling and Segmentation Based Dynamic Programming Techniques”, IEEE Trans. Pattern Analysis and Machine Intelligence, vol.18, no.5, pp.548-554, 1996 Sách, tạp chí
Tiêu đề: Handwritten Word Recognition Using Segmentation-Free Hidden Markov Modeling and Segmentation Based Dynamic Programming Techniques
[20]. Gorgevik D., Cakmakov D., “An Effcient Three-Stage Classifer for Handwritten Digit Recognition”, Proceedings of 17 th Int. Conference on Pattern Recognition, ICPR2004, Vol. 4, pp. 507-510, IEEE Computer Society, Cambridge, UK, 23-26 August 2004 Sách, tạp chí
Tiêu đề: An Effcient Three-Stage Classifer for Handwritten Digit Recognition”, "Proceedings of 17"th" Int. Conference on Pattern Recognition
[21]. G. Vamvakas, B. Gatos, I. Pratikakis, N. Stamatopoulos, A. Roniotis and S.J. Perantonis, "Hybrid Off-Line OCR for Isolated Handwritten Greek Characters", The Fourth IASTED International Conference on Signal Processing, Pattern Recognition, and Applications (SPPRA 2007), pp. 197- 202, ISBN: 978-0-88986-646-1, Innsbruck, Austria, February 2007 Sách, tạp chí
Tiêu đề: Hybrid Off-Line OCR for Isolated Handwritten Greek Characters
[22]. Pham Anh Phuong, Ngo Quoc Tao, Luong Chi Mai, “An Effcient Model for Isolated Vietnamese Handwritten Recognition”, The Fourth International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIH-MSP 2008), Harbin, China, August 15 - 17, 2008, pp. 358-361 Sách, tạp chí
Tiêu đề: An Effcient Model for Isolated Vietnamese Handwritten Recognition”, "The Fourth International Conference on Intelligent Information Hiding and Multimedia Signal Processing

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w