1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt

20 1K 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt được chia làm 3 chương chính. Chương 1: Tổng quan về hiện trạng các bài toán nhận dạng và thiết lập bài toán nghiên cứu; Chương 2: Tìm hiểu về mạng Neural và khoảng cách Hamming; Chương 3: Ứng dụng mạng neural Hamming trong bài toán nhận dạng các chữ cái Tiếng Việt.

LUẬN VĂN TỐT NGHIỆP CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH Đề tài: “Tìm hiểu mạng Neural Hamming ứng dụng toán nhận dạng chữ Tiếng Việt” Sinh viên: Phùng Văn Kiệm Lớ p : Cao học k10b Giáo viên hướng dẫn: TS Lê Quang Minh PHẦN MỞ ĐẦU Từ lâu nhà khoa học nhận thấy ưu điểm óc người tìm cách bắt chước để thực máy tính, tạo cho có khả học tập, nhận dạng phân loại Vì v ậy nhà khoa học nghiên cứu sáng tạo mạng Neural nhân tạo Nó th ực s ự đ ược ý nhanh chóng trở thành hướng nghiên cứu đầy triển vọng đặc biệt lĩnh vực nhận dạng Và toán nhận dạng ký tự toán lớp toán nhận dạng, xử lý ảnh Hiện giới, sản phẩm nhận dạng ký tự triển khai tương đối rộng rãi Tuy nhiên sản phẩm nhận dạng ký tự tiếng Anh, nhận dạng ký tự tiếng Việt ch ỉ có người Việt Nam phát triển Ở nước ta vài năm gần có số sản phẩm nhận dạng tiếng việt tri ển khai thị trường Nhưng sản phẩm bán thị trường dạng đóng kín nên việc để phát triển thành phần mềm tự động cập nhật ảnh điều khơng thể Vì nên tơi chọn đề tài “Tìm hiểu mạng Neural Hamming ứng dụng toán nh ận d ạng ch ữ Tiếng Việt” Hệ thống chữ Tiếng Việt xây dựng dựa chữ Latinh có thêm chữ ghép dấu phụ Do việc nhận dạng gặp khó khăn so với chữ Latinh thơng thường cần phải có thuật tốn xử lý đem lại độ xác cao Trong khn khổ, thời lượng luận văn, đưa chương trình mơ mạng Neural nhận dạng 29 chữ Tiếng Việt từ A đến Y 10 chữ số từ đến Luận văn xếp chia thành chương chính: - Chương 1: Tổng quan trạng toán nhận dạng thi ết lập toán nghiên cứu; - Chương 2: Tìm hiểu mạng Neural khoảng cách Hamming; - Chương 3: Ứng dụng mạng neural Hamming toán nhận d ạng chữ Tiếng Việt Nhân đây, xin chân thành cảm ơn TS Lê Quang Minh người trực tiếp hướng dẫn, bảo nhiệt tình cho tơi hồn thành luận văn Tơi xin chân thành cám ơn thầy cô Trường Đại học CNTT & TT Đại học Thái Nguyên toàn thể bạn giúp đỡ tơi hồn thành luận văn CHƯƠNG I: TỔNG QUAN VỀ HIỆN TRẠNG CÁC BÀI TOÁN NHẬN DẠNG VÀ THIẾT LẬP BÀI TOÁN NGHIÊN CỨU 1.1 Tổng quan toán nhận dạng Nhận dạng chữ lĩnh vực quan tâm nghiên c ứu ứng dụng từ nhiều năm theo hai hướng chính: • Nhận dạng chữ in: phục vụ cho cơng việc tự động hóa đọc tài liệu, tăng tốc độ hiệu nhập thông tin vào máy tính trực tiếp từ nguồn tài liệu • Nhận dạng chữ viết tay: với mức độ ràng buộc khác cách viết ,kiểu chữ phục vụ cho ứng dụng đọc xử lý chứng từ, hóa đơn, phiếu ghi, thảo viết tay Nhận dạng chữ viết tay tách thành hai hướng phát triển: nhận dạng chữ viết tay trực tuyến (on-line) nhận dạng chữ viết tay ngoại tuyến (off-line) Đến thời điểm này, toán nhận dạng chữ in giải gần trọn vẹn (sản phẩm FineReader 11 hãng ABBYY có th ể nhận dạng chữ in theo 20 ngơn ngữ khác có Việt Nam, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 Viện Cơng nghệ Thơng tin Hà Nội nhận dạng tài liệu chứa hình ảnh, bảng văn tiếng Việt với độ xác 99%, ) Tuy nhiên th ế giới Việt Nam, toán nhận dạng chữ viết tay vấn đề thách thức lớn nhà nghiên cứu Bài toàn chưa th ể giải trọn vẹn phụ thuộc q nhiều vào ng ười vi ết s ự bi ến đổi đa dạng cách viết trạng thái tinh th ần c ng ười viết Đặc biệt việc nghiên cứu nhận dạng chữ viết tay ti ếng Việt lại gặp nhiều khó khăn ký tự tiếng Việt có thêm phần dấu, dễ nhầm lẫn với nhiễu 1.2 Cụ thể toán nhận dạng chữ Tiếng Việt Hiện có nhiều báo đề cập đến tốn nh ận d ạng kí tự quang học, nhằm cải tiến phương pháp phân đoạn ảnh, nh ận dạng Song chưa giải cách triệt để vấn đề khó khăn toán thường gặp phải Đặc biệt việc nh ận dạng kí tự tiếng Việt, gặp nhiều khó khăn, tính riêng biệt tiếng Việt: Số kí tự nhiều, kí tự lại có dấu…Nên tốn cịn thu hút quan tâm, nghiên cứu nhằm giải vấn đề khó khăn c toán cách triệt để Một số hệ nhận nhận dạng văn áp dụng nhiều vào ứng dụng FineReader hãng AABBYY, OmmiPage hãng Scansoft dùng để nhận dạng văn tiếng Anh,… VNDOCR Viện công ngh ệ thông tin cho văn tiếng Việt Nhìn chung, sản phẩm phần mềm nhận dạng văn b ản Ti ếng Việt chữ in nước ta thu kết kh ả quan, đặc bi ệt ph ần mềm VNDOCR sử dụng rộng rãi quan nhà nước Riêng phần nhận dạng kí tự viết tay nghiên cứu phát triển nhằm phục vụ cho yêu cầu khác đọc xử lý biểu mẫu: hóa đơn, phiếu điều tra Khó khăn lớn nghiên cứu toán nh ận d ạng ch ữ tiếng Việt biến thiên đa dạng cách viết t ừng người Cùng người viết đơi có nhi ều s ự khác biệt cách viết tuỳ thuộc vào ngữ cảnh, ki ểu vi ết c m ột người thay đổi theo thời gian theo thói quen Đi ều gây nhiều trở ngại việc nhận dạng lựa chọn mơ hình nhận dạng 1.3 Thiết lập tốn Đề tài mà thực là: “Ứng dụng mạng Neural Hamming toán nhận dạng chữ Tiếng Việt”, cơng việc “Xây d ựng chương trình nhận dạng chữ Tiếng Việt” ý tưởng tốn nh sau:  Phân tích ảnh cho ký tự: Chia ảnh tách ký tự theo t ừng vùng gi ới hạn;  Chuyển đổi kí tự sang ma trận điểm ảnh;  Chuyển thành ma trận tuyến tính đưa vào mạng neural;  Đưa vào mạng neural tính giá trị đầu Các bước giải toán sử dụng mạng neural Hamming nhận dạng chữ Tiếng Việt mơ tả theo tiến trình chung sau: Ảnh đầu vào Tiề xử lý n Quá trình biế đổi ảnh n Nhận dạng Kế t Hình Sơ đồ hệ thống nhận dạng 1.3.1 Ảnh đầu vào Với đầu vào file ảnh * bmp có kích cỡ ảnh 150 x 150 Sau nạp mẫu cần nhận dạng ta tiến ảnh thao tác x lý ảnh đ ể tách ký tự Ta xác định ký tự dựa vào đường biên ký t ự Trải qua bươc tiền xử lý ảnh: lọc mịn ảnh, nhị phân, chỉnh nghiêng, chuẩn kích thước, lấp khoảng trống, lấy biên, ta thu ảnh ký tự với biên 1.3.2 Tiền sử lý Giai đoạn góp phần làm tăng độ xác phân lớp hệ thống nhận dạng, nhiên làm cho tốc độ nh ận d ạng c h ệ thống chậm lại Vì vậy, tùy thuộc vào chất lượng ảnh quét vào văn cụ thể để chọn một vài chức khối N ếu cần ưu tiên tốc độ xử lý chất lượng máy qt tốt có th ể bỏ qua giai đoạn Khối tiền xử lý bao gồm số chức năng: Nhị phân hóa ảnh, lọc nhiễu, chuẩn hóa kích thước ảnh, làm trơn biên chữ, làm đầy chữ, làm mảnh chữ xoay văn 1.3.2.1 Nhị phân hóa ảnh Nhị phân hóa ảnh kỹ thuật chuyển ảnh đa cấp xám sang ảnh nhị phân Trong tốn phân tích nâng cao chất lượng ảnh nào, cần thiết để xác định đối tượng quan trọng Nhị phân hóa ảnh phân chia ảnh thành ph ần: ph ần phần chữ Hầu hết phương pháp nhị phân hóa ảnh lựa chọn ngưỡng thích hợp theo c ường đ ộ sáng ảnh sau chuyển tất giá tr ị độ sáng l ớn h ơn ngưỡng thành giá trị độ sáng (ví dụ “trắng”) t ất giá trị bé ngưỡng thành giá trị độ sáng khác (“đen”) Hình 1.2 Nhị phân hóa ảnh 1.3.2.2 Lọc nhiễu Nhiễu tập điểm sáng thừa ảnh Khử nhiễu vấn đề thường gặp nhận dạng, nhiễu có nhiều loại (nhi ễu đ ốm, nhiễu vệt, nhiễu đứt nét ) Để khử nhiễu đốm (các nhiễu với kích thước nhỏ), sử dụng phương pháp lọc (lọc trung bình, lọc trung vị )- Tuy nhiên, với nhiễu vệt (hoặc nhiễu có kích th ước l ớn) phương pháp lọc tỏ hiệu quả, trường họp sử dựng phương pháp khử vùng liên thơng nhỏ tỏ có hiệu Hình 1.3 Nhiễu đốm nhiễu vệt 1.3.2.3 Chuẩn hóa kích thước ảnh Hình 1.4.Chuẩn hóa kích thước ảnh ký tự “A” “P” Việc chuẩn hóa kích thước ảnh dựa việc xác định trọng tâm ảnh, sau xác định khoảng cách lớn từ tâm ảnh đến c ạnh trên, dưới, trái, phải hình chữ nhật bao quanh ảnh Thông qua khoảng cách lớn đó, xác định tỷ lệ co, giãn ảnh gốc so với kích thước xác định, từ hiệu ch ỉnh kích th ước ảnh theo tỷ lệ co, giãn Như vậy, thuật toán chuẩn hóa kích th ước ảnh ln ln đảm bảo tính cân co giãn ảnh, ảnh không bị biến dạng bị lệch 1.3.2.4 Làm trơn biên chữ Đôi chất lượng quét ảnh xấu, đường biên chữ khơng cịn giữ dáng điệu trơn tru ban đầu mà hình thành đường cưa giả tạo Trong trường họp này, phải dùng thuật toán làm trơn biên để khắc phục [28] (a) (b) Hình 1.5.(a) Ảnh gốc, (b) Ảnh sau làm trơn biên 1.3.2.5 Làm đầy chữ Chức áp dụng với ký tự bị đứt nét cách ngẫu nhiên Ảnh đứt nét gây khó khăn cho việc tách chữ, dễ bị nhầm hai phần liên thông ký tự thành hai ký tự riêng bi ệt, t ạo nên sai l ầm trình nhận dạng 1.3.2.6 Làm mảnh chữ Đây bước quan trọng nhằm phát khung xương ký tự cách loại bỏ dần điểm biên ngồi nét Tuy nhiên, q trình làm mảnh chữ nhạy cảm với việc khử nhiễu Hiện có nhiều phương pháp làm mảnh chữ, thuật tốn tìm xương tham khảo [28] Hình 1.4 Làm mảnh chữ 1.3.2.7 Điều chỉnh độ nghiêng văn Do trang tài liệu quét vào không cẩn thận s ự cố in ấn, hàng chữ bị lệch so với lề chuẩn góc α, điều gây khó khăn cho cơng đoạn tách chữ, tách Trong trường hợp vậy, phải tính lại tọa độ điểm ảnh chữ bị sai l ệch Có nhiều kỹ thuật để điều chỉnh độ nghiêng, kỹ thuật phổ biến dựa sở biểu đồ chiếu (projection profile) ảnh tài liệu; số kỹ thuật dựa sở phép biến đổi Hough Fourier, s ố k ỹ thuật hiệu chỉnh độ nghiêng khác tìm thấy [28] Hình 1.7.Hiệu chỉnh độ nghiêng văn Quá trình biến đổi ảnh Một số phương pháp biến đổi khai triển chuỗi thường áp dụng lĩnh vực nhận dạng chữ: 1.3.3.1 Biến đổi Fourier Một tính chất bật phép bi ến đ ổi Fourier khả nhận dạng ký tự có thay đổi tư khác nhau, phép biến đổi áp dụng để nhận dạng ký tự theo nhiều cách khác [29,30] 1.3.3.2 Biến đổi Wavelet Phép biến đổi dãy kỹ thuật khai triển cho phép mô tả đặc trưng ảnh mức độ khác Các công đoạn tách ch ữ thành ký tự từ mô tả hệ so wavelet theo mức độ khác giải pháp Sau h ệ so wavelet chuyển qua máy phân lớp để phục vụ cho việc nhận dạng [31,32] 1.3.3.3 Phương pháp mô men Theo phương pháp này, ảnh gốc thay tập đặc trưng vừa đủ để nhận dạng đối tượng bất biến phép thay đổi tỷ lệ, tịnh tiến quay [33] Các mô men đ ược xét dãy khai triển đặc trưng ảnh gốc xây dựng lại cách đầy đủ từ hệ số mô men 1.3.3.4 Khai triển Karhunent-Loeve Việc khai triển nhằm phân tích véc tơ riêng để rút gọn số chiều tập đặc trưng cách tạo đặc trưng tổ hợp tuyến tính đặc trưng gốc Đây phép biến đổi tối ưu số giới hạn việc nén thơng tin [34], Khai tri ển Karhunent-Loeve dùng số toán nhận dạng mẫu nh nhận dạng mặt người, sử dụng h ệ th ống OCR c Viện Công nghệ Tiêu chuẩn Quốc gia Hoa Kỳ (NIST - National Institute of Standards and Technology of the United States) Vì vi ệc khai triển địi hỏi phải sử dụng thuật tốn có khối lượng tính tốn lớn nên việc sử dựng đặc trưng Karhunent-Loeve toán nhận dạng chữ không phổ biến rộng rãi Tuy nhiên, để tăng tốc độ tính tốn cho máy phân lớp, đặc trưng trở nên thiết thực cho hệ nhận dạng chữ năm gần 1.3.4 Nhận dạng Có nhiều phương pháp nhận dạng mẫu khác áp dụng rộng rãi hệ thống nhận dạng chữ viết tay Các phương pháp tích hợp hướng tiếp cận sau: Đ ối sánh m ẫu, thống kê, cấu trúc, SVM mạng nơ ron 1.3.4.1 Đối sánh mẫu Kỹ thuật nhận dạng chữ đơn giản dựa sở đối sánh nguyên mẫu (prototype) với để nhận dạng ký tự t Nói chung, tốn tử đối sánh xác định mức độ giống hai vé tơ (nhóm điểm, hình dạng, độ cong ) không gian đặc trưng Các kỹ thuật đối sánh nghiên cứu theo ba hướng sau: Đối sánh trực tiếp: Một ký tự đầu vào ảnh đa cấp xám ảnh nhị phân so sánh trực tiếp với tập mẫu chuẩn lưu trữ Việc so sánh dựa theo độ đo s ự t ương đ ồng (ch ẳng hạn độ đo Euclide) để nhận dạng Các kỹ thuật đối sánh đơn giản việc so sánh - ph ức t ạp h ơn nh phân tích định [50,51] Mặc dù phương pháp đối sánh trực tiếp đơn giản có sở tốn học vững kết nh ận dạng nhạy cảm với nhiễu Các mẫu biến dạng Đổi sánh mềm: Một phương pháp đối sánh khác sử dụng mẫu biến dạng, phép biến dạng ảnh dùng để đối sánh ảnh chưa biết với sở liệu ảnh biết [52] Ý tưởng đối sánh mềm đối sánh cách tối ưu mẫu chưa biết với tất mẫu mà mẫu có th ể kéo giãn co lại Chỉ không gian đặc trưng thành lập, véc tơ chưa biết đối sánh cách sử dựng quy hoạch động hàm biến dạng [53,54] Đối sánh giảm nhẹ: Đây kỹ thuật đối sánh ảnh mức độ tượng trưng, kỹ thuật sử dựng hình dáng đặc trưng ảnh ký tự Thứ nhất, vùng đối sánh nhận biết Sau đó, sở số vùng đối sánh đánh giá tốt, phần tử ảnh so sánh với vùng đối sánh Công việc đòi h ỏi m ột k ỹ thu ật tìm kiếm khơng gian đa chiều để tìm cực đại toàn cục số hàm [55] Các kỹ thuật đối sánh mẫu áp dựng tốt nhận dạng chữ in, chữ viết tay kỹ thuật tỏ hiệu 1.3.4.2 Phương pháp tiếp cận cấu trúc Cách tiếp cận phương pháp dựa vào việc mô tả đối tượng nhờ số khái niệm biểu diễn đối tượng sở ngôn ngữ tự nhiên Để mô tả đối tượng người ta dùng số dạng nguyên thu ỷ đoạn thẳng, cung, Mỗi đối tượng mô tả kết họp dạng nguyên thuỷ Các quy tắc kết họp dạng nguyên thuỷ xây dựng giống việc nghiên cứu văn phạm ngơn ngữ, q trình định nhận dạng q trình phân tích cú pháp [57,58] Ph ương pháp đặt vấn đề để giải toán nhận dạng chữ tổng quát Tuy vậy, nhiều vấn đề liên quan đến h ệ nh ận dạng cú pháp chưa giải độc lập chưa xây dựng thuật toán phổ dụng Hiện nay, nhận dạng theo cấu trúc ph ổ biến trích trọn đặc trưng mẫu học, phân hoạch bảng ký tự dựa đặc trưng này, sau ảnh cần nhận dạng trích chọn đặc trưng, sau so sánh bảng phân hoạch để t ìm ký tự có đặc trưng phù hợp Đối với nhận dạng chữ viết tay rời rạc dựa theo cấu trúc xương đường biên, cơng việc địi hỏi phải xây dựng đặc trưng chữ, đặc biệt đặc trưng điểm uốn, điểm gấp khúc đ ặc trưng nét Sau tiến hành công đoạn tiền xử lý, công vi ệc tách nét tiến hành thơng qua điểm chạc Sau trích ch ọn đặc trưng cấu trúc xương chữ, nét đặc trưng cặp ch ỉ s ố đầu cuối tương ứng với thứ tự điểm chạc đầu điểm chạc cuối Cuối xây dựng tìm kiếm, dựa vào đặc trưng cấu trúc xương cấu trúc biên để phân tập mẫu học thành lớp Quá trình tìm kiếm để phân lớp tiến hành qua hai bước: Xác định lớp tương ứng với mẫu vào tìm kiếm lớp mẫu gần giống với mẫu vào [62,63] Các phương pháp cấu trúc áp dụng cho toán nhận dạng chữ phát triển theo hai hướng sau: 1.3.4.2.1 Phương pháp ngữ pháp (Grammatical Methods) Giữa thập niên 1960, nhà nghiên cứu bắt đầu xét luật ngơn ngữ học để phân tích tiếng nói chữ viết Sau đó, luật đa dạng tả, từ vựng ngơn ngữ học áp dụng cho chiến lược nhận dạng Các phương pháp ngữ pháp khởi tạo số luật sinh để hình thành ký tự từ tập cơng th ức ng ữ pháp nguyên thủy Các luật sinh kết nối ki ểu đặc tr ưng thống kê đặc trưng hình thái s ố cú pháp ho ặc lu ật ngữ nghĩa [56,57,58] Giống lý thuyết ngôn ngữ, luật sinh cho phép mô tả cấu trúc câu chấp nhận trích ch ọn thông tin theo ngữ cảnh chữ viết cách sử dụng kiểu ngữ pháp khác [59] Trong phương pháp này, việc huấn luyện thực cách mô tả ký tự văn phạm Gi Cịn pha nhận dạng chuỗi, đồ thị đơn vị viết (ký t ự, từ câu) phân tích để định văn phạm mẫu thuộc lớp Các phương pháp ngữ pháp hầu hết sử dụng giai đoạn hậu xử lý để sửa lỗi mà khối nhận dạng th ực hi ện sai [60,61] 1.3.4.2 Phương pháp đồ thị (Graphical Methods) Các đơn vị chữ viết mô tả đồ thị Các dạng nguyên thủy ký tự (các nét) lựa chọn h ướng tiếp cận cấu trúc Đối với lớp, đồ thị thành lập giai đoạn huấn luyện để mô tả nét, ký tự t Giai đoạn nhận dạng gán đồ thị chưa biết vào lớp cách sử dụng độ đo để so sánh đặc điểm giống đồ thị Có nhiều hướng tiếp cận khác sử dụng phương pháp đồ thị, tiêu biểu hướng tiếp cận đồ thị phân cấp dùng việc nhận dạng chữ viết tay Trung Quốc Hàn Quốc [62,63] 1.3.4.3 Mơ hình Markov ẩn (HMM - Hidden Markov Model) HMM mơ hình xác suất hữu hạn trạng thái theo kiểu phát sinh tiến trình cách định nghĩa xác suất liên kết chuỗi quan sát Mỗi chuỗi quan sát sinh chuỗi phép chuyển trạng thái, trạng thái khởi đầu thu đ ược trạng thái kết thúc Tại trạng thái ph ần tử chuỗi quan sát phát sinh ngẫu nhiên trước chuyển sang trạng thái Các trạng thái HMM xem ẩn bên mơ hình t ại thời điểm nhìn thấy kí hiệu quan sát trạng thái chuyển đổi trạng thái vận hành ẩn bên mơ hình [70] HMM áp dụng rộng rãi toán nh ận dạng chữ viết tay mức từ [71,72,73,74,75] 1.3.4.4 Máy véc tơ tựa (SVM) Các kết chủ yếu lĩnh vực tập trung tập liệu chữ số viết tay chuẩn USPS MNIST [5.3,5.1,87], bên c ạnh có số cơng trình nghiên cứu hệ chữ tiếng La tinh, Hy Lạp, Trung Quốc, Việt Nam nhiên k ết qu ả đ ạt đ ược nhiều hạn chế [88,89,5.2,5.4] SVM áp dụng rộng rãi lĩnh khai phá liệu thị giác máy tính SVM gốc thiết kế để giải toán phân lớp nh ị phân, ý tưởng phương pháp tìm siêu phẳng phân cách cho khoảng cách lề hai lớp đạt cực đại Kho ảng cách xác định véc tơ tựa (SV - Support Vector), sv lọc từ tập mẫu huấn luyện cách giải toán tối ưu lồi [5.1] 1.3.4.5 Mạng nơ ron Một mạng nơ ron định nghĩa cấu trúc tính tốn bao gồm nhiều xử lý “nơ ron” kết nối song song chằng chịt với Do chất song song nơ ron nên thực tính tốn với tốc độ cao so với kỹ thuật phân l ớp khác M ột mạng nơ ron chứa nhiều nút, đầu nút s dụng cho nút khác mạng hàm định cuối phụ thuộc vào tương tác phức tạp nút Mặc dù nguyên lý khác nhau, hầu hết kiến trúc mạng nơ ron tương đương với phương pháp nhận dạng mẫu thống kê [26,27] Các kiến trúc mạng nơ ron phân thành hai nhóm chính: mạng truyền thẳng mạng lan truyền ngược Trong hệ thống nhận dạng chữ, mạng nơ ron sử dụng phổ biến mạng perceptron đa lớp thuộc nhóm mạng truyền thẳng mạng SOM (Self Origanizing Map) Kohonen thuộc nhóm mạng lan truyền ngược Mạng perceptron đa lớp đề xuất Rosenblatt [64] nhiều tác giả sử dụng hệ nhận dạng chữ viết tay [65,66] Hầu hết nghiên cứu phát triển nhận dạng chữ viết tay tập trung vào mạng SOM [67] SOM kết hợp trích ch ọn đặc trưng nhận dạng tập lớn ký tự huấn luy ện Mạng ch ứng t ỏ tương đương với thuật toán phân cụm k-means Với thuật toán đơn giản hiệu quả, với thành công mô hình ứng dụng thực tiễn, mạng nơ ron hi ện hướng nghiên cứu lĩnh vực học máy Mạng nơ ron tỏ phù hợp với toán đối sánh, phân loại mẫu, xấp x ỉ hàm, t ối ưu hoá, lượng tử hố véc tơ phân hoạch khơng gian liệu, phương pháp truyền thống không đủ khả giải vấn đề nêu cách hiệu Đặc biệt hệ th ống nh ận dạng sử dụng mạng nơ ron đạt tỉ lệ nhận dạng xác, so sánh với phương pháp nhận dạng cấu trúc, thống kê, 1.3.5 Kết Sau trải qua trình tiền xử lý mẫu ảnh cần nhận dạng thu gọn với kích cỡ 60x30 đến trình ánh xạ giá tr ị pixel ảnh vào Bước quan trọng cuối nhận dạng cho kết 1.4 Kết luận Nội dung chương trình bày tốn nhận dạng nói chung nhận dạng chữ nói riêng giới Vi ệt Nam: Những ứng dụng áp dụng thực tế; số kết coi thành công Và thiết lập nội dung toán xây dựng luận văn Từ thiết lập toán để giải toán nhận dạng chữ với ưu điểm đơn giản thuật toán hiệu qủa, với thành công ứng dụng thực tiễn Tôi chọn phương pháp nhận dạng chữ sử dụng mạng nơ ron nhân tạo làm định hướng tập trung nghiên cứu luận án CHƯƠNG II: TÌM HIỂU MẠNG NEURAL VÀ MẠNG HAMMING 2.1 Mạng neural 2.1.1 Khái niệm mạng neural 2.1.1.1 Tìm hiểu Neural 2.1.1.1.1 Neural sinh học: Một neural cấu gồm thành phần sau: Dendrite, Soma, Synapse, Axon hình 1.1 ... Tổng quan trạng toán nhận dạng thi ết lập toán nghiên cứu; - Chương 2: Tìm hiểu mạng Neural khoảng cách Hamming; - Chương 3: Ứng dụng mạng neural Hamming toán nhận d ạng chữ Tiếng Việt Nhân đây,... nhận dạng lựa chọn mơ hình nhận dạng 1.3 Thiết lập tốn Đề tài mà thực là: ? ?Ứng dụng mạng Neural Hamming toán nhận dạng chữ Tiếng Việt? ??, cơng việc “Xây d ựng chương trình nhận dạng chữ Tiếng Việt? ??... tài ? ?Tìm hiểu mạng Neural Hamming ứng dụng toán nh ận d ạng ch ữ Tiếng Việt? ?? Hệ thống chữ Tiếng Việt xây dựng dựa chữ Latinh có thêm chữ ghép dấu phụ Do việc nhận dạng gặp khó khăn so với chữ

Ngày đăng: 11/10/2014, 16:05

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w