... th c hiện chỉ phụ thu c vào kích thƣ c của ảnh mà không phụ thu c vào c u tr c của tài liệu - Hiệu quả cao với cc loại tài liệu cc u tr c ph c tạp. - Hiệu quả cao với cc loại tài liệu c ... lại c quy c ch đ c kh c biệt (nhƣ đ c từ phải qua trái, trên xuống). Tập hợp tất ccc yếu tố logic và ch c năng trong một tài liệu và mối quan hệ giữa chúng đƣ c gọi là c u tr c logic c a ... kh c nhau nhƣ cc block, lines, words, figures, tables và background. Ta c thể gọi cc vùng này theo ch c năng c a nó trong tài liệu ho c gán cho nó ccnhãn logic nhƣ sentences, titles, captions,...
... tách cc ký tự c dấu thành cc phần rời nhau. Sau đó chúng tôi xây dựng cc máy phân lớp SVM để nhận dạng cho từng phần chữ và dấu. Cc kết quả th c nghiệm cho thấy mô hình nhậndạngc a chúng ... trên c sở đó sẽ tiến hành tách ảnh thành phần chữ và phần dấu để phân lớp đ c lập, cuối c ng ghép nối cc kết quả phân lớp c a phần chữ và phần dấu để c đư c kết quả nhậndạng cuối c ng. Cc ... HÌNH NHẬNDẠNGCHỮVIỆTVIẾT TAY HẠN CHẾ Trong phần này, chúng tôi sẽ trình bày chi tiết kiến tr c của mô hình nhậndạngchữViệtviết tay hạn chế (Hình 2). 1. Tiền xử lý M c đích c a giai...
... kh c nhau - Nhậndạngccc file vào là PDF - Nhậndạng đƣ ccc trang c nhiều loại font, kiểu font ho c có nền là ảnh mầu - Một số hạn chế chính: - Chƣa hiệu quả với cc ảnh tài liệu cc u ... mà cc nhà khoa h c máy tính muốn đạt đƣ c đó là khả năng nhận dạng và lĩnh v cnhậndạng thu đƣ c nhiều thành c ng nhất là nhậndạng ký tự quang OCR–Optical Character Recognition. OCR c thể ... bản, đề m c, hearder,… Bƣ c này là c sở cho vi cnhậndạng ký tự. - Vi c x c định đƣ c vị trí chính x c của mỗi vùng trong c u tr c logic sẽ tăng thêm thông tin cho quá trình nhậndạng nhƣ...
... tách ảnh thành phần chữ và phần dấu để phân lớp đ c lập, cuối c ng ghép nối cc kết quả phân lớp c a phần chữ và phần dấu để c đư c kết quả nhậndạng cuối c ng. Cc kết quả th c nghiệm c a ... HÌNH NHẬNDẠNGCHỮVIỆTVIẾT TAY HẠN CHẾ Trong phần này, chúng tôi sẽ trình bày chi tiết kiến tr c của mô hình nhậndạngchữViệtviết tay hạn chế (Hình 2). 1. Tiền xử lý M c đích c a giai ... trung trên cc tập dữ liệu chữ số viết tay như USPS và MNIST [4,5,6], một số kết quả kh c mở rộng đối với ccchữc i hệ La tinh, Hy lạp [2,7]. Đ c biệt đối với vi cnhậndạng chữ viết tay...
... Cc tính chất cc bộ và toàn cc kh c nhau c a cc ký tự c thể đư c biểu diễnbằng cc đ c trưng hình h c và hình thái. Cc kiểu đ c trưng này c ng c thể giải mãmột số tri th c về c u tr c ... cc cấu tr c nguyên thủy (c c đoạn thẳng, cc cung) là cc nét tạo ra ký tự. C c ký tự và cc từ c thể đư c mô tả bằng c ch trích chọn và đếm nhiều loại đ c trưng về hình thái như cc điểm cc ... một dãy cc kỹ thuật khai triển cho phép môtả đ c trưng c a ảnh ở cc m c độ kh c nhau. Cc công đoạn tách chữ thành cc kýtự ho c từ đư c mô tả bằng cc hệ số wavelet theo cc m c độ kh c nhau...
... gồm cc nét chữ, cc nét này là cc đoạn thẳng c hướng, cc cung ho ccc đường cong. Hướng c a cc nét đóng vai trò quan trọng trong vi c so sánh sự kh c nhau giữa cc ký tự. Cc ký tự đư c ... ngữ, cc luật sinh cho phép mô tả cc cấu tr c câu c thể chấp nhận đư c và trích chọn thông tin theo ngữ c nh về chữviết bằng c ch sử dụng c c kiểu ngữ pháp kh c nhau [59].Trong cc phương ... đ c trưng trừu tượng, cc nút c a đồ thị tương ứng với c c nét chữ và cc cạnh c a đồ thị tương ứng với cc mối quan hệ giữa cc nét chữ [44]. C y c ng c thể dùng để biểu diễn cc từ và c c...
... biểu cc u tr c ph c tạp Nhận dạngcc công th c Nhận dạngcc công th c Nhận dạngcc trang cc u tr c ph c tạp Nhận dạngcc trang cc u tr c ph c tạp Nhận dạngchữviết tay Nhận dạngchữ ... ) Nhận dạngcc phông chữ kh c nhau (in nghiêng, đậm, gạch dưới, ) Nhận dạngcc phông chữ kh c nhau (in nghiêng, đậm, gạch dưới, ) Nhận dạngcc bảng biểu cc u tr c ph c tạp Nhận dạngcc ... kiểu chữ kh c nhau nhờ quá trình h c thêm cc kiểu Bổ xung thêm cc kiểu chữ kh c nhau nhờ quá trình h c thêm cc kiểu chữ mới. chữ mới. c c ch c năng chính c c ch c năng chính pNÇn...
... neuron và bài toán nhậndạngchữviết tay tiếng Việt, em đã đề xuất một giải pháp kh c ph c đư c những khó khăn c a bài toán và c i đặt đư c hệ th c nghiệm nhậndạngchữviết tay tiếng Việt ... loại đúng cc kí tự thu c nhóm này. Sau khi huấn luyện xong cc mạng (thu đư c bộ tham số phù hợp cho từng mạng), ta c n ghép cc mạng lại theo đúng c u tr c của phân nhóm kí tự để c hệ thống ... toán nhậndạngchữviết tay tiếng Việt (91.62% là rất lớn so với 76.40%). Ngoài ra, sau khi lựa chọn phương pháp trích chọn đ c trưng phù hợp cho từng nhóm kí tự, tỷ lệ nhậndạng đúng c a...
... quay cho kết quả c độ chính x c tương đối tốt, đồng thời c t c độ th c hiện cao, thích hợp với bài toán nhậndạngchữviết tay. Em đã lựa chọn phương pháp này để th c hiện c i đặt. 3. Tách ... vi c phân tách trang văn bản thành cc dòng, sau đó tách cc dòng thành cc từ riêng biệt. Để th c hiện vi c phân tách văn bản thành c c dòng, đầu tiên em th c hiện x c định cc ... chúng ta nhận đư c một trang văn bản đã đư c khôi ph c và tăng c ờng chất lượng. Trang văn bản chúng ta nhận đư c thường c rất nhiều vùng miền kh c nhau, c n phải th c hiện vi c phân tách...
... 13 - cho cc hệ nhậndạng kh c nhau (bằng mô hình mạng neuron, SVM, hay Markov,…), một c ch tổng quát nhất chúng ta c n tiến hành trích chọn đ c trưng cho cc nhóm sau: • Trích chọn đ c trưng ... nghiên c u về trích chọn đ c trưng và bài toán nhậndạngchữviết tay tiếng Việt, em đã đề xuất một giải pháp kh c ph c đư c những khó khăn c a bài toán và c i đặt đư c hệ th c nghiệm nhậndạng ... biệt cc dấu. Khi đã phân biệt đư c dấu, chúng ta sẽ phân biệt đư c c kí tự. • Trích chọn đ c trưng cho cc nhóm kí tự không dấu: c nhiệm vụ tìm ra những đ c trưng riêng c a cc kí tự...
... TOÁN NHẬNDẠNGCHỮVIẾT TAY 2.2.1 Tình hình chung về nhậndạngchữviết tay Bài toán nhậndạngchữviết tay đư c ứng dụng rất nhiều trong th c thế : đư c tích hợp vào hệ thống nhậndạng ... hết s c quan trọng để giải quyết bài toán nhậndạng chữ viết tay. Th c chất quá trình trích chọn đ c trưng c a chữviết tay t c là ta đi tìm c c đại lượng để biểu diễn cho cc ký tự viết tay, ... thông tin về nét chữ như thứ tự nét viết, hướng và t c độ c a nét viết trong khi nó đang đư c viết. C n nhậndạng offline t c là vi cnhậndạng đư c th c hiện sau khi chữ đã đư cviết hay in lên...
... Luận văn đư c bố cc thành 5 chương. Chương 1 giới thiệu về nhậndạngchữviết tay. Chương 2 giới thiệu về SVM. Chương 3 sự c n thiết c a SVM vào vi cnhậndạngchữviết tay. Chương 4 bộ ... SVM. Chương 5 ứng dụng c a SVM vào nhậndạngchữviết tay. References Tiếng Việt 1. Phạm Anh Phương (2008), “Áp dụng một số chiến lư c SVM đa lớp cho bài toán nhận dạngchữviết tay hạn chế”, ... Tạp chí khoa h c đại h c Huế, ISSN 1859-1388, số 45, 109-118. 2. Phạm Anh Phương, Ngô Qu c Tạo, Lương Chi Mai (2008), “Trích chọn đ c trưng wavelet Haar kết hợp với SVM cho vi cnhậndạng chữ...
... C c điểm ch c: Một ký tự sẽ đư c tách thành cc nét thông qua cc điểm ch c (là điểm chung c a cc nét ho c là điểm đầu mút c a nét). Trư c tiên c n chọn một số điểm ch c sao cho chúng tách ... hiện cc bư c như sau: đánh dấu cc điểm ch c, x c định điểm xuất phát, x c định nét xuất phát, tách cc nét tiếp theo. Bư c 3: Trích chọn cc đ c trưng c u tr c xương c a chữ. Với một chữ, ... handwriting recognition): chương trình sẽ thông dịch cc kí tự, ccchữ hay cc đoạn văn đư c viết trên cc mẫu giấy ho ccccc bề mặt kh c mà chúng ta c thể thu thập thông tin về chúng thông...