CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

62 447 1
CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Nhận dạng tự viết tay và phát triển ứng dụng LỜI NÓI ĐẦU Nhận dạng tự, đặc biệt tự viết tay là bài tốn nhiều ứng dụng thực tiễn. Về mặt thuyết, chưa phương pháp nào hồn chỉnh cho cho bài tốn này do tính phức tạp, sự biến dạng của dữ liệu đầu vào. Những năm gần đây, cùng vơí sự phát triển của thuyết nhận dạng, công nghệ xử ảnh, đã nhiều nghiên cứu mang lại một số kết quả cho bài tốn nhận dạng tự viết tay, từ đó mở ra hàng loạt ứng dụng thực tế. Mục tiêu của đồ án nhằm giới thiệu một cách tiếp cận bài tốn nhận dạng chữ viết tay với một số ràng buộc, nhằm từng bước đưa vào ứng dụng thực tiễn. Mặc dù hết sức cố gắng, song do thời gian hạn và những hạn chế bản thân nên đồ án thể còn thiếu sót, mong tiếp tục nhận được sự chỉ bảo của Thầy, và ý kiến đóng góp của các bạn sinh viên để đồ án được hồn thiện hơn. Em xin chân thành cảm ơn. Nha Trang Ngày 10 tháng 9 năm 2003 SVTH : NguyễnĐình Cường Trang 1 Nhận dạng tự viết tay và phát triển ứng dụng NHẬN XÉT CỦA GIÁO VIÊN. . . . . . . . . . . . . . . . . Giáo viên nhận xét PHẦN I SVTH : NguyễnĐình Cường Trang 2 Nhận dạng tự viết tay và phát triển ứng dụng TỔNG QUAN VÀ CƠ SỞ THUYẾT TIỀN XỬ ẢNH TỰ CHƯƠNG I TỔNG QUAN I. Giới thiệu bài tốn: Nhận dạng tự, đặc biệt tự viết tay là bài tốn nhiều ứng dụng thực tế. Máy tính xử lí, nhận dạng các biểu mẫu, phiếu điều tra tự động, bằng cách này ta thể tiết kiệm được nhiều chi phí về thời gian, công sức cũng như các chi phí khác cho việc nhập dữ liệu. Ngày nay cùng với sự phát triển về mặt thuyết, công nghệ, rất nhiều hướng đi cho việc giải quyết bài tốn này như: nhận dạng tự dựa trên cấu trúc hay cách tiếp cận khác như dùng: logic mờ, giải thuật di truyền, mô hình xác suất thống kê, mô hình mạng nơ ron. Đặc biệt trong những năm gần đây mô hình mạng nơron được quan tâm nhiều do khả năng tổng hợp của mô hình và sự phát triển về tốc độ xử lí của máy tính. Trên thế giới hiện nay nhiều chương trình nhận dạng chữ viết (chữ in và viết tay) bằng các thứ tiếng Anh, Nga, v.v . như các hệ OMNIPAGE, READ- WRITE, WORD-SCAN, . Ở Việt Nam cũng một số hệ như WORC của công ty SVTH : NguyễnĐình Cường Trang 3 Nhận dạng tự viết tay và phát triển ứng dụng 3C, VIET-IN của công ty SEATIC, VNDOCR của Viện Công Nghệ Thông Tin, Image Scon của Trung Tâm Tự Động Hóa Thiết Kế, hệ WINGIS của công ty DolfSoft . Nhìn chung, các sản phẩm phần mềm nhận dạng văn bản Tiếng Việt chữ in của nước ta đã thu được kết quả khả quan, đặc biệt phần mềm VNDOCR đã được sử dụng rộng rãi trong các quan nhà nước. Riêng phần nhận dạng tự viết tay vẫn đang được nghiên cứu và phát triển nhằm phục vụ cho các yêu cầu khác nhau như đọc và xử các biểu mẫu: hố đơn, phiếu điều tra . Với mục tiêu tìm hiểu bài tốn nhận dạng ảnh tự viết tay không trực tuyến (off-line), đồng thời sử dụng kết quả vào việc xử lí phiếu đăng môn học của Trường Đại Học Thuỷ Sản Nha Trang. Nội dung đồ án là sự thử nghiệm xây dựng chương trình nhận dạng ảnh tự viết tay nêu trên, bằng cách sử dụng mạng nơron để nhận dạng tự, dựa trên tập mẫu tự đã được mã hố bởi đặc trưng của đường biên. Trong quá trình tìm hiểu thuyết và xây dựng chương trình, em đã tham khảo nhiều nguồn tài liệu, trong đó ý tưởng xác định véc tơ đặc trưng của tự viết tay sử dụng trong đồ án này được tham khảo từ luận án thạc sĩ “ Nhận dạng chữ viết tay rời Tiếng Việt”, của tác giả Phạm Đại Xuân, Đại học khoa học tự nhiên Thành Phố Hồ Chí Minh. II. Cấu trúc, nội dung của đồ án: Nội dung của đồ án được chia làm 4 phần: Phần I: Giới thiệu tổng quan và sở thuyết tiền xửảnh tự, gồm 3 chương: Chương 1: Giới thiệu tổng quan. Chương 2: Giới thiệu sởthuyết tiền xửảnh tự. Chương 3: Giới thiệu cách xác định đặc trưng của tự. Phần II: Giới thiệu các mô hình nhận dạng, gồm 2 chương. Chương 1: Giới thiệu một số thuật phân lớp: đối sánh, sử dụng hàm thế, phương pháp LDA. Chương 2: Giới thiệu mô hình mạng nơ ron cho bài tốn nhận dạng. Phần III: Giới thiệu một số ứng dụng và đánh giá kết luận gồm 4 chương . Chương 1: Giới thiệu ứng dụng thuật tách liên thông cho việc tách liên thông tự trong văn bản. Chương 2: Xây dựng, đánh giá chương trình nhận dạng tự viết tay. Chương 3: Đưa kết quả vào ứng dụng xây dựng chương trình xử lí phiếu đăng môn học cho sinh viên ở trường Đại học Thuỷ Sản Nha Trang. Chương 4: Đánh giá kết luận và nêu hướng phát triển của đề tài. Phần IV : Phụ lục giới thiệu giao diện chương trình. SVTH : NguyễnĐình Cường Trang 4 { } ( ) ( ) dvvpvveE j j j ∑ ∫ + −= 1 2 2 Nhận dạng tự viết tay và phát triển ứng dụng CHƯƠNG II SỞ THUYẾT TIỀN XỬẢNH TỰ I. Lọc mịn ảnh: Lọc mịn ảnh là một lọc thông thấp, giá trị của một điểm ảnh là trung bình trọng số của các điểm ảnh lân cận, hay giá trị điểm ảnh là kết quả của quá trình xoắn (convole) của các điểm ảnh lân cận với một nhân. Nhân kích thước tuỳ ý 3x3, 5x5, kích thước nhân càng lớn thì càng nhiều điểm lân cận ảnh hưởng vào điểm ảnh kết quả. Ví dụ một số nhân lọc mịn ảnh như sau: Lọc mịn ảnh tác dụng hạn chế ảnh nhiễu muối tiêu. II. Nhị phân ảnh: Nhị phân ảnh mức xám là tìm giá trị ngưỡng sao cho các điểm ảnh giá trị lớn hơn ngưỡng được gọi là trắng(nền) và các điểm ảnh giá trị nhỏ hơn ngưỡng được gọi là đen (đối tượng). Tiêu chuẩn xác định ngưỡng thường sử dụng nhất là sử dụng sai số bình phương trung bình giữa giá trị mẫu v và mức tái thiết r(v). (ký hiệu MSE) Ta có: Trong đó p(v) là hàm mật độ xác suất của biến ngẫu nhiên v, thể coi xấp xỉ bằng histogram của ảnh. Với một số cho trước L các mức xám MSE được biểu diễn bởi: SVTH : NguyễnĐình Cường Trang 5 E { } 2 e = ( ) [ ] { } ( ) [ ] ( ) dvvpvrvvrvE ∫ ∞ −=− 0 22  /9  /0  / ( ) ( ) 1 1 1 .1 2 1 1 1 −== −= + = ∫ ∫ + + − Lj dvvp dvvvp r Lj rr v j j j j v v v v j jj j Nhận dạng tự viết tay và phát triển ứng dụng Do r(v)=r j là hằng số trong đoạn [v j , v j+1 ]. Với p(v) cho trước và số mức tái thiết L cố định, các mức quyết định v j , j= 1…L-1 và các mức tái thiết r j , j=0 L-1 cực tiểu hố MSE tuân theo quan hệ sau: Tuy nhiên, không cách giải quyết dưới dạng khép kín nào tồn tại trừ khi chấp nhận một số phép xấp xỉ. Bây giờ ta xem xét trường hợp ngoại lệ nhưng quan trọng với L=2. Đó là trường hợp nhị phân hố ảnh. Khi đó MSE trở thành: Giả sử rằng p(v) thể ước lượng từ histogram và v 0 , v 2 tương ứng với v min , v max . Còn lại ba tham số cần được tính tốn đó là r 0 , r 1 , và v 1 . Tham số v 1 gọi là ngưỡng nhị phân hố. Hơn nữa r 0 (v 1 ) và r 1 (v 1 ) cực tiểu MSE, với một giá trị cho trước của v j , đơn giản là những giá trị trung bình trong đoạn tương ứng: Như vậy đủ để biến đổi v 1 từ v 0 đến v 2 . MSE được tính bằng cách thay r 0 và r 1 bằng r 0 (v 1 ) và r 1 (v 1 ) tương ứng và chọn v l * sao cho MSE là cực tiểu. Otsu đề nghị một cách tương tự nhưng tiêu chuẩn đơn giản hơn về mặt tính tốn dựa trên phân tích biệt số. Trong công thức này, MSE tương đương với phương sai lớp trong σ W 2 (v 1 ). Nếu σ W 2 (v 1 ) được bổ sung vào phương sai lớp giữa σ B 2 (v 1 ), ta được tồn bộ biến đổi σ T 2 ( độc lập v 1 ). Như vậy, thay vì cực tiểu MSE, giải thuật của Otsu cực đại phương sai giữa lớp: Trong đó: Và Biểu thức thể đơn giản thành : SVTH : NguyễnĐình Cường Trang 6 { } ( ) ( ) ( ) ( ) ∫ ∫ −+−= 1 0 2 1 2 1 2 0 2 v v v v dvvprvdvvprveE ( ) ( ) ( ) ∫ ∫ = 1 0 1 0 10 v v v v dvvp dvvvp vr ( ) ( ) ( ) ∫ ∫ = 2 1 2 1 11 v v v v dvvp dvvvp vr ( ) ( ) [ ] ( ) ( ) [ ] { } 2 1111 2 1010 * 1 maxarg TT vvpvvpv µµµµ −+−= ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) max2 1 1 11 1110 111 110 1 1 vv v v v vvv vvp vvp T T == − − = = −= = µµ ω µµ µ ωµµ ω ω ( ) ( ) ( ) ( ) ∫ ∫ = = 1 0 1 0 1 1 v v v v dvvvpv dvvpv µ ω ( ) ( ) [ ] ( ) ( ) [ ]       − − = 11 2 11 * 1 1 . maxarg vv vv v T ωω µωµ Nhận dạng tự viết tay và phát triển ứng dụng Thật ra, còn tồn tại một số tiêu chuẩn lượng hố khác, chẳng hạn entropy, cũng trên histogram của mức xám. Histogram thể được tính từ tồn bộ ảnh hoặc từ lân cận địa phương giới hạn xung quanh ảnh đang xét. III. Đánh nhãn thành phần liên thông: Khái niệm liên thông trong tự thể xem như tập hợp các điểm ảnh liền nhau tạo nên tự, mục tiêu của giải thuật này là lọc ra những tự trong ảnh. 1. Tách liên thông bằng thuật đệ quy : Để tách liên thông ta nghĩ ngay đến kỹ thuật đệ quy cấp 8 (tại mỗi bước chúng ta tối đa 8 lựa chọn tiếp theo). Quy ước : Điểm (x, y) : cho biết giá trị điểm tại toạ độ (x, y). =1 màu chữ =0 màu nền Height : Chiều cao ảnh Width : Chiều rộng ảnh Ta giải thuật như sau: // Đưa tất cả các điểm liên thông với Điểm(x,y) vào liên thông t Procedure Chonvao((x,y) :điểm, t :liênthông) Begin If (Điểm(x, y)=1) AND (NOT đã_xét[x,y]) then Begin Them_vao_lien_thong(t,(x, y)); Đã_xét[x, y] :=True ; For i :=x-1 to x+1 do For j:= y-1 to y+1 do If ( i <>x) or (j<>y) then Chonvao((i, j),t); End; End ; // Ta thủ tục tách liên thông đệ quy như sau : Procedure TáchLiênThôngĐQ(VAR LT: Danh_Sách_Liên_Thông) Begin T:=<danh sách rỗng> t:=<liên thông rỗng> For j:=1 to Height do For i:=1 to Width do đã_xét[i, j]:=False; For j:=1 to Height do For i:=1 to Width do If (Điểm(x, y)=1) AND( NOT Đã_xét[i, j]) then Begin Chonvao( (i, j ),t); Thêm _liên_thông_vào_Danh_Sách(T, t) ; t :=<liên thông rỗng> ; End ; End; SVTH : NguyễnĐình Cường Trang 7 . . . . . . P P P . . L ? . . . . . . . Nhận dạng tự viết tay và phát triển ứng dụng Nhận xét: Thuật tốn này chỉ ý nghĩa minh hoạ bản chất của tách liên thông. Ta không chọn thuật tốn này cài đặt vì chi phí đệ quy quá cao, chưa kể tốc độ thực hiện. 2. Giải thuật cải tiến: Để gán nhãn cho thành phần liên thông ta thể duyệt theo từng đường chạy. Kỹ thuật này gán cho mỗi thành phần liên thông của ảnh nhị phân một nhãn riêng biệt. Nhãn thường là các số tự nhiên bắt đầu từ một đến tổng số các thành phần liên thông trong ảnh input. Giải thuật phát biểu như sau: Quét ảnh từ trái sang phải và từ trên xuống dưới. Trong dòng thứ nhất chứa pixel đen, một nhãn duy nhất được gán cho mỗi đường chạy liên tục của pixel đen. Với mỗi pixel đen của dòng tiếp theo, các pixel lân cận dòng trước và pixel bên trái được xem xét (hình vẽ a ). Nếu bất pixel lân cận nào được gán nhãn, nhãn tương tự được gán cho pixel đen hiện thời; ngược lại, nhãn tiếp theo chưa được sử dụng được chọn. Thủ tục này được sử dụng cho đến dòng cuối của ảnh. Lúc kết thúc tiến trình này, một thành phần liên thông thể chứa các pixel các nhãn khác nhau vì khi chúng ta xem xét lân cận của pixel đen, chẳng hạn pixel “?” (trong hình c), pixel đối với lân cận trái và những lân cận trong dòng trước thể gán nhãn một cách riêng biệt. (Trong ví dụ này, chúng ta sử dụng nhãn của lân cận trái). Một tình huống như vậy phải được xác định và ghi lại. Sau tiến trình quét ảnh, việc gán nhãn được hồn tất bằng cách “thống nhất mâu thuẫn các nhãn” và gán lại các nhãn chưa sử dụng. Để minh hoạ ta các hình biểu diễn sau: Hình a. lân cận của “?” P= dòng trước; L=lân cận trái SVTH : NguyễnĐình Cường Trang 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . * * * * . . * * * . . . . . 1 1 1 1 . . 2 2 2 . . . . . . * * * . . * * * * . . . . . 1 1 1 . . 2 2 2 2 . . . . * * * * . * * * * * . . . . 1 1 1 1 . 2 2 2 2 2 . . . . . . * * * * * . . . . . . . . . 1 1 ? * * . . . . . . . . . * * * * * * . * . . . ⇒ . . . * * * * * * . * . . . * * . . . . . . . . * * . . * * . . . . . . . . * * . . . * * . . . . . . . * * . . . * * . . . . . . . * * . . . * * . . . . . . . . . . . . * * . . . . . . . . . . . Hình b . Aûnh ban đầu Hình c . Tiến trình gán nhãn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 1 . . 2 2 2 . . . . . 1 1 1 1 . . 1 1 1 . . . . . . 1 1 1 . . 2 2 2 2 . . . . . 1 1 1 . . 1 1 1 1 . . . . 1 1 1 1 . 2 2 2 2 2 . . . . 1 1 1 1 . 1 1 1 1 1 . . . . . . 1 1 1 1 1 . . . . . . . . . 1 1 1 1 1 . . . . . . . . . 1 1 1 1 1 1 . 3 . . . ⇒ . . . 1 1 1 1 1 1 . 2 . . . 4 4 . . . . . . . . 3 3 . . 3 3 . . . . . . . . 2 2 . . . 4 4 . . . . . . . 3 3 . . . 3 3 . . . . . . . 2 2 . . . 4 4 . . . . . . . . . . . . 3 3 . . . . . . . . . . . Hình d . Sau khi quét đầy đủ Hình e .Kết quả sau cùng Nhận dạng tự viết tay và phát triển ứng dụng IV. Chỉnh nghiêng: Chỉnh nghiêng ảnh là một phép biến đổi tuyến tính của toạ độ điểm ảnh. Trước hết ta phải xác định góc nghiêng tổng thể của đối tượng, và ta dịch chuyển điểm ảnh đối tượng theo phương ngang tuỳ theo giá trị góc nghiêng tổng thể này và giá trị y của điểm này. Hình a Hình b Chuyển gớc toạ độ về trọng tâm ảnh như hình b Góc nghiêng của tự được qui ước tính là góc từ trục tung, hướng về bên trái giá trị dương, hướng về bên phải giá trị âm. Góc nghiêng tổng thể tự là hướng trung bình của các điểm ảnh đối tượng giá trị góc khoảng –45 0 đến 45 0 theo quy ước tính góc trên . Các điểm ảnh đối tượng hướng ngồi khoảng –45 0 đến 45 0 không tính. Giả sử gọi α là góc nghiêng tổng thể của tự , điểm ảnh đối tượng p(x,y) (trong hệ toạ độ mới ) sẽ toạ độ mới là p(x’ ,y’) (trong hệ toạ độ mới ) với : Để tính góc nghiêng tổng thể ta phải tính được hướng của các điểm ảnh đối tượng. Hướng tại một điểm ảnh đối tượng được tính nhờ vào vectơ gradient điểm ảnh đó. Vectơ gradient tại một điểm ảnh (x, y)là: Độ lớn vectơ gradient tại (x,y) được tính bởi: Hướng của vectơ gradient tại(x,y) được tính bởi: SVTH : NguyễnĐình Cường Trang 9 0 + α- ( ) yy ytgxx = ×+= ' ' α             ∂ ∂ ∂ ∂ =       =∇ y f x f G G f y x 22 yx GGf +=∇ ( )         = − x y G G yx 1 tan, α Nhận dạng tự viết tay và phát triển ứng dụng G x và G y là kết quả xoắn (convolve) với nhân Sobel S x và S y : Hình . Các nhân của bộ lọc Sobel Chú ý: góc tính theo gradient tại mỗi điểm ảnh đối tượng là góc so với trục x và chỉ xét những điểm hướng của vectơ gradient thoả trong khoảng [45 0 ,135 0 ] hay [-135 0 ,-45 0 ]. V. Chuẩn kích thước: Chuẩn kích thước ảnh tự về một kích thước cố định và phóng sát bốn biên của ảnh. Phóng ảnh là thực hiện phép biến đổi sau: Với (x, y) là toạ độ điểm ảnh sau khi phóng và s x ,s y là tỷ lệ phóng theo trục x và y tương ứng, f x (x,y) là giá trị điểm ảnh kết quả ứng với giá trị toạ độ (x, y). Chú ý: Sau khi phóng ảnh, ảnh thể bị rời rạc, răng cưa biên. Để khắc phục tình trạng này, ta thực hiện một số xử bằng phép đóng morphology: VI. Lấp khoảng trống ảnh bằng phép đóng morphology: 1. Một số định nghĩa: Giả sử A và B là hai tập trong không gian Z 2 , aЄ A thì a=(a1, a2) Phép dịch chuyển của tập A đối với x=(x1, x2) ký hiệu(A) x , được định nghĩa. Phép phản chiếu của tập B, ký hiệu B * , được định nghĩa: Phép bù của một tập A, ký hiệu A c , được định nghĩa: Hiệu của hai tập hợp A và B, ký hiệu A-B, được định nghĩa: 2. Phép giãn: Giả sử A, B là hai tập thuộc Z 2 , ∅ là tập hợp rỗng, phép giãn của A đối với B, ký hiệu A⊕B, được định nghĩa: Tập B thường được gọi là thành phần cấu trúc. SVTH : NguyễnĐình Cường Trang 10 -0-0-0 S x --- 000  S y ( ) ( ) yxs sysxfyxf ,, = ( ) { } A a vôùi ∈+== ,xaccA x { } B bôùi ∈−== vbxxB , * { } AxxA C ∉= { } BxAxxBA ∉∈=− , ( ) { } ∅=∩=⊕ ABxBA x * [...]... Nhận dạng tự viết tay và phát triển ứng dụng trưng được rút trong các ô đó, việc chọn các ô phủ lấp lên nhau cũng không ngồi mục đích trên II.Chia ô: Aûnh tự sau khi tiền xử kích thước được chuẩn về m×n điểm ảnh, ảnh được chia nhỏ thành các ô vuông nhỏ kích thước 8×8 điểm ảnh như hình: n m Hình minh hoạ cách chia ô tự Gom 4 ô kích thước 8x8 thành ô kích thước 16x16, và các ô kích thước... Trang 13 Nhận dạng tự viết tay và phát triển ứng dụng Dabs=2 và ci chẵn , ci+1 chẵn c dabs=2 và ci lẻ , ci+1 lẻ : Bỏ pi+1 và thay hướng pi như hình Dabs=2 và ci lẻ, ci+1 lẻ d dabs=3 , ci chẵn, ci+1 lẻ e dabs=3, ci lẻ, ci+1 chẵn SVTH : NguyễnĐình Cường Trang 14 Nhận dạng tự viết tay và phát triển ứng dụng Minh hoạ ảnh tự sau quá trình tiền xử Aûnh ban đầu Ảnh qua tiền xử CHƯƠNG III RÚT... thành tựu đáng kể về luận và ứng dụng trong thực tiễn, chứng tỏ khả năng của máy tính điện tử, thể mô hình hố được một số chức năng tương đối phức tạp của trí tuệ con người Cho đến nay sở tốn học của thuyết nhận dạng được xây dựng và phát triển đồng thời theo các hướng chính sau đây: - Lý thuyết thống kê nhận dạng - Lý thuyết cấu trúc về nhận dạng - Lý thuyết đại số về nhận dạng Mỗi thuyết. .. Trang 34 Nhận dạng tự viết tay và phát triển ứng dụng Bước đầu thử nghiệm em xây dựng bộ nhận dạng cho 2 lớp tự gồm: tự là chữ cái không dấu và tự là chữ số Lớp tự chữ cái: A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z, a, b, d, e, f, g, h, i, j, k, l, m, n, q, r, s, t, v, x, y Lớp tự số : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 Do một số tự khi viết hoa hay... sau đây minh hoạ cho nhận dạng văn bản chứa tự font VniTimes, size 12.Việc nhận dạng từng tự được thực hiện như sau: tự được chuẩn hố vào lưới ô vuông kích thước 56x48 điểm ảnh Cách xác định đặc trưng của font chữ in như sau: SVTH : NguyễnĐình Cường Trang 33 Nhận dạng tự viết tay và phát triển ứng dụng Chia khung tự thành nhiều ô vuông nhỏ kích thước 8x8 Trên mỗi ô vuông nhỏ ta xác định... NGHIỆM SVTH : NguyễnĐình Cường Trang 32 Nhận dạng tự viết tay và phát triển ứng dụng CHƯƠNG I MINH HỌA ỨNG DỤNG GIẢI THUẬT TÁCH THÀNH PHẦN LIÊN THÔNG TRONG BÀI TỐN NHẬN DẠNG ẢNH VĂN BẢN Trước khi xây dựng chương trình nhận dạng tự viết tay, em xin giới thiệu một ứng dụng liên quan đến nhận dạng tự, đó là ứng dụng nhận dạng ảnh văn bản Với cơ sởthuyết vừa nêu ta hồn tồn thể xây dựng được... viết hoa hay viết thường đều giống nhau, chỉ khác nhau về mặt kích thước, do đó đối với những tự này ta thể xét thêm kích thước của chữ, nếu kích thước lớn hơn một ngưỡng nhất định thì coi là chữ hoa, ngược lại là chữ thường Về mặt tự số ta sẽ không phân biệt được số “0” và tự chữ “O”, do đó chương trình tách riêng nhận dạng tự chữ và nhận dạng số Chương trình được cài đặt bằng công cụ... nghiêng và chuẩn hố tự về kích thước chuẩn là 80x56 2 Trích chọn đặc trưng: thể thấy rằng cấu trúc một tự thể mô tả một cách chính xác qua các đường biên của miền liên thông Do đó cấu trúc hố đường biên của một miền liên thông được xác định như sau: Bước 1: Phát hiện biên của tự Bước 2: Mã hố đường biên tự bằng mã xích SVTH : NguyễnĐình Cường Trang 35 Nhận dạng tự viết tay và phát... Thực hiện như sau: Nạp ảnh văn bản cần nhận dạng vào, sau đó nhấn nút nhận dạng để xem kết quả Ta hình minh hoạ kết quả nhận dạng: CHƯƠNG II CHƯƠNG TRÌNH NHẬN DẠNG TỰ VIẾT TAY I Giới thiệu chương trình: Chương trình nhận dạng các tự viết tay không trực tuyến, ảnh tự nhận dạng được thu nhận qua máy quét hoặc viết trực tiếp vào vùng nhận dạng Aûnh thể chứa nhiều tự, được viết trên nhiều... như sau : 1 Tiền xử lí: - Lọc ảnh: Lọc ảnh nhằm giảm bớt nhiễu bằng giải thuật lọc trung bình - Nhị phân ảnh: Dựa vào giải thuật Otsu đã trình bày tiến hành phân ngưỡng, tạo ra ảnh nhị phân chứa giá trị 0 và 1: 0 tượng trưng cho điểm thuộc nền, 1 tượng trưng cho điểm thuộc đối tượng - Tách liên thông: Dùng giải thuật tách liên thông để tách các tự ra khỏi ảnh - Chỉnh nghiêng và chuẩn kích thước: . dạng kí tự viết tay và phát triển ứng dụng TỔNG QUAN VÀ CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ CHƯƠNG I TỔNG QUAN I. Giới thiệu bài tốn: Nhận dạng kí tự, . cơ sở lý thuyết tiền xử lí ảnh kí tự, gồm 3 chương: Chương 1: Giới thiệu tổng quan. Chương 2: Giới thiệu cơ sở lí thuyết tiền xử lí ảnh kí tự. Chương 3:

Ngày đăng: 26/04/2013, 10:08

Hình ảnh liên quan

Để minh hoạ ta cĩ các hình biểu diễn sau: - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

minh.

hoạ ta cĩ các hình biểu diễn sau: Xem tại trang 8 của tài liệu.
Hìn ha Hình b Chuyển gớc toạ độ về trọng tâm ảnh như hình b - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

n.

ha Hình b Chuyển gớc toạ độ về trọng tâm ảnh như hình b Xem tại trang 9 của tài liệu.
c. dabs=2 và ci lẻ, ci+1 lẻ : Bỏ pi+1 và thay hướng pi như hình - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

c..

dabs=2 và ci lẻ, ci+1 lẻ : Bỏ pi+1 và thay hướng pi như hình Xem tại trang 14 của tài liệu.
Ta cĩ hình minh hoạ các phần A, B, C, D trong mỗi ơ vuơng 16x16 D - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

a.

cĩ hình minh hoạ các phần A, B, C, D trong mỗi ơ vuơng 16x16 D Xem tại trang 16 của tài liệu.
Hình minh hoạ cách chia ơ kí tự. - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình minh.

hoạ cách chia ơ kí tự Xem tại trang 16 của tài liệu.
Hình vẽ đồ thị hàm logistic (a=1). Miền giá trị của hàm là(0, 1). - Hàm tanh (tan- hyperbol) - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình v.

ẽ đồ thị hàm logistic (a=1). Miền giá trị của hàm là(0, 1). - Hàm tanh (tan- hyperbol) Xem tại trang 27 của tài liệu.
Ta cĩ hình minh hoạ kết quả nhận dạng: - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

a.

cĩ hình minh hoạ kết quả nhận dạng: Xem tại trang 34 của tài liệu.
Bảng kết quả thử nghiệm trên một số người: Người thứ 1: - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Bảng k.

ết quả thử nghiệm trên một số người: Người thứ 1: Xem tại trang 36 của tài liệu.
Hình vẽ: Sơ đồ mơ hình của hệ xử lí phiếu đăng kí mơn học tự động - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình v.

ẽ: Sơ đồ mơ hình của hệ xử lí phiếu đăng kí mơn học tự động Xem tại trang 46 của tài liệu.
Ta cĩ hình minh hoạ:    Điểm chuẩnLề trái Lề tiêu đề - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

a.

cĩ hình minh hoạ: Điểm chuẩnLề trái Lề tiêu đề Xem tại trang 47 của tài liệu.
Hình minh hoạ kí tự bị nhiễu do cắt phạm đường khung. - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình minh.

hoạ kí tự bị nhiễu do cắt phạm đường khung Xem tại trang 49 của tài liệu.
Hình minh hoạ kết quả lấy thơng tin phiếu đăng kí mơn học. - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình minh.

hoạ kết quả lấy thơng tin phiếu đăng kí mơn học Xem tại trang 51 của tài liệu.
Hình minh hoạ kết quả xử lí phiếu đăng kí mơn học - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình minh.

hoạ kết quả xử lí phiếu đăng kí mơn học Xem tại trang 53 của tài liệu.
Hình 1. Form chính của chương trình. - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình 1..

Form chính của chương trình Xem tại trang 56 của tài liệu.
Hình 2. Form nhận dạng: chức năng nạp ảnh, hoặc viết trực tiếp vào vùng trắng để nhận dạng cho ra kết quả. - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình 2..

Form nhận dạng: chức năng nạp ảnh, hoặc viết trực tiếp vào vùng trắng để nhận dạng cho ra kết quả Xem tại trang 57 của tài liệu.
Hình 3. Form lấy đặc trưng của mẫu học. - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình 3..

Form lấy đặc trưng của mẫu học Xem tại trang 57 của tài liệu.
Hình 1. Form chính của chương trình. - CƠ SỞ LÝ THUYẾT TIỀN XỬ LÝ ẢNH KÍ TỰ

Hình 1..

Form chính của chương trình Xem tại trang 58 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan